[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[connect24h:5072] Re: 話題提供
- To: connect24h@xxxxxxxxxx
- Subject: [connect24h:5072] Re: 話題提供
- From: SHIBATA Akira <shibata@xxxxxxxxxxxxxx>
- Date: Thu, 07 Nov 2002 10:40:09 +0900
柴田@TV飯能%にわか管理者です。
In message <3DC9AFF8.2A8F34A5@xxxxxxxxxxx>
"[connect24h:5070] Re: 話題提供"
"Thu, 07 Nov 2002 09:12:40 +0900"
"Kensuke Nezu <nez@xxxxxxxxxxx>" wrote:
> > In article <20021106114159.871031D33BF@xxxxxxxxxxxxxxxxxxxxxxxxxxxxx>
> > matumoto@xxxxxxxxxxxxxxxxxxxxxx writes:
> > >そいえば、昔のHDDは少しずつエラーセクタが増えて壊れて行くのは経験あり
> > >ますが、即死したってのは経験はないですね。
> > 即死するのは、今話題の環境に優しい「ハズ」なモールド樹脂IC
> > を使ったやつだけでしょう。今までこんなこと無かったもん。
>
> HDDの使われ方の問題もありますが、MBRの部分って通常、サーバーなどでは
> 「たま〜に」読むだけという使われ方もあって、磁気的に不安定になりやすい
> 部分だという気がしています。
>
> #だいたい、論理的に壊れる場合はここが多い・・・。でもこれが結構イタいんです。
当方で崩御なすってくださりやがった HDD は
導入 13 ヶ月目の Fujitsu MODEL MPG3409AT -EF
ID YFIM というものです。
製造日は 2001/5 のように見えます。
書き込みができなくなっていて kernel が
文句たれていてクライアントから連絡がきて
初めてわかりました。
なお、ダメになっていたのは 4 つに分けた
パーティションのうち二つがダメでした。
あとで付け替えて調べてみると、
残りの二つは読めましたが二つが突然ダメに
なったと。
発見が遅れたのはこのサーバは web 兼 smtp 兼
pop サーバだったのですが、メモリをたくさん積んで
いたせいか、 apache は落ちてませんでした。
また、このサーバ経由でメイルの受信が
できない( == pop できない)という連絡がはいったの
ですが、こちらでも追試をしたのですが、
pop できたり、送信もできたりということで、
不具合に感じなかったのです。
pop できない人の 2 人目が現れたときに、
コンソール画面でも見てみるべと思ったら
記憶では英語で「ディスクに書き込めない」みたいな
エラーがボロボロでていました。
> 物理的に壊れる場合、よいメーカは事前にちょっとした異音がするとかそんな
> 感じですが、悪いメーカーはいきなり明らかにヘッドがガチった音がしてお亡く
> なりになったこともありますね〜。
> 即死率が高く感じるようになったのは、私は、NTFSのせい・・・というのもある
> と思います。FATやext2などのように「OSやハードがあからさまにRetryしている」
> という状態がWindows+NTFSだとほとんどわからないので、実は中で一生懸命リトライ
> していたんだけど、本当にダメになったときに突然お亡くなりになるという、そんな
> 現象としか思えない経験を何度かしています。
一応 ext2 で構築してありましたが、初めてディスクの
突然死に立ち会いまして、スリルを味わいました。
なお、これに懲りて、根津さんにおすすめしていただいた
http://online.plathome.co.jp/cgi-bin/category.phtml?parent=7090&rows=1&append=7090&kitem=1184005000001&vitem=1&details=1
を購入してとりつけましたが、予想外にいい感触です。
いい感触と書く理由は
・安いのに hotswap 可能で、自動
・万が一ウケ側の故障があってもそれをはずして直接 IDE
コネクタに挿すと HDD が起動可能なら、そのまま使えそう
同じ HDD を使っての実験では起動成功しています
> と、ホットな話題の最中、私の会社にはファイバチャンネル接続のRAID5 237GBが
> 5台、やってくることになったようです。
>
> #これで少しは枕を高くして寝られるかしら・・・?
お祈りいたします。
実は、上記壊滅的故障をくらう一週間前にイヤ〜ンな状況が
ありまして、 HDD 故障をくらったサーバなんですが、
500 人くらいのユーザ登録がされていて、 ULTRA160 な
IDE RAID5 320GB ( /home に使用) がくっついてます。
電源配線を見直すため、 10 ヶ月ぶりに電源を落としました。
はい、電源いれても RAID のハコが起動しませんでした。
ROM エラーとなって、ダメでした。
結局納入元に連絡をとって、 BIOS を送ってもらって
復旧とあいなりました。
HDD が壊れて無くても、コントローラや、 SCSI アダプタが
逝ってしまったらとかんがえると電源落としたくないです。
(今回は BIOS がとんだ)
まぁ、そんなことがあってキモを冷やしたので、
「根津さんおすすめ RAID 」を導入する稟議書を書いて
出して、会社が渋っている(ウチの会社は金がないので)時に
タイムリーに壊れて即日「決裁 OK 、早く買え」って
ことになりました。
また、それまで、バックアップを気が向いたときしか
とってなかったのですが、 RAID がお隠れになって以降
disk to disk なバックアップをデイリー cron で
取ってましてこれも大いに役立ちました。
しかし、当方の 9 月中のトラブル(他にも Ultra10 の
HDD も壊れたり等等)で得た教訓は
・とにかくデータをバックアップしておけばなんとか
復旧できるということ
・コントローラがダメになったときはどうにもならないので
代替手段を考えておくこと
(今回導入の RAID はココについてもいいので、気に入ってます)
と考えています。
--
SHIBATA Akira ケーブルテレビはまちづくり
shibata@xxxxxxxxxxxxxx phone : +81-429-74-3611
--[PR]------------------------------------------------------------------
7,777,777円が当たるチャンス!
▼ 他にもチャンスがいっぱい♪ => http://m.freeml.com/i.php?id=36
------------------------------------------------------------------[PR]--
<GMO GROUP> Global Media Online www.gmo.jp