SSD使ってたらある時を堺にmd5sumコマンドの返却値がランダムになったギョエー
なんかサーバーサーバープロセスが突然死するしどうなってんだと調査してみたところ、ゲームのデータファイル(80MB)のmd5sumを測定するたびに毎回異なる値が帰ってきた。何を言ってるかわからねぇと思うが実際にそういうことが起きていた。
ちなみに再起動したら直った。md5sumコマンドの値が常に固定になった。
SSDの壊れ方怖いですね。。おそらく再起動するタイミングで不良セクタが除去されたんだろう。単にOS側の問題かもしれないけど、プライマリなDBに使うのやめたほうがいいんじゃ。スレーブのread onlyとかならいいけど。いやスレーブでもやべぇか。てか壊れたことがわかりにくすぎ.. :(
SSD: Intelの60GBのやつ
OS: CentOS release 6.3 (Final)
俺の問題だったらintelさんsryということで。
追記:
ちなみにどういう感じだったかって言うと、毎回md5sumがランダムになるファイルとならないのがあって、ならないやつはまじでずっと固定(当たり前なんだけど)、なんどやっても同じ値になる。ランダムになるファイルもちょっと特殊でランダムさに3パターンぐらいあって、そのうちのどれかの値が出てた感じかな。
んで、そのチェックサムが毎回ランダムになっちゃうファイルが、読み込まれたときにゲームのサーバーが死んでる感じだった。あー、いや死んでないときもあってそのときはmapのCRCが違うみたいなエラーがでてクライアントがゲームのサーバーに接続できない感じだった。なおチェックサムを確認する過程において、このサーバー特有のすべてのdaemonが止まってることを確認した。
以下はランダムな値がでたときのイメージ
$ md5sum ./mvm_fakeout_a2.bsp AAAAAAAAAAAAAAAAAAAAAA $ md5sum ./mvm_fakeout_a2.bsp AAAAAAAAAAAAAAAAAAAAAA $ md5sum ./mvm_fakeout_a2.bsp BBBBBBBBBBBBBBBBBBBBBB $ md5sum ./mvm_fakeout_a2.bsp BBBBBBBBBBBBBBBBBBBBBB $ md5sum ./mvm_fakeout_a2.bsp AAAAAAAAAAAAAAAAAAAAAA $ md5sum ./mvm_fakeout_a2.bsp DDDDDDDDDDDDDDDDDDDDDD $ md5sum ./mvm_fakeout_a2.bsp AAAAAAAAAAAAAAAAAAAAAA
what the fuckってなった。あまりにもファイルサイズがでかすぎると起こりうるみたいなことが書いてあったんだけど、この現象が起きてたファイルのうち、一番大きいので80MB、小さいので1MBなのでそれはないはず。