9月の中旬くらいからサーバが頻繁にフリーズするようになり、
その際にした対応と対策のまとめを自分用に....φ(・ω・` )
・・・なのでこの記事は同じ症状の人以外には面白くないと思います…w
まず最初は、毎日ほぼ同じような時間にフリーズ。
画面は真っ黒でブルースクリーンではない。
まず最初に目を付けたのは電源回り。
なにせ昨年の同じような時期にも電源が逝ったので、
(本体ごと買い替えればスッキリするんですけどねw)
疑わない訳にはいかない(笑
しかし1年経たずに壊れるとはあまり考えたくないので
電源が壊れてる可能性は一旦保留して他の原因を探る。
■UPS
まずは、震災直後に導入したUPSがヘタってるのでは?と思い、電源関係と言う事でUPSを外してみました。
…しかし翌日にフリーズ(´・ω・`)
またKP41…(´・ω・`) 原因はUPSではなかった模様。
— かわにょ (@kawanyo) 2015, 9月 27
UPSは元気ですw
■時計周り
次に、Windowsのシステムログを見ると
システム時間は 2015-10-02T06:32:14.252831100Z から 2015-10-02T06:32:14.252831100Z に変更されました。
このように直前で時計を調整してるようで、もしかするとWindowsUpdateが「無効にしている自動時刻合わせ」を有効にしているのでは?と勘繰る。
(チューナー起動→録画中に時間が変わる→チューナーソフトがフリーズみたいな流れで想像)
改めて時刻合わせを無効に、そして定期的に時刻を調整してくれるNTPソフト「Adrasteia」も念のため無効に。
暗転フリーズ直前に時刻調整して落ちてるのでNTPソフトを無効にしてみた。24時間後くらいに落ちてなければこれが原因だろう…(´・ω・`) 参考 https://t.co/RHsEuJ1kre pic.twitter.com/ceKHKCfFZI
— かわにょ (@kawanyo) 2015, 9月 27
翌日、やはりフリーズ(´・ω・`)
■チューナー
前日の時計の時もだけど今回もチューナーが録画中にフリーズしてたので、ハードウェア的にチューナーが壊れてるのかも?と言う事で予備のチューナーに差し替え。
翌日、やはりフリーズ(´・ω・`)
…チューナーは壊れてなかった(笑
あと、同じような時間帯に落ちるので、似たような事例が知恵袋にあったけど、
3,4日程前からPCが毎日決まった時間にフリーズするのです... - Yahoo!知恵袋
ちょっと違ったw
■KP41病記事から別の事を発見
エラーログに何度も「Kernel-Power41」が出てくるので昨年の電源が逝ったとき同様、
やっぱ電源壊れてるのかなぁ…と思いつつ「Kernel-Power41」関係をひたすらぐぐる生活
そうするとこのようなページに辿り着き、
Kernel-Power41病から解放されました♪: 日報あくせくジェ~ムズ
どうやらブルースクリーンに行く前に再起動する設定になっているらしい。
コントロールパネル>システム>設定の変更でシステムプロパティを開き
詳細設定タブの起動と回復の設定で「自動的に再起動する」のチェックを外し
デバッグ情報の書き込み項目を「最小メモリダンプ」に設定。
…フリーズしてもちゃんとブルースクリーン表示できるようになる(笑
■HDD/SSD?メモリ?
次のフリーズでは画面真っ黒じゃではなくブルースクリーンなので、原因を探れるようになりましたw
>KERNEL_DATA_INPAGE_ERROR
>STOPコード:0x0000007A
と出てて、STOPコード的にはHDD/SSDの物理障害の可能性が高いようです。
ブルースクリーン解決方法 0x0000007A [パソコン分解サイト]
「KERNEL_DATA_INPAGE_ERROR」はカーネルデータが仮想メモリ(pagefile)で見つからず物理メモリへの読み込みが出来ない場合のエラーのようなので、
0x0000007A KERNEL_DATA_INPAGE_ERROR カーネルが…|Yahoo!知恵袋
仮想メモリを無効にして起動。
そしたら翌日はフリーズしなかったけど翌々日にフリーズ\(^o^)/違うのかよw
ちなみにメモリは異常がないと仰る..._( `ω、_ )_
念のためにMemtest走らせます..._( `ω、_ )_ pic.twitter.com/PAuicAQNGx
— かわにょ (@kawanyo) 2015, 9月 30
やはり前途のSTOPコードのようにSSDに何らかの問題がある模様…。
そこで、データのバックアップ開始。
…からの、ブルースクリーンw
「STOPコード:0x000000F4」は
HDD/SSDのケーブルや、HDD/SSD自体がダメになってる場合がある模様で、
メモリに起因する場合もあると、もう何が何だか状態w
ブルースクリーン解決方法 0x000000F4 [パソコン分解サイト]
コントローラー系が逝ってるだけならSSDのメモリは生きてるハズなので、
再インストールは面倒なので別のSSDにクローンを作成する事に。
しかし、別のPCでAcronisを使ってクローンを生成してると
クローン元のSSDが途中からエラーでクローン生成できないと言われるw
(写真撮り忘れた><)
仕方なくクリーンインストールするかなぁ…と準備を進める前に
SSDをサーバに差し戻すと今度はBIOSから認識しなくなる\(^o^)/ww
仕方なくクリーンインストールの旅へ…..._( `ω、_ )_
_人人人人人人人人_ > 死にたい(^o^) <  ̄Y^Y^Y^Y^Y^Y^Y ̄ pic.twitter.com/aYmzFmDqbY
— かわにょ (@kawanyo) 2015, 10月 1
ApacheもどきやFTPD関連の設定が…(´・ω:;.:...
しかし何故か外付ケースに入れて別のPCでUSB接続すると元のSSD認識(゚∀゚)
(設定サルベージ出来た!)
良くわからないけどSSDのコントローラーかブートする何処かが壊れた模様。
(SSDの寿命計測ソフト入れててもコントローラーの故障はさすがに判らないw)
再インストール後も何度かフリーズする事はあったけど、
このPCを組んだ時にも設定してたHyper-Threading関連だと思うので、
その辺を調整したら安定し始めました。
(温度的には問題ないんだけど熱暴走的なフリーズです…たぶん)
「STOPコード:0x00000101」的には
「USBデバッグケーブルが接続されている場合に起こる」と言うけどそんなものは挿してないよと(´・ω・`)
https://support.microsoft.com/ja-jp/kb/2648039
ただ、こちらのBlogを読む限りでは、
PC-take店長のブログ : 0x00000101
粗悪なUSBケーブルだとフリーズするらしいφ(・ω・ ;)
が、忘れた頃にまたブルースクリーン(笑
_人人人人人人人人人人人人人人_ > 鯖が忘れた頃にブルースクリーン <  ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄ pic.twitter.com/KZtZjzQdUy
— かわにょ (@kawanyo) 2015, 10月 21
Hyper-Threadingを無効にする設定のほかに、BIOSのCPU Idle StateをLowPowerにするなど、更に設定を調整した上でMemtestでは問題がないというメモリも念のために買い替えることに。
念には念を入れてエラー補正機能の付いた高価なメモリを買おうと思ったけど、
サーバのマザーはECCメモリ未対応だった\(^o^)/
なので、価格comとAmazonで評判の良いElixirのメモリを買って来ました。
奥が今まで使ってたSanMax製メモリ。手前が買ってきたElixirメモリ。
セットアップ(>ω<)
今の所、安定している気がします…w
■結論
・SSDのコントローラーと一部のセクタが逝ってたっぽい
・メモリも何だか調子が悪かったっぽい
というなんともアバウトな結果です(笑
あと、数日前に挿しっぱなしでたまにしか使わないWEBカメラを起動したら画面が固まって(ブルースクリーンにはならない)電源長押しで再起動させたので、「STOPコード:0x00000101=粗悪なUSBケーブルはフリーズ」から考えるにもしかしたらWEBカメラが壊れたのかも…と思ったので抜いておきました(´・ω・`)ゝ
もうどれが原因なのかサッパリですね\(^o^)/
また変な不都合が出たら追記していきます…(´・ω:;.:...
追記:11/3
また落ちたのでその内まとめます><;
追記:11/25
1~2週間安定してるのでご報告。
その後、BIOSのアップグレードをして、
ドライバ類のダウングレードをしました。
再インストール時にintelの自動ドライバインストールツールを使いましたが今回はマザーボードの型番から1つ1つDLしてそれらの最新版(実質ダウングレード)をしています。
ただし、グラフィックドライバはインストールせずにOS標準のままで運用しています。
現状、ブルースクリーンになることはなく安定しているような気がします…~('、3_ヽ)_
<あまぞん>
シー・エフ・デー販売 Elixir デスクトップ用メモリ DDR3 W3U1333Q-4G DDR3 PC3-10600 CL9 4GB x 2枚セット
- 出版社/メーカー: シー・エフ・デー販売
- メディア: Personal Computers
- 購入: 23人 クリック: 141回
- この商品を含むブログ (30件) を見る
この記事を気に入って頂けたらシェアしてくれると嬉しいです。