読者です 読者をやめる 読者になる 読者になる

かわにょぶろぐ

買ったモノとか適当に。 2014/12/5( http://kawanyo.hateblo.jp/entry/141205 )以前の日記は他のSNSで書いてた日記を手動インポートしてます(´・ω・`)

サーバがフリーズしまくるお話。



9月の中旬くらいからサーバが頻繁にフリーズするようになり、
その際にした対応と対策のまとめを自分用に....φ(・ω・` )
・・・なのでこの記事は同じ症状の人以外には面白くないと思います…w

まず最初は、毎日ほぼ同じような時間にフリーズ。
画面は真っ黒でブルースクリーンではない。

まず最初に目を付けたのは電源回り。

なにせ昨年の同じような時期にも電源が逝ったので、

(本体ごと買い替えればスッキリするんですけどねw)
疑わない訳にはいかない(笑

しかし1年経たずに壊れるとはあまり考えたくないので
電源が壊れてる可能性は一旦保留して他の原因を探る。

UPS

まずは、震災直後に導入したUPSがヘタってるのでは?と思い、電源関係と言う事でUPSを外してみました。

f:id:kawanyo:20151102082043j:plain

…しかし翌日にフリーズ(´・ω・`)

 UPSは元気ですw

■時計周り

次に、Windowsのシステムログを見ると

システム時間は 2015-10-02T06:32:14.252831100Z から 2015-10-02T06:32:14.252831100Z に変更されました。

このように直前で時計を調整してるようで、もしかするとWindowsUpdateが「無効にしている自動時刻合わせ」を有効にしているのでは?と勘繰る。
(チューナー起動→録画中に時間が変わる→チューナーソフトがフリーズみたいな流れで想像)
改めて時刻合わせを無効に、そして定期的に時刻を調整してくれるNTPソフト「Adrasteia」も念のため無効に。

翌日、やはりフリーズ(´・ω・`)

■チューナー

前日の時計の時もだけど今回もチューナーが録画中にフリーズしてたので、ハードウェア的にチューナーが壊れてるのかも?と言う事で予備のチューナーに差し替え。

翌日、やはりフリーズ(´・ω・`)
…チューナーは壊れてなかった(笑

あと、同じような時間帯に落ちるので、似たような事例が知恵袋にあったけど、
 3,4日程前からPCが毎日決まった時間にフリーズするのです... - Yahoo!知恵袋

ちょっと違ったw

■KP41病記事から別の事を発見

エラーログに何度も「Kernel-Power41」が出てくるので昨年の電源が逝ったとき同様、
やっぱ電源壊れてるのかなぁ…と思いつつ「Kernel-Power41」関係をひたすらぐぐる生活

そうするとこのようなページに辿り着き、
 Kernel-Power41病から解放されました♪: 日報あくせくジェ~ムズ

どうやらブルースクリーンに行く前に再起動する設定になっているらしい。
コントロールパネル>システム>設定の変更でシステムプロパティを開き
詳細設定タブの起動と回復の設定で「自動的に再起動する」のチェックを外し
デバッグ情報の書き込み項目を「最小メモリダンプ」に設定。


…フリーズしてもちゃんとブルースクリーン表示できるようになる(笑

■HDD/SSD?メモリ?

次のフリーズでは画面真っ黒じゃではなくブルースクリーンなので、原因を探れるようになりましたw
BlueScreen


>KERNEL_DATA_INPAGE_ERROR
>STOPコード:0x0000007A
と出てて、STOPコード的にはHDD/SSDの物理障害の可能性が高いようです。

 ブルースクリーン解決方法 0x0000007A [パソコン分解サイト]


「KERNEL_DATA_INPAGE_ERROR」はカーネルデータが仮想メモリ(pagefile)で見つからず物理メモリへの読み込みが出来ない場合のエラーのようなので、

 0x0000007A KERNEL_­DATA_­INPAGE_­ERROR カーネルが…|Yahoo!知恵袋


仮想メモリを無効にして起動。

そしたら翌日はフリーズしなかったけど翌々日にフリーズ\(^o^)/違うのかよw

ちなみにメモリは異常がないと仰る..._( `ω、_ )_

やはり前途のSTOPコードのようにSSDに何らかの問題がある模様…。
そこで、データのバックアップ開始。
…からの、ブルースクリーン

BlueScreen

「STOPコード:0x000000F4」は
HDD/SSDのケーブルや、HDD/SSD自体がダメになってる場合がある模様で、
メモリに起因する場合もあると、もう何が何だか状態w
 ブルースクリーン解決方法 0x000000F4 [パソコン分解サイト]


コントローラー系が逝ってるだけならSSDのメモリは生きてるハズなので、
再インストールは面倒なので別のSSDにクローンを作成する事に。

しかし、別のPCでAcronisを使ってクローンを生成してると
クローン元のSSDが途中からエラーでクローン生成できないと言われるw

(写真撮り忘れた><)

仕方なくクリーンインストールするかなぁ…と準備を進める前に
SSDをサーバに差し戻すと今度はBIOSから認識しなくなる\(^o^)/ww

仕方なくクリーンインストールの旅へ…..._( `ω、_ )_

ApacheもどきやFTPD関連の設定が…(´・ω:;.:...

しかし何故か外付ケースに入れて別のPCでUSB接続すると元のSSD認識(゚∀゚)
(設定サルベージ出来た!)
良くわからないけどSSDのコントローラーかブートする何処かが壊れた模様。
SSDの寿命計測ソフト入れててもコントローラーの故障はさすがに判らないw)

再インストール後も何度かフリーズする事はあったけど、
BlueScreen

このPCを組んだ時にも設定してたHyper-Threading関連だと思うので、

その辺を調整したら安定し始めました。
(温度的には問題ないんだけど熱暴走的なフリーズです…たぶん)

「STOPコード:0x00000101」的には
「USBデバッグケーブルが接続されている場合に起こる」と言うけどそんなものは挿してないよと(´・ω・`)

https://support.microsoft.com/ja-jp/kb/2648039


ただ、こちらのBlogを読む限りでは、
 PC-take店長のブログ : 0x00000101
粗悪なUSBケーブルだとフリーズするらしいφ(・ω・ ;)

が、忘れた頃にまたブルースクリーン(笑
f:id:kawanyo:20151102083852p:plain

 Hyper-Threadingを無効にする設定のほかに、BIOSのCPU Idle StateをLowPowerにするなど、更に設定を調整した上でMemtestでは問題がないというメモリも念のために買い替えることに。

念には念を入れてエラー補正機能の付いた高価なメモリを買おうと思ったけど、
サーバのマザーはECCメモリ未対応だった\(^o^)/

なので、価格comとAmazonで評判の良いElixirのメモリを買って来ました。

Elixir メモリ DDR3 PC3-10600 CL9 4GB
奥が今まで使ってたSanMax製メモリ。手前が買ってきたElixirメモリ。

Elixir メモリ DDR3 PC3-10600 CL9 4GB
セットアップ(>ω<)

Elixir メモリ DDR3 PC3-10600 CL9 4GB

今の所、安定している気がします…w

■結論
SSDのコントローラーと一部のセクタが逝ってたっぽい
・メモリも何だか調子が悪かったっぽい
というなんともアバウトな結果です(笑

あと、数日前に挿しっぱなしでたまにしか使わないWEBカメラを起動したら画面が固まって(ブルースクリーンにはならない)電源長押しで再起動させたので、「STOPコード:0x00000101=粗悪なUSBケーブルはフリーズ」から考えるにもしかしたらWEBカメラが壊れたのかも…と思ったので抜いておきました(´・ω・`)ゝ

もうどれが原因なのかサッパリですね\(^o^)/

また変な不都合が出たら追記していきます…(´・ω:;.:...

追記:11/3
また落ちたのでその内まとめます><;

追記:11/25

1~2週間安定してるのでご報告。
その後、BIOSのアップグレードをして、
ドライバ類のダウングレードをしました。
再インストール時にintel自動ドライバインストールツールを使いましたが今回はマザーボードの型番から1つ1つDLしてそれらの最新版(実質ダウングレード)をしています。
ただし、グラフィックドライバはインストールせずにOS標準のままで運用しています。
現状、ブルースクリーンになることはなく安定しているような気がします…~('、3_ヽ)_



<あまぞん>

 この記事を気に入って頂けたらシェアしてくれると嬉しいです。

電子書籍 コミック