メモリに記録されるデータというのは意外と誤ってしまうものです。 誤ったデータが記録されるにはいくつかの要因があり、メモリモジュールの物理的な経年劣化や、宇宙線によるビットの反転など、通常の手段では防ぐことが難しい、あるいは事実上不可能なものが多いです。 そこでそういった誤りを防ぐために、ECCという仕組みが開発されました。メモリアクセスに冗長性を持たせることにより、エラーを検出、可能ならば訂正まで行ってくれる心強い仕組みです(参照:http://e-words.jp/w/ECCE383A1E383A2E383AA.html)。 LinuxでECCを利用し、メモリエラーを検出するにはEDACというモジュールを用います。 EDACはかつてはbluesmokeという名前のLinuxカーネルそのものからは独立したカーネルモジュールでしたが、2.6.16以降のカーネルソースツリーにはデフォルトで組み