タグ

回路とエラー処理に関するvccのブックマーク (2)

  • コンピュータアーキテクチャの話(270) メインメモリのエラー訂正手法「Scrubbing」

    メインメモリのScrubbing コンピュータの中では、プロセサに使われているトランジスタよりもメインメモリに使われているトランジスタの方が圧倒的に多い。したがって、プロセサよりも、メモリが故障したり、エラーしたりという頻度の方が高く、メモリのエラーを訂正することが重要である。発生頻度の高い間欠エラーに対しては、前述のSECDEDコードを使い、1ビットエラーが見つかれば、訂正されたデータをプロセサに送ると同時に、メモリにも書き戻してやれば良いのであるが、1つ問題がある。 メインメモリは容量が大きい。例えば8GBのメインメモリを100nsごとに8バイトずつ読んだとすると、順番に読んでも100秒かかる。実際の動作では、頻繁に使われる部分もあるが、連続稼働するサーバでは何十時間もアクセスされない番地も出てくる。このような番地では、1ビットエラーが発生しても長時間アクセスされないのでエラーが訂正さ

    コンピュータアーキテクチャの話(270) メインメモリのエラー訂正手法「Scrubbing」
    vcc
    vcc 2013/01/15
    プロセサに使われているトランジスタよりもメインメモリに使われているトランジスタの方が圧倒的に多い。したがって、プロセサよりもメモリのエラーを訂正することが重要。
  • コンピュータアーキテクチャの話(271) DRAMの1ビット固定故障への対応手法「エラーロギング」

    また、DRAMにハード故障が発生し記憶セルが壊れてしまうと、その番地を読むと常にエラー(正確には、"1"固定の故障の場合は、"0"を書き込んだ場合だけがエラーになり、"1"を書き込んだ場合は、正常に動作しているように見えてしまう)が起きる。しかし、1ビットエラーであるとSECDEDコードでエラー訂正ができるので、サーバは正常に動作できてしまう。 しかし、このような固定故障がある状態では、その番地にソフトエラーが発生すると2ビットエラーになってSECDEDコードでは訂正不能になる。仮に全部の番地に1ビットの固定故障がある状態では、前記の例では230,400,000fitで、全体の100万分の1の番地に1ビット固定故障がある状態でも230fitと0.08fitと比べると各段に高い2ビットエラー率となってしまう。 「DRAM Errors in the Wild: A Large-Scale F

    コンピュータアーキテクチャの話(271) DRAMの1ビット固定故障への対応手法「エラーロギング」
    vcc
    vcc 2013/01/15
    DRAMにハード故障が発生すると"1"固定の故障の場合は、"0"を書き込んだ場合だけがエラーになり、"1"を書き込んだ場合は、正常に動作しているように見えてしまう。
  • 1