タグ

ブックマーク / rdma.hatenablog.com (2)

  • NUMAアーキテクチャとネットワーク性能(2)-実践編 - Blog

    前回、NUMAアーキテクチャがネットワーク性能に与える影響についての技術的な背景を説明した。 (前回記事) NUMAアーキテクチャとネットワーク性能(1)-説明編 - Interconnect Your Future - InfiniBand and RoCE 稿では、実際にLinux環境でネットワーク性能を測定し、NUMAが与える影響についての事例とノウハウを紹介したい。 稿では、最終的には下記測定例をまとめている。NUMA構成が異なる場合、性能が全く異なってしまう。極端な話、40GbE NICなのに4-5Gbpsしか出ないことになってしまう。実際には性能出ます。注意。 NUMA構成上遠い構成でのiperf性能:1プロセス(1コア) 2.00Gbps、12プロセス(6コア) 4.84Gbps NUMA構成上近い構成でのiperf性能:1プロセス(1コア) 14.7Gbps、12プロセ

    NUMAアーキテクチャとネットワーク性能(2)-実践編 - Blog
    yass
    yass 2014/05/26
    " NUMA構成の設定(アフィニティ(Affinity)設定)は非常に重要である。性能的に不利な構成で性能測定を行うと、本例のような極端な構成では、40GbE NICなのに4-5Gbpsしか性能が出ないといったことも起こりうる。"
  • NUMAアーキテクチャとネットワーク性能(1)-説明編 - Blog

    NUMA(Non-Uniform Memory Access)とは Non-uniform memory access - Wikipedia, the free encyclopedia NUMA - Wikipedia NUMA(Non-Uniform Memory Access、ヌマ)とは、共有メモリ型マルチプロセッサコンピュータシステムのアーキテクチャのひとつで、複数プロセッサが共有するメインメモリへのアクセスコストが、メモリ領域とプロセッサに依存して均一でないアーキテクチャである。 複数CPUがある場合、近いメモリと遠いメモリが構成上存在し、データが置かれる場所によって、性能に差が出てしまうアーキテクチャである。 ネットワーク性能を測定する場合も、NUMA構成上不利な状態で性能測定をしてしまうと、思うような性能が出ない場合があるため、注意が必要である。稿では、NUMA及びCPU

    NUMAアーキテクチャとネットワーク性能(1)-説明編 - Blog
    yass
    yass 2014/05/26
    " NUMAノードの近いメモリに対して、遠いメモリは半分のバンド幅しか性能が出ていない / レイテンシー(処理完了時間)についても、遠いメモリは近いメモリより約60%も時間が掛かってしまう "
  • 1