RDMA(Remote Direct Memory Access)は、サーバーのメモリー間で直接データをやり取りする技術だ。アプリケーションが使うデータの送受信にOSを介さないため、高スループット・低遅延で処理できる。 IPプロトコルでデータを送受信する場合、通常はアプリケーションのプロセスがOSカーネルを呼び出し、OSカーネルがソケットを作ったり、メモリーにデータをコピーしたりといった処理が必要だ。データの転送に逐一OSを介しているために処理が遅くなり、性能のボトルネックになる恐れがある。今日、大規模な演算を行うシステムが増えた。とりわけ生成AI(人工知能)の学習プロセスでは、数万規模のGPU(画像処理半導体)を使用することもある。RDMAをここに適用すれば、従前の課題が解決し得る。 RDMAはサーバー間を接続するネットワークプロトコルとして実装される。HPC(High Performa