タグ

ブックマーク / proc-cpuinfo.fixstars.com (2)

  • OpenCL 2.0勉強会#1:Shared Virtual MemoryなどのOpenCLのバッファー関連まとめ - Fixstars Tech Blog /proc/cpuinfo

    Fixstarsでは半年ごとに2つの社内勉強会を開催しているのですが、今は、もうすぐ確定するはずのOpenCL 2.1に向けてOpenCL 2.0の勉強会を開催しています。 先週の発表者は私で、タイトルに書いたようなことを話したのですが、せっかくなのでここでまとめたいと思います。 ※なるべく一般的なOpenCLについて記述するよう心がけていますが、試した環境がAMDGPU/APUのため、一部デバイス・プラットフォーム固有なことが書かれているかもしれません。 OpenCLのバッファーとは OpenCLでは基的にホストで用意したデータをデバイスで計算してもらい、デバイスで計算した結果をホストが受け取るという形式になっています。 この時、デバイス側で用意する(確保する)メモリ領域のことをバッファーと呼びます。 このような、デバイス・ホスト間の通信ですが、よくあるCPUGPUの構成だとCPU

    OpenCL 2.0勉強会#1:Shared Virtual MemoryなどのOpenCLのバッファー関連まとめ - Fixstars Tech Blog /proc/cpuinfo
  • Processor Trace を使ってデバッグ時に詳細なトレースを取得する - Fixstars Tech Blog /proc/cpuinfo

    このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。 Broadwell 世代から、いくつかのCPUではProcessor Traceと呼ばれる機能が付いています。簡単に使いかたを説明します。 Intel Processor Trace それなりの規模のCPUにはプロセッサ内で発生したイベントを収集する仕組みがあります。よく使うものだと、パフォーマンスカウンタのイベント等ですね。 Haswell以前では、これらのイベントは割り込みを経由して収集されていました。ただ、割り込み経由だと、それなりにオーバーヘッドが大きくなってしまうので、 全てのイベントを収集することは難しく、サンプリングベースのものが主流でした。 Intel Processor Trace は、メモリ経由で、CPU内のイベントを収集する仕組みです。 これを使うと、メモリ経由で

    Processor Trace を使ってデバッグ時に詳細なトレースを取得する - Fixstars Tech Blog /proc/cpuinfo
  • 1