CuPy は Python 上での GPU 計算を支援するライブラリです。Python で標準的に使われている配列計算ライブラリ NumPy 互換の API を提供することで、ユーザーが簡単に GPU (CUDA) を使えることを目指して開発しています。 今回は、CuPy の使い方とその実例、高速化のポイントに加えて、CuPy の仕組み、開発の方向性など、より深く CuPy を知って頂ける内容をお伝えします。
![新しい並列for構文のご提案](https://cdn-ak-scissors.b.st-hatena.com/image/square/97bea8562db61a491539b64b1fbd773ce569a2b8/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Fboostjp14parfor20140301-140228174000-phpapp02-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)
Boost.勉強会 #11 東京 - boostjp 茨城の山奥に行ったりとか,書類書いてたりとかして1週間も経ってしまいましたが書きます. "CilkPlus, TBB, OpenMP 〜 並列プログラミングを支える技術" という大層なタイトルで発表してましたが,つまるところこの辺のライブラリとかコンパイラ拡張の紹介です. 発表スライド: CilkPlus, TBB, OpenMP CilkPlus, TBB については以下のようなページがありますので,こちらを見ると良いと思います. Cilk Home Page | CilkPlus Home | Threading Building Blocks 後は CG 法自体についての説明ですが... まあ興味ある方は調べてみてください.簡単に言うと線形代数で連立1次方程式を解くための解法です. このスライドでは,ベクトル演算中心で並列化が容易
C++で、複数のスレッドから1つのオブジェクトにアクセスするときに同期をとる方法いろいろ。 1. atomicを使う 使える型は限られるが、お手軽。 std::atomic<int> x(0); boost::thread_group threads; for (int i = 0; i < 4; ++i) { threads.create_thread([&] { for (int i = 0; i < 1000000; ++i) ++x; }); } threads.join_all(); std::cout << x << std::endl; // 4000000 これはatomic<T>を使う例。 アトミックな操作を順に実行するだけのコードはアトミックでないことに注意。 2. クラスの中でロックする class integer { public: int get_value()
久しぶりに書く。 ssh で繋いでもいいけど、パスワード打つのが面倒なので。 rsh の使い方 $(HOME)/.rhosts にマシン名と実行するユーザ名を書く machine1 krustf machine2 krustfこれで、 rsh を使って hostname コマンドが実行されれば OK. $ ssh machine2 -l krustf $ rsh machine1 -l krustf "hostname" machine1 OpenMPI で rsh rsh を使うようにフラグを立てればよい。 後、どうもインストール先によっては必要な実行ファイルを mpirun が認識できないようなので、OpenMPI のインストール先ディレクトリ(configure で --prefix に渡した値)も指定する。 mpirun -prefix /usr/local \ --mca plm
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く