タグ

並列に関するmoritataのブックマーク (6)

  • RayによるPython分散並列処理入門 - Qiita

    Rayとは RayはPythonにおける分散並列処理を高速かつシンプルに書けるフレームワークで, 既存のコードを並列化することも容易な設計となっています. Rayを使うことでmultiprocessingなどに比べ簡単にプロセスレベルの並列処理を記述することができます. 記事はRayチュートリアルの内容をもとにしており, コードはPython 3.8.2, Ray 0.8.4での動作を確認しています. インストール ターミナルでpipなどからインストールできます. 使い方 基的な用途としては覚える文法はray.init ray.remote ray.get の3つのみで, この記事では加えてray.wait ray.put も紹介します. Rayによる並列化の基 実行に3秒かかる関数 func が二度呼び出され全体の実行に6秒かかる以下のコードについて, func の実行を並列化する

    RayによるPython分散並列処理入門 - Qiita
  • OpenMP 入門

    OpenMP は共有メモリ並列プログラミングの標準 API である。ここでは C/C++ 版を紹介する。Fortran 版もある。 OpenMP は自動並列化ではない。依存性の分析と解決はプログラマに任されている。使い方を間違えば、当然正しくない結果を出す。 #include <omp.h> OpenMP を使うときにはインクルードする。 _OPENMP OpenMP コンパイラが define するマクロ。 #pragma omp parallel 節 次の行から始まるブロックを並列に(重複して)実行する。 スレッドの数は num_threads 節か、omp_set_num_threads 関数か、環境変数 OMP_NUM_THREADS で指定する。 Parallel 指示行の時点で既に定義されている変数と、ブロック内でもstatic 宣言されている変数は

  • 仮想化技術に見るインテルとAMDの個性

    Intelが2005年3月のIDFで示したソフトベースでの仮想化処理とVTを利用した場合の仮想化処理の、ハードウェアイベント発生数の比較。イベント発生数が少ないVTによる仮想化が性能的に有利になると当時Intelは説明していた こうした仮想化に関する規格策定作業の進行と、仮想化技術のインプリメントにより、ユーザーが仮想環境を利用するための敷居はどんどん下がっていく。長期的には、コンピュータを利用するほとんどすべての環境において仮想化を前提としているかもしれない。だが、それが実現するのはずっと先のことだ。2007年のプラットフォームにおいては、VT-xやVT-dあるいはAMD-Vといった仮想化技術を利用しても、仮想環境を利用するときのオーバーヘッドがなくなるわけではない。 とくに、インタラクティブなI/O処理が多いクライアントでは、仮想化によって発生するオーバーヘッドは無視できないものになっ

    仮想化技術に見るインテルとAMDの個性
  • 研究テーマ - WWW.REAL.CS.TSUKUBA.AC.JP

  • ユーザーが検証,マルチコアの効果

    「マルチコアの効果は明らか」。ネット関連サービスを手掛けるIMJネットワークの山田敏博代表取締役はこう強調する。2月22日にインテルが開催した記者向け説明会のことである。 同社はレンタル・サーバー・サービス用の環境で,仮想化技術を適用している先進ユーザーの一社。今回,インテル製のプロセッサと仮想化ソフト「VMware ESX Server」を使って,マルチコア化による性能改善の度合いを検証した。IMJネットワーク社内のパソコン(Windows XPを搭載)を20台使い,仮想化環境を構築。IMJネットワークの社員が実際に業務で使用する中,プロセッサの使用率を測定していった。 平均プロセッサ使用率はシングルコア・プロセッサを4個搭載したマシンが62.4%。一方,クアッドコア・プロセッサを2個搭載したマシンでは17.0%だった。向上率で見ると,3.67倍になる。シングルコアの環境は3.66GHz

    ユーザーが検証,マルチコアの効果
  • マルチコアCPUの恩恵を享受する方法

    Multi-Core CPUの恩恵を享受するには、ひとつのジョブを複数のプロセスに分け同時に実行することで、時間のかかるジョブを早く終わらせてスループットを稼ぐ方法と、ジョブをそのまま並列化させずに複数同時に実行することで、トータルのスループットを稼ぐ方法があります。 シングルスレッドアプリの複数同時実行で高いスループットを実現 デュアルコアシステムは、今までのシングルコアのシステムよりCPUクロック、FSBが落ちるので、1プロセスを速く走らせるという点においてはシングルコアに劣りますが、2ジョブを同時に実行させてもほぼ1ジョブひとつ実行するのと同じ時間で終了させることができ、トータルのスループットを稼ぐという点においてはシングルコアのシステムより優れています。 est_human BLAST Test Database : Apr 24 2005 est_human Imp

  • 1