タグ

abciに関するdannのブックマーク (3)

  • ABCI上でpytorch distributed data parallelによるマルチノード学習 - Qiita

    なんの記事? pytorchのDistributedDataParallelについての日語記事があまりにもなかったため,素人がまとめました. 並列処理がわからない人による,わからない人のための,とりあえず使えればいいや的なDDPの解説です. 基的にABCIでの実行を前提に書かれていますが,それ以外の環境の人たちにも参考になれば幸いです. はじめに おなじみの機械学習フレームワークであるpytorch.気軽にDataParallelで並列処理の学習もできます. ですがfacebookなどの一流の機械学習エンジニアたちはDistributedDataParallelなるものを使った実装がちらほらみられます. そこでpytorchの解説記事を読むわけですが,これがびっくりするほどわからない. というわけで,ABCI上でのDistributedDataParallel(以下DDP)の使い方を自

    ABCI上でpytorch distributed data parallelによるマルチノード学習 - Qiita
  • PyTorch - ABCI 2.0 User Guide

    はじめに ABCIシステムの概要 ABCIの利用開始 ジョブ実行 ストレージ Environment Modules Python GPU MPI コンテナ 開発ツール 付録 各種アプリケーション Tips ABCI クラウドストレージ ABCI データセット ABCI Singularity エンドポイント FAQ 既知の問題 システム更新履歴 運転状況 お問い合わせ リンク PyTorch ここでは、PyTorchをpipで導入して実行する手順を説明します。具体的には、PyTorchを導入して実行する手順と、PyTorchとHorovodを導入して分散学習を実行する手順を示します。 PyTorchの単体実行 前提 grpnameはご自身のABCI利用グループ名に置き換えてください Python仮想環境はインタラクティブノードと各計算ノードで参照できるよう、ホーム領域またはグループ領域に

  • 60億円超を投じる政府のAI専用スパコン計画、狙いは「一人1ペタFLOPS」

    政府は2016年度第2次補正予算で、人工知能AI)に関する産官連携の新たなR&D拠点を立ち上げる「人工知能に関するグローバル研究拠点整備事業」に195億円を投じる。事業を管轄するのは、経済産業省所管の産業技術総合研究所(産総研)だ。 この195億円に含まれるのは、東京都江東区と千葉県柏市にそれぞれ建設するAI/ロボットの実験棟と、柏市に建設するサーバー棟の建設費、そしてスパコン級の演算性能を持つAI専用のコンピューティング基盤「AI橋渡しクラウド(ABCI)」の調達費である。 このうちABCIについては、2017年1月~2月に仕様案を固めた後、サーバー棟の建設と並行し、2017年末までに完成させることを目指す。「AI専用コンピュータとして、世界一の演算性能を有する」(産総研 情報・人間工学領域 研究戦略部 研究企画室長の谷川民生氏)という。 1980年代に実施されたAI開発の国家プロジェ

    60億円超を投じる政府のAI専用スパコン計画、狙いは「一人1ペタFLOPS」
    dann
    dann 2019/10/23
  • 1