タグ

deeplearningとtensorflowに関するserihiroのブックマーク (3)

  • Apache Hadoop上でTensorFlowを動かす「TonY」 | OSDN Magazine

    Microsoft傘下のLinkedIn開発者は9月12日、Apache Hadoop上でTensorFlowをネイティブに動かすオープンソースプロジェクト「TensorFlow on YARN(TonY)」を発表した。 TensorFlow on YARN(TonY)は、大規模なApache Hadoop実装上で分散型で機械学習を運用するためにLinkedIn社内で開発されたフレームワーク。単一ノードまたは分散型のTensorFlowトレーニングをHadoopアプリケーションとして動かすことができる。 開発チームによると、それまで「TensorFlow on Spark」やIntelの「TensorFlowOnYARN」を試したが、信頼性や柔軟性に欠けたため新たに開発することにしたという。TonYでは、リソースネゴシエーションやコンテナ環境設定などのタスク処理を通じてTensorFlo

    Apache Hadoop上でTensorFlowを動かす「TonY」 | OSDN Magazine
  • Distributed TensorFlow でデータ並列を試してみる - Qiita

    データ並列とは 前回はDistributed TensorFlowのビルドからモデル並列までを行いましたが、今回はデータ並列による学習を試してみます。並列化にはモデル並列とデータ並列の2種類がありますが、大雑把に言うと下記のようになります。 モデル並列: データ1000個に対する巨大な演算1回を100人で分担する データ並列: 1人あたりデータ10個ずつ小分けにして100人で分担する モデル並列は当然ながらモデルに依存するので、データ並列で一度に扱うデータを減らすほうが汎用性は高いといえるでしょう。 パラメータの共有 学習におけるデータ並列化では、同じパラメータを持ったモデルのコピーを複数作り、バッチを小分けにしてそれぞれのモデルのコピーに渡し、各々に微分を計算させます。つまり同じパラメータをもったモデルをデバイスごとに持たせなければならないのですが、そのあたりの扱いが少しわかりにくいです

    Distributed TensorFlow でデータ並列を試してみる - Qiita
  • p2 インスタンスへの TensorFlow 導入 - Qiita

    はじめに この記事は AWSGPU マシンのなかで最も性能の高い p2 系のマシンでの、 TensorFlow の環境構築のメモです。 最終的に AWS Step Function と AWS Lambda を組み合わせて、ここで作ったマシンをスポットインスタンスとして立ち上げ自動で学習を回すことを目指しています。 ※ p2 インスタンスは現在東京リージョンには導入されていません。オレゴン・バージニアなどのリージョンを使ってください。 イメージの選定 TensorFlow 公式ドキュメント を読むと Linux の場合 Ubuntu をベースに書かれているようですので、 Ubuntu のインスタンスを選びました。 Ubuntu Server 16.04 LTS (HVM), SSD Volume Type 予め CUDA 環境などが入っている Amazon Linux の AMI 等

    p2 インスタンスへの TensorFlow 導入 - Qiita
  • 1