更新履歴 2020/11/26 見出しの階層が誤っていたのを修正し、また、見出しの一部を変更しました。 概要 "Mac-optimized TensorFlow and TensorFlow Addons" (https://github.com/apple/tensorflow_macos) を MacBook Air with M1 で動かすための試行錯誤 Intel アーキテクチャの MacBook Pro (Early 2015) から環境を移行した上で、 ARM ベース アーキテクチャに合わせるための方法の模索 (Mac-optimized) TensorFlow の実行結果は含まず、ひとまず import するところまで 背景 日本時間の 2020/11/11 03:00 から行われた Apple Event で詳細が公開された、Apple の新型チップ「M1」。 発表の中で、
はじめに 強化学習よくわからないけど,理論そっちのけでとりあえずパパッと動かして見たいせっかちな人向けです.つまり僕のような人間です. OpenAI Gymで,強化学習の環境を提供してくれているので,それを用います. OpenAI Gymはあくまでも環境だけで,実際に学習させるには他のものが必要です. 調べて見ると,Kerasで強化学習をやるkeras-rlを書いた人がいて,これを使うと簡単に試せそうだったので使います.先人に感謝. 環境の準備 今回の環境 Python 3.6.0 :: Anaconda 4.3.1 (x86_64) Mac OS Sierra 10.12.5 keras 2.0.5 (backend tensorflow) tensorflow 1.2.0 最初はディスプレイのないサーバーでやっていましたが,めんどくさかったので,ローカル環境でやりました. ちなみにディ
強化学習フレームワークの比較:Dopamine、RLLib、Keras-RL、Coach、TRFL、TensorForceなど 以下の記事が面白かったので、ざっくり訳してみました。 ・A Comparison of Reinforcement Learning Frameworks: Dopamine, RLLib, Keras-RL, Coach, TRFL, Tensorforce, Coach and more 0. はじめに「強化学習(RL)フレームワーク」は、RLアルゴリズムのコアコンポーネントの高レベル抽象化を作成することにより、エンジニアを支援します。これによりコードの開発が容易になり、読みやすくなり、効率が向上します。 しかし、フレームワークを選択すると、ある程度のロックインが発生します。フレームワークの学習と使用に投資すると、脱却するのが難しくなります。これは、訪問するパ
本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 「強化学習入門」の第2弾。今回は、強化学習の手法の一つ「Policy Gradient」について解説しています。加えて、「Policy Gradient」でTensorflow, Keras, OpenAI Gymを使ったCart Poleの実装内容もご紹介しています! こんにちは、AI開発部の高橋です。今回は強化学習の手法の一つであるPolicy Gradientを説明します。そしてTensorflow, Keras, OpenAI Gymを使ってCartPoleを実装してみます。 目次 目次 1. はじめに 2. 適用例 3. Valued-Basedのおさらい 4. Policy-Based 5. 実装 6. Baseline 7. まとめ 8. 参考文献・コード 1. はじめに 強
#シリーズ目次 機械学習の理論を理解せずに tensorflow で オセロ AI を作ってみた ~導入編~ 機械学習の理論を理解せずに tensorflow で オセロ AI を作ってみた ~実装編~ 機械学習の理論を理解せずに tensorflow で オセロ AI を作ってみた ~いざ対戦編~ 機械学習の理論を理解しようとしてから オセロ AI を作ってみた 〜再始動‼〜 機械学習の理論を理解しようとしてから オセロ AI を作ってみた 〜何これ Alpha Zero 編〜 機械学習の理論を理解しようと エクセルでニュートラルネットワークを作ってみた 〜画像認識 mnist 編〜 前回の続き... この分野では門外漢の私が、「機械学習の理論」をまったく勉強せずに オセロのAI を作ってみようと思います。 参考にしたサイトはこちら ・ DQNをKerasとTensorFlowとOpen
はじめに この記事はいまさらながらに強化学習(DQN)の実装をKerasを使って進めつつ,目的関数のカスタマイズやoptimizerの追加,複数入力など,ちょっとアルゴリズムに手を加えようとした時にハマった点を備忘録として残したものです.そのため,DQNの解説記事というよりも初心者向けKerasTipsになります. 実行環境 Python3.5.2 Keras 1.2.1 tensorflow 0.12.1 DQNとは DQN(DeepQNetwork)がDeepMindから発表されて2年以上経つので,もはやいたる所に解説記事や実装サンプルがあり,ここでの詳しい解説は不要だと思います.が,ざっくり言うと,Q-Learningという強化学習手法のQ関数部分を,深層学習により近似することで、動画像から直接Q値を推定することを可能にした学習手法です. DQNの理論としては ゼロからDeepまで学
超シンプルにTensorFlowでDQN (Deep Q Network) を実装してみる 〜解説編② 学習の流れを理解する〜 今回は、学習の流れについて解説します。 対象とするソースコードは下記となります。 https://github.com/algolab-inc/tf-dqn-simple/blob/master/train.py 学習の流れ 学習の肝となるのは、上記のコードとなります。 フロー図で示したものが下記となります。 登場人物として、プレイヤーを操作するエージェント と、ゲーム (環境) があります。 それでは、順を追って見ていきましょう。 ① アクションを選択 エージェントは、時刻tにおけるゲームの状態 (state_t) を受け取って、アクションを選択します。詳細は後述しますが、一定割合 (self.exploration) ではランダム選択、残りの割合では学習結果か
機械学習には数多くのライブラリが存在します。例えば数値計算処理を効率的に行ってくれる「Numpy」や、データ解析の手助けをしてくれる「Pandas」などです。 また多くの方が利用している「Scikit-learn」や「TensorFlow」なども機械学習の現場では頻繁に活用されるライブラリの一つです。本記事では機械学習のライブラリとしては比較的新しく、2016年にリリースされた「PyTorch(読み:パイトーチ)」をご紹介します。 機械学習に携わっている方であれば「PyTorch」を一度は耳にしたことがある方も多いかと思います。本記事ではエンジニア向けの「PyTorchで知っておくべき6の基礎知識」をまとめました。PyTorchの基本的な概念やインストール方法、さらに簡単なサンプルコードを掲載しています。 TensorFlowやKerasと肩を並べて人気急上昇のPyTorchの基礎を身につ
本記事はChainerやTensorFlowでGPUを使うと毎回結果が変わる理由と対策 (まとめ)の詳細編であり、TensorFlowについて具体的な対策について検証します。 ##関連Issues(TensorFlow) https://github.com/tensorflow/tensorflow/issues/2652 https://github.com/tensorflow/tensorflow/issues/2732 ##検証環境 TensorFlow r0.12 Python 3.5.2 CUDA 8.0 cuDNN 5.1 NVIDIA Tesla/GeForce いろいろ ##まずは乱数種の指定 GPUの演算誤差だけでなく乱数を用いていることも演算結果が安定しない原因です。 そこで乱数種を指定して発生する乱数を固定します。 ###乱数種の指定対象 TensorFlowの場
第7回ではTensorFlowの基本的な概念を説明しました。今回はTensorFlowをより簡単に扱うことができるようになる高レベルAPIについて説明を行います。高レベルAPIを知ることで、TensorFlowがぐっと身近に感じられるようになるでしょう。 1.はじめに 今回ご紹介するサンプルコードはPython3系、TensorFlow v1.3にて動作確認をしています。すでにPython3系、TensorFlow v1.3のTensorFlowの環境が構築できている方はサンプルコードをgithubより取得してください。 $ git clone https://github.com/rindai87/tf-highlevel-sample.git $ cd tf-highlevel-sample なお、本記事のサンプルコードを閲覧のみする場合は以下よりご覧いただけます。 https://g
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? TensorFlowは主に機械学習、特に多層ニューラルネットワーク(ディープラーニング)を実装するためのライブラリになりますが、その基本的な仕組みを理解するのにそうした難しい話は特に必要ありません。 本記事では、TensorFlowの仕組みを、算数程度の簡単な計算をベースに紐解いていきたいと思います。 TensorFlowの特徴 初めに、TensorFlowの特徴についてまとめておきたいと思います。 TensorFlowは、その名前の通りTensor(多次元配列、行列などに相当)のFlow(計算処理)を記述するためのツールです。その特徴
本ページでは、Google Brain Team によって開発された、ディープラーニング (深層学習) をはじめとするオープンソースの機械学習エンジン、TensorFlow のインストール手順について紹介します。 なお、2016 年 7 月時点では、TensorFlow は Linux および Mac のみでのみ利用可能であり、Windows のバイナリ (実行体) は未提供のため、本手順では、Linux (Ubuntu 16.04 LTS) を用います。 本手順は、Ubuntu と Anaconda のインストールが完了した状態から開始します。Python のバージョンは Python 3.5 (Python3) を用います。Anaconda のインストールが済んでいない場合は、Anaconda を利用した Python のインストール (Ubuntu Linux) の手順でインストール
概要 pythonにあまり触れたことのない人が、Pythonでの開発環境を構築して、TensorFlowをインストールするところまで解説します。 前提 mac OSX Yosemite以上を想定しています。Linuxの場合は、ツール等のインストール方法が異なるため、注意してください。 pythonの仮想環境の整備 (オプション) ここは必須ではありません。必要でない方は次の章まで飛ばしてください。 Macには初めからPythonが入っています。しかし、Python界隈では、Python2系とPython3系があり、ライブラリの充実度の関係から、なかなか3系に移行していけていません。そこで共存が必要になることもあります。 また、プロジェクトごとにライブラリのバージョンを管理したいことがあると思います。機械学習系のライブラリは数多く出ていますが、まだまだ黎明期で、高速でアップデートが行われてい
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く