サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ドラクエ3
qiita.com/ishizakiiii
概要 OpenAI Gymが新しい環境Roboticsを公開したので(公式ブログ)試してみました。 また、その中でHER(Hindsight Experience Replay)で、良いパフォーマンスが出たそうなので、アルゴリズムを理解し、動かしてみました。 環境作り Python3.5.2の環境で、OpenAI GymのインストールとMuJoCoとmujoco-pyのインストールが必要です。 MoJoCoを使うのはライセンスが必要ですが、一旦、無償版(30日間)を使いました。 MuJoCoのライセンス取得 MuJoCoとMuJoCo-pyのインストール方法(公式GitHub) OpenAI Gymのインストール方法(公式GitHub) 環境の種類 今回、8つのRobotics環境が公開されました。 Fecthと呼ばれる、物を摘めるようなロボットと、ShadowHandという手の動きを再現
概要 大井競馬場に行く機会があったので、機械学習を使って競馬の結果を予測できるかをやってみました。 その結果、帝王賞で一位を当てることができたので、記事を書きます。 かなり適当な予測なので、遊びとして見てもらえたらと思います。 証拠 当たったという証拠に、記念でとった馬券画像。 機械学習で予測したものと、パドックを見て予測したものと、2つ買いました。 (びびって複勝、しかも300円) 問題の設定 大井競馬場で行われる帝王賞の1位のみを当てます。 競馬には、色々な馬券の買い方がありますが、今回は簡単でシンプルな問題設定としたかったので、1位のみを予測することにしました。 データの取得 教師あり学習を行うので、過去の競馬結果のデータが必要です。 こちらのサイトからデータをクローリングしました。 南関東4競馬場公式ウェブサイト レース情報のページから、レースに出る馬の過去情報があるページへのリン
概要 ディープラーニングに関する言葉をよく忘れるので、自分用に辞書のようなものを作成しました。 基礎・構成要素 ノード / ニューロン / ユニット 値が渡されたら、処理をして次に渡す機能をもつ部品。 レイヤー / 層 同じ階層のノードをまとめたもの。 重み / パラメータ 伝播されたデータに対してかける係数。 バイアス 前のレイヤーから伝播された値とは別に存在する、各ユニットへのインプットデータ。 学習率 / 学習係数 1回の重み更新(学習)で、どのくらい更新するかの度合い。 局所解 / 局所的最適解 近傍では最適な解と判断される点。広域で見たときに決して最適解とはなるわけではない。 鞍点 あるパラメータの勾配は上がるが、別の勾配は下がる点。 順伝播法 / フォワードプロパゲーション 入力層から、インプットデータを順々に伝播させてネットワークを通して出力層まで演算結果を出力する方法。 誤
概要 ディープラーニングの様々な手法について、ざっくり理解してまとめてみました。 MLP(多層パーセプトロン) 入力層と隠れ層と出力層が全結合である、もっとも単純なディープラーニング。 CNN(畳み込みニューラルネット) 畳み込み層とプーリング層をもつディープラーニング。 局所的なデータの位置のずれを吸収してくれる。 イメージ 畳み込み層(Convolutional layer)ではフィルターと呼ばれる$H×H$の正方データを対象画像上をスライドさせて、重なる部分のデータとフィルターの積和を特徴量として圧縮して、新たなmapと呼ばれるデータを生成する。 プーリング層(Max-pooling layer)では、$K×K$内の最大値を抽出しデータを圧縮する。 それを何層か重ねて最後は全結合によって出力層にデータを渡す。 RNN(再帰型ニューラルネット) 時系列データ、前後のデータに意味のあるデ
概要 強化学習のシミュレーション環境「OpenAI Gym」について、簡単に使い方を記載しました。 類似記事はたくさんあるのですが、自分の理解のために投稿しました。 強化学習とは ある環境において、自律エージェントが状況を観測しながら行動することを繰り返し試行し、目的を達成するための最適な意思決定を学習する、機械学習の方法。 教師あり学習とは違い、環境から得られる報酬を元に、行動の良し悪しを評価する。 The Go gopher was designed by Renée French. OpenAI Gym とは 人工知能を研究する非営利企業 OpenAIが作った、強化学習のシミュレーション用プラットフォーム。 オープンソース https://github.com/openai/gym OpenAI Gym インストール方法 1. 基本パッケージのインストール
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
概要 強化学習のDQN(Deep Q-Network)について理解したので、ゆるくGopherくんを使って説明を試みました。 DQNは人間を打ち負かしたAlphaGoでも使われています。 強化学習は書籍もネットの記事も難解なものが多いので、なるべく図で具体的に記載しました。 強化学習とは ある状態における最適な行動を学習する、機械学習の手法の一つ。 モデル化 ゴーファーくんがケーキを食べるために、最適な行動を学習することを例に考えてみます。 The Go gopher was designed by Renée French. エージェント ある環境で動くプレーヤー → ゴーファーくん 状態(status) エージェントが置かれている状況 $S=\{s_1,s_2,s_3 \cdots \}$ → どのマスにゴーファーくんがいて、どのマスにケーキがあるか? 各マスに1〜9の番号をふる ゴー
概要 2018年はもっともっと機械学習についてレベルアップしたい!! 来年は、カンファレンスとか勉強会とかもっと沢山行って、情報集めて、モチベ上げて、勉強だ!! みたいなノリで、「来年のカンファレンス、どんなのあるの?」と調べたのでまとめてみました。 Conferences(国外編) NIPS 機械学習に関する世界のトップカンファレンス。 開催日: 2018年12月3日〜2018年12月9日 場所: カナダ - モントリオール 公式サイト: https://nips.cc/Conferences/2018 最新の機械学習のアルゴリズムに関する情報や研究内容がガッツリ知れる。 ICML NIPSに並ぶ、機械学習に関する世界のトップカンファレンス。 開催日: 2018年7月10日〜2018年7月15日 場所: スウェーデン - ストックホルム 公式サイト: https://icml.cc/ 現
概要 社内の勉強会用に「機械学習って何?どうやって使うの?」というテーマでまとめたものです。この記事の内容が他の方の役に立てたら嬉しいです。 機械学習 = AI? 機械学習は人工知能の一分野で、ディープラーニングは機械学習の一分野です。 ルールベース 多重If文や探査により多彩なパターンを網羅して、複雑な条件でも適切な出力がされるようにプログラムされているもの データのパターンや特徴を学習し、それをもとに未知のデータに対して何かしらの予測を出力する ディープラーニング データの特徴となる要素の取捨選択を自動で行うことができる、機械学習の手法の一つ 強化学習 ある環境において、 エージェントが状況を観測しながら行動することを繰り返し試行し、目的を達成するための最適な意思決定を学習するもの Point! ルールベースだと、例外が発生すると人が手でルールを書き換える必要があり、どんどんデータが増
概要 ナイーブベイズ分類器(ベイジアンフィルター)のアルゴリズムを具体的な数値を使って説明します。また、Pythonで実装してみました。自分の勉強メモのつもりで書いたのですが、他の方の役にも立てたら嬉しいです。 #ナイーブベイズ分類器って? あるデータ(文章)をどのカテゴリーに属するのかを判定させる、機械学習の教師あり学習の手法の一つです。 スパムメールフィルターやWEBニュース記事のカテゴライズによく使われています。 難易度 ベイズの定理を利用した単純な手法で、難易度は低です。 なるべく数式を使わないで説明してみました。 ナイーブベイズ分類器の計算 対象文章がどのカテゴリーに分類されるかを決めるための計算ロジックを、具体的な数値を使って説明します。 学習データが以下である場合、対象文章がどのカテゴリーに分類されるか計算します。 学習データ サッカー [ ボール | スポーツ | ワール
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 概要 自分用のメモとして、機械学習に関する情報を浅く ( それなりに ) 広くをモットーに、ざっくり整理してみました。 少しでも、他の方の理解に役立ったら嬉しいです。 機械学習とは コンピュータプログラムが経験によって自動的に出力結果を改善していく仕組み。 手法 機械学習の代表的な手法について記載します。 1.教師あり学習 2.教師なし学習 3.強化学習 に分けて記載しました。 ※概要説明は一例です。 1.教師あり学習 1-1.線形回帰 予測したい値を算出する式を連続する多項式として表し、各係数を最小二乗法や最尤推定法で求めることでモデ
このページを最初にブックマークしてみませんか?
『@ishizakiiiiのマイページ - Qiita』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く