タグ

2017年10月30日のブックマーク (7件)

  • これから強化学習を勉強する人のための「強化学習アルゴリズム・マップ」と、実装例まとめ - Qiita

    ※2018年06月23日追記 PyTorchを使用した最新版の内容を次の書籍にまとめました。 つくりながら学ぶ! 深層強化学習 ~PyTorchによる実践プログラミング~ 18年6月28日発売 これから強化学習を勉強したい人に向けて、「どんなアルゴリズムがあるのか」、「どの順番で勉強すれば良いのか」を示した強化学習アルゴリズムの「学習マップ」を作成しました。 さらに、各手法を実際にどう実装すれば良いのかを、簡単な例題を対象に実装しました。 記事では、ひとつずつ解説します。 オレンジ枠の手法は、実装例を紹介します。 ※今回マップを作るにあたっては、以下の文献を参考にしました。 ●速習 強化学習: 基礎理論とアルゴリズム(書籍) ●Deep Learning for Video Game Playing 強化学習とは 強化学習は、画像識別のような教師あり学習や、クラスタリングのような教師なし

    これから強化学習を勉強する人のための「強化学習アルゴリズム・マップ」と、実装例まとめ - Qiita
    agw
    agw 2017/10/30
  • PEZYグループ、国内1位のLINPACK性能と世界1位のGreen500性能を達成

    PEZYグループのExaScalerとPEZY Computingは2017年10月26日、海洋研究開発機構(JAMSTEC)に設置したスーパーコンピュータ(スパコン)「GYOUKOU(暁光)」で、TOP500のランキングに使われるLINPACK性能で14.13PFlopsを実測したと発表した。今回の測定は7056個のPEZY-SC2チップを使い、13.8液浸槽分に相当する規模での測定である。 なお、次回のTOP500リストは、コロラド州デンバーで開催されるSC17において、11月12日に発表される予定になっているが、このGYOUKOUの性能を超えるスパコンが登録されないと仮定すると、暁光の性能は東京大学-筑波大学が設置したOakforest-PACSスパコンの13.55PFlopsを超えて国内トップの性能であり、世界的にも6位の性能となる。 また、Green500のランキングに使われる消

    PEZYグループ、国内1位のLINPACK性能と世界1位のGreen500性能を達成
    agw
    agw 2017/10/30
  • 70歳・80歳の高齢者に保険加入は必要?医療費の負担割合も含めて解説

    70歳・80歳は死亡後のことを考えた保険選びがおすすめです。また健康リスクは年齢を重ねるにつれ上昇するため、入院や介護への備えも必要になります。記事では70歳・80歳の保険加入について、必要性や選び方を中心に解説します。

    70歳・80歳の高齢者に保険加入は必要?医療費の負担割合も含めて解説
    agw
    agw 2017/10/30
  • Kaggle Tokyo Meetup #3 開催レポート - tkm2261's blog

    こんにちは。tkm2261です。 今日は10/28に開催したKaggle Tokyo Meetup #3の模様をレポートします。 connpass.com このmeetupは@threecourseさんや@smlyさんが2年前ぐらいから始めて不定期で開催しており、 私もニートの有り余る労働力を活かして今回運営をして来ました。 開始前 今回はsmlyさんの勤め先であるアドバンステクノロジーラボさんに会場をお借りすることが出来ました。 いよいよKaggle Tokyo Meetup当日です! 入り口入って右手のエレベーターで4Fです お待ちしております! pic.twitter.com/80r6soIJ9H— Takami Sato (@tkm2261) 2017年10月28日 渋谷の超良いところにあって、美術館の上という超良いところのオフィスでした。 今回、Youtubeのチャネル登録者数が

    Kaggle Tokyo Meetup #3 開催レポート - tkm2261's blog
  • 太陽系を通過する謎の天体 NASAが“太陽系外”からやってきた可能性があると発表

    先日発見された太陽系を通過する謎の天体について、太陽系外から飛来してきた可能性があるとNASAが発表しました。もしそうだとした場合、観測・確認された初の「恒星間天体(interstellar object)」となります。 上から飛来し、太陽系を通過しました Credits: NASA/JPL-Caltech 現時点で「A / 2017 U1」と名付けられたその恐らく彗星(または小惑星)とされる物体は、10月19日に米ハワイ大学天文研究所の望遠鏡によって発見されました。直径約400メートル以下という大きさで、秒速25.5キロで移動しているとのことです。 「A / 2017 U1」は、太陽を周回する多くの惑星の軌道に対し、ほぼ真上からやってきたとされ、太陽に向かっては水星の軌道の間を通過して、現在は地球の軌道と火星の軌道の間を移動しているとされています。 なお名称については、国際天文連合によっ

    太陽系を通過する謎の天体 NASAが“太陽系外”からやってきた可能性があると発表
    agw
    agw 2017/10/30
  • 「仕事ではじめる機械学習」を読んだので作者に媚を売る - Stimulator

    - はじめに - 以下を読んで、筆者ら (@chezou, @tokoroten, @hagino3000) ともTwitterで相互フォローだし、いっちょ媚び売るために感想記事でも書いとくかみたいな記事。 www.oreilly.co.jp 私は「企業で機械学習プロジェクトをいくつか経験している」「書に載っているアルゴリズムや検定も大体わかる」くらいで書のターゲットからは少し外れているっぽいのだけれど、知ったことではない。 - このどんな人がターゲット? - 「仕事ではじめる機械学習」というタイトルの通り、「俺は来年から新卒社会人!大学で学んだ知識を活かして機械学習エンジニアとして頑張っていくぞ!」みたいな人が読むとすごく為になる。 あと、ターゲットとしては「バイトで機械学習経験したい学生」とか「突然上司機械学習やってくれって言われた!」みたいな人とか。 あと、機械学習を使った時

    「仕事ではじめる機械学習」を読んだので作者に媚を売る - Stimulator
    agw
    agw 2017/10/30
  • AlphaGo と AlphaGo Zero の自己対戦による学習部分の違い - うどん記

    流し読みだとちゃんと分からなかったのでメモ。 準備(AlphaGo) policy network : 盤面とその特徴量を入力として受け取り、各マスに打つ確率を返すニューラルネット。 value network: 盤面とその特徴量を入力として受け取り、その盤面での勝率を返すニューラルネット。 AlphaGo ではまず policy network をプロの棋譜データから教師あり学習で事前学習させ、その後自己対戦による強化学習によってさらに改善させていく。 AlphaGo の強化学習パート 教師あり学習後の policy network のパラメータ $\rho_0$ から学習をスタートする。自己対戦の結果から policy network のパラメータは随時更新されていく。それらを $\rho_1, \rho_2, \cdots$ とする。$t$ 回目の自己対戦では、現在のパラメータ $\

    AlphaGo と AlphaGo Zero の自己対戦による学習部分の違い - うどん記
    agw
    agw 2017/10/30