タグ

2017年12月17日のブックマーク (14件)

  • 深層学習と並ぶ人工知能の巨塔、強化学習とは一体何か - HELLO CYBERNETICS

    学習の種類 教師あり学習 教師なし学習 半教師あり学習 強化学習 ハッキリとした答えがわからない 良さそうか悪そうかの判断方法自体もわからない 問題設定は遥かに複雑 強化学習を理解する特殊例 強化学習の難しさと課題点 n腕バンディット問題 問題の状況 行動の価値 知識利用と探査 行動価値関数と行動の決定 Q関数 貪欲法による行動の選択 ソフトマックス行動選択 最後に 行動価値関数に関する続編記事 強化学習を学ぶための書籍 2016年NIPSでも強化学習は話題だった 学習の種類 教師あり学習 教師あり学習では、入力データとそれに対する解答をセットでシステムに与えます。 システムにデータを入力すると、何らかの出力を行います。もしもその出力が解答と違っていれば、システムの出力の仕方を僅かに変更するという形で学習を進めていきます。 システムの出力を データを 解答を システムの出力と解答との違い

    深層学習と並ぶ人工知能の巨塔、強化学習とは一体何か - HELLO CYBERNETICS
    none53
    none53 2017/12/17
  • Microsoft PowerPoint - 12RL.ppt

    1 情報意味論(12) 強化学習 櫻井彰人 慶應義塾大学理工学部 まずMDPについて � 確率過程 � マルコフ性 � マルコフ鎖 � マルコフ決定過程 � 強化学習 � 強化学習の技法 確率過程 � 簡単に言えば: ランダムな時系列 � しばしば、インデックスのついた確率変数の集まり と考える � 基: 状態とその状態にいる確率(時刻でインデッ クスされている)の集合 � 離散確率過程を考える 確率過程の例 � 古典: ランダムウォーク � ある時刻 t0 に状態 X0 で開始する � 時刻 ti にて、ステップ Zi だけ動く。ただし P(Zi = -1) = p and P(Zi = 1) = 1 - p � すなわち、時刻 ti においては状態 Xi = X0 + Z1 +…+ Zi http://en.wikipedia.org/wiki/Image:Random_Walk_e

    none53
    none53 2017/12/17
  • マルコフ決定過程(MDP) - 具体例で学ぶ数学

    状態の集合 $S=\{s_1,s_2,\dots\}$ 「自分が一番左下のマスにいて敵が右下にいる状態」など、全てのとりうる状態を集めたものが $S$ です。 行動の集合 $A=\{a_1,a_2,\dots\}$ 「自分が右に動く」「自分が上に動く」など、自分がとれる行動を集めたものが $A$ です。 遷移確率 $P(s,a,s’)$ 状態 $s$ において行動 $a$ をとったときに、次の状態が $s’$ になる確率 $P(s,a,s’)$ も与えられています。例えば、図の $s_1$ の状態で「$a_1=$ 右に動く」という行動をとったとき、敵は上か左にそれぞれ確率 $\dfrac{1}{2}$ で動くので、$P(s_1,a_1,s_2)=P(s_1,a_1,s_3)=\dfrac{1}{2}$ となります。 報酬 $R(s,a,s’)$ 「状態 $s$ において行動 $a$ をとっ

    none53
    none53 2017/12/17
  • 人間を育てるAIはまだ作れない?『アルファ碁 解体新書』著者・大槻知史×ゲームAI開発者・三宅陽一郎

    世界トップ棋士に快勝したアルファ碁の中身が一体どうなっているのか。そして、アルファ碁は人類にどんな価値や新たな課題をもたらしたのか。今回、アルファ碁を構成するディープラーニング、強化学習、モンテカルロ木探索を詳しく解説した『最強囲碁AI アルファ碁 解体新書』を刊行したばかりのAI研究者・大槻知史さんと、書の監修を務めたゲームAI開発者・三宅陽一郎さんに、アルファ碁とその影響力についてたっぷりと対談していただきました。 AI研究者や開発者はもちろん、大学生や高校生でも読める 三宅:書『最強囲碁AI アルファ碁 解体新書』はAI研究の最先端にいる大槻さんがアルファ碁を体系的に解説したです。まずは企画した意図や狙いについて教えていただけますか? 大槻:アルファ碁がどういうものか疑問に思っている方が多そうだと感じたことが大きいです。そもそも『Nature』に投稿された論文は英語ですし、技術

    人間を育てるAIはまだ作れない?『アルファ碁 解体新書』著者・大槻知史×ゲームAI開発者・三宅陽一郎
    none53
    none53 2017/12/17
  • ThB7-6.pdf

    none53
    none53 2017/12/17
  • [コラム]ROSで始めるロボティクス(13) ー Tango端末やDaydreamはAR/VRだけじゃない!XR元年はロボットのあり方も変える!

    none53
    none53 2017/12/17
  • Windows on ARMにおいて気になる電源管理への対応 (1/2)

    今回は前回紹介したドンキの2万円PCについて記事を書く予定だったが、問題が起きてしまった。簡単に言うと、この2万円PCは、OSのアップグレードや入れ替えで問題が起きやすいタイプのハードウェアのようで、正しく稼働していない状態になり、検証が不可能になってしまった。 RS3ことFall Creators UpdateのインストールUSBメモリを作り、ここからのアップデートを試みたのだが、インストール中にネットワークデバイスが認識されず、インストール後にも無線LANデバイスが見えないままとなった。 同機には無線LANしかネットワークデバイスがないので、このままでは何もできない状態でインストールも不完全なままだった。ネットワークドライバを直接インストールしようとしたが、どうも親デバイス(SDIO)からして正しく認識されておらず、うまくいかなった。回復パーティションもRS3に書き換わり、購入時の状態

    Windows on ARMにおいて気になる電源管理への対応 (1/2)
    none53
    none53 2017/12/17
  • サービス終了のお知らせ

    none53
    none53 2017/12/17
  • Hot Chips 29 - 業界初のオープンソースRISC CPUコア「RISC-V」

    Hot Chips 29においてSiFiveは、業界初のオープンソースの「RISC-Vチップ」を発表した。RISC-V(リスク ファイブ)は、カリフォルニア大学バークレイ校で開発されたRISCアーキテクチャの第5世代となるライセンスフリーで、ローヤリティフリーな命令セットである。 このため、RISC-VはARMやMIPSのような商業的なRISC CPUに比べると、安い初期コストで利用できる。また、SiFiveを始めとしてRISC-Vをサポートする会社も出てきて品質も向上してきており、製品への利用も始まっている。 Hot Chips 29において、SiFiveのCTOのYunsup Lee氏が、同社のRISC-Vアーキテクチャを用いる「Freedom SoC」について発表を行った。 RISC-Vのアーキテクチャは非営利団体であるRISC-V Foundationが管理している。そして、RIS

    Hot Chips 29 - 業界初のオープンソースRISC CPUコア「RISC-V」
    none53
    none53 2017/12/17
  • RISC-Vについて改めて - FPGA開発日記

    この記事は ハードウェア開発、CPUアーキテクチャ Advent Calendar 2016 - Qiita の1日目の記事です。 Advent-Calendarを埋めてくれるかた、今からでも募集中です!是非参加してください! 僕一人では、クオリティのある記事を続けられそうにありません。。。(弱音) という訳で、私は今年一年で急激に注目を浴び始めたRISC-Vについて、あらためて纏めていこうと思う。 「改めて」と書いてあるとおり、私が一番最初に紹介したRISC-Vの記事は以下なので、こっちも参照してね。 msyksphinz.hatenablog.com RISC-Vの生い立ち 今でこそ随分と知名度を得たRISC-Vだがが、私が一番最初に発見した日語の記事は、以下と記憶している。 keisanki.at.webry.info この記事を見て、「面白そう!」と思ったので、自分で調べながら記

    RISC-Vについて改めて - FPGA開発日記
    none53
    none53 2017/12/17
  • 【後藤弘茂のWeekly海外ニュース】 海外で急激に盛り上がる新CPU命令アーキテクチャ「RISC-V」

    【後藤弘茂のWeekly海外ニュース】 海外で急激に盛り上がる新CPU命令アーキテクチャ「RISC-V」
    none53
    none53 2017/12/17
  • ドンキ“衝撃の1万円台PC”、影の立役者は中国製チップだった

    ドンキ“衝撃の1万円台PC”、影の立役者は中国製チップだった:製品分解で探るアジアの新トレンド(23)(1/3 ページ) ドン・キホーテがプライベートブランドのPCとして発売した「MUGA ストイックPC」。体価格で1万9800円という衝撃の価格を、なぜ実現できたのか。その裏には、実力を伴った中国製チップの存在があった。 2万円を切る衝撃価格のPC 2017年12月1日、ドン・キホーテから1万9800円(体価格)のノートPC「MUGA ストイックPC」が発売された。今や1万円台のタブレットやネットブックは存在するが、いわゆるPCとして1万円台の製品は稀有(けう)な存在だ。仕様はメインメモリが2Gバイト、ストレージメモリが32Gバイトと若干少ないものの、セカンドPCとしての用途には適している。弊社では早速MUGAストイック PCを入手して分解、解析を行った。 販売当日は開店前からドン・キ

    ドンキ“衝撃の1万円台PC”、影の立役者は中国製チップだった
    none53
    none53 2017/12/17
  • これさえ読めばすぐに理解できる強化学習の導入と実践

    強化学習の位置づけ 教師あり学習 教師なし学習 強化学習 強化学習の応用事例 Atariの攻略 AlphaGo ロボットの自動動作獲得 ファイナンスへの応用 広告配信の最適化 OpenAI Gymを使ってQ-learningを実装してみる 状態 行動 報酬 実装 参考文献 ディープラーニングなどの機械学習技術の進歩によって、過去のデータから学習する技術は大きく進化し、写真の中に写っている対象を認識することや病気の診断、多言語間の翻訳をする性能を著しく向上させることができました。 すでにその性能は専門的な教育を受けた人間の能力と同等 [1] か超えている分野もあるほどです。 一方で、人間にはデータを与えなくとも自ら経験から学び、スキルを上達させることができます。特に何も教えられなくとも、経験からゲームを攻略することやロボットの正しい動作の仕方を学んでいくことができます。 機械学習の中でも、こ

    これさえ読めばすぐに理解できる強化学習の導入と実践
    none53
    none53 2017/12/17
  • https://www.ipsj.or.jp/award/9faeag0000004ej9-att/1R-5.pdf

    none53
    none53 2017/12/17