タグ

2017年2月24日のブックマーク (2件)

  • 強化学習その2

    東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois

    強化学習その2
  • 優良AIスタートアップの見分け方 - 随所に主と作れば、立処皆真なり

    ある方にAIスタートアップの評価方法について聞かれ、いろいろ考えてたら面白くなってきたのでここにまとめて記しておく。手短に言えば、秘密主義は良いサインとはいえないし、AIで何でも出来るはウソだし、応用と顧客に寄り添う堅実さがが第一ということだ。まったくの個人的な意見であり、基的に余計なお世話だとは思うが、笑い飛ばしてもらえれば幸いである。 なおここでのAIスタートアップの意味は、分野や規模は問わず、人工知能AIという言葉を前面に出している新興テック企業とする。 「秘密の独自AI技術(特許出願中)」を第一にアピールして"いない" ビジネス自体に新規性がない場合、テック企業としては技術力をアピールしなければならないが、言葉にすると「世界最高レベルの自社技術」など情報量のない表現の羅列になりがちだ。 サンフランシスコ界隈で数多くのAIスタートアップを取材している記者の話では、技術のコアについ

    優良AIスタートアップの見分け方 - 随所に主と作れば、立処皆真なり
    mainyaa
    mainyaa 2017/02/24