東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois
2. 2 自己紹介代わりの コンテンツ類 DDD 2013 SQLチューニングに 必要な考え方と最新テクニック http://www.oracle.com/technet work/jp/ondemand/ddd-2013- 2051348-ja.html ブログ「ねら~ITエンジニア雑記」 http://d.hatena.ne.jp/gonsuke777/ Bind Peek をもっと使おうぜ! -JPOUG Advent Calendar 2014- http://d.hatena.ne.jp/gonsuke777/ 20141205/1417710300 まだ統計固定で消耗してるの? -JPOUG Advent Calendar 2015- http://d.hatena.ne.jp/gonsuke777/ 20151208/1449587953
2. 2Copyright©2017 NTT corp. All Rights Reserved. 諸説あるが、ここでの定義は「部分的な故障を許容するシステム」の事 複数台のコンピュータを接続して信頼性を高めたり データが途中で化けても再送したり訂正したり 一部のコンピュータが突然故障しても引き継いだり 故障を設計の一部に組み込む事が必須となる 分散システムとは 3. 3Copyright©2017 NTT corp. All Rights Reserved. • 世はまさに分散システム戦国時代 • Hadoopを皮切りに次々出てくる巨大分散OSS • シリコンバレーでも分散ミドルウェアベンチャーが多数出現 • 高信頼なシステムを作ろうと思った場合には複数台のマシンによる高可用構成 が前提になる • Google、Facebook、Amazon等はもちろん • 金融、流通などのエンタープラ
2. Copyright © 2017 Oracle and/or its affiliates. All rights reserved. 以下の事項は、弊社の一般的な製品の方向性に関する概要を説明するもので す。また、情報提供を唯一の目的とするものであり、いかなる契約にも組み込むこ とはできません。以下の事項は、マテリアルやコード、機能を提供することをコミット メント(確約)するものではないため、購買決定を行う際の判断材料になさらな いで下さい。オラクル製品に関して記載されている機能の開発、リリースおよび時 期については、弊社の裁量により決定されます。 OracleとJavaは、Oracle Corporation 及びその子会社、関連会社の米国及びその他の国における登録商標です。 文中の社名、商品名等は各社の商標または登録商標である場合があります。 2
2. Copyright (C) 2019 Yahoo Japan Corporation. All Rights Reserved. 自己紹介 鯵坂 明 (@ajis_ka) Apache Hadoop PMC 2018/9 中途入社 • Hadoop導入支援 • テクニカルサポート • Hadoopバージョンアッ プ + 新機能導入検証 • HadoopのJava11対応 2 浅沼 孝信 (@hayanige) Apache Hadoopコミッタ 2012/4 新卒入社 • Hadoop運用・開発 • NiFi導入・運用 • Hadoopバージョンアッ プ + 新機能導入検証 • HadoopのJava11対応 5. Copyright (C) 2019 Yahoo Japan Corporation. All Rights Reserved. これ、見覚えありませんか? 5 acce
2. アジェンダ 講演前半 (概要, ビジネスミーティング内容, トレンド, Keynote) 概要 ビジネスミーティングの内容 トレンド(私見) Keynoteザッピング 講演後半 (受賞関係, 研究紹介) Codd Award 受賞講演 (Prof. Ailamaki) Best Paper Interventional Fairness: Causal Database Repair for Algorithmic Fairness Runner-up Incremental and Approximate Inference for Faster Occlusion-based Deep CNN Explanations Fast General Distributed Transactions with Opacity 面白かっ
2. 自己紹介 • 木浦正博, Masahiro Kiura • 株式会社ドワンゴ/第二サービス開発本部 • ソフトウェアエンジニア • 2015年01月入社 • I ❤️ • 分散システム(Hadoop/Grid computing etc…) • パラメータチューニング • Linux • Python 2DWANGO Co., Ltd. all rights reserved. 3. 会社紹介 株式会社ドワンゴ • カドカワグループ • ニコニコ動画、ニコニコ生放送を はじめとするニコニコ事業を展開 • 2016年04月 N高等学校/N予備校 開校 • 2017年04月 ニコニコ超会議2017開催 項目 データ 登録者数 約6,743万人 プレミアム会員数※ 約243万人 MAU 約913万人 ※プレミアム会員とは? 月額540円にて、専用回線での快適な視聴や、 生放送の優先視聴ほか
2. Copyright 2019 FUJITSU LIMITED 五島康文 Linuxの開発部門で、OSS(Kernelやその周辺)の機能開発を担当 • エンタープライズ向け機能を開発 • OSSのコミュニティに、新機能などのパッチを投稿し、upstreamのソース に機能をマージするまでがmission ⇒ビジネスとしてupstreamへのマージが必須 • 2016/7~2019/1 不揮発メモリ(NVDIMM)を担当 OSSの開発者を育てるのが個人的なライフワーク • 社内でOSSコミュニティへの参加を推進 • プライベートでも若手を支援 ⇒ OSS Gateに参加 Advent Calendar • 元はクリスマスまでの日めくりカレンダー • 技術者が技術記事をblogに書くのが年末の風物詩に • Fujitsu Advent Calendarを最初にQiitaに作
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く