東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois
「モンスターハンターダブルクロス」はミリオン突破。Nintendo Switch用タイトルも人気の「ゲームソフト週間販売ランキング+」 集計期間:2017年3月20日〜3月26日(メディアクリエイト調べ) コンシューマソフト週間販売ランキングTop20 ※順位の赤背景は新作タイトルです。 順位 機種 タイトル 発売日 販売本数 累計本数 読者レビュー 1 モンスターハンターダブルクロス 17/03/18 280,293 1,128,760 60 2 ゼルダの伝説 ブレス オブ ザ ワイルド(限定版含む) 17/03/03 39,103 302,080 95 3 1-2-Switch 17/03/03 21,647 137,384 4 ゴーストリコン ワイルドランズ 17/03/09 17,349 133,768 58 5 Horizon Zero Dawn(限定版含む) 17/03/02
みなと⋈さん @mimatokanade @__yz_Sh @Rock_ozanari 発言主で無く申し訳ないですが経験者として話します。全体としては軍隊のような規律行動に加えて「主体的行動」を強く求められます。その点について具体的指示は無く曖昧です。「新卒の精神構造を変える」のが主な目的ですので空気に飲まれないように。 2017-03-29 11:45:56 みなと⋈さん @mimatokanade @__yz_Sh 研修の目的は一般常識や仕事内容の教育以上に「会社の為に粉骨砕身」な精神状態の人間を作成する事が目的、なんて会社とあります。怖がらせるようですが、実体験を載せておきます。その場の空気を尊重しつつ、自分を追い詰めないように冷静に頑張ってください。 pic.twitter.com/9dS8US7BPC 2017-03-29 12:15:01
ホテル各室にテレビがあるのに受信料が支払われていないとして、NHKがビジネスホテルチェーン大手「東横イン」とグループ会社に未払い分を求めた訴訟で、東京地裁(中吉徹郎裁判長)は29日、ほぼ請求通りの計約19億3千万円の支払いを東横イン側に命じる判決を言い渡した。NHKによると、判決で受信料の支払いを命じた額としては過去最高という。 対象は、2014年に東横イン側がNHKと全部屋分の契約をするまでの2年間の未払い分。東横イン側は「この期間は一定の割合の客室のみ契約することでNHKと合意しており、残りの客室分の支払いは免除されていた」と主張し、NHKは「残りの客室も支払いは免除していない」と訴えていた。 判決はグループの235のホテルにある未払いの約3万4千部屋について支払い義務があると指摘。「放送法はNHKによる恣意(しい)的な契約免除を認めておらず、免除の合意が成立していたとは認められない」
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く