タグ

2019年9月23日のブックマーク (2件)

  • 強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS

    はじめに ベルマン方程式の概要 最適制御と評価関数 最適制御 評価関数 価値関数 ベルマンの最適性原理 ベルマン方程式 価値関数の離散化 状態の時間発展再訪 ベルマン方程式 まとめ 最後に はじめに 強化学習の基礎に置かれている「ベルマン方程式」について、言葉は知っているが実はちゃんと理解していないという方は意外と多いのではないかと思われます。これを知っていようが知っていまいが、正直世の中の便利なフレームワークを活用すれば強化学習を実行することは可能であるためだと推測されます。 しかし、ある種の出発点になっているはずの基礎方程式を無視して、ガチャガチャ色々試してみても、なんだかフワついたままでモヤモヤしてしまうのではないでしょうか。少なくとも自分はそうです。 なので今回はベルマン方程式を基から丁寧に解説していきたいと思います。 ベルマン方程式の概要 細かい話をする前に、ベルマン方程式がど

    強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS
  • 北朝鮮新型ミサイル、探知できず 低高度、変則軌道で日本政府 | 共同通信

    北朝鮮が5月以降、発射を繰り返した短距離の新型ミサイルに関し、日政府が複数回、発射後の軌道を探知できなかったことが22日、分かった。複数の関係者が明らかにした。日を射程に収める可能性があるミサイルも含まれていた。低い高度や変則的な軌道のため捕捉できなかったとみられる。日政府は北朝鮮が既存のミサイル防衛網の突破を目指していると分析しており、技術開発の進展に危機感を強めている。 韓国軍は探知に成功したとみられる。日韓の軍事情報包括保護協定(GSOMIA=ジーソミア)破棄が日の安全保障に影響を及ぼす懸念も広がりそうだ。

    北朝鮮新型ミサイル、探知できず 低高度、変則軌道で日本政府 | 共同通信
    heyheyhey
    heyheyhey 2019/09/23
    GSOMIA破棄しても困るのは韓国とか抜かしてたアベンジャーズの目論見は見事外れた。韓国の提案通り、日本政府が韓国に対する輸出管理規制を止めて、GSOMIAを結び直すことが一番お手軽で国益に適う。