タグ

2019年9月23日のブックマーク (4件)

  • 強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS

    はじめに ベルマン方程式の概要 最適制御と評価関数 最適制御 評価関数 価値関数 ベルマンの最適性原理 ベルマン方程式 価値関数の離散化 状態の時間発展再訪 ベルマン方程式 まとめ 最後に はじめに 強化学習の基礎に置かれている「ベルマン方程式」について、言葉は知っているが実はちゃんと理解していないという方は意外と多いのではないかと思われます。これを知っていようが知っていまいが、正直世の中の便利なフレームワークを活用すれば強化学習を実行することは可能であるためだと推測されます。 しかし、ある種の出発点になっているはずの基礎方程式を無視して、ガチャガチャ色々試してみても、なんだかフワついたままでモヤモヤしてしまうのではないでしょうか。少なくとも自分はそうです。 なので今回はベルマン方程式を基から丁寧に解説していきたいと思います。 ベルマン方程式の概要 細かい話をする前に、ベルマン方程式がど

    強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS
  • プーチン氏の追放目指したシャーマン、精神科病棟に収容される ロシア

    儀式を行うロシア・トゥワ共和国のシャーマンたち(2010年8月20日撮影、資料写真)。(c)VALERY TITIEVSKY / AFP 【9月22日 AFP】ロシアのウラジーミル・プーチン(Vladimir Putin)大統領をその職から追い払うため、首都モスクワへ向かって歩いて旅していたところを拘束されたシベリア(Siberia)出身のシャーマン(霊媒師)が、精神科病棟に収容されたことが分かった。当局が20日に明らかにした。 【関連記事】ロシア当局、「悪魔」プーチン氏の退治目指したシャーマン拘束 自称シャーマンのアレクサンドル・ガビシェフ(Alexander Gabyshev)氏は、同国東部に位置する地元サハ共和国からモスクワまでの行程の約3分の1を踏破したものの、19日夜にバイカル湖(Lake Baikal)近くで拘束された。 サハ共和国保健省は、「ガビシェフ氏はきょう、共和国内の精

    プーチン氏の追放目指したシャーマン、精神科病棟に収容される ロシア
  • ふたり会議 | LINEでできるパートナーとの質問アプリ

    「ふたり会議」はパートナーとお互いの気持ちや共同生活の価値観を楽しく共有できる質問アプリです。93%のカップルが「話し合いに役立った」と回答しています。

    ふたり会議 | LINEでできるパートナーとの質問アプリ
  • 高精度でテキスト分類を行えるAIの環境を用意しました【BERT】 - ニートの言葉

    こんにちは、あんどう(@t_andou)です。 最近、自然言語処理のAIの一種であるBERTをよく触っています。 今回はBERTのソースを読まなくてもサクッと試せる環境を用意しましたので、メモとして残しておきます。 BERTとはどういうものか 画像引用:https://arxiv.org/pdf/1810.04805.pdf 凄くざっくりと説明すると、BERTとは2018年末にGoogleの人たちが開発した自然言語処理において汎用的に使えて精度の良いAIです。 自然言語処理において精度を測るためにいくつかのタスクがあるのですが、発表された時点ではダントツの成績でした。 仕組みなどの詳細については論文を読むか解説記事をググってください。 2019/09/22時点で既により精度の良い手法がどんどん発表されていますが、BERTの情報量と比べるとまだ少ないため、入門としてはBERTを触ってみるのが

    高精度でテキスト分類を行えるAIの環境を用意しました【BERT】 - ニートの言葉