タグ

2020年2月1日のブックマーク (5件)

  • 自分が読んだ強化学習の資料達 - 下町データサイエンティストの日常

    こんにちは。nino_piraです。 先日、強化学習の資料の引用ツイートをしましたら、それなりに伸びたので、「もしかして、みんな強化学習に興味ある!?」と思い自分が読んだ&好きな資料をまとめてます。 また、ブログを書いているうちに「何を持って基礎とするか」などカテゴライズも自分の中でも行方不明になっていましたので、色々思うところはあると思いますが、暖かい目で読んで頂ければ幸いです。。。。 あくまでも私の経験 強化学習基礎系 [Qiita] DQN(Deep Q Network)を理解したので、Gopherくんの図を使って説明 [書籍]これからの強化学習 [pdf] (小南さん作成) 強化学習入門 [pdf] (通称) Sutton第2版 [書籍] 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [ブログ]強化学習 もう少し強化学習を詳しく知りたい系の人へ [書籍]速習 強化学

    自分が読んだ強化学習の資料達 - 下町データサイエンティストの日常
  • DQN(Deep Q Network)を理解したので、Gopherくんの図を使って説明 - Qiita

    概要 強化学習のDQN(Deep Q-Network)について理解したので、ゆるくGopherくんを使って説明を試みました。 DQNは人間を打ち負かしたAlphaGoでも使われています。 強化学習は書籍もネットの記事も難解なものが多いので、なるべく図で具体的に記載しました。 強化学習とは ある状態における最適な行動を学習する、機械学習の手法の一つ。 モデル化 ゴーファーくんがケーキをべるために、最適な行動を学習することを例に考えてみます。 The Go gopher was designed by Renée French. エージェント ある環境で動くプレーヤー → ゴーファーくん 状態(status) エージェントが置かれている状況 $S=\{s_1,s_2,s_3 \cdots \}$ → どのマスにゴーファーくんがいて、どのマスにケーキがあるか? 各マスに1〜9の番号をふる ゴー

    DQN(Deep Q Network)を理解したので、Gopherくんの図を使って説明 - Qiita
  • Indeedを退職してUbieに入社します|masa_kazama

    1月末で約2年ほど働いたIndeed退職して、UbieというAI×医療のベンチャーに転職します。せっかくの節目なので、社会人になってからを振り返りたいと思います。 目次 ・リクルートについて ・Indeedへの異動に向けて ・Indeedについて ・Ubieへの転職のきっかけ ・これから リクルートについてもともとは新卒でリクルートにデータサイエンティストとして入社して社会人生活を始めました。リクルートは様々なデータを保有しており、データ分析のしがいがありました。また、上司、同期、後輩は優秀な人ばかりで、常に学ぶことばかりでした。特に、データにどのように向き合って、仮説をたてて分析するのか、また、データの裏側にいる実際のユーザーやクライアントの課題を把握してどうしたら解決ができるのかといったスタンス面の土台がこの頃にできたように思います。技術面においても、GCPAWSを使って機械学習

    Indeedを退職してUbieに入社します|masa_kazama
    osamu0329
    osamu0329 2020/02/01
  • ドラゴンの目の論理パズルを知ったのだけど納得できない(納得できた)

    (追記:今更だけどパズルの原文はこちら→https://io9.gizmodo.com/can-you-solve-the-hardest-logic-puzzle-in-the-world-1642492269) 答えには納得したのだけど、問題文に納得がいっていない。 納得がいかない点を説明するために、以下にその問題の配役を変えただけの問題文を書く。 (この時点で間違っているのなら私の解釈間違いということでわかりやすいので指摘してくれると助かる) ある村に100人の村民がいます。 全ての村民は非常に頭が良いし、論理的で間違った行動はしません。それを村民全員が知っています。 村民全員はこの世の人の目は青か赤の二種類であると知っており、それは事実です。 村には鏡も水面もガラスも無く、自分の目の色を確認する術はありません。 村民は一日一回全員が集合し、自分以外の全員の目の色を確認する機会があり

    ドラゴンの目の論理パズルを知ったのだけど納得できない(納得できた)
    osamu0329
    osamu0329 2020/02/01
    赤い目を見たことないから、青を赤と誤認して誰もでていかないとかいうオチかとおもったら違った(そうすると論理パズルではなくなってしまう
  • RESTアンチパターン

    人々がRESTに挑戦しようとすると、通常、実例を探し始めます。そして、「RESTful」であると主張している多くの実例を探したり、「REST API」と名づけたりするだけでなく、RESTを行っていると主張する特定のサービスが何故失敗するのかに関する多くの議論を集めています。 何故、このようなことが起こるのでしょうか? HTTPは新しいものではありません。しかし、それは様々な方法で適用されています。それらのいくつかはWebデザイナが考えていたことと一致していますが、その多くは異なります。人が利用する、他のプログラムによって利用される、あるいはその両方の目的でそれらを構築するかどうかによらず、あなたのHTTPアプリケーションにRESTの原則を適用するということは、あなたがまさにあべこべのことをするということを意味します。つまり、あなたは「正しく」Webを利用しようとしているのです。あなたがその

    RESTアンチパターン