タグ

ブックマーク / pira-nino.hatenablog.com (5)

  • OpenAIのかくれんぼ強化学習の論文を読んだ - 下町データサイエンティストの日常

    論文: Emergent Tool Use from Multi-Agent Interaction 昨年 2019/09/17にOprnAIが出したかくれんぼ(hide and seek)強化学習論文を読んだので、備忘がてらブログにメモ。 メモなので、正確に書いていないことだけはご了承ください。。。 タイトルは"Emergent Tool Use from Multi-Agent Interaction" という論文。 かわいいagent君達がかくれんぼを学習していく様子からは想像つかないタイトルですね(小並) arxiv.org openai.com www.youtube.com また、「そもそも強化学習とは?」といった基礎的な話題は割愛させていただくことをご了承ください。。。 (余談) 白金鉱業fmのコンンツのために読んだ 白金鉱業fm という有志メンバーでのpodcastを定期的

    OpenAIのかくれんぼ強化学習の論文を読んだ - 下町データサイエンティストの日常
    misshiki
    misshiki 2020/04/01
    論文を分かりやすくまとめてくれるのありがたい。
  • 自分が読んだ強化学習の資料達 - 下町データサイエンティストの日常

    こんにちは。nino_piraです。 先日、強化学習の資料の引用ツイートをしましたら、それなりに伸びたので、「もしかして、みんな強化学習に興味ある!?」と思い自分が読んだ&好きな資料をまとめてます。 また、ブログを書いているうちに「何を持って基礎とするか」などカテゴライズも自分の中でも行方不明になっていましたので、色々思うところはあると思いますが、暖かい目で読んで頂ければ幸いです。。。。 あくまでも私の経験 強化学習基礎系 [Qiita] DQN(Deep Q Network)を理解したので、Gopherくんの図を使って説明 [書籍]これからの強化学習 [pdf] (小南さん作成) 強化学習入門 [pdf] (通称) Sutton第2版 [書籍] 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [ブログ]強化学習 もう少し強化学習を詳しく知りたい系の人へ [書籍]速習 強化学

    自分が読んだ強化学習の資料達 - 下町データサイエンティストの日常
    misshiki
    misshiki 2020/02/03
    “「もしかして、みんな強化学習に興味ある!?」と思い自分が読んだ&好きな資料をまとめてます。”
  • 傾向スコアを用いた因果推論入門~実装編~ - 下町データサイエンティストの日常

    0. はじめに 1. 対象データ 2. 先に各手法の結果を確認 3.準備 4. 基礎集計~CMを見た人と見ていない人での目的変数の差~ 5. 因果推論の流れのおさらい 6. 傾向スコアモデリング 6.1 モデリング 6.2 テスト / コントロールの傾向スコアの可視化 6.3Rでの傾向スコアモデリングの実装 7. 傾向スコアマッチング 7.1 結構面倒なpython 7.2 R (Matchingライブラリ) 7.3マッチングの評価 8.IPW 9. ダブルロバスト 9.1 回帰モデル 9.2ダブルロバスト 10.Proximityマッチング 11.改めて、各種手法による推定因果効果のまとめ 12.まとめ 0. はじめに 理論編に引き続き、実装を行なっていきます。 pira-nino.hatenablog.com 実装はpythonとRの両方で行いました。 作業用のコードは以下のgithu

    傾向スコアを用いた因果推論入門~実装編~ - 下町データサイエンティストの日常
    misshiki
    misshiki 2019/08/05
    “因果推論”
  • 傾向スコアを用いた因果推論入門~理論編~ - 下町データサイエンティストの日常

    0. はじめに 1. 因果推論~施策の当の効果~ 1.1 TVのCMを見るとアプリのプレイ時間が短くなる!? 1.2じゃぁ理想的な比較方法は? 1.3 背景要因を揃えた比較が難しい問題 1.4 反実仮想:仮に「xxxしたら / しなかったら」の効果算出 2. 傾向スコアを用いた効果測定 2.1 絶対にこの条件は守ろう ~ 「SUTVA」/「強く無視できる割り当て条件」~ 2.1.1 SUTVA 2.1.2 強く無視できる割り当て条件 2.1.3 どうやって条件が成り立ってるか確認するの? 2.2 傾向スコアとは 3. 傾向スコア算出 3.1モデリング 3.2モデルの評価 4. 傾向スコアを用いたマッチング 4.1 マッチングのお気持ち 4.2 様々なマッチング手法 4.3 マッチングのメリット / デメリット 4.4 マッチングの評価 4.5 そもそも傾向スコアをマッチングに用いるべ

    傾向スコアを用いた因果推論入門~理論編~ - 下町データサイエンティストの日常
  • データサイエンティスト見習い 新卒1年目が終わる - 下町データサイエンティストの日常

    1. 新卒1年目が終わる こんにちは。pira_ninoです。 表題の通り、 新卒1年目が終わりました。。。 いつまで「見習い」と名乗っていいのですかね(苦笑 せっかくの区切りなので、「受託分析会社の1年目が何をしているか」を自分の経験に基づいて書いていこうかなぁと思います。 2. 注意書き 受託分析なので、基クライアントの名前が出る話は一切出せません。つまり、具体的な仕事内容については書けません。 これ故に、受託分析会社のデータサイエンティストは勉強会などの表舞台になかなか出てこないのかなぁと思っています。自分も色々話したいことはありますが、表舞台に出すのはやはり難しいです(汗 また、 私の所属会社を一部の方はご存知かと思いますが「一応個人のブログ」であることをご了承ください。 記事では、「ふわっと」受託分析会社の1年目が何をしているかをお伝え出来ればと思います。 3. 全体的には良

    データサイエンティスト見習い 新卒1年目が終わる - 下町データサイエンティストの日常
  • 1