並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 92件

新着順 人気順

交互作用の検索結果1 - 40 件 / 92件

  • 統計検定準1級 合格体験記 - Qiita

    はじめに 統計検定準1級は(一財)統計質保証推進協会が実施、(一社)日本統計学会が公式認定する「2級までの基礎知識をもとに、実社会の様々な問題に対して適切な統計学の諸手法を応用できる能力を問う」試験です。現在はCBTでの実施となっています。 主観を込めて言いますと、2級と準1級では難易度に雲泥の差があります。 強調して言っておきます。まったく違います! 準1級では統計的推定や検定に加えて、多変量解析(重回帰、PCA、主成分分析、数量化)、時系列解析、マルコフ連鎖、確率過程、分散分析、ベイズ統計、MCMC...と範囲が広いのが特徴です。 以下、かなりの長文になりましたが、受験して得た知見をかなり具体的に記述しました。読者の皆様の合格への一助となれば幸いです。 目的 私はとある私立中高で物理と情報を教えています。統計の勉強を始めたのは、教科「情報」を教えるにあたってのスキルアップが目的です。も

      統計検定準1級 合格体験記 - Qiita
    • ソーシャルゲームにおけるキャラクターの露出度の性差の検討:『Fate/ Grand Order』を例に : 九段新報

      (今回の記事はいつもと文体が違います。それは『「フェミニスト共感ランキング」にみる「数字っぽいもの」への狂信、あるいは具体と抽象の往復に対する困難』でも指摘した通り、近年noteなどを主要な領域として調査もどきとでも言うべきものが流通しており、そうした調査の基礎をおろそかにした議論に否定的な一石を投じるためです。簡単に言い換えれば、もし本職がこの手の調査を徹頭徹尾論文っぽくやったらどうなるかをシミュレーションすることで、調査もどきのいい加減さを浮き彫りにしようということです。) 目的 近年、表現におけるジェンダーバイアスやその影響に関する議論が注目されている。特に創作物に登場するキャラクターの衣装の露出度に関しては性別による著しい差異が指摘されている(e.g. 東京新聞, 2022)。 しかしながら、創作物やそこに登場するキャラクターの数は膨大であり、多くのキャラクターの露出度を計量的に検

        ソーシャルゲームにおけるキャラクターの露出度の性差の検討:『Fate/ Grand Order』を例に : 九段新報
      • Kaggleランカーの9人に聞いた、2020年面白かったコンペ9選と論文9選 | 宙畑

        9名のKagglerの方にアンケートにご協力いただき、2020年に面白かったコンペと論文を教えていただきましたのでその結果を紹介します。 2020年も数多くのデータ解析コンペが開催され、興味深い論文が多く発表されました。 昨年公開した「Kaggle上位ランカーの5人に聞いた、2019年面白かったコンペ12選と論文7選」は現時点で20,000人を超える方にご覧いただき、Kaggleを始めとするデータ解析コンペへの関心が非常に高まっていると感じました。 そして本年も9名のKagglerの方にアンケートにご協力いただき、2020年に面白かったコンペと論文を教えていただきましたのでその結果を紹介します。 (1)回答いただいたKaggler9名のご紹介 まずは今回のアンケートに回答いただいたのは以下9名のKagglerの方です。 aryyyyyさま(@aryyyyy221) カレーちゃんさま(@cu

          Kaggleランカーの9人に聞いた、2020年面白かったコンペ9選と論文9選 | 宙畑
        • ディープラーニングを活用したレコメンドエンジン改善への取り組み - ZOZO TECH BLOG

          はじめに こんにちは、推薦基盤部の与謝です。ECサイトにおけるユーザの購買率向上を目指し、レコメンデーションエンジンを研究・開発しています。最近ではディープラーニングが様々な分野で飛躍的な成果を収め始めています。そのため、レコメンデーション分野でも研究が進み、精度向上に貢献し始めています。本記事では、ディープニューラルネットワーク時代のレコメンド技術について紹介します。 目次 はじめに 目次 パーソナライズレコメンドとは 深層学習より前の推薦手法 協調フィルタリング Matrix Factorization SVD(Singular Value Decomposition) Factorization Machine 深層学習を使った推薦手法 ニューラルネットワーク推薦手法に対する警鐘 Recboleプロジェクト Recboleプロジェクトを用いた各アルゴリズムの検証 General Re

            ディープラーニングを活用したレコメンドエンジン改善への取り組み - ZOZO TECH BLOG
          • スマホのタップ操作の成功率を算出するモデル ~ UIデザインにおけるユーザビリティの推定

            ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。Yahoo! JAPAN研究所で快適に操作できるUIを作るといったインタラクション分野の研究をしている山中です。 この記事では、リンクやボタンの大きさに基づいてタップの成功率を推定するモデルについて解説します(国際会議ISS 2020で発表した研究成果です [1])。 このモデルを活用すると、アプリやウェブページのデザインをするさいに、デザイナーが経験的にボタンやリンクの大きさを設定するのではなく、「リンクがこの大きさであれば95%の確率でタップできるから十分だ」などと操作性に基づいてユーザインタフェース(UI)を設計できるようになります。 タップの成功率を推定できると何が嬉しい? スマートフォンやタブレットPC向けの

              スマホのタップ操作の成功率を算出するモデル ~ UIデザインにおけるユーザビリティの推定
            • 『RとStanではじめるベイズ統計モデリングによるデータ分析入門』は「みどりぼん」に取って替わる次世代の統計モデリング+ベイジアン入門書 - 渋谷駅前で働くデータサイエンティストのブログ

              ここ2ヶ月ぐらいに渡って多くの方々からご著書をご恵贈たまわっているのですが、そのうちの一冊がこちら。かつて計量時系列分析を学んでいた頃に僕も大変お世話になった、Logics of Blueブログの馬場さんの手による『RとStanではじめるベイズ統計モデリングによるデータ分析入門』です。 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 作者:馬場 真哉出版社/メーカー: 講談社発売日: 2019/07/10メディア: 単行本 以前はベイズ統計モデリングの入門書というと「みどりぼん」こと『データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)』一択でしたが、皆さんもご存知のように既にメンテされていないWinBUGSを使っているなどout-of-dateな要素が多く、近年はこれに替わる良書

                『RとStanではじめるベイズ統計モデリングによるデータ分析入門』は「みどりぼん」に取って替わる次世代の統計モデリング+ベイジアン入門書 - 渋谷駅前で働くデータサイエンティストのブログ
              • 機械学習による株価予測 いろはの”は” - Qiita

                はじめに 2021年12月18日にNumerai Meetup Japan 2021が開催された(Numeraiについては過去記事「Numeraiトーナメント~伝統的クオンツと機械学習の融合~」を参照のこと)。このMeetupにて筆者も「Machine Learning for Advancing Traditional Quantitative Approach」と題してプレゼンを行った。 このプレゼン内容をベースとして文字起こししたので「機械学習による株価予測」シリーズいろはの"は"の章の代わりとさせていただく。 なお本記事はNumerai Advent Calendar 2021の24日目の記事とさせて頂いている。 参考:前回記事 機械学習による株価予測 いろはの”い” 機械学習による株価予測 いろはの”ろ” 本記事の目的 機械学習による株価予測は世界中で様々な研究が行われており、毎

                  機械学習による株価予測 いろはの”は” - Qiita
                • データサイエンスのための統計学入門 第2版

                  データサイエンスにおいて重要な統計学と機械学習に関する52の基本概念と関連用語について、簡潔な説明とその知識の背景となる最低限の数式、グラフ、RとPythonのコードを提示し、多面的なアプローチにより、深い理解を促します。データの分類、分析、モデル化、予測という一連のデータサイエンスのプロセスにおいて統計学の必要な項目と不必要な項目を明確にし、統計学の基本と実践的なデータサイエンス技法を効率よく学ぶことができます。データサイエンス分野における昨今のPython人気を反映し、第1版ではRのみの対応だったコードが、今回の改訂でPythonにも対応。コードはすべてGitHubからダウンロード可能です。 日本語版まえがき 訳者まえがき まえがき 1章 探索的データ分析 1.1 構造化データの諸要素 1.1.1 さらに学ぶために 1.2 テーブルデータ 1.2.1 データフレームとインデックス付け

                    データサイエンスのための統計学入門 第2版
                  • 新型コロナ重症化リスクファクター分析 XGBoost+SHAPによるEDA - JMDC TECH BLOG

                    JMDC データサイエンティストの齋藤です。 データ分析の第一歩、EDA(探索的データ分析)にどう取り組んでいますか? 予測のための機械学習の話はよく聞きますが、EDAのための機械学習はあまり目にしないと感じるので、 今回は実務における「XGBoost+SHAPによるEDA」の実践例を取り上げてみたいと思います。 題材は2021年7月にリリースした「新型コロナウイルス感染時の重症化リスクファクターに関する分析結果」です。 https://www.jmdc.co.jp/wp-content/uploads/2021/07/news20210709_2.pdf このブログの内容はテクニカル中心ですが、分析結果自体も面白いのでレポートもご覧いただけると嬉しいです。 XGBoost+SHAPでEDAする理由 分析デザインの概要 Feature Importance SHAP XGBoost+SHA

                      新型コロナ重症化リスクファクター分析 XGBoost+SHAPによるEDA - JMDC TECH BLOG
                    • 保育・幼児教育は「出身家庭に起因する機会格差」を軽減する(柴田悠) - エキスパート - Yahoo!ニュース

                      「機会の格差」の実態欧米と同様に日本でも、「どのような家庭に生まれたか」(親の学歴・所得・養育態度など)は、子どもの成人後の社会生活状況と、偶然では説明しがたい確率で(=統計的に有意に)関連している。 日本での既存研究によれば、幼少期に親が(原因が何であれ)低学歴や低所得だった場合は(つまり出身家庭が社会経済的に不利だった場合は)、傾向として、親に心理的・身体的な余裕がなく、親の養育態度の質が低くなりやすく(Yamaguchi et al. 2018)、子どもの0-2歳時や小学校入学時での健康や発達に困難が生じやすく(菅原 2012)、子どもはその後、低学歴になりやすく、成人後も、非正規雇用・低所得・相対的貧困・生活困窮状態になりやすく(阿部 2011)、健康感や幸福感も低くなりやすい(Oshio et al. 2010)。 このように、「出身家庭の不利」が「成人後の不利」につながっている

                        保育・幼児教育は「出身家庭に起因する機会格差」を軽減する(柴田悠) - エキスパート - Yahoo!ニュース
                      • クリエイティブな仲間は自分の創造性を妨げる? | 東京大学

                        クリエイティブな仲間は自分の創造性を妨げる? - イノベーションとネットワーク構造の少し複雑な関係 - 研究成果 ソーシャルなネットワーク構造と情報共有者の創造性がイノベーションの鍵を握ること自体は広く知られています。では、この両者はどのような関係にあるのでしょうか。 東京大学大学院総合文化研究科の楊大学院生、植田一博教授らの研究チームは、開放的なソーシャルネットワークにいる創造性の高い情報共有者が対象者のイノベーションにポジティブに影響するのに対し、閉鎖的なソーシャルネットワークにいる創造性の高い情報共有者は対象者のイノベーションにネガティブに影響することを明らかにしました(図を参照)。 具体的には、「Idea Storm」というウェブサイトの6,333名のユーザーのデータ2,213,782件の分析を通して、情報共有相手のアイデア提出実績と情報共有ネットワーク構造が、対象者のアイデア提出

                          クリエイティブな仲間は自分の創造性を妨げる? | 東京大学
                        • 図書の書架上の位置が利用者の注視時間に与える影響

                          本研究では公共図書館において,図書の書架上の位置が利用者の注視時間に与える影響を明らかにすることを目的に,視線追尾装置を用いた被験者実験を行った。実験は2017年10 ~11 月にかけ,愛知県の豊橋市中央図書館にて実施し,11 名の被験者が参加した。被験者には視線追尾装置を装着し,自身が読みたい図書を1 冊以上,館内から選択するタスクを課した。得られたデータから書架を注視している場面を抽出し,書架の高さ,注視されていた垂直位置(段),水平位置(左・中央・右)ごとの注視時間を算出した。分析結果から以下の知見が得られた。(1)書架上の垂直位置(段)は配架図書の注視時間に影響し,上段の方が下段よりも長時間見られる傾向がある。また,書架自体の高さにより垂直位置が注視時間に与える影響は異なる。(2)書架上の水平位置は図書の注視時間に影響しない。(3)書架上の垂直位置と水平位置の間に交互作用は認められ

                          • Pythonによる因果推論と因果探索(初心者の方向け) - Qiita

                            因果推論と因果探索を学びたい初心者の方を対象に、因果分析のPythonプログラムを実際にGoogle Colaboratoryで実装しながら学ぶ書籍を執筆しました。 単著としては、「つくりながら学ぶ! PyTorchによる発展ディープラーニング」、以来、約1年ぶりの新刊となります。 本記事では、因果分析の書籍を執筆したモチベーション、Pythonによる因果推論、因果探索の概要について解説します。 「つくりながら学ぶ! Pythonによる因果分析 ~因果推論・因果探索の実践入門」 ●2020年6月30日発売 ●著者:小川雄太郎(自己紹介、Twitter)@電通国際情報サービス(ISID) ●出版社: マイナビ出版 本記事の内容 ● 0. 本書を執筆したモチベーション ● 1. 因果推論が必要な事例 ● 2. 因果推論をしたいデータ ● 3. 因果推論の方法 ● 4. 因果探索の手法 ● 5.

                              Pythonによる因果推論と因果探索(初心者の方向け) - Qiita
                            • 表形式データに対する深層学習ライブラリの開発と実験 - Preferred Networks Research & Development

                              本記事は、2021年度PFN夏季インターンシップで勤務した平川雅人さんと畠山智之さんによる寄稿です。 はじめに 2021年度PFN夏季インターン生の平川雅人と畠山智之です。 今回のインターンでは、表形式データに対して様々な深層学習モデルを試すことができるライブラリを共同で開発しました。開発したライブラリは https://github.com/pfnet-research/deep-table で公開しています。 背景 近年、深層学習は画像や自然言語、音声の分野で目覚ましい成功を収めてきました。しかし表形式データに対しては、深層学習はそのような成功を遂げることは少なく、いまだにXGBoostやLightGBMのような決定木ベースのモデルが主流となっています。 深層学習の有望な手法として、決定木のアンサンブルを模倣して勾配ベースの学習を可能にしたNODE [1] や、スパースなattenti

                                表形式データに対する深層学習ライブラリの開発と実験 - Preferred Networks Research & Development
                              • HSPブームの今を問う(飯村周平:東京大学・日本学術振興会PD)|「こころ」のための専門メディア 金子書房

                                テレビ、雑誌、ネットなどの各種メディアでよく目にするHSP。心理学はいま、HSPについてどのようなことを明らかにしているのでしょうか? 今回はHSPに関する研究をご専門とされる飯村周平先生に、いまわかっていること、そして私たちが日常でよく目にする情報について、ご解説いただきます。 「HSPブーム」の到来と本記事のねらい いま、SNSやメディアでは、HSP(Highly Sensitive Person)という言葉が注目を集めています。精神科医やHSP専門カウンセラー、当事者など、さまざまな肩書をもつ人たちが、書籍を積極的に出版したり、情報を発信したりしています。 例えば、Twitterで「HSP」と検索してみてください。「#HSPあるある」「#HSPさんとつながりたい」「#HSP診断テスト」「#HSS型HSP」などのタグとともに、様々な情報が発信されていることがわかります。また、「生きづら

                                  HSPブームの今を問う(飯村周平:東京大学・日本学術振興会PD)|「こころ」のための専門メディア 金子書房
                                • Numeraiトーナメント -伝統的クオンツと機械学習の融合- - Qiita

                                  はじめに 本記事は、MediumのTowards Data Scienceに寄稿した「Numerai Tournament: Blending Traditional Quantitative Approach & Modern Machine Learning」を和訳したものである。 Numeraiトーナメントについて Numeraiはクラウドソーシング型ファンドと呼ばれる、不特定多数の人間による株価の予測結果をもとに運用するヘッジファンドである。Numeraiでは予測性能を競うトーナメントが開催される。トーナメント参加者はNumeraiから提供されるデータセットを元に予測モデルを構築し提出を行う。参加者はその予測性能に応じてランキングされ、報酬が支払われる(徴収されることもある)。 Numeraiへの出資者には、ルネッサンス・テクノロジーズの共同創業者であるハワード・モーガン、チューダ

                                    Numeraiトーナメント -伝統的クオンツと機械学習の融合- - Qiita
                                  • 統計学と機械学習におけるマルチコ(多重共線性)に対する考えの相違

                                    先日、デスマーチの末なんとか機械学習案件のリリースに漕ぎ着けました。 今回の案件に関わらないですが、要件や仕様はしっかり明文化しておくべきですね。 後から(特にリリース間近になって)言った言わないの議論になるのは双方にとってあまり気持ちのいいものではありません。 些細な仕様変更のため口頭で合意した内容でも、しっかりと資料化しておくことの重要さを再認識しました。 さて、今回はマルチコ(多重共線性)について投稿します。 クライアント先で多変量解析をしているときにこの話題が出たので、いろいろと調べてみました。 大学では統計学視点でのマルチコを若干勉強したのですが、この機会に再度勉強し直してみたのでまとめます。 マルチコ(多重共線性)とはマルチコとは、重回帰モデルにおいて説明変数間に強い相関がある事象のことをいいます。 マルチコはmulti-colinearlity(マルチ-コリニアリティ)の略称

                                      統計学と機械学習におけるマルチコ(多重共線性)に対する考えの相違
                                    • 書評 「NOISE」 - shorebird 進化心理学中心の書評など

                                      NOISE 上 組織はなぜ判断を誤るのか? 作者:ダニエル カーネマン,オリヴィエ シボニー,キャス R サンスティーン早川書房AmazonNOISE 下 組織はなぜ判断を誤るのか? 作者:ダニエル カーネマン,オリヴィエ シボニー,キャス R サンスティーン早川書房Amazon 本書はトヴェルスキーと行動経済学の基礎を作ったカーネマンが,ビジネスコンサルタント出身のオリヴィエ・シボニーと法学者で行動経済学関連の著作も多いキャス・サンスティーンと共著したヒトの意思決定のばらつきについての本になる.カーネマンとトヴェルスキーはヒトの意思決定や行動に様々なバイアスがあることを示してきたことで有名だが,本書では偏り(バイアス)ではなくそのばらつき(ノイズ)が取り上げられることになる.原題は「Noise: A Flaw in Human Judgment」 序章 序章では偏り(バイアス)とばらつき

                                        書評 「NOISE」 - shorebird 進化心理学中心の書評など
                                      • 心理学ワールド 89号 特集 左の顔と右の顔─悪い奴は左頬で笑う 大久保 街亜(専修大学) | 日本心理学会

                                        Profile─大久保 街亜 2002年,東京大学大学院人文社会系研究科博士課程修了。博士(心理学)。日本学術振興会特別研究員,同海外特別研究員,専修大学文学部講師,准教授を経て,2014年より現職。専門は認知心理学。著書は『伝えるための心理統計:効果量・信頼区間・検定力』(共著,勁草書房),『新版 認知心理学:知のアーキテクチャを探る』(共著,有斐閣)など。 図1 ルーカス・クラナッハ(父)による男性(左側)と女性(右側)の肖像。男性は右頬を女性は左頬を見せている。男性は無表情だが,女性はわずかながら口元に笑みを浮かべている。どちらも1522年の作品である。National Gallery of Art Open Accessより。 顔は,正面から見ると左右対称である。目や耳は左右に並んで同じ高さにあり,鼻は顔の中央にある。ただし,わずかに左右差がある。このような左右差を知ってか知らずか

                                          心理学ワールド 89号 特集 左の顔と右の顔─悪い奴は左頬で笑う 大久保 街亜(専修大学) | 日本心理学会
                                        • 投票の義務化について――投票率低下の原因を一方的に有権者におしつけるのは間違い|三春充希(はる) ⭐第50回衆院選情報部

                                          石破氏としては野党を食いちぎることの一環でもあり、場合によってはこうしたことも争点として改憲することを考えているのだと思われます。彼の発言に様々な打算があることは、注意してみていれば気付くでしょう。この発言をめぐる議論の中で、おそらく石破氏の計算通りに、複数の野党の政治家が投票の義務化に追随していました。 議論の余地はありますが、石破先生のおっしゃるとおり投票義務化に賛成です。罰則規制とかになるときな臭くなるので、投票に行くとポイントがたまる様なポジティブなアプローチでルール作りをするといいのではないでしょうか。 https://t.co/2MKybpRiYx — 須藤元気 (@genki_sudo) July 27, 2020 この須藤元気氏の発言は無邪気でほほえましいものですが、「自らの意思で3回連続投票に行かなかった人は選挙権を返上してもらう」という国民民主党の源馬謙太郎氏の提案はと

                                            投票の義務化について――投票率低下の原因を一方的に有権者におしつけるのは間違い|三春充希(はる) ⭐第50回衆院選情報部
                                          • LinkedInが開発した時系列モデル“Greykite”の理論と実装 - ぱぐみの部屋

                                            時系列データのモデリングとして、以下のような手法がメジャーかなと思います。 ARIMA Prophet 状態空間モデル RNN LSTM DeepAR 今回は、2021年に発表された比較的新しい手法であるGreykiteのご紹介をしていきます。 注意:本記事は2022年11月時点の情報をもとに記載しております。ライブラリの変更等により本記事の記載内容が古くなる可能性がありますが、ご了承ください。 Greykiteとは? LinkedInが2021年にOSSとして公開した時系列予測モデルです。機械学習分野の国際会議であるKDD2022でも発表されたようです。 KDD2022よりLinkedInによる時系列予測OSS Greykite (https://t.co/wpsCnuak2t) の紹介論文。コアとなるSilverkiteというアルゴリズムの紹介が中心で解釈可能性と速度が売り。Proph

                                            • Rで機械学習モデルの解釈手法たちを試してみる - 渋谷駅前で働くデータサイエンティストのブログ

                                              この記事の前段として、まず事前に昨年書いた機械学習モデルの解釈性についての記事をご覧ください。 僕が知る限り、機械学習実践のデファクトスタンダードたるPython側ではLIMEやSHAPといった解釈手法については既に良く知られたOSS実装が出回っており、相応に実際に使ってみたというレポートも見かける状況です。一方、R側ではそこまでメインに機械学習を回す人が多くないせいか、あまりこれまで実践例を見かけないなぁと思っていました。 そんなことを考えながら先日ふと思い立ってググってみたら、意外にも幾つかの解釈手法については既にOSS実装があり、中にはCRANに上がっているものもあるのだと今更ながら知ったのでした。 ということで、二番煎じなのか何番煎じなのか分かりませんが、これらのRによる機械学習モデルの解釈法実装を今更ながら僕も試してみることにします。検証に使うデータセットは統一してUCI ML

                                                Rで機械学習モデルの解釈手法たちを試してみる - 渋谷駅前で働くデータサイエンティストのブログ
                                              • 「Data Gateway Talk vol.5」に参加しました&全発表まとめ #dgtalk - u++の備忘録

                                                データアナリスト/データサイエンティストの登竜門 (Gateway to Success) となることを目指した勉強会「Data Gateway Talk vol.5」に参加しました。 data-gateway-talk.connpass.com 対象を絞った勉強会で以前から関心はあり、今回が初参加です。 本記事では、全発表について概要と所感を述べます。 データ分析業務を1年間やって実感したこと 発表資料 概要 所感 「データ分析」の解像度を上げたい 発表資料 概要 所感 GBDTアルゴリズム Gradient Boost Decision Tree with Iris Data 発表資料 概要 所感 Hivemallを使ってSQLで機械学習 発表資料 概要 所感 SHAP(SHapley Additive exPlanations)で機械学習モデルを解釈する 発表資料 概要 所感 リサー

                                                  「Data Gateway Talk vol.5」に参加しました&全発表まとめ #dgtalk - u++の備忘録
                                                • Kaggle Days Tokyo 参加レポート - Gunosyデータ分析ブログ

                                                  はじめに こんにちは!Gunosy Tech Lab の石川(@takaishikawa42)です。 この記事は Gunosy Advent Calendar 2019、12日目の記事です。 昨日の記事は id:mgi さんによるグノシーにおける AWS Transit Gateway 活用事例 でした。 12月11日・12日の2日間の日程で六本木の Google Japan のオフィスで開催された Kaggle Days Tokyo に参加してきたので、本記事ではそのレポートを書きたいと思います。普段趣味で Kaggle を楽しんでいる身として Kaggle Days が東京で開催されることを知り、前のめりで参加してきました。 当日の様子は Twitter のハッシュタグ #kaggledaystokyo で呟かれており、togetter でもまとめられています。*1 はじめに Kagg

                                                    Kaggle Days Tokyo 参加レポート - Gunosyデータ分析ブログ
                                                  • ベイズ×Factorization Machines & Matrix Factorizationの研究まとめ - Qiita

                                                    はじめに 今回は、Factorization Machines(FM)やMatrix Factorization(MF)とベイズを絡めた研究を調べたのでまとめていきたいと思います。 FMはICDM2010で提案されて以来、様々な方向に発展しています。 Deepと組み合わされた研究や、Fieldという概念を加えた研究などがその一例です。 実際、ICDM2010でもっとも引用されている論文がFMだそうです。すごいですね。 モデル自体がシンプルで扱いやすく、特徴量が色々入れられるなど、メリットが大きいことが理由の一つかと思います。 今回の記事では、SIGIR2019 で発表されたBayesian Personalized Feature Interaction Selection for Factorization Machines [Chen+, SIGIR2019]という論文に至るまでの流れ

                                                      ベイズ×Factorization Machines & Matrix Factorizationの研究まとめ - Qiita
                                                    • Accumulated Local Effects(ALE)で機械学習モデルを解釈する - Dropout

                                                      はじめに Partial Dependence 特徴量が独立の場合 数式による確認 PDの実装 特徴量が相関する場合 PDがうまく機能しない原因 Marginal Plot Marginal Plotの数式 Marginal Plotのアルゴリズム Maginal Plotの実装 Accumulated Local Effects ALEのアイデア ALEはうまく機能するのか ALEのアルゴリズム ALEの実装 ALEの数式 まとめ Appendix:線形回帰モデルの場合 参考文献 この記事をベースにした発表資料です! speakerdeck.com はじめに Random Forestやディープラーニングなどのブラックボックスモデルは、予測性能が高い一方で解釈性が低いというトレードオフを抱えています。 これを克服するために、ブラックボックスモデルに後から解釈性を与える「機械学習の解釈手法

                                                        Accumulated Local Effects(ALE)で機械学習モデルを解釈する - Dropout
                                                      • SHAP(SHapley Additive exPlanations)で機械学習モデルを解釈する - Dropout

                                                        はじめに この記事で書いていること、書いていないこと アルバイトゲームとShapley Value 機械学習モデルへの応用 参考文献 はじめに ブラックボックスモデルを解釈する手法として、協力ゲーム理論のShapley Valueを応用したSHAP(SHapley Additive exPlanations)が非常に注目されています。SHAPは各インスタンスの予測値の解釈に使えるだけでなく、Partial Dependence Plotのように予測値と変数の関係をみることができ、さらに変数重要度としても解釈が可能であるなど、ミクロ的な解釈からマクロ的な解釈までを一貫して行える点で非常に優れた解釈手法です。 SHAPの論文の作者によって使いやすいPythonパッケージが開発されていることもあり、実際にパッケージを使った実用例はたくさん見かけるので、本記事では協力ゲーム理論の具体例、Shapl

                                                          SHAP(SHapley Additive exPlanations)で機械学習モデルを解釈する - Dropout
                                                        • 「RとStanではじめる ベイズ統計モデリングによるデータ分析入門」書評 - nora_goes_far

                                                          この記事について 著者の馬場真哉様より、2019年7月10日に講談社より発売の、「RとStanではじめる ベイズ統計モデリングによるデータ分析入門」をご恵投いただきました。ありがとうございます!! www.kspub.co.jp 事前に献本をいただけるということを伺っていたので、その時から「ご恵投いただきました!」とTwitterで報告するだけでなく、簡単にでも読んでみた感想を書こうと決めていました。 まだざっと読んだ段階で、コードを実際に走らせてもいないのですが(もちろん後でじっくり読みながら実行します)、感想や関連書籍との比較をしていきたいと思います。 本記事の方針 本書の「はじめに」の部分やサポートページには、以下のような方を対象読者としていると書かれています。本記事も、そのことを念頭に書いていこうと思います。 統計学の基礎やベイズの定理などの基本事項を学んでみたものの、その有効性が

                                                            「RとStanではじめる ベイズ統計モデリングによるデータ分析入門」書評 - nora_goes_far
                                                          • Kaggleで学ぶ、k-fold交差検証と、特徴量エンジニアリング

                                                            Kaggle公式「機械学習」入門/中級講座の次は、本稿で紹介する動画シリーズで学ぶのがオススメ。記事を前後編に分け、前編では交差検証や、特徴量エンジニアリング(標準化/正規化/対数変換/多項式と交互作用の特徴量/ターゲットエンコーディングなど)を試した体験を共有します。

                                                              Kaggleで学ぶ、k-fold交差検証と、特徴量エンジニアリング
                                                            • 統計検定準1級に受かるための勉強法・参考サイト

                                                              2022/02/15 初稿 2022/02/15 細かな修正 2022/04/20 一部リンク先の動画について注釈を追加 この度、無事に統計検定準1級に合格したので勉強法、参考にしたサイトなどを共有しようと思います。 バックグラウンド 非理数∧非情報系大学生 →高校数学は数学Ⅲまでできる。いわゆる大学数学は教養で軽く学んだ程度(偏微分、固有値ベクトルを求めるくらいはできる)。 機械学習に関しての予備知識は少しある。 統計WEB-BellCurveで2級範囲の内容は履修済みで2級に受かりそうな知識はあった。(自称) →過去問解いて合格できそうになったし今週末で2級申し込みするで~ →直前過ぎて無理ですと断られる →大学の試験期間に入る →気がつけば受けずじまい 件のワークブックが出版され、これがあるなら準1級いけるやろと思い初版で購入するも挫折 といったところです。 2021年12月の中頃く

                                                                統計検定準1級に受かるための勉強法・参考サイト
                                                              • 【社会福祉士の出題傾向!📖】今回は社会調査の基礎&相談援助の基礎と専門職&相談援助の理論と方法&福祉サービスの組織と経営について🍀 - 社会福祉士&医療事務(診療報酬実務能力試験)の資格の合格を目指そう!

                                                                どうも~。当ブログをご覧いただいてる、そこのあなた!いつも見ていただき、ありがとうございます。担当のSW-challengeで~す。 今回は社会福祉士の出題傾向として社会調査の基礎&相談援助の基礎と方法&福祉サービスの組織と経営の4つの科目についてご紹介します。👏 それでは、いってみましょう。(^-^)/ 目次 1、試験までのカウトダウン🍀 2、出題傾向\(^o^)/パート1社会調査の基礎について まずは大きく分けて見ていきます。(^o^) 細かく見ていきます。🎵 この科目のアドバイス! 3、次に相談援助の基礎と専門職 大きく分けて見ていきます。(^o^) 細かく見ていきます。🎵 この科目のアドバイス! 4、出題傾向:次に相談援助の理論と方法について まずは大まかに見ていきます。(^o^) 細かく見ていきます。🎵 この科目のアドバイス! 5、続いて、福祉サービスの組織と経営につい

                                                                • 微弱な快楽から逃れる方法 - 星の動く音がうるさい

                                                                  動機 勉強しないといけないのに、5分程度の動画をYoutubeで無限に見たり、SNSを無限に見たりしてしまう、このループから逃れたい。 きっかけ ↑ 昨日バズっていた「微弱快楽説」。 勉強しないといけないのに、SNSやyoutubeの無限巡回をやめられないのはなぜか。それは「微弱な快楽」に一定時間触れていると、「微弱な快楽を感じ続ける状態がデフォルト」だと脳がセッティングしてしまうので、止めた瞬間「微弱な快楽」が途絶え不快感を覚えるため、という説。 行動療法の学習理論によれば、連鎖化された反応を断ち切るには、直接的な強化と離れている「連鎖の初めのほうの反応」を除去するのが効果的だという。スマホを触るのを止めたければ、仕事場から自室へ帰ってきたとき指定の場所にスマホを置くなど先行拘束して、連鎖の初めの行動を止めることが有効だろう。 でも私が今からここに書きたいのは、先行拘束に失敗してすでに無

                                                                    微弱な快楽から逃れる方法 - 星の動く音がうるさい
                                                                  • 【2019 MLEインターンシップ】機械学習で旅行をプランニングする - Platinum Data Blog by BrainPad

                                                                    ブレインパッドでは毎年学生向けのインターンシップを開催しています。今年も、昨年に続いて「機械学習エンジニア(Machine Learning Engineer, MLE)コース」を実施し、今回は3名がインターンシップに参加しました。その取り組みと成果をご紹介します! こんにちは、アナリティクスサービス本部AIプラクティス部の伊藤です。 今回は、今年の8月末から9月にかけて実施した機械学習エンジニアコースのインターンシップの内容についてお伝えします。 はじめに インターンの紹介と取り組みテーマ インターンシップの進め方 最終報告会 宿泊先のレコメンド(恒川さん) 周遊プランニング(藤原さん) 寄り道先のランキング(佐藤さん) 懇親会 まとめ はじめに 今年は「機械学習による旅行プランニング」というテーマで1か月間のインターンシップを実施しました。京都と名古屋から、3名の方がインターンシップに

                                                                      【2019 MLEインターンシップ】機械学習で旅行をプランニングする - Platinum Data Blog by BrainPad
                                                                    • データから得られた知見は実在集団に当てはまるか?外的妥当性について少し深く考えてみた - Unboundedly

                                                                      データ分析をおこなう人のほとんどは「一般化可能性」とか「外的妥当性」という言葉を耳にしたことがあると思います。 例えば次のような議論を聞いたことがないでしょうか。 ・「アメリカ人のデータから●●を食べると死ににくいことがわかった」→「いやいや、日本人のデータではないから日本人が●●を食べて健康になれるかどうかはわからない」 ・「大学生にボランティアで実験に参加してもらって▲▲が判明した」→「大学生以外には当てはまらんでしょう?」 ・「SNSでアンケート調査をして、AとBの関連を検討した」→「SNSを使っているひと、さらに調査に協力してくれる人、って偏りすぎて参考にならない」 論文を書く際にも、最後の方で研究の限界点を述べる時に ・「本研究は●●というサンプルを使っているので一般化可能性は限定的である」 ・「小規模RCTなので実在集団への一般化はできないかもしれない。より広い集団でさらなる研

                                                                        データから得られた知見は実在集団に当てはまるか?外的妥当性について少し深く考えてみた - Unboundedly
                                                                      • Rettyのデータ分析事例に学ぶ、回帰分析を意思決定に利用するための3つのポイント

                                                                        データアナリスト/データサイエンティストのためのカジュアルな勉強会「Data Gateway Talk」。Retty株式会社でデータ分析チームに所属する二見大揮氏は「意思決定に回帰分析を利用した話と3つの学び」というタイトルで登壇。Rettyがどうやって回帰分析を意思決定に利用したのかについて、3つのポイントに分けて紹介しました。 回帰分析を意思決定に利用する 二見大揮氏:本日は「意思決定に回帰分析を利用した話と3つの学び」というタイトルで発表します。まずは自己紹介から。二見大揮と言います。2019年4月にRetty株式会社に新卒で入社して、現在はWebやアプリのプロダクト内の分析を行う、データ分析チームに所属しています。 今回お伝えしたい3つのポイントを最初に共有します。まず意思決定のアクションにつながる成果物をちゃんと把握する。交互作用なども考慮しながら「MECE」な分析設計に落とし込

                                                                          Rettyのデータ分析事例に学ぶ、回帰分析を意思決定に利用するための3つのポイント
                                                                        • おすすめのR packageをまとめました。 - Open Box with STAT

                                                                          Rを使うときパッケージ(以下、package)を利用すると思います。 packageとは、Rの機能を拡張する関数、データ、資料の集まりです。 例えば、きれいな図を描きたいときは、ベースのR機能であるplotでは物足りないため、ggplot2 packageを使います。 一般化推定方程式を使いたいときは、ベースのR機能だけでは、数式を読み解き、関数を自作する必要がありますが、gee packageを使えば関数の自作は不要です。 このようにRを使う上でpackageは重要ですし、いろいろなpackageを知っていると楽ができます。ただし、packageの有無を自分の解析能力の限界にする必要はありません。自ら関数が組めると解析の幅が広がります。 packageは山ほどあります。しかし解析によく使うpackageはある程度限られます。この記事では、ぼくが使っている(使いたい)R packageを紹

                                                                            おすすめのR packageをまとめました。 - Open Box with STAT
                                                                          • 機械学習を解釈する技術 〜予測力と説明力を両立する実践テクニック

                                                                            2021年8月4日紙版発売 2021年7月30日電子版発売 森下光之助 著 A5判/256ページ 定価2,948円(本体2,680円+税10%) ISBN 978-4-297-12226-3 Gihyo Direct Amazon 楽天ブックス ヨドバシ.com 電子版 Gihyo Digital Publishing Amazon Kindle ブックライブ 楽天kobo honto 本書のサポートページサンプルファイルのダウンロードや正誤表など この本の概要 機械学習の研究開発が急速な勢いで進んでいます。理論研究はもちろん,機械学習手法が実装されたオープンソースのパッケージ開発も進み,それらを実務で利用するためのノウハウも蓄積されてきています。結果として,機械学習をはじめたばかりの入門者でも比較的高い精度の予測モデルを構築できるようになりました。 Deep Learning, Grad

                                                                              機械学習を解釈する技術 〜予測力と説明力を両立する実践テクニック
                                                                            • プロダクトグロースのための重回帰分析入門 - Retty Tech Blog

                                                                              この記事はRetty Advent Calendar 2019 - Qiita 17日目の記事です。 昨日はimaizumeさんのXcode 11でビルドしたRetty iOSアプリの検索バーが突然反応しなくなった訳でした はじめに はじめまして! Rettyのデータアナリストの二見です Rettyの中でもWebやアプリなどのプロダクト側の分析を担当しています。入社して半年ほどなのですが、普段の分析の様子などは以下の記事にまとまっているのでもしよろしければご覧ください。 engineer.retty.me さて今回の記事では重回帰分析を取り上げたいと思います。聞いたこともある方も多いかと思いますが、実際のプロダクトのデータで利用すると結構複雑です。 この記事では回帰分析の概念から入って、実際の分析でどのように利用できるかまでをまとめています。 <注意1:この記事では一般線形回帰を軸にまとめ

                                                                                プロダクトグロースのための重回帰分析入門 - Retty Tech Blog
                                                                              • 一般線形モデルから一般化線形混合モデルにたどり着くまで - と。

                                                                                この記事こそが! R Advent Calendar 22日目の記事です! このノリがわからない人は前の記事を読んでください。 この前の記事が知る人ぞ知るRおじさんのAtsusyさんなのでこの記事では上がったハードルをくぐっていきます。 皆さん読んできました?省略できちゃうんですよ……これでRとPythonでのギャップが埋まり、世界はデータドリブンに動きますね…… しかも明日はSendaiRの運営をされてる茶畑さん、 あさってはがspoanaの運営をされてるtsuyuponさんの投稿です。 誰? みなさんご存知きぬいとさんです。 私は学生時代からRを使ってかれこれ8年になりますが、その人生の大半を線形回帰モデルに費やしてきました。 例えば学部時代にはDobsonの一般化線形モデル入門を読んだり、 ベイズモデリングに入門したり、 Stanの可能性に触れたりと、統計モデルの理論を学び、Rで実装

                                                                                  一般線形モデルから一般化線形混合モデルにたどり着くまで - と。
                                                                                • 統計検定準1級 リンク集 - Qiita

                                                                                  背景 統計検定2級を合格し、準1級を受けようとしたら範囲広すぎ+難しすぎるので、見返せるようにリンク集を作成しました。 準1級では必須の参考書である統計学実践ワークブックに沿って自分がわからなかった部分作成したいと思います。 一部解説者においては作成時点ではYoutubeで見れていたものの、Udemyで有料公開となったようです。ただ、非常に初心者にとってはわかりやすい解説なので購入する価値はあると思います。 埋まっていない箇所についてはワークブックである程度理解できたor諦めたのどちらかです。 統計等のバックグラウンドがない中で、WB、問題集、本リンクで77点で合格しております。(3回受験したのは内緒) また、ワークブックとは別に下記の方もとても頼りにさせていただきました。 【失敗しない】統計検定準1級向けのおすすめ参考書 ワークブック問題回答まとめサイト① ワークブック問題回答まとめサイ

                                                                                    統計検定準1級 リンク集 - Qiita