並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 458件

新着順 人気順

統計学の検索結果161 - 200 件 / 458件

  • 因果推論100本ノック(2)回帰分析

    はじめに 因果推論100本ノック(自作)11本目~20本目の問題とPythonのサンプルコードです. 問題の不備や内容の誤り等ありましたら,ご指摘いただけますと幸いです. 設定 メールマーケティングの効果を推定するケースについて考えます. 化粧品のEC販売にて,メディアの会員の中で購買傾向の弱いユーザーにキャンペーンメールを配信します.手元には「過去に小規模なデータで実験を行ったデータ」と「今回購買傾向の弱いユーザーにメールを配信したデータ」が存在するとします. データは,下記フォルダの2つのファイルを利用します. 利用するファイルの概要は下記の通りです. causal_knock2_rct.csv: 実験データ(以下,rctデータ) causal_knock2_reg.csv: 購買傾向の弱いユーザーにメールを送ったデータ(以下,regデータ) データのカラムの概要は下記の通りです. 変

      因果推論100本ノック(2)回帰分析
    • 科学としての歴史 | Nature ダイジェスト | Nature Portfolio

      過去の出来事を科学的に分析することで、未来を予想できるとする「歴史動態学」が登場した。既存の歴史学者は懐疑的だが、このアプローチは興味深い。 SOURCE:REF.1 「歴史は繰り返す」という格言は、時に真実であるように思われる。例えば米国では、1861~65年の南北戦争後に民族間・階級間の反目による暴力事件が都市部で急増し、それが全米に広がって、1870年頃にピークに達した。国内騒乱が次に増加したのは1920年頃で、人種的反感による暴動、労働者のストライキ、反共感情の高まりなどにより、多くの人が近いうちに革命が起こるかもしれないと思った。米国社会は1970年頃にも不穏な状態に陥り、激しい学生デモ、政治的暗殺、暴動、テロが頻発した(『暴力の周期』参照)。 コネチカット大学(米国ストーズ)で個体群動態学の研究をしているPeter Turchinは、米国の政情の不安定さがピークに達した3つの時

        科学としての歴史 | Nature ダイジェスト | Nature Portfolio
      • 【図解】AIは統計学から。

        最近、「ディープラーニング」「ビッグデータ」「AI」という話題を耳にします。 なんかいろんなことができて、すごく便利みたいです。 これらの技術は 統計学という学問がベース となっています。統計学は、実はいろいろな場面で使われていて、私たちの知らないところで、人類の生活を豊かにしてくれます。 統計学はディープラーニングの基礎 今回は、統計学の概要とその魅力について解説します。これからの AI 時代を生き抜かなくてはならない今こそ、統計学を学ぶべきです。 Python の基礎を本にまとめています。併せてご覧いただけるととても嬉しいです ↓ DeepLearning の基礎を本にまとめています。手に取って頂けるととても喜びます ↓ 皆さんの理解が一歩でも進むと嬉しいです。 Created by NekoAllergy 統計学って何? 統計学とは たくさんのデータについての考え方 統計学とは、たく

          【図解】AIは統計学から。
        • 回帰分析ではlm()ではなくestimatr::lm_robust()を使おう / TokyoR100

          2022年7月23日に行われた、第100回R勉強会@東京(#TokyoR)での発表資料です。 https://tokyor.connpass.com/event/253867/ 資料で使っているRコードはこちらになります。 https://github.com/dropout009/TokyoR100

            回帰分析ではlm()ではなくestimatr::lm_robust()を使おう / TokyoR100
          • 因果推論の統計;特別講義 開催報告 | 東大SPH ,SPH, 東京大学 | 公共健康医学専攻

            2024年2月22日と29日に、京都大学の井上浩輔先生をゲスト講師としてお招きし、本学松山裕教授・萩原康博先生と一緒に因果推論の統計学的アプローチについて特別講義を行いました。 講義内容についてはこちら 講義資料は以下を参照してください。 第1回;因果推論統計の基礎理論 第2回;DAGを理解する 第3回;点曝露の統計モデル 第4回;時間依存性曝露の統計モデル ※講義スライドは各自の勉強・参考のために利用することを許可しますが、無断転載することは固く禁じます。引用・転用などしたい場合は、各著者の許可を得てください

              因果推論の統計;特別講義 開催報告 | 東大SPH ,SPH, 東京大学 | 公共健康医学専攻
            • Fisherだけに5%閾値の責任を負わせるのは少し酷な気がする - Tarotanのブログ

              以下,記憶だけで書いたいい加減な話. 5%閾値を広めた責任者は,K.Pearson, Fisher, Neyman, Snedecor,そして,統計分析のハウツー本の著者ら,さらに,私自身も含めた統計関連従事者(←統計家や統計学者ではない)ではないだろうか.Fisherだけに責任を負わせるのは酷な話だと思う. まず,1900年初頭には,K. Pearsonの提案をもとに,probable errorの3倍以上のものを”almost certain significance”とする分類がBiometrikaを中心に利用されていた.このprobable error (PE)は,Xが正規分布に従っている時に,μ± PEにXが属する50%となるもの.このPEは,元々は,Galtonが多用していた.(Galtonは,いまでいう四分位点から,PEを求めていた.Galtonの文献では,標本と母集団の違い

                Fisherだけに5%閾値の責任を負わせるのは少し酷な気がする - Tarotanのブログ
              • 文科省がTOEFL国別英語力ランキングを作成。TOEFL運営元は「やめて」と注意喚起(寺沢拓敬) - エキスパート - Yahoo!ニュース

                2022年8月8日、文部科学省が「英語教育・日本人の対外発信力の改善に向けて(アクションプラン)」を発表しました。 同資料のなかで、運営元が「やめて」と言っていることを、文科省は平気でやっています。 問題の箇所は同アクションプラン(スライド全12枚)の2枚目。TOEFL国別平均スコアをもとに、各国の英語力ランキングをグラフ化しています。 画像の出所:文科省「英語教育・日本人の対外発信力の改善に向けて(アクションプラン)」(2022年8月8日)、p.2 図の説明は、以下のように、日本の英語力の低さに焦点を当てています。 各国における受験者数や受検者層は異なるため、スコア差が各国の英語力差をそのまま表しているわけではないことに留意が必要ではあるが、各種の英語資格・検定試験において、我が国の平均スコアは諸外国の中で最下位クラス。 こういうTOEFL国別ランキング話法は、しばらく前から、いたるとこ

                  文科省がTOEFL国別英語力ランキングを作成。TOEFL運営元は「やめて」と注意喚起(寺沢拓敬) - エキスパート - Yahoo!ニュース
                • 卒業論文のためのR入門

                  Chapter 1 はじめに この文書は、卒業論文を書くためのRの使い方をできるだけコンパクトにまとめたものです。 読者は立命館大学総合心理学部森ゼミの学生をピンポイントに想定しています。 Rを用いた演習として「心理学データ解析法」の履修を推奨していますが、履修していなくてもわかるように構成しています。 卒業論文自体はWordで作成する想定で、Rで得られた結果をWordに貼り付ける(簡便な)方法を説明します。 一般的なRの入門文書としても参照できます。 説明の都合上、厳密さよりわかりやすさを重視した記述が多々あります。ご了承ください。 1.1 この文書で学ぶこと 具体的には、以下の項目を学習します。 R, RStudioをインストールし、基本的な操作ができるようになる データをRStudioにインポートする インポートしたデータを分析可能な形に前処理する 記述統計を整理する データを可視化

                  • 北大・西浦教授「8割接触削減」評価の根拠について説明(2020年4月24日)

                    新型コロナウイルス感染症対策で厚生労働省クラスター対策班に参加する北海道大学大学院の西浦博教授は24日午後、報道陣との意見交換の場において、PCR検査に関する自身の見解と「接触8割減」の評価手法について説明を行った。 ■チャンネル登録:https://yahoo.jp/zaoidV ■THE PAGEの記事一覧:https://yahoo.jp/g2tIKq #thepage_jp #厚生労働省 #新型コロナウイルス感染症

                      北大・西浦教授「8割接触削減」評価の根拠について説明(2020年4月24日)
                    • A/Bテストにおける「効果量」の非対称性 – nonentity data scientist

                      はじめに A/Bテストのサンプルサイズ設計を行う際に必要となる「効果量」についてのお話です。両側検定を行うときに、ちょっとだけ気にしておいた方がいいかもしれないことを発見したので、備忘録として書いておきます。解釈に誤りを含んでいそうなので、やさしい鉞をお待ちしています。 具体例 T群がC群を有意に上回る例 まずは例として、母比率の差の検定について考えます。まずは次の設定のもとでサンプルサイズ設計を行う事を考えてみましょう。C群とT群のイベント発生率をそれぞれ\(p_1, p_2\)とおいてテスト設計を行います。検出力(\(\beta\))や有意水準(\(\alpha\))などのパラメータは以下の通りとします。 \[ \begin{aligned} p_1 &= 0.1\\ p_2 &= 0.2\\ 1 - \beta &= 0.8\\ \alpha &= 0.05 \end{aligned

                        A/Bテストにおける「効果量」の非対称性 – nonentity data scientist
                      • ゆきまさかずよし on Twitter: "P値の神話がどうやってできたのか https://t.co/duotAxt4iW 最初に提唱した統計学者ロナルド・フィッシャーは一応0.05を提唱したものの固定値としなかった。心理学分野で便利な数値として多用され(微妙な論文を量産… https://t.co/aLvfLBn6TB"

                        P値の神話がどうやってできたのか https://t.co/duotAxt4iW 最初に提唱した統計学者ロナルド・フィッシャーは一応0.05を提唱したものの固定値としなかった。心理学分野で便利な数値として多用され(微妙な論文を量産… https://t.co/aLvfLBn6TB

                          ゆきまさかずよし on Twitter: "P値の神話がどうやってできたのか https://t.co/duotAxt4iW 最初に提唱した統計学者ロナルド・フィッシャーは一応0.05を提唱したものの固定値としなかった。心理学分野で便利な数値として多用され(微妙な論文を量産… https://t.co/aLvfLBn6TB"
                        • 選択(セレクション)バイアスとは?人によって定義が違うので整理してみた。 - Unboundedly

                          疫学と経済学、どちらもある要因Xがある要因Yに与える因果的な効果の大きさを推定する「因果推論」に関心があることが多いです。 「選択(セレクション)バイアス」「交絡」「内生性」、多くの用語が因果推論で登場します。 ところが、話をしているとどうも噛み合わないことが多い。よくよく聞くと、 ①同じことを違う用語を使って話している ②同じ用語を使って全く違う概念について話している ことが判明。 先日の勉強会がきっかけで,selection biasの議論が活発におこなわれています. selection biasは疫学,経済学の領域間だけではなく,領域内でも定義が混乱してそう🤔 それぞれの領域の方々が同じ場で議論し合うのは良いなと思います. お互いリスペクトした議論になっているのもストレスフリー🧸 pic.twitter.com/WTbX7sVHIP — Sato@生物統計家 (@Shuntaro

                            選択(セレクション)バイアスとは?人によって定義が違うので整理してみた。 - Unboundedly
                          • 酒豪遺伝子が話題になったのでお酒の消費量とお茶・コーヒーの消費量を調べてランキングにしたら地域ごとに好まれるお酒やお茶に特色が出ていた

                            Kohyoh Yang @00ur0b0r0s 昨日、日本全国での酒豪遺伝子の発現率が話題になったので、日本全国でのお酒の消費量とお茶・コーヒーの消費量を調べて、ランキング(色が濃いほど高い)したら、酒豪遺伝子の発言以外にも地域ごとに好まれるお酒やお茶の特色出ていた。緑茶とコーヒーは割と酒豪遺伝子が発現が低い地域で好まれている。 pic.twitter.com/N4ZbOoVDrz

                              酒豪遺伝子が話題になったのでお酒の消費量とお茶・コーヒーの消費量を調べてランキングにしたら地域ごとに好まれるお酒やお茶に特色が出ていた
                            • 『統計学を哲学する』(名古屋大学出版会) - 著者:大塚 淳 - 大塚 淳による本文抜粋 | 好きな書評家、読ませる書評。ALL REVIEWS

                              著者:大塚 淳出版社:名古屋大学出版会装丁:単行本(ソフトカバー)(248ページ)発売日:2020-10-26 ISBN-10:4815810036 ISBN-13:978-4815810030 内容紹介: 統計学は実験や臨床試験、社会調査だけでなく、ビッグデータ分析やAI開発でも不可欠である。ではなぜ統計は科学的な根拠になるのか? 帰納推論や因果推論の背後に存在する枠組みを浮き彫りにし、科学的認識論としてデータサイエンスを捉え直す。科学と哲学を架橋する待望の書。 現代の科学において、ほとんど特権的な役割を担っているといってもよい統計学。そもそもなぜ統計は科学的な根拠になるのでしょうか。SNSでも話題となり、発売直後から品切れが続出するなど異例の売行きをみせている注目の新刊『統計学を哲学する』。今回は序章の冒頭抜粋を特別に公開します。本書が目指す「統計学を哲学する」とは、どのような試みなの

                                『統計学を哲学する』(名古屋大学出版会) - 著者:大塚 淳 - 大塚 淳による本文抜粋 | 好きな書評家、読ませる書評。ALL REVIEWS
                              • 研究態度 - 愛知学院大学青木ゼミのブログ

                                心理実験 再現つまずく 揺らぐ信頼、研究刷新促す声 (日経新聞2019年12月15日朝刊記事抜粋) 「つまみ食いを我慢できる子は将来成功する」「目を描いた看板を立てると犯罪が減る」――。有名な心理学の実験を検証してみると、再現できない事態が相次いでいる。望む結果が出るまで実験を繰り返したり、結果が出た後に仮説を作り替えたりする操作が容認されていた背景があるようだ。信頼を失う恐れがあり、改めようとする動きが出ている。米科学誌「サイエンス」は15年、心理学研究への信頼が揺らいでいる事態を重く見て、主要な学術誌に掲載された心理学と社会科学の100本の論文が再現できるかどうかを検証した。結果は衝撃的で、同じ結果が得られたのはわずか4割弱にとどまった。日本の代表的な心理学会誌「心理学評論」も16年、再現できない実験に関する問題を特集号として取り上げた。 心理学で再現できない研究がなぜ目立つのか。大阪

                                  研究態度 - 愛知学院大学青木ゼミのブログ
                                • ABテストにおける分散削減手法①〜少ないサンプルから小さな改善効果を検出する〜|あならいずパンダ

                                  マネーフォワード 分析推進部の石田と申します。 社内では、データサイエンティストとして施策効果検証系の案件を中心に担当しています。 本稿から2回に渡って、「ABテストにおける分散削減手法」というテーマで記事を執筆したいと思います。 馴染みのない方もいらっしゃるかもしれませんが、ABテストへ分散削減手法を適用することで、例えば以下に挙げたメリットを享受することができます。 必要サンプルサイズを低減できるため、意思決定サイクルを高速化できる より小さな改善効果を検出できる 魅力的だと感じていただけた方は、ぜひ最後まで本稿をお読みください! 目次 想定する読者層と書いてある内容本稿のメインターゲットは、以下のような方です。 統計的仮説検定の理論を少し勉強したことがあるけど、分散削減と言われてもあまりピンと来ていない 確率変数、標本平均、分散、正規分布の意味は分かるけど、t検定の検定統計量がパッと

                                    ABテストにおける分散削減手法①〜少ないサンプルから小さな改善効果を検出する〜|あならいずパンダ
                                  • 黒木玄 Gen Kuroki on Twitter: "#統計 もしかしたら奥村さんにミュートされているのではないかと思うのですが、私は統計関係の多くの事柄について奥村さんの発言が良くないと思うことが多いです。 おそらく、伝統的な統計学教師の大部分の発言を私は気に入らない。 例えば… https://t.co/ohEjoP02xM"

                                    #統計 もしかしたら奥村さんにミュートされているのではないかと思うのですが、私は統計関係の多くの事柄について奥村さんの発言が良くないと思うことが多いです。 おそらく、伝統的な統計学教師の大部分の発言を私は気に入らない。 例えば… https://t.co/ohEjoP02xM

                                      黒木玄 Gen Kuroki on Twitter: "#統計 もしかしたら奥村さんにミュートされているのではないかと思うのですが、私は統計関係の多くの事柄について奥村さんの発言が良くないと思うことが多いです。 おそらく、伝統的な統計学教師の大部分の発言を私は気に入らない。 例えば… https://t.co/ohEjoP02xM"
                                    • What does United States import? (2020) | The Observatory of Economic Complexity

                                      Have questions, comments, or concerns? Send us an e-mail: support@oec.world

                                        What does United States import? (2020) | The Observatory of Economic Complexity
                                      • ステート・オブ・AI ガイド on Twitter: "これ実務にものすごく役立ちそう。まれにしか出現しないラベルが含まれる不均衡・ロングテールなデータ(実データあるある)に対して、ロジットを対数確率により調整し平均的なエラー率を最小化する手法。統計的根拠があり実験性能もとても良い。今… https://t.co/ueO3NY1DN3"

                                        これ実務にものすごく役立ちそう。まれにしか出現しないラベルが含まれる不均衡・ロングテールなデータ(実データあるある)に対して、ロジットを対数確率により調整し平均的なエラー率を最小化する手法。統計的根拠があり実験性能もとても良い。今… https://t.co/ueO3NY1DN3

                                          ステート・オブ・AI ガイド on Twitter: "これ実務にものすごく役立ちそう。まれにしか出現しないラベルが含まれる不均衡・ロングテールなデータ(実データあるある)に対して、ロジットを対数確率により調整し平均的なエラー率を最小化する手法。統計的根拠があり実験性能もとても良い。今… https://t.co/ueO3NY1DN3"
                                        • 改訂増補版:統計検定を理解せずに使っている人のために I

                                          © 2019 Japan Society for Bioscience, Biotechnology, and Agrochemistry © 2019 公益社団法人日本農芸化学会 改訂増補にあたってこの総説は,「統計検定を理解せずに使っている人のために I」の改訂増補版である.今後,「II」および「III」も改訂増補する.これら三部作は2013年に出版されたが,最近でもJ-STAGEでの「化学と生物」の論文アクセスランキングで常に上位を占めている.しかし,これら三部作には正しくない記載や,言葉足らずでわかりにくい内容があった.そこで,誤りを修正し,内容をさらに充実しわかりやすくするため,改訂することとなった.間違いのあった理由は,筆者の統計に対する理解不足にほかならない.筆者は統計学が専門ではない.本来このような学術雑誌には専門家が執筆すべきと考えるが,専門家による総説や専門書は,往々に

                                          • 日本の古典和歌を埋め込みベクトルで分析する|yhkondo

                                            今年もアドベントの季節が来ました。この記事は、まつーらとしお氏の主催する、アドベントカレンダー「言語学な人々」2023の12月16日のエントリーとして書かれました。今年は、カレンダー増刷で、黒木邦彦氏主催の、別館(言語学なるひとびと)もあります。どちらもご覧下さい。 和歌集の歌風の分析日本の古典和歌集には、それぞれの性格があります。『万葉集』は自然を歌っていて、「素朴」な歌もあるが、『古今集』は、宮中の「優雅」な伝統を反映している、など、言い方はいろいろあり得ますが、それぞれ異なった歌風を持っていることは間違いありません。それを、コンピュータ、特にAIで分析してみるというのがこのエントリーの内容です。日本語学会の機関誌『日本語の研究』19巻3号(2023年12月)に掲載した拙論(「和歌集の歌風の言語的差異の記述ー大規模言語モデルによる分析−」)の解説記事となります(来年6月にはJSTAGE

                                              日本の古典和歌を埋め込みベクトルで分析する|yhkondo
                                            • R初心者の館(RとRStudioのインストール、初期設定、基本的な記法など) - nora_goes_far

                                              本記事について R Advent Calendar 2019 2日目の記事です。 本記事執筆のモチベーション ゼミや講義でRを使いたいことがあります。しかし、インストールや初期設定、基本的な記法についての説明で時間を使ってしまうのはもったいないと思い、「これを事前に読んできて」と言えば済むような資料を用意したいと思いました(もちろんすでに、ネット上には有用な記事がたくさんあります)。もし同様の要望をお持ちの方がいらっしゃったら、本記事をご活用いただければ幸いです。 そういうわけで、本記事では、Rをまったく触ったことがない初心者を読者に想定しています。また、筆者の環境がWindowsであるため、同環境を事例として説明しています。 目次 RとRStudioのインストール RStudioの初期設定 RStudioの機能 Rの基本的な記法・使用方法 四則演算 代入演算子 その他の演算子 データの型

                                                R初心者の館(RとRStudioのインストール、初期設定、基本的な記法など) - nora_goes_far
                                              • Marketing-Mix-Modeling(MMM)に関する所感や問題意識について - Leverages データ戦略ブログ

                                                目的と背景 レバレジーズのデータ戦略室で室長をしている阪上です。 今回は、最近仕事で使うことがあり、調べているMarketing Mix Modeling(MMM)について簡単に紹介したいと思います。この分野に関して、あまり国内で盛り上がっていないように感じたため、僭越ながら少しでも関心を持つ方が増えることを願って記しました。 今回は具体的に自社でどのような分析を行ったかについては記しておりませんが、今後、別の記事で用意したいと思います。 MMMとは Marketing Mix Modeling(MMM)は各種メディアへの支出が、企業の売上にどのように影響を与えるのかを理解するために、あるいは最適なメディア投資を行うための支出の配分を決めるために使われます。主に回帰分析などの手法を用いて、時系列データである売上を同じく時系列データである各種メディアのインプレッションなどで説明づけるというア

                                                  Marketing-Mix-Modeling(MMM)に関する所感や問題意識について - Leverages データ戦略ブログ
                                                • 株式会社Nospare - Qiita

                                                  株式会社Nospare 統計・データ分析に関するアドバイザリー、ビジネスデータの分析や企業におけるDX支援等、データに関して幅広い価値提供を行っております。 統計学において国際的に活躍する研究者陣を中心に、統計学における知見を発信していきます。

                                                    株式会社Nospare - Qiita
                                                  • VARそして時系列因果性分析の復習 - 渋谷駅前で働くデータサイエンティストのブログ

                                                    「新型コロナウイルス感染症における治療の進展(令和2年10月29日に開催された第13回新型コロナウイルス感染症対策分科会事務局提出資料を基に内閣官房・内閣府作成)」という資料が世間で物議を醸しているようです。ただ、これを見ていて僕が個人的に気になったのは、その議論の内容や結論ではなく、「グレンジャー(Granger)因果」が使われているという点でした。 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 作者:竜義, 沖本発売日: 2010/02/01メディア: 単行本Time Series Analysis 作者:Hamilton, James D.発売日: 1994/01/11メディア: ハードカバー 以前このブログでも一通り計量時系列分析を取り上げて一生懸命沖本本やHamiltonで勉強しながらシリーズ記事を書いたものですが、その時の記憶から言えば「Granger因果って

                                                      VARそして時系列因果性分析の復習 - 渋谷駅前で働くデータサイエンティストのブログ
                                                    • RstanにDockerはいいゾ - Computational Clinical Psychology Lab

                                                      この記事は,Stan Advent Calendar 20192日目の記事です。 昨年もDockerで記事を書いたのですが,実は思ったよりDockerは活用されてないぞと思うことが何度かありました。そこで,今年もDockerについて書きます。 今年は,MacOSのCatalinaがリリースされました。Catalinaでは色々と新機能が追加されたので,ワクワクとした気持ちで試したMacユーザーも多かったのではないでしょうか?しかし,CatalinaにアップグレードするとStanが動作しないという問題があり,軽い気持ちでアップグレードしたStanユーザーを絶望の淵に追い込みました(Stan Advent Calendar 2019の1日目のkosugittiさんの記事でその辺の経緯がまとめられています)。こういう時こそ,以下のStan公式のツイートにあるように,Dockerなどの仮想コンテナを

                                                        RstanにDockerはいいゾ - Computational Clinical Psychology Lab
                                                      • 『現代数理統計学の基礎』章末演習問題解答 (答案) - Qiita

                                                        0.はじめに 『現代数理統計学の基礎』(久保川達也 著)の章末問題の答案を作成する.略解は久保川先生がこちらのサイトに掲載して下さっているが,「略解」なだけあって途中式がかなり端折られていたり,エレガントすぎて凡人では思いつきようのない解答だったりするので,多少計算がゴツくなったとしても庶民的な答案を心がける.また必要に応じて答案とは別に必要な知識の確認を行う. 各リンクから問題の方針と答案に飛べる. 1.確率 (易) ベン図書く (易) 和事象,積事象の性質 (易) 条件付き確率と同時確率 (易) 部分集合についての確率 (易) 条件付き確率の典型問題 (易) 条件付き確率の典型問題2 (易) 因果関係と相関関係,独立性 (易) 和事象と確率の和 2.確率分布と期待値 (標準) 分布関数,密度関数の定義 (標準) 分布関数,密度関数の定義2 (標準) 分布関数,密度関数の定義3 (標準)

                                                          『現代数理統計学の基礎』章末演習問題解答 (答案) - Qiita
                                                        • 資料|分寺杏介 (K. Bunji)のホームページ - Kobe Univ.

                                                          担当が終了した講義の資料は基本的に更新していません。 資料作成当時の理解に誤りがあったり,時代によってスタンダードが変わっていたりする可能性があるので,ご利用は自己責任にてお願い致します。 近い内容の講義を新たに担当した場合は,最新のもののみ公開しています。 (間違いを見つけられた方は,こっそりご連絡いただけると幸いです。)

                                                          • 線形回帰において「多重共線性があると推定が不安定になる」とは?〜図と理論で理解する〜

                                                            これをもとに再度計算し直すと、(\hat{\beta}_0, \hat{\beta}_1, \hat{\beta}_2) = (2.07, 0.576, -3.91\times 10^{-3})、今度は \hat{\beta}_1=0.567 であり家賃が月収増加額に対して57.6%上昇するという随分大きな値が出てしまった。 このように、入力データが少し変わっただけで、線形回帰係数の推定値が大きく変化してしまう。 この原因は、説明変数として円単位の月収 X_1 とほぼ同じ意味を持ち相関も強い X_2、つまりドル単位の月収も含まれていることにある。 なお、もし X_1 だけ用いて予測を行っていれば、いずれの家賃データを入力として用いても回帰係数 \hat{\beta}_1 の推定値はおおよそ 0.30、つまり「月収が10,000円高ければ家賃がその約30%の3,000円程度高いところに住む傾

                                                              線形回帰において「多重共線性があると推定が不安定になる」とは?〜図と理論で理解する〜
                                                            • 22/10/23 何故AIにはイラストを発注できないのか? - LWのサイゼリヤ

                                                              何故AIにはイラストを発注できないのか? 最近イラストAI(主にNovelAI)で美少女イラストを生成しまくっている。かなり楽しい。 技術の進歩スピードとは本当に恐ろしいもので、左手で描いたようなイラストから人間と遜色ないレベルのイラストに進化するまで僅か2ヶ月しかかからなかった。 👈2022年8月 2022年10月👉 pic.twitter.com/yqn3AGSPLC — LW (@lw_ru) 2022年10月17日 ただ自分で呪文を投げながらTwitterでイラストAIを巡る議論を見ていて思うのは、イラスト発注者という立場から語られる意見はかなり少ないということだ。代わりにイラストAIの有用性を語るのはイラストレーターや消費者が多い。例えば「イラストレーターがポーズを検討するために使える」「消費者が見分けられないくらい綺麗なイラストを出せる」など。 一方、発注者が考えざるを得な

                                                                22/10/23 何故AIにはイラストを発注できないのか? - LWのサイゼリヤ
                                                              • Daichi Mochihashi on Twitter: "共同研究などをしていると、学生さんなどが確率の単純な算術平均を取ってしまっていることが本当に多いので、教科書のコラムを公開していくスタイル。こういう話は、意外とあまり他では聞かないような気がしています。 https://t.co/tr13IfKLia"

                                                                共同研究などをしていると、学生さんなどが確率の単純な算術平均を取ってしまっていることが本当に多いので、教科書のコラムを公開していくスタイル。こういう話は、意外とあまり他では聞かないような気がしています。 https://t.co/tr13IfKLia

                                                                  Daichi Mochihashi on Twitter: "共同研究などをしていると、学生さんなどが確率の単純な算術平均を取ってしまっていることが本当に多いので、教科書のコラムを公開していくスタイル。こういう話は、意外とあまり他では聞かないような気がしています。 https://t.co/tr13IfKLia"
                                                                • 平均代入法による欠損データ処理はオワコンどころか黒歴史なので

                                                                  野村総合研究所の塩崎氏と広瀬氏の記事*1がまた*2データ分析者に困惑を引き起こしている。「データが欠損している場合は、平均値や中央値で埋め合わせる作業を行います。」とあるのだが、欠損データ処理としてはよくない手法として知られている。 平均代入法は、欠損が完全にランダムに生じている(MCAR)とき以外は推定量にバイアスが入ると説明されることが多いが、MCARでも回帰分析などの推定に用いる場合はバイアスが入る。また、単一代入法になるので、標準誤差が過小推定される*3。名前がついているぐらい一般的なのだが、使ってはいけない過去の遺物だ。 推定前の処理としては、欠損データ列がある行を分析から除くリストワイズ法や、分析に用いる欠損データ列がある行を分析から除くペアワイズ法の方がまだよい*4。サンプルサイズの減少を避けたい場合は、単一代入法でも回帰代入などを使う方が望ましい。最近は、機械学習の前処理と

                                                                    平均代入法による欠損データ処理はオワコンどころか黒歴史なので
                                                                  • 統計学 計算ノート | Logics of Blue

                                                                    ここでは、統計学の教科書を読み進める際に有用だと思う計算ノートを公開しています。 統計学の教科書を読み進める際に、難しい数式が出てきて困ったり、逆に数式が少なくてもう少し数理的な議論を読みたいと思うことがあるかもしれません。 この計算ノートだけで統計学を勉強することは難しいですが、統計学を勉強する際の副読本としてお使いいただければと思います。 お気づきの点がございましたら、ブログにコメントをいただけますと幸いです。 初等的な統計学入門レベルの内容 (平均・分散の性質や単回帰分析の推定量の性質など) ・統計学計算ノート 更新履歴 2022年06月11日:新規作成 FacebookXHatenaPocketCopyThe post 統計学 計算ノート first appeared on Logics of Blue.

                                                                    • ようこそ! | Doing Meta-Analysis in R

                                                                      オンライン版の R によるメタ分析:ハンズオンへようこそ。 本書は、 R でメタ分析を行う方法について、わかりやすく紹介するガイドラインである。メタ分析の基本的な手順として、アウトカム指標のプール、フォレストプロット、異質性診断、サブグループ解析、メタ回帰、出版バイアスの制御方法、バイアスリスク評価、プロットツールなどを網羅している。 また、ネットワークメタ分析、マルチレベル(3レベル)メタ分析、ベイズメタ分析アプローチ、SEM メタ分析といった高度でありながら関連性の高いトピックも取り上げる。 本書で扱うプログラミングや統計的背景は、専門家でなくても理解できるレベルにとどめている。原著の印刷版は、Chapman & Hall/CRC Press (Taylor & Francis) から出版されている。 ソースレポジトリ 本書は、{rmarkdown} および {bookdown} を使

                                                                      • A/Bテストで想定外の結果が出たら?検定多重性の影響を定量的に分析する

                                                                        ※: 両側 p<0.10 (本A/Bテストにおける有意水準) この場合まず疑うべきはA/Bテストシステムのどこかにバグがあることです。なんらかの理由で購入頻度の高いユーザがZ群にばかり割り当てられたり、統計処理にミスがありp値が実際よりも低く出てしまったりということがあれば、まったく差がない群の間で見かけ上CVRに有意差が出てもおかしくありません。 しかしながらいくら調査してもシステム上の問題は見当たりませんでした。 『多重性の問題』の可能性があるも、それだけとも言い切れない 本A/Bテストにシステム的問題が見当たらない一方、統計手法的には1点問題がありました。それは検定多重性の問題です。検定多重性とは、3群以上の比較を行う際、本当は有意差が無いはずなのに有意差ありとなってしまう確率が2群の時よりも上がってしまう現象です。 このA/Bテストシステムは2群間での比較を前提にt検定で実装されて

                                                                          A/Bテストで想定外の結果が出たら?検定多重性の影響を定量的に分析する
                                                                        • 【総務省統計局】無料データサイエンス・オンライン講座を受講してみた - ロボテッチ通信

                                                                          総務省統計局が無料で開講している「データサイエンス・オンライン講座」を受講してみた。比較的大きめのフォントサイズで社会人のためのと書いてあるが、小学2年生の息子と一緒に受講してみた。貴様は本当に日本語が通じないやつだな。 [目次] データサイエンスとは 難易度が高くても本物に触れることが大事 データサイエンティストという仕事 社会人のためのデータサイエンスの概要 社会人のためのデータサイエンス入門 社会人のためのデータサイエンス演習 データサイエンスとは データサイエンス(data science)とは、統計学やAI(機械学習)などの理論を使って、データを分類⇒予測⇒最適化を行う学問である。これらに関わる研究者や技術者をデータサイエンティストとよぶ。 難易度が高くても本物に触れることが大事 子供に対して何らかの情報を渡す時は、難易度を全く考慮しないようにしている。例えば生物図鑑であれば、内

                                                                            【総務省統計局】無料データサイエンス・オンライン講座を受講してみた - ロボテッチ通信
                                                                          • エンジニアでなくても、データリテラシーがないと食べていけない説|Yuta Fukazawa

                                                                            筆者には専門的なバックグラウンドはないが、会社を経営している中であらためてデータを日常的に意思決定に活用することの重要性を痛感し学習してきて、社内への普及活動もしている。 かなり煽り的なタイトルになってしまったが、もとは、弊社でデータに関わるツールを普及しようとしていて、 「そもそもなんでデータ・ツール(SQL等)を学ぶ必要があるのか?」 「そこはエンジニアがやった方が効率がいいのでは」 「ツールの学習は手段であって、データを活用した業務が目的なのに、SQLの学習に時間をかけるのは手段の目的化ではないか?」 などの声があり、あらためて考え直す契機になったので、書くことにした。 データと意思決定の欠かせない両輪経営は、「企業体として(個人であっても同様)目標に向かい、継続的・計画的に、現在ある資源を最大限に活用する意思決定を行っていくこと」からなる。言い換えれば、打てる手数(限られた時間あた

                                                                              エンジニアでなくても、データリテラシーがないと食べていけない説|Yuta Fukazawa
                                                                            • ベイズ統計学に関する議論を整理する - hidekatsu-izuno 日々の記録

                                                                              最近、「統計学を哲学する」の出版をきっかけとした Twitter 上の議論を追いかけながらベイズ統計学について調べている。 統計学を哲学する 作者:大塚 淳発売日: 2020/10/26メディア: 単行本(ソフトカバー) 前々からベイズ統計学については興味があったので、議論を追ったら何かしらの理解を深められるのでは、と思い関連するツィートを読んでみたのだが、これがびっくりするほどわからない。 通常「わからない」と書いたら高度な数学的議論が繰り広げられているからわからない、という意味だと思われるかもしれないがそうではない。そもそも何が論点なのかもはっきりとせず、議論らしき議論も行われず、ほとんどうんこの投げ合いと呼んでもいい状況だったのだ。 なるほどこれが「頻度主義 vs ベイズ主義」の対立なのかと思いもしたのだが、もやもやが残ったこともあり、議論の内容は理解できなくても論点整理くらいはでき

                                                                                ベイズ統計学に関する議論を整理する - hidekatsu-izuno 日々の記録
                                                                              • 効果検証入門 ~正しい比較のための因果推論/計量経済学の基礎

                                                                                2020年1月18日紙版発売 2019年12月27日電子版発売 安井翔太 著,株式会社ホクソエム 監修 A5判/240ページ 定価2,948円(本体2,680円+税10%) ISBN 978-4-297-11117-5 Gihyo Direct Amazon 楽天ブックス 丸善ジュンク堂書店 ヨドバシ.com 電子版 Gihyo Digital Publishing Amazon Kindle ブックライブ 楽天kobo honto この本の概要 ビジネスで利用されるデータの多くは,その施策の意思決定を行う人物や組織の目的にそった活動の延長上で作られています。具体的には,DM送付などの広告施策であれば,担当者はユーザの反応率を上げるために,反応しやすいであろうユーザに対してのみDMを発送します。ここで発生したデータでDMの効果を計る場合,単純にDMを受け取っているか否かで結果を比較すること

                                                                                  効果検証入門 ~正しい比較のための因果推論/計量経済学の基礎
                                                                                • 書籍紹介「効果検証入門〜正しい比較のための因果推論/計量経済学の基礎」 - 名前はまだない

                                                                                  はじめに すでに一部の書店や電子書籍では発売されていますが、1月18日に技術評論社から「効果検証入門〜正しい比較のための因果推論/計量経済学の基礎」が発売されました。 著者はサイバーエージェント AILabの経済学チームのリーダーの安井さん、監修はホクソエムです。 効果検証入門〜正しい比較のための因果推論/計量経済学の基礎 作者:安井 翔太発売日: 2020/01/18メディア: 単行本(ソフトカバー) あるご縁でこちらの書籍の執筆時のレビューに、因果推論の初学者という立場ですこ〜〜〜しだけ参加させていただきました。 実務や研究等で実際に効果検証/分析ができることを目指しており、入門書としては内容が充実した、非常に良い本だと思います。 仕事で効果検証を行いたいと考えている人、計量経済学を学び始めた人、データ分析に興味が出てきた人など、様々な方に対しておすすめできる本です。 今回は、簡単に内

                                                                                    書籍紹介「効果検証入門〜正しい比較のための因果推論/計量経済学の基礎」 - 名前はまだない