タグ

機械学習と統計に関するbluescreenのブックマーク (17)

  • 因果推論100本ノック(2)回帰分析

    はじめに 因果推論100ノック(自作)11目~20目の問題とPythonのサンプルコードです. 問題の不備や内容の誤り等ありましたら,ご指摘いただけますと幸いです. 設定 メールマーケティングの効果を推定するケースについて考えます. 化粧品のEC販売にて,メディアの会員の中で購買傾向の弱いユーザーにキャンペーンメールを配信します.手元には「過去に小規模なデータで実験を行ったデータ」と「今回購買傾向の弱いユーザーにメールを配信したデータ」が存在するとします. データは,下記フォルダの2つのファイルを利用します. 利用するファイルの概要は下記の通りです. causal_knock2_rct.csv: 実験データ(以下,rctデータ) causal_knock2_reg.csv: 購買傾向の弱いユーザーにメールを送ったデータ(以下,regデータ) データのカラムの概要は下記の通りです. 変

    因果推論100本ノック(2)回帰分析
  • 統計学の講義資料(2022年度) | Logics of Blue

    帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 目次 資料について 統計学の講義資料 1.資料について 帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 もとの講義資料とは異なる点もあるのでご注意ください。 万が一何か問題があれば、当ブログにコメントをいただけますと幸いです。 スライドにも記載の通り、以下の利用を想定しています。 想定①:講義の受講者が復習に利用する 想定②:未受講者が統計学入門資料として利用する 基的には想定①ですが、文系の学生をメインターゲットとした統計学の格的入門資料は少ない印象です。 未受講者の方にも役に立つかもしれないと思いWeb上で公開することにしました。 資料は1年間にわたる講義資料となっています。数回

  • Algorithms for Decision Making

  • 数学カフェ 確率・統計・機械学習回 「速習 確率・統計」

    The document describes various probability distributions that can arise from combining Bernoulli random variables. It shows how a binomial distribution emerges from summing Bernoulli random variables, and how Poisson, normal, chi-squared, exponential, gamma, and inverse gamma distributions can approximate the binomial as the number of Bernoulli trials increases. Code examples in R are provided to

    数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
  • 統計・機械学習の理論を学ぶ手順 - Qiita

    社内向けに公開している記事「統計・機械学習の理論を学ぶ手順」の一部を公開します。中学数学がわからない状態からスタートして理論に触れるにはどう進めばいいのかを簡潔に書きました。僕が一緒に仕事をしやすい人を作るためのものなので、異論は多くあると思いますがあくまでも一例ですし、社員に強制するものではありません。あと項目の順番は説明のため便宜上こうなっているだけで、必ずしも上から下へ進めというわけでもありません。 (追記)これもあるといいのではないかというお声のあった書籍をいくつか追加しました。 数学 残念ながら、統計モデルを正しく用いようと思うと数学を避けることはできません。ニューラルネットワークのような表現力が高くて色々と勝手にやってくれるような統計モデルでも、何も知らずに使うのは危険です。必ず数学は学んでおきましょう。理想を言えば微分トポロジーや関数解析のような高度な理論を知っておくのがベス

    統計・機械学習の理論を学ぶ手順 - Qiita
  • 無料で学べる京大メソッドの統計入門:今月のAIニュースまとめ8選 | Ledge.ai

    画像はUnsplashより 日々、目まぐるしく進化、発展を遂げるAI人工知能)業界。さまざまな企業が新しいサービスを開始したり、実験に取り組んだりしている。 そこで稿ではLedge.aiで取り上げた、これだけは知っておくべき、9月掲載のAIに関するニュースをお届けする。AIの活用事例はもちろん、新たな実証実験にまつわる話など、稿を読んでおけばAIの動向が見えてくるはずだ。 文系理系を問わず学びたい! 滋賀大学データサイエンス学部の無料講座 改訂版 オンライン講座サイト「gacco(ガッコ)」では10月18日の15時から、滋賀大学データサイエンス学部による文系理系を問わず、すべての大学生に学んでもらいたい内容を実現したとうたう「大学生のためのデータサイエンス(Ⅰ)」が開講される。受講料は無料。 講座は改訂版として、滋賀大学を含む数理・データサイエンス教育強化拠点コンソーシアムが提示し

    無料で学べる京大メソッドの統計入門:今月のAIニュースまとめ8選 | Ledge.ai
  • 実践 時系列解析

    時系列データが使われる範囲は広く、医療データ、金融分析、経済予測、天気予報など、さまざまな分野で使われています。書は時系列データを通してデータ解析手法を学んでゆくアプローチで、データのクリーニング、プロットの方法、入出力など基的なトピックについてひととおりカバーしてから、さまざまな分野の事例を数多く取り上げ、統計的手法と機械学習手法の両方を時系列データに適用し、また人気のオープンソースツールも積極的に取り入れた手法を紹介します。プログラムにはRとPythonの両方を利用。データセットやコードはGitHubからダウンロード可能です。 はじめに 1章 時系列の概論と簡単な歴史 1.1 時系列の多様な用途の歴史 1.1.1 時系列問題としての医学 1.1.2 気象予測 1.1.3 経済成長の予測 1.1.4 天文学 1.2 時系列解析の人気に火がつく 1.3 統計的時系列解析の起源 1.4 

    実践 時系列解析
  • 今起きている革命、「因果革命」とは - Qiita

    みなさまは"The Causal Revolution" (因果革命)という言葉を聞いたことがあるでしょうか? 私は今月(2021年6月)に初めて知りました。Google Trendsでもデータ不足によりトレンドが表示されません。 つまりまだ全然マイナーな概念で、聞いたことがないほうが自然かと思われますが、これは「来る」と確信したため記事を投稿しました。この確信の根拠の箇所を記事中で太字で書いた他、最後にもまとめたため、記事を読む価値がありそうかの判断には先にそちらを読んでもらってもいいかもしれません。しかしながら、因果革命ないし統計的因果推論は学ぶ価値のある分野です。記事を読まなくても下記に挙げた書籍を未読の方はぜひ一読してみてください。Qiitaでも因果推論についての記事はいくつもあります。しかし、私が感動した点を明示化した記事は見当たらなかったため記事を投稿しました。 この記

    今起きている革命、「因果革命」とは - Qiita
  • 全国民に配るべき!総務省が示した「データ入力の統一ルール」|Excel医ブログ

    2020年12月、総務省より 【機械判読可能なデータの表記方法の統一ルール】が策定されました。 統計表における機械判読可能なデータの表記方法の統一ルールの策定 https://www.soumu.go.jp/menu_news/s-news/01toukatsu01_02000186.html 2020年11月に河野太郎 行政改革担当大臣のツイートが話題となりました。 その後正式に統一ルールが公開された形です。 各省庁がネット上で公開する統計を機械判読可能にするために、データの表記方法を統一させます。「政府統計の総合窓口(e-Stat)」で日から12月1日までの間、表記方法案に関する意見照会を行います。研究者をはじめ、皆様のご意見をお待ちしています。https://t.co/h07tCTDazc — 河野太郎 (@konotarogomame) November 25, 2020

    全国民に配るべき!総務省が示した「データ入力の統一ルール」|Excel医ブログ
  • 日本語で学べるベイズ統計学の教科書10冊 - Qiita

    東京大学・株式会社Nospareの菅澤です. 今回はベイズ統計学を勉強する上で個人的にオススメな日語の教科書10冊を簡単に紹介したいと思います. 一般的な方法論・基礎理論 中照雄『入門ベイズ統計学』 簡単な例と実践的な例を使ってベイズ推論の考え方が導入された後,マルコフ連鎖モンテカルロ法(MCMC)の基礎的な事項がまとめられています.基的な数理統計学が理解できていれば十分読める内容になっている印象です.このの続編である中照雄『実践ベイズ統計学』では,ファクターモデルやそのポートフォリオ選択への応用,ベイズ的線形回帰モデル,モデル平均化法などのより発展した内容について丁寧に解説されています. 伊庭幸人・種村正美・大森裕浩・和合肇・佐藤整尚・高橋明彦『計算統計II』 かなりボリュームのある内容のです.基的な話題として,MCMCの基礎や標準的な統計モデルにおけるベイズ推論に関して数

    日本語で学べるベイズ統計学の教科書10冊 - Qiita
  • 無料で読める統計学・機械学習周辺のチュートリアル論文や講義ノート10本 - Qiita

    はじめに 千葉大学/Nospareの米倉です.今回は,統計学・機械学習周辺で,僕が良いと思ったチュートリアル/サーベイ論文と講義ノートを簡単なコメント付きで紹介したいと思います.チュートリアル論文やサーベイ論文は,そのトピックの解説や教育面にフォーカスしていて,何か勉強したり,網羅的に把握するときに非常に便利だと個人的に思います.また公開されている講義ノートの中には非常に勉強になるものが多くあります.内容は僕が興味があるトピックに偏っています.またすべて無料で読めます.(教科書等の海賊版みたいなのは載せていません) 10の紹介 Nickl "STATISTICAL THEORY" Nicklの統計学の講義ノートです.いわゆるM推定量の漸近的性質に加え,バーンスタイン・フォンミーゼズ定理等も証明付きで解説されており,上級レベルの数理統計学を学ぶのに重宝すると思います. Doucet and

    無料で読める統計学・機械学習周辺のチュートリアル論文や講義ノート10本 - Qiita
  • 計算機統計学・ベイズ統計学周辺でのお勧めの教科書10冊 - Qiita

    はじめに 千葉大学/Nospareの米倉です.今回は僕が専門にしている計算機統計学・ベイズ統計学周辺で僕が勝手にお勧めだと思う教科書を10冊簡単なコメント付きで紹介したいと思います.初学者向けといより,修士・博士課程位のレベルのが多いので,ややプロ向けです. お勧めのプログラミング言語 僕は普段Julia言語を用いています.特徴は非常に高速なのと,可読性の高さでしょうか.個人的にはPythonやRより優れていると感じていて,僕の周りの専門家でも使っている人が多いです. Robert and Casella "Monte Carlo Statistical Methods" この分野のバイブルと言えばバイブルみたいな感じですが,そう呼ぶにはちょっと頼りない感じもします.けどモンテカルロ法に興味がある人はマストバイです.色々な種類のモンテカルロ法が網羅的に紹介されています. Efron and

    計算機統計学・ベイズ統計学周辺でのお勧めの教科書10冊 - Qiita
  • 無料の統計学講座が開講、多変量データの解析法を学べる | Ledge.ai

    画像は『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より オンライン講座サイト「gacco(ガッコ)」では2021年1月14日から、日統計学会と日行動計量学会の協力のもとに作成した「統計学Ⅲ:多変量データ解析法」が開講される。受講料は無料。 『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より 実際のデータは複数個の測定項目からなる多変量データであることが多く、そのようなデータの統計解析手法の学習は、統計手法の現実問題への応用で極めて重要なものと言える。講座では、多変量解析法を実際のデータに適用する際の注意点や実際の応用例を中心に学習できる。 『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より 講師は、横浜市立大学データサイエンス学部教授の岩崎学氏、大阪大学大学院人間科学研究科

    無料の統計学講座が開講、多変量データの解析法を学べる | Ledge.ai
  • BASIC STUDY | AVILEN AI Trend

    全人類がわかるデータサイエンス 基礎

  • 数学に強いエンジニアむけの機械学習勉強法

    今年の3月から機械学習の勉強を始めて9ヶ月たったのでその振り返りと今後機械学習に入門する人の参考になればという記事です。 巷の記事だと「数学何もわからない人向けの機械学習~」みたいなものが多いので「数学チョットワカル人向け」に勉強方法をまとめてみようと思いました。 前提として筆者は大学で数学を専攻しており、社会人になってからはプログラミングを生業としております。 # 前提知識のおさらいいきなり機械学習入門~のような書籍に入る前に、基礎知識としてこの辺を抑えておくと良いと思います。 ## 線形代数:大学1年レベル機械学習の説明はほとんど行列の計算として表現されますので大前提として。手を動かして計算問題を解くのもおすすめです。 プログラミングのための線形代数 https://www.amazon.co.jp/dp/4274065782 ## 基礎統計(頻度主義):大学1年レベル正規分布や指数分

  • Pythonで作って学ぶ統計モデリング | AIdrops

    Pythonで作って学ぶ統計モデリング 近年、AI機械学習、深層学習といった用語に代表されるように、多種多様のデータを高度なアルゴリズムと計算機の力で解析し、将来予測などの価値を生み出す技術に注目が集まっています。 これらの技術の土台となっているのが、記事で解説する統計モデリング(statistical modeling) と呼ばれる考え方です。元々は手計算が可能なレベルの比較的シンプルな数学的仮定を置いてデータを解析する方法論として発展しましたが、近年の計算機の性能発達に伴い、従来では取り扱えなかったより複雑なモデルを利用した高度な解析を実施する事例が増えてきています。特に、現在実践で広く使われている機械学習のモデルや、複雑な非線形関数を組み合わせた深層学習モデルなども、その多くは突き詰めれば統計モデルの一種であることが言えます。したがって、統計モデリングはそれ自体がデータ解析に対し

    Pythonで作って学ぶ統計モデリング | AIdrops
  • データサイエンティストもしくは機械学習エンジニアになるためのスキル要件とは(2017年夏版) - 渋谷駅前で働くデータサイエンティストのブログ

    この記事は2年前の以下の記事のアップデートです。 前回はとりあえずデータサイエンティストというかデータ分析職一般としてのスキル要件として、「みどりぼん程度の統計学の知識」「はじパタ程度の機械学習の知識」「RかPythonでコードが組める」「SQLが書ける」という4点を挙げたのでした。 で、2年経ったらいよいよ統計分析メインのデータサイエンティスト(物:及びその他の統計分析職)vs. 機械学習システム実装メインの機械学習エンジニアというキャリアの分岐が如実になってきた上に、各方面で技術革新・普及が進んで来たので、上記の過去記事のスキル要件のままでは対応できない状況になってきたように見受けられます。 そこで、今回の記事では「データサイエンティスト」*1「機械学習エンジニア」のそれぞれについて、現段階で僕が個人的に考える「最低限のスキル要件」をさっくり書いてみようかと思います。最初にそれらを書

    データサイエンティストもしくは機械学習エンジニアになるためのスキル要件とは(2017年夏版) - 渋谷駅前で働くデータサイエンティストのブログ
  • 1