株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。
AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す本連載『「AI」エンジニアになるための「基礎数学」再入門』。前回は「スカラ」「ベクトル」「行列」「テンソル」の基礎知識を学びました。今回のテーマは、ベクトルの扱い方=計算方法です。 ところで、皆さんは英語を学習したことがあると思います。新たな英単語・英文法を学ぶことで、より多くの英文を読解できるようになることを経験しているはずです。何が言いたいかというと、今回のテーマを学ぶことは、数学に関連する文献を読むことにおける「単語や文法を学ぶ」ようなことに値します。つまり、より多くの文献を読解できるようになるはずなので、しっかり学んでいきましょう。 2次元のベクトル ベクトルの計算方法を解説するために、例として次のような2つのベクトルを考えます。 今回は2次元(要素が2つ)のベクトルで、次のような数字の集まり
画像は『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より オンライン講座サイト「gacco(ガッコ)」では2021年1月14日から、日本統計学会と日本行動計量学会の協力のもとに作成した「統計学Ⅲ:多変量データ解析法」が開講される。受講料は無料。 『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より 実際のデータは複数個の測定項目からなる多変量データであることが多く、そのようなデータの統計解析手法の学習は、統計手法の現実問題への応用で極めて重要なものと言える。本講座では、多変量解析法を実際のデータに適用する際の注意点や実際の応用例を中心に学習できる。 『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より 講師は、横浜市立大学データサイエンス学部教授の岩崎学氏、大阪大学大学院人間科学研究科
画像は『滋賀大学「大学生のためのデータサイエンス(Ⅱ)」講座PV~ gacco:無料で学べる大学講座』より オンライン講座サイト「gacco(ガッコ)」では11月16日から、滋賀大学データサイエンス学部による「なるべく数式を使わない」という方針で構成した「大学生のためのデータサイエンス(Ⅱ)」が開講される。受講料は無料。 本講座では、機械学習の諸手法とその応用について説明する。まず「機械学習とは何か?」という説明から始め、その後に機械学習の応用事例を紹介。応用事例を先に見ることによって、機械学習の有用性が理解でき、機械学習の手法をより積極的に学べるとしている。 次に、分類問題と回帰問題の具体的な手法を説明し、同時に特徴量の設計・選択など、実践的なテクニックについても紹介する。最後に、近年、発展の著しいニューラルネットワークについても説明してくれる。また、本講座は、機械学習の分野のなかでも教
画像は『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より 総務省は9月29日から、実践的なデータ分析の手法を学習できるとうたう、データサイエンス・オンライン講座「社会人のためのデータサイエンス演習(外部サイト)」を開講している。登録料および受講料は無料。閉講日時は12月7日の23時59分。 本講座では、ビジネスや行政での活用を想定しており、社会人や大学生に向けて、ビジネスや業務上での分析事例を中心に実践的なデータ分析(統計分析)の手法をわかりやすく解説するという。前提条件は表計算ソフトMicrosoft Excelの基本的な操作ができること。 『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より 講師は、総務省統計局の會田雅人氏、総務省統計局の阿向泰二郎氏、株式会社電通の佐伯諭氏、東京大学の松尾豊氏、株式会社ブレインパッドの奥園朋実氏、株式会社ブレインパッドの
この記事について 先日統計検定2級を受けました。自己採点で合格点を採れていた(7割強)ので、勉強前の自分に伝えるつもりで勉強方法についてメモを残します。 勉強のコツは「深く考えないこと」 基礎統計学で使う公式にはオーバーテクノロジーが使われています。 たとえば以下は標準正規分布の確率密度関数の式です。あきらかに初学者の理解を拒んでいます。 f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp \left(-\frac{(x - \mu)^2} {2\sigma^2} \right) \hspace{20px} (-\infty < x < \infty) 初めて教科書を見たときは面食らいましたが、別に今この式自体を理解する必要はありません。統計学の公式には少なくとも普通の大学の1・2年次では理解できない数学が使われているので、今頑張って考えても徒労におわるだ
今回は機械学習でよく出てくる正則化の数理的基礎についてまとめたいと思います. ちょっと数理的なお話が多くなりますが, 大学院に居たときも今の職場で話しているときにも,この辺の事を理解している人は意外と多くないのかなと思ったので, 記事にしてみました. なお,本記事の内容の大部分は 金森敬文. (2015). 統計的学習理論 (機械学習プロフェッショナルシリーズ). を参考に書いています. 一般的な学習理論のお話 回帰にしろ分類にしろ,機械学習の理論はある程度統一的に扱うことが出来ます. 目的変数$y$が離散変数であれば分類問題になりますし,連続変数であれば回帰になります. ここでは,回帰・分類を統一的に扱い,学習理論一般に関する説明を少しだけしたいと思います. 入力ベクトルを$\boldsymbol{X}\in \mathcal{X} \subset \mathbb{R}^d$, 目的変数
2018年12月4日、総務省は、日本オープンオンライン教育推進協議会(JMOOC)公認の配信プラットフォーム「gacco」において、データサイエンス・オンライン講座「誰でも使える統計オープンデータ」を開講しました。 2017年6月に実施した講座を再び開講するものであり、政府統計の総合窓口である e-Stat等を用いて、統計オープンデータを活用したデータ分析手法を学習できるとあります。 データサイエンス・オンライン講座「誰でも使える統計オープンデータ」の開講(総務省, 2018/12/4) http://www.soumu.go.jp/menu_news/s-news/01toukei09_01000042.html データサイエンス・オンライン講座「誰でも使える統計オープンデータ」(gacco) http://gacco.org/stat-japan3/ 参考: 国立情報学研究所、無料オン
データサイエンティストによる統計入門 ― k平均法でデータをクラスタリングしてみよう! ビッグデータ、データサイエンス、人工知能など、統計学を主軸においた分野が隆盛ですが、統計学には高いハードルを感じる方も少なくないでしょう。k平均法を実際に手を動かしながら理解することで、データ分析を身近に感じることができます。 はじめまして、藤井健人(@studies)と申します。イタンジ株式会社でデータ基盤周りの運用を担当しています。 「ビッグデータ」「データサイエンス」「人工知能」といったバズワードに代表されるように、統計学を主軸においた分野の隆盛が日常となって久しいです。 しかし「統計学は学問的な要素があり難しい」という印象を持たれやすく、「実務に活かすのはハードルが高い、怖い」と感じる方も少なくないのではないでしょうか。 そういった方を対象に、今回は統計学の手法の一つであるk平均法を学んでいただ
データサイエンティストブームですね。というのはおいといて、弊社でも統計学をいろんなひと(特にディレクタやデザイナとか)が学んで使えるようになるといいよねという感じで、みんなで勉強しよう!みたいなことをしています。今日は、若手敏腕ディレクタのzaimyが、下記資料に基づく勉強会をしてくれました。 http://www.storyboards.jp/viewer/u0arvn 僕も目下勉強中なのでなんもわからないのですが、読んだ本のうち、統計学に馴染みのない人向けでよかったものについて社内向けにまとめてみたので、こちらにも転載しておきます。 完全独習 統計学入門 作者: 小島寛之出版社/メーカー: ダイヤモンド社発売日: 2013/06/17メディア: Kindle版この商品を含むブログ (2件) を見る これが一番オススメです。見た目は固そうですが、簡単だし、内容もいいと思います。Kindl
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く