NHKのニュースや番組をつくっている私たちが取材に込めた思いや取材手法などをお話します。一緒に「取材ノート」をつくっていきましょう。サイトはhttps://www.nhk.or.jp/d-navi/note/ 利用規約はhttps://nhk.jp/rules
東京大学・株式会社Nospareの菅澤です. 今回はベイズ統計学を勉強する上で個人的にオススメな日本語の教科書10冊を簡単に紹介したいと思います. 一般的な方法論・基礎理論 中妻照雄『入門ベイズ統計学』 簡単な例と実践的な例を使ってベイズ推論の考え方が導入された後,マルコフ連鎖モンテカルロ法(MCMC)の基礎的な事項がまとめられています.基本的な数理統計学が理解できていれば十分読める内容になっている印象です.この本の続編である中妻照雄『実践ベイズ統計学』では,ファクターモデルやそのポートフォリオ選択への応用,ベイズ的線形回帰モデル,モデル平均化法などのより発展した内容について丁寧に解説されています. 伊庭幸人・種村正美・大森裕浩・和合肇・佐藤整尚・高橋明彦『計算統計II』 かなりボリュームのある内容の本です.基本的な話題として,MCMCの基礎や標準的な統計モデルにおけるベイズ推論に関して数
画像はUnsplashより 在宅時間が増加したであろう現在は、学生や社会人が人工知能(AI)やデータサイエンスについて身につける絶好のチャンスと言える。「AIについて何か勉強したい」「統計学について知りたい」という人も少なくないのでは。 近頃、Pythonなどのプログラミングについて勉強したり、データサイエンスについて知識を深めたりできる学習コンテンツが無料で公開される機会が増えつつある。そこで、2021年1月27日現在、無料で学べるAIやデータサイエンス関連の学習コンテンツを集めてみた。 総務省、社会人のためのデータサイエンス入門を無料開講 総務省は2021年1月12日開講した「誰でも使える統計オープンデータ」に先駆け、「社会人のためのデータサイエンス入門」を特別開講している。登録料および受講料は無料。 本講座では入門編として、統計学の基礎やデータの見方・データの取得方法などを学べる。統
講座内容 本講座は、日本統計学会と日本行動計量学会の協力のもとに作成され、統計学Ⅰで学んだデータ分析の基礎および統計学Ⅱで学んだ推測統計の方法に引き続き、多変量データ解析手法について学習します。実際のデータは複数個の測定項目からなる多変量データであることが多く、そのようなデータの統計解析手法の学習は、統計手法の現実問題への応用で極めて重要なものです。本講座では、多変量解析法を実際のデータに適用する際の注意点や実際の応用例を中心に学習をします。 第1週:多変量データ解析法の概略と重回帰分析 多変量データ解析法の分類 変量間の関係(因果、回帰、相関) 研究の種類とデータ収集法 重回帰分析のモデル 結果の読み方 結果の解釈 説明変数の選択 ゲスト:選挙予測――未来の政権を知る(鈴木督久) 第2週:主成分分析と因子分析 主成分・因子分析にできること 主成分分析による可視化の原理 主成分分析の二通り
統計学を哲学する 作者:大塚 淳発売日: 2020/10/26メディア: 単行本(ソフトカバー) 本書は応用統計学にも造詣の深い科学哲学者大塚淳による統計学の哲学の入門書になる.序章では本書について「データサイエンティストのための哲学入門,かつ哲学者のためのデータサイエンス入門」だとある. これまで読んだ統計学の哲学についてはソーバーの「科学と哲学」がなかなか面白かった.本書ではソーバー本では扱っていなかった因果推論や深層学習についても論じられていて,そのあたりも勉強したいと思って手に取った一冊になる. 序章 統計学を哲学する? 序章では本書のねらいと構成が書かれている.ねらいとしては,上記の入門書というだけでなく,「統計は確固とした数理理論であり,そこに哲学的思弁が入り込む余地はない」とか「統計は単なるツールであり,深遠な哲学とは無縁だ」とかいう誤解を解きたいということが挙げられている.
人生のコントロール不能な部分を、もうちょっとコントロール可能にするには、どうすればよいか…というお話。21世紀のサイバー風水学について。 運の良し悪しは、一見するとコントロール不能な現象に見えます。ところが実際は、ある程度までコントロールが可能だったりします。 なぜなら多くの場合、確率的に不利なポジショニングが、「運の悪さ」として観測・説明されているにすぎないからです。因果の順序が逆なのです。「運が悪いから失敗するんじゃなくて、まさかの失敗をしたから運が悪いと呼ばれる」 ですので、「運」と呼ばれるものは、かなりの部分がコントロール可能です。サイバー風水学は、伝統的な風水学のモデルを使いながら、神秘性を排除し、合理と統計により再構築した概念です。 おなじに見える2つのギャンブル以下の2種類のギャンブルの違いを、あなたは瞬間的にイメージできるでしょうか? どちらも、コインを投げて表が出たらお金
データ分析や活用が必要以上に持ち上げられるバブルが ある程度落ち着いてきて、周りの方のだいぶ理解も進んできたと思います。 なので! 今日はデータ分析や活用の根幹、統計について 学んでいないと損するワケを 数式を一切使わずに 具体例を用いて解説したいと思います。 昨今データ活用や分析の有用性は日に日に高まっていますが なぜ知ってないと損になるのか?までは 実はあまり周知されていない気がします。 データ活用やデジタルトランスフォーメーション(DX)を取り入れたいけど どうやら成果?はでるらしいんだけど、 どういう効果があって何ができるの? あまりわかってないかもしれない という経営者や幹部の方、 もしくは 経営者や幹部の方にデータ活用の重要性やDXを推進するための説得として 本記事が少しでもお役に立てれば幸いです。 では本題です! 統計学を学ばないと損するワケ 実は統計学はデータ活用の基本とい
27日に政府が閣議決定した令和2年版自殺対策白書では、昨年の自殺者数は前年より671人少ない2万169人で、全世代的に減少する中、10代が唯一、前年より増加した。15~39歳の各年代の死因は自殺が最も多く、先進国では日本だけにみられる事態として、厚生労働省は「国際的にも深刻な状況」と危機感を抱く。コロナ禍の今夏には中高生の自殺が増えており、心理的な孤立化を防ぐ取り組みが求められる。 「悩み解消の知識が足りない」「さらに分析しないといけない課題。はっきりしたことは言えない」。若年層の自殺者数が減らない要因を問われ、厚労省の担当者はこう言葉を濁した。 昨年の10~19歳の自殺者は659人で、前年より60人増加。人口10万人当たりの自殺者数を示す自殺率も前年比0・3ポイント増の3・1で過去最悪を更新した。 15~39歳の各年代の死因は自殺が最多で、がんなどの病気や不慮の事故を上回る。15~34歳
『データサイエンスのための統計学入門 第2版 ―予測、分類、統計モデリング、統計的機械学習とR/Pythonプログラミング』 Peter Bruce, Andrew Bruce, Peter Gedeck 著、黒川 利明 訳、大橋 真也 技術監修 2020年11月9日発売予定 396ページ ISBN978-4-87311-926-7 定価3,520円(税込) データサイエンスにおいて重要な統計学と機械学習に関する52の基本概念と関連用語について、簡潔な説明とその知識の背景となる最低限の数式、グラフ、RとPythonのコードを提示し、多面的なアプローチにより、深い理解を促します。データの分類、分析、モデル化、予測という一連のデータサイエンスのプロセスにおいて統計学の必要な項目と不必要な項目を明確にし、統計学の基本と実践的なデータサイエンス技法を効率よく学ぶことができます。データサイエンス分野
画像は『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より 総務省は9月29日から、実践的なデータ分析の手法を学習できるとうたう、データサイエンス・オンライン講座「社会人のためのデータサイエンス演習(外部サイト)」を開講している。登録料および受講料は無料。閉講日時は12月7日の23時59分。 本講座では、ビジネスや行政での活用を想定しており、社会人や大学生に向けて、ビジネスや業務上での分析事例を中心に実践的なデータ分析(統計分析)の手法をわかりやすく解説するという。前提条件は表計算ソフトMicrosoft Excelの基本的な操作ができること。 『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より 講師は、総務省統計局の會田雅人氏、総務省統計局の阿向泰二郎氏、株式会社電通の佐伯諭氏、東京大学の松尾豊氏、株式会社ブレインパッドの奥園朋実氏、株式会社ブレインパッドの
将棋界では藤井聡太棋士のフィーバーが起こっています。若干18歳になりたての藤井棋士のタイトル戦が大きな話題になっています。歴史的には、羽生善治、谷川浩司、加藤一二三といった当時の神童達もかつては世間を騒がせたはずです。 世代の異なる強者同士が、ピーク時の実力で戦うと、誰が強いのか?これは将棋界だけでなく、勝負の各世界で話題に上がることです。ここでは、プロ棋士の過去の膨大な対局データと統計モデルによって、各棋士の実力を数値化し、誰が最強なのかを相対的に示してみようと思います。 対象は将棋棋士成績DB[1]に掲載がある棋士番号のあるプロ棋士に限定します。初期の方の棋士(9名)は対戦データがないため除き、2019年10月以降にプロとなった棋士(5名)もデータ不足のため除きます。これで合計309名になり、この棋士同士の対局データのみを集めます。(309名のリスト)データは全て将棋棋士成績DB[1]
はじめに 前回は年齢による実力の変化を考えずに各騎士の実力を評価しました。年齢による実力の衰えは明白であるため、このモデルで異なる世代の棋士の比較は正当ではありませんでした。 その後、インターネットで検索をすると、統計モデリングでの棋士の順位付けをしている記事がいくつかありました。[1][2] また、stanの書籍にも同様な手法が載ってます。[3] しかし、年齢効果による実力の変化を取り入れたモデルはまだないようですので、次はこの変化をモデル化して、世代をまたいで実力を比較できるモデルを構築してみます。一見、実力をローカルレベルモデル等のノイズ入り時系列モデルで表すことが出来そうですが、それだけでは新しい世代が有利なモデルのままになります。年齢による実力の増減を別個に取り入れる必要があります。 データ 用いるデータは、前回の記事「ベイズ統計モデリングを使って、藤井聡太と全盛期の羽生善治を比
【表面的な数字操作で現実を糊塗する政府のごまかし作法の「セコさ」】 ①「ニート 60万人に減少 子ども・若者白書『支援拠点が効果』」 (『日本経済新聞』2014年6月3日夕刊「社会1」面) このニュース,② でひどいブーイングを受けるものとなるが,ともかくさきにその報道内容を聞いておこう。 政府は2014年6月3日,2014年版「子ども・若者白書」を閣議決定した。15~34歳の若者で仕事も通学も求職もしていない「ニート」は 2013年に60万人で,前〔2012〕年に比べ3万人減少したことが明らかになった。この年代の人口に占める割合は0.1ポイント減の 2.2%だった。 補注)「ニートの定義」 --ニート(英,NEET)とは,Not in Education, Employment or Training(ノット・イン・エデュケーション・エンプロイメント・オア・トレーニング),つまり,「訓練
今日は、マーケティングや企画に携わる社会人なら知っておきたい、というよりは、知らないと恥ずかしい、無料で利用できる公的統計データのポータルサイト「e-Stat」の情報と、新しい統計データが自動的に飛んでくる「統計メールニュース」の情報をお届けします。 すでに6月も下旬。新入社員の方も配属部署が決まってバリバリ働いていることだと思います。 マーケティングや企画の仕事をする人にとって、調査データというのは大切なもの。 ネット上で発表される「○○のサービスのユーザー数が○○万人」なんて調査データ、みんな好きですよね。Googleトレンドのような検索ボリュームの情報や、どのブラウザがどれぐらい使われているかといった調査データも人気です。 どれも無料で入手できるデータですが、実は税金でちゃんとした手法でつくられている、質の高い調査データというのが、あるのです。 それが、政府の出している統計データ。
新企画「データファイル・ジャパン」。国や自治体がオープンにしているデータや研究機関の最新の調査結果など、世の中の数々のデータを読み解くことで、いま日本で何が起きているのかを明らかにしていくシリーズです。人口動態統計や出生率、自治体別の未来予測など、よく知られたデータもそれを“裏側”から見ると、新たな発見があります。シリーズで明らかにしていく問題は、それぞれが複層的で重なっているものです。多くが直接的な解決策すら見いだすのが難しい問題ですが、各地での対応や対策などを検証し、複眼的に見ていくなかで、まずは地域から再生への道を探ります。 Copyright NHK (Japan Broadcasting Corporation) All rights reserved. 許可なく転載することを禁じます。 このページは受信料で制作しています。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く