タグ

統計に関するidainahikikomori153のブックマーク (25)

  • 国会の「丁寧に説明」を可視化する - 日直地獄

    「丁寧に説明する」や「丁寧な説明を心がける」の印象がとにかく悪い。というのも、偉い人がこういうだけで、特に丁寧な説明が行われた試しがないと感じるからだ。誰も彼も「丁寧に説明」と言うだけで、それを履行しないというメソッドがはびこっている印象があるのだ。これをデータで確認したい。 「丁寧な説明」の運用と私が持っているイメージ データの作り方 「丁寧な説明」発言ダッシュボード 見どころ 与党は丁寧に説明しがち 第二次安倍政権は丁寧に説明しがち 安倍さんと岸田さん 「丁寧な説明」メソッドを発明したのは誰だったのか 注意事項 「丁寧な説明」の運用と私が持っているイメージ 最近もこういう感じで「丁寧な説明」が出現していた。 まあこれは組織として動け、みたいな観点での批判を入れたいのでちょっと違う気がするが、各議員から丁寧な説明がされてるとは感じない。 「丁寧な説明」というと安倍さんが連発していたイメー

    国会の「丁寧に説明」を可視化する - 日直地獄
  • 都市の3Dモデルをオープンデータ化する国交省の「Project PLATEAU」、メタバースでも事例様々

    Home » 都市の3Dモデルをオープンデータ化する国交省の「Project PLATEAU」、メタバースでも事例様々 都市の3Dモデルをオープンデータ化する国交省の「Project PLATEAU」、メタバースでも事例様々 (※記事は書籍『メタバース未来戦略 現実と仮想世界が融け合うビジネスの羅針盤』の内容を一部、許諾のもと編集・転載したものです) 2020年12月に国土交通省が発表した「Project PLATEAU(プロジェクト・プラトー)」。これは現実の都市空間を再現した「3D都市モデル」のオープンデータ化プロジェクトで、いわゆる「都市と連動するメタバース」「リアルタイムのデジタルツイン」と非常に近接した領域だ。官民を問わず様々なユースケースや実証事例が生み出されている「Project PLATEAU」について、国土交通省の都市局都市政策課課長補佐・内山祐弥氏に事例や展望について

    都市の3Dモデルをオープンデータ化する国交省の「Project PLATEAU」、メタバースでも事例様々
  • PyCaretからAutoVizを使用して探索的データ分析(EDA)を簡単に行ってみる - DATAFLUCT Tech Blog

    こんにちは!nakamura(@naka957)です。記事では、PyCaretで簡単に探索的データ分析を行う方法をご紹介します。 探索的データ分析(Explanatory Data Analysis: EDA)とは、データセットを様々な視点から分析し、データを考察することを目的に行うことです。EDAで得られた知見や仮説を活用し、その後のデータ分析機械学習モデルの構築を有効に行うことができます。 データを考察するための最も有効な手法は、可視化することです。そのため、データを可視化するスキルはEDAにおいて非常に重要になります。記事ではEDAを目的とした可視化する方法をご紹介します。 では、早速始めていきます。 PyCaretとは AutoVizとは ライブラリのインストール 実行の前準備 EDAの実行 散布図 棒グラフ 密度分布 Violinプロット ヒートマップ(相関係数) Auto

    PyCaretからAutoVizを使用して探索的データ分析(EDA)を簡単に行ってみる - DATAFLUCT Tech Blog
  • QGISを使って「災害データを地図で分析」してみよう 初心者向けの入門マニュアル|NHK取材ノート

    分析を身につけるには実際に「手を動かす」ことが一番の近道です。 分析ソフトと自治体のオープンデータを使った分析の進め方をとことん詳しく、マニュアル風にご説明します。やってみたいけど難しそう、わからない!という方の参考になればうれしいです。 (※あくまでもイメージをつかむためのものですので、詳しくはネットや参考書など他の情報もご覧ください) 今回のゴール地震による津波で浸水が想定されている区域に、子どもが通う施設がどのくらいあるのか。公開データから分析、可視化する。 以前、私が分析に携わったこの記事では、津波によって浸水が想定されている区域に、高齢者施設がどのくらいあるかを調べました。 このときのデータは、県や自治体などから取材で提供を受けたものがベースになっていました。そのままオープンにすることはできないので、今回は高齢者と同じく避難に手助けが必要な、「子どもの施設」に津波のリスクがあるか

    QGISを使って「災害データを地図で分析」してみよう 初心者向けの入門マニュアル|NHK取材ノート
  • 統計不正、4兆円過大計上か 20年度の全体5%相当 朝日新聞試算:朝日新聞デジタル

    ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

    統計不正、4兆円過大計上か 20年度の全体5%相当 朝日新聞試算:朝日新聞デジタル
  • 国交省、基幹統計を無断書き換え 建設受注を二重計上、法違反の恐れ:朝日新聞デジタル

    建設業の受注実態を表す国の基幹統計の調査で、国土交通省が建設業者から提出された受注実績のデータを無断で書き換えていたことがわかった。回収を担う都道府県に書き換えさせるなどし、公表した統計には同じ業者の受注実績を「二重計上」したものが含まれていた。建設業の受注状況が8年前から実態より過大になっており、統計法違反に当たる恐れがある。 この統計は「建設工事受注動態統計」で、建設業者が公的機関や民間から受注した工事実績を集計したもの。2020年度は総額79兆5988億円。国内総生産(GDP)の算出に使われ、国交省の担当者は「理論上、上ぶれしていた可能性がある」としている。さらに、月例経済報告や中小企業支援などの基礎資料にもなっている。調査は、全国の業者から約1万2千社を抽出し、受注実績の報告を国交省が毎月受けて集計、公表する。 国交省によると、書き換えていたのは、業者が受注実績を毎月記し、提出する

    国交省、基幹統計を無断書き換え 建設受注を二重計上、法違反の恐れ:朝日新聞デジタル
  • コロナ「第3波」、行動への影響は統計的に「ゼロ」

    感染拡大を受けて、12月14日には政府がGo To トラベル事業の全国一律停止(12月28日~1月11日)、東京都と名古屋市発着分の除外・自粛とすでに除外・自粛となっている札幌市・大阪市発着分の期間延長を決定した。このため、消費マインドの低下による景気下振れを懸念する向きも多い。 しかし、人々の移動データからは、「第3波」によって人々の行動が変化している様子はうかがえない。 感染「第1波」「第2波」「第3波」で行動に変化 Googleが公表しているCOVID-19 Community Mobility Reportsによると、「レストラン、ショッピングセンター等」の利用率(訪問数や滞在時間)について、感染拡大前をベースラインとすると、「第1波」のときには約マイナス40%、「第2波」では約マイナス15%まで減少していたのに対し、10月下旬以降は約マイナス10%の水準で横ばいとなっている。移動

    コロナ「第3波」、行動への影響は統計的に「ゼロ」
  • データサイエンスのための統計学入門 第2版

    データサイエンスにおいて重要な統計学と機械学習に関する52の基概念と関連用語について、簡潔な説明とその知識の背景となる最低限の数式、グラフ、RとPythonのコードを提示し、多面的なアプローチにより、深い理解を促します。データの分類、分析、モデル化、予測という一連のデータサイエンスのプロセスにおいて統計学の必要な項目と不必要な項目を明確にし、統計学の基と実践的なデータサイエンス技法を効率よく学ぶことができます。データサイエンス分野における昨今のPython人気を反映し、第1版ではRのみの対応だったコードが、今回の改訂でPythonにも対応。コードはすべてGitHubからダウンロード可能です。 日語版まえがき 訳者まえがき まえがき 1章 探索的データ分析 1.1 構造化データの諸要素 1.1.1 さらに学ぶために 1.2 テーブルデータ 1.2.1 データフレームとインデックス付け

    データサイエンスのための統計学入門 第2版
  • 11月新刊情報『データサイエンスのための統計学入門 第2版』

    『データサイエンスのための統計学入門 第2版 ―予測、分類、統計モデリング、統計的機械学習とR/Pythonプログラミング』 Peter Bruce, Andrew Bruce, Peter Gedeck 著、黒川 利明 訳、大橋 真也 技術監修 2020年11月9日発売予定 396ページ ISBN978-4-87311-926-7 定価3,520円(税込) データサイエンスにおいて重要な統計学と機械学習に関する52の基概念と関連用語について、簡潔な説明とその知識の背景となる最低限の数式、グラフ、RとPythonのコードを提示し、多面的なアプローチにより、深い理解を促します。データの分類、分析、モデル化、予測という一連のデータサイエンスのプロセスにおいて統計学の必要な項目と不必要な項目を明確にし、統計学の基と実践的なデータサイエンス技法を効率よく学ぶことができます。データサイエンス分野

    11月新刊情報『データサイエンスのための統計学入門 第2版』
  • 国勢調査の回答率は81.3% ネット・郵送ともに前回超え

    総務省は10月21日、一部地域を除いて20日に締め切った国勢調査の回答率が81.3%だったと発表した。このうちネットでの回答率は39.5%、郵送での回答率は41.8%。2015年の前回調査(全体71.0%、ネット36.9%、郵送34.1%)を上回った。 国勢調査は、世帯や就業状況の把握などを目的に、日に住む全員を対象に5年おきに実施。15年からは郵送に加えて、専用サイトで回答を受け付けている。 20年の国勢調査は当初、ネット・郵送ともに回答期限を10月7日としていたが、コロナ禍の影響を配慮して20日まで延長していた。 災害などの影響で期限を延長している153の市町村では、最長で21年2月20日まで回答を受け付ける。各地域からの回答を踏まえた確定値は、21年11月以降に発表する予定。 関連記事 国勢調査、ネット・郵送ともに回答期限を延長 10月20日まで 総務省が、国勢調査の回答期限を延長

    国勢調査の回答率は81.3% ネット・郵送ともに前回超え
  • 社会人のためのデータサイエンス演習

    この度、「社会人のためのデータサイエンス演習」の開講に先立ち、入門編となる『社会人のためのデータサイエンス入門』を特別開講しております。 データ分析の基的な知識を学ぶことができる内容となっており、『社会人のためのデータサイエンス演習』と併せて学習していただくことで、より理解が深まるかと思います。この機会に、ぜひご受講ください。 ※「《特別開講》社会人のためのデータサイエンス入門」は、修了証の発行はございません。 >>入門編はこちらから<< 講座内容 総務省統計局が提供する講座、ビジネスの現場で求められているデータサイエンスをわかりやすく解説します。 今、ビジネスの現場では、統計的な思考力によって様々な課題を解決していく能力、すなわち“データサイエンス”力の高い人材が求められている。コースでは“データサイエンス”力の向上を目指し、事例なども踏まえ、ビジネスの現場で使われる実践的なデータ分

    社会人のためのデータサイエンス演習
  • 【動画でも】タダで学べる有名大学レベルのデータサイエンス【そう、courseraならね。】 - Qiita

    記事中央に時間割を作っていますが、画像に講座リンクが繋がっています。 0. 対象読者 ・データサイエンス,統計,機械学習,AIに興味あり ・大学時代に専攻していなかった ・学習に大金を費やすのは難しい ・独学が厳しい領域だと感じている ・中学生の初級レベルの英語ならわかる この記事を読むのに向いてない方 ・英語を一切学ぶつもりはない ・データサイエンス分野に興味が無く、簡単に概要だけ知りたい (この場合はお金をかけて入門講座や家庭教師を頼んだ方がいい) 1. はじめに 1-1. まだまだ自学しよう 2020年の5月にタダで学べるデータサイエンス名著5冊を記事として書きました。 続編です。 この頃にはウイルスも8月までには収まっているだろう。という根拠のない予測をしていましたが、 まだ自粛ムードが漂う。 きっとデータサイエンティストを目指して入社した新卒の方もいらっしゃるでしょう。 採用した

    【動画でも】タダで学べる有名大学レベルのデータサイエンス【そう、courseraならね。】 - Qiita
  • 野球で送りバントが減らないのはなぜか 認知科学研究者が分析する送りバントをする心理学的理由

    Sports Analyst Meetupは、現役スポーツアナリストとスポーツ分析に興味のある方の情報共有イベント。ここでは認知科学研究者のなういず氏が、時間割引の視点からどうしてバントは減らないのか、心理学的アプローチから解説しました。 どうして送りバントは減らないのか? なういず氏(以下、なういず):『どうして送りバントをやめられないのか』というタイトルで発表いたします。なういずと申します。よろしくお願いします。 初めましての方もいると思いますので、最初に簡単に自己紹介させてください。私、なういずというハンドルネームで活動しています。Twitterは@nowism_sportsでやっていますのでフォローしてもらえると嬉しいです。サッカーは柏レイソルを、野球は巨人を応援しています。 普段は東京大学の大学院で認知科学を研究しています。研究の中では人間の非合理的な意思決定というものに興味があ

    野球で送りバントが減らないのはなぜか 認知科学研究者が分析する送りバントをする心理学的理由
  • [緊急寄稿]日本の新型コロナ対策は成功したと言えるのか─日本の死亡者数はアジアで2番目に多い(菅谷憲夫)|Web医事新報|日本医事新報社

    [緊急寄稿]日の新型コロナ対策は成功したと言えるのか─日の死亡者数はアジアで2番目に多い(菅谷憲夫) No.5014 (2020年05月30日発行) P.30 菅谷憲夫 (慶應義塾大学医学部客員教授,WHO重症インフルエンザガイドライン委員) 登録日: 2020-05-20 最終更新日: 2020-05-20 1.    SARS-Coronavirus-2(SARS-CoV-2)の日の流行 世界保健機関(WHO)は,年3月11日に新型コロナウイルス〔SARS-Coronavirus-2(SARS-CoV-2)〕のパンデミックを宣言し,日国内でも,2020年3月から流行が格化した。4月7日に,東京,神奈川,千葉など7都府県に緊急事態宣言が出て,4月16日には,宣言が全国に拡大された。5月に入り,日の流行も終息傾向が見られるようになった。Social Distancingや休校

  • 全くのゼロから「駆け出しデータサイエンティスト」を育てる方法論 - 渋谷駅前で働くデータサイエンティストのブログ

    (Image by Pixabay) 「データサイエンティスト」の第一次ブーム勃興から6年余り、人工知能ブームに便乗した第二次ブームで人口に膾炙してから3年余り、気が付いたら何やかんや言われながらもデータサイエンティスト及びその類似職が、じわじわと日国内の産業各分野・企業各社に広まりつつあるように僕の目には映ります。 そういう背景がある中で、ここ1年ぐらいの間にそこかしこで目立つようになってきたのが「ゼロからデータサイエンティストを育てたいのだがどうしたら良いか」という相談や議論。割とあるあるなのが「取引先がデータサイエンティストを採用して商談の席に同席させるようになって、彼らがデータサイエンスの知識を駆使してビシバシ突っ込んでくるのだが、こちらにデータサイエンティストがいないので対応できない」みたいなお話。これは実はUSでも同様だと聞くので*1、案外洋の東西を問わない課題なのかもしれま

    全くのゼロから「駆け出しデータサイエンティスト」を育てる方法論 - 渋谷駅前で働くデータサイエンティストのブログ
  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
  • アベノミクスの「成果」を示すデータ集 - モノシリンの3分でまとめるモノシリ話

    さて,選挙も近づいてきたということで,アベノミクスの成果を示すデータを貼り付けていこうと思う。 選挙のたびに「経済」が強調されてきたのだから,有権者にとってアベノミクスの成果を確認することは必要不可欠である。 まずはツイッターで盛大にバズったこのグラフから。アベノミクス前の2012年を100とした賃金と物価と消費の推移である。 データ元:厚労省,総務省 消費税増税と円安により,物価が6年間で6.6%も上がった(赤)。 その一方,名目賃金は2.8%しか伸びなかった(青)。 だから実質賃金は,アベノミクス前と比べて3.6%も落ちた(緑)。 そして,実質世帯消費動向指数は9.3%も落ちた(黄色)。 日銀によると消費税増税による物価上昇効果は2%だそうだ。 残りの4.6%はアベノミクスがもたらした円安が最も影響しているだろう。 (なお,2015年に原油の暴落があったおかげで円安による物価上昇の勢い

    アベノミクスの「成果」を示すデータ集 - モノシリンの3分でまとめるモノシリ話
  • メジャーリーグ11シーズン・400万球分の投球データを分析して審判がどれだけ正しくジャッジできているのかを分析した結果

    by Chris Chow メジャーリーグベースボール(MLB)の公式が公開している統計データベース「Baseball Savant」を用いて、2008~2018年までの11シーズン分で投げられた約400万球を分析し、審判による誤審について分析した研究論文が公開されました。これによると、過去11シーズンのピッチングに対する誤審率は12.78%ですが、2ストライク時に限れば誤審率は20%を超えるそうです。 MLB Umpires Missed 34,294 Pitch Calls in 2018. Time for Robo-umps? | BU Today | Boston University https://www.bu.edu/today/2019/mlb-umpires-strike-zone-accuracy/ An analysis of nearly 4 million pi

    メジャーリーグ11シーズン・400万球分の投球データを分析して審判がどれだけ正しくジャッジできているのかを分析した結果
  • 「忙しいから」統計ルール無視 厚労省の不適切調査 - 日本経済新聞

    厚生労働省が賃金や労働時間を示す毎月勤労統計調査で不適切な調査を続けていたことが発覚した。調査対象から大企業が抜け落ちた状態を長年放置し、2018年分からは勝手に統計を「修正」していた。影響は雇用保険の過少支給やこれまでの景気判断におよぶ。統計を軽んじる風潮は厚労省だけの体質なのか。データや根拠に基づく行政の根幹である統計の信頼が揺らいでいる。「実は、全数調査じゃない」。18年12月13日、総

    「忙しいから」統計ルール無視 厚労省の不適切調査 - 日本経済新聞
  • 勤労統計データ、大きく変わる恐れ | 共同通信

    厚生労働省の統計調査の不適切問題で、十数年間にわたり、抽出データを全数調査に近づけるための統計上の処理すらしていなかったことが分かった。過去の結果が大きく変動し、統計そのものの信頼性が大きく損なわれる恐れが出てきた。

    勤労統計データ、大きく変わる恐れ | 共同通信