タグ

統計に関するotani0083のブックマーク (34)

  • UNdata

    Popular statistical tables, country (area) and regional profiles Population Population, surface area and density PDF | CSV   Updated: 25-Oct-2023 International migrants and refugees PDF | CSV   Updated: 25-Oct-2023 Population growth, fertility, life expectancy and mortality PDF | CSV   Updated: 25-Oct-2023 Population in the capital city, urban and rural areas PDF | CSV National accounts GDP and GD

  • 東京新聞:平成の賃金 検証不能 統計不正 政府廃棄で8年分不明:経済(TOKYO Web)

    令和への改元を控え、「平成経済」を知るための重要な指標の一つである「賃金伸び率」の検証が、今年一月に発覚した政府の統計不正のためにできなくなっている。政府が毎月勤労統計の集計で不正を行っていた期間の資料を廃棄したことで、八年分の賃金が分からなくなったからだ。公表された資料には空欄が並ぶという、異様な状況となっている。 (渥美龍太) ルールでは全数調査をしないといけない東京都分の大規模事業所を、厚生労働省が二〇〇四年に勝手に抽出調査に切り替える不正を始めたため、以降の調査結果が実態より低く出るずれが生じていた。これにより、延べ二千万人超が雇用保険などを過少に給付されていたことが分かった。 問題発覚後、厚労省は一二年以降の結果を再集計して来の数値を再現したが「〇四~一一年分は調査票などの資料を廃棄・紛失していて再集計ができない」(厚労省の賃金統計担当者)ため、公表資料を空欄とした。この空欄部

    東京新聞:平成の賃金 検証不能 統計不正 政府廃棄で8年分不明:経済(TOKYO Web)
    otani0083
    otani0083 2019/05/07
  • 政府統計、信頼に揺らぎ GDPなど日銀が不信感  :日本経済新聞

    の現状を映す統計を巡り、内閣府と日銀が綱引きしている。国内総生産(GDP)など基幹統計の信頼性に日銀が不信を募らせ、独自に算出しようと元データの提供を迫っているのだ。内閣府は業務負担などを理由に一部拒否しているが、統計の精度をどう高めるかは、日経済の行く末にも響きかねない大きな問題をはらんでいる。「基礎データの提供を求めます」。10月11日、政府統計の改善策などを話し合う統計委員会の下部

    政府統計、信頼に揺らぎ GDPなど日銀が不信感  :日本経済新聞
  • TOP|明治150年特設サイト|統計局ホームページ

    ホームページURL変更のお知らせ 当サイトにアクセスいただきありがとうございます。 この度、ホームページアドレス(URL)を変更いたしました。 つきましては、下記の新アドレス(URL)への変更をお願いいたします。 また、お気に入りやブックマークなどに登録されている方はお手数ですが設定のご変更をお願いいたします。 ■旧ホームページアドレス https://www.stat.go.jp/library/meiji150/ ■新ホームページアドレス https://www.stat.go.jp/museum/toukei150/ 今後とも当サイトを宜しくお願いいたします。

  • 文部科学統計要覧(平成30年版):文部科学省

    1.学校教育総括 学校数・在学者数・教職員数 学校数(都道府県別) 在学者数(都道府県別) 教員数(都道府県別) 学校数(年次別) 在学者数(年次別) 教員数(年次別) 入学者数(年次別) 卒業者数(年次別) 就学率・進学率 卒業者に占める就職者の割合 学校土地面積 学校建物面積 長期欠席児童生徒数 2.幼稚園 学校数 園児数 教員数 職員数 入園者数 3. 幼保連携型認定こども園 学校数 園児数 教員数 職員数 入園者数 4.小学校 学校数 学級数 児童数 教員数 職員数 5.中学校 学校数 学級数 生徒数 教員数 職員数 入学志願者数 卒業者数 高等学校等進学者数 就職者数 6.義務教育学校 学校数 学級数 児童生徒数 教員数 職員数 入学志願者数 卒業者数 高等学校等進学者数 就職者数 7.高等学校 学校数 学科数 生徒数 教員数 職員数 通信教育課程(学校数 生徒数 教員数 職員数

    文部科学統計要覧(平成30年版):文部科学省
    otani0083
    otani0083 2018/07/03
    17が学位授与数
  • 厳選30冊!統計学を勉強する上でおすすめな本 | デジラボ

    当サイト【スタビジ】の記事では、統計学のおすすめ書籍を分野別に徹底的にまとめていきます!統計学は難しいイメージがあるかもしれませんが学び方を間違えなければ大丈夫。悪書に当たると一気に挫折してしまうので気を付けてください。ここで紹介する書籍はどれもわかりやすく良なので安心してくださいね! こんにちは! 消費財メーカーのデータサイエンティスト、ウマたん(@statistics1012)です。 今では統計学を楽しんでいますが、昔はσとかμとかギリシャ文字を見るたびに胃がキリキリしていました笑 せっかく統計学を勉強しようとしても、最初に難書・悪書に出会ってしまうと、どうしても統計学に対して堅苦しくて難しいというような印象を持ってしまいます。

    厳選30冊!統計学を勉強する上でおすすめな本 | デジラボ
  • 統計検定を理解せずに使っている人のために III

    Online ISSN : 1883-6852 Print ISSN : 0453-073X ISSN-L : 0453-073X

  • 統計・機械学習・R・Pythonで用途別のオススメ書籍 - StatModeling Memorandum

    比較的読みやすいを中心に紹介します。今後は毎年このページを更新します。 微分積分 高校数学をきちんとやっておけばそんなに困ることないような。偏微分とテイラー展開は大学演習のようなでしっかりやっておきましょう。ラグランジュの未定乗数法のような、統計・機械学習で必要になる部分は、ネット等で学べばいいかなと思っています。 線形代数 tensorflowなどのおかげで順伝播部分(行列積および行列とベクトルの積)さえ書ければ線形代数の知識はそこまでいらないんじゃないかという流れを感じます。しかし、主成分分析やトピックモデルなどの行列分解や、ガウス過程などのカーネル法のような様々なデータ解析の手法に一歩踏み込むと、きちんとした勉強が必要になります。理解しやすくて使いやすくて、統計や機械学習への応用を主眼においた線形代数のはまだ見たことないです。機械学習シリーズとかで基礎から「The Matrix

    統計・機械学習・R・Pythonで用途別のオススメ書籍 - StatModeling Memorandum
  • ソフトウェアのための統計学 – 前編 | POSTD

    ソフトウェア開発の原点は可能性の追求であり、不可能を可能にすることです。ひとたび ソフトウェア が開発されると、エンジニアは次に 程度 という課題に向き合うことになります。企業向けのソフトウェアであれば、「速度はどれくらいか」と頻繁に問われ、「信頼性はどの程度か」という点が重視されます。 ソフトウェアのパフォーマンスに関する質問に答え、さらには正しい内容を語る上で欠かせないのが統計学です。 とはいえ、統計学について多くを語れる開発者はそうはいません。まさに数学と同じで、一般的なプロジェクトで統計学が話題に上ることなどないのです。では、新規にコーディングをしたり、古いコードのメンテナンスをしたりする合間に、手が空くのは誰でしょうか? エンジニアの方は、ぜひ時間を作ってください。近頃は、15分でも貴重な時間と言えるでしょうから、 こちらの記事をブックマークに追加 しておいてもいいでしょう。とに

    ソフトウェアのための統計学 – 前編 | POSTD
  • STAT DASH グランプリ2016 | 政府統計の総合窓口(e-Stat)−API機能

    コンテストについて 行政サービスの向上と社会経済における政府統計データのより高度な活用の普及・促進を目的として、統計データや統計APIを活用するアイデアを募集するコンテスト「STAT DASHグランプリ2016」を開催します。 コンテストは、政府統計の総合窓口(e-Stat)をより使いやすくしてサービスの向上を図ること、および社会経済における政府統計データのより高度な活用の普及・促進を目的として開催するものです。応募いただいたアイデアは、プレゼンテーションなどを基に有識者により審査され、総務大臣の決定を経て、優秀なアイデアは総務大臣から表彰される予定です。 募集部門及び賞構成 「STAT DASHグランプリ2016」では、e-Statの統計データや統計APIを活用するアイデアやアプリケーションを2つの部門で募集します。 各募集部門の詳細は、それぞれ下記からご覧下さい。 行政サービス開拓部

    STAT DASH グランプリ2016 | 政府統計の総合窓口(e-Stat)−API機能
  • 当社データサイエンティストがこよなく愛している『mコマンド』で数億行を高速集計する話 - ハウテレビジョンブログ

    どうも。 1月に入社したばかりの、データ分析担当のn_maoです。 と言いながら、最近はHTMLとjsばかりいじっております。 それはそれで楽しいです。 さて今回はデータ分析のざっくりとした仕事内容と、その分析にかかる手間を省くツールをご紹介します。 データ分析仕事 まずは私の行っているデータ分析という仕事の内容をご紹介します。 私の主な仕事は大きく分けて4つです。 売上げ、会員登録数などの簡単な集計&自動レポーティング データベースからの知識発見(いわゆるデータ分析) 分析結果をもとにした企画立案 実施された企画の効果検証 あくまで私個人の仕事内容であり、データ分析者全員に当てはまるわけではありません。 アルゴリズムの研究開発の方や、インフラ寄りの方もいらっしゃるでしょう。 ですが、同じ職種の方で業務範囲が被っている方も少なからずいらっしゃると思います。 これら4つの業務の中で一番時間

    当社データサイエンティストがこよなく愛している『mコマンド』で数億行を高速集計する話 - ハウテレビジョンブログ
  • 「統計モデリングとは何なのか」をいま一度整理してみる - 渋谷駅前で働くデータサイエンティストのブログ

    もうタイトルを読んで字の如しなんですが、要は「統計モデリングってぶっちゃけ何なのよ?」という問題意識が最近非常に局所的ながら影響力の大きいところ*1から出てきておりまして。 で、僕もその議論にマターリ参加しながら「このもやもやしたものをどうやったらうまく表現できるかなー」と思っていて、何日かして自分なりにちょっと整理がついた気がするので、自分向けの備忘録も兼ねてちょっとブログにまとめてみることにしました。ちなみに@berobero11さんは既にこの議論についてまとめていらっしゃるようで。 あてはめの原理・あてはめを実装する計算法・モデル そうそう、今回もお題はこちらの久保先生の緑です。というかここから議論が始まったわけで。 データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学) 作者: 久保拓弥出版社/メーカー: 岩波書店発売日: 20

    「統計モデリングとは何なのか」をいま一度整理してみる - 渋谷駅前で働くデータサイエンティストのブログ
  • 統計解析 & R言語超初心者入門資料まとめ

    興味を持ち続けていた統計解析や、R言語の勉強をはじめました! まだまだ初歩の初歩ですが、この記事がいつか偉大な一歩になれるように頑張っていく所存ですw まずは、R言語や統計解析に関する入門記事や、モチベーションがアップしそうな記事をまとめていきます! (02/23 11:00) 初学者の人にお勧めな資料にフォーカスしてまとめ直し 🍮 [スライド] 統計学入門 統計学の全体像をつかむのに最適なスライドです。初歩…とはちょっと呼べないくらい内容が深いです! 🏈 [スライド] 初めての「R」 統計解析を始めるときにWindowsな方も、Macな方もとっつきやすのが『R』です。このRを完全初心者をターゲットに説明をしていただけている資料です。超わかりやすいです! 🍄 [デスクトップアプリケーション] R用のIDE: RStudioRStudio RStudioはR言語用のIDEです。Wind

    統計解析 & R言語超初心者入門資料まとめ
  • ディスプレイ広告のクリック数改善のためのデザイン最適化に、ポアソン分布 / 負の二項分布によるGLMを使ってみる - 渋谷駅前で働くデータサイエンティストのブログ

    これはディスプレイ広告に限った話ではないと思うんですが、あるPC / スマホ上の何かしらのクリエイティブに対するクリック数がそのデザインの良し悪しによって左右されるということは、web業界ではよく知られているかと思います。 そういう場合「どんなデザインがクリック数を増やすのに有効か?」というのは、厳密にはきちんと条件統制をかけて実験計画法に基づいてデザインしたA/Bテストなどで調べるべきなんでしょうが、そこまで綿密にやっている余裕のない現場も結構多いはず。 そこで、今回は既に計測済みの各広告のクリック数(CTRでしか得られていないようであれば実クリック数に直すものと想定する)データが得られているものと仮定して、それを各広告のデザイン要素を表すインデックス(二値orカテゴリカルデータ)のデータと組み合わせて、「どんなデザインをすればクリック数が増えるか?」を推定するというケースを想定してRで

    ディスプレイ広告のクリック数改善のためのデザイン最適化に、ポアソン分布 / 負の二項分布によるGLMを使ってみる - 渋谷駅前で働くデータサイエンティストのブログ
  • 今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ

    (※※※続編記事書きました→「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ) 今ちょうどadtech tokyo 2013の会期中で、職場からも近い&会社から行ってこいという指示が出たということで僕も色々セッションを聞いたり企業ブースのお話を聞いたりしてる*1ところです。 ところで、いくつかのセッションの中でキーワードとして「重回帰分析」という言葉が出てきてました。ま、それ自体はこのブログでもRによるデータ分析絡みで頻出だし、ぶっちゃけありふれた手法と言って良いでしょう。やりようによっては普通にExcelでもできますし、それだけ人口に膾炙していると言って良いのかもですね。 ただし。意外にも内部のパラメータというか細かい手法の分岐というか、それこそ普通の線形モデルvs.一般化線形モデル(バリエーション多数)があることを無視して漫然と重回帰分析をや

    今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ
  • [R][データ分析]階層ベイズモデルのサンプルコード bayesmパッケージを利用 - データ分析がしたい

    Rの階層ベイズモデルのサンプルコードが全然見当たらなかったので、自分で書くことにします。詳細を説明しだすとかなり面倒な領域なので、取り合えず使えるというレベルを目指します。 利用するパッケージは「bayesm」です。 階層ベイズに限らずベイズ推定用MCMCの実行はWinBUGSが一般的だと思いますが、Rのみで利用可能かつ事前分布に関する知識なしで利用可能なのが魅力的なので。 階層ベイズモデルについて 階層ベイズモデルは簡単に説明すると個体差を取り入れた統計モデルです。イメージとしては回帰モデルを作成した際の回帰係数が個体ごとに異なっているようなモデルで、最尤法に基づく重回帰モデルやロジスティック回帰モデルより高い表現力を持ちます。 もちろん単純に人ごとに回帰係数を変えるとデータ数より係数の方が多くなり推定できないのですが、係数は個体ごとに大きく異ならないという仮定を入れて問題を解きます。こ

  • Rから利用するオープンデータAPI

    2013年10月8日に開催された標記勉強会で使用したスライドです。オントロジーエディタprotégéの使い方について、簡単な例を用いて説明しています。内容は入門レベルです。

    Rから利用するオープンデータAPI
  • データを取り込む・格納するための方法を理解する

    データを取り込む・格納するための方法を理解する:ITエンジニアのためのデータサイエンティスト養成講座(3)(1/4 ページ) データ分析を行う際の対象となるデータにはさまざまな形式が存在します。データ分析を行うには、まず、データを取り込む方法や、結果セットを書き出したり、データベースに格納したりする手続きが必要です。今回はデータの取得、格納といった分析のための下処理の手続きを紹介します。 連載バックナンバー 前回(連載第2回)は、データ分析に必要な機能と、その機能を実装したPython環境や必要なライブラリのセットアップ方法を説明しました。今回は、分析に必要なデータを、CSV(カンマ区切り)形式のファイルやリレーショナルデータベース、Webサイトなどから取り込む方法について解説します。さらに、結果セットをCSV形式で書き出したり、リレーショナルデータベースに格納する方法も紹介します。 デ

    データを取り込む・格納するための方法を理解する
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurm

    研究用にニコニコ動画のコメント約300GBを公開‐ニコニコインフォ 情報学研究データリポジトリ ニコニコ動画コメント等データ 国立情報学研究所のダウンロードサービスでニコ動のデータセットが公開されていたので、とりあえずダウンロードしてみました ダウンロードの手順 以下のページで、名前、メールアドレス、所属を入力すればよいみたいです。 情報学研究データリポジトリ ニコニコ動画コメント等データ 申請 データの形式 行ごとにそれぞれの動画のjsonが書かれたファイルがたくさんあります。 コメントのデータもありますが、ユーザーに関する情報はないみたいです 動画の説明などには<b></b>や<font></font>、<br />などのHTMLタグが含まれていましたので、それらの除去が必要になりそうです タグの頻度 なんか面白いことできないかなーと考えたんですが、何も思い浮かばなかったので、とりあえ

    ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurm