タグ

statに関するmkawanoのブックマーク (7)

  • e-Stat APIをRから使う - Technically, technophobic.

    ほぼほぼこの記事に書いてある内容なんですけど、httrでやってみたのでメモ。 e-Stat APIとは 政府統計の総合窓口(e-Stat)で提供している統計データを入手できるAPIです。ユーザ登録してAPIキーを生成すると使えます。 今のところ、以下の種類のAPIが用意されています。形式はXMLとJSONとJSONPがありますが、今回はJSON形式のでやってみるので、jsonが返ってくるリクエストURLを書き添えています。 統計表情報取得(getStatsList):統計表の検索 メタ情報取得(getMetaInfo):統計表のメタ情報を取得 統計データ取得(getStatsData):統計表のデータを取得 データセット登録(postDataset):統計データの取得条件を登録しておける データセット参照(refDataset):登録されている取得条件を参照 データカタログ情報取得(get

    e-Stat APIをRから使う - Technically, technophobic.
  • 国が本気出してきた?総務省の『アプリDe統計』が案外お気に入り - ゆめ見るディオスクロイ

    photo by labguest 必ず知らなくてはいけないものではないけれど、ちょっと気なるし知れば「ほほ~」となる知識。それが統計データです。とはいえ明確な目的もなく総務省や厚生労働省のサイトに行って統計データを眺めるというのもちょっとアレですよね。そんな現状を打破するべく、総務省がやってくれました! 総務省統計局と統計センターは、4月15日、統計のオープンデータ高度化への取り組みの一環として、Android搭載スマートフォン向けの統計情報提供アプリ「アプリDe統計」試行版の提供をGoogle Playで開始した。価格は無料。 総務省、統計を身近に感じられるAndroidスマートフォン向け情報提供アプリ「アプリDe統計」 このアプリには3つの機能があり ① 「City Stat」:今、自分がいる場所の市区町村の統計データをスマートフォンのGPSと統計API機能を連動させ表示 ② 「ポケ

    国が本気出してきた?総務省の『アプリDe統計』が案外お気に入り - ゆめ見るディオスクロイ
  • 分析のいろんな仮定と,それに対する頑健さ・対処法 | Sunny side up!

    統計分析にはいろんな「仮定」があります。例えば,t検定はデータが正規分布である必要がある,などなど。しかし,仮定を満たさないからといって,その方法が全く使えなくなるとは限りません。 そこで,よく使われる統計手法の仮定と,それらに対する頑健さ,つまりどれぐらい逸脱を許容できるのかについてまとめておきます。 また,仮定の逸脱に対して脆弱なものにたいして,どのような対処が可能かについても書いておきます。 ただ,この記事で書いているいくつかの基準は,ただの目安なので盲目的に信じないでください。僕は統計の専門家ではないので,「ああ,そんな感じなのね」的に受け取ってもらえればと思います。 二群の平均値の差の検定(t検定) いわゆるt検定の仮定は,3つあります。 ・母集団が正規分布に従っている(母集団の正規性の仮定) ・二群の分散が等しい(分散の均一性の仮定) ・サンプルが独立に抽出されている(サンプル

  • (後編)今回は因果関係があるのに相関関係が見られない4つのケースについてまとめてみた:中間変量の影響 - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。先日、某所で統計解析の講師役をしました。その際に解析環境の準備の手間を省こうと思って、Amazon EC2上にRStudioのサーバー版を立てて、聴講者にそこに繋いでもらって実習をしようとしたのですが、いざ皆が繋いだらサーバーがクラッシュしまくって実習が全く進みませんでした*1 。。。すみませんでした(泣)*2。。 さて。 良かれと思ったもので逆に墓穴を掘る、というのは人生ではよくあることですよね! 前回の「合流点の追加によるバイアス」はそんな例の一つでしたが、今回の「後編」ではそのようなもう一つの例として、「中間変量の追加によるマスク」のケースについて見ていきます。 因果関係があるのに相関が見られないケース(4):中間変量によってマスクされている はい。では、中間変量によって因果効果がマスクされてしまうケースを見ていきます。 ここで「中間変量」というのは、「A→Z」

    (後編)今回は因果関係があるのに相関関係が見られない4つのケースについてまとめてみた:中間変量の影響 - Take a Risk:林岳彦の研究メモ
  • 総務省|報道資料|統計におけるオープンデータの高度化

    総務省は、政府統計のポータルサイトであるe-Statなどで広く公開している政府統計データについて、より高度な利用を可能とする取組についてまとめました。 総務省統計局は、政府統計の中核的機関として、人口や事業所・企業、消費など国の基幹となる重要な統計を作成しております。データ提供の面においても、e-Statを通じ広く公開してきました。 (政府統計の総合窓口(e-Stat) http://www.e-stat.go.jp) 現在、政府全体でオープンデータへの取組を推進しているところですが、これらの取組をリードする総務省として、政府統計の情報提供のかたちを更に高度化すべく検討を行い、独立行政法人統計センターと協力し、トップランナーとして次のような取組を進めています。具体的には次の3つです。 (1)API機能による統計データの高度利用環境の構築 (2)統計GIS機能の強化 (3)オンデマンドによる

    総務省|報道資料|統計におけるオープンデータの高度化
  • 統計学入門−目次

    最終更新日:2022年08月24日 前口上へ 第1章へ webmaster@snap-tck.com Copyleft (C) 2000 SNAP(Sugimoto Norio Art Production)

  • 確率統計を学ぶにあたって 金谷健一 岡山大学工学部情報系学科

    確率統計を学ぶにあたって 金谷健一 岡山大学工学部情報系学科 1 確率統計は大学の一番難しい科目? 私の知っている人で(中には大学の理科系の先生もいる),確率統計は習ったがよく分からない という人が多い.私自身もそうであった.大学で確率統計を習ったが(私の場合は 3 年次であっ た),まったく分からなかった.期末試験のためにいろいろなを読んだが,どうしても理解でき ない.個々の例題の計算の仕方の説明を読めば,そのやり方は分かるし,導出も書いてあるので, そのようになるのだということに疑いは起きない.しかし,どうしても「分かった」という気に ならない.自分の頭で考えることができない.そのため覚えらないのである. 大学に入ると難しい科目をいろいろ学ぶ.特に 1 年次の解析学(微分積分学)と線形代数学(ベ クトルと行列)を学んだときは,あまりに抽象的な記述に愕然とした記憶がある.しかし,その

  • 1