タグ

統計に関するMiki-Teaのブックマーク (43)

  • 有力大学合格者のジニ係数

    ジニ係数とは,富の格差の度合いを測る代表指標ですが,用途はそれに限られません。さまざまな現象の偏りの程度を可視化するのに使うことができます。 今回は,有力大学への合格者数が高校間でどれほど偏っているかを,この指標を用いて明らかにしてみようと思います。ジニ係数の応用例の提示です。 サンデー毎日特別増刊号『完全版・高校の実力』(2010年6月12日)から,全国の4,999高校について,2010年春の主要大学の合格者数を知ることができます。以下のような形で数値が示されています。 私は,東京都内の437高校の有力大学合格者数を調査しました。ここでいう有力大学とは,東大,京大,東工大,一橋大,お茶の水女子大,東京外大,早稲田大,慶応大,国際基督教大,上智大,そしてMARCHの5大学を合わせた15大学です。 437高校のうち113校(25.9%)は,これらの大学への合格者を1人も出していません。合格者

    有力大学合格者のジニ係数
  • 「毎日の数字を追いかけ、毎日改善する」ことの意外な落とし穴 - 渋谷駅前で働くデータサイエンティストのブログ

    (※今回の記事の内容はかなり難解かもです) 大竹文雄の経済脳を鍛える(2月13日分記事) 幾何ブラウン運動と見せかけの回帰 - My Life as a Mock Quant 得てして多くの企業では、「毎日の数字(売上高・利益・在庫etc.)を追いかけ」、「その結果を元手に毎日改善する」ということを日々励行しているのではないかと思います。 ところで、こんな体験したことはありませんか? 「毎日毎日、物凄く一生懸命数字を見ながら頑張ってカイゼンし続けて、確かに頑張った時は数字は上がったし、頑張りが足りない時は数字が下がった。それに一喜一憂しつつもずっと物凄く頑張り続けた・・・でも、あれからもう数ヶ月経ったのに全体としては数字は下がってきている。どうしてなんだろう???」 なるほど、もしかしたらその時の改善努力が正しくなかったのかもしれません。でも、実は「そもそも改善努力と数字とは何の関係もなか

    「毎日の数字を追いかけ、毎日改善する」ことの意外な落とし穴 - 渋谷駅前で働くデータサイエンティストのブログ
  • WEBで読める統計関係の良質な資料 - Interdisciplinary

    私がよく参考にする所を三箇所紹介します。いずれも、説明が極めて明瞭で、論理的な整合性や用語の丁寧な使い方を志向している所に好感が持てるサイトです。 ▼Econom01 Web Site, Sophia University, Tokyo, Japan 上智大学の大西博氏のサイト。私が統計関連で最もよく参照する所です。説明の仕方の明瞭さや、具体例を用いた解説がとても良いと思います。確率統計の一つ一つの概念について、大変丁寧に説明されています。たとえば、「相関(および因果関係)」については、 2つの変数の同時分布と、その条件付き分布は、変数の間の数量的結び付きを示しています。この数量的結び付きは、統計的頻度分布として観察されるものであり、現象の背後にある実態的な「関係」や「構造」から導かれる法則性を必要としません。 例えば、人間の身長と体重とは密接な統計的分布関係を持っていますが、両変数を決定

    WEBで読める統計関係の良質な資料 - Interdisciplinary
  • 「もし60歳以上が投票できないとしたら」という思考実験 - 木走日記

    謹賀新年、年もよろしくお願いいたします。 さて、2012年はどのような年になるのでしょうか。 今日はお正月でもありますので、実現性は無視してある思考実験をしてみたいと思います。 実験のきっかけはお二人の著名な先生の発言がきっかけです。 ひとつは昨年12月14日にブログ「S氏の相場観」でS氏が最近の政治のひどさを嘆かれてこのようなことを発言されていました、失礼して該当箇所を抜粋してご紹介。 (前略) どう考えてもあり得ない判断であるはずなのですが、これもまた一枚岩ではない寄せ集め集団の民主党ならではの結果でしょう。日々こうしたあり得ない話を目にする度、どうしてこんな政党に政治を託してしまったのかと、反省しきりなのですが、あの当時は当に自民党が酷かったですし、仕方が無いとも言うしか無いでしょう。 ただ、今なら自民党に任せられるかと言えば、決してそうではありませんが、一体何をどうすればこの悲

    「もし60歳以上が投票できないとしたら」という思考実験 - 木走日記
  • asahi.com(朝日新聞社):日本人の人口1億2535万人、減少に転じる 国勢調査 - 社会

    印刷  2010年10月1日現在の国勢調査の確定結果で、日人の人口は1億2535万8854人になり、前回調査(05年)から初めて減少に転じた。前回より37万1294人(0.3%)減った。総務省が26日に発表した。  外国人を加えた総人口は1億2805万7352人で、前回調査から0.2%にあたる28万9358人増えた。

  • SYNODOS JOURNAL : 都道府県議選・参院選挙区の定数不均衡について考える 菅原琢

    2010/11/247:0 都道府県議選・参院選挙区の定数不均衡について考える 菅原琢 ◇統一地方選挙の前哨戦、茨城県議選◇ 都道府県議会の議員選挙は、東京都、茨城県、沖縄県を除き、4年に一度の統一地方選挙の際に行われている。統一されていない3都県のうちのひとつ、茨城県議選は今年12月に行われることになっており、来年4月に行われる統一地方選挙の前哨選挙として注目されている。 ◇茨城県議選の有権者数と選挙区定数◇ 12月に行われる予定の選挙での茨城県議会の議員定数は65人である。同選挙では、この定数を36の選挙区に分けて選出することになっている。 茨城県選挙管理委員会が2010年9月2日に選挙人名簿登録者数を発表したので、これをもとに各選挙区の有権者数を集計し、次項で説明するいくつかの方法で定数を配分し直したのが次の表である。なお、筆者のブログにも同様の表をアップしたので、データを使いたい場

  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

  • 学力テストとの相関 まとめ - kei999の日記

    全国学力テストの都道府県別平均点数と相関するものをまとめます。 正の相関 持ち家率 可処分所得* 中学教員の校務用コンピュータ整備率* 自民党得票率 負の相関 給費未納率 失業率 公明党得票率 相関なし 日教組候補得票率 民主党得票率 可処分所得はオタンチーさんのブログより http://ottanti.at.webry.info/200810/article_13.html 中学教員の校務用コンピュータ整備率は奥村先生のブログより http://oku.edu.mie-u.ac.jp/~okumura/blog/node/2284#comments 相関係数とp値の計算はすべてエクセルの「データ分析―回帰分析」を使いました。 Kendallの順位相関とか私には無理です。 持ち家率との散布図。 なかなかビューティホーだと思う

    学力テストとの相関 まとめ - kei999の日記
  • In memory of TweetStats

    In January of 2008, a young script kiddie learned Ruby on Rails and launched tweetstats.com - the first Twitter analytics site. The Twitter API didn’t even exist yet, and the first version simply scraped the website until Twitter eventually made a public API available. I’ve built hundreds of apps on that API. And as of February 13, it’s being shut down. Twitter has literally changed my life, but n

  • 図録▽所得再分配調査による所得格差、及び再分配による格差改善度の推移

    厚生労働省は3年ごとに所得再配分調査を行っている(最新はコロナの影響で4年間隔)。調査の眼目は、各世帯の稼ぎ(当初所得)と実際の収入(再配分所得)とがどのように、どのぐらい違うかである。高齢者の当初所得は退職に伴って減少するが、税金が減り、年金等で所得は補われるため、再配分所得はそれほど減らない。 最初の図には、当初所得と再配分所得のそれぞれについて、格差を示す指標であるジニ係数の推移を掲げた。所得格差の議論で、当初所得の所得格差の拡大だけが取り出され、格差が大きく拡大していると指摘されることもあるが、高齢化に伴って当初所得が大きく減少する者が増加しているのであるから、当然ともいえる動きである。むしろ当の所得格差は再配分所得の方である。 再分配所得も当初所得ほどではないが上昇傾向にはある。高齢世帯は年金受給を加えてもなお就業世帯に比べて所得が少なくなると考えられるので、こちらもそう著しい

  • 3年連続の上昇で少子化傾向は反転したのか?:日経ビジネスオンライン

    長期的な日の経済・社会を考える時、もっとも重要なのが人口問題です。日の人口は今後、(1)人口が減少し、(2)子供の数が減り(少子化)、(3)高齢者の比率が高まる(高齢化)という3つの変化が続くことになります。この3つの変化の根原因は少子化です。子供の数が減っていけば、相対的に高齢者の比率が高まり、やがては人口が減ることになるからです。 その少子化の動向を見る上での代表的な指標が合計特殊出生率です。これは、1人の女性が一生の間に平均何人の子供を産むかという数字です。簡単に言えば、合計特殊出生率が2以上であれば人口は減りません(厳密には2.07人ですが)。日の合計特殊出生率は、終戦直後のベビーブーム期には4.5前後だったのですが、その後は下がり続け、1975年以降は継続的に2を下回るようになり、その後もさらに下がり続けて、2005年には1.25まで低下してしまいました。 ところが、この

    3年連続の上昇で少子化傾向は反転したのか?:日経ビジネスオンライン
  • 統計処理ソフト R 入門 講習会資料

    講習会の目的 講習会は, R についての自習の基盤をつくることを目指します。 たとえ初心者向けの数時間の入門講習でなく1年間の毎週の演習授業であっても,R に関してすべてを説明するのは不可能だと思われます。 R の世界は,縦にはそこそこ深く,横には果てが見えないほど広いです。 CRAN に登録されている R のパッケージは 1000 を超えました。 よって,受講者の幅も広いことですし,受講者各自にとってぴったりな統計解析の実用的な解説をするのはあきらめて, 各自が必要に応じて情報を探し,見つけたものを難なく活用できるようになること,を目標にしました。 ここに自分の求めている分析手法や作図法などの答えがあるとは期待しないで下さい。それは帰ってからのあなたの楽しい仕事です。 R の利用と R 言語 R の根幹は R 言語のインタプリタであり,ユーザはR言語を駆使することでRを操作します。 S

  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

  • EXCELを使った多変量解析

    人気再燃!ポケモンGOをより楽しむウェアラブルデバイス4選 街中で『ポケモンGO』を遊ぶにしても、スマートフォンを出したりしまったりしながら歩くのはなかなか難し…

    EXCELを使った多変量解析
  • リサーチソリューション:主成分分析 - Yahoo!リサーチのヤフー・バリューインサイト

    合成変数ができるだけ多くの情報量を持つようにするため、データの散らばり具合(分散)に着目します。分散=情報量といえるからです。 平面で示すためにデータが2次元(2変量)の場合で考えてみましょう。 下図のようなデータがあった時、データの分散が最も大きくなる方向に軸をとり、これを第1主成分とします。第1主成分だけでは元のデータが持っていた情報をすべて表すことは不可能です。そこで、次に分散が大きくなる方向に軸を取り、これを第2主成分とします。第2主成分の軸は第1主成分の軸に直交します。第1主成分に関する2変量の重みは、それぞれcosθ,sinθとなり、第2主成分に関しては、-sinθ ,cosθとなります。

  • 企業収益と勤労者所得の乖離

  • 貯蓄動向調査報告 - Google 検索

    総務省統計局では、報告書として毎年「家計調査年報(貯蓄・負債編)」を刊行しており、その内容をインターネットでも掲載しております。 「家計調査年報(貯蓄・負債編) ...

  • 過去20年、労働市場で起ったこと(まとめ) - Chikirinの日記

    二日前に書いた話、あの日には“脳みそ切れ”で書けなかったことを補足的にまとめておきます。早めに書いとかないと忘れてしまうからね。とどのつまり「過去20年間にこの国の労働市場でいったい何が起こったのか。」 まずはデータをもう一度見てみましょ。 35歳未満:人口78万人増、正社員が239万人減、非正規雇用が373万人増 35〜54歳:人口267万人減、正社員が35万人減、非正規雇用が273万人増 55歳以上:人口383万人増、正社員が254万人増、非正規雇用が394万人増。 皆が最も注目するのが、唯一正社員の絶対数が増えた55歳以上層でしょう。当時35歳〜だったこの世代は、経済大国になった日で正社員雇用され、すべての人生を会社に捧げてきた人達です。いわゆる団塊世代を含み、労組の組織票の中心世代でもあります。 この層の雇用を守るということが、過去10年以上にわたって経済後退に苦しんだ日の最大

    過去20年、労働市場で起ったこと(まとめ) - Chikirinの日記
  • 統計学の面白さはどこにあるか - hiroyukikojimaの日記

    先日、とあるパーティで、統計学者の松原望先生と会った。 松原望先生は、早期からベイズ統計学の重要性を世にアピールしてきた先駆者である。ぼくは、経済学部の大学院在学時に、選択科目ではあったが、松原望先生の「ベイズ統計学」という講義を受け、そこでベイズ理論の指南をしていただいた。ぼくは『確率的発想法』NHKブックスや『使える!確率的思考』ちくま新書の中で、ベイズ理論を紹介していて、それが多くの読者にウケて、この二冊はセールス的にも良い実績を出しているのだけど、正直言ってここに書いてあることの多くは、松原望先生の講義の受け売りである。そういう意味では、下品ないいかたになるが、大学院の数ある講義の中で最も「金に換えることのできた」講義が先生の講義だった、ということになる。 そのときは、放送大学の教材であった『統計的決定』というを教科書に使った。これがめちゃくちゃいいで、今でもベイズ統計学に関し

    統計学の面白さはどこにあるか - hiroyukikojimaの日記
  • 内閣府が「ネット調査と訪問調査でどんな差が出るか?」を詳細に報告していた | Web担当者Forum

    少し古い記事になるが、内閣府が以下のようなコンテンツを公開していた。 → インターネットによる国民生活に関する意識調査 ~ 世論調査との比較分析 ~ http://www8.cao.go.jp/survey/sonota/h19-internet/index.html わかりやすくいうと、「ネットリサーチを使った調査と、調査員による個別面接聴取による調査とで、どんな違うが出るか調べてみた」というものだ。 2007年7月調査のものなので、2008年版が出たら記事として取りあげようかと思っていたのだが、編集部コラムのネタが切れてきたので出してしまおうと思う。 同じ設問でネットリサーチと訪問調査をそれぞれ行っているのだが、まず、それぞれの調査の共通点と相違点をまとめてみよう。 2つの調査に共通すること・調査項目 現在の生活について(生活の向上感、満足度等)今後の生活について(生活の見通し、力点等

    内閣府が「ネット調査と訪問調査でどんな差が出るか?」を詳細に報告していた | Web担当者Forum