タグ

statisticsに関するyocchi_gogoのブックマーク (23)

  • 『年収は「住むところ」で決まる』 プログラマーが多い街にはヨガ教室が多い - HONZ

    中国から“ものづくり”を取り戻せ。こんなスローガンが聞かれるのは、かつてのものづくり大国・日だけではない。リーバイスのようなアメリカン・スピリッツを象徴する企業までもが製造拠点の全てを海外に移し、失業率が高止まりするアメリカでも“製造業保護活動家”たちが製造業の復権を強く訴えているようだ。しかし、カリフォルニア大学バークレー校教授で経済学者の著者エンリコ・モレッティは、彼らの主張は多くの誤りに基づいていると指摘する。 そもそも、アメリカの製造業は長年のあいだ拡大を続けており、2009年時点の生産高は中国とほぼ同じである(日の約2倍)。1970年代からの生産高増加と反比例して製造業関連従事者が減少したのは、生産性が飛躍的に向上したから。ジェネラル・モーターズ従業員1人当たり年間生産台数は、1950年代に約7台だったものが、現在では約28台にまで増えているという。この生産性の向上は、エンジ

    『年収は「住むところ」で決まる』 プログラマーが多い街にはヨガ教室が多い - HONZ
    yocchi_gogo
    yocchi_gogo 2014/05/12
    タイトルに釣られたけど、中身は真っ当そうだ。
  • 「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE

    ほんのわずかな初期の要因の変化が最終的に思いがけないほど差のある結果を招く現象を「バタフライ効果」と呼びますが、そんな現象は身近なところでも起こっているのかもしれないと思わせるような、一見すると関係のない2つのデータに相関性を見いだすプロジェクトが「Spurious Correlations」です。 Spurious Correlations http://www.tylervigen.com/ 1999年~2009年までの「アメリカの科学・宇宙・テクノロジーに関する支出」と「首つり自殺数」の上昇傾向が一致。 「水泳プールでの溺死数」と「ニコラス・ケイジの映画出演数」が、なぜか似たような傾向で上下しています。つまり、ニコラス・ケイジが映画に出演しなければプールでの事故が激減するのかもしれません。 「アメリカ人1人あたりのチーズ消費量」と「ベッドシーツに絡まって死亡する数」がほぼ一致。 「ア

    「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE
    yocchi_gogo
    yocchi_gogo 2014/05/12
    これはいい教材。ただ自分がふだんみているデータとその解釈への不安も募るな…
  • "相関"の話&そのついでに"21世紀の相関(MIC)"の話(ややマニア向け) - Take a Risk:林岳彦の研究メモ

    どもです。林岳彦です。息子の3DSにバーチャルコンソールの「ソロモンの鍵」を密かに入れました(まだ3面)。 さて。 前回の記事: 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ につきましては沢山ブクマ等をいただき大変ありがとうございました*1。大変感謝しております。 さて。上記記事について、ublftboさんから「相関関係の定義が書かれていないのでは」(相関と因果 - Interdisciplinary)とのご指摘をいただいたきました。 ご指摘は確かにごもっともですので、今回は「相関」概念についてと、そのついでに近年に開発された"21世紀の相関(MIC)"の話について私なりに書いてみたいと思います。 (以下、ややマニア向けの話になるかもしれません。あと前回ほどではないですが、それなりに長いです。)

    "相関"の話&そのついでに"21世紀の相関(MIC)"の話(ややマニア向け) - Take a Risk:林岳彦の研究メモ
    yocchi_gogo
    yocchi_gogo 2013/04/28
    なるほど。ピアソンの相関係数では表現できなかった痒い所に手が届く感じ。
  • 究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.

    ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推

    究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.
  • 最良の予言者は過去なり-1928年に80年先、2008年のアメリカのGDPを予測する - 柿の種中毒のStatistics入門

    株の名言には『最良の予言者は過去なり』という言葉があるそうだ。予測の基的なテクニックは過去のトレンドを読み(回帰分析)、その延長線上に未来予想図を描くことである。ただしこの作業は外挿なので、当然のごとく『過去になかった歴史的転換』によって過去のトレンドから外れていく可能性ももちろん否定できない。 過去にも『今までとは違う、全てを根的に変えるイノベーション』という売り文句の新テクノロジーはたくさんあった。それらをマクロな視点から見ると当に歴史を塗り替え、経済成長を桁違いに押し上げる事例は存在したのだろうか。大恐慌や戦争といった大きな出来事の前後で経済成長にはどのような影響があるのか。この疑問に対して、過去140年間のアメリカ合衆国のGDPはどのように推移してきたのかを調べた面白い話を聞いた。INSEADのイリアン・ミホフ教授の研究である。結論から言うと、 世界で最も先進的な国においては

    最良の予言者は過去なり-1928年に80年先、2008年のアメリカのGDPを予測する - 柿の種中毒のStatistics入門
  • 夏目漱石の坊っちゃんのように、間違った事が大嫌いで義憤に駆られ、損ばかりする行動様式に脳内セロトニンが関与 | 放射線医学総合研究所

    トップページお知らせ・ご案内プレスリリース夏目漱石の坊っちゃんのように、間違った事が大嫌いで義憤に駆られ、損ばかりする行動様式に脳内セロトニンが関与 2012年2月22日 独立行政法人放射線医学総合研究所 国立大学法人京都大学 研究成果のポイント 脳内分子の画像技術と経済ゲームから、不公平に直面した時の反応の個人差を計測 従来は衝動的、敵意の強い性格の人が取引を台無しにしやすいと信じられてきたが、実際には正直で他人を信頼しやすい平和的な性格ほど、不公平に対して実直に義憤に駆られ、取引を台無しにしてまで、拒否行動(報復行動)に出やすい 中脳のセロトニントランスポーターの密度が低い人ほど不公平に対して実直に義憤に駆られ、個人的には得にならない行動に出やすい 経済的・社会的意思決定における個人差の脳科学的理解を深め、意思決定障害を有する精神・神経疾患への診断や治療へ貢献 独立行政法人放射線

    yocchi_gogo
    yocchi_gogo 2012/02/29
    タイトルは面白い。でもこの散布図のデータは随分ばらついているけれど本当に有意なの??
  • 決定係数とは,重相関係数,自由度調整済決定係数

    ■決定係数とは? (このページは解説が中心のページで,重回帰分析に登場する決定係数の説明を行っています.) ◇要点◇ 回帰分析を行うと,実測値を近似する回帰式(予測値)が得られるが,得られた回帰式が常によく当てはまっているとは限らない. 右図1(赤で示した点が実測値,青で示した式が回帰式)では,回帰式が実測値によく当てはまっているが,右図2では,回帰式と実測値の隔たりが大きく,回帰式の当てはまりはよくない.このような回帰式の当てはまり具合(回帰分析の精度)を客観的な指標で表わすことを考える. (1) Excelのツールで回帰分析を行うと,次のような表が出力される.この表の見方を以下において解説する.

  • たばこ増税と価格弾力性

    たばこ税に関する最近の議論 景気はやや明るさを増してきた昨今であるが、依然として厳しい財政状況を背景にたばこ増税に関する議論が最近浮上してきている。 これまでもたびたびたばこに関する税は増税されてきており、特に平成10年から導入されたたばこ特別税では一見何も関係がない国債整理基金特別会計に税収が組み入れられていることもあり、「とりやすいところからとっているだけではないか」と愛煙家はうんざりであろう。 一方、増税論者は「今でも日は他の国に比べてたばこは安い」「増税で喫煙による健康被害を防止すれば医療費の抑制も可能」と主張している。 確かに2002年5月時点で英国やアイルランドでは日のたばこ価格の2倍以上となっており、円に換算すると英国は800円、アイルランドや米国、オーストラリア、市がポール、香港等では500円以上となっている。 ノルウェー、カナダ、オーストラリアなど、価格上昇政策をとり

  • 確率と因果を革命的に架橋する:Judea Pearlのdo演算子 - Take a Risk:林岳彦の研究メモ

    皆さまこんばんは。今回から数回のあいだは、久しぶりに統計的因果推論ネタについて書いていきたいと思います。 今回の具体的なテーマは「Judea Pearlのdo演算子」になります。マニアックです。 このテーマについては自分でも完全に理解しているわけでは全くないので、「解説」というよりも「半可通が書いた公開勉強メモ」というかんじになりますが、その旨ご了承いただければ幸いです。 (*例によって今回もまためちゃくちゃ長いエントリーとなりますが、何卒よろしくお願いいたします。また、間違いなどがありましたらその旨ご指摘いただければ大変幸甚でございます>物の識者の方々) まえおき:Judea Pearlって誰すか? はい。ではそもそもその「Judea Pearlって誰すか?」というところから書いていきたいと思います。 結論から言うと私もよく知りません。ですが、周辺的手がかりからヒューリスティックに判断

    確率と因果を革命的に架橋する:Judea Pearlのdo演算子 - Take a Risk:林岳彦の研究メモ
    yocchi_gogo
    yocchi_gogo 2012/02/23
    これは面白い。と同時に自分の仕事にヒヤリ。ビジネスでの統計の活用法はもっぱら介入を伴う予測だけれど、それを考慮してなかった。
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
  • VOSE | Quantitative Risk Analysis & Risk Management Software

    Quantitative risk analysis software Vose Software designs, develops, sells and supports a range of quantitative risk analysis software. Our mission is to provide quantitative risk analysis software that are: A pleasure to use We put great emphasis on contextual help file links, tool tips, well-described input interfaces, and error captures that make our products stable and easy to use. Unmatched i

    VOSE | Quantitative Risk Analysis & Risk Management Software
    yocchi_gogo
    yocchi_gogo 2012/01/02
    リスクモデリングの豊富な実例と確率密度関数の適用例など役立つ。
  • 経済統計 - 鹿野研究室

    経済統計(2008年度版) 2004、2006、2008年度担当。 シラバスなど シラバス 講義ノート#01~#13の訂正箇所 講義ノート#14~#24の訂正箇所 講義ノートと補遺:前半 (04/09、水) 01. イントロダクション (04/14、月) 02. 一次元データの記述統計 (04/16、水) 03. 二次元データの記述統計 ... 補遺03 (04/21、月) 04. 確率論:事象と確率 (04/23、水) 05. 確率論:確率の演算 (04/28、月) 06. 確率変数と確率分布 (04/30、水) 07. 確率変数の期待値と分散 (05/07、水) 08. モーメント(積率)と重要な不等式 (05/12、月) 09. 代表的な離散型確率分布 ... 補遺09 (05/14、水) 10. 代表的な連続型確率分布 ... 補遺10 (05/19、月) 11. 正規分布 (05

  • 確率分布 Navi - NtRand

    確率分布 Navi 星の数ほどある確率分布から、あなたの目的にピッタリの分布がきっと見つかる! (データの特徴から最適な分布を見つける⇒確率分布の世界) が付いている分布は NtRand3 に乱数生成関数を始めとした関連関数が用意されています。その他の分布も、NtRand3 の関数を使って乱数を生成する方法を解説しています。

    yocchi_gogo
    yocchi_gogo 2012/01/02
    確率分布の実例・用途についてのサマリー
  • techdmba - 確率変数-種々の分布の特徴

    確率変数に関する理解は、ビジネスにおいて重要である。特に、統計学は、経済学の理解を助け、ビジネスでは研究開発や品質管理はもちろんのこと、マーケティングにおいても必須である。数学的な概念がなければ、「あるパフォーマンスが5%向上した」ことが、偶然なのか、有意なのかで、その後の行動様式が大きく変わる。結局、最後の決め手になるのは、”数字”なのである。 ページでは、分布の特徴とともに、下に参考書籍を記載している(ページの記載はページ下の書籍を参考している)。 *図の形状はイメージです。 ページでの記載内容-正規分布、一様分布、三角分布、二項分布、ポアソン分布、幾何分布、超幾何分布、対数正規分布、指数分布、ワイブル分布、ベータ分布など。ページ下に参考書籍。 正規分布) 身長、体重などの自然現象を示すもので、確率理論の中では最も重要な連続分布。平均値以上と以下の値をとる確率は同じで、平均値に近

    yocchi_gogo
    yocchi_gogo 2012/01/02
    確率分布とその適用例について
  • JIN'S PAGE

    R、R言語、R環境・・・・・・ Rのダウンロードとインストール リンク集 題名 Chap_01 データ解析・マイニングとR言語 Chap_02 Rでのデータの入出力 Chap_03 Rでのデータの編集と演算 Chap_04 Rと基統計量 Chap_05 Rでの関数オブジェクト Chap_06 Rでのデータの視覚化(1) Chap_07 Rでのデータの視覚化(2) Chap_08 Rでのデータの視覚化(3) Chap_09 GGobiとデータの視覚化(Rgobi) Chap_10 Rと確率分布 Chap_11 Rと推定 Chap_12 Rと検定 Chap_13 Rと分散分析 Chap_14 Rと回帰分析 Chap_15 Rと重回帰分析 Chap_16 Rと一般化線形モデル Chap_17 Rと非線形モデル Chap_18 Rと判別分析 Chap_19 Rと樹木モデル Chap_20 WEK

  • Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~

    Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。 ・姫路市役所での事例 これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。 ※まだ不完全ですが情報を入手し次第アップデートしていきます。 1. 資料を探す場所 CRAN R体、パッケージ、PDF資料などの置き場 Task Viewに分野ごとのまとめ Searchでパッケージや資料の検索 CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw) Rjpwiki 日語で書かれている、これまでのRに関する資料の集大成 データの加工技、

    Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~
  • Weka 3 - Data Mining with Open Source Machine Learning Software in Java

    Weka is a collection of machine learning algorithms for data mining tasks. It contains tools for data preparation, classification, regression, clustering, association rules mining, and visualization. Found only on the islands of New Zealand, the Weka is a flightless bird with an inquisitive nature. The name is pronounced like this, and the bird sounds like this. Weka is open source software issued

  • モデルの精度を推定する

    モデルの精度を推定する
    yocchi_gogo
    yocchi_gogo 2011/11/27
    決定木による分類モデルの精度推定。交差検証法の説明もとてもわかりやすい。
  • バイオ・データ・マイニング/Rの基本 - とうごろうぃき