タグ

統計に関するmako_toのブックマーク (17)

  • 統計学を勉強するときに知っておきたい7つのポイント

    マイクロソフト社が技術分野でもっと熱い専攻の一つとして分析/統計をあげている(Microsoft JobsBlog)。同社以外でも統計学は、今後最も有益なスキルの一つだと考えているようだ(NYT - For Today’s Graduate, Just One Word: Statistics)。しかし、データマイニングの話も一般化しつつあって学習ノウハウなども公開されているが、経験にあわない部分が多い。統計学を初めて勉強するときに知っておいた方が良い7つのポイントをあげてみた。 1. 学習機会やテキストは山のようにあるので利用する 確率・統計の日語テキストは山のようにあり、大学のコースワークを振り返っても、理文問わずにほとんどの学部で確率・統計はあったはずだ。大学院のコースワークでは英語の文献を好む傾向があるが、上級テキストでも日語のものも少なくない。また「マンガでわかる統計学」のよ

    統計学を勉強するときに知っておきたい7つのポイント
  • はてなブログ | 無料ブログを作成しよう

    広島に行った話 生まれて初めて、ひとりで遠出をした。行ったのは広島だった。 「#Barbenheimer」(読み:バーベンハイマー)を覚えているだろうか。原子爆弾の父・オッペンハイマーを描いた映画『オッペンハイマー』と、実写映画『バービー』がアメリカで同日公開され、映画ファンたち…

    はてなブログ | 無料ブログを作成しよう
  • 統計メーカーのひとりごと

    コメントいただきありがとうございました。 ありがとうございます!連鎖指数と固定指数との比較でイメージがかなりはっきりと掴めました。と同時に、CPIの上方バイアスを考慮する時には常に基準年を考える繊細な注意が必要なことも分かりました。 生活扶助cpiも、2010年基準で2008-2010の伸びを計算すると、2008年の指数を実態より高く算出してしまっているので、実際より物価下落を大きく見てしまうという問題が確かにありますね(かといって2005年基準が正しいわけでもないので難しい)。東洋経済の記事では、厚労省はこれをパーシェと説明したそうですが。 私も今になって、ご指摘の東洋経済の記事を拝見しました。コメントでいただきましたとおり、この記事では「ラスパイレス方式とパーシェ方式の混合」と書いてありますが、その点は誤りのように思えます。実際には「2010年基準のラスパイレス方式」で統一しただけのよ

    統計メーカーのひとりごと
  • econdays.net - econdays リソースおよび情報

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • オバマ政権の景気刺激策は百万の民間の雇用を破壊した・続き - himaginary’s diary

    昨日取り上げた論文についにクルーグマンも反応した。そこで彼は、(昨日紹介した)ノアピニオン氏のブログエントリに加え、ディーン・ベーカーのブログエントリにリンクしている。そちらのエントリでベーカーは、かなり突っ込んだ論文批判を展開しているので、以下に簡単に紹介してみる。 論文では4つの民間産業をまとめて分析しているが、なぜその4業種をまとめて分析対象にしたのか説明が無い。彼らの表からすると、民間全部門を対象にしたら統計的に有意な結果が出ないことは明らかである。また、4業種をまとめて分析した場合でも、辛うじて有意であるに過ぎない。こうしたことからは、彼らは実際には多くの回帰を実施し、その4業種をまとめれば望む結果が得られることを発見したのではないか、という疑念が湧く。 操作変数も奇妙。まったく意味が無い変数では無いものの、同様に尤もらしい他の変数を使った場合の結果に興味が持たれる。感応度分析も

    オバマ政権の景気刺激策は百万の民間の雇用を破壊した・続き - himaginary’s diary
  • サイトのデザインは54%が「好みで決定」、27%が最後に上司にひっくり返され、90%は消費者の意見を参考にせず/デザイン決定プロセス調査 | Web担当者必見! リサーチ データ&市場調査レポート

    参考意見としてターゲット消費者の意見を取り入れているのは10%に過ぎず、90%が消費者の意見を聞かずにデザインを決定している。 デザイン決定のポイントは、「発注側の経営者・上司・担当者の好み」が54%。「サイト制作のゴールを達成できそうだから」(20.7%)の倍以上の割合で「好み」を優先。 27.3%が「発注側の経営者や上司の独断的な意向で最終決定の直前にデザインがひっくり返った」ことで困った経験がある。 これは、デザイン決定のプロセスをビジネス目的に対して最適化するための消費者評価(アンケート)ソリューション「CREATIVE SURVEY」を提供する株式会社フォーデジットとWeb担当者Forumは、共同で行った、「Webサイトのデザイン決定プロセスに関する調査」の結果のハイライトだ。 この調査は、企業サイトの制作において、デザイン決定がどのように行われているのかを調べることで、ビジネス

    サイトのデザインは54%が「好みで決定」、27%が最後に上司にひっくり返され、90%は消費者の意見を参考にせず/デザイン決定プロセス調査 | Web担当者必見! リサーチ データ&市場調査レポート
  • 中国国家統計局が不動産価格指数を取りやめると発表 : Market Hack

    中国国家統計局が不動産価格に関する指数を今後発表しないことを明らかにしました。 この不動産価格指数は以前からそのデータの信ぴょう性に関して疑問が挟まれていました。 中国の経済統計に世界の投資家が低い信頼性しか置いていないひとつの理由はその算出根拠や改訂の過程が極めて不透明な点にあります。 データが発表されているうちは「こんなのアテにならない」と批判が絶えませんでしたが、いざ「やめます」と言われるとそれはそれで困るというのが投資家の身勝手な感想といったところでしょうか?

    中国国家統計局が不動産価格指数を取りやめると発表 : Market Hack
  • 経済指標が予想から大きくハズレたときは慌てるな 米国失業率と非農業部門雇用者数のまとめ : Market Hack

    1月の雇用統計が発表されました。 非農業部門雇用者数: 予想14.6万人 実績3.6万人 民間部門雇用者数: 予想14.5万人 実績5万人 失業率:予想9.5% 実績9% つまり非農業部門雇用者数と民間部門雇用者数の数字は落胆すべき数字、失業率は予想より遥かに良い数字だったわけです。 1. 悪天候要因 2. 過去の数字の改訂 です。 まず米国東部を中心とする厳しい冬の影響で建設業、倉庫業、運輸業などが影響を受けました。特に1月第2週は大きく影響を受けました。 次に非農業部門雇用者数のベンチマークの改訂が行われ、過去に遡って数字が訂正されました。どう変わったかについては下のグラフを見て下さい。 以前から説明していることですが、米国のマーケットは経済統計が事前予想より余りに大きくはずれた場合、「チョッと待て、これは何か特殊要因が働いているのではないか?」と自制心を働かせて、逆に相場が動かないケ

    経済指標が予想から大きくハズレたときは慌てるな 米国失業率と非農業部門雇用者数のまとめ : Market Hack
  • asahi.com(朝日新聞社):7勝7敗なら千秋楽の勝率75% 八百長、統計で証明? - スポーツ

    角界を揺るがす八百長疑惑。日相撲協会の放駒理事長は2日の会見で「過去には一切なかった」と述べたが、11年間の星取表を調べ上げ、八百長の存在を統計的に示した2002年の学術論文が改めて注目を集めている。  米シカゴ大のスティーブン・レビット教授(経済学)らは1989年から2000年までの十両以上の取組3万2千回以上を調べた。7勝7敗で迎えた力士の千秋楽での勝率は75%にもなった。  勝ち越しをかけた一番で勝率が上がるのは八百長ではなく、力士が必死になるからという説明もあり得るが、同じ相手と次の場所以降で対戦したときの勝率は4割程度に下がっていた。  教授らは、わざと負けることで借りを返したと分析。ただ、統計的には返し切れたとは言えず、残る分は金銭で埋めたのでは、とした。  勝ち星の数が番付に与えた影響を調べると、8勝した力士は平均約7枚昇格、7勝だと約4枚降格、差は11枚分だったが、9、1

  • 統計と数学の違い - himaginary’s diary

    Mostly Economicsがアンドリュー・ゲルマンのインタビューを紹介していた(なぜかソースが記述されていなかったが、ぐぐってみるとゲルマンが統計に関する推薦図書を5つ挙げたThe Browserというサイトだった)。 その中の統計と数学の違いに触れた部分が面白かったので、以下に紹介してみる。 Statistics is what people think math is. Statistics is about patterns and that’s what people think math is about. The difference is that in math, you have to get very complicated before you get to interesting patterns. The math that we can all easil

    統計と数学の違い - himaginary’s diary
  • 日本の神話 - himaginary’s diary

    Centre for European Policy StudiesのDaniel Gros*1が「日の神話(The Japan Myth)」と題したProject Syndicateコラムを書いている(Economist's View経由)。 そこで彼は21世紀の最初の10年を振り返り、言われているほど日経済は悪くなかった、として以下の数字を挙げている。 過去10年の年率成長率は米国1.7%に対し日は0.6%に留まった。しかし、ドイツも日と同じ0.6%だったし、イタリアはもっと悪く、0.2%だった。ヨーロッパの主要国では、フランスとスペインのみ上回った。 また、先進国同士を比較する場合は、GDP全体の成長率ではなく、一人当たりGDPの成長率でもなく、生産年齢人口当たりのGDP成長率を使うのが良い。潜在生産力を表わすのは生産年齢人口だからである。その指標で見た場合、過去10年間の日

    日本の神話 - himaginary’s diary
  • 厚生労働省:平成22年(2010)人口動態統計の年間推計

    注: 1)平成22年(A)及び差(A)-(B)は、1,000人(組)単位でまとめてある。 2)出生・死亡・自然増減・婚姻・離婚率は人口千対、死産率は出産(出生+死産)千対である。 率算出に用いた人口は、平成22年10月1日現在推計日人人口 125,766,000 人(試算値)である。 (総務省統計局推計の同日現在総人口(概算値)から、人口動態・保健統計課で試算) 1 出生数 出生数は107万1000人、出生率(人口千対)は8.5と推計される。 2 死亡数 死亡数は119万4000人、死亡率(人口千対)は9.5と推計される。 なお、3大死因の死亡数は、第1位悪性新生物35万2000人、第2位心疾患18万9000人、第3位脳血管疾患12万3000人と推計される。 また、死産数は2万7000胎、死産率(出産千対)は24.6と推計される。 3 自然増減数 自然増減数は△12万3000人、自然増減

  • 消費者物価 20か月連続下落 NHKニュース

    消費者物価 20か月連続下落 11月26日 11時20分 10月の全国の消費者物価指数は、エアコンの値下がりなどから、去年の同じ月に比べて0.6%低下し、20か月連続で下落しました。 総務省が発表した10月の全国の消費者物価指数は、天候の変動による影響が大きい生鮮料品を除いて、平成17年を100とした指数で99.5と、去年の同じ月に比べて0.6%低下しました。これは、エアコンや薄型テレビが値下がりしたことや、高校の授業料が実質無償化された影響などを受けたもので、消費者物価指数は20か月連続の下落となりました。ただ、たばこ税の増税を受けて、たばこが大幅に値上げされたことなどから、下落幅は前の月よりも縮小しました。一方、速報値として発表された東京都区部の今月の消費者物価指数は99.0と、去年の同じ月より0.5%低下し、19か月連続で下落しました。総務省は「このところ電気料金が引き下げられる動

  • 統計局ホームページ/消費者物価指数(CPI)

    消費者物価指数は、全国の世帯が購入する家計に係る財及びサービスの価格等を総合した物価の変動を時系列的に測定するものです。 すなわち家計の消費構造を一定のものに固定し、これに要する費用が物価の変動によって、どう変化するかを指数値で示したもので、毎月作成しています。 指数計算に採用している各品目のウエイトは総務省統計局実施の家計調査の結果等に基づいています。 品目の価格は総務省統計局実施の小売物価統計調査によって調査された小売価格を用いています。 結果は各種経済施策や年金の改定などに利用されています。 <最新結果  2024年(令和6年)3月分・時系列データ > お知らせ 令和6年3月22日  ラスパイレス連鎖基準方式による消費者物価指数(参考指数)の品目別ウェイトを更新しました。 令和6年2月27日  「小売物価統計調査(2024年1月分)における令和6年能登半島地震の影響について」(PDF

  • 連合国はどうやってドイツの戦車生産数を割り出したのか | スラド サイエンス

    家/.「How Allies Used Math Against German Tanks 」より。 第二次世界大戦中、ドイツ軍の戦車は明らかに連合国のそれより優れていた。これは動かしようのない事実だったため、連合軍はドイツ軍の生産数を知ろうと躍起になったそうだ。 当初スパイ活動や通信傍受、捕虜への尋問などでこれを割り出したところ、毎月1400台生産しているとの推測が立てられた。しかし実際には、8ヶ月間続いたスターリングラードの戦いに同盟軍が投入した戦車の数はたった1200台だったことから、これは現実的な数字ではないと結論づけられたという。 正確な生産数を割り出すのに連合軍が次に目をつけたのが、戦車にふられたシリアル番号だったという。このシリアル番号を考察し、離散一様分布の最大値を推定する数式を元に割り出された生産数は「1940年の夏から1942年の秋までに毎月255台」であったとのこと

  • 日本人のお金の使い方がまるわかりになる全国消費者実態調査データ | 初代編集長ブログ―安田英久

    今日は、世の中の人がどんなお金の使い方をしているのかを全国で調査したデータを紹介します。市場調査を行うにあたって参考になるかなり詳細なデータを入手できます。しかも無料で。 「30代の男性は書籍や雑誌に1か月あたり何円使っているのか」「ケータイの通信費は、年齢層でどれくらい違うのか」「緑茶と紅茶とコーヒーと、それぞれいくらぐらい使っているのか」「やシャツや下着に使っているお金は?」「CD・DVDやゲームにはどれくらいお金を使っているのか」「映画や遊園地や温泉にはみんなどれくらい行っているのか」こんなデータがあればいいと思いませんか? それがあるのです。 そのデータとは、総務省統計局が行っている「全国消費実態調査」。 平成21年全国消費実態調査(統計局)全国消費実態調査とは、国民生活の実態について、家計の収支や貯蓄・負債、耐久消費財、住宅・宅地などの家計資産を総合的に調査し、世帯の消費・所得

    日本人のお金の使い方がまるわかりになる全国消費者実態調査データ | 初代編集長ブログ―安田英久
  • 第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT

    今ほど統計解析が必要とされる時代はありません。オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しましょう! 読者にとってRは、世に溢れるデータの密林を切り開くための“ブッシュナイフ”となることでしょう(編集部) 統計解析の必要性とリテラシー 21世紀になって、経営学者の故ピーター・ドラッカー氏が言うところの知識労働者は、ますます統計解析を必要する局面が増えてきました。この状況は、20世紀後半から21世紀に起きた計算機能力の増大とインターネットの発展を基礎に、3つの大きな潮流が現れたことがキッカケとなっているように思います。その3つの潮流とは、オープンソース、オープンデータ、そしてオープンアイデアです。後ろの2つは今筆者が名付けました。 オープンソースは、皆さんがご存知のように、Linux、Apache、PerlPythonRubyなどのO

    第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT
  • 1