タグ

統計に関するaokirozinのブックマーク (6)

  • なぜリスク分析のプロは仮説検定を使わないのか(ややマニア向け) - Take a Risk:林岳彦の研究メモ

    お久しぶりです。林岳彦です。もうすぐ『愛なき世界』の日、いわゆる(マイブラッディ)バレンタインデーですね。何かと雑音が多いこの世界ですが、いつでも自分の足元を見つめて行きましょう。 さて。 今回は、以下の: そもそもビジネスの現場ではどういう「レベル」の統計学を使うべきなのか - 銀座で働くデータサイエンティストのブログ 統計学的検定に対するある拒絶反応: ニュースの社会科学的な裏側 A/Bテストのガイドライン:仮説検定はいらない(Request for Comments|ご意見求む) - 廿TT のあたりの皆様の良記事に触発されて「仮説検定」について何か書いてみようと思いました。で、書こうと思えば色々な側面から書ける気もするのですが、今回はちょっと斜めからのアプローチとして、「リスク分析の人の頭のなかで仮説検定はこんな感じに見えている」というところを書いていきたいと思います。 ここで、ひ

    なぜリスク分析のプロは仮説検定を使わないのか(ややマニア向け) - Take a Risk:林岳彦の研究メモ
  • そもそもビジネスの現場ではどういう「レベル」の統計学を使うべきなのか - 渋谷駅前で働くデータサイエンティストのブログ

    データサイエンティストブームが去りつつある一方で、データ分析ブームそのものはじわじわと広がり続けている感じのする昨今ですが。最近また、色々なところで「当にビジネスやるのに統計学って必要なの?」みたいな話題を聞くことが増えてきたので、何となくざっくりまとめて書いてみました。 ちなみに今回の話題の参考図書を挙げようと思ったら、この辺ですかね。 とある弁当屋の統計技師(データサイエンティスト) ―データ分析のはじめかた― 作者: 石田基広,りんと出版社/メーカー: 共立出版発売日: 2013/09/25メディア: 単行この商品を含むブログ (13件) を見る 統計学入門 (基礎統計学) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メディア: 単行購入: 158人 クリック: 3,604回この商品を含むブログ (78件) を見る 当は赤

    そもそもビジネスの現場ではどういう「レベル」の統計学を使うべきなのか - 渋谷駅前で働くデータサイエンティストのブログ
    aokirozin
    aokirozin 2014/01/22
    "これを読んで「そうだよね」と言える人は大丈夫です。でも、これを読んでもポカーンとしてしまう人にはもう既に仮説検定は無理ゲーではないかと"
  • パッケージユーザーのための機械学習(3):サポートベクターマシン(SVM) - 渋谷駅前で働くデータサイエンティストのブログ

    (※はてなフォトライフの不具合で正しくない順番で画像が表示されている可能性があります) PythonでSMO-SVM書き下すという宿題がまだ終わってないくせにこれ書いていいのか物凄く迷うんですが(笑)、R Advent Calendar 2013の12月6日分第6回の担当に当たっているのでついでに書いちゃいます。 なのですが。実はその12月6日は米ネバダ州・タホ湖畔で開催中のNIPS 2013に参加中*1でupできるかどうか分からない*2ので、タイムスタンプ変えて予めupさせてもらいました。ルール破っちゃってごめんなさい。。。 ということで、今回の参考文献はこちら。未だに評は分かれるみたいですが、僕が推すのはいわゆるSVM赤こと『サポートベクターマシン入門』です。 サポートベクターマシン入門 作者: ネロクリスティアニーニ,ジョンショー‐テイラー,Nello Cristianini,Jo

    パッケージユーザーのための機械学習(3):サポートベクターマシン(SVM) - 渋谷駅前で働くデータサイエンティストのブログ
    aokirozin
    aokirozin 2013/12/03
    なるほど、わからん。
  • 第一種の過誤と第二種の過誤 - Interdisciplinary

    twitterを眺めていたら、NATROMさんが 第1種の過誤と第2種の過誤の用語の使い方にも疑問が…。 http://twitter.com/NATROM/status/244301894485438464 こう書いておられたので、気になってNATROMさんのRTを辿ったら、どうやら、このエントリーの事のようでした⇒差別をめぐる2種類の過誤 - Whoso is not expressly included NATROMさんによれば、ここで使われている「第1種の過誤と第2種の過誤」という用語の使い方に疑問があるらしい。で、そのエントリーをよく見てみると、以前に自分が(NATROMさんも)ブックマークしていたものでした。私は不勉強にして詳しい経歴を存じあげないのですが、書き手の金明秀氏は、twitterプロフィールによれば、計量社会学を専門とする方のようです。 実際に当該エントリーでの用語

    第一種の過誤と第二種の過誤 - Interdisciplinary
    aokirozin
    aokirozin 2012/09/16
    そもそも用いた手法が間違ってたっていう、第三種の過誤(γエラー)ってのもあるんだぜ。そしてγエラーが実は一番多いっていうね
  • できちゃった婚の背景 - これは駄目だ。

    以前、『若者の間で激増している「できちゃった婚」』という記事に[┃┃¨╋┓]タグを付けて放置していたのですが、今日、「社会実情データ実録」さんの「都道府県別のできちゃった婚比率」のデータを見て、せっかくなので検証してみました。 じつに理由もなく直感的なのですが、経済的な側面が高いと思われるので、まずはできちゃった婚比率のデータと県民所得を付きあわせてみました。 R2=0.544とまずまずです。 他にそれらしいものとして、失業率とあわせてみると、 いまいちです。 もうちょっとばっちりくるデータはないものかと漁って見ると、厚労省に学歴別、男女別の初任給のデータがあったので、とりあえず大卒女子あたりで見ると、 やっぱり、いまいちです。 しかし、ここで高卒女子の初任給でプロットすると、 おおお!ドンピシャです。特に異常値ぽかった沖縄(右端の点)が綺麗に載っているのは驚きです。 ちなみに高卒男子のプ

    できちゃった婚の背景 - これは駄目だ。
    aokirozin
    aokirozin 2012/03/29
    縦軸と横軸反対じゃね?
  • http://hirano.com/blog/archives/04071100.html

    aokirozin
    aokirozin 2009/08/31
    ちゃんとサンプリングできれば、選挙はサンプリング投票でいいのではと思うけれど、思ったより複雑そうです。
  • 1