タグ

統計に関するWaSpのブックマーク (4)

  • 次の10年、「統計分析」こそテクノロジー分野でいちばんホットな職業になる

    The Top Three hottest new majors for a career in technology : Microsoft JobsBlog マイクロソフトの採用活動などを記しているブログ「Microsoft JobsBlog」に8月23日付けでポストされたエントリ「The Top Three hottest new majors for a career in technology」(テクノロジー分野でもっとも熱い、3つの専門性とは)では、長期的に見て次の3つがホットな分野だと挙げられています。 Data Mining/Machine Learning/AI/Natural Language Processing (データマイニング/機械学習人工知能/自然言語処理) Business Intelligence/Competitive Intelligence (ビジ

    次の10年、「統計分析」こそテクノロジー分野でいちばんホットな職業になる
    WaSp
    WaSp 2010/09/02
    統計がまともに利用されてこなかったのは、統計にかけられるデータがなかったのではなく、分析結果を理解・納得し、利用する人間がいないからでしょう。分析官だけ作っても、意味が分からないものは信頼しない。
  • 東京新聞:『平均寿命に影響なし』:社会(TOKYO Web)

    全国で所在が分からない百歳以上の高齢者が増え続けている問題で、海外などで日の「長寿国家」を疑う声が上がっているが、厚生労働省の担当者は六日、紙の取材に「ほとんど影響はない」と述べた。日人の平均寿命は、今回問題になっている住民基台帳ではなく、五年に一度実施している国勢調査をもとに算出。さらに男性では九十八歳以上、女性で百三歳以上の実データは、あいまいなため使っていないという。  平均寿命とは、年齢別の死亡率を算出し、その年に生まれた零歳児が今後何年生きられるかを予測したもの。日人の二〇〇九年の平均寿命は、女性が八六・四四歳で世界一位、男性が七九・五九歳で世界五位だった。厚労省人口動態・保健統計課の担当者によると、戦後の一時期を除いて、平均寿命は国勢調査をもとに算出。 「例えば、実家に住民票を残している大学生は少なくない。住民基台帳より国勢調査の方がより実態を反映している」と説明す

    WaSp
    WaSp 2010/08/07
    かなりの年の層って、数え年なのかどうかとか、そもそも自分の年齢を正確に知らない人とか結構いるしね。それで除外してるんだろうが、男女で除外年齢ラインが違うのはなぜだろう。
  • サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ
    WaSp
    WaSp 2010/03/22
    統計は最後の手段か、説明する時の奥の手くらいになって欲しい。統計マジックをかけられてても、農学だとか生態だとか再検証がひどく面倒なものだとそのまま流布しちゃうし、感覚的につまらなくなる。
  • Life is beautiful: インターネットが普及すると少子化が進む!?

    統計の授業で重回帰分析 (multiple regression)をしてみせなければならなかったので、CIAの発行するWorld Fact Bookから、世界中の国のさまざまなデータを入手して、何が出生率と強い相関関係を持つかを調べてみた。 入力データは、人口、国民一人あたりのGDP、インターネットの普及率、赤字国債のGDPに対する比率、失業率。この5つのデータすべてを集めることができた113カ国に関して、 「それらの入力データのうち、どれが出生率と強い相関関係を持っているか」を重回帰分析という手法を利用して解析したのだ。 細かな計算式を見せても退屈だろうから結果だけを書くと、上の5つの入力データのうち、出生率と強い相関関係を持つのは、インターネットの普及率と失業率。 出生率(人口千人あたりに年間何人子供が生まれてくるか)を、インターネットの普及率と失業率で表すとこうなる。 出生率=23.

    WaSp
    WaSp 2008/06/17
    上の式から予想される出生率は…と、実際の数値7.87にとても近い値となる。>当たり前。データから回帰式出して、その式とデータがかけ離れてたらオカシイ。特に当てはまりの良かった二つを引っ張り出したんだから。
  • 1