タグ

統計に関するnoumi-kudryavkaのブックマーク (4)

  • 機械学習によるデータ分析まわりのお話

    2. データサイエンティスト 2 今世紀でもっともセクシーな職業 ハーバード・ビジネス・レビュー 2013年年2⽉月号 2018年年までに⽶米国で14〜~19万⼈人不不⾜足 マッキンゼー 2011年年5⽉月 求められるスキル ビジネススキル,機械学習/ビッグデータ, 数学/OR,プログラミング,統計 Analyzing the Analyzers, O’reilly 2013 4. ⽇日お話すること 4 1. データのこと Keywords: ダミー変数,⽋欠損値,正規化,次元の呪い 2. 機械学習のこと Keywords: 機械学習の分類,アルゴリズム,注意点 3. 評価のこと Keywords: 混同⾏行行列列,適合率率率,再現率率率,F値,ROC曲線 4. 分析のこと Keywords: 過学習,交差検証,学習曲線,バイアス・バリアンス 教師あり学習(後述)寄りの内容が多いです

    機械学習によるデータ分析まわりのお話
  • 統計の基本事項

    トップページ→研究分野と周辺→システムの評価→ 基統計量 平均(算術平均)値は、(データ値の総和)÷(データ数)となる。(或るデータの値)-(平均値)を、そのデータの偏差という。偏差の絶対値の大きいデータが多ければ、そのデータ群はばらつきが大きい。データ群のばらつきの大きさを単純に偏差の総和とすると、偏差には正負があるので相殺されてしまう。 そこで、各データの偏差を二乗する(こうすれば必ず正の値になる)。(各データの偏差の二乗の総和)÷(データ数)をそのデータ群の分散と呼び、ばらつきの大きさを表す。また、分散の平方根を標準偏差という。英語では偏差はDeviation、分散はVariance、標準偏差はStandard Deviationとなるので、標準偏差はS.D.と略記される事も多い。 統計の最も基的な量である基統計量としては、他に最大値、最小値、範囲(最大値-最小値)、中央値(デ

  • 日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)

    2008年に日統計学会75周年記念出版として刊行されました国友直人・山拓監修『21世紀の統計科学』(全3巻)の増補版を, 日統計学会のホームページを通じて提供することとなりました.書の増補版の オンライン公開が統計科学の今後の発展に資することを期待しております. 第I巻 社会・経済の統計科学 (国友直人・山拓編) 第II巻 自然・生物・健康の統計科学 (小西貞則・国友直人編) 第III巻 数理・計算の統計科学 (北川源四郎・竹村彰通編)

  • 社会実情データ図録 Honkawa Data Tribune

    米国大統領選におけるハリス、トランプ両候補については支持層の違いが余りに対照的な点が注目される。男女の違いが最も大きいが、白人vs非白人、富裕層vs貧困層、退役軍人vs労働組合員なども目立っている。

  • 1