タグ

統計学に関するshifuminのブックマーク (10)

  • 「母数」の誤用について

    「母数」(parameter)は統計の術語で,「確率分布を特定するための定数」のことです。たとえば,確率分布の一つである正規分布は,平均と分散を決めることで特定されます。ですから,平均と分散は正規分布の母数です。 「JISZ8101-1 統計-用語及び記号-第1部:一般統計用語及び確率で用いられる用語」では次のように定義されています。 2.8 (確率)分布族 (かくりつ)ぶんぷぞく(family of distributions) 確率分布(2.11) の集合。 注記1 確率分布を区別するとき,確率分布のパラメータ(2.9) がインデックスとしてよく用いられる。 注記2 確率分布の平均(2.35) 及び/又は分散(2.36) が,しばしば分布族のインデックスとして用いられ,又は分布族を表すのに三つ以上のパラメータが必要な場合はその一部として用いられる。平均及び分散は,分布族の明示的なパラメ

    shifumin
    shifumin 2020/12/19
    よく誤用されているいわゆる統計学用語としての母数、辞書だと普通にその意味で載っているものもあるのか。
  • 統計学と機械学習を支える数学が、「全く一緒」と言えるわけ

    東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータを活用する様々なプロジェクトにおいて調査、分析、システム開発および人材育成に従事する。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。 『統計学が最強の学問である[数学編]』 ビジネス書大賞(2014)、統計学会出版賞(2017)受賞シリーズの最新刊となる『統計学が最強の学問である[数学編]』の序章を公開。これから全ての人に必要な、統計学と機械学習を支える数学がこの1冊でマスターできる、待望の1冊です。 バックナンバー一覧 ビジネス書大賞(2014)、統計学会出版賞(2017)を受賞し、累計48万部を突破した大ヒッ

    統計学と機械学習を支える数学が、「全く一緒」と言えるわけ
  • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

    追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

    データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
  • 【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita

    統計をこれから学ぼうという方にとって、非常に重要な概念ですが理解が難しいものに「標準偏差」があると思います。「平均」くらいまでは馴染みもあるし、「わかるわかるー」という感じと思いますが、突如現れる「標準偏差」 の壁。結構、この辺りで、「数学無理だー」って打ちのめされた方もいるのではないでしょうか。 先にグラフのイメージを掲載すると、下記の赤い線の長さが「標準偏差」です。なぜこの長さが標準偏差なのか、ということも解き明かしていきます。 (code is here) 記事では数学が得意でない方にもわかるように1から標準偏差とはなにか、を説明してみようという記事です。 数式はわかるけど、イマイチ「標準偏差」の意味わからんという方にも直感的な理解がしてもらえるような説明もしていきますので、ぜひご覧ください。 (※ この記事では標準偏差の分母に $n$を使用しています。$n-1$を使用するケースも

    【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita
    shifumin
    shifumin 2015/08/01
    統計学学び情報。
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

  • 主観確率 - Wikipedia

    主観確率(しゅかんかくりつ、英: subjective probability)は、客観確率に対比される概念。この両者は確率の哲学的解釈における二つの主要な選択肢である。主観的確率の考え方は1920年代から1930年代ごろにフランク・ラムゼイやブルーノ・デ・フィネッティらによって導入された。 主観確率と客観確率[編集] 客観確率とは、世界の中に存在する頻度や傾向性など、我々の主観によらず存在するものとしての確率を指す。客観確率は実験または理論的考察(思考実験)から求められ、客観的な観測結果と比較できるランダムな事象についての確率である。 主観確率とは、人間が考える主観的な信念あるいは信頼の度合(客観的には求められない)をいう。たとえば「かつて火星に生命が存在した確率」という言葉は、主観確率の考え方からは、「かつて火星に生命が存在したと信じる信念の度合い」と同値である。 数学における確率論は

    shifumin
    shifumin 2015/03/29
    「主観確率とは、人間が考える主観的な信念あるいは信頼の度合(客観的には求められない)をいう」
  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • カップルが一緒にお風呂に入る割合をベイズ推定してみた

    [DL輪読会]Scalable Training of Inference Networks for Gaussian-Process ModelsDeep Learning JP

    カップルが一緒にお風呂に入る割合をベイズ推定してみた
    shifumin
    shifumin 2015/03/22
    なるほど〜。
  • RjpWiki - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですRjpWiki はオープンソースの統計解析システム 《R》 に関する情報交換を目的とした Wiki です † どなたでも自由にページを追加・編集できます. (初めて投稿・既存記事への追加・修正を行なう方はこのページ末の注意*1を御覧下さい) ページへのファイル添付については、画像ファイルのみパスワードなしで可能としてあります(ページ上部「画像添付」より)。その他のファイルの添付はパスワードを入力することで可能です(ページ上部「ファイル添付」より)。現在のパスワードは, Rでの round(qt(0.2,df=8),3) の実行結果です。 スパム書き込みに対処するため、書き込み系の処理に対してパスワードを設けました。ユーザ名の欄には,Rで round(qt(0.2,df=8),3) を実行

  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

  • 1