統計学に関するtsuka_ryoのブックマーク (40)

  • 『統計を始める前に』(主に言語研究者向け)の公開|Colorless Green Ideas

    文書の性質 『統計を始める前に』という教科書的文書を公開したいと思う。これは、以前、勉強会のために私が作成した文書の一部を切り貼りして作ったものである。以下から、PDFファイルとしてダウンロードが可能なので、必要な方はどうぞ。なお、強制ではないが、リンクを貼るときは、PDFに直接リンクするのではなく、このページにリンクしていただければ幸いである。何か追加情報があったときには、このページに書くつもりなので。 http://id.fnshr.info/docs/stat_for_langs00.pdf これは何を目的にした文書かと言うと、タイトルの通り、「統計を始める前に」一通り知っておきたい数学的知識などをまとめたものである。この文書を一通り読んだ上で、統計の勉強を始めるとはかどるはずである。 統計を始める前に、数学の勉強をしないといけないなんて面倒だと思う人もいるかもしれない。だが、私の経

    tsuka_ryo
    tsuka_ryo 2012/05/07
    これから統計を始めようかなと考えている言語研究者向けの数学
  • 今年の8冊〜量子力学・統計学・マクロ経済学から〜 - ハリ・セルダンになりたくて

    東日大震災を始め、辛く悲しい出来事が多い一年でした。仕事も忙しくあまりblogを更新することも出来ませんでしたが、年末ですから今年、記憶に残ったをいくつかご紹介したいと思います。 [量子力学この一冊] 矢野の大学時代からの友人である森田邦久氏の新著が「量子力学の哲学」です。量子力学というのは物理学の一分野で、たとえば「電子」などというミクロな*1物質の振る舞いを分析します。 電子などのミクロな物質には「粒子と波」の両方の性質が観測されるなど、ミクロな世界では我々の日常生活では少し理解しがたい現象が発生します。 そのため、それをどのように理解すればいいのか、が重要な問題になってくるわけです。「シュレディンガーの」と言われる話に端的に表される問題ですが、学問的には「量子力学の解釈問題」とか「量子力学の観測問題」などと呼ばれています。 大学時代に森田氏と矢野(ともう一人の友人F氏)は物理を

    今年の8冊〜量子力学・統計学・マクロ経済学から〜 - ハリ・セルダンになりたくて
  • はてなブログ | 無料ブログを作成しよう

    うめぇヨーグルトソースでもいかがですか。個人差にもよりますが。もしよろしければ。 お久しぶりです。 最近うんめぇ〜と思ってるヨーグルトソースがあるので、書いていこうと思います。 ヨーグルトとハーブ類をもりもり使うので、そういうのがべられない方にはうんめぇソースではないです。ごめんなさい…。もしよろしければお茶だけも…旦~ 【用意する…

    はてなブログ | 無料ブログを作成しよう
  • 伝えるための心理統計 大久保街亜著 岡田謙介著

    「科学的研究で重要なのは有意かどうかである」というこれまでの傾向に対し、統計改革と呼ばれる新たな運動が起きている。書はこの運動に焦点を当て、今後の研究に求められるデータの示し方を丁寧に解説。医学・教育学・社会学など、心理学以外の多くの他分野にも役立つ内容で、書を読み進めることで必ず理解が深まる、これからの研究者必携の書。 正誤表(PDF) まえがき 第I部 背景と歴史 第1章 心理統計における新展開:統計改革がはじまった 1.1 Cohen(1994) 1.2 心理学における統計改革 1.3 さまざまな分野における統計改革 1.4 日における統計改革 1.5 統計改革の現状と将来 1.6 まとめ 第2章 帰無仮説検定:その論理と問題点 2.1 「有意」の誕生 2.2 帰無仮説検定の論理 2.3 帰無仮説検定の問題点 2.4 帰無仮説検定を擁護する 2.5 まとめ 第II部 理論と実践

    伝えるための心理統計 大久保街亜著 岡田謙介著
  • 説明と選抜:統計学における2つの「関心」 - 社会学者の研究メモ

    社会学者や経済学者にとって、統計学をベースにした計量分析とは、何かを因果的に説明する道具であるという側面がある。賃金を学歴で説明するというとき、それは他の条件が同じで学歴が変化したときの賃金の変化量を推定する、という意味である。 (記述的な分析手法を含めて)統計学を学ぶ人のほとんどは、この「説明(explanation)」のためにそれを学んでいるのだと考えられる。 しかし統計学には、それとは全く異なった目的が託されることもある。それは「選抜(selection)」である。統計学を選抜に使うというのは、それをアカデミックに活用している研究者からみても、実はあまり馴染みのない考え方である。というのも、あとで詳しく述べるが、選抜は学問的説明とは相容れない考え方だからだ。 しかし選抜は、実践家においては大いに意味がある考え方である。「限られた回数の耐久力テストの結果から、真に優れた個体を選抜する」

    説明と選抜:統計学における2つの「関心」 - 社会学者の研究メモ
  • 統計学を勉強するときに知っておきたい7つのポイント

    マイクロソフト社が技術分野でもっと熱い専攻の一つとして分析/統計をあげている(Microsoft JobsBlog)。同社以外でも統計学は、今後最も有益なスキルの一つだと考えているようだ(NYT - For Today’s Graduate, Just One Word: Statistics)。しかし、データマイニングの話も一般化しつつあって学習ノウハウなども公開されているが、経験にあわない部分が多い。統計学を初めて勉強するときに知っておいた方が良い7つのポイントをあげてみた。 1. 学習機会やテキストは山のようにあるので利用する 確率・統計の日語テキストは山のようにあり、大学のコースワークを振り返っても、理文問わずにほとんどの学部で確率・統計はあったはずだ。大学院のコースワークでは英語の文献を好む傾向があるが、上級テキストでも日語のものも少なくない。また「マンガでわかる統計学」のよ

    統計学を勉強するときに知っておきたい7つのポイント
  • 神経科学と統計科学の対話

    統計数理研究所研究会 神経科学と統計科学の対話 2 統計数理研究所 3F 第5セミナー室 (D312/314) 東京都立川市(最寄り駅・多摩モノレール高松) 2011年 12月26日~12月27日 地図はここ 昨年度 「神経科学と統計科学の対話」 2011年@統計数理研究所 参考 「非線形科学と統計科学の対話」 2007年@統計数理研究所 前回は顔合わせの意味もあり短めのオリジナル講演・問題提起を並べた構成でしたが,今回は「統計手法のサーベイ・チュートリアル」をメインにして,脳研究そのものに関する特別講演1件とオリジナルの短めの口頭発表を加えた形式にしました.ポスターセッションはありません. 12月26日(月)のプログラム 13:00-13:15 伊庭幸人(統数研) オープニング 13:15-14:15(60分) 福水 健次(統数研) カーネル法の基礎(仮題)(講義) 14:15-15:1

  • サンプリングについてのひとつのお話 - 社会学者の研究メモ

    世論調査などでもしばしば「層化二段無作為抽出」という言葉を目にする人は多いのではないだろうか。この手続を簡潔に説明することはなかなか難しいので、何度テキストを読んでもピンとこない、という人は意外に多いようである。その理由の一つは、「単純ランダムサンプリング(unrestricted random sampling)」を最初に説明して、それからその他の抽出法を応用として説明しようとしているからではないか、という気がする。そのせいか、一般の方の中には「母集団の正しい姿を捉えるには単純ランダム抽出が最善で、それ以外は亜流」といった考え方をしている人も多いようだ。 ところが、統計に関わる研究者のほとんどは、実際には「単純ランダム抽出は最善というよりも次善」ということを理解した上でデータを扱っている。それが一般の人には理解しにくい思考プロセスを踏まえているために、いろいろな誤解が生じているようである

    サンプリングについてのひとつのお話 - 社会学者の研究メモ
  • はてなブログ | 無料ブログを作成しよう

    広島に行った話 生まれて初めて、ひとりで遠出をした。行ったのは広島だった。 「#Barbenheimer」(読み:バーベンハイマー)を覚えているだろうか。原子爆弾の父・オッペンハイマーを描いた映画『オッペンハイマー』と、実写映画『バービー』がアメリカで同日公開され、映画ファンたち…

    はてなブログ | 無料ブログを作成しよう
  • 言語研究者のための統計の学び方―基礎を身につける|Colorless Green Ideas

    総和 総和と言っても、ピンと来ない人もいる。要するに与えられた規則に基づいて、数を足していくだけの話なのだけれども、慣れないとどういったものだか分かりづらいところがある。 総和記号の使用例 \[ \sum_{n=3}^{7} 2i = 2 \cdot 3 + 2 \cdot 4 + 2 \cdot 5 + 2 \cdot 6 + 2 \cdot 7 \] いずれにせよ、統計の教科書では、総和の記号がよく出てくるので、総和記号の取り扱いに把握しておくと統計が理解しやすくなる。高校の教科書だと、普通、数列について扱っている章に載っている。 組み合わせ論と確率 組み合わせ論と確率については、統計の入門書にもしっかり載っているので、特に力を入れる必要はないと思う。「そう言えばこんな感じなのだな」と、軽く確認するだけで十分だ。 対数 言語現象は対数の形で表されることが多いので、しっかり把握しておくこ

  • 図(だけ)で説明する回帰分析 - 社会学者の研究メモ

    分かっているようで意外と分かっていないのが回帰分析です。回帰分析の考え方をできるだけ図だけで説明した資料を作りましたので、適宜ご参照ください。 「(ほぼ)図(だけ)で説明する回帰分析」(PDF) 主な内容は、以下のとおりです。 説明変数と撹乱項の相関の理解 予測値の信頼区間をプロットすることの重要性の理解 「変数をコントロールする」ということで曖昧に理解されている内容の理解

    図(だけ)で説明する回帰分析 - 社会学者の研究メモ
  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • 確率論に迷い込む前に - dongfang99の日記

    @HeizoTakenaka 竹中平蔵 30年で大地震の確率は87%・・浜岡停止の最大の理由だ。確率計算のプロセスは不明だが、あえて単純計算すると、この1年で起こる確率は2.9%、この一カ月の確率は0.2%だ。原発停止の様々な社会経済的コストを試算するために1カ月かけても、その間に地震が起こる確率は極めて低いはずだ。 http://twitter.com/#!/HeizoTakenaka/status/67726323170283520 竹中氏のこのつぶやきをめぐって、何だか「確率論的におかしい」と「確率論的には間違っていない」の対立になっているのだが、それ以前の問題として、この発言は明らかに不適切だろう。このことを誰も指摘せず、竹中氏の「確率的にはリスクは低いのだから拙速に原発を止めずに経済合理性を計算すべき」という、政策論的主張そのものが見事なまでにスルーされているのが不思議である。む

    確率論に迷い込む前に - dongfang99の日記
  • 統計検定:Japan Statistical Society Certificate

    統計検定」とは、統計に関する知識や活用力を評価する全国統一試験です。問い合わせ:統計検定センター

  • 使える数理リテラシー - 株式会社 勁草書房

  • 「統計学を拓いた異才たち--経験則から科学への一世紀--」 ザルツブルグ著 日本経済新聞社 - 道端鈴成

    統計学については、品質管理を初めとして、医学、薬学、農学、心理学、経済学、等々の広い領域における沢山のテキストや解説書が書かれている。統計ソフトウェアの解説書は山積みである。統計学の数学的な専門書もある。しかし統計学について論じたは非常にすくない。これは、時空に関する物理学、進化論、分子生物学、最近では複雑系などについて、その研究の歴史や哲学的意味が大いに論じられているのと対照的である。統計学はあくまでテクニックとして行うものであって、論ずるものではないと考えられているかのようだ。 しかし、人類の知的な探求の営みとして考えると、統計学には非常に興味深い特徴がある。まず、統計学的な認識は歴史的にかなり遅れて生じている。例えば、折れ線グラフや棒グラフなど、データのごく素朴な図示の方法だが、18世紀にイギリスのPlayfairが発案したものである。二つの変数の関連を示すごく基的な指標である相

    「統計学を拓いた異才たち--経験則から科学への一世紀--」 ザルツブルグ著 日本経済新聞社 - 道端鈴成
    tsuka_ryo
    tsuka_ryo 2011/01/03
    イアン・ハッキングを参照しないなど、哲学にはやや弱いらしいが、統計の実務家による統計学の歴史の本として読みやすく有益な一冊である
  • 『統計学を拓いた異才たち:経験則から科学へ進展した一世紀』 - leeswijzer: een nieuwe leeszaal van dagboek

    デイヴィッド・サルツブルグ著/竹内惠行・熊谷悦生訳 (2006年3月23日刊行,日経済新聞社,ISBN:4532351944→目次) 【書評】 ※Copyright 2006 by MINAKA Nobuhiro. All rights reserved 原著は:David Salsburg『The Lady Tasting Tea: How Statistics Revolutinalized Science in the Twentieth Century』(2001年刊行,Henry Holt and Company, ISBN:0805071342). 近代統計学の概略をあらかじめ知っている読者にとっては,とても興味深い歴史絵巻が繰り広げられている.講義ネタとして使えるエピソードもたくさんある(ばくぜんと知っていた知識の確認にもなる).しかし,書でいきなり「統計革命」という言葉

    『統計学を拓いた異才たち:経験則から科学へ進展した一世紀』 - leeswijzer: een nieuwe leeszaal van dagboek
    tsuka_ryo
    tsuka_ryo 2011/01/03
    "最後に,統計学のもっとも“哲学”的な部分について言及があって,考えさせられるものがある"
  • 統計学へのお誘い本リスト

    趣旨 大学での講義や統計研修の受講生から,「統計学の参考図書を紹介してほしい」との依頼があったので,下記のような「お誘いリスト」をつくってみた.すべて日語のである.“門前”から“門”までの「参道」がやや長い気がするが,そこは気の迷いや逡巡が憑いてまわる相手のために,ということでご容赦いただきたい.また,いったん“入門”してしまった後は,統計手法ごとにそれぞれ特化したより適切な(中級書以上)がきっとあると思うが,下のリストはまったく網羅的ではない.個人的に,生物系・農学系の学生や研究員を相手に講義をする機会が多いので,リストの最初の方はできるだけ“数式汚染”されていない統計を中心に挙げてある.下記の内容についてご意見やご指摘がありましたらご連絡ください. 門前でまだ迷っている人のための誘惑 結城浩/たなか鮎子[イラスト]『数学ガールの秘密ノート:やさしい統計』(2016年11月7

  • 岩波書店

    岩波書店公式サイト

    岩波書店
  • 信頼性の高い推論 G.ハーマン著 S.クルカルニ著 蟹池陽一訳

    帰納とは、個別の前提から一般的な結論を導く推論のことである。哲学の伝統では演繹との対比において帰納の確実性が問題とされてきたのに対し、書では帰納を推論の規則と捉えて演繹と切り離し、帰納の信頼性の評価にあたって情報工学における統計的学習理論が有効であることを明らかにする。哲学と認知科学の協働による画期的な知見。 序 第一章 帰納の問題 1 問 題 2 推論と含意 3 反省的均衡 4 反省的均衡についての懸念 5 信頼性 6 今後の先取り 7 結 論 第二章 帰納とVC次元 1 パターン認識 2 背景確率分布 3 分類・推定の規則の信頼性 4 帰納的学習 5 満足のいく枚挙的帰納の条件 6 ポパー 7 総 括 第三章 帰納と「単純性」 1 序 2 経験的誤差の最小化 3 普遍的一致性 4 構造的リスク最小化 5 最小記述長 6 単純性 7 実数変数の推定とカーブフィッティング 8 グッドマン