タグ

統計に関するMackerelのブックマーク (12)

  • 機械学習を初めて勉強する人におすすめの入門書 - old school magic

    概要 私が機械学習の勉強を始めた頃、何から手を付ければ良いのかよく分からず、とても悩んだ覚えがあります。同じような悩みを抱えている方の参考になればと思い、自分が勉強していった方法を記事にしたいと思います。 目標としては、機械学習全般について、コンパクトなイメージを持てるようになることです。 そのためにも、簡単なから始めて、少しずつ難しいに挑戦して行きましょう。 入門書 何はともあれ、まずは機械学習のイメージを掴むことが大切です。 最初の一冊には、フリーソフトでつくる音声認識システムがおすすめします。 フリーソフトでつくる音声認識システム - パターン認識・機械学習の初歩から対話システムまで 作者: 荒木雅弘出版社/メーカー: 森北出版発売日: 2007/10/17メディア: 単行(ソフトカバー)購入: 45人 クリック: 519回この商品を含むブログ (38件) を見るレビュー :

    機械学習を初めて勉強する人におすすめの入門書 - old school magic
  • http://r.livedocs.net/

  • 統計言語 R の公式ヘルプでさらっと目を通しておくと良いトピックまとめ - ほくそ笑む

    『アート・オブ・Rプログラミング』の日語訳が出たので早速買いました。 細かい仕様の解説が多くちりばめられていて結構いい感じです。 プログラミング初心者向けではないですが、他の言語になじんでる人が R に入門したい場合には、他の入門書よりもこっちを読んだ方が手っ取り早いのではないかと思います。 例えば、下記のように、他言語との比較による解説が各所に見られます。 他のスクリプト言語の経験がある読者は、Python での None や Perl での undefined などの「存在しない」値を知っているかもしれません。実は、R にはこのような値が2つあります。NA と NULL です。 http://www.amazon.co.jp/gp/product/4873115795 さて、今日はこのの 1.7.4 節からの話題です。 統計言語 R には、公式ヘルプが付属しており、例えば平均値を計

    統計言語 R の公式ヘルプでさらっと目を通しておくと良いトピックまとめ - ほくそ笑む
  • 相関と因果について考える:統計的因果推論、その(不)可能性の中心

    3. 今回のもくじ イントロ -『相関と因果』再訪 基礎編 - 因果概念の変遷: 心の習慣 から 反事実 へ - 因果と確率論を繋ぐ:Pearlのdo演算子 実務編 - 重回帰とは因果構造分解酵素である - バックドア基準による変数選択 考察 - 因果推論の不可能性, モデル選択の3視点 4. 相関と因果は一致しない 86 女 性 84 の 平 82 均 寿 80 命 78 (歳) 30 34 38 NHKの放送受信契約数(百万) http://www.stat.go.jp/data/nihon/02.htm 元データ→ http://pid.nhk.or.jp/jushinryo/know/pdf/toukei2010.pdf 5. 相関と因果は一致しない 86 p < 0.00000002 女 2 性 84 R = 0.99 の 平 82 均 寿 80 命 78 (歳) 30 34 3

    相関と因果について考える:統計的因果推論、その(不)可能性の中心
  • 続・わしの頁

    統計解析フリーソフト R に関する頁です.

  • 東京工業大学 情報理工学院 数理・計算科学系

    大岡山地区の建物 大学正門より,桜並木のウッドデッキを通り,右手の芝生をつっきる小径が西8号館,西7号館に続くみちです. 大岡山西8号館(E棟,W棟): キャンパスマップの18, 19番の建物にあたります.館の西隣りに位置しています.正面玄関をはいったところは3階です. E棟においでの方は廊下をはいってすぐ左手のエレベータをご利用下さい. W棟にはじめておいでの方は十分に注意して下さい.E棟とW棟を繋いでいる通路は3階と10階にしかありません.E棟のエレベータを利用すると迷子になります.正面玄関から廊下をまっすぐにおいでになり,奥の右手にあるエレベータをご利用下さい. 西7号館:キャンパスマップの17番の建物にあたります.西8号館から,建物を二つ挟んだ並びにあります.芝生から向う場合,左手に館を見ながら進み,館がとぎれたあたりの右手にある小さな建物が西7号館です.橋を渡ってはいったと

  • 我々は欲しいデータではなく手持ちのデータで戦わねばならない - himaginary’s diary

    28日エントリに、稀にしか起きないイベントについて確率を論じることの無意味さを指摘するコメントを頂いたが、そうした議論とつながっていなくもないテーマがアンドリュー・ゲルマンのブログで扱われていた。ただし書いたのはゲルマンではなく、ローレンス・バークレー国立研究所の物理学者Phillip “Phil” Price。 そこで彼は、何らかの推計において、完全にランダムなサンプルはまず手に入らないので、取りあえず入手可能なサンプル=便宜的標(convenience sample)で推計した結果を一般化するのは常識の部類に属すると思っていたが、そうではなかった、という愚痴をこぼしている。具体的には、あるテーマについてそうした便宜的標で推計を行ったところ、その結果から何らかの結論を導き出そうとする行為は完全に誤りである、とポスドクに強硬に抗議された、とのことである。 同エントリでPhilは、似た話

    我々は欲しいデータではなく手持ちのデータで戦わねばならない - himaginary’s diary
  • Rが使えるフリをするための14の知識

    米国FDAで公認され、ハーバード大学やイェール大学の授業で利用されるようになり、世間での認知度が着実に上昇している統計用プログラミング環境のRだが、ユーザーなのか、ユーザーになりたいのか、ユーザーとして振舞いたいのか分からない人が増えてきた。 スノッブなユーザーとして振舞う場合は、Rの特性を語れる必要があるので、ユーザーになるよりもRへの知識や理解が必要で、実は難易度が高い行動である。それでもあえて意識の高いRユーザーとして振舞いたい人々のために、最低限求められる事のチェック・リストを用意してみた。 1. 参考文献や参考ページを押さえておく 一番大事な事だが、参考文献や参考ページを押さえておこう。公式サイトで配布されている、「R 入門」「R 言語定義」「R のデータ取り込み/出力」は持っておくべきだ。R-TipsやRjpWikiも参考になる。 2. 演算子や制御構文をマスターする 四則演算

    Rが使えるフリをするための14の知識
  • イレッサの記事に、ちょっと一言 - aggren0xの日記

    http://d.hatena.ne.jp/what_a_dude/20110114/p1 のエントリを読んで、この中の「検出力」と「モニタリング」についてより具体的に説明する方法がないものかと考えてみた*1。ポイントとしては、多少の確率分布を用いるがP値は使わない。ちょっとブラックボックスのように思う人が多いと思うので。使わなくても、統計的考察はできる。 二項分布で考える ちょろっと具体的な数字を出してみたい。イレッサによる急性肺障害・間質性肺炎、というのが懸案の副作用であるわけだが、この発症率についてはイレッサ群で4%、抗癌剤による通常療法群で2%観察されるとする報告がある*2。このような場合、たとえイレッサが登場していなくても、その時点で標準的な治療をすることにより2%程度の間質性肺炎は発症したと考えられ、残りの2%がイレッサによる「超過リスク」ということになる。もちろんこのような比

    イレッサの記事に、ちょっと一言 - aggren0xの日記
  • 本田宏先生へのお願い - 新小児科医のつぶやき

    とりあえず田先生の3/1のツイッターには、 拡散希望!明日3月2日毎日新聞朝刊「医療を開く」で「医師不足は小児救急にも影」と日は小児集中治療専門医も超不足、小児科勤務医の疲弊と日の1−4歳幼児死亡率先進国中で米国についで高い事実に、多大な影響を与えている可能性を警告します こうあってさらに3/2には、 拡散希望!日3月2日毎日新聞朝刊「医療を開く」で「医師不足は小児救急にも影」と日は小児集中治療専門医も超不足で小児科勤務医の疲弊に加えて1−4歳幼児死亡率が先進国中で米国についで高いことに多大な影響を与えている可能性を警告しました さらに同日に、 今朝3月2日毎日新聞朝刊「医療を開く」で「医師不足は小児救急にも影」と日は小児集中治療専門医超不足、小児科勤務医の疲弊だけでなく、日の1−4歳幼児死亡率が先進国の中で米国についで高いことに大きな影響を与えている可能性を警告しました。

    本田宏先生へのお願い - 新小児科医のつぶやき
  • 大相撲のアノーマリー (1)

    大相撲の勝敗結果を分析すると、ちょっとした不自然さが見つかります。今回は、ベストセラーとなった書籍「ヤバい経済学」でも紹介されていた論文を元ネタにネット上のデータを利用して解析を試みます。 今回の前口上 諸事情により2カ月の間連載を空けてしまいました。申し訳ございませんでした。実は10月、11月に用意した時事ネタがいろいろあるのですが、こちらは少しタイミングを逸して旬が過ぎたので、もう少し寝かせてから提示したいと思います。また、何人かの読者の方から励ましのお言葉を戴きまして大変感謝しています。当に励みになります。ありがとうございました。もしもこの連載で取り上げてほしい問題やネタ、改善点などがありましたら、遠慮なく以下のメールアドレスにリクエストやご意見をお送りください。 knife@bakfoo.com 今回から数回は、大相撲の統計データをネタにして、「公になっているが混乱しているデータ

    大相撲のアノーマリー (1)
  • 「統計数理」既刊目次

    各論文の全文pdfをご覧いただけます。 pdfを公開しているものについては、著作権は統計数理研究所に帰属します 第72巻 第1号 第2号 (2024年) 第71巻 第1号 ,第2号 (2023年) 第70巻 第1号 ,第2号 (2022年) 第69巻 第1号 ,第2号 (2021年) 第68巻 第1号 ,第2号 (2020年) 第67巻 第1号 ,第2号 (2019年) 第66巻 第1号 ,第2号 (2018年) 第65巻 第1号 ,第2号 (2017年) 第64巻 第1号 ,第2号 (2016年) 第63巻 第1号 ,第2号 (2015年) 第62巻 第1号, 第2号 (2014年) 第61巻 第1号, 第2号 (2013年) 第60巻 第1号, 第2号 (2012年) 第59巻 第1号, 第2号 (2011年) 第58巻 第1号, 第2号 (2010年) 第57巻 第1号, 第2号 (

  • 1