タグ

統計学に関するmasashisalvadorのブックマーク (5)

  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
  • WEBで読める統計関係の良質な資料 - Interdisciplinary

    私がよく参考にする所を三箇所紹介します。いずれも、説明が極めて明瞭で、論理的な整合性や用語の丁寧な使い方を志向している所に好感が持てるサイトです。 ▼Econom01 Web Site, Sophia University, Tokyo, Japan 上智大学の大西博氏のサイト。私が統計関連で最もよく参照する所です。説明の仕方の明瞭さや、具体例を用いた解説がとても良いと思います。確率統計の一つ一つの概念について、大変丁寧に説明されています。たとえば、「相関(および因果関係)」については、 2つの変数の同時分布と、その条件付き分布は、変数の間の数量的結び付きを示しています。この数量的結び付きは、統計的頻度分布として観察されるものであり、現象の背後にある実態的な「関係」や「構造」から導かれる法則性を必要としません。 例えば、人間の身長と体重とは密接な統計的分布関係を持っていますが、両変数を決定

    WEBで読める統計関係の良質な資料 - Interdisciplinary
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 〈統計学へのお誘い本リスト(11 Nov. 06 版)〉 - leeswijzer: een nieuwe leeszaal van dagboek

    → アップデート:〈6-September-2011版〉. 数理統計研修の受講生から,「統計学の参考図書を紹介してほしい」との依頼があったので,下記のような「お誘いリスト」をつくってみた.“門前”から“門”までの「参道」がやや長い気がするが,そこは気の迷いや逡巡が憑いてまわる相手のために,ということでご容赦を.また,いったん“入門”してしまった後は,手法ごとにそれぞれ適切な(中級書)がきっとあると思うが,上のリストではそこまでは考えていない.ただし,ぼくの担当している講義が「実験計画法」だったりするので,この分野については数冊選んで,リストに付けた.なお,〈R〉に関する参考書は別のリストを参照されたい. ご意見などありましたら,ご連絡ください. 門前で迷っている人のためのコミック系入門書 高橋信『マンガでわかる統計学』(2004年7月刊行,オーム社,ISBN:4274065707→版元

    〈統計学へのお誘い本リスト(11 Nov. 06 版)〉 - leeswijzer: een nieuwe leeszaal van dagboek
  • 統計学とは意味を考えずにデータを処理する方法 - Willyの脳内日記

    Apeescape さんにリンクを紹介して頂いた xkcd の 「学問分野を純度の順に並べてみた」の一コマを見て 統計屋の観点から一つコメントしておきたくなった。 このマンガにおける 「社会学 < 心理学 < 生物学 < 化学 < 物理 < 数学」 という順番は、左側が右側の分野の応用になっているという関係になっている。 ここで注目すべき点は、左側は右側から演繹的に導けると仮定している点にある。 しかし、実際にはノイズの問題や、計算量の問題、実証の規模の問題があり、 社会学をこの経路をたどって数学を使って演繹的に導くことは事実上不可能だろう。 ここで、統計屋が取るのが以下の方法だ。 「社会学 <- 統計学 < 数学」 ここで、"<-"は演繹的ではなく帰納的な方法によっている。 簡単に言えば、観察された事象の意味は考えずに分析するということだ。 こうした方法によって、統計学は途中のステップを

  • 1