タグ

statisticsに関するTYKのブックマーク (189)

  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • はてなブログ | 無料ブログを作成しよう

    うめぇヨーグルトソースでもいかがですか。個人差にもよりますが。もしよろしければ。 お久しぶりです。 最近うんめぇ〜と思ってるヨーグルトソースがあるので、書いていこうと思います。 ヨーグルトとハーブ類をもりもり使うので、そういうのがべられない方にはうんめぇソースではないです。ごめんなさい…。もしよろしければお茶だけも…旦~ 【用意する…

    はてなブログ | 無料ブログを作成しよう
  • Rと手作業で覚える最尤法 - 餡子付゛録゛

    OLSより進んだ統計手法で最初に覚えるのは最尤法だと思います。大半の人はツールとして知っていて、あまり中身を意識していない気がするのですが、「尤度」の説明無しで『尤度が最大になるパラメーターを求める方法』と言う説明が横行しているのは、問題があるかも知れません。 最尤法は、ある分布から観測値が取り出されたとして、“そうなる確率”が最も高くなるように分布の具体的な形状を決めるやり方です。“そうなる確率”を尤度と言います。こう書くと易しい事なのか難しい事なのか判別もつかないと思うので、実際に最尤法を解いてみましょう。 まず、何も考えずにトライ&エラーで最尤法を試みるやり方を説明した後に、教科書的な最尤法の解法を説明します。 1. 何も考えずにトライ&エラーで最尤法を試みる ある正規分布から値を3つ取り出したら、11 13 23だったとしましょう。このサンプルが“もっともらしい”正規分布の平均と分

  • ベイズ推定を知っているフリをするための知識

    最近はベイジアンが増えてきて、実用分野での利用も進んでいるようだ。話題としては知っておきたいが、世間一般には理解に混乱を生んでいるようだ。 ベイズ推定は入門レベルの統計学の教科書ではオマケ的な扱いがされており、実際に伝統的な統計手法を拡張している面が強い。そういう意味では、誤解や混乱があっても仕方が無い。 利用する必要があるのか無いのか良く分からない点も多いのだが、知らないと告白するのも気恥ずかしいかも知れない。自分ではベイズ推定で分析を行わない人が、ベイズ信者と話をあわせるために最低限知っておくべき事をまとめてみた。 1. ベイズ推定とは何か? ベイズ推定とは、ベイズの定理を応用した推定手法だ。端的に理解するためには、最尤法に事前確率を導入している事だけ覚えれば良い。これで哲学的議論を全て回避してベイズ推定を把握することができる。 下の(1)式ではπ(θ)が事前確率、π(θ|x)が事後確

    ベイズ推定を知っているフリをするための知識
  • はてなブログ | 無料ブログを作成しよう

    思いは言葉に。 はてなブログは、あなたの思いや考えを残したり、 さまざまな人が綴った多様な価値観に触れたりできる場所です。

    はてなブログ | 無料ブログを作成しよう
  • 説明と選抜:統計学における2つの「関心」 - 社会学者の研究メモ

    社会学者や経済学者にとって、統計学をベースにした計量分析とは、何かを因果的に説明する道具であるという側面がある。賃金を学歴で説明するというとき、それは他の条件が同じで学歴が変化したときの賃金の変化量を推定する、という意味である。 (記述的な分析手法を含めて)統計学を学ぶ人のほとんどは、この「説明(explanation)」のためにそれを学んでいるのだと考えられる。 しかし統計学には、それとは全く異なった目的が託されることもある。それは「選抜(selection)」である。統計学を選抜に使うというのは、それをアカデミックに活用している研究者からみても、実はあまり馴染みのない考え方である。というのも、あとで詳しく述べるが、選抜は学問的説明とは相容れない考え方だからだ。 しかし選抜は、実践家においては大いに意味がある考え方である。「限られた回数の耐久力テストの結果から、真に優れた個体を選抜する」

    説明と選抜:統計学における2つの「関心」 - 社会学者の研究メモ
  • Would You Rather Questions

    Would you rather questionsYour classic "Would you rather?" questions are on rrrather. Play below by clicking on your choice, or use this list as a conversation starter. Compare your answer to the votes of others.

    TYK
    TYK 2012/01/22
    天地創造説vsビッグバン
  • ジャンケンで勝つ確率を上げる簡単な方法 | ライフハッカー・ジャパン

    「パー、グー、チョキの順に手を出すと、ジャンケンで勝つ確率が高い」という話を幼い日に聞いたことがあります。その理由は、「相手はグー、チョキ、パーの順に手を出すことが多いから」という単純なものでした。科学的根拠など知る由もなく、友達が言っていたことをそのまま信じてジャンケンをしていたものです。 さてこのジャンケン、実際には手の出し方はそれぞれ1/3とはならないようで、人には出す手の「クセ」があるようなのです。ある大学教授が学生725人を使って実験を行なっているので、ここにご紹介します。 Photo by Thinkstock/Getty Images. 2009年6月20日の日経済新聞土曜版「日経プラスワン」に、桜美林大学の芳沢光雄教授による「ジャンケンに関する研究結果」が掲載されました。芳沢教授が学生725人を集めて、のべ11567回ジャンケンさせたところ、人間の手の出し方はグー、キョキ

    ジャンケンで勝つ確率を上げる簡単な方法 | ライフハッカー・ジャパン
    TYK
    TYK 2012/01/21
    じゃんけん
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
  • Twitter / あんちべ!: Rによる言語の類型化 http://t.co/6F ...

  • biostatisticsryangosling

    biostatisticsryangosling 1.5M ratings 277k ratings See, that’s what the app is perfect for. Sounds perfect Wahhhh, I don’t wanna

    biostatisticsryangosling
    TYK
    TYK 2011/12/07
    統計学者のナンパのしかた
  • Rユーザ会で「RではじめるTwitter解析」を発表してきました - あらびき日記

    この記事は abicky.net の Rユーザ会で「RではじめるTwitter解析」を発表してきました に移行しました

    Rユーザ会で「RではじめるTwitter解析」を発表してきました - あらびき日記
  • Error - Cookies Turned Off

    TYK
    TYK 2011/11/23
    統計検定におけるeffect size算出のススメ(EJN) http://bit.ly/vgnVC5 Matlabファンクション http://bit.ly/ucZwqk
  • ミクの歌って覚える統計入門

    VOCALOID 初音ミクの歌のパワーで、統計の基礎を楽しく学んじゃおう。 もうつまらない教科書はいらない!

  • 君が出した有意差に意味はあるのか

    あ〜る菊池誠(反緊縮)公式 @kikumaco えーっとね、有意差の話は 「生物学を学ぶ人のための統計のはなし―きみにも出せる有意差」(粕谷英一、文一総合出版) 。これはなかなかいいだと思います。これ読むと、他人の論文でやってるインチキがわかる(^^ 2011-11-03 22:08:45

    君が出した有意差に意味はあるのか
  • ポテトの長さの分布

    Tencuss @tencuss 極端に短いものが入っていることがあるから無理ではないかと。 QT @fffw2: マクドナルドのフライドポテトの長さの統計を取ったら、ちゃんと正規分布になるのかな? 2011-11-04 19:10:01

    ポテトの長さの分布
  • みかんの実の数は本当に10袋なのか?

    風霊守 @fffw2 みかんはヘタを取って、維管束の断面の数を数えて、中に入っている房の数を推測してから、べる。これが冬の楽しみ。 2010-11-15 13:10:31

    みかんの実の数は本当に10袋なのか?
  • 統計学の読み物&海外ドラマ - データサイエンティスト上がりのDX参謀・起業家

    ツイッターで統計学の読み物を教えて欲しいと言われましたので、今まで眺めてきたの中から3冊紹介したいと思います。 読み物 統計学を拓いた異才たち―経験則から科学へ進展した一世紀 作者: デイヴィッドサルツブルグ,David S. Salsburg,竹内惠行,熊谷悦生出版社/メーカー: 日経済新聞社発売日: 2006/03/20メディア: 単行購入: 28人 クリック: 366回この商品を含むブログ (90件) を見る 過去の統計家の偉人達のエピソードをまとめたです。最も多く利用されるt検定がどうやって産まれたかとかいろいろ書いてあります。 その数学が戦略を決める (文春文庫) 作者: イアンエアーズ,Ian Ayres,山形浩生出版社/メーカー: 文藝春秋発売日: 2010/06/10メディア: 文庫購入: 34人 クリック: 303回この商品を含むブログ (76件) を見る 古典的

    統計学の読み物&海外ドラマ - データサイエンティスト上がりのDX参謀・起業家
  • R言語で構造方程式モデリング その1 - yokkunsの日記

    行動科学などの領域では、重さや長さのように直接観測可能な特性だけでなく、「先高感」「知能」「ブランドイメージ」のように直接測定出来ない特性である構成概念(潜在変数)を扱う必要がある。 構造方程式モデリングは、構成概念や観測変数の性質を調べるために集めた多くの観測変数を同時に分析するための統計的方法。 構造方程式モデリング 多変量解析の1手法 第2世代の多変量解析 伝統的な統計手法を下位モデルとして実行可能 因子分析法 多変量解析 パス解析法 時系列解析 etc... 変数の分類 方程式モデルには、様々な種類の変数が登場するため、ここでは、3つの観点から分類しその性質を確認する 観測変数と潜在変数 観測変数 : 直接観測出来る変数。 潜在変数 : モデルに導入した直接観測出来ない変数。構成概念 構造変数と誤差変数 構造変数 : 考察の対象となっている構成概念を含んでいる変数 誤差変数 : 考

    R言語で構造方程式モデリング その1 - yokkunsの日記
  • Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~

    Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。 ・姫路市役所での事例 これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。 ※まだ不完全ですが情報を入手し次第アップデートしていきます。 1. 資料を探す場所 CRAN R体、パッケージ、PDF資料などの置き場 Task Viewに分野ごとのまとめ Searchでパッケージや資料の検索 CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw) Rjpwiki 日語で書かれている、これまでのRに関する資料の集大成 データの加工技、

    Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~