タグ

統計学に関するI_am_Prowrestlerのブックマーク (18)

  • 統計学とRStudioの組み合わせがやばい|加藤貞顕

    ピースオブケイクでは、週に1度、数学の先生に来ていただいて、勉強会をやっている。ちょうど1年くらい前に有志メンバーではじめて、最初は線形代数、次に微分積分、次に機械学習を学んだ。 それで、いまやっているのは統計学なんだけど、今まででいちばん頭に入りにくい気がする。なんというか、納得感が低いのだ。 もちろん、先生のせいではまったくなく、こちらのレベルの問題なんだけど、入門向けに話してもらうと、いろんな理屈が「天下り」的に降ってくることになる(例:なんで標のときはn-1で割るの?)。かといってその根拠を、ちゃんと説明してもらうともっとわからない。 ひとつの手は、実用工学として、ツールとして、使い方を覚えて割り切って使うことだろう。たぶん、そうするのが正解なのだと思うけど、その場合でも、ツールの「手触り」を体感して納得してから覚えたい。 と思っていたら、先生に「Rつかえば? 便利だよ」とご紹介

    統計学とRStudioの組み合わせがやばい|加藤貞顕
  • http://wofwof.blog60.fc2.com/

    中学生の娘はこの夏、近所の学校で開かれてる夏期講習を取っている。 自分で教えるのはやめたが、何をやったかくらいは2〜3日に一度聞くようにしている。 今日は確率をやったらしい。 私「お〜い、娘。今日の夏期講習は何やった?」 娘「確率。」 私「どんな問題やった?」 娘「例えばA,B,C,D,Eの5人が並ぶ時の並び方は何通りあるかとか。」 私「それ確率じゃないじゃん。」 娘「えっと、ある並び方をする確率はいくつかとか。」 私「AさんとBさんが仲良くていつも隣同士だったら、実現しない並び方もあるんでは?」 娘「そういう実際の確率とは違うんだけどね。」 私「実際の確率じゃないなら何を求めたの?」 娘「誰が好きとか、隣になりやすいとか一切ないって考えて計算するの。」 私「"同様に確からしい"っていう前提を置いて計算するってことだね。 ところでペニー硬貨をスピンさせた時に表が出る確率はどのくらいでしょう

  • 2014年春版:初心者にお薦めする「本当にゼロから統計学と機械学習の基礎を学ぶ」ための6冊 - 渋谷駅前で働くデータサイエンティストのブログ

    前回リストの記事から半年ぐらい経ちましたよー、ということで初心者向けに関しても書籍リストをアップデートした最新版のリストをお送りします。あまり中身が変わってないかもしれませんが、かぶっているは良いだということで(笑)。 ところで、昨年秋に比べると「これから統計学・機械学習について学びたい!」という人たちの動機が変わってきているような気がしなくもないんですね。以前は主に「エンジニアでこれからデータ分析について学びたい」という層が多かったんですが、最近になって「営業や企画をやっているんだけど数字を見る際にデータ分析とか知っていると良いことがありそう」という層が増えてきているように見聞します*1。 そういう意味で言うと「エンジニア向けのを推薦するのが必ずしもベストとは限らない」という側面もありそうなんですが、それは次回までの宿題ということで、今回も基的にはエンジニア向けのを一旦揃えてみ

    2014年春版:初心者にお薦めする「本当にゼロから統計学と機械学習の基礎を学ぶ」ための6冊 - 渋谷駅前で働くデータサイエンティストのブログ
  • 社会人が統計学や機械学習を学ぶなら「落下傘方式」で - 渋谷駅前で働くデータサイエンティストのブログ

    今日何気なく呟いたツイートが、見ていたら結構RT&favされていた模様で。 社会人が統計学とか機械学習を独習するには、いわゆる「落下傘方式」が良いと思う。必要な時にその項目だけ学んで実践する。その繰り返しで学問体系のマス目が埋まっていけば良し。あと、初めに体系立ったテキストを分からなくても良いので通読するのも良し。だいたいの地図が頭に入る。— TJO (@TJO_datasci) 2014, 3月 31 この後も色々補足で呟いたんですが、せっかくなので簡単にまとめたものを書いてみました。これから社会人で統計学や機械学習を学ぼうと考えている人の参考になれば嬉しいです。 あ、これはベタな言い方をすれば「データサイエンティスト(死語)になるにはどうしたら良いか」にもつながる話なんですが、ここではもっと広く「統計学や機械学習を使う仕事をしたいと思ったらどう独習するべきか」という話にしておこうと思い

    社会人が統計学や機械学習を学ぶなら「落下傘方式」で - 渋谷駅前で働くデータサイエンティストのブログ
  • 実践! Rで学ぶ統計解析の基礎 - @IT

    Rは統計解析のブッシュナイフだ 実践! Rで学ぶ統計解析の基礎(1) オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しよう!

  • 最近の会社での統計学普及の取り組みと入門書について - Kentaro Kuribayashi's blog

    データサイエンティストブームですね。というのはおいといて、弊社でも統計学をいろんなひと(特にディレクタやデザイナとか)が学んで使えるようになるといいよねという感じで、みんなで勉強しよう!みたいなことをしています。今日は、若手敏腕ディレクタのzaimyが、下記資料に基づく勉強会をしてくれました。 http://www.storyboards.jp/viewer/u0arvn 僕も目下勉強中なのでなんもわからないのですが、読んだのうち、統計学に馴染みのない人向けでよかったものについて社内向けにまとめてみたので、こちらにも転載しておきます。 完全独習 統計学入門 作者: 小島寛之出版社/メーカー: ダイヤモンド社発売日: 2013/06/17メディア: Kindle版この商品を含むブログ (2件) を見る これが一番オススメです。見た目は固そうですが、簡単だし、内容もいいと思います。Kindl

    最近の会社での統計学普及の取り組みと入門書について - Kentaro Kuribayashi's blog
  • 伝説のベイジアン先生にベイズの基礎を教えてもらえる「図解・ベイズ統計「超」入門」を読んだ - EchizenBlog-Zwei

    「図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術」というを読んだ。 社会人のアヤとケンが社内研修で伝説のベイジアン先生からベイズの基礎を教わる、という設定の会話形式でベイズについて書かれた入門書。社内研修でベイズのプロから指導を受けるとかどんだけ恵まれてるんだ。 アヤさんは大学で統計をやったが数学は詳しくないという設定。ただ時々鋭い質問をする。また統計に詳しいイケメン兄がいる。 ケンくんは知識は全くなく最後まで「わかりません」を連発する。彼女持ちのリア充。 伝説のベイジアン先生は社内研修の講師。ベイズの基礎を豊富な具体例で教えてくれるまじぱない先生。あまりにもいけてるので数カ月後に転職しそうな感じ。 内容は1章が導入、2章が同時確率・条件付き確率、3章がベイズの定理、4章がベイズの定理を用いた事後確率計算の具体例、5章が事例の追加による事前確率の更新(具体例としてナイ

    伝説のベイジアン先生にベイズの基礎を教えてもらえる「図解・ベイズ統計「超」入門」を読んだ - EchizenBlog-Zwei
  • 今回は因果関係があるのに相関関係が見られない4つのケースをまとめてみた(前編:検定力が低い) - Take a Risk:林岳彦の研究メモ

    どもお久しぶりです。林岳彦です。ローソンなどで売ってるいなばのタイカレーはそうめんのつけ汁として使ってもマジうまいのでオススメです。 さて。 今回は前々回の記事: 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ の続編として、逆のケースとなる「因果関係があるのに相関関係が見られない」ケースについて見ていきたいと思います。あんまり長いと読むのも書くのも大変なので、今回はまずは前編として「検定力の問題」に絞って書いていきます。 (*今回は上記の前々回の記事での記述を下敷きに書いていきますので、分からないところがあったら適宜前々回の記事をご参照ください) まずは(今回の記事における)用語の定義:「相関」と「因果」 今回も少しややこしい話になると思うので、まずは用語の定義をしておきたいと思います。(*細かいと

    今回は因果関係があるのに相関関係が見られない4つのケースをまとめてみた(前編:検定力が低い) - Take a Risk:林岳彦の研究メモ
  • オンラインで無料で読める統計書22冊|Colorless Green Ideas

    はじめに 今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれたが多いが、日語で書かれたも若干ある。 入門書 まず、統計の初学者のために書かれた入門書を紹介したいと思う。 福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。 小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論

    オンラインで無料で読める統計書22冊|Colorless Green Ideas
  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
  • R言語で統計解析入門: 目次1 テクニカルデータプレゼンテーション  梶山 喜一郎

    Technical Data presentation in R コピペで学ぶ Rでテクニカルデータプレゼンテーション 1.基礎統計解析編 グラフィックス・リテラシ-教育: 「図学 I ・図形情報 I ・統計学」科目 修了後のコースウェア 福岡大学工学部図学教室   梶山 喜一郎 ・つまみいで,学習しないように願います. ・データの可視化を体系・系統だったスキルにするために順を追って学習する. ・統計ブームに乗っている学習者も先人に感謝の気持ちを.さらに, ・確かなスキルにするために,教科書・解説書を理解し,Rスクリプトで確認. A. はじめに--ここは統計・解析の必要を味わった後で読めばよい まず,統計の手続きを実行する.慣れたら統計的に考えよう. 学校の統計学を復習--買った教科書とノートをまた読むだけ a. 測定と尺度 Measurement and scale b. 記述統計学の

  • 統計学入門

    さて皆さん、「数字は魔物、統計は数字のトリック」などと言われ、統計学はある人々からは疫病神のように忌みに嫌われ、またある人々からは金科玉条のごとく無条件に信奉され、はたまた別の人々からは塵芥のごとく無視されています。 しかしやかましくいわれている割には、その質が十分理解されているとはいい難いのが現状ではないでしょうか? 研究現場の研究者が統計手法を利用する時に犯す間違いのうち、ほぼ90%のものが非常に初歩的なものです。 そしてそれらの間違いは研究者が統計学の基的な事柄をはっきりと理解していないか、あるいはそれらを誤解していることが原因になっています。 例えば研究現場でしばしば間違って使われている統計手法のベスト3は次のようなものです。 有意確率(p値)と「有意差あり」の意味 標準偏差(SD)と標準誤差(SE)の使い分け 多重比較の使用方法 これらは全て非常に初歩的かつ基的なことです。

  • 今すぐ使える『明日からつかえるシンプル統計学』

    まちがえるな、統計学は道具だ。統計は学ぶものではなく、使うもの。 これはわたし自身への戒言。だから、使い方を誤らない程度に理解していればいいし、そのために教科書をイチから読み込む必要も、Rをマスターする必要もない。もちろん様々な武器(統計手法)が使えるに越したことはないが、次のような問題と向き合っているなら、書をオススメする。 あと500人お客を呼び込むためには、いくら広告費が必要か? カスタードケーキがチョコパイに勝つには、「味の改良」と「販促キャンペーン強化」のどちらが有効か? クラス全体の成績が低迷している。国語と数学の両方が苦手な生徒だけ補習したほうがいいのか、全員に国語の補習をしたほうがいいのか 前任者から引き継いだデータが大量にあるが、それぞれの関係や着眼点がまとめられてない。どこから手をつければいいか? 社内のKPI(Key Performance Indicator :

    今すぐ使える『明日からつかえるシンプル統計学』
  • 統計学入門−目次

    最終更新日:2022年08月24日 前口上へ 第1章へ webmaster@snap-tck.com Copyleft (C) 2000 SNAP(Sugimoto Norio Art Production)

  • 佐藤吉宗先生の統計学入門(1)-偽陽性問題-

    Yoshihiro Sato @yoshisatose 最近、TLで偽陽性の話題を目にするので、一つ練習問題を紹介します。これは昨秋、私が担当している統計学(1年生向け)の試験で出題した問題で、あとで複数の学生から「とても面白い問題だった」という反応がありました。「ベイズの定理」の問題なので、分かる人には簡単です。四則演算で解けます。 Yoshihiro Sato @yoshisatose 【問題】 人口の5%がある病気に罹っているとします。この病気に罹っているかどうかを確かめる検査があるのですが完全なものではなく、病気に実際に罹っている人が受けると90%の確率で陽性となり、病気に罹っていない人が受けると90%の確率で陰性と出ます。(続く…)

    佐藤吉宗先生の統計学入門(1)-偽陽性問題-
  • 若き経済学者のアメリカ

    もちろん僕はそういうアツさが決してキライではない。だから確かに一読の価値はある内容だとは思う。ただ、「これからの10年で最もセクシーな職業」というハル・ヴァリアンの有名な台詞に言及してはいるものの、書の中身からは統計学のセクシーさが最後まで伝わって来なかったのが、個人的にはとても残念でならない。 以下の3冊と比肩するくらいの、セクシーでワイルドでエキサイティングな統計学書が登場したかと思ったのだが、果たしてそれは期待し過ぎだっただろうか。

  • マンガでわかる統計学で、統計を学び直す - $shibayu36->blog;

    最近Webサービス開発する際に統計学がある程度使えそうと思って、勉強しようと思っている。それで最近買ったのが以下の。 統計学の基礎―カラーイメージで学ぶ 作者:市原 清志,佐藤 正一日教育研究センターAmazon ただ、買ったはいいものの、自分には少し難しく、あーまた統計の勉強挫折しそうだなー*1と感じていた。それでここでまた挫折するのは嫌だなーと思って、少しレベルを落として、《Gunosy》開発チームが厳選、WEB業界人が読むべき“統計学”の必読書ベスト5 | キャリアハックにも紹介されていた「マンガでわかる統計学」を買った。 マンガでわかる統計学 作者:信, 高橋,トレンドプロオーム社Amazon このが統計学をこれまで避け続けてきた自分にとって非常に良かった。 2時間くらいでさっと読み終わることが出来る 統計学を学ぶ上でのはじめの一歩の部分がよくまとまっている データの種類とか

    マンガでわかる統計学で、統計を学び直す - $shibayu36->blog;
  • 【データ分析】『統計学が最強の学問である』西内 啓 : マインドマップ的読書感想文

    統計学が最強の学問である 【の概要】◆今日ご紹介するのは、先日の「未読・気になる」の記事でも人気だった1冊。 サブタイトルとして「データ社会を生きぬくための武器と教養」とあり、なるほどそうだと感じいりました。 アマゾンの内容紹介から一部引用。あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。 「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人が、その当の魅力とパワフルさを知っているだろうか。 私はぶっちゃけ「超文系人間」ですが、書に目を通しておいて良かったと思っております。 いつも応援ありがとうございます! 【ポイント】■1.統計的にあみだくじは端が当たりにくい 友人たちのクセなのか、人間心理の傾向なのか、両端の縦棒を先に選ばれたことはほ

  • 1