ブックマーク / hoxo-m.hatenablog.com (9)

  • ベイズ統計の入門書が出版ラッシュなのでまとめてみた - ほくそ笑む

    【宣伝】2016/09/14 このページに来た方へ。あなたが求めているはこれです。 StanとRでベイズ統計モデリング (Wonderful R) 作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/25メディア: 単行この商品を含むブログ (10件) を見るまずこれを予約してから下記を読むといいです。 【宣伝終】 最近、ベイズ統計の入門書がたくさん出版されているので、ここで一旦まとめてみようと思います。 1. 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門 (2015/6/25) 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門 作者: 豊田秀樹出版社/メーカー: 朝倉書店発売日: 2015/06/25メディア: 単行この商品を含むブログ (6件) を見る データ分析業界ではかなり有名な豊田秀樹先生のです

    ベイズ統計の入門書が出版ラッシュなのでまとめてみた - ほくそ笑む
  • データの不備を統計的に見抜く (Gelman's Secret Weapon) - ほくそ笑む

    リクルートの高柳さん、Yahooの簑田さんと共同で翻訳したが出版されます。 「みんなのR」(原題:R for Everyone)です。 みんなのR -データ分析と統計解析の新しい教科書- 作者: Jared P. Lander,Tokyo.R(協力),高柳慎一,牧山幸史,簑田高志出版社/メーカー: マイナビ発売日: 2015/06/30メディア: 単行(ソフトカバー)この商品を含むブログ (7件) を見る このは、統計言語 R のインストール・基的な使い方から始まり、統計解析の基礎からちょっと高度な話題まで、幅広く取り扱っています。 特徴としては、 RStudio の使用を推奨 グラフィクスはすべて ggplot2 を使用 plyr, data.table, stringr といった、モダンな便利パッケージを使用*1 説明に使用されるデータはすべて Web からダウンロード可能 R

    データの不備を統計的に見抜く (Gelman's Secret Weapon) - ほくそ笑む
  • 実践 統計モデリング入門 【1. 概要・目次】 - ほくそ笑む

    【宣伝】2016/09/14 このページに来た方へ。あなたが求めているはこれです。 StanとRでベイズ統計モデリング (Wonderful R) 作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/25メディア: 単行この商品を含むブログ (10件) を見るまずこれを予約してから下記を読むといいです。 【宣伝終】 はじめに 統計モデリングは今後ますます重要になってくる技術です。 現在、Web 上には統計モデリングに関する様々な優良記事があります。 それらの記事は、完成したモデルをスマートに提示しているものが多いようです。 しかし、実際の統計モデリングの現場は決してスマートなものではなく、様々な泥臭い試行錯誤を行いながら地道にモデルを構築していきます。 この一連の記事では、最終的なモデルの完成形をいきなり提示するのではなく、モデル構築の手順をスッテプバイス

    実践 統計モデリング入門 【1. 概要・目次】 - ほくそ笑む
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • RFM 分析を簡単に実行できる R パッケージ easyRFM を作った - ほくそ笑む

    ※この記事は R Advent Calendar 2014 - Qiita の 11 日目の記事です。 はじめに RFM 分析は、マーケティングの顧客分析でよく使われる手法です。 Recency(いつ買ったか)、Frequency(何回買ったか)、Monetary(いくら使ったか)を指標として、顧客をグループ化します。 RFM 分析が何なのか、何に使えるのかは、次のサイトの記事を読めば理解できると思います。 顧客分析の手法 #RFM分析 しかし、実際のデータにこの手法を適用しようと思ったとき、困ったことになります。 どのようにランクを区切ったら良いのか分からないのです。 上記のサイトにもこう書いてあります。 ランクをどこで区切るかは重要な問題で、業種、業界、商品や分析を行なう時期や、用いるデータの期間などによって、分けかたを慎重に検討する必要があります。 このランクを区切るという重要かつ難

    RFM 分析を簡単に実行できる R パッケージ easyRFM を作った - ほくそ笑む
  • R で超簡単に並列処理を書けるパッケージ pforeach を作った - ほくそ笑む

    ※この記事は R Advent Calendar 2014 : ATND の 22 日目の記事です。 0. この記事の要約 R の foreach パッケージを改良して、デフォルトで並列計算するようにしたパッケージ pforeach を作りました。 pforeach - Easy to parallel processing in R これにより、R での並列計算を下記のようにシンプルに書くことができます。 library(pforeach) pforeach(i = 1:100)({ i ** 2 }) これは、従来の foreach で次のように書いたものと同じ動作をします。 library(foreach) library(doParallel) cl <- makeCluster(detectCores()) registerDoParallel(cl) foreach(i = 1

    R で超簡単に並列処理を書けるパッケージ pforeach を作った - ほくそ笑む
    masadream
    masadream 2015/01/03
    これは素晴らしい。すごい使いやすそう。
  • ビジネス側の人がデータ分析できるようになるために最初に読むべき一冊 - ほくそ笑む

    我らが TJO 氏の初の単著が Amazon で酷評を受けていると聞いてやってきました。 手を動かしながら学ぶ ビジネスに活かすデータマイニング 作者: 尾崎隆出版社/メーカー: 技術評論社発売日: 2014/08/22メディア: 単行(ソフトカバー)この商品を含むブログ (6件) を見る 難解な専門用語が多すぎるとか、後半は読者を置いてけぼりだとか、さんざんな言われようです。 今回、実際にこのを読んでみて、Amazon のレビューは正しい面もあるが、悪い面ばかりをとらえすぎていると思いました。 評価の良いレビューもあるのに、悪評価だけが上に上がっているのもおかしいです。 このが役に立ったという人の意見にも耳を傾けるべきです。 まず、私がこのを通して読んでみて思ったのは、マーケターのようなビジネス側の人間がデータ分析を学ぶのにいいなあということです。 説明は平易だし、出てくるプログ

    ビジネス側の人がデータ分析できるようになるために最初に読むべき一冊 - ほくそ笑む
  • 欠測データの相関係数の推定法について発表しました - ほくそ笑む

    先日行われた BUGS/stan勉強会 #3 で発表させていただきました。 タイトルは「Stan で欠測データの相関係数を推定してみた」です。 欠測データに対して相関係数を求めるとき、普通のやり方では実際の値より小さい値になってしまいます。そこで、片側だけしか観測できていない不完全データを用いて推定精度を上げる方法を紹介しています。 スライドは下記にアップしています。 Stan で欠測データの相関係数を推定してみた from hoxo_m 最終的なコード全体はこちらに載せています。 Stan の勉強にあたっては、ごみ箱さん、beroberoさん、伊東さんにアドバイスを頂きました。ありがとうございます。 hoxo_mさんのバイアスの掛かったデータの相関係数の問題、よく使われる統計手法からの発展としてすごくいい例だし、片方しか観測されていないデータを使ってもあれほど改善するとは驚いた。#Tok

    欠測データの相関係数の推定法について発表しました - ほくそ笑む
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
  • 1