タグ

ブックマーク / blog.statsbeginner.net (5)

  • RでTwitterのデータを分析するための準備(2015年6月現在のやり方) - StatsBeginner: 初学者の統計学習ノート

    RでTwitterを触る方法 Twitterのデータを分析しようと思って、手始めに{twitteR}というパッケージを触ってみました*1。 導入前にやることがいくつかあるのですが、ググって出てきた解説サイトに書いてあったとおりにやってみると失敗して数時間苦しみましたので*2、一応利用開始に至った道のりをメモしておきます。他にやる人がいたら参考にしてください。 なんかですね、RでTwitterAPIを触る方法に関する記事は昔のものも含め色々みつかるのですが、Twitter側の仕様やRのパッケージの仕様の変更なども微妙に生じていて、どの記事のどこの部分が現行なのかというのがよく分からなかったりします。 なので、2015年6月20日現在やるならこうです、という意味でエントリを起こしておきます。ちなみに私はR for Mac OS X GUI(3.0.2)のコンソールで操作しており、ターミナルや

    RでTwitterのデータを分析するための準備(2015年6月現在のやり方) - StatsBeginner: 初学者の統計学習ノート
  • 信頼区間の意味と、Rのpredict()関数の使い方の注意点 - StatsBeginner: 初学者の統計学習ノート

    信頼区間とはなんぞやというのをメモしておこうと思って、簡単なデータで回帰分析を行って図をつくろうかと思ったら、Rのpredict()関数の使い方に落とし穴があったので復習がてらメモ……。 とりあえず単回帰分析する Rの練習用データセット「cars」をつかいます。*1 車のスピードと制動距離(or 停止距離)ですかね。 > head(cars) # Rの練習用データセット「cars」の中身 speed dist 1 4 2 2 4 10 3 7 4 4 7 22 5 8 16 6 9 10 相関係数と散布図をみておきます。 > cor(cars$speed, cars$dist) [1] 0.8068949 > plot(cars) とりあえず回帰分析します。 # lm()で回帰分析 > cars.lm <- lm(dist ~ speed, data=cars) > summary(car

    信頼区間の意味と、Rのpredict()関数の使い方の注意点 - StatsBeginner: 初学者の統計学習ノート
  • 『入門 機械学習』第3章:ベイズスパム分類器の作成 - StatsBeginner: 初学者の統計学習ノート

    けっこうやっかいな教科書 オライリーの『入門 機械学習』という教科書を、半年ぐらい前に3分の1ぐらい読んで、内容をまとめたりはせずにほっといたのですが、このたび実際にRでコードを写経しながら走らせてみたりしたので、学習ノートとしてエントリを起こしておこうかと思います。 入門 機械学習 作者: Drew Conway,John Myles White,萩原正人,奥野陽,水野貴明,木下哲也出版社/メーカー: オライリージャパン発売日: 2012/12/22メディア: 大型購入: 2人 クリック: 41回この商品を含むブログ (11件) を見る 機械学習の入門的な教科書としては、理論のとして『わかパタ』『続・わかパタ』をそれぞれ途中まで読んだという中途半端な状態ですがw、コーディングのとしては、RでやるものとPythonでやるものを1冊ずつぐらいやろうかなと思っておりました。 それでRのも

    『入門 機械学習』第3章:ベイズスパム分類器の作成 - StatsBeginner: 初学者の統計学習ノート
  • 勉強会:主成分分析・因子分析(金明哲『Rによるデータサイエンス』) - StatsBeginner: 初学者の統計学習ノート

    今回の勉強会 こないだの日曜日は友人とやっている週次の統計勉強会で、金明哲『Rによるデータサイエンス』の主成分分析の章と因子分析の章を扱いました。 Rによるデータサイエンス - データ解析の基礎から最新手法まで 作者: 金明哲出版社/メーカー: 森北出版発売日: 2007/10/13メディア: 単行(ソフトカバー)購入: 36人 クリック: 694回この商品を含むブログ (59件) を見る 多変量解析の教科書で理論的な学習は終えた上で、演習としてRでの分析を実行してみるという位置づけです。主成分分析と因子分析についての理論的な説明も、一応この教科書に少し書いてありますが、基的にはRの演習がメインの教科書なので、考え方や数式の展開などの解説は別書で読むべきでしょう。(我々の勉強会では、永田・棟近『多変量解析入門』を使用しました。過去のエントリ参照。) なお、次回の勉強会では永田・棟近『多

    勉強会:主成分分析・因子分析(金明哲『Rによるデータサイエンス』) - StatsBeginner: 初学者の統計学習ノート
  • 因子分析の勉強(永田・棟近『多変量解析法入門』) - StatsBeginner: 初学者の統計学習ノート

    因子分析の勉強 昨日は、友人とやっている勉強会で、因子分析の勉強をした。教科書は、永田・棟近『多変量解析法入門』の第13章(の一部)。神テキストです。 多変量解析法入門 (ライブラリ新数学大系) 作者: 永田靖,棟近雅彦出版社/メーカー: サイエンス社発売日: 2001/04メディア: 単行購入: 2人 クリック: 9回この商品を含むブログ (1件) を見る この教科書では因子分析の扱いは大きくなく、主成分分析には1章が当てられているのに対して因子分析は「その他の方法」の一つとしてしか取り上げられてなくて、約9ページ分しか解説はないのだが、それでも説明と数式の展開が分かりやすいので助かる。また、主成分分析との理論的な関係が分かりやすい。(主成分分析の章については以前のエントリを参照。) 因子分析については、我々の勉強会では南風原『心理統計学の基礎』という教科書で既に勉強していたのだが、そ

    因子分析の勉強(永田・棟近『多変量解析法入門』) - StatsBeginner: 初学者の統計学習ノート
  • 1