gragra1185のブックマーク / 2018年1月16日

gragra1185 id:gragra1185

2018年1月16日のブックマーク (4件)

【Rでテキストマイニング】他人のタイムラインをWord Cloudで可視化してみる - Np-Urのデータ分析教室
前回は、PythonからTwitter APIを叩き、スピードワゴンの小沢さんのツイートをWord Cloudを使って可視化してみました。 www.randpy.tokyo この辺りの処理はRでも簡単にできるぞー！ということで、今回はRでTweet取得＆可視化に挑戦してみましょう。このようなテキストマイニングについて詳しく知りたいという方は、以下の2冊がとても分かりやすくおススメです。 Rによるテキストマイニング入門作者: 石田基広出版社/メーカー: 森北出版発売日: 2017/06/28メディア: 単行本この商品を含むブログ (1件) を見るRによるやさしいテキストマイニング: 機械学習編作者: 小林雄一郎出版社/メーカー: オーム社発売日: 2017/09/21メディア: 単行本この商品を含むブログを見るまた、今回は選挙が近く色々動きがあるので、・民進党代表：前原誠司さん（
gragra1185 2018/01/16
R
リンク
海坊主　蛸入道　（『百種怪談妖物双六』その10） - うきよのおはなし～江戸文学が崩し字と共に楽しく読めるブログ～
一寿斎芳員画『百種怪談妖物双六（むかしばなしばけものすごろく）』（安政五［1858］年刊） ※国会図書館の画像を利用しています。国立国会図書館デジタルコレクション - 百種怪談妖物双六新年の双六企画で出なかったコマの妖怪をちょこちょこ紹介していくシリーズです♪ ◆玄界洋（げんかいなだ）の海坊主（うみぼうず）◆ 一　たこ入（にう）だう二　やまびこ三　三つめ大僧（だいそう）四　かつぱ五　山をとこ海に現れて船を沈める系の妖怪ですね。船幽霊とキャラかぶりのような気がします（笑） kihiminhamame.hatena blog.com この手の伝承は各地にあったようなので、玄界灘としたのは、単に実在の地名を書いてリアリティーを出そうとしただけだと思われます。 ◆土佐海（とさうみ）の蛸入道（たこのにうだう）◆ 一　茂林寺（もりんじ）三　ひとつ目（め）四　見越入道（みこしにうだう）
gragra1185 2018/01/16
蛸入道の双六とはこれまたすごい。

interesting
リンク
【R】ふつうのスクリプト言語プログラマーのためのR言語入門 - 歩いたら休め
「他のスクリプト言語ならそれなりに触れるけど、Rって変な機能が多いから難しい」と感じている人のために、Rの独特な点、ハマりどころ、そして特にデータの集計での強力な機能やパッケージをまとめてみました。社内のデータリソース移行の作業の中で、前任者が（良い意味でも悪い意味でも）すごいRプログラマーだったのと、DBからのデータの取得からデータの整形・確認が一気に行えるという理由で久しぶりにRを触りました。（先輩！僕が「%>%ってなんですか？」みたいな質問すると、チャットでgithubのリンクを貼られたり、AdvancedRを薦められたりするの、めっちゃ困りました！）数年前Rを使っていたときは、 Rのプログラムってよくわからないなあ…、後から自分のコード見ても意味が読み取れないよ… Pythonでpandasとかmatplotlibってパッケージを使えばRっぽいことができるの？じゃあそっち使お
gragra1185 2018/01/16
R
リンク
Fisher's exact testが"正確”かどうか - r-statistics-fanの日記
https://oku.edu.mie-u.ac.jp/~okumura/stat/fisher-chisq.html https://twitter.com/genkuroki/status/910360137256325121 このあたりのFisher's exact testが"正確”かどうかという議論が勉強になるそれぞれの立場でそれぞれ一理ある前提として周辺度数の固定という条件を許容するかどうか P値について、理想の値に近いことを正確と表現するか、アルファエラーが保たれることを正確とするかで混乱しているように思う自分の認識は、 ”サンプルサイズが少ないときはカイ二乗検定ではアルファエラーが保たれないので Fisher's exact testを使用するべき” です。なぜなら、研究時に少ないNのデータで有意差を証明したとしても、もしアルファエラーが保たれない可能性がある手
gragra1185 2018/01/16
R
リンク
- 2018年1月19日
- 2018年1月16日
- 2018年1月15日