2018年1月16日のブックマーク (4件)

  • 【Rでテキストマイニング】他人のタイムラインをWord Cloudで可視化してみる - Np-Urのデータ分析教室

    前回は、PythonからTwitter APIを叩き、スピードワゴンの小沢さんのツイートをWord Cloudを使って可視化してみました。 www.randpy.tokyo この辺りの処理はRでも簡単にできるぞー! ということで、今回はRでTweet取得&可視化に挑戦してみましょう。 このようなテキストマイニングについて詳しく知りたいという方は、以下の2冊がとても分かりやすくおススメです。 Rによるテキストマイニング入門 作者: 石田基広出版社/メーカー: 森北出版発売日: 2017/06/28メディア: 単行この商品を含むブログ (1件) を見るRによるやさしいテキストマイニング: 機械学習編 作者: 小林雄一郎出版社/メーカー: オーム社発売日: 2017/09/21メディア: 単行この商品を含むブログを見る また、今回は選挙が近く色々動きがあるので、 ・民進党代表:前原誠司さん(

    【Rでテキストマイニング】他人のタイムラインをWord Cloudで可視化してみる - Np-Urのデータ分析教室
    gragra1185
    gragra1185 2018/01/16
  • 海坊主 蛸入道 (『百種怪談妖物双六』その10) - うきよのおはなし~江戸文学が崩し字と共に楽しく読めるブログ~

    一寿斎芳員画『百種怪談妖物双六(むかしばなしばけものすごろく)』(安政五[1858]年刊) ※国会図書館の画像を利用しています。 国立国会図書館デジタルコレクション - 百種怪談妖物双六 新年の双六企画で出なかったコマの妖怪をちょこちょこ紹介していくシリーズです♪ ◆玄界洋(げんかいなだ)の海坊主(うみぼうず)◆ 一 たこ入(にう)だう 二 やまびこ 三 三つめ大僧(だいそう) 四 かつぱ 五 山をとこ 海に現れて船を沈める系の妖怪ですね。 船幽霊とキャラかぶりのような気がします(笑) kihiminhamame.hatenablog.com この手の伝承は各地にあったようなので、玄界灘としたのは、単に実在の地名を書いてリアリティーを出そうとしただけだと思われます。 ◆土佐海(とさうみ)の蛸入道(たこのにうだう)◆ 一 茂林寺(もりんじ) 三 ひとつ目(め) 四 見越入道(みこしにうだう)

    海坊主 蛸入道 (『百種怪談妖物双六』その10) - うきよのおはなし~江戸文学が崩し字と共に楽しく読めるブログ~
    gragra1185
    gragra1185 2018/01/16
    蛸入道の双六とはこれまたすごい。
  • 【R】ふつうのスクリプト言語プログラマーのためのR言語入門 - 歩いたら休め

    「他のスクリプト言語ならそれなりに触れるけど、Rって変な機能が多いから難しい」と感じている人のために、Rの独特な点、ハマりどころ、そして特にデータの集計での強力な機能やパッケージをまとめてみました。 社内のデータリソース移行の作業の中で、前任者が(良い意味でも悪い意味でも)すごいRプログラマーだったのと、DBからのデータの取得からデータの整形・確認が一気に行えるという理由で久しぶりにRを触りました。 (先輩!僕が「%>%ってなんですか?」みたいな質問すると、チャットでgithubのリンクを貼られたり、AdvancedRを薦められたりするの、めっちゃ困りました!) 数年前Rを使っていたときは、 Rのプログラムってよくわからないなあ…、後から自分のコード見ても意味が読み取れないよ… Pythonでpandasとかmatplotlibってパッケージを使えばRっぽいことができるの?じゃあそっち使お

    【R】ふつうのスクリプト言語プログラマーのためのR言語入門 - 歩いたら休め
    gragra1185
    gragra1185 2018/01/16
  • Fisher's exact testが"正確”かどうか - r-statistics-fanの日記

    https://oku.edu.mie-u.ac.jp/~okumura/stat/fisher-chisq.html https://twitter.com/genkuroki/status/910360137256325121 このあたりのFisher's exact testが"正確”かどうかという議論が勉強になる それぞれの立場でそれぞれ一理ある 前提として周辺度数の固定という条件を許容するかどうか P値について、理想の値に近いことを正確と表現するか、アルファエラーが保たれることを正確とするか で混乱しているように思う 自分の認識は、 ”サンプルサイズが少ないときはカイ二乗検定ではアルファエラーが保たれないので Fisher's exact testを使用するべき” です。 なぜなら、研究時に少ないNのデータで有意差を証明したとしても、もしアルファエラーが 保たれない可能性がある手

    Fisher's exact testが"正確”かどうか - r-statistics-fanの日記
    gragra1185
    gragra1185 2018/01/16