タグ

2014年3月12日のブックマーク (4件)

  • Yet Another 仕事のツール (50) KH Coderとコーディング・ルール | マイナビニュース

  • KH Coderで内容分析 : メディア・リサーチ

    テキストマイニングのソフトを初めて使ってみた。KH Coderという、立命館大学の先生(樋口耕一・准教授)が開発されたソフトだ。使い方は、至って簡単。わずか2時間で、基をほとんどマスターすることができた。「青空文庫」に収録された、福沢諭吉の『学問のすすめ』を使って、ちょっといじってみたので、簡単にご紹介したいと思う。 (1)分析対象のテキスト化 青空文庫をダウンロードする。テキスト形式のファイルでダウンロードする。 ダウンロードしたファイルには、ルビが含まれているので、これを秀丸を使って削除する。 また、余計なタグなどもあり、これも秀丸で削除する。 (2)KH Coderを起動 「新規プロジェクト」を選び、さきほどのテキストファイルを指定する。 (3)前処理の実行 (4) 「ツール」「抽出語」「抽出語リスト」で出現頻度の高い語をリストアップ 自動的にエクセルファイル形式で、出現頻度の高い

    KH Coderで内容分析 : メディア・リサーチ
  • 【D3.js】デザイナーにお勧め「インタラクティブ・データビジュアライゼーション」感想

    これは、プログラマではない人々を対象としたデータビジュアライゼーションのプログラミングについてのだ。あなたがビジュアルのスキルはあるものの、データやコードをいじったことがないアーティストやグラフィックデザイナなら、このはあなたに打ってつけだ。あなたが大量のデータを持っているが、ビジュアルやコードを相手にしたことがないジャーナリストや研究者なら、やはりこのはあなたのためにある。 発売前からたびたびお勧めしているのですが、改めて。 書はD3.jsの初心者向けオンラインチュートリアル「D3 チュートリアル」を書かれたスコット・マレイさんがオンラインチュートリアルに追記する形で出版された参考書です。 著者自らが、D3の使い方を身に付けていったプロセスに沿って章立てられいるので、読者もステップバイステップでD3の扱い方を学んでいくことができます。 書のなかでも何度も繰り返し説明がありますが

    【D3.js】デザイナーにお勧め「インタラクティブ・データビジュアライゼーション」感想
  • Rによるtwitterテキストマイニング 〜テキストに対する学習とは〜 - あんちべ!

    あんちべのすべらない話〜俺のツイートがこんなにウケないはずがない〜 View more presentations from AntiBayesian 自分のtweetがウケるか滑るかをpostする前にrandomForestで判別してみよう! LTは制限時間10分だったため、詳細は意図的に省きました。 記事では皆さんにも実践頂けるよう、学習データの作り方についてスライドより詳しく説明したいと思います。 ●そもそも「学習する」とは? 今回の目的は、自分のツイートがfav(面白い), non(普通)のどちらになるか分類することです。 そのためには「favになるツイートはどのような特徴を持っているか?」を明らかにしなければなりません。 特徴が明らかになっていれば、 ・このツイートはfavの特徴を強く持っている→favに分類 ・このツイートはfavの特徴を殆ど持っていない→nonに分類 という

    Rによるtwitterテキストマイニング 〜テキストに対する学習とは〜 - あんちべ!