2013年2月12日 プログラム公開. 1月は1つもブログ記事を書きませんでしたが,本年もどうぞよろしくお願いします. 1月は温泉旅行に行ったり,体調崩してたり,図書館総合展フォーラム in 熊本に行ったりしていました.(熊本でお世話になって皆さまありがとうございました.) 2月は試験と修士論文の構想発表があるので,いろいろとやらないといけないのですが,あまりに統計が分からないので現実逃避にプログラミングの勉強をはじめてしまいました. 方法 さて,タイトルの図書館系ブログのクラスタリングです.手順としては以下の方法で行いました.方法は,後述しますが「集合知プログラミング」によります. 各ブログのRSSフィードリストを作成する. 各フィードからブログ記事の本文を抽出する. ブログ本文を抽出して,形態素解析を行い単語ごとに分割する. ブログごとの単語出現回数をカウントする. どのブログにも高頻
![「集合知プログラミング」で図書館系ブログをクラスタリングしてみた - よしなしごと](https://cdn-ak-scissors.b.st-hatena.com/image/square/6bf8872f6e2353234f460230121786ce4e051f99/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fo%2Fotani0083%2F20130201%2F20130201191611.jpg)