タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

tagcloudに関するshunuhsのブックマーク (2)

  • 著作権切れをタグクラウド化 - akihitoのログ置き場

    miyagawaさんのエントリーやはてなダイアリーTagCloud の影響で、第2次タグクラウドブームがおきています(脳内調査)。 そこで流行にオイラも乗ってみましたよ。巷で話題の著作権切れ作品をタグクラウド化してみました。 桜の樹の下には(梶井基次郎) →タグクラウド化 作り方はmiyagawaさんとほぼ同じです(おそらく)。 青空文庫からHTML::TreeBuilder::XPath + HTML::Selector::XPathでタイトル、作者、文を切り出した後、文をText::MeCabで形態素解析して"名詞,一般"のみ集計しHTML::TagCloudでタグクラウド化しました。 ゴミっぽい仮名文字も入っていますが("つて"が多いのは"乗つて"等の旧表現の所為か?)、結構いい感じにできたので他の著作権切れも試してみました 山椒大夫(森鴎外) →タグクラウド化 瓶詰地獄(夢野久

    著作権切れをタグクラウド化 - akihitoのログ置き場
    shunuhs
    shunuhs 2006/11/13
    これだけで主題がわかりそう。読んだことないけど「人間失格 --> 人間/自分」みたいな感じ?
  • 日本の総理大臣の演説をタグクラウド化: blog.bulknews.net

    の総理大臣の演説をタグクラウド化 US Presidential Speeches Tag Cloud が面白かったので日の総理大臣版を3分ハッキング。コード自体は15分くらいでかけたんだけどデバッグやらデータの解析やらに時間がかかってトータルでは2時間くらいか。 Japanese Prime Minister Speeches Tag Cloud 首相官邸ホームページ からリンクをたどって HTMLをダウンロード、HTML::TreeBuilder で as_text して Text::MeCab にわせ、名詞(代名詞などをのぞく)の頻度を YAML データとしてつっこみ、HTML::TagCloud でタグクラウド化しました。スライダーの JS などは元の US Presidential のほとんどパクリです。 IE だと行間がかなりつまってるのは HTML::TagCloud

    shunuhs
    shunuhs 2006/11/13
    これおもしろいなー。年代によってどのように国策のキーワードがわかるって感じだね。
  • 1