タグ

2006年11月13日のブックマーク (3件)

  • 著作権切れをタグクラウド化 - akihitoのログ置き場

    miyagawaさんのエントリーやはてなダイアリーTagCloud の影響で、第2次タグクラウドブームがおきています(脳内調査)。 そこで流行にオイラも乗ってみましたよ。巷で話題の著作権切れ作品をタグクラウド化してみました。 桜の樹の下には(梶井基次郎) →タグクラウド化 作り方はmiyagawaさんとほぼ同じです(おそらく)。 青空文庫からHTML::TreeBuilder::XPath + HTML::Selector::XPathでタイトル、作者、文を切り出した後、文をText::MeCabで形態素解析して"名詞,一般"のみ集計しHTML::TagCloudでタグクラウド化しました。 ゴミっぽい仮名文字も入っていますが("つて"が多いのは"乗つて"等の旧表現の所為か?)、結構いい感じにできたので他の著作権切れも試してみました 山椒大夫(森鴎外) →タグクラウド化 瓶詰地獄(夢野久

    著作権切れをタグクラウド化 - akihitoのログ置き場
    shunuhs
    shunuhs 2006/11/13
    これだけで主題がわかりそう。読んだことないけど「人間失格 --> 人間/自分」みたいな感じ?
  • 日本の総理大臣の演説をタグクラウド化: blog.bulknews.net

    の総理大臣の演説をタグクラウド化 US Presidential Speeches Tag Cloud が面白かったので日の総理大臣版を3分ハッキング。コード自体は15分くらいでかけたんだけどデバッグやらデータの解析やらに時間がかかってトータルでは2時間くらいか。 Japanese Prime Minister Speeches Tag Cloud 首相官邸ホームページ からリンクをたどって HTMLをダウンロード、HTML::TreeBuilder で as_text して Text::MeCab にわせ、名詞(代名詞などをのぞく)の頻度を YAML データとしてつっこみ、HTML::TagCloud でタグクラウド化しました。スライダーの JS などは元の US Presidential のほとんどパクリです。 IE だと行間がかなりつまってるのは HTML::TagCloud

    shunuhs
    shunuhs 2006/11/13
    これおもしろいなー。年代によってどのように国策のキーワードがわかるって感じだね。
  • [結] 2006年10月 - 結城浩の日記 - ルソー展と陣取りゲーム・クイズ

    目次 2006年10月31日 - Tropy一周年 / 仕事 / 2006年10月30日 - 仕事 / 2006年10月29日 - 礼拝 / トドちゃん / 2006年10月28日 - lingr.com実験中 / 2006年10月27日 - 仕事 / 2006年10月26日 - 仕事 / 疑似乱数列を生成する計算方法の妥当性を調べるのにチューリングテスト的方法は使えるか / 2006年10月25日 - 仕事 / 仕事 / 仕事 / アナザ・タボウ / 2006年10月23日 - 多忙 / 2006年10月20日 - 仕事 / 2006年10月19日 - 仕事 / 仕事 / 『新版Perl言語プログラミングレッスン入門編』 / 2006年10月18日 - 仕事 / 仕事 / 仕事 / 2006年10月17日 - 仕事 / 2006年10月16日 - トドちゃん到着 / 今日の魔法の言葉 /

    shunuhs
    shunuhs 2006/11/13
    ε(     v ゚ω゚) > 「トドちゃん」というのは結城のTo Do(やるべきこと)の擬人化です。 <-- いいな、これ。