ブログの各記事にタグをつけてタグページを作ろうと思い、Yahoo!の形態素解析Webサービスを利用して、各記事にタグ付けをしてみました。 » F.Ko-Jiがよく書いているキーワード一覧 – F.Ko-Jiの「一秒後は未来」 何かあったらマズいので、タグページは念のためサブドメインにしています。(最初は同じドメインにしていたけど途中で変更した。) MTのデータベースを読み書きしたくなかったので、ディレクトリに静的ファイルとして格納されている各記事のHTMLファイルをプログラムで読み込んで、ひとつずつAPIにリクエストして返ってきたデータを別のデータベースに格納しました。 以下、作業メモです。 タグの抽出 タグの抽出対象は各エントリーのタイトルと本文とする。 ApacheではリクエストできるURLが全体で8196バイトという制限があるので、本文が長い場合はその長さを超えないようにバッサリ切る