タグ

2006年1月21日のブックマーク (5件)

  • キーワード置換アルゴリズム - ita’s diary

    http://d.hatena.ne.jp/hatenadiary/20060119/1137667217 うわーこれはこまったね。いままでは長いキーワードから抜き出していってたけど、TRIE 構造を使って文の前方からマッチを探して行くから短いのが優先されたりする。たとえば 文:あいうえおかきくけこさしすせそ KW1 いう KW2 うえおかき KW3 かきく KW4 きくけこさしという文でKW1-KW4のキーワードがマッチする場合、新しくなった方法では「いう」と「かきく」が抽出される。マッチがあっても何文字か進む間保留しとくとかの方法で解決できるのかな。LZ圧縮とかも辞書にマッチするパターンを番号で置き換えるとかしてると思ったんで、標準的なアルゴリズム何かあるんじゃないかねぇ。 追記:LZ系は保留はしない模様。ふーむ。 とりあえず、n文字のマッチがあった場合、これを候補1として仮採用し、

    キーワード置換アルゴリズム - ita’s diary
  • きまぐれ日記: Autolink: 前方最長一致ではなく最長キーワード優先一致を実現する

    Hatena のキーワード置換アルゴリズムがTRIE ベースの手法に変更になったようです。以前に AC法でやる方法の記事を書いたのですが、それと似たことをやってるのでしょうか。 AC法のやり方は単純で、前方から最長一致でキーワードを見つけていきます。これまでは長いキーワードから順番に見つけていく方法(最長キーワード優先一致)だったそうですが、前方から見つけていく方法だと短いキーワードが優先される場合があります。 http://d.hatena.ne.jp/ita/20060119/p1 http://d.hatena.ne.jp/hatenadiary/20060119/1137667217 文:あいうえおかきくけこさしすせそ KW1 いう KW2 うえおかき KW3 かきく KW4 きくけこさし という文でKW1-KW4のキーワードがマッチする場合、新しくなった方法では「いう」と「かき

  • 電車男よりも今はBバージンを読みなさい : ロケスタ社長日記

    電車男ブームもそろそろひと段落といった雰囲気の世の中ですが、電車男が世間に知れ渡った今でこそ、「Bバージン」を読んでほしいと強く思う次第で。 ネタバレがあるので、注意してください。 漫画を楽しむには問題のない範囲内であり、 漫画評論家などにも言及されるような箇所ではありますが、 情報なしで新鮮に楽しみたい方は読まないほうがいいかもしれません。 電車男のテーマは「ヲタ男が、好きな女性のために格好をきれいにし、おしゃれな店を研究し、脱ヲタしていく」である。 これに対して、Bバージンのテーマも全く同じ。 Bバージンは「生物ヲタであった主人公の秋は、好きな人のために、もっともチェックの厳しい年齢の女兄弟3人に鍛えられ、大学に入るころには、超イケメンのチャラ男に変身する。」という感じなのだ。程度の違いはあれ、ネタとしては同じである。 しかし、電車男のうすっぺらい「脱ヲタ→成功→よかっ

    xnissy
    xnissy 2006/01/21
  • アップル - iTunes - Podcast - Podcastを制作する - iTunesのRSSタグ

    You have something to say, and the world deserves to hear it. Get the resources you need to promote your podcast, launch a subscription, grow your audience, and measure your impact.

    アップル - iTunes - Podcast - Podcastを制作する - iTunesのRSSタグ
  • http://www.mainichi-msn.co.jp/today/news/20060121k0000m020105000c.html

    xnissy
    xnissy 2006/01/21
    怒るべきか、輸入停止で喜ぶべきか