タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

autolinkに関するkimzoのブックマーク (2)

  • MeCabによるAutolink - tsubosakaの日記

    上の研究会でMeCabを使ってAUtolinkを実現する話が出ていたので実際に実験してみた. MeCab の辞書構造と汎用テキスト変換ツールとしての利用を参考にした. 置換するキーワードリストとしてはWikipediaの記事タイトルを用いた.記事タイトルはダウンロードサイトのjawiki-latest-all-titles-in-ns0.gzから取得できる. 記事タイトルリストは以下のスクリプトで変換する trans.rb title = $_.strip length = title.split(//u).length; score = [-36000.0 ,-400 *(length**1.5)].max.to_i puts "#{title},0,0,#{score},#{length}" unless (length < 3 or title =~ /[",]/) [Tsubosa

    MeCabによるAutolink - tsubosakaの日記
  • MeCab の辞書構造と汎用テキスト変換ツールとしての利用

    $Id: dic-detail.html 161 2008-02-03 09:58:46Z taku-ku $; 概要 単語辞書の構造を理解することで, MeCab を汎用的なテキスト変換ツールとして利用することができます. 例えば, ひらがな to カタカナ変換, ローマ字 to ひらがな変換, Auto Link等を MeCab だけで実行できます ファイル 単語辞書を構築するには, 最低以下のファイルを作成する必要があります. *.csv ファイル (単語辞書) matrix.def (連接表) unk.def (未知語用品詞定義) char.def (未知語の文字定義) dicrc (設定ファイル) *.csv ファイル 単語辞書です エントリは, 以下のような CSV で追加します. test,1223,1223,6058,foo,bar,baz 最初の4つは必須エントリで,

    kimzo
    kimzo 2008/06/09
    使える
  • 1