タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

mecabと自然言語処理に関するsisidovskiのブックマーク (2)

  • ウノウラボ Unoh Labs: PHPとMecabでキーワード自動リンクを実装する

    こんにちは、山下です。 今年もどうぞよろしくお願い致します。 Webサービスを開発していると、特定のキーワードを自動でURLリンクにする処理が必要になることがあると思います。今回は、このキーワード自動リンク機能を形態素解析ツールMecabを使ってPHPで実装する方法を紹介したいと思います。 説明に入る前に少し補足しておくと、Trieの実装であるDouble-Array処理だけ利用したいのであれば、MecabからDouble-Array処理の部分を切り出したDartsというライブラリがあります。しかし、なぜMecabを使うかというと、PerlだとDartsのバインディングが公開されているのですが、現時点でPHP版はありません。また、最近のLinuxディストリビューションでは、Mecabのパッケージが最初から用意されているため、より簡単に利用できると思ったからです。 それでは、順を追って説明

  • MeCabでユーザー辞書を登録する - mizchi log

    バイトでやってる自然言語処理のお仕事です。 データをMeCab辞書のフォーマットにパースしてcsvで保存 /usr/local/libexec/mecab/mecab-dict-index でコンパイル /usr/local/etc/mecabrc を編集してユーザー辞書を指定する 参考: MeCab: 単語の追加方法 MeCab辞書のフォーマット 例: 工藤,1223,1223,6058,名詞,固有名詞,人名,名,*,*,くどう,クドウ,クドウ具体的には 表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用形,活用型,原形,読み,発音 今回は名詞を扱うので、ある程度決め打ちにしておく。 {単語},-1,-1,10,名詞,一般,*,*,*,*,{単語},*,*,{登録タグ} 文脈ID: 左文脈IDは, その単語を左から見たときの内部状態IDです. 通

    MeCabでユーザー辞書を登録する - mizchi log
  • 1