[B! mecab] ytesakiのブックマーク

note20.com is for sale | HugeDomains

ytesaki 2006/06/25

このあたり、ちょっと突っついておかないと

mecab
php

リンク

日本語の読み変換サービス-Yomi:phpspot開発日誌

yomi.endeworks.jp yomi.endeworks.jpはMeCabとユーザーの編集によって作成される日本語の読み変換サービスです。辞書を引けという噂もありますが。 [Yomi] - 読みを使えば、日本語の読みを簡単に取得することが出来ます。読みの取得は、MeCabだけに頼らず、ユーザの力も借りて不備を補うという試みも面白いですね。読みはJSON形式でも取得可能。 http://yomi.endeworks.jp/yomi?mode=json&q=%u706B%u5C71 にアクセスすると次の値が返されます。 { "q" : "火山", "mecab" : "カザン", "yomi" : "カザン", "candidates" : [ ] } 使い方によっては面白いことが出来そう。

ytesaki 2006/05/31

リンク

きまぐれ日記: MeCab: 字種に基づくわかち書き

前回の N-gram に引き続き、字種に基づく分かち書きを MeCab だけで実現してみます。日本語ほど字種が多い言語はありません。ひらがな、カタカナ、漢字、アルファベット、数字、記号..などなど。これらはわかち書きをする上で非常に重要な情報です。MeCab + ipadic の場合、未知語は字種に基づく発見的な手法 (heuristics)　で切り出しています。今回は、辞書はまったく使わず、この字種情報だけで分かち書きをしてみます。単純に「同じ字種のものをまとめて出力する」といった塩梅です。例によって、MeCab の辞書の構成のドキュメントはこちらにあります。基本的に 1. dic.csv (辞書ファイル) 2. matrix.def (連接ファイル) 3. char.def (文字種ファイル) 4. unk.def (未知語処理) 5. dicrc から辞書が構成されます。今回も

ytesaki 2006/05/28

mecab

リンク

http://chasen.org/~taku/blog/archives/2006/05/textmecab.html

ytesaki 2006/05/15

リンク

Kazuho@Cybozu Labs: キーワード抽出モジュールを作ってみた

« IIS のログを tail -f | メイン | Lingua::JA::Summarize 0.02 » 2006年04月26日キーワード抽出モジュールを作ってみた一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらっていた時、わざわざ TF-IDF注1 用に別のコーパスを用意しなくても、MeCab だったら生起コストを辞書内に持っているんだから、それを使えばいいのではないか、という話になりました。竹迫さんがその日のうちに作ってくれたプロトタイプで、アルゴリズムの改善とパラメータのチューニングを行ったところ、十分な品質が出そうなので、書き直して公開することにしました。普通の Perl モジュールなので、 perl Makefile.PL && make && make install すれば使うことができます (15:50追記: すみません。 MeCab

ytesaki 2006/04/29

リンク

MeCab: Yet Another Part-of-Speech and Morphological Analyzer

MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧くださいメーリングリスト一般ユーザ向けメーリングリスト開発者向けメーリングリスト新着情報 2008-02-03 MeCab 0.97 マルチスレッド環境で辞書を開くときの排他制御がうまくいっていなかったバグの修正 Windows版でインストール時に辞書の文字コードを指定できるようになった一部のコンパイラで正しくコンパイルできなかった問題の修正部分解析モードを変更するAPI の追加 (Tagger::set_partial()) ラティスの生成レベルを変更するAPI の追加 (Tagger::set_lattice_level()) 温度パラメータを変更するAPIの追加 (Tagger::set_theta()) 全候補出力モードを変更するAPIの追加 (Tagger::set_all_morphs()) 2007-

ytesaki 2006/04/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (6)

mecabに関するytesakiのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス