[B! mecab] hide-Kのブックマーク

きまぐれ日記: MeCabがiPhone,OSXに載っていると言うのは止めようと思う

iPhoneのSDKの条項に変更が加わり、Flashのクロスコンパイルを含む純正開発ツール以外で作成されたバイナリの配布が禁止となるようです。世間でも散々言われていますが、この変更は正直とても残念です。 Apple的には「製品のクオリティーが保てないから」という理由だそうですが、 Windows版iTunesが意味もなくQuickTime入れたり、Windows非標準のUIを使いまくっていて、お世辞にもクオリティーが高いとは言えないのを棚にあげて、クオリティー云々と言い訳できるのでしょうか。アプリなんて所詮玉石混淆。決めるのはユーザです。 MeCabは以前GPL/LGPLでした。Appleを含む複数の方からこのライセンスでは使いにくいと言う指摘をうけ、前職の同僚と協議をしながらBSD/LGPL/GPL のトリプルライセンスにしたという経緯があります。結果としてこの変更はうまく

hide-K 2010/04/30

mecab
apple

リンク

perl - 勝手に添削 - Text::MeCab by DMAKI : 404 Blog Not Found

2006年05月02日17:15 カテゴリLightweight Languages perl - 勝手に添削 - Text::MeCab by DMAKI というわけで、このところ毎日やってる勝手に添削のコーナー。今回はDMAKI版Text::MeCab。 Advanced Perl Programming, 2nd Ed. Simon Cozens [邦訳:実用Perlプログラミング第2版] D-5 出張版アップした。オプションとかはあまりテストしてないので問題あったら教えてください。今回のソースは、たったこれだけ。 Text-MeCab-0.02/lib/Text/MeCab.pm package Text::MeCab; use strict; use vars qw($VERSION @ISA %EXPORT_TAGS @EXPORT_OK); BEGIN { $VERSION

hide-K 2008/06/27

リンク

大規模テキスト処理を支える形態素解析技術（工藤拓氏・Google） - Cafe Babe

第80回知識ベースシステム研究会を開催したが，二日間で58名の方々に参加して頂き，積極的に議論に加わって頂いた．この場を借りて，参加してくれた方々に感謝したい．大変遅くなった（爆）が，Googleの工藤拓氏による招待講演「大規模テキスト処理を支える形態素解析技術」の概要を，このブログで報告しておきたい．工藤氏の専門分野は統計的自然言語処理と機械学習であるが，日本語形態素解析エンジンMeCabの開発者であり，他にも自然言語処理関連の有益なツールや，Webベースの日本語入力を可能にするAjax IMEのようなユニークなサービスを提供しているなど，時代をリードする研究開発者の一人である．彼の活動に興味があれば，彼のブログ「きまぐれ日記」は必見だろう．なお，当日は弊社側の不手際で，予定していた工藤氏の重要なデモをおこなうことができなかった．弊社はネットワーク会社であるにもかかわらず，ネットワーク

hide-K 2008/02/15

リンク

キーワード抽出モジュール Lingua::JA::Summarize を使うコツ (nakatani @ cybozu labs)

いわゆる「Web2.0」っぽい要素である「タグ」。一般にはタグ付けは手動で行うわけですが、自然言語テキストへのタグ付け(キーワード抽出)を自動で行うことができれば、あれこれと可能性が広がって楽しそう……しかし、それは実現が難しかったり高コストだったりして、簡単に手を出せる解はあまりありません。ラボの奥さんの作成したキーワード抽出モジュール Lingua::JA::Summarize は次の特徴を持っています。動作要件の敷居が低い辞書のメンテナンスをしなくても、未知語や熟語もある程度抽出してくれる希望の結果に近づけるためのチューニングが可能本モジュールを使って、サイボウズ・ラボ内での情報交換を行っている社内掲示板をスレッド単位で解析しているのですが、辞書を一切チューニングしていない状態でも「しょこたん☆ぶろぐ」や「猫かぶり隊隊員ニャンコ達」などの特徴的なキーワードが抽出されます（

hide-K 2007/04/28

リンク

[を] 裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する

裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する 2006-09-17-1 [YahooHacks][NLP] 今回の YahooHacks は、長い文を検索キーとしてWeb検索をするというハックです。一年前の検索会議[2005-09-30-3]で紹介しましたが、今回ゼロから書き直しました。サンプルコードが長くなってしまってすいません…。 (一時的にデモを置いておきます。そのうち消えます。ご了承下さい。 http://nais.to/~yto/tmp/yahoohacks-samp/hack_sentence.cgi 検索例：SEOの10ステップと...←うろ覚えタイトル ) ■■■長い文をそのまま検索キーとして Web 検索するどこかからコピペしてきた長い文をそのまま Yahoo! で検索してもヒットしないことが多いです。そういう場合

hide-K 2006/09/19

リンク

GREE Labs -オープンソーステクノロジー勉強会第2回 ―開催のご報告―

404 お探しのページは見つかりません GREE Engineering トップへ戻る

hide-K 2006/05/20

リンク

Kazuho@Cybozu Labs: キーワード抽出モジュールを作ってみた

« IIS のログを tail -f | メイン | Lingua::JA::Summarize 0.02 » 2006年04月26日キーワード抽出モジュールを作ってみた一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらっていた時、わざわざ TF-IDF注1 用に別のコーパスを用意しなくても、MeCab だったら生起コストを辞書内に持っているんだから、それを使えばいいのではないか、という話になりました。竹迫さんがその日のうちに作ってくれたプロトタイプで、アルゴリズムの改善とパラメータのチューニングを行ったところ、十分な品質が出そうなので、書き直して公開することにしました。普通の Perl モジュールなので、 perl Makefile.PL && make && make install すれば使うことができます (15:50追記: すみません。 MeCab

hide-K 2006/04/26

リンク

はてなブックマーク

タグ

関連タグで絞り込む (9)

mecabに関するhide-Kのブックマーク (7)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス