先月ハワイに行ってきてオルオルな (ハワイ語で ’楽しい’ という意味) 気分の takahi-i です。最近ログデータの有効活用が話題になっていますが、検索エンジンが出力する検索クエリログを使用してどんなことができるのかについて紹介させていただきます。 ... 続きを読む
2009年12月3日、グーグルは突如「Google日本語入力」を公開した。 昨日発表されたGoogle日本語入力。すでに各所で話題になっている 対応OSは現在のところ、Mac OS X以降ならびにWindows XP以降(64bit版には未対応)で、同社サイトからダウンロードし、無料で利... 続きを読む
Google IME がリリースされたそうで、Twitter でも #googleime というハッシュタグで祭りになっているようである。リリース文を見ると @taku910 さんと @komatsuh さんが主に関わっているようである。以前Google サジェストのローマ字検索機能 = Google IME で... 続きを読む
動向情報の要約と可視化に関するワークショップ 趣旨 研究課題「動向情報の要約と可視化」について, 共通の素材を用いて協調的かつ競争的に研究を進めていくワークショップを提案いたします. 動向情報とは,幾つかの統計量の時系列データを基として,その変化... 続きを読む
みんなの経験は、奈良先端科学技術大学院大学自然言語処理学講座とニフティ株式会社の共同研究により開発を行いました。 公開にあたりアクセラテクノロジ株式会社およびニフティ株式会社よりブログ記事の収集・解析について協力を受けました。 FAMFAMFAMのアイ... 続きを読む
MeCabは形態素解析のためのソフトウェアです。日本語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日本語や、正しく書かれた日本語でも新語を期待した通りに分かち書きしてくれ... 続きを読む
情報の信頼性評価に関する基盤技術の研究開発(<特集>情報の信頼性評価) Information Credibility Criteria Project(<Special Issue>Trust Assessment of Web Information) 続きを読む