タグ

自然言語に関するNeanのブックマーク (3)

  • 自然言語検索エンジンTrue Knowledge、β版テスターを募集

    自然言語による検索エンジンを開発する英True Knowledgeは11月7日、β版テスターを募集すると発表した。 検索エンジンは通常、単語間の統計的な関連性を基に、検索結果にふさわしそうな文書やWebページを見つけ出す。だが、それら文書やページの内容を、十分に理解しているわけではない。 True Knowledgeは、収集した情報からナレッジベースを作成、コンピュータがこれを学習し、答えを導き出せるようにした検索エンジンだという。ナレッジベースには、特性や属性を伴った「ファクト」をエントリーしていく。ユーザーとの質疑応答から、ナレッジベースは情報をさらに増やし、深みを増していくという。 例えば、歌手で女優のジェニファー・ロペスを「人」として登録。システム側には「人」「性別」「婚姻関係」といった概念が既にインプットされているため、「ジェニファー・ロペスは独身ですか?」と文章で質問を入力する

    自然言語検索エンジンTrue Knowledge、β版テスターを募集
  • 辞書不要の形態素解析エンジン「マリモ」とは − @IT

    2007/08/15 検索サービスを提供するベンチャー企業のムーターは8月1日、辞書を必要としない形態素解析エンジン「マリモ」の提供を開始した。従来、形態素解析では品詞情報を含む日語辞書を用意するのが常識だったが、マリモでは、そうした辞書を不要とした。新技術のアプローチと特性について、開発元のムーターに話を聞いた。 統計処理で単語部分を推定 形態素解析とは、与えられた文を、文法上意味のある最小の単位(形態素)に区切る処理。「今日は晴れています」なら、「今日(名詞)/は(助詞)/晴れ(動詞)/て(助詞)/い(助詞)/ます(助動詞)」と分ける。検索エンジンをはじめ、さまざまな自然言語処理の場面で必要となる基礎技術だ。 形態素解析を行うには、あらかじめ品詞情報が付加された数十万語からなる辞書を用意する必要がある。また、新語や造語、専門用語に対応するには、個別に人力で単語を登録する必要がある。

  • NTTデータの日本語解釈ツール「なずき」に興味津々

    NTTデータの日語意味理解製品「なずき」は、徳島大学発ベンチャー企業、株式会社言語理解研究所(代表取締役:青江 順一、社:徳島県徳島市)との協業により商品化しました。「なずき」では、単語の出現頻度等を利用した統計的な言語処理技術に加え、人の思考と同じように文書の「意味」を踏まえた言語処理技術を用いている点が大きな特長となります。 中でも注目している製品は、「類似文書検索エンジン」と「意味概念キーワード抽出エンジン」と「感情理解エンジン」の3つで、これだけで Google AdSense 的にコンテンツマッチ広告や、ブログの記事のテキストマイニングといったビジネスができそうです。まぁ ”これだけで” とは書きましたが、大学の研究の成果物ってのは企業相手にしているのでお値段も非常に高価ってのが通例なので、なかなか手がだせないってのも事実とは思います。 オープンソースでも似たような製品はあり

  • 1