タグ

nlpに関するkazyのブックマーク (5)

  • スペル修正プログラムはどう書くか

    Peter Norvig / 青木靖 訳 先週、2人の友人(ディーンとビル)がそれぞれ別個にGoogleが極めて早く正確にスペル修正できるのには驚くばかりだと私に言った。たとえば speling のような語でGoogleを検索すると、0.1秒くらいで答えが返ってきて、もしかして: spelling じゃないかと言ってくる(YahooMicrosoftのものにも同様の機能がある)。ディーンとビルが高い実績を持ったエンジニアであり数学者であることを思えば、スペル修正のような統計的言語処理についてもっと知っていて良さそうなものなのにと私は驚いた。しかし彼らは知らなかった。よく考えてみれば、 別に彼らが知っているべき理由はないのだった。 間違っていたのは彼らの知識ではなく、私の仮定の方だ。 このことについてちゃんとした説明を書いておけば、彼らばかりでなく多くの人に有益かもしれない。Google

  • syncha: Japanese predicate argument structure analyzer

    $Id: index.html,v 1.3 2007/04/19 17:48:59 ryu-i Exp $

    kazy
    kazy 2007/03/07
    日本語テキストに対して、統語構造を解析するデモ。
  • 大語彙連続音声認識システムJulius

    A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?

    大語彙連続音声認識システムJulius
  • ASUMI Top

    コンピュータの世界をセマンティック(意味を包含する世界)な領域へと導く 技術分野のパイオニアとして、より使いやすく便利なコンピュータの利用環境を提供します。 ここで使われている人工知能「Copain」は、人工知能技術を応用した対話・検索エンジンです。 「Copain」により次の事を実現する事が可能です。 1.自然言語による対話:自然言語での入出力により自然な対話を行う。 2.意味的検索:曖昧な検索条件を意味的に解釈・判断することにより適切な検索を行う。 「Copain」の特徴 1.意味ネットワークを形成するナレッジスペース �@ 話題の推移を含む連続的な会話 �A 話題の特定と、ユーザの曖昧な発言に対する柔軟な回答 �B 意味的に関連したデータの入力の容易性(データ・メンテナンス性の向上) �C (学習などの)機能拡張性 2.高度な文章解析 − 口語文に対して最適化された

    kazy
    kazy 2006/11/16
  • suffix array

    更新履歴 2004/01/07  O(N) 構築アルゴリズム三種追加(Ko &Alulu, Kim & al., Karkkainen & Sanders) Suffix Arrayは、最近注目を集めているデータ構造です。その理由として、 (1)大規模なデータに対して、高速に検索、情報抽出を行うことができる (2)BWTとしてデータ圧縮に用いることができる。 ことが挙げられます。(1)に関しては自然言語処理において、膨大な量のコーパスから情報(例えば、単語の出現回数など)を調べるときににSuffix Arrayを用いると非常に高速に求めることができます。 膨大な量のコーパスに基づいた自然言語処理が盛んになってきている今、Suffix Arrayが注目を集めています。 また、ゲノム情報を調べるバイオインフォマティクスにおいても、ここの配列と似ている部分(例えばCCAG)を調べるといった場合

  • 1