タグ

nlpに関するt_ashulaのブックマーク (6)

  • 人工無能 ロイディ --- SSB

    ロイディとは ロイディ(Reudy)は、主にSSBの市川(Gimite)によって作られた、人間とチャットをする日語人工無能です。人間同士の会話のみから学習するというのが特徴です。つまり、人間の手で単語とかテンプレートを仕込んでいる訳ではありません。 すぐに寝たがる。 人間をいじめる。 人間を人工無能よわばりする。 …などの特徴があるようです。 どんな会話をするの? まずはロイディ迷言集を見てください。 ちなみにほとんど何も学習してない状態だと、こんな感じです。 ロイディとおしゃべりするには 3つの方法があります。 ロイディが常駐しているWebチャット Lingrのkennさんのルームに入る。一番お手軽な方法です。置かせてもらっているだけで、ロイディとの会話専用のチャットルームというわけではありません。 IRCのチャンネルにロイディを招待する。WIDE系IRCirc.fujisa

  • マイクロソフトも参入、広告分野で注目される人工「無脳」の魅力とは:コラム - CNET Japan

    コンピュータに1980年代以前から親しんでいる人は、「人工無脳」と聞くと、ある種のノスタルジーと共に思い起こすものがあるんじゃないかな。 「何それ?」という人のために少し解説すると、人工無脳というのは一種のお遊びプログラムのことで、チャットで人間と会話をしてくれるロボットのこと。海外ではChatter Botと呼ぶのが一般的みたいだね。 もちろん、会話の精度は高くなくて、「何言ってんだコイツ」とか、「会話が全然なりたってないじゃん」なんて場合がほとんどなんだけど、たまに「おっ!」と思わせるようなことを言ったりして、チャット参加者を楽しませてくれる。 そもそも人工無脳(人工「無能」と表記される場合も多いが筆者は「無脳」という表記で統一している)というのは、開発者たちが「こんなもの人工知能と呼べるレベルじゃなくて、人工無脳だよね(笑)」という謙遜から使われだした言葉なんだ。 「あー、昔よく遊ん

    マイクロソフトも参入、広告分野で注目される人工「無脳」の魅力とは:コラム - CNET Japan
  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
  • [を] 形態素解析と検索APIとTF-IDFでキーワード抽出

    形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基中の基ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード

  • ispl.jp

    This domain may be for sale!

    ispl.jp
  • 1