[B! 人工無能] hsbmのブックマーク

人工無能の作り方

書いた人 INA 人工無能とは？人間っぽく話すプログラムのこと。会話を理解しているというよりは、なんかそれっぽいことを話すだけのものが多い。今回は「日本語のようなものを話す人工無能」を作ってみたので、その簡単な仕組みと工夫した点について少し書いてみることにする。動機うちのサークルのメンバーがよく集まってるチャット。とてもマニアックなどうしようもない会話が繰り広げられているわけだが、ちょっと物足りない。そうだ！萌キャラがいないじゃないか！「ないなら作ればいいじゃない？」材料 MeCab 形態素解析エンジン難しいことは知らなくても問題ない。「私は変な人ではない」 ↓ 私名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシは助詞,係助詞,*,*,*,*,は,ハ,ワ変名詞,形容動詞語幹,*,*,*,*,変,ヘン,ヘンな助動詞,*,*,*,特殊・ダ,体言接続,だ,

hsbm 2009/02/20

人工無能

リンク

RSS を読み込んでランダムな文章を生成する

RSS を読み込んでランダムな文章を生成する 2008-09-07-3 [Programming][NLP][IIR][WebAPI] 今日のIIR輪講[2008-09-07-2]の内容のフォローも兼ねて、ちょっとしたハックを紹介。 bigram language model に基づく、ランダム文生成を行います。って、まあ、単純にある単語の次に現れる単語の分布を用いて、文章を生成していくだけですが。以下、サンプルプログラムと実行例です。サンプルコード rss-lm.pl #!/usr/bin/perl use strict; use warnings; use XML::RSS; use LWP::Simple; use XML::Simple; use URI::Escape; use utf8; binmode STDOUT, ":utf8"; my $appid = "Yaho

hsbm 2008/09/08

人工無能

リンク

カイ二乗値で単語間の関連の強さを調べる

カイ二乗値で単語間の関連の強さを調べる 2007-09-19-1 [Algorithm][Programming] カイ２乗値を使って単語間の関連度を調べる方法。つまり、関連語を探すときに、χ二乗値を関連度として使う。 perl によるサンプルコード (chiword.pl)。昔、勉強がてら作ったコード。 #!/usr/bin/perl use strict; use warnings; my %cnt; my $pair_num; while (<>) { chomp; next if /^\s*$/; my @list = sort split(/,/, $_); for (my $i = 0; $i < @list; $i++) { for (my $j = $i + 1; $j < @list; $j++) { next if $list[$i] eq $list[$j]; $c

hsbm 2007/12/26

リンク

形態素解析と検索APIとTF-IDFでキーワード抽出

形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。教科書に載っているような基本中の基本ですが、あらためてエッセンスを簡単な例で解説したいと思います。目的：キーワード抽出対象テキストから、そのテキストを代表するキーワードを抽出します。TF-IDF という指標を用います。（この値が大きいほどその単語が代表キーワードっぽいということでよろしく。） TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード候補が含まれるドキュメ

hsbm 2007/12/16

人工無能

リンク

xe-kdoo(2005-04-18)

>> [Memo][Firefox] Tab Mix の中の人も大変だなタブ回りの Extension である Tab Mix の開発者が代わるよ、という話。 As a non-coder, I am not able to maintain Tab Mix which is become more and more complex. >> [Sixamo] ししゃもを偲ぶ忘れないうちに、ししゃものアルゴリズムの概要を書いておこう。というかすでにかなり忘れているので、「Yet Another ししゃも」のアルゴリズム、なんだけど。記憶・学習文章の学習聞いた文章は、全てそのまま覚えておきます。とりあえずこの時点では、何も加工はしません。注目語*1の学習入力が一定量たまったら、ししゃもはその中から「注目語」を探し出し、それを覚えます。基本的に、ししゃもが知っている*

hsbm 2007/12/16

人工無能

リンク

小宮日記

hsbm 2007/12/12

人工無能

リンク

人工無脳レビュー

Fig. 1に最近の人工無脳の能力の、独断に基づいた分布を示す。横軸は学習能力、縦軸は文脈追跡能力を示している。近年この勢力図は大きく変わった。マルコフ文生成を行なう人工無脳の一派の台頭と、限定的ながら論理を追跡して会話に反映させる人工無脳の技術の出現である。かつて人工無脳の代名詞と考えられていた辞書型はいまや旧世代のアーキテクチャに属し、その範疇では新しい技術開発が停滞している模様である。ログ型アーキテクチャは以前から存在していたのだが、いつの時代にもあまり大きな勢力にはなっていないようである。これらの情勢の変化はマシンパワーの増大と人工無脳業界への形態素解析器の導入に伴って生じたと考えられる。以下に各人工無脳の特徴を簡単に述べるマルコフ文生成型マルコフ連鎖を用いて文を生成する。後述の辞書型人工無脳は辞書を拡大することでよい反応をするようになるが、マルコフ文生成型は逆で、生成する文の

hsbm 2007/12/05

人工無能

リンク

ワードサラダ技術について

後半部分が重要で、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である　ということです。さて、実例です。たとえば次の文章を考えてみます。「通信販売大手セシールは９日、生命保険の販売に本格参入する方針を明らかにした。」まず形態素解析するとこんな感じになります。通信名詞,サ変接続,*,*,*,*,通信,ツウシン,ツーシン販売名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ大手名詞,一般,*,*,*,*,大手,オオテ,オーテセシール名詞,固有名詞,組織,*,*,*,セシール,セシール,セシールは助詞,係助詞,*,*,*,*,は,ハ,ワ９名詞,数,*,*,*,*,９,キュウ,キュー日名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ、記号,読点,*,*,*,*,、,、,、生命名詞,一般,*,*,*,*,生命,セイメイ,セイメイ保険名詞,一般

hsbm 2007/12/05

人工無能

リンク

はてなブックマーク

タグ

関連タグで絞り込む (1)

人工無能に関するhsbmのブックマーク (8)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス