[B! Espresso] rokujyouhitomaのブックマーク

rokujyouhitoma id:rokujyouhitoma

Espressoに関するrokujyouhitomaのブックマーク (5)

メンバー | 広島市立大学言語音声メディア工学研究グループ
広島市立大学言語音声メディア工学研究グループのWEBサイトです。知識基盤社会におけるさまざまな形態のコミュニケーションに対応する知識情報処理において極めて重要な役割を担う言語と音声に関する情報処理技術の基礎から応用までの幅広い教育・研究活動を行います。
rokujyouhitoma 2015/05/03
NLP

Paper

Espresso

bootstrap
リンク
https://cl.sd.tmu.ac.jp/~komachi/papers/jsai2010-bootstrap.pdf
rokujyouhitoma 2015/05/03
NLP

Espresso

小町守

工藤拓

松本祐治

Paper
リンク
きまぐれ日記: 情報抽出アルゴリズム Espresso の謎
Espresso という情報抽出アルゴリズムを使った研究が散見されるようになったので、ちょっと深追いしてみました。基本的に Bootstrapping をベースにしているようです。 Bootstrapping のアイデアはわかりやすいのですが、実際動かすには設定すべきパラメータがいくつもあります(各Iteration でどういう基準で何個パターンを見つけたらいいのかなど)。 Espresso は、この設定すべきパラーメータがアルゴリズムとして明示的に記述されており、わりと再現・実装がしやすいアルゴリズムだと感じました。しかし、式を追ってみると、最終的な結果は Seed に依存しないのではないかという疑惑が出てきました。オリジナルの論文の式をみていきましょう。 http://www.patrickpantel.com/Download/Papers/2006/acl06-01
rokujyouhitoma 2015/05/03
Espresso

NLP
リンク
https://www.anlp.jp/proceedings/annual_meeting/2014/pdf_dir/P1-11.pdf
rokujyouhitoma 2015/05/03
Espresso

NLP

Paper

松本裕治

NAIST
リンク
きまぐれ日記: 情報抽出アルゴリズム Espresso 最終章
Espresso を飲みながらさらに Espresso を考えていました。 r_instance = A^n * r_instance_0 となるのは間違いないと思います。A は P * P^{T}、さらに P = 1/|I||P| * pmi(i, p)/ maxpmi です。 A は、インスタンスどうしの類似度を表現した正方対称行列です。A_{i,j} はインスタンス i, j の類似度です。類似度は、パターン個数次元からなるベクトルの内積で、各次元は pmi となります。この形だと、r_instanc は r_instance_0 できまるので、初期値に依存してるように思えますが、A^n がいったいどういう意味を持つのかずっと考えていました。 A_{i,j} が 0, 1 の場合、A　は無向グラフの接続行列となります。i,j がつながっている場合は A_{i,j} = 1となり
rokujyouhitoma 2015/05/03
Espresso

NLP
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx