[B! コーパス] espのブックマーク

esp id:esp

コーパスに関するespのブックマーク (2)

共起データに基づく単語クラスタリング法
本研究では、名詞と動詞のペア(n,v)が以下に示すような確率モデルによって生成されるとし、その確率モデルの推定問題として単語クラスタリング問題を定式化する。ここで、C_nは名詞nの属するクラスタを表し、C_vは動詞vの属するクラスタを表す。また、各々の単語は一つのクラスタにしか属さないとする。このようなクラスタリングは一般的にハード・クラスタリングと呼ばれる。図2に上記モデルの例を示す。名詞集合に対する一つの分割と動詞集合に対する一つの分割が定まれば、一つの離散モデル(確率パラメータをもつ)が決まる。名詞集合、および動詞の集合に対する可能な分割は指数オーダー数存在するので、上記確率モデルも数多く存在する。与えられた共起データに対して、そのデータをもっとも良く説明でき、かつ単純なモデルを選択できれば、そのモデルにおける単語集合の分割をクラスタリングの結果とみなすことがで
esp 2005/06/14
コーパス
リンク
言語情報学プロジェクト - 麗澤大学言語研究センター (LinC)
※ 学内むけリソースとサービスについてのお知らせは別ページをどうぞ (学内からのみアクセス可)。論文を追加しました。 [2006-03-17] 研究発表の予定を追加しました。 [2006-01-24] コーパスサーバ (Unix) のアドレス (IPアドレスとホスト名) が更新されました。詳細はコーパスサーバのページをご覧下さい。 [2006-01-10] 現代イギリス英語のコーパス British National Corpus を検索するソフトウエア SARA が学内の学生用PCに導入されました。詳細はSARAのページをご覧下さい。 [2005-10-14] 麗澤大学大学院言語教育研究科と共催で，特別講演会「スロヴェニアにみるヨーロッパの日本語教育」を開催しました。講演内容の紹介を含むプログラムはこちら (PDF, 115KB)。 [2005-07-15, 2005-07-23更
esp 2005/06/14
コーパス
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx