タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

コーパスに関するespのブックマーク (2)

  • 共起データに基づく単語クラスタリング法

    研究では、名詞と動詞のペア(n,v)が以下に示すような確率モデルによって 生成されるとし、その確率モデルの推定問題として単語クラスタリング問題を 定式化する。 ここで、C_nは名詞nの属するクラスタを表し、C_vは動詞vの属するクラスタを 表す。また、各々の単語は一つのクラスタにしか属さないとする。このような クラスタリングは一般的にハード・クラスタリングと呼ばれる。図2に上記モデルの例を示す。 名詞集合に対する一つの分割と動詞集合に対する一つの分割が定まれば、一つ の離散モデル(確率パラメータをもつ)が決まる。名詞集合、および動詞の集合 に対する可能な分割は指数オーダー数存在するので、上記確率モデルも数多く 存在する。与えられた共起データに対して、そのデータをもっとも良く説明で き、かつ単純なモデルを選択できれば、そのモデルにおける単語集合の分割を クラスタリングの結果とみなすことがで

  • 言語情報学プロジェクト - 麗澤大学言語研究センター (LinC)

    ※ 学内むけリソースとサービスについてのお知らせは別ページをどうぞ (学内からのみアクセス可)。 論文を追加しました。 [2006-03-17] 研究発表の予定を追加しました。 [2006-01-24] コーパスサーバ (Unix) の アドレス (IPアドレスホスト名) が更新されました。詳細はコーパスサーバのページをご覧下さい。 [2006-01-10] 現代イギリス英語のコーパス British National Corpus を検索するソフトウエア SARA が学内の学生用PCに導入されました。詳細はSARAのページをご覧下さい。 [2005-10-14] 麗澤大学大学院言語教育研究科と共催で,特別講演会「スロヴェニアにみるヨーロッパの日教育」 を開催しました。講演内容の紹介を含むプログラムはこちら (PDF, 115KB)。 [2005-07-15, 2005-07-23更

  • 1