特定の文書のみに大量に出現する語彙を特定する手法を提案する。コーパス全体における出現確率と、コーパスから文書単位で再標本した部分コーパスにおける出現確率を繰り返し求めその中央値とのズレを評価する方法である。科学雑誌Natureをコーパスとした検証を行った。また昨年提案の文書頻度的最尤推定手法との比較を行う。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く