2つの文書を結合して圧縮した時に符号化によってデータ長を減少できるということは、前後の2つの文書に共通のパターンが多い、ということ ――圧縮可能性から類似度数を定義できる。

mindmind のブックマーク 2006/11/12 05:30

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

prima materia diary - 文書の類似度とデータ圧縮と符号化と

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう