先々週の言語処理学会の懇親会で「あまりにもブログを更新しなさすぎでは?」というお言葉をいただき,確かにそうかな,と思い,最近ちょっと考えていることでも書いておこうと思います. 自然言語処理において自動要約を独特のものにしているのは,機械にある種の価値判断を強いる点です.自動要約には,首尾一貫したテキストを生成するという課題とともに,入力文書中に含まれる重要な情報を同定する(内容選択)という課題があります.これは非常に独特なもので,例えば機械翻訳は入力されたテキストに含まれる情報を異なる言語のテキストの上において再現するもので,機械に情報を取捨選択させるということはしません.自然言語解析の種々の技術も同様です.自然言語処理のほとんどの処理では入出力の(意味的)等価性が保たれますが,自動要約においては入出力の等価性が保たれることはあまり期待されません.自動要約は価値判断を機械に強いるわけです.