Lingua::JA::Summarizeで特徴語を抽出して、Hyper Estraierでblosxomのデータを検索するということをやってみた。 抽出された語彙は単にOR検索しているので、精度があんまよくない。 use strict; use warnings; use Estraier; use Lingua::JA::Summarize; my $entry = << '__DDD__'; 文章をここへ __DDD__ my $s = Lingua::JA::Summarize->new; $s->analyze($entry); my @keywords = $s->keywords({ minwords => 3, maxwords => 5}); my $query_keywords = join(" OR ", @keywords); print $query_keywor