bloglinesでのキーワード検索がはてなより広範囲な為、早速乗り換えました。 しかし、2バイト文字の判定は難しいらしく、言語を日本語にしても他のアジアの漢字圏のFeedも混ざってきます*1。そこで、英文のみかひらがながあるエントリーのみ残すフィルタを作成しました。 正規表現はこちらを参考にしました。 ここでもruleとして同じようなものが公開されています。が、英文のみのエントリーも削除してしまうのでFilterとして実装してみました*2。 package Plagger::Plugin::Filter::JapaneseHiragana; use strict; use base qw( Plagger::Plugin ); our $VERSION = '0.1'; sub register { my($self, $context) = @_; $context->register
とりあえずさらしてみる。 package Plagger::Plugin::Filter::Summarize::Japanese; use strict; use base qw( Plagger::Plugin ); our $VERSION = '0.01'; use Encode; use Lingua::JA::Summarize; sub register { my($self, $context) = @_; $context->register_hook( $self, 'update.entry.fixup' => \&filter, ); } sub filter { my($self, $context, $args) = @_; my $encoding = $self->conf->{encoding} || 'euc-jp'; my $maxwords = $s
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く