タグ

Plaggerに関するBell000のブックマーク (7)

  • 【ハウツー】「habu」 - Python版PlaggerでRSSを加工する (1) 「habu」とは何か? - 概要 | エンタープライズ | マイコミジャーナル

    Web 2.0の根幹をなす技術の1つにRSSがあります。RSSは、Webサイトやブログの更新情報を配信するための技術です。 筆者は以前から、RSSから収集したデータをデータベースに登録したり、ブログをメールで更新(moblog)するためのスクリプトなどを作成し、複数動作させていました。これらのスクリプトは基的にはほとんど同じような処理を行うものです。処理は大きく分けて、外部のサーバーからデータを取得する部分と、取得したデータをフィルタする部分、そして、フィルタした結果をデータベースなどに出力する部分です。フィルタする部分は同じ機能を再実装しているところも多々ありました。 自作のスクリプト類をリファクタリングする必要性を感じ始めた時に、Plaggerの存在を知り、UNIX的な思想に感銘しました。Plaggerにインスパイアされ、Pythonベースで「habu(ハブ)」の開発を始めました

  • 一足早く「Plagger」の便利さを実感してみよう − @IT

    2006年初頭から「Plagger」という技術が、一部で話題になりました。まだまだ知名度が低い「Plagger」ですが、便利でカスタマイズ性が高いものなので、2007年では爆発的に流行するかもしれません。豊富なプラグインを自在に組み合わせ、欲しい情報を収集し、加工して出力するPlaggerの仕組みや使い方を紹介します。 1. 何でもできる? Plaggerの正体に迫る 今回は話題のPlagger(プラガー)を取り上げます。 この連載を読んでいる読者の皆さんは、ネットワーク技術や知識に興味を持っている人が多いでしょうから、「Plagger」という単語は一度は耳にしたことがあるでしょう。しかし、Plaggerという言葉を聞いたことはあっても、いったいどんなものかピンと来ない人もいるかもしれません。今回はPlaggerがどういった働きをするか? その動きの仕組みなどを中心に紹介していきます。 ●

    一足早く「Plagger」の便利さを実感してみよう − @IT
  • mizzy.org - Plagger プラグインの実行フェーズ

    Plagger プラグインの実行フェーズ Posted by Gosuke Miyashita Sat, 23 Sep 2006 18:58:42 GMT Plagger プラグインの実行フェーズについて整理してみたので、載せておきます。 追記 はてブで「argsもあるとうれしいとおもた」というコメントがありましたので、追加してみました。 実行フェーズ $args フェーズの役割 実行例

  • Elementary, ... Googleで「はらへった」と検索するとピザが届くようにするまで

    日曜は、Plagger を初めてちゃんとさわってみました。 Plagger の概略は、miyagawaさん自身による このYAPC::NAのPDF がわかりやすいです。要するに、 『ネットからフィードを集める → (ごにょごにょする) → 出力する』をするものです。 この「集める」や「ごにょごにょ」や「出力」の部分に、ブロックを重ねるようにしてモジュールを重ね、自分の好きな起承転結にできるという点が実に Perl ぽい着想です。風がふけば桶屋がもうかるフレームワークと呼んでいます。 Subscription::Bloglines / Publish::Gmail まあ、まずは普通に使ってみようということで、「Bloglines から集める」→ (エントリごとに分割、RSS 広告除去、文の内容をできるだけ収集→ Bloglines、Delicious へのリンク付与、はてブ登録数付与) →

    Elementary, ... Googleで「はらへった」と検索するとピザが届くようにするまで
  • ぽっぺん日記@karashi.org(2006-07-18)

    _ 101fwy.com「陸・海・空軍」板から写真をぶっこ抜き(仮)・その2 昨日の続き。 少しいじって「陸・海・空軍」板の全ての板からjpgのぶっこ抜きが出来るようにしてみた。 assets/plugins/Filter-FindEnclosures/101fwy.pl: sub handle { my ($self, $url) = @_; $url =~ qr!http://(www\.)?101fwy\.com/\w+/(\d+\.htm)?!; } sub find { my($self, $args) = @_; my @enclosures_list; while ($args->{content} =~ m!<a href="(src/\d+\.jpg)" target=_blank>\d+\.jpg</a>!g) { my $enclosure = Plagger::En

  • woremacx.com - https://woremacx.com/

    Windows 10 の入ったディスクのバックアップが clonezilla で外形的にできることがわかった Posted on Jun 27, 2020 Windows10 が載ってるディスクに破壊的な変更加える前にバックアップしたくて、SystemRescueCd で clonezilla 使ってディスクまるごとイメージ化した(内部的には partimage が使われてる?)。 でこれ、レストアしたら起動する状態まで持っていけるんかな? すんごく不安だ。。。 — woremacx (@woremacx) June 15, 2020 systemrescuecd に同梱されている clonezilla を使ってまるまる取った Windows 10 のバックアップが戻せるか不安で仕方なかったので、VirtualBox に戻せるか試した。 そもそもなぜ clonezilla を試したかったの

  • crawler.jp - Plaggerをインストール@さくらインターネット

    「まるごとPerl!」を買ってきたので、これを機に念願のPlaggerを使ってみることにしました。ぜんぜん詳しくないんですが、Plaggerを使うと、これまで自前のスクリプトでスクレイピングしていたネタが簡単に収集できそうです。これはすごい! で、早速さくらインターネットのレンタルサーバ環境にインストールしようとしたんですけど、ものすごくはまってしまって、もう調べまくり。なんとかインストールはできたものの、朝になってしまいました。。。せっかくなので記念にメモを残しておきます。やたら無駄に長いです。 まずは、CPANシェルがちゃんと使えないとダメです。 CPANシェルの設定方法はこちらのエントリーをご覧ください。 http://www.crawler.jp/archives/000278.html あと、これを忘れずに。 setenv PERL5LIB $HOME/perl/lib:$H

  • 1