タグ

tipsとplaggerに関するminiminのブックマーク (3)

  • いまさら聞けない? 初心者向けPlagger設定覚え書き その2 - Muibrog

    昨日書いたその1は多くの人に読んでもらえたようで、改めてPlaggerに対する興味の高さを確認しました。いじってみたいけど敷居が高いという人が多いんだなーと実感。Windowsでも簡単にインストールできるようなので試してみたらどうかと思います。すっごくたのしいから! 別にPlaggerコミュニティのまわしもんでもなんでもないけど。 その1ではFilter::EntryFullText(以下:EFT)について説明しました。これは指定したHTMLからサイト内部のリンク先を抽出して指定されたルールに従って内容を持ってくるフィルタです。EFTを使って企業ニュースサイトの見出しページを読み込んでその日のニュースを引っ張ってくることができました。しかし、EFTでは外部サイトのリンクには対応できませんでした。これでは個人ニュースサイトに対応できません。そこで今回はCustomFeed::Configを取

    いまさら聞けない? 初心者向けPlagger設定覚え書き その2 - Muibrog
  • いまさら聞けない? 初心者向けPlagger設定覚え書き その1 - Muibrog

    Plaggerをいじってみて、とても便利でなにより楽しくてしょうがない。まだ「それPla」ってほどなんでもできるわけじゃないけど、RSSを配信してないサイトから欲しい情報を取り出すことはできるようになった。意外と初心者向けの手引き的なものが見つからなかったので、初心者向けにメモしておきます。まだ簡単なことしかわからないし、間違ったことも書いてあるかも知れないのでいろいろ試してみながら確認してください。 まずはFilter::EntryFullText(みんなEFTって呼んでるみたい)について。 企業ニュースサイト(新聞社とか)のトップページにあるような自分のサイト内へのリンクのあるHTMLをフィードと変換するときに使うFilter。下のはYOMIURI ONLINEの科学のトップページから科学ニュースを取り出すためのyamlWikipedia)。 author: Toshi custo

    いまさら聞けない? 初心者向けPlagger設定覚え書き その1 - Muibrog
  • crawler.jp - Plaggerのサンプルを動かしてみた

    無事にインストールが済んだので、サンプルで遊ぼうと思って軽い気持ちで「まるごとPerl!」に載っているYAMLを打ち込んでみました。 その前に、plaggerコマンドを利用するため、こんな感じでpathを追加しています。 set PATH=$HOME/perl/lib/bin:$PATH YAMLrss2email.yaml)の内容はblog.bulknews.netのフィードをGmailのメール宛に送るというものでした。 plugins: - module: Subscription::Config config: feed: - http://blog.bulknews.net/mt/index.rdf - module: Publish::Gmail config: mailto: Gmailのメールアドレス いよいよ実行します。しかし・・・。 %plagger -c rss2e

  • 1