タグ

ブックマーク / muibrog.hatenablog.com (5)

  • Muibrog - いまPla もくじ。

    //d.hatena.ne.jp/toshi123/20060912#p1" title="引用元:Muibrog">いまPla その1:基的なyamlの書き方、Filter::EntryFullTextの使い方についてです。 //d.hatena.ne.jp/toshi123/20060913#p1" title="引用元:Muibrog">いまPla その2:CustomFeed::Configの使い方についてです。これで個人ニュースサイトもばっちり? //d.hatena.ne.jp/toshi123/20060914#p1" title="引用元:Muibrog">いまPla その3:同じサイトから2パターンの以上の領域を抽出したいときにはどうするか。こんどこそばっちり? //d.hatena.ne.jp/toshi123/20060915#p1" title="引用元:Muib

    Muibrog - いまPla もくじ。
  • いまさら聞けない? 初心者向けPlagger設定覚え書き その3

    いまPla*1 その3です。 その1では「Filter::EntryFullText」について、その2では「CustomFeed::Config」について扱ってきました。今回はCustomFeed::Configで抽出したいサイトが複雑な場合にどうやって対応するかということに焦点を当てていきます。 その2ではサンプルとしてまなめはうすさんからニュースのタイトル、コメント、リンクを抽出するyamlファイルを作成しましたが、紹介したファイルでは日付が変わる部分での取得がうまくいかない、またニュースしか取得できないため雑記を読むことができないという欠点がありました。1つめに関しては正規表現を工夫すればなんとでもなりますが、2つめに関してはニュース部と日記部分でパターンそのものが違うので取得することが難しそうです。特に2つめの問題を解消する方法に関して取り扱います。 その2で作ったCustomFe

    いまさら聞けない? 初心者向けPlagger設定覚え書き その3
  • いまさら聞けない? 初心者向けPlagger設定覚え書き その2 - Muibrog

    昨日書いたその1は多くの人に読んでもらえたようで、改めてPlaggerに対する興味の高さを確認しました。いじってみたいけど敷居が高いという人が多いんだなーと実感。Windowsでも簡単にインストールできるようなので試してみたらどうかと思います。すっごくたのしいから! 別にPlaggerコミュニティのまわしもんでもなんでもないけど。 その1ではFilter::EntryFullText(以下:EFT)について説明しました。これは指定したHTMLからサイト内部のリンク先を抽出して指定されたルールに従って内容を持ってくるフィルタです。EFTを使って企業ニュースサイトの見出しページを読み込んでその日のニュースを引っ張ってくることができました。しかし、EFTでは外部サイトのリンクには対応できませんでした。これでは個人ニュースサイトに対応できません。そこで今回はCustomFeed::Configを取

    いまさら聞けない? 初心者向けPlagger設定覚え書き その2 - Muibrog
  • いまさら聞けない? 初心者向けPlagger設定覚え書き その1 - Muibrog

    Plaggerをいじってみて、とても便利でなにより楽しくてしょうがない。まだ「それPla」ってほどなんでもできるわけじゃないけど、RSSを配信してないサイトから欲しい情報を取り出すことはできるようになった。意外と初心者向けの手引き的なものが見つからなかったので、初心者向けにメモしておきます。まだ簡単なことしかわからないし、間違ったことも書いてあるかも知れないのでいろいろ試してみながら確認してください。 まずはFilter::EntryFullText(みんなEFTって呼んでるみたい)について。 企業ニュースサイト(新聞社とか)のトップページにあるような自分のサイト内へのリンクのあるHTMLをフィードと変換するときに使うFilter。下のはYOMIURI ONLINEの科学のトップページから科学ニュースを取り出すためのyamlWikipedia)。 author: Toshi custo

    いまさら聞けない? 初心者向けPlagger設定覚え書き その1 - Muibrog
  • とうとうPlaggerに手を出した。まなめさんをGmailで読む。 - muibrog

    リリースされてからずっと手を出したかったPlaggerにやっと手を出した。 これで俺も「それPla」とか言っちゃったりできちゃうわけ! いひひ。 つーか、Plagger便利すぎる。楽しすぎる! もっと早く手を出せば良かったー。 ちなみにPlaggerっていうのはRSSとかその他のいろんなのを拾ってきてなんか形にして出力するっていうすぐれもの。 インストールが面倒だって聞いてたけど、そうでもなかった。FedoraCore4、Perl5.8.6の環境でcrawler.jp::blogさんの「Plaggerをインストール@さくらインターネット」を参考にインストール。 自宅鯖につっこんだんでさくら鯖じゃないけど、大まかな方法は一緒。要するにCPANのシェル(ここを参照すると良いよ)で「test Plagger」ってして必要なモジュールを全部入れてあげればいい(基的にはEnter連打)。うちの環境

    とうとうPlaggerに手を出した。まなめさんをGmailで読む。 - muibrog
    TAKA128
    TAKA128 2006/09/10
    『RSSを配信してないサイトからフィードを作ってGmailに送ってみる』
  • 1