[B! plagger][software] hirotsのブックマーク

hirots id:hirots

plaggerとsoftwareに関するhirotsのブックマーク (3)

いまさら聞けない？初心者向けPlagger設定覚え書きその3
いまPla*1 その3です。その1では「Filter::EntryFullText」について、その2では「CustomFeed::Config」について扱ってきました。今回はCustomFeed::Configで抽出したいサイトが複雑な場合にどうやって対応するかということに焦点を当てていきます。その2ではサンプルとしてまなめはうすさんからニュースのタイトル、コメント、リンクを抽出するyamlファイルを作成しましたが、紹介したファイルでは日付が変わる部分での取得がうまくいかない、またニュースしか取得できないため雑記を読むことができないという欠点がありました。1つめに関しては正規表現を工夫すればなんとでもなりますが、2つめに関してはニュース部と日記部分でパターンそのものが違うので取得することが難しそうです。特に2つめの問題を解消する方法に関して取り扱います。その2で作ったCustomFe
hirots 2006/09/15
software

programming

plagger

perl
リンク
いまさら聞けない？初心者向けPlagger設定覚え書きその2 - Muibrog
昨日書いたその1は多くの人に読んでもらえたようで、改めてPlaggerに対する興味の高さを確認しました。いじってみたいけど敷居が高いという人が多いんだなーと実感。Windowsでも簡単にインストールできるようなので試してみたらどうかと思います。すっごくたのしいから！別にPlaggerコミュニティのまわしもんでもなんでもないけど。その1ではFilter::EntryFullText（以下：EFT）について説明しました。これは指定したHTMLからサイト内部のリンク先を抽出して指定されたルールに従って内容を持ってくるフィルタです。EFTを使って企業ニュースサイトの見出しページを読み込んでその日のニュースを引っ張ってくることができました。しかし、EFTでは外部サイトのリンクには対応できませんでした。これでは個人ニュースサイトに対応できません。そこで今回はCustomFeed::Configを取
hirots 2006/09/14
software

perl

plagger

programming
リンク
いまさら聞けない? 初心者向けPlagger設定覚え書きその1 - Muibrog
Plaggerをいじってみて、とても便利でなにより楽しくてしょうがない。まだ「それPla」ってほどなんでもできるわけじゃないけど、RSSを配信してないサイトから欲しい情報を取り出すことはできるようになった。意外と初心者向けの手引き的なものが見つからなかったので、初心者向けにメモしておきます。まだ簡単なことしかわからないし、間違ったことも書いてあるかも知れないのでいろいろ試してみながら確認してください。まずはFilter::EntryFullText（みんなEFTって呼んでるみたい）について。企業ニュースサイト（新聞社とか）のトップページにあるような自分のサイト内へのリンクのあるHTMLをフィードと変換するときに使うFilter。下のはYOMIURI ONLINEの科学のトップページから科学ニュースを取り出すためのyaml（ Wikipedia）。 author: Toshi custo
hirots 2006/09/14
software

perl

plagger

programming

rss
リンク
1