タグ

ブックマーク / muibrog.hatenablog.com (8)

  • gをぺちって押してLDRで全部全文読んじゃおう。 - muibrog

    LDRで今日もぺちぺちとjを連打してフィードを読み漁っているわけですが、全文配信されてないフィードは直接サイトに行かないと読めなくてあんまりうれしくない。 これを解消するGreaseMonkeyスクリプトが「g」で文を取得するlivedoor Reader用Greasemonkeyスクリプト - F.Ko-Jiの「一秒後は未来」で公開されている。もともとはアメブロのフィードから全文を取得するためのものだったが、全文を囲むタグを指定することでそのサイトの全文を定義することができるようにバージョンアップして、愛用させてもらっていた。でも挟むタグを指定するというのがくせ者で、うまく指定できないサイトが意外と多いという問題もあった。 これを解決してくれたのがLivedoor Readerで記事全文を表示するGreasemonkey Script - 枕をそばだてて聴くで公開されているGrease

    gをぺちって押してLDRで全部全文読んじゃおう。 - muibrog
  • いまさら聞けない? 初心者向けPlagger設定覚え書き その6

    いまPla その6です。 その5で複数のフィードをまとめてメールする場合に重複が削除できないという話をしましたが、このことについてmizzyさんがコメントとご自身のブログで説明してくださいました。 SmartFeed::All は「各エントリにID“smartfeed:all”を付け」るのではなく、複数のフィードをひとまとめにしたフィードをつくり、そのフィードに対して ID”smartfeed::all” つけるものです。エントリにIDをつけるわけではありませんので、ご注意ください。 (コメントより引用) 要約すると、 SmartFeed::All なフィードは、各フィードが Deduped される前につくられる。 SmartFeed::All なフィードは smartfeed.feed フェーズを通過しないので、Filter::Rule が適用されない。 (「mizzy.org - Sm

    いまさら聞けない? 初心者向けPlagger設定覚え書き その6
  • 2006-09-16 - Muibrog

    いまPla*1 その5です。*2 その4でSmartFeedを使った出力のまとめ方を紹介しましたが、まとめずに出力すると上書きしてしまうと書きました。まとめずに1つのconfig.yamlから複数のRSSに出力を行う方法をコメントでid:otsuneさんから教えていただきましたので紹介します。これはOtsuneさんのサイト「MYCOM野良Atomレシピ」で紹介されている方法です。この方法でもSmartFeedを用いていますが、その使い方がちょっと違います。 その4の方法(1つにまとめる)では↓のようにしていました。 - module: SmartFeed::All - module: Publish::Feed rule: expression: $args->{feed}->id eq 'smartfeed:all' config: format: atom dir: /home/tos

    2006-09-16 - Muibrog
  • いまさら聞けない? 初心者向けPlagger設定覚え書き その4

    いまPla*1 その4です。 その3ではちょっと難しい話になってしまったので今回はできるだけライトに行きたいと思います。前回までに Filter::EntryFullText と CustomFeed::Config をうまく使うといろんなサイトの欲しいところを持ってこられるということを書いてきました。今回はその出力方法に関していくつか取り上げてみたいと思います。 その3までのconfig.yamlでは出力部分はすべてGmailにメールする設定でした。 - module: Publish::Gmail config: mailto: xxx@gmail.com mailfrom: xxx+plagger@gmail.com mailto 宛先です。ご自分のメールアドレスをどうぞ。 mailfrom 送信元となるメールアドレスです。Gmailではアカウントに対して「+xxx」という風にしても

    いまさら聞けない? 初心者向けPlagger設定覚え書き その4
  • いまさら聞けない? 初心者向けPlagger設定覚え書き その3

    いまPla*1 その3です。 その1では「Filter::EntryFullText」について、その2では「CustomFeed::Config」について扱ってきました。今回はCustomFeed::Configで抽出したいサイトが複雑な場合にどうやって対応するかということに焦点を当てていきます。 その2ではサンプルとしてまなめはうすさんからニュースのタイトル、コメント、リンクを抽出するyamlファイルを作成しましたが、紹介したファイルでは日付が変わる部分での取得がうまくいかない、またニュースしか取得できないため雑記を読むことができないという欠点がありました。1つめに関しては正規表現を工夫すればなんとでもなりますが、2つめに関してはニュース部と日記部分でパターンそのものが違うので取得することが難しそうです。特に2つめの問題を解消する方法に関して取り扱います。 その2で作ったCustomFe

    いまさら聞けない? 初心者向けPlagger設定覚え書き その3
  • いまさら聞けない? 初心者向けPlagger設定覚え書き その2 - Muibrog

    昨日書いたその1は多くの人に読んでもらえたようで、改めてPlaggerに対する興味の高さを確認しました。いじってみたいけど敷居が高いという人が多いんだなーと実感。Windowsでも簡単にインストールできるようなので試してみたらどうかと思います。すっごくたのしいから! 別にPlaggerコミュニティのまわしもんでもなんでもないけど。 その1ではFilter::EntryFullText(以下:EFT)について説明しました。これは指定したHTMLからサイト内部のリンク先を抽出して指定されたルールに従って内容を持ってくるフィルタです。EFTを使って企業ニュースサイトの見出しページを読み込んでその日のニュースを引っ張ってくることができました。しかし、EFTでは外部サイトのリンクには対応できませんでした。これでは個人ニュースサイトに対応できません。そこで今回はCustomFeed::Configを取

    いまさら聞けない? 初心者向けPlagger設定覚え書き その2 - Muibrog
  • いまさら聞けない? 初心者向けPlagger設定覚え書き その1 - Muibrog

    Plaggerをいじってみて、とても便利でなにより楽しくてしょうがない。まだ「それPla」ってほどなんでもできるわけじゃないけど、RSSを配信してないサイトから欲しい情報を取り出すことはできるようになった。意外と初心者向けの手引き的なものが見つからなかったので、初心者向けにメモしておきます。まだ簡単なことしかわからないし、間違ったことも書いてあるかも知れないのでいろいろ試してみながら確認してください。 まずはFilter::EntryFullText(みんなEFTって呼んでるみたい)について。 企業ニュースサイト(新聞社とか)のトップページにあるような自分のサイト内へのリンクのあるHTMLをフィードと変換するときに使うFilter。下のはYOMIURI ONLINEの科学のトップページから科学ニュースを取り出すためのyamlWikipedia)。 author: Toshi custo

    いまさら聞けない? 初心者向けPlagger設定覚え書き その1 - Muibrog
  • とうとうPlaggerに手を出した。まなめさんをGmailで読む。 - muibrog

    リリースされてからずっと手を出したかったPlaggerにやっと手を出した。 これで俺も「それPla」とか言っちゃったりできちゃうわけ! いひひ。 つーか、Plagger便利すぎる。楽しすぎる! もっと早く手を出せば良かったー。 ちなみにPlaggerっていうのはRSSとかその他のいろんなのを拾ってきてなんか形にして出力するっていうすぐれもの。 インストールが面倒だって聞いてたけど、そうでもなかった。FedoraCore4、Perl5.8.6の環境でcrawler.jp::blogさんの「Plaggerをインストール@さくらインターネット」を参考にインストール。 自宅鯖につっこんだんでさくら鯖じゃないけど、大まかな方法は一緒。要するにCPANのシェル(ここを参照すると良いよ)で「test Plagger」ってして必要なモジュールを全部入れてあげればいい(基的にはEnter連打)。うちの環境

    とうとうPlaggerに手を出した。まなめさんをGmailで読む。 - muibrog
  • 1