タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

tutorialとtipsとpipesに関するCherenkovのブックマーク (2)

  • 『Dapper』を使ってRSS化されていないページの特定データを抽出する。

    これをご覧になっている方は、”RSSを使ってブログを巡回”している人もいらっしゃるかと思います。 しかしRSS未対応のページや表の特定部分を抜き出して他で利用する場合、どうしたらいいのでしょうか。 以前RSSを提供していないHPからRSSを発行するサービスをご紹介しました。 これはサイトのURLを入力するだけで自動でRSSが発行されるものでした。 ■RSS配信のないホームページからRSS受信をする。 http://haaya.net/1533 しかし、必要のない広告なども一緒に出力されてしまいます。 今回はもう少し進んで、特定部分の抜き出しを『Dapper』というwebサービスを使って 抽出をしてみようと思います。画像が多いのでご注意ください。 ■今回作ろうと思うもの NHK BSのホームページにある映画情報をRSSとして取得する。 NHK BSオンライン 映画カレンダー http://w

  • uessay: Yahoo! Pipesのテクニックを10個(前編)

    このブログで、もう何回も書いているが、Yahoo! Pipesによるスクレイピングが楽しい。やりたいことができなくてRubyで書き始めたこともあったが、Pipesの視認性の良さに慣れてしまうと、後戻りは難しい。 で、触り始めた頃より少し覚えたことが増えたので列挙してみる。 1.PipesにはWeb型RSSリーダよりFirefoxのライブブックマークが似合う RSSと言えば、Livedoor ReaderなどWeb型のRSSリーダーで読む方が楽だという固定観念があったが、Pipesを頻繁に手直ししてると未読や既読が混ざってしまい扱いにくい。また、Fetch PageなどでRSSを生成するとpubDateが付かない(もしくは付けるのに苦労する)という点もWeb型と相性が悪い。Firefoxのライブブックマークなど、RSSそのものを単純に表示するようなツールの方が向いている気がする。 2.タイト

    uessay: Yahoo! Pipesのテクニックを10個(前編)
    Cherenkov
    Cherenkov 2011/01/27
    「Pipesの文字化けはcharsetを疑え」
  • 1