ryskosnのブックマーク - はてなブックマーク

Webスクレイプ時におけるXPath取得方について - うせーのブログ運営ひとりごと
勉強がてらamazonのベストセラーを引っ張ってきて、ジャンルごとに商品のランキング商品説明商品レビュー（参考になった上位3人）を並べてHTML形式に成形する、ということをやってみた。「引っ張ってきて」の部分はperlのWeb::Scraperモジュールを利用するのだが、スクレイピングするためには「ページのどの部分を拾ってくるか」を定義してやる必要がある。 use Web::Scraper;　今日のCPANモジュール今回は、XPathを指定してスクレイピングすることにした。XPathの指定は上記リンクの通り、Firebugを利用してみた。さて、このFirebugでのXPath抽出だが、amazonで試すと相当「ウソ」が返ってくることがわかった。上記の要素を拾ってきたいとする。Firebugが返す値は /html/body/div[4]/table/tr/td[2]/div/
ryskosn 2010/02/21
XPath
リンク
さくらインターネットのcron設定 - うせーのブログ運営ひとりごと
さくらインターネットでのcron設定は基本的にコントロールパネル（Webベースの管理ページ）から実施する…が、コントロールパネルからは最大5つしか登録できません。ブログの自動更新のために複数のスクリプトを定期的に動作させるためには、5つではどうしても足りないので、コマンドラインで接続（できるのはスタンダードプラン以上）をして、cronを登録する必要があります。 # crontab -e 基本的なことだが、これによって、5つ以上のスクリプトを仕掛けておくことができます。【登録したスクリプトが動かない場合】 perlスクリプト等で、内部で（自分でインストールした）モジュールを使っている場合などは、cronにスクリプトを登録しただけでは動きません。なぜなら、自分でインストールしたモジュールへはパスが通っていないから。であればcronの先頭でパスを通してしまいましょう。ついでにシェルやもろも
ryskosn 2010/02/21
cron

Perl

さくら
リンク
1

はてなブックマーク

タグ

ブックマーク / bsks.sakura.ne.jp (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / bsks.sakura.ne.jp (2)

Webスクレイプ時におけるXPath取得方について - うせーのブログ運営ひとりごと

さくらインターネットのcron設定 - うせーのブログ運営ひとりごと

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス