XPathとは - mteramotoの日記でXPathを覚えたので、さっそくEntryFullTextで使ってみる。 bodyのないFeedを探すと、ちょうどオルタナティブ・ブログが見つかったので、これをネタにしよう。 FireFoxのコンテキストメニュー「ページのソースを表示」を使ってソースをながめて、XPathを考える。 div[@class="contents"]がよさそう。XPath Checkerを使って、ちゃんと本文が取得できてることを確認。 Handlerはこんな感じかな。XPathがうまく使えると、すごく簡単に書けるのがうれしい。 author: mteramoto handle: http://blogs\.itmedia\.co\.jp/.+/\d{4}/\d{2}/.+\.html extract_xpath: body: //div[@class="content