HTML を解析するには HTML::TreeBuilder が便利なんだけど、なかなか初心者向けのドキュメントが見つけられなかったので、自分用の覚え書きの意味も含めて、まとめておこうと思います。 とりあえずこんな HTMLファイル(sample.html) を処理してみましょう。 <html> <head> <title>sample.html</title> </head> <body> <div class="entry"> <div class="entry_head"> <h1><a href="http://www.hoge.jp/" id="link">www.hoge.jp</a> is fugafuga</h1> </div> <div class="entry_body"> hogehoge-fugafuga-hogehoge-fugafuga </div> </div