HTMLの中から指定したDOMを探し出すにはXPathまたはCSSセレクタを使う方法が考えられます。jQueryなりを使って利用する人が多いと思いますが、今回はWebブラウザを使わずにターミナルで行うケースを考えます。 そのためのツールがcssgrepです。まるでファイルをgrepするようにXPathやCSSセレクタを使ったテキスト抽出ができます。 cssgrepの使い方 MOONGIFTで試したところ。 サンプルのコードは次のようになっています。 curl http://linuxfr.org/ | ./cssgrep.rb '#friends li:nth-child(even)' <li><a href="http://www.agendadulibre.org/">Agenda du libre</a></li> <li><a href="http://fr.lolix.org/"