XPathとは XPath(XML Path Language)とは、XML形式の文書から、特定の部分を指定して抽出するための簡潔な構文(言語)です。HTML形式の文書にも対応します。 CSSではセレクタを使ってHTML文書内の特定の部分を抽出しますが、XPathはより簡潔かつ柔軟に指定ができるとされています。以下の例はbody以下のリンク要素(hogeクラス)を取り出す書き方です。 CSSセレクタ html > body a.hoge XPath /html/body//a[@class="hoge"] XPathを試してみる 上記のとおり、XPathはHTMLのパースに使えます。なのでHTMLに対してXPathでデータを抽出するのがお試しとしては簡単でしょう。 Google Chrome で XPath を書いてみる Google Chrome の開発者ツールには、XPathによる検索
![XPathのまとめ、要素の参照方法いろいろ](https://cdn-ak-scissors.b.st-hatena.com/image/square/e9c7de32b921fef6abadb5ceea1ea92a8202b9d3/height=288;version=1;width=512/https%3A%2F%2Fwebbibouroku.com%2Fwp-content%2Fthemes%2Flionmedia%2Fimg%2Fimg_no.gif)