タグ

便利と言語に関するlocke-009のブックマーク (3)

  • XPath (XML Path Language) とは

    XPath(XML Path Language)とは、XMLで記述されたデータの問い合わせ言語です。SQLのSELECTのように、条件を指定してXMLデータを取得することができます。この記事では、XPathの使い方をご紹介します。 XPathとは XMLデータはツリーとしてモデル化でき、また、要素や属性などXMLデータを構成する各パーツは、ツリーを構成するノードとしてモデル化できます。XPathのデータモデルでは、XMLデータを以下の7種類のノードから構成されるツリーと考えます。 ルートノード(最上位ノード) 要素ノード(XMLの要素を表すノード) テキストノード(開始タグと終了タグで挟まれた文字列データ) 属性ノード(要素内で指定された属性をあらわすノード) 名前空間ノード(名前空間を表すノード) 処理命令ノード(処理命令を表すノード) コメントノード(コメントを表すノード) XMLの取

  • XPathとは | Octoparse

    XPath」とは、Webサイトの特定の部分を効率的に識別し、データを抽出するための言語を指します。この技術は、Webクローラーやスクレイピングツールにおいて中心的な役割を担い、Pythonなどのプログラミング言語やOctoparseのようなツールを使用する際に不可欠です。 XPathの使い方を理解することで、目的のデータを正確かつ迅速に取得することが可能になります。 記事では、XPathの基的な概念を初心者にもわかりやすく解説し、実用的な書き方や役立つ関数について詳しくご紹介します。この記事を読むことで、XPathの基礎知識を身につけ、効果的なWebデータ収集のスキルを習得できるでしょう。 Xpathとは そもそも「XPath」とは何を示すのかわからない方も多いでしょう。ここでは、XPathの基概念や仕組みをかんたんに紹介します。 XPath (XML Path Language)

  • クローラ作成に必須!XPATHの記法まとめ - Qiita

    最近クローラーを作成する機会が多く、その時にXPathが改めて便利だと思ったので XPathについてまとめてみました! XPathを学ぶ方の役に立てれば幸いです。 初級編 XPathとは XPathはXML文章中の要素、属性値などを指定するための言語です。 XPathではXML文章をツリーとして捉えることで、要素や属性の位置を指定することができます。 HTMLもXMLの一種とみなすことができるため、XPathを使ってHTML文章中の要素を指定することができます。 例えば、 <html> ... <body> <h1>ワンピース</h1> <div class="item"> <span class="brand">iQON</span> <span class="regular_price">1,200円</span> <span class="sale_price">1,000円</sp

    クローラ作成に必須!XPATHの記法まとめ - Qiita
  • 1