タグ

nokogiriとxmlに関するclavierのブックマーク (2)

  • Nokogiriメモ。XMLを解析する - ぽひゅっとメモ

    別途で、XMLファイルを出力するのも書きます(次の日記) まず今回の日記は Nokogiriでxmlファイルを読み込む・解析のやり方について(メモ程度)。 抽象的すぎて良い例ではないですが、こんなXMLがあったとする <xml_node> <test_node type="a"> <hoge> <hoge_child>hoge1</hoge_child> <hogehoge>hoge2</hogehoge> </hoge> <fuga>fuga1</fuga> <piyo>piyo1</piyo> </test_node> <test_node type="a"> <hoge> <hoge_child>hoge3</hoge_child> <hogehoge>hoge4</hogehoge> </hoge> </test_node> <test_node type="b"> <hoge>

    Nokogiriメモ。XMLを解析する - ぽひゅっとメモ
  • Ruby製の構文解析ツール、Nokogiriの使い方 with Xpath - プログラマでありたい

    RubyHTMLやXMLをパースする構文解析ツールの定番は、Nokogiriです。スクレイピングする際の必需品で、なくてはならないモジュールの1つです。ただ色々なことが出来る反面、どこから取りかかれば良いのか解り難い部分もあります。自習を兼ねて、Nokogiri概要と主要な機能を紹介してみます。 Nokogiriとは何か? ReademeによるとNokogiriとは、「HTMLとXMLとSAXとXSLTとReaderのパーサー」で、特徴としては、XPathCSS3セレクター経由で探索する機能を持つことのようです。他にもHTMLやXMLのビルダーの機能を持っていますが、HTMLとXMLのパーサー(構文解析器)と覚えておけばよいでしょう。 Nokogiriのクラス構造 Nokogiriは、なかなか巨大なライブラリです。10以上のモジュールと70以上のクラスで構成されていて、yardでダイア

    Ruby製の構文解析ツール、Nokogiriの使い方 with Xpath - プログラマでありたい
  • 1