タグ

Rubyとxmlに関するuchiuchiyamaのブックマーク (5)

  • rubyのNokogiriをもっと簡単に!Slopする。 - それマグで!

    ruby のNokgiri をもっと簡単に使いたい。 PHPSimpeXMLに負けてる気がします。JSON.load にも負けてる気がします。 NokogirのSlopを見つけた doc = Nokogir::Slop("<book><title>日常に潜む数理曲線</title></book>") doc.book.tile.text #=> 日常に潜む数理曲線 これが出来る。 もういちいち、searchで降りて行かなくていいんです。オブジェクトしてアクセ出来るようになってとても便利なんです。 実際にやってみた 次のような。XMLがあるとき users.xml <?xml version="1.0" encoding="utf-8"?> <users> <user> <loginId>takuya@mmmm.jp</loginId> <passwd>************</pass

    rubyのNokogiriをもっと簡単に!Slopする。 - それマグで!
  • Rubyで数値文字参照を文字列に変換 - 基本へ帰ろう

    Rubyで数値文字参照を文字列に変換するのってどうやるんだろう・・・と思って調べてみました。 数値文字参照とは 文字参照 - Wikipedia 上記を読んでいただければ分かります。 HTMLなどのSGML文書においては、直接記述できない文字 や記号(マークアップで使われる "<" や "]]" など)を表記する際に用いられる方法である。 XMLにおいては、HTMLにおける「数値文字参照」を文字参照と呼 ぶ。なおHTMLにおける「文字実体参照」は、XMLでは実体参照(Entity reference)と呼び区別する。 文字列と数値文字参照の変換をやってみる 【みんなの知識 ちょっと便利帳】文字列と数値文字参照(文字参照)の変換スクリプト - 機種依存文字文字化け防止でWeb上で変換できます。 文字列 - ♪ 10進数数値文字参照 - &#9834; 16進数数値文字参照 - &#x266a

    Rubyで数値文字参照を文字列に変換 - 基本へ帰ろう
  • Overview

    Overview Overview API Support Tutorials Changelog About Nokogiri¶ Nokogiri (鋸) makes it easy and painless to work with XML and HTML from Ruby. It provides a sensible, easy-to-understand API for reading, writing, modifying, and querying documents. It is fast and standards-compliant by relying on native parsers like libxml2, libgumbo, and xerces. Guiding Principles¶ Some guiding principles Nokogiri

    Overview
  • RubyでXML操作: Netsphere Laboratories

    Warning. (2019.1) REXML は, 標準添付ですが, 品質・速度の両面であまりよくありません。Nokogiri (鋸) がメジャーで、長らく標準の地位で使われています。REXML の3倍速い。 最近は, 大鋸 (おが) の人気が高い。スレッドセーフ、高速、機能性もある。Yorick Peterse / oga · GitLab REXMLの特徴 REXMLは、 XML 1.0に準拠した、高速なXMLパーサで、DOMツリーを生成したり、XML文書を読みながらコールバックさせる (SAX2ストリームパーサ) ことができる。 XPathの実装を含み、検索式によってDOMツリーの好きな要素を取り出すことができる。 Ruby 1.8.5にはREXML 3.1.4が添付されている。チュートリアル、APIリファレンスは下記で見られる。が、APIリファレンスのほうは不十分かつ誤りもある。

  • 進化する“Webスクレイピング”技術の世界 ― @IT

    2007/02/20 WebサービスAPIRSSフィードを使って複数サイトのサービスや情報をマッシュアップ――。これはWeb2.0が包含するいくつかの概念のうち、最も重要なものの1つだ。Amazon.comやGoogleYahoo!楽天といった大手Webサイトは、RESTやSOAPを用いたAPIを公開しており、さまざまなサービス提供者や個人がAPIを通して各種サービスを利用している。その一方、世の中のWebサイトの大多数はWeb1.0的なHTMLCGIフォームしか提供していないのが現実だ。こうした背景からWeb1.0サイトから構造化されたデータを引っ張り出す“Webスクレイピング技術が急速に発展してきているようだ。 HTMLをXML化し、XPathで関連データだけを抽出 例えば価格情報サイトでは製品名から価格が簡単に調べられるが、Webサーバから提供されるのは、製品名や価格にレ

  • 1