タグ

rubyとxmlに関するemergentのブックマーク (3)

  • atomutil - RubyでAtomPubを操作するパッケージをリリースしました - Codin’ In The Free World

    PerlのXML::Atom, XML::Atom::Service, XML::Atom::Ext::Threading, AtompubをRubyにportingしてみました。 atompubというネームスペースは既に確保されてた(ネームスペースだけ8月に確保されてて、具体的なファイルやリポジトリは何も無い…)ので atomutilという名前にしておきました。 RubyForge RDoc gem install atomutil まだDocumentやTestが足りず、非常にバギーだと思いますが、試してみたい方はどうぞ。 使い方はPerlのものとほぼ一緒です。詳しくは上のリンクからRDocを参照して下さい。 entry = Atom::Entry.new entry.title = 'My Entry' entry.summary = 'Summary' entry.updated

  • REXMLで、RelaxNGを使ってValidationするにはどうすればいいのでしょうか? - sshi.Continual

    わけあって、XMLのスキーマを作ることになったのだけれど、イマドキXMLSchemaでもないよなそれは茨の道だ地獄への道は標準化が舗装する とか思ったのでRelaxNGを使ってみることにした。XMLやらスキーマやらRelaxやら言ってると、途端にじゃばじゃばいう擬音が聞こえてくるけども、こちとら自腹じゃそんな重たいものはいらぬ、というわけで、Rubyでライブラリをあさる。 軽くRAAを眺めてみると、Ruby標準のXMLライブラリであるREXMLにちらっとRelaxNGに対応とか書いてある。おお、じゃあそれでいいや。と、いろいろいじくってみたものの、壊滅的にドキュメントがない。一体どうやって使うんだこれ。 しょうがないので、ちらっとソースを眺めてみると、REXML::Validation::RelaxNG#validateの仮引数名がeventになってる。ははぁんこれは、ストリームパーサー系

    REXMLで、RelaxNGを使ってValidationするにはどうすればいいのでしょうか? - sshi.Continual
  • 進化する“Webスクレイピング”技術の世界 ― @IT

    2007/02/20 WebサービスAPIRSSフィードを使って複数サイトのサービスや情報をマッシュアップ――。これはWeb2.0が包含するいくつかの概念のうち、最も重要なものの1つだ。Amazon.comやGoogleYahoo!楽天といった大手Webサイトは、RESTやSOAPを用いたAPIを公開しており、さまざまなサービス提供者や個人がAPIを通して各種サービスを利用している。その一方、世の中のWebサイトの大多数はWeb1.0的なHTMLCGIフォームしか提供していないのが現実だ。こうした背景からWeb1.0サイトから構造化されたデータを引っ張り出す“Webスクレイピング技術が急速に発展してきているようだ。 HTMLをXML化し、XPathで関連データだけを抽出 例えば価格情報サイトでは製品名から価格が簡単に調べられるが、Webサーバから提供されるのは、製品名や価格にレ

    emergent
    emergent 2007/04/04
    Webの世界全体がそうした“フレンドリーな世界”になるのは、楽観的に見てもWeb88.0になるころではないか
  • 1