タグ

XMLに関するcyboのブックマーク (5)

  • エラーを含んだXMLをルーズにパースする - kaisehのブログ

    各種ブログのRSSのようなWeb上のXMLリソースをdom4jやJDOMなどで読み込むと、パースに失敗するケースがとても多いです。というのも、こういうXMLは基的に、validであることをあまり期待できないからです(エスケープ漏れがあったり、"<!--"で始まったコメントの直後に"-"が来たりする[追記: これはinvalidな例じゃなく非well-formedな例でした])。ひどいときはwell-formedですらないこともあります。 こういう問題がある場合、HTMLであれば、MayaaやS2JSFでも採用されているNekoHTMLというライブラリを使って、エラーを出さずにルーズにパースできます。このNekoHTMLを、HTMLではなくXMLに適用する方法を調べたので、メモしておきます。 パーサを以下のような構成にすると、XMLの解析に適した状態になります。 NekoHTML側ではなく

    エラーを含んだXMLをルーズにパースする - kaisehのブログ
    cybo
    cybo 2009/02/26
  • Leo's Chronicle: XML時代の終焉 ~ XMLから再びCoddへ

    先日、ACM SIGMODの日支部大会に招いていただいて、「Relational-Style XML Query (ACM Portal http://doi.acm.org/10.1145/1376616.1376650)」について講演をしてきました。Relational-Style XML Queryは、XMLという複雑な構造をもったデータに対して、SQLのようなテーブルデータへの検索に使われる言語で問い合わせする手法です。 この研究の肝は、木構造データといわれるXMLでも、実はそのほとんどがリレーション(Microsoft Excelのようなテーブル形式のデータ)の組み合わせと考えることができ、そのテーブル構造の情報(スキーマ)を使うと、検索が非常に簡単に書けるという点です。

  • 【インフォシーク】Infoseek : 楽天が運営するポータルサイト

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • 価格.com API + Relaxer - mokkouyou2001の日記

    http://apiblog.kakaku.com/KakakuItemSearchV1.0.html 価格.comでもAPIが公開されました。 以前YahooJapanAPIの時は、JaxMeなどでマッピングしたけど、 今度はrelaxerを使用してみようということで実験 Relaxer1.1はインストール済みで、 RELAX_HOMEが環境変数に登録してあり、%REALX_HOME%\binにPATHが通っているものとする。 商品検索API を見てみると、 サンプルがあるので、それを元に、rngを生成してみます。 #kakakuResult.xml <?xml version="1.0" encoding="utf-8" ?> <ProductInfo> <NumOfResult>794</NumOfResult> <Item> <ProductID>00200614970</Prod

    価格.com API + Relaxer - mokkouyou2001の日記
  • XMLデータのあるタグの値を書き換えたいと思っています。…

    XMLデータのあるタグの値を書き換えたいと思っています。「/root/b = 10」のように指定すると、以下のように書き換えてくるツール・実装を探しています。Javaがベストですが、他の言語でも構いませんので、サンプルがあれば教えて頂けますか。 書き換え前 <root> <a>11</a> <b>12</b> <c>13</c> </root> ↓ 書き換え後 <root> <a>11</a> <b>10</b> <c>13</c> </root> ※bタグの値が書き換わっている。

    cybo
    cybo 2007/02/25
  • 1