タグ

parserに関するhiro360のブックマーク (2)

  • エラーを含んだXMLをルーズにパースする - kaisehのブログ

    各種ブログのRSSのようなWeb上のXMLリソースをdom4jやJDOMなどで読み込むと、パースに失敗するケースがとても多いです。というのも、こういうXMLは基的に、validであることをあまり期待できないからです(エスケープ漏れがあったり、"<!--"で始まったコメントの直後に"-"が来たりする[追記: これはinvalidな例じゃなく非well-formedな例でした])。ひどいときはwell-formedですらないこともあります。 こういう問題がある場合、HTMLであれば、MayaaやS2JSFでも採用されているNekoHTMLというライブラリを使って、エラーを出さずにルーズにパースできます。このNekoHTMLを、HTMLではなくXMLに適用する方法を調べたので、メモしておきます。 パーサを以下のような構成にすると、XMLの解析に適した状態になります。 NekoHTML側ではなく

    エラーを含んだXMLをルーズにパースする - kaisehのブログ
  • XAMJWG – WELCOME TO THE XAMJWG PROJECT

    The history of taxi’s In this blog, I will tell you all about how taxis first started. The way the world has changed in terms of transport is so dramatic and no one ever really thinks about just how far we have come over the years. Taxis weren’t always around to chauffeur people about but there were other types of transport that taxis actually originated from. Where did it all start? Years ago, th

  • 1