タグ

xmlに関するdenkenのブックマーク (99)

  • Latest topics > 独自の文書型宣言を含めつつエラーを出さない方法(XHTML 1.1でXMLとして他の名前空間の要素を組み合わせて使いたい人向けの話) - outsider reflex

    Latest topics > 独自の文書型宣言を含めつつエラーを出さない方法(XHTML 1.1でXMLとして他の名前空間の要素を組み合わせて使いたい人向けの話) 宣伝。日経LinuxにてLinuxの基礎?を紹介する漫画「シス管系女子」を連載させていただいています。 以下の特設サイトにて、単行まんがでわかるLinux シス管系女子の試し読みが可能! « すべて彼女のために Main ツリー型タブのサイドバーをAll-in-One Sidebarと連携させられないの?(I want the tree of tabs to be shown in the sidebar.) » 独自の文書型宣言を含めつつエラーを出さない方法(XHTML 1.1でXMLとして他の名前空間の要素を組み合わせて使いたい人向けの話) - Mar 17, 2010 僕はXHTMLのルビ(小さな字で読み仮名をふったり

  • XSLTをWebプロダクションレベルで普通の技術にするためには(?)

    自分のフォローしてない人たちのもなるたけ追って、とりあえず備忘録的なものとしてのまとめ。(後ろに追加しているあたり、だいぶ話が発散してますけど、まあそれがTwitterてことで…。どこまでこのまとめに追加するかは気分によります)

    XSLTをWebプロダクションレベルで普通の技術にするためには(?)
    denken
    denken 2010/02/23
    PHPの使えないサーバを借りてた5,6年前に、オレオレXMLをMSXMLでXHTMLに変えてFTPをするbatを使って日記を更新していた私が通りますよ…
  • x-xmlperl1.html#toggle

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    x-xmlperl1.html#toggle
    denken
    denken 2009/03/15
    perlやってる人はXMLが嫌いでYAMLとか使ってそうなイメージ
  • エラーを含んだXMLをルーズにパースする - kaisehのブログ

    各種ブログのRSSのようなWeb上のXMLリソースをdom4jやJDOMなどで読み込むと、パースに失敗するケースがとても多いです。というのも、こういうXMLは基的に、validであることをあまり期待できないからです(エスケープ漏れがあったり、"<!--"で始まったコメントの直後に"-"が来たりする[追記: これはinvalidな例じゃなく非well-formedな例でした])。ひどいときはwell-formedですらないこともあります。 こういう問題がある場合、HTMLであれば、MayaaやS2JSFでも採用されているNekoHTMLというライブラリを使って、エラーを出さずにルーズにパースできます。このNekoHTMLを、HTMLではなくXMLに適用する方法を調べたので、メモしておきます。 パーサを以下のような構成にすると、XMLの解析に適した状態になります。 NekoHTML側ではなく

    エラーを含んだXMLをルーズにパースする - kaisehのブログ
    denken
    denken 2009/03/04
    妥当でないXMLをnekohtmlで読む方法
  • XML::LibXMLでHTML文書を扱う - 徒書

    XML::LibXML大好きな者が以下述べてみます。 しかし、XML::Liberalを除けば、XML::*なモジュールはX抜きのHTMLってくれない.... と、404 Blog Not Found:perl - HTMLをXMLとして扱うで書かれていたのですが、XML::LibXML、というかその基となるCライブラリlibxml2はHTMLパーサも備えているので、直にHTMLを扱うこともできます。 ただ元がXMLパーサなだけに、少しでもHTML文書に壊れた部分があると解析エラーを起こして停止してしまいますが、幸いなことにそのエラーから回復するモードも備えています。以下サンプルを。 use strict; use warnings; use XML::LibXML; my $parser = XML::LibXML->new(); $parser->recover_silently(

  • yohei-y:weblog: 半構造データ、あるいは Web 上のデータ

    国島先生や斉藤先生が XML や半構造データについていろいろ書いてくださっており、それに反応する形ではてなブックマークや twitter 上での議論が日語で進んでいて面白い。 http://kunishi.blogspot.com/2008/12/twitter.html http://leoclock.blogspot.com/2008/12/relational-style-xml-query-sigmod-j.html http://kunishi.blogspot.com/2008/12/xml-db.html ブックマークや twitter で細かいコメントを書いているだけでは申し訳ないような気がするので、久々にエントリを書こうとしたのだけれど、なんだかバックグラウンドが長くなってしまった。最先端の研究者のみなさんに失礼な物言いもありますが、XML guy としては XML の

  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
    denken
    denken 2009/01/23
    あんまり関係ないけど、Atomの仕様とかみてると「&lt;hoge>」みたいなくだりがあって、そんなにエスケープの手間が惜しいかと思ったことがある。ちりも積もれば。
  • RDFとXMLの違いについて

    また,今までRDFが何なのか書籍を読んでもよくわからなかったのだが,「XMLは木構造,RDFはDAG(Directed Acyclic Graph)」だと説明されて疑問が氷解(木だけ説明して,森を見させてくれない書籍だったなあ…). 以下の文章内の「RDFがDAGである」という内容は間違いです。 DAGは「無閉回路有向グラフ」を意味し、サイクルを含むことができるRDFグラフは当てはまりません。「RDFは有向グラフである」が正しい表現となります。 お詫びして訂正します。 参照先ページののコメント欄も合わせてご覧ください。 RDFがDAGなのは、それ自体も重要なのだけれど、しかしそれのみでXMLと対比させるのは評価として正しくないと感じる。 僕が人にRDFを説明するときは、「XMLやCSVYAMLは、情報を直列化するための仕様だけれど、RDFっていうのは情報そのものを記述するための仕様だ」っ

    denken
    denken 2008/12/23
  • Back to XML - 檜山正幸のキマイラ飼育記 (はてなBlog)

    一時期、ある狭い範囲内では「XMLの檜山さん」だったわけですが、ここんところ、XMLにはご無沙汰で、事実上何もしてない。個人的な事情もあるけれど、期待したほどには XML everywhere、everything in XML という状況にはならないし、XML技術が変に矮小化されたり、トンチンカンな使い方をされたり、不毛な議論があったりと、デスパレートな気分にもなりますわな。 じゃ、XMLにまったく興味を失ったかというと、それはないです。不意に別れた昔の彼女に未練があるくらいの感情は残っています。あわよくば復縁したい、とね。そうは思っていても、行き違いや誤解や不運とかが重なってなかなか復縁できなかった、とそんな感じでしたね。 最近になって、XMLに戻れるかな、もう一度なんらかの形でコミットしようか、と思いはじめました。その事情を話す前に、XML技術がどう使えるか、どう使うべきかを述べて

    Back to XML - 檜山正幸のキマイラ飼育記 (はてなBlog)
    denken
    denken 2008/12/22
    オーバースペックなことも多いXML
  • ある日のTwitterのタイムラインをまとめてみた

    This Page has moved to a new address: kunishi’s blog: ある日のTwitterのタイムラインをまとめてみた Sorry for the inconvenience… Redirection provided by Blogger to WordPress Migration Service

    denken
    denken 2008/12/20
    「 XMLに関する(笑えない)ジョークに「XMLに携わる技術者が10人集まると、XML名前空間の解釈は11個ある」というのがあります。10人とも解釈が違って、さらに妥協の産物としての解釈が1通りあるという意味」
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • テキストデータとHTML断片を区別する | 水無月ばけらのえび日記

    以前に上記の方法と同じようなものを検討したことがある。エスケープ漏れが発生するのは、同じ変数の中味が処理の段階によって未エスケープからエスケープ済みに変わったり、未エスケープとエスケープ済みの変数が何の区別もなく混在しているからだという話をどこかで読んだためだ。 「安全なテンプレートシステムはあるのか」ですかね。型が同じなのが良くないのではないかという話であって、変数の名前で区別する話ではありませんが。 ……ところで余談ですが、新しいhatomaru.dllでも「全部DOMでつくり、InnerXml/OuterXmlには書き込まない」というポリシーは健在で、XSSに対する特別な配慮はほとんどしていません。それは良いのですが、実は「全部DOM」方式にも弱点があることが判明しています。 C#でこんなコードを書くと……。 XmlDocument result = new XmlDocument(

  • 例えば、PHPと謎の用語 | 水無月ばけらのえび日記

    それでもhtmlentities()はひどい。HTMLにあるのは数値文字参照と文字実体参照で、そのふたつを総称して文字参照と呼ばれることはあるが、HTMLエンティティと呼ばれることはない。HTMLエンティティという言葉からHTMLの仕様にたどり着くのは難しいだろう。 PHP畑の人と会話していると、たまに用語に違和感を感じることがあります。特に実体参照のことを「HTMLエンティティ」とか「エンティティ化」と呼んでいる人がけっこういるようなのですが、これは htmlentities() の影響なのかもしれません。 別途定義された実体 (entity) を参照 (reference) するから実体参照 (entity reference) なのでして、実体というのは実体宣言で定義された何かを指します。「リファレンス化」ならまだしも、「エンティティ化」では意味が逆になってしまうと思うのですが……。

    denken
    denken 2008/10/14
    &#169;
  • XMLサーバ/Cocoon自由自在! 第1回 Cocoonをセットアップしよう

    XMLサーバ/Cocoon自由自在! 第1回 Cocoonをセットアップしよう XML文書の利点の1つは、自由な変換が可能な点だ。XMLを元に、Webブラウザに対応したXHTML、iモードなどの小型画面に対応したCHTML、あるいはプレーンテキストやPDFなど、1つの情報を元に複数のフォーマットを作成できる。それを実現してくれるXMLサーバが「Cocoon」だ。この連載では、CocoonによるXML文書の変換の実際を紹介していく。 太田一郎 ティアイエス株式会社 2001/9/1 XML文書をWebで配信したい。とりあえずそんなときは、その文書をXSLTのスタイルシートとともにWebサーバにアップロードします。Internet Explorer(以下IE)やMozillaなどのXSLTに対応したWebブラウザなら、これだけでOKです。XSLTに対応したWebブラウザなら、Webサーバに置い

    denken
    denken 2008/08/07
    分の悪い名前だなあ
  • RSSをパースするときの制御文字への対処 - public static void main

    DOMを使ってRSSをパースしているとたまに以下のエラーがおきることがあります。(Livedoorブログ、FC2、Amebaブログとかが多い) An invalid XML character (Unicode: 0x14) was found in the element content of the document.Unicode: 0x14の部分は0xbだったりいろいろです。 原因は、絵文字を使っていたり、文字化けしたりといったことによって制御文字が挿入されたためのようです。 ASCIIコードでは0x00〜0x1Fと0x7Fのコード範囲が制御文字になり、これが含まれているXMLはinvalidになるようです。 Javaの場合、RSSをパースする前に以下のようにこの制御文字を削除しました。 str.replaceAll("[\\00-\\x1f\\x7f]", ""); 上記のコード

    RSSをパースするときの制御文字への対処 - public static void main
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • FC2ブログ 現在アクセスが集中しています。

  • Reread : IE6 ???? XML ???????????????

    ...

    denken
    denken 2007/11/22
    Lintで100点を取ることにこだわるあまりよけいなオーバーヘッドを増やしたら意味がないですね。
  • xsltによるxml変換で質問です。 xsltを使って、RSSのような複数の記事が連続して収録されているxmlを元に、記事単位でhtmlファイルを生成させることは可能でしょ…

    xsltによるxml変換で質問です。 xsltを使って、RSSのような複数の記事が連続して収録されているxmlを元に、記事単位でhtmlファイルを生成させることは可能でしょうか。可能であれば方法を教えてください。不可能なのであれば、不可能であることが説明されているURL等を教えてください。 例えば、 <rss> <channel> <item> <title>記事 1</title> ... </item> <item> <title>記事 2</title> ... </item> <item> <title>記事 3</title> ... </item> </channel> </rss> こういうRSS(xml)を入力にして、 -記事1.html -記事2.html -記事3.html を生成するようなことです。1入力1出力の方法はわかりますが、1入力n出力の記述方法がわからないの