タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

rubyとxmlに関するymorimoのブックマーク (2)

  • RubyでUTF8とXML書き出し – Naofumi Kagami

    アップデートRSSからTwitterに自動投稿をしてくれるTwitterfeedなどのサービスがありますが、これらは下記の2.の「XMLはUTF8をそのままに残す」というのができなくて文字化けを発生させているようです。”&#26085″などの記号はウェブブラウザだと正しく変換して画面に表示してくれますが、ほとんどのTwitterクライアントではこの変換をやらないためです。 丸一日、これで悩んでいました。なんとか解決したので、ここに記録します。 やりたかったこと UTF8化したデータをXMLに書き出す。 XMLファイルはUTF8をそのままに残す。例えば”日語” => “日&amp#26412;&amp#35486;”という変換はしない。 大きいXMLファイルを書き出したいので、XMLをすべてメモリに溜め込んでから書き出すのではなく、少しずつファイルに書き出す。 そんなに珍しいことをやろう

    RubyでUTF8とXML書き出し – Naofumi Kagami
  • XML Cleansing

    If you accept data from various sources, and want to produce XML that can be consumed, one thing you need to be careful about is character set issues. On the input side, people often lie or make mistakes.  Many don’t specify an encoding, and while XML’s default is utf-8, it is common to find iso-8859-1 or even win-1252 data. On the output side, if you want to produce something that can be consumed

    ymorimo
    ymorimo 2008/03/04
    なんでBuilderでto_xsかまして全エスケープしてるのかいまいちよくわからん
  • 1