XMLを解析したい用事が出来たので、折角だからPythonでやってみたところ、 日本語を含むXMLだったのでUnicodeEncodeErrorが出てしまった。。。 「Unicode文字列って何?」状態だったので、やったことを忘れないようにメモメモ。 XMLパーサー 代表的なパーサーは2つ(SAXとDOM) SAXはイベント駆動型と呼ばれるXMLパーサー。 XML文章を読み込んで、タグやテキストなど読み込んだ文字列に応じてイベントを発生させ、 そのイベントに対応するハンドラを呼び出すことでXMLを解析する。 XMLパーサーにはDOMと呼ばれるものもあって、XML文章を一度すべて読み込んで解析し、 DOMツリーと呼ばれる形式でメモリ上に展開する。 メモリ上に一回全て展開するので、それなりにメモリを消費する。 SAX/DOMともに、Python2.0で追加されていて、処理の構造上、向いている処