PHPで、RSS等のXMLを取得し、パースしています。 その際、 ・不正な文字 ・不正な文字コード をうまく除去できずに、エラーが沢山出ます。 preg_matchを使うので、urlencode で変な記号が入らないようにしていますが、 別のとこでエラーがでたりします。 unterminated entity reference ... Compilation failed: nothing to repeat at offset Entity: line 499: parser error : Input is not proper UTF-8, indicate encoding ! Bytes: 0xE3 0x2E 0x2E 0x2E in というようなのが多いです。 php5のsimplexml_load_string等で今はパースしています。 文字コードを整え、不正文字を見つけれ