はてなダイアリーに書いた日本語に無い中国語漢字は全て数値文字参照 に変換されてしまいます。 WordPressに移行しようと思い、調査のため Movable Type形式でデータをエクスポートしたはいいが、数値文字参照のままでは。。。 意味がないのでこの部分を変換してみました。 言語は何でもよかったのですが、丁度手元にあったPHP環境で書きました。 変換の関数ですが、どれを使ったらいいのか分からなくて mb_convert_encoding($str ,'UTF-8','HTML-ENTITIES'); や $convmap = array ( 0x0000, 0xffff, 0x0000, 0xffff ); mb_decode_numericentity ( $str, $convmap, 'UTF-8' ); いろいろ試行錯誤しましたが上記では一部の中国語が変換されなかったりしたので