TwitterのStreaming APIを使っていた後輩が、取得される文字が化けていると嘆いていたので見てみると、Unicodeエスケープされた文字が取得されているようでした。 Pythonだと結構楽に変換できるみたいだけど、JavaはUnicodeエスケープされた文字をデコードしてくれるような標準ライブラリはどうやらなさそうな模様。Charsetならエンコード変換するものがあるけれど(Shift_JIS→UTF-8など)、Unicodeエスケープはバイトレベルの変換ではなく、ASCII文字にされてしまっているので適用できるわけもない…。無理やりASCIIにマッピングするのはURLエンコードと同じような感じですね。(まぁこちらにはjava.net.URLEncoderやjava.net.URLDecoderがあるんですけどね) という訳で簡単ですが、JavaでUnicodeエスケープされ