この手のアプリ作っている人には既知のことなんだろうけど、このあたりでアジア言語圏で作られたPDFから抽出したテキストが文字化けするという話題があって、下記の方法で一応解決できたぽいのでメモ。 “TJ”や”Tj”のオペレータコールバックから、 static void stringCallback(CGPDFScannerRef inScanner, void *userInfo) { CGPDFStringRef rawString; bool success = CGPDFScannerPopString(inScanner, &string); if(success) { NSString* string = [[NSString stringWithCString:(const char*)CGPDFStringGetBytePtr(rawString) encoding:NSUnic