Twitterで 「Evernoteは縦書き日本語OCRにも対応しているらしいのでエロ漫画をぶっこんで好きな時に好 きなジャンルのそれを検索するというライフハック思い付きました」 とかつぶやいてたらなんとなく日本語OCRを試してみたくなったのでやってみた。 適当に調べて、まあ、MacPortsに入っているものでということで(インストールが楽だから) Tesseract とやらを試すことにした。 他にもgocrとかOCRopusとかあったけどバージョン番号的にこっちがいいかなって。 まずは $ sudo port install tesseract で、インストールしながら README を読んでると どうも言語データが必要らしいので http://code.google.com/p/tesseract-ocr/downloads/list からjpn.traineddata.gzをとりあえ