マサチューセッツ工科大学(MIT)がオープンソースのOCR(光学式文字読み取り)エンジン「Tesseract」のJavaScript実装「Tesseract.js」を公開した。 Tesseract.jsは、米HPが開発しその後Googleによってオープンソース化されたOCRエンジンであるTesseractをJavaScriptに移植したもの。Emscriptenコンパイラを利用してC++で書かれたTesseractのライブラリをクロスコンパイルし、自動ダウンロードシステムと言語ファイルを加えた。日本語、英語、スペイン語、中国語、韓国語を含む60以上の言語をサポートする。 テキストの向きとスクリプトの検出を自動で行うことができ、シンプルなインターフェイスを利用して文章を読むことができるという。テキスト認識のオフロードができるため画像処理アプリケーションのコストを下げ、利便性を改善できるとして
![テキスト認識エンジン「Tesseract」をJavaScriptに移植した「Tesseract.js」 | OSDN Magazine](https://cdn-ak-scissors.b.st-hatena.com/image/square/4196864a37518a8c4219cc80d90c0a0b1a82a491/height=288;version=1;width=512/https%3A%2F%2Fmag.osdn.jp%2Fimages%2Fmag%2Fmagazine-200x200.png)