タグ

OCRと電子化に関するmyrmecoleonのブックマーク (1)

  • Google,HPの開発したオープンソースOCRエンジン「Tesseract」を公開

    Googleは,オープンソース・コミュニティSourceForge.netで文字認識(OCR)エンジン「Tesseract」を公開した。Google最上級技術リード(Uber Tech Lead)のLuc Vincent氏が米国時間8月,公式ブログGoogle Code Blogへの投稿で明らかにしたもの。SourceForge.netのWebサイトから無償でダウンロードできる。 Tesseractは,米Hewlett-Packard(HP)が1985~1995年にかけて開発していたOCRエンジン。ネバダ州立大学ラスベガス校(UNLV)が1995年に開催したOCRソフトウエアの精度を評価するコンテストで,トップ3の成績を記録したという。しかしHPがOCR事業からの撤退を決めたことから,「Tesseractはほこりをかぶっていた」(Google)。 その後「HPの関係者がTesseract

    Google,HPの開発したオープンソースOCRエンジン「Tesseract」を公開
    myrmecoleon
    myrmecoleon 2006/09/06
    素晴らしい。さっさと日本語も対応させて欲しいなー
  • 1