会議室にあるホワイトボード。印刷する仕組みがあれば良いが、そうでない場合は携帯電話のカメラで撮影していく事がある。後で見返すと会議の内容が思い出せるのは便利だが、画像データのままと言うのがいただけない。テキストデータに落とし込む仕組みはないだろうか。 スキャナなどがあれば、OCRと言う手がある。これは大抵スキャナ付属、または有料だ。だがこちらはオープンソースで提供されている。 今回紹介するオープンソース・ソフトウェアはWeOCR Project、Web上で利用できるOCRソフトウェアだ。 Web上で、と言っても実際はCGIベースで動作しているので、インタフェースとしてWebを介しているに過ぎない。だが、ブラウザベースで利用できれば便利な事も多そうだ。 利用できる画像の種類はBMPやJPEGなど。圧縮されていても利用できる。画面のスクリーンショットをアップしてみた限りでは、60~70%くらい