タグ

OCRに関するamatanoyoのブックマーク (4)

  • エバーノート日本法人設立〜画像の日本語認識機能を提供開始 - ネタフル

    Evernote Japan Launch」ということで、日法人設立の発表記者会見が東京駅側で行われていまして、そのレポートをお届けします。 CEOフィルよりプレゼンテーション。 ・エバーノートは記憶のプラットフォームである ・ツイッター、mixiなどは素晴らしいサービスだが全てソーシャルコミュニケーションのためのツールである ・エバーノートは友達のためでも同僚のためでもない自分自身の記憶が外部化するためのツールである ・ツイッターなどのソーシャルサービスに投稿された情報は友達が見ることを前提にしいる ・ところがエバーノートに入力された情報を見るのは自分自身だけである ・エバーノートは人間の外部の記憶を果たすので様々なバージョンがある ・Mac/Winのほかありとあらゆるスマートフォン版が用意されている ・最近になってiPad版が追加され急成長している ・iPadを始めとするタブレット

    エバーノート日本法人設立〜画像の日本語認識機能を提供開始 - ネタフル
    amatanoyo
    amatanoyo 2010/06/23
    手書きはダメだったけど、印刷文字はちゃんとできる。
  • Apache2 Ubuntu Default Page: It works

    This is the default welcome page used to test the correct operation of the Apache2 server after installation on Ubuntu systems. It is based on the equivalent page on Debian, from which the Ubuntu Apache packaging is derived. If you can read this page, it means that the Apache HTTP server installed at this site is working properly. You should replace this file (located at /var/www/html/index.html)

  • OCRKit - Simply fast OCR

  • 愛書家失格: AcrobatのOCRテキスト認識の精度について調べてみた―(2)本論と結論

    実験の結果 調査した8つのパターンについて、誤認識した文字の数と正しく認識した文字の率(認識率)を表にしました。認識率については小数点以下2桁目を四捨五入しました。 (4)については、どういうトラブルなのか、丸々2行分認識できていなかったので、今回は計測無しということにします。とにかく、こういうこともあるんだということがわかりました。 8つの実験すべての場合でまったくお手上げだった部分がありました。 ひとつは割り注の部分で、もうひとつは縦書き文中に出てくる横文字の部分。 今回これらについては、誤認識文字数に含めませんでした。 どのような誤認識があったか 「範疇」の「疇」の字と「論理学論叢」の「叢」の字が、まったく正しく読み取れませんでした。これらは、画数が多いために判別が難しかった文字なのかなと思われます。 画数が多いわけではないのに「世紀」の「紀」の字がほとんど正しく読み取れませんで

  • 1