HPで開発され、現在ではオープンソースとなっているOCRソフトウェア「Tesseract-OCR」の調教をしようと思って、Training Tesseract3のページを眺めている。 日本語文書のOCRに利用する「jpn.traineddata」を無理やりテキストエディタで開いてみると、上記育成法解説から予想される通り、ファイルの最初の方に「認識させたい文字一覧」がユニコードテキストとして読み取れる状態で含まれている。 ざっと眺めてみたところ、JIS X 0208(0213)の第一水準漢字のうち、次のものが含まれていない。 穐 袷 吋 蔚 嬰 盈 穎 謁 掩 鴛 鴬 禾 恢 劾 浬 蛎 鈎 劃 廓 鰍 椛 竃 侃 桓 澗 翰 諌 翫 誼 掬 黍 笈 禦 兇 彊 尭 粁 駈 虞 轡 粂 祁 荊 戟 倹 乎 鈷 梧 佼 肱 砿 壕 甑 忽 坤 艮 孜 鴫 悉 蔀 屡 蕊 勺 綬 蒐 輯 酋 藷
OCR機能を搭載した 「iPhone」アプリの開発 所 属 : 仲野研究室 指導教員: 仲野誠 発 表 者: 神夏子 2013年度 情報教育コース 卒業研究 構想発表 目次 §1 開発動機 §2 OCR ■OCRとは ■日本語対応のOCRエンジン ■インストール ■テスト ■TesseractとNhocrの比較 §3 今後の課題とスケジュール ・開発環境 ・参考サイト §1 はじめに ■研究動機 OCR機能が搭載されたアプリをよく目にする… OCRについて 学びたい!!! 名刺認識管理アプリ,手書きメモ認識アプリ, レシート認識家計簿アプリetc… OCR機能を使って 何か便利なアプリを 自分でつくってみたい! ■アプリ内容について、、、 手書き文字認識のメモ帳アプリ 画像文字認識の家計簿アプリ ・既に同じ機能がついたアプリが存在していた ・OCRエンジンがどの程度認識するのかわからなかっ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く