タグ

2019年1月4日のブックマーク (3件)

  • tess-twoでAndroidアプリにOCR機能を追加する - Qiita

    SlideViewer というアプリをリリースしています。 そこでは、Speaker Deck のスライドを表示できているのですが、テキストをコピーしたりはできません。 そこで、 https://github.com/noboru-i/SlideViewer/pull/44/files の変更を加えて、OCR機能を追加しました。 tess-twoを導入する Tesseract というOCRのライブラリを利用することにしました。 rmtheis/tess-two というTesseractのラッパーライブラリが、Androidへの導入には簡単そうでした。 READMEに書いてあるとおり、compile 'com.rmtheis:tess-two:6.2.0'を追加します。 また、NDKが必要とのことだったので、 プロジェクトへの C / C++ コードの追加 | Android Studio

    tess-twoでAndroidアプリにOCR機能を追加する - Qiita
    t_furu
    t_furu 2019/01/04
    Tesseractのラッパーライブラリ
  • Google Cloud Vision APIのOCR(画像認識)を検証する - Qiita

    今回はこの中の「文章検知(OCR)」を使っています。 検証に使った画像 今回、色々なパターンの画像を使い、どのくらいの精度で検知が出来るのか試してみました。検証に使った画像は以下の通りです。 キャプチャ画像(文字のみ) キャプチャ画像(イラスト&文字) 印刷物を撮影したデータ(Word文章) 印刷物を撮影(Excel表) 手書き文字を撮影 (おまけ)アラビア文字 検証環境 以下の環境で検証しています。 - AWS EC2 Amazon Linux - PHP 5.3.29 - Google Cloud Vision V1 検証方法 APIキーの取得 まずはGoogle Cloud Visionを使用するにあたって必要なAPIキーをGoogle Developers Consoleから取得します。 Google Developers Console サンプルプログラム サンプルプログラムはこ

    Google Cloud Vision APIのOCR(画像認識)を検証する - Qiita
    t_furu
    t_furu 2019/01/04
    Google Cloud Vision APIのOCR機能
  • ColaboratoryでTesseract-OCRを動かしてみる - Qiita

    今回はGoogle機械学習の学習や研究用に提供をしているColaboratoryを扱ってみます。 これまでのブログは、Jupyter Notebookで、ローカル環境のブラウザで、プログラムの動作確認をしていました。 ColaboratoryはGoogleのアカウントがあれば、ソフトウェアインストールなしで、Jupyter Notebookと同等な環境を使用できるので、非常に便利です。 Colaboratoryを使ってみる。 Googleアカウントでログインした状態で、Colaboratoryにアクセスしてみます。 ファイルメニューから「Python3のノートブックを新規作成」を選ぶと以下のような編集画面になります。 Jupyter Notebookと画面も操作性もほぼ同じです。 ノートでの解析処理は、ハードウェアアクセラレーターを使用することも可能です。 ランタイムメニューの「ランタイ

    ColaboratoryでTesseract-OCRを動かしてみる - Qiita
    t_furu
    t_furu 2019/01/04
    日本語OCR