タグ

ocrに関するtk78のブックマーク (8)

  • macOS のデフォルト状態でコマンドラインからOCR処理を行う - TeX Alchemist Online

    macOS 12 Monterey では,OSビルトインでのOCR機能が搭載されました。Preview.app で,画像やスキャンPDF(中身がスキャン画像のPDF)に対して,ただマウスでドラッグするだけで,中身の文字を認識して選択し,コピーできるようになっています。さらに,macOS 13 Ventura では,それが日語にも対応しました。 たとえば,(今や入手困難となってしまった)The TeXbook のアスキーによる日語版をスキャンしたものを Preview.app で開くと,何もしなくても,文字選択できます。 これをコピーして他のエディタにペーストすると, TEXの名称で気をつけなければならないことがほかにもある。Eの文字が不揃いになっていることだ。Eの文字を少し下げてあるのは、TeXが組版のためのシステムであることを印象づけるためであり、またほかのシステムの名称と区別するた

    macOS のデフォルト状態でコマンドラインからOCR処理を行う - TeX Alchemist Online
    tk78
    tk78 2023/06/30
  • OCR処理プログラム及び学習用データセットの公開について | NDLラボ

    2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日語のOCR処理プログラムです。 このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。 機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。 リポジトリ : https://github.com/ndl-lab/

    tk78
    tk78 2022/04/26
  • スマホにカメラついてるんだからOCRできるでしょという気持ち - Progate Tech Blog

    どうも、 株式会社Progate で SoftwareEngineer チームのマネージャーをしています @satetsu888 です。記事は Progate AdventCalendar 2020 10日目です。 普段仕事ではエンジニア組織のことやプロダクトの技術戦略的なことを考えたり、ミーティングしたり採用活動したりタスクをお願いして回ったりなどを担当していますが、今日はそういうのとはなんの関係もないただの日常の話を書こうと思います。 ことの始まり 我が家では子どもの朝ごはんとして週に2,3回くらいの頻度でポケモンパンを買っています。 先日(2020/09/18 ~ 11/24) ポケモンパンについてるポイントを5点集めるとポケモンシールホルダーの抽選に1回応募できるキャンペーンがありました。(キャンペーン自体はすでに終了しています) いつも通りのペースでパンを買ってると何回か挑戦で

    スマホにカメラついてるんだからOCRできるでしょという気持ち - Progate Tech Blog
    tk78
    tk78 2020/12/10
  • Microsoft Cognitive Services「Computer Vision API」を使ってOCR認識を試す - 吉田の備忘録

    tk78
    tk78 2016/05/15
  • iOSで日本語OCR!ビルド編〜iOS SDK 6.1 + tesseract-ocr 3.02〜 | DevelopersIO

    最近iOSでOCR(Optical Character Recognition:工学文字認識)をしたいとの声をよく耳にするので調査してみました。 オープンソースのOCRエンジン「tesseract-ocr」 オープンソースで日語に対応したOCRエンジンを探してみると、tesseract-ocrなるものを見つけました。このtesseract-ocrですが、Google先生が開発を支援していると噂のオープンソースのOCRエンジンで、C++で書かれています。また、英語、日語だけでなく多数の言語にも対応しています。ライセンスはApache License 2.0です。ちなみに読み方は「テッサラクトOCR」だそうです。 tesseract-ocrではiOSで簡単に利用できる形式では配布しておりませんが、C++で書かれているので当然Objective-Cでも使うことが出来ます。iOSでtesser

    tk78
    tk78 2013/05/14
  • Google DocsのOCR変換機能が日本語に対応

    PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日語に対応した。 米Googleは2月28日(現地時間)、昨年6月にGoogle Docsに追加したOCR(光学式文字認識)機能を、新たに日語を含む29カ国語に対応させたと発表した。日語のPDFやスキャナやデジカメで取り込んだ文字を含む画像をGoogle Docsにアップロードすると、ファイルがテキストデータに変換される。 使い方は、Google Docsの「アップロード」の画面で変換オプションを以下のように設定し、「アップロードを開始」をクリックする。変換が可能なファイル容量の上限は2Mバイトだ。 実際にやってみたところ、PDFではほぼ問題なくテキストに変換されたが、デジカメで撮影した画像からの変換の精度はまだ高いとはいえないようだ

    Google DocsのOCR変換機能が日本語に対応
  • ScanSnap S1500 の設定まとめ - 電子書籍を自炊するときの 10 のポイント - おいちゃんと呼ばれています

    これまで電子書籍を自炊するエントリーをいくつか書いてきましたが、予想以上のはてブとトラバと問合せをいただいて、嬉しい限りです。 裁断については「裁断機 PK-513L でを 100冊裁断してみた - 経験した 9つの失敗とその回避方法」でほぼ完結していますが、「スキャン → OCR テキスト認識」についても ある程度 情報が出揃ったので、この辺りで一度まとめておこうと思います。 だーかーらー、結局、ScanSnap S1500 はどう設定すれば良いわけ??時間がもったいないから手短によろしく << という声に正面から向き合ってみるエントリーです。 では、早速。 *1. 画質の選択 : スーパーファイン オススメは「スーパーファイン(カラー/グレー:300dpi、白黒:600dpi)」です。「ファイン(カラー/グレー:200dpi、白黒:400dpi)」との差は肉眼では分かりづらいですが、

  • エバーノート日本法人設立〜画像の日本語認識機能を提供開始 - ネタフル

    Evernote Japan Launch」ということで、日法人設立の発表記者会見が東京駅側で行われていまして、そのレポートをお届けします。 CEOフィルよりプレゼンテーション。 ・エバーノートは記憶のプラットフォームである ・ツイッター、mixiなどは素晴らしいサービスだが全てソーシャルコミュニケーションのためのツールである ・エバーノートは友達のためでも同僚のためでもない自分自身の記憶が外部化するためのツールである ・ツイッターなどのソーシャルサービスに投稿された情報は友達が見ることを前提にしいる ・ところがエバーノートに入力された情報を見るのは自分自身だけである ・エバーノートは人間の外部の記憶を果たすので様々なバージョンがある ・Mac/Winのほかありとあらゆるスマートフォン版が用意されている ・最近になってiPad版が追加され急成長している ・iPadを始めとするタブレット

    エバーノート日本法人設立〜画像の日本語認識機能を提供開始 - ネタフル
  • 1