[B! ocr] tk78のブックマーク

macOS のデフォルト状態でコマンドラインからOCR処理を行う - TeX Alchemist Online

macOS 12 Monterey では，OSビルトインでのOCR機能が搭載されました。Preview.app で，画像やスキャンPDF（中身がスキャン画像のPDF）に対して，ただマウスでドラッグするだけで，中身の文字を認識して選択し，コピーできるようになっています。さらに，macOS 13 Ventura では，それが日本語にも対応しました。たとえば，（今や入手困難となってしまった）The TeXbook のアスキーによる日本語版をスキャンしたものを Preview.app で開くと，何もしなくても，文字選択できます。これをコピーして他のエディタにペーストすると， TEXの名称で気をつけなければならないことがほかにもある。Eの文字が不揃いになっていることだ。Eの文字を少し下げてあるのは、TeXが組版のためのシステムであることを印象づけるためであり、またほかのシステムの名称と区別するた

tk78 2023/06/30

mac
ocr

リンク

OCR処理プログラム及び学習用データセットの公開について | NDLラボ

2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館（以下、「当館」とします。）が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。リポジトリ : https://github.com/ndl-lab/

tk78 2022/04/26

ocr

リンク

スマホにカメラついてるんだからOCRできるでしょという気持ち - Progate Tech Blog

どうも、株式会社Progate で SoftwareEngineer チームのマネージャーをしています @satetsu888 です。本記事は Progate AdventCalendar 2020 10日目です。普段仕事ではエンジニア組織のことやプロダクトの技術戦略的なことを考えたり、ミーティングしたり採用活動したりタスクをお願いして回ったりなどを担当していますが、今日はそういうのとはなんの関係もないただの日常の話を書こうと思います。ことの始まり我が家では子どもの朝ごはんとして週に2,3回くらいの頻度でポケモンパンを買っています。先日(2020/09/18 ~ 11/24) ポケモンパンについてるポイントを5点集めるとポケモンシールホルダーの抽選に1回応募できるキャンペーンがありました。（キャンペーン自体はすでに終了しています）いつも通りのペースでパンを買ってると何回か挑戦で

tk78 2020/12/10

ocr
web

リンク

Microsoft Cognitive Services「Computer Vision API」を使ってOCR認識を試す - 吉田の備忘録

tk78 2016/05/15

azure
ocr

リンク

iOSで日本語OCR！ビルド編〜iOS SDK 6.1 + tesseract-ocr 3.02〜 | DevelopersIO

最近iOSでOCR（Optical Character Recognition：工学文字認識）をしたいとの声をよく耳にするので調査してみました。オープンソースのOCRエンジン「tesseract-ocr」オープンソースで日本語に対応したOCRエンジンを探してみると、tesseract-ocrなるものを見つけました。このtesseract-ocrですが、Google先生が開発を支援していると噂のオープンソースのOCRエンジンで、C++で書かれています。また、英語、日本語だけでなく多数の言語にも対応しています。ライセンスはApache License 2.0です。ちなみに読み方は「テッサラクトOCR」だそうです。 tesseract-ocrではiOSで簡単に利用できる形式では配布しておりませんが、C++で書かれているので当然Objective-Cでも使うことが出来ます。iOSでtesser

tk78 2013/05/14

ios
ocr

リンク

Google DocsのOCR変換機能が日本語に対応

PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日本語に対応した。米Googleは2月28日（現地時間）、昨年6月にGoogle Docsに追加したOCR（光学式文字認識）機能を、新たに日本語を含む29カ国語に対応させたと発表した。日本語のPDFやスキャナやデジカメで取り込んだ文字を含む画像をGoogle Docsにアップロードすると、ファイルがテキストデータに変換される。使い方は、Google Docsの「アップロード」の画面で変換オプションを以下のように設定し、「アップロードを開始」をクリックする。変換が可能なファイル容量の上限は2Mバイトだ。実際にやってみたところ、PDFではほぼ問題なくテキストに変換されたが、デジカメで撮影した画像からの変換の精度はまだ高いとはいえないようだ

tk78 2011/03/02

ocr
google

リンク

ScanSnap S1500 の設定まとめ - 電子書籍を自炊するときの 10 のポイント - おいちゃんと呼ばれています

これまで電子書籍を自炊するエントリーをいくつか書いてきましたが、予想以上のはてブとトラバと問合せをいただいて、嬉しい限りです。裁断については「裁断機 PK-513L で本を 100冊裁断してみた - 経験した 9つの失敗とその回避方法」でほぼ完結していますが、「スキャン → OCR テキスト認識」についてもある程度情報が出揃ったので、この辺りで一度まとめておこうと思います。だーかーらー、結局、ScanSnap S1500 はどう設定すれば良いわけ？？時間がもったいないから手短によろしく << という声に正面から向き合ってみるエントリーです。では、早速。 *1. 画質の選択 : スーパーファインオススメは「スーパーファイン（カラー/グレー：300dpi、白黒：600dpi）」です。「ファイン（カラー/グレー：200dpi、白黒：400dpi）」との差は肉眼では分かりづらいですが、

tk78 2010/08/13

リンク

エバーノート日本法人設立〜画像の日本語認識機能を提供開始 - ネタフル

「Evernote Japan Launch」ということで、日本法人設立の発表記者会見が東京駅側で行われていまして、そのレポートをお届けします。 CEOフィルよりプレゼンテーション。・エバーノートは記憶のプラットフォームである・ツイッター、mixiなどは素晴らしいサービスだが全てソーシャルコミュニケーションのためのツールである・エバーノートは友達のためでも同僚のためでもない自分自身の記憶が外部化するためのツールである・ツイッターなどのソーシャルサービスに投稿された情報は友達が見ることを前提にしいる・ところがエバーノートに入力された情報を見るのは自分自身だけである・エバーノートは人間の外部の記憶を果たすので様々なバージョンがある・Mac/Winのほかありとあらゆるスマートフォン版が用意されている・最近になってiPad版が追加され急成長している・iPadを始めとするタブレット

tk78 2010/06/24

リンク

はてなブックマーク

タグ

関連タグで絞り込む (9)

ocrに関するtk78のブックマーク (8)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス