[B! ocr] lost_and_foundのブックマーク

WASMでOCR使ってみた

これは SMat Advent Calendar 2024 の12/17分の記事です。弊社では「SmartMat Cloud」というIoT重量計 x SaaSでモノの流れを可視化するサービスを提供しております。最近お客様がスムーズにオンボーディングできるように、スマホのweb appのプロトタイプを作っております。当時のスプリントのゴールは商品の初回登録の時はスマートマットのシリアル番号や製品バーコードを読み取って検索するプロトタイプを狙いました。バーコードリーダーはnpmのzxing-wasmがデファクトスタンダードでしたがスマートマットのシリアル番号はOptical Character Recognition(OCR)が必要でした。 OCR in the browser OCRはtesseract.jsでしょう？と思いましたが、ocrsというプロジェクトが気になりました。 ocrs

lost_and_found 2024/12/17

ocr
wasm

リンク

LINEヤフー株式会社

「LINEヤフーDesign 公式note」 LINEヤフー株式会社のデザインに関連するさまざまな情報を発信するLINEヤフーDesign 公式noteです。

lost_and_found 2021/07/16

ocr

リンク

日本語OCRはなぜ難しい？　NAVERのエンジニアが語る、テキスト検出における課題と解決策 | ログミーBusiness

日本語OCRはなぜ難しい？　NAVERのエンジニアが語る、テキスト検出における課題と解決策提供：LINE株式会社 2019年11月20、21日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2019」が開催されました。1日目は「Engineering」をテーマに、LINEの技術の深堀りを、2日目は「Production」をテーマに、Web開発技術やUI/UX、プロジェクトマネジメントなど、より実践的な内容についてたくさんのプレゼンテーションが行われました。「NAVER ClovaのOCR（光学的文字認識）」に登壇したのはNAVER OCR Team AI ResearcherのHwalsuk Lee氏。深層学習を用いたOCR技術の仕組みについて語りました。講演資料はこちら LINEのOCR技術の仕組みHwalsuk Lee氏：み

lost_and_found 2020/04/07

ocr

リンク

Google Cloud Vison APIでNDLのデジコレ画像をひたすらOCRをかけてみる（その1） | kzakza

Google Cloud Vison APIで　光学式文字認識（OCR）をかけたり、画像に含まれているものの解析ができるようになっていますので、以下で公開されている方法とスクリプトで国立国会図書館デジタルコレクションで公開されている画像データをOCRにかけてみました、のその１（気が向けば、いろいろと試してみたいので、引き続きやってみるつもり）。 ※2017/8/19 追記このエントリでは、レイアウトの認識に難ありという話になってしまいましたが、レイアントを認識できる方法で改めて同じ画像をGoogleのOCRにかけたものを以下に紹介しています。 Google Cloud Vison APIでNDLのデジコレ画像をひたすらOCRをかけてみる（その1　再戦）正確すぎる！Googleの画像認識APIで超ラクラクOCR（macOS・ていねい解説） : GOROLIB DESIGN – はやさはち

lost_and_found 2017/08/18

リンク

PFU、オーバーヘッド構造で非接触型の「ScanSnap SV600」

lost_and_found 2013/06/13

リンク

今後に期待大！日本語対応のOCRアプリ『ImageReader』 | ライフハッカー・ジャパン

ちょっとした紙媒体の資料をテキスト化したいときってありませんか？「ここテストに出ますよ～」と言われた時のように、「この部分だけ覚えておきたい（記録しておきたい）」場合、スマホがあれば、まず本の該当部分を写真に撮るのが簡単でしょう。しかし、このままでは画像としてしか扱えません。できればさらにテキスト化までしてしまったほうが便利ですよね。そんなかゆいところに手が届くようなアプリをAndroidアプリのレビューサイト「TABROID」でご紹介しています。『ImageReader（イメージリーダー）』は写真内の活字を抽出し、テキスト化するOCRアプリです。この種のアプリでは珍しく日本語にも対応しています。その実力はというと... 小文字が大文字に、よく判らない記号が入っていたりしましたが、意味や内容は汲み取れる程度にテキスト化されました。一度読んだことがあれば、大体の内容は思い起こすことがで

lost_and_found 2012/11/28

ocr

リンク

Logispec　 EvernoteのOCRでテキスト化された文章をtxt形式で抽出する方法

Evernoteには、画像ファイルにある文字を文字コードで認識するOCRの機能があります。英語のみならず、日本語にも対応しています。 OCR処理は自動で行われ、画像をアップロードしてしばらくしてから同期を実行すると、画像中の文字を検索できるようになります。これをテキストファイルに変換する方法が公式には存在していないようなので、手動で行う方法を探しました。 1)ノートをパソコンに保存対象ノートを右クリック→「ノートのエクスポート」 enex形式で保存します。「ノートタグのエクスポート」にチェックを入れておきます。 2)テキストエディタで開く正規表現で置換ができるテキストエディタ(例えばEmEditor Free)で開きます。 enexファイルの実体はxmlで、前半に画像ファイルのバイナリが入っています。この部分はいらないのでカットします。画像データの後に、「<it em h="25"

lost_and_found 2011/12/04

リンク

顔のニキビを一刻も早く治す効果的な方法

顔のニキビを一刻も早く治す効果的な方法大事な日が控えている時に限ってできてしまうこと、ありませんか？ニキビができてしまうと、それだけで気分も落ち込み、印象も大分変わってしまいますよね？私も最近まではチョコチョコニキビができてしまうことがありました。最近は以下の対策をすることで、劇的にニキビに悩むことが少なくなりました。よかったら参考にしてみてください。【YouTube】赤ら顔を治す方法こちら顔のニキビの原因まずはニキビができてしまった原因を特定しましょう。ニキビの原因は様々です。食生活の乱れ、角質の汚れ、メイクがきちんと落とせていない。乾燥によるニキビ、または疲れが溜まっていたり、ストレスが溜まっている場合、ホルモンのバランスが崩れている場合などが挙げられます。自分のニキビの原因が何なのかを知ることもとても大切です。対処法その１原因が分かったら、その原因を排除し

lost_and_found 2011/10/06

リンク

Google DocsのOCR変換機能が日本語に対応

PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日本語に対応した。米Googleは2月28日（現地時間）、昨年6月にGoogle Docsに追加したOCR（光学式文字認識）機能を、新たに日本語を含む29カ国語に対応させたと発表した。日本語のPDFやスキャナやデジカメで取り込んだ文字を含む画像をGoogle Docsにアップロードすると、ファイルがテキストデータに変換される。使い方は、Google Docsの「アップロード」の画面で変換オプションを以下のように設定し、「アップロードを開始」をクリックする。変換が可能なファイル容量の上限は2Mバイトだ。実際にやってみたところ、PDFではほぼ問題なくテキストに変換されたが、デジカメで撮影した画像からの変換の精度はまだ高いとはいえないようだ

lost_and_found 2011/03/02

google
ocr

リンク

CamScanner Free: データ整理が便利なスキャンアプリ！これで無料なんて・・・信じられない！無料。3046 | AppBank

おすすめアプリ、ゲーム、iPhone、スマホの使い方、ガジェットなどのお得な情報をお届け | AppBank

lost_and_found 2010/10/11

リンク

OCRからOWRへ - 電子化

本日のお題： wordFromDictionary="false" さて、新年なので話題を変えて、OCRについて進めていきましょう。 OCRというのは、本名、Optical Character Recognitionですので、その名前が示すとおり、文字（Character）単位の認識（Recognition）をしていきます。ところが、こんなことを額面どおりに行っているソフトは、おもちゃOCRだけです。ちゃんとしたOCRは、OCRという名前がついていても、実は、OWRとなっていて、Optical Word Recognitionという感じで、単語（Word）単位の認識（Recognition）をしていきます。分かりやすくするために、例で見て行きましょう。前（http://d.hatena.ne.jp/denshikA/20091010）にも書きましたが、OCRというのは、EとB、CとO

lost_and_found 2010/09/09

"ちゃんとしたOCRは、OCRという名前がついていても、実は、OWRとなっていて単語単位の認識をしていきます。"

ocr

リンク

Login to your Evernote account

Login to your Evernote account to access your notes, tasks, and more.

lost_and_found 2010/09/09

ocr

リンク

GoogleドキュメントにPDF、画像内の文字を抽出できる機能が登場 | ライフハッカー・ジャパン

Googleドキュメントに新しい機能が追加されましたのでご紹介いたします。新機能はPDF・画像内の文字を抽出できるというもの。Google ブックスで利用されているOCR技術を利用しています。なかなか精度もいいですよ。以下に使ってみた様子を載せておきます。まずGoogleドキュメントにアクセスします。ファイルのアップロードを選択しますと、オプションで「PDF や画像ファイルからテキストを Google ドキュメントのドキュメントに変換する。」という項目があるので、チェックをいれます。以下の画像を読み取ってみました。 Google Chrome Updates, Adds Integrated Flash Player アップロード後、しばらくすると変換が終了します。変換後のドキュメントは以下のとおり。一部文字が抜けたりしているところがありますが、おおよそ読み取ることができてい

lost_and_found 2010/07/01

流石だね

リンク

出版社のネット戦略を取材して « マガジン航[kɔː]

出版社のネット戦略を中心に取材を進めてきた。取材を通して見えてきたのは、各社の考え方により相当な温度差があることだ。これまでを振り返りながら総括を試みる。まずネット事業を真剣に画策する出版社は年々増えている。これは断言できることだ。ただ業界全体を見れば、各社の考え方により相当な温度差があることも事実だ。今回、紙面に登場していただいた出版社は8社。業界動向など周辺取材でお世話になった出版社は4社。合計12社の協力を得ることができた。これは大きな収穫だったが、いきなり楽屋話をすると、実は今回の件で30社以上に取材依頼を提出している。つまり20社以上に固辞されたわけだ。プロ野球の世界でも打率3割なら御の字なのだし、まぁ善戦したほうだと考えてはいるが、いろいろ四苦八苦する場面もあった。「ネットなんてまったく興味ございません」と露骨に拒絶反応を示す編集長もいたし、「それを聞いてどうする」となぜか

lost_and_found 2010/04/05

リンク

画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」

メールに画像ファイルを添付して送るだけで、画像ファイルを読み取ってワードの文書で返送してきます。メールだけでOCRが利用できるということです。 » n1ne@freeOCR 対応している画像のファイルフォーマットは .bmp, .dib, .rle, .dcx, .djvu, .djv, .gif, .jb2, .jbig2, .jp2, .j2k, .jpg, .jpeg, .pcx, .pdf, .png, .tif, .tiff, .xps とかなりあります。メールだけでなく、ファイル転送サービスを使うことも可能。試しにこのブログの記事を画像にして、メールで送ってみました。この画像をocr@n1ne.netへメール夕方の4時に画像を送り、戻ってきたのが夜の11時。ちょっと時間がかかっていますが、返信されたメールにはdoc,docx,pdfの三種類のファイルが添付されていました。

lost_and_found 2010/04/03

リンク

【PK-513L】裁断機でラノベを切ってみた

PK-513Lの威力をもっと知るべき。

lost_and_found 2010/01/31

リンク

中身を捨てずに空間をすてる。漫画も本も iPhone に入れる全工程

iPhone情報整理術の話が続いて恐縮ですが、本が出て以来意外に反響があるのに、一方であまり信じてもらえなかったのが**「本や漫画を裁断して iPhone にいれてゆく」**というテクニックです。「本大事にしろよ！」という意見もいくつかいただいたのですが、こうした極端な方法はなにもすべての本に対して行うのではなくて、「場所がないから捨てなくてはいけない、でも捨てるには惜しい」という一部の本に対して行うことを想定しています。特に私にとってはそれが漫画です。私はちょうど４月に引っ越したばかりなのですが、引っ越しで書斎の面積が少し狭くなり、その分だけいくらか本を手放さなくては本棚が機能しないところまできていました。そこで、とても好きで惜しくはあるのですが一年に一度程度しか読まない漫画「三国志」の PDF 化に着手しました。その一連の流れを以下に写真付きでまとめてみましたので、同様の「書籍

lost_and_found 2009/10/27

リンク

Scan This Book! (Published 2006)

Correction Appended In several dozen nondescript office buildings around the world, thousands of hourly workers bend over table-top scanners and haul dusty books into high-tech scanning booths. They are assem bling the universal library page by page. The dream is an old one: to have in one place all knowledge, past and present. All books, all documents, all conceptual works, in all languages. It is

lost_and_found 2009/10/24

book
ebook

リンク

新聞電子化にまつわるエコノミーその2 - 電子化

ここで、次の話題（OCR）へ移る前に、ちょっとだけ、新聞電子化の工程について見てみましょう。本日のお題 1日あたり10万画像 1月あたり300万画像 1年あたり3600万画像現在の日本において、平均的な電子化機器(スキャナなど)の性能・価格平均的な人件費平均的な家賃平均的なスキャン価格相場年間を通じた仕事量などを考慮すると、普通のスキャン業者が1社で電子化できる最大量は、「10万画像/日」となるでしょう*1。この「10万画像/日」というのは、マイクロフィルムからの電子化の場合であって、もし、紙ベースの資料からの電子化の場合、効率が1/8〜1/6くらいに落ちますので、「1.2万画像/日〜1.5万画像/日」となります。さらに、さらに、上記の「10万画像/日」ないし「1.2万画像/日〜1.5万画像/日」というのは、OCR変換作業*2を含んでいません。もし、OCRまでを含めると

lost_and_found 2009/10/19

リンク

何故私は狂った猿のように1000万円分の書籍を切り刻んだのか - やねうらお−ノーゲーム・ノーライフ

id:yaneurao:20091001でFUJITSU ScanSnap S1500 FI-S1500を買って書籍を裁断してスキャンした話を書いた。「もうどうせ残りの本は売ってもたいしたお金にもならないし」と書いたが、取り込んだ書籍の数は3,000冊強。総スキャンページ数、262,845枚。消耗品のパッド交換4回。ローラー交換2回。1冊の平均価格は3,000円程度。全体でおおよそ1,000万円。今回は、気がついたらこれだけの本を切り刻んでいた。id:yaneurao:20060131の本棚に換算すると14個分である。たぶんアマゾンで売れば、その1/3ぐらいのお金にはなっていただろうから、ちょっともったいない気もする。私も当初はそこまで本を徹底的に切り刻む気はなかったのであまり気にもかけてなかった。そこで、どうしてこんなことになったのか、つらつら考えてみた。 ■　切り刻まずに取り込ん

lost_and_found 2009/10/09

ocr
ebook

リンク

はてなブックマーク

タグ

関連タグで絞り込む (24)

ocrに関するlost_and_foundのブックマーク (25)

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第3週）

今週のはてなブックマーク数ランキング（2025年4月第2週）

今週のはてなブックマーク数ランキング（2025年4月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス