タグ

ocrに関するlost_and_foundのブックマーク (25)

  • WASMでOCR使ってみた

    これは SMat Advent Calendar 2024 の12/17分の記事です。 弊社では「SmartMat Cloud」というIoT重量計 x SaaSでモノの流れを可視化するサービスを提供しております。最近お客様がスムーズにオンボーディングできるように、スマホのweb appのプロトタイプを作っております。当時のスプリントのゴールは商品の初回登録の時はスマートマットのシリアル番号や製品バーコードを読み取って検索するプロトタイプを狙いました。 バーコードリーダーはnpmのzxing-wasmがデファクトスタンダードでしたがスマートマットのシリアル番号はOptical Character Recognition(OCR)が必要でした。 OCR in the browser OCRはtesseract.jsでしょう?と思いましたが、ocrsというプロジェクトが気になりました。 ocrs

    WASMでOCR使ってみた
  • LINEヤフー株式会社

    LINEヤフーDesign 公式noteLINEヤフー株式会社のデザインに関連するさまざまな情報を発信するLINEヤフーDesign 公式noteです。

    LINEヤフー株式会社
  • 日本語OCRはなぜ難しい? NAVERのエンジニアが語る、テキスト検出における課題と解決策 | ログミーBusiness

    語OCRはなぜ難しい? NAVERのエンジニアが語る、テキスト検出における課題と解決策提供:LINE株式会社 2019年11月20、21日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2019」が開催されました。1日目は「Engineering」をテーマに、LINE技術の深堀りを、2日目は「Production」をテーマに、Web開発技術UI/UXプロジェクトマネジメントなど、より実践的な内容についてたくさんのプレゼンテーションが行われました。「NAVER ClovaのOCR(光学的文字認識) 」に登壇したのはNAVER OCR Team AI ResearcherのHwalsuk Lee氏。深層学習を用いたOCR技術の仕組みについて語りました。講演資料はこちら LINEのOCR技術の仕組みHwalsuk Lee氏:み

    日本語OCRはなぜ難しい? NAVERのエンジニアが語る、テキスト検出における課題と解決策 | ログミーBusiness
  • Google Cloud Vison APIでNDLのデジコレ画像をひたすらOCRをかけてみる(その1) | kzakza

    Google Cloud Vison APIで 光学式文字認識(OCR)をかけたり、画像に含まれているものの解析ができるようになっていますので、以下で公開されている方法とスクリプトで国立国会図書館デジタルコレクションで公開されている画像データをOCRにかけてみました、のその1(気が向けば、いろいろと試してみたいので、引き続きやってみるつもり)。 ※2017/8/19 追記 このエントリでは、レイアウトの認識に難ありという話になってしまいましたが、レイアントを認識できる方法で改めて同じ画像をGoogleのOCRにかけたものを以下に紹介しています。 Google Cloud Vison APINDLのデジコレ画像をひたすらOCRをかけてみる(その1 再戦) 正確すぎる!Googleの画像認識APIで超ラクラクOCR(macOS・ていねい解説) : GOROLIB DESIGN – はやさはち

    Google Cloud Vison APIでNDLのデジコレ画像をひたすらOCRをかけてみる(その1) | kzakza
  • PFU、オーバーヘッド構造で非接触型の「ScanSnap SV600」

  • 今後に期待大! 日本語対応のOCRアプリ『ImageReader』 | ライフハッカー・ジャパン

    ちょっとした紙媒体の資料をテキスト化したいときってありませんか? 「ここテストに出ますよ~」と言われた時のように、「この部分だけ覚えておきたい(記録しておきたい)」場合、スマホがあれば、まずの該当部分を写真に撮るのが簡単でしょう。しかし、このままでは画像としてしか扱えません。できればさらにテキスト化までしてしまったほうが便利ですよね。 そんなかゆいところに手が届くようなアプリをAndroidアプリのレビューサイト「TABROID」でご紹介しています。『ImageReader(イメージリーダー)』は写真内の活字を抽出し、テキスト化するOCRアプリです。この種のアプリでは珍しく日語にも対応しています。 その実力はというと... 小文字が大文字に、よく判らない記号が入っていたりしましたが、意味や内容は汲み取れる程度にテキスト化されました。一度読んだことがあれば、大体の内容は思い起こすことがで

  • Logispec  EvernoteのOCRでテキスト化された文章をtxt形式で抽出する方法

    Evernoteには、画像ファイルにある文字を文字コードで認識するOCRの機能があります。英語のみならず、日語にも対応しています。 OCR処理は自動で行われ、画像をアップロードしてしばらくしてから同期を実行すると、画像中の文字を検索できるようになります。 これをテキストファイルに変換する方法が公式には存在していないようなので、手動で行う方法を探しました。 1)ノートをパソコンに保存 対象ノートを右クリック→「ノートのエクスポート」 enex形式で保存します。「ノートタグのエクスポート」にチェックを入れておきます。 2)テキストエディタで開く 正規表現で置換ができるテキストエディタ(例えばEmEditor Free)で開きます。 enexファイルの実体はxmlで、前半に画像ファイルのバイナリが入っています。この部分はいらないのでカットします。 画像データの後に、「<item h="25"

  • 顔のニキビを一刻も早く治す効果的な方法

    顔のニキビを一刻も早く治す効果的な方法 大事な日が控えている時に限ってできてしまうこと、ありませんか? ニキビができてしまうと、それだけで気分も落ち込み、印象も大分変わってしまいますよね? 私も最近まではチョコチョコニキビができてしまうことがありました。 最近は以下の対策をすることで、劇的にニキビに悩むことが少なくなりました。 よかったら参考にしてみてください。 【YouTube】赤ら顔を治す方法こちら 顔のニキビの原因 まずはニキビができてしまった原因を特定しましょう。 ニキビの原因は様々です。 生活の乱れ、角質の汚れ、メイクがきちんと落とせていない。 乾燥によるニキビ、または疲れが溜まっていたり、ストレスが溜まっている場合、ホルモンのバランスが崩れている場合などが挙げられます。 自分のニキビの原因が何なのかを知ることもとても大切です。 対処法その1 原因が分かったら、その原因を排除し

  • Google DocsのOCR変換機能が日本語に対応

    PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日語に対応した。 米Googleは2月28日(現地時間)、昨年6月にGoogle Docsに追加したOCR(光学式文字認識)機能を、新たに日語を含む29カ国語に対応させたと発表した。日語のPDFやスキャナやデジカメで取り込んだ文字を含む画像をGoogle Docsにアップロードすると、ファイルがテキストデータに変換される。 使い方は、Google Docsの「アップロード」の画面で変換オプションを以下のように設定し、「アップロードを開始」をクリックする。変換が可能なファイル容量の上限は2Mバイトだ。 実際にやってみたところ、PDFではほぼ問題なくテキストに変換されたが、デジカメで撮影した画像からの変換の精度はまだ高いとはいえないようだ

    Google DocsのOCR変換機能が日本語に対応
  • CamScanner Free: データ整理が便利なスキャンアプリ!これで無料なんて・・・信じられない!無料。3046 | AppBank

    おすすめアプリ、ゲームiPhone、スマホの使い方、ガジェットなどのお得な情報をお届け | AppBank

  • OCRからOWRへ - 電子化

    日のお題: wordFromDictionary="false" さて、新年なので話題を変えて、OCRについて進めていきましょう。 OCRというのは、名、Optical Character Recognitionですので、その名前が示すとおり、文字(Character)単位の認識(Recognition)をしていきます。ところが、こんなことを額面どおりに行っているソフトは、おもちゃOCRだけです。 ちゃんとしたOCRは、OCRという名前がついていても、実は、OWRとなっていて、Optical Word Recognitionという感じで、単語(Word)単位の認識(Recognition)をしていきます。 分かりやすくするために、例で見て行きましょう。 前(http://d.hatena.ne.jp/denshikA/20091010)にも書きましたが、OCRというのは、EとB、CとO

    OCRからOWRへ - 電子化
    lost_and_found
    lost_and_found 2010/09/09
    "ちゃんとしたOCRは、OCRという名前がついていても、実は、OWRとなっていて単語単位の認識をしていきます。"
  • Login to your Evernote account

    Login to your Evernote account to access your notes, tasks, and more.

    Login to your Evernote account
  • GoogleドキュメントにPDF、画像内の文字を抽出できる機能が登場 | ライフハッカー・ジャパン

    Googleドキュメントに新しい機能が追加されましたのでご紹介いたします。 新機能はPDF・画像内の文字を抽出できるというもの。Google ブックスで利用されているOCR技術を利用しています。なかなか精度もいいですよ。 以下に使ってみた様子を載せておきます。 まずGoogleドキュメントにアクセスします。 ファイルのアップロードを選択しますと、オプションで「PDF や画像ファイルからテキストを Google ドキュメントのドキュメントに変換する。」という項目があるので、チェックをいれます。 以下の画像を読み取ってみました。 Google Chrome Updates, Adds Integrated Flash Player アップロード後、しばらくすると変換が終了します。 変換後のドキュメントは以下のとおり。 一部文字が抜けたりしているところがありますが、おおよそ読み取ることができてい

    GoogleドキュメントにPDF、画像内の文字を抽出できる機能が登場 | ライフハッカー・ジャパン
    lost_and_found
    lost_and_found 2010/07/01
    流石だね
  • 出版社のネット戦略を取材して « マガジン航[kɔː]

    出版社のネット戦略を中心に取材を進めてきた。取材を通して見えてきたのは、各社の考え方により相当な温度差があることだ。これまでを振り返りながら総括を試みる。 まずネット事業を真剣に画策する出版社は年々増えている。これは断言できることだ。ただ業界全体を見れば、各社の考え方により相当な温度差があることも事実だ。今回、紙面に登場していただいた出版社は8社。業界動向など周辺取材でお世話になった出版社は4社。合計12社の協力を得ることができた。これは大きな収穫だったが、いきなり楽屋話をすると、実は今回の件で30社以上に取材依頼を提出している。つまり20社以上に固辞されたわけだ。 プロ野球の世界でも打率3割なら御の字なのだし、まぁ善戦したほうだと考えてはいるが、いろいろ四苦八苦する場面もあった。「ネットなんてまったく興味ございません」と露骨に拒絶反応を示す編集長もいたし、「それを聞いてどうする」となぜか

  • 画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」

    Warning: include_once(/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-cache-phase1.php): failed to open stream: Permission denied in /home/users/0/lolipop.jp-dp16105308/web/wp/wp-content/advanced-cache.php on line 8 Warning: include_once(): Failed opening '/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-c

    画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」
  • 【PK-513L】裁断機でラノベを切ってみた

    PK-513Lの威力をもっと知るべき。

    【PK-513L】裁断機でラノベを切ってみた
  • 中身を捨てずに空間をすてる。漫画も本も iPhone に入れる全工程

    iPhone情報整理術 の話が続いて恐縮ですが、が出て以来意外に反響があるのに、一方であまり信じてもらえなかったのが**「漫画を裁断して iPhone にいれてゆく」**というテクニックです。 「大事にしろよ!」という意見もいくつかいただいたのですが、こうした極端な方法はなにもすべてのに対して行うのではなくて、「場所がないから捨てなくてはいけない、でも捨てるには惜しい」という一部のに対して行うことを想定しています。特に私にとってはそれが漫画です。 私はちょうど4月に引っ越したばかりなのですが、引っ越しで書斎の面積が少し狭くなり、その分だけいくらかを手放さなくては棚が機能しないところまできていました。そこで、とても好きで惜しくはあるのですが一年に一度程度しか読まない漫画「三国志」の PDF 化に着手しました。 その一連の流れを以下に写真付きでまとめてみましたので、同様の「書籍

    中身を捨てずに空間をすてる。漫画も本も iPhone に入れる全工程
  • Scan This Book! (Published 2006)

    Correction Appended In several dozen nondescript office buildings around the world, thousands of hourly workers bend over table-top scanners and haul dusty books into high-tech scanning booths. They are assembling the universal library page by page. The dream is an old one: to have in one place all knowledge, past and present. All books, all documents, all conceptual works, in all languages. It is

    Scan This Book! (Published 2006)
  • 新聞電子化にまつわるエコノミー その2 - 電子化

    ここで、次の話題(OCR)へ移る前に、ちょっとだけ、新聞電子化の工程について見てみましょう。 日のお題 1日あたり10万画像 1月あたり300万画像 1年あたり3600万画像 現在の日において、 平均的な電子化機器(スキャナなど)の性能・価格 平均的な人件費 平均的な家賃 平均的なスキャン価格相場 年間を通じた仕事量 などを考慮すると、普通のスキャン業者が1社で電子化できる最大量は、「10万画像/日」となるでしょう*1。 この「10万画像/日」というのは、マイクロフィルムからの電子化の場合であって、もし、紙ベースの資料からの電子化の場合、効率が1/8〜1/6くらいに落ちますので、「1.2万画像/日〜1.5万画像/日」となります。 さらに、さらに、上記の「10万画像/日」ないし「1.2万画像/日〜1.5万画像/日」というのは、OCR変換作業*2を含んでいません。もし、OCRまでを含めると

    新聞電子化にまつわるエコノミー その2 - 電子化
  • 何故私は狂った猿のように1000万円分の書籍を切り刻んだのか - やねうらお−ノーゲーム・ノーライフ

    id:yaneurao:20091001でFUJITSU ScanSnap S1500 FI-S1500を買って書籍を裁断してスキャンした話を書いた。 「もうどうせ残りのは売ってもたいしたお金にもならないし」と書いたが、取り込んだ書籍の数は3,000冊強。総スキャンページ数、262,845枚。消耗品のパッド交換4回。ローラー交換2回。1冊の平均価格は3,000円程度。全体でおおよそ1,000万円。今回は、気がついたらこれだけのを切り刻んでいた。id:yaneurao:20060131の棚に換算すると14個分である。 たぶんアマゾンで売れば、その1/3ぐらいのお金にはなっていただろうから、ちょっともったいない気もする。私も当初はそこまでを徹底的に切り刻む気はなかったのであまり気にもかけてなかった。 そこで、どうしてこんなことになったのか、つらつら考えてみた。 ■ 切り刻まずに取り込ん

    何故私は狂った猿のように1000万円分の書籍を切り刻んだのか - やねうらお−ノーゲーム・ノーライフ