タグ

OCRに関するrichard_rawのブックマーク (56)

  • 無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね

    昨日ツイッターのフォロワーさんがTLで「人を殴ったらかなり痛いくらいの紙書類の束渡されて、一晩で再編集とか死ぬる」とおっしゃってまして、まだまだ紙ベースの業務進行ってありますしPCに取り込んで効率的にさばくにはどうしたらいいだろうなーと思いまして。 調べてみたところ、GoogleDriveでもテキストスキャンした画像ファイルをOCR変換する機能があるらしくちょっとサンプル作って試して見ましたので日はそのレビューを。 【追記】縦書き版の検証記事も書いときました。あわせて参考にどうぞ。 GoogleDriveOCR、縦書きだったらどうなのよ? Google Drive OCRの使い方GoogleDrive利用するにはとりあえずGoogleアカウント必要なのでない方はまずそちらのご用意を。GoogleDriveの導入については過去に サービス開始したオンラインストレージ『Google Driv

    無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね
    richard_raw
    richard_raw 2012/11/15
    おー、なかなか優秀ですね。縦組みはキツいみたいですが。
  • TechCrunch | Startup and Technology News

    Yellow, an asset financier for solar energy and digital devices in Africa has raised $14 million series B funding in a round led by Convergence Partners with participation from the Energy Entrepreneur Fisker, the electric carmaker founded by the Danish auto designer Henrik Fisker, is gearing up to enter the Chinese market where competition is increasingly cut-throat, following in the footsteps of

    TechCrunch | Startup and Technology News
    richard_raw
    richard_raw 2012/09/25
    「機械と人間の目視で2重のチェック」やはり人力は外せないか……。/月額1,980円、ちょっと高い。
  • コンピュータビジョンのソースコード/ライブラリのまとめ - takminの書きっぱなし備忘録 @はてなブログ

    今まで自分が見つけたコンピュータビジョンの研究に役に立ちそうなフリーのライブラリやソースコードをまとめてみました。自分ではまだ使っていないものも多いので、そこはご容赦を。主にC/C++が中心です。 またライブラリ形式でない、いわゆる学会で発表した研究のコードをそのまま公開しているという人がたくさんいて、それに関しては特にメジャーなもののみ紹介しています。なにぶん僕の観測範囲は限られてますので、「このライブラリに触れないのはおかしい」、「説明が間違っている」等、ご意見大歓迎です。 定番(Standard) OpenCV 定番中の定番です。コンピュータビジョンに関して広範なアルゴリズムが実装されています。 http://code.opencv.org/projects/OpenCV/wiki/WikiStart Point Cloud Library 3次元点群データを扱うならこれ。Kinec

    コンピュータビジョンのソースコード/ライブラリのまとめ - takminの書きっぱなし備忘録 @はてなブログ
    richard_raw
    richard_raw 2012/05/21
    画像認識とかOCRとかARとか。/ここに載ってないのだとnhocrとかface.jsとか。そういえばface.comというWebサービスもありましたな。
  • Engadget | Technology News & Reviews

    Hands-on with the new iPad Pro M4: Absurdly thin and light, but the screen steals the show

    Engadget | Technology News & Reviews
    richard_raw
    richard_raw 2012/04/27
    画像認識とOCRは便利そうです。
  • 【用途別】ビジネスに使えるiPhoneアプリ特集 – 2012年春 | AppBank

    ビジネスパーソンに便利なカレンダーアプリ Week Calendar entrypostmanが「最強カレンダーアプリはこれだ!」と叫ぶほどのカレンダーアプリ。 Week Calendarのスゴイ点は2点。 1. 表示の種類が豊富!超見やすい!やばい! 2. カスタマイズがとにかくいい!すごい! ことビジネスパーソンに限定すれば、恐らく最強のカレンダーアプリです。 レビュー記事はこちらからどうぞ。 Week Calendar: 最強のカレンダーアプリの一つ。標準カレンダーの進化系。カスタマイズもよすぎ。 ハチカレンダー2 (iPhoneカレンダー対応) 「祝日・六曜・旧暦+天気」をカレンダーに表示できるアプリです。 標準のカレンダーやGoogleカレンダーと同期できる他、予定表示方法「ToDo表示」も良い感じです。 レビュー記事はこちらからどうぞ。 ハチカレンダー2 (iPhoneカレンダ

    【用途別】ビジネスに使えるiPhoneアプリ特集 – 2012年春 | AppBank
    richard_raw
    richard_raw 2012/04/17
    人力OCR……。/時間管理ツールは使いこなせる自信がありませんorz/メモ帳アプリが気になります。
  • Engadget | Technology News & Reviews

    Hands-on with the new iPad Pro M4: Absurdly thin and light, but the screen steals the show

    Engadget | Technology News & Reviews
    richard_raw
    richard_raw 2011/12/03
    1800年の新聞がOCRされてるとか凄いですな!
  • Evernoteの日本語認識がめちゃくちゃすごい件

    先日ドヤ顔の貴公子こと @ushigyu 氏がブログにエントリーを書いていたが、ほぼ同じ手順で名刺をデータ化している。 ただ、Evernoteにはあくまでも「一応」入れている感じで、実際に使う時はほとんどMacからSpotlightで検索していた。 なぜか。 理由は単純。Evernoteは検索が遅く実用的ではなかったからだ。 「なかったから」と過去形で書いたのには理由がある。 Evernoteの検索が、劇的に速くなるアプリが出たからだ。 Evernote検索専用アプリ withEverが凄い! withEver 1.4(¥85) カテゴリ: 仕事効率化, ライフスタイル 販売元: e73developer – Ryo Enami(サイズ: 1.7 MB) 全てのバージョンの評価: (8件の評価) このwithEverを使えばEvernoteに格納されたノートの文字列を1秒程度で検索して見つ

    Evernoteの日本語認識がめちゃくちゃすごい件
    richard_raw
    richard_raw 2011/11/12
    まあScanSnapのOCRがショボいのはありますが、それにしても白抜き文字認識は凄い!あとwithEverの紹介。
  • 日本生まれのクラウドノート「KYBER」がすごい理由 (1/3)

    オーリッドという日IT企業が注目を集めている。売上高は40億円規模。法人向けWebサービスを提供していたが、昨年から個人向けサービス「KYBER」を開始した。16日に発売した「KYBER Smartnote」(写真、3冊1500円)は、そのサービスの目玉だ。 見た目はごく普通のノート。メモをしたり、議事録をとったり、普通のノートとして使える。ノートをiPhone付属のカメラで撮影し、KYBERのWebサイトにアップロードすると、画像のデータがクラウドサーバー上で管理される(Androidには10月対応予定)。そこまではこれまでのクラウドサービスにもあったもの。「Evernote」を思い浮かべる人もいるだろう。 だが、話はここからだ。 しばらくすると、手書きのメモが文字データになって送られてくる。いわゆるOCR(画像からの文字起こし)だが、その精度は異様に高い。ほぼ完璧だ。納品までも最速

    日本生まれのクラウドノート「KYBER」がすごい理由 (1/3)
    richard_raw
    richard_raw 2011/09/21
    中国で人海戦術!/「同じ形ならマル、違う形ならバツをつける。それなら日本語がわからなくても、子供でもチェックできますよね」なんか画像処理でできそうな気がしてきた。
  • 「汚い手書き文書でも100%デジタル化」をうたうサービス--オーリッド

    2011年7月7日から9日までの3日間、東京ビッグサイトで開催された電子書籍関連の展示会イベント「第15回国際電子出版EXPO」。オーリッドの展示ブースでは、クラウドコンピューティングと人手による多重チェックを組み合わせることにより、名刺や手書き文書を100パーセントの精度でデジタルデータ化できるサービス「オーリッドカイバー」のデモを披露していた。 オーリッドカイバーではまず、ユーザーが手書きメモやオフィス文書、会議で使ったホワイトボードなどの写真やスキャンデータを同社のクラウドに送信する。すると、(1)写真やスキャンデータをOCR(光学式文字読取装置)でデジタル化、(2)判定オペレータによるOCR結果のチェック、(3)在宅オペレータによる多段階入力、(4)センターオペレータによる最終チェック、(5)デジタルデータの納品---という5ステップでデジタルデータ化し、ユーザーに納品する。 オー

    「汚い手書き文書でも100%デジタル化」をうたうサービス--オーリッド
    richard_raw
    richard_raw 2011/07/13
    OCRを人力チェック。複雑なレイアウトの場合はどうなるのやら。
  • いよいよラノベ登場!『スターダスト・シティ』は1巻目が広告無しPDF - (株)Jコミックテラスの中の人

    何と、Jコミにライトノベルが登場!! 巨匠・笹祐一先生の『スターダスト・シティ』です。 1巻目は広告無しのPDFで公開。 2巻目は広告付きのアルヌールでどうぞ。 http://www.j-comi.jp/book/comic/3401 作者の笹祐一先生は、大ヒットシリーズ『ARIEL』で有名ですよね。またイラスト担当は『イクサー1』の平野俊弘(現・平野俊貴)さんです。 1巻目の広告無しPDF版は、OCR(文字認識)によって、単語の検索などが出来るようになっています。文章をマウスでなぞると、文字が認識されていることが分かるはず・・・。

    いよいよラノベ登場!『スターダスト・シティ』は1巻目が広告無しPDF - (株)Jコミックテラスの中の人
    richard_raw
    richard_raw 2011/04/25
    ライトノベルも配信するんですな。しかもOCR済み。
  • USBバスパワー駆動で軽量、安価なモバイルスキャナ「MobileOffice S400」が販売開始される

    外出先で渡された書類などを今すぐパソコンに取り込みたい時などに活躍しそうなモバイルスキャナ「MobileOffice S400」が発売されました。 USBバスパワー駆動でACアダプタが不要なほか、持ち運びに便利な軽量ボディに加えて、自動的に紙面を吸い込んでくれるオートフィード式を採用したモデルとなっています。 詳細は以下から。 A4カラー モバイルスキャナ MobileOffice S400 USBバスパワー 送料無料 - オーグショップ は,バーコードリーダー、ブックスキャナーの販売サイトです ブックリーダーやスキャナなどを販売する「オーグショップ」の公式ページによると、日3月28にちにからモバイルスキャナ「MobileOffice S400」の販売を開始したそうです。 これが「MobileOffice S400」です。体サイズは47×247×33.8mmで、スティックタイプの形状。

    USBバスパワー駆動で軽量、安価なモバイルスキャナ「MobileOffice S400」が販売開始される
    richard_raw
    richard_raw 2011/03/29
    重さ330グラム、販売価格1万3800円。こりゃ小さい。
  • Google Docs、画像から日本語を抽出するOCR機能搭載 | ネット | マイコミジャーナル

    Create and edit web-based documents, spreadsheets, and presentations. Googleは2月28日(米国時間)、Google DocsのOCR機能に新しく29のサポート言語を追加したことを発表した。この結果、Google DocsがサポートするOCR向け言語は34となる。今回の機能追加で日語もサポートされるようになっており、日語を含んだ画像やPDFをアップロードして、日語テキストを抽出することができる。 OCRによるテキスト抽出の機能を利用するには、画像をアップロードする段階で「PDFや画像ファイルからテキストをGoogleドキュメントのドキュメントに変換する」にチェックを入れて、言語として「日語」を選択すればよい。画像とともに抽出されたテキストも表示されるようになる。 マイコミジャーナルに掲載された記事の画像 Go

    richard_raw
    richard_raw 2011/03/02
    精度はこれから、といったことろでしょうか。
  • 保存できる、ほぼA4サイズのデジタルノート(NoteSlate) : monogocoro ものごころ

    描いて消すだけのブギーボードに保存機能が着いた!といった感じの重さ280gで厚さ6mmでお値段99ドル(!)のe Inkのノート。 ディスプレイ面は、190x270mmなのでA4(210x297mm)より少し小さいだけ。 iPadKindleとの比較表は以下。 WiFi対応で、メールは見られるけどブラウザはNG。保存はSDカードやUSBで。MP3の再生、PDFtextが読める、180時間の長時間稼働、いずれOCRにも対応予定という、個人的には超魅力的な99ドルで13インチサイズのデジタルノート。 面白いのは、描く線の色ごとに3つのカラーバージョンが販売予定なこと。いい。 リリース予定は、6月にBasic,White,Blackが、12月に赤、青、緑、そして最後にカラー版も登場予定(価格不明)とのこと。待ち遠しい。 Thanks!!: Engadget Original: N

    richard_raw
    richard_raw 2011/01/21
    「WiFi対応で、メールは見られるけどブラウザはNG。保存はSDカードやUSBで。MP3の再生、PDFとtextが読める、180時間の長時間稼働、いずれOCRにも対応予定という、個人的には超魅力的な99ドルで13インチサイズのデジタルノート
  • 33言語対応!画像からテキストだけを抽出できるサービス「The Free Online OCR」 : 二十歳街道まっしぐら

    「The Free Online OCR」は画像にある文字を抽出してテキストに変換してくれるサービスです。 画像をアップロードまたは画像URLを指定し、言語を設定するだけでOKです。 変換もすぐに終わるので、便利。 画像から文字だけ抽出したい人におすすめです。 全部で33言語対応とのこと。 以下に使ってみた様子を載せておきます。 まず「The Free Online OCR」にアクセスしましょう。 「Image」より、画像ファイルをアップロードまたは、画像URLを指定します。 「Language」より、抽出したい言語を選択。 「Convert」をクリックすると、抽出開始です。 結果はこのとおり。 【抽出結果】 Aaron's Twitter Viewer Hi, there. i‘m Aaron Swartz (@aaronsw)_ I made this Iittie program s

    33言語対応!画像からテキストだけを抽出できるサービス「The Free Online OCR」 : 二十歳街道まっしぐら
    richard_raw
    richard_raw 2011/01/16
    おお、素晴らしい。処理が速いなら最強かも。
  • Engadget | Technology News & Reviews

    Parrots in captivity seem to enjoy video-chatting with their friends on Messenger

    Engadget | Technology News & Reviews
    richard_raw
    richard_raw 2011/01/13
    上司が「一冊だけ買って、あとはコ(ry」などと
  • iPhoneカメラで撮影したURLのサイトを開けるアプリ「LinkGrabber」 | クリエイティブ | マイコミジャーナル

    ABBYYは、プリントされているウェブのアドレスをiPhoneカメラで撮影/編集することによって、iPhoneのブラウザでWebサイトを開くことができるユーティリティアプリ「LinkGrabber」をリリースした。価格は115円。 同アプリは、新聞や広告、名刺などプリントされた画像からテキストを読み込む同社のモバイルOCR技術を用い、iPhoneカメラでWebアドレスを撮影し、編集を加えることで、iPhoneのブラウザで撮影したURLのサイトを開くことができる。 キャプチャーしたWebアドレスをmailやSMSで送信することができるほか、カメラカメラロールに保存されている写真からもアドレスをキャプチャーすることも可能。 価格は115円で詳細はこちらより。

    richard_raw
    richard_raw 2010/12/14
    ありそうでなかった
  • 【コラム】Useful Web Applications (4) コメントスパム防止機能を実装できる無料ツール - reCAPTCHA | ネット | マイコミジャーナル

    ネットサービスのユーザー登録画面などで、そのユーザーが「人間かどうか」を判定するために使われる「読みづらい文字」のことを「CAPTCHA(キャプチャ)」といいます(「Completely Automated Public Turing test to tell Computers and Humans Apart」の略)。今回は、そのCAPTCHAを自分のサイトで使えるフリーのCAPTCHAサービス「reCAPTCHA」の使い方を紹介しましょう。 reCAPTCHA reCAPTCHAとは? reCAPTCHAは元々アメリカのカーネギーメロン大学で開発されたシステムで、OCRで読み取れない文字の解読にCAPTCHAを利用するという発想から生まれています。 reCAPTCHAでは2つの単語が提示されます。 1つはすでにreCAPTCHA側で答えがわかっている単語で「ユーザーが人間かどうか」を

    richard_raw
    richard_raw 2010/12/07
    reCAPTCHAの使い方。……手書きのシステムを思いつきました(たぶん公知)。
  • スキャン代行業者の実力を比較する(前編)

    電子書籍の普及に伴って台頭してきた「スキャン代行サービス」。この代行サービスを取り扱う短期連載の第2回は、実際に各業者に発注し、サービスの内容を具体的に検証する。 前回の記事「スキャン代行サービスの現状と内容比較」では、スキャン代行サービスの現状についてお届けした。各社のサービスの概要はサイトの説明ページを読めばおおむね理解できるものの、実際の納品物のクオリティ、および各業者の対応の詳細は、やはり実際に発注してみないと分からないところが多い。 このため今回は、同一の組み合わせパターンとなる書籍を用意し、各業者にほぼ同じ内容で発注を行い、サービス内容の検証を行った。あくまで一例ではあるが、参考にしてほしい。企画では全部で7社の業者に依頼を行ったが、今回はまず4社、次回で残る3社について、検証結果をお届けしたい。 なお、前回も触れたとおり、スキャン代行サービスは著作権法30条1項にある「その

    スキャン代行業者の実力を比較する(前編)
    richard_raw
    richard_raw 2010/12/01
    スキャン品質は自炊と変わりませんか……。
  • 本を送るとスキャンして電子書籍化してくれる「BOOKSCAN」の裏側を見せてもらいました

    をそのまま送ると裁断機でバラバラにした後、スキャンしてPDFデータなどに変換してくれるという、電子書籍時代が始まっているにもかかわらず既存の出版社がノロノロしているその間隙を縫うかのようなタイミングで出現したサービス、それが「BOOKSCAN」です。その舞台裏がどうなっているのかを実際に行って取材してきました。 結論から言うと、2010年4月の設立から約7ヶ月が経過、その間に新規参入業者が山ほど出現しましたが、「BOOKSCAN」はさらなる劇的な進化を遂げて差別化に成功しており、最初の頃からは考えられないレベルに到達していました。正直、わずか7ヶ月でここまでできるのだという意味では、まるで海外のスタートアップ企業のようなスピード感と、アイディアを形にする確かな技術力を感じます。 戦慄すべきその恐るべき舞台裏の中身は以下から。BOOKSCAN(ブックスキャン) 低価格・書籍スキャンサービス

    本を送るとスキャンして電子書籍化してくれる「BOOKSCAN」の裏側を見せてもらいました
    richard_raw
    richard_raw 2010/11/25
    なにこの成長っぷり!
  • キヤノンMJとEMCが協業、紙文書の電子化ソフトとOCRソフトを構築サービス込みで提供

    キヤノンマーケティングジャパン(キヤノンMJ)とEMCジャパンは2010年11月17日、紙文書の電子化ソリューションで協業すると発表した。EMCの電子化ソフト「Captiva InputAccel」とキヤノンの日語OCRソフト「Rosetta-Stone-Components」を組み合わせ、システム構築サービスとともに提供する。販売開始は2011年4月から。 Captiva InputAccelは、スキャナーで読み取った文書データを種類ごとに分類したり、文書に記載してあるべき項目がすべて埋まっているかを検証したりする機能を持つ。世界では1万2000社が導入しているが、国内では日語を読み取るOCR機能がないため、販売が伸び悩んでいた。キヤノンのOCRソフトと組み合わせることで、EMCジャパンは販売増を狙う。 キヤノンMJはシステム構築案件につなげたい考え。「他の電子化ソフトも検討したが、

    キヤノンMJとEMCが協業、紙文書の電子化ソフトとOCRソフトを構築サービス込みで提供
    richard_raw
    richard_raw 2010/11/18
    EMCには日本語OCRがないとか、キヤノンはimageRUNNERと組み合わせたいとか。