タグ

OCRに関するnsyeeのブックマーク (11)

  • 日本生まれのクラウドノート「KYBER」がすごい理由 (1/3)

    オーリッドという日IT企業が注目を集めている。売上高は40億円規模。法人向けWebサービスを提供していたが、昨年から個人向けサービス「KYBER」を開始した。16日に発売した「KYBER Smartnote」(写真、3冊1500円)は、そのサービスの目玉だ。 見た目はごく普通のノート。メモをしたり、議事録をとったり、普通のノートとして使える。ノートをiPhone付属のカメラで撮影し、KYBERのWebサイトにアップロードすると、画像のデータがクラウドサーバー上で管理される(Androidには10月対応予定)。そこまではこれまでのクラウドサービスにもあったもの。「Evernote」を思い浮かべる人もいるだろう。 だが、話はここからだ。 しばらくすると、手書きのメモが文字データになって送られてくる。いわゆるOCR(画像からの文字起こし)だが、その精度は異様に高い。ほぼ完璧だ。納品までも最速

    日本生まれのクラウドノート「KYBER」がすごい理由 (1/3)
  • sasasin.net/docs - Kindle

    届いたのは先月初くらいでした。 Kindle 3G Wireless Reading Device, Free 3G + Wi-Fi, 6" Display, 3G Works Globally - Latest Generation 自宅と会社の往復40分のひまつぶしが欲しかったのです。朝は日が差すので、iPadやケータイのようなバックライトで見せる機器は使えません。夜は街灯しかないので、紙媒体の書籍はおあずけになってしまいます。 で、反射型のディスプレイのため、日が差しても見やすく、ブックカバーに偽装した読書灯がオプションとして用意されていたため、夜道でも読める、ということでKindleとなりました。 一月くらい運用してみて、だいぶ生活に融け込んだと思うので、下記。 3G通信機能 Webkitを採用したフルブラウザがインストール済みであるため、たいがいのサイトは見るのに困りません。が、

  • binWord/blog - Mac+ScanSnap+Acrobatでお手軽名刺管理(検索も可!)

    ○どうやっても面倒くさい名刺管理 社会人で名刺管理に悩む人は少なくないと思う。ほったらかしにしていると必要な時に見つからないし、かといってすべてをアドレス帳にきちんと入力するのも時間の無駄。WindowsではOCRを利用した名刺管理ソフトがいろいろ発売されているが、Macでは適当なものがない。 最近では、ScanSnap(Amazon)を使い、画像データとして名刺を管理している人もいるようだ(参考記事)。Macの場合、iLifeに含まれるiPhotoを使えば、画像にキーワードを付けられるし、紙をパラパラめくる感覚で名刺を探せる。iPodとも同期できる。 私もこのやり方を試してみた。確かに画像としてパラパラめくるのは気持ちいいのだが、枚数が多くなってくるとそれでは探しきれない。検索用キーワードを入力しておけばSpotlightで探せるが、いちいち打ち込むのは面倒だ。また、両面印刷の名刺もうま

  • OCR の製品スペックと研究論文の読み方とか

    今年の初めくらいから,またもや OCR 関係のソフトウェアに首を突っ込んでいるもんで,関連する論文を読んだり,関連する製品の性能を検証したりしています。もちろん,プログラムも書いている。それにしても,まぁー……この分野は面白い。前処理から領域の抽出,レイアウトの論理構造解析から文字認識まで,それぞれがそれぞれ大きな懸案を抱えていて,しかも今のところ,これといった技術が確立していない。 で,ですね。ともかくも,OCR 製品の性能や論文を読んでるわけです。これ,自分で作ってみて,初めてその性能が「高い」のか「低い」のかが分かったりする。 例えば,これは以前書いたかもしれないけれど,「文字認識率99.9%」とかいったキャッチフレーズがあったりしますよね。これ,高いと思うでしょうか,低いと思うでしょうか。ま,用途にもよるんだろうけども,あたしんとこのお客さんからすると,低い部類に入るんだと思う。

    nsyee
    nsyee 2010/08/14
  • モノマニア: 現行の日本語OCRソフト比較:縦書き文章の論文、英語日本語混在論文における「極限」性能比較、ソフト価格比較:Panasonic:読取革命 ver.14、エプソン・エー・アイ・ソフト :��

    文系研究者電化製品批評。(ガセネタ注意) ※Windows版・Mac版 Endnote 13 Endnote X3の格安購入法については、以下のサイトで詳しく紹介しています。 http://www.monomania.jpn.org/Site/Endnote13.html ※プラステック社のOpticbook 3600とA300のお得な購入方法と価格比較については、以下のサイトを参照してください。 http://www.monomania.jpn.org/Site/Opticbook2.html どもAtlasです。今日は日語OCRソフトを紹介します。OCRソフトというのは、簡単に言えば、スキャナで取り込んだ画像ファイルをテキスト化してパソコンで検索できるようにするためのソフトです。検索可能なPDFファイル(透明PDF)を作るのに使用するソフトウェアです。 富士通のスキャンスナップやCa

    nsyee
    nsyee 2010/08/14
  • MacOSX 上の Acrobat の OCR の奇妙な文字化けに対処する

    MacOSX の OCR の選択肢は狭く、ちょっと躊躇する分野である。そのため、Acrobat 搭載の OCR が重宝すると思う。 しかし!! 僕の持っている Acrobat 8.1.2 では OCR 処理後に埋め込まれる文字が奇妙な文字化けを起こして、全く使えなかった。 ググりまくっても対処法が見つからずに途方に暮れていた。 はて?なんすかね? ふと文字化け文字列をコピペして UTF-8として再認識させると 80% 位が日語として識別できるようになった。 詳しく調べてみると、OCR処理後に埋め込まれる文字列が「90ms-RKSJ-H」というエンコードで符号化される(要するにShift-JISの亜流)はずが、コイツの中身が勝手に「UTF-8」になってるっぽい?らしい。 小一日後、、、ふと思ったのが、環境変数LANGかなくらい。。。 LANG変数は、結構昔に ~/.MacOSX/envir

    nsyee
    nsyee 2010/08/10
  • iPadに本を電子化して持ち歩く!PDFのファイルサイズを3分の1にまで小さくする方法 | nanapi[ナナピ]

    iPadを電子化して持ち歩く!PDFのファイルサイズを3分の1にまで小さくする方法 に関するライフレシピをご紹介します。nanapi [ナナピ]は、みんなで作る暮らしのレシピサイトです。はじめに いよいよ iPad が日でも発売されましたね! 今回のレシピは、を電子化(PDF 化)して iPad でたくさん持ち歩きたいという方、必見です!PDF のファイルサイズを小さくする方法を紹介します。 もちろん見た目が悪くなっても構わないのであれば、いくらでも小さくできるのですが、ここでは見た目を落とさないようにこだわってみました。 ファイルサイズはどのくらい小さくなる? ファイルサイズがどのくらい小さくなるのかを下の表にまとめました。 の中身にもよりますが、テキストがメインのだと3分の1くらいまで小さくなります。 意外とスゴい、Adobe Acrobat 今回使用するのは、定番スキャナ

  • 電子化した本に最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww - おいちゃんと呼ばれています

    まずは下の表を見てください。 Perlベストプラクティス 作者: Damian Conway,クイープ出版社/メーカー: オライリー・ジャパン発売日: 2006/08/24メディア: 大型購入: 11人 クリック: 153回この商品を含むブログ (155件) を見る |版 / ページ数|B5版 / 513ページ| |スキャン|白黒 600dpi /(表紙のみ)カラー 300dpi| |圧縮前のサイズ|89.2MB| |圧縮後のサイズ|28.1MB| これは前回のエントリー「ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実」で調査対象にしたPDF)を、Adobe Acrobat 9(Pro / Standard)を使って圧縮した結果です。*1 前回のエントリーでは、 ScanSnap でスキャンした後に Adobe Acrobat で OCR テキスト認識

    電子化した本に最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww - おいちゃんと呼ばれています
  • ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています

    おっと。また大袈裟なタイトルつけちゃって。 釣り << なんて言われないように、気合い入れて書かなくっちゃ。 さて、先週のエントリー「裁断機 PK-513L でを 100冊裁断してみた - 経験した 9つの失敗とその回避方法」が大きな反響をいただいたので、今回は裁断の次のステップである「スキャン」を攻略。ScanSnap S1500 の設定についていろいろと調べてみました。 *目次というか、いきなり結論から 書いていったら結構長くなってしまったので、とりあえず目次。というかほとんど結論なんですが、結論だけ見られればいいやという方のためにも。 **(2010年7月9日 追記) 自炊した電子書籍PDF)を iPad でサクサク表示する方法(サンプル動画あり) << **(2010年8月13日 追記) OCR テキスト認識に限らず、ScanSnap S1500 の設定全般についてもまとめてみ

    ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています
  • OCRソフト(スキャナーで読み込んだPDFなどを文字認識する)で一番機能が優れているのは、何でしょうか?…

    OCRソフト(スキャナーで読み込んだPDFなどを文字認識する)で一番機能が優れているのは、何でしょうか?読取革命Ver.14 製品版を買おうと思いましたが、AMAZONの評価が★2つだったので、もう一度検討してからにしたほうがよいかと思いました。読んdeココ!というのも良いということですが。価格なども含め、使ったことのある方に教えていただければ幸いです。宜しくお願いします。

    nsyee
    nsyee 2010/07/16
  • yamakawa.us - GoogleドキュメントにOCR機能が追加、PDFや画像からテキストを抽出

    この機能は、Googleドキュメントに対してデータをアップロードする際、オプションの「PDF や画像ファイルからテキストを Google ドキュメントのドキュメントに変換する」にチェックを入れておけば、アップロードされたものがPDFや画像であれば自動的に文字だけを抽出して新規の文章ドキュメントとしてアップロードしてくれるというもの。 例えば今回追加されたオプションをONにし、PDFやjpeg形式のファイルをアップロードすると、アップロードされたデータはすべてdoc形式のものになります。 これは非常に便利ですね。文章の検索にも役立つと思います。

  • 1