タグ

ocrに関するtarchanのブックマーク (22)

  • 凸版印刷、くずし字解読支援システム「ふみのはゼミ」を開発

    凸版印刷、くずし字解読支援システム「ふみのはゼミ」を開発高精度のくずし字AI-OCRを搭載し、古文書・古典籍をオンライン上で簡単に解読できるシステム。共同作業をサポートし、コロナ禍における学習や研究、イベントなどに活用可能 凸版印刷株式会社(社:東京都千代田区、代表取締役社長:麿 秀晴、以下 凸版印刷)は、高精度のくずし字AI-OCRを搭載し、古文書・古典籍をオンライン上で簡単に解読できるシステム「ふみのはゼミ」を開発しました。 授業やイベントでの活用を想定したグループワーク支援機能により、歴史的資料のデジタルアーカイブ化を推進するとともに、コロナ禍における学習・研究の拡大に貢献します。 「ふみのはゼミ」を活用した共同解読作業のイメージ サービスは、凸版印刷が2015年から研究・実証試験を行ってきたくずし字OCRをさらに発展させ、凸版印刷総合研究所が開発したAI-OCRの導入による文字

    凸版印刷、くずし字解読支援システム「ふみのはゼミ」を開発
    tarchan
    tarchan 2021/02/17
  • 自作プログラム | Hello, My Friends

    ゲーム画面DeepL翻訳支援ツールOCR2DeepL ※ぬるっぽさんによる翻訳支援ツールPCOTの方が優れているため こちらアップデートの予定はありません PCOTを利用することを推奨しています ダウンロードページ ヌルポインターストライク スクリーンOCR(Capture2Textなど)と連携しゲーム画面を話題のDeepL Translatorで 翻訳するツールです Capture2TextとDeepLアプリを連携させますので、別途それぞれのアプリの インストールが必要となります ※電ファミニコゲーマーさん記事にして頂きました! ダウンロード 使い方はreadmeをよくお読み下さい Capture2Textの設定例 Q&A Q. DeepLアプリが反応しない時がある A. Capture2Text/DeepLアプリ/OCR2DeepLの3つが起動しているか確認してください また稀にタイミ

    自作プログラム | Hello, My Friends
  • 寿司打の限界を目指して ~WebGLのOCR~

    この記事は闇の魔術に対する防衛術 Advent Calendar 20192 日目の記事です。 ある日、会社で寿司打というタイピングの速度や正確さを競うゲームが流行った。 みんなやってるので私も挑戦してみたところ、結果は惨敗。全エンジニアの中でもっともスコアが低かった。もともとタイピングが早くも正確でもないことを自覚していたつもりだったが、現実を突きつけられ大人しく家に返って枕を濡らそうと思った。が、あまりの悔しさにまみれ「JSer ならタイピング速度ではなく JS で勝負すればいいんだ」とダークサイドに堕ち闇の力に手を染めてしまった。 記事はムキになって寿司打(WebGL 版)のスコアを稼ぐ自動化 JavaScript の話。 なお動作確認には Ubuntu 19.04、Google Chrome 80.0.3955.4 を使用した。 寿司打 WebGL 版 http://typing

    寿司打の限界を目指して ~WebGLのOCR~
  • 超簡単! 「Google ドキュメント」を使って画像の中の文字をテキストデータにする方法 - 価格.comマガジン

    「パソコンとスマホの基ワザ」は、パソコンやスマートフォンに関する基ワザや知っておくと便利な機能をていねいに紹介する連載です。“超”が付くほど簡単な使い方から、中上級者でも知っておくと役に立つ情報をお届けしていきます。第63回は、「Google ドキュメント」を使った、画像の文字をテキストデータ化する方法を紹介します。 「Google ドキュメント」を使えば、紙の書類のデジタル化が超簡単 紙の書類を渡されたけど、それをパソコンのデータとして扱いたい。そんなときに便利なのが、画像の中の文字を認識してテキストデータにする、いわゆる文字認識機能だ。この機能をもつアプリはいろいろあるが、アプリをインストールすることなく、「Google Drive」の機能で行う方法もある。 その方法とは、Google Driveに画像をアップロードし、その画像を「Google ドキュメント」で開くだけ。そうすると

    超簡単! 「Google ドキュメント」を使って画像の中の文字をテキストデータにする方法 - 価格.comマガジン
  • 認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた | Ledge.ai

    記事ネタを集めていたところ、代官山で日語の手書き認識ソフトウェアの開発に成功した外国人グループがいる。それもたった2か月で。という記事にあたりました。日語の手書き文字のOCRを外国人が開発しているという驚き。 気になりすぎたので、早速取材にいってみたところ、Reactive Inc.のデータサイエンティストのDavid MalkinさんとコアエンジニアのPhilip Irriさんにお話しを聞くことができたので、まとめてみました! 非エンジニアにもわかるようにと噛み砕いて、システムの内容や今後の拡張計画ディープラーニングの可能性についてまでいろいろ話してくださいました。

    認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた | Ledge.ai
    tarchan
    tarchan 2016/06/15
  • 手書きは死なない。ギークが選ぶ「手書きスキャン」という選択肢 | ライフハッカー・ジャパン

    誰かの電話番号をメモするなら、わざわざ紙に書くより、直接スマホに入力するほうが速いのは事実。しかし、会話の途中や、手元にスマホがないとき、近くにあるペンでどこか平らなところ(手の甲でもいい)にさっとメモするほうが手軽です。ToDoリストだって紙とペン派の人たちがたくさんいます。 手書きにはたくさんの利点があります。数々の研究によって、手書きでメモするほうがタイプするより、情報をよく憶えていられることが示唆されています。きっと学生たちはこのことをよくわかっています。 手書きメモをデジタルに変換して使う もちろん、手書きメモも完璧ではありません。例えば、手書きした情報は検索が困難です。紙の束を持ち歩いて、必要なときに必要な情報をさっと取り出すなど非現実的です。デジタルなメモなら、検索が簡単なだけでなく、複数デバイスに同期してどこへでも持ち歩くことができます。 では、ギークたちはどうするかって?

    tarchan
    tarchan 2014/06/12
    「原子カ」とかの誤変換は無くならないんですかね
  • 「"原子力(りょく)"ではなく"原子カ(か)"で検索すると出てくるpdf資料が「検索避けの隠蔽工作か!?」と一部で話題。

    まとめ なぜストロンチウムはス卜口ンチウムになったのか 「原子力」("力"は漢字)が「原子カ」("カ"はカタカナ)に、ストロンチウム("トロ"はカタカナ)が、ス卜口ンチウム("卜"は漢字の"ボク"、"口"は漢字の"クチ")になってるPDFがたくさん発見された。それはなぜそうなったのか。および改善するには? 18034 pv 99 15 users 12

    「"原子力(りょく)"ではなく"原子カ(か)"で検索すると出てくるpdf資料が「検索避けの隠蔽工作か!?」と一部で話題。
  • Sale – Touch Lab – タッチ ラボ

    iPhone・iPod touch・iPadApple Watchのニュース、便利な使い方、アプリとアクセサリのレビューをお届けします。

    Sale – Touch Lab – タッチ ラボ
  • 富士通、GPUを活用し人間の脳を模した人工知能型手書き文字認識技術を開発

  • 震災対応支援。FAXから情報を効率的に収集、活用·Shinsai FaxOCR MOONGIFT

    Shinsai FaxOCRはFAXを自動OCRし、そこから得られた数字を一覧、集計できる管理システムです。 2011年3月の地震は痛ましい災害でしたが、ただ嘆くだけでなくその時期だからこそ生まれた素晴らしいプロダクトがたくさんあります。今回はその一つ、Shinsai FaxOCRを紹介します。 ログインします。 ダッシュボードです。 日次報告集計のFAX受信リストです。 実際に送られてきたFAXです。 予め決められた手書き部分をOCR解析して取り出しています。 日語はともかく数字部分は適切に解析されています。 CSVダウンロードもできます。 ユーザ管理です。 Shinsai FaxOCRは送信されてきたFAXをOCR解析し、そこに書かれた数字を一覧したり集計したりしてダウンロードできます。報告用紙のフォーマットは決まっていますが、規定に則って作成もできます。FAXを使って各施設は状況を

    震災対応支援。FAXから情報を効率的に収集、活用·Shinsai FaxOCR MOONGIFT
  • 日本生まれのクラウドノート「KYBER」がすごい理由 (1/3)

    オーリッドという日IT企業が注目を集めている。売上高は40億円規模。法人向けWebサービスを提供していたが、昨年から個人向けサービス「KYBER」を開始した。16日に発売した「KYBER Smartnote」(写真、3冊1500円)は、そのサービスの目玉だ。 見た目はごく普通のノート。メモをしたり、議事録をとったり、普通のノートとして使える。ノートをiPhone付属のカメラで撮影し、KYBERのWebサイトにアップロードすると、画像のデータがクラウドサーバー上で管理される(Androidには10月対応予定)。そこまではこれまでのクラウドサービスにもあったもの。「Evernote」を思い浮かべる人もいるだろう。 だが、話はここからだ。 しばらくすると、手書きのメモが文字データになって送られてくる。いわゆるOCR(画像からの文字起こし)だが、その精度は異様に高い。ほぼ完璧だ。納品までも最速

    日本生まれのクラウドノート「KYBER」がすごい理由 (1/3)
  • 避難所の名簿の写真からの文字起しに役立つツール - 強火で進め

    ツール 日郵便郵便番号データ 読み辛い手書きの住所前後の文字から該当住所を検索するの利用可能 http://search.post.japanpost.jp/zipcode/dl/oogaki.html 手描きで漢字を検索 手書き漢字認識 - sljfaq.org http://kanji.sljfaq.org/drawj.html ここで公開しているツール情報について 現在、Googleが避難所の名簿の写真を一括で公開しています。 https://picasaweb.google.com/116505943227607394790/DropBox# この写真データを元に多くの方がパーソンファインダー(Person Finder)への登録に協力されています。 現在、Googleは重複を防ぐ為、パーソンファインダーでは無くPicasaのコメント欄にて記入をお願いしますとの事です。 この作

    避難所の名簿の写真からの文字起しに役立つツール - 強火で進め
  • Google DocsのOCR変換機能が日本語に対応

    PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日語に対応した。 米Googleは2月28日(現地時間)、昨年6月にGoogle Docsに追加したOCR(光学式文字認識)機能を、新たに日語を含む29カ国語に対応させたと発表した。日語のPDFやスキャナやデジカメで取り込んだ文字を含む画像をGoogle Docsにアップロードすると、ファイルがテキストデータに変換される。 使い方は、Google Docsの「アップロード」の画面で変換オプションを以下のように設定し、「アップロードを開始」をクリックする。変換が可能なファイル容量の上限は2Mバイトだ。 実際にやってみたところ、PDFではほぼ問題なくテキストに変換されたが、デジカメで撮影した画像からの変換の精度はまだ高いとはいえないようだ

    Google DocsのOCR変換機能が日本語に対応
  • 自炊した電子書籍(PDF)を iPad でサクサク表示する方法(サンプル動画あり) - おいちゃんと呼ばれています

    以前、このような(↓)自炊(=を自前で電子化)PDF に関するエントリーを書いてみたのですが... -電子化したに最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww -iPadを電子化して持ち歩く!PDFのファイルサイズを3分の1にまで小さくする方法 | nanapi[ナナピ] たしかに PDF のファイルサイズは小さくなって、その分多くのiPad で持ち歩けるようにはなりましたが、 なにせ 表示が遅い。遅すぎる(↓) で、これは「どげんかせんといかん」と思い、あれやこれや試した結果、 Adobe Acrobat 9 の「ClearScan」機能で OCR テキスト認識すれば OK << という解決策を見つけましたので、報告します。 *1. テキストが多くて、版の大きいの表示が遅い 表示が遅いといっても、すべてのの表示が遅いのではなく、

    自炊した電子書籍(PDF)を iPad でサクサク表示する方法(サンプル動画あり) - おいちゃんと呼ばれています
    tarchan
    tarchan 2010/07/13
    文字数の多いPDFは表示が遅いらしい
  • GoogleドキュメントにPDF、画像内の文字を抽出できる機能が登場 | ライフハッカー・ジャパン

    Googleドキュメントに新しい機能が追加されましたのでご紹介いたします。 新機能はPDF・画像内の文字を抽出できるというもの。Google ブックスで利用されているOCR技術を利用しています。なかなか精度もいいですよ。 以下に使ってみた様子を載せておきます。 まずGoogleドキュメントにアクセスします。 ファイルのアップロードを選択しますと、オプションで「PDF や画像ファイルからテキストを Google ドキュメントのドキュメントに変換する。」という項目があるので、チェックをいれます。 以下の画像を読み取ってみました。 Google Chrome Updates, Adds Integrated Flash Player アップロード後、しばらくすると変換が終了します。 変換後のドキュメントは以下のとおり。 一部文字が抜けたりしているところがありますが、おおよそ読み取ることができてい

    GoogleドキュメントにPDF、画像内の文字を抽出できる機能が登場 | ライフハッカー・ジャパン
  • エバーノート日本法人設立〜画像の日本語認識機能を提供開始 - ネタフル

    Evernote Japan Launch」ということで、日法人設立の発表記者会見が東京駅側で行われていまして、そのレポートをお届けします。 CEOフィルよりプレゼンテーション。 ・エバーノートは記憶のプラットフォームである ・ツイッター、mixiなどは素晴らしいサービスだが全てソーシャルコミュニケーションのためのツールである ・エバーノートは友達のためでも同僚のためでもない自分自身の記憶が外部化するためのツールである ・ツイッターなどのソーシャルサービスに投稿された情報は友達が見ることを前提にしいる ・ところがエバーノートに入力された情報を見るのは自分自身だけである ・エバーノートは人間の外部の記憶を果たすので様々なバージョンがある ・Mac/Winのほかありとあらゆるスマートフォン版が用意されている ・最近になってiPad版が追加され急成長している ・iPadを始めとするタブレット

    エバーノート日本法人設立〜画像の日本語認識機能を提供開始 - ネタフル
  • ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています

    おっと。また大袈裟なタイトルつけちゃって。 釣り << なんて言われないように、気合い入れて書かなくっちゃ。 さて、先週のエントリー「裁断機 PK-513L でを 100冊裁断してみた - 経験した 9つの失敗とその回避方法」が大きな反響をいただいたので、今回は裁断の次のステップである「スキャン」を攻略。ScanSnap S1500 の設定についていろいろと調べてみました。 *目次というか、いきなり結論から 書いていったら結構長くなってしまったので、とりあえず目次。というかほとんど結論なんですが、結論だけ見られればいいやという方のためにも。 **(2010年7月9日 追記) 自炊した電子書籍PDF)を iPad でサクサク表示する方法(サンプル動画あり) << **(2010年8月13日 追記) OCR テキスト認識に限らず、ScanSnap S1500 の設定全般についてもまとめてみ

    ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています
  • 画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」

    Warning: include_once(/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-cache-phase1.php): failed to open stream: Permission denied in /home/users/0/lolipop.jp-dp16105308/web/wp/wp-content/advanced-cache.php on line 8 Warning: include_once(): Failed opening '/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-c

    画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」
  • 紙とデジタルの橋渡し――OCR処理で住民サービスを向上した世田谷区

    東京23区で最も人口の多い世田谷区の住民税を処理するには、120万件にものぼる関係書類の入力作業が必要だ。そして、その最大の問題は、住民税を算出するための確定申告書類や報告書などの書式やサイズがまちまちで、手入力作業が基となっていたこと。世田谷区は、これを高精度のOCRによってイメージ処理することで、大幅なコストダウンを実現。それに付随してサービス向上をも成し遂げたという。 自治体の課税課における業務の1つに、住民税の計算と通知書の送付がある。世田谷区も例外ではないが、東京23区で最大となる人口83万0103人(平成21年1月1日現在)を抱える自治体となると、その課税計算処理だけでもおよそ120万件の書類をコンピュータに入力しなければならない。しかも、課税計算の根拠となる書類は、税務署からの確定申告書類、一般の区民税の申告書類、事業者からの給与支払報告書など多岐にわたる。 この課税資料を

    紙とデジタルの橋渡し――OCR処理で住民サービスを向上した世田谷区
    tarchan
    tarchan 2009/12/10
    自動化したあとも毎年調整が必要なのか>「税法や資料様式が毎年のように変わり、コーディングや委託業者への指示もその都度変更が発生する。」
  • Google Docs にテキストを OCR する機能が追加予定?

    Perform OCR with Google Docs – Turn Images Into Editable Documents まだユーザーインターフェースそのものに組み込まれてはいないようですが、Google Docs に OCR 機能が追加されるのではないかという記事が Digital Inspiration で紹介されています。 この機能は Document List Data API の例として公開されているもので、こちらのフォームを利用して画像をアップロードすると、テキストが認識されて自動的に Google Documents に変換されます。 現在の所英数字のみ 画像はそれなりに高解像度の必要があります。1文字ごとに 10 px ほどの高さが目安 ファイルサイズは最大 10 MB、25 メガピクセル ファイルサイズに従って時間がかかります。500K くらいなら 15 秒、

    Google Docs にテキストを OCR する機能が追加予定?