The Station is a weekly newsletter dedicated to all things transportation. Sign up here — just click The Station — to receive the newsletter every weekend in your inbox. Subscribe for free. W
Follow @applechinfo Jotnot DocScanner Genius Scam CamScaner RectAce 2 :iPhone774G [↓] :2011/02/10(木) 09:36:56 ID:Ve7DVQqK0 [PC] 画質や他との連携考えたらDocScannerが1番と思った。 230円だし。 DocScanner (Version 5.0.5) カテゴリ: 仕事効率化 価格: ¥350 デベロッパ名: Norfello Oy リリース日: 2009/04/18 対応デバイス: 全機種 現Ver.の平均評価: (2.5 / 27件の評価) 通算の平均評価: (3.5 / 471件の評価) Game Center: 非対応 3 :iPhone774G [↓] :2011/02/11(金) 17:21:01 ID:db/X/th60 [PC] CamSc
PDFフリーソフトやPDF変換ソフト、ワードやエクセルからのPDF変換など、たくさんのPDFソフトがあります。 編集や結合・分割、抽出・挿入、パスワード設定、印刷・コピー制限、デジタル署名など、 PDF変換ソフトによって機能が違うので一覧表示にまとめてみました。
こんにちは!freee で モバイルアプリ 開発を担当している RyoAbe です。 freee Developers Advent Calendar の10日目として、Google Cloud Vision API の導入 〜 OCR 機能の検証の結果についてまとめた記事になります。 Google Cloud Vision API とは? Google Cloud Vision API とは GCP が提供するサービスの一つで、機械学習により画像から分析情報を抽出する以下のような機能を提供します。 乗り物や動物など、画像に写っているさまざまなカテゴリの物体(「ヨット」や「ライオン」、「エッフェル塔」など)を検出 アダルト コンテンツから暴力的なコンテンツまで、さまざまなタイプの不適切なコンテンツを検出 著名人やロゴ、ニュース イベントなどの時事的なエンティティを検出 光学式文字認識(OC
SikuliスクリプトはOpenCVを使った画像認識を利用して、GUI操作の自動化を行うスクリプトです。 指定した画像に一致した領域にカーソルを動かしてクリックさせたり、キーボードでの入力をさせたりすることができます。 そこで、今回はSikuliがUIテストに利用できるのかどうかを調べるために、iOSシミュレータに対してSikuliスクリプトを試しに使ってみました。 なお、MITのUIデザイングループが始めたオープンソースの研究プロジェクトであり(ソースはGitHubにあります)、現在はコロラド大学ボルダー校のSikuli Labがメンテナンスしているようです。 ダウンロードから起動まで Sikuliのサイトのダウンロードページからdmgファイルをダウンロードします。これをマウントして実行するだけです。 なお、Lion以降を利用している場合には、Gatekeeperの設定によって実行できな
Download the free version and test out the software - 70% of features are unrestricted. Create stunning documents that conform to international ISO specifications for PDF files. Make a single payment and use the software indefinitely with our perpetual license model. Supported operating systems: All current versions of MS Windows operating systems, and previous versions that are maintained with se
この記事はLayerXテックアドカレ2023の5日目の記事です。 昨日はmakogaさんがEngineering Career Ladderを作るときに気をつけたこと 其の一を書いてくれました。 次回はyuya-takeyamaさんがMicrosoft Graph APIについて書いてくれます!乞うご期待! こんにちは、機械学習を通じて誰かをラクにしたい yakipuです。 今回は、10月から始まったインボイス制度に伴う適格請求書発行事業者登録番号(以下「登録番号」と表記します)のOCR読み取りの戦いについて記したいと思います。 インボイス制度は、売手が買手に対して正確な税率や消費税額を示す適格請求書(インボイス)を交付することで、買手が仕入税額控除の適用を受けるために必要な制度です。売手側は登録事業者として登録番号などが記載されたインボイスを交付し、買手側はインボイスを保存する必要があり
キヤノンの軽量ドキュメントスキャナー「DR-150」をモニターしています。 前回のイベントレポート&ファーストインプレッションはこちら。 » キヤノン DR-150 でドキュメントスキャナーはますますコンパクトに – F.Ko-Jiの「一秒後は未来」 さて、今回はこのスキャナに付属している CD からインストールできる「やさしく家計簿 エントリー」というソフトを使ってみます。これはレシートをスキャンして支出入力ができるという便利ソフトです。 ※ なお前回の記事でも書きましたが、縦の解像度の低いネットブックなどで利用する場合には、家計簿ソフトのウインドウサイズの関係でボタンが表示されない場合があります。 レシートを準備 さっそくレシートをスキャンしてみましょう。 ↑ まずはレシートがないとお話しになりません。 ↑ スキャナを準備します。 スキャナーをPCにつなぐ スキャナを PC に接続しま
PDF を Gyazo に展開して Scrapbox の記事にして全文検索する という試みについてです。 まず PDF を Gyazo に展開して Scrapbox の記事にするということですが、これについてブラウザ上で簡単に動くツールを実装しました。 https://ssig33.github.io/pdftoscrapbox/ おそろしく素朴な見た目ですがとりあえず動きます。Chrome や Edge に Tamper Monkey (試してないけど Firefox と Greasemonkey でも動くんじゃないかな)を入れて、 input に Scrapbox のプロジェクト名を入れて user.js をインストールした上で赤いところに PDFをドラッグ&ドロップすると、 PDF.js で PDF でレンダリングした上で全てのページを Gyazo にアップロードして Scrapbo
Genius Scanが登場した時に叫んだ「スキャンアプリの価格破壊や!」という言葉をもう一度使いたいアプリ、CamScanner Freeをご紹介します。 基本機能は以下の通り。 名刺やホワイトボードを撮影した写真の加工機能 スキャンデータの整理機能 撮影した写真について、必要部分を切り取って拡大し、さらに2種類のフィルタで写真上の文字などを見えやすくする加工を行えます。 その上、スキャンアプリが苦手としている「ファイリング」機能も充実しています。パソコンや友人、さらにはGoogle Docs、BOX.net、Evernote、iDisk、Dropboxへのスキャンデータ転送もお手の物。 いやぁ、充実のアプリですよ。早速ご紹介していきます。
こんばんは。編集委員の早川大地です。 以前、「はじめて本を自炊してみたよ」を書いて以来、すっかり電子書籍一択の生活を送っているわけです。本屋から買ってきたばかりの新品の本を即座に裁断しスキャナに入れるたびに、毎回そこはかとない罪悪感で、「あああ、僕は今いけないことをしているうううう!!!とってもいけないことをしているよおおおお!!!」という気分になるのですが、やはり便利さには変えられぬってことで、哀れ、我が家につれてこられた本は、即座にばらばらにされる運命に陥っています。そんなわけで、電子書籍読書が習慣になってくると、最初とはちょっとばかり使い方やコツも変わってくるんで、その後の僕の環境をご紹介します。 ■機材 前回記事時は、レンタルでしたが、結局すぐにスキャナ、裁断機ともに買いなおしました。スキャナはScanSnap S1500をそのまま購入し、裁断機はカール事務器のDC-210Nという
英国警察長協会(Association of Chief Police Officers:ACPO)によると、警察は監視カメラが日々生成する大量の情報に手が回らなくなっているという。 ACPOの犯罪記録局で情報ディレクターを務めるIan Readhead氏は先週、警察は監視カメラからの大量のデータに圧倒されており、警察が監視カメラの1機能である「Automatic Number Plate Recognition System(自動ナンバープレート認識システム)」を使ってリアルタイムで車を追跡できなくなっていることは大きな懸念の1つであると述べた。 Readhead氏は現地時間5月13日、ロンドンで開催されたデータ保護をテーマとしたイベントで、「問題は膨大な量のデータだ」と述べた。「ケントで子どもが誘拐された場合、多数の監視カメラがこの車を捕らえたが追跡できないということが起こり得る。わた
画像に含まれる文字をテキストデータ化する光学文字認識(OCR)は、請求書やレシート、名刺などの印刷物をデジタル化する手法として広く使われています。そんなOCRをディープラーニングフレームワークで実現したのが、オープンソースのOCRシステム「PP-OCRv2」のデモ版となる「PaddleOCR」です。 PaddleOCR - a Hugging Face Space by akhaliq https://huggingface.co/spaces/akhaliq/PaddleOCR GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recog
ブラウザFirefoxのアドオン「Copyfish」は、OCR(光学文字認識)機能を追加して、ムービーの字幕やサイトロゴ、文字画像などを文字コード形式に変換することができます。テキスト変換すると同時に翻訳することも可能ということなので、さっそく使ってみました。 Copyfish :: Add-ons for Firefox https://addons.mozilla.org/en-us/firefox/addon/copyfish-ocr-software/ ◆アドオンインストール Firefoxで上記URLにアクセスして、「Add to Firefox」をクリック。 「インストール」をクリック。 「Welcome!」と表示されたページが開けば、Copyfishアドオンのインストールは完了です。 ◆使ってみた ・ムービー字幕 まずはムービー内の字幕をコピーしてみます。検索ボックス横のアド
Windows:どれだけ時代が巡っても、どんなにテクノロジーが進化しても、検索やテキストのハイライトができ、コピー&ペーストも可能なPDFドキュメントではなく、なぜかスキャンしただけの文字データのない画像ファイルで書類を送ってくるオフィスや会社はあります。 検索機能などが必要な類いの書類が画像ファイルで送られて来た時には、『GText』が便利です。テキストをスキャンしてそこから文字列を抽出し、他の書類へコピーできるようにしてくれます。 インストールが済んだら、画像ファイルを選択して読み込み、画像からテキストに翻訳したいエリアをハイライトします。翻訳が完了するとポップアップ画面が表示され、そこからテキストのハイライト、コピーが可能です。もしテキストがあまり正確ではない場合、「try again」をクリックしてもう一度やってみてください。 GTTextは、BMP/JPG/GIF/TIFF/PN
期間限定ながら、安さでは4,900円のeRemoconが一番。これのみWiFi搭載 面白さでは、音声認識に対応しており、自律的に動作し、Linuxサーバ的にいじくれるFutureHomeControllerが一番 コストパフォーマンスがよく、API完備で外からつついて面白がれるのがIRKit タイマーが重要ならiRemocon 一番特徴がないが、普通には使えるPluto タイマー機能が充実したiRemoconは、ホームオートメーション的な使い方への最短距離だと思います。ただし、iRemoconは、外出先からの操作には月額250円支払う必要があるので、そこを重視するならその他の選択になるんじゃないでしょうか。 ハッキングしまくりたい人なら、IRKitか、FutureHomeControllerしかありません。 PlutoもインターフェースがWebベースなのでどうにかなるかなと思ったんですが、
米Pew Research Centerの調査によれば、2023年10月の時点で10年前(2013年)のWebページの38%がアクセス不能であるという。 10年前といえばそこそこ昔だと感じるかもしれない。20代の人からすればまだ子供時代だろう。10年前のガジェット、例えばPCやスマホはすでに役に立たなくなっても、新しいものがそれに変われば問題ない。 だが情報はどうだろうか。われわれは常に最新の情報を求めており、うっかり古い情報をつかんでしまうと判断を誤る可能性が高くなる。その一方で過去の情報が無ければ、今の情報の価値が分からなくなるのも事実だ。データとしての年次変化やトレンドの変遷など、過去からのベクトルが追えなくなってしまえば、未来予測もできない。つまり情報は過去からの 連続性が無ければ、未来線が描けないということである。 Webページが失われていくということは、当時のトレンドが分からな
日本の大学発! 楽譜を読んでリアルタイムに演奏するスキャナー「Gocen」が海外でも話題に2012.11.15 15:00 首都大学東京の研究者が開発した、五線譜を読みとってリアルタイムに演奏する小型のスキャナー「Gocen(ゴセン)」が米ギズモードでも話題になっています。このスキャナーは様々な音色に対応しており、ピアノやギター、さらには交響曲の楽譜も再現することができるスグレモノ。 Gocenは和音を簡単に扱えるだけでなく基本的なOCR機能も備えているため、「トランペット」「バイオリン」といった楽器名を読み取ることができます。さらに、音符の大きさから音の大きさを判別して抑揚の再現もできますよ。 プロトタイプ版はパソコンにつなげて処理していますが、将来的にはスマホアプリとしての期待も高まるところ。Gocenを色々な場所に持ち歩いて使えるようになれば、アマチュア作曲家にとっては貴重な支援ツー
それWebでできるよ! こんにちは皆さん スマホのカメラを使って写真を撮ると、なんと文字列が返ってくる。 そんなアプリがあるような気がするのですが、現在ではブラウザでもカメラにアクセスできるので、わざわざアプリにする必要もなく ( OSの差異にあまり煩わされることなく ) Webアプリで簡単に作ることができるのではなかろうか、と考えました。 考えたらやるしか無いでしょう。 休日を利用して、ちゃっちゃか作ってみました。 あ、いつものようにPHP使いますね TL;DR 今回の見所は以下のとおりです。 HTML + JavaScriptでカメラを取る tesseract-ocrをインストールしたコンテナを作る PHPでOCRする 何がやりたいのか 掲示板とかで無線wifiのssidとか貼ってあるとき、いちいち手打ちするの面倒なんで、カメラで取ってそのままはっつけられるようになったら嬉しいのになぁ
超音波・赤外線方式のデジタルペンは、ボールペンのペン先から超音波と赤外線を発信して、フラッシュメモリを搭載した受信ユニットに筆跡情報を記憶する仕組みになっています。 この受信ユニットを『airpenMINI』では従来の約1/3のサイズをに抑えて、携帯性を向上させました。受信ユニットは大型のシングルクリップを備え、普通紙のノート用紙上部に取り付け利用することができます。また、一般的にデジタルペンは筆記時にペン先が押されてスイッチが入る為ペン先の沈み込む違和感がありますが、付属の専用設計のデジタルペンは感圧スイッチを使い、違和感を大幅に低減しています。 パーソナルコンピュータへデータを吸い上げる際に同時に手書き文字をテキスト化する為メモ書きの検索が容易であると共に、イラストや図はBMPやJPEG、ベクターデータ(SVG)に出力ができます。 筆跡データをメモリーする受信ユニットは手のひらに収まる
ミエルカAI TOP > メディア > 技術解説 > 自然言語処理 > 【技術解説】似ている文字列がわかる!レーベンシュタイン距離とジャロ・ウィンクラー距離の計算方法とは 執筆:金子冴 人はだれしも間違いを犯すものである.徹夜で仕上げた報告書を提出した後,よく見直してみると誤字脱字が山ほど見つかった経験が読者にもあるだろう(もしかすると私だけかもしれないが).そういう時,もし自動で間違っている単語を見つけてくれるプログラムがあったら…と考える人もいるかもしれない.そこで今回は,文字列同士の似ている度合いを計算する2つの手法を紹介しよう. ●レーベンシュタイン距離(Levenshtein Distance) ●ジャロ・ウィンクラー距離(Jaro-winkler Distance) 目次 文字列の類似度,距離 編集処理(挿入,削除,置換) レーベンシュタイン距離(Levenshtein Dis
名刺管理をiPhoneだけでしたい。でも、、、 お金は使いたくない(無料アプリだけ) 手間はかけたくない でも、ある程度はちゃんと整理したい そんなあなたにベストな名刺管理方法をご紹介します。最強の無料スキャンアプリ「Genius Scan」と、画像の自動OCRが便利な「Evernote」がを組み合わせるという手法です。 早速ご紹介します。 動画で一連の作業を紹介しました。 本題に入る前に、Genius ScanとEvernoteをゲットしましょう。両方無料アプリです。 Genius Scan(記事) Evernote(記事) まず、名刺を机の上に置きます。 アプリGenius Scanを起動します。 左下の【カメラボタン】をタップします。 名刺を撮影すると、自動的に名刺を検知してくれます。この状態で右下の【Use】をタップ。 自動的に、文字がくっきりするように画像を変換してくれます。これ
R&D チームの徳田(@dakuton)です。 最近は画像とテキストの狭間にいます。 今回記事のまとめ 簡単にまとめると以下のとおりです。 いくつかの超解像(高解像度化)モデルがOpenCV extra modules(opencv_contrib)インストール + コード数行記述で導入可能 超解像に限らず、文字が一定サイズ以上になるような前処理 -> OCR解析 を実施すると、OCR精度改善につながることがある 超解像による見た目の滑らかさに比例して、OCR精度改善につながるわけではない 低計算コストな画像拡大から超解像に変更する恩恵は発生しにくい テスト条件を変えた場合、違った結果になる可能性あり(用いるOCRエンジン、画像の劣化条件、OpenCV未提供の後発モデル利用など) 実験内容 利用するOCRエンジンの実行条件は変えずに、前処理部分のみ変更した場合のOCR精度・速度変化を調べま
「(古い資料の)本文検索ができるようになれば、新たな本の価値を届けられる」。国立国会図書館次世代システム開発研究室の徳原直子室長は力を込める。 国立国会図書館(NDL)は2022年4月25日、新たに開発した「NDLOCR」をオープンソースとして公開した。NDLOCRは、書籍や雑誌などの画像データから本文のテキストデータを作成できるOCR(光学的文字認識)処理プログラム。明治~昭和期の独特なレイアウトにも対応しているのが特徴だ。古い資料でも本文検索ができるようになる。 NDLが蔵書のデジタル化に乗り出したのは2000年代に遡る。資料をスキャンし、主に「JPEG 2000」のフォーマットで保存、提供してきた。NDLが手掛けるオンラインサービス「国立国会図書館デジタルコレクション」から利用可能だ。 デジタル化を進める最大の目的は資料の保存にある。時がたつほど紙は劣化していくからだ。 ただし、ND
PDFファイルは、どんな環境のPCでもテキストや画像の表示を崩すことなく見られるデータ形式です。しかし、PDFからテキストデータをコピーしようとすると、うまく選択できなかったり、テキストの内容がおかしくなってしまったりすることがあります。なぜPDFファイルからのテキスト抽出が難しいのかを、PDFファイルのテキスト化およびデータベース作成を行う団体、FilingDBが報告しています。 PDF text extraction | FilingDB https://www.filingdb.com/pdf-text-extraction ◆読み取り保護 PDFファイルの中には内容が保護されているものが存在します。テキスト自体は正しく表示されていても、テキストをコピーしようとすると「Copying text was denied (テキストのコピーが拒否されました)」といった内容が表示され、テキス
目の前に書かれた数字を素因数分解したいあなたに朗報です。 このアプリを実行すると、目の前の数字が素因数分解されるようになります。 ダウンロードはこちらから(ソースコードつき) v1.2 MTM04版 http://tinyurl.com/y9fzox9 v1.1 初回リリース版 http://tinyurl.com/ykmj7cj なお、実行するためには、 Windows XP 以降 (Windows 7 (x86,x64) で動作を確認) Microsoft Office 2003 または 2007 (Office 2007 で確認) Office 2010 の場合には、「方法 1: SharePoint Designer 2007 をインストールすることによって MODI をインストールする」 http://support.microsoft.com/kb/982760 の手順に従って
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く