並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 1604件

新着順 人気順

OCRの検索結果81 - 120 件 / 1604件

  • 手書きの数式を自動認識してLaTeXやMathMLにする「Web Equation」

    指定された領域にマウスで式を書けば、大体1秒ぐらいで自動的に認識して解析、LaTeXやMathMLに変換して出力してくれる無料サービスがこの「Web Equation」です。 Web Equation https://webdemo.myscript.com/#/demo/equation これが初期画面、ここに数式をマウスで書けば自動的に認識してくれます 右上の国旗から日本を選ぶとこうなります。「ここにお書き」と言われたので書いてみます。 このような複雑な式も変換OK 「MathML」のタブをクリックすればこのような感じで出力されます 多少汚くても認識してくれる模様 矢印も認識できました、なかなか便利で優秀です

      手書きの数式を自動認識してLaTeXやMathMLにする「Web Equation」
    • 株式関係 - goo ダウンロード

      【2018年3月13日追記】 gooゲームにつきまして、2018年4月5日にリニューアルオープンすることが決定いたしました。 リニューアルの詳細はこちら ----------------------------------- 日頃よりgooサービスをご利用いただき誠にありがとうございます。 このたび、誠に勝手ながら、2018年3月15日(※)をもちまして以下のサービスの提供を終了いたします。 ・gooゲーム ・goo占い ・gooダウンロード ※gooゲームにて提供している無料フラッシュゲームの一部につきましては、2018年1月15日に提供を終了いたします。 ご利用のお客さまにはご迷惑をおかけし、誠に申し訳ございません。何卒ご理解賜りますようお願い申し上げます。 詳細につきましては、各サービスのお知らせをご確認ください。 「goo占い」の終了について 詳細はこちら 「gooダウンロード」の

        株式関係 - goo ダウンロード
      • 【Python】Kindleの洋書1冊を1分で日本語PDFに変換するコードを書いた話 - Qiita

        動機 外資系のAmazonが展開している電子書籍Kindleでは比較的洋書の取り扱いが多いです。 Kindle Unlimitedに登録されている書籍も多く、Springerなんかも含まれているので活用しない手はありません。 そこでkindle-translatorをつくりました。 https://github.com/1plus1is3/kindle-translator これで一冊50万字あるKindleの洋書を1分で日本語PDFに変換できます。 キーボードの矢印キーでページ送りができるならKindleに限らずあらゆる電子書籍リーダおよびPDFビューワで使え、DeepLが対応している言語であれば英語以外の言語でも翻訳できます(仏→日とか)。 未経験からPythonエンジニアになって3ヶ月(うち1ヶ月は研修)が経ち、色々作れるようになった時点でつくったツールなので、改良すべき点もまだまだ

          【Python】Kindleの洋書1冊を1分で日本語PDFに変換するコードを書いた話 - Qiita
        • 香港曾道免费资料 大全:香港曾道免费资料 大全

          • Pythonを用いたPDFデータからの情報抽出 / Extraction data from PDF using Python

            ■イベント 
:第54回情報科学若手の会 https://wakate.connpass.com/event/222829/ ■登壇概要 タイトル:Pythonを用いたPDFデータからの情報抽出 / Extraction data from PDF using Python 発表者: 
技術本部 DSOC R&D研究員  青見 樹 ▼Twitter https://twitter.com/SansanRandD

              Pythonを用いたPDFデータからの情報抽出 / Extraction data from PDF using Python
            • 要チェックなEvernoteアドオン5選 | ライフハッカー・ジャパン

              デスク配線がスッキリ。Ankerの全部入り12 in 1モニタースタンドが突然8,250円OFFされてた #Amazonセール

                要チェックなEvernoteアドオン5選 | ライフハッカー・ジャパン
              • Engadget | Technology News & Reviews

                Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals

                  Engadget | Technology News & Reviews
                • 数独を解く(画像解析) - cuspy diary

                  画像として与えられた数独を解きます。 新聞に掲載されていたこの問題をOpenCVを使って画像解析する。(画像が斜めなのはワザとです) グレースケール変換画像解析の前処理として、まずグレースケールに変換し、ガウシアンフィルタをかけてぼかします。ガウシアンフィルタをかける事で、安定した二値化画像が得られます。 二値化次に二値化を行います。 二値化には、普通の方法、大津さんの手法、適応的二値化、などさまざまな手法が在ります。いろいろ試した所、適応的二値化(Adaptive Threshold)が最も数独の認識に適していることが解りました。 適応的二値化(Adaptive Threshold)であれば、影になってしまった部分も上手く処理できます。 膨張処理次に、数独の盤面の外枠を認識を行います。 二値化の影響で枠線が途切れてしまう可能性がありますので、膨張処理(dilate)を行います。 (膨張処

                  • スマホで領収書を撮るだけ! 確定申告形式がラクになるサービス(とその裏側) | ライフハッカー・ジャパン

                    これ1つで全て解決!HDディスプレイ搭載のマルチUSBハブで働き方に変革が起きた【今日のライフハックツール】

                      スマホで領収書を撮るだけ! 確定申告形式がラクになるサービス(とその裏側) | ライフハッカー・ジャパン
                    • スキャン代行業者の実力を比較する(前編)

                      電子書籍の普及に伴って台頭してきた「スキャン代行サービス」。この代行サービスを取り扱う短期連載の第2回は、実際に各業者に発注し、サービスの内容を具体的に検証する。 前回の記事「スキャン代行サービスの現状と内容比較」では、スキャン代行サービスの現状についてお届けした。各社のサービスの概要はサイトの説明ページを読めばおおむね理解できるものの、実際の納品物のクオリティ、および各業者の対応の詳細は、やはり実際に発注してみないと分からないところが多い。 このため今回は、同一の組み合わせパターンとなる書籍を用意し、各業者にほぼ同じ内容で発注を行い、サービス内容の検証を行った。あくまで一例ではあるが、参考にしてほしい。本企画では全部で7社の業者に依頼を行ったが、今回はまず4社、次回で残る3社について、検証結果をお届けしたい。 なお、前回も触れたとおり、スキャン代行サービスは著作権法30条1項にある「その

                        スキャン代行業者の実力を比較する(前編)
                      • ブラウザだけでPDFからテキストを抽出してくれる『PDFTextOnline』 | 100SHIKI

                        ちょっと知っておくと便利かもしれないツールのご紹介。 PDFTextOnlineはブラウザ上でPDFファイルからテキストを抽出してくれるツールだ。 Acrobat Readerが手元にないときや、PDFは重いからテキストにしたいなぁ、というときに便利かもしれない(使いどころが難しいが)。 英語版のサービスではあるが、日本語のテキストもちゃんと抽出してくれる。またブックマークが文書中に含まれていたら、その情報まで抜き出してくれる。 なんにせよ、ブラウザだけで、という手軽さが良い。ブラウザさえあればあとはなんとかなる、という時代に近づいているようですな。

                          ブラウザだけでPDFからテキストを抽出してくれる『PDFTextOnline』 | 100SHIKI
                        • スキャン代行サービスの現状と内容比較

                          電子書籍の普及に伴って台頭してきた「スキャン代行サービス」。この代行サービスを取り扱う短期連載の第1回は、サービスの現状をまとめつつ、各社サービスの内容を比較する。 スキャン代行サービスがなぜ今話題なのか? 今年2010年にネット上で話題になった新しいビジネスの一つに「スキャン代行サービス」がある。手持ちの書籍をダンボールに詰めて宅配便で代行業者に送付すると、のり付けされた部分を裁断し、スキャナでPDFまたはJPEGなどのデジタルデータに変換、電子書籍端末で読める形にして届けてくれるというサービスだ。 これまでもオフィス文書を対象にした電子化サービスは存在していたが、2010年に台頭してきたこれらスキャン代行サービスの特徴は、ターゲットが主に個人ユーザーであり、また対象となるのが「書籍」である点が、従来とは大きく異なっている。裁断機とスキャナを用いた書籍の電子化作業は一般に「自炊」と呼ばれ

                            スキャン代行サービスの現状と内容比較
                          • ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています

                            おっと。また大袈裟なタイトルつけちゃって。 釣り << なんて言われないように、気合い入れて書かなくっちゃ。 さて、先週のエントリー「裁断機 PK-513L で本を 100冊裁断してみた - 経験した 9つの失敗とその回避方法」が大きな反響をいただいたので、今回は裁断の次のステップである「スキャン」を攻略。ScanSnap S1500 の設定についていろいろと調べてみました。 *目次というか、いきなり結論から 書いていったら結構長くなってしまったので、とりあえず目次。というかほとんど結論なんですが、結論だけ見られればいいやという方のためにも。 **(2010年7月9日 追記) 自炊した電子書籍(PDF)を iPad でサクサク表示する方法(サンプル動画あり) << **(2010年8月13日 追記) OCR テキスト認識に限らず、ScanSnap S1500 の設定全般についてもまとめてみ

                              ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています
                            • 4 Google Keep Tips And Tricks For Better Notes, Lists And To-Dos

                              When you want take notes or write a list, it should be easy and quick. Google Keep, the Internet giant's note-taking service, is renowned for those two qualities. It's one of the best apps for notes and to-do lists. But it can be better. Apart from the Android app, it works great in the Chrome browser and as a web app, but that's about it—there is no iOS app or desktop version at the moment. Regar

                                4 Google Keep Tips And Tricks For Better Notes, Lists And To-Dos
                              • 何故私は狂った猿のように1000万円分の書籍を切り刻んだのか - やねうらお−ノーゲーム・ノーライフ

                                id:yaneurao:20091001でFUJITSU ScanSnap S1500 FI-S1500を買って書籍を裁断してスキャンした話を書いた。 「もうどうせ残りの本は売ってもたいしたお金にもならないし」と書いたが、取り込んだ書籍の数は3,000冊強。総スキャンページ数、262,845枚。消耗品のパッド交換4回。ローラー交換2回。1冊の平均価格は3,000円程度。全体でおおよそ1,000万円。今回は、気がついたらこれだけの本を切り刻んでいた。id:yaneurao:20060131の本棚に換算すると14個分である。 たぶんアマゾンで売れば、その1/3ぐらいのお金にはなっていただろうから、ちょっともったいない気もする。私も当初はそこまで本を徹底的に切り刻む気はなかったのであまり気にもかけてなかった。 そこで、どうしてこんなことになったのか、つらつら考えてみた。 ■ 切り刻まずに取り込ん

                                  何故私は狂った猿のように1000万円分の書籍を切り刻んだのか - やねうらお−ノーゲーム・ノーライフ
                                • Engadget | Technology News & Reviews

                                  Parrots in captivity seem to enjoy video-chatting with their friends on Messenger

                                    Engadget | Technology News & Reviews
                                  • キンコーズで電子書籍用に1冊108円で断裁してもらったお話と個人的な自炊のお話。 - ゆず日記

                                    ふと 一昨日 「メタプログラミングRuby」が届いたので、そういえばと会社の帰りにキンコーズに寄って断裁してきた。 入店 初めてのキンコーズ利用なのと、本当に断裁だけできるかよく分かってなかったので何て言おうかなーと思いながら入店したんだけど、店員さんが愛想良く「いらっしゃいませ〜」と声掛けてくれたので『断裁100円位で出来るって聞いてきたんですけど〜…』「でしたら2階のフロアで受け付けておりますので2階へどうぞー」とスムーズに入店。 2階に上がって別のスタッフに要件話したらすぐ断裁 + お会計してもらった。 カット 1冊108円 (税込み) でプロの仕上がり。 #追記 (2014/05/15 11:32): 厚い場合には料金加算されるケースもあるので、実際の料金については 穴あけ加工・ホチキス留め加工 | サービス・料金(価格) | オンデマンド印刷のキンコーズ・ジャパン の通り受付で確

                                      キンコーズで電子書籍用に1冊108円で断裁してもらったお話と個人的な自炊のお話。 - ゆず日記
                                    • 秋元@サイボウズラボ・プログラマー・ブログ: reCAPTCHA - キャプチャを利用した人力高性能OCR

                                      reCAPTCHA という新サービスはすごい。その構想力には感動させられた。 念のためにCAPTCHA(キャプチャ)について説明しておくと、スパムプログラム(bot)と人間のユーザを見分けるための簡単な(しかし機械にとっ […] reCAPTCHA という新サービスはすごい。その構想力には感動させられた。 念のためにCAPTCHA(キャプチャ)について説明しておくと、スパムプログラム(bot)と人間のユーザを見分けるための簡単な(しかし機械にとっては難しい)クイズのことだ。ある程度ウェブを使っている人なら、ネットサービスの登録時やコメントの書き込み時などに、読みにくく加工されたアルファベットを読まされたりした経験があるだろうと思う。 それらのサイトでは、あなたが人間にしかできないクイズを解いたのを見て、ユーザ登録やコメントの投稿を受け付けたりする仕組みになっているわけだ。文字を読む以外のC

                                      • 「まさかスキャナーで…」年金機構甘いチェック : 社会 : 読売新聞(YOMIURI ONLINE)

                                        日本年金機構が委託した業者のデータ入力で約95万2000人分にミスがあった問題は、機構側のずさんな業務管理が一因だった。 うち入力漏れの約8万4000人分で過少支給が判明。さらに約31万8000人分の一部で支給額に誤りがある見通しで、機構は26日にも詳細を公表する。度重なる不祥事に、識者は「体制を抜本的に見直す必要がある」と指摘している。 ◆「まさか」 「まさかスキャナーで読み取っているとは……」。ある厚生労働省幹部は、主なミスの原因が業者の契約に反した入力方法にあり、それを見逃してきた機構のチェックの甘さにあきれた。 機構が所得控除などに関するデータ入力を委託した情報処理会社「SAY企画」(東京都豊島区)は、2人1組で手入力するという本来の入力方法ではなく、スキャナーを使って紙のデータを読み取っていた。機械が誤認識した漢字などが残り、配偶者の所得区分を示す丸印も誤って認識され、過少支給な

                                          「まさかスキャナーで…」年金機構甘いチェック : 社会 : 読売新聞(YOMIURI ONLINE)
                                        • GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita

                                          作ったもの 紙の書類などスキャンして管理してると ↓こんな感じでファイル名がカオスになりがち… そこで、今回のツールを一発たたくとこうなります。 何となく中身が推測できるようになりました。 このツールは何? 請求書・名刺・Webページなどのpdf・画像ファイルの中身を読み取り、重要(っぽい)ワードで自動リネームするツールです。 内部では以下を行ってます。 ファイルをGoogle Driveにアップロード (G Suiteが理想) OCRされたテキストを抽出 重要部分をNTTコミュニケーションズの固有表現抽出APIで抽出 (企業名とかの専門用語辞書使うと精度上がるっぽいけど無料版だと使えない…) 日付、会社名、人名を結合したファイル名を作りリネーム 動作確認環境 Mac 10.14.3 Python 3.7.2 動かし方手順 1.ファイルをGoogle Drive APIでアップロードできる

                                            GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita
                                          • LINEに画像を送ると、AIが3秒で文字起こし 「企業や役所の働き方変える」 長崎のベンチャーが開発

                                            紙の書類をスマートフォンのカメラで撮影し、「LINE」で画像を送ると、約3秒でテキスト化して返信する――。こんなAIアプリを、長崎県西海市のベンチャー企業「西海クリエイティブカンパニー」が7月3日からLINE上で公開している。ユーザーがOCR(光学文字認識)ソフトなどを用意しなくても、書類や帳票を簡単にデータ化できる点が特徴だ。 記者が試しに名刺を撮影して公式アカウントに送ったところ、すぐに氏名や企業名、所属部署、オフィスの住所、電話番号、メールアドレスなどを正確にテキスト化して返信してくれた。 このアプリの名前は「文字起こし ばりぐっどくん」。LINE上で友だち申請すると、誰でも利用できる。同社の本業はデザインやWebメディアの運営だが、西海市内の企業・役所から紙文書のスキャンやデータ入力作業を減らし、地域全体の業務効率を高める狙いで開発したという。 だが、リリースすると他の地域からも利

                                              LINEに画像を送ると、AIが3秒で文字起こし 「企業や役所の働き方変える」 長崎のベンチャーが開発
                                            • Evernoteで自分の脳を拡張する(プライベートベータご招待)

                                              Holy procrastination, startup founders! Tomorrow’s your last chance to apply to the Startup Battlefield 200 at TechCrunch Disrupt 2024. Your last chance for a shot to stand on the Disrupt…

                                                Evernoteで自分の脳を拡張する(プライベートベータご招待)
                                              • IT戦士が片付いた!? ドキュメントスキャナー「imageFORMULA DR-150」でモテモテに

                                                モテたい。 毎日こうつぶやき、周囲の男性全員に色目を使っている、31歳おひとりさまの自称・IT戦士(♀)の記者。こんなにウェルカムなのに、こんなに待っているのに、なぜ誰も声をかけてくれないのか。 「ここに置いていいですか?」。記者の机にFAXを届けてくれた後輩男子が、おそるおそる声をかけてきた。かわいい男子は好物だ。さあ、こっちにおいで。取って食ったりはしないから。たぶん。 だが彼は、FAXの置き場に困って目を泳がせ、書類の山の上に投げるように置くと、そそくさと去っていった。ああ待ってくれかわいい男子。行かないで! ……だが確かに記者の机は、1枚のFAXの置き場にも困るほどの汚さだ。紙の資料も新聞も取材メモも放置。机上には正体不明の地層が堆積し、何の資料がどこにあるかすら分からない。男子が寄りつくはずもなく、仕事の効率も極めて悪い。このままでは嫁にも行けず、主夫もめとれそうにない。 「ドキ

                                                  IT戦士が片付いた!? ドキュメントスキャナー「imageFORMULA DR-150」でモテモテに
                                                • MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介

                                                  OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。 デモサービスで試せます 今回紹介するオープンソース・ソフトウェアはNHocr、日本語OCRシステムだ。Google Code上にホスティングされ、まだソースコードは一部しか開示されていないが、デモサービスは公開されている。 デモサービスでは、BMP/JPEG/PBM/PGM/PPMのファイル(さらに各ファイルをGZip圧縮していても可能)をアップロードすると、それを解析した結果を日本語表示してくれる。日本語OCRとあって、漢字/ひらがな/片仮名/英語などが判別可能になっている。 読み取らせた画像 手書き文字であっても認識率はそこそこ高い。正式リリースがまだという段階にあ

                                                    MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介
                                                  • PCの操作をすべて録画&文字起こしして過去の操作を丸ごと検索可能にするアプリ「Windrecorder」

                                                    PCを使っていると、過去の操作内容やブラウザで閲覧していた情報を思い出したくなるタイミングが頻繁に発生します。そんな時に役立ちそうなPC操作記録アプリ「Windrecorder」がオープンソースで開発されています。 GitHub - yuka-friends/Windrecorder: Windrecorder is a memory search app by records everything on your screen in small size, to let you rewind what you have seen, query through OCR text or image description, and get activity statistics. https://github.com/yuka-friends/Windrecorder I made an o

                                                      PCの操作をすべて録画&文字起こしして過去の操作を丸ごと検索可能にするアプリ「Windrecorder」
                                                    • 岸本元 on X: "国会図書館デジタルコレクションで「ドラゴンクエスト」と検索すると、大正11年に刊行された『本居宣長稿本全集 』がヒットする。いくらなんでも大正時代の本居宣長の本にドラクエの話は書かれてないだろと驚いたが、何者かが原本に落書きしたのを読み取ったようだったhttps://t.co/t2DHCNuxgK https://t.co/3oMcKg6yvs"

                                                        岸本元 on X: "国会図書館デジタルコレクションで「ドラゴンクエスト」と検索すると、大正11年に刊行された『本居宣長稿本全集 』がヒットする。いくらなんでも大正時代の本居宣長の本にドラクエの話は書かれてないだろと驚いたが、何者かが原本に落書きしたのを読み取ったようだったhttps://t.co/t2DHCNuxgK https://t.co/3oMcKg6yvs"
                                                      • iPadに本を電子化して持ち歩く!PDFのファイルサイズを3分の1にまで小さくする方法 | nanapi[ナナピ]

                                                        iPadに本を電子化して持ち歩く!PDFのファイルサイズを3分の1にまで小さくする方法 に関するライフレシピをご紹介します。nanapi [ナナピ]は、みんなで作る暮らしのレシピサイトです。はじめに いよいよ iPad が日本でも発売されましたね! 今回のレシピは、本を電子化(PDF 化)して iPad でたくさん持ち歩きたいという方、必見です!PDF のファイルサイズを小さくする方法を紹介します。 もちろん見た目が悪くなっても構わないのであれば、いくらでも小さくできるのですが、ここでは見た目を落とさないようにこだわってみました。 ファイルサイズはどのくらい小さくなる? ファイルサイズがどのくらい小さくなるのかを下の表にまとめました。 本の中身にもよりますが、テキストがメインの本だと3分の1くらいまで小さくなります。 意外とスゴい、Adobe Acrobat 今回使用するのは、定番スキャナ

                                                        • xdoc2txt

                                                          xdoc2txt.exe [-s|-e|-j][-c][-f][-p][-n][-r=(0|1|2)] <filename...> -h ヘルプの表示 -s 出力のエンコードはShiftJIS(デフォルト) -j 出力のエンコードはJIS -s 出力のエンコードはEUC -c PDFキャッシュ on(デフォルトはoff) -f 変換結果をファイルに出力。デフォルトでは標準出力に出力 -p OLE2複合文書の場合、文書プロパティを表示(Office、一太郎で有効) -n PDF文書のアクセス権限の設定を無視(cryptlib.dllが必要) -r= HTML文書のルビの変換 -r=0 ルビ削除 -r=1 () -r=2 《》青空文庫形式 -o= その他のオプション -o=0 PDFで -- ? -- の形式のページ番号を表示しない -o=1 PDFで改行を削除(

                                                          • 「情シスない中小企業に使ってほしい」 NTT東日本、「AI-OCR」とRPAサービス提供 紙帳票のデータ入力を効率化

                                                            NTT東日本とAI(人工知能)ベンチャーのAI insideは1月23日、ディープラーニングを使って帳票内容を読み取るOCR(光学文字認識)サービス「AIよみと~る」の提供を始めた。データ入力業務などを自動化するRPA(ロボットによる業務自動化)サービス「おまかせRPA」と合わせて提供することで、紙書類のデータ入力などを手作業で行うバックオフィス業務の効率化をサポートする。 紙帳票に記載された内容をスキャナーで読み取り、デジタルデータ化したものをAIよみと~るで検出する。AI insideが開発したAI基盤「Neural X」の学習アルゴリズムを使ったディープラーニング技術と、ゆがみ・傾き補正機能を組み合わせることで、手書き文字も含めたトライアルでは96%以上の認識率を実現したという(NTT東日本調べ)。欄外にはみ出た数字、訂正印、2行にわたって折り返して記載された住所なども、AIが内容を

                                                              「情シスない中小企業に使ってほしい」 NTT東日本、「AI-OCR」とRPAサービス提供 紙帳票のデータ入力を効率化
                                                            • Visual C++の勉強部屋

                                                              理工系、特に電気系、の学生と技術者を対象としたVisual C++の解説を行います。Visual C++を始めたいが、よく分からないという人は、これを参考にしてください。ただし、初めてプログラムを学ぶ全くの初心者向けではありません。 本資料の一部のJava版が(株)翔泳社のウエブサイトCodeZineにありますので、こちらもご利用ください(Java版とある場所をクリックして下さい)。Visual C++ 6.0版(現在は全部削除)が最初に公開され、そのJava版がCodeZineに寄稿され、その後に現在のVisual C++ 2005 Express Edition版が作成されています。 Java版は、すべてアプレットになっていますので、ブラウザから試してみることができます(Javaランタイム必要)。 Visual C++ 2008 Express Editionが無償でダウンロード

                                                              • コンピュータビジョンのソースコード/ライブラリのまとめ - takminの書きっぱなし備忘録 @はてなブログ

                                                                今まで自分が見つけたコンピュータビジョンの研究に役に立ちそうなフリーのライブラリやソースコードをまとめてみました。自分ではまだ使っていないものも多いので、そこはご容赦を。主にC/C++が中心です。 またライブラリ形式でない、いわゆる学会で発表した研究のコードをそのまま公開しているという人がたくさんいて、それに関しては特にメジャーなもののみ紹介しています。なにぶん僕の観測範囲は限られてますので、「このライブラリに触れないのはおかしい」、「説明が間違っている」等、ご意見大歓迎です。 定番(Standard) OpenCV 定番中の定番です。コンピュータビジョンに関して広範なアルゴリズムが実装されています。 http://code.opencv.org/projects/OpenCV/wiki/WikiStart Point Cloud Library 3次元点群データを扱うならこれ。Kinec

                                                                  コンピュータビジョンのソースコード/ライブラリのまとめ - takminの書きっぱなし備忘録 @はてなブログ
                                                                • Pythonで始める ドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python

                                                                  ビジネス文書をデータ化し構造や内容を理解するアプリケーションはドキュメント・インテリジェンスと呼ばれ、画像処理や自然言語処理といった複数の要素技術を組み合わせて開発する必要があります。何が必要でどう実現すれば良いのかといった第一歩を、Pythonでの具体的な構築事例とともに紹介します。 https://2021.pycon.jp/time-table/?id=273795

                                                                    Pythonで始める ドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python
                                                                  • Welcome Back

                                                                    Remember everything important. Continue with Google Continue with Apple or Remember me for 30 days Forgot password? Don't have an account? Create account Terms of Service Privacy Policy Copyright 2024 Evernote Corporation. All rights reserved.

                                                                      Welcome Back
                                                                    • はまちや2 on Twitter: "これは東京証券取引所公式の代表の名前が入った一見まともな書類に見えるけど、GoogleはPDF内にある外から見えない注釈等も検索対象にしているらしくて、キャッシュでみると書類に埋め込まれた「うんこ」という文字が可視化される… https://t.co/HCMBx4yqsX"

                                                                      これは東京証券取引所公式の代表の名前が入った一見まともな書類に見えるけど、GoogleはPDF内にある外から見えない注釈等も検索対象にしているらしくて、キャッシュでみると書類に埋め込まれた「うんこ」という文字が可視化される… https://t.co/HCMBx4yqsX

                                                                        はまちや2 on Twitter: "これは東京証券取引所公式の代表の名前が入った一見まともな書類に見えるけど、GoogleはPDF内にある外から見えない注釈等も検索対象にしているらしくて、キャッシュでみると書類に埋め込まれた「うんこ」という文字が可視化される… https://t.co/HCMBx4yqsX"
                                                                      • iOSと機械学習 - その後のその後

                                                                        ビッグデータとかの機械学習隆盛の背景にある文脈や、その拠り所となるコンピュータの処理性能から考えても「モバイルデバイス向けOSと機械学習を紐付けて考えようとする」ことはそもそもあまり筋がよろしくない・・・とは思うのですが、やはり長くiOSだけにコミットしてきた身としては、新たに興味を持っている機械学習という分野と、勝手知ったるiOSという分野の交差点はないのかなと考えずにはいられないわけでして。。 そんなわけで、「iOS と機械学習」について雑多な切り口から調べてみました。 iOSで使える機械学習ライブラリ DeepBeliefSDK コンボリューショナルニューラルネットワークを用いた画像認識ライブラリ。iOSとかのモバイルデバイスで処理できるよう、高度に最適化してある、OpenCVと一緒に使うのも簡単、とのこと。 https://github.com/jetpacapp/DeepBeli

                                                                          iOSと機械学習 - その後のその後
                                                                        • OCR処理プログラム及び学習用データセットの公開について | NDLラボ

                                                                          2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。 このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。 機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。 リポジトリ : https://github.com/ndl-lab/

                                                                          • 脳をバックアップしてくれるツール『EverNote』 | WIRED VISION

                                                                            脳をバックアップしてくれるツール『EverNote』 2008年3月18日 IT コメント: トラックバック (5) Scott Gilbertson ユーザーの人生を構成するすべての知識を網羅したデータベース――それが『EverNote』の目指すものだ。 EverNoteは、ユーザーが1日のうちに収集するあらゆるデジタルデータを、重要なものから取るに足らないものまで何でも、中枢のライブラリーに格納してくれるソフトウェア。必要なときにはいつでも瞬時にライブラリーにアクセスできる。 マルチプラットフォームでウェブサービス版もあるEverNoteは、ユーザーが投入したデータを、写真からウェブクリップや手書きのメモまで何でも取り込んでインデックス化してくれる。つまりこれを使えば、ユーザーの人生がたちまち、注釈の付いた、検索可能なものに変身するというわけだ。 保存した理由を思い出せるように、項目に

                                                                            • 窓の杜 - 【NEWS】独自エンジンを搭載したフリーの日本語OCRソフト「SmartOCR Lite Edition」

                                                                              独自エンジンで画像から文字を認識し、Word/ExcelファイルやRTF/HTML/CSV/PDF形式で保存できる日本語OCRソフト「SmartOCR Lite Edition」v1.0.3が、17日に公開された。Windows XP/2000に対応するフリーソフトで、現在作者のホームページからダウンロードできる。 「SmartOCR Lite Edition」は、独自のエンジンを搭載したOCRソフト。スキャナー画像やBMP/TIFF/JPEG/PNG/GIF/WMF/EMF形式のファイルから読み取った文字情報をテキスト文字列に変換してTXTファイルとして保存できるほか、元画像のレイアウトや表組みを保持したWord/ExcelファイルやRTF/HTML/CSV/PDF形式でも保存できる。また元画像にテキスト情報を埋め込み、画像を選択してテキストコピーしたり文字列検索ができる“透明テキストつ

                                                                              • 紙の資料をデジタル化できる「スマホ用スキャナ」アプリ5選 | ライフハッカー・ジャパン

                                                                                旅行中にもらった領収証や、ホワイトボードの板書の内容、封筒に描いたスケッチなどを保存したい時は、スマートフォンのスキャナアプリを使えば簡単です。本記事でご紹介するオススメのアプリなら、紙資料のスナップショットを撮って、クラウド上に保存できるので、スキャンしたデータを後で別のデバイスからも参照できます(文字認識も可能です)。 それでは、領収証や板書、手書きのメモなどの記録に役立つ選りすぐりのスマートフォン用スキャナアプリを5つご紹介しましょう。 重要な情報が書かれた紙切れをポケットにくしゃくしゃに丸めて入れておくのはイヤだし、黒板をノートに書き写す前に消されてしまったら困りますよね。そこで米Lifehackerは先ごろ、どのスキャナアプリを使用して書類をスマートフォンに保存しているかをテーマにした読者対象のアンケートを実施しました。 その結果、あらゆるモバイルプラットフォームを網羅した膨大な

                                                                                  紙の資料をデジタル化できる「スマホ用スキャナ」アプリ5選 | ライフハッカー・ジャパン
                                                                                • 目指したのは「究極のシンプル」 レシート撮るだけ家計簿アプリ「ReceReco」の狙い

                                                                                  レシート写真を撮るだけで家計簿を作れる無料iPhoneアプリ「ReceReco」が人気だ。1月31日の公開直後にユーザーが急増し、App Storeのファイナンス部門で約40日間にわたって1位をキープ。ダウンロード数は3月末時点で33万件を超えている。 OCR(文字認識技術)によってレシート内のテキストや数字を読み取り、手入力をすることなく支出管理を行えるというアプリ。従来の無料家計簿アプリにはなかった手軽さが話題となり、App Storeのレビュー欄では「こんなに便利なものがあったなんて」「お店でレシートをもらうのが嬉しくなった」など驚きの声も上がっている。 開発したのは、企業向けデータ分析サービスなどを手がけるブレインパッド。「データ分析のプロ集団」を掲げる同社が、今回は新事業として個人向けアプリを開発した。「当初は年内50万ダウンロードが目標だったが、近いうちに上方修正したいと思う。

                                                                                    目指したのは「究極のシンプル」 レシート撮るだけ家計簿アプリ「ReceReco」の狙い