タグ

googleとOCRに関するigrepのブックマーク (2)

  • GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita

    作ったもの 紙の書類などスキャンして管理してると ↓こんな感じでファイル名がカオスになりがち… そこで、今回のツールを一発たたくとこうなります。 何となく中身が推測できるようになりました。 このツールは何? 請求書・名刺・Webページなどのpdf・画像ファイルの中身を読み取り、重要(っぽい)ワードで自動リネームするツールです。 内部では以下を行ってます。 ファイルをGoogle Driveにアップロード (G Suiteが理想) OCRされたテキストを抽出 重要部分をNTTコミュニケーションズの固有表現抽出APIで抽出 (企業名とかの専門用語辞書使うと精度上がるっぽいけど無料版だと使えない…) 日付、会社名、人名を結合したファイル名を作りリネーム 動作確認環境 Mac 10.14.3 Python 3.7.2 動かし方手順 1.ファイルをGoogle Drive APIでアップロードできる

    GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita
  • スパム防止の「CAPTCHA」に秘められたすごい事実 : まだ仮想通貨持ってないの?

    話題作「なめらかな社会とその敵」に掲載されていて驚いたエピソード。 スパム防止「CAPTHA」のすごい話 「CAPTHA」ってありますよね。人間じゃないと読めない文字を入力させることで、スパムを防止させるアレです。みなさんも何度も入力したことがあるはず。 かずあるCAPTHAサービスの中のひとつ、Googleが無償で提供している「reCAPTHA」には、驚くような裏話が隠されています。 なんでも、これ、紙ののデジタル化プロジェクトの一環だそうです。 古いなどをスキャンしてデジタル化するプロジェクトにおいては、一般的に「OCR」が使われます。が、OCRは機械で読みとるので、やっぱりミスが出てきてしまいます。 そんなときにreCAPTHAが役立ちます。reCAPTHAは、ミスされがちな文字を抜き出し、ユーザーに判別させる技術です。 OCRでエラーが出てしまう文字を抜き出し、 こうしてCAP

    スパム防止の「CAPTCHA」に秘められたすごい事実 : まだ仮想通貨持ってないの?
    igrep
    igrep 2013/02/18
    知らなかった。Nice idea!
  • 1