タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

ocrとtoolに関するkiyo_hikoのブックマーク (2)

  • 「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正

    原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と「口」(くち)になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎがあった。画像PDFをテキスト化する際、文字認識(OCR)ソフトが間違った文字を認識してしまったことが原因という。 誤字があったのは、今年1月に開かれた「第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキンググループ」の会議資料一覧ページ。「福島第一原子力発電所におけるストロンチウム分析の状況について[東京電力]」という資料の「ト」と「ロ」がそれぞれ漢字になっており、「検索避けのためにあえて漢字にしたのでは」などと一部ネットユーザーの間で騒ぎになっていた。 同庁によると、Webサイトに掲載するテキストは通常、手打ちで確認しているが、この会議は資料が届いたタイミングがギリギ

    「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正
    kiyo_hiko
    kiyo_hiko 2014/06/10
    以前いたセキュリティがちがち業種で新しいツールの導入が認められず化石な仕事してたとかあるし、原子力とかガチそうだしなんとも。テキストから力二や卜口検出するスクリプトならVBS/VBAで割とすぐ作れそうだけど
  • PDFにフリーで追記: PDF-Viewer OCR機能

    PDF-Viewer OCR機能 PDF-XChange ViewerはフリーのPDFビューワーである。 Ver2.5(Build200)で、フリーでOCR機能が使えるようになった。 ドキュメント/OCR Pages...以下 試にマニュアルから画像だけのテキストの無いPDFを作成し、 そのPDFにOCR機能を利用してテキスト抽出し、できたPDF のテキストを選択コピーし、テキストエディタに貼り付け、調べた。 一部の文字が誤変換等(*注)が確認されたが おおむね変換ができていた。フリー版で使えるのはGood!! (*注)試行結果(誤変換例) (オリジナル)This was the very first build incorporating **NEW** features (OCR)This was the very ?rst build incorporating **NEW** fe

    kiyo_hiko
    kiyo_hiko 2012/01/15
    「フリーでOCR機能が使えるようになった」…バージョナップしようと思ったらもう2.5だた / XChangeViwerのお蔭でタブレットOSはWindows以外考えられないけど、Androidは似たようなソフトってあるのかな
  • 1