「PDFやJPEGなど画像ファイル内の文字を文字情報として認識させ、活用したい」 「ある程度精度の高いOCRをコストをかけずに(できれば無料で)利用したい」 といった声をよく耳にします。 文字情報が含まれていない画像ファイル※内の文字は、画像情報になりますので、そのままでは文字(テキスト)情報として抽出、コピーをしたり、検索をかけるなど再利用・活用することは出来ません。 ※画像ファイルでも文字情報が含まれているものもございます。 画像ファイル内の文字文字情報を含んでいる場合には下のように文字列を選択することができる状態になっています。 文字として認識していますので文字列で検索をかけることも可能です。 これに対して、文字情報が含まれていない場合は、文字列の選択や検索を行うことが出来ません。 OCRについて画像情報としての文字を文字情報として扱えるようにするには、OCR(光学文字認識)という技