スキャンしてデータ化された書類からテキストを抽出できれば、再利用が容易になることで資料作成などの作業が捗る。これから新たに書類をスキャンするのであればスキャナ側の設定でOCRをオンにしておけばよいし、すでにスキャンした後であればOCR機能を持つソフトを用いてあらためて処理する方法もあるが、いずれの方法も使えない場合、オンラインサービスを使うのが手軽だ。 OCR機能を持つオンラインサービスといえば、かつては日本語に対応しないケースがほとんどだったが、最近では日本語固有の縦書きも認識できるなど、高い実用性を備えたサービスが増えつつある。今回は、スキャン書類から日本語テキストを取り出すにあたって実用レベルの認識精度を備えた3つのオンラインサービスを、横書きおよび縦書きでの和英混じり文の認識結果とともに紹介しよう。 なお今回はPDF(単一ページ)のアップロードとTXTのダウンロードに対応し、縦書き