「Google Docs」のOCR(光学文字認識)機能が2月28日から強化され、日本語を含む34言語を処理できるようになった。 この機能を使って画像やPDFをアップロードすると、テキスト部分が抽出され、Googleドキュメントに変換される。 機能がローンチされた当初使ってみたところ、日本語がかなり文字化けして「まだまだか」といったところだったが、現状ではどうだろう。 まずは、PDFをアップロードしてみる。アップロードする際に、「PDF や画像ファイルからテキストを Google ドキュメントのドキュメントに変換する」のチェックボックスにチェックを付けて、「アップロードを開始」をクリックする。
