はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識別する必要があったり、縦書きなど日本語ドキュメント特有のレイアウトに対処する必要があったりと日本語特有の難しさがあります。 ですが、今後、海外の開発者がこれらの課題に対処するため、日本のドキュメント画像解析に特化したものをリリースする可能性は低く、やはり自国の言語向けのサービスは自国のエンジニアが開発すべきだと筆者は考えています。 もちろん、Azure Document Intelligenceをはじめとした、クラウドサービスのドキュメント解析サービスはありますが、クラウドを利用できないユ
OCRで書類を読ませるために、わざわざ一度プリントしてから、ドキュメントスキャナに...なんていう経験はないでしょうか? ブログ「Blog.IKUBON.com」で紹介されていた「n1ne@freeOCR」を使えば、そんな必要はありません。スキャナが無くても、OCRが無料で使えちゃいます。 使い方も簡単。テキスト化したいファイルを添付して、メールで送るだけなのです。 対応している拡張子は、 .bmp .dib .rle .dcx .djvu .djv. gif. jb2 .jbig2 .jp2 .j2k .jpg .jpeg .pcx .pdf .png .tif .tiff .xps と、よく見るものからそうでないモノまで、かなり豊富。 これらのファイルであれば、ocr@n1ne.netに添付して送ると、画像をテキスト化して、doc,docx,pdfのファイル形式で送り返してくれるそうで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く