概要 OCR(Optical Character Reader)とは、紙面を写した画像などを解析して、その中に含まれる文字に相当するパターンを検出し、書かれている内容を文字データとして取り出す装置やソフトウェアのこと。また、そのような方式による自動文字認識。 文字が印刷された紙などをイメージスキャナやカメラなどで撮影し、その中に含まれる線の形状などのパターンを解析して、人間の使う文字や数字、記号に相当するものを発見して文字データの並びとして出力する。 古くから郵便番号の読み取り装置などとして利用されてきたが、近年ではパソコンやスマートフォンなどでも利用できる精度の良い安価なソフトウェアも増え、書類や書籍の電子化、帳簿や伝票などの読み取りシステムなどに応用されている。 書籍のように印刷された紙面の文字は字形が美しく規則正しく並んでいるため認識しやすいが、かすれや汚れで不鮮明な箇所や、人間が手
![OCRとは - IT用語辞典](https://cdn-ak-scissors.b.st-hatena.com/image/square/9846ab2080ca2a3a2477bb46934eaa3835eaf338/height=288;version=1;width=512/https%3A%2F%2Fp.e-words.jp%2Fogimage.png)