音声認識 人の音声(会話)をコンピュータに認識させることで、「話し言葉をテキストデータに変換」あるいは「音声の特徴を捉えて声を出している人を識別」などを行う機能を指します。 音声認識技術は、生活の一部として一般的に普及してきています。 物体認識 画像やビデオ内の物体を識別するためのコンピュータビジョンの手法です。 ディープラーニングや機械学習の重要な成果のひとつが物体認識と言えます。 人間が写真やビデオを見る場合、人物や物体、シーン、細部の情報をすぐに見分けることができます。 AI-OCR Optical Character Reader(またはRecognition)の略で、画像データのテキスト部分を認識し、文字データに変換する光学文字認識機能のことを言います。 具体的にいうと、紙文書をスキャナーで読み込み、書かれている文字を認識してデジタル化する技術です。