「世界インターネット会議・烏鎮サミット」で展示されていた口唇形状認識システムを試す来場者(2017年12月4日撮影、資料写真)。(c)CNS/杜洋 【12月25日 CNS】中国のIT大手「捜狗(Sogou)」が業界初となる口唇形状認識の開発に成功した。音声認識に頼らず、話す人の唇の動きを画像認識することによって会話の内容を解読する。 口唇形状認識は画像認識と自然言語処理が一体となった技術。ディープラーニング(深層学習)を応用し、中国語の口の動きを数千時間かけて学習させた。認識の正確率は60%以上で、米グーグル(Google)による英語の口唇形状認識システムの正確率50%を上回った。12月上旬に中国・浙江省(Zhejiang)で行われた「世界インターネット会議(World Internet Conference)烏鎮サミット」で捜狗の口唇形状認識が初めて公開され、注目を集めた。 今後は、音声