Google Cloud の AI を利用した音声サービスが急ピッチで進化を遂げています。今年 3 月には、DeepMind の音声生成モデル WaveNet を採用した音声合成 API の Cloud Text-to-Speech をリリースしました。さらにこのほど、Cloud Speech-to-Text(旧称 : Cloud Speech API)について、2 年前の発表以来最大規模となる改良を行いました。 Cloud Speech API は 2016 年に初めて発表され、1 年近く前から正式提供(GA)されており、半年で 2 倍以上というペースで利用が伸びています。今年 4 月の NAB と SpeechTek の両カンファレンスの開幕に合わせて、私たちは Cloud Speech-to-Text の新機能とアップデートをリリースしました。これにより、通話や動画のテキスト起こしな
![新しい Cloud Speech-to-Text で通話や動画音声のテキスト変換精度が向上 | Google Cloud 公式ブログ](https://cdn-ak-scissors.b.st-hatena.com/image/square/3b6cc866966645c1860c08e3be68fbb1d48af21f/height=288;version=1;width=512/https%3A%2F%2Fstorage.googleapis.com%2Fgweb-cloudblog-publish%2Fimages%2Fgooglecloud_2022_RYqbQfm.max-2500x2500.jpg)