はじめに みなさんこちらの記事は読んでいただけたでしょうか? .NET Frameworkで音声認識をしてzoomのビデオ画面に字幕を出す Zoomの自分の動画スペースに字幕を表示する方法なんですが、 先日とあるオンラインMeetUpイベントで使用してみたところ、 Webカメラに字幕を重ねて表示して配信することができました!!!実用的! 何言ってるかわからない問題 前回の記事にも載せましたが、.NET Frameworkの音声認識は 精度が良いとは言えたものではなく、とてもガバガバな認識結果を返してきます。 すると「え、それは何を表示してるの?」と、しゃべっている内容と表示文字列が リンクしていると認識されない現象が発生します。致命的! ほかの方法を試す というわけで、違う方法を試してみることにします。今回、配信界隈を調査する中で 「ゆかりねっと」という音声合成ソフトがあることを知りました