声が出せない環境でも通話に参加できる、リアルタイムな音声読み上げアプリをつくりました。 タイピングした文字を読み上げてくれるというだけの超シンプルなものなので記事にするかどうかも迷ったのですが、技術的には個人的に少し面白かったのでかんたんに書いてみます。 デモ 背景 Discordで作業通話をよくするのですが、私があまり声が出せない環境なことが多いため、もともとGoogle翻訳の読み上げ機能を使って発声(?)したりしていました。 ですがそういった既存の読み上げ機能では、文章を打ってから毎回再生ボタンを押さなければいけないので、通常の会話スピードに追いつこうとしてもどうしてもラグが発生します。 またその性質上、短い相槌には不向きだったり、少し長い文章を発話しようとするとタイピング中しばらく沈黙が生まれることがあるなどの問題もありました。 そこで、まるで普通に話しているかのような感じで、変換終
![リアルタイム音声読み上げアプリを作ってみたら一瞬でできた](https://cdn-ak-scissors.b.st-hatena.com/image/square/ee099e34e4af606247e0fef56f64e1b193a7a523/height=288;version=1;width=512/https%3A%2F%2Fres.cloudinary.com%2Fzenn%2Fimage%2Fupload%2Fs--xI__7h92--%2Fc_fit%252Cg_north_west%252Cl_text%3Anotosansjp-medium.otf_55%3A%2525E3%252583%2525AA%2525E3%252582%2525A2%2525E3%252583%2525AB%2525E3%252582%2525BF%2525E3%252582%2525A4%2525E3%252583%2525A0%2525E9%25259F%2525B3%2525E5%2525A3%2525B0%2525E8%2525AA%2525AD%2525E3%252581%2525BF%2525E4%2525B8%25258A%2525E3%252581%252592%2525E3%252582%2525A2%2525E3%252583%252597%2525E3%252583%2525AA%2525E3%252582%252592%2525E4%2525BD%25259C%2525E3%252581%2525A3%2525E3%252581%2525A6%2525E3%252581%2525BF%2525E3%252581%25259F%2525E3%252582%252589%2525E4%2525B8%252580%2525E7%25259E%2525AC%2525E3%252581%2525A7%2525E3%252581%2525A7%2525E3%252581%25258D%2525E3%252581%25259F%252Cw_1010%252Cx_90%252Cy_100%2Fg_south_west%252Cl_text%3Anotosansjp-medium.otf_37%3A%2525E3%252581%252593%2525E3%252582%25258B%2525E3%252582%25258A%2525E3%252582%25258A%252Cx_203%252Cy_121%2Fg_south_west%252Ch_90%252Cl_fetch%3AaHR0cHM6Ly9zdG9yYWdlLmdvb2dsZWFwaXMuY29tL3plbm4tdXNlci11cGxvYWQvYXZhdGFyLzJmZWMwNWNjMGEuanBlZw%3D%3D%252Cr_max%252Cw_90%252Cx_87%252Cy_95%2Fv1627283836%2Fdefault%2Fog-base-w1200-v2.png)