タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

Pythonとwebrtcとpythonに関するtar0_tのブックマーク (1)

  • 簡単に原稿を読み上げて録音できるウェブアプリケーションをStreamlitで作った

    Tojiが動作している様子 概要 YouTubeなどの動画サイトを開くと、最近流行りのVTuberゲーム実況などで、音声合成や声質変換を活用している様子を見かけることが多くなりました。私はゆっくり実況を見すぎて逆にあれが自然に思えてくるくらいの人間なのですが、自然な音声合成や声質変換の技術発展には目を見張るものがあります。 私も興味があってそうした音声情報処理の世界に片足を突っ込み始めているのですが、ディープニューラルネットを利用した各種タスクでは、ドメインが変わったとしてもデータ量が物を言う世界には違いがないようです。音声に関する代表的なデータセットとしては、Common Voice、声優統計コーパス、JUSTコーパス、JVSコーパスなどがあります。こうしたコーパスや音源を利用することで気軽に各種タスクに適用することができますが、既存製品と肩を並べたり実用に耐えうるものを作ったり、また

    簡単に原稿を読み上げて録音できるウェブアプリケーションをStreamlitで作った
  • 1