2022年3月7日のブックマーク (2件)

  • 自作ウェブアプリを使って自分でJVS/声優統計コーパスの読み上げを録音した話

    概要 以下の記事で「簡単に原稿を読み上げて録音できるウェブアプリケーションをStreamlitで作った」というツールの紹介をしました。 ソフトウェア開発界隈ではEat your Own Dog foodという言葉があるように、作ったからには自分で試してみないとねということで、私も自分の声の音声データを作成してみました。この記事では、自作の原稿読み上げウェブアプリケーションを自分で利用しながら感じた使用感や、音声データ収集の難しさについて雑多に書いてみようと思います。 読み上げ対象 今回はJVSコーパスにおけるvoiceactress100を読み上げました。これは声優統計コーパスが作成した音素バランス文100文に対して、句読点情報が付与されたものです(参考)。また、読み上げ時にはルビ情報が付加された以下のサイトに掲載されているテキストを利用しました。 読み仮名(ルビ)つき声優統計コーパス音素

    自作ウェブアプリを使って自分でJVS/声優統計コーパスの読み上げを録音した話
    yag_ays
    yag_ays 2022/03/07
  • 簡単に原稿を読み上げて録音できるウェブアプリケーションをStreamlitで作った

    Tojiが動作している様子 概要 YouTubeなどの動画サイトを開くと、最近流行りのVTuberゲーム実況などで、音声合成や声質変換を活用している様子を見かけることが多くなりました。私はゆっくり実況を見すぎて逆にあれが自然に思えてくるくらいの人間なのですが、自然な音声合成や声質変換の技術発展には目を見張るものがあります。 私も興味があってそうした音声情報処理の世界に片足を突っ込み始めているのですが、ディープニューラルネットを利用した各種タスクでは、ドメインが変わったとしてもデータ量が物を言う世界には違いがないようです。音声に関する代表的なデータセットとしては、Common Voice、声優統計コーパス、JUSTコーパス、JVSコーパスなどがあります。こうしたコーパスや音源を利用することで気軽に各種タスクに適用することができますが、既存製品と肩を並べたり実用に耐えうるものを作ったり、また

    簡単に原稿を読み上げて録音できるウェブアプリケーションをStreamlitで作った
    yag_ays
    yag_ays 2022/03/07