![https://twitter.com/izumisatoshi05/status/1641406680545234944](https://cdn-ak-scissors.b.st-hatena.com/image/square/216cd8212898c174e3d08ad371341c70d9516f38/height=288;version=1;width=512/https%3A%2F%2Fpbs.twimg.com%2Fprofile_images%2F1483799757621702658%2FJPvZFyJb.jpg)
自宅のローカルネットワーク上にて汎用サーバーやビルドマシンとして使っているMac miniに、VOICEVOX Engineの音声合成サーバーを立ててみたので、その時の手順をまとめました。 経緯 最近、ChatGPT周りのAPIを触っていたら、文章の読み上げをしたくなってきました。もともとVOICEVOXが良さそうなことを聞いていたので利用してみることにしました。 まず、VOICEVOXを利用する上で、自分のニーズは以下でした。 細かいクエリ調整は一旦置いておいて、趣味で作る各種アプリとかで簡易的な読み上げを行いたい 最近ずんだもんをYouTubeでよく見る。かわいい。ずんだもんにしゃべらせたい また、いくつか試している中でパフォーマンス的な問題もでました いつもの作業用PCはMacBook ProなのでVOICEVOXをGPU版で起動できず、音声合成にかかる時間が結構厳しい Docker
ゆっくりボイスをしゃべらせるためのPHPプログラム「YukkuriTalk」を作成してみました こんにちは、代表のmatsuiです。 弊社では、サーバの監視で異常を検知すると、 (ゆっくりの声で) ”○○のサーバが沈黙しました。○○のサーバが沈黙しました。各員戦闘配置についてください。” といった、音声が流れます。(内容はプロジェクトによって異なり、上は戦争ゲームなのでこのようなアラートになっています) Linux上からこういった”ゆっくりボイス”による発声を簡単に行えるためのツール「YukkuriTalk」を作成してみましたので、記事にしてみたいと思います。 ゆっくりボイスについて ゆっくりボイスといえば、テキスト文章読み上げソフトSofTalkが有名ですが、その音声ライブラリには株式会社アクエストの「AquesTalk」が使用されています。YukkuriTalkも発声処理にこのライブラ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く