サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
パリ五輪
blog-yama.a-quest.com
現在、新しい音声合成エンジンの研究フェーズに入ってます。そのため、ライブラリの更新がしばらくできずにいます。 今回は、AquesTalkで生成した音声データの音量を調整する方法を示します。 AquesTalkライブラリに、音量を調整する機能が欲しいというリクエストもあるのですが、ライブラリは可能な限りシンプルにというスタンスなので・・・ その代わり、WAVデータの全体の音量を調整する関数を下記に紹介します。簡単でしょ! WavVolume.cpp /*----------------------------------------------- WavVolume - WAV データの全体の音量を調整する 2009/03/05 N.Yamazaki Creation -----------------------------------------------*/ // wav : WAV
このところ、コーパスベースの音声合成というのがブームです。 とはいえ、これが世の中に現れてから、すでに10年くらい経っていますが・・・。 コーパスベースの音声合成とは、テキスト音声合成の技術的な方式のひとつで、大雑把に言えば、人間の声を大量に録音してデータベース化しておき、合成するときには、ここから出来るだけ長くマッチする部分を切り出して、それを連結して文章を生成するというものです。 ですから、合成したい文がデータベース中に完全に一致したなら、単に録音して再生しているだけですので、そりゃもう高品質な音声になります。単純な話、この方式では、より高品質な合成音声にするには、データベースを大きくすれば良いのです。 というわけで、コーパスベースでは、どうしても音声合成システムに必要なデータサイズは大きくなってしまいます。普通のシステムでも数100Mbyteはあるでしょうか。現在のコンピュータのHD
ネット検索していると、iPhone SDK 付属のシミュレータで、日本語入力ができると書かれているのを目にします(シミュレータでは出来ない、という書き込みもある)。 しかし、自分の環境では、いろいろやってみたのですが、日本語入力ができません。テンキーはキーボード設定でONにしても表示されないし・・・ あきらめかけていたところ・・・ 判りました!!! ハードウェアのバージョンを2.0にする 2.1でも2.2でも2.2.1でもダメです。 ■まとめ メニューの日本語化 General > International > Language で「日本語」を選択し「Done」ボタン テンキー設定 「設定」アイコン>一般>キーボード>各国のキーボード>日本語>「テンキー」をON ここまでは、ネット上ですぐわかった。で、今回のTips! ハードウェアのバージョン変更 メニュー「ハードウェア」>バージョン>
AquesTalkを利用したiPhoneアプリ『ゆっくり百人一首』をリリースしました。 これは、百人一首の読み手として使うためのアプリで、以前にWindows版を期間限定でリリースしたものをiPhone/iPod touch上に移植したものです。 開発中に『ミク百人一首』が販売され、先を越された感はありますが・・・ ゆっくり百人一首 AquesTalkは、既にSayKana でMac OS X上に移植済みですが、iPhoneプラットフォーム上でのAquesTalkは、今回が初めてのリリースとなります。 といっても、どちらもLinuxに近いので、開発に際してのAquesTalk音声合成エンジン自体はコードをいじることなく再コンパイルするだけなんですけどね。 iPhoneアプリを作るのは初めてでしたが、プログラム開発よりもリリースの手順に戸惑いました。しかしながら、オンラインだけでリリースから
新しい iPod shuffle の目玉の機能の VoiceOver 規則音声合成技術って、これまであまり目立った存在ではなかったのですが、Appleのこの製品によって、今まで触れることのなかった非常に多くの方々がこの技術に触れることは間違いないでしょうね。 さて、Appleはこの音声合成に何処製のエンジンを使っているのでしょう? (ということは、少なくともウチのエンジンではないということ。残念!) Appleのホームページによれば、iTunesのMac OS X Leopard版とWindows版では前者のほうが『非常に優れた英語の音声』と書いてあるので、英語のエンジンは少なくとも2種類存在するのですが、日本語の場合もMacとWindowsでは異なるのでしょうか? 今回は、Windows版の日本語のエンジンだけをざっくり調べてみました。 で、判定結果は Nuance製 "REALSPEA
ASP.NETのWebサイト管理ツール(WSAT)を、Visual StudioやVisual Web Developer から起動せずに、配置後のIISで起動する方法について 仮想ディレクトリ作成 1.仮想ディレクトリの名前は"webadmin"とする(とりあえず) 2.パスは、 C:¥WINDOWS¥Microsoft.NET¥Framework¥¥ASP.NETWebAdminFiles 3.プロパティ設定 ディレクトリセキュリティ/認証とアクセス制御の[統合Window認証]をチェック 次のURLにIEでアクセス http://localhost/webadmin/default.aspx?applicationPhysicalPath=D:¥www¥test1¥&applicationUrl=/test1 なお、 applicationPhysicalPath:編集するページの実
Win32APIを呼び出すインターフェースを使って、.NET FrameworkからAquesTalkを呼び出すことができます。 今回は、固定のメッセージを発声する最もシンプルなプログラムをC#で作ってみます。なお、説明にはC#を使っていますが、Visual Basic .NET版も同様の方法で作れると思います。 step1 次のプログラムをエディタ等で記述してHelloTalk.csという名前で保存します。 // HelloTalk.cs using System; using System.Runtime.InteropServices; // DllImport class HelloTalk { [DllImport("AquesTalkDa.dll")] private static extern int AquesTalkDa_PlaySync(string koe, int
■背景 「AquesTalkPlayer」は、AquesTalk音声合成エンジンをつかったWindowsアプリです。 見かけも機能もSofTalkのようなものです。 2022年7月末にSofTalkからAquesTalkが外れたこと*1から開発に踏み切りました。 SofTalkでこれまでAquesTalkを使っていた方々に向けたアプリです。 当社はこれまでアプリは作らずに音声合成エンジン(ライブラリ)に集中してきましたが、とうとう公式アプリのリリースです。*2 *1 ブログ「SofTalkのAquesTalk対応終了に関して」 *2 公式アプリといえば、RaspberryPi用の「AquesTalk-Pi」やAndroidの「AquesTalk-TTS」もアプリですね。 ■名前が長い 「AquesTalkPlayer」(アクエストークプレイヤー)、ちょっと名前が長かったです。 略称をつける
このページを最初にブックマークしてみませんか?
『N.Yamazaki's blog』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く