サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
パリ五輪
blog-yama.a-quest.com
2022年7月23日に、アプリSofTalkからAquesTalk音声合成エンジンが無くなりました。 正直、とても残念に思います。 SofTalkは、AquesTalkのフロントエンドという機能のみならず、独自の処理で、あの独特なしゃべり方の"ゆっくりボイス"を築き上げてきました。 2006年に最初のAquesTalkをリリースしましたが、その直後から採用いただいてきたことを思うと一抹の寂しさも感じています。 今回の対応中止に関し、ライセンス内容に折り合いがつかなかったという話は、ほぼネット記事の通りです。 一方、今回の一件で私には反省すべき点があります。 アプリ開発者とのコミュニケーション不足です。 SofTalkの開発者であるcncc様とは、ライブラリアップデートの際には連絡すると約束していたにもかかわらず失念していたため、通常はやり取りがありませんでした。 そのため、ライブラリのアッ
ArduinoのWireライブラリは、読み出しの際のリピート・スタート・コンディションが使えないって書いてあるサイトが多くありますが、今は使えるようになってます。 通常、I2Cデバイスにデータを書き込むときは単にwrite()を連続すれば良いのですが、I2Cデバイスからデータを取得するときは、読み込むレジスタのアドレスを指定(Write)してから、データを読み込む2段階の処理となります。 以下は、I2Cデバイスにレジスタのアドレス(1byte)を指定した後、2byteのデータを読み込むありふれたコードです。 Wire.beginTransmission(DEVICE_I2C_ADDRESS); Wire.write((byte)REG_ADDR); Wire.endTransmission(); Wire.requestFrom(DEVICE_I2C_ADDRESS, 2); uint16
keywords:音声合成, 組み込み, 日本語, ESP32, M5Stack 2021/12/21 加筆、2020/10/22 Ver.Upに伴い加筆修正 ■概要 AquesTalk-ESP32は、ESP32向けの音声合成ライブラリです。 Ver.2.0から小型軽量の言語処理エンジンAqKanji2Koe-Mが組み込まれ、漢字テキストからの音声合成もできるようになりました。メールやSNSの情報をリアルタイムに音声出力できます。 ■インストール Arduino IDE上でに、AquesTalk-ESP32をセットアップする手順を以下に示します。 1. こちらから、AquesTalk-ESP32(aquestalk-esp32_0221.zip)をダウンロード 2. Arduino IDEでAquesTalk-ESP32ライブラリをインストール メニュー:スケッチ>ライブラリのインクル
- M5Stackで漢字テキストからの音声合成 - Keywords: AqKanji2Koe, AquesTalk, 言語処理, M5Stack, ESP32, 組み込みシステム ■漢字の読み上げ 日本語テキストから音声合成をするには、言語処理エンジンが必要です。 言語処理エンジンAqKanji2Koeは、漢字仮名混じりの文字列を、AquesTalk用の音声記号列に変換するライブラリです。 この言語処理には5MB〜12MBの辞書データが必要で、これがネックになってハードウェア規模を小さくできませんでした。そのため、現在の最小動作環境は、Raspberry Pi程度となっています。 *「AquesTalk Pi」はRAM256MB〜のRaspberry Pi上で動作 現在、この言語処理エンジンを、1ランク小さい規模のハードウェアで動作をすることを目指して開発を進めています。具体的には、RA
keywords: ESP32, サウンド, DAC, I2S ■概要 ESP32の内蔵DACから音を出すとき、前後のプチプチというノイズが気になってので、これを防ぐ方法を検討してみました。 ■クリックノイズの原因 ESP-IDFのI2Sドライバは無音時の値を0としている。 内蔵DACにおける値0は負の最大値である。 通常I2Sの16bitデータは符号付き(無音時の値が0、最小が-32768、最大が32767)で表現します(図1-A)。ESP-IDFのI2Sドライバも、その前提で書かれています。 しかし、内蔵DACは0Vから3.3Vの範囲を16bitの符号無し整数(0から65535)で指定します。 そのため、音声信号では無音時の値を32768、負の最大値を0、正の最大値を65535になるように変換して与える必要があります。 ESP-IDFのI2Sドライバは無音時の値が0という前提で書かれて
keywords: 音声合成 AquesTalk ESP32 I2S 2018/08/09 AquesTalk-ESP32とArduino-ESP32のVer.upに伴い、ソースコードやライブラリのセットアップ方法は、次の記事を参照してください。「AquesTalk-ESP32 Ver.2.0」を使う 概要 AquesTalk pico for ESP32 (以下、AquesTalk-ESP)は、ESP32向けの音声合成ライブラリです。 これを使って、ESP-WROOM-32の内臓のDA(I2S経由)から合成音声を出力します。 アンプ・スピーカーを内蔵しているM5Stackなら、ソフトだけで簡単に音声合成できます。 AquesTalk pico for ESP32 (AquesTalk-ESP)の入手 アクエストのサイトからダウンロードできます。 ・アクエスト > ダウンロード http
■AquesTalk10をリリース 音声合成エンジンAquesTalkのリリースから約10年が経ち、ようやく新バージョン AquesTalk10 を、本日リリースしました。 「ゆっくり声」の音声合成エンジン、AquesTalk/AquesTalk2の後継バージョンです。 特徴: ・音声の周波数帯域を2倍にしてクリアな音質に ・音素データをすべて一から作り直り、さらにこれをチューニングをして、明瞭性を向上 ・エンドユーザが複数の声質パラメータを操作して、自由に声質を作れる 当社サイトのデモページにて、9種のプリセット声種のサンプル音声が聴取できます。 また、評価版パッケージの中に、声質パラメータを自由に操作して音声合成できるサンプルアプリ「AqTk10App」が含まれています(評価版の制限あり)。 「 AqTk10App」 ■新しい声というジレンマ AquesTalkの合成音声は、「ゆっくり
Keywords: Wi-SUN, HEMS, スマートメーター, ECHONET Lite ■概要 USBドングル「UDG-1-WSNE」を使って、スマートメーター(電力量計)から瞬時電力を習得・蓄積し、現在の消費電力などをグラフと共に表示する表示するシステムを作りました。このモニター端末をリビングに常設し、電気の「見える化」を実現。 表示画面 スマートメーターとの接続には、920MHz帯のWi-SUN規格の無線通信で行いますので、Wi-SUN通信のハードウェアが必要です。 このWi-SUN通信デバイスとしては ROHM の BP35A1 を使った例はありますが、今回はUSBドングル「UDG-1-WSNE」を使用しましたので、はんだ付けなどの電子工作は一切ありません。 なお、この記事では、このUSBドングルを使うときの注意点のみ詳しく記述します。 ■システム構成 ハードウェア スマートメ
2022/02/07 追記あり AquesTalk Piとは、Raspberry Pi上で軽快に動作する音声合成コマンド(プログラム)です。 インストールから基本的な使い方、オプションの使い方を簡単にまとめました。 Raspberry Pi Type B ■音が出るか確認 予めRaspberry Piで音声が再生できるかチェックします。 オーディオをミニプラグに出力させる場合 $ amixer cset numid=3 1 オーディオをHDMIに出力させる場合 $ amixer cset numid=3 2 追記 2020/10/10 "amixer: Cannot find the given element from control default" とエラーが出る場合、画面右上スピーカーアイコンの右クリックで切り替えてください。 以下のコマンドでRaspbianに用意されている音声デ
Raspberry Pi用の音声合成アプリ 「AquesTalk Pi」のベータ版ができました。 「AquesTalk Pi」とは? Raspberry Pi上で動作する、テキスト音声合成アプリです(ライブラリではない)。 ・少ない処理量で高速に合成 ・2声種を内蔵。AquesTalkのf1(reimu?) と f2(marisa?) ・漢字の文から合成できる。 AqKanji2Koeエンジン内蔵 こちらの動作確認環境 Raspberry Pi Model B Revision 2 -512MB Raspbian wheezy 2013-07-26 使い方の例 $ ./AquesTalkPi ゆっくりしていってね? | aplay 以下でオプション等が表示されますので、その他の使い方はこれを参照ください。 $./AquesTalkPi -h お願い 動作確認のご協力をお願いいたします。
Arduino用 音声合成LSIライブラリ このライブラリは、Arduinoから音声合成LSI「AquesTalk pico LSI」(以下、"LSI")を制御するためのライブラリです。これを使えば簡単に音声合成を行うスケッチが書けます。 なお、Arduino基板とLSIは2線のI2Cインターフェースで接続することを前提としています。ハードウェア的には「AquesTalk Shield(*1)」を使ったり、ブレッドボード上で配線します(下の配線例参照)。 *1 AquesTalkプロトシールド や ROBOBA032 配線例 Arduino Uno, ATP3011XX-PU ブレッドボードとアクティブスピーカを使った例 動作環境 ■ 対象デバイス(LSI) ATP3012F6-PU/ATP3012F5-PU/ATP3011R4-PU/ATP3011M6-PU/ATP3011F1-PU
keyword: Arduino 音声出力 サウンド 音声合成LSI 音声合成LSIを使えば簡単にArduinoで音声出力ができます! ■Arduinoで音声を出力するいくつかの方法 電子工作を手軽に始められるマイコンボード『Arduino』。モノづくりやプロトタイピングで数多く利用されています。Arduinoからの出力の基本は、なんといってもLチカですね。誰もがLEDを点滅させることから始めたことと思います。その後、もう少し詳細な情報を出力するのにLCD(液晶ディスプレイ)を使う方法がありますが、Lチカに比べるとだいぶ難しくなってきます。 一方で、サウンドを使いたいということもあるでしょう。音は、なんらかの警告や注意喚起に最適ですし、見ないで操作する装置だってありますよね。 そこで、Arduinoででサウンドを出力する方法を考えてみると、おおむね以下の方法があります。(これらの特徴や使い
音声合成LSI「AquesTalk pico LSI」ATP3011シリーズは、裏コマンドで声質を調整することができます。 ニコニコ動画 ■注意 本記事の内容は、(株)アクエスト公式のものではありません。 記事内容の実施に伴う影響等は、すべて自己責任でお願いいたします。 ■対象製品 ATP3011F4-PU ATP3011F4-AU ATP3011M6-PU ATP3011F1-PU ■原理は動作クロックの変更 特に音声合成の動作を変えているわけでなく、単純に動作クロックを変更するだけです。 したがって、この調整のによる効果はテープ(古い!?)の早回しみたいなものです。 このデバイスは、OSCCALレジスタの値を変更することで、内部RCクロック周波数を調整できます。 OSCCALの値と周波数の関係は次のとおり。 *Atmel社 ATmega328 データシートより ただし、あくまでも平均的
音声合成LSI 「AquesTalk pico LSI」 (ATP3010F4/ATP3011F4)は、UARTの他にI2CやSPIのインターフェースを持っています。 一方、Arduino側のUARTは、PCとの通信で既に使われているので、ArduinoとAquesTalk pico LSI間の通信には、I2CやSPIを利用するのが便利です。 ココまでは、前回(I2C)と同じ。 今回は、SPIを使ってAquesTalk pico LSIを動かす方法を示します。 配線 通信モードをSPI(Mode0)にするため SMOD0(4pin), SMOD1(5pin)をGNDに接続、 ATP3010F4とArduinoのSPI接続は次のとおり。 SCK(19pin) <-> D13 MISO(18pin) <-> D12 MOSI(17pin) <-> D11 /SS(16pin) <->
音声合成LSI 「AquesTalk pico LSI」 (ATP3010F4/ATP3011F4)は、UARTの他にI2CやSPIのインターフェースを持っています。 一方、Arduino側のUARTは、PCとの通信で既に使われているので、ArduinoとAquesTalk pico LSI間の通信には、I2CやSPIを利用するのが便利です。 今回は、I2Cを使ってAquesTalk pico LSIを動かす方法を示します。 (SPIを使う場合はこちら) 配線 通信モードをI2CにするためSMOD0(4pin)をGNDに接続、 I2C通信のSCL(28pin)をArduinoのA5に、SDA(27pin)をA4に接続します。 また、このSCLとSDAは、4.7KΩ程度でプルアップ(VCCに接続)します。 サンプルスケッチ このスケッチは、予めプログラムに用意した複数のメッセージを順番に読み
先に、Arduinoを音声合成ボードに変えるというのをやりましたが、 今回は、Arduino用の音声合成シールドを作ってみます。 AquesTalk pico LSI ATP3010F4は、Arduino unoと同じATmega328pマイコンを使っていますが、ここにArduinoのスケッチを書きこんでオリジナルのArduino作品を作るなんてことはもちろんできません。そのためオリジナル作品を作るには、ArduinoボードとAquesTalk pico LSIがそれぞれ必要になり、これらを配線する必要があります。 Arduinoの世界では、無線LANとかSDカードなど機能を拡張するハードをシールドって呼ぶらしく、通常は基板になっていてArduinoボードに挿して簡単に使えるようにようになっています。 しかし、今回は基板ではなく、ICを亀の子のように2段に重ねて実装します。 部品点数も少な
ブートローダが書き込まれていないATmega328PにArduinoのブートローダを書き込む簡単な方法です。 (追記 2015/03/16 第2弾を書きました http://blog-yama.a-quest.com/?eid=970164 ) 用意するもの Arduino Uno ブレッドボード ATmega328P ArduinoIDE 書き込み用のスケッチ(後述) 作業 ブレッドボードとArduino Unoを配線します。 (画像はarduino.ccより) 書き込み用のスケッチをUnoに書く スケッチは、下記からダウンロードして、Unoにアップロードします。 ちなみに、これを書いた人はUnoのブートローダを作成された方のようです。 http://www.arduino.cc/cgi-bin/yabb2/YaBB.pl?num=1295516707 の 最初の記事内にあるリンク op
AquesTalk TTS for Android のインストール手順 「Google翻訳」などの各種のAndroidアプリで日本語の音声合成が可能となる、音声合成エンジン『AquesTalk TTS』のインストール&設定方法をまとめてみました。 動作環境 Android OS 2.2 以降 SDカード(内蔵)内部ストレージに40MB以上の空き領域 辞書データインストール時にインターネット接続必要 インストール方法 基本的な流れは次のとおりです。 アプリパッケージをインストール 辞書データをダウンロード 音声合成の設定 以下に詳細を示します。 1. アプリパッケージをインストール Android Market から"AquesTalk TTS"で検索、または下記URLのページからダウンロードして下さい。 http://market.android.com/details?id=com.a_
AquesTalk TTS for Android Google翻訳でも日本語音声合成が可能になる、 Android用の日本語TTSエンジン『AquesTalk TTS』のβ版をリリースしました。 このソフトの概要は先の記事をご覧ください。 先の記事 『Android用の日本語TTSエンジン』 動作環境 Android OS 2.2 以降SDカードに40MB以上の空き領域辞書データインストール時にはインターネット接続必要 = β版の配布は終了しました = お願い お試しいただいた場合、是非ともこちらのBBSに動作レポートの投稿をお願いします。使用端末、Android OSのバージョン、動いたとか、うまく動作しないときはどうなってしまうかなどを報告いただければと思います。 なお、ベータ版につき公開期間限定です。また、製品版は有料の予定ですので、興味を持たれた方は早めにお試しください。 お約束
Android用の日本語Text-To-Speech Engine、いわゆる音声合成エンジンを開発しました。 既にAndroid用のライブラリはリリースしていますが、今回のはライブラリでも単体の音声合成アプリでもなく、AndroidのTTSエンジンとしてのソフトウェアです。 どういうことかというと、 ライブラリの場合は個々のアプリケーションに音声合成ライブラリを組み込む必要があるし、音声合成単体のアプリでは、そのアプリを起動してそこから読み上げるテキストを指定しなくてはならないなどで、使い勝手がいまひとつ。 今回は、AndroidのTTSエンジンとして実装したので、アプリ側からは、どんな音声合成エンジンが組み込まれているかを意識せず、単にAndroid TTS APIを呼び出すだけで"話す"ことが可能になります。 例えば”Google翻訳”というアプリがありますが、翻訳結果が英語ならスピー
音声合成ライブラリAquesTalk2を使用した Android用のデモアプリを公開しました。 追記 2011/07/28 バージョンアップしました。AquesTalk2 v2.3実装+Phont追加 AqTk2Demo すでに公開しているAquesTalk2 Androidのライブラリパッケージにもサンプルアプリが入ってますが、今回公開のアプリは、言語処理ライブラリAqKanji2Koeを組み込んで、漢字を含んだテキストからの音声合成が出来るようになっています。そうそう、このAqKanji2Koeライブラリは近日リリース予定です。 使用方法 使い方は、特に説明不要かと思いますが、上のテキストボックスに日本語テキストを入れて[Convert]ボタンの押下すると、下のテキストボックスにその音声記号列が表示されます。 [Play/Stop]ボタンの押下で音声合成します。 なお、下のテキストボッ
メールが、受信はできるのだけど、送信ができなくなった。 ちなみに、こちらで使用しているメールサーバーは、 インターネットのプロバイダとは異なるところ。 今回、光回線とプロバイダを変更したので、それが原因と思い、 検索してみれば、「Outbound Port25 Blocking」って、 SMTPでポート番号25が使えなくなるのが原因らしいというのが判った。 そこで、メーラのSMTPポートを25番から587番に変更してみたのだが、 相変わらず送信できない。 状況は、SMTPサーバーにアクセスしようとすると、数秒してから 「421 cannot connect to smtp server」 とエラーが返る。 認証設定を変えたりと、色々やってみたけれど、SMTPサーバに接続できない。 あれこれ、半日悩んだ結果・・・ なんと、原因は、avast! だった。 avastのメールシールドを停止すると
音声合成エンジン AquesTalk2 をGoogleのOSプラットフォームであるAndroidに移植しました。 サンプルアプリを含むライブラリは、こちらから、ダウンロード出来ます。 非営利の個人利用に限り無償で使用できますので、お手元のAndroid端末に組み込んでみてはいかがでしょうか。 基本的な使い方は、先に書いたAquesTalkと同じですが、声種データを指定すれば異なる声種で合成ができるようになっています。 サンプルアプリ ダウンロードしたパッケージには、ライブラリと一緒に、サンプルアプリが2つ(HelloAquesTalk2,AqTk2App)入っています。 * HelloAquesTalk2: 最も単純なサンプルで、起動時に規定のメッセージを合成出力するだけのものです。 * AqTkApp2: GUIを持たせ、任意の音声記号列と話速 、声種を指定して音声合成するものです。 サ
先に、Android上でメモリ上の音声データをファイル経由せずに、直接再生する方法がわからないと書きましたが、その方法を教えていただいたので、簡単に使い方をまとめておきます。 MediaPlayerでなく、AudioTrackを使うのがミソ。 困ったことに、再生が終了(指定のデータの長さを出力)しても、AudioTrackのstatusはずっとPLAYSTATE_PLAYINGのままである。 どうやら、stop()やpause()を呼び出さないかぎり、statusが変わらない模様。 そこで、下のサンプルコードでは、setNotificationMarkerPosition()を呼び出し、再生データの長さの再生が終わった時点で、onMarkerReached()が呼ばれるようにして、この中でstop()するようにしている。 1. インポート import android.media.Audi
音声合成エンジン AquesTalkをGoogleのOSプラットフォームであるAndroidに移植しました。 現在、β版であり評価版を無償でダウンロード出来ます。downloadページ サンプルアプリ ライブラリと一緒に、サンプルアプリが2つ(HelloAquesTalk,AqTkApp)入っています。 HelloAquesTalk: 最も単純なサンプルで、起動時に規定のメッセージを合成出力するだけのものです。 AqTkApp: GUIを持たせ、任意の音声記号列と話速を指定して音声合成するものです。 サンプルアプリの動かし方 AndroidSDK(+Eclipse)の開発環境が構築されていることが前提です。 ダウンロードしたプロジェクトファイル一式を任意の場所に展開 Eclipseを起動 メニュー>ファイル>新規>Androidプロジェクト [外部ソースからプロジェクトを作成]を選択し、
先程、AquesTalk2 iPhoneをリリースしました。 日本語の音声合成を行う、iPhone OS用のスタティックライブラリです。 機能的には、Windows版と同等の機能をもっていて、直接iPhoneのスピーカに出力するサウンドデバイスへの出力機能も実装しています。 そのため、たった数行のコードを書くだけで、iPhoneアプリで音声合成を簡単に実現できます。また、コードサイズも50KB程度ですのでサイズを気にする必要も有りません。 そして・・・ 無料アプリなら無償で組み込んで配布できます!!! 「個人に限る」など制限がありますが、ゲームやユーティリティなど、さまざまなiPhoneアプリに、気軽に使っていただけると思います。 配布に関する詳細は、AquesTalk2 iPhoneライセンス規定ライブラリ付属のドキュメントを参照してください。 ライブラリのダウンロードは、こちらから
#追記 2018/02 SayAqTk2の公開は終了しました。AquesTalk2 Linuxライブラリ内のサンプルプログラムをビルドして同様の機能を実現可能です。 AquesTalk2 Linuxは、Linux上で動作する音声合成ライブラリで、非営利の個人利用なら無償で利用できます。 ただ、これはライブラリとして配布されているので、何らかのアプリから呼び出す以外、そのままでは使うことはできません。 そこで、AquesTalk2をコンソールアプリケーション化することで、スクリプトを書くだけで音声合成が出来るようにしてみます。 以下に、Linux環境にAquesTalk2 Linuxをインストールするところから、これをコンソールアプリケーション化して動作を確認するまでの手順を示します。 AquesTalk2のダウンロード AQUESTのダウンロードページにアクセスして、最上部のAquesT
VisualBasicで規則音声合成エンジンAquesTalkを利用する方法を紹介します。具体的には、Excel上のVBを使って、AquesTalkのライブラリを呼び出す簡単なプログラミングです。 1. Visual Basic の起動 Excelを開いて、[ツール][マクロ][Visual Basic Editor]で、Visual Basic Editorを起動します。 2. フォームにコントロールを貼り付ける [挿入][ユーザーフォーム]で新規フォームを作成し、テキストボックスとコマンドボタンを貼り付ける 3. コマンドハンドラの記述 コマンドボタンをダブルクリックして、フォームのコードを開き、CommandButton1_Click()サブルーチン内に次ののコードを記述します。 Private Sub CommandButton1_Click() If AquesTalkDa_Pl
次のページ
このページを最初にブックマークしてみませんか?
『N.Yamazaki's blog』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く