タグ

text2speechに関するnilabのブックマーク (78)

  • 「リソースの課題を技術で解決」――災害時にラジオを放送し続けるために、AIアナ開発秘話

    AIやロボットによって、今後20年ほどで、今ある職業のおよそ半数が奪われてしまう、という英オックスフォード大の予測があります。人間の仕事が失われるということは悲観的に捉えられがちですが、技術革新とともに迎える未来は当に暗いものなのでしょうか。人間にはない、テクノロジーの力を活用すれば、私たちが抱える問題が解消されるかもしれません。 その可能性を信じてAIの活用に挑戦しているのが、和歌山県和歌山市にあるコミュニティFM局「エフエム和歌山」です。2008年に開局し、約50万人の聴取可能人口に向けて地元のニュースやオリジナル番組を放送しています。 同局のクロスメディア局長・山口誠二さんは2017年7月、アマゾンウェブサービス(AWS)の人工知能サービス「Amazon Polly(アマゾンポリー)」を活用して放送を行う仕組みを開発。AIアナウンサーの誕生として、大きな話題を呼びました。開発に至っ

    「リソースの課題を技術で解決」――災害時にラジオを放送し続けるために、AIアナ開発秘話
    nilab
    nilab 2018/02/02
    「イントネーションや間の取り方、漢字の読み方を「Amazon Polly」が独自に学習」「「Amazon Polly」であれば、読み上げ100万文字当たりにかかる費用は4ドル(約450円)。私たちが1年間運用しても、400円ほどと算出」
  • Open JTalk - HMM-based Text-to-Speech System

    サンプル 「小さな鰻屋に,熱気のようなものがみなぎる.」 (声質: 0.55 ピッチシフト: 0 話速: 1.0) wav 「一週間ばかり,ニューヨークを取材した.」 (声質: 0.45 ピッチシフト: 18 話速: 1.2) wav オプション 声質の値を小さくすると女性,大きくすると男性のような声になります. ピッチシフトの値を調整することで,合成する音声の高さを半音単位で変更します. 話速の値を小さくすると遅く,大きくすると速くなります. 合成テキスト 最大200字までの文章を合成できます. 2018/07/11 利用規約の一部を緩和しました. 2012/12/25 [Ver. 1.8] Open JTalkのバージョンを1.06に更新しました. 女性話者「Mei (Happy)」「Mei (Bashful)」「Mei (Angry)」「Mei (Sad)」を追加しました. 音質を安

    nilab
    nilab 2016/07/05
    「入力された日本語テキストに基づいて自由な音声を生成するHMMテキスト音声合成システム,Open JTalkのデモンストレーションです」
  • VoiceText Web API (β版)

    無料版で作成した音声データの商用利用、二次利用及び配布する行為は禁止されております。 利用規約をご確認の上、サービスをご利用ください。 ※音声データの二次利用例 WebAPIで作成した音声をYouTube等の動画投稿(共有)サイトにおいて使用・公開する行為 有料版サービスを開始しました。詳しくは製品情報をご覧ください。

    VoiceText Web API (β版)
    nilab
    nilab 2014/07/09
    VoiceText Web API (β版) : 「Webに声を、感情を。高品質な音声合成VoiceTextが、簡単に使えるWeb APIに」
  • SayKana - Mac用音声合成プログラム

    SayKanaは、Mac OS X上で動作する日音声合成ソフトウェアです。OS Xに付属の say コマンド(英語音声合成)と同様の機能を実装しています。 AquesTalk音声合成エンジンをMac OS X 上に移植したもので、基的に『かな』からの音声合成であり、漢字かな交じり文は読み上げられません。 商用でなければ無償でご利用いただけます。 特徴 sayコマンドと同様の使用方法・インターフェース 女声/男声の声種切替可能 音声のAIFF保存 発話速度の変更 制限の少ない入力文字列 フロントエンドに簡易読みモジュールを含めましたので、音声記号列の表記仕様に合致しない文字列からでも、適切な読み上げを行うことができます。

    nilab
    nilab 2013/09/13
    SayKana - Mac用音声合成プログラム : 「日本語音声合成ソフトウェアです。OS Xに付属の say コマンド(英語の音声合成)と同様の機能を実装しています。 AquesTalk音声合成エンジンをMac OS X 上に移植したもの」
  • 橋本商会 » Macのsayコマンドの音程を変更しつつ再生

    Macのsayに日語しゃべらせれるけど、声が1種類しかなくてもっとほしい。 soxについてるplayコマンドを使うと音程変えたりエフェクトいろいろかけたりしながら再生できるので brew install sox saypitchコマンドを作った 後ろに数字付けると音程調整できる saypitch パソコンなくても書画カメラとnexus7で余裕だった -300 saypitch パソコンなくても書画カメラとnexus7で余裕だった 800 男っぽい声とかもだせる。 #!/bin/sh ## brew install sox TMP=/tmp/saypitch.aiff if test $2 ; then PITCH=$2 else PITCH=0 fi say $1 -o $TMP && play $TMP pitch $PITCH norm reverb rm $TMP 読む速度遅くした

    nilab
    nilab 2013/09/13
    橋本商会 » Macのsayコマンドの音程を変更しつつ再生 : 「soxについてるplayコマンドを使うと音程変えたりエフェクトいろいろかけたりしながら再生できる」
  • TwiML™ for Programmable Voice | Twilio

    TwiML (the Twilio Markup Language) is a set of instructions you can use to tell Twilio what to do when you receive an incoming call or SMS. When someone makes a call to one of your Twilio numbers, Twilio looks up the URL associated with that phone number and sends it a request. Twilio then reads the TwiML instructions hosted at that URL to determine what to do, whether it's recording the call, pla

    nilab
    nilab 2013/03/07
    Twilio Docs - API TwiML
  • [ヅ] JavaScriptだけでテキストを読み上げるSpeak.jsを日本語に対応させてみた (2013-02-14)

    Speak.jsはジェネレータを通じて音声を動的に生み出します。対応しているのは英数字のみとなっており、日語には対応していません。常に動的に生成しているので自由なテキストを読み上げさせることができます。 なんと!JavaScriptだけでテキスト読み上げ「Speak.js」|オープンソース・ソフトウェア、ITニュースを毎日紹介するエンジニア、デザイナー向けブログ とりあえず「ひらがな」だけ対応してみた。 日語テキストを読み上げるサンプル ⇒ Speak.js with speakBasho(スピーク芭蕉) Demo 日語対応プログラム speakBasho.js の中身 var BASHO_DATA = { 'あ': 'ah', 'い': 'e', 'う': 'wool', 'え': 'eay', 'お': 'oh', 'か': 'car', 'き': 'key', 'く': 'ku

    nilab
    nilab 2013/02/14
    やっぱ音声合成は楽しいね(・∀・)/ [ヅ] JavaScriptだけでテキストを読み上げるSpeak.jsを日本語に対応させてみた
  • GitHub - mtttmpl/speak-js: Text-to-Speech in JavaScript

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - mtttmpl/speak-js: Text-to-Speech in JavaScript
    nilab
    nilab 2013/02/14
    mattytemple/speak-js · GitHub
  • Open JTalk

    What is Open JTalk? Open JTalk is a Japanese text-to-speech system. This software is released under the Modified BSD license. Getting Open JTalk Open JTalk version 1.11 (25 December, 2018) NEW! The Japanese text-to-speech system. It works in Linux machines. Documentation Source Code Dictionary for Open JTalk version 1.11 (25 December, 2018) NEW! If you cannot compile dictionary, you can use compil

    nilab
    nilab 2013/01/08
    Open JTalk
  • http://openhri.net/software/openjtalk/

    nilab
    nilab 2013/01/08
    OpenHRI » OpenJTalk : 「フリーで利用できる日本語音声合成エンジン」
  • http://openhri.net/

    nilab
    nilab 2013/01/08
    OpenHRI : 「音声認識・音声合成・対話制御など、ロボットのコミュニケーション機能の実現に必要な各要素を実現するコンポーネント群」
  • UTAU-Synth / 歌声合成ツールUTAU

    歌声合成ツールUTAU (フリーソフト/シェアウェア) Windows向けに作成された歌声合成ソフトウェアです。 サンプリングされた音声ライブラリを元に歌唱を組み立てる機能を持ち、 音声ライブラリは付属音声の他に自作も可能です。 現在はUTAUに向けて作成された音声ライブラリがネット上に非常に多く存在しており、 それらをダウンロードして使用することにより、お好みの音声で歌唱を作成することが出来ます。 UTAU-Synth (現在試用ライセンスのみ) UTAUのMac OSXへの移植版です。 元々UTAUがWindows以外のプラットフォームを全く考慮せず作られていたため、 インターフェースが1から作り直しになっています。 ・連続音・単独音を意識しないで歌詞入力可能 ・音符の自由配置 ・矩形選択 お知らせ 2024/5/23 ■UTAU 0.4.19 download ・セキュリティー脆弱性

    nilab
    nilab 2011/06/02
    UTAU-Synth / 歌声合成ツールUTAU
  • Lifelike Text to Speech for Your Customers

    Hello, my name is Kayla, I'm one of the voices that you can use to speech enable your website. When I'm reading your text it sounds like this. Terms of Service - This demo is for evaluation purpose only; commercial use is strictly forbidden. No static audio files may be produced, downloaded, or distributed. The background music in the voice demo is not included with the purchased product. Benefits

    Lifelike Text to Speech for Your Customers
    nilab
    nilab 2011/04/07
    NeoSpeech Text-to-Speech Software Programs | TTS Demo
  • Toshiba.jp - Storage

    品番は3文字以上指定して下さい。 オンラインディストリビューターが保有する東芝製品の在庫照会および購入が行えるサービスです。

    Toshiba.jp - Storage
    nilab
    nilab 2011/01/12
    音声合成ミドルウエア ToSpeak™|カーインフォテイメント用IC|東芝 セミコンダクター社
  • Studio ToSpeak 音声 合成 読み上げソフト

    Studio ToSpeakは、東芝の音声合成エンジンToSpeakを利用して、好きな文章を入力するだけで、いろいろな声の合成音声を生成することができるサイトです。お知らせ 2010年1月5日 「Studio ToSpeak」サイトを公開しました。 好きなキャラクターを選んで、合成音声の作成ができます。 簡単なユーザー登録を行って、ぜひご利用下さい。

    nilab
    nilab 2011/01/12
    「キャラクターを選んで、合成音声の作成」「文章を入力するだけで、いろいろな声の合成音声を生成することができます。作成した合成音声は、ダウンロードして楽しむこともできます」Studio ToSpeak
  • 最終審査会レポート|i*deal Competition 2010(アイディールコンペティション)

    セカイホンヤクデンワ(仮称):言語の壁を超える世界通話サービスiplatform.org KORODROID氏/発表mnb氏 べたら外国語が話せるようになるコンニャクがあれば……という思いから生み出されたのが、セカイホンヤクデンワ。これを使って通話をすると、英語でしゃべった内容が日語として音声出力され、その逆も然り、となる。某アニメで夢見た“セカイ”を実現したいというわけだ。 セカイフォンの実現方式。「部品(1)」「部品(2)」と書かれているところがポイントだ。 セカイフォンのアーキテクチャ。実は、Googleの音声検索、翻訳、TTSの3サービスを組み合わせて実現されている。 写真でも分かるとおり、セカイフォンはGoogleのサービスを組み合わせることによって実現されている。デモンストレーションも行なわれ、実際にセカイフォンが動いている様が確認された。 マッシュアップ作品ということで、

    nilab
    nilab 2010/03/31
    最終審査会レポート|i*deal Competition 2010:セカイホンヤクデンワ(仮称):言語の壁を超える世界通話サービスiplatform.org KORODROID氏/発表mnb氏:Google音声検索(音声認識)->Google翻訳->Google TTS:ホンヤクコンニャンク
  • 棒読みちゃん - ダウンロード(音声合成で日本語文章を読み上げ)

    ニコニコ実況が2020/12/16にリニューアルし、ニコ生の機能を利用する形式に変わりました。 旧APIの廃止に伴い棒読みちゃんに添付していたプラグインからは接続できなくなりました。 ニコ生用には棒読みちゃんと連携できるコメントビューアが色々ありますので、そちらと連携してご利用ください。 ■概要 漢字を含む日語の文章を音声合成で読み上げるツール。 IMEで漢字をひらがなに変換し、AquesTalkで音声合成します。 SAPI5やSpeech Platform音声合成エンジンにも対応しています。 ■動作環境 Microsoft Windows 2000以上(7の64bit版のみ確認) Microsoft .NET Framework 2.0以上(3.5のみ確認) ■カンパのお願い フリーウェアなので無料でご利用いただけますが、気に入ってくださった方は、ご支援いただければ幸いです。 Ama

    nilab
    nilab 2009/07/17
    棒読みちゃん ~ 音声合成で日本語文章を読み上げるツール : 「2ちゃんねる専用ブラウザの読み上げ」
  • http://aqtk.rubyforge.org/

    nilab
    nilab 2009/03/13
    AquesTalk/Ruby - Ruby bindings for AquesTalk. : AquesTalk/Rubyはテキスト音声合成ミドルウェア「AquesTalk」のRubyバインディングです。 日本語の文章のサウンドデバイスへの出力や、WAVフォーマットへ変換することができます。
  • i Speech : Text to speech

    [[ description ]]

    nilab
    nilab 2009/01/15
    Convert Text to Speech Free. Listen to any Document, Website or Blog
  • 音声合成ミドルウェアRuby Talk-漢字仮名混じり文を正確に読み上げ、高い肉声感となめらかな合成音を実現する、最適な音声合成ソリューション

    株式会社日立超LSIシステムズは、2019年4月1日に株式会社日立ソリューションズ・テクノロジーに社名変更しました。 新サイトへのブックマークまたはリンクの変更をお願いします。 15秒後に自動的に新サイトへ移動します。 移動しない場合は、お手数ですが下記リンクをクリックしてください。 株式会社日立ソリューションズ・テクノロジー

    nilab
    nilab 2009/01/08
    日立超LSIシステムズ:音声合成ミドルウェアRuby Talk、DS版 Ruby Talk-漢字仮名混じり文を正確に読み上げ、高い肉声感となめらかな合成音を実現する、最適な音声合成ソリューション