並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 18 件 / 18件

新着順 人気順

ssml イントネーションの検索結果1 - 18 件 / 18件

  • 合成音声を使ってboard(SaaS)のチュートリアル動画を制作した話(VOICEPEAKとGoogle Cloud Text-to-Speech) - ヴェルク - IT起業の記録

    boardというSaaSのチュートリアル動画を合成音声を使って制作しているので、その話を書いていきます。 個別相談会のデモとチュートリアル動画 以前書いた board(SaaS)個別相談会の変遷 の中で少し触れたのですが、2021年に、個別相談会の中でやっていたデモをベースに、チュートリアル動画を制作しました。 個別相談会では、業務の流れに沿って基本的な操作を一通り説明していくデモを行っていたのですが、途中に質問が挟まることも多く、そうすると、全体で30〜40分ほどかかってしまうことも多くありました。 個別相談会は1時間枠なので、そのうち40分をデモで使うのは、時間の使い方としてもったいないなという課題感がありました。また、弊社は営業など外向けに活動するメンバーがいないため個別相談会はすべて僕がやっており、個別相談会を開催できる回数にも限りがありました。 一方で「お試しする前にとりあえずデ

      合成音声を使ってboard(SaaS)のチュートリアル動画を制作した話(VOICEPEAKとGoogle Cloud Text-to-Speech) - ヴェルク - IT起業の記録
    • 喉を痛めたのでPollyにDDRネタLTの語り手を託した話 | DevelopersIO

      MizukiだけじゃなくSalliにもお世話になってました。 ありがとうSalli。 私とPolly。 先日、風邪を引いてしまいました。 久々の発熱で寝込んでしまい、熱が収まった頃には鼻水のナイアガラが止まらず、まさかと思っていたら喉にまで風邪が到達してしまいました。 風邪のフルコースはあまり嬉しくないものですね。 ▲ 体力の衰えに、ちょっと凹んだりもしました こんにちは。AWS事業本部のShirotaです。最近は小ぶりなのど飴のパックが多くて生きやすくなったなと感じました。 LT前に風邪を引いて声が出し辛くなってしまった 「自分の喋りたい事を喋る」社内LTの前日、 ほぼほぼ声が出せなくなってしまいました 。 喉を慮って喋ってみると20dbくらいしか出ず、そもそも凄いハスキーな声で聞こえづらい事山の如し。明日の5分だけでも生き返って私の喉……! と思いつつ、「声が出ない 風邪 治し方」と調

        喉を痛めたのでPollyにDDRネタLTの語り手を託した話 | DevelopersIO
      • やさにちウォッチのルビ(ruby - ふりがな)のスタイル (改訂版)

        この記事は アクセシビリティ Advent Calendar 2021 アイコン別ウィンドウで開きます の第1日目の記事です。 この記事は PowerCMS X Advent Calendar 2021 アイコン別ウィンドウで開きます の第1日目の記事です。 この記事は やさしい日本語 Advent Calendar 2021 アイコン別ウィンドウで開きます の第10日目の記事です。 ※ Advent Calendar用に新規記事の作成も考えましたが、ルビをフル活用した ウェブコンテンツに関する実装ノウハウとして纏まっているほうが後の役に立ちそうだったので大幅に加筆して、改訂版としました。 「やさにちウォッチ」 アイコン別ウィンドウで開きますは私たち(アルファサード株式会社) アイコン別ウィンドウで開きますが運営する「やさしい日本語の情報をやさしい日本語で発信する」オウンドメディアです。す

          やさにちウォッチのルビ(ruby - ふりがな)のスタイル (改訂版)
        • 年間1000円、エフエム和歌山のAIアナウンサー「ナナコ」の裏側

          ビジネス課題を熟知した現場の人間が「開発者」になる時代 その弱点とは、読み上げる文章のイントネーションを調整する方法が「句読点の場所を変える」ことしかない点だ。新聞社から配信されるニュース原稿を、Amazon Pollyが正確に読み上げるかは分からない。また、音声で流すには文章が長すぎるケースもある。そのため、山口さんは文章を短縮、成形するシステムを自作した。 「クラウドサービスを使うならば、JavaScriptで呼び出せるといった動的なSSMLを作った方が便利。文章成形を自動化したのもそれが理由です。文章を短縮するためのアルゴリズムは単純かもしれませんが、ラジオの現場経験がなければ絶対にできないものだと考えています。5年~10年くらいの経験は必要でしょう」(山口さん) 周りに大勢人がいる環境や、雑踏の中でもニュースの音が聞こえるようにするにはどうするか――。そんな細かなポイントを解説する

            年間1000円、エフエム和歌山のAIアナウンサー「ナナコ」の裏側
          • Alexa Dayで「パルコ様事例にみるAlexaとデジタルサイネージを連携する方法」という話をしてきた #alexaday2018 #jawsug | DevelopersIO

            春寒の候, ウグイスの澄んだ鳴き声が聞かれる季節になりましたが、いかがお過ごしでしょうか、せーのです。 今日は2/11に神戸にて行われたカンファレンス「Alexa Day 2018」に登壇してきたお話です。 きっかけ きっかけは去年の秋に登壇した横浜の「CROSS 2017」というイベントでした。 私は「音声AIアシスタントがもたらす未来とは。」というテーマのパネルディスカッションに参加しました。そこで一緒に参加していた小賀 浩通さん、市川 純さん、伊東 知治さんらとセッション後に雑談していた時に「来年神戸でユーザーグループのカンファレンスを開くんだけど、せーのさん、Alexaで何かしゃべってよ」と言われ、よくある勉強会の感じかな、と思い気軽にOKしました。後にそれが300名以上が参加するイベントで200名強の参加者の前で話す、ということが判明するわけです。 テーマ 今回オファーされたテー

              Alexa Dayで「パルコ様事例にみるAlexaとデジタルサイネージを連携する方法」という話をしてきた #alexaday2018 #jawsug | DevelopersIO
            • 「翻訳こんにゃく」実現化への途中報告:ITエンジニアの高年収戦略:エンジニアライフ

              不朽の名作ドラえもんの中に出てくる「翻訳こんにゃく」が、まもなく実現化出来そうなので、今回はその途中報告をします。さすがに「翻訳こんにゃく」を知らない方はいないと思いますが、念のために簡単に説明をしておきますと、このこんにゃくを食べるだけで英語などの外国語をはじめ、古文書や壁画が読めるようになり、さらには宇宙人とも会話が出来るようになる、夢と希望がつまったこんにゃくです。 ぼくは子供の頃、藤子・F・不二雄先生の想像の世界に胸を躍らせていました。そして大人になり、英語の世界に触れるようになってからというものの、心の底から「翻訳こんにゃく」が欲しいと思うようになっていったのです。特に外資系に入社してからはその必要性が顕著となりました。というのも、ぼくは英語が大の苦手なのです。。。それならば、いちエンジニアとして、「翻訳こんにゃく」を作ってみようと思い至ったわけです。今回はその途中報告をします。

                「翻訳こんにゃく」実現化への途中報告:ITエンジニアの高年収戦略:エンジニアライフ
              • 【レポート】AWS の機械学習サービス入門 #AWSSummit | DevelopersIO

                はじめに オペレーションチームの下田です。 2018年 5月 30日(水) 〜 6月 1日(金)の期間に、グランドプリンスホテル新高輪で開催される日本最大級のクラウドコンピューティングカンファレンス AWS Summit Tokyo 2018 に参加しています。 「AWS の機械学習サービス入門」を聴講しましたので、レポートしたいと思います。 スピーカーは、 アマゾン ウェブ サービス ジャパン株式会社 技術統括本部 ソリューションアーキテクト 川村 誠さんです。 セッションに関する紹介文を、公式サイトから引用します。 セッション一覧 - AWS Summit Tokyo 2018(2018 年 5 月 30 日~ 6 月 1 日)|AWS AWS re:Invent 2017 で拡張された機械学習/深層学習サービス群の今と、サービスレイヤーを中心としたアップデートについてご紹介します。

                  【レポート】AWS の機械学習サービス入門 #AWSSummit | DevelopersIO
                • 音声読み上げソフトでYoutubeなど動画のナレーションをサクッと作る方法。コツとポイント|音声読み上げソフト 音読さん

                  こんにちは、音読さんです。 音読さんを使う方の用途の一つに、Youtubeなどの動画のナレーションに使う、というものがあります。 それもそのはず、声出しをしたくない人にとって音声読み上げソフトはとても便利なんです。 この動画でも音読さんの音声を使い、ナレーションをしています。 音読さんを使って動画のナレーションを作るのには少しだけコツがいると思っています。 今回は、音読さんで動画のナレーションを作る方法を紹介していきます。 音読さんでナレーションを作る方法は 台本を作る。 一行ずつに区切る。 一行ずつ音読さんで読み上げさせてみる。 音声に納得すればそのままダウンロード。 納得がいかなければ、修正する。 ダウンロードした音声を動画編集ソフトへ。 間の取り方を編集していく。 完成。 です。 それぞれの項目で工夫点があるので詳しく解説していきます。 1. 台本を作る。 まずは台本を作ります。 音

                    音声読み上げソフトでYoutubeなど動画のナレーションをサクッと作る方法。コツとポイント|音声読み上げソフト 音読さん
                  • 音声合成マークアップ言語(SSML)バージョン1.1

                    【注意】 このドキュメントは、W3CのSpeech Synthesis Markup Language (SSML) Version 1.1 W3C Recommendation 7 September 2010の和訳です。 このドキュメントの正式版はW3Cのサイト上にある英語版であり、このドキュメントには翻訳に起因する誤りがありえます。誤訳、誤植などのご指摘は、訳者までお願い致します。 First Update: 2012年3月10日 | Last Update: 2015年5月16日 音声合成マークアップ言語(SSML)バージョン1.1 W3C勧告 2010年9月7日 本バージョン: http://www.w3.org/TR/2010/REC-speech-synthesis11-20100907/ 最新バージョン: http://www.w3.org/TR/speech-synthe

                    • 無料で使用可能な音声合成ソフトをPythonで喋らせてみた - OVERS

                      目次 はじめに 自己紹介 音声合成ソフトとは Google Cloud Text to Speech 概要 使い方 VOICEVOX 概要 使い方 CoeFont 概要 比較結果 応用編 配信で使えるYouTubeライブコメント読み上げとして使ってみた まとめ 所感 さいごに はじめに 自己紹介 じげん 求人Div.でエンジニアをしている酒匂と申します。 求人Div.では3つの求人サービスを運用しております。 正社員、派遣、アルバイトなどの幅広い求人情報を扱っており、全国のアルバイト情報を扱っている「アルバイトEX」、正社員求人を専門に扱っている「転職EX」、求人看護師の求人を専門に扱っている「看護師求人EX」があり、これらサービスには複数の企業からいただいた求人情報を掲載させていただいているという特徴があります。 私の業務は主にアルバイトEXの開発・保守を担当しており、転職EX、看護師求

                      • [レポート] Alexa スキル ー ベストプラクティス #Alexa #AWSSummit | DevelopersIO

                        こんにちは、せーのです。 今日は2018/05/30より3日間に渡って東京、品川で開催されている「AWS Summit Tokyo 2018」からセッションリポートをいたします。 このレポートはTech上級 「Alexa スキル ー ベストプラクティス」です。スピーカーはアマゾンジャパン合同会社 Alexa Skills Kit本部 シニアソリューションアーキテクトの小林 剛士氏です。 レポート ジェフ・ベゾスがお客様に宛てた手紙 => we willl continue to focus relentlessly on our customers. 長期的に投資する、というのがAmazon のミッション 2018/3/31 アメリカ、インド、ドイツなどで好評戴いているAlexaを日本で正式に開始した 人間は昔から面倒なことはしない インターフェースの変遷: Character Mode

                          [レポート] Alexa スキル ー ベストプラクティス #Alexa #AWSSummit | DevelopersIO
                        • [新機能] Amazon PollyがNeural TTSに対応しました | DevelopersIO

                          更に今回、Neural TTSとSSML(音声合成マークアップ言語)を使って、ニュースキャスターのように読み上げさせることができるようになりました。この機能はMatthewとJoannaの音声でのみ使用可能です。 やってみた 例としてMatthewでやってみましょう。CNNで配信されているこの記事の文章を使用させて頂きます。 まずは音声エンジンを[スタンダード]で実行。 次に音声エンジンを[ニューラル]に変更して実行してみます。 交互に聴いてもらえれば分かるかと思うのですが、音声が柔らかくなってます。スタンダードでは音にザラつきがあったり発音が潰れている箇所があるのですが、ニューラルだとスームスです。 更に、ニュースキャスターのSSMLを使ってみましょう。設定は以下のように対象のテキストをSSMLタグで囲みます。 <amazon:domain name="news">text</amazo

                            [新機能] Amazon PollyがNeural TTSに対応しました | DevelopersIO
                          • [電話無人対応] Amazon Bedrock + Whisperで住所のヒアリング精度を確認してみた[Amazon Connect] | DevelopersIO

                            [電話無人対応] Amazon Bedrock + Whisperで住所のヒアリング精度を確認してみた[Amazon Connect] はじめに Amazon Connect + Amazon Bedrock + Whisper APIの組み合わせで、電話での発話による住所のヒアリング精度を確認してみました。 ヒアリング精度の確認方法は、発話によって住所を伝えた際、発話通り住所を認識するかAWS Lambdaのログから確認します。 利用シーンとしては、留守番電話やAIチャットボットでの一次対応で住所をヒアリングし、後から人が確認することを想定しています。 ヒアリングした住所をDBと突き合わせるのは、住所の表記揺れ等で難しいため想定していません。 構成 構成としては、下記の通りです。 住所のヒアリングに関して、Connectのフローは下記の通りです。 コンタクトフロー内で「メディアストリーミ

                              [電話無人対応] Amazon Bedrock + Whisperで住所のヒアリング精度を確認してみた[Amazon Connect] | DevelopersIO
                            • VirtualAlexaによるテストドリブンなAlexaスキル開発 - アクトインディ開発者ブログ

                              morishitaです。 「いこーよのおでかけナビ」の開発において、最も役立ったライブラリVirtualAlexaについて紹介したいと思います。 いこーよのおでかけナビ 発売日: 2019/08/27メディア: アプリ 開発環境 このエントリでは次の環境を前提とします。 Node.js v8.10.0 Typescript 2.9以上 (3.0.0以上でも問題ないです) Alexaスキル実装の辛み Alexaスキルの開発コンソールにはAlexaシミュレータというツールが含まれていて、実機に近いE2Eテストが可能となっています。 Alexaシミュレータを利用したテスト/デバッグの開発では次のサイクルを繰り返すことになります。 便利は便利なのですが、繰り返すと次が辛くなってきます。 Lambdaのビルド+デプロイに時間がかかる 実行後の確認が面倒 どこでエラーが発生したのかわかりにくい Clo

                                VirtualAlexaによるテストドリブンなAlexaスキル開発 - アクトインディ開発者ブログ
                              • VOICEVOXをPythonから利用し、wavファイルで保存する方法[AzureとGoogle Cloudの比較あり]

                                PythonからVOICEVOXの音声を合成する方法を紹介します。VOICEVOXの合成音声を、Azure Text to SpeechやGoogle CloudのText-to-speechとも比較してみました。GoogleやAzureと場合によっては互角になりうる期待のソフトウェアです。 VOICEVOX、皆さん使ってますか? 2021年8月ごろに彗星のように登場した、無料なのにかなり優秀な音声合成ソフトウェアです。 今回Pythonから使いたかったのですが、コードベースで使う解説記事がどこにもなかったので書いてみました。 https://voicevox.hiroshiba.jp/ GUIでの使い方は解説されている記事が多いので、この記事ではPythonからコマンドラインベースで音声を出力する方法を書いていきます。インストールのやり方は省略します。 VOICEVOX ENGINE V

                                  VOICEVOXをPythonから利用し、wavファイルで保存する方法[AzureとGoogle Cloudの比較あり]
                                • 人間の声に近い音声をクラウドで作成できるサービスが提供開始

                                  音声技術の応用開発を行うエーアイは、ブラウザ上で人の声に近い自然な音声を合成できるサービス「AITalk 声の職人 クラウド版」を5月9日より提供する。 同社は、2003年に文京区で設立され、音声技術の応用開発を行い続けている企業。2005年にはIPAの次世代ソフトウェア開発・普及事業に採択、コーパスベース音声合成方式と呼ばれる膨大なデータベースを用いる方式で、より人間らしい自然な音声の組み合わせを実現。高品質音声合成エンジン「AITalk」を開発し、40種類近くにおよぶ言語、使用するシチュエーションや用途に合わせた感情表現と滑らかな音声が特徴になる。 防災行政、道路交通情報、観光案内から電話応答システム、ロボットへの組み込み、パッケージやWebでのナビゲーションと活用事例も多い。Webサイトには、OEMとして提供している事例が数多く掲載されており、マツコ・デラックス氏を忠実に実現したアン

                                    人間の声に近い音声をクラウドで作成できるサービスが提供開始
                                  • 【新機能】これでスキル内で流暢な英語も話せる!Alexaスキルの音声にPollyが使えるようになりました! #Alexa 【祝GA】 | DevelopersIO

                                    せーのでございます。Alexaの大型新機能がついにGA(一般公開)になりましたのでご紹介します。 「Amazon Polly音声のAlexa Skill使用」がついに登場です! どんな機能? 今までAlexaの音声は言語につき同じ人からの発話でした。日本人で言えばあのEchoでよく聴く女性の声(Mizuki、といいます)、あれですね。 それがこの機能によりAmazon Pollyで使用されている全ボイスのうち、Alexaで使われる言語にて使われる音声、27音声(2018/10/24時点)が使えるようになりました! 例えば日本語であればおなじみのMizukiの他に男性ボイスのTakumiも使えるようになりました。これでストーリーによって男女の音声を使い分けることも可能になりました。 なにがすごいの? 今回の機能の一番のポイントは「どの言語のスキルであっても"Pollyの全ボイス"が使える」と

                                      【新機能】これでスキル内で流暢な英語も話せる!Alexaスキルの音声にPollyが使えるようになりました! #Alexa 【祝GA】 | DevelopersIO
                                    • 音声合成サービス 一覧比較 =WebAPIがメイン= - Qiita

                                      🔵音声合成サービス 一覧比較 前書き ※追記 2023/12/05:最近ネット動画「AbemaTV」でVOICEBOXのずんだもんの声でのナレーションのCMがあるのを見た(というか聞いた) ※追記 2022/11/29:CoeFontのアイコンが変更してたので該当画像類の反映、他 ※追記 2022/08/14:フリーソフト関連を追加&上書き (これに伴い、今まで使ってた「フリーFree」は「組み込めタイプのFreeソフト」に変更) └ 「VOICEVOX」「COEIROINK」「TALQu」 の3つ └ フリーソフト関連部分に特化した記事(スクショなど画像あり):↓これ ※追記 2021/12/25:「CoeFont」関連について追加&上書き └ 「CoeFont」関連部分に特化した記事(スクショなど画像あり):↓これ ※リンク追加「* まず予備知識」の章に & 少し文章追加や推敲 @追

                                        音声合成サービス 一覧比較 =WebAPIがメイン= - Qiita
                                      1