タグ

テキストとAIに関するkyo_agoのブックマーク (1)

  • Amazonの侵略。AWS AI ソリューション『Polly』『Rekognition』の凄さ | Ledge.ai

    もう見出しで全部いいきっちゃってますが、要するに読み上げツールの1つです。 今のところ24の言語に対応し、言語によっては(日語は1パターンのみですが)複数のキャラクター選択も可能。もちろんアプリやWebからの呼び出しもカンタンという便利なサービス。 仕組みとしては以下のような感じ つまりテキストを意味分類し、指定言語において『その文脈で読み上げるには何が適切か』をまず判断。 さらにそこから『この文節の並びならこんな抑揚になるはず』という音韻を学習データから作成。調整して出力するイメージらしいですね。 この仕組みなら、例えば日語特有の『かなカナ仮名&アルファベット混じり』のテキストでも割となんとかしてくれたりしちゃいます。 これは既存テキストを上手く活かしたい場合にかなり有用ですね。安すぎるほど安いですし。 実際のデモ例 別タブで再生する場合はこちら リップシンクに使える?スピーチマーク

    Amazonの侵略。AWS AI ソリューション『Polly』『Rekognition』の凄さ | Ledge.ai
  • 1