タグ

音声に関するSuperAlloyZZのブックマーク (3)

  • 音声合成・歌声合成の新星「CeVIO」、その謎が解けた!

    等身大の3Dキャラクターが感情表現豊かに客と会話するデジタルサイネージが東京のアニメイト秋葉原で稼働している。キャラクターの名前は「さとうささら」。「CeVIO Vision」というシステムを使っている。 4月26日午後6時には無償の音声合成・歌声合成アプリケーション「CeVIO Creative Studio FREE」も公開された。このCeVIOというプロジェクト、素性がただものではないことは分かるのだが、どこが主体でやっているのかは不明だった。ようやくその実体が判明した。 稼働しているシステムをアニメイト秋葉原まで見に行ってみたが、MMDAgentを使った双方向音声デジタルサイネージである名古屋工業大学のバーチャル案内嬢「メイちゃん」と構成が似ている。真相を問い合わせみたが、もうちょっと待ってくれと言われて3カ月。ようやく取材が実現したのがつい先日のことだ。 話をうかがったのは、名古

    音声合成・歌声合成の新星「CeVIO」、その謎が解けた!
  • 音声認識 - Wikipedia

    音声認識(おんせいにんしき、英: speech recognition)は声がもつ情報をコンピュータに認識させるタスクの総称である[1]。ヒトの(天然)音声認識と対比して自動音声認識(英: Automatic Speech Recognition; ASR)とも呼ばれる[2]。 例として文字起こしや話者認識が挙げられる。 タスク[編集] 音声認識は「音声に含まれる情報を認識するタスク」の総称であり、具体的に解かれる問題の例として以下が挙げられる: Speech-to-Text (STT): 含まれる言語情報を文字に変換するタスク。いわゆる文字起こし キーワード認識(英語版)(KWS): 事前に設定されたキーワードの出現を認識するタスク。例として「ヘイ、Siri」 音声認識をサブタスクとして含むタスクには以下が挙げられる: 音声操作: 音声によるアプリの操作。SST/KWSで音声情報を取り出

  • ΔΣ変調 - Wikipedia

    ΔΣ変調(デルタシグマへんちょう)とは、パルス密度変調 ( PDM英語:pulse-density modulation )方式の一種である。音声などの信号に対して用いられることが多い。 半導体技術の発達や精度の必要なアナログ的な部分が少ないなどの点から、A/D変換及びD/A変換で多用されている。 量子化雑音のパワースペクトル密度分布の形状を整形(ノイズシェーピング)し、通過帯域のダイナミックレンジを向上させる。また、より小さな量子化語長数に符号化する効果もある。 古典制御工学においては、PI制御に分類される。 1960年代初めに当時大学院生で、後に早稲田大学理工学部教授などを歴任する安田靖彦が、Δ変調(差分パルス符号変調)のオフセットの問題が回避された方式として考案・開発し、「Δ-Σ変調」と命名した[1]。以上の経緯もあり日ではほぼ「ΔΣ」の順で呼ばれるが、再生側の処理構成を数式的な

    ΔΣ変調 - Wikipedia
  • 1