タグ

speech_synthesisに関するmroriiのブックマーク (3)

  • 初音ミクなどの音声合成のしくみ。 - IHARA Note

    初音ミクという歌声合成ソフトが売り出されてから約半年が経つ。その間、様々な初音ミクに対する言説を見てきたが、社会的・心理的・哲学的な観点からの言及ばかりで、科学的な観点からの言及が少なかったので、科学的な観点から簡単な解説を書いた。絵を読むようなつもりで眺めていただければ幸いである。 リンク先のページに誤りがありましたので、訂正記事にて訂正させていただきました(2008年3月26日)。 初音ミクとかの音声合成のしくみ また、音声合成ではなく、音声認識についてもかなり前に書いたので、合わせて読んでいただけると幸いである。 音声認識のしくみ 簡単にしか書いていないので、詳しいことを知りたい方は、専門書を読んでください。板橋先生のには音声のことが情報工学的な観点から詳しく書かれており、古井先生のには物理的な音波としての音と情報工学的な音声のことが半分ずつくらい書かれています。どちらも理工系

    初音ミクなどの音声合成のしくみ。 - IHARA Note
  • 音声合成

    コンピュータで声を作る流れコンピュータでは、言語処理、韻律(いんりつ)生成、波形処理をして、音声が合成されます。 (韻律とは、声の高さ、イントネーション、リズム、ポーズなどの喋り方の特徴です) 音声合成用の発音言語処理部では、漢字やひらがなの混じった文章を音声合成用の発音に変換します。この発音は、私達が普段使っている漢字を読むための「ふりがな」とは違います。例を挙げてみましょう。 音声を作る方式を3つ紹介富士通音声合成の波形処理部には、主な方式が3つあります。 「音節接続方式」、「コーパスベース方式」、「大規模コーパスベース方式」 それぞれ音声波形辞書の容量が異なるため、携帯電話やカーナビや音声サービスなど音声合成機能が組み込まれる製品の特徴に応じて使い分けられています。 音節接続方式音声波形辞書:数MBから約10MB(日語の50音、濁音、半濁音等約140音の音声を登録)特長:少し機械

    音声合成
  • 初音ミクとかの音声合成のしくみ

    2007年に「初音ミク」という歌声合成ソフトがブレイクしました。 そこで、わけもなく「音声合成のしくみ」を簡単に解説します。 とはいっても、VOCALOIDシリーズは手法が明かされていないので、 かなり推測が入っています。 その推測した部分が誤っていたので、 この色で加筆します(2008年3月29日)。 誤っている部分もそのまま残してあります。 また、手法もかなり明かされているようです。 ところで、結構たくさん図がありますが、 あまり正確ではありません。 また、内容そのものもかなり簡易化してあります。 音声合成って何? まずは音声合成とはなんぞやという話なのですが、 一般的には、文字を音声信号にすることです。 イメージとしてはこんな感じです。 初音ミクの場合、そこに音程や音の長さやその他いろいろも入ってくるので、 イメージとしてはこうなります。 音声波形を拡大してみる 一般に、音声波形はな

  • 1