タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

algorithmとtechnologyに関するtaninswのブックマーク (2)

  • 初音ミクとかの音声合成のしくみ

    2007年に「初音ミク」という歌声合成ソフトがブレイクしました。 そこで、わけもなく「音声合成のしくみ」を簡単に解説します。 とはいっても、VOCALOIDシリーズは手法が明かされていないので、 かなり推測が入っています。 その推測した部分が誤っていたので、 この色で加筆します(2008年3月29日)。 誤っている部分もそのまま残してあります。 また、手法もかなり明かされているようです。 ところで、結構たくさん図がありますが、 あまり正確ではありません。 また、内容そのものもかなり簡易化してあります。 音声合成って何? まずは音声合成とはなんぞやという話なのですが、 一般的には、文字を音声信号にすることです。 イメージとしてはこんな感じです。 初音ミクの場合、そこに音程や音の長さやその他いろいろも入ってくるので、 イメージとしてはこうなります。 音声波形を拡大してみる 一般に、音声波形はな

  • 音声認識のしくみ

    音声認識を紹介するページ とにかくここでは、 だらだらと「音声認識」というモノを紹介します。 全体が(ほぼ)このページ一枚に収まっています。 ところどころにリンクがありますが、 そのリンク先には、 難しい話やこぼれ話みたいなものがちょこちょことあります。 ところで、話を簡単にするために、 ちょっと嘘を混ぜています。 そうでないと、ものすごく複雑な話になるので。 音声認識ってなにさ 簡単に言ってしまえば、 人間が喋った声を機械が文字に直すことです。 図で描くとこんな感じです。 左側が音声波形(つまり、声を図に表している)で、 右側がそれをひらがなに直したものです。 左側の音声波形を少し詳しく見てみる 人間は耳で音を聞きますが、 機械はマイクで音を聞きます。 そして、マイクで収録された音をそのまま表示させると、 下のような感じになります。 横軸が時刻で、縦軸が振幅です。 音声というのは、ようす

  • 1