タグ

音声に関するga_jiのブックマーク (3)

  • 東京大学 講義 UT OpenCourseWare

    東京大学の講義や公開講座の映像・音声をポッドキャストでもお楽しみいただけます。東京大学が誇る「世界の叡智」をいつでも、どこでも、より多くの方々に体験していただきたいと考えています。 MIMA Search とは、UT OCW、MIT OCWに公開されている各授業のシラバスの関係を構造的に見ることができる検索システムです。MIMA Searchは、シラバスに含まれている各種の情報をもとに、検索結果を「点」と「線」でネットワーク表現します。

    ga_ji
    ga_ji 2010/11/19
  • IHARA Note

    数ヶ月前に、桃音モモの音源から歌声をワンフレーズ作った(モモ - IHARA Note)。 今回はその続きとして、話者が変わっても合成できるかなと波音リツで試してみた。ただし、歌声ではなく話し声であり、「忘れ物」という単語である。手作業である(古典的な信号処理による合成。非UTAU、非VOCALOID、非機械学習、非STRAIGHT・WORLD系手法、非LPC)。 20210125_wasuremono.wav - Google ドライブ 機械らしさはぬぐえないが、そこそこ満足のいく合成音となった。ただし、波音リツっぽさは消えてしまっている。波音リツには、「高音」「通常音」「低音」の三種類が用意されていたが、その「低音」の音源だけで合成しているせいだろうと思われる。 ところでこれは別の目的の研究から派生したものなのであるが、そのメインであるはずの別の研究のほうに大した知見が得られず、音声合

    IHARA Note
  • 子音の調音位置の弁別法が分からないということと、ゼロ交差グラムの正式名称が知りたいということ。 - IHARA Note

    相変わらず、子音について興味がある。日の日記は、「b,d,g」の違いがスペクトログラムやその亜種を見ても分からなかったのでスペクトログラムを見ても分からないところに違いがあるのではないかという感想と、DFTによるスペクトログラム以外にも時間周波数分析法はあるので自己流で時間周波数分析をしていたけどその分析法でも子音の調音位置が見えなかったという報告である。前者の「感想」は単なる感想である。後者の分析法はそこそこ面白いかもしれない。 まず、問題のない話からである。私の把握している限りでは音声の母音は何を解析すれば弁別できるのかが比較的はっきりしている。帯域ごとのパワーの分布である。のどから唇までは、太さの異なる管が縦続接続されていると近似的に見なすことができ、接続されている管の太さと長さを方程式にあてはめれば、パワーの分布が出てくる。人が母音を発するときには管の太さを舌などによって変化させ

    子音の調音位置の弁別法が分からないということと、ゼロ交差グラムの正式名称が知りたいということ。 - IHARA Note
  • 1