speechに関するmorningriverのブックマーク (6)

  • Speech Signal Processing Toolkit (SPTK)

    Speech Signal Processing Toolkit (SPTK) Version 3.11 December 25, 2017 The Speech Signal Processing Toolkit (SPTK) is a suite of speech signal processing tools for UNIX environments, e.g., LPC analysis, PARCOR analysis, LSP analysis, PARCOR synthesis filter, LSP synthesis filter, vector quantization techniques, and other extended versions of them. This software is released under the Modified BSD l

  • STRAIGHT Wiki - STRAIGHT wiki

    2008-12-04 STRAIGHT HowToUse STRAIGHT Library 2008-11-27 STRAIGHT Wiki 2008-07-31 STRAIGHT History 2008-07-15 STRAIGHT Demo 2008-06-16 RecentDeleted 2008-04-30 SandBox InterWikiName 2004-11-20 MenuBar STRAIGHT Wiki † 高品質音声分析変換合成方式STRAIGHTのWikiへようこそ. このWikiは,音声合成に関する技術(VOCALOID等合成方式は問いません)について,技術・作品を通じて情報交換が出来る場を目指しております.管理人はSTRAIGHTと呼ばれる分析合成方式を使う研究者なので,STRAIGHTに関する話題が多くなると思います. でも,他の優れた方法と連携してみたいな

  • オノマトペン

    オノマトペを声に出しながら線を引くことで、そのオノマトペに応じた質感で線を描けるインタフェースです。 例えば「モコモコ〜」と言いながら線を引くと、モコモコした線を描くことができます。 動画 高解像度版 (QuickTime, H.264) ニコニコ動画版 機能 オノマトペに応じて以下のようなブラシで線を描くことができます。 また、コピー&ペーストのような編集操作や、 写真の変形といった画像加工にもオノマトペを使います。 ブラシ 編集・画像加工 特徴 マルチモーダル・モードレス ボタンやショートカットを使った明示的な切り替えが必要ありません。 操作から操作へスムーズに移行できます。 機能と入力の感覚的なマッピング 機能と入力の対応付けが分かりやすく、入力した結果描かれる線をイメージしやすくなっています。 エンターテイメント 絵を描くのが楽しくなるかも 実装 音声認識にはオープンソースの音声

  • 2008-SLP-73

    第73回 音声言語情報処理研究会 (SIG-SLP) (第4回 音声言語情報処理技術デベロッパーズフォーラム) 日時: 平成20年10月24日(金) 会場: 東京工業大学 大岡山キャンパス 西8号館10階大会議室 (〒152-8550 東京都目黒区大岡山2-12-1) 地理案内 連続開催:JEITA主催 "Speech Technology: Today and Tomorrow" 10月のSLP研究会は、この数年にわたりご好評を頂きました 「音声言語情報処理技術デベロッパーズフォーラム」として開催し、 音声認識音声合成などの実用化に焦点を置いた議論を行いたいと思います。 特に今回は、JEITA主催の同趣旨の シンポジウム "Speech Technology: Today and Tomorrow" (10月23日開催)と同一会場で連続開催になりました。 SLP研究会では、一般発表に加

    morningriver
    morningriver 2008/09/03
    雑種路線の中の人がSLPで講演
  • 「最近の日本語は乱れている!」とか主張すると、なぜ国語学者はニヤニヤするのか。 - 小学校笑いぐさ日記

    なぞなぞです。 母には2回会ったけれど、父には会わなかった、というものなーんだ? ヒント:これは平安時代のなぞなぞです。 (「母には二度逢ひたれど父には一度も逢はず」『後奈良院御撰何曽』) こたえ:くちびる えーと、「なんでだ!」って話を説明すると長くなります。 (有名な話ではあるんですが) 半濁音(ぱぴぷぺぽ)を含む言葉の多くは外来語で、いわゆる「和語」には少ないことは、皆さんご存じと思います。 これはなぜか。 これは、日語の発音の変遷に理由があります。 日語では、古くは、「はひふへほ」という字を書いて、「パピプペポ」と発音していました。 (しかし、文字で説明するのが難しい話題だな) だから、「はは」という言葉を発音する時、実際の発音は現在の「パパ」に近くなりますから、唇が2回合わさるのです。 これがなぞなぞの答えの答え。 さて、もっと時代が下ると、「は行」は「ファ フィ フ フェ

    「最近の日本語は乱れている!」とか主張すると、なぜ国語学者はニヤニヤするのか。 - 小学校笑いぐさ日記
  • 自分の声で音声合成 OKIがソフト発売

    沖電気工業(OKI)は7月24日、自分の声から音声を合成し、入力したテキストを読み上げられる音声合成ソフト「Polluxstar」(ポルックスター)を発売した。あらかじめ録音しておいた自分の声のデータベースを元に音声を合成する仕組みだ。 病気などで声を失った人に、自分の声の代わりとして使ってもらうといった用途を想定している。価格は音声データベース製作費用を含めて105万円。 「カスタム原稿」でイントネーションや方言も再現 あらかじめ録音しておいた声を「音素」と呼ばれる細かい単位に分解してデータベースを作成。PC上で入力したテキスト通りの音素を抜き出して組み合わせ、音声を再生する。 データベースを作る作業は、ユーザーの声の録音から始まる。同社が用意した自然文の原稿をユーザーに朗読してもらい、その声を録音。原稿の長さは1000文ほどで、読み上げると60分くらい。収録には2~3時間かかるという。

    自分の声で音声合成 OKIがソフト発売
  • 1