タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

PDFとspeechに関するgologo13のブックマーク (5)

  • 6 音声情報 (オーディオ、サウンド) のデジタル処理 • 応用  通信:電話、TV 電話、インターネット電話  放送:TV, CATV, CS  蓄積:音楽用 CD, DAT, DV, DVD  合成:コンピュータミュージック

    6 音声情報 (オーディオ、サウンド) のデジタル処理 • 応用  通信:電話、TV 電話、インターネット電話  放送:TV, CATV, CS  蓄積:音楽用 CD, DAT, DV, DVD  合成:コンピュータミュージック (シンセサイザー) 6.1 音の性質 6.1.1 音波 • 音とは、物体 (音源) の振動、すなわち周期的に繰り返される運動が空気に伝え られた結果、空気に圧力の周期的変化がおき、その波が空気中を伝わる現象。 • 音圧 音によって空気の圧力が変化するときの、空気の圧力を音圧という。人間は音 圧の変化を耳を通じて音として知覚し、またマイクロホンは電気信号 (電圧の 時間に対する変化) に変換する。大きな音圧は大きな電圧を生むが、後述のよ うに、人間にとっての「音の大きさ」は、音圧だけで決まるわけではない。 – 圧力  Pa = N/m2 – 大気圧= 1.013

    gologo13
    gologo13 2010/12/01
    6 音声情報 (オーディオ、サウンド)のデジタル処理. 音声の信号処理周辺の話.数式も出てるしかなり詳しめ.良いね
  • 音声圧縮もMPEG-2

    音声圧縮の原理と実際 BS デジタル放送では、ハイビジョン映像にふさわしい高音質のマルチチャンネルステレ オ音声サービスが求められます。こうした音声サービスを実現する音声符号化方式として わが国で採用されたのが、MPEG-2 Audio 規格の中の AAC(Advanced Audio Coding) 符号化方式です。MPEG-2 Audio には、AAC の他に BC(Backward Compatible)と呼 ばれる方式もあり、 日の CS デジタル放送および欧州のデジタル放送で採用されています。 AAC は、BC に 2 年半ほど遅れて開発・標準化された方式で、BC に比べ約 2 倍圧縮効率 が高いとされています。圧縮前の音声品質を 5 として 5 段階評価をしたときに、評価値の 平均および最悪値が 4 以上になるために必要となる情報量は、表 1 に示すようになってい ます。BS

    gologo13
    gologo13 2010/11/30
    音声圧縮の原理と実際
  • http://www.sound.sie.dendai.ac.jp/dsp/Text/PDF/Chap2-7.pdf

    gologo13
    gologo13 2010/11/30
    2-7 高能率符号化
  • TeX output 2010.01.20:1242

    語話し言葉コーパスを用いた異なるタスクに対する 音声認識∗ ☆西井 俊介,篠崎 隆宏,古井 貞熙 (東工大) 1 はじめに 音声認識のタスクは多様であるが,各タスクに 対してどのようなコーパスに基づき学習した音 響モデルを用いて音声認識をするのが適当であ るかは,従来あまり調べられてこなかった.そこ で研究では代表的なタスクとして,話し言葉, 読み上げ音声,対話音声に対して,日語話し言 葉コーパス (CSJ)[1] 及び新聞記事読み上げ音声 コーパス (JNAS)[2] に基づき学習した音響モデ ルを用いて音声認識を行い,性能評価を行った. その結果より CSJ を用いて学習したモデルを用 いることで,JNAS モデルと比較して多くのタス クにおいて同程度またはより高い認識性能が得 られることを示す. 2 音響モデル 音響モデルの学習用データセットとして以下 のものを用いた. •

    gologo13
    gologo13 2010/11/29
    日本語話し言葉コーパスを用いた異なるタスクに対する 音声認識
  • https://nlp.cs.nyu.edu/pubs/papers/uchimoto-nlp03.pdf

    gologo13
    gologo13 2010/11/29
    日本語話し言葉コーパスの形態素解析
  • 1