タグ

voiceに関するtkoieのブックマーク (6)

  • 声の種類と発声のしくみ|研究開発|OKI

    声の種類と発声のしくみ 1.声ってどんなもの? 2.母音の発声のしくみ 3.子音の発声のしくみ 1.声ってどんなもの? 言葉は人間がいちばん最初に作った文明といわれ、100万年前に母音らしきものが生まれました。その後、5万年の間に子音が加わり、現在の音声(言葉)の原型ができあがりました。これから、音声信号の性質について学習して行きましょう。まず、図1.にいろいろな音声信号を示します。 ここで、図1.から音声信号の性質を考えてみましょう。 周期的である 波形をみると最初にわかる性質です。しかし、この性質は/a/,/i/,/u/,/e/,/o/などの母音や/n/鼻音にみられる性質で、/s/や/k/などの子音にはみられません。この周期は『ピッチ』と呼ばれており、声の高さを決める要因です。 音韻により波形の形が違う 楽器の音色が違うように音韻により聞こえ方(波形の形)が違っています。これは『ホル

    tkoie
    tkoie 2010/11/19
    [1)声は周期的であり、音韻によって波形が異なる。2)母音の発声において、声帯の振動周期が『ピッチ』(声の高さ)を与え、声道の形が『ホルマント』(声の種類)を与える。3)子音の発生においては、複雑。
  • MATLAB 音声信号処理

    MATLAB 音声信号処理 MATLAB 音声信号処理 new 音質評価のためのソフトウェア 2006/12 まずは試してみる (command windowにpasteして実行させてください) 正弦波信号を作成する ガウス雑音を作成する MATLABでハレルヤを聴く 電話機の音を再現する MATLABで音声を録音して再生する 録音した音をWAVEファイルとして保存する 声の変換 MATLABで笑う 様々な信号 インパルス ステップ ランプ 加速度 のこぎり波と方形波 sinc関数とDirichlet関数 chirp信号 正弦波信号を画像として見る 2次元の一様乱数 窓関数・種々の変換 矩形窓 ハミング窓 ハニング窓 高速フーリエ変換 (FFT) スペクトログラム 離散コサイン変換 (DCT) ヒルベルト変換 離散フーリエ変換デモ ディジタルフィルタの基礎 畳み込み積分 振幅特性と位相特性

    tkoie
    tkoie 2010/11/09
    ①まずは試してみる②様々な信号③窓関数・種々の変換④ディジタルフィルタの基礎⑤FIRフィルタ⑥IIRフィルタの間接設計⑦統計的信号処理
  • メル周波数ケプストラム(MFCC) - Miyazawa’s Pukiwiki 公開版

    スペクトラム(spectrum)とは † 音声や地震波などの周期性のある信号は、どれだけ複雑な信号であっても、単純な波に分解できる(フーリエの定理) 単純な波...単一の周波数と振幅をもつ正弦波、余弦波 上記の定理に従って、ある信号の周波数成分と振幅の成分を抽出したものが、周波数スペクトラム(スペクトル)です*1。 スペクトラムの求め方(MATLABによる説明) 以下のような複雑な波を考えます。 MATLABで上の波を生成するには、以下のコードを実行 time = 0 : 1 / 8820 : 0.05; sinwav_1 = 1.2 * sin(2 * pi * 130 * time); coswav_1 = 0.9 * cos(2 * pi * 200 * time); sinwav_2 = 1.8 * sin(2 * pi * 260 * time); coswav_2 = 1.4

    tkoie
    tkoie 2010/11/09
    MFCCの意義と応用:メリット:ケプストラム:低次成分: 個人差の大きいピッチ成分を除去して、音韻の特定にとって重要な声道の音響特性(すなわち、口腔の形)のみを抽出できる.
  • praat極私的研究室

    PRAATは音声分析・合成等を用途として開発公開されているプログラムです。 機能は豊富なのですが,使い方に癖がある観も否めません。また公式サイトや マニュアルが英語であることもあって,国内ではまとまった情報が見つけにくい 気がします。 たまたま2004年LET関西支部大学授業研究部会11月例会でこのプログラムに ついて紹介する機会があり,その時にいただいた質問をベースにちょこちょこと 使い方を探っている状態です。 このページではこちらで見つけつつあるPRAATの使い道・使い方について 備忘録的にまとめていきます。当然ながら,ここの手順が[唯一の|正しい]解とは 言えません。PRAATには公式サイトもマニュアルもありますから,そちらにも 目を配っていただくことを強く勧めます。 また,こちらでの記述の誤りや 「うちではこういう使い方をしていますけど...」といったメモがありま

    tkoie
    tkoie 2010/01/08
    このページではこちらで見つけつつあるPRAATの使い道・使い方について 備忘録的にまとめていきます。当然ながら,ここの手順が[唯一の|正しい]解とは 言えません。PRAATには公式サイトもマニュアルもありますから・・・
  • The Julius book (日本語)

    目次 まえがき1. 概要動作環境音声認識システムの実行に必要なものパッケージの構成処理フロー2. インストールバイナリパッケージソースからコンパイルするコンパイル時オプションlibsent オプションlibjuliusオプションjuliusオプションコンパイル手順の詳細LinuxWindows - cygwinWindows - mingwWindows - Microsoft Visual C++3. 音声データ入力基フォーマットビット数チャンネル数サンプリングレートファイル入力サポートするファイル形式録音デバイスからの直接入力録音デバイスの条件OSごとの詳細入力遅延の調整ネットワーク・ソケット経由の入力ネットワーク経由esd標準入力DATLINK/NetAudio特徴量ファイル入力プラグインによる入力拡張について4. フロントエンド処理・特徴量抽出フロントエンド処理直流成分除去スペク

    tkoie
    tkoie 2010/01/05
    この文書は,音声認識エンジン Julius のトータルリファレンスである.インストールから音声入力の仕様,各モデルの具体的仕様,オプション一覧,ライブラリ・プラグインの解説などが書かれている.
  • Home | Linguistic Data Consortium

    Human language technologies require large amounts of data to train, develop and test models and systems. There is a direct relationship between data quality and system effectiveness, that is, good data makes good systems. LDC ensures that the community has access to high-quality data sets through effective data management practices that cover such matters as accessibility, usability, curation and

    tkoie
    tkoie 2009/03/31
    The Linguistic Data Consortium supports language-related education, research and technology development by creating and sharing linguistic resources: data, tools and standards.
  • 1