タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

音声認識と研究に関するyamikuro1226のブックマーク (3)

  • UT OpenCourseWare

    東京大学の講義や公開講座の映像・音声をポッドキャストでもお楽しみいただけます。東京大学が誇る「世界の叡智」をいつでも、どこでも、より多くの方々に体験していただきたいと考えています。 MIMA Search とは、UT OCW、MIT OCWに公開されている各授業のシラバスの関係を構造的に見ることができる検索システムです。MIMA Searchは、シラバスに含まれている各種の情報をもとに、検索結果を「点」と「線」でネットワーク表現します。 講義: 計数工学科(数理工学/数理情報工学/システム情報工学)4年 応用音響学 夏学期 火曜日 8:30-10:00 講義項目: 1. 音声信号とは? (音声学の初歩、ピッチとフォルマント) 2. 音声分析 (音声スペクトル、ケプストラム解析、線形予測(LPC)分析、偏自己相関(PARCOR)分析、線スペクトル対(LSP)分析) 3. 音声符

  • たまには専門のことを。 - IHARA Note

    音声工学をずっとやってきたはずなのに、最近十件の中に音声が少なかったので、音声のことを書く。音声工学といっても様々な応用分野があり、現在世間に流行しているバイオメトリクスなども古くから研究されていたり、比較的新しいところでは感情認識なども研究されていたりする。全てについて一度に語ることは私にはできないので、音声認識について語る。 音声認識(機械による自動音声認識)の性能が使い物になるレベルか使い物にならないレベルかということに関しては、様々な人が様々なことを言っているが、どの人も「まだ性能が上がる余地はある」ということに関しては共通して思っているようである。ただし、どの部分をいじれば性能が上がるかということに関しては見解がばらばらである。 機械による音声認識というのは、大きく二つの部分に分かれている。音響モデルと言語モデルである。どちらもさらに細かく分類することができ、それぞれの人がそれぞ

    たまには専門のことを。 - IHARA Note
  • The Use of Overlapped Sub-Bands in Multi-Band, Multi-SNR, Multi-Path Recognition of Noisy Word Utterances - IHARA Note

    電子情報通信学会の英論文誌に、私が博士課程のときの後輩(当時修士課程)の論文が出た。The Use of Overlapped Sub-Bands in Multi-Band, Multi-SNR, Multi-Path Recognition of Noisy Word Utterancesである。彼と最も頻繁に最も長い時間ディスカッションしていたのが私なので、私の名前も第二著者として載せてもらっている。後ろの二人は先生である。 技術とは関係のない話からすると、彼は非常に勤勉だった。頭も使っていたし、手もよく動かした。また、英語は日常会話ならば全く問題なく流暢に喋ることができた。体力もあった。できる学生の典型像である。できる学生というのは、決して「たまにふらっと研究室に来てものすごい手際のよさで研究を終わらせていく」学生ではなく、「長時間研究室に滞在してねばり強く問題の解決にあたっていく

    The Use of Overlapped Sub-Bands in Multi-Band, Multi-SNR, Multi-Path Recognition of Noisy Word Utterances - IHARA Note
  • 1