タグ

音声認識に関するPhinlodaのブックマーク (5)

  • 引越ししたので未来なお部屋を作ってみた。 - お前の血は何色だ!! 4

    年の瀬に引越ししたので、部屋の再構築を行った。 コンセプトは快適に引き篭もれる未来の部屋。 その紹介をしたいと思う。 図面 一部省略の図面、古い建物なのでちょっと広い。 10m2 * 2部屋ぐらい。 何度か検討を繰り返してこの形式に落ち着いた。 カーテンを100インチのディスプレイにしてみた カーテンレールに100インチのスクリーンを釣り下げてみた。 カーテンが支えられるんだから、100インチのスクリーンぐらい支えられるだろうという発想。 カーテンレールに入れるのにLANケーブル用のマーカータイを使ってみた。 束ねれば結構強固である。 スクリーンの後ろは黒塗りされているので裏写りはないと思うけど、念のための裏写り防止のためと、昼間でも投影できるように暗室を作りたかったので、暗室用のブラックカーテンを後ろに引いている。 プロジェクターはNECの NP-U310WJD 短焦点プロジェクターを使

    引越ししたので未来なお部屋を作ってみた。 - お前の血は何色だ!! 4
  • ema log - Mac の say コマンドがうらやましかったので調べてみた - Mac の say コマンドがうらやましかったので調べてみた

    このページは検索エンジンのクローラ用のページです。最近のエントリ一覧などノイズになりやすい項目を除去しています。 Windows には Speech-API なるものがあるようです。XP 以降には標準搭載?? Ruby でも Win32 Utils というライブラリの中にこの API 用のラッパーを用意してくださっている方がいるようです。 gem install win32-sapi で 0.1.3 (mswin32) を選択してインストール。んで、 @echo off goto endofruby #!/bin/ruby # say require 'win32/sapi5' Win32::SpVoice.new.speak( ARGV.join( ' ' ) ) __END__ :endofruby "%~d0%~p0ruby" -x "%~f0" %* のような、say.bat を

  • Podcastleとは - Podcastle.jp

    Podcastle(ポッドキャッスル)は,音声版のブログであるポッドキャストを日語で検索できるサー ビスです.Podcastleのトップページから好きな言葉を 入力し,検索してみてください.あなたの知らなかったポッドキャストと出会えるかもしれません. Podcastleは,音声認識という技術を使い,音声を文字に変換しています. つまり,コンピュータがポッドキャストの音声を解析・認識し,文字として書き起こします. そして,その文字列から全文検索を行い,検索結果を表示します.産業技術総合研究所 (AIST)の音声認識技術を用いることによって,高精度の認識性能を実 現しています. 日語には,同音異義語が多数あります.また,聞きとりにくい音声は, 人間が聞いても間違えてしまうことがあります.そのような音声は,コンピュータにも 認識できません.また,音声認識技術はまだまだ研究段階なので,人間には

  • PtoPA、音声自動会話コンテンツの制作を容易にする技術を開発

    ピートゥピーエー(PtoPA)は4月25日、コンテンツごとに特別な言語モデルを作成しなくても、音声認識や音声自動会話などのコンテンツ制作が簡単に行える「言語モデル自動生成技術」を開発したと発表した。 言語モデル自動生成技術は、音声自動会話のコンテンツ(会話シナリオのナレッジベース)から自動的に言語データ(コーパス)を抽出し、それぞれの言葉の認識優先順位を自動的に設定する技術。PtoPAが独自に開発した汎用辞書を利用して、同じ意味でも言い方が異なる多数の言い回しを自動的に言語モデルに生成する。 専門知識や時間と費用を必要とする、手作業による膨大なコーパスの収集や、コンテンツ専用の言語モデルを作成することなしに、手作業で2〜3カ月をかけて作成した言語モデルの80%以上をカバーする自動生成言語モデルを生成することができるという。 PtoPAでは、電話を使った音声での自動FAQや、カーナビ、ロボッ

    PtoPA、音声自動会話コンテンツの制作を容易にする技術を開発
  • 日立、隣り合う複数の人の音声を聞き分ける音声処理技術

    日立製作所中央研究所(福永泰所長)は4月20日、隣り合う人が同時に話す 音声を聞き分ける音声処理技術を開発したと発表した。 複数のマイクロホン(マイク)素子を使って音の発生位置(音源位置)を瞬 時に高い精度で測定する技術と、特定の方向からの音声だけを抽出する技術に よって実現したもの。この技術を用いることで、マイクから1-2m離れた複数の 人の音声を聞き分けたり、周辺の雑音を取り除いて特定の音声だけを抽出でき たりするので、テレビ会議での雑音の除去や、雑音の多い環境での音声認識精 度の向上のほか、複数のマイクで録音したビデオ映像の中から特定の人の音声 だけを抽出することが可能。 具体的には、一瞬で高精度に音源位置を測定する「近接音源定位技術」によ って、近接した音源に対して位置を推定する性能が向上した。また、突発的な 雑音を選択的に除去する「空間音声フィルタリング技術」は、音源位置の推定

    日立、隣り合う複数の人の音声を聞き分ける音声処理技術
  • 1