音声に関するkmasu_Tのブックマーク (13)

  • その発言は本心? 話し方から「真実らしさ」を自動判定するサイト | WIRED VISION

    その発言は心? 話し方から「真実らしさ」を自動判定するサイト 2008年4月21日 カルチャー コメント: トラックバック (0) Bryan Gardiner 高級売春組織の顧客であることが発覚して辞任に追い込まれたニューヨーク州のEliot Spitzer知事は、実際のところ、辞任の意向を表明する演説中にどれほど自責の念にとらわれていたのだろうか? キリスト教のテレビ伝道者、Pat Robertson氏は、空手とキリスト教についてどう考えているのだろうか? Robertson氏は、「なんらかの悪霊を吸い込む」ことによって超人的な力が得られる、と気で信じているのだろうか? 『RealScoop』は、これらの重要な疑問に対して、独自の「高度なアルゴリズム」と音声分析技術を利用して答を出そうとしている。 RealScoopは基的に、(たいていは不祥事を起こした)公人が行なった音声や動画

  • TechCrunch Japanese アーカイブ » 音声の未来は音なしの音声?

    The French Secretary of State for the Digital Economy as of this year, Marina Ferrari, revealed this year’s laureates during VivaTech week in Paris. According to its promoters, this fifth…

    TechCrunch Japanese アーカイブ » 音声の未来は音なしの音声?
  • Engadget | Technology News & Reviews

    The Biden Administration opens $285 million funding for ‘digital twin’ chip research institute

    Engadget | Technology News & Reviews
  • 日立、隣り合う複数の人の音声を聞き分ける音声処理技術

    日立製作所中央研究所(福永泰所長)は4月20日、隣り合う人が同時に話す 音声を聞き分ける音声処理技術を開発したと発表した。 複数のマイクロホン(マイク)素子を使って音の発生位置(音源位置)を瞬 時に高い精度で測定する技術と、特定の方向からの音声だけを抽出する技術に よって実現したもの。この技術を用いることで、マイクから1-2m離れた複数の 人の音声を聞き分けたり、周辺の雑音を取り除いて特定の音声だけを抽出でき たりするので、テレビ会議での雑音の除去や、雑音の多い環境での音声認識精 度の向上のほか、複数のマイクで録音したビデオ映像の中から特定の人の音声 だけを抽出することが可能。 具体的には、一瞬で高精度に音源位置を測定する「近接音源定位技術」によ って、近接した音源に対して位置を推定する性能が向上した。また、突発的な 雑音を選択的に除去する「空間音声フィルタリング技術」は、音源位置の推定

    日立、隣り合う複数の人の音声を聞き分ける音声処理技術
  • Odeo: Millions of FREE MP3s, Podcasts, and More

    Decrease quantity for W77 ⚡ Daftar Situs Slot777 Winrate 100% Withdraw Cepat Terpercaya 2024 Increase quantity for W77 ⚡ Daftar Situs Slot777 Winrate 100% Withdraw Cepat Terpercaya 2024

    Odeo: Millions of FREE MP3s, Podcasts, and More
  • NEC、音声対話機能を搭載できる小型モジュール、多様な機器に組み込み可能

    NECは5月7日、車載端末や携帯電話、情報家電、キオスクの端末、ロボット など、さまざまな機器に組み込んで音声対話機能を搭載できる小型音声対話モ ジュールを開発したと発表した。 まず、NECエレクトロニクス製アプリケーションCPU「MPシリーズ」とソフト ウェアのプラットフォーム「platformOViA」を利用した小型・高機能・低消費 電力・安価なハードウェアモジュールを開発。次に、同CPU上に、音声認識音声合成・対話制御機能、耐雑音信号処理機能、音源方向検出機能、顔認識機 能、シナリオエンジン機能、CG表示機能、ネットワーク通信機能、RTミドルウ ェア連携機能などの各種ソフトウェアエンジンとそのノウハウを統合し、軽量 化して搭載した。 機器の種類・機能に応じてこれらの機能を取捨選択し、シナリオエンジンに よる統合制御やRTミドルウェア連携機能、ネットワーク通信機能を用いた外部 機器と

    NEC、音声対話機能を搭載できる小型モジュール、多様な機器に組み込み可能
  • 本気の音声認識、「声de入力」のこだわり

    auの春商戦向けモデルは、新機能・新サービスが目白押し。その中でコンシューマーユーザーの注目を大きく集めているのが、総合音楽サービス「LISMO」だが(1月19日の記事参照)、一方で先行して発表された「声de入力」(1月12日の記事参照)にも全機種が対応している。先進的なUIへの取り組み、さらに歩行者ナビゲーションへの取り組みという点でも注目である。 そこで日の時事日想は特別編として、KDDI au商品企画部モバイルサービス部サービスグループ課長の幡容子氏、同コンテンツメディア事業部コンテンツ推進部パートナーズビジネスグループ課長補佐の小林大介氏、同コンテンツメディア事業部コンテンツ推進部パートナーズビジネスグループリーダー課長補佐の江幡智広氏の3名にインタビュー。「声de入力」と「EZナビウォーク」にフォーカスしていきたい。 au商品企画部モバイルサービス部サービスグループの幡

    本気の音声認識、「声de入力」のこだわり
  • NEC、携帯上で動作可能な英会話音声翻訳ソフトを開発

    NECNECエレクトロニクスは、携帯電話向けアプリケーションプロセッサ上で動作可能な、日英自動翻訳ソフトを開発した。5万語という語彙に対応し、旅行時の会話レベルをサポートしているという。 今回開発された翻訳ソフトウェアは、音声での入出力に対応した、携帯電話向けアプリケーションプロセッサ上で動作可能なもの。NECでは、これまでも自動翻訳ソフトの開発を行なってきたが、今回開発されたソフトウェアでは、マルチコアプロセッサ向けの並列音声認識方式を新たに開発し、NECエレクトロニクス製でARM9ベースのCPUコアを1チップ上に3つ搭載したアプリケーションプロセッサ「MP211」で動作を確認。また、携帯電話などの機器でも処理できるようプログラムサイズを小型化している。 NECでは今後、音声認識および言語処理技術のさらなる向上を図っていく。 ■ URL プレスリリース http://www.nec.c

  • NTTレゾナント、携帯電話から音声で検索キーワード入力が可能に | 家電 | マイコミジャーナル

    NTTレゾナントは、ポータルサイト「goo」上の実験サイト「gooラボ」において、携帯電話による情報検索の際、キーワード入力を音声で行う「スピーチ・アシステッド・サーチ」の商用環境における実証実験を開始した。実験は、「goo路線」の検索と連動しており、携帯電話から音声で駅名入力を可能にするもの。事前のユーザー登録などが不要なことから、同社では個人情報保護にも配慮した新たな携帯電話向けサービスが可能だとしている。 試験利用の手順は、携帯電話から「gooラボ」の専用ページにアクセスし、路線検索と時刻表検索から検索サービスを選択し、「電話発信」のボタンを押して実証実験専用番号に電話をかけて、音声ガイダンスにそって駅名を話し、コンピュータが認識した結果に間違いがなければ電話を切って「結果確認」をクリックするといったもの。すると駅名が入力された「goo路線」検索ページに移動、検索条件に誤りがなければ

  • au、「EZナビウォーク」に音声認識の検索機能

    KDDIと沖縄セルラーは、auの携帯電話に、音声認識技術を活用した新機能「声de入力」を搭載すると発表した。2月上旬からは、EZナビウォークの検索機能として「声で乗換検索」「声で目的地検索」という新機能が用意される。 「声de入力」には、サーバーと携帯電話の両方に音声認識機能を備え、処理を分散させるという“分散型音声認識機能”が活用されている。EZナビウォークでは、鉄道の乗り換え経路や目的地を調べる場合に「東京から大阪まで、10分後に出発」「東京都千代田区三番町」などと喋るだけで、ナビゲーション機能が利用できるようになる。分散型音声認識の「声de入力」で目的地検索をする場合、携帯電話体では、ユーザーが喋ってた内容をまず録音し、その内容から「とうきょう」「おおさか」「10分後」と検索条件になる語彙を抽出するところまで処理される。 抜き出されたデータは、パケット通信でサーバー側に送信され、サ

  • au、受信メールを自動で読み上げるアプリ

    KDDI、沖縄セルラーは、au携帯電話で受信したEメールを音声で自動的に読み上げるBREWアプリ「EZメール読み上げ」を3月上旬から提供する。 「EZメール読み上げ」は、専用のEZアプリを起動すると、受信したEメールを自動的に音声で読み上げるサービス。アプリを起動することで、以降の受信メールはKDDIの音声変換サーバーに自動転送され、携帯電話にダウンロードされて自動的に音声で読み上げられる。音声合成エンジンでは、駅名・地名・人名など約11万語の日語辞書と、約1万語の英単語辞書をサポートする。絵文字も読み上げ可能で、ハートマークなら「ハート」、キラキラしたハートマークなら「キラキラハート」などと読み上げるという。 対応端末は、neon、W41シリーズ、A5518SA、Sweets pure、A5520SAで、今後発売される端末でも順次サポートされる予定。対応端末へのプリセットとの予定はなく

  • 携帯電話に話しかけてブログを表示--ボイスドメインサービス

    音声認識システム「AmiVoice」を開発・販売するアドバンスト・メディアの子会社で、音声認識技術を使ったドメインサービスを提供するボイスドメインサービスは、2月1日より携帯電話向けのブログドメインサービスを提供開始する。 これはユーザーが携帯電話に向かってブログの名前を話すと、そのブログへのリンクが表示されるというもの。ユーザーが直接URLを入力したり、検索サイトで探したりする必要がなくなる。ただし、そのブログが同社のボイスドメインに登録されていることが条件となる。 ブログをボイスドメインに登録する費用は初年度が1万9600円、2年目以降は9800円。ユーザーには利用料金がかからないが、別途通信・通話料金が必要となる。 ボイスドメインサービスは2005年11月より、携帯電話で発話した企業名や商品名、サービス名を音声認識技術によりテキストへ変換して、目的のサイトへのURLリンクを表示するサ

    携帯電話に話しかけてブログを表示--ボイスドメインサービス
  • NEC、2.7型液晶/30GB HDD搭載のマルチメディアプレーヤー

    NECは、2.7型のカラー液晶ディスプレイと30GB HDDを搭載したビデオ/オーディオプレーヤー「VoToL(ヴォトル/PK-MV300)」を3月下旬より発売する。同社直販サイトのNEC Directでのみ販売され、価格は39,900円。 VoToLは、化粧瓶風のデザインが特徴のモバイルAVプレーヤー。「大人の男女の携帯嗜好品」をコンセプトに、高級感やモノとしての愛着などを重視してデザインされている。VoToLは、Visual On-demand Tool Of Lifeの略称。 1.8インチ30GB HDDを搭載し、液晶ディスプレイは2.7型/320×240ドット。動画ファイルはMPEG-2/MPEG-4(SP/ASP)/WMV(DRM10)の再生が可能で、DivXについてはソフトウェアバージョンアップでの対応を検討しているという。 また、音楽再生はMP3/WMA(DRM10)/

  • 1