タグ

k-taiとvoiceに関するcx20のブックマーク (4)

  • 携帯電話に話しかけてブログを表示--ボイスドメインサービス

    音声認識システム「AmiVoice」を開発・販売するアドバンスト・メディアの子会社で、音声認識技術を使ったドメインサービスを提供するボイスドメインサービスは、2月1日より携帯電話向けのブログドメインサービスを提供開始する。 これはユーザーが携帯電話に向かってブログの名前を話すと、そのブログへのリンクが表示されるというもの。ユーザーが直接URLを入力したり、検索サイトで探したりする必要がなくなる。ただし、そのブログが同社のボイスドメインに登録されていることが条件となる。 ブログをボイスドメインに登録する費用は初年度が1万9600円、2年目以降は9800円。ユーザーには利用料金がかからないが、別途通信・通話料金が必要となる。 ボイスドメインサービスは2005年11月より、携帯電話で発話した企業名や商品名、サービス名を音声認識技術によりテキストへ変換して、目的のサイトへのURLリンクを表示するサ

    携帯電話に話しかけてブログを表示--ボイスドメインサービス
  • 道のりは険しいが、意義深い音声入力UIへの取り組み

    1月12日、KDDIが乗換案内や目的地検索を音声で入力できる「声de入力」を発表した(1月12日の記事参照)。これは同社が以前から開発していたDSRと呼ばれる技術をau携帯電話向けに転用したものだ(1月12日の記事参照)。 筆者も、昨日の発表会で実際に試したが、乗換検索や電話番号入力に関しては、かなり高い精度を見せた。ただし、音声入力システム利用時特有のリズムとイントネーションで話さないと、「ほぼ確実な入力」にならないのも事実。吉岡記者も書いているように「慣れ」は必要だ(1月12日の記事参照)。 声de入力に限らず、「音声入力の難しさ」は、いかにユーザーに慣れてもらうかにある。店頭購入時もしくはサービスの初期利用段階に、ユーザーがトレーニングする仕組みがほしいところだ。 改善の余地が大きい施設名検索 一方、住所検索や施設名検索では、改善の余地が大きいと感じた。 まず住所検索であるが、都道府

    道のりは険しいが、意義深い音声入力UIへの取り組み
  • au、高精度な音声認識機能を実用化、話すだけで検索できる「声de入力」 | 家電 | マイコミジャーナル

    KDDI、沖縄セルラーは、携帯電話向けの高度な音声認識を商用化、歩行者ナビゲーションサービス「EZナビウォーク」で2月上旬からサービスを提供する。au携帯電話に分散型音声認識機能を搭載、サーバと連携することで高精度な音声認識を実現した。同時に、サービス対応端末3モデルも発表されている。 話して乗換検索 今回搭載されたのは音声認識サービス「声de入力」。採用された分散型音声認識機能は、端末とサーバに音声認識機能を分散して配置し、端末側ではユーザーの発生した音声の特徴情報を抽出してサーバに送信、サーバ側で音声認識処理を行う、というもの。 声de入力の仕組み。端末とサーバで分散して処理を行う 従来の音声通話型と端末内蔵型にはそれぞれ欠点があった。音声通話型は通話料が必要で、UIも今ひとつ。内蔵型は、端末のCPUやメモリ、辞書サイズなどの能力面に難点があった。今回の分散処理型では、端末側にはそれほ

  • ケータイナビも声で操作--KDDI、音声認識を使った新サービス

    KDDIおよび沖縄セルラーは1月12日、au携帯電話に分散型音声認識機能「声de入力」機能を搭載し、ナビタイムジャパンとの協業により2月上旬からサービスを提供開始すると発表した。 分散型音声認識機能とは、音声認識機能を携帯電話側とサーバ側に分散配置し、ユーザーの発声から特徴的な情報を抽出してサーバ側で音声認識処理を行うシステムのこと。高性能サーバを利用できるため、従来と比べて大規模かつ高精度な音声認識が可能になる。さらに、今回au携帯電話に搭載される声de入力機能では、音声認識時に周辺雑音を測定し高い認識性能を維持、誤認識の可能性がある場合に原因を推定してユーザーに利用方法をアドバイスするといった工夫をしている。 サービスの内容としては、歩行者向けナビゲーションサービスであるEZナビウォークにおいて「声で乗換検索」「声で目的地検索」を提供する予定。ユーザーは画面を見ずに歩きながら乗換検索や

    ケータイナビも声で操作--KDDI、音声認識を使った新サービス
  • 1