タグ

音声認識に関するtsupoのブックマーク (16)

  • au版「GALAXY S II」に会話エージェントアプリが標準搭載

    イナゴは1月31日、音声会話アシスタントアプリ「netpeople:a(ネットピープル エー)」が、KDDIから1月20日に発売されたスマートフォン「GALAXY S II WiMAX ISW11SC」にプリインストールされたことを発表した。 netpeople:aは、スマートフォンに向かって音声で発話するだけで、デジタルエージェントが会話をしながら求める情報まで導いてくれるアプリ。グルメ検索や天気・地域情報検索、電車の乗り換えや地図などを確認できるという。 たとえば「デートのために、渋谷で居酒屋を探して」と話しかけると、「60件見つかりました。何料理にしましょうか?」と返してくれる。その後「和がいいな。駐車場のあるお店ね」と話しかけると、「条件に合うお店が、2件見つかりました。気に入ってくれるといいな」と返してくれるという。 同社では、2011年7月12日にNTTドコモの「GALAXY

    au版「GALAXY S II」に会話エージェントアプリが標準搭載
    tsupo
    tsupo 2012/01/31
    「デートのために、渋谷で居酒屋を探して」「60件見つかりました。何料理にしましょうか?」「和食がいいな。駐車場のあるお店ね」「条件に合うお店が、2件見つかりました。気に入ってくれるといいな」
  • Googleが音声認識API公開へ=モバイル機器は音声操作が主流に?【湯川】 | TechWave(テックウェーブ)

    iPhoneなどで利用できるGoogleアプリの音声認識技術の精度の高さは定評があるが、その音声認識技術APIを公開されることが明らかになった。ドイツのベルリンで開催中の家電業界の見市IFA2010でGoogleCEO、Eric Schmidt氏が行った基調講演の中で、Googleの担当者が会場からの質問に答えたもの。モバイルアプリを開発するサードパーティー向けに近くAPIを公開するという。 Google音声認識技術の精度が高いのは、だれよりも多くの検索データを持っているからだ。Google検索は、スペルを間違って入力しても、過去の無数の入力データを基に推測し正しいスペルを「もしかして」と提案してくれる。これと同様の仕組みで、聞き取りにくい発声であっても正しいキーワードを推測できるようになっている。 現時点ではGoogle提供のアプリの中でも検索アプリにしか音声認識技術は利用されて

  • 会話で高齢者サポート ロボットが家族になる日 - 日本経済新聞

    国立障害者リハビリテーションセンターなどの研究チームが高齢者や認知機能の衰えた人に役立つ生活支援システムを開発した。ロボットがタイミング良く話しかけてその日の予定やこれから取り組まなければならない仕事や作業を思い出してもらう。一人暮らしで話し相手がいない高齢者などに有効なことを確認した。介護サービスと連携して実用化を目指す。「そろそろデイサービスに出かけるんだよね、トイレに行ったらどう?」。ロ

    会話で高齢者サポート ロボットが家族になる日 - 日本経済新聞
    tsupo
    tsupo 2010/09/06
    高齢者や認知機能の衰えた人に役立つ生活支援システム / ロボットがタイミング良く話しかけてその日の予定やこれから取り組まなければならない仕事や作業を思い出してもらう
  • http://mainichi.jp/select/wadai/news/20080105k0000m040014000c.html

    tsupo
    tsupo 2010/06/15
    (すでに記事は削除されてる) 携帯電話を使って、日本語と英語の会話を自動音声翻訳するシステム / 京都府精華町の「国際電気通信基礎技術研究所」(ATR)が開発
  • Google検索の未来--外国人と話せる翻訳ケータイも5年以内に

    Googleは6月8日、「Science of Search - 検索の科学」と題したイベントを開催した。同社の検索サービスのエンジニアが多数来日し、最新の状況について講演した。 話題の中心はGoogleが考える未来の検索だった。エンジニアリング リサーチ上級副社長のAlan Eustace氏は、携帯電話での会話をリアルタイムで翻訳するようなサービスがいずれ登場するだろうという見通しを述べた。 「まもなく携帯電話を通して話した言葉がほかの国の言葉にリアルタイムで翻訳される機会がやってくる。Googleがこの5年間で実現する」(Eustace氏) 携帯電話に検索クエリを話しかけることで検索できる「Google音声検索」というサービスがある。Eustace氏は開発の段階では実現不可能だと考えていたという。 「しかし私は間違っていた。データの力、マシンの力、科学者の力がそれを実現した」とEust

    Google検索の未来--外国人と話せる翻訳ケータイも5年以内に
    tsupo
    tsupo 2010/06/15
    「まもなく携帯電話を通して話した言葉がほかの国の言葉にリアルタイムで翻訳される機会がやってくる。Googleがこの5年間で実現する」 → 京都のATRが研究しているのと、どっちが(略)
  • Nexus Oneを使ってみた――軽快だが音声入力はいまいち

    わたしはこの2日間、HTCが製造したスマートフォン「Nexus One」を使っている。その結果、市場に出回っているAndroid携帯の中ではダントツだという結論に至った。 わたしはGoogle社で1月5日に開かれたNexus One発表イベントには出席しなかったが、Googleは親切にも貸出機を送ってくれた。 貸出機はT-Mobileのサービスに対応し、4GバイトのSDカードが付いている。開封とセットアップの写真をこちらのスライドショーで紹介している。 まず、手に持った感じはどうかというと、完ぺきだ。Nexus Oneはたった11.5ミリの薄さで、縦幅はたいていの筆記具よりも短い。 DROIDと比べてみると、DROIDがださく見える。DROIDが6オンス(170グラム)でNexus Oneが4.6オンス(130グラム)ということを考えればうなずける。 しかし、DROIDは少々角張っていて

    Nexus Oneを使ってみた――軽快だが音声入力はいまいち
    tsupo
    tsupo 2010/01/18
    市場に出回っているAndroid携帯の中ではダントツ / DROIDがださく見える / Nexus TwoはNexus Oneの2カ月後には出ない / (あまり一般的ではない)固有名詞の音声認識には問題あり?
  • Googleの愚直さが作る未来を見誤るな - FutureInsight.info

    ちょっと最近改めてGoogleってすごいなと思ったので、まぁ、もう聞き飽きたネタかと思いますが、たまにはGoogleの話を。 YouTubeの黒字化は達成済み説 第27夜のポッドキャストでも述べたのですが、YouTubeが単年度で黒字化したのはどうも間違いなさそうです。ネタ元は以下などに列挙されています。 http://it.blog-jiji.com/0001/2009/11/youtube-9a82.html 黒字化の理由ですが、YouTubeにがっつり半透明の広告が設置されるようになったなどの広告の強化に加えて、多くの人々が予想していた動画ビジネスはその配信コストをまかなうことが広告収入からは出来ないといった予測に対して、Googleがあっさりとその上を行ったという点が上げられます。というのも、現状Googleが動画配信に必要な配信コストが劇的に下がっているのです。Googleが海底

    Googleの愚直さが作る未来を見誤るな - FutureInsight.info
    tsupo
    tsupo 2010/01/18
    YouTube: 海底ケーブルを引きまくって配信コストが下がり続けることで黒字化 / 音声認識: アメリカでGoogleが展開する無料の104的サービスは全てこの音素データを収集するため
  • グーグル、日本語音声検索機能を公開--iPhoneとAndroid端末で利用可能に

    グーグルは12月7日、日語の音声入力でウェブ検索ができる機能を公開した。iPhoneおよびAndroid端末で利用可能。動画検索などにも対応する。 iPhoneの場合はApp Storeにおいて無料で提供されているアプリ「Google Mobile App」を使う。利用前には設定画面において「音声検索」を「オン」にする必要がある。Android端末の場合は、Androidマーケットで提供されているアプリ「Google音声検索」を利用する。 いずれも検索ウィジェットにマイクのアイコンが表示されるため、このボタンを押して検索したい言葉を話しかけると、Google側で音声を認識して自動的にウェブ検索をする。 iPhoneで「Google Mobile App」を開くと設定画面上に「音声検索」の項目があるため、ここを「オン」にする 検索ボックスの右側にマイクのアイコンが表示されるため、このボタン

    グーグル、日本語音声検索機能を公開--iPhoneとAndroid端末で利用可能に
    tsupo
    tsupo 2009/12/07
    グーグルは12月7日、日本語の音声入力でウェブ検索ができる機能を公開 / iPhoneおよびAndroid端末で利用可能 / 「Google日本語入力」の技術を使うことで、高い入力精度を実現
  • 声で「つぶやいて」投稿できるiPhone用Twitterアプリ、「しゃべったー」が公開

    音声認識サービスを提供しているカタログは11月24日、声で入力するiPhoneTwitterアプリ「しゃべったー」を公開した。利用料金は無料だ。 アプリを起動して声を録音すると、アプリが音声の特徴点を抽出してサーバに送信し、サーバ側で文字に変換した上で表示する。変換結果が意図と違う場合は、手作業で修正することも可能だ。録音時間は最大15秒。 Twitterに投稿されている2000万件以上のつぶやきを収集して辞書データを作成しており、「〜なう」といったTwitter独特の言い回しや、流行語などにも対応している点が特徴。常時データを収集しているため、新語も自動で学習しているという。 ReTweet(RT)、Reply(@)、Direct Messages(DM)、お気に入り、検索といったTwitterの基機能も備えており、音声入力をしない場合でもTwitterクライアントとして利用できる。

    声で「つぶやいて」投稿できるiPhone用Twitterアプリ、「しゃべったー」が公開
    tsupo
    tsupo 2009/11/25
    アプリを起動して声を録音すると、アプリが音声の特徴点を抽出してサーバに送信し、サーバ側で文字に変換した上で表示する → この方式なら、クライアントは iPhone じゃなくてもいけると思う
  • 音声認識メールがTwitterに対応 - iPhoneに「〜なう」とつぶやくだけで投稿 | 携帯 | マイコミジャーナル

    アドバンスト・メディアは、同社が7月から配信しているiPhone向け『音声認識メール』に、新たに「Twitter」への投稿機能を追加したことを発表した。アプリは、iPhone・iPod touch向けアプリのダウンロードサービス「App Store」にて600円(2010年1月末までのサーバ利用料込み)で販売している。 これまで同社の提供する「音声認識メール」はメール、SMS、Map対応のみだったが、今回140文字以内の短いメッセージを投稿できるミニブログサービス「Twitter」に対応。これにより、ユーザーはiPhoneに向けて喋るだけでTwitterへの投稿が可能となった。 利用イメージ 同社によると、継続的なデータ蓄積により認識率を向上させ、居場所や自分の状態を伝えるときに使う「〜なう」などTwitter独自の言い回しや用語にも対応したという。また、テキストコピー後にSafariの

    tsupo
    tsupo 2009/09/25
    「音声認識メール」はメール、SMS、Map対応のみだったが、今回「Twitter」に対応 / ユーザーはiPhoneに向けて喋るだけでTwitterへの投稿が可能となった / 「~なう」などTwitter独自の言い回しにも対応
  • 『斬(ZAN)』 “Twitter”に換わる何かを探して

    主に Web(ウェブ),ブログ(blog),サイト,ニュース,CGM などネットで視た様々な出来事を『斬』りますよ。 2024 02 ≪ 12345678910111213141516171819202122232425262728293031≫ 2024 04 ・早すぎたCGMサービス「オルトアール」の話(その6) | トーキング.jp -対談ブログ- 正直、“Twitter”をほとんどやっていないのに、こーゆーのを書くのは、的外れなのかもしれない。だけど、ではなぜ“Twitter”をやらないのかを考えれば、自ずとどんなウェブサービスなら自分がいつくんだろうか?ってことの答えが出てくるんじゃないかと思ったのですよ。 それで出た結論から言うと、音声認識して文字に落とし込んだタイプの“Twitter”ならいいんじゃないかと。 ニコニコ生放送を最近よく好んで観ているのですが、文字文化と違って

    tsupo
    tsupo 2009/08/30
    自動音声認識して文字に起こすタイプのツールがあればいいのではとなる → (英語限定だと思うけど)携帯電話で喋ったのを Twitter に投稿するというサービスは2年くらい前からある / Scripting News の人が使ってる
  • http://japan.internet.com/busnews/20090108/6.html

    tsupo
    tsupo 2009/01/08
    きっと携帯電話を使ったトゥイート投稿用の音声認識技術があるはずだと思ったら、実際に存在していた → Dial2Do に音声入力→テキスト変換し、HelloTxt 経由で投稿 / HelloTxt は、Dial2Do から音声で呼び出せる
  • 電話に話しかけるだけで店舗検索 グーグルが新サービス検討 - MSN産経ニュース

    来日したインターネット検索大手、米グーグルのマリッサ・メイヤー副社長は9日、東京都渋谷区のグーグル法人で会見し、携帯電話や固定電話に話しかけるだけで、探している店舗などを検索し、表示する新サービスを国内で展開するよう検討していることを明らかにした。 この検索サービスは「グーグル411」と呼ばれ、現在米国とカナダで提供している。利用者はグーグルの専用番号に無料ダイヤルで電話し、自分の所在地と探しているサービスを吹き込めば、該当する店舗などに電話を取り次いでもらえる。 例えば「カリフォルニア州マウンテンビュー」「ピザの注文」といえば、地域のピザ店のリストが音声で流れ、そこから気に入った店を選び、注文できる仕組み。また携帯電話経由なら、メールで店舗情報や地図などを得ることもできる。 メイヤー副社長は「ウェブサイトに言葉を入力して行う従来の検索サービスとは違う、極めて新しい検索手法」と述べ、将

    tsupo
    tsupo 2008/06/09
    グーグル411 / 将来日本での導入に意欲 / グーグルのサービスの場合、対応は基本的にコンピューター音声で行われるため、NTTのようにコールセンターで大量の人員を雇う必要がない。利用者の電話料金負担もない
  • 「開発の主体」って何だろう? - NyaRuRuが地球にいたころ

    某MS社員に、「MS IME最近どうなっているのよ?」と先週聞いた答えが...「IME開発の主体が、中国にシフトしまっていて我々も手を出せない......個人的にはATOKに切り替えようと思っている」と言う現役開発系社員の発言に絶句!!! 4 兆円を超える金でYahoo買おうという発想があるならその数10分の1でも、IMEの品質向上に自ら開発投資をするべきで...来IMEは、かな漢字変換としての機能だけではなく...正しい漢字を検索する、自分のファイルやデータをローカルファイルの中から検索する、企業内部で共通辞書や住所、顧客データなどを検索する、社会のデータベースやインターネット上の情報を検索するに必要な共通技術であるにも関わらず...まぁ、そんなことが理解できない経営者が...IMEの開発は中国でやった方が安く済むと思っているのであれば、未来は無いねぇ... 私自身はずっと ATOK

    「開発の主体」って何だろう? - NyaRuRuが地球にいたころ
    tsupo
    tsupo 2008/02/16
    統計処理アルゴリズムの基盤部分が中国の Microsoft Research で研究開発されていて,残りは国内で開発されているものという認識 / もっと科学的で機械的な手法 / Trigram/SLM
  • http://www.asahi.com/business/update/0303/005.html

    tsupo
    tsupo 2007/03/04
    対話型ロボット「PaPeRo」の対話技術 / 会話を文章化する音声認識技術 / キーワードを抽出して関連のイラストやBGMなどの素材を表示する独自技術 / 画面上のパペロの指示に従ってブログ編集
  • Coming soon: Google Voice Search

    The master of text-based search is looking to lend a voice to Internet users everywhere, or so it appears based on Google's latest patent. Patent #7,027,987 issued today by the US Patent and Trademark Office covers a "Voice interface for a search engine," which is described as: "A system provides search results from a voice search query. The system receives a voice search query from a user, derive

    Coming soon: Google Voice Search
    tsupo
    tsupo 2006/04/14
    Windows Vista に音声による操作、検索を組み込むことが発表されていますが、それに対する先制攻撃として Google が音声による検索(を実現するために、まずは音声→プレーンテキスト変換)を出してくるという話
  • 1