アマゾン「音声AI経済圏」の快進撃が止まらない。 2018年9月20日、米アマゾンは同社の音声アシスタント「Alexa」に関する戦略の発表会を、アメリカ・シアトルの本社で開催した。 シアトルのアマゾン本社隣にある「The Sphere」という施設で発表会が行われた。アマゾンが世界から記者を招いた発表会を行うのは異例のこと。
![アマゾン「音声AI経済圏」止まらぬ進撃 —— 電子レンジで白モノ家電参入に隠された野望](https://cdn-ak-scissors.b.st-hatena.com/image/square/06c82f482b312113429d7b726aeed8a30e79b3e6/height=288;version=1;width=512/https%3A%2F%2Fmedia.loom-app.com%2Fbi%2Fdist%2Fimages%2F2018%2F10%2F04%2F06.jpg%3Fw%3D1280%26h%3D630%26f%3Djpg)
NTTドコモやNTTグループが長年培ってきた音声対話技術やAIエージェントの技術をオープン化し、クラウド・プラットフォームとしての提供を本格化する。 当面、利用料金は無料、デベロッパー向けの説明会も開催し、普及を促進する考えだ。 これにより、NTTの音声会話エンジンを搭載したスマートスピーカー、ロボット、音声家電、自動車などが開発しやすくなり、ソフトウェアベンダーも音声会話を使ったアプリの開発やビジネス化が容易になる。 日本語による高精度な音声会話デバイスやサービスの普及が、一気に加速する可能性が出てきた。 名称は「AIエージェント基盤」 NTTドコモが提供するクラウド・プラットフォームの名称は「AIエージェント基盤」。通称「PROJECT:SEBASTIEN」(プロジェクト・セバスチャン)と呼ばれている。 プロジェクトを牽引する責任者のNTTドコモ 秋永氏と、開発を担当する山崎氏に話を聞
3月16日 発表 NECは16日、機能を強化した新型パーソナルロボット「PaPeRo 2005」を開発したと発表し、デモを行なった。音声や画像など認識能力が大幅に向上し、さまざまなセンサ情報を使ってより多様なインタラクションが可能になった。 ●PaPeRo2005 「PaPeRo2005」は高さ38.5cm、重量約6kg。8つのマイクを搭載。時間差から音声がする方向を検出する。「ノイズキャンセラー」機能で家庭内など雑音の多い環境での音声認識や、「エコーキャンセラー」機能でロボットが話している途中でも人の声を認識できるようになった。テレビをつけたままの環境でも音声認識できるなど、従来に比べてノイズ下での認識誤りが1/3、ロボット発声中の音声認識誤りは1/5になったという。 また手書き文字を認識し、名前を覚えたり数式を読んで計算する文字認識技術、手振りや振り子を画像認識する技術などを開発し、新
印刷される方はこちらをご覧ください(PDF形式、773kバイト) このニュースリリース記載の情報(製品価格、製品仕様、サービスの内容、発売日、お問い合わせ先、URL等)は、発表日現在の情報です。予告なしに変更され、検索日と情報が異なる可能性もありますので、あらかじめご了承ください。なお、最新のお問い合わせ先は、お問い合わせ一覧をご覧下さい。 2017年9月28日 自発的に成長する音声対話AI技術を開発 対話コンテンツの拡充工数を10分の1に低減 図1:成長の過程 株式会社日立製作所(執行役社長兼CEO:東原 敏昭/以下、日立)は、ヒューマノイドロボット「EMIEW(エミュー)3」*1の接客・案内サービスでの活用を想定し、対応できなかった質問を職員に確認して自発的に日々成長する音声対話AI技術を開発しました。本技術により、専門知識を持たない職員でも、「EMIEW3」からの質問に回答するだけで
HEARTalk™ UU-001 ふあーーーHEARtalkめっちゃたのしいです!!テレル!!(音源については個人的な楽しみのためのあれなのでご容赦ください…) pic.twitter.com/cQf1YGfhiF — はいぬっか (@hinzka) 2017年6月21日 ヤマハ株式会社が開発した自然応答技術の呼称が「HEARTalk™」(ハートーク) これを搭載した基板が『HEARTalk™ UU-001』です。 体験者が発話する内容の「音律」・「長さ」・「語尾変化(上げ下げ)」を自動的に判断し、対応する音声データを選択して機敏に再生します。 音源にはwavファイルを使っていて、ユーザーが自由に差し替えることができます。 つまりこれを使うと、任意の「声」ときわめて自然な雰囲気で対話することができてしまうのです。これはヤバイ。 詳しくはこちら www.dtmstation.com やったこ
契約書の入手及 び記載方法等につきましては、右下の「ALAGIN会員」よりログイン頂く事で、右メニューより「入手の方法(契約書含む)」「契約書の記載方法・代理作成」がご覧になれます。
経緯や詳細は下記の記事に書いたのだが、けものフレンズというアニメに出てくるボス(ラッキービースト)というロボットみたいな何かをiPhoneで作ってみた。 至極簡易的ではあるものの、はじめてロボット/AI的なものを自分で作ってみて色々と技術的にも学んだことが多かったので、ここに書き記しておこうと思う。 今回のシステムの全体像 アニメに出てくるラッキービーストは、いわゆる汎用人工知能(強いAI)なのだが、さすがにそれを実現するのは難しいので、今回は「モノを見せると、それについて教えてくれる」人工無脳的な実装をすることにした。 大まかなシステムの流れはこんな感じ。 音声認識で「これなんだかわかりますか?」的な質問をされたことを検知する カメラを使って、目の前の様子を撮影する 撮影した画像から物体を検出する 検出した物体について、Wikipediaで情報を調べる 適当に文章にして音声合成で喋る 一
TwitterやQiitaで話題になっていたので、けものフレンズを見た。 良かった。中でも、パークガイドロボットのボス(ラッキービースト)が良かった。ボスのポンコツ具合がとても良かった。 ボスは、アニメの中の描写を見る限り、いわゆる汎用人工知能と呼ばれるタイプのAIで、他の登場人物たちと自然に会話をしたり、「楽しかった」などの感情らしき表現を持ち合わせていることを考えると、相当高度な技術によって構成されていると考えられる。そして、パークガイドとしてジャパリバスを運転したり、動物の説明をしたり、天候をみて出発延期を提言したり、セルリアンとの戦いの中では自らを犠牲にして作戦を決行してフレンズを守るなど、その働きぶりはなかなかに有能である。 一方で、想定外の事態に陥ると容易にフリーズしたり、最終話でカバンの演技に簡単に騙されてしまうような、不完全な部分も持ち合わせているのだが、その様子がいかにも
米Googleは4月27日(現地時間)、音声AIアシスタント「Google Assistant」をサードパーティーのハードウェアに搭載するための「Google Assistant SDK」を公開したと発表した。 Google Assistantは、「Ok Google」と音声で呼び掛けるか、ボタンを押すことで音声での命令や質問ができるAIアシスタント。現在は「Google Home」やAndroid端末(日本はまだ未対応)、「Google Allo」、「Android Wear」などのGoogle製品にしか搭載されていない。 Google Assistantと競合する米Amazon.comの音声アシスタント「Amazon Alexa」は既にSDKが公開されており、中国LenovoなどがAlexa搭載製品を発売している。Googleは、「製品にGoogle Assistantを搭載したい場合
ロボットブームはコンシューマーレベルにも降りてきている。それを象徴するかのような製品が今年(2017年)、2つ現れた。デアゴスティーニの「ロビ2」と、講談社の「ATOM」である。どちらもパートワーク、すなわちばらばらの部品が週刊で届いて、ユーザーが自分で部品を組み立てる製品だ。「ロビ2」は6月6日に創刊予定。講談社「ATOM」は4月4日に創刊され、発売中である。どちらもドライバー一本で組み立てられる。 合計の値段は税込でみると、「ロビ2」が全80号でおおよそ17万円強、講談社の「ATOM」が全70号でおおよそ20万円弱となっている。ただしATOMは、完成後もサービスをフル利用するためには月額料金が別途必要となる。 講談社の「ATOM」については発表時にも触れたが、ここでもう一度、2つを並べて見てみよう。 15万体売れた人気作の第2弾、ネットにつながらなくてもよいとの判断 「ロビ2」は大成功
対話システムにおけるインタラクション 技術のこれまでとこれから:携帯機器での音声情報検索案内システムを例として(南 泰浩)
VoiceLabsが「The 2017 Voice Report」を発表した。 今回はその興味深い調査結果からいくつかトピックスを紹介したい。 AI音声アシスタントデバイスの販売台数 2015年に170万台、2016年に650万台、2017年に2,450万台が出荷され、今年の累計デバイス数は3,300万台になると予測している。 販売台数は著しく伸びており、また今後も伸びるということだが、このデータは米国内だけのものだ。日本を始め様々な国へ出荷が伸びればさらに伸びても不思議はない状況だ。 各社AI音声アシスタントのソフトウェアの特徴 Amazon Echo、Google Home、そして今後参入可能性のあるメーカーも、プロダクトのAI領域に現状大きな違いはないとしているが、VoiceLabは以下各社の特徴をあげている。 ・Google Webからの情報を使う質問に答えるのに優れている。 ・A
こんにちは、せーのです。先日、AWS Summit Tokyoも盛況のうち無事終わり、だいぶ日常業務に戻ってきた感があります。 今日は音声認識の話題です。 タッチの次はボイス AWS SummitではDevOps、IoT、サーバレスアーキテクチャあたりの話題が盛況でしたが、"次の波"として注目されていたのが音声認識技術についての話題でした。 Amazonでは既に「Amazon Echo」という音声認識によるアシスタントデバイスが売りだされ、アメリカで大人気となっています。他にもIBMの「Watson」やAppleの「Siri」、Googleの「Google now」やMicrosoftの「Cortana」等、キーボードからタッチに移り始めたデバイス入力方法の次は声による入力、という見方が大勢となっています。AWS Summit TokyoでもAmazonの自然言語応答サービスであるAVS(
書籍の中から有用な技術情報をピックアップして紹介する本シリーズ。今回は、秀和システム発行の書籍『図解入門 最新 人工知能がよーくわかる本(2016年7月4日発行)』からの抜粋です。 ご注意:本稿は、著者及び出版社の許可を得て、そのまま転載したものです。このため用字用語の統一ルールなどは@ITのそれとは一致しません。あらかじめご了承ください。 ※編集部注:前回記事『シンギュラリティ(技術的特異点)――人間の脳を超える「強いAI」はいつ生まれるのか』はこちら 人間と自然に会話するコンピュータ SF映画やコミックに登場するロボットや人工知能は、まるで人間のように会話をすることができます。人間が話しかけた内容や人間同士の会話を正確に理解し、必要としている情報を回答したり、アドバイスをしたりしてくれる……そんなシーンが描かれています。これには、どのような技術が必要なのでしょうか。 会話に必要な技術
ドラえもんや鉄腕アトムのような、人間と自然に会話ができる人工知能は本当に生まれるのか――。NTTで人工知能による雑談対話を研究している東中竜一郎さんに聞く本インタビュー。本記事(中編)では、人間らしい自然なコミュニケーションを実現するために必要な“要件”について聞いていく。 前編はこちら→人工知能と人が、本当の意味で“話せる”ようになる日 NTTで人工知能による雑談対話を研究している(前回の記事を参照)東中竜一郎さんは、1年ほど前に、芸能人のマツコ・デラックスさんに似せたロボット「マツコロイド」に雑談機能を組み込み、テレビ番組でマツコさんと雑談をさせたことがあるが、うまくいかなかったという。独身のマツコさんに対して、マツコロイドが“夫婦”に関する話題を振り続けてしまい、気まずい雰囲気が流れてしまったのだ(番組的には笑いが起きて盛り上がったが)。 「マツコロイドについても、ブログなどのデータ
人工知能と人が、本当の意味で“話せる”ようになる日:【総力特集】人とAIの共存で進化する「おもてなし」(1/4 ページ) 昨今「Watson」や「りんな」など、人間と会話ができる人工知能が注目を集めている。しかし、これらは人間の心を理解してコミュニケーションを取っているかというと、そうではない。いつか本当に人工知能と人が心を通わせるような時代は来るのか。人間と雑談できる対話システムを開発し続ける第一人者に話を聞いた。 人工知能(AI)が「必要なものはこれですか」とオススメしてくれる世界が、近い将来、実現するかもしれない。人間をはるかに超える学習能力を持った人工知能が、私たちの思考の一歩先を読み、意思を持った人間のように私たちを“もてなして”くれる世界が目の前に迫っているのだ。 人工知能というと、最近はマイクロソフトが開発している女子高生AI「りんな」や、CMが話題を呼んだIBMのコグニティ
Nara Institute of Science and Technology Augmented Human Communication Laboratory 音声対話システム 2016/11/15 音情報処理 2016 「音声対話システム」 1 奈良先端科学技術大学院大学 助教 吉野 幸一郎 NAIST AHC Lab. • 音声対話システムの歴史と枠組み – 音声対話システムの進化と淘汰 – 音声対話システムの基本的枠組み • 対話システムの分類と機能 – タスク指向対話、雑談対話 – 言語理解、対話制御 – end-to-end • 最新の研究動向 – Dialogue State Tracking – Deep Reinforcement Learning – 自律型アンドロイド 2016/11/15 音情報処理 2016 「音声対話システム」 2 本講義の目次 NAIST A
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く