タグ

ブックマーク / japan.cnet.com (19)

  • グーグル翻訳アプリ、ニューラル機械翻訳がオフラインに対応

    Googleは米国時間6月12日、同社のニューラル機械翻訳(NMT)システムのアップデートを提供開始した。これによりユーザーは、インターネットに接続していない時でも、より正確な翻訳を得られるようになる。 Googleは2016年にNMT技術を導入して翻訳の精度を高めた。この技術が今回オフラインに対応し、「Android」または「iOS」デバイス上の「Google翻訳」アプリで直接実行できるようになる。 NMTシステムでは、文章の中の単語やフレーズを個々に翻訳するのではなく、文全体を1つの翻訳単位として捉え、より広範な文脈を考慮して最適な翻訳を考え出す。Googleは発表の中で、これにより段落や記事の翻訳がはるかに自然なものになると述べた。 オフライン機能は、国外への旅行時や、インターネットに接続できない場合、あるいはデータ通信を使いたくない場合に利用できる。各言語セットは35〜45Mバイト

    グーグル翻訳アプリ、ニューラル機械翻訳がオフラインに対応
    jp-myk
    jp-myk 2021/04/06
  • グーグルの「音声文字変換」アプリ、犬の鳴き声やノックの音も表示へ

    Googleの「Live Transcribe(音声文字変換)」アプリに音事象を表示する機能が加わる。Googleによると、聴覚障害者が音の世界をもっと楽しむのに役立つという。 Google機械学習および音声認識技術のアップデートにより、Live Transcribeは会話だけでなく、犬のほえる声やドアをノックする音、拍手、笑い声、音楽、ホイッスル、通りすぎる車などの音も文字化できるようになる。 Live Transcribeは、「Sound Amplifier(音声増幅)」とともに2月にリリースされた。Live TranscribeとSound Amplifierはいずれも、聴覚障害者がより簡単にコミュニケーションできるようにする狙いがある。 Live Transcribeは、スマートフォンのマイクを通じて会話を捕捉し、その内容をディスプレイに自動表示する。 Google機械学習の公

    グーグルの「音声文字変換」アプリ、犬の鳴き声やノックの音も表示へ
    jp-myk
    jp-myk 2019/05/17
  • マスク氏が支援するOpenAI、大規模な教師なし言語モデル「GPT-2」の情報を公開

    Elon Musk氏が支援する非営利の人工知能研究グループのOpenAIは米国時間2月14日、「大規模な教師なし言語モデル」の「GPT-2」に関する情報を明かした。OpenAIによると、GPT-2は読解力や質問応答、要約などに関して、非常に優れたスキルを持っているという。 文章の冒頭を入力すると、かなり説得力のあるサンプルが返ってくる。800万のウェブページのデータセットで訓練されたGPT-2は、与えられたテキストの文体や内容に適応する。 OpenAIはいくつかの例を提示している。たとえば、「Miley Cyrusさんが今日、ハリウッド大通りのAbercrombie and Fitchで万引きをして捕まった」という例文を入力した例では、「19歳の同歌手が警備員に連れられて店から出る様子がカメラに写っている」で始まるサンプルが返ってくる。 「Miley Cyrusさんが今日、ハリウッド大通り

    マスク氏が支援するOpenAI、大規模な教師なし言語モデル「GPT-2」の情報を公開
    jp-myk
    jp-myk 2019/03/03
  • 認識率が大幅向上、エラー改善率最大20%を記録。ディープラーニングの発展技術「LSTM」を実装し、音声認識エンジンAmiVoice(R)が更に精度向上しました

    認識率が大幅向上、エラー改善率最大20%を記録。ディープラーニングの発展技術「LSTM」を実装し、音声認識エンジンAmiVoice(R)が更に精度向上しました 株式会社アドバンスト・メディア(社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)は、ディープラーニングの発展技術であるリカレントニューラルネットワークの「LSTM(Long Short-Term Memory)」を音声認識エンジンAmiVoiceに実装しました。これにより、エラー改善率最大20%を記録(当社調べ)し、自然発話の認識率が大きく向上いたしました。 LSTMは、リカレントニューラルネットワーク技術の一つで、これまで短期でしか利用できなかった情報を長期に渡って活用することができるという特徴を持っています。これを音声認識エンジンに実装することで認識率を向上させることが可能となりました。 この度

    認識率が大幅向上、エラー改善率最大20%を記録。ディープラーニングの発展技術「LSTM」を実装し、音声認識エンジンAmiVoice(R)が更に精度向上しました
    jp-myk
    jp-myk 2017/11/21
  • インテル、サードパーティー製「Alexa」デバイス向けのSDKを発表

    Intelが新しいソフトウェア開発キット(SDK)「Intel Speech Enabling Developer Kit」を発表した。このSDKは、Amazonの「Alexa」の音声制御機能をより多くのサードパーティー製スマートホームデバイスにもたらすことを目的としている。 Intelによると、このSDKは遠距離音声制御のための完全なフロントエンドソリューションを提供するという。 このSDKには、干渉エンジンを搭載するIntelのデュアル・デジタル・シグナル・プロセッサと、円形に配置された8個のマイクが含まれる。このシステムは、音響エコーキャンセレーション、ノイズリダクション、ビームフォーミング、「Alexa」向けにチューニングされたカスタム起動ワードのアルゴリズムも利用する。 Intelのスマートホームグループでゼネラルマネージャーを務めるMiles Kingston氏は声明で次のよう

    インテル、サードパーティー製「Alexa」デバイス向けのSDKを発表
    jp-myk
    jp-myk 2017/10/23
  • アマゾン、ディープラーニングライブラリ「DSSTNE」をオープンソース化

    Amazonが、自社のディープラーニングソフトウェアをオープンソース化した。GitHubに公開されたこの「Deep Scalable Sparse Tensor Network Engine(DSSTNE)」ライブラリは、「Apache 2.0」ライセンスの下で利用可能になっている。 Amazonは同ライブラリのFAQページで、DSSTNE(発音は「Destiny」と同じ)は、Amazonの多数の顧客のショッピングを支援するものだとした。「われわれは、顧客が膨大な製品カタログの中から、ふさわしい製品を見つけ出すのを手助けする」と同社は説明している。「ふさわしいおすすめ製品を提示するのに、ニューラルネットワークは不可欠だ」(AmazonAmazonは、DSSTNEをオープンソースのソフトウェアとして公開したと述べた。「ディープラーニングの可能性を、言語の理解やオブジェクトの認識などの領域

    アマゾン、ディープラーニングライブラリ「DSSTNE」をオープンソース化
    jp-myk
    jp-myk 2016/05/12
  • イーロン・マスク氏ら、AI研究組織「OpenAI」を創設--人類への貢献を目指す

    Elon Musk氏、Sam Altman氏、Peter Thiel氏というIT業界の著名人らから10億ドルもの寄付を得て、人工知能AI)の推進を目的とする研究組織OpenAIが米国時間12月11日に創設された。AIは、この技術を搭載する機械が人間にどう影響するかという懸念から、有望ながら論争の的にもなっている分野だ。 OpenAIは発表の中で、「人間レベルのAIがどれだけ社会に貢献できるかを推測することは難しく、また、それが正しく構築または利用されなかった場合に社会にどれだけの損害を与え得るかを想像することも同等に難しい」と述べ、「人間レベルのAIが、いつ実現可能なレベルに達するかを予測するのは困難だ。そのレベルに達したときに、良い成果を自己利益よりも優先できる強力な研究機関が存在することが重要となる」とした。 Musk氏、Altman氏、Thiel氏がAIに関心を寄せていることは重要

    イーロン・マスク氏ら、AI研究組織「OpenAI」を創設--人類への貢献を目指す
    jp-myk
    jp-myk 2016/05/12
  • グーグル、オフラインでも使えるモバイル向け音声認識システムを開発

    Googleは、インターネットに接続していなくても、「Nexus 5」で「リアルタイムより高速に」動作するほど容量の小さな音声認識システムを開発した。 離れた場所にあるデータセンターでの演算処理が不要なこの新システムを使えば、安定したネットワーク接続が必要であるという条件にとらわれることなく、スマートフォンやスマートウォッチなど、メモリに制約のあるいかなるガジェットでも音声認識を利用できる可能性がある。 Googleの研究チームが新たな論文で示した概要によると、目的は、ローカルで動作する軽量だが正確な組み込み型の音声認識システムを開発することだという。 研究チームの言う軽量とは、容量20.3Mバイトのシステムのことだ。これを2.26GHzのCPUと2GバイトのRAMが搭載されたNexus 5でテストすると、自由に記述するディクテーション(口述)作業で単語誤り率13.5%を達成した。 当然の

    グーグル、オフラインでも使えるモバイル向け音声認識システムを開発
    jp-myk
    jp-myk 2016/03/14
  • グーグルが音声検索を改善--高速化と騒音環境での認識向上

    Googleは、「iOS」と「Android」向け「Google」アプリの音響モデルに複数の改善を施し、その詳細を明らかにした。ユーザーが最寄りのレストランへの行き方を尋ねたり、ウェブ検索のための質問をしたりする際の音声をより効率的に認識できるようにするものだ。 今回の改善により、Googleアプリは騒がしい環境でも言われていることをより正確に認識できるようになったのに加え、リアルタイムでの音声解析に必要な計算リソースが削減されていると、Googleの音声チームは述べている。 同チームによると、Googleが音響モデルに採用している種類の「リカレントニューラルネットワーク(RNN)」は、ディープニューラルネットワークよりも情報の記憶に優れ、「時間依存性」をモデル化することができるという。例えば、「museum」と言う単語は、/m j u z i @ m/という音声表記に翻訳される。 「先ほ

    グーグルが音声検索を改善--高速化と騒音環境での認識向上
    jp-myk
    jp-myk 2015/09/29
  • グーグル、画像解析によるシティガイドアプリのJetpacを買収

    GoogleがJetpacを買収した。Jetpacは、「Instagram」の公開写真を分析して行き先を推奨するアプリの開発元である。 Jetpacは間もなく同社アプリをAppleのApp Storeから削除し、米国時間9月15日にサポートを終了する予定だという。 Jetpacの従業員は、Googleの「Knowledge」チームに加わる予定。同チームは、実世界に関するより洗練された理解を検索結果に組み込む作業に取り組んでいる。 人気の高いバーや景勝地などを検索するJetpacの技術Googleが何に利用するつもりなのかは正確には明らかではないが、JetpacはGoogleの優先事項に合致する複数の技術を保有している。まず、同社の技術は、人的な収集整理などの処理に頼ることなく自動的に膨大な量の公開写真から情報を抽出する。Googleの検索アルゴリズムでも、広範囲にわたる同じアプローチがウ

    グーグル、画像解析によるシティガイドアプリのJetpacを買収
    jp-myk
    jp-myk 2014/09/09
  • 音声検索の現状の課題と普及の可能性 :渡辺隆広のサーチエンジン情報館

    ここ1~2年ほど、検索技術やそのエマージング・テクノロジーemerging technology)に着目しつつ、特にデジタルネイティブ世代(1990年生まれ以降と定義)の検索に対する意識や日常生活における検索行動・役割にフォーカスした、様々な調査・研究を行っています。今回はその中で、「音声検索」について、簡単に取り上げたいと思います。 話しかけることで検索できる「音声検索」 音声検索とは、文字列ではなく、皆さんの発話する声により検索できる技術やサービスを指します。有名なところでは、Apple iOS に搭載される Siri や、 Google音声検索が挙げられるでしょう。まだ一般発売されていませんが、Google Glass も音声で操作ができますね。最近では、カーナビでも音声操作できるものがありますし、一部メーカーが販売する液晶テレビでも音声による操作や番組検索ができるもの、携帯電話や

    音声検索の現状の課題と普及の可能性 :渡辺隆広のサーチエンジン情報館
    jp-myk
    jp-myk 2014/05/08
  • グーグルとニールセン、YouTube上の広告評価で連携を強化

    GoogleはYouTubeにおいて、テレビ視聴率調査企業Nielsenによるさらなる広告追跡機能をより長期にわたって提供する予定である。これにより、従来のテレビから新興の大規模プラットフォームであるYouTubeへと流出する広告費が増加する可能性が高まる。 Googleは長い間、Nielsenと距離を置き、YouTube上の広告に対するサードパーティーによる測定を避けていた。そのために、ウェブ最大の動画プラットフォームであるYouTubeを広告提供の場として利用することをためらう広告主もいた。なぜなら、これらの広告主が何十年間にもわたり、Nielsenの評価を基にメディアを購入してきたためである。Googleが2013年11月、Nielsenが一部の広告に対して「Online Campaign Ratings」と呼ばれる評価システムを提供することを許可したことで、この状況に変化が訪れた。

    グーグルとニールセン、YouTube上の広告評価で連携を強化
    jp-myk
    jp-myk 2014/04/02
  • グーグル、高周波音ログイン技術の新興企業SlickLoginを買収

    Googleは、イスラエルの新興企業であるSlickLoginを買収した。SlickLoginは、ウェブサイトでの認証にスマートフォンと高周波音を用いる技術を開発している。 3人のチームからなるSlickLoginは同社のウェブサイトで今回の買収を発表した。 そこには「われわれSlickLoginチームは、Googleに参加することを日付けで発表する。Googleは、ログインという行為がイライラさせられることなく簡単であるべきであり、認証というものが足かせとなることなしに効果的に機能すべきだという、われわれと同じ信念を有している企業だ」と記されている。 買収の条件は明らかにされていないが、Geektimeによるとこの「acqui-hire」(買収による人材獲得)の価値は「数百万ドル」であるという。 創業から日が浅いSlickLoginはまだ商用製品を世に送り出していないが、同社が開発して

    グーグル、高周波音ログイン技術の新興企業SlickLoginを買収
    jp-myk
    jp-myk 2014/02/26
  • MSの次世代パーソナルアシスタント機能「Cortana」、登場は2014年以降か

    Microsoftの「Cortana」(開発コード名)アプリは、同社がAppleの「Siri」や「Google Now」に対抗して進める取り組みの中心になっている。今週、Cortanaがあらためて注目を集めたのは、2014年初めになると見られる「Blue」アップデートのリリースに向けて「Windows Phone」の動向を追跡している人たちがたまたま言及したのがきっかけだった。 Cortanaという開発コード名は、Microsoftの「Halo」シリーズに登場する、学習と適応の能力を持つ人工知能に由来する。 Microsoftのアシスタント技術であるCortanaでも、機械学習技術と「Bing」に使われている知識レポジトリ「Satori」により、学習と適応が可能になる。 Cortanaは単なるアプリ以上のもので、これによりユーザーは、音声コマンドを使って自分の携帯電話とより自然にやり取りで

    MSの次世代パーソナルアシスタント機能「Cortana」、登場は2014年以降か
    jp-myk
    jp-myk 2013/12/26
  • 2013年は音声コマンドの年に--「Google Glass」や「Xbox One」の登場がもたらす変化

    「OK、Glass、写真を撮って」 「Xbox、HBOでは何の番組をやっているの」 「Siri、『Angry Birds』をプレイ」 「Xbox One」の発表の間、筆者はMicrosoftがこのデバイスの中に多くの音声コマンドを組み込んでいることに強い印象を受けた。「Kinect」はこのゲーム機に一連の基コマンドを導入したが、今や映画の再生からアプリの起動まで、あらゆることが音声でできるようになった。「Xbox, Live TV」は、筆者がリビングルームでよく口にする一言になるかもしれない。 音声コマンドが大きく期待できると考えているのは、Microsoftだけではない。「Google Glass」の価値提案の大部分は、同社の(大抵は)滑らかな音声コマンドによってもたらされている。筆者はいまだに、音声コマンドで写真をスクロールして見ていくことができないのだが、カメラに触れずに写真を撮影

    2013年は音声コマンドの年に--「Google Glass」や「Xbox One」の登場がもたらす変化
    jp-myk
    jp-myk 2013/09/23
  • Google Chromeに搭載の「Crankshaft」--高速化された新JavaScriptエンジン

    Google Chrome」の最新のテストバージョンには、さらに高速になったJavaScriptエンジンが搭載されている。JavaScriptエンジンは、ウェブベースのプログラムを実行するためのブラウザコンポーネントとして重要性が高まってきている。 その結果、ページの読み込み速度が高速化し、ウェブアプリケーションがさらに強力になる。また、ブラウザのパフォーマンスをめぐって、Microsoftの「Internet Explorer(IE)」やMozilla Foundationの「Firefox」、Appleの「Safari」、そして「Opera」との新たな戦いが始まる。 Chromeのブラウザエンジン「V8」は、「Crankshaft」と呼ばれるバージョン3へとアップグレードされようとしている。Googleによると、V8は適応的コンパイルと呼ばれる技術を用いており、これによってJavaS

    Google Chromeに搭載の「Crankshaft」--高速化された新JavaScriptエンジン
    jp-myk
    jp-myk 2010/12/13
  • 自ら立ち上げたヤフー「リスペクトしている」--グーグル新役員の有馬氏

    1996年にヤフーを立ち上げ、常務取締役を務めた有馬誠氏が、1月1日にグーグルの専務執行役員営業部長に就任した。Google AdWordsやGoogle AdSenseを中心とした、グーグル法人の広告営業を統括するという。 グーグルの広告ビジネス、検索をはじめとしたサービス群の現状、そして目の前に立ちはだかるヤフーについて有馬氏に聞いた。 --グーグルの広告の現状を分析されたと思いますがどんな感触でしたか。 まだまだ伸びる余地があると思いました。その理由は大きく分けて2つ。これはグーグルに限りませんが、検索連動型広告は非常に手軽に始められます。ただそのことをご存じない広告主さんはまだまだおられます。これはやり方次第でもっと知ってもらう余地があると思っています。 もう1つは、グーグルはこれまで広告代理店と一緒に営業してきてましたが、やはり広告主のニーズを直接お聞きしていかないと代理店

    自ら立ち上げたヤフー「リスペクトしている」--グーグル新役員の有馬氏
  • グーグル、ノートPCを全米600以上の高校へ寄贈--理系教育促進のため

    Googleは、科学、テクノロジ、工学および数学教育促進のため、全米600以上の高校へそれぞれ5台のコンピュータを寄贈することを決定した。同社によると、対象となる高校は全米最高ランク1000校のリストから選んだという。同社広報担当のEmily Wood氏は、「これらの高校には、テクノロジに関して不十分な環境にいる学生が大変多い」と述べ、「われわれとしては、教育を与えることに成果を残している学校を検討し、さらに弾みをつけてもらうことを考えた」と説明する。贈られるコンピュータは、Googleのバックパックがセットになった特別仕様のLenovo製15インチノートPCとなる予定で、2月末までに送付される。

    グーグル、ノートPCを全米600以上の高校へ寄贈--理系教育促進のため
    jp-myk
    jp-myk 2010/01/17
    どんだけ。。
  • 国内ネット最大手、ヤフーがこだわる「多彩」な人材

    1月31日で、創立13年目に突入したヤフー。日でもっともアクセス数の多い検索ポータルサイト「Yahoo!JAPAN」には日最大のネットオークションサイト「Yahoo!オークション」など、多彩なサービスを持つ。1996年1月の創業からわずか1年10カ月後の1997年11月に店頭登録銘柄として株式を公開 、2003年10月には東京証券取引所第一部市場に上場した。さらに2007年2月にはジャスダックへの重複上場も果たした。 同社の成長の足跡を、ページビュー(PV)の推移から見てみよう。サービス開始から1年3カ月後、1997年7月における1日あたりのPVは500万PV。その倍の1000万PVに到達したのは、約1年後の1998年6月だ。2000年初頭からネット利用者数の急増に呼応する形で急激にPVも伸び始め、2000年7月に1日あたり1億PV、2001年8月に同2億PV、2004年10月には同1

    国内ネット最大手、ヤフーがこだわる「多彩」な人材
  • 1