並び順

ブックマーク数

期間指定

  • から
  • まで

561 - 600 件 / 650件

新着順 人気順

音声認識の検索結果561 - 600 件 / 650件

  • 第2話 小説として投稿した責任を取る - うちの社長がわざわざネットに炎上ネタを書き込むわけがないハートフル物語(かわんご) - カクヨム

    「ああああああああ」 株式会社ピアンゴの山上会長はパソコンの前で頭をかきむしっていた。ピアンゴとは日本有数の動画投稿サイトであるピアピア動画の運営元だ。 「どうしたんですか?」 尋ねたのは山上会長のスタッフの儚井美智子。元々はネットメディアのライターで、時々、会長のゴーストライターもやっている。 「儚井さんさあ、昨日、カクヨムに投稿した小説あるじゃん。ホラーになってないし、残酷表現も暴力表現も性表現もないじゃないかとクレームが来ているんだよね。」 「社員にとっては十分にホラー小説にはなっていると思いますけど、確かに残虐表現とかはないですね」 「いやカクヨムの機能を試したくて、つい、残虐表現、暴力表現、性表現あり、で設定ボタンを押しちゃったんだよね。ちょっと反省しててさあ、やっぱセルフレーティングって真面目に使って欲しい機能じゃん。変な前例を作っちゃいけないと思うんだよね」 「いい心かげです

      第2話 小説として投稿した責任を取る - うちの社長がわざわざネットに炎上ネタを書き込むわけがないハートフル物語(かわんご) - カクヨム
    • iPhone 3G Sに触った! 日本語音声コントロールのレスポンスに感動

      iPhone 3G Sに触った! 日本語音声コントロールのレスポンスに感動:WWDC 2009現地リポート(1/2 ページ) Worldwide Developers Conference 2009(WWDC 2009)の基調講演で最大の目玉といえば、カメラ機能の強化と大幅なスピードアップを実現した新型iPhone「iPhone 3G S」だ。もっとも、このiPhone 3G S、フィル・シラー上級副社長による基調講演中も、スライドには表示されたものの、実機が出てくることはなかった。アメリカでは約10日後に発売されるというのに、本当にきちんと動いているのだろうか。 この疑問は、WWDC 2009基調講演の直後に行われたグループインタビューセッションで氷解した――筆者は幸運にもグループの中で、ただ1人、このiPhone 3G Sを音声操作する幸運に恵まれた。そのときの模様をお伝えしよう。なお

        iPhone 3G Sに触った! 日本語音声コントロールのレスポンスに感動
      • 日本の家電業界に求められるイノベーティブな商品 - たぱぞうの米国株投資

        日本の家電メーカーの苦境の原因をテレビリモコンから探る 日本の家電メーカーから画期的な商品が出なくなって久しいです。高付加価値を追求する姿勢は伝わりますが、複雑で分かりにくくなっている傾向にあります。 例えば家電リモコンのボタンが多すぎます。日本の家電のボタンの多さに慣れてしまった面もあるので、「こんなもんか」と思っていました。 しかし、そうではないということがわかりました。先日アマゾンプライムに入り、fireTVを購入しました。 ボタンのシンプルさ、分かりやすさに驚きました。 両脇はテレビとDVDレコーダのリモコンです。下の部分はメーカー名が入っているので画像を切りましたが、どこのメーカーもこんな感じでボタンが並びまくっているのではないでしょうかね。 真ん中がFireTVのリモコンです。たったこれだけです。 そういえば、ipodが出たころもボタン1つしかなくて話題になりました。ipodも

          日本の家電業界に求められるイノベーティブな商品 - たぱぞうの米国株投資
        • 会話が見える! 世界最速の「リアルタイム字幕」にびっくり

          会話が見える! 世界最速の「リアルタイム字幕」にびっくり:水曜インタビュー劇場(瞬時公演)(1/5 ページ) 2月某日、幕張メッセ(千葉市)。記事のネタを探すために、記者はとあるセミナーを聴講していたところ、大きなモニターに釘付けとなった。 モニターには、登壇者の発言がリアルタイムで文字になって映し出されていたのだ。「ITmedia ビジネスオンラインって最高ね」と発言すると、瞬時に「ITmedia ビジネスオンラインって最高ね」と表示される。それだけではない。日本語の横で、英語のスペルも次々に並んでいたのだ。 よーく見ると、ところどころで“おかしな日本語”も登場する。例えば、「ITmedia ビジネスオンラインって再考ね」といった感じで。しかし、しばらくすると、正しい日本語に変わっていくのだ。 気になる、気になる。どうやってリアルタイムに文字を起こしているのか。最新のテクノロジーを駆使し

            会話が見える! 世界最速の「リアルタイム字幕」にびっくり
          • 価格.com - 『ドスパラの対応に不信感』 Palit Microsystems NE6208TS20LC-150A (GeForce RTX2080Ti 11GB GamingProOC) [PCIExp 11GB] ドスパラWeb限定モデル のクチコミ掲示板

            [ログイン新規ID登録]閲覧履歴ご利用ガイド 『ドスパラの対応に不信感』のクチコミ掲示板 ホーム > パソコン > グラフィックボード・ビデオカード > Palit Microsystems(パリット マイクロシステム) > NE6208TS20LC-150A (GeForce RTX2080Ti 11GB GamingProOC) [PCIExp 11GB] ドスパラWeb限定モデル > クチコミ掲示板 Palit Microsystems 2018年 9月26日 登録 NE6208TS20LC-150A (GeForce RTX2080Ti 11GB GamingProOC) [PCIExp 11GB] ドスパラWeb限定モデル GeForce RTX 2080 Tiを搭載した、オーバークロック仕様のビデオカード。ゲーミング向けモデル。 ハイエンドサーバーに搭載される「DrMOS」を採

              価格.com - 『ドスパラの対応に不信感』 Palit Microsystems NE6208TS20LC-150A (GeForce RTX2080Ti 11GB GamingProOC) [PCIExp 11GB] ドスパラWeb限定モデル のクチコミ掲示板
            • 特許庁の審査官はこち亀好き?-こち亀アイデア関連の特許出願紹介 Vo.3- | Toreru Media

              1.はじめに:特許発明の審査に漫画を活用 本記事では、筆者が大好きな漫画である「こちら葛飾区亀有公園前派出所(以下、こち亀)」に登場するアイデア関連の特許出願を紹介します。Vo.1、Vo.2 では、「こち亀のコミック発売後に出願された、似たアイデアに関する特許出願 or 実用新案出願」を紹介しました。 今回は少し視点を変えて、「特許出願に関する特許庁の審査において、実際にこち亀が参照された事例」を3つ紹介します。審査においては、多くの場合、過去の特許文献が参照されて審査が行われます。しかし以下3件については特許文献に加えてこち亀も登場しており、知財関係者としては非常に胸熱な状況です。(・・私だけ?) では、紹介していきます。 2.審査事例1:音声入力制御システム 特開2001-343996:三菱電機(出願日:2000年6月1日) 特許文献(J-PlatPat リンク) 1件目は、利用者が適

                特許庁の審査官はこち亀好き?-こち亀アイデア関連の特許出願紹介 Vo.3- | Toreru Media
              • IBM スマートな社会を支えるITインフラストラクチャーを提唱 - Japan

                2009年12月22日 2009年12月18日 2009年12月17日 2009年12月16日 2009年12月15日 2009年12月14日 2009年12月11日 2009年12月10日 2009年12月10日 2009年12月04日 2009年12月01日 2009年11月30日 2009年11月27日 2009年11月26日 2009年11月26日 2009年11月26日 2009年11月25日 2009年11月25日 2009年11月19日 2009年11月18日 2009年11月18日 2009年11月17日 2009年11月17日 2009年11月13日 2009年11月13日 2009年11月12日 2009年11月11日 2009年11月10日 2009年11月10日 2009年11月10日 2009年のプレスリリース一覧 ここに掲載されている情報は、発表日時点の内容です

                • NII Today - NIIについて - 国立情報学研究所 / National Institute of Informatics

                  「情報学」は私たちが生活する社会をどう変え、未来にどのような価値を生み出すのか。国立情報学研究所(NII)の広報誌「NII Today」は、情報学研究の最先端をみなさまに分かりやすくお伝えします。 NII Today 国立情報学研究所ニュース 国立情報学研究所ニュース 学術情報センターニュース 学術情報センターニュース

                    NII Today - NIIについて - 国立情報学研究所 / National Institute of Informatics
                  • 日本声優統計学会

                    日本声優統計学会は声優,声,アニメ作品,ラジオ,アニメソング,アニメイベント,アニメスタッフ,及び声優ファンにまつわる諸現象に対して数理統計的・機械学習的アプローチを用いて分析する集団です. 日本声優統計学会は正式な学会ではなく,同人活動を行うサークルです. 独自に構築した音素バランス文,及びそれらをプロの女性声優 3 名が 3 パターンで読み上げた音声です. (2020.11.01) あなたがライセンスがある程度自由な音素バランス文やその読み上げ音声を必要としている場合,声優統計コーパスではなく, JVS コーパスの利用を検討してください.より詳しい説明はこちらの文章をお読みください. 更新履歴 詳細な変更履歴はこちら (ChangeLog.md) をご確認ください. 2021年02月28日 : つくよみちゃんコーパスへのリンクを追加. 2020年11月01日 : JVS corpus

                    • 開店2カ月でリピーター比率25%の「ITレストラン」

                      慶応義塾大学に近い東京都港区芝に、開店2カ月にもかかわらず、早くもリピーター比率が25%に達した高級和食レストランがある。店の名は、「瑞宝」。今年8月7日にオープン。口コミだけで顧客層を拡大した。オープンからの2カ月で最大11回来た顧客もいるという。 見た目では分からないが、瑞宝は「ITレストラン」という顔を持つ。店内のバックヤードにはサーバーラックが2本。飲食店としての業務の多くをIT(情報技術)で支援する。客席も含め無線LANが整備されている。 瑞宝では、雰囲気を損なわないよう、店員は携帯情報端末やメモを使わない。その代わり、「音声CRMシステム」を活用。店員は顧客から「薄味が好き」「ネギが苦手」といった好みを聞き出し、バックヤードに戻ってからマイクに向かって聞き出した内容をしゃべる。音声認識ソフトを通してテキストデータとして記録。この内容は厨房のパソコン画面に表示され、調理のための情

                        開店2カ月でリピーター比率25%の「ITレストラン」
                      • 口ずさんで楽曲を検索できるウェブサイト「Midomi」が登場

                        あるメロディを口ずさんでいるが、その曲のタイトルを知らなかったり思い出せずにいらいらしたことはないだろうか?そんな人のために、10秒以内に知りたい曲のタイトルを教えてくれるという新しいウェブサイト「Midomi」が登場した。 米国時間1月26日にベータ版の運用を開始したMidomiでは、ユーザーが歌ったり、口ずさんだり、口笛を吹いて楽曲を検索できる。検索結果には、商用で提供されている楽曲のほか、他のユーザーが録音した楽曲も含まれている。ユーザーは、検索結果のうち自分の音声とマッチする部分のみを聞くこともできる。 このほかにも、楽曲のタイトルやアーティスト名を使った検索も利用できる。同システムはスペルミスをしても認識する。 Midomiを開発および提供するMelodisは、200万以上のデジタル楽曲のライセンスを取得しており、ユーザーはこれを購入できる。また、ユーザーから集めた曲も1万200

                          口ずさんで楽曲を検索できるウェブサイト「Midomi」が登場
                        • 人工知能はどこへ向かうのか:AIと機械学習の今 | ライフハッカー・ジャパン

                          人工知能(AI)の技法の1つであるディープ・ラーニング(深層学習)は、現在非常にホットなトピックで、これまでにも数限りなく取り上げられてきました。Google、Facebook、MicrosoftやBaiduといった名だたる企業が、マシンに視覚情報処理能力のある「目」を持たせるコンピュータービジョンや、音声認識、テキスト解析といった分野で技術革新を進めていますが、その多くはこのディープ・ラーニングに支えられたものです。また、多くのハイテク系新興企業の技術的基盤にもなっています(中には製品のリリース前に買収された企業もあります)。機械学習に関して言えば、こうした表に出てきやすい「成功」はメディアの注目を集めがちです。 しかしこうした事象は、地面の下でふつふつとたぎるマグマのように成長を遂げるこの分野の、あくまで表から見える面にすぎません。この手の研究の大部分が行われているのは、実は大手ウェブ

                            人工知能はどこへ向かうのか:AIと機械学習の今 | ライフハッカー・ジャパン
                          • ASCII.jp:ドンキ2万円PCのようなメモリ2GBのWindows 10マシンをチューニングする (1/2)|Windows Info

                            本連載でもすでに紹介しているが、ドンキ2万円PCに再度Windows 10 RS3をインストールしたところ、不明なデバイスは2つのみとなった。1つはSenser Hubなので動かなくても問題はない。もう1つはサウンドなのだが、こちらは引き続き解決策を探している。今回は本機のような、メモリが2GBしか搭載されていない64bit版Windows 10マシンをある程度軽快に利用できるようにしてみる。 メモリ2GBマシンの基本は1つのアプリのみを利用すること メモリが2GBしかない場合、システムなどのメモリ占有量を減らし、実行したいアプリケーションに最大限メモリが割り当てられるようにするといい。 使い方としては、同時に複数のアプリを使うのではなく、ブラウザやエディタなど1つのアプリケーションを利用することを想定している。もちろん、複数のアプリを起動することは不可能ではないが、なにせメモリが少ないた

                              ASCII.jp:ドンキ2万円PCのようなメモリ2GBのWindows 10マシンをチューニングする (1/2)|Windows Info
                            • フリーの iOS 向け音声認識/音声合成ライブラリ『OpenEars』の使い方 - その後のその後

                              OpenEars は Politepix 社より提供されているフリーの iOS 向け音声認識/音声合成(Text to Speech, TTS)ライブラリです。 OpenEars 話した言葉を認識したり、入力した文字列を読み上げたり(mac の say コマンドみたいなもの)することができます。 試してみたところ超簡単に使えたので、自分のアプリに OpenEars を導入する方法を紹介します。 音声合成の導入方法 フレームワーク追加、ヘッダインポートといった一般的なライブラリの導入手順をのぞけば、基本的にはメソッドを1つ呼ぶだけで導入できます。 1. フレームワークをプロジェクトに追加 解凍したフォルダ配下にあるFrameworkフォルダごとプロジェクトに追加します。フォルダには OpenEars.framework、Slt.framework ほか、言語モデルや辞書が入っています。 また

                                フリーの iOS 向け音声認識/音声合成ライブラリ『OpenEars』の使い方 - その後のその後
                              • Google Homeを英会話の無料トレーニング教材にしてみる - プロクラシスト

                                こんにちは、ほけきよです。 我が家に、Google Home Miniが届きました!*1 Google Home Mini 友人がプレゼントしてくれたものです。スマートスピーカー、プレゼントに最適だと思うんですよ。 新しくて、興味はあるけど、よくわからないし、自分では最後のひと押し踏み込めない。 けれど、あればかなり楽しいです。 この辺はAmazonのAlexaとかも一緒かな? もらってかなり嬉しかったですし、使ってみて更に感謝が深まった商品でした。 で、こいつの効果的な活用法を考えて見たのですが、 英語の練習に使えないかなと思って、色々試行錯誤しています。 今回は、スマートスピーカーの使用例の一つとして、参考にしてみてください。 Google Home Miniの設定 設定の仕方 利用例 気温や時刻を聞く アラームをセットする ニュースを聞く ゲームをする 英語学習用アプリ まとめ Go

                                  Google Homeを英会話の無料トレーニング教材にしてみる - プロクラシスト
                                • 松尾豊氏が語った「ディープラーニングは、インターネットに匹敵する数十年に1度の技術」である理由

                                  2018年12月12日〜14日、東京ビックサイトにて「SEMICON Japan 2018」が開催されました。SEMICONは、世界を代表するエレクトロニクス製造サプライチェーンの国際展示会。およそ750社による最先端技術の展示に加え、国内外のリーディング企業や、研究機関のトップエグゼクティブ、技術エキスパートなどによるさまざまな講演が、3日間に渡るイベントを盛り上げました。本記事では、東京大学大学院 工学系研究科 特任准教授の松尾豊氏による「人工知能は人間を超えるか -- ディープラーニングの先にあるもの」の模様をお送りします。 コントロールできていれば、王様を突撃させてもいい? 松尾豊氏:よろしくお願いします。25分ということですので、手短に話していきたいと思います。みなさんもご存知の通り、DeepMindが開発した囲碁のAI「AlphaGo」がプロ棋士を破ったというニュースがありまし

                                    松尾豊氏が語った「ディープラーニングは、インターネットに匹敵する数十年に1度の技術」である理由
                                  • 社内Podcastサービス「Hatena FM」について - Hatena Developer Blog

                                    こんにちは、id:chris4403 です。この記事は、はてなエンジニア Advent Calendar 2018の1日目の記事です。 前置き ここ数年、音声メディア(いわゆるPodcast)に興味があり、いろいろと試しています(ということを去年のアドベントカレンダーでも書いてました)。 記事の中でも触れているように、数年前から社内向けのPodcastサービスを作って運用しています。今回は、このサービスを使って運用している社内向けPodcastについて書いてみたいと思います。エンジニアアドベントカレンダーに適した内容なのか、はちょっと自信ないですが、Podcastに興味があるエンジニアの方は多そうなので、気にせず書きます。 また、エンジニアの方でPodcastに興味がある方は、yatteiki.fmのみなさんが書かれている「今日からはじめる「技術Podcast」完全入門 (技術書典シリーズ

                                      社内Podcastサービス「Hatena FM」について - Hatena Developer Blog
                                    • http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html

                                      • テスラの電気自動車(EV)がいかにスゴイか11点に分けて説明する - LITERALLY

                                        最終更新日:2016/11/23 先日の自動運転事故により、嫌な形で知名度が上がってしまったテスラだが、現状、テスラ車の魅力は自動運転機能にあるわけではない。自動運転機能がなくとも、テスラ車は素晴らしい車だ。このことを意外と知らない人が多いので、熱弁したい。 僕の友人に、テスラのモデルSに乗っている人がいる。何度か一緒にドライブに行き、自分で運転させてもらったこともある。テスラ車に初めて乗ったとき、その完成度の高さと先進感に心底驚いた。新しい形の車に、心が躍った。これほど乗る人の心を躍らせてくれる車を、ぼくは他に見たことがない。はじめてiPhoneを手にしたときと同じような、いやそれ以上の感動があった。 そして、何より、これほどの車を10年あまりで開発し、量販にまで漕ぎ着けたことは衝撃的だ。約80年の歴史があるトヨタと、たった10年で戦えるようになったのだ。スゴさでいえば、ラグビー日本代表

                                          テスラの電気自動車(EV)がいかにスゴイか11点に分けて説明する - LITERALLY
                                        • Amazon EchoをRaspberry Piのワイヤレス音声認識マイク&スピーカとしてミクさんの声で喋らせたり家電制御(リモコン制御)する方法 - karaage. [からあげ]

                                          Amazon EchoをRaspberry Piのワイヤレス音声認識マイク・スピーカとして使いたい 我が家では、Amazon Echoを壁掛け設置して色々便利に活用しています。 ただ、そんな中。妻から色々不満の声が上がってきました。具体的には以下です。 リマインダでいちいち2回言うのが気にくわない。1回で良い 音声認識で家電(テレビ・リモコン・ルンバ)の制御がしたい からあげDashボタンの音声認識率が悪くてつかえない ここまできたら、Amazon Echo単体では、如何ともしがたいですね。そんなときの強い味方が我らがRaspberry Piです。要はAmazon EchoをRaspberry Piのワイヤレス音声認識マイク&スピーカと使うことができれば何でもできます(ラズパイ脳なのでRaspberry Piなら何でもできると信じている)。 というわけで、今回は色々ネット情報調べて試行錯誤

                                            Amazon EchoをRaspberry Piのワイヤレス音声認識マイク&スピーカとしてミクさんの声で喋らせたり家電制御(リモコン制御)する方法 - karaage. [からあげ]
                                          • Maintainer Month: オープンソースをメンテナンスするコツ

                                            週に一度まとめて更新のようなパターンだと、体調が悪いときなどにその週はスキップされ、また次の週も更新しようとして偶然タイミングが合わなかった場合などに、1ヶ月更新が止まるみたいな状態は起きやすいです。 1ヶ月更新を止めてしまうと、そこで更新する習慣が失われて、この書籍でいう逆戻りが起きるのかなと思っています。 そのため、JSer.infoではタスクを細分化して進められる時にやっていけるような形を作っています。 ライブラリのメンテナンスのリズムをツール化する JavaScript周りは顕著ですが、ライブラリが細かく分かれていることが多いため、リポジトリの数も多いです。 そのため、リポジトリのCI設定や依存ライブラリのアップデートなどをメンテナンスするだけで無限の時間がかかります。 このメンテナンス作業を手動で毎回やるととても疲れるので、自分の場合はツール化していることが多いです。 作ったり、

                                              Maintainer Month: オープンソースをメンテナンスするコツ
                                            • Apple、3月7日に新型iPadを披露 発表会を告知

                                              米Appleは3月7日午前10時(日本時間8日午前3時)に発表会をサンフランシスコで開く。「iPad 3」と呼ばれてきた新型iPadを披露するとみられる。招待状を受け取った米メディアが一斉に報じた。 発表会を報じた米メディアには招待状の画像が掲載されているが、そこに写っているiPadとおぼしき薄型デバイスのディスプレイは、フォントなどの表示から精細度の高さを感じさせ、噂されるRetina Displayの搭載を期待させる。 噂では、新型iPadが搭載するというRetina Displayは9.7インチと現行のiPad 2と同サイズだが、解像度が2048×1536ピクセル(iPad 2は1024×768ピクセル)に向上するという。またクアッドコアプロセッサの採用(「A5X」や「A6」チップなどと呼ばれている)や、LTEへの対応などが予想されている。 現在はiPhone 4Sでのみ利用できる音

                                                Apple、3月7日に新型iPadを披露 発表会を告知
                                              • 人工知能を100年間研究し続ける大学が予想した人工知能と生活する2030年の姿とは?

                                                By Michael Shaheen 人工知能の技術は急速に発展してくると、「人工知能の進化によって人間の暮らしはどんどん豊かになるのか?」という点が気になってきますが、人工知能の研究を100年にわたって続けているスタンフォード大学が、人工知能と共生する2030年の世界はどのようになっているのかをまとめたレポートを公開しました。 Executive Summary | One Hundred Year Study on Artificial Intelligence (AI100) https://ai100.stanford.edu/2016-report/executive-summary Overview | One Hundred Year Study on Artificial Intelligence (AI100) https://ai100.stanford.edu/201

                                                  人工知能を100年間研究し続ける大学が予想した人工知能と生活する2030年の姿とは?
                                                • 身長158cm、体重43kg、日本人女性の平均値を参考にして作ったリアルなロボット「HRP-4C」が実際に動いている様子のムービー

                                                  本日、独立行政法人 産業技術総合研究所の知能システム研究部門ヒューマノイド研究グループ 梶田 秀司 研究グループ長らが「HRP-4C」というとんでもなくリアルなロボットを発表しました。身長158cm、体重43kg(バッテリー含む)で、関節位置や寸法は日本人青年女性の平均値を参考にしており、人間に極めて近い外観を実現しています。 歩行動作や全身動作はモーションキャプチャーで計測した人間の歩行動作や全身動作を参考にしているとのことで、HRPにおいて開発された二足歩行ロボットの制御技術を適用することにより、人間に極めて近い動作を実現しています。 また、音声認識にもとづく応答動作なども可能で、2009年3月23日に開幕する第8回「東京発 日本ファッション・ウィーク」のファッションショーの一つに出演を予定しており、その完成度は尋常ではありません。 というわけで、実際に動作している様子を見てみましょう

                                                    身長158cm、体重43kg、日本人女性の平均値を参考にして作ったリアルなロボット「HRP-4C」が実際に動いている様子のムービー
                                                  • 「あれやって」主人のくせ予測する家電 アマゾンが着手:朝日新聞デジタル

                                                    デジタルトレンド・チェック! 「あれ、やっといてくれる?」と家の中で話しかけると、人工知能(AI)につながったスピーカーが「わかりました」と答えて用事を済ませてくれる。「あれ」は「テレビ番組の視聴予約」かも知れないし、「足りない日用品の注文」かも知れません。人が話すあいまいな言葉の文脈を解釈し、その意味を理解して、具体的に実行する──米アマゾン・ドット・コムが描いているのはそういう未来です。それは5~10年程度の近い時期になる可能性もあります。 同社は20日(現地時間)、本社のある米シアトルで発表会を開催しました(写真1、2)。題材は、AIを利用した音声アシスタント「Alexa(アレクサ)」の関連製品です。音声で操作するスマートスピーカー「Echo(エコー)」シリーズが主軸で、日本でも昨年秋から発売されています。今回はそのEchoシリーズがリニューアルし、新しいモデルになりました。 しかし

                                                      「あれやって」主人のくせ予測する家電 アマゾンが着手:朝日新聞デジタル
                                                    • 【レビュー】 夢の「音声自動書き起こし」はもうすぐ実現!? Microsoftの「Video Indexer」を試す ~動画・録音の音声を自動でテキスト化し翻訳も

                                                        【レビュー】 夢の「音声自動書き起こし」はもうすぐ実現!? Microsoftの「Video Indexer」を試す ~動画・録音の音声を自動でテキスト化し翻訳も
                                                      • TechCrunch | Startup and Technology News

                                                        Welcome back to TechCrunch’s Week in Review — TechCrunch’s newsletter recapping the week’s biggest news. Want it in your inbox every Saturday? Sign up here. Over the past eight years,…

                                                          TechCrunch | Startup and Technology News
                                                        • Googleが「人間の専門家レベルを超える最初のモデル」とする『Gemini』発表、GPT-4を凌駕 | AIDB

                                                          Googleは、人間の専門家のパフォーマンスを上回る最初の大規模言語モデル(LLM)として「Gemini」を発表しました。LLMの主要なベンチマークの一つであるMMLU(多領域の学術ベンチマーク)をはじめとするほとんどのベンチマークでGPT-4を凌駕しています。 Geminiは、画像、音声、動画の理解を含むマルチモーダルタスクでも最先端の性能を示しています。テストに使用された20のマルチモーダルベンチマーク全てで最高の水準を達成しています。 また、複数のソースからの情報を統合して、より正確で詳細に理解する能力に優れているとのことです。 なお、Ultra、Pro、Nanoの3つのサイズがあり、それぞれ異なる計算要件に特化して設計されています(例えばモバイル向けにはNanoなど)。Ultraは最も高度に複雑なタスクをこなし、研究報告では主にUltraの性能が他モデルと比較されています。 本記事

                                                            Googleが「人間の専門家レベルを超える最初のモデル」とする『Gemini』発表、GPT-4を凌駕 | AIDB
                                                          • 【画像】 ヤマダ電機のタブレットの比較広告が酷すぎると話題に : 痛いニュース(ノ∀`)

                                                            【画像】 ヤマダ電機のタブレットの比較広告が酷すぎると話題に 1 名前: サッカーボールキック(庭):2013/11/05(火) 18:04:19.82 ID:5sJAxud00 2 : ローリングソバット(千葉県):2013/11/05(火) 18:05:37.74 ID:ppqE/DYD0 ネットが使えないってことはないだろう・・・ 4 : ボ ラギノール(新疆ウイグル自治区):2013/11/05(火) 18:06:48.97 ID:B7PsTVQKP YAMADA独占の文字入力機能ってなんだよ 13 : グロリア(群馬県):2013/11/05(火) 18:10:48.57 ID:ZLUNr5/y0 文字入力機能は他のにもついてるだろ 29 : フランケンシュタイナー(福井県):2013/11/05(火) 18:16:43.46 ID:XQs010pP0 音声認識nexus7なかっ

                                                              【画像】 ヤマダ電機のタブレットの比較広告が酷すぎると話題に : 痛いニュース(ノ∀`)
                                                            • ドワンゴ川上会長単独インタビュー「僕らがディープラーニングで狙うもの」

                                                              「深層学習(ディープラーニング)によるAIの活用が、次のビジネスを大きく左右する」と言われて久しい。 KADOKAWAと経営統合した、ニコニコ動画の運営で知られるドワンゴも、社内に研究所を持ち、ディープラーニングに本格的に取り組んでいる企業のひとつだ。映像配信やコミュニティ運営がビジネスの軸であるドワンゴはAIをどのように活用しようとしているのか。川上量生会長の単独インタビューを通して見えてきた姿は「AIという道具の活用方法」だった。 脳を模して自ら学ぶ「ディープラーニング」 ドワンゴは、2014年10月に、自社の研究部門である「ドワンゴ人工知能研究所」を設立した。以来ディープラーニングの研究を続けている。ドワンゴの戦略を考える前に、AIの基本的なところからおさらいしておこう。 2000年代前半までのAIでは、人間がまず「判断するためのルールや特徴」を示す、俗に「ルールベースによる推論」と

                                                                ドワンゴ川上会長単独インタビュー「僕らがディープラーニングで狙うもの」
                                                              • Rubyで深層学習を使った音声合成Amazon Pollyを使ってWebサイトの読み上げ音声合成してみた

                                                                今日のre:InventでDeep Learningを使った音声合成サービスのAmazon Pollyが発表されました。 正直、DLを使ったの音声合成が話題になったのなんて今年に入ってからだと思っていたのに、もう商用化したんか!という気持ちでいっぱいです。 Amazon Polly – 文章から音声へ、47の声と24の言語 | Amazon Web Services ブログ Amazon Polly – Lifelike Text-to-Speech [2016/12/02追記] PollyがDLベースという話は https://aws.amazon.com/jp/polly/ に、"Polly is an Amazon AI service that uses advanced deep learning technologies to synthesize speech that so

                                                                  Rubyで深層学習を使った音声合成Amazon Pollyを使ってWebサイトの読み上げ音声合成してみた
                                                                • プログラマならいつかは読んでおきたい(と言っておけばかっこいい)本10冊 - 2010-11-26 - きしだのはてな

                                                                  昨日の技術力をあげたいプログラマが読んでおかないと話にならない本10冊は本自体にはあまり意味がなくでその技術分野が大事で、あとエントリーレベルのものが多かったので、今日は読み甲斐のある本を。 本棚に飾っておくとかっこいい本です。あと、本屋でまとめて買って持って帰れるなら、値段的にも重さ的にも、尊敬します。 ぼくが持ってない本や持っててもほとんど読んでない本がかなり含まれてます。「この人こんな本も読んでるんだー」などと無用に尊敬したらダメですよ。むしろ、そのように誤解させて尊敬させるための本です。 アルゴリズムデザイン 作者:Jon Kleinberg,Eva Tardos共立出版Amazon読んで面白いし、アルゴリズムカタログじゃなくて設計方法の解説が多いので、とてもいい本です。途中までは読んでるので続きを読まねば。 あとアルゴリズムの本としてはアルゴリズムイントロダクションが定番ですが、

                                                                    プログラマならいつかは読んでおきたい(と言っておけばかっこいい)本10冊 - 2010-11-26 - きしだのはてな
                                                                  • Start | 和歌山大学メディアインテリジェンス研究室

                                                                    和歌山大学メディアインテリジェンス研究室(西村竜一研究室)† 本研究室では、音声や画像、動画、自然言語、センサなどの「メディア」を活用した認識・理解の知的技術によって、人と人、人と機械の協働を豊かなものにするための教育・研究を行います。 2019年度から活動している研究室です。 本研究室の学部生は、システム工学部 メディアデザインメジャーに所属しています。大学院生の所属は、システム工学研究科 知的モデリングクラスタです。 なお、本研究室は、西村が所属(担当)するデータ・インテリジェンス教育研究部門及び学生自主創造支援部門(クリエ)とも協働することで教育・研究活動を進めています。 今後は、社会インフォマティクス学環の学生の受入も行う予定です。 ↑ お知らせ† 2023/12/9 大学院生(M2)の日田さんが国立研究開発法人情報通信研究機構(NICT)の研究員みなさまと共著で発表した『複数話者

                                                                    • AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に

                                                                      AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に Amazon Lexを利用することで、「すべてのデベロッパーがAmazon Alexaに採用されている深層学習技術と同じ技術を利用できる」(Amazon Lexの説明文から)とされています。 Amazon Lexは、自動音声認識による音声からテキストへの変換機能と、テキストの内容からその意図を認識する自然言語理解機能を備えています。 つまり、電話やオンライン会議などを経由して日本語の音声をAmazon Lexに入力すると、いわゆる文字起こしのようにその内容をテキストに変換してくれます。 そしてこの音声から変換されたテキストや、Slackなどのテキストチャットなどで入力されたテキストの内容から、Amazon Lexはその意図などを理解し、会話の中から必要な

                                                                        AWS、アレクサと同様の会話理解力を持つ「Amazon Lex」日本語対応を発表。日本語で会話する音声ボットやチャットボットが開発可能に
                                                                      • ディープラーニング(Deep Learning)とは?【入門編】

                                                                        #はじめに 最近、ニュースや記事でよく目にする“ ディープラーニング(Deep Learning) ” 。 ビジネスや社会にどのように影響を与え、活用されていくのかに興味ある方が多方面に増えてきている一方で、Deep Learningについて知りたいけれども、実際よくわからない…と感じている方も多く見受けられます。 実際にMM総研の「人工知能技術のビジネス活用概況」の調査結果によると、人工知能のビジネスへの導入率は、日本は他2カ国に比べかなり遅れをとっていることが読み取れます。 引用:https://www.m2ri.jp/news/detail.html?id=238 今回は、その基本的な疑問や実際どうビジネス活用できそうなのか皆さまが想像できるようになるよう、Deep Learningとは一体どういう技術なのか、俗にいう「人工知能(AI)」や「機械学習(ML)」との違いなど基本的な情報

                                                                          ディープラーニング(Deep Learning)とは?【入門編】
                                                                        • iPhone Developer Program

                                                                          ウィジェットとライブアクティビティ ウィジェットがさらに多くの場所で活用できるようになり、パワーアップしました。WidgetKitを使ってインタラクティブな要素やアニメーションによるトランジションに対応すると、ユーザーがウィジェットから直接アクションを実行できます。既存のウィジェットにわずかな変更を加え、iOS 17向けに再ビルドするだけで、iPhoneのスタンバイ画面、iPadのロック画面、Macのデスクトップ上で視覚的に美しく表示させることができます。SwiftUIを使用すると、ウィジェットの色と間隔がコンテキストに合わせて自動調整されるため、複数のプラットフォームで使いやすさが増します。 WidgetKitとActivityKitで構築したライブアクティビティがiPadで利用できるようになり、ユーザーはアプリのアクティビティや情報をロック画面からいつでもリアルタイムで確認できます。

                                                                            iPhone Developer Program
                                                                          • Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog

                                                                            はいえーとあの google の音声入力のテストをやってみてるんですけどこれめっちゃすごいですねなんかここまで認識精度良いと思わなかったあの文字の改行とかそこだけちょっと自分でやんないといけないんですけどそれ以外は全然不満がないですねこれなにかコマンドとかあるのかなやそうでもないか何がやりたいかというと discord でちょっと仕事で使ってみたくてボイスチャットチャンネルに没頭*1参加させて録音させてそのデータを google のドキュメントとして音声で食わせて文字起こしさせればあの会議とかねリモートワークとかですごい便利なんじゃないかなと思って文字認識 api ってちょっと公開されてるかわかんないんだけどこういう api って google あんまりね有料 api 脱退後悔*2しきれなかったりっていうイメージあるんだよねまあ google ドキュメントを使わせるためのインセンティブやっ

                                                                              Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog
                                                                            • グーグルNexus SのNFCで、Suicaを読むアプリが早くも登場

                                                                              (本記事は、ゲストブロガーのITジャーナリスト 星暁雄氏による投稿です) NFC(Near Field Communication)搭載のスマートフォンは今後増えることが予想されている。NFCとは近距離無線通信のことで、電子マネーなどに使われている技術だといえば分かりやすいだろうか。 米Googleが2010年12月に発売したAndroidスマートフォン「Nexus S」は、Androidスマートフォンの中ではいち早くNFCを搭載した。同機種が搭載するOSのAndroid2.3(Gingerbread)は、スマートフォンをNFCのリーダーとして使うための標準APIを用意する。 また米AppleのiPhone次期機種はNFCを搭載するとの噂が流れている。近い将来、NFCの規格に準拠したICタグをスマートフォンで読み取るアプリケーションが多数登場することが予想される。 スマートフォンをカードに

                                                                                グーグルNexus SのNFCで、Suicaを読むアプリが早くも登場
                                                                              • アプリとプログラムが動く仕組みをトレタCTO増井雄一郎氏が解説 - ログミーTech(テック)

                                                                                株式会社トレタのCTO・増井雄一郎氏がアプリやプログラミングの仕組みについて社内勉強会で解説しました。アプリはどのように作られて、どのように動いているのかをわかりやすい例えとともに説明しています。またプログラミングを習得するには数学や英語よりも、国語力が求められるそうです。文系の人でもエンジニアの仕事をざっくりと理解できるような内容になっています。 お風呂にパソコンを持ち込んでプログラミングしている 増井雄一郎氏(以下、増井):私は「masuidrive」という名前で活動しておりまして、それで検索すると結構いろんなものが出ます。仕事ではこうやってプログラムを書いているんですが、基本的に僕は自分の時間もほとんど趣味のプログラミングをしていて、僕の写真を撮るとほぼ100%パソコンが手元に写る。それ以外の時間はほとんど何もしてないという状態になってます。 あまりにプログラムが好きなんですが、実は

                                                                                  アプリとプログラムが動く仕組みをトレタCTO増井雄一郎氏が解説 - ログミーTech(テック)
                                                                                • なぜネイティブ英語が聞き取れないのか?原因は? 単語耳と英語舌の作り方・外国語認知メカニズム - ポリグロットライフ | 言語まなび∞ラボ

                                                                                  はじめに 今回はなぜネイティブの英語・子音が聞き取れない?その原因や英語耳と英語舌の作り方を解説していきます。まぜ、日本人がネイティブの話す英語や子音を上手く聞き取れないのか?という原因について考えていきながら、外国語の認知メカニズムを明らかにします。まずは、外国語聴解に必要な要素(英語が聞き取れない原因)を整理します。その次は、理解される外国語音声の表出するために意識するべきことを確認します。それらの基礎理論を踏まえ、ネイティブの英語耳・英語舌を作りのための具体的なトレーニング方法を説明していきます。最後に、発音の学び方として、トレーニングにおすすめの教材を紹介していきます。 今回のブログではリスニング力の音声認識・認知メカニズムに焦点をあてています。頭の中で日本語から英語に翻訳してしまうなどの問題に対してはチャンク学習(パターンプラクティス)がおすすめです。 www.sunafuki.

                                                                                    なぜネイティブ英語が聞き取れないのか?原因は? 単語耳と英語舌の作り方・外国語認知メカニズム - ポリグロットライフ | 言語まなび∞ラボ