並び順

ブックマーク数

期間指定

  • から
  • まで

401 - 440 件 / 657件

新着順 人気順

音声認識の検索結果401 - 440 件 / 657件

  • 【これがゲームチェンジャーか!】松尾研のTanuki-8BとTanuki-8x8Bを試す|shi3z

    なぜタヌキなのか? その謎は謎のままだが、とにかく日本語性能がGemini1.5Proに次ぎ、少し前のGPT-4よりも高い上に商用利用可能という太っ腹仕様なので使わない手はない。むしろこれさえあればもう誰もGPTに課金しなくて済む、そんな未来が来るのかもしれない。 しかし、Tanukiは特殊な何かをしてるらしくMLXに簡単にコンバートできずvllmで動かすときもちょっと魔改造したvllmが必要になるという。 最近ローカルづいてる吾輩としてはできればMLXで動かしたいのだがMLXがまだTanukiに対応してない(し、そもそも何をすればTanuki対応にできるのかよくわからない)ので、とりあえず「非推奨」とされてはいるものの、Macでもギリギリ動きそうなGGUF版を動かしてみた。 from llama_cpp import Llama filename = "Tanuki-8B-dpo-v1.

      【これがゲームチェンジャーか!】松尾研のTanuki-8BとTanuki-8x8Bを試す|shi3z
    • Engadget | Technology News & Reviews

      The Polaris Dawn crew is back on Earth after a historic mission

        Engadget | Technology News & Reviews
      • [速報] Google I/O 2016 基調講演レポート ~ スマートホームからAndroid N の新機能まで!Google が発信する10の発表 | Recruit Tech Blog

        [速報] Google I/O 2016 基調講演レポート ~ スマートホームからAndroid N の新機能まで!Google が発信する10の発表 釘宮愼之介 こんにちは釘宮です。ただいまアメリカはマウンテンビューというところにいます。 Google が開催するクリエイティブ・カンファレンス『Google IO 2016』が日本時間5月19日に開催されました。このイベントは全世界から7000人以上が参加する3日間の大規模なイベントとなっています。初日は基調講演としてGoogleの新たなサービスやプロダクトに関する発表がされました。 今回は現地に渡った @kgmyshin と @wangxuan の二人が速報レポートとしてお伝えします。 Google I/O 2016 基調講演ダイジェスト Google Assistantという概念が生まれた Google Homeというスマートホームプ

          [速報] Google I/O 2016 基調講演レポート ~ スマートホームからAndroid N の新機能まで!Google が発信する10の発表 | Recruit Tech Blog
        • 「妹のような声」で会話できる“萌えCOCOROBO”シャープが開発 掃除能力をほめると喜ぶ

          SHARP Cloud Labsのプロジェクトの1つ、「プレミアムなCOCOROBO」は、「情緒あふれる情報サービスの充実と、音声会話機能による癒し効果の向上を目指した取り組み」としてスタート。「かわいらしい妹のようなロボット家電と暮らしたい」「魅力的な声のロボット家電と会話を楽しみたい」という顧客ニーズに応え、声優×漫画家×家電という異業種のコラボレーションで誕生したという。 人工知能や音声認識などの技術を活用したロボット掃除機「COCOROBO」に、漫画家の霜月絹鯊(しもつき・きぬさ)さんが描いたかわいらしい女の子「ココロボちゃん」(プレココちゃん)の大きなステッカーを貼付。女優・声優で16歳の木戸衣吹(きど・いぶき)さんの音声で、ユーザーと会話できる。 COCOROBOちゃんは「明るく元気だがやや気分屋」のキャラクター。聞き上手で、24時間いつでも話し相手をしてくれるという。例えば、

            「妹のような声」で会話できる“萌えCOCOROBO”シャープが開発 掃除能力をほめると喜ぶ
          • 婚活の会話、ロボットが“代行” 実際にカップル成立も

            「ご趣味はなんですか?」「日本文学が好きです」「わあ、私もなんです。偶然ですね」──合コンや婚活パーティーでありそうな自己紹介のワンシーンだが、話しているのは人間ではなく、机の上に置かれたロボットだ。 一般社団法人CiP協議会は、2月9日に開催した「ロボットが会話を代行する婚活パーティー in 竹芝」の実施結果を12日に報告した。参加者28人から、計4組のカップルが誕生したという。 CiP協議会は、竹芝地区に「コンテンツ×デジタル」産業の拠点形成を目指し活動する団体。竹芝地区でテクノロジーを活用した新しいコンテンツを生み出していく一貫として、ロボット婚活パーティーを開いた。 なぜロボットで自己紹介? 日本の生涯未婚率が上がっている背景として、「多くの日本人が、自身のコミュニケーションに苦手意識を持つなどの理由があることから、コミュニケーションの起点にロボットを活用する本企画の開催を決めた」

              婚活の会話、ロボットが“代行” 実際にカップル成立も
            • 「マイクロソフト」史上初の「完全ワイヤレスイヤホン」がすごすぎる!

              「マイクロソフト」からワイヤレスイヤホン「Surface Earbuds」が発売。Windows10と連携することで操作をおこなえるなど、画期的なモノになっているらしい! 同社初となるこの完全ワイヤレスイヤホンは、タッチセンサーと音声認識に対応するマイクを搭載。大きな円盤のような外見が印象的で、ファッション性の高さも抜群だ。 イヤホン本体をタップして操作することで、音量調整、通話、Spotifyの音楽再生などの基本動作に対応。 さらに、Windows10に接続することで、Power PointやOutlookなどのOffice製品の操作をおこなうことも可能だという。その機能を使えば、Powe Pointを用いたプレゼンテーションで、自身が喋る日本語の音声を英語字幕にライブ翻訳して表示させることなども可能に......! もちろん、13.6mmドライバーを採用するなど音響面でも妥協なし。連続

                「マイクロソフト」史上初の「完全ワイヤレスイヤホン」がすごすぎる!
              • 自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか

                2017年、米Googleや米Amazonなどの「スマートスピーカー」と呼ばれるデバイスの普及が日本で始まった。例えば、「ねえGoogle、今日の予定は?」と話しかけると、カレンダーアプリに入力していた予定を流ちょうな日本語で読み上げてくれる。中に人がいるわけではない。デバイスが人の声を認識し、応答となる声を合成しているのだ。 このデバイスが音声で応答するために使用しているコアの技術は、「音声認識」と「音声合成」という2つの技術だ。音声認識は人の声の波形を機械で処理し、どんな文であったかを推定する技術。音声合成は与えられた文やデータから、人が話す音声を合成する技術だ。 ここに、音声認識で推定した文に対して適切な応答文を出力する「対話制御」という技術が加わり、「人の話を聞いて適切な応答を音声で返す」という一連の動作を実現している。 音声認識・合成ともに、コンピュータを利用した研究は1950年

                  自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか
                • Google、Android 2.1搭載の“スーパーフォン”「Nexus One」を発表

                  Googleが1月5日(現地時間)、HTCと緊密に協力し、Android OS 2.1の持てる性能を最大限に引き出した、スマートフォンのさらに上を行く自称“スーパーフォン”「Nexus One」を発表した。 かねてからうわさがあったとおり、端末はGoogleがWebサイト(http://www.google.com/phone/)で即日販売を開始。米国、英国、シンガポール、香港から購入できる。米国ではSIMロックフリー版を529ドル、T-Mobileとの2年契約付きのものは179ドルで販売する。購入にはGoogleアカウントとGoogle Checkoutのアカウントが必要だ。なお日本からはまだ購入できない。 Snapdragon搭載、3.7インチ有機ELのタッチパネルディスプレイを装備 Nexus Oneは、HTCがデザインや製造を担当し、Googleが販売するAndroid OS 2.

                    Google、Android 2.1搭載の“スーパーフォン”「Nexus One」を発表
                  • 第3回 ベイジアンフィルタを実装してみよう | gihyo.jp

                    さらに詳細な利用方法が知りたい方は、Yahoo!デベロッパーズネットワークのマニュアルを参照してください。 ベイジアンフィルタの実装 ここから本格的にベイジアンフィルタの実装に入っていきます。 その前に、まずは先程のリスト1のコードを利用して入力された文章をわかち書きし、単語の集合を返す関数を作成しnaivebayes.pyとして保存しましょう。こちらも先程のmorphological.pyと同様にutf-8で保存してください。 リスト2 文章の分割をする関数(naivebayes.py) # -*- coding: utf-8 -*- import math import sys #yahoo!形態素解析 import morphological def getwords(doc): words = [s.lower() for s in morphological.split(doc)

                      第3回 ベイジアンフィルタを実装してみよう | gihyo.jp
                    • 培養したヒトの脳組織を使ってコンピューターを構築することに成功、日本語の音声認識にも対応

                      人間の幹細胞を基に作られた脳オルガノイド(ミニ脳)を電子チップに接続した「ブレイノウェア」と呼ばれるセットアップを構築して、簡単な計算タスクを実行することに成功したことが、インディアナ大学ブルーミントン校のエンジニアであるフェン・グオ氏らの研究チームによって報告されました。 Brain organoid reservoir computing for artificial intelligence | Nature Electronics https://www.nature.com/articles/s41928-023-01069-w Scientists Built a Functional Computer With Human Brain Tissue : ScienceAlert https://www.sciencealert.com/scientists-built-a-f

                        培養したヒトの脳組織を使ってコンピューターを構築することに成功、日本語の音声認識にも対応
                      • 深層距離学習(Deep Metric Learning)の基礎から紹介 - OPTiM TECH BLOG

                        こんにちは、R&Dチームの河野(@ps3kono)です。深層学習モデルの開発を担当しております。 今回は、画像分類、画像検査、顔認識や異常検知など様々な分野に利用されている深層距離学習(Deep Metric Learning)について紹介したいと思います。 Deep Metric Learningとは 定番のクラス分類と距離学習によるクラス分類の違い 距離学習の進化 1. 対照的(contrastive)アプローチ サンプル選択(sample selection) 代表的な学習手法 Contrastive loss Triplet loss さらなる改善と進化 対照的アプローチの問題点 2. Softmaxをベースにしたアプローチ 代表的な学習手法 Center loss SphereFace CosFace ArcFace さらなる改善と進化(2019年以降) 推論 深層距離学習の利点

                          深層距離学習(Deep Metric Learning)の基礎から紹介 - OPTiM TECH BLOG
                        • 見慣れた街でこんなバトルが……! Googleが開発した世界規模の“陣取り”ゲーム「INGRESS」が面白そう

                          Googleが開発し、世界規模で展開中のAndroid向け位置情報ゲーム「INGRESS(イングレス)」をご存知ですか? 世界の各所から漏れ出す未知のエネルギーをめぐって人類が2つの勢力に分かれて陣取り合戦を繰り広げる――そんなSF感タップリのARG(代替現実ゲーム)です。これまで招待制のβ版サービスが運営されていましたが、このほど正式リリースが発表され、誰でも参加できるようになりました。アプリはGoogle Playで無料配布されています。 なんか拡張現実感あるな! INGRESSは、Niantic LabsというGoogleの社内ベンチャー的組織が立ち上げたゲームで、2012年11月にβ版がスタートしました。今のところゲームは英語版のみですが、日本でもさまざまなプレイヤーが参加し、陣取り合戦を繰り広げています。 こちらの紹介には日本語字幕がありますよ! プレイヤーは未知のエネルギーに抵

                            見慣れた街でこんなバトルが……! Googleが開発した世界規模の“陣取り”ゲーム「INGRESS」が面白そう
                          • なぜ、AppleのM1チップはそんなに速いのか?

                            Medium(Debugger)より。 新しいM1 Macの実際の体験が動き始めました。速いです。本当に速い。しかし、なぜ? 魔法は何ですか? エリック・エンハイム Youtubeで、昨年iMacを購入したMacユーザーを見ました。それは40GBのRAMを搭載、約4000ドルの費用がかかて最大になりました。その時には、超高価なiMacが、わずか700ドルを支払った新しいM1 Mac Miniによって破壊されていく様子を信じられないような気持ちで見ていました。 実際のテストでは、M1 MacはIntel Macの最上位を超えて追い越しているだけでなく、それらを破壊しているのです。信じられない人たちは、一体どうやってこんなことが可能なのかと尋ね始めました。 あなたがその人たちの一人なら、あなたはうってつけの場所に来ました。ここでは、AppleがM1で行ったことを正確に消化可能な部分に分解する予

                              なぜ、AppleのM1チップはそんなに速いのか?
                            • OpenAIの文字起こしAI「Whisper」、医療現場での利用に研究者らが警鐘

                              米OpenAIが2022年に発表した音声テキスト変換AI「Whisper」に、文章の一部または全部を捏造してしまういわゆる「幻覚」による重大な欠陥があると、米Associated Pressは10月26日(現地時間)、多数のエンジニアや研究者へのインタビューに基づいて報じた。 Whisperは、インタビューの翻訳や文字起こし、消費者向け技術でのテキスト生成、動画の字幕作成など、世界中の様々な業界で使用されている。Associated Pressは、医療機関でもWhisperベースのツールが診察の会話の文字起こしで使われ始めていることが、深刻な懸念を引き起こしていると指摘する。 Whisperのトレーニングには、ネット上の膨大な音声データと、それに対応する文字起こしテキストから構成される、68万時間に及ぶ大規模なデータセットが使われたとしているが、トレーニングに使った具体的なソースは明示して

                                OpenAIの文字起こしAI「Whisper」、医療現場での利用に研究者らが警鐘
                              • Backbone.js ではじめるクライアントサイド MVC プログラミング | CYOKODOG

                                MVC と言えば Apache Struts をはじめとするサーバサイド・フレームワークを想像しますが、 今回は JavaScript による大規模開発の際に採用されるクライアントサイド MVC フレームワーク「Backbone.js」の使い方についてまとめてみました。 (厳密にはクライアントサイドの場合、MVC とは呼ばず MVVM とか MV* とか呼ばれてるようです。) 前提 Backbone.js の構成を簡単に言ってしまうと 単一データの管理を行うモデル 複数件のモデルの管理を行うコレクション 画面の管理を行うビュー の3つの主要モジュールを軸に構成されており、Underscore.js、jQuery(Zepto)に依存するかたちで動作するようになっています。 利用の際は、underscore.js、jquery.js、backbone.js の順で読み込みます。 //cdnjs

                                • 自分の声をキャラクターの声にリアルタイム変換するSFのような技術、リアチェンvoiceが楽器フェアに登場!|DTMステーション

                                  音声信号処理により、自分の声をまったく別の人の声に変換するというSFのような技術が登場してきました。東京・世田谷区にあるクリムゾンテクノロジーが開発した「リアチェンvoice」というのがそれ。リアル&リアルタイムに音声を変換する、ということから名付けられているそうですが、すでに8月から販売も開始されているという現実となっている技術なのです。 奈良先端科学技術大学院大学の戸田智基客員教授(名古屋大学教授)の戸田智基教授の研究グループとクリムゾンテクノロジーによる共同開発で、製品は標準版とプロ版の2種類。実際、どのくらい使えるものになっているのかを見てきましたので、紹介してみたいと思います。 リアルタイムにしゃべる声をキャラクターの声に変換するリアチェンvoice 最近、ゆるキャラの着ぐるみが各地で活躍しています。ただ、ゆるキャラをしゃべらせるとなると、なかなか無理も生じてきます。アニメなどの

                                    自分の声をキャラクターの声にリアルタイム変換するSFのような技術、リアチェンvoiceが楽器フェアに登場!|DTMステーション
                                  • 「エンジニアに無理と怒られた」――熱烈“攻殻”ファンが思い込めた「1/8タチコマ」開発の舞台裏

                                    「うちの社内では、アニメ好きの社員の中で“必修アニメ”がある。その1つが『攻殻機動隊 S.A.C.』。そんなアニメに登場する『タチコマ』を作ることになった。ただの玩具を作るだけなら、決まった言葉だけを覚えさせればいい。しかしアニメの中のタチコマなら、どんな言葉にも何かしら返答するはず。私たちは玩具ではなく、タチコマを作りたかった」 Cerevoが開発した「うごく、しゃべる、並列化する。1/8タチコマ」(c)士郎正宗・Production I.G/講談社・攻殻機動隊製作委員会 (c)Cerevo.Inc そう話すのは、家電ベンチャーCerevoの海田裕二郎プロダクトマネージャー。海田さん率いる6人のプロジェクトチームは、約1年半の歳月をかけ、アニメ「攻殻機動隊 S.A.C.」シリーズに登場する4足歩行ロボット「タチコマ」を約8分の1のサイズで再現した(関連記事)。 製品名は「うごく、しゃべる

                                      「エンジニアに無理と怒られた」――熱烈“攻殻”ファンが思い込めた「1/8タチコマ」開発の舞台裏
                                    • 金盾 - Wikipedia

                                      金盾(きんじゅん、中国語: 金盾工程、拼音: Jīndùn Gōngchéng)とは、中国本土(大陸地区)で実施されている包括的な情報管理システム構築プロジェクトであり[1]、正式な名称は全国公安工作信息化工程(全国公安業務情報化プロジェクト)である。[2] 1993年に、中国政府は金融などの情報化・電子政府化に向けて「金字工程」と称する国家戦略を立てた。これは別名を「12金工程」といい、金卡(電子貨幣)をはじめ、金橋(公用経済情報)、金関(対外貿易)、金財(財政管理)、金農(農業情報)、金税(税収)、金水(水利情報)、金質(質量監督)など12の分野にわたって「金」の字がつく情報化計画が立案されていた。 公安の情報化を目指す「金盾」もこの一つで、当初は金融分野の情報化が優先されたため、国家公安部が金盾計画を決定したのは1998年9月22日、国務院が計画を批准したのは2001年4月25日であ

                                        金盾 - Wikipedia
                                      • 呼びかけると遺影が出現、スマート仏壇「コハコ」 コンセプトモデル公開

                                        故人の名前を呼びかけると遺影の写真が表示され、タッチセンサーに触れると「おりん」が鳴る──。こんな「スマート仏壇」のコンセプトモデル「コハコ」を、デザインスタジオのBIRDMANと映像制作の二番工房が公開した。 現代の家庭には、仏壇を置く「仏間」や、洋風のインテリアに合うデザインの仏壇がないことが多く、仏壇を置きづらいという事情がある。そこで両社は、どんな間取りやインテリアにも溶け込む仏壇を開発しようと考えたという。 位牌(いはい)に見立てたUSBメモリをコハコの中に入れると、7.9インチの円形IGZO液晶ディスプレイでUSBに保存された写真や動画データを再生できる。 コハコには、カメラやマイク、LEDタッチセンサー、アロマディフューザーなどを内蔵。仏壇の前に立つとセンサーが起動し、顔や音声認識で個人を判別するという。 故人の名前を呼びかけるとディスプレイに遺影の写真を表示する他、タッチセ

                                          呼びかけると遺影が出現、スマート仏壇「コハコ」 コンセプトモデル公開
                                        • パターン認識と機械学習(PRML)まとめ - 人工知能に関する断創録

                                          2010年は、パターン認識と機械学習(PRML)を読破して、機械学習の基礎理論とさまざまなアルゴリズムを身につけるという目標(2010/1/1)をたてています。もうすでに2010年も半分以上過ぎてしまいましたが、ここらでまとめたページを作っておこうと思います。ただ漫然と読んでると理解できてるかいまいち不安なので、Python(2006/12/10)というプログラミング言語で例を実装しながら読み進めています。Pythonの数値計算ライブラリScipy、Numpyとグラフ描画ライブラリのmatplotlibを主に使ってコーディングしています。実用的なコードでないかもしれませんが、ご参考まで。 PRMLのPython実装 PRML読書中(2010/3/26) 多項式曲線フィッティング(2010/3/27) 最尤推定、MAP推定、ベイズ推定(2010/4/4) 分類における最小二乗(2010/4/

                                            パターン認識と機械学習(PRML)まとめ - 人工知能に関する断創録
                                          • Preferred Networks における研究活動 - Preferred Networks Research & Development

                                            こんにちは、新しく執行役員兼 Chief Research Strategist に就任した秋葉です。就任の挨拶を兼ねて、PFN における研究活動に関する考えを共有したいと思います。 PFN における研究とは何か? 何が研究であり何が研究でないかという境界を引くのは非常に難しく、またそれを積極的に行う意味もありません。研究とは「研ぎ澄まし究めること」を語義とし、一般に、物事について深く調査・考察を行い事実を解明したり発明を行ったりすることを指します。 PFN では挑戦的であり不確実性の高いプロジェクトが大部分を占めており、ほぼ全てのプロジェクトが少なからず研究的側面を伴います。深層学習関連のコア技術の研究開発は勿論、その応用に関してもデータやタスクに応じた適切な手法の選択や非自明な工夫がなければ上手くいかないことが殆どです。また、ロボティクス、コンピュータビジョン、自然言語処理等のような多

                                              Preferred Networks における研究活動 - Preferred Networks Research & Development
                                            • ごめんVisionPro誤解してた (๑˃̵ᴗ˂̵)|shi3z

                                              朝起きて、「うーんまだ布団から出たくないな」と思ったとき、おもむろにVisionProを被ってみた。 暗い部屋では認識が格段に悪くなるが、なぜPSVRではこういう使い方をしなかったのかわかった。後頭部だ。 PSVRは後頭部にゴツい部品があって、それで寝ながらVRを見るということが少し難しくなってる。VisionProの標準のバンドはこういうときにちょうどいい。 VisionProでTerminalを動かして、継之助の様子を見る。今日も元気に学習しているようだ。 昨日寝落ちした Amazon Primeの「沈黙の艦隊」第五話と六話を見る。音がいい。空間オーディオに対する長年の研究が結実してる感じ。しかもすごくいい音なのだ。 昨日、路上で歩きながら使ってみた(技適の特例申請には移動経路を申告済み)。路上で使うと思わぬ欠点というか盲点にぶちあたる。ウィンドウがついてこないのだ。 他のHMDと違い

                                                ごめんVisionPro誤解してた (๑˃̵ᴗ˂̵)|shi3z
                                              • 暇人\(^o^)/速報 (旧) 頭良い人!知的好奇心をくすぐられるような話して下さい!

                                                1 名前:以下、名無しにかわりましてVIPがお送りします[] 投稿日:2009/03/19(木) 15:59:51.24 ID:Gt/EalamO・深海について ・変な生物について ・人間の体の不思議 ・昔の話 ・科学的に証明されてないのに、現実に起こってること。 ・人間の五感、第六感についての話 ・宇宙の話 こんな感じ! ■科学が進化する5つの条件 8 名前:以下、名無しにかわりましてVIPがお送りします[] 投稿日:2009/03/19(木) 16:04:15.14 ID:kod9+RYNPヤバイ。宇宙ヤバイ。まじでヤバイよ、マジヤバイ。 宇宙ヤバイ。 まず広い。もう広いなんてもんじゃない。超広い。 広いとかっても 「東京ドーム20個ぶんくらい?」 とか、もう、そういうレベルじゃない。 何しろ無限。スゲェ!なんか単位とか無いの。何坪とか何?fとかを超越してる。無限だし超広い。 しかも膨

                                                • LINE、スマートスピーカー「WAVE」を今秋発売、1.5万円。スマホの次のAI時代を担う

                                                    LINE、スマートスピーカー「WAVE」を今秋発売、1.5万円。スマホの次のAI時代を担う
                                                  • Distributed TensorFlowの話 - Qiita

                                                    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Hadoop Conference Japan 2016 もともとは2月8日に開催されるHadoop Conference Japan 2016のセッションとしてこの話を応募したのですが、あえなく落選しました……(;_;) しかし、ありがたいことに復活戦のLightning Talkの投票では5位に選んでいただき、ランチタイムA会場でお話することになりました。ありがとうございます! 今回のスライドはここで公開しています。 とはいえ、5分のLTではこの内容をしっかりと伝えられる自信がないので、以下でスライド内容の詳しい解説をしたいと思いま

                                                      Distributed TensorFlowの話 - Qiita
                                                    • 「自分の付加価値は何なのか」を考え続けていく必要がある 及川卓也氏が思う「エンジニア」と「生成AI」の関係性

                                                      及川卓也氏に聞く必要な“エンジニア力”の身につけ方 「自分の付加価値は何なのか」を考え続けていく必要がある 及川卓也氏が思う「エンジニア」と「生成AI」の関係性 米国OpenAI社が公開した「ChatGPT」が盛り上がりを見せている中、議論されがちなのは“AIの脅威”。それではエンジニアやプログラマーにとって、AIは脅威なのでしょうか?それとも新たな相棒なのでしょうか? 今まで多くのエンジニア組織をまとめてきた及川卓也氏に、エンジニアとChatGPTの関係についてうかがいしました。 ChatGPTに対してプログラマーができること ーー最近の話でいうと、ChatGPTのような生成AIが出てきて、なんか「エンジニアの仕事も取られるんじゃないの?」とか、エンジニアもプログラミングをやっていて、ChatGPTももちろんプログラミングをするというのはあるとは思うんですけど、そういう意見も一部はあるの

                                                        「自分の付加価値は何なのか」を考え続けていく必要がある 及川卓也氏が思う「エンジニア」と「生成AI」の関係性
                                                      • なぜ何千人ものAI研究者がネイチャーなどの学術誌での論文掲載をボイコットしているのか?

                                                        by Franck V. Nature(ネイチャー)などの学術誌では毎年さまざまな学術論文が掲載されていますが、AI関連の研究分野として注目を集める機械学習に関する研究論文は、無料で誰でも使えるオープンアクセスジャーナルなどで公開されるケースが多いものです。なぜ有料で購読する必要のある学術誌などではなく、無料で誰でも読めるオープンなプラットフォーム上で公開されるケースが多いのかについて、シェフィールド大学で機械学習の教授を務めるニール・ローレンス氏が説明しています。 Why thousands of AI researchers are boycotting the new Nature journal | Science | The Guardian https://www.theguardian.com/science/blog/2018/may/29/why-thousands-of

                                                          なぜ何千人ものAI研究者がネイチャーなどの学術誌での論文掲載をボイコットしているのか?
                                                        • 講義まとめ:自然言語処理のための深層学習(CS224d) - Qiita

                                                          CS224d(自然言語処理のための深層学習)はスタンフォード大のRichard Socherが2015年から教えている講義で、動画やスライドなどの講義資料と演習問題がウェブ上で無料で公開されています。 CS224d: Deep Learning for Natural Language Processing 会社の勉強会で週1回半年程度かけて講義動画と演習を終えたため、勉強したことを簡単にまとめてみたいと思います。 なぜ今なのか? 深層学習(Deep Learning)は2000年代後半のRBMやauto-encoderなどの教師なし学習から流行が始まりましたが、それらを教師あり学習の事前学習に使うアプローチは徐々に衰退し、2010年代前半には画像認識のための畳み込みネットワークがImageNetコンテストのおかげで爆発的に有名になりました。詳しくありませんが音声認識の分野でも既存の複雑な

                                                            講義まとめ:自然言語処理のための深層学習(CS224d) - Qiita
                                                          • ブラウザ上で3Dキャラクターと会話できる「ChatVRM」をオープンソースで公開しました - pixiv inside

                                                            こんにちは、VRoid部のkeshigomuです。 普段は主にVRoid Hubのフロントエンドエンジニアとして、3Dキャラクターを表示するビューワーの開発に携わっています。また@pixiv/three-vrmという、Web上で3Dモデルを使ったコンテンツを開発するためのOSSライブラリの運用も行っています。 今回、ブラウザで簡単に3Dキャラクターと会話できる技術デモ「ChatVRM」とそのコードをオープンソースで公開しました。 「ChatVRM」は、テキスト・口頭で話しかけた言葉にキャラクターがフルボイスで回答してくれる「キャラクターと会話できる」デモです。WEBブラウザ上で動作でき、3Dキャラクターのインポート・切り替え、キャラクターに併せて声を調整することもできます。 (2023/07/10追記) 読み上げ音声の生成に使用していたKoeiro APIの提供終了に伴い、以前のデモとコー

                                                              ブラウザ上で3Dキャラクターと会話できる「ChatVRM」をオープンソースで公開しました - pixiv inside
                                                            • 「この部屋に漆黒の闇をもたらして……」とGoogle Homeに命じて消灯してみる

                                                              「この部屋に漆黒の闇をもたらして……」とGoogle Homeに命じて消灯してみる:山口真弘のスマートスピーカー暮らし(1/2 ページ) 赤外線リモコンで操作可能な家電製品を、「Google Home」から音声でコントロール可能にしてくれるのが「Nature Remo」だ。利用にあたっては、まずスマートフォンから家電製品をコントロールできるように設定し、その後外部サービスを使って、Google Homeと連携させるという手順を踏む。 前回の記事では、スマホから家電製品をコントロールするための設定手順を紹介した。今回はWebサービスの「IFTTT(イフト)」を使ってGoogle Homeと連携させる手順を紹介しよう。本稿のタイトルの意味については、その後でじっくりと触れたい。 Google Homeに指示→IFTTT→Nature Remo→家電を操作 Nature RemoとGoogle

                                                                「この部屋に漆黒の闇をもたらして……」とGoogle Homeに命じて消灯してみる
                                                              • 【閲覧注意】死ぬ程洒落にならない怖い話を集めてみない?『オリンパスのリストラ方法』:哲学ニュースnwk

                                                                2011年10月22日18:53 【閲覧注意】死ぬ程洒落にならない怖い話を集めてみない?『オリンパスのリストラ方法』 Tweet 335: なまえないよぉ~:2011/10/18(火) 11:06:49.29 ID:Ma0aziuI0 なまえないよぉ~ 怖い話っつーか迷信みたいなものなんだけど... 地中海のなんとかって島では歩いてるとよく誰かに名前を呼ばれるんだって でもそこで、振り向いたり返事したりしたらアウト 名前を呼ばれた人はそのままその誰かにどこかへ連れてかれてしまうんだと でもそいつは一回呼んで無視されるとあきらめるらしい だから、そこの人達は道で人に話しかけるときは二回名前を呼ぶらしい 逆に言うと二回名前を呼ばれない限りは絶対に振り返ってはいけないんだって みなさんも地中海の方に旅行に行くときは気をつけて... 71:本当にあった怖い名無し:2011/10

                                                                • LSTMネットワークの概要 - Qiita

                                                                  Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Christopher Olah氏のブログ記事 http://colah.github.io/posts/2015-08-Understanding-LSTMs/ の翻訳です。 翻訳の誤りなどあればご指摘お待ちしております。 ##リカレントニューラルネットワーク 人間は毎秒ゼロから思考を開始することはありません。このエッセイを読んでいる間、あなたは前の単語の理解に基づいて、各単語を理解します。すべてを捨てて、またゼロから思考を開始してはいません。あなたの思考は持続性を持っています。 従来のニューラルネットワークは、これを行うことができま

                                                                    LSTMネットワークの概要 - Qiita
                                                                  • 【悲報】JASRACのせいでGmailやDropbox有料化の恐れ。「今回はスマホやクラウドからも徴収する」 : IT速報

                                                                    1: フェイスロック(庭) 2013/11/17(日) 12:31:12.34 ID:T1RLB+X10 BE:1032216544-PLT(12001) ポイント特典 日本音楽著作権協会(JASRAC)など音楽や映像の権利者団体などで構成される「Culture First」は11月14日、著作物の「コピー(複製)」に対する、新たな補償金制度の創設を提案した。著作物の「コピー機能」を有する機器やサービスの提供者は、機器かサービスかに関係なく、権利者への「補償金」支払いを義務付けるという制度だ。 もしこの制度が成立すると、様々な機器メーカーやサービス事業者が、権利者に補償金を支払う義務が生じる。そして実際に金額を負担するのは、価格転嫁された商品やサービスを購入・利用する「消費者」となりそうだ。 ■補償金の激減が提案の原因か この提案の背景には、補償金の落ち込みがあるとみられる。 私的録音補償

                                                                      【悲報】JASRACのせいでGmailやDropbox有料化の恐れ。「今回はスマホやクラウドからも徴収する」 : IT速報
                                                                    • https://jp.techcrunch.com/2017/02/17/20170216youtube-says-it-now-has-automatically-captioned-1b-videos/

                                                                        https://jp.techcrunch.com/2017/02/17/20170216youtube-says-it-now-has-automatically-captioned-1b-videos/
                                                                      • オペレーティング・システムから、オペレーティング・エージェントへ|深津 貴之 (fladdict)

                                                                        今回の発表で強く感じたことは、やはりOpenAIの目指すChatGPTが単なるチャットアプリケーションではないということだ。 従来のオペレーティングシステム(OS)はハードウェアとアプリケーションの架け橋である。だがOpenAIはChatGPTを「言語で命令できるオペレーティングエージェント」と位置付け、人生のあらゆるタッチポイントで新たなゲートキーパーとなろうとしているように思える。 IT競争は手前の取り合い歴史を振り返れば、IT競争の常道とは、ゲートウェイを手前に築くことにあったようだ。PCの争いをOSが無意味化し、OSの争いをブラウザが、ブラウザの争いを検索エンジンがと、そしてそれをスマホとアプリが…このようにITの争いは常に手前を争うものだった。こうして一番手前を抑えた企業は、大きな利益を手に入れた。 今、OpenAIの動きは、このメタゲームに大きな変化を加えつつある。 OpenA

                                                                          オペレーティング・システムから、オペレーティング・エージェントへ|深津 貴之 (fladdict)
                                                                        • 「ポーズ」と「合言葉」がなければ開かない自動ドア、文教大が開発

                                                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 文教大学川合研究室の研究チームが開発した「ユーザのアクションによって反応する自動ドアの開発」は、音声と姿勢で認証する自動ドアの開閉システムだ。自動ドアに設置したカメラで姿勢推定と音声認識を行い、あらかじめ決めておいたポーズと言葉が合致すれば開く。

                                                                            「ポーズ」と「合言葉」がなければ開かない自動ドア、文教大が開発
                                                                          • Amazon大化けの10年。もう誰にも止められない

                                                                            Amazon大化けの10年。もう誰にも止められない2019.12.24 21:0031,333 Adam Clark Estes - Gizmodo US [原文] ( satomi ) 「配達ありがとう。ご自由にどうぞ」という軒先の差し入れに感動して踊り出すAmazon配達員の動画、もう見ました? 監視カメラRingに残っていた映像を家主が投稿して再生1800万回のバイラルヒット中のものです。 いい話だな~♡と自分も一瞬ホンワカしましたが、Yahooで配達員のKarim Ahmad-Reedさんのこんな言葉を読んで固まってしまいました。 「差し入れのある家なんて初めてでした。あの日は昼ごはん忘れて腹ペコで、喉も少し乾いていたからね」 宅配のラスト・ワンマイルAmazon社員と言っても、宅配のラスト・ワンマイルの一番大変な部分を担うのは主に非正規雇用の契約ワーカーで、飲まず食わずでサンタ役

                                                                              Amazon大化けの10年。もう誰にも止められない
                                                                            • 月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita

                                                                              何をした? Youtube上に公開されている動画の音声から、ディープラーニング技術を用いた音声合成ツールを構築しました。 今回対象にしたのは、バーチャルユーチューバー・にじさんじの委員長こと 月ノ美兎 さん(Youtubeチャンネル) です。 ※選出理由は、単純に私がYoutube上で一番推している方だからです。 成果 動画から抽出した音声と、音声を文章に起こしたテキストの組み合わせのデータセット約50分ぶんを教師データとして学習した結果 ※学習に必要なデータ量は最低でも1時間程度と言われているので、まだまだ足りていません… 月ノ美兎さんの音声合成ツールを作ってみた https://t.co/YVdWW9vREb via @YouTube — K2 (@K2ML2) May 29, 2020 発話内容が不明瞭な箇所がありますが、一応ご本人の声に近い音声を作成することができているかと思います

                                                                                月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita
                                                                              • Engadget | Technology News & Reviews

                                                                                Pick up the 9th-gen iPad with two years of AppleCare+ for only $298

                                                                                  Engadget | Technology News & Reviews
                                                                                • 深層学習による自然言語処理 - RNN, LSTM, ニューラル機械翻訳の理論

                                                                                  本稿ではニューラルネットワーク,誤差逆伝播法,言語モデル,RNN,LSTM,ニューラル機械翻訳の一連の手法について数理的に解説する. 前編の目次 ニューラルネットワーク 順伝播 (Forwardpropagation) 逆伝播 (Backpropagation) リカレントニューラルネットワーク (RNN) Recurrent Neural Network Language Model (RNNLM) Backpropagation Through Time (BPTT) Long Short-Term Memory (LSTM) Gated Recurrent Unit (GRU) RNN のドロップアウトとバッチ正規化 ニューラル機械翻訳 (NMT) Sequence to Sequence (seq2seq) 注意 (Attention) 双方向エンコーダー・多層LSTM 評価手法

                                                                                    深層学習による自然言語処理 - RNN, LSTM, ニューラル機械翻訳の理論