並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 270件

新着順 人気順

音声認識の検索結果121 - 160 件 / 270件

  • NVIDIAが音声認識追加や画像検索改善を行ったAIチャットボット「ChatRTX」を公開

    NVIDIAが、AIチャットボット「ChatRTX」でサポートするLLMを追加して画像検索機能の改善や音声認識機能の追加を行ったことを発表しました。 Build a Custom LLM with ChatRTX | NVIDIA https://www.nvidia.com/en-us/ai-on-rtx/chatrtx/ ChatRTX Adds New AI Models and Features | NVIDIA Blog https://blogs.nvidia.com/blog/ai-decoded-chatrtx-update/ Nvidia’s AI chatbot now supports Google’s Gemma model, voice queries, and more - The Verge https://www.theverge.com/2024/5/1/

      NVIDIAが音声認識追加や画像検索改善を行ったAIチャットボット「ChatRTX」を公開
    • 「Teachable Machine」で機械学習した音声認識データを使って「Scratch」でプログラミング ~拡張機能「TM2Scratch」を専用の「Scratch」で(Impress Watch) - Yahoo!ニュース

        「Teachable Machine」で機械学習した音声認識データを使って「Scratch」でプログラミング ~拡張機能「TM2Scratch」を専用の「Scratch」で(Impress Watch) - Yahoo!ニュース
      • 同僚と怖い話をし、帰宅時間になると「ピポッと」音声認識が起動した→すると検索結果に『ああああああああ』と出ており…

          同僚と怖い話をし、帰宅時間になると「ピポッと」音声認識が起動した→すると検索結果に『ああああああああ』と出ており…
        • 音声認識で自動議事録作成ツールをつくった。なんとなく。:村上福之の「ネットとケータイと俺様」:オルタナティブ・ブログ

          https://gijiroku.fukuyuki.net/ よくある、音声認識で自動で議事録をつけるやつをつくりました。MacやWindowsやChromebookなどのChrome専用です。 Pixel4の文字起こしデモが出て、「議事録に使える!」「議事録に使える!」「議事録に使える!」というツィートが多くて、え?前から文字起こしアプリやサービスって結構あるよねって思った。各種IME(オジサン語: FEP)も音声認識に対応し、google driveでも音声認識できる令和元年、そんなにすごいのか。話者認識やオフライン大事なのかな? たしかに議事録に特化したやつないよなぁと思って自動議事録作成ツールを作った。ChromeのSpeechRecognitionの音声認識のまんまなので、音声認識率はGoogleクオリティです。ばんざい。バックグラウンドでも動作します。また、音声認識で文字起こし

            音声認識で自動議事録作成ツールをつくった。なんとなく。:村上福之の「ネットとケータイと俺様」:オルタナティブ・ブログ
          • 日本語に特化した高精度な音声認識 ReazonSpeech を使って、会議音声を書き起こししてみた | DevelopersIO

            こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 本記事では、株式会社レアゾン・ホールディングスが2023年1月18日に公開したReazonSpeechを使ってみたいと思います。 ReazonSpeechはプロダクト群の総称で、日本語に特化した超高精度なモデルと、その学習に使用されたコーパス、コーパス作成のためのツールなどが公開されています。 詳細は下記リンクを参照ください。 モデルの方は、ライセンスがApache-2.0となっており商用利用も可能な形となっています。 コーパスはテレビなどの音声となりますので、CDLA-Sharing-1.0 (ただし利用目的は著作権法30条の4に定める情報解析に限る)とされています。 今回はこのモデルをColab上で動かして、以前投稿したWhisperなどと比較してみたいと思います。 実行手順は下記の以前の記事も参考にされてください

              日本語に特化した高精度な音声認識 ReazonSpeech を使って、会議音声を書き起こししてみた | DevelopersIO
            • メタ、1000言語以上に対応した音声認識・生成モデルを公開

              メタは、音声データと付随するテキストデータを納めたデータセットがなくても、わずかなデータから音声認識・生成可能なAIモデルを構築した。多くの言語に対応した音声アプリの開発に役立つ可能性がある。 by Rhiannon Williams2023.05.25 2 15 メタ(Meta)は1000以上の言語について、音声認識・生成が可能な人工知能(AI)モデルを構築した。対応可能な言語の数はこれまでの10倍となる。この取り組みは、消滅の危機に瀕している数々の言語の保存に向けた重要な一歩であると同社は述べている。 メタは、コード・ホスティング・ サービス「ギットハブ(GitHub)」を通じてモデルを公開した。同社は、モデルをオープンソース化することで、異なる言語を使う開発者が、すべての人が理解できるメッセージングサービスや、あらゆる言語で利用可能な実質現実(VR)システムといった新しい音声アプリケ

                メタ、1000言語以上に対応した音声認識・生成モデルを公開
              • AmiVoice API-開発者向け音声認識エンジン(アミボイス)

                どの音声認識サービスを選べばよいか迷っていますか? 各サービスの比較一覧やフローチャートでお客様の案件にあったサービスがわかります。 ・サービスの違いを見る ・サービスの選び方資料ダウンロード 開発向け音声認識サービス AmiVoice API 従量課金制のクラウド型音声認識API AmiVoice API Private オンプレミス・お客様専用の音声認識API AmiVoice SDK オフラインで使える音声認識エンジン Amazon Connect 向けサービス AmiVoice TextStream for Amazon Connect Amazon Connectの通話のリアルタイム文字化サービス AmiVoice IVR for Amazon Connect Amazon ConnectのIVRに最適化した音声認識サービス

                  AmiVoice API-開発者向け音声認識エンジン(アミボイス)
                • 「E2E音声認識」と「話者分離」のためのラベルなしデータ学習 「CLOVA Note」で認識性能向上するための技術

                  2021年11月10日と11日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2021」がオンラインで開催されました。そこでEnd-to-End音声認識技術の実用化とAI音声記録サービス「CLOVA Note」について紹介されました。まずはNAVERのリュー ヒョクス氏から、サービスの紹介とそれに使われている技術について。 CLOVA Speechチーム リューヒョクス氏:End-to-End音声認識と「CLOVA Note」というサービスについて、LINEの木田とNAVERのリューヒョクスが発表します。この音声認識は、NAVER CLOVA、LINEのSpeechチーム共同での研究開発の成果です。よろしくお願いします。 本日は2部構成で発表いたします。最初にNAVER CLOVAのリューヒョクスがEnd-to-End音声認識とは

                    「E2E音声認識」と「話者分離」のためのラベルなしデータ学習 「CLOVA Note」で認識性能向上するための技術
                  • Googleを上回る音声認識精度ですべての「商談」を文字起こし 海外ピッチの優勝回数2桁超のベンチャーが見る、AI API市場の魅力

                    「IVS2023 KYOTO」内にて、次世代の起業家の登竜門とも言われる日本最大級のスタートアップピッチコンテスト「IVS LAUNCHPAD」が開催されました。本記事では、海外のピッチコンテストで10度以上優勝を経験しているPoeticsの山崎はずむ氏による、セールステックからより大きなAI API市場への展開ついての6分間のプレゼンテーションをお届けします。 「なぜ失注したのか」が見えない、営業のブラックボックス化 山崎はずむ氏(以下、山崎):はじめまして、Poeticsの山崎と申します。我々は電話・オンライン商談を解析するAI「JamRoll」を提供しています。 JamRollが解決する課題は、営業のブラックボックス化問題。成約・失注といった結果はSalesforceを見ればわかりますが、「なぜ失注したのか」というプロセスが見えないと改善策を打ち出せません。 一方で、成約や失注の原因

                      Googleを上回る音声認識精度ですべての「商談」を文字起こし 海外ピッチの優勝回数2桁超のベンチャーが見る、AI API市場の魅力
                    • これで音声テキスト化が楽になる!Pythonで音声認識を作る方法

                      最近ではPythonでプログラミングをしたり、AI(人工知能)を使ったりする人が増えていますよね。 Pythonでプログラミングして作れる物の一つに、音声認識があります。以前は音声認識の精度があまり良くありませんでしたが、近年、音声認識の精度は驚くほど向上し、色々な言語の違いだけではなく、方言まで認識することができるようになったとのこと。さらに、さまざまなAPIの登場などにより、音声認識のプログラムを作成した経験がない人でも簡単に、Pythonで音声認識ができるようになりました。 とはいえ、何も知らない状態でいきなり音声認識を作るのはやはり難しいでしょう。そこで今回は、Pythonで音声認識を作る方法についてお伝えします。1つ1つ丁寧に解説していくので、Pythonの音声認識の作り方について、一緒にマスターしましょう!

                        これで音声テキスト化が楽になる!Pythonで音声認識を作る方法
                      • 【wav2vec 2.0】Facebook AIが新しい音声認識フレームワークを公開!自己教師あり学習により正解ラベルなしで高精度を達成!?

                        3つの要点 ✔️ Facebook AIが新しい音声認識フレームワーク「wav2vec 2.0」を公開 ✔️ 自己教師あり学習により,少量の文字起こし音声と正解ラベルなし音声で学習 ✔️ ラベルなしデータ・ラベル付きデータのみの場合の両方で最高精度を達成 wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations written by Alexei Baevski, Henry Zhou, Abdelrahman Mohamed, Michael Auli (Submitted on 20 Jun 2020 (v1), last revised 22 Oct 2020 (this version, v3)) Comments: Accepted at NeurIPS 2020 Subject

                          【wav2vec 2.0】Facebook AIが新しい音声認識フレームワークを公開!自己教師あり学習により正解ラベルなしで高精度を達成!?
                        • もじこ - AI音声認識を使った文字起こしエディタ

                          放送局では日々、多くの文字起こしが行われています。文字起こしは地獄です。この地獄に立ち向かうために「もじこ」は作られました。「もじこ」はあなたに寄り添いながら文字起こしのお手伝いをします。

                            もじこ - AI音声認識を使った文字起こしエディタ
                          • 【フリーゲーム】彼女の命運は”あなたの声”に託された!?衝撃の音声認識脱出ADV『声で導け!脱出のアリア』 – もぐらゲームス

                            人間の声をコンピュータに認識させ、文字列に変換させたり、その特徴に応じて固有の反応を返し、識別する”音声認識”の技術。昨今はパソコン、スマートフォンへの関連機能搭載などもあって急速に世の中へと普及した。ひと昔前はごく一部の言語などにしか反応しなかったのも、AI技術の発展もあり、本格的な対話が実現できるレベルにまで至りつつある。 そんな音声認識はゲームに採用された例も複数ある。中でも『ピカチュウげんきでちゅう』、『シーマン』の2作品は現代ほど技術が発展していなかった時期を象徴する作品として、未だ輝きを放っている。以降も同様の技術を採用したゲームがいくつか誕生し、中には指示を飛ばし、困難を乗り越えるスリリングな内容のものも誕生している。 そんな指示を飛ばすタイプの音声認識採用ゲームがなんと!フリーゲーム界隈に現れた。 その名も『声で導け!脱出のアリア』。 ”あなた”の声で少女を脱出させろ!20

                              【フリーゲーム】彼女の命運は”あなたの声”に託された!?衝撃の音声認識脱出ADV『声で導け!脱出のアリア』 – もぐらゲームス
                            • 音声認識によるリアルタイム字幕&翻訳が可能な「Speech to Text Webcam Overlay」をZoomで使ってみた - DENET 技術ブログ

                                音声認識によるリアルタイム字幕&翻訳が可能な「Speech to Text Webcam Overlay」をZoomで使ってみた - DENET 技術ブログ
                              • 誰でも簡単に「会話を目で見る」ことができる 無料のAI音声認識アプリ「CLOVA Note β(クローバ・ノート)」本日より提供開始!

                                誰でも簡単に「会話を目で見る」ことができる 無料のAI音声認識アプリ「CLOVA Note β(クローバ・ノート)」本日より提供開始!LINEの音声認識AIによるテキスト変換機能を無料提供 複数名の話者分離を可能とした会議の議事録作成や書き起こしにマルチデバイスで対応 LINE株式会社(本社:東京都新宿区、代表取締役社長:出澤 剛)は、LINEのAIテクノロジーブランド「LINE CLOVA」より、「会話を目で見る」ことができる無料のAI音声認識アプリ「CLOVA Note(クローバ・ノート)」のβ版の提供を本日5月24日(火)より開始しましたので、お知らせいたします。 「CLOVA Note」は、LINE CLOVAのAI技術である「CLOVA Speech(音声認識)」の音声認識AIによって、録音した声をテキストに変換するAI音声認識アプリです。アプリをインストールし、スマートフォンや

                                  誰でも簡単に「会話を目で見る」ことができる 無料のAI音声認識アプリ「CLOVA Note β(クローバ・ノート)」本日より提供開始!
                                • 京都大学がAIによるアイヌ語の自動音声認識・合成に成功 | Techable(テッカブル)

                                  京都大学は、アイヌ語の音声の自動認識・合成を行なう人工知能の開発に成功したと発表した。 消滅危機にあるアイヌ文化今回の研究は、アイヌ文化の多くが口頭で伝承され、アイヌ語は2009年にUNESCOにより「極めて深刻な」消滅危機言語に認定される事態となっている背景を受け進められていた研究。以前から、口頭伝承を録音・記録する活動が様々に行われてきたが、その書き起こし・アーカイブ化には膨大な手間と アイヌ語の知識を必要とするため、多くが未整備となっていた。 そこで同研究グループは、文化庁「アイヌ語のアーカイブ作成支援事業」を活用してアイヌ語アーカイブの構築に取り組んでいるアイヌ民族博物館や平取町立二風谷アイヌ文化博物館と協力しながら、2017年からアイヌ語の自動音声認識・合成(AINU語AI)の研究開発に取り組んできたという。 高い認識率研究では、提供された民話の音声データを分析。その結果、音節を

                                    京都大学がAIによるアイヌ語の自動音声認識・合成に成功 | Techable(テッカブル)
                                  • オンライン会議の発言を音声認識で可視化する無料サービス、ユーザーローカルが提供開始 発言者の感情や単語の使用頻度も分析

                                      オンライン会議の発言を音声認識で可視化する無料サービス、ユーザーローカルが提供開始 発言者の感情や単語の使用頻度も分析
                                    • [M1] 音声認識ツール Voskを動かす [Node] | DevelopersIO

                                      Introduction 各所で話題の日本語音声認識ツール,Voskがすごいです。 実際やってみたところ、簡単なプログラムで日本語のリアルタイム音声認識ができました。 (M1非対応かと思ってたけど、なんか普通に動いた) VoskのインストールからNodeで動かすところまでやっていきます。 Environment OS : MacOS 12.4 Node : v18.2.0 yarn : 1.22.15 MacBook Pro (13-inch, M1, 2020)で動作確認。 Try では実際にやってみます。 Githubにはいろいろなサンプルがありますが、 今回はこのシンプルなプログラムを使ってみます。 このサンプルはマイクから入力された音声を 日本語でコンソールに表示するだけのシンプルなものです。 まずは適当なディレクトリを作成し、voskをインストール。 % mkdir vosk-e

                                        [M1] 音声認識ツール Voskを動かす [Node] | DevelopersIO
                                      • AI音声認識を活用した文字起こしでZoomミーティング・ウェビナーの字幕機能を搭載 | DXを推進するAIポータルメディア「AIsmiley」

                                        株式会社アドバンスト・メディアは、AI音声認識を活用した文字起こし支援アプリケーションに、Zoomミーティング・ウェビナーの字幕機能を搭載したことを発表しました。 このAIニュースのポイント AI音声認識を活用した文字起こしでZoomミーティング・ウェビナーの字幕機能を搭載 難聴者・聴覚障がい者との会議にも活用が可能 ソフトをインストールしていない人の画面にも字幕表示が可能 株式会社アドバンスト・メディアは、AI音声認識を活用した文字起こし支援アプリケーション「AmiVoice ScribeAssist」に、Zoomミーティング・ウェビナーの字幕機能を搭載したことを発表しました。また、2月19日(金)、ヤマハ ウェビナーにてZoom連携活用について講演が行われます。 Zoomミーティング・ウェビナーでの会話をリアルタイムで文字化し、画面内に字幕として表示できます。発話を視覚化することでより

                                          AI音声認識を活用した文字起こしでZoomミーティング・ウェビナーの字幕機能を搭載 | DXを推進するAIポータルメディア「AIsmiley」
                                        • 「JoeyNMT」で音声データを使った自動音声認識、音声翻訳モデルを作る

                                          「JoeyNMT」で音声データを使った自動音声認識、音声翻訳モデルを作る:「Python+PyTorch」と「JoeyNMT」で学ぶニューラル機械翻訳(終) 精度向上により、近年利用が広まっている「ニューラル機械翻訳」。その仕組みを、自分で動かしながら学んでみましょう。第3回は「JoeyNMT」を音声に対応させて、音声認識や音声翻訳のタスクをエンドツーエンドで解くモデルを構築してみましょう。 ハイデルベルク大学の博士課程に在籍しながら、八楽という会社で「ヤラクゼン」の開発に携わっている太田です。ヤラクゼンは、AI翻訳から翻訳文の編集、ドキュメントの共有、翻訳会社への発注までを1つにする翻訳プラットフォームです。 第2回は、Discordのチャットbotでニューラル機械翻訳を試す方法と「JoeyNMT」のカスタマイズ方法を紹介しました。第3回は「JoeyNMT」を音声に対応させて、音声認識や

                                            「JoeyNMT」で音声データを使った自動音声認識、音声翻訳モデルを作る
                                          • M5Stick-Cで音声認識(TensorFlow Lite for MCU)

                                            M5Stick-Cに、先日のM5Stack用音声認識を移植してみました。 コードは以下のリポジトリに置いてあります。(M5Stack版の別ブランチ) boochow/TFLite_Micro_MicroSpeech_M5Stack at m5stickc M5Stick-Cでは、マイクがデジタルで、かつスピーカーからのノイズを拾わないためか、認識性能はM5Stackよりも良好です。声もM5Stackのときよりも小さくてもOKです。 認識結果は、Avatarは使わず普通にLCDに表示させています。

                                              M5Stick-Cで音声認識(TensorFlow Lite for MCU)
                                            • 声でカーナビを操作! ディープラーニングによる音声認識技術の応用事例 #ディープラーニング

                                              ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。サイエンス統括本部で音声認識の技術開発を担当している木田です。 この年末年始、帰省や旅行でお出かけの際にカーナビを利用される方が多いのではないでしょうか? ヤフーではYahoo!カーナビというサービスを提供していますが、2018年12月に音声によるハンズフリー操作機能が導入されました(2019年12月現在はAndroid版のみ対応)。 今回はその技術の裏側をご紹介します! 写真:アフロ 使い方とシステム構成 それでは、この機能の使い方を説明します。 まずはYahoo!カーナビを起動し、こちらのページに記載している設定を行うことで、ハンズフリー操作が有効になります。 設定ができたら、「ねぇヤフー」と呼びかけてみてください

                                                声でカーナビを操作! ディープラーニングによる音声認識技術の応用事例 #ディープラーニング
                                              • 記者に特化した音声認識モデル(Whisper)を作った話|朝日新聞社 メディア研究開発センター

                                                こんにちは、メディア研究開発センターの山野陽祐です。 先日、朝日新聞の記者に特化したWhisper (音声認識モデル)を構築し、3月末から社内向けツール「YOLO」にて運用を開始しました。それに至るまでの道のりをこちらの記事でご紹介します。 なお、学習データとして活用するファイルは、社内会議や公の記者会見とし、個人情報やセンシティブな情報が含まれるファイルは使用しておりません。 データ「YOLO」は音声や動画の文字起こしをする社内向けのサービスで、約2年前にリリースしました。この間にアップロードされた音声ファイルや動画ファイルは数千時間におよび、そのうち学習に使えるデータも多くあります。 ここでは、YOLOで蓄積されたデータを紹介し、続いて学習データや評価データについても述べます。 YOLOデータアップロード時、ユーザーにファイルの"ジャンル"を指定してもらうようなサービス設計をしています

                                                  記者に特化した音声認識モデル(Whisper)を作った話|朝日新聞社 メディア研究開発センター
                                                • 「watchOS 11」が登場、手首で手軽に音声認識&翻訳できる機能など

                                                  2024年6月11日2時からAppleが開催している年次開発者会議「WWDC24」の基調講演で、Apple Watch向けOSである「watchOS」の次期メジャーバージョンとなる「watchOS 11」が発表されました。 Appleのイベント - Apple(日本) https://www.apple.com/jp/apple-events/ watchOS 11が健康とフィットネスに関するパワフルな洞察を提供 - Apple (日本) https://www.apple.com/jp/newsroom/2024/06/watchos-11-brings-powerful-health-and-fitness-insights/ WWDC 2024 — June 10 | Apple - YouTube watchOS 11では新たに「トレーニングの負荷」が登場します。 「トレーニングの

                                                    「watchOS 11」が登場、手首で手軽に音声認識&翻訳できる機能など
                                                  • Microsoftが音声認識アシスタント「Cortana」を巡る特許訴訟で377億円の支払い命令を受ける

                                                    by Underway In Ireland Microsoftの音声認識アシスタント機能「Cortana」がIPA Technologiesの特許を侵害しているとして2018年から行われてきた裁判で、デラウェア州の連邦陪審は特許侵害を認定し、Microsoftに最大2億4200万ドル(約377億円)の支払いを命じました。 Microsoft hit with $242 million US verdict in Cortana patent lawsuit | Reuters https://www.reuters.com/legal/microsoft-hit-with-242-million-us-verdict-cortana-patent-lawsuit-2024-05-10/ Microsoft to Pay $242 Million in Patent Case Over C

                                                      Microsoftが音声認識アシスタント「Cortana」を巡る特許訴訟で377億円の支払い命令を受ける
                                                    • 「パズル」でスッキリ! 東大生が「音声認識」の仕組みを徹底解説!(東京大学CAST)

                                                      最近は、両手がふさがっていても「Hey Siri」や「OK Google」と話しかければスマホを使うことができますよね。便利な世の中だなぁ。 今回の「現役東大生のサイエンス入門」では、そんな「音声認識」に用いられるアルゴリズムについて、「パズル」を用いて迫っていきたいと思います。

                                                        「パズル」でスッキリ! 東大生が「音声認識」の仕組みを徹底解説!(東京大学CAST)
                                                      • 超軽量なCNN音声認識モデル!Google開発「ContextNet」を解説!

                                                        3つの要点 ✔️ Googleが軽量なCNN音声認識モデルを提案 ✔️ squeeze-and-excitationモジュールによってグローバルコンテキストを考慮 ✔️ Progressive Downsamplingによってコンピューティングコストを削減 ContextNet: Improving Convolutional Neural Networks for Automatic Speech Recognition with Global Context written by Wei Han, Zhengdong Zhang, Yu Zhang, Jiahui Yu, Chung-Cheng Chiu, James Qin, Anmol Gulati, Ruoming Pang, Yonghui Wu (Submitted on 7 May 2020 (v1), last revi

                                                          超軽量なCNN音声認識モデル!Google開発「ContextNet」を解説!
                                                        • ついにラベル無しで音声認識を実現した Facebook の wav2vec-U を解説【論文速報】

                                                            ついにラベル無しで音声認識を実現した Facebook の wav2vec-U を解説【論文速報】
                                                          • 音声通話やビデオ通話と併用し、音声認識で会話ログが取れるサービスを作ってみました - Skyway Walkers

                                                            現在、音声通話やビデオ通話が可能なサービスは多数存在するのですが、会話の内容を音声認識で字幕表示したり、テキストとして残せるサービスはそれほど多くないように思います。(現状だと英語のみ対応というケースが多い気がします) そのため、音声通話やビデオ通話と併用して利用する事で、日本語での会話内容をテキストで残せるサービスを作ってみました。 ※2020/06/08 追記:サービスの名前変更しました。 skybeje.net 使い方は簡単です。音声通話やビデオ通話をしている状態で 「Talk To CSV」にアクセス(簡易チャットルームが作られます) 上段の「招待URLをコピー」を押し、URLをクリップボードにコピーします。 (招待URLは起動のだびに毎回変わる事に注意してください) 音声通話やビデオ通話の参加者に、そのURLを伝えます。 参加者全員にGoogle Chromeで、そのURLを開い

                                                              音声通話やビデオ通話と併用し、音声認識で会話ログが取れるサービスを作ってみました - Skyway Walkers
                                                            • マイクロソフトが買収の「音声認識ソフト」、医療IT激変の破壊力

                                                              医療・医薬品業界のオピニオンリーダーとして、1988年創刊「RISFAX」、2000年創刊「医薬経済」を発行しています。毎月1日・15日に公開する「医薬経済ONLINE」 の中から、ダイヤモンド編集部が旬の話題をピックアップして「お届け」します。 医薬経済ONLINE発 独自の切り口で真相を探る。医療・医薬品業界の誰もが知る業界紙!業界のオピニオンリーダーとして、1988年創刊「RISFAX」、2000年創刊「医薬経済」を発行しています。毎月1日・15日に公開する「医薬経済ONLINE」の中から、ダイヤモンド編集部が旬の話題をピックアップして「お届け」します。 バックナンバー一覧 キュア・アップの禁煙治療用アプリ、アップルウォッチの心電図アプリなど、医師と患者をデジタルでつなぐ製品が日本でも相次いで登場している。新型コロナウイルス感染症のパンデミックによって、遠隔診療も事実上解禁されている

                                                                マイクロソフトが買収の「音声認識ソフト」、医療IT激変の破壊力
                                                              • FeFETによる機械学習、音声認識の精度は95.9%

                                                                東京大学は、強誘電体トランジスタ(FeFET)を用いた「リザバーコンピューティング」と呼ばれる機械学習方式を開発し、高い精度で音声認識を行うことに成功した。採用したFeEFTは現行の製造プロセスと親和性が高く、LSIの大規模化も比較的容易とみている。 3つの電流成分の時間応答を組み合わせる方式などを採用 東京大学は2022年6月、強誘電体トランジスタ(FeFET)を用いたリザバーコンピューティングと呼ばれる機械学習方式を開発し、高い精度で音声認識を行うことに成功したと発表した。採用したFeEFTは現行の製造プロセスと親和性が高く、大規模LSIにも比較的対応が容易とみている。 研究グループはこれまで、酸化ハフニウム系強誘電体材料を用いて製造するFeFETを活用したリザバーコンピューティング方式を提案し、その基本動作について確認してきた。ただ、実用化に向けた計算性能の確認や、システム上の課題な

                                                                  FeFETによる機械学習、音声認識の精度は95.9%
                                                                • 音声認識パワーブースター搭載バックブレーダーを実現する

                                                                  「パワーブースターON!!」子供の頃の夢は現実となった製作物:mylist/67556116「いいね」に作った感想音声認識システム:sm40179914独立可動サスペンション自動走行バックブレーダー:sm39830574Twitter:https://twitter.com/NiwakaraAgeBGM(再生順)Chime - Lifelong [NCS Release],Elektronomia & RUD - Rollercoaster [NCS Release],RudeLies, Distrion, Alex Skrindo & Axol - Together [NCS Release],Chime & MDK - Arcade Dwellers [NCS Release],Everen Maxwell - A Day at Sea [NCS Release

                                                                    音声認識パワーブースター搭載バックブレーダーを実現する
                                                                  • 巨大な警察官から逃れるゲーム『Militsioner』ゲームプレイ映像公開。音声認識で巨人と会話する奇妙な体験 - AUTOMATON

                                                                    インディースタジオTallBoysは2月12日、シュルレアリスム・アドベンチャー『Militsioner』のゲームプレイ映像を新たに公開した。対応プラットフォームはPC(Steam)。リリース時期は今のところ明かされていない。 『Militsioner』は一人称視点のアドベンチャーゲームだ。プレイヤーは“大いなる敵”の監視をかいくぐって奇妙な街からの脱出を目指すことになる。大いなる敵とは、すなわち文字どおり「巨人」。主人公が囚われた街には、なぜか身の丈数十メートルはあろうかという巨大な警察官が棲みついている。犯した覚えのない罪で牢獄送りが言い渡されたプレイヤーは、上空からの目線に見張られつつ、街を探索して脱出の糸口をつかまなくてはならないのだ。 道を拓くためには身を隠すだけでなく、あえて警察官の注意を引くことが必要な場面も。本作は音声認識機能を搭載しており、プレイヤーは声を発することで警官

                                                                      巨大な警察官から逃れるゲーム『Militsioner』ゲームプレイ映像公開。音声認識で巨人と会話する奇妙な体験 - AUTOMATON
                                                                    • オンライン会議と音声認識

                                                                      Secrets of Rock Star Developers (and How to Become One!) [CON7615] (Yuji KUBO...Yuji Kubota

                                                                        オンライン会議と音声認識
                                                                      • 「メルセデス」と呼んで、のワケ 音声認識もしない「ベンツ」呼称は変わるのか?(乗りものニュース) - Yahoo!ニュース

                                                                        日本でメルセデス・ベンツのクルマやブランドは、広く「ベンツ」と呼ばれていますが、今後、この慣習は大きく変わるかもしれません。 【写真】「メルセデス」はこの人 その大きな要因となりうるのが「音声認識」です。2018年10月に日本で発売された「Aクラス」では、クルマがドライバーの呼び掛けに応じて目的地の設定や空調の調整などを行うシステム「MBUX」が装備されました。これを起動させる場合、「ハイ、メルセデス」と呼び掛けると説明されています。 メルセデス・ベンツ日本によると、このシステムは「ハイ、ベンツ」といった呼び掛けでは起動しないそうです。 「『ベンツ』も創業者のひとりの名前ですので、クルマの呼称としては決して間違いではありません。ただ、『メルセデス』は女性の名前に由来し、語感としてもやわらかい印象があり、その名に親しんでいただくためにも、『メルセデス』と呼んでいただけるよう、わたしたちも心掛

                                                                          「メルセデス」と呼んで、のワケ 音声認識もしない「ベンツ」呼称は変わるのか?(乗りものニュース) - Yahoo!ニュース
                                                                        • 「音声認識」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音声認識』を5月20日(木)に発売

                                                                          「音声認識」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音声認識』を5月20日(木)に発売 インプレスグループでIT関連メディア事業を展開する株式会社インプレス(本社:東京都千代田区、代表取締役社長:小川 亨)は、音声認識の基礎から深層学習を用いた最新手法を解説した書籍『Pythonで学ぶ音声認識』を2021年5月20日(木)に発売いたします。 ■音声認識の基礎から深層学習を用いた最新手法までを解説 音声認識とは、音声信号から発話内容を認識することで、AIスピーカなどに利用されている技術です。本書は、現在までの音声認識技術の発展経緯を学びながら、深層学習を用いた最新の音声認識システムを実装できるようになることを目的とし、その手法をソースコード付きで丁寧に解説しています。 本書は「実際に動くものが作れる」ことを目指して、特定の技術のアルゴリズムと、それを実装するた

                                                                            「音声認識」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音声認識』を5月20日(木)に発売
                                                                          • ブレインパッド社員が投稿したQiita記事まとめ(2020年1月~5月、Python、Google Cloud Platform、音声認識ほか) - Platinum Data Blog by BrainPad

                                                                            2018年1月より、ブレインパッドが始めているQiita Organization。社員が投稿した「Qiita記事まとめ」として、2020年1月~5月の記事をご紹介していきます! こんにちは。広報の中村です。 ブレインパッドのデータサイエンティスト・エンジニアが投稿する技術トピックをQiita Organizationにまとめています。 qiita.com このブログを執筆している日時点で167記事が投稿されています! 今回は2020年1月~5月に投稿された記事をご紹介します! 日付 タイトル(リンク) カテゴリ 2020.01.02 Google提供のDataflowテンプレートとJavaScriptの話 JavaScript、Google Cloud Platform、gcp、dataflow、ApacheBeam 2020.01.01 Google Cloud Speech API

                                                                              ブレインパッド社員が投稿したQiita記事まとめ(2020年1月~5月、Python、Google Cloud Platform、音声認識ほか) - Platinum Data Blog by BrainPad
                                                                            • ユーザーの意図を汲める音声認識!同時に読みや品詞も推定する、ヤフーのEnd-to-End音声認識研究事例

                                                                              ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、ヤフー独自の音声認識エンジン「YJVOICE」の研究開発を担当している大町です。こちらのブログでも紹介しているように、ヤフーではEnd-to-End(E2E)音声認識の研究開発に取り組んでいます。 今回は、自然言語処理のトップカンファレンスNAACL2021(2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics)で発表した、新しいE2E音声認識の手法を紹介します。より詳しい内容を知りたい方は原論文もご参照ください。 既存のE2E音声認識は、ユーザーの発言意図を特定しにくい

                                                                                ユーザーの意図を汲める音声認識!同時に読みや品詞も推定する、ヤフーのEnd-to-End音声認識研究事例
                                                                              • 音声認識超比較、各社コグニティブサービス全部入り

                                                                                人が話す言葉を認識する音声認識技術は、第三のユーザインターフェースVUI(Voice User Interface)として、 私たちの身の回りで多く利用され、触れる機会も多くなりました。開発においても手軽に利用が行え、Watsonをはじめ Azure、Googleといった主要なAIサービスから音声認識機能が供されています。本発表では、各社から提供される 音声認識について、機能比較だけではなく、ノイズのある会話シーンや複数話者、子供の発話は?方言は?など、 様々な会話シーンにおける各社の認識精度や得意、不得意、精度向上のコツについてお話します。Read less

                                                                                  音声認識超比較、各社コグニティブサービス全部入り
                                                                                • 【9/30発売】新登場 Fire TV Stick - Alexa対応音声認識リモコン付属 | ストリーミングメディアプレーヤー - ジャニーズ販売情報

                                                                                  新登場 Fire TV Stick - Alexa対応音声認識リモコン付属 発売日:2020年9月30日 人気のFire TV Stickが前のモデルよりも50%パワフルになって新登場、HDRの鮮明な映像に対応しています。 【Amazon】新登場 Fire TV Stick - Alexa対応音声認識リモコン付属 【楽天市場】新登場 Fire TV Stick - Alexa対応音声認識リモコン付属 我が家には以前のFireTVStickがあります。 Fire TV Stick - Alexa対応音声認識リモコン付属 【Amazon】Fire TV Stick - Alexa対応音声認識リモコン付属 商品詳細 Fire TV StickをHDMI端子対応のテレビに挿してWi-Fiにつなぐだけで、簡単に映画やビデオをテレビの大画面で楽しむことができます。 映画、ドラマ、バラエティ、スポーツ、

                                                                                    【9/30発売】新登場 Fire TV Stick - Alexa対応音声認識リモコン付属 | ストリーミングメディアプレーヤー - ジャニーズ販売情報