並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 23 件 / 23件

新着順 人気順

音声対話の検索結果1 - 23 件 / 23件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

音声対話に関するエントリは23件あります。 人工知能aiChatGPT などが関連タグです。 人気エントリには 『ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」』などがあります。
  • ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」

    チキン@ライター @HeroofChickens フリーランスのライター4年目。リストラがきっかけ。Kindle出版1位、Kindleプロデュースで1位・ベストセラー取得。商業出版のブックライティング中(2024年の5月ごろ出版かな?) webwhiter-skill.com/job/

      ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」
    • 新しいChatGPTの音声対話機能を使ってみたら相手に感情が無いことを忘れかけるくらいちゃんと喋るから怖い→「声優の仕事が無くなるのでは?」という意見も

      OpenAI社のChatGPTに搭載された「高度な音声モード」という機能で、有料プランに加入しているユーザーが利用できるのだそう

        新しいChatGPTの音声対話機能を使ってみたら相手に感情が無いことを忘れかけるくらいちゃんと喋るから怖い→「声優の仕事が無くなるのでは?」という意見も
      • ジミー大西をAI化 音声対話アプリ「携帯人間AIジミー」開発 ドコモの技術で

        対話型AIに実在の人物や架空のキャラクターを模した受け答えをさせるNTTドコモの「キャラクタ雑談技術」を活用し、タレントのジミー大西さんを再現したAIとの音声対話を楽しめるアプリ「携帯人間AIジミー」がリリースされる。吉本興業とNTTグループなどが共同出資したラフ&ピース マザーが、iOS/Android向けに3月20日に公開する。 キャラクタ雑談技術は、実在の人物やキャラクターの対話データ(質問・応答)を学習することで、まるでその人やキャラと会話しているような対話型AIを作成できる技術。「ドコモAIエージェント」と組み合わせると、音声認識・音声合成による対話が可能になる。 AIジミーは、同技術を初めて活用した商用サービス。ジミー大西さん本人が作成した対話データをもとに学習したAIを構築した他、本人の音声から作成したオリジナル音声合成モデルを使った。ジミーさんの声を分析し、ジミーさんらしい

          ジミー大西をAI化 音声対話アプリ「携帯人間AIジミー」開発 ドコモの技術で
        • OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能 | テクノエッジ TechnoEdge

          OpenAIは5月14日、ChatGPTのGPT-4oを使えるマルチモーダルなMacアプリを公開しました。chat.openai.comにアクセスしてダウンロードリンクが表示されれば利用できます(現在利用できるユーザーはPlusプランの購読者のみ)。ChatGPTアプリはこれでiPhone、Androidに続いてMac版が公開されたことになります。Windows版は年内に登場予定です。 機能としてはiPhoneアプリと同様で、現状ではGPT-4oの音声モデルや、カメラの映像を見ながら音声で対話したりといったことはできません。使われている音声モデルも、従来のものと同じで、遮られても会話をスムーズに続けたりといった機能は実装されていません。歌うこともできません。

            OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能 | テクノエッジ TechnoEdge
          • オープンソースAI(Whisper、BERT、VOICEVOX)を用いた音声対話ロボットの作成 - Qiita

            はじめに どうもこんにちは。ヤフー株式会社のkunishouです。気づけば2022年も残り3週間、皆様いかがお過ごしでしょうか? 今年の機械学習のトレンドと言えば、海外のAI企業から次々とオープンソースのAIが発表されたことが非常に印象的でした。画像生成分野ではStability AI社の「Stable Diffusion」、音声認識分野ではOpenAI社の「Whisper」などが発表されました。発表されたこれらのAIは非常に高機能であるにも関わらず、オープンソースのAIとして、自由に利用することができます。 今回、 クリスマスも近いということなのでこれらの高機能なAIを活用して何か面白い物を作ることはできないか と考え、物理的に言葉を投げかけると返事が返ってくるような音声対話ロボットを作ってみることにしました( クリスマスにしゃべる相手がいないからというわけでは決してありません )。 目

              オープンソースAI(Whisper、BERT、VOICEVOX)を用いた音声対話ロボットの作成 - Qiita
            • LLM音声対話システムの応答を高速化してみた | CyberAgent Developers Blog

              はじめまして、CyberAgent AI Lab Intaractive Agentチームの技術研究員の大平といいます。 この記事は CyberAgent Developers Advent Calendar 2023 1日目の記事です。 ChatGPTの登場以降、自然なチャット対話はAPI呼び出しだけで簡単に実装できるようになりました。 更に人間のようなインタラクションを実現しようとすれば、音声対話に発展させたいと思う方も多いかと思われます。 しかし実際にLLMを使って音声対話システムを構築してみると、そのレスポンスの遅さに不満を感じることになります。 この記事ではよくあるシンプルなLLMを用いた音声対話に対していくつかの工夫を施し、その応答速度をできるだけ早めてみようという試みになります。 よくある構成として、以下を用います。 音声認識 Google STT LLM ChatGPT 3

                LLM音声対話システムの応答を高速化してみた | CyberAgent Developers Blog
              • AI音声対話アバター「AOI」が正式リリース ChatGPT搭載で品質の高い対話を実現

                AI音声対話アバター「AOI」が正式リリース ChatGPT搭載で品質の高い対話を実現 AI音声対話アバター「AI Avatar AOI(エーアイ アバター アオイ)」が、正式リリースされました。新たにマルチデバイス対応とAIチャットボット「ChatGPT」との連携機能が搭載されています。 「AI Avatar AOI」は、AI音声認識エンジン「AmiVoice」を活用したAI音声対話アバターです。VRChat上のイベント「バーチャルマーケット2022 Winter」にも出展され、メタバース空間の来訪者応対を24時間365日無人で行いました。 (AI Avatar AOI 体験会記事より) 今回、開発当初から対応していたVR・メタバース空間での利用に加え、企業や自治体へ採用される中で多くの要望があった、デジタルサイネージ、PC、スマートフォンなどにも対応。より実用的に利用できるように進化し

                  AI音声対話アバター「AOI」が正式リリース ChatGPT搭載で品質の高い対話を実現
                • ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」 (2ページ目)

                  守屋恵一 ChatGPT本 4冊目出ました!@デジタル系ライター・編集者 / 仕事垢 @moriyakeiichi 昨日自分で試してみて、ビックリした。 これ、Custom Instructionsに発言パターンをてんこ盛りに入れて、音声を差し替えることができれば、好きな俳優やアニメキャラクターと無限にお喋りできる。 技術的には可能なので、Whisperの音声データを差し替えられれば、あるいは、 twitter.com/HeroofChickens… 2023-09-28 17:39:15

                    ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」 (2ページ目)
                  • Windows 11、Copilotでファイル検索・音声対話強化 「深い推論」も

                      Windows 11、Copilotでファイル検索・音声対話強化 「深い推論」も
                    • チャットGPTに新たな音声対話機能、人間並みの会話が可能に…日本語にも対応

                      【読売新聞】 【ニューヨーク=小林泰裕】米オープンAIは24日、対話型AI(人工知能)サービス「チャットGPT」に、新たな音声対話機能を導入すると発表した。応答速度を大幅に改善させ、人間を相手にしているかのように滑らかにAIと会話す

                        チャットGPTに新たな音声対話機能、人間並みの会話が可能に…日本語にも対応
                      • ボイスボットカオスマップ2023を公開!電話や窓口対応をAIが音声対話で自動化

                        企業のDXを推進する国内最大級のAIポータルメディア「AIsmiley」を運営するアイスマイリー(東京都渋谷区、 代表取締役:板羽晃司)は、各業界の DX 推進の支援の一環としてボイスボット関連サービスをまとめた「ボイスボットカオスマップ2023」を2023年1月31日に公開しました。掲載数は合計で60サービスです。 ※2023年12月11日更新 ボイスボットとは? ボイスボットは、AI・人工知能技術を用いた音声対話システムです。音声認識や音声合成、自然言語処理の技術を組み合わせて構成されています。 ボイスボットは、音声での対話に特化したシステムであり、人間と同様の自然な対話が可能です。コロナワクチンのコールセンターやレストランの予約受付、宅配の集荷受付などの顧客対応業務の自動化、音声認識による医療診断、音声合成によるバーチャルアシスタントなど様々な業界で利用されています。 ボイスボットは

                          ボイスボットカオスマップ2023を公開!電話や窓口対応をAIが音声対話で自動化
                        • アートネイチャー、PKSHAのAI音声対話エンジン導入で予約や請求受付を自動化

                          アートネイチャーはPKSHA Workplaceが提供する自動音声対話エンジン「BEDORE Voice Conversation」の導入を開始しました。 このAIニュースのポイント アートネイチャーがボイスボット「BEDORE Voice Conversation」の導入を開始 コンタクトセンター営業時間外の問合せや「あふれ呼」発生による機会損失防止に活用 有用性が確認できた場合、将来的にはRPAと連携した後続業務の効率化も検討予定 株式会社アートネイチャーは株式会社PKSHA Technologyのグループ会社である株式会社PKSHA Workplaceが提供する、自動音声対話エンジン「BEDORE Voice Conversation」の導入を開始しました。 アートネイチャーは「ふやしたいのは、笑顔です。」をモットーに、ウィッグをはじめとした髪にまつわる幅広い商品・サービスを提供する

                            アートネイチャー、PKSHAのAI音声対話エンジン導入で予約や請求受付を自動化
                          • Microsoft Copilot進化!音声対話とビジョン機能で日常をAIアシスト - イノベトピア

                            Last Updated on 2024-10-02 10:00 by admin マイクロソフトは2024年10月1日、AIアシスタント「Microsoft Copilot」、Windows 11、Bing検索エンジンの大規模アップデートを発表した。 主な更新内容は以下の通り: Copilotに音声対話機能「Copilot Voice」を追加。英語圏の国々で提供開始。 Copilot Proユーザー向けに「Copilot Vision」を導入。画像や画面の内容を理解し、意思決定を支援。 Windows 11に「Recall」機能を追加。以前閲覧したコンテンツを即座に取り出せる。 Windows 11の検索機能を改善。自然言語での検索が可能に。 Bingに「Bing Generative Search」を導入。複雑な質問に対して詳細な回答を生成。 これらの更新は、AIを活用してよりパーソナ

                              Microsoft Copilot進化!音声対話とビジョン機能で日常をAIアシスト - イノベトピア
                            • Realtime APIとLangChainによる音声対話検索エージェントを試す - Qiita

                              INFO: connection open input_audio_buffer.speech_started input_audio_buffer.speech_stopped input_audio_buffer.committed input_audio_buffer.speech_started user: こんにちは input_audio_buffer.speech_stopped input_audio_buffer.committed response.output_item.added model: わかりました。ちょっと調べますね。 お待ちください。 user: 今日の東京の天気について教えて頂ければと思います。 response.output_item.added tool call {'type': 'response.function_call_arguments

                                Realtime APIとLangChainによる音声対話検索エージェントを試す - Qiita
                              • ChatGPTを使ったAI音声対話システムを作ってみた - 佐藤百貨店

                                まえから音声対話に興味があったので、作りかけだったシステムにChatGPT APIをつなげてみました。 ChatGPTで遊ぶのは面白いけど、キーボードでカチャカチャ入力するのが面倒だったので我ながら大満足な出来ばえ。自画自賛。なお、中身はChatGPT、Googleストリーミング音声認識、VOICEVOXを使っていて完全に他力本願な構成です。 ソースコード https://github.com/sato-susumu/susumu_ai_dialogue_system

                                  ChatGPTを使ったAI音声対話システムを作ってみた - 佐藤百貨店
                                • 無料ユーザーでもChatGPTと音声対話できるようになったよ

                                  さっそく試してみました。 解任のアナウンスから1週間も経たないうちに再びCEOとして復帰することになったサム・アルトマン氏の話題で持ちきりのOpenAI。 同社が手掛けるChatGPTの音声対話機能はこれまで有料プランを契約しているユーザーのみ使える機能でしたが、OpenAIは無料ユーザーでも同機能が使えるようになったと伝えています。 ChatGPTの音声対話機能を使う方法(iOS版)Image: はらいさん「ChatGPT」アプリを開くと右下にヘッドフォンのロゴが表示されているのでタップします。 すると音声対話画面に切り替わるので、まずは挨拶をしたり簡単な質問から会話を始めてみるのもいいかもしれませんね。 赤色のバツボタンを押して会話を終了すると、画面にはChatGPTと会話した内容がテキストで表示されます。また、左にスワイプすることで過去の会話の内容を見ることもできます。 また、設定で

                                    無料ユーザーでもChatGPTと音声対話できるようになったよ
                                  • ChatGPT+3Dモデルの音声対話エージェントを15分で開発する方法⚡️ - Qiita

                                    先日、タイトルの件についてRTAをしました。 その結果、だいたい2時間くらいで以下のようなChatGPT+3Dモデル対話エージェントが完成しました。 RTAではユーザーの話しかけに対する反応速度が遅くなっていたり(長文の読み上げ音声の生成&ダウンロードに時間がかかっている)、そもそも2時間って結構大変だなーみたいなのがあるので、基本的に"Out-of-the-Box"で動くサンプルを公開しました。 この記事ではChatGPTとおしゃべりするまでの手順と、その次に進みたい(自らもっとカスタマイズしたい)方向けのTipsを説明したいと思います。 音声認識・音声合成・ChatGPTのAPIKeyの取得 まずはAPI Keyの類を準備します。音声認識・音声合成としてGoogle / Azure / Watsonのいずれかを準備してください。 Google Azure Watson サービスにより設

                                      ChatGPT+3Dモデルの音声対話エージェントを15分で開発する方法⚡️ - Qiita
                                    • 明治安田生命、AI音声対話エンジン「BEDORE Voice Conversation」で請求受付を自動化

                                      PKSHA Technologyは、PKSHA Communicationが、明治安田生命保険において、深層学習と自然言語処理を活用したAI音声対話エンジン「BEDORE Voice Conversation」を6月より運用を開始しました。PKSHA Communicationは多様なAI SaaSプロダクトにより、未来の顧客との関係性の実現を目指します。 このAIニュースのポイント 明治安田生命保険が、AI音声対話エンジン「BEDORE Voice Conversation」を6月より運用を開始 BEDORE Voice Conversationは、深層学習とNLPを組み合わせ、電話による音声対話に活用したソフトウェア システム導入により、名義変更などの問合せにAIが応答し、発話した音声を受け付けて解決 株式会社PKSHA Technologyは、グループ会社である株式会社PKSHA C

                                        明治安田生命、AI音声対話エンジン「BEDORE Voice Conversation」で請求受付を自動化
                                      • 「OK, Honda」音声対話AIエージェント搭載の電気自動車「Honda e」ホンダが10月末発売 世界初の5連画面、スマホと繋がる機能も - ロボスタ ロボスタ - ロボット情報WEBマガジン

                                        本田技研工業(Honda)は、新型電気自動車(EV)「Honda e(ホンダ イー)」を10月30日(金)に発売することを、同年8月27日に発表した。 Hondaが共同開発したAIアシスタントは感情さえ表現し、世界初の5ディスプレイ水平配置、スイッチを押すだけで縦列駐車する機能、スマートフォンと繋がるコネクテッド機能など、先進の各種テクノロジーを搭載している。 Honda eの特徴 都市型コミューター Honda eは、クラウドAIによる音声認識と情報提供をおこなう「Hondaパーソナルアシスタント」やHonda車専用車載通信モジュール「Honda CONNECT」なども搭載。車内に「ワイドスクリーン Honda CONNECTディスプレー」を配置しており、スマートフォンとの接続によって各種アプリを表示することも可能だ。 同社は、同EVがユーザーの移動と暮らしをシームレスに繋げる生活のパー

                                          「OK, Honda」音声対話AIエージェント搭載の電気自動車「Honda e」ホンダが10月末発売 世界初の5連画面、スマホと繋がる機能も - ロボスタ ロボスタ - ロボット情報WEBマガジン
                                        • 「あはは」も再現? 味気ないAIとのおしゃべりを豊かにする音声対話技術

                                          若手ディープテック研究者の育成を支援する産業技術総合研究所(産総研)の「覚醒プロジェクト」。この連載では、2023年度の覚醒プロジェクトに採択された研究者の研究内容を紹介する。 今回は、表現力豊かな音声合成技術の開発に取り組む、東京大学大学院の中田 亘さん、関 健太郎さんのチームを取り上げる。代表の中田さんに話を聞いた。 研究実施者:中田 亘、関 健太郎(東京大学大学院) 研究テーマ:音声対話システムにおける表現力豊かな音声合成のためのデータセット整備と大規模言語モデルの言語知識の活用 担当PM:谷中 瞳(東京大学大学院 情報理工学系研究科 准教授(卓越研究員)) 無機質な音声を表現力のある声にどう近づけるか スマホやスマート・スピーカーに話しかけると音声で応えてくれるSiriやAlexaといった音声アシスタントは、今や日常的に使われている。だが、その声はというと明らかに人工的で、どこか無

                                            「あはは」も再現? 味気ないAIとのおしゃべりを豊かにする音声対話技術
                                          • 「VRChat」向けAI音声対話アバター「AI Avatar AOI」アドバンスト・メディアが開発 メタバース空間上での対応を自動化 - ロボスタ ロボスタ - ロボット情報WEBマガジン

                                            株式会社アドバンスト・メディアは国内シェアNo.1の音声認識エンジンAmiVoiceを搭載したAI音声対話アバター「AI Avatar AOI」(エーアイ アバター アオイ)を開発したことを発表した。同社によるとソーシャルVRアプリ「VRChat」のメタバース空間上で利用できるAI音声対話アバターの取り組みは国内で初めてとなる。(2022年8月30日時点、同社調べ) 「VRChat」で利用できるAI音声対話アバター「AI Avatar AOI」 「AI Avatar AOI」はソーシャルVRアプリ「VRChat」で利用できるAI音声対話アバター。音声認識エンジンAmiVoiceを搭載し、ユーザの発話を高精度で認識、自然な話し言葉を用いたコミュニケーションを実現する。「AI Avatar AOI」がメタバース空間上のどの地点でどのような動作・自動応答を行うかは、導入企業自身が用途に合わせて簡

                                              「VRChat」向けAI音声対話アバター「AI Avatar AOI」アドバンスト・メディアが開発 メタバース空間上での対応を自動化 - ロボスタ ロボスタ - ロボット情報WEBマガジン
                                            • Amazon Transcribe, ChatGPT, Amazon Pollyで作る自動音声対話システム - Qiita

                                              Amazon Transcribe, ChatGPT, Amazon Pollyで作る自動音声対話システムJavaScriptAWSRustChatGPT記事投稿キャンペーン_ChatGPT 近年、AI技術の進化により、自動音声対話システムがますます注目を集めています。音声入力をリアルタイムでテキストに変換し、AIが適切な応答を生成し、それを音声出力するシステムは、さまざまなシーンで活躍しています。今回、私は AWS の機能と OpenAI API を利用して、このような自動音声対話システムのプロトタイプを構築しました。 このプロジェクトでは、 AI 部分に OpenAI の ChatGPT を使用しました。 ChatGPT は、 OpenAI API を通じてアクセスでき、自然な会話を実現するために特別に設計されたモデルです。また、 Amazon Transcribe を音声認識に、 A

                                                Amazon Transcribe, ChatGPT, Amazon Pollyで作る自動音声対話システム - Qiita
                                              • オープンソースAI【Whisper、GPT3、GoogleTextToSpeech】を用いた音声対話ロボットの作成 - Qiita

                                                import glob import librosa import IPython import MeCab import unidic import pandas as pd import alkana import re import os from IPython.display import Audio %cd /content/voicevox_core # ローカルPCマイクでの録音設定 from IPython.display import Javascript from google.colab import output from base64 import b64decode RECORD = """ const sleep = time => new Promise(resolve => setTimeout(resolve, time)) const b2text

                                                  オープンソースAI【Whisper、GPT3、GoogleTextToSpeech】を用いた音声対話ロボットの作成 - Qiita
                                                1

                                                新着記事