並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 22 件 / 22件

新着順 人気順

voicevox api pythonの検索結果1 - 22 件 / 22件

  • Anthropic の Code with Claude に関する発表まとめ

    tl;dr Anthropic の開発者向けイベント Code with Claude が開催されたよ Claude 4 Opus と Claude 4 Sonnet が発表されたよ 無課金を含むすべてのプランで Claude 4 Opus と Claude 4 Sonnet が使えるよ Anthropic API に Code Execution Tool、MCP Connector、Files API、Extended Prompt Caching の 4 つの機能が追加されたよ(ベータ版) Claude Code が正式リリースされたよ これはなに? 2025 年 5 月 22 日にサンフランシスコにて開催された Anthropic の開発者向けイベント、Code with Claude に関する発表まとめ。公開されたモデルや機能などをひと通り紹介、実際に動かすところまでを解説した記

      Anthropic の Code with Claude に関する発表まとめ
    • UnityとDifyで自分専用のAIエージェントを作成する - 弁護士ドットコム株式会社 Creators’ blog

      この記事は弁護士ドットコム Advent Calendar 2024の 20 日目の記事です。 こんにちは。弁護士ドットコム株式会社リーガルブレイン開発室の井出です。 今年も AI 絡みの話題が尽きない年となりましたが、皆さんは何が一番重要な話題だと思いましたでしょうか。それら数ある中で、私は AI エージェントの発展に注目しています。 そこで趣味と勉強を兼ねて Unity と Dify とその他いろいろで自分専用の AI エージェントを作成したのでその方法をお伝えします。 AI エージェントとは 今回やりたいこと アプリの概要 構成図 完成スクリーンショット 必要なもの 開発環境 OpenAI API Unity Hub Unity Editor のバージョン Docker Desktop Dify ChatdollKit バージョン VRoid Studio VOICEVOX Azur

        UnityとDifyで自分専用のAIエージェントを作成する - 弁護士ドットコム株式会社 Creators’ blog
      • 今年の書初めコーディングはAITuberを創る!

        はじめに あけましておめでとうございます。去年は何といってもAIの年でした。ChatGPTやStableDiffusionが2022年末に登場してから、想像を超えてAI周りが進化しましたね。今回は年の初めという事もあり、前から興味のあったAITuberを作ってみる事にしました。 「AITuberを作ってみたら生成AIプログラミングがよくわかった件」 って本も買ったし。LLM部分だけでは無く、OBSやYouTubeのコメント取得などAITuberに必要な内容が一式揃っていて非常に参考になりました。 また、私はプログラミングは多少できますが、イラストや音楽に関しては全くスキルの無い人間です。そのためそのあたりに関してはStable DiffusionやSunoAIの力を借りて作っているので、結果的にオール生成AIという感じですね。そのあたりも含めて記事にまとめたいと思います。 TL;DR 素の

          今年の書初めコーディングはAITuberを創る!
        • 美少女競馬AI予想VTuberのために、動画コンテンツを爆速で作るプログラムを書いてみた。アンド、勉強会内容の共有が少し良くなりそうなツールを作ってみた。 - Qiita

          美少女競馬AI予想VTuberのために、動画コンテンツを爆速で作るプログラムを書いてみた。アンド、勉強会内容の共有が少し良くなりそうなツールを作ってみた。Python勉強会moviepyVtuberVOICEVOX 結論から先に言うと 動画編集する時間を短くしたかったので、 テキストベースで動画が編集できるプログラムを作った。 1.動画の素材を用意して 2.こんな感じの動画編集スクリプトを書くと 3.こんな感じの動画を生成できる 4. その動画を生成するプログラムをオープンソースで公開した 実施した内容 まずは、上記のは動画をご確認ください。 動機 こんにちは、普段競馬AI開発VTuberの、サポートをしています、まさちゃこといいます。 競馬AI開発VTuberのユーミィちゃんは、主に中央競馬を自作のAIで予想して、その予想を呟いたり、予想内容に関する解説配信を行ったりしています。 VTu

            美少女競馬AI予想VTuberのために、動画コンテンツを爆速で作るプログラムを書いてみた。アンド、勉強会内容の共有が少し良くなりそうなツールを作ってみた。 - Qiita
          • Claude Codeで5分でずんだもん解説動画を作る!|Naoki |電電猫猫

            AIと対話するだけで「ずんだもん×めたん」の紹介動画を作成する方法 ― Remotion + VOICEVOX テンプレート解説 Claude Code x Remotion x VOICEVOXでずんだもん解説動画を5分で作れるようにした 「Claude Codeのv2.1.19のアプデ内容で解説動画作って」っていうだけでずんだもんの解説動画作れる。誰でもリポジトリコピーしたらすぐ使える。 スクショとかも使えるし、PDFの資料でプレゼン動画もすぐできる pic.twitter.com/hrn0PAfV6V — 電電猫猫/ Naoki (@nya3_neko2) January 24, 2026 はじめに:Mac環境における動画制作の課題Windowsユーザーであれば、「ゆっくりムービーメーカー(YMM)」という選択肢があります。ずんだもんやめたんといったキャラクターを使った解説動画を、比

              Claude Codeで5分でずんだもん解説動画を作る!|Naoki |電電猫猫
            • 簡単にMCPを実行できるMCP connectorを試す

              通常、MCPサーバーを利用するにはそのクライアントアプリ(Claude Desktop、Cursor、Mastraなど)が必要です。 先ほどAnthropicから発表された MCP connector を使用すれば、AnthropicのメッセージAPIから直接MCPサーバーに接続できます。 使い方 早速試してみましょう。 今回はサンプルコードとしてPythonを利用します。 まずは必要なパッケージをインストールします。 import os import anthropic import sys def main(): # 環境変数からキーを取得 api_key = os.getenv("ANTHROPIC_API_KEY") if not api_key: raise ValueError("ANTHROPIC_API_KEY環境変数を設定してください。") # Client を初期化 c

                簡単にMCPを実行できるMCP connectorを試す
              • MotionPNGTuberでAIキャラクターを作る|うえぞう

                展開したら、ターミナルでこのディレクトリーの中(mpt.htmlなどがあるディレクトリー)に移動しましょう。 AIAvatarKitのインストール今回、バックエンドとしてはAIAvatarKitを使用します。その名の通り音声対話型のAIアバターを簡単に開発するためのフレームワークで、VRChatなどのメタバースプラットフォームはもちろん電話やWebブラウザーをフロントエンドとして接続することができます。 インストールはとても簡単で、以下のコマンド一発でお手元のPython環境に入ります。(なので、必要に応じて仮想環境などで実行してください) pip install aiavatar fastapi uvicorn websocketsMotionPNGTuberサンプルの実行server.py を任意のコードエディターで開いて、OPENAI_API_KEYにOpenAIのAPIキーを入力し

                  MotionPNGTuberでAIキャラクターを作る|うえぞう
                • 【個人開発】AIでVTuberを作るのに必要な知識は、機械学習の知識ではない【AITuber】 - Qiita

                  はじめに 先日、Virtual YouTuberを作りました。普通のVTuberとは異なり、コメントを広い、対話をしてくれるのはAIです。 AIVTuberというジャンルへの注目度は日に日に高まっていますが、一見機械学習の知識がたくさん必要で、実装が難しいように思う方も多くいるかと思います。 しかし実際は機械学習の知識は(合ったほうが勿論良いですが)そこまで必要ないです。 この記事ではAIVTuber作成のハードルを下げることを目標にしています。よって想定読者は「専門科目として機械学習を勉強していないがAIVTuberを作ってみたい人」を対象にしています。 方針の策定 「AIVTuber」に必要な要件をまず考えます。高度なことをやっているように思えますが、以下に分解するとイメージがつきやすくなります YouTubeコメントの取得 取得した質問にAIで回答 回答した文字列を合成音声に変換 音

                    【個人開発】AIでVTuberを作るのに必要な知識は、機械学習の知識ではない【AITuber】 - Qiita
                  • GPT-3とVoiceVoxを活用してAIエージェントを作る!【Unity】|ねぎぽよし

                    OpenAI GPT-3+VoiceVoxで、3D AIエージェントを作ってLooking Glassで良い感じに表示させてみた! ふとした時に何か会話するの楽しいし、自分の作業してるすぐ横で見守ってくれるし、AIにどんどんかわいさを感じていってあまりにも良い…👏😭 pic.twitter.com/I5UegeJUrl — ねぎぽよし (@CST_negi) February 27, 2023 やっていることのコアとなる要素を抜き出すと… ・自身の発話内容をテキストに変換する ・そのテキストをOpenAIのAPIに投げて、AI側の回答を取得する ・AIの回答テキストをVoiceVoxを用いて音声として出力する ・その音声を再生しつつ、それをベースにキャラクターに口パクをさせる となります。 環境はWindows11で、プログラミング自体はUnity/C#で完結しておりPythonなどを

                      GPT-3とVoiceVoxを活用してAIエージェントを作る!【Unity】|ねぎぽよし
                    • LLM音声対話システムの応答を高速化してみた | CyberAgent Developers Blog

                      はじめまして、CyberAgent AI Lab Intaractive Agentチームの技術研究員の大平といいます。 この記事は CyberAgent Developers Advent Calendar 2023 1日目の記事です。 ChatGPTの登場以降、自然なチャット対話はAPI呼び出しだけで簡単に実装できるようになりました。 更に人間のようなインタラクションを実現しようとすれば、音声対話に発展させたいと思う方も多いかと思われます。 しかし実際にLLMを使って音声対話システムを構築してみると、そのレスポンスの遅さに不満を感じることになります。 この記事ではよくあるシンプルなLLMを用いた音声対話に対していくつかの工夫を施し、その応答速度をできるだけ早めてみようという試みになります。 よくある構成として、以下を用います。 音声認識 Google STT LLM ChatGPT 3

                        LLM音声対話システムの応答を高速化してみた | CyberAgent Developers Blog
                      • 3Dモデル姿のAIとお喋りできるソフト『VRM_AI』使い方|とりにく

                        上記のURLから最新のVRM_AI_v〇〇.zipをDL。適当なディレクトリに解凍します。 ⑤config.iniを設定解凍してでてきたフォルダの中にconfig.iniがありますのでそれを編集していきます。 [VRM] VRMpath = D:\Documents\3d\悪役令嬢\Akuyaku_Reijo.vrm [AI_Setting] InputMode = voice pythonPath = C:\Users\ユーザー名\AppData\Local\Programs\Python\Python310\python.exe scriptPath = D:/desktop/test_API.py AI_URL = http://127.0.0.1:5000/ [AI_Voice] VoiceApp = AssistantSeika VoicePeak_exe = C:\Progra

                          3Dモデル姿のAIとお喋りできるソフト『VRM_AI』使い方|とりにく
                        • AITuberを作ってYouTubeで配信した

                          筆者、なぜか1週間ほど声が出ない。病院に行ったら喋りすぎで声帯が腫れていると言われた。しゃべったり歌ったりするのが好きな筆者にとってとてもストレスが溜まる。YouTubeで配信もできない。そこで、AITuberを作って自分の代わりにYouTube配信で話させることにした。 ▲完成したAITuberの配信(1:50から) AITuberとは AITuberというのは、中身がAIで作られている、Vtuberのような見た目の話す配信キャラクターである。 筆者は「機田ゆん」というオリジナルキャラクターを持っている。そこで、機田ゆんをAITuber化することにした。 現状、機田ゆんはボイスアクターがいる状態で話すことしかできない。さらに、Live2DのモデルもAIで生成したイラストを簡単にLive2D化したものしかなく、きれいなものがない。 ▲数少ない機田ゆんが話している動画 今回機田ゆんのAITu

                            AITuberを作ってYouTubeで配信した
                          • Next.jsとPythonの開発環境を爆速で構築する

                            はじめに 今回はフロントエンドにNext.js、バックエンドにPythonを採用して、Webサイトの環境構築を行いたいと思います。元々、Whisper APIとVOICEVOXによる合成音声を使用した会話アプリを開発したかったのですがですが、環境構築の段階でかなりのボリュームになった為、一旦記事として共有します。 モノレポについて モノレポとはWebアプリの全てのコード(WebバックエンドやWebフロントエンド)を単一のリポジトリに保存するパターンを指します。 リポジトリを単一化することのメリットは、複数のチームで開発を行う際に、バックエンドとフロントエンドでコードを使い回すことができたり、コードの調査、変更の追跡が容易になる点です。 アプリケーションの概要 今回実装したコードは以下のリポジトリに格納しています。アプリの実装も入ってくるので少し見にくいかもしれませんが、ご容赦ください。 フ

                              Next.jsとPythonの開発環境を爆速で構築する
                            • 超簡単!VRChatにおしゃべりAIアバターを召喚する方法(前編) - Qiita

                              ChatGPTの登場でAIアシスタントやデジタルヒューマンといった分野が盛り上がりを見せています。これは主観ですが、私は肌でそう感じています。スマホアプリやAR、専用デバイスのみならず、バーチャルSNS上でもインテリジェントなNPCとして今後活用が見込めるのではないでしょうか。 この記事では特にVRChatにChatGPTベースの音声対話AIアバターを設置する方法についてご紹介したいと思います。なおここで作るAIアバターはclusterなど別のプラットフォームでも動作します。 出来上がりのイメージはこんなかんじです。 VRChatのAIアバター、ChatGPTのFunction Callingに対応してみたよ〜✌️天気予報教えてくれるようになった! pic.twitter.com/PHO53oHvmJ — うえぞう@うな技研代表 (@uezochan) June 23, 2023 ちなみに

                                超簡単!VRChatにおしゃべりAIアバターを召喚する方法(前編) - Qiita
                              • 無料で使用可能な音声合成ソフトをPythonでしゃべらせてみた - OVERS

                                目次 はじめに 自己紹介 音声合成ソフトとは Google Cloud Text to Speech 概要 使い方 VOICEVOX 概要 使い方 CoeFont 概要 比較結果 応用編 配信で使えるYouTubeライブコメント読み上げとして使ってみた まとめ 所感 さいごに はじめに 自己紹介 じげん 求人Div.でエンジニアをしている酒匂と申します。 求人Div.では3つの求人サービスを運用しております。 正社員、派遣、アルバイトなどの幅広い求人情報を扱っており、全国のアルバイト情報を扱っている「アルバイトEX」、正社員求人を専門に扱っている「転職EX」、求人看護師の求人を専門に扱っている「看護師求人EX」があり、これらサービスには複数の企業からいただいた求人情報を掲載させていただいているという特徴があります。 私の業務は主にアルバイトEXの開発・保守を担当しており、転職EX、看護師求

                                • VOICEVOXをPythonから利用し、wavファイルで保存する方法[AzureとGoogle Cloudの比較あり]

                                  PythonからVOICEVOXの音声を合成する方法を紹介します。VOICEVOXの合成音声を、Azure Text to SpeechやGoogle CloudのText-to-speechとも比較してみました。GoogleやAzureと場合によっては互角になりうる期待のソフトウェアです。 VOICEVOX、皆さん使ってますか? 2021年8月ごろに彗星のように登場した、無料なのにかなり優秀な音声合成ソフトウェアです。 今回Pythonから使いたかったのですが、コードベースで使う解説記事がどこにもなかったので書いてみました。 https://voicevox.hiroshiba.jp/ GUIでの使い方は解説されている記事が多いので、この記事ではPythonからコマンドラインベースで音声を出力する方法を書いていきます。インストールのやり方は省略します。 VOICEVOX ENGINE V

                                    VOICEVOXをPythonから利用し、wavファイルで保存する方法[AzureとGoogle Cloudの比較あり]
                                  • AIと音声会話する Python × Whisper API × ChatGPT API × VOICEVOX 〜バックエンド編〜

                                    はじめに 今回は、AIと音声で会話するアプリのバックエンド側の実装を行なったので、その時に学んだことを記事にして共有してます。構成フローとしては、マイクからの音声入力を、Whisper APIを使用して音声からテキストに変換、chatGTPから得られた返答をVOICEVOXを使用して、音声に変換してます。 アプリケーション概要 今回実装したソースコードは以下のリポジトリに格納してます。 前回の記事ではアプリの環境構築についてまとめています。frontend/ディレクトリでeslint、prettier、stylelintrcの設定を行い、backend/ディレクトリでPython用のlintツール(flake8 や black)の設定をしてます。huskyをルートディレクトリに配置して、フロントエンドとバックエンドの両方のlintが実行されるように設定します。GitHub Actionsと

                                      AIと音声会話する Python × Whisper API × ChatGPT API × VOICEVOX 〜バックエンド編〜
                                    • VOICEVOX COREをRaspberryPiにインストールしてCLIで便利に音声合成を行おう - uepon日々の備忘録

                                      前回のエントリではVOICEVOXをPCにインストールされたUbuntuへインストールしたという内容でしたが、今回はRaspberryPiにVOICEVOXをインストールするという内容です。ただ、RaspberryPiの運用ではモニタのないヘッドレス環境での使用の可能性もあるため、この設定ではVOICEVOXを構成する要素の1つであるVOICEVOX COREを導入し、CLIでの運用を行ってみたいと思います。 ネットで検索してもうまくいかないという話はあるのですが、成功例はなかなかないようです。自分も数日悩みましたがようやく解決できました。 【参考】 uepon.hatenadiary.com VOICEVOXの構成要素 VOICEVOXは3つのモジュール「エディター」、「エンジン」、「コア」で構成されています。VOICEVOXソフトウェアはこの3つから構成され、エディターはエンジンの機能

                                        VOICEVOX COREをRaspberryPiにインストールしてCLIで便利に音声合成を行おう - uepon日々の備忘録
                                      • GitHub - taishi-i/awesome-ChatGPT-repositories: A curated list of resources dedicated to open source GitHub repositories related to ChatGPT and OpenAI API

                                        awesome-chatgpt-api - Curated list of apps and tools that not only use the new ChatGPT API, but also allow users to configure their own API keys, enabling free and on-demand usage of their own quota. awesome-chatgpt-prompts - This repo includes ChatGPT prompt curation to use ChatGPT better. awesome-chatgpt - Curated list of awesome tools, demos, docs for ChatGPT and GPT-3 awesome-totally-open-chat

                                          GitHub - taishi-i/awesome-ChatGPT-repositories: A curated list of resources dedicated to open source GitHub repositories related to ChatGPT and OpenAI API
                                        • VOICEVOX ENGINE(API)のスループット検証 - Qiita

                                          こんにちは。最近、ChatGPT×VRM 3Dモデル×VOICEVOXで性格・見た目・声をカスタマイズできるAIアシスタントアプリを開発・運営しているうえぞうと申します。 今回、このアプリの3大要素の一つである声を担うVOICEVOXのAPIサーバーの運用が結構大変だったので、その知見を還元することで少しでもコミュニティーに貢献したいと思いこの記事を書きました。 諸々の工夫についてはまた別途記事化するとして、本記事では企画段階で知っておくべきスループットの特徴についてシェアしたいと思います。 検証内容 まずは手元のPC(MacBook Pro 2020 / Core i7 論理8コア / 32GB RAM)で多重度の検証、その後一般的なAWSのサーバーでその処理時間を計測してみます。みなさんがVOICEVOXを利用したサービスを展開される際、一つの目安にしていただけるかと思います。 環境準

                                            VOICEVOX ENGINE(API)のスループット検証 - Qiita
                                          • Raspberry Pi ZeroでMotionPNGTuberなAIコンパニオンを作る|うえぞう

                                            特長はこんなかんじ。 🦋超小型軽量: 65mm × 30mm × 30mm、バッテリー込み74.6グラム 🐆超低遅延: 1秒台の応答速度 🦞無限の拡張性: OpenClawとも連携 ネックストラップにつけたり肩に乗せたりしてもいいかもしれませんね! MotionPNGTuberとはMotionPNGTuber(動くPNGTuber)とは、ろてじんさんがが考案・開発したキャラクターのループ動画とリップシンク差分画像によるアバター表現手法です。豊かな表現ながらもLive 2Dや3Dモデルといったアバター準備のハードルを下げる画期的な手法ですね! この記事では、このMotionPNGTuberをRaspberry Pi Zero 2 Wという非力なエッジデバイスで動作させ、さらに音声対話できるAIコンパニオンにする方法をご紹介します。 準備するものメインのコンポーネントとしてRaspber

                                              Raspberry Pi ZeroでMotionPNGTuberなAIコンパニオンを作る|うえぞう
                                            • ChatGPT+Pythonでボイスロイドとリアルタイムで音声会話できるプログラムを作った

                                              ChatGPTを試していて、想像以上に受け答えがしっかりしている印象を持ちました。入力と出力を音声に置き換えてアレクサのように応答できれば、音声ベースでAIと対話できるのでは?と思い、プログラムを作ってみました。 作ったもの プログラムを起動し、音声で問いかけることで音声でメッセージが返ってきます。 音声出力の方法としてボイスロイドを用いました。このツイートの例ではVOICEVOXの「春日部つむぎ」にしゃべってもらっています。 作り方 やることはシンプルで↓のような流れになります。 音声の入力を受けつけ、なるべく正確にテキストに変換する ChatGPTにそのテキストを送信し、返答を受け取る 返ってきたメッセージをVOICEVOXのメッセージ合成APIに送信し、合成後のメッセージを.wav形式で保存する プログラム内でその.wavファイルを再生する 上記の流れをループさせることで、何回でも対

                                                ChatGPT+Pythonでボイスロイドとリアルタイムで音声会話できるプログラムを作った
                                              1