並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 12 件 / 12件

新着順 人気順

API | API Speechの検索結果1 - 12 件 / 12件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

API | API Speechに関するエントリは12件あります。 JavaScript音声処理プログラミング などが関連タグです。 人気エントリには 『GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node』などがあります。
  • GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node

    Vosk is an offline open source speech recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish. More to come. Vosk models are small (50 Mb) but p

      GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node
    • GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実装してみる | DevelopersIO

      はじめに OpenAIのDevDayで発表されたText2SpeechのAPIを使ってみたいと思います。Text2Speechとは簡単にいうとテキストの読み上げ機能です。 日本語を読ませる場合、まだ少し英語訛りですが、なかなか人間っぽい発音を行います。 今回はこのText2SpeechのAPIを使って遊んでみたいと思います。 なにを作るのか? 先程記載したように、Text2Speechでは発話を行うことができます。 この特徴とGPTの会話ができる特性を組み合わせれば、会話っぽいことができるのではないかと思い実装してみました。 今回は試験的に実装を行うため、GPTには「動物博士」としてのロールを与えて動物の雑学を教えてもらいました。 完成形は以下のような動画になります。Text2Speechを利用しているため音声ONの状態での閲覧を推奨します。 発音が英語話者っぽくなっていることや漢字を稀に

        GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実装してみる | DevelopersIO
      • VOSK Offline Speech Recognition API

        РУС 中文 Vosk is a speech recognition toolkit. The best things in Vosk are: Supports 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish, Uzbek, Korean, Breton, Gujarati, Tajik, Telugu. More to com

        • Google Colab で OpenAI API の Text-to-Speech を試す|npaka

          「Google Colab」で「OpenAI API」の「Text-to-Speech」を試したので、まとめました。 前回 1. Text-to-Speech「Text-to-Speech」、テキストの読み上げを行うAPIです。6つの内蔵ボイスが付属しており、次の目的で使用できます。 ・書かれたブログ投稿のナレーション ・複数言語の音声を生成 ・ストリーミングを使用したリアルタイムオーディオ出力 2. セットアップColabでのセットアップ手順は、次のとおりです。 (1) パッケージのインストール。 # パッケージのインストール !pip install openai(2) 環境変数の準備。 以下のコードの <OpenAI_APIキー> にはOpenAIのサイトで取得できるAPIキーを指定します。(有料) import os os.environ["OPENAI_API_KEY"] = "

            Google Colab で OpenAI API の Text-to-Speech を試す|npaka
          • Exploring the Web Speech API

            Experimenting with voice on the web using the Web Speech Synthesis and Recognition API The Web Speech API is one of those web technologies that no one ever talks about or writes about. In this blog post, we are going to take a closer look at what the API is capable of, what its limitations and strengths are, and how web developers can utilize it to enhance the user’s browsing experience. “The Web

              Exploring the Web Speech API
            • Google Speech to Text APIを使ってブラウザでリアルタイム文字起こしする - Qiita

              TD;TL Google Speech to Text APIとWeb Speech APIを併用することで実現する 音声検出のみWeb Speech APIを使い、文字起こし自体はGoogle Speech to Text APIを使うことで、ブラウザ文字起こしにおいてリアルタイム感と精度の高さを両立する 発端 現在開発中のプロダクトの中で、Speech to Textの仕組みを導入するために様々な方法を調べていました。 オンライン会議中の会話を文字起こししたり、アジェンダや議事録を一括で管理できるサービス「Telelogger」というサービスなのですが、コアとなる機能が会議中の会話の文字起こしです。 サービスはWebアプリケーションとして提供するため、ブラウザでの文字起こしを想定しています。 対象ブラウザをGoogle Chromeに絞った上で、最初はWeb Speech APIを試し

                Google Speech to Text APIを使ってブラウザでリアルタイム文字起こしする - Qiita
              • Web Speech APIを利用しブラウザで音声を認識する方法

                製品 コミュニケーション メッセージング マルチチャネルのテキストメッセージとメディアメッセージの送受信を180か国以上で

                  Web Speech APIを利用しブラウザで音声を認識する方法
                • GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python WITHOUT needing Microsoft Edge or Windows or an API key

                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                    GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python WITHOUT needing Microsoft Edge or Windows or an API key
                  • 【JS】Web Speech APIの音声読み上げ機能の実装方法(日本語 / 英語読み上げ)|WEB CREATES

                    WEBページで、WEB Speech APIを使ってWEBページのテキストを読み上げる実装方法を共有しようと思います。JavaScriptで実装をしました。 今回は、個人開発で作成した英語学習サービスの英単語の発音を確認する際に、こちらのブラウザの音声合成機能を使用しました。 英語を読み上げる際におこった不具合の対処も併せて紹介させていただきます。 Web Speech APIの音声読み上げ機能使ってみる 【デモ】テキストを読み上げてみる どのように読み上げるのか確認できるデモサイトは下記になります。 デモを見る <input type="text" id="text" name="text" value="吾輩は猫である。" placeholder="読み上げたいテキストを入力してください" /> <button onclick="readAloud()">読み上げる</button>

                      【JS】Web Speech APIの音声読み上げ機能の実装方法(日本語 / 英語読み上げ)|WEB CREATES
                    • フロント初心者がWeb Speech API を使ったシステムのフロント部分作ってみた!! - Qiita

                      はじめに インターンでフロントエンドを勉強し始めて1ヶ月の初心者が、「Web Speech API」を使って音声でChatGPTと連携できるWebサイトを作ってみました。今回はフロント部分についてです。 システム概要 Webぺージでブラウザの音声認識機能を使ってChatGPTに話しかけ、音声合成機能を使って音声でChatGPTの返答を受け取ることができるシステムを作りました! システムのイメージはこんな感じ。PythonでChatGPTのAPIを叩く部分をバックエンドとしました。 今回はフロントエンドについてなので、画面構成・音声認識・音声合成について書いていきます。 音声認識・合成で使ったAPIについて 今回は音声の認識・合成に「Web Speech API」を使いました。 音声認識・合成については以下の記事を参考にさせてただきました。 音声認識 , 音声合成 1.画面構成 まずHTML

                        フロント初心者がWeb Speech API を使ったシステムのフロント部分作ってみた!! - Qiita
                      • Speech to Text - AmiVoiceの音声認識API・SDK(アミボイス)

                        開発者向け Speech to text AmiVoiceの高精度音声認識を あなたのサービスに AmiVoice Cloud Platformでは、機械学習の専門知識がなくとも高性能な speech to text(音声認識)をお好みのプログラム言語でアプリケーションに組み込むことが可能。音声のテキスト変換や音声入力のほか音声感情分析機能も簡単に実装いただけます。

                          Speech to Text - AmiVoiceの音声認識API・SDK(アミボイス)
                        • Researcher Breaks reCAPTCHA With Google’s Speech-to-Text API

                          Researcher uses an old unCAPTCHA trick against latest the audio version of reCAPTCHA, with a 97 percent success rate. An old attack method dating back to 2017 that uses voice-to-text to bypass CAPTCHA protections turns out to still work on Google’s latest reCAPTCHA v3. That’s according to researcher Nikolai Tschacher, who posted a video proof-of-concept (PoC) of the attack on Jan. 2. CAPTCHA, intr

                            Researcher Breaks reCAPTCHA With Google’s Speech-to-Text API
                          1

                          新着記事