API|API Speechの人気記事 12件 - はてなブックマーク

1 - 12 件 / 12件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

API | API Speechの検索結果1 - 12 件 / 12件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

API | API Speechに関するエントリは12件あります。 JavaScript、音声処理、プログラミングなどが関連タグです。人気エントリには『GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node』などがあります。

GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node
- 18 users
- github.com/alphacep
- テクノロジー
- 2022/05/16
Vosk is an offline open source speech recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish. More to come. Vosk models are small (50 Mb) but p
GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実装してみる | DevelopersIO
- 18 users
- dev.classmethod.jp
- テクノロジー
- 2023/11/08
はじめに OpenAIのDevDayで発表されたText2SpeechのAPIを使ってみたいと思います。Text2Speechとは簡単にいうとテキストの読み上げ機能です。日本語を読ませる場合、まだ少し英語訛りですが、なかなか人間っぽい発音を行います。今回はこのText2SpeechのAPIを使って遊んでみたいと思います。なにを作るのか？先程記載したように、Text2Speechでは発話を行うことができます。この特徴とGPTの会話ができる特性を組み合わせれば、会話っぽいことができるのではないかと思い実装してみました。今回は試験的に実装を行うため、GPTには「動物博士」としてのロールを与えて動物の雑学を教えてもらいました。完成形は以下のような動画になります。Text2Speechを利用しているため音声ONの状態での閲覧を推奨します。発音が英語話者っぽくなっていることや漢字を稀に
- ChatGPT
- AI
- 音声処理
- api
- OpenAI
- あとで読む
VOSK Offline Speech Recognition API
- 16 users
- alphacephei.com
- テクノロジー
- 2021/07/31
РУС 中文 Vosk is a speech recognition toolkit. The best things in Vosk are: Supports 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish, Uzbek, Korean, Breton, Gujarati, Tajik, Telugu. More to com
- あとで読む
Google Colab で OpenAI API の Text-to-Speech を試す｜npaka
- 7 users
- note.com/npaka
- テクノロジー
- 2023/11/08
「Google Colab」で「OpenAI API」の「Text-to-Speech」を試したので、まとめました。前回 1. Text-to-Speech「Text-to-Speech」、テキストの読み上げを行うAPIです。6つの内蔵ボイスが付属しており、次の目的で使用できます。・書かれたブログ投稿のナレーション・複数言語の音声を生成・ストリーミングを使用したリアルタイムオーディオ出力 2. セットアップColabでのセットアップ手順は、次のとおりです。 (1) パッケージのインストール。 # パッケージのインストール !pip install openai(2) 環境変数の準備。以下のコードの <OpenAI_APIキー> にはOpenAIのサイトで取得できるAPIキーを指定します。(有料) import os os.environ["OPENAI_API_KEY"] = "
- API
- google

Exploring the Web Speech API
- 6 users
- www.voorhoede.nl
- テクノロジー
- 2020/07/05
Experimenting with voice on the web using the Web Speech Synthesis and Recognition API The Web Speech API is one of those web technologies that no one ever talks about or writes about. In this blog post, we are going to take a closer look at what the API is capable of, what its limitations and strengths are, and how web developers can utilize it to enhance the user’s browsing experience. “The Web
Google Speech to Text APIを使ってブラウザでリアルタイム文字起こしする - Qiita
- 4 users
- qiita.com/kawazu255
- テクノロジー
- 2020/07/19
TD;TL Google Speech to Text APIとWeb Speech APIを併用することで実現する音声検出のみWeb Speech APIを使い、文字起こし自体はGoogle Speech to Text APIを使うことで、ブラウザ文字起こしにおいてリアルタイム感と精度の高さを両立する発端現在開発中のプロダクトの中で、Speech to Textの仕組みを導入するために様々な方法を調べていました。オンライン会議中の会話を文字起こししたり、アジェンダや議事録を一括で管理できるサービス「Telelogger」というサービスなのですが、コアとなる機能が会議中の会話の文字起こしです。サービスはWebアプリケーションとして提供するため、ブラウザでの文字起こしを想定しています。対象ブラウザをGoogle Chromeに絞った上で、最初はWeb Speech APIを試し
- Article
Web Speech APIを利用しブラウザで音声を認識する方法
- 4 users
- www.twilio.com
- テクノロジー
- 2021/06/05
製品コミュニケーションメッセージングマルチチャネルのテキストメッセージとメディアメッセージの送受信を180か国以上で
- web
GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python WITHOUT needing Microsoft Edge or Windows or an API key
- 3 users
- github.com/rany2
- テクノロジー
- 2024/01/18
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
【JS】Web Speech APIの音声読み上げ機能の実装方法（日本語 / 英語読み上げ）｜WEB CREATES
- 3 users
- web-creates.com
- テクノロジー
- 2023/01/20
WEBページで、WEB Speech APIを使ってWEBページのテキストを読み上げる実装方法を共有しようと思います。JavaScriptで実装をしました。今回は、個人開発で作成した英語学習サービスの英単語の発音を確認する際に、こちらのブラウザの音声合成機能を使用しました。英語を読み上げる際におこった不具合の対処も併せて紹介させていただきます。 Web Speech APIの音声読み上げ機能使ってみる【デモ】テキストを読み上げてみるどのように読み上げるのか確認できるデモサイトは下記になります。デモを見る <input type="text" id="text" name="text" value="吾輩は猫である。" placeholder="読み上げたいテキストを入力してください" /> <button onclick="readAloud()">読み上げる</button>
フロント初心者がWeb Speech API を使ったシステムのフロント部分作ってみた！！ - Qiita
- 3 users
- qiita.com/yvngodowny
- テクノロジー
- 2023/07/04
はじめにインターンでフロントエンドを勉強し始めて1ヶ月の初心者が、「Web Speech API」を使って音声でChatGPTと連携できるWebサイトを作ってみました。今回はフロント部分についてです。システム概要 Webぺージでブラウザの音声認識機能を使ってChatGPTに話しかけ、音声合成機能を使って音声でChatGPTの返答を受け取ることができるシステムを作りました！システムのイメージはこんな感じ。PythonでChatGPTのAPIを叩く部分をバックエンドとしました。今回はフロントエンドについてなので、画面構成・音声認識・音声合成について書いていきます。音声認識・合成で使ったAPIについて今回は音声の認識・合成に「Web Speech API」を使いました。音声認識・合成については以下の記事を参考にさせてただきました。音声認識 , 音声合成 1.画面構成まずHTML
Speech to Text - AmiVoiceの音声認識API・SDK（アミボイス）
- 3 users
- acp.amivoice.com
- テクノロジー
- 2023/07/12
開発者向け Speech to text AmiVoiceの高精度音声認識をあなたのサービスに AmiVoice Cloud Platformでは、機械学習の専門知識がなくとも高性能な speech to text（音声認識）をお好みのプログラム言語でアプリケーションに組み込むことが可能。音声のテキスト変換や音声入力のほか音声感情分析機能も簡単に実装いただけます。
- ai
- webservice
- software
Researcher Breaks reCAPTCHA With Google’s Speech-to-Text API
- 3 users
- threatpost.com
- テクノロジー
- 2021/01/05
Researcher uses an old unCAPTCHA trick against latest the audio version of reCAPTCHA, with a 97 percent success rate. An old attack method dating back to 2017 that uses voice-to-text to bypass CAPTCHA protections turns out to still work on Google’s latest reCAPTCHA v3. That’s according to researcher Nikolai Tschacher, who posted a video proof-of-concept (PoC) of the attack on Jan. 2. CAPTCHA, intr