[B! Cloud Speech-to-Text] roogh5eeSha6のブックマーク

PythonでCloud Speech APIを叩いて音声をテキスト化 | AVILEN AI Trend

Google Cloud PlatformにはSpeech APIという音声認識を行うための機能があります。今回はこちらのAPIを使って、Pythonで音声の日本語をテキストに起こしてみようと思います。Speech APIの詳細。また、Pythonで録音するプログラムと合わせて使うことで、録音した音声をほぼリアルタイムにテキスト化するプログラムも作成いたしましたので、ぜひ参考にしてください。音声ファイルをテキストにするサンプルプログラム以下にサンプルプログラムを示します。 #coding:utf8 import base64 from google apiclient import discovery import httplib2 #APIキーを設定 key = "YourAPIKey" #音声認識に使うファイル名 speech_file = "sample.wav" #URL情報

roogh5eeSha6 2020/04/08

Cloud Speech-to-Text

リンク

Google Speech API の使い方日本語音声をテキストに変換してみよう

５秒で試せる Cloud Speech API Google Cloud Speech API のページのデモアプリで、言語を選択してブラウザに向かって話すだけで手っ取り早く試せます。利用登録も必要ありません。（Chrome 以外のブラウザだとうまく動かないことがあります） Google Cloud Platform の利用登録 Cloud Speech API を直接使うには、まず初めに Google Cloud Platform の利用登録が必要になります。（Cloud Speech API は Google Cloud Platform が提供するサービスのひとつです）登録用のGoogleアカウントを１つ用意しましょう。 Google Cloud Platform トップページの「無料トライアル」をクリックし、Googleアカウントでログインします。 Google Cloud Pla

roogh5eeSha6 2020/04/08

Cloud Speech-to-Text

リンク

Google Cloud Speech-to-Text APIをいろいろ調査してみる - OPTiM TECH BLOG

こんにちは、2020年新卒入社予定の山口です！修論と引越し準備とアルバイトで慌ただしい日々を過ごしています。今日は業務で触った、Google製API Google Cloud Speech-to-Text API について皆さんと共有できればと思います。 Google Cloud Speech-to-Text API とは APIを導入していく GCP側 PC側実際に試してみる認識モデルを変更してみるマルチチャンネルで試してみるファイル形式・サンプリング周波数を比較してみるナレーション音声（「本日は〜」の音声です。）走れメロス＿朗読おわりに Google Cloud Speech-to-Text API とは Google Cloud Speech-to-Text API は名前の通り、音声データから文字起こしをするAPIです。この音声データは私たちが日頃聞いているような音声

roogh5eeSha6 2020/04/08

Cloud Speech-to-Text

リンク

Google Cloud Speech APIのリアルタイム音声認識は使い物になる精度なのか？

はじめに今までコールセンターへの音声認識システムの導入とかに携わってきました。音声認識の方式には大きく２種類あります。バッチ型音声ファイルを渡すと認識した結果が返ってくるコールセンターの通話録音をテキスト化してビッグデータ分析とかで活用できる Youtube動画の自動字幕とかでも使われている。リアルタイム型（またはストリーミング型）喋っている音声がリアルタイムで認識されていく。コールセンターのスーパーバイザが複数のオペレータの音声をモニタリングしたりする場合に活用できる最近だとAbemaTVで記者会見の生中継とかでAIポンが使われているで、クラウド型の音声認識 APIに関しては以下が4強と言われています。 Google Cloud Speech API Microsoft Azure Bing Speech API IBM Watson Speech to Text Am

roogh5eeSha6 2020/04/08

リンク

Google Cloud Speech-to-Text APIでマイク入力からストリーミング音声認識をする - Qiita

はじめに 2018年に以下の記事を投稿しました。 Google Cloud Speech APIのリアルタイム音声認識は使い物になる精度なのか？おかげさまで結構なアクセス数や「いいね」をいただいたのですが、先日「同じ手順を踏んでもエラーが出て動作しない」とコメントいただきました。調べてみたところ、コードでインポートしているライブラリ（grpc-google-cloud-speech-v1beta1）が2019年4月ごろにサポート終了していることが原因なようです。ということで、マイク入力でストリーミング音声認識を行う方法を再度記事としてまとめました。動作環境以下の環境で試しています Windows 10 Python 3.6.8 (64bit) Google Cloud SDK GCPでプロジェクトを作成したり、gcloudの初期設定をしたり、Pythonのセットアップしたり、必要

roogh5eeSha6 2020/04/08

リンク

音声から日本語の文字起こしを行う | 1 Minute Tips

概要日本語の音声ファイルを文字起こししたい場合がある。真っ先に思い浮かんだのがAmazon transcribeだが、まだ日本語には対応していなかった。調べたところ、Google Speech APIが日本語に対応していたのでこちらを使って文字起こしをしてみた。サンプルの音声 iPhoneに付属しているボイスメモというアプリで録音した https://itunes.apple.com/jp/app/%E3%83%9C%E3%82%A4%E3%82%B9%E3%83%A1%E3%83%A2/id1069512134?mt=8 今回はあくまでもサンプルなので、今日の日付を読み上げた。加工ボイスメモで録音したファイルはm4aファイルになる。このフォーマットではGoogle Speech APIが対応していないのでwavファイルへ変換する。 Speech APIが対応しているファイルフ

roogh5eeSha6 2020/04/08

Cloud Speech-to-Text

リンク

ストリーミング入力の音声を文字に変換する | Cloud Speech-to-Text Documentation | Google Cloud

フィードバックを送信ストリーミング入力の音声を文字に変換するコレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。このセクションでは、マイクからの入力などのストリーミング音声をテキストに変換する方法について説明します。ストリーミング音声認識では、音声を Speech-to-Text にストリーミングし、音声を処理しながらリアルタイムでストリーム音声認識の結果を受信できます。ストリーミング音声認識リクエストについては、音声の制限もご覧ください。ストリーミング音声認識は、gRPC 経由でのみ利用できます。ローカルファイルでストリーミング音声認識を実行するローカル音声ファイルに対して、ストリーミング音声認識を実行する例を次に示します。API に送信されるすべてのストリーミングリクエストには 10 MB の上限があります。この上限は、最初の Streami

roogh5eeSha6 2020/04/08

リンク

はてなブックマーク

タグ

関連タグで絞り込む (1)

Cloud Speech-to-Textに関するroogh5eeSha6のブックマーク (7)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス