urza358のブックマーク / 2019年3月20日

urza358 id:urza358

2019年3月20日のブックマーク (6件)

Google Cloud Speech APIのリアルタイム音声認識は使い物になる精度なのか？
はじめに今までコールセンターへの音声認識システムの導入とかに携わってきました。音声認識の方式には大きく２種類あります。バッチ型音声ファイルを渡すと認識した結果が返ってくるコールセンターの通話録音をテキスト化してビッグデータ分析とかで活用できる Youtube動画の自動字幕とかでも使われている。リアルタイム型（またはストリーミング型）喋っている音声がリアルタイムで認識されていく。コールセンターのスーパーバイザが複数のオペレータの音声をモニタリングしたりする場合に活用できる最近だとAbemaTVで記者会見の生中継とかでAIポンが使われているで、クラウド型の音声認識 APIに関しては以下が4強と言われています。 Google Cloud Speech API Microsoft Azure Bing Speech API IBM Watson Speech to Text Am
urza358 2019/03/20
google

api

python
リンク
音声認識API　料金比較 - Qiita
なにをするにもまずは料金から。個人でも、使えるかどうか調べてみた。（20171228現在の情報。料金例は実際の請求料金と異なる可能性あります。） 4大API情報巨人の肩に乗りたい。 google Cloud Platform Speech API 料金情報含むまずはgoogleが提供するSeech API。料金体系時間料金
urza358 2019/03/20
webサービス

まとめ

list

development

programming
リンク
Setting Up a Collaboration Session
urza358 2019/03/20
autodesk

vred
リンク
OpenGLプログラミングメモ
ここは、OpenGLについて学習し、その過程を記録するページです。プログラミングメモとしてご利用下さい。 glutCreateWindowの位置を直す編集をした際に「<」以降が消えるという@wikiの仕様に気づかず、正常に動作しないプログラムを長期に渡り掲載しておりました。現在、修復作業中です。直接、コードを記載すると今後、似たような仕様変更で同じ不具合に遭遇するかもしれないのでプログラムコードはテキストデータとしてダウンロードする形に今後変更するかもしれません。
urza358 2019/03/20
opengl
リンク
OpenGL が世界を描画する仕組み · けんごのお屋敷
OpenGL 基礎シリーズの第 1 回です。ビューイングパイプライン OpenGL が世界を描画するっていうタイトルだけでワクワクするなら、あなたはもう OpenGL の、いや、このブログの虜です。というのはおいといて、OpenGL で描画すると一言で言ってもその描画フローの中には大量の計算処理が含まれおり、そのフローをひと通り全て通り超えてこそ初めて画面に何か描画される。いわゆるパイプラインと呼ばれる処理の流れがあり、それはおおまかには以下のようになっている。細かくは他にもやってることはあるし厳密には実際と異なる部分もあるけど、これくらい抑えておけば基本はわかると思う。ちなみに赤い部分は自分でプログラミングする必要がある。青い部分は設定値さえこちらから与えてやれば後は OpenGL が内部でよろしくやってくれる。ふー、ただ単に 1 枚の画像を描画するだけでもこれだけのフローがあって
urza358 2019/03/20
opengl
リンク
Performance - OpenGL Wiki
urza358 2019/03/20
cad

opengl
リンク
- 2019年3月23日
- 2019年3月20日
- 2019年3月19日