faibouのブックマーク / 2023年6月3日

faibou id:faibou

2023年6月3日のブックマーク (3件)

日本語に特化した高精度な音声認識 ReazonSpeech を使って、会議音声を書き起こししてみた | DevelopersIO
こんちには。データアナリティクス事業本部機械学習チームの中村です。本記事では、株式会社レアゾン・ホールディングスが2023年1月18日に公開したReazonSpeechを使ってみたいと思います。 ReazonSpeechはプロダクト群の総称で、日本語に特化した超高精度なモデルと、その学習に使用されたコーパス、コーパス作成のためのツールなどが公開されています。詳細は下記リンクを参照ください。モデルの方は、ライセンスがApache-2.0となっており商用利用も可能な形となっています。コーパスはテレビなどの音声となりますので、CDLA-Sharing-1.0 (ただし利用目的は著作権法３０条の４に定める情報解析に限る)とされています。今回はこのモデルをColab上で動かして、以前投稿したWhisperなどと比較してみたいと思います。実行手順は下記の以前の記事も参考にされてください
faibou 2023/06/03
リンク
【MediaPipe + KalidoKit】ブラウザでリアルタイム顔認識して遊ぶ
こんにちは、@d_etteiu8383です。この記事は夏のブログリレー 2022年 28日目の記事です。概要本記事ではMediaPipeのFaceMeshとKalidoKitを利用して、ブラウザ上でリアルタイムに顔認識を行う方法について説明します。イントロ突然ですが本日9月6日が何の日だかご存じでしょうか？そうです、真中のんさんの誕生日ですね。彼女はアニメ『プリパラ』の登場人物の一人ですが、このアニメは3DCGを利用したライブシーンが特徴的ですよね。3Dと言えばというわけで本記事ではMediaPipeのFaceMeshとKalidoKitを利用した、ブラウザ上でのリアルタイム顔認識について説明します。 MediaPipe Face Mesh overview: https://google.github.io/mediapipe/solu
faibou 2023/06/03
リンク
Developers.IO 2018 で「API 設計」の話をしてきた #cmdevio2018 | DevelopersIO
緊張すると声がアムロ・レイになる都元です。ここからしばらく、キャッチコピーの迷走期が始まりますのでよろしくお付き合いください。さて、去る 10/5 (金) 秋葉原 UDX にて開催された Developers.IO 2018、その中で「クラスメソッドにおける Web API エンジニアリリングの基本的な考え方と標準定義」という仰々しいタイトルで1講座持たせていただきました。スライド話したかったことと、話したこと本セッションで話したかったことはだいぶ多岐にわたり、当然 40 分では話しきれないので、当初は次の 2 テーマに絞ってお話しようと考えてスライドを作っていました。アプリケーション動作ログガイドライン RESTful / リソース指向 API 設計しかし実際にスライドを作ってみると、それぞれで 40 分の規模となってしまい…。ログの話は断腸の思いで見送りとさせていた
faibou 2023/06/03
API

設計
リンク
- 2023年6月6日
- 2023年6月3日
- 2023年6月1日