qiita.com[B!]新着記事・評価 - はてなブックマーク

『qiita.com』

AWS のビデオ分析と Elasticsearch の全文検索を使って映像検索システムを作りました。 - Qiita
3 users
qiita.com/toshiouchi

AWS のビデオ分析と Elasticsearch の全文検索を使って、映像検索システムを作りました。記録を残させていただきます。報告する内容検索サービス概略 Amazon Rekognition というビデオ分析サービスから得られる情報得られる情報が英語なので、翻訳サイト Excite で翻訳して使うことにしました。 Elasticsearch のデータスキーマ検索サービスのアルゴリズム映像頭出し再生の HTML と Javascript ほかに考えられる映像検索サービスシステムを構築したのが2年前くらいなので、Elasticsearch のバージョンが6くらいです。Java でプログラミングしてあり、今も動きますが、Java のバージョンも11です。なので、プログラムは掲載しません。エッセンスのみご報告させていただきます。検索サービス概略検索サービスを受け付けるページは
- テクノロジー
- 2023/06/28 10:11

OpenAI の Whisper を、自前の音声データで Fine Tuning するプログラム - Qiita
3 users
qiita.com/toshiouchi

プログラムの目的 OpenAI の Whisper には、30秒以上の音声ファイルを文字起こしする transcribe 関数があります。驚異的なのは、large モデルで 10 分以上の音声ファイルから字幕ファイルを作っても、メモリーで問題が起きないです。fine tuning したモデルに、この機能を使うために、OpenAI の Whisper を fine tuning するプログラムを作成しました。fine tuning させたところ、きちんと学習しているので、情報の共有をお願いします。ライブラリーの読み込みなど最初に、ライブラリーの読み込みと GPU の判別。わたくしの開発環境は、GPU がないので、一応、GPU が使えるようにプログラムは書いたつもりですが、動作確認はしていません。もし、ちゃんと動かなかったら、直して使ってください。CPU では動作確認しました。 impor
- テクノロジー
- 2023/03/15 16:48

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx