サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
デスク環境を整える
github.com/m-bain
This repository provides fast automatic speech recognition (70x realtime with large-v2) with word-level timestamps and speaker diarization. ⚡️ Batched inference for 70x realtime transcription using whisper large-v2 🪶 faster-whisper backend, requires <8GB gpu memory for large-v2 with beam_size=5 🎯 Accurate word-level timestamps using wav2vec2 alignment 👯♂️ Multispeaker ASR using speaker diariza
このページを最初にブックマークしてみませんか?
『github.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く