エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【試行錯誤】OpenAI Whisperを活用した日本語歌詞のforced-alignment その1:下調べとワンパス - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【試行錯誤】OpenAI Whisperを活用した日本語歌詞のforced-alignment その1:下調べとワンパス - Qiita
概要 whisperとwav2vecを使った音素レベルのaudio-lyric-alignmentの方法を試行錯誤します。とりあえず... 概要 whisperとwav2vecを使った音素レベルのaudio-lyric-alignmentの方法を試行錯誤します。とりあえず下調べして、なんとなくの方針を決めて、精度はともかく、それっぽいalignmentの結果が出てくることを目指します。 シリーズ一覧は以下 【試行錯誤】OpenAI Whisperを活用した日本語歌詞のforced-alignment リンクまとめ 背景 forced-alignment forced-alignmentはある音声(発話)とその書き起こしテキストにおいて、テキストの各音素が、音声のどの位置(時刻)に対応するかを推定する技術です。 https://linguistics.berkeley.edu/plab/guestwiki/index.php?title=Forced_alignment この技術の応用先として、動画への自動字幕付与などがあります