【試行錯誤】OpenAI Whisperを活用した日本語歌詞のforced-alignment その１：下調べとワンパス - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/shimajiroxyz

3 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

【試行錯誤】OpenAI Whisperを活用した日本語歌詞のforced-alignment その１：下調べとワンパス - Qiita

概要 whisperとwav2vecを使った音素レベルのaudio-lyric-alignmentの方法を試行錯誤します。とりあえず... 概要 whisperとwav2vecを使った音素レベルのaudio-lyric-alignmentの方法を試行錯誤します。とりあえず下調べして、なんとなくの方針を決めて、精度はともかく、それっぽいalignmentの結果が出てくることを目指します。シリーズ一覧は以下【試行錯誤】OpenAI Whisperを活用した日本語歌詞のforced-alignment リンクまとめ背景 forced-alignment forced-alignmentはある音声（発話）とその書き起こしテキストにおいて、テキストの各音素が、音声のどの位置（時刻）に対応するかを推定する技術です。 https://linguistics.berkeley.edu/plab/guestwiki/index.php?title=Forced_alignment この技術の応用先として、動画への自動字幕付与などがあります

ブックマークしたユーザー

lunastera2024/04/16
NEXTAltair2023/01/16

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx