外国語音声データ(silk形式)をWhisperで音声認識→機械翻訳しよう - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/wrwrhucjnd

1user がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

外国語音声データ(silk形式)をWhisperで音声認識→機械翻訳しよう - Qiita

外国語音声データ(silk形式)をWhisperで音声認識→機械翻訳しよう。経緯かつてSkypeが開発した「SILK」... 外国語音声データ(silk形式)をWhisperで音声認識→機械翻訳しよう。経緯かつてSkypeが開発した「SILK」形式は、音声通話などで使用されている音声圧縮形式のようです。今回は、中国で主に使われているSNSアプリ「WeChat」のボイスチャットで、このSILK形式が使われており、それを上手いこと日本語に直せないかと試しました。手順 silkファイルをwaveファイルに変換 waveファイルをwhisperで書き起こし＆英訳英文をEasyNMT + Fugu-MTで和訳 silkファイルをwaveファイルに変換最初にsilkファイルをwaveファイルに変換します。変換にはsilk-v3-decoderおよびFFmpegを使用します。 ※ 注意 silk-v3-decoderのwindowsバイナリにはマルウェアが含まれています。ソースから自分でコンパイルしてください。

ブックマークしたユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx