
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
外国語音声データ(silk形式)をWhisperで音声認識→機械翻訳しよう - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
外国語音声データ(silk形式)をWhisperで音声認識→機械翻訳しよう - Qiita
外国語音声データ(silk形式)をWhisperで音声認識→機械翻訳しよう。 経緯 かつてSkypeが開発した「SILK」... 外国語音声データ(silk形式)をWhisperで音声認識→機械翻訳しよう。 経緯 かつてSkypeが開発した「SILK」形式は、音声通話などで使用されている音声圧縮形式のようです。 今回は、中国で主に使われているSNSアプリ「WeChat」のボイスチャットで、このSILK形式が使われており、それを上手いこと日本語に直せないかと試しました。 手順 silkファイルをwaveファイルに変換 waveファイルをwhisperで書き起こし&英訳 英文をEasyNMT + Fugu-MTで和訳 silkファイルをwaveファイルに変換 最初にsilkファイルをwaveファイルに変換します。 変換にはsilk-v3-decoderおよびFFmpegを使用します。 ※ 注意 silk-v3-decoderのwindowsバイナリにはマルウェアが含まれています。ソースから自分でコンパイルしてください。