「Unreal Engine (UE) Advent Calendar 2022 その3」23日目の記事です。 はじめに OpenAIの音声認識AI「Whisper」がすごいらしい。これをUnreal Engineでリアルタイムに動かせるようにしたら応用範囲が広がっておもしろいんじゃないかと思いました。 (「異議あり!」って実際に声に出させたいよね) (NLPアドベンチャーを音声入力で、みたいな夢も広がる) しかし、いざやってみたらいろいろな課題にぶつかりました。この記事は、それらをどう解決したかの記録です。 目次 目標設定:C++とONNX Runtimeで実装する Whisperの処理の全体感 課題と対応 課題1:マイク入力と前処理をC++で実装する 課題2:Whisperの機械学習モデルをONNXにエクスポートする 課題3:ONNXモデルをtransformer&FP16向けに最適化
![音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと](https://cdn-ak-scissors.b.st-hatena.com/image/square/80f23b7ad07dc437a25aafa7632902771f1dcf84/height=288;version=1;width=512/https%3A%2F%2Fres.cloudinary.com%2Fzenn%2Fimage%2Fupload%2Fs--mt4Gi0h8--%2Fc_fit%252Cg_north_west%252Cl_text%3Anotosansjp-medium.otf_55%3A%2525E9%25259F%2525B3%2525E5%2525A3%2525B0%2525E8%2525AA%25258D%2525E8%2525AD%252598AI%2525E3%252581%2525AEWhisper%2525E3%252582%252592Unreal%252520Engine%2525E3%252581%2525A7%2525E3%252583%2525AA%2525E3%252582%2525A2%2525E3%252583%2525AB%2525E3%252582%2525BF%2525E3%252582%2525A4%2525E3%252583%2525A0%2525E3%252581%2525AB%2525E5%25258B%252595%2525E3%252581%25258B%2525E3%252581%252599%2525E3%252581%25259F%2525E3%252582%252581%2525E3%252581%2525AB%2525E3%252582%252584%2525E3%252581%2525A3%2525E3%252581%25259F%2525E3%252581%252593%2525E3%252581%2525A8%252Cw_1010%252Cx_90%252Cy_100%2Fg_south_west%252Cl_text%3Anotosansjp-medium.otf_37%3A%2525E6%2525A0%2525AA%2525E5%2525BC%25258F%2525E4%2525BC%25259A%2525E7%2525A4%2525BE%2525E7%2525A9%2525BA%2525E3%252581%25258D%2525E5%2525AE%2525B6%2525E7%2525B7%25258F%2525E5%252590%252588%2525E7%2525A0%252594%2525E7%2525A9%2525B6%2525E6%252589%252580%252Cx_203%252Cy_121%2Fg_south_west%252Ch_90%252Cl_fetch%3AaHR0cHM6Ly9zdG9yYWdlLmdvb2dsZWFwaXMuY29tL3plbm4tdXNlci11cGxvYWQvYXZhdGFyLzhhYzczZTBjODEuanBlZw%3D%3D%252Cr_max%252Cw_90%252Cx_87%252Cy_95%2Fv1627283836%2Fdefault%2Fog-base-w1200-v2.png)