低解像度の音声データを超解像化をする拡散ベースの生成モデル AudioSR が公表されていました。リンク先に変換サンプルなどもあり、音声や自然音、音楽など幅広いジャンルの例が示されています。高い再現度であるようなので、さっそく試してみました。 インストール!pip install git+https://github.com/haoheliu/versatile_audio_super_resolution実行!GPUメモリを16GBくらい消費します。Google Colab無料枠だとメモリが足らなくて動かない感じでした。 !audiosr -i /content/kurumi.wav変換例変換前(サンプリングレート8kHz)
![オーディオ超解像技術 AudioSR を試す|はまち](https://cdn-ak-scissors.b.st-hatena.com/image/square/cfdbd8b80230bff002d0496f39aa9a120eb2a022/height=288;version=1;width=512/https%3A%2F%2Fassets.st-note.com%2Fproduction%2Fuploads%2Fimages%2F116249092%2Frectangle_large_type_2_4f194e8e3f5adc631e23978c174c3864.png%3Ffit%3Dbounds%26quality%3D85%26width%3D1280)