IBIS 2023 企画セッション『最適輸送』 https://ibisml.org/ibis2023/os/#os3 で発表した内容です。 講演概要: 最適輸送が機械学習コミュニティーで人気を博している要因として、最適輸送には微分可能な変種が存在することが挙げられる。微分可能な最適輸送は様々な機…

低解像度の音声データを超解像化をする拡散ベースの生成モデル AudioSR が公表されていました。リンク先に変換サンプルなどもあり、音声や自然音、音楽など幅広いジャンルの例が示されています。高い再現度であるようなので、さっそく試してみました。 インストール!pip install git+https://github.com/haoheliu/versatile_audio_super_resolution実行!GPUメモリを16GBくらい消費します。Google Colab無料枠だとメモリが足らなくて動かない感じでした。 !audiosr -i /content/kurumi.wav変換例変換前(サンプリングレート8kHz)
数理最適化 Advent Calendar 2022の9日目です。 新緑の頃、新型コロナ流行の合間をぬって、ささやかな結婚披露宴を表参道の式場にて催しました。諸々の準備の中でも席次はこだわるとキリがなく、数理最適化を使って決めました。人間関係をできるだけ保つようなゲスト集合から座席集合への写像を考えます。 ゲスト間人間関係を考慮して良い感じの配席を考えたい tl;dr 披露宴をしました 知り合い関係が複雑かつ長机でゲストの席配置が難しい 組合せ爆発は本物。高々20人の配置に1週間以上悩んだ結果、数理最適化した方が早いと結論 「知り合い同士を近くに配席する」問題は非凸な二次計画になり汎用ソルバでうまく解けない ゲストを席に"輸送"すると考えて最適輸送の一種で解くとうまくいった 本質的に非凸な問題を非凸のまま、しかし性質の良い距離構造を活用するアプローチが奏功したのではないか 再現用Colab
CPUでも動かせる版があるというのは、AWSなどの上でアーキテクチャを検討する際も選択肢が増えそうで良いですね。 ノイズをマシマシにしてみる 最後にもう少しだけノイズデータを増やしてみましょう。 ノイズ2倍 ffmpegで以下のようにすれば、重みを付けてミックスが可能です。下記はノイズのボリュームが2倍になっています。 !ffmpeg \ -i "output.wav" \ -i "noise.wav" \ -filter_complex \ "[0:a]volume=1.0,channelsplit=channel_layout=mono[a1];\ [1:a]volume=2.0,channelsplit=channel_layout=mono[a2];\ [a1][a2]amerge=inputs=2" \ -ac 1 \ "mix-noise-weight2.wav" 可視化すると
皆さんネコがお好きですが、ネコのフンが好きな人はいませんよね。 そこで、NVIDIAのエンジニアであるロバート・ボンド (Robert Bond) は、ディープラーニングとNVIDIAのJetson TX1開発プラットフォームを利用し、ネコを認識すると家のスプリンクラー・システムのスイッチが入る仕組みで、敷地内のネコを優しく追い払っています。 システム・ソフトウェア・エンジニアとしてNVIDIAに8年以上勤め、65歳になるボンドは言います。「ガーデニング好きの妻が、庭をきれいに清潔にしておきたいんだ」 ボンドは、ネコに罠を仕掛けるというアイデアをすぐに却下しました。それでは隣人として友好的とはいえません。そこで、より技術的な解決策を利用しようと決めました。 ボンドは、ディープラーニングやJetsonの素人ではありません。昨年、台所の床を時折小走りするアリに、無害の5ミリワットのレーザ・ビー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く