[NAFNet] 機械学習で画像のノイズ除去、ブラー除去、超解像 [Denoise, Deblur, Super Resolution] 2022年5月7日土曜日 Artificial Intelligence NAFNet 概要 近年、画像復元(Image Resolution)技術は様々な進歩がみられていますが、システムの複雑さも増加しています。 NAFNetは、SOTAを達成しつつ、計算効率の高い単純なベースラインで構成される画像復元技術です。 NAFNetは、Sigmoid, ReLU, GELU, Softmaxなどの非線形活性化関数を使用せず、乗算で置き換えるか、削除することでベースラインを単純化しています。 このため、非線形活性化関数フリーなネットワークであることから、Nonlinear Activation Free NetworkでNAFNetと呼ばれています。 NAFN
Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能 米Metaは6月16日(現地時間)、新たな音声生成AIモデル「Voicebox」を開発したと発表した。音声の編集、サンプリング、スタイルの設定などを行える。 音声とテキストを入力することで、以下のような音声を出力できる。 入力した声で入力したテキストを読み上げる音声クリップを作成する 録音した音声から犬の鳴き声やブザー音などのノイズを除去する 録音した音声の言い間違いを修正する 1つの言語のスピーチを同じ声のまま別の言語に変換する(英語の音声を仏語に、など) 1つのテキストを多様な声で読み上げる Metaは、Voiceboxで将来的にはメタバース内のバーチャルアシスタントやNPC(ノンプレイヤーキャラクター)が自然な声で話せるようになるとしている。また、自分の声のまま(本来は話せない)外
デジタルカメラが登場した昔から、いや昔ほどそうだったのだけど、高感度時のノイズって悩みの種だったのである。フィルム時代に比べると、1枚ごとに感度を変えられるってこと自体が画期的だったのだが、デジタルの高感度って「少ない信号を増幅することで感度を上げてる」だけで、信号を増幅すれば一緒にノイズも増幅されてノイズが目立つわけである。 今でこそ高感度時の画質がぐっと上がって平気でISO12800とか使うようになってきたけど、昔は「手ブレや被写体ブレを覚悟してISO感度を上げないで撮る」か、ノイズがのっかってくるのを承知の上で感度を上げて撮るか、ってせめぎ合いがあったものである。 感度を上げて撮りたい、でもノイズが乗りすぎると困る。 ってことは高感度ノイズをうまく消すことができればばんばんざいではないか。 そして今年の4月、アドビがAIを使ったノイズ除去機能を「Lightroom」と「Lightro
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く