Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Google Researchが開発した「Total Relighting」は、人物画像を切り抜いて別の背景に置き換えた際、被写体の照明変更を行う深層学習を用いた技術だ。静止画像だけでなく、映像内で動く人物も新しい背景に応じた照明で合成し、違和感のない動画コンテンツに仕上げる。
![合成背景に人が溶け込むよう照明を調節する技術 Googleが開発](https://cdn-ak-scissors.b.st-hatena.com/image/square/8adf1fad11c6262875f627819fb9c98900f034e8/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fnews%2Farticles%2F2110%2F18%2Fcover_news047.png)
0. 自己紹介皆さんこんにちは、株式会社ACESの代表の田村(@7142857)です。簡単に自己紹介させていただくと、私は東京大学の工学系研究科博士課程で松尾研究室に所属し、Deep Learningの金融への応用について研究しつつ、株式会社ACESという会社を経営しております。先週はIPOのタマゴにも出させていただきました。 【IPOのタマゴ~磨けイノベーション】テーマは「人の知見を数式化する」。ACES 田村 浩一郎社長をゲストに迎え、今後の事業展開や戦略を聞く。視聴は→https://t.co/8KbwDmPBWM pic.twitter.com/go4nZTnDy1 — 日経CNBC (@NIKKEI_CNBC) September 9, 2021 1. AI技術がコモディティ化しているという主張の理解 Deep Learningが登場してから、"AIブーム"が続いていました。 -
GoogleのAI研究チームであるGoogle AIが、低解像度画像にあえてノイズを追加して「純粋なノイズ」になるまで加工し、そこから高解像度画像を生成する「diffusion model(拡散モデル)」という手法を改善する新たなアプローチを発表しました。「画質の悪い低解像度画像から高解像度画像を生成する技術」には、古い写真の復元から医療用画像の改善まで幅広い用途が想定され、機械学習の活躍が期待されているタスクの1つです。 Google AI Blog: High Fidelity Image Generation Using Diffusion Models https://ai.googleblog.com/2021/07/high-fidelity-image-generation-using.html Enhance! Google researchers detail new m
はじめにリアルタイム声質変換アプリケーション、Realtime Yukarinを開発し、 OSS(オープンソースソフトウェア)として公開しました。 ここで言う声質変換とは、「誰でも好きな声になれる」技術のことを指します。 好きな声になれる声質変換は夢があって流行りそうなのですが、まだ全然普及していないと思います。 それは現時点で、声質変換を実際にリアルタイムで使えるフリーな仕組みが無いためだと考えました。 そこで、自由に使えるリアルタイム声質変換アプリケーションを作り、ソースコードと合わせて公開しました。 声質変換とは声を変える方法で有名なのは、声の高さや音色を変える手法、いわゆるボイスチェンジャーです。 既存のボイスチェンジャーは、元の声を起点として、変換パラメータを自分で調整する必要があります。 一方ここでの声質変換は、元の声と好きな声を用いて機械学習し、変換パラメータを自動で調整しま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く