タグ

深層学習とITmediaに関するmohnoのブックマーク (5)

  • ビデオ会議中のよそ見が可能に? 顔が常に前を向いているように見せる技術、NVIDIAが開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米NVIDIAの研究チームが開発した「One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing」は、ビデオ会議中に話している人の頭部を常に正面に向ける、深層学習を用いた技術だ。視線や頭部をあちらこちらに動かしても、常に正面を向いて相手とアイコンタクトを取って話しているかのように見せられる。

    ビデオ会議中のよそ見が可能に? 顔が常に前を向いているように見せる技術、NVIDIAが開発
    mohno
    mohno 2021/10/05
    「視線や頭部をあちらこちらに動かしても、常に正面を向いて相手とアイコンタクトを取って話しているかのように見せられる」←画面を向いててもカメラを向いてるようにできるのか。けっこう需要高そう。
  • 写真を「アニメの背景」に変換するAI 30秒で“水彩風”など4種類の背景を生成

    AIベンチャーのラディウス・ファイブ(東京都新宿区)は7月29日、AIを使って写真からアニメ用の美術背景を生成するサービス「Anime Art Painter」を始めた。写真をアップロードするだけでアニメ風の背景に変換できる。1枚の画像から4種類の背景を30秒程度で生成する。背景の生成は無料だが、画像のダウンロードは有料で料金は480円から。 大まかには、ディープラーニングを使い、写真のテクスチャ(質感)を簡略化。アニメやイラストに使われるような画風に変換する仕組みという。建物や夜景、山などの自然物、近距離で撮影した物体、屋内の背景など、物体に応じてテクスチャの変換や色合いを調整するという。生成される4種類の画像は、アニメでよく使われるような水彩風の絵を2種類と、べた塗りに近いアニメ風の絵が2種類。 同社は現在のアニメ業界について「制作が2年待ちといわれるほど行き詰まっている」と指摘する。

    写真を「アニメの背景」に変換するAI 30秒で“水彩風”など4種類の背景を生成
    mohno
    mohno 2021/07/30
    こういうのは他にもあるんだけど、そこまでこだわらない作品ならいいのかな。新海誠監督にはリテイクされそうな予感→https://twitter.com/shinkaimakoto/status/1293130397312643072
  • ピアノの演奏動画から楽譜を自動作成 ディープラーニングで 京大が技術開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 京都大学の研究チームが開発した「Non-Local Musical Statistics as Guides for Audio-to-Score Piano Transcription」は、Web上のピアノ演奏動画の音声データから楽譜を作成する、深層学習(ディープラーニング)を用いた自動変換システムだ。 システムは、3段階で構成される。1段階目は、入力された動画の音の信号に対してMIDIシーケンスを深層学習ネットワークで推定(Multipitch detection)する。ピッチ解析用とベロシティ推定用のネットワークを別々で学習し、その出力を組み合わせてMIDIシーケンスを合成する。2段

    ピアノの演奏動画から楽譜を自動作成 ディープラーニングで 京大が技術開発
    mohno
    mohno 2021/03/17
    「Web上のピアノ演奏動画の音声データから楽譜を作成する、深層学習(ディープラーニング)を用いた自動変換システム」←おお。「実用レベルの出力結果を実証」
  • 無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力

    市販の歌声合成ソフトとして、ヤマハのVOCALOIDとともに独自の歴史を刻んできた「CeVIO」が1月29日、登場から8年を前に大きく進化。深層学習の技術を取り入れ「CeVIO AI」として、開発元のテクノスピーチが発売した。まずはその歌声を聴いてほしい。 これは、ソフト上で楽譜を打ち込んで再生ボタンを押しただけで出力された音声だ。それだけでこのように人間らしい歌声が出力できる。「しゃくりあげ」や「ビブラート」といった歌唱表現も勝手に付く。メインボーカルとして起用するにはもう少し調整が必要だが、作曲中の仮歌に使うなら文句のないクオリティーになっている。人間らしい歌声を合成するまでの時間が短いため、作業を迅速に進められるのがメリットの一つだ。 CeVIO AIリリースまでの道のり CeVIOは2013年公開のWindows専用音声/歌声合成ソフト。名古屋工業大学が長年研究しているHMM(隠れ

    無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力
    mohno
    mohno 2021/01/30
    この世界のことはあまり知らないけど、けっこうすごいもんだと思った。「名古屋工業大学が長年研究しているHMM(隠れマルコフモデル)による音声合成技術」←へぇぇ。
  • 「Yahoo!知恵袋」の不快な投稿、見えないところへ わずか1日で6億件を処理 ヤフー社内で何が起きたのか (1/2) - ITmedia NEWS

    老舗Q&Aサービス「Yahoo!知恵袋」は、長い間あるものに悩まされてきた。規約違反ではないため削除できないが、見る人を不快にさせる内容の“グレーな投稿”である。これまで社内でパトロールを行うなど対応してきたが、同サービスの投稿は約6億件にものぼり、全てのグレーな投稿を見つけ出すことは難しかった。スーパーコンピュータ「kukai」(クウカイ)が導入されるまでは。 グレーな投稿には、中身がなく質問への回答になっていないものや、アダルトカテゴリーではないのに年齢制限が必要そうなものなどがある。ユーザー投稿型サービスだからこそ起こる問題だが「利用者から厳しい意見をいただくことも多い。どこかで線引きをする必要があった」とヤフーの丹羽達洋さんは話す。 そこで考えたのが、グレーな投稿を検出し、トップページなど人目につきやすい場所では非表示にするという対応だった。 グレーな投稿、どうやって見つける? し

    「Yahoo!知恵袋」の不快な投稿、見えないところへ わずか1日で6億件を処理 ヤフー社内で何が起きたのか (1/2) - ITmedia NEWS
    mohno
    mohno 2018/11/02
    「ヤフー初のスーパーコンピュータ…スパコンの省エネランキング「GREEN500」では世界2位を獲得」←ハードから開発したのか。すごいな。「もともと約9カ月かかると想定していた処理時間を、約200分の1に短縮できた」
  • 1