yfntのブックマーク - はてなブックマーク

Google DeepMind、マシンが周囲を認識するために、2D画像から3Dシーンを推定する教師なし視覚認識ニューラルネットワーク「GQN」を発表

Google DeepMind、マシンが周囲を認識するために、2D画像から3Dシーンを推定する教師なし視覚認識ニューラルネットワーク「GQN」を発表 2018-06-15 Google DeepMindは、マシンが周囲を認識するために、2D画像からシーンの3Dモデルを生成する視覚認識フレームワーク「Generative Query Network（GQN）」システムを発表しました。 GQNは、事実上何も知らないエージェントが、シーンの複数の静的2D画像を見て、それの合理的に正確な3Dモデルを再構築するシステムです。シーンの内容を人間がラベル付けすることなく、あらゆる角度からシーンを推定しレンダリングします。マシンが、その部屋なりを動きながら収集した2D画像を基に、関係性や規則性などを学び、見えない部分も含めオブジェクトの位置や色などを推定し再現します。以下のような単一の視点から正確な3

yfnt 2018/06/16

リンク

英国ノッティンガム大学等、1枚の2D顔写真から3D顔モデルを機械学習を用いて作成するアルゴリズムを論文にて公開。任意の顔画像ですぐ試せるオンラインデモあり

英国ノッティンガム大学等、1枚の2D顔写真から3D顔モデルを機械学習を用いて作成するアルゴリズムを論文にて公開。任意の顔画像ですぐ試せるオンラインデモあり 2017-09-15 英国のノッティンガム大学とキングストン大学の研究者たちは、単一の2D顔画像から3D顔モデルを推測し作成するアルゴリズムを論文にて発表しました。 Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric CNN Regression（PDF） AaronJackson/vrn（GitHub）単一の2D顔画像から3D顔モデルを推測するために、60,000枚以上の2D写真と3D顔モデルデータセットを畳み込みニューラルネットワーク（CNN）で訓練しました。ブラウザ上で今すぐ試せるオンラインデモも公開されており、任意の顔写真をア

yfnt 2017/09/20

リンク

Google、機械学習の可視化を強化する「TensorBoard API」を発表。独自の機械学習ビジュアライゼーション構築へ

Google、機械学習の可視化を強化する「TensorBoard API」を発表。独自の機械学習ビジュアライゼーション構築へ 2017-09-12 Googleは、機械学習の可視化を強化する「TensorBoard API」を発表しました。 tensorflow/tensorboard（Github） 2015年にオープンソース化した機械学習ライブラリ「TensorFlow」には、様々なデータを可視化できるツール「TensorBoard」が含まれています。しかし、新しいビジュアライゼーションを追加することは非常に難しいのが現状でした。そこで、開発者がTensorBoardにカスタムビジュアライゼーション・プラグインを追加できるようにする新たなAPIセット「TensorBoard API」をリリースしました。これにより、独自の機械学習ビジュアライゼーションが構築できるとしています。プラ

yfnt 2017/09/12

リンク

Apple、Siriのテキスト読み上げ音声合成技術（TTS）に関する詳細を公開。Deep learningを含むdeep MDNベースであり、iOS11にも搭載技術。前期OSとの比較音声あり

Apple、Siriのテキスト読み上げ音声合成技術（TTS）に関する詳細を公開。Deep learningを含むdeep MDNベースであり、iOS11にも搭載技術。前期OSとの比較音声あり 2017-08-24 Appleは、バーチャルパーソナルアシスタント「Siri」の背後にあるDeep learningベースの技術について、その中でもdeep MDNベースの「音声合成テキスト読み上げ（TTS：text-to-speech）」に関するシステムの詳細を公開しました。同社が構築するSiriのしゃべる音声は、更新とともにより自然に、より現実の人間に似た音声になってきており、今回発表されたTTSシステムも来年秋に最終版をリリースするiOS11に搭載するとした最新の音声合成技術になります。同社の合成技術は、単位選択合成（Unit selection synthesis）に基づいており、人の

yfnt 2017/08/24

リンク

Google、3DCGのための新たな圧縮ライブラリ「Draco」をGitHubで公開。ZIP形式よりも効率的。VR/ARにおいても帯域を大幅に削減し素早くレンダリング

Google、3DCGのための新たな圧縮ライブラリ「Draco」をGitHubで公開。ZIP形式よりも効率的。VR/ARにおいても帯域を大幅に削減し素早くレンダリング 2017-01-17 Googleは、Chrome Mediaチームが開発した3DCGのためのオープンソースデータ圧縮ライブラリ「Draco」を発表および公開しました。「Draco」は、Chrome Mediaチームが開発した圧縮ライブラリで、ZIP形式よりも効率良くデータ圧縮を実行できるオープンソースです。Meshファイルの圧縮において、100MB以上のファイルをZIPで30MBに対して、Dracoでは10MB以下になると今までの圧縮より効果があることを報告します。 Dracoは、メッシュと点群データを圧縮するために使用できるほか、圧縮ポイント、接続情報、テクスチャ座標、色情報、法線、およびジオメトリに関連する属性もサポ

yfnt 2017/01/18

リンク

VRでソースプログラムを視覚化し構造を解釈できる「Primitive」

VR内でソースプログラム（ソースコード）を可視化し構造を解釈できるプラットフォーム「primitive」が登場しました。 Primitiveは、自動的に任意のJaveコードをアニメーションの3Dモデルに変換することができます。MR技法による映像も公開されており、そこではJavaコードが視覚化されている様子を確認できます。このことで、複雑なコードを早く、深く理解することに繋がり、新人研修や開発チームが大規模なプロジェクトの詳細までビジュアルで解釈することなどに利用出来るとしています。公式ページはこちら。

yfnt 2016/09/18

リンク

Googleエンジニア、ピクサー独自開発のレンダリング用ソフト「RenderMan」をVR形式で描画する方法を公開

Google エンジニア、ピクサー独自開発のレンダリング用ソフト「RenderMan」をVR形式で描画する方法を公開 2015-08-20 SIGGRAPHのアフターパーティで、Googleのソフトウェアエンジニア Mach Kobayashi氏は、ピクサーが独自開発・実際に使用しているレンダリング用ソフトウェア「RenderMan」をVRフォーマットにグラフィックスを描画する方法を披露しました。 RenderManは、「カールじいさんの空飛ぶ家」「トイ・ストーリー」などで使われた、とりわけ3Dアニメーションと視覚効果のレンダリングにおいて能力を発揮するソフトウェアです。そして、そのピクサークオリティを360度全方位レンダリングしたのが今回披露された内容です。この技術は、レイトレーシングという仕組みを利用しており、他のレンダリング方法と比べ臨場感の高いレベルを可能にしています。ちなみに、製作

yfnt 2015/08/27

リンク

はてなブックマーク

タグ

ブックマーク / shiropen.com (7)

お知らせ

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス