タグ

DeepLearningと3dに関するslay-tのブックマーク (2)

  • VIBEで、人の動画から3Dモデルを推定する | cedro-blog

    1.はじめに 以前から人の動画から3Dモデルを推定する手法はありましたが、複雑な動きの場合は細部でゆがみやズレが生じていました。今回は、この問題点を改善したVIBEという技術をご紹介します。 *この論文は、2019.12に提出されました。 2.VIBEとは? VIBEとは、Video Inference for Body Pose and Shape Estimation の略で、ディープラーニング を使って、人の動画から3Dモデルを推定する技術です。 使用しているモデルは、SMPL (Skinned Multi-Person Linear model)と言う人間の自然なポーズにおける多種多様な体型を正確に表現するためのモデルです。 このモデルは、N=6890個の頂点を持っており、頂点の重み付き和からP=23個の関節位置を求めることが出来ます。 下記が、VIBEのアーキテクチャーです。入力

  • 3DGANをchainerで実装した - verbalize

    タイトルの通り、3DGANのchainer実装をgithubに上げた。当初はkerasで書いていたが良い結果が得られず、ソースコードの間違い探しをするモチベーションが下がってきたので、思い切ってchainerで書き直した。 github.com 実はmnistなどのサンプルレベルのものを超えてちゃんとディープラーニングでタスクに取り組むのは今回が初めてだった。Chainerによるgan実装自体は公式のexampleやchainer-gan-libが非常に参考になった。 モデル 3DGANはその名の通り3Dモデルを生成するためのGAN。[1610.07584] Learning a Probabilistic Latent Space of Object Shapes via 3D Generative-Adversarial Modelingで提案されているもの。前回の記事でも触れた。 構

    3DGANをchainerで実装した - verbalize
  • 1