2020年8月5日のブックマーク (6件)

  • 動画内の物体を高速で追跡する技術「D3S」 トラッカーのベンチマークで高成績

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 スロベニアのリュブリャナ大学とチェコ工科大学による研究チームが開発した「D3S」は、動画内の物体を高速に追跡する高性能なセグメンテーショントラッカーだ。 このトラッカーは、指定した対象が動画上をどのように移動しているかを推定する物体検出だけでなく、同時に領域検出も行う。 出力結果は、指定した対象の位置を四角形の枠線で囲み、囲んだ中の物体自体を縁取り塗り潰す。これにより出力されたデータは、領域情報付きデータセットとして機械学習に利用する。

    動画内の物体を高速で追跡する技術「D3S」 トラッカーのベンチマークで高成績
    Seamless
    Seamless 2020/08/05
    寄稿:動画内の物体が高速に変形しても追跡し連続的にセグメンテーションする技術。SiamMaskよりも高性能。
  • 動画内の素早い動きから3D人体モデルを連続生成 深層学習を活用

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 ドイツの研究機関Max Planck Institute for Intelligent SystemsとMax Planck ETH Center for Learning Systemsによる研究チームが開発した「VIBE」は、深層学習を用いることで、動画内で動く人の3次元姿勢と形状を連続的に推定する技術だ。 動画から人体の3次元モデルを連続的に推定する手法はこれまでにも研究されてきたが、複雑な動きの場合には正確性が失われ、細部でアーティファクト(ゆがみやズレ等)が起きていた。この課題に対して、これまでの研究成果を上回る高品質な3次元モデルを出力可能にしたのが今回の手法だ。 アーティフ

    動画内の素早い動きから3D人体モデルを連続生成 深層学習を活用
    Seamless
    Seamless 2020/08/05
    寄稿:CNNを用い動画内の動く人物の3次元姿勢と形状を連続的に推定。ダンスやダッシュのように素早い動きでも細部の歪みやズレを抑え運動学的にもっともらしい動きの連続的なメッシュを生成する。
  • 口元に直接与えるVR新感覚 ヘッドセットに取り付けるロボットアーム

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 独Hochschule Bonn-Rhein-Sieg(H-BRS)と加サイモン・フレイザー大学による研究チームが開発した「FaceHaptics」(PDFへのリンク)は、VRプレイヤーの顔に、風、暖かさ、柔らかさなどのさまざまな触覚を与えるヘッドマウントディスプレイ統合型ロボットアームシステムだ。 このシステムでは、ロボットアームをヘッドマウントディスプレイ前方に取り付けて、顔の前からプレイヤーの口周辺に触覚フィードバックを提供する。ロボットアームは、4自由度をサポートしており、横の動きは中心からプラスマイナス67.5度(合計135度)の範囲で回転しカバーする。 ロボットアーム先端には、

    口元に直接与えるVR新感覚 ヘッドセットに取り付けるロボットアーム
    Seamless
    Seamless 2020/08/05
    寄稿:顔に風、水、暖かさ、柔らかさ等のさまざまな触覚を与える4自由度のロボットアーム。先端には熱線(約55度まで発熱)を備えたファンとスプレーノズルが整備。食品を取り付けて実際に食べさせることも。
  • Google、イヤフォンケーブルでジェスチャー操作する「E-textile Microinteractions」開発

    Google、イヤフォンケーブルでジェスチャー操作する「E-textile Microinteractions」開発:Innovative Tech

    Google、イヤフォンケーブルでジェスチャー操作する「E-textile Microinteractions」開発
    Seamless
    Seamless 2020/08/05
    寄稿:ケーブルにタッチ、ツイスト、ピンチ、握る、手のひらで軽く叩く、挟んだ状態で滑らせる入力が可能。平均認識精度93.8%。インラインリモコンより高速。最新のトラックパッドと同等性能。
  • 不要な音は消去して必要な音だけ聞ける“聴力自在化”技術 北大と神大が開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 北海道大学と神戸大学による研究チームが発表した「ウェアラブルコンピューティングにおける聴力自在化技術の提案」(PDFへのリンク)は、外界音を変換し、ユーザーが自在に自身の聴力を操作する技術だ。この技術を用いることで、外界音から聞きたい音だけを選択して聞くことができる。 人間の耳は、自らの意志では制御することが難しく、聞く音の取捨選択ができない。その上、超音波などの人間には聞こえない音も取得することができない。 研究チームは、マイクとスピーカーを搭載したイヤフォン型ウェアラブルデバイス(マイク付きワイヤレスイヤフォン)での利用を想定し、外界音から聞きたい音だけを聞ける技術でこの課題に挑戦する

    不要な音は消去して必要な音だけ聞ける“聴力自在化”技術 北大と神大が開発
    Seamless
    Seamless 2020/08/05
    寄稿:応用例→ 2つの音(A,B)を超音波領域(従来の聴力では聞こえない)に埋め込み1つのスピーカから同時出力「無音 or A or B」聞きたい音だけ選択し聞ける。公共の場で活用できる。マイク付イヤフォンの使用を想定。
  • “実在しないリアルな顔”を自在に編集できる「StyleRig」 StyleGANで生成した顔の向き、表情、照明を制御

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 独MPI Informatics、仏Technicolor、仏Valeo.ai、米スタンフォード大学による研究チームが開発した「StyleRig」は、機械学習が生成したリアルな、だが実在しない人物の顔(静止画)を自在に編集できるシステムだ。 顔の向きや表情、光の当たり方などを変更できる。 今回の手法は、GAN(Generative Adversarial Network)を用い、リアルな顔画像を生成するNVIDIAの「StyleGAN」をベースにしている。 StyleGANは、高解像度の人物画像や2つの顔を組み合わせた合成画像を生成するスタイル変換ネットワークで、実在しないがリアルな顔を出

    “実在しないリアルな顔”を自在に編集できる「StyleRig」 StyleGANで生成した顔の向き、表情、照明を制御
    Seamless
    Seamless 2020/08/05
    寄稿:NVIDIAのStyleGANで生成した高解像度の合成顔画像の品質を維持したまま頭の向き、表情、照明をリギングのように変更できる.自己教師あり学習、微分可能レンダラー使用。