タグ

ブックマーク / blog.negativemind.com (3)

  • U-Net:ディープラーニングによるSemantic Segmentation手法

    ※このネットワーク図では具体例として入力画像と特徴マップのサイズも記載されているが、U-Netは全結合層を持たないため、入力画像サイズを固定する必要はない。 この論文では細胞と背景のセグメンテーションが目的なので出力は2チャンネル(2クラス分類)。 Encoder-Decoder構造 U-NetもFCNやSegNetと同様に全結合層を持たず、畳み込み層で構成されている。U-NetもSegNetのようにほぼ左右対称のEncoder–Decoder構造で、Encoderのpoolingを経てダウンサンプリングされた特徴マップをDecoderでアップサンプリングしていく。 U-NetとSegNetの大きな違いは、Encoderの各層で出力される特徴マップをDecoderの対応する各層の特徴マップに連結(concatenation)するアプローチを導入した点。このアプローチはスキップ接続と呼ばれて

    U-Net:ディープラーニングによるSemantic Segmentation手法
  • COLMAP:オープンソースのSfM・MVSツール

    Structure from MotionからMulti-View StereoまでできるCOLMAPというツールを見つけた。そこからさらにSurface ReconstructionまでやらないとPhotogrammetryとは言わないのかね。 COLMAPは、GUIとCLIを備えた汎用的なStructure from Motion(SfM)とMulti-View Stereo(MVS)のパイプラインです。COLMAPは、順序のある画像、順序不同の画像群から再構築を行うための幅広い機能を提供します。 このソフトウェアはGNU General Publicライセンスです。 COLMAPはBSDライセンスに基づいてライセンスされています。このプロジェクトを研究で利用する場合は以下論文を引用してください。

    COLMAP:オープンソースのSfM・MVSツール
  • OpenMVS:Multi-View Stereoによる3次元復元ライブラリ

    複数枚の2D画像から、カメラの3D姿勢情報と被写体の疎(sparse)な3D点群を推定するのがStructure from Motionという手法。そこで求めたカメラの姿勢、点群の情報を使ってさらに密(dense)な点群を求めるのがMulti-View Stereoという手法。 Structure from Motionのライブラリは結構色々あるみたいなんだけど、そこから密な点群を求めるMulti-View Stereoのライブラリはあんまり見かけないんだよね。(PMVSというツールは有名ですが) このOpenMVS(Multi-View Stereo)は、名前の通り、密な点群を復元するMulti-View Stereoのアルゴリズムを実装したライブラリ。OpemMVS自体はAGPLライセンスだけど、依存しているサードパーティのライブラリが細々と沢山あり、それぞれのライセンスに従うのでこち

    OpenMVS:Multi-View Stereoによる3次元復元ライブラリ
  • 1