サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
robonchu.hatenablog.com
Pytorch tutorial DataSetの作成 DataLoader 自作transformsの使い方 PILの使い方 Model Definition Training total evaluation each class evaluation CNNを用いた簡単な2class分類をしてみる Pytorch tutorial Training a Classifier — PyTorch Tutorials 1.4.0 documentation Transfer Learning for Computer Vision Tutorial — PyTorch Tutorials 1.4.0 documentation Writing Custom Datasets, DataLoaders and Transforms — PyTorch Tutorials 1.4.0 doc
やりたいこと 計算処理が軽いDNNの構築。低スペックのPCでもガンガン認識を回したい。 論文 https://arxiv.org/abs/1704.04861 [1801.04381] MobileNetV2: Inverted Residuals and Linear Bottlenecks MobileNetsの理解 通常のCNNではチャンネル間の特徴・チャンネル内の特徴(画像内の特徴)をフィルターによってまとめて考えるのに対し、MobileNetsではそれらをdepthwiseとpointwiseの畳み込みに分離し、表現しパラメータを削減している。 また、処理速度と精度を調整するためのwidth multiplierとresolution multiplierというパラメータもうまく設計されている。 参考: MobileNets: CNNのサイズ・計算コストの削減手法_翻訳・要約 -
参考:クォータニオンの回転補間:掲示板:シムダンス「四次元能」|Beach - ビーチ やりたいこと クオータニオンを理解する 教科書 SBクリエイティブ:ゲームアプリの数学 ↓ 素晴らしくわかりやすい。 【Unity道場 博多スペシャル 2017】クォータニオン完全マスター - YouTube 【Unity道場スペシャル 2017博多】クォータニオン完全マスター クォータニオンで回転を表現する定義にθ/2が使用される理由 回転行列の問題 ジンバルロック(特異点がある) 行列計算での処理負荷が重い 回転の補間が難しい クオータニオンの利点 ジンバルロックがない 計算負荷が低い 2つの回転同士のスムーズな補間が表現できる x,y,z軸に限らない任意の回転軸での回転が簡単にできる 複素数について 虚数単位 i ** 2 = -1 複素数 a + b * i 複素平面 参考: 複素平面 - Wi
やりたいこと Depthセンサで取得したデータをOpen3Dで自由自在に操りたい 教科書 Open3D: A Modern Library for 3D Data Processing — Open3D 0.1 dev documentation Colored point cloud registration Point to Point ICPでは幾何的な平面は揃うが、平面の三角形の模様などはズレてしまう. しかし、Colored point cloud registrationでは色情報から、模様などからフィッティングできる. Colored Point Cloud Registration Revisited, ICCV 2017 の実装👇 Downsample with a voxel size. Estimate normal. Applying colored point
やりたいこと Depthセンサで取得したデータをOpen3Dで自由自在に操りたい Open3D – A Modern Library for 3D Data Processing Open3Dまじでイケてる! Intelさんありがとうございまぁぁす!! 教科書 Open3D: A Modern Library for 3D Data Processing — Open3D 0.9.0 documentation インストール 以下、cmakeでpythonのバージョンが揃う指定している scripts/install-deps-ubuntu.sh mkdir build cd build cmake -DPYTHON_EXECUTABLE:FILEPATH=/usr/bin/python ../src make -j fatal error: Python.h: No such file
やりたいこと 低スペックパソコンで Tiny YOLOを使ってざっくりとした人の位置と大きさを出力する 教科書 👇 わかりやすい記事ありがとうございます。 ChainerでYOLO - Qiita 今回扱うTinyYOLOの説明 上記でもあるように、 Pascal VOCという20クラス分類問題のデータセットに対して係数は最適化されています。 全画面を7x7のグリッドに区切り、グリッドごとのクラス確率と、そのグリッド内に中心をもつバウンディングボックスを1グリッドにつき最大2つずつ、そして、その2つのバウンディングボックス信頼度、というすべての情報を直接推論します。 バウンディングボックスの座標は中心位置のx,yをグリッドサイズで0から1.0に正規化した数値、サイズは幅と高さを画像サイズで0から1.0に正規化した数値の平方根になっています。平方根にする理由は、サイズが大きくなったときの誤
All CVPR論文まとめ Classification,Detection,Segmentation UberNet Classification 全体 AlexNet 論文 論文まとめ VGG16 論文 論文まとめ Fine-tuning ResNet 論文 論文まとめ SqueezeNet 論文 論文まとめ DenseNet 論文 Git Local Binary Convolutional Neural Networks Detection 全体 R-CNN 論文 論文まとめ Faster R-CNN 論文 論文まとめ yolo 論文 論文まとめ SSD 論文 論文まとめ Mask R-CNN 論文 論文まとめ Segmentation 全体 FCN 論文 論文まとめ Net Surgery Shift and Stitch trick Delated Convolution 論文
参考:List of RGBD datasets INDOOR NYU Dataset v1 ☆ NYU Dataset v2 ☆ SUN 3D ☆ SUN RGB-D ☆ ViDRILO: The Visual and Depth Robot Indoor Localization with Objects information dataset ☆ SceneNN: A Scene Meshes Dataset with aNNotations ☆ Stanford 2D-3D-Semantics Dataset ☆ ScanNet ☆ SceneNet RGB-D ☆ SUNCG ☆ ‘Object Detection and Classification from Large-Scale Cluttered Indoor Scans’ Cornell-RGBD-Dataset Ac
単眼カメラでの位置計測や自己位置推定に興味がありやす Monocular Visual Odometry Direct Sparse Odometry LSD-SLAM ORB-SLAM PTAM Visual SLAM Monocular Visual Odometryがおもしろそう http://yokoya.naist.jp/paper/datas/1407/SSII%E3%83%81%E3%83%A5%E3%83%BC%E3%83%88%E3%83%AA%E3%82%A2%E3%83%AB%E4%BD%90%E8%97%A4.pdf Good! OpenCVでカメラ画像から自己位置認識 (Visual Odometry) Good! LSD-SLAMを使える環境を作るまでのあれこれ[後輩用] · GitHub Good! 趣味なし奴のメモ帳: LSD-SLAMをROSで試す1-イン
このページを最初にブックマークしてみませんか?
『robonchu.hatenablog.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く