[B! cnn][CNN] xiangzeのブックマーク

グラフ構造を用いたコンピュータビジョンモデル「Vision GNN」

3つの要点 ✔️ 画像をグラフ構造として表現するコンピュータビジョンモデル「Vision GNN(ViG)」の提案 ✔️ 画像のパッチをノードとみなし、近いパッチを繋いでグラフを構成し、不規則で複雑なオブジェクトを表現する ✔️ 画像認識と物体検出に関する実験により、提案するViGアーキテクチャの優位性を実証した Vision GNN: An Image is Worth Graph of Nodes written by Kai Han,Yunhe Wang,Jianyuan Guo,Yehui Tang,Enhua Wu (Submitted on 1 Jun 2022 (v1), last revised 4 Nov 2022 (this version, v3)) Comments: NeurIPS 2022 Subjects: Computer Vision and Patter

xiangze 2023/10/29

gnn
cnn

リンク

CNN-based End-to-end Autonomous Driving on FPGA Using TVM and VTA

xiangze 2023/06/15

リンク

Laser: Latent Set Representations for 3D Generative Modeling

xiangze 2023/02/19

リンク

Vitis AI で開発を開始

開発者サイトでは、AMD のアダプティブコンピューティングプラットフォームを使用する開発に役立つ、最新かつ包括的な Vitis™ AI 開発ガイダンス、チュートリアル、リファレンスデザイン、トレーニングコースなど、数多くの技術リソースを提供しています。 Vitis AI プラットフォームを使用する開発の詳細 >

xiangze 2023/01/30

リンク

Ryuz's Laboratory

xiangze 2021/06/13

リンク

画像系初心者による kaggle 細胞コンペ 2019 まとめ - guchiBLO はてな

本記事の概要 Recursion Cellular Image Classification (以降細胞コンペや本コンペと略します) という kaggle の画像コンペに参加したのでまとめます。筆者は一年ほど kaggle をやっていますがまともに画像コンペに参加したのは初なので、幾つかの気付きも書き残しておこうと思います。本記事の概要コンペ概要画像特性実験構造 control 画像リーク metric learning 上位チームの解法 1st place 2nd place 3rd place 4th place 5th place 7th place 9th place 16th place 細胞コンペに参加してみてやったこと躓き・気付き次コンペではやりたいことまとめコンペ概要細胞コンペではある実験に使用された細胞画像を 1,108 クラスに分類するというタスク

xiangze 2020/08/24

kaggle
cnn

リンク

第41回関東CV勉強会 CNN-SLAM

CNN-SLAM: Real-time dense monocular SLAM with learned depth predictionRead less

xiangze 2020/05/09

リンク

如何在Ultra96v2上整合DPU及安裝DNNDK

xiangze 2020/05/05

リンク

CNNの精度向上手法のモデルサイズによる効果の違いを調べてみた - 終末 A.I.

画像認識タスクはDeep Learningにより大幅に精度が向上してきた分野です。 1クラス500枚・100クラスの分類を行う必要がある、比較的難易度が高めのCIFAR-100ベンチマークでも、最新の手法であるGPipeやEfficientNetでは、テストセットにて90%を超えるAccuracyを達成しています。 paperswithcode.com しかし、これらの最高精度を叩き出すような手法はパラメーター数が600Mや、60Mと大量のパラメーターが必要になります。このように、パラメーター数が多いモデルは、精度を向上させやすい分、推論や学習にパラメーター数に応じた時間が必要な問題があります。一方で、多くのモデル構造では、パラメーター数が数Mにいくかいかないかの、より小さいモデルを構築することができます。このようなモデルは、深いモデルに比べ精度面では劣るものの、処理速度は圧倒的に高

xiangze 2019/09/16

CNN

リンク

gscnn

Current state-of-the-art methods for image segmentation form a dense image representation where the color, shape and texture information are all processed together inside a deep CNN. This however may not be ideal as they contain very different type of information relevant for recognition. We propose a new architecture that adds a shape stream to the classical CNN architecture. The two streams proc

xiangze 2019/08/31

リンク

CVPR2018のPointCloudのCNN論文とSPLATNet

Takuya MinagawaTechnical Solution Architect at Vision&IT Lab Co., Ltd.

xiangze 2018/11/23

リンク

MPRG : 機械知覚&ロボティクスグループ／中部大学

09 Nov 2018 解説&サーベイ物体認識のための畳み込みニューラルネットワークの研究動向 1章はじめに　2章 ILSVRCで振り返るCNNの進化　3章最新のCNN改良手法　4章各モデルの精度および処理速度の検証　5章まとめ Download: PDF (Japanese) 電子情報通信学会論文誌に採録されました． 2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降，画像認識においては畳み込みニューラルネットワーク(CNN)を用いることがデファクトスタンダードとなった. ILSVRCでは毎年のように新たなCNNのモデルが提案され，一貫して認識精度の向上に寄与してきた. CNNは画像分類だけではなく，セグメンテーションや物体検出など様々なタスクを解くためのベースネットワークとしても広く利用されてきている. 本稿では，AlexNet以降の代表的

xiangze 2018/11/15

リンク

CS231n Convolutional Neural Networks for Visual Recognition

These notes accompany the Stanford CS class CS231n: Convolutional Neural Networks for Visual Recognition. For questions/concerns/bug reports, please submit a pull request directly to our git repo.

xiangze 2018/11/11

リンク

Variational Bayesian dropout: pitfalls and fixes

xiangze 2018/07/12

リンク

Deep Watershed Transform for Instance Segmentation

Most contemporary approaches to instance segmentation use complex pipelines involving conditional random fields, recurrent neural networks, object proposals, or template matching schemes. In our paper, we present a simple yet powerful end-to-end convolutional neural network to tackle this task. Our approach combines intuitions from the classical watershed transf orm and modern deep learning to prod

xiangze 2018/05/13

リンク

GitHub - interactivetech/BayesianCNN-SGHMC: This is our code repository for our Final Project for ORIE 6741 Bayesian Machine Learning Class.

xiangze 2018/05/01

リンク

Ideinの技術や事業の紹介

Ideinの中村です。弊社は4/7でちょうど設立3年目を迎えたベンチャー企業です。この記事では主に弊社の取り組む課題や事業などについて紹介したいと思います。主にエンジニアや研究者の方々向けに弊社が何をやっているのか知ってもらう事を目的として書いています。社名・ロゴ社名のIdeinはイデインと読みます。アイデア(Idea)の語源になったと言われているギリシアの言葉で見る・知るという意味があります。画像認識技術をやっていく気持ちを表しています。ロゴは八咫烏です。課題IdeinはDeep Neural Network(DNN)による画像認識等の推論技術を、ハードウェア製品に搭載する技術に取り組んでいます。クラウドやサーバーではなく末端のデバイス上でDNNモデルによる推論を実行するニーズが近年高まっています。最近はEdge ComputingとかOn Device Inference等と呼ば

xiangze 2018/04/08

リンク

株式会社 Accel Brain – 活用なき「AI論」は、無学に等しい。

語られている事柄は全て、観察者によって語られている。Alles was gesagt wird, wird von einem Beobachter gesagt. Maturana, H. R. (2013). Erkennen: die Organisation und Verkörperung von Wirklichkeit: ausgewählte Arbeiten zur biologischen Epistemologie. Springer-Verlag., S.34.

xiangze 2018/04/04

リンク

MobileNetV2: The Next Generation of On-Device Computer Vision Networks

Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more

xiangze 2018/04/04

リンク

Dilated Convolution - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

Dilated Convolution を chainer で実装しました。 Dilated Convolution の説明 Dilated Convolution は、フィルターとの積を取る相手の間隔をあける畳み込みのことです。例えば、以下のような画像において、 12 を中心に 3 x 3 の普通の畳み込みフィルターを適用すると、 6, 7, 8, 11, 12, 13, 16, 17, 18 との積を取って和を取ると思います。 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 3 x 3 の dilate = 2 の Dilated Convolution フィルターを 12 を中心に適用すると、0, 2, 4, 10, 12, 14, 20, 22, 24 と 1 つおきに取ってきて、それらに 3 x

xiangze 2018/04/02

CNN

リンク

はてなブックマーク

タグ

関連タグで絞り込む (48)

cnnとCNNに関するxiangzeのブックマーク (80)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス