3つの要点 ✔️ 画像をグラフ構造として表現するコンピュータビジョンモデル「Vision GNN(ViG)」の提案 ✔️ 画像のパッチをノードとみなし、近いパッチを繋いでグラフを構成し、不規則で複雑なオブジェクトを表現する ✔️ 画像認識と物体検出に関する実験により、提案するViGアーキテクチャの優位性を実証した Vision GNN: An Image is Worth Graph of Nodes written by Kai Han,Yunhe Wang,Jianyuan Guo,Yehui Tang,Enhua Wu (Submitted on 1 Jun 2022 (v1), last revised 4 Nov 2022 (this version, v3)) Comments: NeurIPS 2022 Subjects: Computer Vision and Patter
![グラフ構造を用いたコンピュータビジョンモデル「Vision GNN」](https://cdn-ak-scissors.b.st-hatena.com/image/square/f6e5eb2a1279922b07aa90e5225bb28091a6a411/height=288;version=1;width=512/https%3A%2F%2Faisholar.s3.ap-northeast-1.amazonaws.com%2Fmedia%2FJune2023%2Fvision_gnn.png)