前回作った行列乗算IPのXSAファイルを使って、ultra96v2の実機上で動かしてみた。 udmabufとAXI DMA転送を行うことで、行列乗算IPをハード側のプログラムに直接組み込むことができる。 これを使えばDNN(Yolov3とか)などの高速化のテクニックにも使える。 udmabufとAXI DMA転送を使った高速化例 目次 1.Petalinux用projectの作成 2.DMA転送用のモジュール「udmabuf」を作る 3.system-user.dtsiの上書きして2回目のbuild 4.ultra96上でUIOの確認 5.UIO(/dev/uio)で行列乗算IPの動作確認 1.Petalinux用projectの作成XSAファイルを使用してPetaLinuxのprojectを作る。 $ petalinux-create -t project -n hls_ultra96