この記事は自分用の備忘録です。解説用ではないです 追記2: 結果だけ先に発表すると、OpenCVが約16ms、C++ with asmが約3msまで高速化されました。最後のコメント欄まで読んでいただければと思います。 きっかけ カメラから画像を取得して、それを反転させて表示するプログラムを開発しています。 画像の反転をOpenCVを使っているのですが、画素数が大きいのでもう少しなんとか早くならないものかと、取り組んでみました。 残念ながら、私が使っているデバイスのCPUは、OpenCLをサポートしていない、ので、GPUにデータを乗っける方法が使えないのです。 使えたら、OpenCV3で、高速化してしまうんですけどね。 ということで、イバラの道としりながら、アセンブリ言語に進んでいきます。 NEON命令 NEON命令とは、arm系CPUにおいて、1命令で複数データをまとめて処理できる命令だそ
![c++とアセンブリ言語で画像を反転させてみる - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/c5ded5a44bc0512af5ebabe629da6636e3293bf2/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9YyUyQiUyQiVFMyU4MSVBOCVFMyU4MiVBMiVFMyU4MiVCQiVFMyU4MyVCMyVFMyU4MyU5NiVFMyU4MyVBQSVFOCVBOCU4MCVFOCVBQSU5RSVFMyU4MSVBNyVFNyU5NCVCQiVFNSU4MyU4RiVFMyU4MiU5MiVFNSU4RiU4RCVFOCVCQiVBMiVFMyU4MSU5NSVFMyU4MSU5QiVFMyU4MSVBNiVFMyU4MSVCRiVFMyU4MiU4QiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnM9OWE5YWUwMzgwYTMzYTZmODdkZTdjMmNmNTU0MDA4NDA%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDB3ZjlhNW03NSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9YzFhZjZhMDNmNzA3NWI2ZjcyODUzZDA5NWJmNzdlNTc%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3Df0c79c32ea4c214f2994b68604df882d)