はじめに 「あれ?インテルコンパイラの吐くコードがまたgccより遅いんじゃね?」と書こうとしたら、いろいろあって最終的にインテルコンパイラが圧倒的に速いコードを吐いた話。 コンパイラのバージョンとか 使うコンパイラのバージョンは、g++が4.8.5、icpcが16.0.3。 実行環境はIntel(R) Xeon(R) CPU E5-2680 v3 @ 2.50GHz。 128ビット整数からboolへのキャスト (一個だけ) 訳あって128ビット整数をboolにキャストしたくなった。単純にキャストして正しい結果が得られるか確認するのと、どう実装されるか調べるため、こんなコードを書いた。 #include <stdio.h> #include <cstdint> void func32(__uint32_t m, bool &b){ b = m; } void func64(__uint64_
![インテルコンパイラのアセンブル時最適化 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/085e0cc5fdeba373e5dc6e778aeb33aa8b9a02ea/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUUzJTgyJUE0JUUzJTgzJUIzJUUzJTgzJTg2JUUzJTgzJUFCJUUzJTgyJUIzJUUzJTgzJUIzJUUzJTgzJTkxJUUzJTgyJUE0JUUzJTgzJUE5JUUzJTgxJUFFJUUzJTgyJUEyJUUzJTgyJUJCJUUzJTgzJUIzJUUzJTgzJTk2JUUzJTgzJUFCJUU2JTk5JTgyJUU2JTlDJTgwJUU5JTgxJUE5JUU1JThDJTk2JnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1jZmQ1YzRkZDFhY2ZhZmU1NzA2ZTIxZmFiMDZlZDZkMg%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwa2FpdHlvMjU2JnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz04ZjVhM2QxZWZkZjExODlmNTNmYzZkOTQzNzFmMjRhNw%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3Dedd62706fa24a2750628aa1f0534febe)