Intel CPU で popcnt 命令を連発するとレジスタの割り当て方によって性能がめっさ変わる,という話. 本の虫: ループカウンタを64bitにしたり、 バッファのサイズを定数にしたらパフォーマンス激落ちなんだけど何で? と,その元ページ c++ - Replacing a 32-bit loop count variable with 64-bit introduces crazy performance deviations - Stack Overflow なんかぱっと見ても一瞬よくわかんなかったので適当にまとめ. ちなみにここに書いてるのは確信度はそれなりにあるけどそれが正解かはわからない点に注意. どこを見ればいいのか まず,質問者は 32bit とか 64bit とか constant とかを気にしているけど,その辺りは全然関係なかった. で,どこを見ればよかったかとい