NVIDIAの「GK110(Kepler)」GPUを使う「Tesla K20/K20x」と「GeForce Titan」は、現状では最強の科学技術計算能力を誇っており、K20xは2012年11月のTop500で1位を獲得したオークリッジ国立研究所のTitanスパコンにも採用されている。 GPUは高い浮動小数点演算能力を持っているが、単に、浮動小数点演算器の数を増やして従来のCPUを相似形で拡大したものではなく、かなり異なった作り(アーキテクチャ)となっている。そのため、GPUの高い演算能力を引き出すためには、CPUのプログラムとは異なる注意が必要である。そこで、Kepler GPUを例にとり、そのアーキテクチャとCUDAプログラムの最適化のポイントを見ていきたいと思う。なお、この連載は、GTC 2013でのPaulius Micikevicius氏の発表を中心とし、Julien Demou
![Kepler GPUアーキテクチャとプログラム最適化(1) GK110チップと搭載されるStreaming Multiprocessorの基礎](https://cdn-ak-scissors.b.st-hatena.com/image/square/84c4a173e842fcb261a434db0667141ce9a2f52c/height=288;version=1;width=512/https%3A%2F%2Fnews.mynavi.jp%2Ftechplus%2Farticle%2Fkepler_gpu-1%2Findex_images%2Findex.jpg)