タグ

SIMDとfadisに関するUSAGI-WRPのブックマーク (1)

  • 『gccの最適化オプションでVFP/NEONを使う』

    古くからi387のようなハードウェアがあったx86とは異なりARMには最近までハードウェアで浮動小数点数を計算する仕組みがなかった。 このためARM用のgccはデフォルトで浮動小数点数の演算をソフトウェアでエミュレーションするバイナリを吐く。 かつてXScaleを積んだシャープのZaurus(通称リナザウ)にスケーラブルフォントやOgg Vorbisといった浮動小数演算を伴う処理を多用するKDE3.4を入れてみたところ動いたが実用に耐えないほど遅かった、という話があったが原因のひとつがこの浮動小数点数のエミュレーションにあったのではないかと思う。 今日のハイエンドなARMプロセッサにはVFP(ARMv6)あるいはNEON(ARMv7、VFP上位互換)といった浮動小数点数SIMD命令セットが搭載されており、浮動小数点数をハードウェアで演算することができる。 BeagleBoardはじめとする

  • 1