最後に,の計算がどのくらい高速化できたのか,実験してみました.アルゴリズムとして,以下のものを比較しました. libcのexp関数 パデ近似を用いたもの(cephesの実装に近いです) 5次~13次でテーラー展開を0を中心として行ったもの 5次~13次の最良多項式近似をの範囲で行ったもの 5次~13次の最良多項式近似をの範囲で行ったもの 5次~11次の最良多項式近似をの範囲で行ったものをSSE2で実装したもの SSE2の実装で11次で打ち止めしているのは,11次と13次で演算精度の差が殆どないことが分かり,単に実装するのが面倒くさかったからだけです.0を中心としたテーラー展開や,最良多項式をの範囲で構成する手法は,の値を切り下げではなく,四捨五入(つまり0.5を足してから切り下げる)で求めます(Wapitiやsse_mathfun.hのexp計算ルーチンは四捨五入を使っています). 実験で