[B! C][高速化] ni66lingのブックマーク

ni66ling id:ni66ling

Cと高速化に関するni66lingのブックマーク (1)

C# Parallel.For + Native C での画像処理で、C#の約50倍の高速化
並列化による高速化は、アムダールの法則に従い、問題に内在する並列度に依存する。このような並列度の高い画像処理などでは並列化による高速化に向いており、C# で素直に実装（デフォルトのコンパイラスイッチ）したときが4.8秒に比べて、C# Parallel.For + Native Cで約50倍の高速化ができた。実際のNative C のアセンブラ出力を確認してみると、次のようにSSE命令までは展開されていなかった。これは、フィルターの３重forループを展開し、さらに整数加減算＋シフト演算へ変換しているため、SSE命令を使うより、単純なアセンブラの実行のほうが十分高速であるからと思われる。実際、手書きで SSE Intrinsics で積和演算を書いて実行してみたが、コンパイラーの最適化よりも、若干遅い結果となってしまった。もう少し複雑な演算や、浮動小数点の積和が必要な処理であれば、SSEコー
ni66ling 2013/01/05
C#

C

Parallel

高速化
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx