タグ

関連タグで絞り込む (3)

タグの絞り込みを解除

SIMDとCPUに関するtekimenのブックマーク (2)

  • x86-64機械語入門 AVX/AVX-512編

    この記事はx86-64機械語入門の続きです。SSE/AVX/AVX-512の紹介と、それに伴うVEXプリフィックス、EVEXプリフィックスの紹介を行います。 SSE x86-64で単精度・倍精度の浮動小数点数を扱うには、SSE (Streaming SIMD Extensions) と呼ばれる機能(命令セットとレジスター)を使います。元々は命令セット拡張でしたが、x86-64ではSSE2が常に利用可能なので、標準で使える機能だと思って構いません。 SSEでは128ビット幅のレジスターを16(32ビットモードでは8)利用できます。データ型は無印SSEでは単精度浮動小数点数(32ビット幅)が、SSE2以降では倍精度浮動小数点数(64ビット幅)や整数が使えます。 SSEの128ビット幅のレジスターはXMMレジスターと呼ばれ、xmm0, xmm1, ..., xmm15のように番号をつけて呼ば

    x86-64機械語入門 AVX/AVX-512編
  • Armの命令セットとNEON拡張 - Qiita

    このアドベントカレンダーのスコープ、対象読者について この記事はひとりNEONアドベントカレンダー2020 1日目の記事です。 目次にも書きましたが、あくまで手島個人の知識の範囲内で書くので、すべて公開情報がもとになっています。 個人で趣味の範囲で書くので、筆者の勤務先とは無関係です 一人advent calendarなので、省エネモードがモットーになってます。悪しからず。 Arm v8.4、SVEと行ったArmの現在進行形の拡張に関しては実機が手元に無いこともあって、あまり深入りはしない予定 実際のコードはアセンブラではなく、GCCのintrinsicをもとに解説する C/C++のコードからNEON命令を使うコードを解説するので、それが読めるぐらいの読者を想定。 日のトピック いきなり「NEONとは」、と飛び込んでもわからない人が居ると思うので、第1日目は概要を説明しようと思います。

    Armの命令セットとNEON拡張 - Qiita
  • 1