タグ

BLASに関するserihiroのブックマーク (8)

  • AMD Ryzen 3900X vs Intel Xeon 2175W Python numpy - MKL vs OpenBLAS

    Introduction (and a bit of history!) In this post I've done more testing with Ryzen 3900X looking at the effect of BLAS libraries on a simple but computationally demanding problem with Python numpy. The results may surprise you! I start with a little bit of history of Intel vs AMD performance to give you what may be a new perspective on the issue. More reality check with the AMD Zen2 Ryzen 3900X!

    AMD Ryzen 3900X vs Intel Xeon 2175W Python numpy - MKL vs OpenBLAS
  • Batched BLAS

  • BLAS | Apple Developer Documentation

  • Introduction of LAPACK/BLAS: Support information

    更新情報 [2017-12-21 (Thu)] 秋田県立大学講義資料アップ [2017-09-20 (Web)] SparseSuite Matrix Collection(旧 The University of Florida Sparse Matrix Collection)リンク変更 [2016-12-25 (Sun)] バグ情報追加 [2016-12-08 (Thu)] カバー写真 with Amazon Link追加 [2016-12-05 (Mon)] サンプルプログラム公開@Github追加 [2016-02-22 (Mon)] サポートページ開設 目次とバグ情報 はじめに [P.v] (誤)細田陽一 → (正) 細田陽介 第1章 LAPACK/BLASって何? 1.1 コンピューターと線型計算 1.2 LAPACKとBLASの成り立ちと構成 1.3 LAPACK/BLAS

  • [VC++] OpenBLASを使ってみた - Qiita

    みなさん、BLASって知ってますか? はい、そうですね。大きな行列演算をするときに使うとめっちゃ速い、あのBLASですね。 けど、実際どれくらい速くなるの? よくわからないので、試しにOpenBLASで行列の掛け算をやってみました。 Visual StudioでOpenBLASを使う Visual StudioでOpenBLASを使うには、だいたい3つくらい方法があります。 1. 自分でビルドする ここにやり方が載ってます。 https://github.com/xianyi/OpenBLAS/wiki/How-to-use-OpenBLAS-in-Microsoft-Visual-Studio 正直、やりたくないです。 2. SourceForgeにあるコンパイル済みバイナリを落とす ReadMeに書いてありますが、Windows用バイナリが公式に配布されています。 https://so

    [VC++] OpenBLASを使ってみた - Qiita
  • ATLASを使う - Risky Dune

    行列演算がボトルネックのコードを書いたので, Automatically Tuned Linear Algebra Software (ATLAS)を導入した. キャッシュサイズなどを考慮して行列演算を行なってくれるため, 自分で適当に書いた奴より速い. uBlasより速いか検討してないが, まあ多分速いだろう. ただ, インターフェイスとしてはおそらくuBlasの方が優れているのでそちらの使用をまず検討した方がいいかもしれない. インストール 環境はUbuntu12.04です. 手順を列挙すると aptからgfortranを入れる CPU frequency scalingを切る ATLASをコンパイル & インストール おそらくgfortranはATLASがFortran上に構築されてるから必要. CPU frequency scalingは計算量があまり必要ないときに動作周波数を抑え

    ATLASを使う - Risky Dune
  • BLAS/CBLASの簡単な使い方

    このサイトについて このサイトは、もともとサイトの作者(工学系修士)が2010年頃に研究中にBLASの使い方についてのわかりやすい日語ソースや複素数を扱うサンプルコードが殆どなかったことをきっかけとして、備忘録代わりに作成したものです。そのため、このサイトの信憑性はその程度のものとして、自己責任でご利用をいただきますようお願い致します。このサイトは、その程度のレベルでしか記載されておりませんので、仮に誤りがあったことで損失などを被った場合においても一切の責任を負いません。 なお、作者はその後、誤りを幾つか発見し、数年間放置するといったことも平気でやっておりますのでご注意ください。 この度、BLASの簡単な使い方公開12周年を記念して、2023年に順次リファインしております。その後、数値計算研究は趣味程度に実施しているものですので、このサイトの信憑性はその程度のものとして、自己責任でご利用

  • 行列の積演算で openBLAS cuBLAS を体感する - Qiita

    Basic Linear Algebra Subprograms (BLAS) の 行列の積 演算が、C の for 文で率直に書いたルーチンに比べ、どれ程のものか体感してみる。 背景 深層学習の実装を理解していくにあたり、行列の積演算を高速に行いたくなった。 BLASは 行列の積演算が速いとの話を目にするが、実際に使ってみたことはなかった。 → 今回 BLAS の性能を体感してみる。 BLAS について 下記Webサイトを参考にしています。 ・Basic Linear Algebra Subprograms(Wikipedia) ・BLASの簡単な使い方 ・CUDA Toolkit cuBLAS ・インテル(R) 数値演算ライブラリ(MKL) リファレンス・マニュアル(PDF)

    行列の積演算で openBLAS cuBLAS を体感する - Qiita
  • 1