
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【M1 Mac】Arm版Python3.9のnumpyにOpenBLASをリンクして行列積を300倍高速化する方法 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【M1 Mac】Arm版Python3.9のnumpyにOpenBLASをリンクして行列積を300倍高速化する方法 - Qiita
行列積ではpure numpyに比べて300倍も高速化できました。しかし,NativeなArm版OpenBLASがエミュレート... 行列積ではpure numpyに比べて300倍も高速化できました。しかし,NativeなArm版OpenBLASがエミュレートされているRosetta 2 + Intel MKLに行列積以外で負けているのは何故なんでしょうか(Rosetta 2では,AVX512は使えないので,MKLはフルパワーを発揮できないはずです)。 検証ログ Pure NumPy (aarch64) Dotted two 4096x4096 matrices in 298.54 s. Dotted two vectors of length 524288 in 1.09 ms. SVD of a 2048x1024 matrix in 13.27 s. Cholesky decomposition of a 2048x2048 matrix in 2.12 s. Eigendecomposition of a 204