Winograd 畳み込みアルゴリズムをTVMで実装するその2 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/masahi

2users がブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

prototechno #compiler_study

2018/11/10 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Winograd 畳み込みアルゴリズムをTVMで実装するその2 - Qiita

前回の記事では、Winograd アルゴリズムの概要、TVM によるアルゴリズムの定義、ナイーブな GPU 実装、... 前回の記事では、Winograd アルゴリズムの概要、TVM によるアルゴリズムの定義、ナイーブな GPU 実装、までを説明しました。今回は、ナイーブなスケジュールから出発して、ステップバイステップでスケジュールを改善していきます。最終的には、 TVM 本家の Direct Convolution よりも 2 倍近く速くなります。また、TVM には AMD GPU 向けのバックエンドもあるので、AMD GPU 用のカーネルを生成することもできます。NVIDIA GPU 向けに高速化したスケジュールが、 AMD GPU でも高速に動作することを最後に示します。高速化 1. 入力変換、出力逆変換の改善まずは、入力タイルの変換 $V$ の計算スケジュールを改善します。$V$ は、サイズ (4, 4, 全タイル数, チャネル数) で、入力タイル $d$ に変換行列 $B^T$ を左右からかけた変換

ブックマークしたユーザー

prototechno2018/11/10
nabinno2018/08/26

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx