タグ

ブックマーク / qiita.com/t-tkd3a (1)

  • 高速な Convolution 処理を目指してみた。 Kn2Image方式 - Qiita

    仕組みを学んでいると、すでに世の中に高速なConvolution処理が出回っていても、自前でもConvolution 処理を実装してみたくなりますよね(なりました)。 面白そうな論文「arXiv:1704.04428」の手法を真似て実装しました。 結果は... うん、まぁ... cudnn スゲぇなぁ を体感する事となりました......。 私の実装では、期待してたほどの処理速度には至りませんでしたが、資料をここにてまとめます。 なにかの参考になればと思い公開いたします。 背景 深層学習の理解を深めようと、自前で実装を行ってます。 Convolution 処理についても、理解を深めるため、自前で実装します。 cudnn 使えば イイじゃん なんですけども ソレはソレ。 Im2Col方式での実装を考えていましたが、(arXiv:1704.04428) Parallel Multi Chann

    高速な Convolution 処理を目指してみた。 Kn2Image方式 - Qiita
  • 1