サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
iPhone 16
ryuz.txt-nifty.com
はじめに 従来のパーセプトロンモデルを使った学習ではなく、回路そのものを微分してFPGAを直接学習してしまおうという当サイトオリジナルのディープラーニングLUT-Networkですが、ここのところ深いネットを学習させるために蒸留(Knowledge Distillation)に取り組んでいました。 その一つの成果として、MNISTデータを使ったセマンティックセグメンテーション(もどき)を試してみたのでブログに記録しておきます。 まずは先に結果 まず先に最新の結果を記載いたします。MNISTベースの画像を入力して、それぞれの数字領域を色塗りするセマンティックセグメンテーション(もどき)を学習させてみました。 入力画像 出力画像 上記の入力画像をもとに Verilog のRTLシミュレーションで得た結果画像が以下です。 FPGAリソース 下記が実際にRTLを合成した場合のリソース量です。DNN
はじめに 現在DNN(Deep Neural Network)の実装において、FPGAの活用はしばし議論の対象になっています。もちろんDNN分野全体からするとニッチな部類に入るとは考えますが、FPGAベンダーはここに非常に力を入れており、作成したネットワークのデプロイ先としてFPGAが選択しやすくなるような各種のソリューションが用意され始めており、日々進化しています。 ここでのFPGAのメリットは、低消費電力であったり、コストであったりします。DNNの実行にはクラウドであっても電力というランニングコストは馬鹿になりませんし、エッジコンピューティング、特にバッテリー駆動のモバイル分野においては電力は極めて重要です。またイニシャルコストの重要性はどちらも同じでしょう。 ここでFPGAベンダーはこぞって、「GPUと同じように開発できます」をキャッチフレーズに、GPUを使って研究開発をしている多く
Zybo Z7-20 にて、LUT-Network で構成したCNNが1000fpsの高速度カメラ入力にてリアルタイムで動き始めたので、結果を纏めておきます。 システムの構成とか、カメラやOLEDの高速駆動とかは過去記事をご参照ください。
FPGAをターゲットに、リソース効率と速度重視の学習が出来る Binary Deep Neural Network(Binary-DNN)を目指しています。 十分なベンチマークはできていませんが、FPGAなどのハードウェアロジックにターゲットを限定し、その回路構成と等価なネットを直接学習させることで、従来のバイナリニューラルネットワークに比べて、数十倍~数千倍程度の効率が狙える可能性があることが見えてきました。
Ryuzのブログ 主にプログラミングやFPGAネタを書いていくブログです。 ホームページはこちら http://ryuz.my.coocan.jp/ 新しい記事は Hatena Blog や Zenn にあります。 XILINXのZynqについて思うところを駄文ですが、少し書いてみます。 ユーザーから見るとZynqにはいくつもの側面があると思います。 [エッジコンピューティングにおけるTegraの対抗としてのZynq] 1つはGPGPUにおけるnVidiaのTegraの対抗であり、FPGAによるアクセラレーター型コンピュータをエッジコンピューティングに持ち込んだものという考え方です。これはCUDAに相当する部分をHLSやSDxで置き換えていこうという試みだと思っています。おそらくここがXilinx社の本命で、もっともデバイスの数が出ると思われる部分で、力を入れている分野かと思います。 サー
このページを最初にブックマークしてみませんか?
『ryuz.txt-nifty.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く