このIntel® Movidius™ Neural Compute Stickは、イメージ最高。。。1万円でRasPiが高性能なDLマシンになっちゃう♬ ということで、半年以上たったので安定しているはずということで試してみました。 というか、RasPi使っていろいろ物体検出とかやれそうだなということで期待してやってみました。 結果から書くと、出来ました! 残念ながら、ここにたどり着けたのは幸運だったかもしれません。 ということで、苦労話は無しで、マネしてもらえればほぼ出来ると思います。 ※参考はたくさんありますが、。。すべての記載は控えます メモリは4GB以上空きがないと厳しいと思います。 ※ウワンはSTRETCH完了時2GB残ってましたが、途中削除しつつ進めましたが最後はぎりぎりになりました やるべきこと (1)ほぼ公式のとおりやる Intel® Movidius™ NCS Quick
はじめに 今回は、今年(2018)の4月に発表された、物体検出モデルPeleeについて調べてみました。 Peleeについて Peleeの論文のタイトルは、「Pelee: A Real-Time Object Detection System on Mobile Devices」です。 タイトルの通り、モバイル端末でのリアルタイムでの物体検出に適したモデルらしいです。 つまり、処理速度を上げつつ、モデルの大きさ(パラメータ数)を抑えたモデルらしいです。 Peleeモデルのテクニック PeleeモデルはDenseNetベースのモデルで、これをSSDと組み合わせたようです。 [Densely Connected Convolutional Networks](https://arxiv.org/pdf/1608.06993v3.pdf) Peleeの主なテクニックとして、以下のようなものが上げら
Caffeを使ってみた Caffe2があるのですが、WindowsではGPUで現状(2018.6)は使うことが出来ないので、Caffeにしました。 WindowsのCaffeはビルドなどしても良いのですが、バイナリバージョンが公式で出ているので、動かすだけであれば簡単です。 以下の手順で動かしていきます。 学習画像、テスト画像、評価画像の3種類を用意する データベースを作る 平均値画像を作る 学習する 評価する はじめに はじめに,Windows版のCaffeを入手します。 かつては,ビルドなどをしなければならないのですが,とりあえずいろいろと改良しなければビルド版を入手したらOK GPU,CPUなど好きなものをダウンロードしてください。 プログラムはここ ダウンロード後は解凍して、フォルダの中に[tools]と[example]のフォルダを作成しておきましょう。 [tools]には、後に
NVIDIA主催のAI講習でAI開発の手ほどきを受けてウキウキの会社員のみなさんがいきなりぶち当たる壁「Linux機」の手配。おじさんはそんな辛い気持ちよくわかります。 そんな事情はわかりつつ、NVIDIA DIGITS 6.0をWindowsで使う! - 夜間飛行ではwindows版BVLC/CaffeでDIGITSを動かしたのですが、オリジナルがビルドできないのって気になります。 cmakeの扱いやCIツールのお勉強、WindowsとLinuxの差異へのさらなる習熟を目指してNVIDIAのNVCaffe 0.15をWindows機向けにbuildしましたのでご報告です。 とりあえずバイナリ欲しい人向け この辺にリンク貼っておいたんで… Prebuild binariesから持っていってくだされ。 caffe/README.md at caffe-0.15-win · Chachay/c
Facebook Reality Labs、VRハンドトラッキングをリアルタイムに実行するCNNを用いたマーカベースの光学式モーションキャプチャシステムを発表 2018-08-10 Facebook Reality Labsの研究者らは、VR内のハンドトラッキングをリアルタイムに実行するCNN(convolutional neural network)を用いたマーカベースの光学式モーションキャプチャシステムを発表しました。 論文:Online Optical Marker-based Hand Tracking with Deep Labels 著者:Shangchen Han, Beibei Liu, Robert Wang, Yuting Ye, Christopher D. Twigg, Kenrick Kin 本システムは、キャプチャデータをラベリングするためにCNNを用いて推定し
WaveNetを使ったAutoencoderで音楽のドメイン間の変換を可能に! – A Universal Music Translation Network 交響曲、ピアノ曲、コーラス、口笛などの異なる「ドメイン」の間で、音楽を自在に変換するという野心的な研究. 音楽を変換するといってもMIDIなどのシンボルレベルでのスタイルの変換ではなく、音の波形そのものを扱っています。 ベースになっているのはNSynthの論文の中で提案されているWaveNetをつかったAutoencoderです(NSynthについてはこのサイトでも取り上げたことがあります). Encoderは全ドメインで共通、Decoderは各ドメインごとに用意しています (ひとつのdecoderをドメインごとに条件付け(conditioning)する方法だとうまくいかなかったそうです)。Decoderには、NVIDIAが提供する
はじめに NIPS2017から、J. Wang らの Gated Recurrent Convolutional Neural Network for OCR をまとめてみた。 NIPS2017の論文ページはこちら。 http://papers.nips.cc/paper/6637-gated-recurrent-convolution-neural-network-for-ocr 著者らのコードはこちら。 https://github.com/Jianfeng1991/GRCNN-for-OCR 概要 OCRタスクのモデル RCNN(recurrent convolutional neural network)に gate を加えた GRCNN(Gated RCNN)を用いた この gate はRCL(recurrent convolution layer)における context mo
Deep Learning Labとは? Deep Learning Labとは、Chainerを提供するPreferred Networksと、Azure クラウドを提供するMicrosoft による、深層学習に関する「最新技術をビジネスで活用している事例」や「最新の技術動向」を共有することで、深層学習技術者の裾野を広げ、実社会での利用拡大を図ることを目的としたコミュニティです。 Deep Learning Lab 第一回ハッカソン開催 あなたの深層学習プロジェクト、例題で止まっていませんか? 実務課題に近いデータに対してのアプローチ方法、モデルのチューニング方法、精度をあげる方法が学べるハッカソンを9月8日(土) ,日本マイクロソフト本社(品川)にて開催。 テーマ:画像処理(CNN)で実務課題に挑戦 今回は「ポテトチップスの画像分類」です。 実務課題に近く、実力がつく比較的難易度が高め
Sadly, I must say goodbye to Leaf (my programming language) This is hard to write, or rather, it’s a hard decision to make. After investing many years on Leaf — a programming language, a major life project — I need to take a break from it. It’s no longer fulfilling my goals, and it’s not as fun as it once was. It’s interfering with my other career priorities. Leaf has become part of my identity, a
Facebook AI Research による論文「Deep Clustering for Unsupervised Learning of Visual Features」の解説資料 https://arxiv.org/abs/1807.05520
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く