【仕様】・パッケージ:箱・シリーズ:-・モジュール/ボードタイプ:-・コアプロセッサ:-・コプロセッサ:-・速度:-・フラッシュサイズ:-・RAMサイズ:-・コネクタタイプ:-・サイズ/寸法:-・動作温度:
【仕様】・パッケージ:箱・シリーズ:-・モジュール/ボードタイプ:-・コアプロセッサ:-・コプロセッサ:-・速度:-・フラッシュサイズ:-・RAMサイズ:-・コネクタタイプ:-・サイズ/寸法:-・動作温度:
0. はじめに 昨今のAI、DXブームの影響で、機械学習、深層学習(ディープラーニング, Deep Learning) への注目は増すばかりですが、初学者の方にとって機械学習を学ぶハードルは依然高い状態かと思います。 機械学習、特にディープラーニングを習得するには学ぶべきことが多く、また分野によっては難易度が高いということもあり、学んでいる途中で挫折してしまうという人も多いという印象があります。 そこで本記事では、これから機械学習を学びたい方が自学自習する際の助けになるようにと、有用な自習コンテンツをまとめました。 本記事では、機械学習エンジニアとして実務に参画できるレベルを目指して、コンテンツを収集しました。よって機械学習の理論やライブラリに加え、社会実装する上で付随して必要となるソフトウェアエンジニアリングのスキルも含めています。 コンテンツについては、適宜追記していく予定です。 対象
はじめに今回はちょっとだけ本業に近い領域のことを書いてみます。 GPU で機械学習のコードを動かしたい時、個人ユーザーにとっては Google Colaboratory (長いので以下 Google Colab) が最も有力な開発環境かと思います。何と言っても無料で使えるのが大きいですよね。最近私もプライベートでは時々お世話になっています。ただ無料でサービスを継続するためにいくつか制限・制約があるのがちょっと厄介なところ。特に予期せぬタイミングで GPU の使用制限に引っかかることがあるのは結構困ります。先日もいきなり「あなたはしばらく GPU 使えませーん」と言われて焦りました (GPU 使用制限についての公式の説明もご覧ください)。 そこで、Google Colab に代わるものはないのか?無料で GPU が使える等という虫の良い要求は Google 以外には満たせないのか?という疑問
OpenCV3系で導入されたdnnモジュールのサンプルで、GoogLeNetのCaffeモデルの読み込みを行うプログラムのサンプルがあったので、自作画像で画像認識をしつつ、使い方を確認してみようという記事です。 GoogLeNetはGoogle発のDeep Learningの画像分類のニューラルネットワークです。発表されたのは2014年で、今ではもっと新しいネットワークも様々発表されてはいますが、22層という多くの層を用いており、分類精度の高いモデルです。 詳細については論文[1]も出ていますし、他に詳しい記事もたくさんあると思うので、今日は取りあえず使ってみる、実践してみるというところに重きを置きたいと思います。 [1] “Going Deeper with Convolutions” Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Se
2020/01に書いた記事M5StickVやUnitVで使えるkmodelファイルをローカル環境で作成する。ではYolo-digit-detectorというものを利用してモデルデータを作成していました。しかし、2020/09現在ではaXeleRateというプロジェクトに変わっているようです。本記事ではaXeleRateを利用してK210で利用できるYolov2のkmodelを作成する手順を紹介します。 ※ Windowsで説明しているのですが、Linuxで実行した方がトラブルが少なくいいかもしれません。 記事で利用した環境 以前の記事M5StickVやUnitVで使えるkmodelファイルをローカル環境で作成する。ではVMWare上で動く仮想環境のUbuntuを利用していましたが、今回はTensorflow-GPUを使うためにWindows10で行っています。ファイルパスの記述が異なります
M5Stack COM.X Sgifoxモジュールを用いたエッジAIの組み込み実装と,エッジAIによる画像処理結果をSigfoxでクラウドへ送信する仕組みのユースケース一例として,「人流エッジAI計測」を作ってみました。 【補足】ここで言うエッジAI ここで言うエッジAIとは,一般にAIモデルがコンピュータリソースの豊富なクラウドサーバーにおいて実行されることが多いのに対して,現場で取得したデータのインプットをその場でタイムリーにAIモデルに与えて推論させ,取得したい特定の情報を得ることを意味しています。 画像から人を検出する,ということを断続的に超短周期で実行し続けることで,カメラの前を通り過ぎる人の数をカウントします。 ソリューションのポイントとメリット デバイスを設置した現場で,エッジAIを用いて画像から人物の数の情報の取り出しを実行することにより… データ量を削減し、必要なデータの
はじめに MobileNet系の高速なモデルアーキテクチャに利用される構成要素と、それらを利用したモデルについて、何故高速なのか観点と、空間方向の畳み込みとチャネル方向の畳み込みがどのようになされているかという観点で整理を行う。 高速なモデルアーキテクチャに利用される構成要素 まず、高速なモデルに利用される畳み込み構成要素について、計算量と、空間方向の畳み込みとチャネル方向の畳み込みがどのようになっているかを説明する。 まず、一般的な畳み込みの計算量を確認する。 入力特徴マップのサイズを$H \times W$、入力チャネル数を$N$、カーネルサイズを$K \times K$、出力チャネル数を$M$とすると、一般的な畳み込み層の計算量は、$H W N K^2 M$となる。 これは、入力特徴マップの1箇所につき畳み込みのコストが$K^2 N$で、これを入力特徴マップの$H W$箇所に適用する
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く