Raspberry Pi Advent Calendar 2019の21日目です。 なんとなく機械学習を触ってみたい方、 画像処理に機械学習を取り入れてみたい方、 ラズパイ4を買ってみたけど特にすることがない方向けに記事を書きます。 画像処理に初めて機械学習を使った時に「dlib」というライブラリを使ったのですが、 これが中身を理解しなくても使いやすかったのでご紹介させていただきます。 概要 ラズパイにwebカメラをつなげ、取得した画像データから任意の物体の位置を検出します。 物体の位置は物体の形状(エッジ)を学習することで検出します。 形状認識で用いられる特徴量にはHOG・SIFT・SURFなどがあるのですが、 dlibではHOG特徴量を用いています。 特徴 HOG(Histograms of Oriented Gradients)…輪郭がはっきりと映っている画像に有効 SIFT…ぼやけ
プログラミング言語(以下、言語)の1つであるPythonの人気が高まっている。もはやどんな技術者も無縁ではいられない。 言語には、その言語で利用できる「ライブラリー」が用意されている。ライブラリーは、呼び出すだけで様々な機能を実現できるモジュールのこと。ある言語で利用できるライブラリーには、「その言語で書かれているもの」と「別の言語で開発され、その言語向けのAPI(Application Programming Interface)が用意されているもの」がある。 ライブラリーが乏しい言語では、プログラマーが自分のやりたいことを実現するには多くの処理を自前で実装しなければならない。これに対しライブラリーが豊富な言語は、やりたいことをすぐに実現できる。
【要約】 Windows環境でデータベースシステム,人工知能,3Dコンピュータグラフィックス,メディア処理,プログラミングなどを活用するためのソフトウェアセットアップガイドである.主な内容は次のとおりである. 基本的な開発環境の構築(Python,Git,CMake,7-Zip,Build Tools for Visual Studio) NVIDIA関連ソフトウェア(ドライバ,CUDAツールキット,cuDNN)のインストール Python関連パッケージ(NumPy,SciKit-learn,TensorFlow,Keras,MatplotLib,OpenCV,PyTorch)のインストールと設定 さまざまな機械学習ライブラリ(Dlib,face_recognition,MTCNN,OpenPose,Tesseract OCR,Mask R-CNN,Meshroom,muZero,Open
オフィスでの居眠りを監視し、眠そうな人がいたら空調の温度が下がって強制的に起こす、という空調管理システムが話題になっていました。 www.nikkei.com https://t.co/NhLc3GByQv これネガティブに受け取られてるけどよく居眠りするサイドの意見としては居眠りって意図的にしてるわけではなくてむしろしなくて済むならしたくないので空調等の自然な形でそれを抑止してくれるのは結構いいと思う、仮眠とは話が別— メルセデスベン子 (@nomolk) 2018年7月26日 自分はよくなにかやりながら寝てしまう体質で、家でゲームやってたり本読んでるときでも寝てしまいます。眠い状態を経由せずに覚醒状態からいつのまにか寝てるので、我慢は無力です。なのでAI等の第三者が冷気とかでやさしく起こしてくれるならそれに越したことはないです。なので作ることにしました。 慶洋エンジニアリング(KEIY
windows10PC何台かに、dlibが使えるように環境構築しました。途中、つっかかったり警告やエラーもあったので備忘録として記載しておきます。 基本的には下記サイトの通り進めれば大丈夫だと思います。 http://www.learnopencv.com/install-dlib-on-windows/ Cmakeのエラーが出たら https://stackoverflow.com/questions/41514379/cmake-error-during-installation-of-dlib-on-windows こちらを参照するとC++ 2015 Build Toolsを入れるといいと書いてあります。 そこで http://landinghub.visualstudio.com/visual-cpp-build-tools こちらからC++ 2015 Build Toolsをイン
Since the last dlib release, I've been working on adding easy to use deep metric learning tooling to dlib. Deep metric learning is useful for a lot of things, but the most popular application is face recognition. So obviously I had to add a face recognition example program to dlib. The new example comes with pictures of bald Hollywood action heroes and uses the provided deep metric model to identi
ディープラーニングを使ったイメージの切り抜きで紹介されていたselective searchをやってみました。 selective searchは画像中の似たような領域を一つの物体として認識して、物体の候補を提案するアルゴリズムです。 良さそうなスライドを見つけたので紹介しておきます。 KantoCV/Selective Search for Object Recoginition from belltailjp www.slideshare.net Selective SearchのPython実装にはdlibの他にも belltailjp/selective_search_py · GitHub AlpacaDB/selectivesearch · GitHub があるようです。これ以外にもあったら教えて欲しいです。 dlibのインストール 記事ではMatlab実装を使っていましたが、
Back in September 2017, Davis King released v19.7 of dlib — and inside the release notes you’ll find a short, inconspicuous bullet point on dlib’s new 5-point facial landmark detector: Added a 5 point face landmarking model that is over 10x smaller than the 68 point model, runs faster, and works with both HOG and CNN generated face detections. My goal here today is to introduce you to the new dlib
シマフクロウを検出する 今回は、カメラ画像から自分の好きな物体を検出する方法を紹介します。 最終的には上の画像のように、カメラ画像からシマフクロウを検出します。次のステップにより物体の検出を行います。 検出する物体の特徴を学習する 学習した特徴をもとに画像中の物体を探索する まず、検出する物体の特徴を抽出するわけですが、どのような特徴を、どのように学習するか?が問題です。 これは画像処理や機械学習といった研究分野の問題で、面白いところではあるのですが、とても説明しきれないのでここでは説明省略します。 全てを説明しきれないので・・・ 詳細は、"Object Detection", "機械学習"などのキーワードで検索すると嫌というほど出てきます。または、最後にちょっとだけ原理に関わることも書きたいと思います。 今回は、HOG特徴をSVMで学習する方法で物体検出を行います。 HOG特徴は、輝度変
こんにちは。アプリケーション共同開発部エンジニアの石島です。 昨年の 11 月に Keras を使って Droid くんを認識してみた と題して Deep Learning の一種である Convolutional Neural Network(CNN)を用いて画像内の Droid くんの認識を行なってみました。今回は画像中の Droid くんを探してみようと思います! 今回は Droid くんのみの検出なので大量の画像と学習時間を必要とする Deep Learning ではなく、以前からある画像特徴量の HOG(Histograms of Oriented Gradients)特徴量と機械学習手法の SVM(Support Vector Machine)を用いて Droid くんの検出を行います。 この組み合わせは Deep Learning の登場前にはよく用いられていた手法です。こち
画像認識系の人達の間では、高性能な顔の器官検出(Face Alignment)が手軽に利用できることで知られているC++のライブラリ Dlib。(表記は大文字、小文字どっちなんでしょう?) 英語のWikipediaによると、2002年から開発されているかなり歴史のあるライブラリみたい。 公式ブログによると、最新バージョンのdlib 19.0からDeep Learning APIが備わったようです。 Dlib C++ Library Dlibは、現実世界の問題を扱う高度なソフトウェアを実装するための機械学習アルゴリズムやツールを備えたモダンなC++ツールキットです。Dlibはロボット工学、組み込みデバイス、携帯電話、巨大なハイパフォーマンスコンピューティング環境など、産業・アカデミック分野を問わず幅広い分野で利用されています。Dlibのオープンソースライセンシングにより、任意のアプリケーショ
The first part of this blog post will discuss facial landmarks and why they are used in computer vision applications. From there, I’ll demonstrate how to detect and extract facial landmarks using dlib, OpenCV, and Python. Finally, we’ll look at some results of applying facial landmark detection to images. What are facial landmarks? Detecting facial landmarks is a subset of the shape prediction pro
dlibを用いたselective searchで紹介したSegmentation as Selective Search for Object Recognitionを読んだところ、selective searchした候補領域に対してHOG特徴量を取ってSVMで物体かどうかの判定を行っていたのでHOG+SVMによる物体検出器を使ってみます。 ここではdlibの実装を使います。 dlibのPythonラッパーのインストールはdlibを用いたselective searchを参照してください。 教師データの作成 ラベリング用プログラムはOpenCVでの物体検出器作成にあるものを使います。 出力をこのプログラムでxmlに変換します。 #include <iostream> #include <fstream> #include <string> using namespace std; int
Dlib is a modern C++ toolkit containing machine learning algorithms and tools for creating complex software in C++ to solve real world problems. It is used in both industry and academia in a wide range of domains including robotics, embedded devices, mobile phones, and large high performance computing environments. Dlib's open source licensing allows you to use it in any application, free of charg
前準備 Build Tools for Visual Studio 2022 (ビルドツール for Visual Studio 2022)または Visual Studio 2022 のインストール(Windows 上) 【インストールの判断】 Build Tools for Visual Studio は,開発ツールセットである. Visual Studio は統合開発環境であり,いくつかの種類があり,Build Tools for Visual Studioの機能を含むか連携して使用するものである.インストールは以下の基準で判断してください: Build Tools for Visual Studio の機能のみが必要な場合 Build Tools for Visual Studio のインストール を行う. Visual Studio の機能が必要である,あるいは,よく分からない場
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く