久しぶりに 研究 カテゴリーの記事 書きます.Convolution Neural Network (CNN) を画像検索に利用する話です. 画像検索(image retrieval または image search)とは,大量の画像を蓄えた「データベース (database)」の中から,検索対象(「クエリ (query)」)の画像に類似した画像を探し出す手続きのことです.ここで考えているのは画像の内容の類似性(人間の感覚的な似てる度合い)に基づく検索なので,より詳しく Content-Based Image Retrieval と言うこともあります.ちなみに,Content-Based じゃない画像検索ってのは,「猫」とか「白いもふもふ」みたいにキーワードをクエリにするとか,そういう類のやつね. 5年ほど前に Deep な CNN が画像認識で高い性能を示すことが知られるようになって以来
September 7, 2015 by Alban Desmaison tl;dr A few weeks ago, Google DeepMind released an awesome paper called Spatial Transformer Networks aiming at boosting the geometric invariance of CNNs in a very elegant way. This approach was so appealing to us at Moodstocks that we decided to implement it and see how it performs on a not-so-simple dataset called the GTSRB. At the end of the day Spatial Trans
Porting state of the art deep learning algorithms to resource constrained compute platforms (e.g. VR, AR, wearables) is extremely challenging. We propose a fast, compact, and accurate model for convolutional neural networks that enables efficient learning and inference. We introduce LCNN, a lookup-based convolutional neural network that encodes convolutions by few lookups to a dictionary that is t
今回は、畳み込みニューラルネットを使ってCIFAR-10(2015/10/14)の一般物体認識をやってみた。以前、Chainerでやった(2015/11/8)のをKerasで再実装した。 これもKerasの例題に含まれている。このスクリプトでは、データ拡張(Data Augmentation)も使っているがこれはまた別の回に取り上げよう。 ソースコード:cifar10.py CIFAR-10 CIFAR-10は32x32ピクセル(ちっさ!)のカラー画像のデータセット。クラスラベルはairplane, automobile, bird, cat, deer, dog, frog, horse, ship, truckの10種類で訓練用データ5万枚、テスト用データ1万枚から成る。 まずは描画してみよう。 import numpy as np import matplotlib.pyplot a
Sound examples and additional information [poster] Presented at the "Seminar on music knowledge extraction using machine learning", Dec. 4th, collocated with NIPS2016 Barcelona. Contact: {merlijn.blaauw, jordi.bonada}@upf.edu Demo 1: "El Último Vals" (original by La Oreja De Van Gogh) With background music and effects.
モルフォとデンソーは12月9日、共同で開発を進めてきたDeep Neural Network(DNN)による画像認識技術のアルゴリズムが、高度運転支援および自動運転技術の実現に向けた次世代の画像認識システムに応用されることが決まったことを発表した。 自動運転を実現するためには、自動車の周囲で生じるさまざまな状況を認識する必要があったが、従来のパターン認識や機械学習では、認識が必要な対象物に対して特徴づけなどを行って、あらかじめ学習させる必要があった。一方、DNNによる画像認識は、自身で対象物の特徴を抽出し、学習することができることから、対象物の認識や検知の精度を高めやすい、といった利点があり、今後も両社は継続して、認識処理性能の向上に向けた取り組みを進めていくとしている。 また、モルフォでは、デンソーが開発を進める電子ミラー技術や周辺監視システムにおいても、画像処理技術を応用することで、視
The goal of this paper is to serve as a guide for selecting a detection architecture that achieves the right speed/memory/accuracy balance for a given application and platform. To this end, we investigate various ways to trade accuracy for speed and memory usage in modern convolutional object detection systems. A number of successful systems have been proposed in recent years, but apples-to-apples
Convolutional Neural Networks (CNNs) exhibit remarkable performance in various machine learning tasks. As sensor-equipped internet of things (IoT) devices permeate into every aspect of modern life, it is increasingly important to run CNN inference, a computationally intensive application, on resource constrained devices. We present a technique for fast and energy-efficient CNN inference on mobile
はじめに pythonでCNNを実装しました. 深層学習ライブラリは使用せず,numpyだけで実装しました. 教科書として『深層学習』を使いました. 本記事の構成 はじめに CNN 畳込み層 プーリング層 学習 重みの更新 誤差逆伝播 pythonでの実装 畳込み層の実装 プーリング層の実装 MNISTデータセットでの実験 学習 結果 おわりに CNNとは,畳込み演算を用いた順伝播型ネットワークであり,主に画像認識に応用されています. 一般的なニューラルネットワークは,隣接層のユニットが全結合されたものですが, CNNは,隣接層間の特定のユニットのみが結合した特別な層を持ちます. これらの特殊な層では,畳込み および プーリング という演算を行います. 以下では,畳込みとプーリングについて説明します. 畳込み層 畳込みは,画像にフィルタの対応する画素同士の積をとり,その総和をとる演算です.
Note This tutorial is adapted from an existing convolution arithmetic guide [1], with an added emphasis on Theano’s interface. Also, note that the signal processing community has a different nomenclature and a well established literature on the topic, but for this tutorial we will stick to the terms used in the machine learning community. For a signal processing point of view on the subject, see f
NNEF reduces machine learning deployment fragmentation by enabling a rich mix of neural network training tools and inference engines to be used by applications across a diverse range of devices and platforms. The goal of NNEF is to enable data scientists and engineers to easily transfer trained networks from their chosen training framework into a wide variety of inference engines. A stable, flexib
Deep convolutional neural networks take GPU days of compute time to train on large data sets. Pedestrian detection for self driving cars requires very low latency. Image recognition for mobile phones is constrained by limited processing resources. The success of convolutional neural networks in these situations is limited by how fast we can compute them. Conventional FFT based convolution is fast
デンソーアイティーラボラトリの佐藤です。 12/3-4にパシフィコ横浜で開催された、ViEW2015(ビジョン技術の実利用ワークショップ)において、CNN (Convolutional Neural Network) のチュートリアル講演を行いました。その時に使用したスライドを掲載します。 国内における画像系のDeep Learningのチュートリアルは、東京大学の中山英樹先生(スライド)や、中部大学の山下隆義先生(スライド)らによるものが有名です。網羅的かつ分かりやすいため、入門者の方々にはとても参考になると思います。 ぼくのチュートリアル講演では、入門者と中級者のあいだくらいの方々をターゲットにしました。誤差逆伝搬法や活性化関数などは一通り知っているけど、バリバリ使いこなしているとは言えないなあ、といった方々に役立つ知見を盛り込んだつもりです。参考になれば幸いです。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く