A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?
さて、今回から具体的な手法について見ていきましょう。 この連載のテーマは「ビジネスは変わるのか」なので、あくまでビジネスに活用できる、という視点で見ていきます。 ディープラーニングとは何か? まずは、やはり前回でも触れた、ブームの発端となったディープラーニングを取り上げないわけにはいかないでしょう。 現在でもブームの中核をなしている大きな要素の1つです。ところが困ったことに、現在のところビジネスを変えるという意味ではディープラーニングのインパクトというのはさして大きくありません。これはあくまで「現在のところ」であり、今後どうなるかは未知数ですが、とはいえまだその道筋もあまり見えていないというのが正直なところです。 ディープラーニングが騒がれる理由 ではなんでそんな騒がれるのかというと、いくつかの理由があります。 1つ目は、ディープラーニングそれそのものは、大きな進歩があったのは事実だからで
類似画像検索手法について簡単にまとめました。 はじめに 画像検索には主に2種類の手法がある。 TBIR (Text Based Image Retrieval) 画像にテキストデータが紐付けられていて、テキストを元に検索する CBIR (Content Based Image Retrieval) 画像の特徴量を基盤として検索する ライブラリ Feature Extraction Library - FELib http://appsrv.cse.cuhk.edu.hk/~jkzhu/felib.html 下記の5つの特徴を持つ画像から特徴量を抽出できるライブラリである。 Color histogram, color moments. カラーヒストグラム・色統計) Edge histogram. 輪郭のヒストグラム Gabor wavelets transform. Wavelet tra
画像処理は難しい。 Instagramのキレイなフィルタ、GoogleのPhoto Sphere、そうしたサービスを見て画像は面白そうだ!と心躍らせて開いた画像処理の本。そこに山と羅列される数式を前に石化せざるを得なかった俺たちが、耳にささやかれる「難しいことはOpenCVがやってくれるわ。そうでしょ?」という声に身をゆだねる以外に何ができただろう。 本稿は石化せざるを得なかったあの頃を克服し、OpenCVを使いながらも基礎的な理論を理解したいと願う方へ、その道筋(アイテム的には金の針)を示すものになればと思います。 扱う範囲としては、あらゆる処理の基礎となる「画像の特徴点検出」を対象とします(実践 コンピュータビジョンの2章に相当)。なお、本記事自体、初心者である私が理解しながら書いているため、上級画像処理冒険者の方は誤りなどあれば指摘していただければ幸いです。 画像の特徴点とは 人間が
前回、おそ松さんたちをディープラーニングで見分けるため、準備編としておそ松さんたちの顔画像を5644枚集めました。 今回はそれを用いて、ディープラーニングで学習させ、判別器を作って検証します。 集めた画像 人物 枚数 例 おそ松 1126 から松 769 チョロ松 1047 一松 736 十四松 855 とど松 729 その他 383 使用フレームワーク 最近GoogleからTensorFlowという新しいディープラーニングのフレームワークが発表されました。 会社のブログに使い方書いたのですが、まだ慣れていないので、今回はchainerを使います。こちらだとすぐに高い成果を上げているImageNetのNINモデル、4層畳み込みニューラルネットワークがサンプルで入っていますので、こちらを改良して使います。 imageNetの使い方は、こちらやこちらを参考にしています。 訓練データセット Im
概要 画像補完技術とは画像の欠損部分をそれらしく埋め合わせる技術のことをいう。この技術は古くから職人技として知られ、傷んだ写真の修復や写真からのトロツキーの除去などに広く用いられてきた。 近年では画像補完を自動的に行う技術の発展が目覚ましい。Hays らは、風景画像の欠損部分に合う画像を風景画像データベースから検索することで、風景画像の一部をまったく違う(しかし見た目には自然な)風景画像へと置き換えることに成功している。このような外部画像データベースを用いる手法は一種の「脳内補完」として機能しているといえる。 ところで、一般に「脳内補完」の主要な適用先は着衣状態の無着衣化である。彼らの手法のうち、風景画像データベースを裸体画像データベースへと置き換えることで、着衣画像の裸体化が行えることが期待される。 本プロジェクトでは上記着想の実装を行い、その実験結果を示す。 なお、本プロジェクトページ
Note that all plenary presentations will be video-recorded and available on the Signal Processing Society SigView online training database in late 2015. Deep Learning Yoshua Bengio Professor, University of Montreal Department of Computer Science and Operations Research Canada Research Chair in Statistical Learning Algorithms TIME Monday September 28, 2015 Abstract & Biography + Abstract The abstra
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向 6月10日 (木) 11:00 - 12:30 メイン会場(vimeo + sli.do) 登壇者1:中山 英樹 氏(東京大学) 登壇者2:幡谷 龍一郎 氏(東京大学) 概要:データ拡張は画像認識の精度向上テクニックとして古くから用いられてきたが、最新の深層学習においても最重要技術の一つとして年々注目を集めており、多様かつ複雑な進化を遂げている。その成功のカギは、タスクに関する先見知識を活用しながら、如何にして汎化性能を高めるように訓練画像を変換あるいは生成するかにある。本講演では、データ拡張の原理や最新動向について解説すると共に、自動的なデータ拡張に関する講演者の研究事例についても紹介する。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く