2017年9月20日のブックマーク (6件)

  • KerasでVGG16を使う - 人工知能に関する断創録

    今回は、Deep Learningの画像応用において代表的なモデルであるVGG16をKerasから使ってみた。この学習済みのVGG16モデルは画像に関するいろいろな面白い実験をする際の基礎になるためKerasで取り扱う方法をちゃんと理解しておきたい。 ソースコード: test_vgg16 VGG16の概要 VGG16*1は2014年のILSVRC(ImageNet Large Scale Visual Recognition Challenge)で提案された畳み込み13層とフル結合3層の計16層から成る畳み込みニューラルネットワーク。層の数が多いだけで一般的な畳み込みニューラルネットと大きな違いはなく、同時期に提案されたGoogLeNetに比べるとシンプルでわかりやすい。ImageNetと呼ばれる大規模な画像データセットを使って訓練したモデルが公開されている。 VGG16の出力層は1000

    KerasでVGG16を使う - 人工知能に関する断創録
  • SSD: Single Shot MultiBox Detector 高速リアルタイム物体検出デモをKerasで試す - Qiita

    リアルタイムに物体検出するのってどうやるんだろう?と思い調べてみたら、想像以上に高機能なモデルが公開されていたので試してみました。こんな感じです。 自動運転で良く見るようなリアルタイムの物体認識をしています。このモデルは「Single Shot MultiBox Detector(SSD)」という深層学習モデルで、Kerasで動いています。 環境さえ整えればレポジトリをクローンして簡単に実行できます。今回はデモの実行方法をまとめてみます。 環境 ちょっと古いiMacにUbuntu16.04を入れたものを使いました。詳しくはこのへんとかこのへんをご参照ください。 深層学習を利用したリアルタイムの物体検出は次々と新しい技術が公開されているようです。ざっと調べたところ、R-CNN、Fast R-CNN、Faster R-CNN…。どれだけ早くなるねん。って感じですが、とにかくどんどん早くなってい

    SSD: Single Shot MultiBox Detector 高速リアルタイム物体検出デモをKerasで試す - Qiita
  • TensorFlowで始める深層学習 (1)そもそも何が出来るの? - ぐるなびをちょっと良くするエンジニアブログ

    こんにちは!かわしま@を楽しむエンジニアです。 週末、以前から気になっていた秋葉原の老舗とんかつ店丸五(まるご)へ。特ロースかつにセットメニュー(ご飯/赤出汁/お新香付)を付けて二千円少々。ご飯お代わり出来ます。脂身好きなら迷わずロースですよね v こちらのお店、かなり並ぶことになりますが、特と言う名に恥じない肉の厚みに、甘い脂身の美味しさあふれています!! それでは、これから 何回かに分けて、深層学習に関して書いていきたいと思います。 どうせなら、旬なアーキテクチャであるTensorFlowを使って、深層学習の理解を深められたらと思います。自分自身もこのブログを通して勉強する身です。 今回は、TensorFlowで深層学習を始めるのに、何ができるの?何が必要になってくるの?どう進めて行くの?等を概観して見ましょう。 最初に関連する事をこまごまと。。。 深層学習(Deep Learnin

    TensorFlowで始める深層学習 (1)そもそも何が出来るの? - ぐるなびをちょっと良くするエンジニアブログ
  • OpenCVを使った顔認識(Haar-like特徴分類器) - Qiita

    「Haar-like特徴を用いたブースティングされた分類器のカスケード」とは、Haar-likeとよばれる明暗で構成される矩形のパターンを検出に使う手法です。Haar-like特徴と対象画像を重ね合わせ、パターンがあるかないかを判定します。 OpenCVには以下のHaar-like特徴分類器があらかじめ用意されています。 [OpenCV Install Dir]/Library/etc/haarcascades/ ファイル名 内容

    OpenCVを使った顔認識(Haar-like特徴分類器) - Qiita
  • 畳み込みニューラルネットワークの基礎 - HELLO CYBERNETICS

    事前知識 テンソルで理解しておくべきことは意外と少ない 畳み込みとは 畳み込み 畳み込みニューラルネット 畳み込みニューラルネットの畳み込み処理 空間フィルタ 畳み込み層 RGB画像を扱う場合 畳み込み層まとめ 分類の方法について プーリング層 活性化関数 全体のまとめ 事前知識 テンソルで理解しておくべきことは意外と少ない 畳み込みニューラルネットワークでは非常にたくさんの添字が現れます。 しかし決して難しいものではありません。実はとてもシンプルな処理を繰り返しているだけです。そのことを理解するためには、テンソルの概念を知っておくと便利です。 言葉が聞き慣れないだけで全く難しくありません。 テンソルのインターネットで検索すると何やら難しい話が出てきます。 以下はWikipediaの引用です(読む必要ありません。テンソルって聞くとこんな話が出てきますが、気にしないでくださいということが言い

    畳み込みニューラルネットワークの基礎 - HELLO CYBERNETICS
  • 畳み込みニューラルネットワークの仕組み | POSTD

    (編注:2016/11/17、記事を修正いたしました。) ディープラーニングの分野でテクノロジの進化が続いているということが話題になる場合、十中八九畳み込みニューラルネットワークが関係しています。畳み込みニューラルネットワークはCNN(Convolutional Neural Network)またはConvNetとも呼ばれ、ディープニューラルネットワークの分野の主力となっています。CNNは画像を複数のカテゴリに分類するよう学習しており、その分類能力は人間を上回ることもあります。大言壮語のうたい文句を実現している方法が当にあるとすれば、それはCNNでしょう。 CNNの非常に大きな長所として、理解しやすいことが挙げられます。少なくとも幾つかの基的な部分にブレークダウンして学べば、それを実感できるでしょう。というわけで、これから一通り説明します。また、画像処理についてこの記事よりも詳細に説明

    畳み込みニューラルネットワークの仕組み | POSTD