タグ

畳み込みに関するedo_m18のブックマーク (3)

  • Deep Learning

    2012年に開催された大規模画像認識のコンペ ILSVRC(ImageNet Large Scale Visual Recognition Challenge)で AlexNet が圧倒的な成績で優勝して以来、ディープラーニングの手法が画像認識での主役に躍り出ました。それ以降、ILSVRC で ImageNet の画像を用いたモデルの開発競争が行われてきました。 ディープラーニングの手法はCNN (Convolutional Neural Network)を基礎としています。その初期代表モデルは LeNet と AlexNet でした。その後、畳み込み層を深くすればするほど学習精度が上昇するので、畳み込み層をより深くするモデルが登場しました。VGG16、VGG19 は畳み込み層の深さを16、19にしたネットワークモデルです。GoogLeNet は畳み込み層を22にまで拡大しました。そして、

  • 8.2. コンボリューション行列...

    ここは数学者の独壇場です。 フィルターはほとんどがコンボリューション行列を使用しています。 コンボリューション行列... フィルターと想像力があればどんなフィルターも創れます。 コンボリューション (二次元畳み込み) 行列とは何なのでしょう。 数学の小道具をちょっとばかり知っていただければ大まかな理解が可能です。 コンボリューションとは行列式を「カーネル (核)」と呼ばれる別の行列式で処理することです。 コンボリューション行列フィルターは「像」を処理する最初の行列を使います。 像とは画素を縦横の座標に並べた 2 次元の集合です。 ほしい効果によって利用されるカーネルは異なります。 GIMP では 5×5 行列か 3×3 行列が使われます。 ここでの説明は専ら 3×3 行列のみ扱いますが、 これは最もよく用いられているうえお望みの効果をこなすのに充分なものだからです。 ダイアログでは 5×5

  • たたみ込み演算による画像処理

    4.たたみ込み演算による画像処理 【たたみ込み演算】 たたみ込みは,画像処理を実行するときに最も頻繁に用いられる計算のひとつである.数学的には,もとの関数とたたみ込む関数との積の積分で表されるが,ディジタル信号においては,掛け算と足し算のみで容易に表現することができる. 図1を見てみよう.これは一次元信号に対するたたみ込みの演算例である. 図1 一次元におけるたたみ込みの演算の計算例 この例では,関数 f に関数 g をたたみ込み,その結果を f *g として表している.b',c' と進むにつれて,関数 g が1つずつずれて掛け算が行われていることがわかる.ただし,関数 f において両端の a と c については,関数 g をずらしていった際にそれぞれの x と z とが関数 f の範囲から外れてしまう.そのため,計算結果の a' と g' は,強制的に出力画素値を0とするか,または適切な

    edo_m18
    edo_m18 2014/02/22
    そういうことかー。
  • 1