サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ドラクエ3
peluigi.hatenablog.com
はじめに Gated-SCNN: Gated Shape CNNs for Semantic Segmentationを読んだのでメモ. 気持ち 従来のCNNを使ったsegmentation手法は色だの形だのテクスチャだのをCNNの内部で一緒くたに扱っていて,その扱い方を疑問視した論文.ここではshapeに関する推論を分離したほうがいいという仮説を立てて,通常のCNN(regular stream)にshapeを扱うブランチ(shape stream)を加えたtwo stream型のモデルを提案. Gated Shape CNN 上で説明した通り,regular streamとshape streamからなるモデルを作る.その際にちゃんとshape streamがshape(ここではboundary)に関する情報のみを扱えるよう,Gated Convolution Layer (GCL)を
はじめに EfficientNet: Rethinking Model Scaling for Convolutional Neural Networksを読んだのでメモ.より良いbackbone networkであるEfficientNetを提案.感覚的に持ってたモデルの深さと幅,入力に関する解像度とモデルの精度間の関係をいくつか実験的に検証して面白かったのでまとめる. Problem Formulation まず問題の定式化から入る.ある番目の畳み込み層の入出力関係を次のように定義する. これを多層化した最終的なモデルはと表現する.あるベースラインモデルに対し,モデルの深さ,チャネル数,入力の解像度の3つを探索のパラメータとして次のような最適化問題を解くのが目標. などハットのついた変数は初期のベースラインモデルのパラメータを表す. Scaling Dimensions 各変数とモデル
はじめに Realistic Evaluation of Semi-Supervised Learning Algorithmsを読んだのでメモ.PyTorchで実装もしました.実装の話はこちら. 気持ち データを作るコストが高いことからsemi-supervised learning (SSL)は重要で,最近はそれなりのラベルデータがあればsupervisedに匹敵する性能がでる.ただ,実世界の設定に対してSSLはちゃんと機能するのかというのがこの論文が問題として提案しているところ.そこで実世界の課題に対してSSLのアルゴリズムが機能するかを評価可能な新しい実験方法を提案するという論文.実験を行う上で実際以下の様な発見があったとのこと. ・同一構成のモデルに対してラベル有りのみを使った場合とラベルなしも使った場合の性能差が報告よりも小さい. ・強力な正則化をかけてラベル有りのみで学習され
はじめに Gumbel Max Trickについて勉強したからメモ. Gumbel Max Trickのお気持ちとしてはカテゴリカル分布から効率よくサンプリングしたいというもの(多分。。。). 言ってしまえばカテゴリカル分布におけるreparameterization trick. accept-rejectアルゴリズム カテゴリカル分布からの基本的なサンプリング方法の一つにaccept-rejectアルゴリズムがある. カテゴリカル分布のパラメータ(各カテゴリがサンプリングされる確率)をとする.と{} を一様にサンプリングし,の時にを返し,の時にはまたサンプリングを繰り返すというもの.である限り二つの変数をサンプリングし続けなければならないから効率がわるい. Gumbel Max Trick Gumbel Max Trickでは標準Gumbel分布からカテゴリの数だけサンプリングを行い,
はじめに SRFlow: Learning the Super-Resolution Space with Normalizing Flowを読んだのでメモ. 従来のdeep super resolutionが決定的な出力をすることに対し,超解像はそもそも決定的に決まる問題ではないという考えからconditionalなgenerative flowを使って,低解像度画像を条件とする確率モデルとして超解像を実現. SRFlow 手法はシンプルで,基本的にはGlowをベースとしている. 低解像度画像を条件としてモデルに与えるために,まず低解像度画像をCNN により,と変換する. このCNNはinvertibleではなく通常のCNN. 得られた表現をaffine coupling層へ次のように導入することでconditionalなモデルとする. は層目の出力を2分割したもの. アフィン変換のパラ
このページを最初にブックマークしてみませんか?
『機械学習とかコンピュータビジョンとか』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く