タグ

機械学習に関するnixenekoのブックマーク (258)

  • Deep Learningによる一般物体検出アルゴリズムの紹介 - ABEJA Tech Blog

    一般物体検出アルゴリズムの紹介 今回CNNを用いた一般物体検出アルゴリズムの有名な論文を順を追って説明します。 コンピュータビジョンの分野において、一般物体検出とは下記の図のように、ある画像の中から定められた物体の位置とカテゴリー(クラス)を検出することを指します。 [6]より引用 Deep Learningアルゴリズムの発展によって、一般物体認識の精度は目まぐるしい勢いで進歩しております。 そこで今回はDeep Learning(CNN)を応用した、一般物体検出アルゴリズムの有名な論文を説明したいと思います。 R-CNN (Regions with CNN features) (CVPR 2014) [1] かの有名なCNNの論文[8]で、ILSVRC 2012の物体認識チャレンジで大差をつけて1位になりました。 このチャレンジでは1枚の画像が1000クラスのうちどれに属するかを推定する

    Deep Learningによる一般物体検出アルゴリズムの紹介 - ABEJA Tech Blog
  • Deep Learningの気持ちになって考えてみる - kivantium活動日記

    前回の記事で友利奈緒判定botを作ったのを紹介したところ、いろんな人から試してもらうことができました。集計したところ正解率としては90%程度を出していました。 この前集計した時の混同行列はこんな感じでした。最近投稿数が増えすぎて集計したくないです……。 しかし、第4世代のネットワークになっても「さすがにこれはないだろう」というような間違いを続けています。 .@dolicas_ 友利奈緒です(72%) pic.twitter.com/U9l93GVgIS— まほろ(稼働中) (@mitra_sun22) 2015, 9月 5 .@DEGwer3456 友利奈緒です(99%) pic.twitter.com/8Yum498g4E— まほろ(稼働中) (@mitra_sun22) September 6, 2015 Deep Learningは性能がいいということで最近もてはやされていますが、こ

    Deep Learningの気持ちになって考えてみる - kivantium活動日記
  • Faster R-CNNの紹介 - kivantium活動日記

    はじめに 今までいろんな画像処理のプログラムを書いてきましたが、その多くで物体検出のアルゴリズムを使っています。 ご注文は機械学習ですか?・結城友奈はサンタであるなどの記事ではOpenCVでアニメ顔検出をやってみたで紹介したlbpcascade_animefaceを使いました。これは2001年のViolaとJonesの論文で提案された方法に1994年(くらい)に提案されたLBP特徴量を組み合わせた、2008年の論文の方法を応用したもの(多分)です。 友利奈緒判定botではdlibによるHOG特徴を用いた物体検出がすごいで紹介したHOG特徴量とSVMを組み合わせた方法を使っています。これは2005年の人検出に関する論文の方法を使ったものです。 どのプログラムでも物体検出した後の判定精度はそれなりに高いのに、物体検出の精度の低さが全体の完成度を下げている感じになってしまっていました。2005年

    Faster R-CNNの紹介 - kivantium活動日記
  • 最適化アルゴリズムを評価するベンチマーク関数まとめ - Qiita

    更新履歴 最適解と探索範囲を追記しました。 2016/11/29 @fimbulさん 編集リクエストありがとうございました。修正しました。 2017/7/10 @tomochiiiさん 編集リクエストありがとうございました。Easom functionを引用元の数式に修正、Schaffer function N. 2とN. 4の数式の修正 2018/5/9 @applicative62045 さん 編集リクエストありがとうございました(編集リクエストの確認遅くなりました。2019/12/31記載) Griek functionを修正 2019/12/31 @okamoto6496 さん 指摘ありがとうございました。Five-well potential functionの数式を修正。 2020/01/20 @higedura さん 指摘ありがとうございます。Bukin function N

    最適化アルゴリズムを評価するベンチマーク関数まとめ - Qiita
  • タカハシ春の GAN 祭り!〜 一日一GAN(๑•̀ㅂ•́)و✧ 〜 - ABEJA Tech Blog

    ABEJAでリサーチャーをしています高橋です。 昨今 deep learning 界隈では Generative Adversarial Net(GAN) が流行っていて、世はまさにガンガン行こうぜ時代ですね。 GAN を用いると綺麗な絵が作成できたり二つの絵の中間のような絵を生成できたりします。例えばこの論文のような感じです。このように GAN は有用なモデルである一方、最近の GAN では急によくわからない式が出てきたりするので、勉強も兼ねて「一日一GAN」をやってみました。今回読んだ論文のリストは以下です。 EBGAN (https://arxiv.org/abs/1609.03126 ) WGAN (https://arxiv.org/abs/1701.07875) LSGAN (https://arxiv.org/abs/1611.04076) f-GAN (https://ar

    タカハシ春の GAN 祭り!〜 一日一GAN(๑•̀ㅂ•́)و✧ 〜 - ABEJA Tech Blog
  • CNNで抽出した特徴を使った画像検索 - まんぼう日記

    久しぶりに 研究 カテゴリーの記事 書きます.Convolution Neural Network (CNN) を画像検索に利用する話です. 画像検索(image retrieval または image search)とは,大量の画像を蓄えた「データベース (database)」の中から,検索対象(「クエリ (query)」)の画像に類似した画像を探し出す手続きのことです.ここで考えているのは画像の内容の類似性(人間の感覚的な似てる度合い)に基づく検索なので,より詳しく Content-Based Image Retrieval と言うこともあります.ちなみに,Content-Based じゃない画像検索ってのは,「」とか「白いもふもふ」みたいにキーワードをクエリにするとか,そういう類のやつね. 5年ほど前に Deep な CNN が画像認識で高い性能を示すことが知られるようになって以来

    CNNで抽出した特徴を使った画像検索 - まんぼう日記
  • GAN(Generative Adversarial Networks)を学習させる際の14のテクニック - Qiita

    ※この記事は"How to Train a GAN?" at NIPS2016を、ここを参考にして、私なりに解釈して、重要そうな部分を引用して翻訳したものです。役に立つことが多かったので共有致します。 ※GANの説明は省略します。G=Generator、D=Discriminatorとして説明します。 ※それぞれのテクニックに根拠はあまり書いてないですが、ほとんどが論文に書いてあった「こうすればうまくいった」というものです。GANの学習がうまくいかないときに試してみると良いと思います。 1. 入力を正規化 (Normalize the inputs) ・DのInput(=Gの出力)となる画像を[-1,1]の範囲に正規化する。 ・Gの出力が[-1,1]となるように、OutputのところをTanhにする。 2. GのLoss関数を修正する (A modified loss function)

    GAN(Generative Adversarial Networks)を学習させる際の14のテクニック - Qiita
  • Residual Network(ResNet)の理解とチューニングのベストプラクティス

    Residual Network(ResNet)とは ResNetのアイデア Shortcut Connectionの導入 Bottleneckアーキテクチャ ResNetの最適化ベストプラクティス Optimizerの選定 Batch Normalizationの位置 Post Activation vs Pre Activation Wide Residual Network まとめ 参考 2015年のImageNetコンペティションとCOCOセグメンテーションの最良モデルとしてDeep Residual NetworksがMicrosoft Researchから提案され、最大1000層以上の深いニューラルネットワークを構築することが可能となった。 記事では、 Residual Networkとは何か Residual Networkのチューニング方法 Residual Networ

    Residual Network(ResNet)の理解とチューニングのベストプラクティス
  • Essential Cheat Sheets for Machine Learning and Deep Learning Engineers

    Machine learning is complex. For newbies, starting to learn machine learning can be painful if they don’t have right resources to learn from. Most of the machine learning libraries are difficult to understand and learning curve can be a bit frustrating. I am creating a repository on Github(cheatsheets-ai) containing cheatsheets for different machine learning frameworks, gathered from different sou

    Essential Cheat Sheets for Machine Learning and Deep Learning Engineers
  • 「ラフスケッチの自動線画化」論文を読んでみた - deep moon

    2016 - 05 - 08 「ラフスケッチの自動線画化」論文を読んでみた 機械学習 Deep Learning 画像処理 論文 gigazine.net ちょっと前にネットを賑わわせたこの論文を読んだので、おもしろいなと思ったところをまとめていこうと思います。 まず、この論文にはアプリケーション(応用)として注目すべき点と、それを可能にした技術的なポイントがあるので、それを整理したいと思います。 アプリケーションとして 十分実用的な線画化ができているように見える ユーザーテストで商業ソフトによるものを圧倒 任意のサイズ の ラスター画像 を扱える 既存の線画化技術の多くは ベクター 画像しか扱えない 一般的な画像認識タスクに用いられる CNN では入力サイズが固定されているものが多い 閾値 を手動で設定する必要が ない 商業ソフトのものは 閾値 を手動で調整する必要があった 実時間での処

    「ラフスケッチの自動線画化」論文を読んでみた - deep moon
  • 機械学習で使う指標総まとめ(教師あり学習編) - プロクラシスト

    こんにちは、ほけきよです! 機械学習の基は教師あり学習です。 でも、実際の現場ではいろいろ指標が出てきて「?」 ってなるので、一回気でまとめてみることにしてみました! 教師あり学習の分類 二値分類 用語一覧表 図解 事例 事例1:果物の分類 事例2:ガンかどうかの検査 ROC曲線の意味合い 指標まとめ 多クラス分類 precision, recall, F-measure accuracy logarithm loss 出力が数値(回帰) 用語一覧 二乗誤差(MSE, RMSE)と絶対誤差(MAE)の使い分け AICとBIC, wAICの使い分け 時系列問題 参考になりそうなサイト 教師あり学習の分類 今回は正解はカテゴリか意味を持つ数字かで場合分けをしてみた。 全体の指標のサマリーはこんな感じ(だと思っている。) ※他にも大事な指標があるよ&これは間違っているのでは?? というコメン

    機械学習で使う指標総まとめ(教師あり学習編) - プロクラシスト
  • Applying deep learning to real-world problems

    The rise of artificial intelligence in recent years is grounded in the success of deep learning. Three major drivers caused the breakthrough of (deep) neural networks: the availability of huge amounts of training data, powerful computational infrastructure, and advances in academia. Thereby deep learning systems start to outperform not only classical methods, but also human benchmarks in various t

    Applying deep learning to real-world problems
  • 人工知能学会全国大会に参加した #jsai2017 - Stimulator

    - はじめに - JSAI2017 – 2017年度 人工知能学会全国大会(第31回) に参加した。 今まで学会への参加は学生発表、個人の聴講参加だけだったが、今回は企業ブースでの参加となった。 あまり聴講への参加は出来てないがメモ程度に気になったものをまとめておく。 - 聴講 - 企業ブース出展者での参加では1企業につき2名分のみ聴講証が渡されていたため、6割は会社の犬として自社の説明やステッカー配りなどをしていた。 以下には会社の犬時間以外で聴講し気になった所のみまとめておく。 会社の犬なので、基礎研究より産業応用の部分が多いかもしれない。 05月23日 DNNによるRDF上の単語間の関係の予測を見たかったのだが、部屋に着いた時には質疑だった。 Deep Learning系やチュートリアルセッションはどこも激混みで、大変であった。 DNN圧縮時のパラメータと圧縮後の精度, 大きさの関係

    人工知能学会全国大会に参加した #jsai2017 - Stimulator
  • シモセラ エドガー Siameseネットワークモデルを用いた画像特徴量抽出

    Siameseネットワークモデルを効率的に学習させることで、 ロバストな画像特徴量を計算する手法を提案する。 提案手法では、モデルに2つの画像パッチを入力し、出力された特徴量の誤差によってモデルを学習させる。 また、入力するパッチをその識別の難しさによって分類し、識別が困難なパッチを優先的に学習させることで、SIFT特徴量よりもロバストな特徴量の抽出を実現した。 Our approach consists in training a Convolutional Neural Network (CNN) to build a feature representation of an image patch. We train by using two patches simultaneously that should either correspond to the same point

    シモセラ エドガー Siameseネットワークモデルを用いた画像特徴量抽出
  • Convolutional Methods for Text

    tl;drRNNS work great for text but convolutions can do it fasterAny part of a sentence can influence the semantics of a word. For that reason we want our network to see the entire input at onceGetting that big a receptive can make gradients vanish and our networks failWe can solve the vanishing gradient problem with DenseNets or Dilated ConvolutionsSometimes we need to generate text. We can use “de

    Convolutional Methods for Text
  • Deep Furiganaを機械学習で自動でふる - にほんごのれんしゅう

    Deep Furiganaを機械学習で自動でふる 注:今回、JSAI2017において、立命館大学の学生が発表した論文が、一部の小説家の方々の批判を浴びたそうですが、この内容はgithubにて炎上前から管理されていたプロジェクトであり、無関係です。 Deep Furiganaは、日語の漢字に特殊な読み方を割り当てて、中二心をくすぐるものです 特殊な読み方(発音でなく文脈的な表現を表している)とすることが多く、外国人にとって日語の学習の障害になっているということです。 図1. Fate Grand Orderのアルテラの場面、生命と文明を(おまえたち)と呼ばせる つまりどういうことなのか Deep Furiganaがある文脈の前後にて、生命と、文明と、おまえたちは、同等の意味を持っていると考えられます。 意味が等しいか、近しい中二っぽい単語をDeepFuriganaとして適応すればよいとい

    Deep Furiganaを機械学習で自動でふる - にほんごのれんしゅう
  • GitHub - reiinakano/xcessiv: A web-based application for quick, scalable, and automated hyperparameter tuning and stacked ensembling in Python.

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - reiinakano/xcessiv: A web-based application for quick, scalable, and automated hyperparameter tuning and stacked ensembling in Python.
  • 脳活動パターンから知覚している任意の物体を解読する方法 - 京大とATR

    京都大学(京大)は5月22日、ヒトの脳活動パターンを深層ニューラルネットワークなどの人工知能モデルの信号に変換して利用することで、見ている画像に含まれる物体や想像している物体を脳から解読する技術の開発に成功したと発表した。 同成果は、国際電気通信基礎技術研究所(ATR)脳情報総合通信研究所神経情報学研究室 神谷之康客員室長(京都大学情報学研究科教授)、堀川友慈主任研究員らの研究グループによるもので、5月22日付けの英国科学誌「Nature Communications」に掲載された。 同研究グループはこれまでに、機能的磁気共鳴画像法(fMRI)などにより計測されるヒトの脳活動パターンを、機械学習によるパターン認識で解析することで心の状態を解読する「ブレインデコーディング」と呼ばれる技術を開発してきた。しかし、脳活動からそのときに見ている物体を解読する従来の方法では、あらかじめ脳活動を計測し

    脳活動パターンから知覚している任意の物体を解読する方法 - 京大とATR
  • An Interactive Tutorial on Numerical Optimization

    Numerical Optimization is one of the central techniques in Machine Learning. For many problems it is hard to figure out the best solution directly, but it is relatively easy to set up a loss function that measures how good a solution is - and then minimize the parameters of that function to find the solution. I ended up writing a bunch of numerical optimization routines back when I was first tryin

    An Interactive Tutorial on Numerical Optimization
  • Practical Deep Learning for Coders - Practical Deep Learning

    A free course designed for people with some coding experience, who want to learn how to apply deep learning and machine learning to practical problems. This free course is designed for people (and bunnies!) with some coding experience who want to learn how to apply deep learning and machine learning to practical problems. Deep learning can do all kinds of amazing things. For instance, all illustra

    Practical Deep Learning for Coders - Practical Deep Learning