Private content!This content has been marked as private by the uploader.
memo.sugyan.com の続編。 あれから色々な変更しつつ実験してみたりしたのでその記録。 結論を先に書くと、これくらい改善した。 DCGAN ざっくりおさらい Generator: 乱数の入力から画像を生成する Discriminator: 入力した画像がGeneratorが生成したものか学習データのものかを判別する という2種類のネットワークを用意し、お互いを騙す・見破るように学習を行うことで Generatorが学習データそっくりの画像を生成できるようになる、というもの 学習用画像の増加 前回の記事では90人の顔画像データから生成していたけど、あれから収集を続けて もう少し多く集まったので、今回は260人から集めた顔画像100点ずつ、計26,000件を学習に使用した。 Feature matching openai.com の記事で紹介されている "Improved Tech
Ziyi Lin, Chris Liu, Renrui Zhang, Peng Gao, Longtian Qiu, Han Xiao, Han Qiu, Chen Lin, Wenqi Shao, Keqin Chen, Jiaming Han, Siyuan Huang, Yichi Zhang, Xuming He, Hongsheng Li, Yu Qiao
MIRU2016 でのチュートリアル講演のスライドです。深層学習フレームワークの一般的な構成から、Chainer の解説、深層学習における OSS 開発の例と学生・研究者がそこにどのように関わっていくかについて書いています。Read less
Introduction Content-aware fill is a powerful tool designers and photographers use to fill in unwanted or missing parts of images. Image completion and inpainting are closely related technologies used to fill in missing or corrupted parts of images. There are many ways to do content-aware fill, image completion, and inpainting. In this blog post, I present Raymond Yeh and Chen Chen et al.’s paper
はじめにこんにちは。データ分析チーム・入社1年目のルーキー、小池です。 データ分析チームでは、画像処理・自然言語処理など様々な分野に取り組んでおり、機械学習や多変量解析を用いたデータの分析を行っています。 そんな中で私は機械学習・Deep Learningによる画像処理系の分析を行っています。 本記事では、私達の取り組みの一部をご紹介すると同時に、画像分析の面白さを体感していただければと思います。 今回のテーマ今回のテーマは、AI(機械学習・Deep Learning等)を用いて、 大量にある顔画像の中から同一人物をクラスタリングし、頻出する顔画像の抽出 を行いたいと思います。 簡単に言うと、 たくさんある画像から同じ人を見つけること を機械(AI)にやらせるということです。 目的「たくさんある画像から同じ人を見るけること」ができれば、以下1~3の流れで、店舗に来るお客さんが常連さんか否か
ここ1年くらいDeep Learning Tutorialを読みながらTheanoというライブラリで深層学習のアルゴリズムを実装してきた。 深層学習の基本的なアルゴリズムならTheanoでガリガリ書くこともできたがより高度なアルゴリズムをTheanoでスクラッチから書くのはとてもきつい*1。 そんなわけでPylearn2、Lasagne、nolearnなどのTheanoベースのラッパーライブラリをいろいろ調べていたのだが、結局のところKerasというライブラリが一番よさげだと思った。KerasはバックエンドとしてTheanoとTensorflowの両方が使え、より高レイヤな表現(たぶんChainerと同レベル)で深層学習のさまざまなアルゴリズムが記述できる。TheanoやTensorflowは完全に隠蔽されており、Kerasで書かれたプログラムはまったく修正せずにTheanoとTensor
Part of Understanding Hinton’s Capsule Networks Series:Part I: Intuition (you are reading it now) Part II: How Capsules Work Part III: Dynamic Routing Between Capsules Part IV: CapsNet Architecture Quick announcement about our new publication AI³. We are getting the best writers together to talk about the Theory, Practice, and Business of AI and machine learning. Follow it to stay up to date on th
最終更新: 2016/03/22 親子関係やコメント等は厳密なものではありません。詳しくは、リンク先でご確認下さい。 waifu2x http://ultraist.hatenablog.com/entry/2015/05/17/183436 https://github.com/nagadomi/waifu2x 作者: ultraist (@ultraistter) 本家。 ウェブサービス有。 計算に高性能サーバが必要なので、割安な使用料が時価のサービスを利用している。サーバの利用者が一時的に急増して使用料が跳ね上がると、サービスが一時停止することがある。 繋がらなくなったら、大体これが原因。数時間 - 数日待つか、下記のソフトウェアのいずれかをダウンロードして自分の環境で使いましょう。 (Windows 64bitかつGPUがnVidia製なら、Waifu2x-caffe。それ以外の環
うまくできましたか? ボヤけたり、ギザギザになったりしませんでしたか? waifu2xをお試しください。 (ブラウザの処理に影響されないようクリックで拡大おねがいします) waifu2xは、二次元画像を2倍に拡大するソフトウェアです。多くの二次元画像についてスゴイ級のクオリティで拡大できます。 waifu2xは、最新鋭の人工知能技術 Deep Convolutional Neural Networks を使って開発されました。 waifu2xの人工知能は、次の問に答えます。 いまから与える画像はある画像を半分に縮小したものである。縮小される前の画像を求めよ。 画像を拡大するのではなく、縮小される前の状態に戻します。 縮小されてないオリジナル画像を与えた場合も、やはり縮小される前の画像を答えます。 その画像は本来存在しないものですが、waifu2xはそれを想像で創ります。 二次元画像のJPE
ICCV 2017 ( http://iccv2017.thecvf.com/ )の参加速報を書きました。合計で約160ページあります。 この資料には下記の項目が含まれています。 ・DNNの概要(DNN以前の歴史や最近の動向) ・ICCV 2017での動向や気付き ・これから引用されそう(流行りそう)な論文 ・フォーカスすべき研究分野 ・今後の方針 ・論文まとめ(約90本あります) cvpaper.challengeはコンピュータビジョン分野の「今」を映す挑戦です。論文読破・まとめ・アイディア考案・議論・実装・論文執筆(・社会実装)に至るまで広く取り組み、あらゆる知識を共有します。 https://sites.google.com/site/cvpaperchallenge/Read less
Copy<!-- Typekit: Update the link below with your Typekit ID --> <link rel="stylesheet" href="https://use.typekit.net/gnx8fcu.css"> <!-- Add your analytics script here --> <!-- I use Fathom, it’s a great alternative to Google Analytics with a minimal dashboard and a focus on privacy. Please consider using my referral link when creating an account: https://usefathom.com/ref/CSKBJR --> <!-- Favicon:
Welcome. I am a mathematician and a physicist, and the chief scientist and a cofounder of Nutrino. I work in a number of scientific areas, primarily on deep learning and AI, general relativity, integrable systems, partial differential equations, and the foundations of quantum theory. I am particularly fascinated by the problem of radiation reaction. I love applications of mathematics to everyday l
Piano-midi.de: classical piano pieces (http://www.piano-midi.de/) Nottingham : over 1000 folk tunes (http://abc.sourceforge.net/NMD/) MuseData: electronic library of classical music scores (http://musedata.stanford.edu/) JSB Chorales: set of four-part harmonized chorales (http://www.jsbchorales.net/index.shtml) FMA: A Dataset For Music Analysis (https://github.com/mdeff/fma) Natural Images MNIST:
ニューラルネットワークと深層学習 What this book is about On the exercises and problems ニューラルネットワークを用いた手書き文字認識 逆伝播の仕組み ニューラルネットワークの学習の改善 ニューラルネットワークが任意の関数を表現できることの視覚的証明 ニューラルネットワークを訓練するのはなぜ難しいのか 深層学習 Appendix: 知性のある シンプルな アルゴリズムはあるか? Acknowledgements Frequently Asked Questions Sponsors Resources 「ニューラルネットワークと深層学習」は無料のオンライン書籍です。 この本では、次のような内容を扱います。 ニューラルネットワーク:コンピュータに、観測データにもとづいて学習する能力を与える、生物学にヒントを得たプログラミングパラダイム。 深
by Sony An open source software to make research, development and implementation of neural network more efficient. Get Started Features Write less do more Neural Network Libraries allows you to define a computation graph (neural network) intuitively with less amount of code. Dynamic computation graph support Dynamic computation graph used enables flexible runtime network construction. The Library
ソニーの最先端R&D、そのウラ側に迫る! 若きエンジニアが生み出す機械学習フレームワークの価値 圧倒的スピードで浸透しつつある、機械学習。この分野にソニーが満を持して投入したOSSの背後には、ある若手エンジニアの活躍がありました。ソニーの最先端R&Dの裏側に迫ります。 いま、機械学習がすさまじいスピードで浸透しつつあります。 Chainer、Keras、TensorFlowといった、機械学習のためのフレームワークが続々とリリースされ活用されていることも、もちろん無関係ではありません。 そして、2017年6月、ソニーからオープンソースソフトウェア(OSS)として機械学習フレームワーク「Neural Network Libraries」が公開されました。動的グラフ機能というディープラーニングの最新トレンドを取り入れながら、電子機器などに組み込む使い方にも対応しやすい作りがこのフレームワークの特
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く