CVPR2018にて超解像分野において極めて重要そうだなと感じた論文がありました。Yochai Blauらによる下記の論文です。 [1711.06077] The Perception-Distortion Tradeoff この内容を踏まえて最近の超解像研究の流れをまとめたいと思います。 超解像とは? 超解像について振り返ります。多くの方がwaifu2xというソフトウェアで一度は目にしたことがあるかもしれません。下記イメージのように低解像の画像を高解像の画像に変換する方法を 超解像(Super Resolution)と呼ばれます。 (参照元:二次元画像を拡大したいと思ったことはありませんか? - デー) このwaifu2xがざっくりどのように超解像を行っているかというと、ベースはSRCNNというConvolutional Neural Netoworkを使った超解像手法であり、下記のよう
2000年代にニューラルネットワークの研究が再び活発になりました。現在、ディープラーニングは近代的な機械学習の道を切り開いている非常に活発な研究領域となっています。Google、Microsoft、Facebookなどの企業では、社内のディープラーニングチームが急成長しています。しかし、多くの人にとってディープラーニングはまだまだとても複雑で困難な課題です。本書ではサンプルのPython 3プログラムと簡潔な説明を通してこの複雑な分野の主要な概念を紹介します。微積分、行列演算、Pythonの基礎があれば誰でも本書を始めることができます。 監訳者まえがき まえがき 1章 ニューラルネットワーク 1.1 知的な機械を作るということ 1.2 従来のプログラムの限界 1.3 機械学習のしくみ 1.4 ニューロン 1.5 線形パーセプトロンをニューロンとして表現する 1.6 フィードフォワードニュー
(注:2017/04/08、いただいたフィードバックを元に翻訳を修正いたしました。 @liaoyuanw ) この記事は、私の著書 『Deep Learning with Python(Pythonを使ったディープラーニング)』 (Manning Publications刊)の第9章2部を編集したものです。現状のディープラーニングの限界とその将来に関する2つのシリーズ記事の一部です。 既にディープラーニングに深く親しんでいる人を対象にしています(例:著書の1章から8章を読んだ人)。読者に相当の予備知識があるものと想定して書かれたものです。 ディープラーニング: 幾何学的観察 ディープラーニングに関して何より驚かされるのは、そのシンプルさです。10年前は、機械認識の問題において、勾配降下法で訓練したシンプルなパラメトリックモデルを使い、これほど見事な結果に到達するなど誰も想像しませんでした。
プロジェクトの忙しい時期やら体調不良やら子供の保育園入園やらでマジで追いかけられていないけどこのまとめから辿っていけば良さそう。自分の勉強用にあとでまとめてみる / Highlights from TensorFlow Developer Summit, 2018 https://t.co/M6eNfflHZO— norihiro shimoda (@rindai87) 2018年4月3日 ということで、こちらをもとにした完全に自分用のメモ集みたいな感じです。まあ言ってみればただのリンク集なので、元ブログと情報量に大差はありませんのでご注意を。 medium.com 最初にやったほうがいいこと $ pip install --upgrade tensorflow とかやって、TensorFlowのバージョンを1.7まであげておきます。 Installing TensorFlow | T
技術開発の進展により加速度的に進化しているAI(人工知能)。このAIという言葉とともに語られているのが、機械学習やディープラーニングだ。AIと機械学習、そしてディープラーニングの違いとは何なのか。 1.はじめに 最近、ニュースや書籍などでAIという言葉を見聞きすることが多い。人手不足の救世主のように扱われたり、人の仕事を奪う悪魔のように書かれるが、その実体はいまひとつ分かりにくい。ましてや、自分の携わっている仕事に対して、具体的に何をしてくれるのかが分からないという声をよく聞く。 もう1つややこしいのは、その呼び名である。AI、機械学習、ディープラーニング、それぞれが何のことなのか、どんな関係なのか不明なまま、なんとなく人に聞けなくて腑に落ちない。この記事では機械学習を中心に、その実体を説明したい。 2.AIとは AIとはArtificial Intelligenceの略、日本語にすれば人
この投稿は米国時間 3 月 26 日に投稿されたもの(投稿はこちら)の抄訳です。 Posted by Google Cloud デベロッパー アドボケイト 佐藤一憲 この 3 つのラーメンは、41 店舗あるラーメン二郎のうち 3 店舗で作られたものです。それぞれ、どの店舗で出されたものか分かりますか? データ サイエンティストの土井賢治さんが作成した機械学習(ML)によるラーメン識別器を使えば、それぞれの微妙な盛り付けの違いを見分けることで、95% の精度で店舗を特定できます。 この写真を見ても分かるとおり、ラーメン二郎の相当コアなファンでもなければ、ラーメン画像から 41 店舗のどこで作られたかを見分けることは簡単ではありません。テーブルやどんぶりの色、形にあまり違いのない場合が多いのです。 土井さんは、ディープ ラーニングを使ってこの問題を解けるか興味を持ち、インターネット上から 48
やりたいこと ディープラーニングで日経平均を予測したい 簡単にディープラーニングを体験したい 方法 ディープラーニングの手法は、時系列データの取扱に優れたLSTMを使用 コードが簡単な、TensorFlow + Kerasで実装 環境 Windows 10 64bit TensorFlow + Keras 環境構築はこちら→ Windowsで簡単にAI開発の環境構築<人工知能を体験したい人向け> ディープラーニングの実装 日経平均株価のデータ取得 ダウンロードセンターより、日経平均株価のCSVをダウンロード https://indexes.nikkei.co.jp/nkave/index?type=download そのままではデータを取り込めなかったので、前処理として下記の処理を行う - 1行目は、date, close, open, high, low と書き換える - 最終行の日本語
スマートフォンやパソコンを使用していて、Googleマップを使用したことがない、という人は少ないだろう。行ったことが無い場所に行く際に、インターネットで「〇〇から△△」などと検索すると、ほとんどの場合にはGoogleマップでの検索結果が上位に表示される。 実はこのGoogleマップでは、機械学習を活用し、住所、建物の名称などの地理情報がない国のマップも作成可能だという。その方法についてGoogleは3月9日、「現場で役立つ機械学習」と題し、六本木の同社オフィスにてメディアセミナーを開催。Googleマップのソフトウェアエンジニアであるアンドリュー・ルッキングビル氏による説明が行われた。 機械学習で、地図をつくる 地理情報のない国での情報を、どう得るのか? ここでは、ストリートビューの画像がカギとなる。設置されている看板などの地理的情報をもつ画像から、情報を自動的に抽出するのだ。 これまでの
NECは、スーパーやコンビニなどの小売店で、決済時に必要な商品読み取りを大幅に効率化する技術として、生鮮品や日配品から、パッケージ品まで、あらゆる小売商品を画像認識する多種物体認識技術を開発しました。本技術は小売店での決済無人化に貢献する技術です。 本技術は、特性の異なるディープラーニング技術と特徴点マッチング技術を融合させることで、生鮮品のように個体ごとに外観の違いが大きい自然物から、パッケージ品のように酷似したデザインが大量にある工業製品まで、多種多様な小売商品を高精度に認識します。さらに、これら多数の商品を雑然と置いても、一括して個々の商品を頑健に認識します。 近年、画像認識技術を用いてカメラから小売商品そのものを認識することで、小売店の決済を省力化・無人化する取り組みが進められています。しかし従来の画像認識技術では、生鮮品などの自然物と、パッケージ品などの工業製品では、特性が異なる
1. The document presents a method for deep learning using variational autoencoders that model the relationship between pairs of data points (x1, x2). 2. It introduces variables to represent latent vectors z and z~ that are used to generate x1 and x2, as well as a subset S of dimensions that relate x1 and x2. 3. The method works by training an encoder qφ(z|x) to approximate a prior p(z) and maximiz
目次 (背景)自分の声を結月ゆかりにしたい。前回はあまりクオリティが良くなかったので、手法を変えて質を上げたい。 (手法)声質変換を、低音質変換と高音質化の二段階に分けてそれぞれ学習させた。画像分野で有名なモデルを使った。 (結果)性能が飛躍的に向上し、かなり聞き取れるものになった。 (考察)精度はまだ改善の余地があり、多対多声質変換にすることで精度が向上すると考えられる。今回の結果を論文化したい。 デモ動画 背景多くの人が可愛い女の子になりたいと思っている。 CG技術やモーションキャプチャ技術の向上により、姿は女の子に仮想化できるようになってきた。 しかし、声に関してはまだまだ課題が多い。 声質変換は「遅延」「音質」「複数話者」などの難しい課題がある。 今回は、自分の声を結月ゆかりにするための、低遅延で実現可能な高音質声質変換を目指した。 手法大きく分けて3つの工夫をした。 画像ディープ
今年の目標(2018/1/1)で宣言したとおり今年はPyTorchを使えるようにしていこうと思ってます! ここにPyTorchのリソースをまとめる予定です。一気に追加すると収拾つかないため内容を吟味してから追加してこうと思います。外部リンク集の2つのサイトはPyTorchに関するチュートリアルや論文の再現実装など大量のリソースがまとまっていてとてもおすすめです。あと公式のチュートリアルはとてもしっかり書かれていて勉強になります。こちらもおすすめ。 PyTorch - 本家 PyTorch Forums - 本家フォーラム PyTorch Official Tutorials - 本家のチュートリアル PyTorch Official Examples - さまざまな実装例 外部リンク集 The Incredible Pytorch - チュートリアルから各種アルゴリズムの実装まで大量に紹介
深層学習の今のところの限界「何ができて、何ができないか?」 2018.01.08 Updated by Ryo Shimizu on January 8, 2018, 08:29 am JST あけましておめでとうございます。 先日、MIT Technology Reviewにこのような記事が掲載されていました。 深層学習の過大評価は危険、ウーバーAI研究所の前所長が指摘 この論文を発表したのはニューヨーク大学の心理学者のゲイリー・マーカス教授。心理学者ということで、我々情報工学の立場とはまた違う立場で深層学習にできることとできないことを分離しています。 筆者はこのニュースを見て最初は反発したのですが、原文を読んでみると現状のディープラーニングの課題についてよくまとまっているのではないかと思いましたので紹介します。原文はこちら ■ディープラーニングの限界 マーカス教授によると、ディープラー
Eureka EngineeringLearn about Eureka’s engineering efforts, product developments and more.
Optimization for Deep Learning Highlights in 2017 Different gradient descent optimization algorithms have been proposed in recent years but Adam is still most commonly used. This post discusses the most exciting highlights and most promising recent approaches that may shape the way we will optimize our models in the future. This post discusses the most exciting highlights and most promising direct
AI(人工知能)に関わる技術、なかでもディープラーニングが急速に発達し、社会のさまざまな領域で実際に利用されるようになりました。その背景のひとつには、AI分野での研究開発に多大な投資を行っている大手IT企業が、その成果の一部をオープンソースとして公開し、世界中のエンジニアが自由に使えるようになったことがあります。 こうしたオープンソースのAI関連ライブラリには、Googleの「TensorFlow」やFacebookの「Torch」といった海外のIT企業のものだけでなく、国内にもPreferred Networksの「Chainer」やソニーの「Neural Network Libraries」などがあります。最近では、関連した情報も数多く手に入るようになりました。 また、これらのライブラリの多くには親切なチュートリアルも用意されており、AIの開発経験がないエンジニアでもさほど手間を掛ける
タイトルの通り、3DGANのchainer実装をgithubに上げた。当初はkerasで書いていたが良い結果が得られず、ソースコードの間違い探しをするモチベーションが下がってきたので、思い切ってchainerで書き直した。 github.com 実はmnistなどのサンプルレベルのものを超えてちゃんとディープラーニングでタスクに取り組むのは今回が初めてだった。Chainerによるgan実装自体は公式のexampleやchainer-gan-libが非常に参考になった。 モデル 3DGANはその名の通り3Dモデルを生成するためのGAN。[1610.07584] Learning a Probabilistic Latent Space of Object Shapes via 3D Generative-Adversarial Modelingで提案されているもの。前回の記事でも触れた。 構
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く