タグ

ブックマーク / deepage.net (7)

  • 高次元のデータを可視化するt-SNEの効果的な使い方

    t-SNEは、高次元のデータを可視化する手法としては、非常に便利ですが、時々不可解な挙動をしたり、誤解を招くような可視化をすることがあります。 シンプルなデータを可視化して動作の仕組みを理解することで、t-SNEのより効果的な使い方を学ぶことができます。 t-SNEは、高次元のデータを調査するための手法として、2008年にvan der MaatenとHintonによって発表 [1] された人気の手法です。 この技術は、数百または数千次元のデータですら無理やり2次元の「マップ」に落とし込むという、ほとんど魔法のような能力を備えているために、機械学習の分野で幅広く普及しています。 このような印象を持っている方が多いのですが、こういった捉え方をしていると誤解を招くこともあります。 この記事の目的は、よくある共通の誤解を解くためでもあります。 t-SNEで可視化できることと、できないことを説明す

    高次元のデータを可視化するt-SNEの効果的な使い方
    endor
    endor 2019/05/07
  • オートエンコーダ:抽象的な特徴を自己学習するディープラーニングの人気者

    オートエンコーダ(自己符号化器)とは何か オートエンコーダ(AutoEncoder) ニューラルネットワークの歴史 誤差逆伝播での勾配消失を防ぐ オートエンコーダは大成功だったか 生成モデルとオートエンコーダ Variational Autoencoder まとめ ディープラーニングが盛んに研究され、実用化されはじめている。Google認識やAlphaGoがプロの囲碁棋士イ・セドル氏を打ち負かしたことは大きな話題を呼んだ。GoogleのプロダクトでもレコメンドやGoogle Photoの画像認識など、その役割は凄まじいものがある。 ディープラーニングの幕開けは2006年にHinton氏がDeep AutoEncoderやDeep Belief Networkを提案してからだと言われている。 また、ディープラーニングの紹介のされ方でよくあるのが ディープラーニングを使うことで、コンピュー

    オートエンコーダ:抽象的な特徴を自己学習するディープラーニングの人気者
    endor
    endor 2019/04/23
  • レコメンドに浸透していくDeep Learning: 大手サービスの実用例から最新アルゴリズムを概観する

    レコメンドに浸透していくDeep Learning: 大手サービスの実用例から最新アルゴリズムを概観する
  • あらゆるデータを可視化するTensorBoard徹底入門

    TensorBoardの主要機能 折れ線グラフ 画像 音声 ヒストグラム 計算グラフ 次元削減のプロット TensorBoardの読み方 シンボルの意味 name scopeとnode グラフの色 Structure View Device View 計算時間・メモリ テンソルの次元数 Summary Operation scalar histogram image audio 可視化してみる ハイパーパラメータの探索 Embedding Visualization メタデータファイルの作り方 スプライト画像の作り方 ラベルによる色分け t-SNEとPCA まとめ TensorFlowの優れた機能として、TensorBoardによる充実した可視化環境が挙げられます。TensorBoardがあれば、ニューラルネットワークの学習が上手くいかないときに、俯瞰してネットワークを表示したり、様々なデ

    あらゆるデータを可視化するTensorBoard徹底入門
  • Pandasでヒストグラムの作成や頻度を出力する方法

    ヒストグラムを作成するhist関数 基数の数を変更する (bins) ラベルを元にヒストグラムを作成する by 非数値データの頻度をヒストグラムで表示する まとめ 参考 Pandasにもヒストグラムを作成する関数hist()が存在します。この関数は値を表示するのではなく、ヒストグラムをmatplotlibを使ってプロットします。単純に頻度の数値データが欲しい場合はvalues_counts関数が便利な関数です。 記事では ヒストグラムの作成の仕方 value_counts関数を使った非数値データの頻度の出力方法 について解説します。 今回扱うサンプルデータはKaggleのチュートリアルからとってきたものです。 Titanic - Kaggle ここのtrain.csvという名前のファイルを使います。 (ダウンロードするためにはユーザー登録が必要ですが簡単なものなのでしておくことをお勧めし

    Pandasでヒストグラムの作成や頻度を出力する方法
    endor
    endor 2019/04/15
  • Residual Network(ResNet)の理解とチューニングのベストプラクティス

    Residual Network(ResNet)とは ResNetのアイデア Shortcut Connectionの導入 Bottleneckアーキテクチャ ResNetの最適化ベストプラクティス Optimizerの選定 Batch Normalizationの位置 Post Activation vs Pre Activation Wide Residual Network まとめ 参考 2015年のImageNetコンペティションとCOCOセグメンテーションの最良モデルとしてDeep Residual NetworksがMicrosoft Researchから提案され、最大1000層以上の深いニューラルネットワークを構築することが可能となった。 記事では、 Residual Networkとは何か Residual Networkのチューニング方法 Residual Networ

    Residual Network(ResNet)の理解とチューニングのベストプラクティス
  • RNNでプログラミング言語の構文エラーを自動修復する衝撃

    コンパイルエラーの問題点 DeepFix Iterative Repair まとめ 参考文献 プログラミング言語のコンパイルエラーを自動で検知して修復することができたら、プログラマの作業時間を減らせる可能性があります。もしくは、テキストエディタがプログラムを書いている最中に、エラーだろうと思われる構文を見つけたときにさり気なく教えてくれたら生産性が著しく向上することも考えられます。 “Software is eating the world.“という言葉は、マーク・アンドリーセンの提唱した言葉です。まだまだ「い尽くす」ほどではないものの、徐々にその影響力は高まっていると感じます。ソフトウェアを開発する必要性が増すにつれて、ソフトウェアエンジニアも次第に求められていくことでしょう。そして、そのプログラマの仕事の大部分はデバッグに費やされます。 バグや構文エラーを自動検知するシステムがテキス

    RNNでプログラミング言語の構文エラーを自動修復する衝撃
    endor
    endor 2017/06/15
  • 1