タグ

ブックマーク / qiita.com/kenmatsu4 (9)

  • 【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita

    %matplotlib inline import matplotlib.pyplot as plt import matplotlib.cm as cm import numpy as np import seaborn as sns import numpy.random as rd m = 10 s = 3 min_x = m-4*s max_x = m+4*s x = np.linspace(min_x, max_x, 201) y = (1/np.sqrt(2*np.pi*s**2))*np.exp(-0.5*(x-m)**2/s**2) plt.figure(figsize=(8,5)) plt.xlim(min_x, max_x) plt.ylim(0,max(y)*1.1) plt.plot(x,y) plt.show() この図は、平均$\mu$、標準偏差$\sigma$

    【統計学】尤度って何?をグラフィカルに説明してみる。 - Qiita
  • 【ディープラーニング】ChainerでAutoencoderを試して結果を可視化してみる。 - Qiita

    ChainerでAutoencoderを試してみる記事です。前回の記事、「【機械学習】ディープラーニング フレームワークChainerを試しながら解説してみる。」の続きとなります。ディープラーニングの事前学習にも使われる技術ですね。 記事で使用したコードはコチラから取得できます。 1.最初に AutoencoderとはAuto(自己) encode(符号化)er(器)で、データを2層のニューラルネットに通して、自分自身のデータと一致する出力がされるようパラメーターを学習させるものです。データだけあれば良いので、分類的には教師なし学習になります。 学習フェーズ こんなことをして何が嬉しいのかというと、 入力に合わせたパラメーター$w_{ji}$を設定できる。(入力データの特徴を抽出できる) その入力に合わせたパラメーターを使うことでディープなニューラルネットでの学習を可能にする(ランダム値

    【ディープラーニング】ChainerでAutoencoderを試して結果を可視化してみる。 - Qiita
  • 【機械学習】ディープラーニング フレームワークChainerを試しながら解説してみる。 - Qiita

    今話題のDeep Learning(深層学習)フレームワーク、Chainerに手書き文字の判別を行うサンプルコードがあります。こちらを使って内容を少し解説する記事を書いてみたいと思います。 (記事のコードの全文をGitHubにアップしました。[PC推奨]) とにかく、インストールがすごく簡単かつ、Pythonが書ければすぐに使うことができておすすめです! Pythonに閉じてコードが書けるのもすごくいいですよね。 こんな感じのニューラルネットワークモデルを試してみる、という記事です。 主要な情報はこちらにあります。 Chainerのメインサイト ChainerのGitHubリポジトリ Chainerのチュートリアルとリファレンス #1. インストール# まずは何はともあれインストールです。ChainerのGitHubに記載の"Requirements" ( https://github.

    【機械学習】ディープラーニング フレームワークChainerを試しながら解説してみる。 - Qiita
  • ROC曲線とは何か、アニメーションで理解する。 - Qiita

    統計学、パターン認識等で、ROC(Receiver Operating Characteristic;受信者動作特性)曲線という概念が出てきます。また、データ分析・予測のコンペティションサイトKaggleでも、提出されたアルゴリズムの識別性能評価にこのROC曲線に基づくAUC(Area Under the Curve)というものを使っています。(例えばココ) このROC曲線、ちょっとわかりにくいので、まとめてみました。また、アニメーションでグラフを動かしてイメージを付けるということもやってみます。 1. ROC曲線に至る前説 まず、例として健康に関するとある検査数値データがあったとします。 この検査数値は健康な人は平均25, 標準偏差2の正規分布に従い分布しています。(下記図の緑の曲線) 病気の人は平均30、標準偏差4の正規分布に従い分布しています。(下記の図の青の曲線) グラフにすると下

    ROC曲線とは何か、アニメーションで理解する。 - Qiita
  • スタバTwitterデータ位置情報のビジュアライゼーションと分析 - Qiita

    スタバTwitterシリーズの第4回目です。 今回は、tweetデータに含まれる位置情報を処理してみたいと思います! その1:Twitter REST APIsでデータを取り込みmongoDBにインポート http://qiita.com/kenmatsu4/items/23768cbe32fe381d54a2 その2:取得したTwitterデータからスパムの分離 http://qiita.com/kenmatsu4/items/8d88e0992ca6e443f446 その3:ある日を境にツイート数が増えたわけは? http://qiita.com/kenmatsu4/items/02034e5688cc186f224b その4:Twitterにひそむ位置情報の視覚化(今回) http://qiita.com/kenmatsu4/items/114f3cff815aa5037535 <<

    スタバTwitterデータ位置情報のビジュアライゼーションと分析 - Qiita
  • 確率的勾配降下法とは何か、をPythonで動かして解説する - Qiita

    勾配降下法は何に使う? 勾配降下法は統計学や機械学習で多く使われています。特に機械学習というのは基的に何かしらの関数を最小化(最大化)する問題を数値解析的に解くことに帰結する場合が多いです。(e.g. 最小二乗法 → 誤差の二乗和を最小化(参考)、ニューラルネットワークのパラメータ決定 etc...) なので、基的にはひたすら微分して0となるところを探す問題ですね、微分して0。で、その微分して0となる値は何か、をプログラムで解く場合に重要になるのがこの勾配降下法です。幾つか勾配法にも種類がありますがここでは最急降下法、確率的勾配降下法の2つを扱います。まずはイメージをつかむために1次元のグラフで確認していきたいと思います。 1次元の場合 1次元の場合は、確率的という概念はなく、ただの勾配降下法になります。 (どういうことか、はのちほど) 1次元の例は、正規分布をマイナスにしたものを使っ

    確率的勾配降下法とは何か、をPythonで動かして解説する - Qiita
  • [python] 乱数生成 備忘録 - Qiita

    いつも乱数を生成しようとすると、どの関数を使えば良いか思い出せないので、使用頻度の高そうな乱数生成関数を備忘録としてまとめました。 特に後半の各種確率分布から生成される乱数はグラフとイメージを併記しているので、確率分布自体の理解にも役立つと思います。特にカイ二乗分布は自分も昔イメージがわかなくて悩んだので直感的にわかるよう説明をしてみました。 以下、下記のライブラリをimportしている前提で記載します。 import numpy as np import numpy.random as rd import scipy.stats as st import matplotlib.pyplot as plt

    [python] 乱数生成 備忘録 - Qiita
  • 主成分分析PCAを用いて手書き数字を分析する。その2 - Qiita

    昨日の記事に引き続きPCAを使っていきたいと思います。LDAの説明をする予定だったのですが、ちょっと予定を変えて今日もPCAのみです。 カオスの中に... 43000個の手書き数字データをPCAで2次元に落としてグラフにしたのが下記です。 手書き文字784次元を2次元に落とすという無茶な分析をした結果のグラフがこれですね。"1"とか"0"とかはわりと分離できているのですが、"2","3","5","6","8"で1つグループ、"4","7","9"でもう1つのグループとして重なっちゃっていますね。。。特に上のグラフはカオスです。。。 でも、2次元から30次元ぐらいまで主成分を増やすと積寄与率が0.731と7割を超えるので、意外と良い結果にるんじゃないかなという予感がします。 寄与率を出すpythonコードはこちら。ライブラリを使うと簡単ですね^^ n_comp = 30 pca = dec

    主成分分析PCAを用いて手書き数字を分析する。その2 - Qiita
  • 主成分分析PCAを用いて手書き数字を分析する。その1 - Qiita

    始めに 手書き数字を分析するのもなんだかシリーズ化してきましたが、今回は主成分分析(PCA:Principal Component Analysis)とその教師ありバージョンとも呼べる線形判別分析(LDA:Linear Discriminant Analysis)をつかって分析をしてみたいと思います。python機械学習ライブラリscikit-learnを使っています。 【過去の手書き数字データ分析記事】 手書き数字をpythonでもてあそぶ その1 手書き数字をpythonでもてあそぶ その2(識別する) 【機械学習】k-nearest neighbor method(k最近傍法)を自力でpythonで書いて、手書き数字の認識をする 主成分分析 (PCA) まずは主成分分析からです。基的には複数あるデータの要素をまとめて、いわゆる主成分を取り出す分析です。機械学習では主に対象データの

    主成分分析PCAを用いて手書き数字を分析する。その1 - Qiita
  • 1