サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大谷翔平
sonoshou.hatenablog.jp
最も代表的な教師あり分類手法の一つであるサポートベクターマシン。 訓練サンプルから、各データ点との距離が最大となるマージン最大化超平面を求めるという明確な分類基準がある、かつ、一見求めづらそうなこの超平面を一意に求められるということから 数学的に美しい分類手法と言えるでしょう。 サポートベクターマシンの詳しい説明はこちらになります。 サポートベクターマシン - Wikipedia さて、上のWikipediaの記述にもある通り、 マージン最大化超平面は最適化問題の凸二次計画問題となります。 今回は、この凸二次計画問題を勾配法で解くことで、 ハードマージンのサポートベクターマシンを実装しました。 使用したデータ 線形分離可能なデータです。 また、こちらの座標関係をテキストデータにしたものがこちらです。 各行がデータを表しており、スペースで区切られています。 左から、X座標、Y座標、クラス(1
Sublime Text 導入 | sonoshouのまじめなブログ でSublime Textを導入したのですが, キーバインドできるMarkdownエディタとしも優秀だという話を聞き, Sublime Textを自分なりにカスタマイズしてみました. 結論から言うと,非常にMarkdownが書きやすいです! キーバインド使えることがこんなに嬉しいのか……! Markdownって改行(半角スペース2回)が面倒だと思ってたのですけど, SHIFT + Enterに半角スペース2回を割り当てたら幸せになりました. ただ,他のMarkdown専用アプリと比較すると, プレビューがリアルタイムに見られないのが痛い……. キーバインドを取るか,プレビューを取るか,好みかもしれません. Macな方は適宜読み替えて下さい. 大きく違う点はありませんでした. 追記(2014年11月24日) OmniMar
データサイエンティスト養成読本 ビッグデータ時代のビジネスを支えるデータ分析力が身につく! という触れ込みに惹かれ、読んでみた。 全体としては、現在ビジネスに携わっている人向けに書かれており、 網羅的に全体像を把握することができるような印章を受けた。 (私が学生なのでピンと来ない部分は多くあったが、現在ビジネスをしている人にとっては、特に即戦力になる本だと思う。) さらりと読んだ結果、NoSQLについて気になったので、 この部分だけをまとめようと思う。復習がてら。 まとめと感想 いきなり(一部の)まとめと感想を述べてみる。 KVSとそのKVSを開発した企業まとめ。 Google:HBase Amazon:Dynamo Facebook:Casandra 10gen:MongoDB LinkedIn:Voldemort そうそうたる企業の数々。 ついでに、Twitter社は独自のストリーム処
集合知プログラミングの第5章最適化の一部を自分なりにまとめます。 ヒルクライム法(傾斜上り法) ヒルクライム法は、ある地点から少し値を変更し、 変更後の値が変更前の値より低ければ採用する。 これを繰り返して行けば、最小値へ近づくことが出来る。 ヒルクライム法には致命的な弱点がある。 例えば、下図のようなグラフを考える。 このように、局所的最小解があるようなグラフでは、 大局的最小解を発見することはできない。 ヒルクライム法は非常に単純な方法で一般的に使われることは無いが、 この後の手法の比較のために説明する。 アルゴリズム<初期化処理> ランダムな値で変数を初期化。カウントを初期化。 <反復処理> 変更する変数を一つ選ぶ。 変数の値を増加させるか、減少させるかを決定する。 変数の値を変更後、新たな変数でコストを算出する。 変更前と変更後のコストの大小を比較する。 変更後のコストが小さければ
Dark Blackでおしゃれに決める! パソコンの画面を長く見れば見るほど目が疲れてくる。 いわずもがなですが、仕方ないことではありますよね。 かくいう私も1日10時間ぐらいは平気でディスプレイを見続けているのですが、 流石に目への負担がひどくなってきました。 そこで現在主力で使っているIDEのEclipseのテーマを変更して、 少しでも目への負担を減らそうと思いました。 以下が本エントリー設定完了の参考の画像です。 テーマ変更の仕方 下のホームページを参考にしました。 http://d.hatena.ne.jp/cypher256/20120926/p1 1. カラーテーマをインストールする Eclipseを起動する。 ヘルプ - 新規ソフトウェアのインストール 「追加」 名前に「color theme」、アドレスに 「http://eclipse-color-theme.github
ecliseとgitの連携2 ~さくらVPS~ - sonoshouのまじめなブログ 新しく書きました。(2014年1月22日更新) 既にリモート上にgitリポジトリが既に存在する場合は、 こちらをご参照ください。 リモート上にgitリポジトリが存在しない場合は、 以下の記事が参考になるかと思います。 いつでもプログラム書きたいですよね。 サーバーにgitを構築しましょう。 ついでにeclipseと連携させましょう。 今回はおすすめのリンク集となりそうです。 私が構築するにあたって、いくつか詰まった点があります。 そこを重点的に説明していくつもりです。 \------筆者の環境------\ ・さくらVPS1GBプラン ・Cent OS ・eclipse 4.2 \----------------------\ この記事は下記リンクを参考にしています。 さくらインターネットをgitの共用リ
このエントリーは、集合知プログラミング第8章を参照にしています。 非負値行列因子分解は、データマイニングの手法の一つである。 データの重要な特徴を抽出するために用いられる。 非負値行列因子分解は、non-negative matrix factorizationの日本語訳であり、 よくNMFと省略されるので、こちらの省略形も覚えておきたい。 非負値行列因子分解の基本的なアイディア非負値行列因子分解は、その名の通り、行列を正の数(非負値)で因子分解することで、 特徴の抽出を行う。 因子分解とは、掛け合わせることで再び分解前の行列を構築できるような 2つの小さな行列を探し出すということである。 非負値行列因子分解の例以下、具体例を交えながら解説する。 文書の記事と記事内に存在する単語との対応付けがあるとき、 これらに対してNMFで特徴を抽出する。 対応付けの表は以下のようになっているとする。
pythonを使った機械学習の環境構築まとめです。 python (プログラミング言語) pydev (eclipseのpython環境構築プラグイン) numpy (数学関数ライブラリ) scipy (数値解析ライブラリ) matplotlib (グラフ描画ライブラリ) cvxopt (最適化計算ライブラリ) の導入を順に説明していきます。 過去に同系統の記事を書いています。 基本的にはこの記事のみで完結致しますが、 箇所によっては過去記事の方が詳しい場合があります。 わからなくなった場合は過去記事も参照してみて下さい。 <過去記事> Python インストール Pydev インストール matplotlibを使ってグラフを簡単表示 (含Numpy導入) pythonの導入Python Japan User's Group http://www.python.jp
機械学習の勉強をしていく中でグラフを描画して、 機械学習の過程と結果を見たいことが増えてきました。 というわけで、 Pythonを使って簡単にグラフ描画できるライブラリと高水準の数学関数ライブラリを導入してみたいと思います。 Matplotlib (簡単にグラフ描画できるライブラリ) Wikipedia:Matplotlib Numpy (数学関数ライブラリ) Wikipedia:Numpy 前提: ・筆者の環境はWindows (MacやLinuxでも導入可能) ・pythonが動く環境 Numpyに関するサンプルコードやインストール方法は 機械学習 はじめよう 第6回 Numpyの導入 を参考にしています。 また、リンク先のサイトでもインストール方法が解説されています。 特にMacの方はリンク先サイトの方がわかりやすいと思いますので、合わせてご覧下さい。 Matplotlibの導入ht
このページを最初にブックマークしてみませんか?
『sonoshouのまじめなブログ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く