[B! MachineLearning][tips] tnalのブックマーク

機械学習の初心者が数式に困惑したら。解決への指針 - HELLO CYBERNETICS

前回機械学習を学ぶなら数学が必要だという話をしました。 s0sem0y.hatena blog.com それと同時に、数学を極めてから機械学習をやるのではなく、機械学習をやりながら必要に応じて数学を学んでいくというスタイルをオススメしました。しかし、今から機械学習を学んでいこうという人にとって、機械学習の数式がわからないとき、果たしてどの数学を学べば改善が見込めるのかを判断するのは難しい問題かと思います。そこで機械学習に現れる数式を実際に取り上げ、ケースごとにどの数学分野を補強すべきかの指針をまとめてみたいと思います。また、少しの定性的な理解を深める解説も載せておきます。今後のヒントになれば嬉しいです。パーセプトロンでのケース全て同じ意味、式変形が分からない人へ入力ベクトルに対して、という数式が現れます。この数式を大抵の本は以下のように変形します。最初の式と、この式が全く同じ計算

tnal 2016/10/17

リンク

RBMから考えるDeep Learning　～黒魔術を添えて～ - Qiita

ずいぶん遅くなりましたが、ひとまず完成です。疑問点・翻訳ミスを始めとした指摘がありましたら、どしどしお願いします(14/12/18)。 1週間あるから大丈夫だろうとたかを括っていたら、あっという間に投稿日になってしまいました。本当はPylearn2を使ってRBMを学習させようと考えていたのですが、役に立つ内容を書くには時間が足りなさすぎるので、お茶を濁します。今回の目標 Restricted Boltzmann Machine及びDeep Belief Networkの基本的な動作原理を知る "A Practical Guide to Training Redstricted Boltzmann Machine"(GE Hinton, 2012)で黒魔術(RBMの性能を引き出すコツ)を学ぶ先日、以下のような発表をしました。今回の内容は以下のスライドの焼き直し・改良を含みます。参考にどう

tnal 2015/06/15

リンク

不均衡データをSVMでクラス分類するにはどうすれば良いか - 渋谷駅前で働くデータサイエンティストのブログ

今年のKDD cupが絵に描いたような不均衡データ（正例と負例との数的比率が極端に偏っているデータ）で苦労させられたので、ちょっと調べたら色々と良い方法があるなぁと気が付きましたよということで備忘録的に紹介しておきます。ちなみにググったら普通に@sfchaosさんのslideshareが出てきたので、僕なんぞの解説よりそちらをどうぞｗ不均衡データのクラス分類なおこちらのスライドの方がSVM以外にもランダムフォレストなどでの対処法も載っているので、汎用的だと思います。。。クラス重み付けを調整してサンプルサイズが小さい方のクラスの影響力を上げてやるこれはRのsvm{e1071}の説明だと割とあっさりとしか書かれてないので、どちらかというとPythonのsklearn.svm.SVCの説明を見た方が分かりやすいかもしれません。 SVM: Separating hyperplane fo

tnal 2014/10/10

リンク

KDD2013読み会やった & Density-Based Logistic Regression 読んだ - 糞糞糞ネット弁慶

KDD 2013 の論文を互いに持ち寄って読む会をやった．日付を工夫しなかったせいでhttp://www.marine-e.net/sp/marikore2013/に行けなかったのが非常に悲しい．会場は前回と同じくGunosyのオフィスを貸していただいた．参加してくださった方々，オフィスを貸してくださったgunosyの方々ありがとうございました．自分は Density-Based Logistic Regression を読んだ． Density-Based Logistic Regression(pdf，後半に生理的嫌悪感を抱かせる図が載っているので注意が必要．) 目的ロジスティック回帰にカーネル密度推定を組み合わせた Density-Based Logistic Regression (DLR) を提案する．この手法は，計算効率が良く，モデルの可解釈性に優れ，パラメーターフリーで

tnal 2013/09/11

リンク

[機械学習] A few useful things to know about machine learning - tsubosakaの日記

タイトルの論文はCommunication of the ACM, 2012のレビュー記事ドラフトバージョンは下のリンクから読める。 http://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf 割と面白かったのでいくつか内容を紹介概要機械学習システムはデータから自動でタスク(スパムフィルタ、レコメンドなど)をどうやって実行するかを見出すことができます。しかしながら機械学習システムを成功させるには教科書を読んだだけではなかなか見つけづらいお約束事とかがあって、思うようには行かないことが多い。本文献では機械学習の研究者および実務に携わる人間が知っておくべきである事柄を12個に要約しています。一般化が重要機械学習のゴールは訓練データにはないデータに対しても一般化して推定ができるという点になります。単に訓練データのみ分類できればよ

tnal 2012/10/03

リンク

機械学習を様々なアプリケーションに適用するためのアドバイス - kisa12012の日記

Andrew Ngの講義で面白いスライドがあったので紹介．研究ではなく様々なアプリケーションへ機械学習を適用するときに実践すべきTipsが３つのトピックに関して語られています．以下は，スライド内で自分が覚えておくべきと思った部分を抽出し，メモ書きしたもの．実サービスやKDD Cup等のコンテストで機械学習を用いる度に，見返してみるのも良いかもしれません．スライド http://see.stanford.edu/materials/aimlcs229/ML-advice.pdf トピック１．Debugging Learning Algorithms 適当な分類器を学習させ，スパムフィルタリングでエラー率20%を達成したら次に何をすべきか？訓練データを増やしたり，より良い分類器を適用したり，色々な改善策が考えられる… 診断法1 : バイアス-バリアンス分析現在の分類器のボトルネックはバイ

tnal 2012/02/09

リンク

はてなブックマーク

タグ

関連タグで絞り込む (10)

MachineLearningとtipsに関するtnalのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス