タグ

MachineLearningとPythonに関するmega-ne0221のブックマーク (4)

  • SVMを使いこなす!チェックポイント8つ - Qiita

    僕はSVMが大好きです.シュパッてきれいに分類できている姿を見ると,かっこよくてドキドキします. 今回は,SVMの性能を最大限に引き出すために知っておくと役立つことを書いていこうと思います.ちょっとチューニングを行うだけで,10%〜20%精度が向上するなんてことはよくあります. なお,記事は使いこなし方にフォーカスしているので,理論的なことを知りたい方は別途確認して下さい. 特徴量の作成 まずは,適切な特徴量を作成するにあたって注意すべきことを2つ紹介します. 1. スケーリング スケーリングとは,特徴量のとりうる値の範囲をあらかじめ調整してあげることです. なぜスケーリングするの? 理由は2つあります. 大きい値の範囲をとる特徴量に引きずられないようにします.[0,10]での1と2の違いは1だけですが,[0,10000]での1の100の違いよりもずっと重要です.すなわち,これらを対等に

    SVMを使いこなす!チェックポイント8つ - Qiita
  • SVM(RBFカーネル)のハイパーパラメータを変えると何が起こるの? - Qiita

    概要 SVM(Support Vector Machine)は分類精度の高い機械学習の手法として知られています. SVMでより高い分類精度を得るには, ハイパーパラメータを訓練データから決定する必要があります. この記事では, RBFカーネル(Gaussian カーネル)を用いたSVMのハイパーパラメータを調整することで, 決定境界がどのように変化するのかを解説します. 決めるべきハイパーパラメータ RBFカーネルを用いたSVMでは, 以下の2つのハイパーパラメータを調整します. コストパラメータ: $C$ RBFカーネルのパラメータ: $\gamma$ コストパラメータについて SVMは特徴空間に写像されたデータ点集合を分離する超平面を決定する手法です. しかし, 特徴空間上の点集合がいつも分離可能とは限りません. 例えば, 以下の図では二種類の記号を完璧に分割するような直線を引くことは

    SVM(RBFカーネル)のハイパーパラメータを変えると何が起こるの? - Qiita
  • ディープラーニングでおそ松さんの六つ子は見分けられるのか? 〜準備編〜 - bohemia日記

    最近おそ松さんというアニメが流行っていますね。 6つ子のおそ松くんのアニメを現代版にアレンジした作品なのですが、その過程でそれぞれの兄弟の特徴が付けられています。 左から、おそ松、から松、チョロ松、一松、十四松、とど松で、順に長男次男三男・・・となっています。 簡単にまとめると、このようになります。 生まれ 名前 色 特徴 長男 おそ松 赤 クズ 次男 から松 青 ナルシスト 三男 チョロ松 緑 ツッコミ、意識高い系 四男 一松 紫 コミュ障 五男 十四松 黄色 マイペース 六男 とど松 ピンク 甘え上手、腹黒 それぞれの色を着ているときは、簡単に見分けられますが、そうでないときは見分けるのに困難を伴います。 髪や目つきにも特徴があるので、見分けることができるので、このような表を作ってらっしゃる方もいます。 それでも結構苦労したので、同じくディープラーニングで学習させたモデルで判別できない

    ディープラーニングでおそ松さんの六つ子は見分けられるのか? 〜準備編〜 - bohemia日記
  • scikit-learn から学ぶ機械学習の手法の概要 - Qiita

    前回、株式の時系列データを分析する話で、後半にちょっとだけ機械学習の話をしました。今日は機械学習ライブラリ scikit-learn に触れます。 scikit-learn といえば以前にも簡単なクラスタリングの例をあげたり、サポートベクトルマシンやクラスタリングで問題を解く、 TF-IDF を計算する、回帰モデルの可視化、 DBSCAN によるクラスタリングといったことをしてきましたが、あらためてライブラリの機能を整理します。 機械学習と言うと難しい数学を駆使するイメージがつきまといますが、完成度の高いライブラリを使えば利用者が機械学習の手法そのものを実装しなくても利用することはできます。もちろん手法の内容に対する理解は必要ですが、せっかく scikit-learn という事実上デファクトとも言えるライブラリが存在するのですから、これを使うところから入門していくのが良いかと思います。 以

    scikit-learn から学ぶ機械学習の手法の概要 - Qiita
  • 1