Contributing- Ways to contribute, Automated Contributions Policy, Submitting a bug report or a feature request- How to make a good bug report., Contributing code- Video resources, How to contribute...
learning_curve# sklearn.model_selection.learning_curve(estimator, X, y, *, groups=None, train_sizes=array([0.1, 0.33, 0.55, 0.78, 1.]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=None, pre_dispatch='all', verbose=0, shuffle=False, random_state=None, error_score=nan, return_times=False, fit_params=None)[source]# Learning curve. Determines cross-validated training and test sco
LinearDiscriminantAnalysis# class sklearn.discriminant_analysis.LinearDiscriminantAnalysis(solver='svd', shrinkage=None, priors=None, n_components=None, store_covariance=False, tol=0.0001, covariance_estimator=None)[source]# Linear Discriminant Analysis. A classifier with a linear decision boundary, generated by fitting class conditional densities to the data and using Bayes’ rule. The model fits
【翻訳】scikit-learn 0.18 チュートリアル 科学的データ処理のための統計学習のチュートリアル 統計学習:scikit-learnにおける設定と推定器オブジェクトPython機械学習MachineLearningscikit-learn http://scikit-learn.org/0.18/tutorial/statistical_inference/settings.html を google翻訳した scikit-learn 0.18 チュートリアル 目次 科学的データ処理のための統計学習のチュートリアル 目次 統計学習:scikit-learnにおける設定と推定子オブジェクト データセット scikit-learnは、二次元配列として表現された1つ以上のデータセットの情報を学習することを扱います。それらは、多次元観測のリストとして理解することができます。これらの配列
クラスタリング:観測値をまとめてグループ化する クラスタリングで解決された問題 虹彩データセットが与えられた場合、3種類の虹彩があるが、タキソノミストにラベルを付けるためのアクセス権がない場合、クラスタリングタスクを試すことができます:観測をクラスタと呼ばれるよく分離されたグループに分割します。 K平均クラスタリング 異なるクラスタリング基準および関連するアルゴリズムが多数存在することに注意してください。最も単純なクラスタリングアルゴリズムは K平均 である。 >>> from sklearn import cluster, datasets >>> iris = datasets.load_iris() >>> X_iris = iris.data >>> y_iris = iris.target >>> k_means = cluster.KMeans(n_clusters=3) >>
【翻訳】scikit-learn 0.18 チュートリアル 科学的データ処理のための統計学習のチュートリアル すべてを一緒に入れてPython機械学習MachineLearningscikit-learn from sklearn import linear_model, decomposition, datasets from sklearn.pipeline import Pipeline from sklearn.model_selection import GridSearchCV logistic = linear_model.LogisticRegression() pca = decomposition.PCA() pipe = Pipeline(steps=[('pca', pca), ('logistic', logistic)]) digits = datasets.l
実験的な科学のデータセットのサイズが急速に拡大しているため、機械学習は重要性が増している技術です。さまざまな観測をリンクする予測関数を構築することから、観測を分類すること、またはラベル付けされていないデータセットの構造を学習することまで、さまざまな問題に取り組んでいます。 このチュートリアルでは、データを手がかりにした統計的学習の結果、統計的推論を目的とした機械学習技術の使用を紹介します。 scikit-learn は、古典的な機械学習アルゴリズムを科学Pythonパッケージ( NumPy 、 SciPy 、 matplotlib )の緊密に編成された世界に統合したPythonモジュールです。 統計学習:scikit-learnにおける設定と推定器オブジェクト データセット 推定器オブジェクト 教師あり学習:高次元の観測からの出力変数を予測する 最近傍と次元の呪い 線形モデル:回帰から希薄
http://scikit-learn.org/0.18/tutorial/machine_learning_map/index.html をgoogle翻訳した チュートリアル 目次 / 前のチュートリアル 適切な推定器の選択 多くの場合、機械学習の問題を解決する最も難しい部分は、その仕事のための正しい推定器を見つけることです。 データの種類や問題ごとに、適した推定器は異なります。 以下のフローチャートは、どの推定器でデータを試してみるかという大まかなガイドをユーザーに提供することを目的としています。 下の図の見積もりをクリックすると、そのドキュメントが表示されます。(訳注:クリックできません) scikit-learnアルゴリズムチートシート 開始 サンプルが50以上あるか? NO → もっとデータを集めましょう yes ↓ カテゴリを推定したい? Yes → ラベル付けされた教師デー
書かれたチュートリアルについては、ドキュメントのチュートリアルのセクションを参照してください。 初めて科学的なPythonをお使いですか? 科学的なPythonエコシステムを新しく始めるときは、 Python Scientific Lecture Notes(訳注:日本語訳版がここに ) を強くお勧めします。これは、あなたの基礎を少し見つけるのを助け、間違いなくあなたの scikit-learn を学ぶ経験を向上させます。 scikit-learnを最大限に活用するには、NumPy配列の基本的な理解が推奨されます。 外部チュートリアル 特定の科目分野に合わせたオンラインチュートリアルがいくつか用意されています。 PythonでNeuroImagingのための機械学習 天文学データ解析のための機械学習 Scipy 2013での ガイ・バロックウ、ジェイク・バンダープラス、オリビエ・グリゼル
scikit-learn モデルを訓練した後、再学習することなく将来の使用のためにモデルを持続させる方法が望ましい。次のセクションでは、pickleでモデルを永続化する方法の例を示します。また、pickleシリアル化の作業時に、セキュリティと保守性に関するいくつかの問題を確認します。 3.4.1. 永続性の例 Pythonの組み込み永続化モジュール、つまり pickle を使って、scikitモデルを保存することは可能です: >>> from sklearn import svm >>> from sklearn import datasets >>> clf = svm.SVC() >>> iris = datasets.load_iris() >>> X, y = iris.data, iris.target >>> clf.fit(X, y) SVC(C=1.0, cache_siz
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く