[B! scikit-learn] nabinnoのブックマーク

nabinno id:nabinno

scikit-learnに関するnabinnoのブックマーク (356)

実戦投入する機械学習
検証活動で作成した、会議を診断してくれる会議診断士さゆりの説明資料。機械学習(SVM)を利用し、会議の良し悪しを判定します。
nabinno 2020/12/07
slideshare

tis

takahiro-kudo

scikit-learn

machine-learning
リンク
load_iris
nabinno 2020/11/08
scikit-learn

python

sklearn.datasets

data-set

sklearn.datasets.load_iris

statistics
リンク
MinMaxScaler
nabinno 2020/10/25
scikit-learn

python

sklearn.preprocessing.MinMaxScal
リンク
Amazon.co.jp: scikit-learn データ分析実践ハンドブック (Pythonライブラリ定番セレクション): 拓也,毛利, 廣野,北川, 千代子,澤田, 一徳,谷: 本
nabinno 2020/09/07
takuya-mori

scikit-learn

python

statistics

books
リンク
GitHub - drivendataorg/box-plots-sklearn: An implementation of some of the tools used by the winner of the box plots competition using scikit-learn.
nabinno 2020/08/27
github

box-plots-sklearn

scikit-learn

python

statistics
リンク
Plot different SVM classifiers in the iris dataset
nabinno 2020/08/09
scikit-learn

sklearn.svm

svm

decision-boundary

statistical-classification

statistics
リンク
https://datacamp-community-prod.s3.amazonaws.com/5433fa18-9f43-44cc-b228-74672efcd116
nabinno 2020/08/06
datacamp

scikit-learn

sklearn

python

cheatsheet
リンク
classification_report
classification_report# sklearn.metrics.classification_report(y_true, y_pred, *, labels=None, target_names=None, sample_weight=None, digits=2, output_dict=False, zero_division='warn')[source]# Build a text report showing the main classification metrics. Read more in the User Guide. Parameters: y_true1d array-like, or label indicator array / sparse matrixGround truth (correct) target values. y_pred1
nabinno 2020/07/24
scikit-learn

python

sklearn.metrics

classfication_report
リンク
Ridge
nabinno 2020/07/24
scikit-learn

python

sklearn.linear_model

ridge

regression-analysis
リンク
Lasso
Lasso# class sklearn.linear_model.Lasso(alpha=1.0, *, fit_intercept=True, precompute=False, copy_X=True, max_iter=1000, tol=0.0001, warm_start=False, positive=False, random_state=None, selection='cyclic')[source]# Linear Model trained with L1 prior as regularizer (aka the Lasso). The optimization objective for Lasso is: Technically the Lasso model is optimizing the same objective function as the E
nabinno 2020/07/24
scikit-learn

python

sklearn.linear_model

lasso

regression-analysis

statistics
リンク
cross_validate
cross_validate# sklearn.model_selection.cross_validate(estimator, X, y=None, *, groups=None, scoring=None, cv=None, n_jobs=None, verbose=0, params=None, pre_dispatch='2*n_jobs', return_train_score=False, return_estimator=False, return_indices=False, error_score=nan)[source]# Evaluate metric(s) by cross-validation and also record fit/score times. Read more in the User Guide. Parameters: estimatores
nabinno 2020/07/24
scikit-learn

python

sklearn.model_selection

cross-validation

data-validation

statistics
リンク
cross_val_scoreはもうやめよう！一発で交差検証するにはcross_validateを使う - 静かなる名辞
はじめに scikit-learnで交差検証を行い、評価指標を算出する方法としては、cross_val_scoreがよくオススメされています。実際、「sklearn 交差検証」みたいな検索キーワードでググるとこの関数がよく出てきます。しかし、この関数は複数の評価指標を算出することができず、一つのスコアしか出力してくれません。これでどういうとき困るかというと、Accuracy, Precision, Recall, F1をすべて出したい・・・というとき、困ります。基本的にこれらはぜんぶ出して評価するものという考え方のもと検証しようとすると、うまくいかないのです。その辺りを柔軟に制御するために、これまで私は自分で交差検証のコードを書いてきました。しかし、そんな必要はありませんでした。cross_validateという関数を使えばいいのです。・・・と、大げさに書いてみましたが、実はこの関数
nabinno 2020/07/24
scikit-learn

python

sklearn.model_selection

cross_val_score

cross_validate

cross-validation

data-validation

statistics
リンク
scikit-learnのcross_val_scoreを使って交差検証(Cross Validation)をする方法 - ランダムの森
機械学習モデルを作る時、与えられたデータを全て用いてモデルの学習・精度向上を行うと、そのデータに対してのみ精度の良いモデル(理想のモデルに近づけていない。)が出来上がってしまい、未知のデータに対して適用できなくなってしまいます。そのため通常、データをあらかじめ学習用と検証用に分けておき、学習用データでモデル作成→検証用データでモデルの精度を確かめるという手順でモデリングを進めていきます。さて、上記のように学習データ内で精度の良いモデルを作るのですが、こちらも学習データに特化したモデルを作ってしまうと、いつまでたっても精度の良いモデルができません。(特に学習データが少ない場合。) この問題を解決する手法が交差検証(Cross Validation)です。今回は交差検証の中でも、K-分割交差検証(k-Fold cross validation)について説明します。 K-分割交差検証では学習
nabinno 2020/07/24
scikit-learn

python

sklearn.model_selection

cross_val_score

cross-validation

data-validation

statistics
リンク
mean_squared_error
nabinno 2020/07/23
scikit-learn

python

sklearn.metrics

mean_squared_error

mean-suqared-error

loss-function

mathematical-optimization

decision-theory

statistics
リンク
KNeighborsClassifier
KNeighborsClassifier# class sklearn.neighbors.KNeighborsClassifier(n_neighbors=5, *, weights='uniform', algorithm='auto', leaf_size=30, p=2, metric='minkowski', metric_params=None, n_jobs=None)[source]# Classifier implementing the k-nearest neighbors vote. Read more in the User Guide. Parameters: n_neighborsint, default=5Number of neighbors to use by default for kneighbors queries. weights{‘unifor
nabinno 2020/07/20
scikit-learn

python

sklearn.neighbors

sklearn.neighbors.kneighborsclas

kneighborsclassifier

k-nearest-neighbors-algorithm

supervised-learning

cluster-analysis

machine-learning
リンク
NMF
NMF# class sklearn.decomposition.NMF(n_components='auto', *, init=None, solver='cd', beta_loss='frobenius', tol=0.0001, max_iter=200, random_state=None, alpha_W=0.0, alpha_H='same', l1_ratio=0.0, verbose=0, shuffle=False)[source]# Non-Negative Matrix Factorization (NMF). Find two non-negative matrices, i.e. matrices with all non-negative elements, (W, H) whose product approximates the non-negative
nabinno 2020/07/19
scikit-learn

python

sklearn.decomposition

sklearn.decomposition.nmf

non-negative-matrix-factorizatio

linear-algebra

machine-learning

analytics
リンク
RandomizedSearchCV
RandomizedSearchCV# class sklearn.model_selection.RandomizedSearchCV(estimator, param_distributions, *, n_iter=10, scoring=None, n_jobs=None, refit=True, cv=None, verbose=0, pre_dispatch='2*n_jobs', random_state=None, error_score=nan, return_train_score=False)[source]# Randomized search on hyper parameters. RandomizedSearchCV implements a “fit” and a “score” method. It also implements “score_sampl
nabinno 2020/05/10
scikit-learn

python

sklearn.model_selection

randomizedsearchcv
リンク
roc_curve
nabinno 2020/05/08
scikit-learn

python

sklearn.metrics

roc_curve

roc

statistics
リンク
scikit-learn でクラス分類結果を評価する
本ページでは、Python の機械学習ライブラリの scikit-learn を用いて、クラス分類 (Classification) を行った際の識別結果 (予測結果) の精度を評価する方法を紹介します。混同行列 (Confusion matrix) 機械学習を用いたクラス分類の精度を評価するには、混同行列 (Confusion matrix, 読み方は「コンフュージョン・マトリックス」) を作成して、正しく識別できた件数、誤って識別した件数を比較することが一般的です。以下の表は、電子メールのスパムフィルタ (迷惑メールフィルタ) の精度評価を行なう場合の混同行列の例で説明します。混同行列は横方向に識別モデルが算出した識別結果、縦に実際の値 (正解データ) を記します。例えば、スパムフィルタの場合、横方向に「スパム、またはスパムでないとモデルが識別した件数」、縦方向に「実際にそのメー
nabinno 2020/05/07
python

confusion-matrix

scikit-learn

sklearn.metrics

recall_score
リンク
recall_score
nabinno 2020/05/07
scikit-learn

python

sklearn.metrics

recall_score

confusion-matrix
リンク
1 2 3 4 5 6 7 8 9 10 次のページ

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx