タグ

scikit-learnに関するincepのブックマーク (3)

  • sklearn.feature_selection.SelectKBest

    sklearn.feature_selection.SelectKBest¶ class sklearn.feature_selection.SelectKBest(score_func=<function f_classif>, *, k=10)[source]¶ Select features according to the k highest scores. Read more in the User Guide. Parameters: score_funccallable, default=f_classifFunction taking two arrays X and y, and returning a pair of arrays (scores, pvalues) or a single array with scores. Default is f_classif

  • scikit-learn に付属しているデータセット

    scikit-learn には、機械学習やデータマイニングをすぐに試すことができるよう、実験用データが同梱されています。このページでは、いくつかのデータセットについて紹介します。 Iris (アヤメの計測データ、通称:アイリス) “setosa”, “versicolor”, “virginica” という 3 種類の品種のアヤメのがく片 (Sepal)、花弁 (Petal) の幅および長さを計測したデータです。 データセットの詳細 レコード数

    incep
    incep 2017/10/17
    あやめデータセット
  • 機械学習ライブラリ scikit-learn で簡単ツイート分類 | ぱろすけのメモ帳

    皆様こんにちは。今日も元気に自分を見つめ直していますか?自分を見つめ直す手段として、過去の自分の発言を見返すことは有用だと考えられます。たとえば、Twitter を使っている方ならば、その過去ログを用いることが考えられるでしょう。Twitter の過去ログはライフログとして機能し、それを用いることにより、過去の出来事のみならず、考え方、感じ方、ふとした着想、などなどを読み取ることができます。しかしながら、過去のツイートを全部見返すのは非常に面倒ですね。たとえば僕のアカウントはトータルで4万ツイート以上あります。これは非常にめんどい。Twitter は情報量多くてだるいよね問題については、従来「再生核 Hilbert 空間を用い、脱ベイズ確率主義に立脚したあまりだるくないツイッター」などの試みが行われてきましたが、今なおその面倒さを軽減する手段については十分とはいえません。記事では、過去の

  • 1