タグ

2020年11月6日のブックマーク (2件)

  • scikit-learnのサンプルデータセットの一覧と使い方 | note.nkmk.me

    scikit-learnには分類(classification)や回帰(regression)などの機械学習の問題に使えるデータセットが同梱されている。アルゴリズムを試してみたりするのに便利。 画像などのサイズの大きいデータをダウンロードするための関数も用意されている。 7. Dataset loading utilities — scikit-learn 0.24.1 documentation 公式ドキュメントの表記に従い、scikit-learnに同梱されているデータをトイ・データセット(Toy dataset)、ダウンロードが必要なサイズの大きいデータを実世界データセット(Real world dataset)と呼ぶ。 ここでは以下の内容について説明する。 トイ・データセット(Toy dataset)の一覧 実世界データセット(Real world dataset)の一覧 インポー

    scikit-learnのサンプルデータセットの一覧と使い方 | note.nkmk.me
  • Jupyter Notebook を使ってみよう

    ページでは、Jupyter Notebook の概要と基的な使い方について紹介します。 Jupyter Notebook とは Jupyter Notebook (読み方は「ジュパイター・ノートブック」または「ジュピター・ノートブック」) とは、ノートブックと呼ばれる形式で作成したプログラムを実行し、実行結果を記録しながら、データの分析作業を進めるためのツールです。 プログラムとその実行結果やその際のメモを簡単に作成、確認することができるため、自分自身の過去の作業内容の振り返りや、チームメンバーへ作業結果を共有する際に便利なほか、スクール形式での授業や研修などでの利用にも向いています。 このようなノートブック形式で分析作業を行うためのツールとしては、微分積分などの科学技術系計算ソフトウェアの Mathematica (マセマティカ) や Spark, Hadoop などの並列分散処理シ

    H58
    H58 2020/11/06