タグ

Pythonとscikit-learnに関するmisshikiのブックマーク (8)

  • 「ロジスティック回帰」による分類をPythonで学ぼう

    「知識ゼロから学べる」をモットーにした機械学習入門連載の第5回。いよいよ今回から、「Yes/No」や「スパムかどうか」といった“分類”予測を扱います。これを実現する代表的な手法が「ロジスティック回帰」です。図を使って仕組みや考え方をやさしく学び、Pythonとscikit-learnでの実装も体験します。初めての人でも安心して取り組める内容です。 連載目次 「この商品は売れるか/どうか?」「この顧客はサービスを解約しそうか/どうか?」―― こうしたYes/Noの判断(=分類)をデータから予測したい場面は、ビジネスや日常でたくさんありますよね? 今回は、このような際に役立つ、機械学習の代表的な手法であるロジスティック回帰による“分類”について学んでいきましょう。 具体的には、ロジスティック回帰の概要から、その仕組み、そしてPythonプログラミングによるモデルの実装と評価まで取り組み、“分類

    「ロジスティック回帰」による分類をPythonで学ぼう
    misshiki
    misshiki 2025/06/18
    “入力データと出力結果の関係を「S字型の曲線」(=ロジスティック関数)でモデル化する手法。一方、線形回帰モデルでは、「曲線」ではなく「直線」で関係を表現していた。この違いが特に重要なポイント。”
  • Prophet を scikit-learn パイプラインの中へ組み込む簡単な方法

    要するに、単なるコード整理を超えて、機械学習ワークフロー全体を Prophet に適用できる点が最大の利点です。 データ準備 ここでは 3 年分のサンプルデータを生成します。ds 列に日付、reg が外生変数、y が目的変数です。 以下、コードです。 # 必要なライブラリをインポート import numpy as np import pandas as pd # 乱数のシードを固定して再現性を確保 np.random.seed(0) # データのサンプル数を設定 N = 365 * 3 # 日付データを生成(2022年1月1日からN日間のデータ) dates = pd.date_range('2022-01-01', periods=N, freq='D') # 外生変数を生成(線形データにランダムなノイズを加える) reg = np.linspace(0, 10, N) + np.ra

    Prophet を scikit-learn パイプラインの中へ組み込む簡単な方法
    misshiki
    misshiki 2025/06/02
    “Prophet を scikit-learn の Pipeline に組み込み、前処理→学習→予測→可視化を一気通貫で回す方法をステップごとに解説”
  • [pandas超入門]Diabetesデータセットを使って回帰分析してみよう(単回帰分析編)

    [pandas超入門]Diabetesデータセットを使って回帰分析してみよう(単回帰分析編):Pythonデータ処理入門 Diabetesデータセットから特徴量としてBMIを選択して、単回帰分析を行ってみます。単回帰分析でうまくターゲットを予測できるのかどうかを見ていきましょう。

    [pandas超入門]Diabetesデータセットを使って回帰分析してみよう(単回帰分析編)
    misshiki
    misshiki 2025/03/07
    “Diabetesデータセットから特徴量としてBMIを選択して、単回帰分析を行ってみます。単回帰分析でうまくターゲットを予測できるのかどうかを見ていきましょう。”
  • 「正則化」手法(ラッソ回帰、リッジ回帰)をPythonで学ぼう

    「知識ゼロから学べる」をモットーにした機械学習入門連載の第4回。過学習を抑えて予測精度を向上させるための「正則化」手法として、ラッソ回帰とリッジ回帰に注目。その概要と仕組みを図解で学び、Pythonとscikit-learnライブラリを使った実装と正則化の効果も体験します。初心者でも安心! 易しい内容です。 連載目次 前回(第3回)では、売上予測など「データの傾向を把握して、数値を予測する」際に役立つ、機械学習の代表的な手法である線形回帰について学びました。この予測精度を「もっと高めたい」とは思いませんか? モデルを評価した結果、予測精度、つまり機械学習モデルの性能があまり良くなかったとします。原因として、過剰適合(過学習)の可能性が考えられる場合、過剰適合を減らすための手法である正則化(Regularization)を試してみる価値があります。そこで今回は、ラッソ回帰とリッジ回帰という正

    「正則化」手法(ラッソ回帰、リッジ回帰)をPythonで学ぼう
    misshiki
    misshiki 2024/12/05
    “過学習を抑えて予測精度を向上させるための「正則化」手法として、ラッソ回帰とリッジ回帰に注目。その概要と仕組みを図解で学び、Pythonとscikit-learnライブラリを使った実装と正則化の効果も体験します。”
  • Scikit-learnが実験的にGPU対応していたので調査してみた! - Qiita

    はじめに みずほリサーチ&テクノロジーズ株式会社の@fujineです。 いきなりですがAIエンジニアの皆さん、scikit-learnが実験的にGPUに対応していたこと、ご存知でしょうか? scikit-learnは機械学習分野における古参パッケージの1つです。多様な機能を提供する一方、FAQにて「GPUに対応する予定はない(キリッ)」と公式宣言しており、scikit-learnが好きな自分としては「勿体無いなぁ」と常々感じていました。 そんな中、何気なくRelease Highlights for 1.2を読んでいたら以下文面を発見!しかも約半年前の2022年12月にリリースされてる… Experimental Array API support in LinearDiscriminantAnalysis Experimental support for the Array API sp

    Scikit-learnが実験的にGPU対応していたので調査してみた! - Qiita
    misshiki
    misshiki 2024/04/30
    “いきなりですがAIエンジニアの皆さん、scikit-learnが実験的にGPUに対応していたこと、ご存知でしょうか?”
  • Pythonで統計・データ分析!~基本統計量の活用と機械学習の基本

    Pythonで統計・データ分析!~基統計量の活用と機械学習の基数学×Pythonプログラミング入門(1/5 ページ) データ分析において最もよく使われる表形式のデータを取り扱う方法を見ていく。まず、pandasデータフレームの基的な取り扱い方法を確認し、次に、各種の基統計量を求める。また、基統計量の可視化を行い、データの「見方」についても触れる。最後に、scikit-learnを使った回帰と分類の簡単な例を紹介する。

    Pythonで統計・データ分析!~基本統計量の活用と機械学習の基本
    misshiki
    misshiki 2023/01/23
    “pandasデータフレームの基本的な取り扱い方法を確認し、次に、各種の基本統計量を求める。また、基本統計量の可視化を行い、データの「見方」についても触れる。最後に、scikit-learnを使った回帰と分類の簡単な例を紹介
  • conda Numpyのようにscikit-learnも高速化する方法 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 最近、condaで入れるNumpyの方が、pipで入れるNumpyより動作が早いことが少し話題になっています(元記事は最近ではないのですが)。記事では、scikit-learnもインストールを工夫すれば、より高速に動作することを解説します。 はじめに 記事、「Anaconda の NumPy が高速みたいなので試してみた」 https://tech.morikatron.ai/entry/2020/03/27/100000 を最近Twitterのタイムラインで何度も見かけました(元記事は20年3月に記載されたものですが)。 conda

    conda Numpyのようにscikit-learnも高速化する方法 - Qiita
    misshiki
    misshiki 2020/08/02
    “$ conda install -c intel scikit-learn でのインストールをおすすめします(Intel AVX2以上対応CPU環境で)。”
  • GitHub - sktime/sktime: A unified framework for machine learning with time series

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - sktime/sktime: A unified framework for machine learning with time series
    misshiki
    misshiki 2020/07/01
    “時系列を使用した機械学習用のPythonツールボックス。現在サポート: 予測、 時系列分類 時系列回帰。 sktimeは、複合モデルの構築、調整、評価のための専用の時系列アルゴリズムとscikit-learn互換ツールを提供。”
  • 1