タグ

ブックマーク / datachemeng.com (2)

  • スモールデータを用いたデータ解析・機械学習のアプローチのまとめ

    分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。 スモールデータ、すなわちサンプル数が小さいデータセットにおいては、データ解析・機械学習を慎重に行う必要があります。スモールデータにおける問題の詳細は、こちらに書いた通りです。 サンプル数が小さいデータセットには、データ解析で回帰分析やクラス分類をするとき、とてつもなく大きな問題があります。回帰分析やクラス分類における問題というと、精度の高いモデルが構築できないことを想像するかもしれません。 逆です。 精度の高いモ...

  • 部分的最小二乗回帰(Partial Least Squares Regression, PLS)~回帰分析は最初にこれ!~

    PLSの概要 線形の回帰分析手法の1つ 説明変数(記述子)の数がサンプルの数より多くても計算可能 回帰式を作るときにノイズの影響を受けにくい 説明変数の間の相関が高くても対応可能 主成分分析をしたあとの主成分と目的変数との間で最小二乗法を行うのは主成分回帰 (PCR) であり、PLSとは異なるので注意 PLS回帰とかPLSRとも呼ばれているが、ここでは PLS スライドのタイトル 部分的最小二乗回帰 (PLS) とは? どうして PLS を使うの?~多重共線性~ 多重共線性への対策 主成分回帰 (PCR) PCR と PLS との違い PLS の概要 PLSの基式 (yは1変数) 1成分のPLSモデル t1の計算 yとの共分散の最大化 t1の計算 Lagrangeの未定乗数法 t1の計算 Gの最大化 t1の計算 式変形 t1の計算 w1の計算 p1とq1の計算 2成分のPLSモデル w2

    部分的最小二乗回帰(Partial Least Squares Regression, PLS)~回帰分析は最初にこれ!~
  • 1