タグ

機械学習と用語に関するchess-newsのブックマーク (4)

  • 機械学習で使う英単語まとめ

    機械学習の資料は英語が多い 機械学習を勉強していると英語で書かれた資料に目を通す機会も多い。 たとえば「derivative」という単語が出てくる。 一般的には「派生」という意味。 しかし、頻繁に「derivative」という単語が出てくる。 これは何か専門用語なんだろうなと思い、あたりをつけて調べたら「導関数」のことだった。 他にも、「differentiation」を「差」だと思って読んでたら、実は「微分」のことだったり。 こういう日常で使われる場合の英単語の意味と、専門用語での意味は微妙にイメージのずれがある。 何度も辞書を引かなくていいように、一覧表にまとめた。

    機械学習で使う英単語まとめ
  • みにくいアヒルの子の定理(Ugly Duckling theorem)とは?

    連載目次 用語解説 機械学習におけるみにくいアヒルの子の定理(醜いアヒルの子の定理: Ugly Duckling theorem)とは、何らかの「仮定(=事前知識や偏向、帰納バイアス)」がないと「分類(=類似性の判断)」は(理論上)不可能である、ということを主張する定理である。つまり分類やパターン認識において、あらゆる特徴量を客観的に同等に扱うことはできず、何らかの仮定に基づいて主観的に特徴量選択を行うことが質的に必要であることを示す。 概念的にはノーフリーランチ定理に似ており、機械学習で必修の定理として一緒に学ぶことが多い。ノーフリーランチ定理は「あらゆる問題を効率よく解けるような“万能”の機械学習モデルや探索/最適化のアルゴリズムなどは存在しない」ことを主張する用語である。一方、みにくいアヒルの子の定理は「仮定/事前知識がない場合には、分類性能が高くなるような“最良”の特徴表現/特徴

    みにくいアヒルの子の定理(Ugly Duckling theorem)とは?
  • 学習曲線 | 学習曲線を使用してモデルの過学習・学習不足を判断

    2020.11.13 学習曲線は、訓練データのサンプル数と予測性能の関係を示したグラフである。学習曲線は、予測モデルが過学習を起こしているのか、それとも学習不足になっているのかを判断するて助けになる(Sebastian et al, 2017)。学習曲線の横軸は訓練データのサンプル数であり、縦軸は評価指標である。評価指標は、訓練データを用いて評価した指標と、検証データを用いて評価した指標の両方を用いる。 描き方としては、訓練データをダウンサンプリングしていきながら、学習と検証を行い、それぞれの評価指標を計算し、そして学習に使用したサンプル数を横軸に、そのときの評価指標を縦軸にプロットする。理想的なモデルであれば、サンプル数を大きくしたとき、学習データに対する予測精度と評価データに対する予測精度がほぼ同じ値に漸近する。その漸近される値があらかじめ設定した精度よりも高ければ、そのモデルがうまく

  • 【初心者向け】 機械学習におけるクラス分類の評価指標の解説 - OPTiM TECH BLOG

    こんにちは。R&Dチームの河野です。主な担当業務は機械学習モデルの開発です。 タイから日に留学し、卒業後日企業に就職していました。データ分析機械学習の業務経験が3年程度で、R&Dチーム唯一の女性かつ外国人のメンバーです。 直近の仕事はディープラーニングによるクラス分類モデルの開発を担当しており、今回はモデル精度評価によく使われる評価指標について初心者向け説明させて頂きたいと思います。機械学習モデルの精度改善には課題に適切な評価指標の選択がすごく重要のため、各評価指標の理解が必要になります。分類モデル開発に興味を持っている方・挑戦してみたい方にご参考になれば幸いです。 基的な用語 ポジティブとネガティブクラス 混合行列 評価指標 正解率(Accuracy) 適合率(Precision) 再現率(Recall) F値(F1-score) しきい値とprecision-recallのトレ

    【初心者向け】 機械学習におけるクラス分類の評価指標の解説 - OPTiM TECH BLOG
  • 1