タグ

2020年10月29日のブックマーク (2件)

  • Weekly Machine Learning #199

    Facebookから100言語対応の機械翻訳モデル、GoogleからBERTをしのぐT5の多言語モデルが公開されました。教師なしの表現学習手法が洗練される=>高い精度で意図に沿ったデータを集められる=>表現学習による精度が上がる=>より意図に沿った・・・というループが回り始めて、世はまさに教師なし時代という印象です。これに構造探索(NAS)が加わると、もはや研究者というよりMLOpsのようなエンジニアのテリトリーになってくると思います。Bitter Lessonではないですが、結局のところ計算機と相性のよい手法が複雑な手法を駆逐するのかもしれません。単調に見えることでも試行錯誤・継続の物量が最終的にものをいうというのは人間の成長にも通じるところがあるかもです。 枝刈りがバイアスを強めているという研究は衝撃です。まだCeleb-Aでしか実験していないので、他のデータセットでの検証が気になりま

    Weekly Machine Learning #199
  • 第10回 機械学習の評価関数(二値分類用)の基礎を押さえよう

    では、早速1つずつ説明していこう。今回はこれまでの連載の中でも比較的難しめであるので、理解できない部分があれば時間をかけて何度も読むなどして頑張ってほしい。 二値分類用[基礎編](Binary classification) 混同行列(Confusion Matrix)について 二値分類の評価関数を理解するには、まずは混同行列(Confusion Matrix)を知っておく必要があるので、最初に説明させてほしい。簡単そうで間違いやすいところなので、冗長になるが例を使って丁寧に説明する。 二値分類の問題に対する学習済みモデルの予測結果を評価して、正解率(何%正解か)を算出することを考えてみよう。二値分類の一方の値が例えば「YES(1.0)」で、もう一方が「NO(0.0)」であるとする(例えばタイタニック号乗客者の生存状況で生存がYES、死亡がNOなど)。予測値がYESのとき、正解値がYESな

    第10回 機械学習の評価関数(二値分類用)の基礎を押さえよう