機械学習において教師あり学習は、一般画像認識や音声認識などで目覚ましい成果を上げている。一方で世の中のほとんどの問題では教師データはほとんど存在せず、教師なしデータが大量に存在する。このような、大量の教師なしデータと少量の教師ありデータが与えられた場合に学習する問題を「半教師あり学習」と呼ぶ。 生物のほとんどの学習が、このような半教師あり学習の問題だと考えられる。人間は生まれてから様々な物体を、正解を与えられずにただ観察する。そしてある日、その物体のラベル(例えば「これは象」「あれはキリン」など)が与えられると、その教師事例を数千例も与えられなくても途端に認識できるようになる。こうした生物の学習の過程では、教師なしのデータから何らかの学習を行っているはずである。 半教師あり学習は2種類に大別 半教師あり学習の手法は大きく2つに分かれる。1つ目は、「ブートストラップ法」と呼ばれる方法である。
![《日経Robo》学習の本命「半教師あり学習」、少ない教師データで高い精度](https://cdn-ak-scissors.b.st-hatena.com/image/square/1afb78f346661d3a55ac5012976fc50e12be3c73/height=288;version=1;width=512/https%3A%2F%2Fxtech.nikkei.com%2Fdm%2Fatcl%2Fmag%2F15%2F00144%2F00009%2Fprof_m.png%3F20220512)