例によって,ICML2011からActive Learning from Crowdsのメモ書きです. クラウドと銘打ってはいますが,結局のところ複数アノテーターがいるときにどのように能動学習を行うとよいか,という手法提案の論文になっています. 概要 アノテーターが複数いる場合の能動学習手法の提案 ラベル付けしたいデータに関して,一番信頼できるアノテーターのラベル付け情報を信頼する ただ単に多数決を取るよりも高い精度を達成 能動学習 (Active Learning) 今までラベル付けしたデータから学習器を生成 上手く分類出来ないデータ(今後の学習に一番有効なデータ)を選び,アノテーターによるラベル付け 上記の操作を繰り返す 複数アノテーター 多くの教師あり学習では,一人のアノテーターがラベル付けすることを暗に仮定 この仮定は本当に正しいか? 近年は,多くのあのテーターが同時にラベル付けす