シンデレラガールズたちにはスリーサイズのデータがあるのだが、双葉杏だけスリーサイズのデータが欠けている。 これを、他のシンデレラガールズたちのデータを用いて推定しよう、という試み。 今回はLASSOを使用した(というかこれしかいまのところできない)。 主成分分析もこれを流用したらできる。 data0 <- read.csv("imasPCA.csv", header=TRUE) data1 <- data0[,-which(colnames(data0)=="name")] #PCA用に数値だけにする plot(data1, cex=1) 年齢、身長、体重、バスト、ウエスト、ヒップはそれぞれ相関が強そう。 LASSOを使って予測しよう。 今回は、バスト、ウエスト、ヒップをそれぞれ独立に推定した。というのも、予測したいデータが3つ欠損していて、これらを同時に推定するのは今回よくわからなかった
![機械学習を用いて双葉杏のスリーサイズ推定問題を解く - 驚異のアニヲタ社会復帰の予備](https://cdn-ak-scissors.b.st-hatena.com/image/square/b6f0ee28eba1680f2e13eeda615694ffca64bff4/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2FM%2FMikuHatsune%2F20130120%2F20130120212837.jpg)