連載目次 データセット解説 Boston Housingデータセット(The Boston house-price data)(ボストンの住宅価格データ)は、「1970年代後半における(米国マサチューセッツ州にある)ボストンの住宅価格」の表形式データセット(=構造化データセット)である(図1、米国国勢調査局が収集した情報から抽出&加工して作成されたデータセットである)。 Boston Housingは、主に回帰(数値予測、つまり「住宅価格の予測」)を目的としたディープラーニング/機械学習/統計学の研究や初心者向けチュートリアルで使われている(※ただし、ディープラーニングを行うにはデータ数が506件と少なすぎる点に注意が必要だ)。 Boston Housingは、13属性(説明変数、入力データ)+1属性(目的変数、ラベル=正解を示す教師データ)の14属性で構成されている。各属性(列項目)の意
![Boston Housing:ボストンの住宅価格(部屋数や犯罪率などの13項目)の表形式データセット](https://cdn-ak-scissors.b.st-hatena.com/image/square/fb1f9c117339670be531046671d34f00a6572b21/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fait%2Farticles%2F2006%2F24%2Fcover_news033.png)