機械学習を勉強したことのある人なら大抵一度は見たことのあるBoston Housing Data。ボストンの郊外地域に関する犯罪率やその他様々な属性から、価格を見積もるためのデータだ。サンプルが506件と少ないので、ちょっとした実験用のデータ(Toy Data)として使われる。PythonのSciKit-LearnやRでもビルトインのデータとして用意されているので、他人に何かを伝える場合でもほとんど準備なしで使える。 演習などでやることはLinear Regression(線形回帰)などのアルゴリズムを実装してコストが下がったことを確認して完了なのだが、うまくいったという実感はわかない。たいていの学習者はボストンで家の購入の検討をしたことがないだろう。カップラーメンの麺の乾燥重量と販売価格の関係とはちがい、数字を見てもよくわからない。しかもデータは1970年のアメリカの国勢調査によるもので