脱素人を目指し機械学習のオンライン講義をとっている。 ニューラルネットの宿題が手書き文字の識別をしろという。数字のみ。テストデータは MNIST のデータセットを使う。有名なデータらしい。そういえば TensorFlow のチュートリアルにもでてきたな。 Samples from MNIST Dataset. The image is from Theanets API Document.Wikipedia によると、この手描き数字はアメリカ統計局職員から集めたデータと高校生から集めたデータを混ぜたものとのこと。ただし生のデータは荒々しくて辛いと適当に正規化してあるそうな。簡単な線形回帰を使っただけなのに正解率が 90% を超えたので機械学習スゲーッと感動してたけど、さすがに前処理はしてあったのね…。 顔写真広く使われるテストデータに出会うと、いつも Lenna のことを思い出す。 The