第3回の記事では競馬のデータ解析をするために必要なデータ収集の選択肢とその特徴について書いていきます。 データ元の重要性 データ解析をする上で対象となるデータは全ての根幹です。 データ提供サービスによって扱っているデータの種類や更新タイミング、信頼性は異なります。どんなに優秀なアルゴリズムを作ったとしても、無い情報からは何も予測できないですし、間違った情報からは間違った答えしか導けません。 また適しているデータ取得先は、その人の実現したい目的によって変わります。遊びでデータ解析したい人ならばなるべく手軽で最低限のデータが取得できる方法を選ぶべきですし、本格的に毎週運用していきたいのであれば多少手間がかかる方法だとしてもデータの種類が豊富なデータ元を選ぶべきでしょう。 今回はデータ取得先として「JRA-VAN DataLab.」「netkeiba.com」「JRDB」の3サービスを紹介します