はじめに 機械学習、特にdeep learningではデータが命である。ここでは、顔画像から年齢・性別を推定するタスクの学習に利用できるIMDB-WIKIデータセットを紹介する。 本稿では、学習のためのデータの整形まで。次回はCNNを利用した年齢・性別推定CNNの学習をやりたい。 コードは下記。 https://github.com/yu4u/age-gender-estimation IMDB-WIKIデータセット このデータセットは、Internet Movie Database(IMDb; 映画やテレビ番組の俳優に関するオンラインデータベース)およびWikipediaをクローリングして作られたデータベースで、プロフィール画像、プロフィール画像から顔領域を抽出した画像、人物に関するメタデータから構成される。IMDbには、460,723枚、Wikipediaには62,328枚の顔画像が含