タグ

datasetに関するthondaのブックマーク (2)

  • 「バッハっぽさとは何か?」をAIに理解させることを可能にする330曲・100万音分のデータセットが公開される

    By grfx_guru 人間は音楽を聴いて「この曲はバッハの作曲だな」や「このフレーズはモーツァルトに似ている」といった分析を行うことが可能です。その際には脳の中で音の高さや長さを分析して自分の記憶と照合して……という処理が行われているわけですが、コンピューターにも同様の能力を可能にさせるための詳細なデータセットが公開されました。 What makes Bach sound like Bach? New dataset teaches algorithms classical music | UW Today http://www.washington.edu/news/2016/11/30/what-makes-bach-sound-like-bach-new-dataset-teaches-algorithms-classical-music/ 2016年11月、アメリカ・ワシントン

    「バッハっぽさとは何か?」をAIに理解させることを可能にする330曲・100万音分のデータセットが公開される
  • 大規模画像データセット - n_hidekeyの日記

    最近は画像認識・検索で用いられるデータセットも大規模化が進んでいます。 いくつか代表的なものや最近見つけたものをまとめてみます。 (ここでの目安は、教師つきデータは10万枚以上、教師なしデータは100万枚以上のもの) ImageNet http://www.image-net.org/ 自然言語処理の分野で有名なWordNetのオントロジーに従って、各単語(今のところ名詞のみ)に対応する画像を収集したものです。Amazon Mechanical Turk を利用し、質の高いデータセットを構築するように工夫されています。日々データは蓄積・更新されており、2012年1月現在、約1400万枚の画像データ(2万2千カテゴリ)が集まっているようです。 アノテーションは基的に1画像1カテゴリで、一部の画像には物体の位置を示すbounding boxもついています。カテゴリによっては十分な数の画像がな

    大規模画像データセット - n_hidekeyの日記
  • 1