mlに関するfoxintheforestのブックマーク (3)

  • ZOZO、10年分のファッションデータをオープンソース化 流行に左右されないAI研究に期待

    ZOZOテクノロジーズは9月2日、服のコーディネート約255万件とアイテム約200万件などを含むデータセット「Shift15M」をオープンソースとしてGitHubで公開したと発表した。服の流行が変化してもAIの認識精度を高く保つための研究への活用を見込む。 公開したデータは、服のコーディネートを試せるアプリ「IQON」で2010~2020年に投稿されたコーディネート情報や、投稿日時、「いいね」の数、ジャンルやカテゴリー情報、機械学習用に付与したラベルなど。 同社によると、ファッション関連のデータは流行の変化や新製品の登場によってデータの分布が変わる「分布シフト」という現象が起き、AIによる認識精度が低下する。分布シフトはファッション以外の分野でも起きるが、これまでデータセットの不足で研究が進まなかったという。 Shift15Mと合わせて、10年間のコーディネートの傾向を基に分布シフトの再現

    ZOZO、10年分のファッションデータをオープンソース化 流行に左右されないAI研究に期待
  • Kaggleランカーの9人に聞いた、2020年面白かったコンペ9選と論文9選 | 宙畑

    9名のKagglerの方にアンケートにご協力いただき、2020年に面白かったコンペと論文を教えていただきましたのでその結果を紹介します。 2020年も数多くのデータ解析コンペが開催され、興味深い論文が多く発表されました。 昨年公開した「Kaggle上位ランカーの5人に聞いた、2019年面白かったコンペ12選と論文7選」は現時点で20,000人を超える方にご覧いただき、Kaggleを始めとするデータ解析コンペへの関心が非常に高まっていると感じました。 そして年も9名のKagglerの方にアンケートにご協力いただき、2020年に面白かったコンペと論文を教えていただきましたのでその結果を紹介します。 (1)回答いただいたKaggler9名のご紹介 まずは今回のアンケートに回答いただいたのは以下9名のKagglerの方です。 aryyyyyさま(@aryyyyy221) カレーちゃんさま(@cu

    Kaggleランカーの9人に聞いた、2020年面白かったコンペ9選と論文9選 | 宙畑
  • 機械音の異常検知チャレンジ DCASE 2020 Task 2 - Qiita

    (DCASEホームページより) はじめに 音を題材とした異常検知のデータセットによる機械学習コンペが始まりました。 音に関するコンペ自体が珍しいなか、タスクとして一般的な分類などでもなく、更に難しい異常検知が設定されました。 個人的に2019年に画像の異常検知に積極的に取り組んだのですが、音声は周波数領域に変換すると画像のように取り扱えることから、チャレンジしたい題材でした。下記は画像にチャレンジしたときの記事です。 欠陥発見! MVTec異常検知データセットへの深層距離学習(Deep Metric Learning)応用 深層距離学習(Deep Metric Learning)各手法の定量評価 (MNIST/CIFAR10・異常検知) この記事では、そのコンペ「DCASE 2020 Task 2 Unsupervised Detection of Anomalous Sounds for

    機械音の異常検知チャレンジ DCASE 2020 Task 2 - Qiita
  • 1