タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

YouTubeに関するRyobotのブックマーク (2)

  • VoxCeleb

    VoxCeleb is an audio-visual dataset consisting of short clips of human speech, extracted from interview videos uploaded to YouTube 7,000 + speakers VoxCeleb contains speech from speakers spanning a wide range of different ethnicities, accents, professions and ages. Utterance Lengths 1 million + utterances All speaking face-tracks are captured "in the wild", with background chatter, laughter, overl

    Ryobot
    Ryobot 2021/07/31
    “YouTubeにアップロードされたインタビュー動画から抽出された、人間のスピーチの短いクリップで構成される視聴覚データセットです。”7,000話者以上,100万発話以上,2,000時間以上
  • AVSpeech: Audio Visual Speech dataset

    Ryobot
    Ryobot 2021/07/31
    “シングルスピーカーのビデオクリップの大規模なコレクションです。このデータセットは、公開されているYouTubeの教育ビデオに基づいており、そこから3〜10秒の短いクリップが自動的に抽出されました。”
  • 1