"ニコニコ動画の統計的機械学習"シリーズとして、ニコニコ動画のデータを使った解析を幾つか書いてみます。 結構前にやった、以下の発表の内容をブログ化するってのも含めて。 ニコニコ動画のコメント解析 from Keisuke Ogaki ニコニコ動画のコメント解析 このスライドのトピックは ごちうさ難民はどこにいったか コメントによる動画要約 動画を表現するマルチモーダル特徴量の精度検証 なんですが、まずこの記事では3番目の、特徴量の精度検証に触れます。 概要 ニコニコ動画の体験は、音声、画像、そしてなんといってもコメント、と マルチモーダルな体験ですが、それらの情報を使ってニコニコ動画を解析するにあたって、どういう入力特徴を使うことができるか、そしてどの特徴が有用か、を検証しました。 結果は、"コメント >>> 超えられない壁 >>> 画像 > 音声"でした。 また、特徴量を結合することで、