タグ

ニコニコ動画に関するryotanizeのブックマーク (2)

  • ニコニコの動画を識別するためのマルチモーダル特徴(ニコニコ動画の統計的機械学習1) - 人工言語処理入門

    "ニコニコ動画の統計的機械学習"シリーズとして、ニコニコ動画のデータを使った解析を幾つか書いてみます。 結構前にやった、以下の発表の内容をブログ化するってのも含めて。 ニコニコ動画のコメント解析 from Keisuke Ogaki ニコニコ動画のコメント解析 このスライドのトピックは ごちうさ難民はどこにいったか コメントによる動画要約 動画を表現するマルチモーダル特徴量の精度検証 なんですが、まずこの記事では3番目の、特徴量の精度検証に触れます。 概要 ニコニコ動画の体験は、音声、画像、そしてなんといってもコメント、と マルチモーダルな体験ですが、それらの情報を使ってニコニコ動画を解析するにあたって、どういう入力特徴を使うことができるか、そしてどの特徴が有用か、を検証しました。 結果は、"コメント >>> 超えられない壁 >>> 画像 > 音声"でした。 また、特徴量を結合することで、

    ニコニコの動画を識別するためのマルチモーダル特徴(ニコニコ動画の統計的機械学習1) - 人工言語処理入門
  • ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurm

    研究用にニコニコ動画のコメント約300GBを公開‐ニコニコインフォ 情報学研究データリポジトリ ニコニコ動画コメント等データ 国立情報学研究所のダウンロードサービスでニコ動のデータセットが公開されていたので、とりあえずダウンロードしてみました ダウンロードの手順 以下のページで、名前、メールアドレス、所属を入力すればよいみたいです。 情報学研究データリポジトリ ニコニコ動画コメント等データ 申請 データの形式 行ごとにそれぞれの動画のjsonが書かれたファイルがたくさんあります。 コメントのデータもありますが、ユーザーに関する情報はないみたいです 動画の説明などには<b></b>や<font></font>、<br />などのHTMLタグが含まれていましたので、それらの除去が必要になりそうです タグの頻度 なんか面白いことできないかなーと考えたんですが、何も思い浮かばなかったので、とりあえ

    ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurm
  • 1