タグ

ブックマーク / mikuhatsune.hatenadiary.com (2)

  • データセットと声優動画の抽出 - 驚異のアニヲタ社会復帰の予備

    国立情報学研究所にあるニコニコデータセットをダウンロードする。JSON形式で圧縮されている約50GBの800万動画分コメントデータである。 圧縮されたファイルは解凍しないでそのまま処理することで、HDDが300GBなくても大丈夫なようにした。 ニコニコ大百科女性声優一覧から、いわゆる萌えアニメに出演している声優を選んで288人のリスト cvlist.txt を作る。 タイトルやタグなどの動画情報ファイルである meta.txt と、cvlist.txt に載っている声優がタグに出現する動画のコメントを抜き出したファイル nm...txt ができる。112958の動画が抽出された。 JSONの扱いがなぜかPython 2 ではうまくいかなかったので version 3 でやった。 ### Python3 で!!! import json import re import os import

    データセットと声優動画の抽出 - 驚異のアニヲタ社会復帰の予備
    Luigitefu
    Luigitefu 2014/03/26
  • 声優統計第一号のレビュー - 驚異のアニヲタ社会復帰の予備

    C83にて声優統計第一号が完売という超人気っぷりをみせた。 冬のコミックマーケット(C83)一日目で「声優統計 第一号」を出します - 糞糞糞ネット弁慶 2012-12-27 コミックマーケット83 告知 - 声優統計 あやうく手に入らないという事態だったが、なんとか手にすることができた。 ここで勝手にレビューなるものを書く。 日声優統計学会発足のご挨拶−声優と化学の融合を目指して 声優統計入門 Wikipediaの声優PVデータ特性とブレイク判定手法 キャスティング情報のbag-of声優モデルを用いた音響監督推定問題 ブログを用いた女性声優の結婚時期予測問題 アニメーションの内容及びキャスティングを用いないDVDの売上予測 終わりに

    声優統計第一号のレビュー - 驚異のアニヲタ社会復帰の予備
    Luigitefu
    Luigitefu 2013/12/13
  • 1