タグ

ブックマーク / kkobayashi-a.hatenablog.com (2)

  • 某グラの某データ - kkobayashi_a’s blog

    最近、声優統計の皆様が色々とすごい解析をされててすごいです。 自分も何かせねば・・・ということで、とりあえずデータのクロールでもしておくか、と思ってやってみました。 http://seigura.com/senior/directory/tabid/69/Default.aspx 声優統計における最初にして最大の課題、それは声優名の一覧。Wikipediaは基準が甘すぎるし、一般サイトのまとめは信頼性に欠けるし・・・。その辺の問題をある程度解決できる、声優グランプリ監修の声優名鑑のデータです。ちなみに女性のみです。 CSV : https://docs.google.com/spreadsheet/pub?key=0AtjBs4lEumHVdEpZZW1RdDRRaEJYSW5TNkJidEFRNVE&output=csv HTML : https://docs.google.com/sp

    某グラの某データ - kkobayashi_a’s blog
    yuiseki
    yuiseki 2012/03/04
  • Wikipediaから声優名一覧を取ってくるPerlスクリプト - kkobayashi_a’s blog

    めも - XXXannexでxpathだけ考えといてスクリプトにしていなかった。 なにやらゴチャゴチャしてしまったなあ。俺のコードはモダンなモジュールを使いこなすほど洗練されてない、というのがよく分かるなw もうちょいうまいこと書けそうな気もするのだが・・・とりあえず動くということで。 use strict; use warnings; use Web::Scraper; use URI; use URI::Escape; use Data::Dumper; use List::MoreUtils qw(uniq); my $uri = new URI('http://ja.wikipedia.org/wiki/Category:%E6%97%A5%E6%9C%AC%E3%81%AE%E5%A5%B3%E6%80%A7%E5%A3%B0%E5%84%AA'); my $uris = scr

    Wikipediaから声優名一覧を取ってくるPerlスクリプト - kkobayashi_a’s blog
    yuiseki
    yuiseki 2008/12/29
  • 1