yuisekiのブックマーク - はてなブックマーク

援助交際してそうなアニメキャラランキング2016をstanで考える - 驚異のアニヲタ社会復帰の予備

注意：本解析の結果と、実際に声優がそうであるかはまったく関係がありません。援助交際してそうなアニメキャラランキング2015をstanで考えたことがあったのだが、2016年度版も集計されたので解析してみる。 2015年は以前にもやったが、2016年度分はスレをひたすらコピペして取ってきてテキストマイニング+手作業による集計を行った。過去分は2012年度からあるので、せっかくだから時系列的な変化があるかどうかやってみたい気分になったが、時系列解析といえるほどのことはできていない。投票のルールとしては、1人が一回に5人のキャラまで挙げることができる。スレが立ってからある一定期間もしくは3スレ(1000*3)が埋まるまでが期限である。どの年度も3スレ消費により投票が終了しているようだった。キャラについては、特定できるキャラ名は頑張ってunique なキャラ名をつけ、キャラの出ているアニメ

yuiseki 2016/10/20

リンク

自称有識者()が例の副作用100%予測にがんばって答える - 驚異のアニヲタ社会復帰の予備

ちょっとアレなので非公開になりました。結論 cross validation くらいしよう。

yuiseki 2016/01/28

リンク

第26羽　ココア「チノちゃん、スリーサイズ教えて」チノ「嫌ですよ」 - 驚異のアニヲタ社会復帰の予備

この記事はごちうさ住民 Advent Calendar 2014の第26日目の記事です(勝手に参加。ひと目で尋常でない解析ネタだと見抜いたよ「チノちゃん、スリーサイズ教えて」「嫌ですよ」 (´・ω:;.:... データを愛した少女と解析に愛された少女「というわけでお馴染みのスリーサイズ解析をするよっ。まずは公式設定から年齢と身長だけ入手できたからアイマスデータセットと機械学習を用いて年齢と身長から、体重、スリーサイズを推定するよっ。主成分分析をするブラのサイズ推定をする SPADE法で分化解析をする Trajectory detection で成長度推定をする viSNEによる次元削減とクラスタリングをするという感じでやろう」初めてデータを扱った日の事憶えてる?　他人のデータでスリーサイズ推定しようとしたわよね「アイマスデータセットは年齢、身長、体重、スリーサイズの6

yuiseki 2015/01/30

リンク

Twitterで声優のフォローリストを取得する - 驚異のアニヲタ社会復帰の予備

こちらを参考に一回200人の取得をAPIに引っかからないように取得する。フォローしている人(friends)もしくはフォローされている人(followers)で別個に取得できる。有名人ならたいていfollowersが万人規模になるので、取得するだけでくっそ時間がかかる。 # 待ち時間をプログレスバーで import sys, time rng_time = 60*15 wait_time = 1 def Limit Error(rng_time = 60*15, wait_time = 1): for i in range(1, rng_time + 1): rate = i * 71 / rng_time meter = "\r|%s%s| %d秒" % ("=" * rate, ' ' * (71 - rate), (rng_time - i)) sys.stdout.write(me

yuiseki 2014/12/18

リンク

GF(仮)のキャラがニーソなのかどうなのかを Deep learning を使ってなんとか知りたい - 驚異のアニヲタ社会復帰の予備

GF(仮)を見てる。クロエ・ルメールのようなニーソキャラが好きなのだが、これをどうにかキャラプロフィールから推定できないか…と思っていたら MNIST手書き文字データをdeep learnignで分類するっていう、あの有名なやつを、Rパッケージであるh2oでやる、という話があったわけで GFのプロフィール画像からニーソキャラかどうか推定しよう!! ってたぶん誰でも思いつくわけですよ。というわけでやってみた。ちなみにdeep learning の勉強は1秒も進んでいない。キャラがニーソであるかどうかは、おそらく髪が長くて金髪、つまりクロエ・ルメール的なキャラだとニーソ率が高いということがいままでのアニメ経験上分かっている感じ。 (だったら画像上、長髪キャラかどうかを判別するほうがたぶんdeep learning の本当の使い方なんだろうけど完全無視!!というかニーソ推定やってから気づい

yuiseki 2014/11/19

リンク

アイマス, ラブライブ, WUG, GFのキャラ分析 - 驚異のアニヲタ社会復帰の予備

ガールフレンド(仮)、ラブライブ!、シンデレラガールズ、Wake Up, Girls!のキャラ分析をやったのだが、ごく一部の熱心なファンから、これら全体で見たときにアニメ間で類似性や違いがあったりするのか、という質問を受けたのでやってみる。その前に、月白陽子、橘響子、久保田友季、荒井薫、神崎ミコト、畑山政子、水野楓夏らが学園生ではなく教員扱いっぽいので年齢不詳である。これを4作品すべてのキャラで年齢推定すると dat <- read.csv("animegirls.csv") data0 <- dat[, 2:8] rownames(data0) <- dat$name library(glmnet) # とりあえず LASSO にする hoge <- as.matrix(na.omit(data0)[,-c(1,7)]) g0 <- glmnet(hoge, na.omit(data0

yuiseki 2014/06/09

culture
tech

リンク

低水準関数 - 驚異のアニヲタ社会復帰の予備

Rでプロット画面を充実させたいとき、 par(new = TRUE) で上書きしていくスタイルと、低水準関数と呼ばれるお絵かき関数群でプロットに付け足していくスタイルがある。ダメ出し：par(new=TRUE) は使わないという話があって、これはどういうことかと質問されたのだが、上書きを重ねるとプロット軸が合っているのになぜか線が太くなっていく。 for(i in seq(1000)){ plot(1) par(new=TRUE) } 複雑な図を描こうと思ったら、白いキャンバスをとりあえずプロット関数で出しておいて、低水準関数でひたすら重ねていくスタイルが汎用性があっていいと思う。たぶん流行りのggplot系はこの手法でやっているんじゃないかな(適当エクセルみたいな、GUIでゴリゴリやるタイプのプロットなら、自分の手で微調節できるが、低水準関数でゴリ押しすると座標を厳密に取得できるので

yuiseki 2014/05/10

tech

リンク

意識高すぎて休日にword2vecをいじるしかやることなかった - 驚異のアニヲタ社会復帰の予備

word2vecという、ニューラルネットワーク的なことを用いて文書集合からコーパスを構築して、単語のベクトル演算ができるようになる手法があるらしい。艦これ加賀さんから乳を引いてみるという話を聞いてスゲー!!ってなったので、Twitterでやってみたとか英辞郎でやってみたとかMagic: The Gatheringとかwikipediaいろいろあるなか、何番煎じだよｿﾚｪ…って思われそうだけれどもやってみる。こちらを参考にword2vecをインストールする。今回はPythonではなくターミナルでカチャカチャやることにする。 demo-word.sh の中にtext8というデータがあるが、これは100MBほどのコーパスで、 anarchism originated as a term of abuse first used against early working class radic

yuiseki 2014/04/21

リンク

substituteで数式のプロット - 驚異のアニヲタ社会復帰の予備

プロット上に数式を書きたいと思ったら、expressionが使えるが、loop回したり複雑な式を書きたいと思ったらsubstituteが使える。例にあるやつを全部やって、そのあと複雑に式を並べたやつをごっそりやってみる。テキストを用意したらparseしてsubstituteに流す。 # データ x + y x*y x/y x %+-% y x %/% y x %*% y x[i] x^2 paste(x, y, z) sqrt(x) sqrt(x, y) x == y x != y x < y x <= y x > y x >= y x %~~% y x %=~% y x %==% y x %prop% y plain(x) bold(x) italic(x) bolditalic(x) list(x, y, z) ... cdots ldots x %subset% y x %sub

yuiseki 2014/01/09

tech

リンク

ニコニコ動画のボーカロイド共演ネットワーク - 驚異のアニヲタ社会復帰の予備

VOCALOIDのタグを付けて投稿される動画は爆発的に増えている。タグの共起を抽出してネットワークを描いた。初音ミクが中心にくることは予想に難くないので初音ミクのところを拡大した。共演ネットワークはいわゆる複雑ネットワークになるだろうと思ったら案の定なった。各次数のノードたちの総登場回数もプロット点の大きさに反映させたが、初音ミクの登場回数が最も多かった。 VOCALOID 初音ミク鏡音リン巡音ルカ KAITO 鏡音レン GUMI UTAU 215163 85376 22741 17997 16608 16521 11381 8044 ネットワークの登場人物は指数関数的に増えてはいるが、人口爆発モデル的に考えるとどこかで飽和するだろうという仮定で、3パラメータによるロジスティックカーブへの当てはめをして予測した。2015年始めには320人で飽和するかもしれない。下限は0だとしてへ

yuiseki 2013/11/10

tech

リンク

Twitter解析 - 驚異のアニヲタ社会復帰の予備

声優統計第三号がC85に当選となったのでネタとしてはTwitterを解析しようと思った。ということでまずはデータ取り(タイムライン取得)をやる。結論としてはRでやるよりPythonでやるほうがよかった。あとはAPIがバージョンが変わったとかなんとかでたくさんのtweetを取得することができないらしいのでどうしようか悩む。下準備として、Twitter Developerにアプリを登録して、Consumer key, Consumer secret, Access token, Access token secret をメモる。 PythonではTwythonが使いやすい。こちらとこちらを参考にして、オバマ大統領のタイムラインを取得してみる。結果はJSON形式で得られる。 from twython import Twython, TwythonError api = twython.se

yuiseki 2013/11/02

tech

リンク

時系列解析 - 驚異のアニヲタ社会復帰の予備

セミナーで時系列を学んだのだが、初音ミクの投稿数に適応してみる。 Kalman filterで過去から現在までたどって、平滑化で現在から過去へ遡ることでパラメータを最適化していく。これを使うと欠損値補完もできる。そして前回はやらなかった、今後の投稿数予測もやる。時系列データにはTrend(上昇気味か減少気味か), Seasonal(所定の周期における規則的変動), Cycle(任意の周期における規則的変動), Residuals(誤差)から構成されるもんだと考える。これらをそれぞれ推定して、組み合わせたら元の時系列データだと考える。予測をしたら95%CIだとものすごいばらつく。こんなもんなのか…Trendとしては増加気味なのに予測投稿数がオワコン化しているのでこれは次数選択がミスっているのではないかという指摘を受けた。 2000くらいの観測点で6時間くらい計算に時間がかかってるので

yuiseki 2013/10/02

tech

リンク

Rでフローサイトメトリー(FCM/FACS) - 驚異のアニヲタ社会復帰の予備

フローサイトメトリー(FCM)という実験がある。これは、細胞表面に抗原があるのを抗体反応で標識して、標識された細胞に光を当てて抗体反応が起きていたか、つまりその抗原が存在するかを識別する実験である。実験機器が許す限り、抗原標識は可能で、たいてい2〜3の抗体、多くて何十できるとかできないとか。正常な細胞でも白血病などの異常な細胞でも、ある種の抗原パターンがあって、それらの組み合わせで理論的には細胞を分離できる。 flowCoreパッケージでFCMデータを扱ってみる。 # Required once per R installation source("http://bioconductor.org/biocLite.R") biocLite("flowCore") library(flowCore) file.name <- system.file("extdata","08774087

yuiseki 2013/09/21

science

リンク

RGoogleMapでGoogleと連携してiPhone5sの繋がりやすさをプロットする - 驚異のアニヲタ社会復帰の予備

注意 au iPhone5ユーザーだがパケット通信をしないのでその会社に思い入れがあるわけではない。調査会社はauの子会社の模様(2ch調べ)らしいのでバイアスはある。ステマではありません。 iPhone5sが発売になったわけだが、docomo, au, softbankの3キャリアからの発売となった。これで各会社は繋がりやすさで勝負しないとお客を確保できない状況になった。するとお約束の山手線での繋がりやすさ調べが起きるわけだが、データを発見したのはいいものの山手線とか乗らねえし知らねえ!!(総武線or中央快速しか乗らない)ってことでプロットしてわかりやすくする。今までubuntuでRgoogle Mapsが使えなくてイラッ☆としていたのだが急にインストールできるようになってたので、Rgoogle Mapsを使った放射線地図やRgoogle Mapsで簡単ＧＩＳ - Bye Bye Mo

yuiseki 2013/09/21

リンク

pixivのタグ頻度から考えるラブライブのカップリング - 驚異のアニヲタ社会復帰の予備

進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ！というのが面白そうだったので、毎度おなじみのラブライブ!でネットワーク解析をしてみる。 pixivの小説からタグを取ってくる。作業は pixiv というフォルダとする。 # Rで tag <- "ラブライブ" page <- 1000 urls <- paste("http://spapi.pixiv.net/iphone/search_novel.php?s_mode=s_tag&p=", seq(page), "&word=", tag, sep="") write.table(urls, "urls.txt", row.names=FALSE, col.names=FALSE, quote=FALSE) こうして出来た urls.txt を wget を使って取得する。 # ターミナルで cd pixiv

yuiseki 2013/09/14

culture

リンク

数学いらずの医科統計学 - 驚異のアニヲタ社会復帰の予備

MIKUセミナーで以下の本を使う。数学いらずの医科統計学第2版作者: 津崎晃一出版社/メーカー: メディカルサイエンスインターナショナル発売日: 2011/03/24メディア: 単行本購入: 1人クリック: 37回この商品を含むブログ (2件) を見るPART1　統計学入門用語の整理統計とは何か、的な PART2　信頼区間 PART3　連続変数分布について信頼区間 PART4　P値と有意性統計学的有意仮説検定結果の解釈検出力等価性検定と非劣性検定 PART5　統計学における問題多重検定正規分布外れ値 PART6　統計学的検定法観察結果と期待していた分布の比較前向き研究と実験研究ケースコントロール研究生存曲線対応のないt検定対応のある2群の比較相関 PART7　データにモデルを適合させる線形回帰非線形回帰モデルの紹介モデルの比較重回帰・

yuiseki 2013/07/19

tech

リンク

微分方程式で数学モデルを作ろう - 驚異のアニヲタ社会復帰の予備

微分方程式で数学モデルを作ろう作者: デヴィッド・バージェスモラグ・ボリー,垣田高夫,大町比佐栄出版社/メーカー: 日本評論社発売日: 1990/04/09メディア: 単行本購入: 15人クリック: 101回この商品を含むブログ (5件) を見る微分方程式を用いた数学モデルについてやる第一章　序論 1.1　数学モデルの作り方 1.2　人口問題 1.3　モデル化のための枠組 1.4　微分方程式：基礎概念とアイデア第二章　成長と減衰 2.1　はじめに 2.2　薬の吸収 2.3　放射性炭素 2.4　水の加熱と冷却 2.5　アルコールの吸収と事故危険率 2.6　人工腎臓器の数学モデル第三章　変数分離系微分方程式 3.1　はじめに 3.2　刺激に対する反応 3.3　ロケットの飛行 3.4　水流についてのトリチェリの法則 3.5　抑制された成長モデル 3.6　技術革新の普及第四章　線形一階

yuiseki 2013/07/16

リンク

ボディイメージ - 驚異のアニヲタ社会復帰の予備

シンデレラガールズのデータがあったのでやってしまった。このデータには身長体重があったので、身体的特徴についての統計量をとると age height weight BMI B W H Min. : 9.00 Min. :127.0 Min. :28.00 Min. :15.42 Min. : 60.0 Min. :47.0 Min. :65.00 1st Qu.:15.00 1st Qu.:152.2 1st Qu.:41.00 1st Qu.:16.95 1st Qu.: 78.0 1st Qu.:55.0 1st Qu.:80.00 Median :17.00 Median :157.5 Median :44.00 Median :17.53 Median : 82.0 Median :56.0 Median :82.00 Mean :17.67 Mean :156.5 Mean :4

yuiseki 2013/07/16

リンク

シンデレラガールズ解析のためのデータ - 驚異のアニヲタ社会復帰の予備

Wikiよりシンデレラガールズのデータを入手した。解析用に、 type：1がキュート、2がクール、3がパッション rare：1がN、2がR、3がS blood：1がA、2がB、3がAB、4がO hand：1が右利き、2が左利き、3が両利き双葉杏：彼女一人だけ公式でスリーサイズ設定が非公開になっている。これを推定問題として解くとした。アンケートｪ… コピペでタブ区切りで保存して使える。 type rare name age height weight B W H Boold hand 1 2 天海春香 17 158 46 83 56 82 4 1 1 2 高槻やよい 14 145 37 74 54 78 4 1 1 2 菊地真 17 159 44 75 57 78 4 1 1 2 我那覇響 16 152 41 83 56 80 1 1 1 1 島村卯月 17 159 45 83 59

yuiseki 2013/07/16

リンク

機械学習を用いて双葉杏のスリーサイズ推定問題を解く - 驚異のアニヲタ社会復帰の予備

シンデレラガールズたちにはスリーサイズのデータがあるのだが、双葉杏だけスリーサイズのデータが欠けている。これを、他のシンデレラガールズたちのデータを用いて推定しよう、という試み。今回はLASSOを使用した（というかこれしかいまのところできない）。主成分分析もこれを流用したらできる。 data0 <- read.csv("imasPCA.csv", header=TRUE) data1 <- data0[,-which(colnames(data0)=="name")] #PCA用に数値だけにする plot(data1, cex=1) 年齢、身長、体重、バスト、ウエスト、ヒップはそれぞれ相関が強そう。 LASSOを使って予測しよう。今回は、バスト、ウエスト、ヒップをそれぞれ独立に推定した。というのも、予測したいデータが3つ欠損していて、これらを同時に推定するのは今回よくわからなかった

yuiseki 2013/07/16

リンク

はてなブックマーク

タグ

ブックマーク / mikuhatsune.hatenadiary.com (37)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス