タグ

ブックマーク / mikuhatsune.hatenadiary.com (37)

  • 援助交際してそうなアニメキャラランキング2016をstanで考える - 驚異のアニヲタ社会復帰の予備

    注意:解析の結果と、実際に声優がそうであるかはまったく関係がありません。 援助交際してそうなアニメキャラランキング2015をstanで考えたことがあったのだが、2016年度版も集計されたので解析してみる。 2015年は以前にもやったが、2016年度分はスレをひたすらコピペして取ってきてテキストマイニング+手作業による集計を行った。 過去分は2012年度からあるので、せっかくだから時系列的な変化があるかどうかやってみたい気分になったが、時系列解析といえるほどのことはできていない。 投票のルールとしては、1人が一回に5人のキャラまで挙げることができる。スレが立ってからある一定期間もしくは3スレ(1000*3)が埋まるまでが期限である。 どの年度も3スレ消費により投票が終了しているようだった。 キャラについては、特定できるキャラ名は頑張ってunique なキャラ名をつけ、キャラの出ているアニメ

    援助交際してそうなアニメキャラランキング2016をstanで考える - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2016/10/20
  • 自称有識者()が例の副作用100%予測にがんばって答える - 驚異のアニヲタ社会復帰の予備

    ちょっとアレなので非公開になりました。 結論 cross validation くらいしよう。

    自称有識者()が例の副作用100%予測にがんばって答える - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2016/01/28
  • 第26羽 ココア「チノちゃん、スリーサイズ教えて」チノ「嫌ですよ」 - 驚異のアニヲタ社会復帰の予備

    この記事はごちうさ住民 Advent Calendar 2014の第26日目の記事です(勝手に参加。 ひと目で尋常でない解析ネタだと見抜いたよ 「チノちゃん、スリーサイズ教えて」 「嫌ですよ」 (´・ω:;.:... データを愛した少女と解析に愛された少女 「というわけでお馴染みのスリーサイズ解析をするよっ。 まずは公式設定から年齢と身長だけ入手できたから アイマスデータセットと機械学習を用いて年齢と身長から、体重、スリーサイズを推定するよっ。 主成分分析をする ブラのサイズ推定をする SPADE法で分化解析をする Trajectory detection で成長度推定をする viSNEによる次元削減とクラスタリングをする という感じでやろう」 初めてデータを扱った日の事憶えてる? 他人のデータでスリーサイズ推定しようとしたわよね 「アイマスデータセットは年齢、身長、体重、スリーサイズの6

    第26羽 ココア「チノちゃん、スリーサイズ教えて」チノ「嫌ですよ」 - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2015/01/30
  • Twitterで声優のフォローリストを取得する - 驚異のアニヲタ社会復帰の予備

    こちらを参考に一回200人の取得をAPIに引っかからないように取得する。 フォローしている人(friends)もしくはフォローされている人(followers)で別個に取得できる。有名人ならたいていfollowersが万人規模になるので、取得するだけでくっそ時間がかかる。 # 待ち時間をプログレスバーで import sys, time rng_time = 60*15 wait_time = 1 def LimitError(rng_time = 60*15, wait_time = 1): for i in range(1, rng_time + 1): rate = i * 71 / rng_time meter = "\r|%s%s| %d秒" % ("=" * rate, ' ' * (71 - rate), (rng_time - i)) sys.stdout.write(me

    Twitterで声優のフォローリストを取得する - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2014/12/18
  • GF(仮)のキャラがニーソなのかどうなのかを Deep learning を使ってなんとか知りたい - 驚異のアニヲタ社会復帰の予備

    GF(仮)を見てる。 クロエ・ルメールのようなニーソキャラが好きなのだが、これをどうにかキャラプロフィールから推定できないか…と思っていたら MNIST手書き文字データをdeep learnignで分類するっていう、あの有名なやつを、Rパッケージであるh2oでやる、という話があったわけで GFのプロフィール画像からニーソキャラかどうか推定しよう!! ってたぶん誰でも思いつくわけですよ。 というわけでやってみた。ちなみにdeep learning の勉強は1秒も進んでいない。 キャラがニーソであるかどうかは、おそらく髪が長くて金髪、つまりクロエ・ルメール的なキャラだとニーソ率が高いということがいままでのアニメ経験上分かっている感じ。 (だったら画像上、長髪キャラかどうかを判別するほうがたぶんdeep learning の当の使い方なんだろうけど完全無視!!というかニーソ推定やってから気づい

    yuiseki
    yuiseki 2014/11/19
  • アイマス, ラブライブ, WUG, GFのキャラ分析 - 驚異のアニヲタ社会復帰の予備

    ガールフレンド(仮)、ラブライブ!、シンデレラガールズ、Wake Up, Girls!のキャラ分析をやったのだが、ごく一部の熱心なファンから、これら全体で見たときにアニメ間で類似性や違いがあったりするのか、という質問を受けたのでやってみる。 その前に、月白陽子、橘響子、久保田友季、荒井薫、神崎ミコト、畑山政子、水野楓夏らが学園生ではなく教員扱いっぽいので年齢不詳である。これを4作品すべてのキャラで年齢推定すると dat <- read.csv("animegirls.csv") data0 <- dat[, 2:8] rownames(data0) <- dat$name library(glmnet) # とりあえず LASSO にする hoge <- as.matrix(na.omit(data0)[,-c(1,7)]) g0 <- glmnet(hoge, na.omit(data0

  • 低水準関数 - 驚異のアニヲタ社会復帰の予備

    Rでプロット画面を充実させたいとき、 par(new = TRUE) で上書きしていくスタイルと、低水準関数と呼ばれるお絵かき関数群でプロットに付け足していくスタイルがある。 ダメ出し:par(new=TRUE) は使わないという話があって、これはどういうことかと質問されたのだが、上書きを重ねるとプロット軸が合っているのになぜか線が太くなっていく。 for(i in seq(1000)){ plot(1) par(new=TRUE) } 複雑な図を描こうと思ったら、白いキャンバスをとりあえずプロット関数で出しておいて、低水準関数でひたすら重ねていくスタイルが汎用性があっていいと思う。たぶん流行りのggplot系はこの手法でやっているんじゃないかな(適当 エクセルみたいな、GUIでゴリゴリやるタイプのプロットなら、自分の手で微調節できるが、低水準関数でゴリ押しすると座標を厳密に取得できるので

    低水準関数 - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2014/05/10
  • 意識高すぎて休日にword2vecをいじるしかやることなかった - 驚異のアニヲタ社会復帰の予備

    word2vecという、ニューラルネットワーク的なことを用いて文書集合からコーパスを構築して、単語のベクトル演算ができるようになる手法があるらしい。 艦これ加賀さんから乳を引いてみるという話を聞いてスゲー!!ってなったので、Twitterでやってみたとか英辞郎でやってみたとかMagic: The Gatheringとかwikipediaいろいろあるなか、何番煎じだよソレェ…って思われそうだけれどもやってみる。 こちらを参考にword2vecをインストールする。今回はPythonではなくターミナルでカチャカチャやることにする。 demo-word.sh の中にtext8というデータがあるが、これは100MBほどのコーパスで、 anarchism originated as a term of abuse first used against early working class radic

    意識高すぎて休日にword2vecをいじるしかやることなかった - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2014/04/21
  • substituteで数式のプロット - 驚異のアニヲタ社会復帰の予備

    プロット上に数式を書きたいと思ったら、expressionが使えるが、loop回したり複雑な式を書きたいと思ったらsubstituteが使える。 例にあるやつを全部やって、そのあと複雑に式を並べたやつをごっそりやってみる。 テキストを用意したらparseしてsubstituteに流す。 # データ x + y x*y x/y x %+-% y x %/% y x %*% y x[i] x^2 paste(x, y, z) sqrt(x) sqrt(x, y) x == y x != y x < y x <= y x > y x >= y x %~~% y x %=~% y x %==% y x %prop% y plain(x) bold(x) italic(x) bolditalic(x) list(x, y, z) ... cdots ldots x %subset% y x %sub

    substituteで数式のプロット - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2014/01/09
  • ニコニコ動画のボーカロイド共演ネットワーク - 驚異のアニヲタ社会復帰の予備

    VOCALOIDのタグを付けて投稿される動画は爆発的に増えている。 タグの共起を抽出してネットワークを描いた。初音ミクが中心にくることは予想に難くないので初音ミクのところを拡大した。 共演ネットワークはいわゆる複雑ネットワークになるだろうと思ったら案の定なった。各次数のノードたちの総登場回数もプロット点の大きさに反映させたが、初音ミクの登場回数が最も多かった。 VOCALOID 初音ミク 鏡音リン 巡音ルカ KAITO 鏡音レン GUMI UTAU 215163 85376 22741 17997 16608 16521 11381 8044 ネットワークの登場人物は指数関数的に増えてはいるが、人口爆発モデル的に考えるとどこかで飽和するだろうという仮定で、3パラメータによるロジスティックカーブへの当てはめをして予測した。2015年始めには320人で飽和するかもしれない。下限は0だとして へ

    ニコニコ動画のボーカロイド共演ネットワーク - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2013/11/10
  • Twitter解析 - 驚異のアニヲタ社会復帰の予備

    声優統計第三号がC85に当選となったのでネタとしてはTwitterを解析しようと思った。 ということでまずはデータ取り(タイムライン取得)をやる。 結論としてはRでやるよりPythonでやるほうがよかった。あとはAPIがバージョンが変わったとかなんとかでたくさんのtweetを取得することができないらしいのでどうしようか悩む。 下準備として、Twitter Developerにアプリを登録して、Consumer key, Consumer secret, Access token, Access token secret をメモる。 PythonではTwythonが使いやすい。こちらとこちらを参考にして、オバマ大統領のタイムラインを取得してみる。結果はJSON形式で得られる。 from twython import Twython, TwythonError api = twython.se

    Twitter解析 - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2013/11/02
  • 時系列解析 - 驚異のアニヲタ社会復帰の予備

    セミナーで時系列を学んだのだが、初音ミクの投稿数に適応してみる。 Kalman filterで過去から現在までたどって、平滑化で現在から過去へ遡ることでパラメータを最適化していく。 これを使うと欠損値補完もできる。 そして前回はやらなかった、今後の投稿数予測もやる。 時系列データにはTrend(上昇気味か減少気味か), Seasonal(所定の周期における規則的変動), Cycle(任意の周期における規則的変動), Residuals(誤差)から構成されるもんだと考える。これらをそれぞれ推定して、組み合わせたら元の時系列データだと考える。 予測をしたら95%CIだとものすごいばらつく。こんなもんなのか…Trendとしては増加気味なのに予測投稿数がオワコン化しているのでこれは次数選択がミスっているのではないかという指摘を受けた。 2000くらいの観測点で6時間くらい計算に時間がかかってるので

    yuiseki
    yuiseki 2013/10/02
  • Rでフローサイトメトリー(FCM/FACS) - 驚異のアニヲタ社会復帰の予備

    フローサイトメトリー(FCM)という実験がある。これは、細胞表面に抗原があるのを抗体反応で標識して、標識された細胞に光を当てて抗体反応が起きていたか、つまりその抗原が存在するかを識別する実験である。 実験機器が許す限り、抗原標識は可能で、たいてい2〜3の抗体、多くて何十できるとかできないとか。 正常な細胞でも白血病などの異常な細胞でも、ある種の抗原パターンがあって、それらの組み合わせで理論的には細胞を分離できる。 flowCoreパッケージでFCMデータを扱ってみる。 # Required once per R installation source("http://bioconductor.org/biocLite.R") biocLite("flowCore") library(flowCore) file.name <- system.file("extdata","08774087

    Rでフローサイトメトリー(FCM/FACS) - 驚異のアニヲタ社会復帰の予備
  • RGoogleMapでGoogleと連携してiPhone5sの繋がりやすさをプロットする - 驚異のアニヲタ社会復帰の予備

    注意 au iPhone5ユーザーだがパケット通信をしないのでその会社に思い入れがあるわけではない。 調査会社はauの子会社の模様(2ch調べ)らしいのでバイアスはある。 ステマではありません。 iPhone5sが発売になったわけだが、docomo, au, softbankの3キャリアからの発売となった。これで各会社は繋がりやすさで勝負しないとお客を確保できない状況になった。 するとお約束の山手線での繋がりやすさ調べが起きるわけだが、データを発見したのはいいものの山手線とか乗らねえし知らねえ!!(総武線or中央快速しか乗らない)ってことでプロットしてわかりやすくする。 今までubuntuでRgoogleMapsが使えなくてイラッ☆としていたのだが急にインストールできるようになってたので、RgoogleMapsを使った放射線地図やRgoogleMapsで簡単GIS - Bye Bye Mo

  • pixivのタグ頻度から考えるラブライブのカップリング - 驚異のアニヲタ社会復帰の予備

    進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!というのが面白そうだったので、毎度おなじみのラブライブ!でネットワーク解析をしてみる。 pixiv小説からタグを取ってくる。作業は pixiv というフォルダとする。 # Rで tag <- "ラブライブ" page <- 1000 urls <- paste("http://spapi.pixiv.net/iphone/search_novel.php?s_mode=s_tag&p=", seq(page), "&word=", tag, sep="") write.table(urls, "urls.txt", row.names=FALSE, col.names=FALSE, quote=FALSE) こうして出来た urls.txt を wget を使って取得する。 # ターミナルで cd pixiv

    pixivのタグ頻度から考えるラブライブのカップリング - 驚異のアニヲタ社会復帰の予備
  • 数学いらずの医科統計学 - 驚異のアニヲタ社会復帰の予備

    MIKUセミナーで以下のを使う。 数学いらずの医科統計学 第2版 作者: 津崎晃一出版社/メーカー: メディカルサイエンスインターナショナル発売日: 2011/03/24メディア: 単行購入: 1人 クリック: 37回この商品を含むブログ (2件) を見るPART1 統計学入門 用語の整理 統計とは何か、的な PART2 信頼区間 PART3 連続変数 分布について 信頼区間 PART4 P値と有意性 統計学的有意 仮説検定 結果の解釈 検出力 等価性検定と非劣性検定 PART5 統計学における問題 多重検定 正規分布 外れ値 PART6 統計学的検定法 観察結果と期待していた分布の比較 前向き研究と実験研究 ケースコントロール研究 生存曲線 対応のないt検定 対応のある2群の比較 相関 PART7 データにモデルを適合させる 線形回帰 非線形回帰 モデルの紹介 モデルの比較 重回帰・

    数学いらずの医科統計学 - 驚異のアニヲタ社会復帰の予備
    yuiseki
    yuiseki 2013/07/19
  • 微分方程式で数学モデルを作ろう - 驚異のアニヲタ社会復帰の予備

    微分方程式で数学モデルを作ろう 作者: デヴィッド・バージェスモラグ・ボリー,垣田高夫,大町比佐栄出版社/メーカー: 日評論社発売日: 1990/04/09メディア: 単行購入: 15人 クリック: 101回この商品を含むブログ (5件) を見る微分方程式を用いた数学モデルについてやる 第一章 序論 1.1 数学モデルの作り方 1.2 人口問題 1.3 モデル化のための枠組 1.4 微分方程式:基礎概念とアイデア 第二章 成長と減衰 2.1 はじめに 2.2 薬の吸収 2.3 放射性炭素 2.4 水の加熱と冷却 2.5 アルコールの吸収と事故危険率 2.6 人工腎臓器の数学モデル 第三章 変数分離系微分方程式 3.1 はじめに 3.2 刺激に対する反応 3.3 ロケットの飛行 3.4 水流についてのトリチェリの法則 3.5 抑制された成長モデル 3.6 技術革新の普及 第四章 線形一階

    微分方程式で数学モデルを作ろう - 驚異のアニヲタ社会復帰の予備
  • ボディイメージ - 驚異のアニヲタ社会復帰の予備

    シンデレラガールズのデータがあったのでやってしまった。 このデータには身長体重があったので、身体的特徴についての統計量をとると age height weight BMI B W H Min. : 9.00 Min. :127.0 Min. :28.00 Min. :15.42 Min. : 60.0 Min. :47.0 Min. :65.00 1st Qu.:15.00 1st Qu.:152.2 1st Qu.:41.00 1st Qu.:16.95 1st Qu.: 78.0 1st Qu.:55.0 1st Qu.:80.00 Median :17.00 Median :157.5 Median :44.00 Median :17.53 Median : 82.0 Median :56.0 Median :82.00 Mean :17.67 Mean :156.5 Mean :4

    ボディイメージ - 驚異のアニヲタ社会復帰の予備
  • シンデレラガールズ解析のためのデータ - 驚異のアニヲタ社会復帰の予備

    Wikiよりシンデレラガールズのデータを入手した。 解析用に、 type:1がキュート、2がクール、3がパッション rare:1がN、2がR、3がS blood:1がA、2がB、3がAB、4がO hand:1が右利き、2が左利き、3が両利き 双葉杏:彼女一人だけ公式でスリーサイズ設定が非公開になっている。これを推定問題として解く とした。アンケートェ… コピペでタブ区切りで保存して使える。 type rare name age height weight B W H Boold hand 1 2 天海春香 17 158 46 83 56 82 4 1 1 2 高槻やよい 14 145 37 74 54 78 4 1 1 2 菊地真 17 159 44 75 57 78 4 1 1 2 我那覇響 16 152 41 83 56 80 1 1 1 1 島村卯月 17 159 45 83 59

    シンデレラガールズ解析のためのデータ - 驚異のアニヲタ社会復帰の予備
  • 機械学習を用いて双葉杏のスリーサイズ推定問題を解く - 驚異のアニヲタ社会復帰の予備

    シンデレラガールズたちにはスリーサイズのデータがあるのだが、双葉杏だけスリーサイズのデータが欠けている。 これを、他のシンデレラガールズたちのデータを用いて推定しよう、という試み。 今回はLASSOを使用した(というかこれしかいまのところできない)。 主成分分析もこれを流用したらできる。 data0 <- read.csv("imasPCA.csv", header=TRUE) data1 <- data0[,-which(colnames(data0)=="name")] #PCA用に数値だけにする plot(data1, cex=1) 年齢、身長、体重、バスト、ウエスト、ヒップはそれぞれ相関が強そう。 LASSOを使って予測しよう。 今回は、バスト、ウエスト、ヒップをそれぞれ独立に推定した。というのも、予測したいデータが3つ欠損していて、これらを同時に推定するのは今回よくわからなかった

    機械学習を用いて双葉杏のスリーサイズ推定問題を解く - 驚異のアニヲタ社会復帰の予備