タグ

ブックマーク / yeoman.hatenablog.com (2)

  • 【芥川賞受賞・火花】読むべきか悩むのでテキストマイニングで決定する。 - 実験スピリッツ

    躍進し続ける芸人・又吉先生。そこはかとなく感じる風格、作家らしい珍しい風貌。じわじわくる笑いの感性。 私は直感的に思いました。彼は歴史に名を刻む傑物ではないかと。 かの太宰治は著名な作家にけちょんけちょんに馬鹿にされて喧嘩まで起こしています。あの邪悪そうな太宰が後世ここまで評価されるのならば、又吉先生の未来は明るい。あくまで直感です。 せっかくなので、今回は「火花」についてできるだけ客観的に読むべき作品かどうか判断してみたいと思います。 読書メーターの感想・レビューからデータを集める。 レビューはどこから集めても問題なさそうですが、アマゾンより、読書メーターの方が読書歴が長くて良質なユーザーに恵まれているんじゃないかと思いこちらを選択しました。 まずは、1000人分のレビューを集めました。そしてそのレビューの内容を形態素解析して形容詞だけを抜き出して頻度順に並べたのが下記の図です。 先ほど

    【芥川賞受賞・火花】読むべきか悩むのでテキストマイニングで決定する。 - 実験スピリッツ
  • 【サッカー】ポアソン分布を使ってtoto予想してみた。 - 実験スピリッツ

    あらゆるスポーツはデータ分析によって評価されています。今回はサッカーです。 調べてみた結果、試合のゴール数はポアソン分布(正規分布)に従うと仮定できるそうで、簡単そうなのでやってみます。 ※かなり前に実験してみた結果なので、その辺はご容赦下さい。 ポアソン分布とは ポアソン分布は平均値を変数として使用することで、ある事象が起こる確率を求めることができます。 今回の場合、λに平均得点、kに得点の0点~3点を代入します。 例えば、2015年サンフレッチェ広島は1ゲームあたり平均2.03ゴールを得点する可能性があります。この情報をポアソン方程式に当てはめると、広島が試合で0ゴールになる確率は13%、1ゴールは27%、2ゴールは27%、3ゴールは18%になります。簡単ですね。 しかしながら、サッカーは対戦相手あってのものです。単純に、これをそのまま利用するのは適切ではありません。 検証する対象試合

    【サッカー】ポアソン分布を使ってtoto予想してみた。 - 実験スピリッツ
  • 1