Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
自分のブログのテキストを分析・可視化してみたい 以前自分のブログの分析を「内部リンク」や「はてブ情報」の観点で行ってみました。 ただ、目的無く分析してしまったので、結局イマイチどう活用してよいかよく分からない結果しか得られませんでした。 そんな前回の反省を全く活かすことなく、また何の目的もなくブログを分析してみることにしました。今回は以前から興味のあった機械学習を用いたブログの文章の分析・可視化(テキストマイニングと呼ばれるらしいです)にチャレンジしてみることにしました。どちらかというとテキストマイニングが主で、使用する素材(学習データ)に困ったので仕方なく自分のブログを使ってみたというのが正直なところです。 ネットでコピペすりゃ簡単にできるだろと思っていたのですが、自分のやりたいことするのはそれなりに大変だったので、知見としてやり方とどんなことが分かるのかを残しておきます。 ブログのテキ
先日、たまたま見つけて購入した「Nature in Code」に掲載されていた、感染症シミュレーション(SIRモデル)が面白そうだったので作成してみた。 demo 白いセルが感染可能者(感染する前の健康な人)、赤いセルが感染者、緑のセルが隔離者(死亡、もしくは快復して免疫を獲得した人)となる。 参考書のコードを少しカスタマイズして、感染率や隔離率を調整できるようにした。 感染率が高いと早く広範囲に感染が広がり、隔離率が高いと早く収束する。 数値は、「初期感染者」以外は、0〜1の値で割合を示す。例えば、感染率が1の場合、隣接する感染可能者は100%感染する。 初期免疫保持者率は、感染が広がる前に免疫を獲得している人(灰色)の割合。 初期免疫保持者が多いと、拡散せずに早期に収束する。(集団免疫効果) このシミュレーターだと初期隔離者がランダムに配置されるため、集団免疫率は入力した数値より低くな
思ったよりプレミア12が面白くて盛り上がってる私ですこんばんわ!*1 PyCon JP 2015のトークセッション「野球Hack!~Pythonを用いたデータ分析と可視化」で披露した、MLBのオープンデータ「RETROSHEET」を用いたデモを披露させてもらいました。 そのデモで使ったコードを、「野球データを用いた分析と可視化」のお手本として本日公開いたしましたので報告します! 野球Hack!~Pythonを用いたデータ分析と可視化 サンプルコード(New!!!) github.com スライド 野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp from 伸一 中川 www.slideshare.net 動画 youtu.be サンプルコード解説 何が出来るの? 今回公開した野球データ分析サンプル「hatteberg」は、 RETROSHEETのcsvファイルを元に
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く