タグ

2011年3月13日のブックマーク (2件)

  • 震源地の推移

    このページについて 震源地の推移をアニメーションします. から までのデータを表示可能です. マーカーの大きさはマグニチュードに比例,するんじゃなくて,マグニチ ュードを m とすると,「マーカーのサイズ = 5 * 1.5m」としてい ます.1.5 にはあんまり意味が無くて,それっぽく見えるサイズを調整しました. 深さを色(白黒)で表しており,浅い(0km)と白く,10km 刻みでだん だん暗くなっていき,深い(90km 以上)と黒くなります.深さが公開されてい ないデータがあったんですが,面倒なので 0km として扱っています.なので, 白が目立つかも. 震源地のデータはhttp://tenki.jp/earthquake/で公開 されている,震源地が明らかなデータを利用させて頂きました.いい加減に抜き 出しているので,間違いなどあるかもしれません.また,多分発生時の発表デー タなので

  • 大規模データマイニングでのモデル探索手法:K-sample plot - データサイエンティスト上がりのDX参謀・起業家

    巨大地震が日を襲い、皆不安を感じながら生活していると思います。 そんな中せめて自分に出来ることをしようと思い、研究してきた内容をブログに記します。 サンプル数が大規模なデータでニューラルネットワークとかサポートベクターマシンとかをしたくても、 時間がかかってしょうがない!ってときに参考にしてみて下さい。 近年、特にweb関係の業界ではデータデータをいくらでも記録できるようになったため、データの規模が非常に大きくなっています。 大規模データに機械学習、マシーンラーニングを適用したいという要望は高まっています。 そういうときはデータからサンプリングして性能を確かめることが多いと思います。 ですがそんな時は、 「サンプル数はどれくらいがいいの?」 「一回やっただけじゃ真の性能は分からないよね?」 「しかもクロスバリデーションしなきゃいけないし。。」 などのような事を疑問に思うでしょう。 今回紹

    大規模データマイニングでのモデル探索手法:K-sample plot - データサイエンティスト上がりのDX参謀・起業家