タグ

ブックマーク / kaiseh.hatenadiary.org (3)

  • 適切なクラスタ数を推定するX-means法 - kaisehのブログ

    K-means法によるクラスタリングでは、あらかじめクラスタ数Kを固定する必要があります。HatenarMapsでもK-means法を使っているのですが、クラスタ数は(特に根拠もなく)200個に決め打ちになっていました。 これに対して、X-means法というK-means法の拡張が提案されていることを知りました。X-means法を使うと、データに応じて最適なクラスタ数を推定できます。 K-means and X-means implementations http://www-2.cs.cmu.edu/~dpelleg/download/xmeans.pdf X-means法の考え方は、K=2で再帰的にK-means法を実行していくというもので、クラスタの分割前と分割後でBIC(ベイズ情報量規準)を比較し、値が改善しなくなるまで分割を続けます。 調べたところ、Javaのデータマイニングツー

    適切なクラスタ数を推定するX-means法 - kaisehのブログ
  • マンセル表色系を使って視覚化の配色を改善する - kaisehのブログ

    データを視覚化するとき、重要なのが色の選び方です。せっかく描いたグラフも、配色が悪いと見栄えがぱっとしなかったり、目が疲れたりします。 以下はJFreeChartのデフォルト配色ですが、あまり良くない色使いの例だと思います。 この配色は、 #FF5555, #5555FF, #55FF55, #FFFF55, #FF55FF, #55FFFFになっています。人間はRGB成分を平等に知覚するわけではないので、こういう(一見均等な)色の割り当てをすると、色のまとまり感がなくなって野暮ったい見た目になってしまいます。 マンセル表色系は、人間の心理や知覚を前提にした色体系です。これを参考にして配色を組めば、目に優しい視覚化ができると思います。 マンセル・カラー・システム - Wikipedia マンセル表色系はhue(色相), value(明度), chroma(彩度)の3要素で構成されますが、人

    マンセル表色系を使って視覚化の配色を改善する - kaisehのブログ
  • JDBCドライバまとめ - kaisehのブログ

    各種RDBMSのJDBCドライバがダウンロードできるURLと、ドライバのクラス名と、POMのdependency(現時点の最新バージョン)を表にしてみました。Mavenのセントラルリポジトリからドライバが見つからなかった場合は、POMの欄をN/Aにしてあります。 DB / Download URL JDBC Driver Class POM MySQL com.mysql.jdbc.Driver mysql mysql-connector-java 5.1.6 PostgreSQL org.postgresql.Driver postgresql postgresql 8.3-603.jdbc4 SQLite org.sqlite.JDBC N/A HSQLDB org.hsqldb.jdbcDriver hsqldb hsqldb 1.8.0.7 Derby org.apache.der

    JDBCドライバまとめ - kaisehのブログ
  • 1