タグ

ブックマーク / yokkuns.hatenadiary.org (4)

  • kmeansで楽できる(かもしれない)パッケージを作った - yokkunsの日記

    k-means法は、非階層的クラスタリングの代表的な手法ですごく便利ですが、使って行く上で、以下の2つが問題になってきます。 初期値がランダムなので、結果がぶれる 最適なクラスタ数が分からない この2つの弱点に対して拡張版や手法が提案されていますが、すごくシンプルな方法で解決するパッケージを作ってみました。 その名もykmeansパッケージ・・・! http://cran.r-project.org/web/packages/ykmeans/index.html ※改良とか拡張とかしてるわけではないので、kmeans2とか付けるのは自重した このパッケージは、上記の二つの問題に対して、以下のアプローチで対応しています。 N回(デフォルトは100)実行して、一番分類されたクラスタを採用する 任意の変数のクラスタ内分散の平均値が小さくなるクラスタ数を採用する N回実行して一番多く分類されたクラ

    kmeansで楽できる(かもしれない)パッケージを作った - yokkunsの日記
    t10471
    t10471 2014/03/20
  • 第26回TokyoRでData Fusionについて発表しました - yokkunsの日記

    先日、第26回TokyoRを開催しました。 http://atnd.org/events/31518 今回、ちょっとバタバタしてメモを取り忘れたので、自分の発表資料だけ載せておきます。 R言語で学ぶData Fusino入門 Tokyor26 data fusion from yokkuns Rで、ディリクレ過程混合モデルまで実行してみたかったのですが、どのパッケージを使えば良いかが分からず、また自分で実装するには時間がなかったので今回は断念。 知ってる方いたら教えてください:) 階層ベイズモデルやってる方がすごく興味を持ってくれていたので、そこら辺の各種方法論を一度整理してみたい 次回 次回は、10/20に開催する予定です! 近日中にATNDを立てるので、興味のある方は是非ご参加ください!

    第26回TokyoRでData Fusionについて発表しました - yokkunsの日記
  • RでYahoo!の日本語解析APIを使うパッケージを作ってみました - yokkunsの日記

    Rでテキストマイニングをする場合、RMecabや、RCaBoChaがあるんですが、事前にMecabやCaBoChaをインストールする必要があり、これから始める人にはちょっと敷居が高いところがあるかと思います。 RMeCabとRCaBoCha - yokkunsの日記 RCaBoChaの64bit版が公開されたので試してみた - yokkunsの日記 もっと気軽にRだけで動かしてみるものがあっても良いかなと思い、Yahoo! Japanが提供しているテキスト解析APIを使うパッケージを作成してみました。CRANにコミット済みです。 CRAN - Package YjdnJlp 以下の機能をサポートしています。 形態素解析 係り受け解析 キーフレーズ抽出 インストールと読み込み > install.packages("YjdnJlp") > library(YjdnJlp) 要求されたパッケー

    RでYahoo!の日本語解析APIを使うパッケージを作ってみました - yokkunsの日記
  • RMeCabとRCaBoCha - yokkunsの日記

    先日(MeCabをyumでインストール@CentOS - yokkunsの日記)CentOSにMeCabとか入れていたのだが、仮想マシンの容量がいっぱいになってしまい、Rが入れられなかったので、新規でFedora11の仮想マシンを作成した。 今回は、ディスク容量を15Gにしたので大丈夫 MeCabのインストール 前回は、CentOSにrpmが用意されていなかったので、何かごにょごにょしてインストールしたが、今回はあるので、普通にyumでインストール。 $ sudo yum install mecab mecab-devel mecab-ipadic Rのインストール こっちも、普通にインストール $ sudo yum install R R-devel RMeCabのインストール http://groups.google.co.jp/group/rmecab/filesから、現在の最新版(

    RMeCabとRCaBoCha - yokkunsの日記
  • 1