[B! Weka][Data Mining] ayaniimi213のブックマーク

テキスト処理にWekaを使う（その１：文書のトークン化とTFIDF重みづけ） - シリコンの谷のゾンビ

テキスト分類課題などでは，文書をTF-IDF重み付けしたbag-of-wordsで表現することが多い．これをベースラインにするため，さくっとこの処理をしたい．卒論やM1のときは，この処理をわざわざ手で書いたのだが，バグが出たら大変だし，なにより面倒くさい．論文では，最近流行りのLuceneを使っている人もいるけれど，WekaのStringToWordVectorもなかなか高性能．TFIDF重みづけまでの処理をやってみる．Luceneの方が汎用性があるから便利そうなんだけれど，とりあえずテキスト分類課題に使いたいので．前提知識かなり自分用メモ（＋α）なので，説明不足な部分があります．あと，基本的にCUIベースで話を進めます．最後の方に気がついたのですが，GUIとずれがありますね．そこらへんは，まぁ，適当に． Wekaについては，日本語情報があるにはあるのですが最近更新されていないので，

ayaniimi213 2010/12/31

リンク

Spectral Clusterer for WEKA

Overview Change log Spectral Clustering Release notes System requirements Installation instructions Build instructions Documentation References Overview This is preliminary, but fully functional, implementation of the Spectral Clustering algorithm for the WEKA framework. WEKA is an Open Source Knowledge Discovering and Data Mining system developed in Java by the University of Waikato in New Zealan

ayaniimi213 2010/12/31

リンク

Wekaの日本語情報

Wekaの日本語情報データマイニングツールWekaに関する日本語による情報．データマイニングツールとしての使い方なども紹介していきます． weka-jpでは，データマイニングツールWeka*の使い方に関する日本語での情報を提供していきます． Wekaはニュージーランドのワイカト大学において開発されたデータマイニングツールで，分類学習やクラスタリング，相関ルール生成のみならず，データの前処理や視覚化に関する機能も含む統合型ツールです． Wekaに実装された機械学習やクラスタリングのアルゴリズムは他のツールとAPIやCLIを通して利用可能であるため，多くのツールでライブラリとして利用されています．本サイトでは，利用方法に関する解説記事を作成し，公開する予定です．記事の作成に関して，より多くの方にご協力を頂きたいと考えております．更新履歴 2023年11月1日：Weka関連リンクのページ

ayaniimi213 2010/01/05

リンク

RapidMiner -- Data Mining, ETL, OLAP, BI

ETL, data warehousing, data mining, OLAP, business intelligence (BI) in Java. 500+ modules: extract, transf orm, load (ETL), data mining, data analysis + Weka, statistical forecasting, preprocessing, validation, visualization, OLAP, business intelligence.

ayaniimi213 2009/08/21

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

WekaとData Miningに関するayaniimi213のブックマーク (4)

お知らせ

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

今週のはてなブックマーク数ランキング（2024年10月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス