はじめにクラスタリングプログラムを作るクラスタの代表単語を表示する検索結果を自動分類するクラスタリングアルゴリズムの詳細1 はじめにこのチュートリアルでは,libcs について学びます. libcs は, WAM にエンコードされたデータをクラスタリングするためのライブラリです. クラスタリングとは, 互いに似ているデータを自動的にまとめることです. まとまったデータ集合のことをクラスタと呼びます. 例えば,キーワード検索の結果(文書集合)をクラスタリングすれば, 検索結果を幾つかの意味的なまとまり(クラスタ)に分類することができます. これは検索結果の概観をつかむのに役立つでしょう. その他にも,単語の集合をクラスタリングすれば, シソーラス(単語の意味的な階層)のようなものを自動的に作ることができます. 実際の実行例をみてみましょう. 毎日新聞94年版から社説を10記事選び, 3つの