調べた.主に言語モデルに応用する場合の話.大きく分けて階層的と非階層的クラスタリングがある.Class-Based n-gram Models of Natural Language 階層的クラスタリングDistributed word clustering for large scale class-based language modeling in machine translation MapReduceによる単語クラスタリング 元論文のpdfが見つからないが,exchange algorithm(Kneser and Ney, 1993)を分散処理向けに改良している.Exploring Asymmetric Clustering for Statistical Language Modeling 非対称クラスタリングAn Efficient Method for Determin