中川研究室の研究テーマは、統計的機械学習の理論とアルゴリズム、および自然言語処理およびそのWWWへの応用です。特に、統計的自然言語処理の理論、ベイズ統計に基づく機械学習の理論と学習アルゴリズム、およびWWWに見られる半構造化文書からの情報抽出および情報ナビゲーションシステムなどを研究しています。以下に詳細を記します。 統計的機械学習 統計的機械学習とは、観測されたデータから統計的手法を用い新たな知識を導出することである。 統計的機械学習についての教科書的な内容はこちらを参照してほしい。 統計的機械学習には種々の分類がある。主要なものを説明しよう。 教師あり学習と教師なし学習 教師あり学習(supervised learning)では、観測データと、そのデータの意味が与えられる。例えば、文書分類問題であれば、観測された文書とその文書の属するカテゴリー(スポーツ、芸能、など)の対のデータ集