ふと思いだして,グラムさんの教師なし形態素解析(単語分割)ツールであるlatticelmを試してみた.音声認識結果のラティスを入力できることが特徴のひとつですが,テキストを入力とする場合はほぼ持橋さんの教師なし形態素解析論文と同等のことを行います.latticelm version 0.2インストールにはOpenFSTが必要です. WebHome Wikipediaの本文データから10,000行を取り出して適用してみました.$ time ./latticelm -prefix out/ input.txtLoaded 3307 symbolsRunning on 10000 sequences手元のMBAではかなり時間がかかる(1イテレーションに20分近く)ので,途中経過を載せておく.head samp.22 ア ンパ サンド ] ]ア ンパ サンド ( a m p er s a n d