自然言語処理の研究をしているものです。 基本的には、ご指摘のWikipediaのページ書かれているchasenかmecabを使用するのが一般的です。 商用を含め、多くの応用・研究場面で、単語に分割する目的で使用されているはずです。 自作するのは大変なので、単に単語に分割をしたいのであれば、chasenかmecab、JavaであればSen(mecabのJavaへの移植バージョン)を使用するのがよいと思われます。 http://www.mlab.im.dendai.ac.jp/~yamada/ir/MorphologicalAnalyzer/Sen.html Webサービスで利用したいのであれば、Yahooが去年、形態素解析エンジンをWeb APIとして公開していますので、それを利用するのがよいかと思います。 http://www.itmedia.co.jp/news/articles/070