このPHP版TinySegmenterは、内部で文字コード変換をするためにmb関数を使っているので、mb関数が使える必要がある。 使い方はサンプルを見てもらえばわかるが、こんな感じ。 <?php include_once(dirname(__FILE__).'/tiny_segmenter.php'); $input = "日本語の新聞記事であれば文字単位で95%程度の精度で分かち書きが行えます。 "; $segmenter = new TinySegmenterarray(); $result = $segmenter->segment($input, 'UTF-8'); print_r($result); ?> Array ( [0] => 日本語 [1] => の [2] => 新聞 [3] => 記事 [4] => で [5] => あれ [6] => ば [7] => 文字 [8