knpを初めて使ってみたら結構処理が遅かったので、どれくらい速度に差があるのか検証してみました。 速度のオーダーを確かめてみる程度の検証です(真面目な検証ではない) ■実験設定 pythonからsubprocessを使って*1各ツールを呼び出し ウェブコーパスからn文を解析して、1文辺りの時間を計測、ツール間で比較しました KNPは解析速度が文字数により指数的に低下するようなので、KNPについては文字数を変えて実験してみました。(mecab, cabochaはそこまで文字数に依存しない) 日本語の1文は、だいたい30~40文字くらいの目安感です(きっちりした文章だともうちょい長い) 40文字ってどれくらいかと言うと 「特に上流部なんかは補充が効かないところが多く、一度やられると少し時間がかかります」 これできっちり40文字。 ■実験結果 解析器 入力文数 1文の文字数 実行時間 1文辺りの