ちゃお・・・† 自然言語処理といえば前処理がつきもの。前処理は速いにこしたことがない。というわけで、Python3での日本語変換モジュールの比較をしました。 比較項目 全角・半角の変換と、ひらがなからカタカナへの変換。対象文字列が長い場合と短い場合の両方を見る。 比較対象 jaconv (わたしが作ったモジュール。最近 jctconv から名前を変えました) mohayonaoさんのコード cnvk mojimoji zenhan rfZenHan python-nkf 比較結果 詳細はこちら jaconv cnvk mojimoji zenhan rfZenHan mohayonao nkf