概要 Rust製の形態素解析器Linderaを使用して、テキストファイルに含まれる日本語の語数を数えるプログラムを作成しました。Linderaの使用方法と、並列処理ライブラリrayonによる処理の高速化について解説します。 Rustについて Rustは、CやC++と同等の高速・低レイヤーのプログラミングが可能でありながら、メモリ安全性に重点をおいたプログラミング言語です。2015年にバージョン1.0がリリースされた比較的新しい言語であり、近年人気を集めています。 自然言語処理にRustを使う動機 Rustを勉強中である著者が「使ってみたかった」というのが一番の動機です。 それ以外には、 Rustによる日本語の自然言語処理の例は、ネット上でそれほどたくさんは見かけないので、やってみた。 それなりの大きさのテキストファイル(数百メガバイト)を分かち書きするのに、例えばPythonで処理するのと