村田機械は、音声認識ソフトを作る際に必要な辞書データを生成するプログラムをオープンソースにすると発表した。ライセンスはCPLで配布する。 今回公開されるのは、高性能音声認識ソフトウェアとして定評のある「Julius」をベースとした音声認識の実用化に不可欠なプログラム。具体的には、単語辞書データを生成するためのプログラム「vocab2htkdic.rb」がオープンソースになる。なお、「Julius」に関してはすでにオープンソース化されている。 「vocab2htkdic.rb」は、多言語データ対応を可能にし、最新のUNIX系OS環境でも使用できるプログラム。村田機械では、今回のオープンソース化により、さまざまな要望やバグ報告などの意見交換、活発な議論が生まれ、多くの研究者に利用されるプログラムになることを期待している。 村田機械:オープンソースソフトウエア「vocab2htkdic.