最終更新日:2023年6月12日 開発本部研究開発グループR&Dチームのサンティです。 今回は、テキストマイニングのエンジニア向けに、以前ご紹介した「大規模辞書マッチングを手軽に高速化してみた」のソースコードを、実験のために公開します。正式な資料は特にありませんが、下記の手順を一通り実行いただければ基本的な操作を体験できると思います。 なお、前提としてある程度Julia言語が使える、またはこれをきっかけにJulia言語を初めて見ようかと思っている方を想定しています。初版では非効率な部分がまだまだ沢山ありますので、皆様からの改良改善点の共有をお待ちしております。 まず、DAWGパッケージの公開リポジトリは下記の通りです。 https://github.com/hottolink/DAWG このパッケージは、Julia言語で記述した疎行列及びダブル配列ベースDAWG(Directed Acyc