三国志のゲームの武将データを(サンプルに)使った近傍検索を、検索ライブラリ「NGT」を使って、試してみた話です。 ひょんなことから、久しぶりに高次元(多次元)ベクトルのデータを扱うことになりました。(もとい仕事で扱うことにしました。) というのも、15年以上前の話ですが、私、学生の頃は情報検索に関する研究をしていまして、いわゆる大容量ファイル等の類似検索で扱えるような高次元なベクトルデータ向けの効率的なインデックスに関することをテーマとしてやっていたんですよね。 ・・・閑話休題。 で、良さげな検索ライブラリがないかなー、と探してみたら、Yahoo!様が「NGT」というドンピシャなライブラリをオープンソースとして公開してくれていたので、早速試してみました。 NGTと高次元ベクトルの検索について 「NGT」は、GitHub の README によると "Neighborhood Graph a