Groongaで学ぶ全文検索 2016-03-25に行って来た。 今日は、仕事でPDFを全文検索できるようにしたいから話を聞きに来たという参加者がいたので、PDFを全文検索できるよう、Groongaのデータベースを作るまでをその場でやった。 まず、PDFを全文検索するために必要なことの概要を説明した。 全文検索できるようにするまでの概要 PDFを全文検索するには 全文検索できるようにするための準備(データベースの構築) データベースを使って全文検索をする という二段階が必要になる。 準備は、 PDFからテキストを抜き出す テキストをGroongaに突っ込む Groongaが(勝手に)インデックスを作る という手順に分解できる。ここのところ僕が説明したのだけど、「テキストをGroongaに突っ込む」のところ、「どのような形で」というのが抜けていて、そこがぴんとこなかったようだ。あとで@kto