groonga/mroongaが標準で備える文字列正規化機能(ノーマライザ・normalizer)として、 いわゆるgroonga独自のnormalizer(NormalizerAuto)と呼ばれるもがあります。 これは、大文字・小文字だけでなく、全角・半角を同一視できるという UnicodeのNFKCを用いた機能です。 とても便利な正規化機能なのですが、この文字列の正規化方法は MySQLで利用されているCOLLATION(照合順序)とは異なる動作です。 利用シーンによっては、MySQLでの作法に合わせた方が都合が良い場合があります。 そこで、groonga-normalizer-mysqlというパッケージの出番です。 本記事では、それら正規化機能の挙動の違いを追いかけてみたいと思います。 mroongaで使えるnormalizer いまのところ4つのnormalizerが提供されていま
![groonga/mroongaの文字列正規化機能 (normalizer) の挙動を追ってみる - Y-Ken Studio](https://cdn-ak-scissors.b.st-hatena.com/image/square/f1e38b9367ef24e2e0ee95d87ee8d74c41229845/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fy%2Fyoshi-ken%2F20130509%2F20130509231155.png)