先週はPostgreSQL上でテキストのFuzzy Searchを試した。そのときは fuzzystrmatch や pg_trgm といったモジュールが活躍していた。 では、同じことをHiveで実現するとどうなるだろう。 データ 適当にテーブル sample をつくっておく: hive> CREATE TABLE sample AS > SELECT 1 AS id, 'I live in Tokyo.' AS document > UNION ALL > SELECT 2 AS id, 'Are you happy?' AS document > ; hive> SELECT * FROM sample; OK sample.id sample.document 1 I live in Tokyo. 2 Are you happy? Time taken: 0.066 seconds,
![HiveでテキストのFuzzy Search](https://cdn-ak-scissors.b.st-hatena.com/image/square/541916615021bf6b37ccf8f01d1cbada74bd1f8c/height=288;version=1;width=512/https%3A%2F%2Ftakuti.me%2Fimages%2Fthumbnail.png)