タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

fulltextに関するtvskのブックマーク (2)

  • まだ日本語全文検索で消耗してるの? - Qiita

    この記事は InnoDB のフルテキストインデックスで日語 NGRAM の続きです。 以降↑の記事を「前回の記事」と呼称します。 例によって実験しつつ記述しています。整合性や内容の保証はできません。 検証に使ったのは CentOS 7, mysql 5.7.9 です。 前回の記事は何をしているのか 端的に言えば下記です。 文字列を ngram 化するファンクションを定義 全文検索したい複数カラムを結合して ngram 化した文字列を格納するカラムを定義 トリガーで↑のカラムに ngram 化した文字列を放り込む ↑↑のカラムに対して FULLTEXT INDEX を張る 検索時に ↑↑↑のカラムに対して MATCH AGAINST 検索を行うことで全文検索 とまぁ色々めんどいことをしています。 特に筋ではないトリガーとファンクションの定義が嫌。 mysql 5.7.9 には・・・ とこ

    まだ日本語全文検索で消耗してるの? - Qiita
    tvsk
    tvsk 2018/10/11
    5.7 で使いやすくなった全文検索
  • MySQL 5.7.6のInnoDB日本語全文検索 ngram

    日々の覚書: プレビュー "MySQL 5.7.6のInnoDB語全文検索 MeCab Plugin" に引き続き、今度はngramなトークナイザー。ドキュメントは ここ 。 MeCab Pluginと違って特にINSTALL PLUGINとかせずに即使える。 mysql> ALTER TABLE articles ADD FULLTEXT KEY (title, content) WITH PARSER ngram; Query OK, 0 rows affected (6 hours 25 min 20.67 sec) Records: 0 Duplicates: 0 Warnings: 0 ( д ) ゚ ゚ 6時間半!? しょうがないとはいえ、MeCabのときは1時間半でお釣りが来てたのにと思うとちょっとしょんぼり。 時間もさることながら、このやり方(データをインポートしてから

    tvsk
    tvsk 2018/10/11
    全文検索のFULLTEXTインデックスの再構築のパフォーマンス
  • 1