タグ

全文検索に関するrindenlabのブックマーク (4)

  • MySQLで全文検索をするために必要なこと - 小さな星がほらひとつ

    与えられたキーワードに合致するデータをデータベースから取得することを考えた時、完全一致であれば「=」で検索を行うと思います。 では与えられたキーワードを「含む」検索、つまり部分一致を行いたいのであればどうするか。最も簡単なのは「search_column like '%キーワード%'」といった形で、「like」を使いキーワードの前後にワイルドカードを与える方法でしょう。 ですがこれを何の気無しに使うのはちょっと危険。 上記のようなlike検索ではインデックスが利用されないため(※)、全レコードをスキャンします。 かつキーワードを部分一致で探したいようなカラムは、文章等の比較的大きなサイズであると考えられます。 そのため検索コストは大きく、数千〜数万行であればまだ良いかもしれませんが、数十万ともなると利用には耐えられないでしょう。(実体験) ※ただし前方一致検索であれば、最初のワイルドカード

    MySQLで全文検索をするために必要なこと - 小さな星がほらひとつ
  • 知識ゼロからElasticsearchを実践で使えるようになろう! - $shibayu36->blog;

    以前少しだけElasticsearchを触った時に、自分流Elasticsearch入門 - $shibayu36->blog; というElasticsearchに入門した時のメモをまとめていた。しかし、その頃はElasticsearchを使って完全に一人で一つの機能を作るというところまではいけなかった。 最近になってまたElasticsearchを一から導入する仕事をすることになった。この時以前自分がまとめた記事を読みながらやっていたのだが、実践で一から導入するためにはこの記事だけでは知識が足りなかった。 そこで、前の記事の知識をベースに、一から導入するために少しずつ学んでいき、自分のブログにまとめるなどのことをしてきたので、今回はその締めくくりとして、知識ゼロからElasticsearchを使えるようになるために学習したことについて書いておきたいと思う。 今回書くこと・書かないこと 今

    知識ゼロからElasticsearchを実践で使えるようになろう! - $shibayu36->blog;
  • 自分流Elasticsearch入門 - $shibayu36->blog;

    【2016/09/10追記】 勉強しなおして、Elasticsearchの知識についてさらにまとめた記事を書いたので、そちらを参照してもらうと良さそうです。 blog.shibayu36.org 最近Elasticsearchの勉強をした。ただ、入門のためどのような資料が適しているかを知るのが大変だった。そこでどのように勉強したかについてメモをしておく。少しまとめエントリー的なノリになりそう。 Elasticsearchの概念を知る 全文検索技術の基を知る Elasticsearchのドキュメントのたどり方を知る の順に学習を進めていった。 Elasticsearchの概念を知る Elasticsearchの学習を始めようとした時に、まずは基からということで以下のを読んでいた。 高速スケーラブル検索エンジン ElasticSearch Server (アスキー書籍) 作者:Rafal

    自分流Elasticsearch入門 - $shibayu36->blog;
  • Googleデスクトップで全文検索システムサーバを作ろう! | SEが気づいたお得なIT情報

    Googleデスクトップで全文検索システムサーバを作ろう!とは? 自分のパソコンや共有のファイルサーバにあるExcelやWord,PDF,Textなどの文書系のファイルをGoogle検索のような感じで検索できるようにしようというものです。ただし、Googleデスクトップは通常自分のパソコンでしか使うことができないので、複数のパソコンからみんなで同じGoogleデスクトップを使えるようにしようというのが今回の内容です。 http://desktop.google.co.jp/ja/features.html 以前、Namazuで前文検索システムを作ってみたのですが、検索結果が思った形にならなかったのであきらめていました。しかし、最近になってGoogleデスクトップで同じ様なことができるとわかって、喜んでいました。しかーし、Googleデスクトップは、ほかのマシンからネットワーク(Http)経

    Googleデスクトップで全文検索システムサーバを作ろう! | SEが気づいたお得なIT情報
  • 1