タグ

検索エンジンに関するkamatama_41のブックマーク (3)

  • クックパッドの検索の裏側 - クックパッド開発者ブログ

    初めまして、インフラストラクチャー部の加藤 (@EugeneK) です。 クックパッドでは現在178万ものレシピが公開されていますが、目的のレシピを探すために検索機能を提供しています。 今回は検索機能の裏側の仕組みについて、インフラストラクチャーの観点からお話ししようと思います。 全ての検索機能を支えるSolrと周辺のアーキテクチャ クックパッドにはレシピの検索だけでなく様々な検索機能がありますが、その全てはSolrを活用して実装されています。 以前はMySQL Tritonnによる全文検索機能を使用していましたが、2011年頃からSolrに切り替わりました。 クックパッドではSolrをマスタ - スレーブ構成にすることで冗長性と負荷分散を実現しています。以下の構成図をご覧ください。 マスタとスレーブの間には、リピータと呼ばれる検索インデックスを中継するためだけの役割のサーバがいます。この

    クックパッドの検索の裏側 - クックパッド開発者ブログ
  • Google / Yahoo! / Bingのスニペットの作られ方

    検索結果に表示されたウェブページの簡潔な説明文を、検索エンジン用語で「スニペット」と呼びます。 スニペットは、検索結果でのクリックを誘うのに重要な役割を果たします。 何を基にしてスニペットは作られるのでしょう? まとめてみました。 Googleのスニペット Googleは基的に meta descriptionタグ の記述が使われます。 Matt Cutts(マット・カッツ)氏によれば、以前よりも meta descriptionタグの記述を利用する傾向が強まっているとのことです。 検索キーワードに対してより適切だと判断したときは、コンテンツの中からも引っ張ってきます。 したがって、同じページであっても検索キーワードによって検索結果でのスニペットが変わってくることもあります。 Googleのスニペットは通常、最大で半角210文字前後ですが、キーワードの語数が多い検索では文量が増えます。

    Google / Yahoo! / Bingのスニペットの作られ方
  • 検索エンジンの常識をApache Solrで身につける

    表のような転置インデックス完成後は、クエリに対する結果を返す処理は簡単です。例えば、ユーザーが「Vim」というクエリを発行すると、検索エンジンは「Vim」を含む文書IDリストを返します。表では文書IDの「2」を返します。 検索エンジンを取り巻く7つの技術 検索エンジンのコア技術は前節で紹介したインデックスです。しかし実際に、検索インデックスだけで構成する検索エンジンから、検索サービスを構築するには多大なコストが掛かります。以下の節で検索エンジンを利用したシステム、検索サービスを構築する際に便利なコンポーネントを紹介します。 これらの機能のいくつかは、多くの検索エンジンが組み込んでいます。一方で、簡素な検索エンジンは、以下で紹介するコンポーネントをサポートしていないため、ユーザーが独自に開発するか、その機能を持つコンポーネントを組み込む必要があるものもあります。 【1】トークナイザ 検索エン

    検索エンジンの常識をApache Solrで身につける
  • 1