タグ

検索に関するsh-2のブックマーク (4)

  • クックパッドの検索の裏側 - クックパッド開発者ブログ

    初めまして、インフラストラクチャー部の加藤 (@EugeneK) です。 クックパッドでは現在178万ものレシピが公開されていますが、目的のレシピを探すために検索機能を提供しています。 今回は検索機能の裏側の仕組みについて、インフラストラクチャーの観点からお話ししようと思います。 全ての検索機能を支えるSolrと周辺のアーキテクチャ クックパッドにはレシピの検索だけでなく様々な検索機能がありますが、その全てはSolrを活用して実装されています。 以前はMySQL Tritonnによる全文検索機能を使用していましたが、2011年頃からSolrに切り替わりました。 クックパッドではSolrをマスタ - スレーブ構成にすることで冗長性と負荷分散を実現しています。以下の構成図をご覧ください。 マスタとスレーブの間には、リピータと呼ばれる検索インデックスを中継するためだけの役割のサーバがいます。この

    クックパッドの検索の裏側 - クックパッド開発者ブログ
  • SEO業界の都市伝説 クラスCのIPアドレス分散 - はてな村定点観測所

    2014-05-24 SEO業界の都市伝説 クラスCのIPアドレス分散 何か最近、業界の過去の黒歴史を語ったりするキャラとして定着してスミマセン。 バッドノウハウとして生温かく見守って頂ければと思います。 黒歴史で思い出したのが、SEO業界の「IPアドレス分散」。 「IPアドレス分散」ってご存じでしょうか? 数年前まで検索エンジンのSEO対策には大きく「内部対策」と「外部対策」がありました。大まかに言って、内部対策は、WEBサイト内のテキストやタグやリンクによって対策キーワードの順位を上げること。外部対策は、外部からのリンクを受ける(被リンク)によってサイトの価値を高めていくことでした。 そして外部対策として、形態素解析した日語をマルコフ連鎖でダミーテキストに変換することなどは以前書いた通りです。 SEO業界では割とこういう黒い手法を使って、外部リンク獲得用のサイトを量産していました。数

    SEO業界の都市伝説 クラスCのIPアドレス分散 - はてな村定点観測所
  • Elasticsearchチュートリアル - 不可視点

    目的 検索用サーバーとして最近注目されているElasticsearchですが、ついに1.0 RC1がリリースされたそうです。 Googleトレンドを見ても、この分野で先行するApache Solrに迫る勢いを感じます。 そういうわけで私もElasticsearchについて興味を持って調べてみましたが情報がちょっと少ないですね… 「調べたけど断片的な情報しかない」 「公式doc英語だし、専門用語が多すぎてわからん」 「え、できること多すぎ。よくわからん。どれが重要?」 と言った感じで、最初ちょっと大変… そこで調べ始める人が、概観をつかむためのチュートリアルをつくろうと思います。 コマンドを全部実行する必要ありません。用語をおさえることで調べものが捗ることがひとつのゴールです。 自分の理解の整理も兼ねています。間違ってる箇所あったら教えて下さい。 part 1:ESを使ってレストラン検索を作

    Elasticsearchチュートリアル - 不可視点
  • RubyでただのArrayだと思ってデータを追加したつもりなのに気がついたら全文検索出来ていた・・的なものを作った - ブログのおんがえし

    続きを書きました。 Ruby Advent Calendar 22日目の記事です RroongaというRubyで使える全文検索エンジンがあって愛用しているのですが、使う前の準備でカラム指定やデータ型を指定したり、全文検索のためのインデックステーブルを作るのが少し大変でした(大規模なアプリケーションの時はしっかり定義出来るので便利なのですが)。 普段使いで全文検索するために、実験的にRubyのArrayのように使えるようにしてみました。 インストール Rroongaを使うにはgemのインストールが必要です。他の全文検索エンジンと違ってそれ以外のソフトウェアのインストールが不要なのがいい所です。Windowsでも問題なく動きます。 $ gem install rroonga 今回書いたコードは以下にまとめてあります。 ongaeshi/grn_array - GitHub $ git clon

  • 1