タグ

全文検索とslideに関するdai_yamashitaのブックマーク (4)

  • 誰でもわかる全文検索入門

    全文検索エンジンも、事前に検索対象のデータを調べてこのような索引を作っておくことで、高速な検索を実現しています。 インターネット検索の例 たとえばインターネット検索の場合、まず各サイトからデータを収集して、その中から索引に載せる単語を選んで索引を作ります。索引のデータは下の図の右側のような表になっています。各単語と、それがどのサイトのどこにあったのかを記録しておく形です。 検索の時は、この索引データを調べます。例えば利用者が「理解」という言葉で検索したら、索引の「理解」のところを調べます。そうすると「サイトAの8文字目と18文字目、サイトGの……」と出現場所がわかるので、すぐに結果を返せます。 なお、この図では索引の単語の並び方が適当ですが、実際にはと同じように「あいうえお順」などに並べておいて、すぐに単語を見つけられるようにしてあります。 索引にない単語 この仕組みの場合、索引にある単

    誰でもわかる全文検索入門
  • KMCの春合宿で「画像検索・閲覧システムの実装と全文検索SQL」の話をした - 私が歌川です

    speakerdeck.com スライド中のURLを踏んだりSQLをコピーしたりすることができるようにPDFも用意しました. (追記: SpeakerDeckのページにPDFをダウンロードできるリンクがあるのでそっちを使いましょう.クールなURIは変わらないのでこちらのURLも残しておきます.) (追記: URLのフォーマットに一貫性を持たせるためにリンクを差し替えました.クールなURIは変わらないので前のURLも有効にしています) 内容 このブログでも度々言及している,自分用の画像保存・共有BOT,ならびに画像検索システム「救い」の話をしています. BOT部分の実装をざっと見たり*1,全文検索SQLを検索窓への入力から組み立てる方法について言及したりしました. また,似たようなことをやっている人の様子や今後の課題についても言及しました. 最後に,Twitter Streaming API

    KMCの春合宿で「画像検索・閲覧システムの実装と全文検索SQL」の話をした - 私が歌川です
  • CROSS 2015 全文検索群雄割拠

    21. Copyright Elasticsearch 2014.Copying,publishing and/or distributing without written permission is strictly prohibited Jun Ohtani • Me, Jun Ohtani / Technical Adovocate lucene-gosenコ ミ ッ タ ー ElasticSearch Server日語版の翻訳 elasticsearch-extended-analysisの開発 http://blog.johtani.info 好き な飲み物: プレ ミ アムモルツ • Elasticsearch, founded in 2012 Products: Elasticsearch, Logstash, Kibana, Marvel, Shield Profess

    CROSS 2015 全文検索群雄割拠
  • Groonga改良型Ngramトークナイザー - Naoya Murakami - Rabbit Slide Show

    Page: 1 Groonga 改良型Ngram トークナイザー Naoya (@naoa̲y) 全⽂検索エンジンGroongaを囲む⼣べ5 2014/11/29 Groonga改良型Ngramトークナイザー Powered by Rabbit 2.1.2 Page: 2 自⼰紹介 ✓ Naoya (@naoa̲y) ✓ 数年ほど特許事務所勤務 ✓ 前は数年ほどユーザSIでインフラSE ✓ Groongaでプログラミングを学ぶ ✓ GroongaのCプラグインなら書ける Groonga改良型Ngramトークナイザー Powered by Rabbit 2.1.2 Page: 3 制作物 ✓ 特許の全⽂検索サービス を個⼈で制作 (中) ✓ 専門家以外でも有用な知財情報へ迅 速にアクセスできるように ✓ 権利の死活情報でも絞込みができ 侵害調査やフリーな技術調査が可能 ✓ 知財流通促進・フリ

    Groonga改良型Ngramトークナイザー - Naoya Murakami - Rabbit Slide Show
  • 1