タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

IRに関するmai_squareのブックマーク (10)

  • はてなブックマーク全文検索機能の裏側

    そろそろ落ち着いて来たころ合いなので、はてなブックマーク全文検索機能の裏側について書いてみることにします。 PFI側は、8月ぐらいからバイトに来てもらっているid:nobu-qと、id:kzkの2人がメインになって進めました(参考: 制作スタッフ)。数学的な所は他のメンバーに色々と助言をしてもらいました。 はてな側は主にid:naoyaさんを中心に、こちらの希望や要求を聞いて頂きました。開発期間は大体1〜2か月ぐらいで、9月の上旬に一度id:naoyaさんにオフィスに来て頂いて合宿をしました。その他の開発はSkypeのチャットで連絡を取りながら進めてました。インフラ面ではid:stanakaさん、契約面ではid:jkondoさん、id:kossyさんにお世話になりました。 全文検索エンジンSedue 今回の検索エンジンはSedue(セデュー)という製品をベースにして構築しています。Sedu

    はてなブックマーク全文検索機能の裏側
    mai_square
    mai_square 2008/12/16
    はてブの全文検索はCSA
  • 情報検索ことはじめ〜教科書編〜 - シリコンの谷のゾンビ

    2011-01-18追記 教科書編その2 にて2011年版のIR教科書を紹介しています 情報検索(IR)の勉強を格的に始めて8ヶ月.大体どんな分野があって,どんなことを勉強すればいいのかわかってきた(と思う).この気持ちを忘れないうちにメモしておこう.以下,若輩があーだこーだ言ってるだけなので,間違いや他に情報があれば,ぜひコメントをお願いします. # ここで述べている情報検索とは,コンピュータサイエンスの一分野としての情報検索です.図書館情報学の側面は一切扱っていません,あしからず. というわけでまず教科書編. 腰を入れて勉強する場合,基礎づくりのためには教科書選びがいちばん重要だと思っている.自分の知っている限り,情報検索における教科書の選択肢はそれほど広くはない.以下に紹介するは,情報検索を学ぶ上で「買い」の.これらを読めば,最新の論文を読めるだけの土台はできるし,専門家と議

    情報検索ことはじめ〜教科書編〜 - シリコンの谷のゾンビ
  • 自然言語検索エンジン「Powerset」、Live Searchとの統合へ第一歩

    Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

  • オープンソース検索エンジン「Wikia Search」、検索結果の編集機能を追加

    Wikiaが米国時間6月3日午前、物議を醸している検索エンジン「Wikia Search」に、画期的な機能を追加した。 同日提供開始されたこの新機能により、Wikia Search上で検索した結果が十分でないと思われる場合に、ユーザーが検索結果を編集できる。あるユーザーが加えた修正は、そのユーザーが実行する検索の結果だけでなく、全ユーザーによる検索の結果に反映されることになる。 Wikia Searchは、マシンでインデックス化された約3000万ページの小規模なサブセットで立ち上げ、これをベースにユーザーが検索結果を拡充できるようにする。Wikia(およびWikipedia)の共同創設者であるJimmy Wales氏は、ウェブを「すべてクロールしたものとは言い難い」ことを認めているが、これは出発点だ。 Wikia Searchでユーザーが行える編集は広範囲にわたっている。検索結果ページで、

    オープンソース検索エンジン「Wikia Search」、検索結果の編集機能を追加
  • 1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

    最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めのです。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

  • Introduction to Information Retrieval

    This is the companion website for the following book. Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. You can order this book at CUP, at your local bookstore or on the internet. The best search term to use is the ISBN: 0521865719. The book aims to provide a modern approach to information retrieval from a co

  • 連載:検索エンジンを作る|gihyo.jp … 技術評論社

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    連載:検索エンジンを作る|gihyo.jp … 技術評論社
  • 検索エンジンのアルゴリズムとは? 過去6年の変遷にみる順位決定の仕組み | Web担当者Forum

    アルゴリズム検索の結果を相手に仕事をしている検索マーケティング担当者の大多数は、自分たちが少なくとも検索エンジンの「最新アルゴリズムを把握している」と主張しているし、僕がこれまでに聞いた(あるいは、そういう意味で言えば、担当した)クライアント仕事では、9割方この話が少なくとも1回は話題に上っていた。 しかし、この点については、まだ多くの点で当のことがわかっておらず、最近SEOに手を染めたばかりの人たちにとっては、おそらく最も気の重い側面だろうと思う。 というわけで、みんなの苦労を少しでも軽くするため、しょっちゅう変わり続ける検索エンジンの検索結果算定式に、どうすれば遅れを取らずにいられるかという問題に関して、みんなが持つ共通の疑問に答えておいたほうがいいんじゃないかと思ったんだ。 アルゴリズムとは何か? グーグル、ヤフー、マイクロソフトは、それぞれどのようにして、検索アルゴリズムを検索結

    検索エンジンのアルゴリズムとは? 過去6年の変遷にみる順位決定の仕組み | Web担当者Forum
    mai_square
    mai_square 2008/03/26
    ランキングアルゴリズム
  • 検索結果の「鮮度」が変わる、Google "QDF"アルゴリズムの仕組み:渡辺隆広のサーチエンジン情報館

    前々回の記事「百度、気で日の検索エンジン市場に参入する けど」の文中で、Googleの検索結果が同じキーワードでも朝と夜で変化するという話を書きましたが、それについて説明している日語の記事があまりないので、ここで解説をしておきます。この技術はもともと、米New York TimesのGoogleへのインタビューの中で紹介されたもので、QDF(query deserves freshness)と呼ばれるものです。日国内では2007年4月以降、Googleウェブ検索によく「5分前」「1時間前」「4時間前」といったラベルつきのリンクが掲載されることがありますが、これはQDFアルゴリズムによるものです。 --------------- GoogleYahoo!で検索した時に私たちが目にする検索結果の並び順というのは、ある時点におけるウェブページのランク付けの結果に基づいたものだ。ウェブ

    検索結果の「鮮度」が変わる、Google "QDF"アルゴリズムの仕組み:渡辺隆広のサーチエンジン情報館
  • 企業向け検索エンジン

    Googleや米Oracleなどが注力している企業向けの検索エンジン。こう呼ばれる製品の構成要素は,「クローラ」「サーチャ」「ビジュアライザ」の三つです。気になる「検索漏れ」や「ノイズの量」は,言語解析方式に左右されます。また,利用者の利便性は,辞書やインデックスの作り方次第で決まります。 こうした,[知る][選ぶ][使う]ポイントを解説します。 <目次> 第1回 言語解析方式は3種類 第2回 ノイズを減らす「ランキング」 第3回 JTBの選択理由 第4回 同じ製品でも利便性は雲泥の差

    企業向け検索エンジン
  • 1