タグ

information retrievalに関するwebmarksjpのブックマーク (3)

  • mixiが自社開発の検索エンジンに移行、ウェブ検索はYSTに

    ミクシィは7月2日、ソーシャルネットワーキングサービス(SNS)「mixi」内の検索機能をgooから自社開発の検索エンジンに切り替えた。 今回の検索エンジン移行により、mixi内における日記やコミュニティの検索機能はすべて自社開発の検索エンジンによって提供される。 この検索エンジンは「文字 N-gram」をいう手法を用いたもので、従来の検索エンジンに比べて検索漏れが少ないという。mixiの日記には、辞書に掲載されていない文字が見られたり、文字がきちんと並んでいなかったりする。こういった場合に効率よく検索できる技術として文字 N-gramによる検索エンジンを導入したという。 同時に、ウェブ検索のエンジンも「Yahoo! Search Technology」(YST)に移行した。この検索エンジンはヤフーでも採用されている。 オーバーチュアは今回のYST導入を機に、mixi のコミュニティ検索、

    mixiが自社開発の検索エンジンに移行、ウェブ検索はYSTに
  • 国産検索エンジンはなぜ必要なのか?--経産省担当者に聞く - CNET Japan

    経済産業省は7月、国内の総合電機メーカーや大学など38団体とともに、国産の検索エンジンを開発する「情報大航海プロジェクト・コンソーシアム」を設立する。企業や大学がこれまで研究してきた検索技術やノウハウを持ち寄り、成果物はオープンソースとして広く公開する考えだ。 検索エンジンの分野では現在、GoogleYahoo!Microsoftといった米国の大手企業が火花を散らしている。この分野で国が音頭を取って研究開発を進める狙いは何なのか。経済産業省 商務情報政策局 情報政策ユニット 情報経済企画調査官で、今回のプロジェクトを推進した立役者である八尋俊英氏に聞いた。 --情報大航海プロジェクト・コンソーシアムを結成した狙いはどこにあるのでしょう。 まず前提として、現在は情報がとにかく山のように沢山あり、その中から必要なものだけをうまく抽出して知識化する技術が求められているということがあります。こ

    国産検索エンジンはなぜ必要なのか?--経産省担当者に聞く - CNET Japan
  • Introduction to Information Retrieval #1 の復習資料 - naoyaのはてなダイアリー

    Introduction to Information Retrieval の 輪講 に参加しています。自分はこの輪講で復習係を担当させてもらっています。毎回輪講の頭に、前回分の内容をサマリしてプレゼンテーションする係です。 これから輪講の度、作成した資料を公開していきたいと思います。第一回目の資料を以下に置いておきます。 http://bloghackers.net/~naoya/iir/ppt/iir_01.ppt (ppt, 274K) 第一回目は、書籍の第一章 "Boolean Retrieval" の復習です。大規模データを検索する検索システムにおいて、転置インデックスはどのように作成されるか、またブーリアン検索 (「渋谷 and ラーメン」という検索クエリの類) はどう処理されるかといったことの導入部です。 先週末の第二回目は、転置インデックス作成時の前処理部分(トークナイズ、

    Introduction to Information Retrieval #1 の復習資料 - naoyaのはてなダイアリー
  • 1