タグ

webとengineに関するSeacolorのブックマーク (7)

  • 全文検索エンジンgroongaについての発表資料を公開しました。

    2010年末に、3つに勉強会にて「全文検索エンジンgroonga」の紹介をさせていただきました。 第4回Solr勉強会 groongaを囲む夕べ ドワンゴ技術勉強会(2) MySQLについて それぞれの勉強会にて用いた発表資料を公開いたします。 groongaの紹介部分については使いまわしがバレバレですが、それぞれの勉強会の特性に合わせた味付けをしているので、ぜひご覧になっていただければ嬉しいです。勉強会当日のレポートをされている方もいらっしゃるようなので、興味のある方は検索してみるとよいでしょう。 また、groongaを囲む夕べに関しては、他の発表者さんの資料も以下のリンクから見ること...

    全文検索エンジンgroongaについての発表資料を公開しました。
  • 第10回 動的な索引構築 | gihyo.jp

    はじめに 今回からは、近年の話題や少し発展した話題について触れていく予定です。 第7回では、転置索引の静的な構築方法について触れました。今回は、索引に対して文書のインクリメンタルに追加していく方法について触れていきます。 動的な索引構築の必要性 第7回の復習になりますが、索引の構築方法には"静的"な方法と"動的"な方法が存在します。英語ではそれぞれ、Offline Index Construction、Online Index Constructionと呼ばれています[1]⁠。 文書が頻繁に追加される場合や索引が大規模な場合、文書の追加の度に索引を作り直すことは非常に高コストとなり現実的ではありません。このような場合は、動的な構築方法により索引をインクリメンタルに更新していくことで対応することができます。情報が絶えず追加されている近年のWeb上では、とても重要な構築方法となります。 メモリ

    第10回 動的な索引構築 | gihyo.jp
  • MOONGIFT: » 要導入検討!オープンソースのリコメンデーションエンジン「RichContext」:オープンソースを毎日紹介

    ※ 画像は公式サイトより これは面白い! Amazonの強さは物流システムやECサイトの使い勝手などもあるが、完全なコンピュータベースでのリコメンデーションにもその一因がある。ユーザの行動履歴を全て補足し、そのユーザにあった商品を提案することで購入につなげるシステムだ。 デモアプリケーション。記事を選択すると、別な記事を提案する これは何もECサイトに限らず、最近でははてなブックマークでも関連記事を載せるようになっている。ニーズの連結をはかることで、さらにユーザをつなぎ止めておくことができるようになる。 今回紹介するオープンソース・ソフトウェアはRichContext、オープンソースのリコメンデーションエンジンだ。なおライセンスはApacheライセンスをベースにしているが、修正して独自のライセンスになっているのでご注意いただきたい。 RichContextは専用のアプリケーションサーバを介

    MOONGIFT: » 要導入検討!オープンソースのリコメンデーションエンジン「RichContext」:オープンソースを毎日紹介
  • 元Google技術者、新たな検索エンジンを立ち上げ

    Googleエンジニアが立ち上げた企業Cuilが7月28日、従来とは異なる手法を使った新しい検索エンジンを発表した。 Cuil(「クール」と発音する)の検索エンジンは、従来のリンク分析やトラフィックランキングといった手法ではなく、Webページの内容を分析し、それに基づいて検索結果のランキングを決める。また類似の検索結果をグループ化し、検索結果を「雑誌スタイル」でテーマごとに表示したり、さらにカテゴリーごとに検索することもできる。 例えば「Harry Potter」を検索すると、検索結果ページは「すべての検索結果」「Harry Potter Books」「Harry Potter Games」などのテーマごとにタブで区切られ、右側には「Actors」「Movie Stars」「Directors」などのカテゴリーが表示される。 Cuilは「ほかの検索エンジンの3倍に上る1200億のWebペ

    元Google技術者、新たな検索エンジンを立ち上げ
  • 米Microsoft、自然言語検索技術の米Powersetを買収 | 経営 | マイコミジャーナル

    Microsoftは7月1日 (現地時間)、検索技術/ 自然言語技術を手がける米Powersetの買収合意を明らかにした。自然な話し言葉での検索を可能するPowersetの検索エンジンは、次世代の検索技術として注目されている。同社は現在の拠点である米サンフランシスコにとどまったまま、MicrosoftのSearch Relevanceチームに所属するという。 Powerset買収について、Microsoftの検索担当のシニアバイスプレジデントであるSatya Nadella氏は、検索に対して同じビジョンを共有していると強調する。ビジョンとは「検索やWebページ中のワードに含まれる意図や意味の理解を追加することで、検索を次のレベルへと引き上げる」だ。 現在の検索ユーザーは、数回の検索を繰り返したり、長く続く検索結果を何度もクリックしながら目的の情報にたどり着いている。これには2つの問題が影

  • Google App Engine が凄すぎる気がしてきた - Djangoへの片思い日記

    Google Developer Day 2008 に行ってきました。 で、基調講演聞いたあと、Google App Engine のコードラボに参加してきました。 まぁ簡単に言うと Hackathon です。 画像掲示板つくってみる ユーザ登録&認証 コメント付加 古いデータは消す な画像掲示板を書いてみました。 #!/usr/bin/env python # -*- coding: utf-8 -*- import wsgiref.handlers, cgi from google.appengine.api import images from google.appengine.api import users from google.appengine.ext import webapp,db class ImageAndText(db.Model): user = db.User

    Google App Engine が凄すぎる気がしてきた - Djangoへの片思い日記
  • Google、Yahoo!、MSがRobots.txtなどREP共通/独自内容公開 | エンタープライズ | マイコミジャーナル

    主要な検索サービスを提供しているGoogleYahoo!Microsoftの3社は3日(米国時間)、Robots Exclusion Protocol (REP)の現状を説明するとともに、それぞれが独自に提供しているディレクティブの説明を公開した。 コンテンツホルダが求めるのはどうすれば検索結果にコンテンツが有利に登場するかだが、逆に特定のコンテンツをどうすれば検索対象から除外できるかも求められている。この場合に使われるのがRobots Exclusion Protocol(REP)だ。robots.txtファイルに指定する方法やMETAタグで指定する方法などがある。これら方法はGoogleYahoo!Microsoftなど主要な検索エンジンサービスでサポートされており、検索エンジンアクセス制御方法のデファクトスタンダードとなっている。 ここ数年、GoogleYahoo!、Mic

  • 1