タグ

検索エンジンに関するkunimiyaのブックマーク (9)

  • 140行で作る分散リアルタイム検索エンジン(Twitter Streaming API対応) - 古橋貞之の日記

    マトモに使えるRPCライブラリ MessagePack-RPC for Ruby のバージョン 0.2.0 をリリースしました! 新たにコネクションプーリングの機能を追加しました。一度接続したコネクションを共有して使い回すことができます。コネクションを何度も張り直す負荷と遅延を削減でき、リソースの消費も抑えられます。 また、不意に切断されたコネクションを自動的に再接続する機能を導入し、信頼性を向上させています。 これを使って何か作ってみようと言うことで、twitterのリアルタイム検索エンジンを作ってみました。日語を検索できないなど機能は貧弱ですが、プログラム全体がわずか140行に収まっています(クローラ27行、インデクサ48行、クラスタ管理ノード37行、検索クライアント28行)。 新しいつぶやきを受信するたびに、リアルタイムで転置インデックスを作成していきます。インデックスを作成するノ

    140行で作る分散リアルタイム検索エンジン(Twitter Streaming API対応) - 古橋貞之の日記
  • “Wolfram|Alpha”、データセットをオープン化へ?

    理論物理学者で数学ソフトを扱うWolfram Researchのスティーブン・ウルフラム氏が開発した計算知識 (computational knowledge)エンジン“Wolfram|Alpha”が、APIなどにより、データセットをオープン化する予定であると、英ガーディアン紙やCNET Newsが報じています。 Wolfram Alpha to open data feeds – guardian.co.uk 2009/8/28付けの記事 http://www.guardian.co.uk/news/datablog/2009/aug/28/searchengines-internet Wolfram|Alpha、データフィード向けにAPIを提供へ–英報道 – CNET Japan 2009/8/31付けの記事 http://japan.cnet.com/news/media/story

    “Wolfram|Alpha”、データセットをオープン化へ?
  • Expired

    Expired:掲載期限切れです この記事は,ロイター・ジャパンとの契約の掲載期限(30日間)を過ぎましたのでサーバから削除しました。 このページは20秒後にNews トップページに自動的に切り替わります。

  • johokanri.jp

    johokanri.jp 2019 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

  • ゲノミクス研究から誕生、「ディープ・ウェブ」を検索するエンジン『DeepDyve』 | WIRED VISION

    ゲノミクス研究から誕生、「ディープ・ウェブ」を検索するエンジン『DeepDyve』 2008年11月13日 IT コメント: トラックバック (0) Chris Snyder 関係記事がどのように関連するかを図示する機能もある ヒトゲノム計画に参加する科学者たちが立ち上げた研究向け検索エンジンは、『Google』でさえも未踏の領域、「ディープ・ウェブ」に到達すると主張している。 米DeepDyve社の検索エンジン『DeepDyve』は、他の検索エンジンからは拾い上げられないデータの99%(後述するカリフォルニア大学バークレー校の調査を引用した自社評価)を検索するように設計されている。 他の検索エンジンは、主に人気の解釈に基づいてページを返しており、ページが見つかる場合しか機能しない。有料会員しか閲覧できないコンテンツや、ページランクを稼げるほど十分な数のサイトにリンクされていないページなど

  • 404 - gooラボ

    お探しの情報は見つかりませんでした。 gooラボ gooトップ 同じ状態が続く場合はお手数をおかけしますが、goo事務局までお問い合わせください。 goo事務局

    kunimiya
    kunimiya 2007/09/13
    前から実装してほしいことをやってくれた!精度はもうちょっとあがってほしいところ
  • 日本が目指す「Google対抗エンジン」は成功するか? | WIRED VISION

    が目指す「Google対抗エンジン」は成功するか? 2007年9月 7日 IT コメント: トラックバック (0) Adario Strange 2007年09月07日 米Google社が検索市場を支配していることに、極東の隣人である日人たちは恐れを抱いている。 日のハイテク企業が集まって、Google社に対抗するための新しいコンソーシアムを立ち上げたのはそのためだ。 ネット版『Financial Times』紙の報道によると、このコンソーシアムはおよそ1億3000万ドルの予算をプロジェクトのために計上しており、NTTデータ、トヨタIT開発センター、トヨタマップマスター、NEC、日立製作所、ソニーコンピュータサイエンス研究所などの企業が加わって、さまざまな検索コンポーネントの開発に取り組むという。 しかし、この計画には大きな問題が1つある――それは、日のハイテク業界自体が抱える問

    kunimiya
    kunimiya 2007/09/10
    >コンソーシアムの企業にとってはコントロールしやすく、ユーザーにとっては目新しさの乏しいような検索エンジンが生まれ、日本製品に詰め込まれるようになるだろう。
  • 検索エンジンの拒否をする設定

    sorry Japanese only 最終更新日 2004/10/09 page size = Mbyte 関連するページ 許せないクローラー ファイルの内容を表示する 見て欲しくない人を拒否する設定 .htaccessを使った個別に拒否する方法 検索エンジンの拒否をする設定 googleyahooなど、検索エンジンにクロールさせず、検索にヒットしないようにする方法は以下の通りです。 サーバーのルートへ robots.txtと言うテキストファイルを置き、以下の内容を書き込んでおく。 サーバーのルートへ置いておかなければ意味がありません。 私の場合だったら miya0.dyndns.org/robots.txtって意味です。 その場所へ置けない、プロバイダー上の hpなどの場合は、各ページへ以下のような行を追加しておくと良いです。 この行を htmlソースの <head>部分へ書いてお

  • 想-IMAGINE Book Search | 多様な情報源の想いを連ねて発想しよう!

    想 -IMAGINE- たとえば、知識、記憶、デジタル DB list Web Search DB LIST Copyright (C) 2006 Association Press All Right Reserved. Web Search 言葉や文章を入力してください。 入力文章や選択された記事から連想検索します。 検索したいDBにチェックしてください。

    kunimiya
    kunimiya 2006/08/01
    NIIが開発した連想型検索エンジン。
  • 1