タグ

検索エンジンに関するsawarabi0130のブックマーク (3)

  • WikipediaがGoogleに対抗する広告なしの検索エンジンを開発へ

    by Thomas 誰でも編集できるフリー百科事典「Wikipedia」を運営しているウィキメディア財団が、インターネット上で確実かつ信頼できる公開情報を見つけるための「Knowledge Engine by Wikipedia」を開発して、Googleが圧倒的優位にある検索エンジンの世界へ打って出るようです。 開発予算は約240万ドル(約2億7000万円)で、ジョン・S&ジェームズ・L・ナイト財団から2015年9月に2万5000ドル(約284万円)の支援を受けたことが明らかになっています。 File:Knowledge engine grant agreement.pdf - Wikimedia Foundation https://wikimediafoundation.org/wiki/File:Knowledge_engine_grant_agreement.pdf Knowled

    WikipediaがGoogleに対抗する広告なしの検索エンジンを開発へ
  • 検索エンジンの常識をApache Solrで身につける

    表のような転置インデックス完成後は、クエリに対する結果を返す処理は簡単です。例えば、ユーザーが「Vim」というクエリを発行すると、検索エンジンは「Vim」を含む文書IDリストを返します。表では文書IDの「2」を返します。 検索エンジンを取り巻く7つの技術 検索エンジンのコア技術は前節で紹介したインデックスです。しかし実際に、検索インデックスだけで構成する検索エンジンから、検索サービスを構築するには多大なコストが掛かります。以下の節で検索エンジンを利用したシステム、検索サービスを構築する際に便利なコンポーネントを紹介します。 これらの機能のいくつかは、多くの検索エンジンが組み込んでいます。一方で、簡素な検索エンジンは、以下で紹介するコンポーネントをサポートしていないため、ユーザーが独自に開発するか、その機能を持つコンポーネントを組み込む必要があるものもあります。 【1】トークナイザ 検索エン

    検索エンジンの常識をApache Solrで身につける
  • トップ100万件を除外した検索エンジン『MillionShort』 | 100SHIKI

    なんという逆転の発想。 MillionShortは、トップ100万件を除外して結果を表示してくれる検索エンジンである。 みんながしのぎを削っている検索上位ではなくて、あえてマイナーすぎる結果を探している人にはいいのかもしれない。 100万件ぐらいを除外するとスパム業者を避けつつ、当にマイナーなサイトを見つけることができる可能性が高まるだろう。 またオプションでトップ何件を除外するか、という設定もできる。デフォルトでは100万件だが、いろいろ試してみるといいのかも。 普通のやりかたでは見つからないサイトを見つけたいときにいかがですかね。

    トップ100万件を除外した検索エンジン『MillionShort』 | 100SHIKI
  • 1