運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します。個別にライセンスが設定されている記事等はそのライセンスに従います。
そこで今日は、そのテーマをさらに進めて「垂直検索による細分化」の可能性について考察してみようと思う。 iMedixは、現在市場に出ている中でもとりわけ刺激的な垂直検索エンジンだ。crunchiesの最優秀新規ベンチャー企業賞を受賞しただけではなく、市場でも優秀な専門家の多くから非常に高い評価を得ている。気に入らないという人もいるようだが、ビジネスチャンスに恵まれた市場で、開発の面でもマーケティングの面でも実にうまくやっている。 iMedixは「健康」というテーマに絞った検索サービスを提供しているのだが、そのサービスにおける最大の「売り」は、検索結果と連携するソーシャルネットワークを組み込んでいることだ。 上図は僕が「allergies(アレルギー)」で検索した結果だが、同じテーマに興味をもっている人、その話題について話したいと思っている人のリストがサイドバーに表示されている。これは、健康に
Selain memiliki prediksi yang sangat akurat, Sbobet kini mempunyai jadwal Piala Dunia 2022 lengkap. Yang memberikan berbagai informasi terkait turnamen yang hanya di adakan selama empat tahun sekali ini. Karena tentunya tidak semua website memberikan beragam jadwal SBOBET88 yang akurat. Berbeda dengan Sbobet, saat ini memang menjadi yang paling andalkan dalam soal dunia olahraga sepakbola. Mengin
高野教授は「人間ができることを機械が10倍のスピードでやってくれるなら、たとえ質が7割落ちてもそっちを選ぶ人は多い」と嘆く 「Googleは確かに便利だが、大きな問題がある」。国立情報学研究所(NII)の高野明彦教授は指摘する。「プロの手による知識を、そこここで台無しにしている」というのだ。 Googleは、被リンク数などを尺度とした独自のアルゴリズムでサイトの重要度を機械的に判定するため、検索結果の表示順と情報の信頼性は必ずしも比例しない。これがGoogleの「唯一最大の問題」という。 「Google上では、記者が現場を歩いて裏を取った新聞記事も、ネット上の情報を写しただけのブログ記事も同列。情報の質や、経過の“差異”が失われる」。ネットが誕生するはるか以前から培われてきたプロの手法も、ロボット検索の前には無力だ。 高野教授がこれまでに開発してきた検索システムも、同じような問題に直面して
検索エンジン相関図 2008年3月版です。 相関関係を見直して一部サイトを削除したほか、細かな間違いを修正しています。 PC 検索エンジン 主な動き PCディレクトリ型検索エンジンのDMOZ(Open Directory)の関係を変更しました。同サイトは一応、GoogleとAOLにディレクトリを提供しているものの、Googleは検索タブからディレクトリへのリンクを削除したため、一般ユーザーがGoogleにてDMOZデータを参照する機会がほとんどありません。AOLも同様です。よって、相関図上はDMOZの提携関係は「なし」と表記しています。DMOZはそのデータの鮮度や編集上の問題から近年は存在意義がないのではないか?といった意見もありますが、今後どういった価値をユーザーに提供していくのかを考える時が来ているのかも知れません。 PC ロボット型検索エンジン相関図 モバイル検索エンジン 主な動き
This is the companion website for the following book. Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. You can order this book at CUP, at your local bookstore or on the internet. The best search term to use is the ISBN: 0521865719. The book aims to provide a modern approach to information retrieval from a co
Introduction to Information Retrieval の 輪講 に参加しています。自分はこの輪講で復習係を担当させてもらっています。毎回輪講の頭に、前回分の内容をサマリしてプレゼンテーションする係です。 これから輪講の度、作成した資料を公開していきたいと思います。第一回目の資料を以下に置いておきます。 http://bloghackers.net/~naoya/iir/ppt/iir_01.ppt (ppt, 274K) 第一回目は、書籍の第一章 "Boolean Retrieval" の復習です。大規模データを検索する検索システムにおいて、転置インデックスはどのように作成されるか、またブーリアン検索 (「渋谷 and ラーメン」という検索クエリの類) はどう処理されるかといったことの導入部です。 先週末の第二回目は、転置インデックス作成時の前処理部分(トークナイズ、
前々回の記事「百度、本気で日本の検索エンジン市場に参入する けど」の本文中で、Googleの検索結果が同じキーワードでも朝と夜で変化するという話を書きましたが、それについて説明している日本語の記事があまりないので、ここで解説をしておきます。この技術はもともと、米New York TimesのGoogleへのインタビューの中で紹介されたもので、QDF(query deserves freshness)と呼ばれるものです。日本国内では2007年4月以降、Googleウェブ検索によく「5分前」「1時間前」「4時間前」といったラベルつきのリンクが掲載されることがありますが、これはQDFアルゴリズムによるものです。 --------------- GoogleやYahoo!で検索した時に私たちが目にする検索結果の並び順というのは、ある時点におけるウェブページのランク付けの結果に基づいたものだ。ウェブ
きょう世界第3位の検索エンジン、Baidu(百度)の日本語サイトの運用が始まり、それに合わせて中国本社のCEO、Robin Li氏が来日した。そのミーティングにまねかれたので行ってみたら、記者会見ではなく、佐々木俊尚氏やDan氏など、おなじみのブロガーばかり10人ほど。ブログから1次情報の出る日が来たのかもしれない。 気の毒な大手メディアのために、とりあえず第一報を提供しておくと、Li氏は39歳。NY州立大学で修士号をとった、絵に描いたようにハンサムな中国の新世代エリートだ。Baiduの中国内シェアは70%、世界市場シェアは5%で、Google、Yahoo!に次ぐ。日本での戦略は、Yahoo!などに対抗するのではなく、「セカンド・サーチエンジン」をねらうという。特徴は「遊ぶ」検索サービスで、動画検索や画像検索に力を入れる。漢字文化圏どうしの強みを生かして、検索精度も上げる。 ただし「キ
米ウィキアは2008年1月7日、オープンソースで開発を進めている検索エンジン「Wikia Search」のアルファ版を公開した。処理の仕組みを公開すること、ユーザーからのフィードバックを受けて検索結果を改良していくことなどを特徴とする。ウィキアは、ユーザーの手で作られる知識共有型の百科事典サイト「Wikipedia」を創始したジミー・ウェールズ氏らが2004年に設立した会社。Wikipediaのようにユーザーの広い支持を得られれば、インターネット検索の分野で台風の目となる可能性がある。 「ウィキアの検索エンジンは、オープンで、透明性の高い、公開された方法によって、信用ある利用者のコミュニティーからのフィードバックによって作られるものと考えています」――ウィキアは、Wikia Searchの目指すところをそう説明する。 具体的には、(1)透明性(2)コミュニティー(3)品質(4)プライバシー
Googleでうまく検索できないときに、役立つかもしれない検索エンジン8つ 管理人 @ 12月 3日 10:26am 検索Tips, 検索エンジン Googleはとても優れた検索エンジンですが、そのGoogleを駆使しても、自分の欲しい検索結果を得られないことがあるかもしれません。そのような時に、試してみる価値のある代替検索エンジンをWeb Worker Daily の記事よりご紹介します。 EVERYZING オーディオや動画の情報を検索するときに便利。ポッドキャストやビデオキャスト内での言葉をテキストにして検索対象になっているので、メディアの内容から検索することができる。筆者が試したところ、日本語の検索に関しては、微妙。でも動画の中身まで検索するというのは、需要はありそうですね。タイトルだけすごくて、中身はおもしろくない動画もありますから。 Blinx 様々な動画共有サイトから1800
転置インデックスによる検索システムを作ってみよう! 2007-11-26-5 [Algorithm][Programming] 転置インデックス[2007-06-17-6]による検索システムの実装は パフォーマンスを無視すれば意外と簡単です。 それを示すために Perl で簡単な検索システムを作ってみました。 検索方式は転置インデックス(Inverted Index)、 ランキングには TF-IDF[2005-10-12-1] を用いました。 検索対象ファイルは一行一記事で以下のフォーマットとします。 [記事ID][SPC][記事内容]\n 記事IDは数字、記事内容は UTF-8 の文字で構成されるものとします。 以下のようなサンプル test.txt を用意しました。 1 これはペンです 2 最近はどうですか? 3 ペンギン大好き 4 こんにちは。いかがおすごしですか? 5 ここ最近疲れ
この文書は自然検索に対する最適化のリーダー39人の英知を結集したものだ。彼らは、Googleの順位決定アルゴリズム(検索エンジンが検索結果を並べる順番を決める方法)を構成するさまざまな要因について投票した。その結果、この上なく価値の高い情報ができあがった。もちろん、200種類以上あるといわれる要因のすべてが含まれているわけではないが、私見では、Googleのアルゴリズムに関して必要な90%~95%の知識がここにふくまれるはずだ。 順位決定の要因に加え、Googleの順位決定に関してパネリストに尋ねた4つの質問への回答がこの文書の最後に示してある。これだけ優秀な人たちに協力してもらったのだから、貴重な回答をもう少し得られずにはいられなかったのだ。 ※注:この文書は、Googleのアルゴリズムをリバースエンジニアリングすることを試みるものでなければ、ウェブ開発者やウェブマーケターにサイトの最適
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く