タグ

technologyと検索エンジンに関するmirioxのブックマーク (9)

  • どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup

    Webの全体像を効率よく取り込み,分類する 「YSTのシステムは大まかに三つの機能に分かれます(図2)。最初は世界中のWebページをYSTのシステムに取り込む『クローリング(crawling)』という機能です」(Yahoo! JAPAN,リスティング事業部 検索企画室の宮崎光世氏,以下同)。 取り込むと簡単に言っても,Webページの数は膨大なうえ,更新の頻度や情報の質などがまちまちです。すべてのページに同じようにアクセスしていると非効率なことこの上ありません。そこで,限られた時間で質の良い検索ができるようにするための工夫をしています。例えば,クローリングを繰り返すうちに頻繁に更新されることがわかったページは短いサイクルでチェックし,ほとんど更新のないページはチェックの頻度を落とす,といったことをしているそうです。 ただ,更新の頻度が単に高いだけではダメです。重要性が高いと考えられるWebサ

    どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup
  • 検索エンジンが「ユーザーのその日の気分」を知る方法(下)

    佐々木俊尚氏が日のベンチャーにおけるWeb2.0ビジネス最前線を描く連載企画。Googleがまだ検索に利用していない“人間関係”や“心理学的分析”アプローチで新サービスを展開しようとしている2つの日のベンチャーを取り上げる。 検索キーワードには人間関係が反映される ソーシャルニュースサイト「newsing」を運営するマイネットジャパン社長の上原仁さんは言う。「自分がつながっている友人や家族、同僚ががいたら、その人に影響されて自分の興味もどんどん移っていくということは多い。単なるカスタマイズやパーソナライズではなく、そうした人間関係をソーシャルニュースに持ち込めないかと思うんですよね」 この連載の第10回で、「外界からの影響や、人の内なる精神的志向などをパラメーター化し、情報収集の精度を上げる方法はないのだろうか?」と書いた。人が情報収集をする際、何を求めているのかということを探ろうと

    検索エンジンが「ユーザーのその日の気分」を知る方法(下)
  • 検索エンジン技術がチューリング賞を射止める日

    10月31日は,今年(2006年)のチューリング賞の推薦の締め切り日である(詳細情報)。2006年のチューリング賞は誰が候補に名を連ねているだろうか。 チューリング賞は,ACM(Association for Computing Machinery)がコンピュータの発展に貢献した人に授与している賞である(詳細情報)。最近では,2003年がオブジェクト指向やパソコンの発展に寄与したアラン・ケイ,2004年はTCP/IPを開発したヴィントン・サーフとロバート・カーン,そして昨年は,Algol60やBNF(プログラミング言語の定義記法)を開発したピーター・ナウアが受賞している。 チューリング賞の歴史を振り返ると,ソフトウエアによる情報処理の効率化に貢献した技術の受賞が目立つ。そう考えると,今,インターネットを利用するうえでなくてはならないGoogleなどの検索エンジンを支えている技術も,将来はチ

    検索エンジン技術がチューリング賞を射止める日
  • パーソナライズ検索、グーグルが探し当てていない正解とは

    Googleが検索のパーソナライゼーションを目指している。 Googleは先頃、パーソナライゼーションを強化した検索機能を提供する一連の新サービスを発表した。しかし、ユーザーのことをより深く把握し理解しようとする同社の試みは残念ながら筋を外れている。 現状では、Googleは検索クエリを処理し、検索結果の適合度をユーザー個人の検索履歴のみに基づいて絞り込んでいる。しかし、このアプローチには欠陥がある。その欠陥について考えてみることは、パーソナライゼーションを深く理解するよい機会になる。また、「検索エンジンがこちらの興味や意向をわかっている」とユーザーに実感させるにはどのような手順を踏めばよいのかも明確になる。検索フィールドに単語を入力するとき、自分が探そうとしているものをお気に入りの検索エンジンが直感的に理解してくれることをだれもが願うものだ。それはまだ夢物語ではあるが、いくつかのプロセ

    パーソナライズ検索、グーグルが探し当てていない正解とは
  • メディア・パブ: Google,絶対優位の検索エンジン構築のため半導体設計に着手か

    Googleの検索エンジンの正体は謎に包まれている。公にされていないのでしかたないが,あまり根拠のない話が真実として出回っているのが現状である。でも,Googleの検索エンジン技術についてNew York Timesが解説したとなると,見ておかなければ・・。 今までも,同社開発者の論文や特許などをベースにして,Googleの検索エンジンを解説した記事は多かった。NYTimes.comの記事も,大筋はこれまでの推測記事と重なる点が多いが,個人的には初めて目にする話も少なくなかった。Googleの開発者への直接取材で,注目すべき点が幾つか明らかになっている。 大規模な分散コンピューティングのための技術として, MapReduceや the Google File System, the Google Work Queueを紹介しているが,既知の話である。また,YahooやMicrosoftの競

  • Googleはデータに何らかの手を加えている? コンテンツ時代のデータ像

    SGIは6月28日、東京・恵比寿のウェスティンホテル東京で「SiliconLIVE! Forum 2006」を開催した。同フォーラムの中から、「マルチメディア・コミュニケーション&データベース」と題したお茶の水女子大学理学部情報科学科の増永良文教授の基調講演を紹介する。 DBの研究開発はシステムからコンテンツへ移行 増永教授は「DBとは何か」の説明について、「DBには2つ意味がある。1つはDBのコンテンツ。もう1つは、Oracleなどデータを管理するDB管理システム」と解説した。そして、DBに関する最近の関心事について、「従来は、DB管理システムに関心が集まっていたが、最近は、データウエアハウスなどに蓄積したデータからどういった知識、ルールが出てくるのか、DBの中身に関心が移ってきた」と述べた。 「DBはわれわれが住んでいる世の中の“写し絵”だ。リレーショナルDBは表の形でデータを管理

    Googleはデータに何らかの手を加えている? コンテンツ時代のデータ像
  • 国産検索エンジンはなぜ必要なのか?--経産省担当者に聞く - CNET Japan

    経済産業省は7月、国内の総合電機メーカーや大学など38団体とともに、国産の検索エンジンを開発する「情報大航海プロジェクト・コンソーシアム」を設立する。企業や大学がこれまで研究してきた検索技術やノウハウを持ち寄り、成果物はオープンソースとして広く公開する考えだ。 検索エンジンの分野では現在、GoogleYahoo!Microsoftといった米国の大手企業が火花を散らしている。この分野で国が音頭を取って研究開発を進める狙いは何なのか。経済産業省 商務情報政策局 情報政策ユニット 情報経済企画調査官で、今回のプロジェクトを推進した立役者である八尋俊英氏に聞いた。 --情報大航海プロジェクト・コンソーシアムを結成した狙いはどこにあるのでしょう。 まず前提として、現在は情報がとにかく山のように沢山あり、その中から必要なものだけをうまく抽出して知識化する技術が求められているということがあります。こ

    国産検索エンジンはなぜ必要なのか?--経産省担当者に聞く - CNET Japan
  • 「Google独占にはさせない」--国産検索エンジン開発へ、産学官が一致団結

    検索エンジンといって、真っ先に思い浮かぶのはどんな企業だろう。検索の王者であるGoogleや対抗するYahoo!Microsoftなど、大手はほとんど米国企業であるのが現状だ。ここに危機感を抱いた経済産業省が、産学を巻き込んだ一大プロジェクトを始動させる。 プロジェクトの名前は「情報大航海プロジェクト・コンソーシアム」。7月設立予定で、国産の情報検索・解析エンジンを開発する。日立製作所やNEC富士通といった企業のほか、早稲田大学や東京大学などの38団体が参加する。3〜5年後の実用化を目指す。 コンソーシアムが目指すのは、今後ますます増えると見られる画像や動画の検索・解析ができるエンジンの開発だ。現在の検索エンジンは文字を検索対象としているため、例えばある画像に似た画像を瞬時に探すといったことは難しい。画像を使って検索できることで、たとえば製品設計者が膨大な部品データの中から、自分の欲し

    「Google独占にはさせない」--国産検索エンジン開発へ、産学官が一致団結
  • ITmedia News:Googleの限界は「人の手」で破る――国産の新検索「想」

    高野教授は「人間ができることを機械が10倍のスピードでやってくれるなら、たとえ質が7割落ちてもそっちを選ぶ人は多い」と嘆く 「Googleは確かに便利だが、大きな問題がある」。国立情報学研究所(NII)の高野明彦教授は指摘する。「プロの手による知識を、そこここで台無しにしている」というのだ。 Googleは、被リンク数などを尺度とした独自のアルゴリズムでサイトの重要度を機械的に判定するため、検索結果の表示順と情報の信頼性は必ずしも比例しない。これがGoogleの「唯一最大の問題」という。 「Google上では、記者が現場を歩いて裏を取った新聞記事も、ネット上の情報を写しただけのブログ記事も同列。情報の質や、経過の“差異”が失われる」。ネットが誕生するはるか以前から培われてきたプロの手法も、ロボット検索の前には無力だ。 高野教授がこれまでに開発してきた検索システムも、同じような問題に直面して

    ITmedia News:Googleの限界は「人の手」で破る――国産の新検索「想」
  • 1