タグ

googleとsearchに関するtorutoのブックマーク (38)

  • Google Goggles

    If you are not redirected automatically, follow the link

  • http://image-swirl.googlelabs.com/

  • サーチクオリティチームの紹介

    ※先週から始まった毎週月曜日のエンジニアリングブログシリーズの 2 回目です。今週は過去に米国の Google ブログにポストされたものの中から、検索技術についてを抄訳してご紹介します。 私が担当している「サーチクオリティ」(Search Quality)は、Googleの検索結果のランキングを担当し、Googleに寄せられる1日に何億もの質問に対し、一瞬にして、ウェブ上の何十億ものページから、どれをどのような順番で表示するかを決める仕事です。 非常に多くの人々に極めて頻繁に利用されているにもかかわらず、Googleランキングは驚くほど知られていません。これは完全に私たちの責任において、あえてそうしているのです。それには 2 つの理由があります。ひとつはシンプルに、そしてどこの会社とも同じように、他社に自社の秘密の方策を公開したくないからです。もうひとつは、不正利用を防ぐためです。ランキ

    サーチクオリティチームの紹介
  • Google WSDM'09講演翻訳:大規模な情報検索システム構築における課題(1) - llameradaの日記

    GoogleのFellowであるJeffrey Dean氏のWSDM'09における講演"Challenges in Building Large-Scale Information Retrieval Systems"のスライドを翻訳してみました。Googleの検索システムの10年間の進化の軌跡が紹介されており、興味深い話が満載です。個人的にはディスクの外周部と内周部を使い分けている話がツボでした。なお、イタリック体で一部解説・感想をいれています。翻訳は素人なので詳しくは元の資料を参照してください。 スライドの入手元:Jeffrey Dean – Google AI 検索システムに取り組む理由 チャレンジングなサイエンスとエンジリアニングのブレンド 多くの魅力的な未解決な問題が存在する。 CS(コンピュータサイエンス)の多数の領域にまたがる。 アーキテクチャ、分散システム、アルゴリズム、圧

    Google WSDM'09講演翻訳:大規模な情報検索システム構築における課題(1) - llameradaの日記
  • アップル、独自に検索エンジンを開発中とのうわさ

    TechCrunchは米国時間11月13日、GoogleYahooMicrosoftに対抗する独自の検索エンジンを、Appleが現在開発中であるといった内容のうわさが流れていることを伝えた。同報道においてTechCrunchでは、Appleが検索エンジンを開発する理由について、「Safari」ブラウザを始めとする、ウェブ全体から流れ込むトラフィックから、現在の路線とは異なる売り上げを確保したいという願望を挙げている。 しかしながら、いくらか調査を進めた結果として、TechCrunchは、Appleが秘密裏に検索エンジンの開発に取り組んでいる可能性は、かなり低いと判明したとも伝えており、シリコンバレーでは、Appleが、業界内の別のセクターに注力する可能性について、ほとんどうわさにもなっていないことを報じている。 筆者は、うわさの真偽を問いただす議論など必要ないと感じているし、そもそもA

    アップル、独自に検索エンジンを開発中とのうわさ
  • Google検索が一度のクロールで見るユニーク URLは1兆件

    Googleの検索エンジンでは,現在,新しいコンテンツを見つけるために,一度に1兆件のユニークURLを見て回るという。同社Web検索インフラ・チームのソフトウエア・エンジニア,Jesse Alpert氏とNissan Hajaj氏が米国時間2008年7月25日に同社公式ブログに投稿した記事によると,1998年に構築した最初のGoogleインデックスは2600万ページだった。2000年には10億に拡大し,その後8年間で膨大な数のコンテンツがWeb上に登場した。 Googleの検索では,最初のページから新しいページへのリンクをたどり,そこからまた新しいページへのリンクをたどる。これを繰り返して膨大なリンクのリストができあがる。同じコンテンツでも自動複製などにより複数のURLが設けられている場合があり,これら重複を除いたユニークURLのリストは1兆件。1日当たり作成されるWebページは数十億ペ

    Google検索が一度のクロールで見るユニーク URLは1兆件
  • Rauru Blog » Blog Archive » Google の自動学習

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • MapReduce - naoyaのはてなダイアリー

    "MapReduce" は Google のバックエンドで利用されている並列計算システムです。検索エンジンのインデックス作成をはじめとする、大規模な入力データに対するバッチ処理を想定して作られたシステムです。 MapReduce の面白いところは、map() と reduce() という二つの関数の組み合わせを定義するだけで、大規模データに対する様々な計算問題を解決することができる点です。 MapReduce の計算モデル map() にはその計算問題のデータとしての key-value ペアが次々に渡ってきます。map() では key-value 値のペアを異なる複数の key-value ペアに変換します。reduce() には、map() で作った key-value ペアを同一の key で束ねたものが順番に渡ってきます。その key-values ペアを任意の形式に変換すること

    MapReduce - naoyaのはてなダイアリー
  • Google、略語や英文字キーワードの処理方法を大きく改善 - Yahoo! & 百度と違いを比較 ::SEM R (#SEMR)

    Google、略語や英文字キーワードの処理方法を大きく改善 - Yahoo! & 百度と違いを比較 日語の表記ゆれ問題、Yahoo!やLive Searchが(一部)未対応でGoogleが対応済みの問題が略語・英文字キーワードの処理方法。Googleは略語で検索しても正式名称を含むページを検索できる。 公開日時:2008年05月06日 20:00 少なくとも昨年末時点で、Googleは日語文字列の処理を大きく改善し、Yahoo!やMSN / Live Search、百度など他の日語検索エンジンが実現できていない(Ask.jpがやってました)ことをしています。それが略語や英文字(英語表記)のキーワードを入力した時の処理方法です。 上記の表は、検索キーワードで検索した時に、検索結果でボールド表示(太字)される文字列を表したものです。例えば、「ファミマ」と検索した時に、Googleは検索結

    Google、略語や英文字キーワードの処理方法を大きく改善 - Yahoo! & 百度と違いを比較 ::SEM R (#SEMR)
    toruto
    toruto 2008/05/07
    機械的に同意語を見つけ出しているのかな.SONY≒ソニーはどうやって見つけているのだろう.人手でやってたらあほらしいし.単純な語の関連度だと,ゴミは多く混じりそうだし.そこをうまくやるのでしょうけど.
  • Geocoding - 住所から緯度経度を検索

    Geocoding.jpとは? 住所やランドマーク名をGPS座標に変換するサービスです。 座標系はWGS84に対応。近似TOKYO97出力も可能です。 Open Location Code(OLC)取得も可能です。 Aobaが個人で作成、運用しています。 Google様とYahoo!様のふんどしで相撲をとっております。 お問い合わせはTwitter窓口まで。 検索のサンプルは? 住所 『東京都港区芝公園4-2-8』 で検索 ランドマーク名 『東京タワー』 で検索 ランドマーク名 『東京駅』 で検索 ランドマーク名 『Arc de triomphe』(凱旋門) で検索 ランドマーク名 『ユニコーンガンダム』 で検索 Open Location Code 『8Q7XMP52+J6』(渋谷ハチ公像) で検索 緯度、経度から検索 『東京タワー』 経度、緯度から検索(度、分、秒) 『Eiffel T

    Geocoding - 住所から緯度経度を検索
  • WWW2008

    The WWW2008 Conference site has been archived at: thewebconf.org This notice is provided as a courtesy in memory of RFC 2068 and HTTP Status Code 402.

  • 3分LifeHacking:気付かなかった自分の関心に気付く方法 - ITmedia Biz.ID

    仕事で疲れてモチベーションが低下すると、「プチうつ」状態になって、何にも興味を持てなくなることがある。そんな風に思っている人に試してほしいのが、Googleを使った方法だ。 最近、筆者の周辺でよく聞くのが「最近、何にも興味を持てなくなった」というご意見。仕事で疲れてモチベーションが低下すると、「プチうつ」状態になって、何にも興味を持てなくなることがある。 そんな疲れた人に限って、休日に癒してくれる恋人もいなかったり、ストレスを発散させる趣味もなかったりする。心配になった友人が遊びに誘ったり、オススメの映画を教えても、人から薦められたものには何となく腰が引けて、結局引きこもりの休日をすごすハメに――。こうして、どんどん疲弊していくというわけだ。 人から薦められてもダメなら、自分自身の行動の結果であれば受け入れるのではないか。そんなふうに思っている人に試してほしいのが、Googleの検索履

    3分LifeHacking:気付かなかった自分の関心に気付く方法 - ITmedia Biz.ID
  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
  • 日本国内の検索シェア、ヤフーが47.4%、グーグル35% - comScore Japan調査 ::SEM R (#SEMR)

    国内の検索シェア、ヤフーが47.4%、グーグル35% - comScore Japan調査 コムスコア、検索市場の分析・調査ツール「qSerach 2.0」をリリース。 公開日時:2007年09月12日 18:53 調査会社コムスコア・ジャパンは2007年9月12日、日国内の検索市場に関するデータを発表した。 2006年7月と2007年7月の検索数、検索回数、検索シェアデータを発表。全検索件数は2006年7月の47億5,400万件から57億9,500万件と21.9%増加。これを検索エンジン別に見るとヤフーは31億3,400万件から27億4,400万件と12.4%マイナスに対してグーグルは13億2,200万件から20億2,700万件と53.3%増加している。さらに検索シェアもヤフーは65.9%から47.4%と1年で18.6%マイナスに対してグーグルは27.8%から35.0%と7.2ポイ

    日本国内の検索シェア、ヤフーが47.4%、グーグル35% - comScore Japan調査 ::SEM R (#SEMR)
    toruto
    toruto 2007/09/13
    うちの母もグーグルを使い始めました。「Googleってタダ?」
  • ポスト検索の道は何が切り開くのか:グーグルキラーを探す:コラム - CNET Japan

    検索市場は「ゲームオーバー」だという前提から話を始めよう。Googleは勝利した。Googleの優位性については、このRead/WriteWebへの投稿で十分に説明されている。Googleキラーがもし存在するとしても、それは次のような検索業界への新規参入者ではないだろう。 面白い新機能:新しいユーザーインターフェース、アラート、見せ方などのことだ。問題は、よい機能が1つあるだけでは、Googleのユーザーを乗り換えさせるのには十分ではないし、複数の検索エンジンを使うような時間や動機を持つ人などいない。この分野で、新興企業はどこに賭けたらいいだろうか?安く作って、GYM(Google-Yahoo-Microsoft)に研究開発案件として売ることだろう 自然言語処理:この分野には大きな資金が投入されている。これは間違ったことのように思える。人間にとって簡単な問題を解決するために、扱わなければな

    ポスト検索の道は何が切り開くのか:グーグルキラーを探す:コラム - CNET Japan
  • Googleのモバイル戦略は「日本から世界へ発展させる」

    企業とユーザーをつなぐ検索エンジンマーケティング(SEM)が重視されるなか、PCよりも情報のライフサイクルが早いといわれるモバイルにおける検索サービスは、今後どういった方向に進んでいくのだろう。 モバイル・ビジネス・サミット 2007の特別講演では、検索エンジン最大手Googleのストラテジック パートナーディベロップメント マネージャーであるJohn Lagerling氏が、同社のモバイルビジネスの展開について語った。 PCとモバイルに共通するGoogleのテーマ 「ユーザーと情報をどうつなげるか」――さまざまなサービスを提供する際に、Googleは、このことを常に念頭に置いていると講演の冒頭でLagerling氏は述べた。 「たとえば、病院へ行って薬を出される。この薬の詳細を知るには薬局で聞くというのがこれまでの情報収集方法でした。しかし、今では携帯電話で薬の名前を入力すれば簡単に情報

    Googleのモバイル戦略は「日本から世界へ発展させる」
    toruto
    toruto 2007/08/09
    携帯電話を利用するとき、ユーザーは外にいると思われがちだが、実は家の中にいることも多いのだ。
  • 2log.net

    This domain may be for sale!

  • 次のグーグルはどこか?--検索業界の著名人らがRed Herring Eastカンファレンスで語る:ニュース - CNET Japan

    マサチューセッツ州ボストン発--検索業界の著名人らが米国時間6月28日、当地で開催のRed Herring Eastカンファレンスに集まり、次の良いアイデア探しに関心を寄せているベンチャーキャピタリストらに知恵を提供した。 同カンファレンスにパネリストとして参加したAsk.com、Answers.com、Truveo/AOL、Microsoft Searchの重鎮らには多くの質問が寄せられたが、彼らはそれらをうまくかわした。 彼らが浴びた質問の例としては、次に注目すべき大手検索企業はどこだと考えるか、株式を公開する見込みがあるのはどの企業か、ビデオ検索で利益を上げるにはどうすれば良いか、ビデオ検索エンジンに徹するべきか、あるいは検索したビデオをサイト上で視聴できるようにすべきか、などだ。 今週はじめに業界の専門家がモバイルビデオについても同様の発言をしたが、問題なのは、技術が事態を停滞させ

    次のグーグルはどこか?--検索業界の著名人らがRed Herring Eastカンファレンスで語る:ニュース - CNET Japan
    toruto
    toruto 2007/06/29
    「15分間の空き時間があり、楽しみたいと思った時に誰もが利用するツール
  • グーグル、中国最大手ポータル「新浪網」と提携

    新浪網ほどの著名サイトがGoogleと手を組んだからといって、他のサイトもGoogleと提携するとは限らない。たとえば新浪網に続くポータルサイトの「捜狐(SOHU)」は、同社の検索サイト「捜狗(Sogou)」を積極的に推進しており、中国の検索サイトのシェアは、百度、GoogleYahooに次ぐものとなっている。ある中国メディアは、自身が開発した検索エンジンの愛問を捨てGoogleを採用したことに、自主開発を良しとする現在の中国の風潮と比較し「逆の潮流」と評している。 新浪網の2006年の決算報告書を見ると、広告による売り上げは前年同期比で41%と大幅に増加し、また四半期ベースでは、全売上における広告売上の比率は第1四半期より47.5%、54.9%、58.3%、63.3%となっていることがわかる。同社がより広告に注力していることが伺える。新浪網は今回の提携によりGoogleAdSense

    グーグル、中国最大手ポータル「新浪網」と提携
  • How long should Google remember searches?