タグ

webとgoogleに関するcastleのブックマーク (103)

  • Google を支える技術 - naoyaのはてなダイアリー

    Google を支える技術 を読みました。 Google のバックエンドで動いている各種分散処理システムに関しては Google 自身から論文がいくつも発表されています。それらの論文をはじめとする比較的最近の情報ソースをベースに、ある程度かみ砕いて要所要所を紹介するという内容でした。加えて著者の西田圭介さんは OpenCobol (COBOL を C 言語に変換しコンパイルする gcc のフロントエンド) を開発された、技術的なバックグラウンドがしっかりしている方であるようで、内容は信頼できると思います。 自分はこれまで Google のバックエンドの各種ソフトウェアについては方々で耳にしていましたが、漠然と何をするものか程度のことしか知りませんでした。 Web 検索の基的な仕組みと それにまつわる Google が直面した問題、特に大規模処理 それを支えるために開発された各種ソフトウェ

    Google を支える技術 - naoyaのはてなダイアリー
    castle
    castle 2008/03/31
    「各ミドルウェアはそれ単体で独立して動いているのではなく~それらをまた別の分散システムが支え、且つ各々の入出力はデータ構造言語で定義されたデータで結合され」「大規模なソフトウェアが階層をなし協調動作」
  • メディア・パブ: 止まらないグーグルの頭脳流出,活気づくスタートアップに転職

    Googleからの人材流出が止まらないようだ。IPO前にストックオプションを取得し,入社4年後にオプションをすべて受け取った従業員が,同社を辞めていくことは避けられない。 この1年間に約6000人も新規採用するほどの大企業となったGoogleでは,やりがいのある挑戦的な仕事を見出せなくなったのかもしれない。すでに,優秀なキーパーソンがFacebookなどに続々と転職している。 Wired.comが,Googleを飛び出た人の一覧を掲載していた。彼らが転職した企業を以下に紹介する。ほとんどがスタートアップである。おもしろいベンチャーが目白押しだ。彼ら自身が起業したスタートアップもある。 *Cuill:すでに話題になっている検索エンジン。インデックス化コストがGoogleの10分の1とか。relevanceの点でも優れているとか。 *HowCast:人気上昇のハウツー動画サイト。YouTube

  • Googleを支える技術

    Googleを支える技術 2008-03-25-1 [BookReview] 献頂きました。ありがとうございます。 そうでなくとも絶対買うですが。 ■西田圭介 / Googleを支える技術 - 巨大システムの内側の世界 結論から言いますと、 Google のバックエンドの技術について 興味のあるITエンジニアや学生で、 英語よりも日語を読むほうがはやい人は必読です。 グーグルについての技術的なトピックが 日語でさくっと読めます。 Google 社員による英語論文やドキュメントを情報源とし、 それらを咀嚼して平易に解説しています。 「情報系の大学3年生程度の予備知識」を前提に 書かれているとのことで、 情報系の基礎的な語彙が分かっていれば、 確かに難解な話はありません。 数式も出てこないです。 内容紹介 第一章は検索の話で、クロール、インデックス、 ランキング、と Google

    Googleを支える技術
    castle
    castle 2008/03/26
    「第二章はシステムの大規模化。クラスタ、データセンター。インデックスの分割が重要」「検索タスク全体に特化した設計になっているのが面白」「消費電力を抑えたり、適切に電力配分したり。HDDの故障予測とか」
  • グーグルでは上位なのにヤフーでは順位が低いのはなぜか(またはその逆)? | Web担当者Forum

    ずっと昔(といってもウェブの存在より古い話じゃない)、検索エンジン最適化(SEO)の作業には、検索エンジンごとに個別のターゲット化手法が必要だった。Hotbotならメタタグを使ったキーワード記述のなかで、すべてのキーワードを2つ並べる必要があったし、またNorthern Lightでは、右下の隅に少なくとも1人の踊る赤ん坊の画像を置くことが、大きな効果をもたらした。 現在、ほとんどのSEO担当者は、検索エンジン対策についても検索エンジンターゲティングの基準についても、同一のものを念頭に作業している。 キーワードを詰め込みすぎない賢い使用静的コンテンツの作成検索ロボットが容易に巡回できるURLみんながリンクしてくれそうなコンテンツの構築ソーシャルマーケティング、バイラルマーケティング、ディレクトリマーケティングによるサイトの宣伝こうした手法は、SEO業界全体において、比較的一貫している。 し

    グーグルでは上位なのにヤフーでは順位が低いのはなぜか(またはその逆)? | Web担当者Forum
    castle
    castle 2008/03/21
    「グーグルは、価値の低い多数のリンクよりも、少数の質が高い信頼性のあるリンクを評価する」「ヤフーは、いわゆる「操作的な」リンクを識別して評価を下げることに関して、グーグルほどには優れていない」
  • グーグルが検索結果を操作している一例 - 量産型ブログ

    以前脳内メーカーの便乗方法に関連してグーグルアドセンスのスタンスに批判的なことを書いたのですがその結果、当ブログはグーグルの検索結果に表示されにくい状態と相成りました。やりましたね。 別に検索結果から除外されたわけではなく、ペイジランクが0になっただけなんですが。 併せて俺のエントリーにリンクしているサイトまでPR0でした ページランクが0になっているのは以下の通り 脳内メーカーの便乗商法? - 量産型ブログ オーバーチュアよ、おまえもか! - 量産型ブログ 「脳内メーカー」の大ブームに便乗した悪質なサイト :にゅーあきばどっとこむ やじうまWatch■ 超大人気「脳内メーカー」に、よく似たサイトが登場していた ちなみに 相変わらず"量産型ブログ"で検索しても当ブログはヒットしない他、"tomozo3"で検索しても駄目。どうやらグーグル的には当ブログは情報商材サイトよりも下という評価のよう

    グーグルが検索結果を操作している一例 - 量産型ブログ
    castle
    castle 2008/01/18
    「相変わらず"量産型ブログ"で検索しても当ブログはヒットしない他、"tomozo3"で検索しても駄目」「俺の知らない間に、Googleは批判者を排除するアルゴリズムを実装したようです。やりましたね」
  • グーグル、無限への挑戦 (BusinessWeek):NBonline(日経ビジネス オンライン)

    気になる記事をスクラップできます。保存した記事は、マイページでスマホ、タブレットからでもご確認頂けます。※会員限定 無料会員登録 詳細 | ログイン Stephen Baker (BusinessWeek誌シニアライター、ニューヨーク) 米国時間2007年12月13日更新 「Google and the Wisdom of Clouds」 「データ量が今の1000倍になったとしたら、君ならどうする?」 この質問をされると、それまで自信満々で入社面接に臨んでいた若者はしどろもどろになってしまう。 今や超難関、米グーグルGOOG)の採用面接でのひとコマである。質問を投げかけるのは、上級ソフトウエアエンジニアのクリストフ・ビシグリア氏(27歳)。ほっそりとした体格と、ウエーブのかかった長髪のビシグリア氏が試しているのは、目の前にいる大学生が「グーグラー(グーグル社員)」流の発想法について来られ

    グーグル、無限への挑戦 (BusinessWeek):NBonline(日経ビジネス オンライン)
    castle
    castle 2007/12/25
    一方日本は、次世代スパコンを作っていたって大鑑巨砲時代っぽいような。いまの世の中的な戦闘機はデータ分析技術で、その開発競争が先端になってるっぽ? その次が解析データを活かす方法っぽくて。
  • http://www.heiwaboke.com/2007/12/post_1191.html

    castle
    castle 2007/12/11
    「俺らが会話してるのを勝手にビデオ撮影されてて、それが俺らの知らないところで勝手に放映されてるみたいなもん。しかもそれで金儲け」「ツールがあるからな。アフィ連合が身内だけで回してる」あ、ツール載ってる
  • ひろゆきがティム・オライリーに直接きいた、「Web2.0ってなんだったの?」

    11月14日夜、2ちゃんねる管理人の西村博之氏が、Web2.0の提唱者であるTim O'Reilly氏と初めて顔を合わせた。 Web2.0 EXPOを前日に控えたこの日、IT・コンテンツ産業の発展を目指す「Venture BEAT Project」イベントが都内で開催された。そこにゲストとして招かれていたのが西村氏と、10年ぶりに来日したO'Reilly氏だった。2人はすぐにうち解け、ゆっくりと語り合った。 “Return of the Web” 西村氏:Web 2.0という言葉を作り出したのは3年前? O'Reilly氏:2003年に最初のアイデアを話し始め、2004年からWeb 2.0カンファレンスを始めた。Web 2.0に関する記事を書いたのは2005年。でもWeb2.0という概念について考え始めたのは10年前くらいから。そのときは違う名前だったけどね。 1997年にオープンソースに

    ひろゆきがティム・オライリーに直接きいた、「Web2.0ってなんだったの?」
    castle
    castle 2007/11/16
    「Web 2.0を使ったのは、みんな、ドットコムバブルの後、ウェブが終わったと思っていたからだ。でもウェブは戻ってきた」「ユーザーがデータに価値を与えて、より良いものにしているから、Web 2.0企業」
  • 初音ミク・イメージ検索問題 - まとめ

    事の始まり . 10月15日頃から、大手検索エンジンの画像検索において、 「初音ミク」による画像検索結果が表示されなくなるという現象が発生。 さらにWikipediの「初音ミク」のページに対し、公式ページの文章を無断で転載しているとして削除されました。 Blog 2007-10-15 14:56:08 「初音ミク」をGoogle イメージ検索してみた。 今、話題の「初音ミク」を自称「史上最強のイメージ検索!」Google イメージ検索してみました。 正解が1個も無いぞ!! Googleよ、どーなってる!! 2ch 70 名前: 名無しさん@お腹いっぱい。 [sage] 投稿日: 2007/10/17(水) 23:34:41 ID:???0 "初音ミク"でgoogle イメージ検索しても 一枚も出てこないのはなんで? GoogleYahoo!のイメージ検索などで検索結果が0件など 初音ミク

  • 2007-10-17

    なにやら初音ミク画像が復帰したとかしてないとからしいですね。 「初音ミク」画像、Googleに復帰 http://www.itmedia.co.jp/news/articles/0710/23/news126.html なんですが、なんというか思い切り不自然みたいですね。 http://news22.2ch.net/test/read.cgi/newsplus/1193148342/ より転載 ※太字化と文字色変更は引用者による 91 名前:名無しさん@八周年[sage] 投稿日:2007/10/24(水) 00:27:15 id:V9v7y7Iu0 http://s01.megalodon.jp/2007-1024-0023-32/www.google.co.jp/images?svnum=10&hl=ja&rlz=1B2GGGL_ja___JP209&q=%E5%88%9D%E9%9F

    2007-10-17
    castle
    castle 2007/11/09
    「「Hatsune Miku」で検索すればちゃんと検索できる。しかし「初音ミク」ではできない」「「誰かが」「なんらかの目的で」、「人為的に検索結果を操作している」事は確か」「単語でWeb検索なら引っ掛かる」
  • 「ちょっと怖い話」Googleが知ることのできる16個に及ぶ、あなたの個人情報|WEBマーケティングブログ

    組織のマインドマップツールをマインドマイスターにすべき理由 伸びてる産業、会社、事業を紹介しまくるStrainerのニュースレターに登録!! Googleが知っている個人情報16 あなたのフルネーム グーグルアカウント情報に表示されていますね。 あなたの住所 AdsenseGoogleチェックアウトに登録していると登録必須情報になります。 あなたの電話番号 Gmailを携帯に転送する際、登録しています。 あなたがいつネットを見ているか iGoogleを使っていることはもちろん、ログインしていればいつ見ているかがわかります。 あなたの最新のIPアドレス IPアドレスが変わっても、ログインすることでわかります。 あなたが今一番興味を抱いているもの Google Readerでの履歴やGoogleブックマーク、さらにはYouTubeでの閲覧履歴から特性の傾向を割り出せます。 あなたが訪問する全

    「ちょっと怖い話」Googleが知ることのできる16個に及ぶ、あなたの個人情報|WEBマーケティングブログ
    castle
    castle 2007/10/29
    「あなたがいつネットを見ているか・あなたの最新のIPアドレス・あなたが今一番興味を抱いているもの・あなたが訪問する全てのウェブサイト・あなたは誰を知っているか・あなたのオンライン上でのすべての言動」
  • 例の消失騒動って人為的に起こせるんじゃないのかな? | fladdict

    例のアレの騒動、原因がクロール期間うんぬんいってる人は頭悪すぎだと思う。 だって9末頭に発表されたipod touchを画像検索とか、9月後半<修正>発売日って8月31日だっけ</修正>以降に発表されたものの画像検索すれば、そうじゃないってすぐわかるじゃん。 ニュースサイトもそれぐらい検証すればいいのに。 原因不明なとても不思議な理由で、ALT属性のキーワードがNGリストに入っちゃった的なのが実情なんだろうな。(全ての画像にALT属性が入ってるわけではないので、それだけじゃないんだろうけど) たぶん特定のALTタグがついたチャイルドポルノかスナッフ写真を大量にばら撒いて、グーグルに通報とかしたら似たような現象を再現できるとおもうのだけどな。それが真実かどうかはともかく、あくまで人為的に再現はできそうな気がする。誰か実験してみないかな。 と妄想してみた。 <追記> 昔書いたネタエントリーだけ

    castle
    castle 2007/10/23
    「中国の違法P2Pを抑制するには、アニメやドラマのタイトルで天安門事件や文化革命の映像を大量放流してやれば、中国政府が勝手に規制してくれるってアイデアを考えた事があった」
  • 我が愛する初音ミクが揉め事に巻き込まれているらしい - 最終防衛ライン3

    TBSを発端とした初音ミク騒動 「アッコにおまかせ」の初音ミク特集があまりにもひどくて大騒ぎに - GIGAZINE ↓ VIPのスレに降臨したtask氏の全発言 - coldcupのメモ 人のサイト:2-dimension ↓ 10月14日のテレビ放映に関しましてご報告とお詫び:メディアファージ事業部 ブログ ↓ TBS「アッコにおまかせ」の初音ミク特集に対して開発元が公式にコメント - GIGAZINE ↓ これからネット経由で取材を受けるすべての人へ 現在の良く分からない状況 ⊂⌒⊃。Д。)⊃カジ速≡≡≡⊂⌒つ゚Д゚)つFull Auto | 【圧力?】「初音ミク」でイメージ検索かけてもヒットせず。さらにwikipediaからも削除【TBS?】 初音ミク - Wikipedia 「初音ミク」画像がネットから“消えた”? - ITmedia News 検索エンジンで怪現象? 「初音ミ

    我が愛する初音ミクが揉め事に巻き込まれているらしい - 最終防衛ライン3
  • 初音ミクがこの先生きのこるには:アルファルファモザイク

    編集元:ニュース速報板より「電通、初音ミクに圧力をかける!?」 1 海賊(東京都) :2007/10/18(木) 03:38:30 ID:OFhgFDi6P ?PLT(25113) ポイント特典 初音ミクでgoogle イメージ検索しても一枚ミクの画像が出てこない http://images.google.co.jp/images?q=%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF&gbv=2&svnum=10&hl=ja&safe=off&start=18&sa=N&ndsp=18出てくるのはライブドアのみ Wikipediaからも削除されている。 http://ja.wikipedia.org/wiki/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF goo http://bsearch.goo.ne.jp/image.

    castle
    castle 2007/10/18
    プリキュアとかナージャとか…w ていうかまとめ方によってトーンが変わるなぁ。
  • ⊂⌒⊃。Д。)⊃カジ速≡≡≡⊂⌒つ゚Д゚)つFull Auto | 【圧力?】「初音ミク」でイメージ検索かけてもヒットせず。さらにwikipediaからも削除【TBS?】

    This domain may be for sale!

    castle
    castle 2007/10/18
    「初音ミクとニコニコ動画は、テレビや広告代理店の存在意義そのものを根底から否定する存在だから。早い話、Lv1の勇者を、悪の魔王が叩き潰しにきた」「中国ヤフーはちゃんと出ててワロタ」手動google八分?www
  • [N] Googleが脅威に感じているらしい検索エンジン「Cuill」

    Cuill―スーパーステルス検索エンジン。Googleも注目というエントリーより。 この会社のウリは、Googleよりはるかに速く、安くウェブページをインデクスできるということ。Cuillは出資を募る際の説明で、新しい検索アーキテクチャーとレリバンス手法によって、Googleの1/10のコストでインデクスすると言っている。 元Googleの検索エキスパートらが設立した「Cuill」という検索エンジンが開発中らしいです。 詳しくは明らかになっていませんが、Googleより速く、そして安くインデクスできるのが特徴で、 Googleは、この発明がGoogleの知的財産に加えられなかったことは大いに不満だろう と記事では書かれています。 まだ実体が明らかではないのですが、早くもGoogleが買収に動いているという噂もあるそうで、もしかするとその内に買収されてしまうかもしれませんね。 Google

    [N] Googleが脅威に感じているらしい検索エンジン「Cuill」
  • ほぼ日刊イトイ新聞ー「ソーシャル・ウェブ」座談会

    「2.0」とか、「ロングテール」とか、 最近のインターネットは なにかと難しそうで、タイヘンらしい。 でも、滑川海彦さんの『ソーシャル・ウェブ入門』には そのあたりのことが わかりやすく楽しげに、書かれてるんです。 そこで、糸井重里、滑川さん、 日経ビジネスオンラインの 山中浩之副編集長が集まって、座談会をやりました。 「グーグル」だとか、「ミクシィ」だとか、 いろいろ便利になってるのは、たしか。 だけど、ホントにおもしろいことって、どこにある? しゃべりにしゃべって、6時間。 そのうち、レコーダーが回っていた 約3時間ぶんのおはなしを ぎゅーっとまとめて、お届けします。 ※なお、この鼎談のようすは、山中さんが副編集長をつとめる 日経ビジネスオンラインでも、ほぼ同時に連載中です。 「ほぼ日」バージョンとはまたちがった視点から 編集されていますので、ぜひ、読みくらべてみてくださいね。

    castle
    castle 2007/09/05
    「ひとつには、はじめから「クローズド」になっているような領域」「昔から「30人くらいしか、よろこばない」という情報や商品があったはず。出してる側も「30人ぶんしか、つくれない」」「最後はやっぱり「モノ」」
  • 池田信夫 blog グーグルの最大のリスク

    私がどういう人間か、あるいは何をしているかを知ろうと思えば、私のグーグルとGmailの履歴を見るのが一番だろう。そこには、私の1日の活動の半分ぐらいが記録されている。しかし私がそれを意に介さないのは、私が銀行預金をいつもチェックしないのと同じだ。こうした個人情報はすべて機械によって処理され、人間が操作したり盗用したりすることはないと信じているからだ。 しかし、この信頼には何の根拠もない。ある日、グーグルの社員が私の銀行口座のパスワードを盗んで私の全財産を持ち去らないという保証は何もない。今のところパスワードはグーグルに知られていないと思うが、クレジットカード番号は知られているかもしれない。もちろん今まで世界中でその種の事件が報じられたことはないが、それは事件が起きていないということを必ずしも意味しない。 今週のEconomist誌は、ニック・リーソンという一人のトレーダーの不正取引がベ

    castle
    castle 2007/09/01
    「(私のグーグルとGmailの履歴には)私の1日の活動の半分ぐらいが記録されている。しかし私がそれを意に介さないのは、私が銀行預金をいつもチェックしないのと同じだ」「しかし、この信頼には何の根拠もない」
  • 新生活を迎えるにあたって役立つサイトまとめ :VIPPERな俺

    castle
    castle 2007/07/17
    「日本中の監視カメラをブラウザ上で操作できるぞ」なんか気持ち悪いなぁ。
  • 「公」というものを制御不能であるけど善なるものとして認識する - アンカテ

    アレントは、人間の活動領域を「公的領域」と「私的領域」に分け、現代社会の問題を「私的領域」による「公的領域」の侵蝕であるととらえた。 「私的領域」とは、人間の生存に必要な生産活動を行う場ということである。アレントはアテネの都市国家における「家」を「私的領域」の代表としたが、現代に生きる我々は企業をイメージするのがいいと思う。生産活動にはエンジニアリングと指揮命令系統が必要である。この中では、人間は命じられた通りに言いつけられた仕事を確実にこなさなくてはならない。 「公的領域」とは政治の場であるが、政治エンジニアリングや指揮命令系統ではなく、対等な立場の人間同士の議論によって行うべきだというのがアレントの主張である。人間同士の議論には、必然的に予測できない部分があって、エンジニアリングによって事前にシステムを決定することはできない。そこには別の方法論が必要であり、指揮命令系統ではなく個々の

    「公」というものを制御不能であるけど善なるものとして認識する - アンカテ
    castle
    castle 2007/06/20
    「プライバシーは暴かれ晒されていくのだが、平等に晒され、晒されたプライバシーを私的に悪用することは難しくなる。悪用されないことが確実に保証されると仮定して、どうしても守るべきプライバシーとは何なのか」