タグ

studyとsearchに関するkei-sのブックマーク (2)

  • 楽天も情報爆発しています - 武蔵野日記

    楽天テクノロジーカンファレンスには行かれなかったのだが、大規模分散処理フレームワークの設計、実装が進行中 -- 楽天MapReduce・HadoopはRubyを活用などを読むと、けっこうおもしろそうだったのだな、と分かる。 楽天技術研究所がどういう位置づけなのかは分からないが、こういう基盤技術の開発を支援しているというのは評価していいと思う。(車輪の再発明という気がしないでもないが) 個人的な興味としては楽天が大規模データに対してどういうことをしているかということなのだが、記事を見るといろいろ書いてある。 計算モデルがシンプルでも規模が巨大になるとまったく別の問題が生まれてくる。処理すべき情報量が爆発的に増加しているからだ。 例えば協調フィルタリングではユーザーを縦軸に、商品アイテムを横軸にした購買履歴マトリックスについて計算処理を行う必要があるが、あまりに量が多く、素直に実装すると「2

    楽天も情報爆発しています - 武蔵野日記
  • xe-kdoo(2007-02-11)

    >> [Memo] What's Really New on the Web? 招待講演「大規模Webアーカイブの時空間分析とその実際」 @ www.textfile.org 経由で、 招待講演「大規模Webアーカイブの時空間分析とその実際」 @ Cafe Babe ふむ。 この中の、 しかし,Webページがいつ作られたのか…という情報を判定するのは,スナッ プショットにも欠落があるのだから難しい.Webサーバだって,まともに Last-Modifiedなんて付けてくれないもの.…と思っていたら,デモを見てびっ くりした…というのは,なんと豊田先生はアーカイブを解析して,Webページ の新しさを求める方法を実現していたのだった.つまり,制約のあるデータを 使っても自由に過去に遡れるWebタイムマシンを目の前に見せてくれたのだっ た. 招待講演「大規模Webアーカイブの時空間分析とその実際

  • 1