タグ

databaseとhatenaに関するtakadoのブックマーク (2)

  • 「はてな流大規模データ処理」を見てきた - もぎゃろぐ

    KOF2008:関西オープンソース2008というイベントに来ています。 はてなの伊藤さんの講演があったので、講演メモを公開。 #ボクがメモした内容であって、100%言ったとおりに書いてあるわけじゃないので、参考としてご覧ください。 (続き) アジェンダ 大規模なデータ OSのキャッシュ MySQLの運用 大規模データアプリケーションの開発 データの例 はてなブックマークのデータ量:五千万件くらいのデータ量 このデータに対して何百万人がアクセスしてくる状況でどういう作りにするか レコード数 1073万エントリー 3134万エントリー 4143万タグ データサイズ エントリー2.5GB 何の工夫もなく普通にアクセスすると...200秒待っても結果が帰ってこない 大規模データの難しいところ 開発サーバで開発者が作っている時は快適に動いていても、多数の人間がアク

  • Myrmecoleon in Paradoxical Library. はてな新館 - はてブ指数

    書誌学的方法による研究者評価の方法のひとつとしてh指数(h-index)というものがある。 その定義は 「その研究者が公刊した論文のうち、被引用数がh以上であるものがh以上あることを満たすような数値」 h指数 - Wikipedia というもの。イメージとしてはこのグラフをみるとわかるかなと。 要するにどの程度の質の論文をどれくらいの量書いているのか,というのが一発で分かる感覚的に優れた指標である。単純な被引用数(論文が引用された回数)の総和だと特定の論文が妙に引用されてて他はボロボロ,みたいな研究者も高く評価されてしまうのに対し,h指数を使うと質と量が同時に把握できるので分かりやすくてオススメ。 詳しいところはwikipediaが詳しいのと,あとオリジナルの論文(英文)も公開されてるので読むとよい。っても自分も読んでないが(マテ で,なんでこんなことをわざわざ説明してるのかというと, こ

    takado
    takado 2007/07/20
    H指数をはてブの評価に適用
  • 1