タグ

2006年10月27日のブックマーク (2件)

  • 書評 - 統計数字を疑う : 404 Blog Not Found

    2006年10月26日11:20 カテゴリ書評/画評/品評 書評 - 統計数字を疑う 門倉貴史は「404 Blog Not Found:犯罪経済学が欲しい」で以前紹介とおり、地下経済とBRICs経済という、他の経済学者があまり手を出してこなかった分野のパイオニアだ。後者はとにかく、前者に関しては未だに彼以外の研究者が少なそうで残念である。 統計数字を疑う 門倉貴史 そんな門倉氏がなぜ孤軍奮闘できるのか?秘密は書にある。 「統計を疑え」という言葉は耳にたこが出来るほど聞く。しかし具体的にどんな統計をどうやって疑い、どうやって有意の情報を引き出すのかをきちんと解説したは、統計の参考書ですら少ない。書はまさに砂漠の慈雨である。強いて類書を探すと反社会学講座ということになるが、こちらはすでに疑い方を知っている人向けで一段高度。反社会学講座をよんでイマイチピンと来なかった人は、書からはじめる

    書評 - 統計数字を疑う : 404 Blog Not Found
  • どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup

    Webの全体像を効率よく取り込み,分類する 「YSTのシステムは大まかに三つの機能に分かれます(図2)。最初は世界中のWebページをYSTのシステムに取り込む『クローリング(crawling)』という機能です」(Yahoo! JAPAN,リスティング事業部 検索企画室の宮崎光世氏,以下同)。 取り込むと簡単に言っても,Webページの数は膨大なうえ,更新の頻度や情報の質などがまちまちです。すべてのページに同じようにアクセスしていると非効率なことこの上ありません。そこで,限られた時間で質の良い検索ができるようにするための工夫をしています。例えば,クローリングを繰り返すうちに頻繁に更新されることがわかったページは短いサイクルでチェックし,ほとんど更新のないページはチェックの頻度を落とす,といったことをしているそうです。 ただ,更新の頻度が単に高いだけではダメです。重要性が高いと考えられるWebサ

    どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup