「はてなアンテナの登録数ランキング(個人ニュースサイト篇) - 鯨飲馬食コード」を元に作った個人ニュースサイトのURLデータセットを「News Site URL Dataset 鯨飲馬食コード+」に公開した。 新しいデータ(ns20081011.txt)は前回のデータ(ns20080706.txt)からいくつかのURLを除外および追加した。除外したURLは主にリンク切れしていたものと、2008年に更新がないサイトのもの、明示的に更新を停止もしくは移転した旨が記載されていたサイトのURLである。追加した主なURLは移転先のURLと更新が停止したサイトで推薦されていたサイトのURLである。ただ、あまり厳密な基準を設けたわけではない。またドメインが売買された形跡があるサイトもあったが、判断できなかったものはそのままにした。 オリジナルのデータ(parallels2.txt)自体が新興ニュースサイ