タグ

wikipediaに関するatomoharuのブックマーク (2)

  • Wikipediaのキーワードリンクを使って関連語データを作ってみた

    Wikipediaのキーワードリンクを使って関連語データを作ってみた 2007-06-09-3 [NLP][Programming][Algorithm] Wikipedia のキーワードリンクを使って関連語データ(関連キーワード集) を作ってみた。 Wikipedia のデータはダウンロードページからbz2形式のを取ってきた。 日のウィキペディアのXMLデータね。 (see Wikipedia:データベースダウンロード) で、Perlスクリプトで以下の関連語データ作成処理を行った。 (スクリプトはこの記事の末尾に載せておく) (1) 各キーワードページに含まれているキーワード(リンク)を取り出す。 例えばキーワードAのページにB,C,Dが含まれていたら、A => B,C,D というデータを蓄積。 またキーワードAが他のキーワードのページ(例えばX)に含まれていたら、それも蓄積。その場合

    Wikipediaのキーワードリンクを使って関連語データを作ってみた
  • 2ちゃんねる化するウィキペディア - 池田信夫 blog

    ウィキペディアの私に関する項目が、何度も削除されているらしい。いま残っているのは数行の経歴だけだが、これすら間違っている。私は「経済評論家」などと呼ばれたこともないし、名乗ったこともない。私が博士課程を中退したのは、1997年である。 前の記事でも書いたように、私は日のウィキペディアの品質には疑問をもっているので、このブログでもほとんどリンクを張らない。大部分は英語版の質の悪いダイジェストで、日語版オリジナルの項目には事実誤認や個人への中傷が多い。西和彦さんの項目などは、学歴や職歴まで間違いだらけで、人が怒って編集し、大バトルが繰り広げられた末、大部分は削除されて保護されてしまった。 このようにウィキペディア日版の質が悪い原因は、ウェブで匿名が当たり前になっていることが影響していると思われる。歌田明弘氏によれば、アメリカのブログの8割は実名だが、日の9割は匿名だという。日

    atomoharu
    atomoharu 2006/12/27
    2chにしてもwikipediaにしても、大部分はそうではないと思う。でも、当事者にしてみたらたまったものじゃないだろうなぁ。
  • 1