タグ

wikipediaに関するhikedaのブックマーク (2)

  • Wikipediaのキーワードリンクを使って関連語データを作ってみた

    Wikipediaのキーワードリンクを使って関連語データを作ってみた 2007-06-09-3 [NLP][Programming][Algorithm] Wikipedia のキーワードリンクを使って関連語データ(関連キーワード集) を作ってみた。 Wikipedia のデータはダウンロードページからbz2形式のを取ってきた。 日のウィキペディアのXMLデータね。 (see Wikipedia:データベースダウンロード) で、Perlスクリプトで以下の関連語データ作成処理を行った。 (スクリプトはこの記事の末尾に載せておく) (1) 各キーワードページに含まれているキーワード(リンク)を取り出す。 例えばキーワードAのページにB,C,Dが含まれていたら、A => B,C,D というデータを蓄積。 またキーワードAが他のキーワードのページ(例えばX)に含まれていたら、それも蓄積。その場合

    Wikipediaのキーワードリンクを使って関連語データを作ってみた
  • Wikipedia:珍項目 - Wikipedia

    0ルピー紙幣 インドの模造紙幣。役人からの贈賄要求に抗議するため、市民団体が作成した。 1に等しい数? 0.999... 循環小数 0.999...によって表される実数は、寸分違わずちょうど 1 に等しい。その証明と、そこから広がる数学の世界。 100年電球 1901年から点灯し続けている消防署の電球。 1956年メルボルンオリンピックのニセ聖火リレー事件 ナチズムに起源を持つとして聖火リレーに抗議した学生のイタズラ。 300ページのiPhone請求書 AT&Tモビリティから送られた、300ページにも及ぶiPhone使用料金の請求書。 4千年紀以降 まず誰もその目で確認できないであろう遠い遠い未来の予想。 4分33秒 ジョン・ケージの前衛音楽。「第1楽章:休み。第2楽章:休み。第3楽章:休み」。 5秒ルール 落としたべ物がもったいない! というときの奥の手。世界規模で認知されている。 5

  • 1