タグ

2010年11月6日のブックマーク (3件)

  • 階層クラスタリング for はてブ・タグ付けデータ: エスキュービズム ラボ Blog

    階層クラスタリングは、データマイニング手法の一つです。 今回はこの手法を、はてなブックマークのタグ付けデータに対して適用しました。 まずは、結果から紹介します: より大規模なデータセットを用いて解析した結果はこちら: ツリー表現 タグクラウド表現  === 解説 === 階層クラスタリングは、 「類似する要素をグループ化し、 徐々にそのグループもグループ化していき、 最終的に一つのグループにして、 階層的に要素およびグループを表現する」手法です。 上の例では、 “レシピ”と”料理”がまずグループ化されて、次に、そのグループと””がグループ化されています。 そのグループはさらに、音楽やアニメ、ゲーム関連の要素 (”音楽”、”music”、”アニメ”、”ニコニコ動画”、”著作権、”game”、”ゲーム”) からなる階層的なグループと統合されています。 このようなグル

  • これがWikipediaの裏側、知られざる大規模システムの実態「Wikipedia / MediaWiki におけるシステム運用」

    Wikipediaといえば世界で第5位の訪問者数を誇る巨大サイトですが、システム運営に携わる人間は世界でわずか6人、しかもこれはボランティア込みという恐るべき少人数で、第4位のFacebookのサーバ数が3万台を超えているのに対して、Wikipediaはわずか350台で運用している……などというような感じで、知られざる今のWikipediaの実態が「KOF2010」にて日行われた講演「Wikipedia / MediaWiki におけるシステム運用」で明かされました。 登壇したのはWikipediaを運営するWikimedia財団のエンジニアであるRyan Lane氏で、100席ある座席は満席になり、隣の中継の部屋まで人があふれているほどの盛況っぷりで、語られる内容もなかなか参考になることが多く、今後のGIGAZINEサーバにも活かせそうな内容でした。 というわけで、「Wikipedia

    これがWikipediaの裏側、知られざる大規模システムの実態「Wikipedia / MediaWiki におけるシステム運用」
  • 外国人が特に勘違いしやすい、イギリスの呼び名や区分いろいろ : らばQ

    外国人が特に勘違いしやすい、イギリスの呼び名や区分いろいろ イギリスは日と同じ島国ですが、いくつかの国が合わさった連合王国でもあり、島ごとの区切りなど、どこでラインを引くかで呼び名も変わってきます。 イングランドやウェールズなどの区別は良く知られていますが、細かい区別までとなると、あまり知られていません。 外国人が特に勘違いしやすい、英国の線引きと呼称を図解したしたものがありましたのでご紹介します。 ブリテン諸島"The British Isles" いわゆるグレートブリテン島とアイルランド島の2つの大きな島と、その周辺の小さな島々から構成されている。 ブリティッシュ・アイランズ"The British Islands" 正式名称はグレートブリテン及び北アイルランド連合王国。国内の法のもとに使われる名称。 マン島"The Isle of Man" グレートブリテン島とアイルランドにはさま

    外国人が特に勘違いしやすい、イギリスの呼び名や区分いろいろ : らばQ
    seikenn
    seikenn 2010/11/06
    これはいいね。一度しっかりと覚えたい