タグ

アルゴリズムに関するk_staticのブックマーク (3)

  • アソシエーション分析(あそしえーしょんぶんせき)

    POSデータ(注1)などの巨大なデータベースから、価値あるアソシエーション・ルール(注2)を抽出するデータマイニング(注3)・テクニック。マーケットバスケット分析(注4)に利用される。 アソシエーション・ルール抽出(association rule extraction)、アソシエーション・ルール・マイニング(association rule mining)、アソシエーション・ルール発見(association rule discovery)などともいう。 小売業のPOSシステムでは、日々大量のトランザクションデータが生み出されている。この中には、「パンとバターを購入した取引の90%がミルクも購入している」といった法則が秘められているが、中規模の小売店舗でも商品アイテム数は数千から数万に及び、その組み合わせ(アソシエーション・ルール)は無数にある。そのため、どの組み合わせが価値ある法則であ

  • クラスター分析(くらすたーぶんせき)

    多変量解析の1つで、対象物(データの集まり)をサンプルの類似度(距離)によって、いくつかのグループ(クラスター)に分けるデータ分析/分類手法、あるいはそのアルゴリズムの総称。特にデータを外的基準なしに自動的、定量的に分類する数学的方法をいう。 具体的な手順としては、まず類似性の定義を行ってサンプルの類似度を数値化する。そこからサンプルそれぞれの距離を算出し、それに応じてサンプル同士をまとめ(クラスタリング)、クラスター間の距離も計算する。距離の測定方法としては、ユークリッド距離、ユークリッド平方距離、標準化ユークリッド距離、ミンコフスキー距離、マハラノビスの距離などがある。 クラスタリング手法(アルゴリズム)も、分析や用途に応じてさまざまなものが提唱されており、その分類もいろいろあるが階層的と非階層的で説明することが多い。階層的方法には、最短距離法、最長距離法、メジアン法、重心法、群平均法

    クラスター分析(くらすたーぶんせき)
  • Googleからのアドバイス「高品質なサイト」とは? チェックリストを公開 ::SEM R (#SEMR)

    Googleからのアドバイス「高品質なサイト」とは? チェックリストを公開 検索アルゴリズム的に「高品質なサイト」って何だろう?Googleが、高品質サイトを判断するための参考になる「質問集」を公開。 公開日時:2011年05月07日 09:03 米Googleは2011年5月6日、役に立たない低品質サイトの排除と同時に優れたコンテンツが検索上位に表示されるようにするためのアルゴリズム変更(パンダ・アップデート(Panda Update))に関連して、同社が考える「高品質サイト」について言及している。 検索マーケティング業界で話題になっているパンダ・アップデートとは、いわばアルゴリズムで自動的にサイト品質(site quality)を判断しようとするGoogleの取り組みだ。低品質サイトの検索順位を低下させることにより、検索利用者が優れたコンテンツを探し出せるようにする狙いがある。 「アル

    Googleからのアドバイス「高品質なサイト」とは? チェックリストを公開 ::SEM R (#SEMR)
  • 1