タグ

アルゴリズムに関するksk0531のブックマーク (2)

  • tf-idf - Wikipedia

    情報検索の分野において、tf–idf (または、 TF*IDF、TFIDF、TF–IDF、Tf–idf)は、term frequency–inverse document frequencyの略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量(数値)である[1]。また、tf-idfは情報検索や、テキストマイニング、ユーザーモデリング(英語版)における重み係数(英語版)にもよく用いられる。ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。この性質は、一般にいくつかの単語はより出現しやすいという事実をうまく調整することに役立っている。今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。2015年に行われた研究

    ksk0531
    ksk0531 2013/05/16
    なるほどわからん。
  • 米Google Matt Cutts、Google 検索アルゴリズムの変更計画の詳細を語る ::SEM R (#SEMR)

    Google Matt Cutts、Google 検索アルゴリズムの変更計画の詳細を語る グーグル・マットカッツ氏が今後のGoogle検索ランキングアルゴリズム変更計画について語る。ペンギンアップデートは次回は大きなものに、新しいリンク分析アルゴリズムの導入など。 公開日時:2013年05月14日 04:52 米Google マット・カッツ氏が、今後の同社検索アルゴリズムの変更計画やスパムへの対応について、ビデオで詳細を語った。 “What should we expect in the next few months in terms of SEO for Google?” 以下、重要なところをピックアップ。 ペンギン・アップデート ペンギンアップデートについては既報の通り、次回の更新はより広範囲で、より影響が大きなものになるという。次回更新は Google 内部では「ペンギン 2.0

    米Google Matt Cutts、Google 検索アルゴリズムの変更計画の詳細を語る ::SEM R (#SEMR)
  • 1