タグ

ブックマーク / www.lewuathe.com (1)

  • TF-IDFでタグ付け

    TF-IDFでタグ付け 03 Nov 2013 Kaggleで挑戦できそうな問題があったのでチャレンジしてみた。 http://www.kaggle.com/c/facebook-recruiting-iii-keyword-extraction Stack Exchange(Stack Overflowみたいなもの)にあるテキストとそのタグデータを訓練データとして 同様にStack Exchangeにあるページからタグを類推せよという問題。 多分キーワード抽出を行う方法がうまく行くんじゃないかと思いやってみた。 TF-IDFアルゴリズム 基的にはTF-IDFを使ってみる。これは文書中のtokenの重要度をその頻度と、他の文書にどれくらいないかの指標 の積として表すアルゴリズム。コードで書くと下のような感じ。 import numpy as np term = <Target Term>

    TF-IDFでタグ付け
    ottonove
    ottonove 2018/04/16
  • 1