タグ

pythonに関するhigan_nのブックマーク (1)

  • ニュース記事の自動分類 (その1) – zcky@fiole blog

    キュレーションアプリ「eS」では、記事をビジネス/テクノロジー/エンターテイメント/スポーツ/ライフのカテゴリに分けて分類しています。 (イチ押しは、それぞれのカテゴリのトップ記事なので、カテゴリとは異なります。) 「テクノロジー」の定義って何って話ですが、そこら辺は私達なりの基準で分けているので、辞書的定義とは少し異なるかもしれません。 分類があると当然読みたい記事を探しやすいですし、分類されている記事群を眺めている方が分類されていない記事群を眺めているより、頭を切り替えなくてよいので読む負荷が低かったりします。 具体的には「eS」はクローリングした記事情報を以下のステップで分類しています。 形態素解析(前処理) 記事の文章を単語単位に区切ります。 例:空が青いのはなぜ? → 空 / が / 青い / の / は / 何故 / ? 分類 区切った単語情報を用いてアルゴリズム(ナイーブベイ

    ニュース記事の自動分類 (その1) – zcky@fiole blog
  • 1