タグ

ブックマーク / qiita.com/nezuq (1)

  • Wikipediaを元にした単語辞書に頒布義務はあるのか? キュレーションサービスを巡る法的論争。 - Qiita

    結論 頒布義務があるようです。形態素解析用の単語辞書をご提供いただき、ありがとうございました。 考察 キュレーションサービス(ニュースアプリ。Webコンテンツを集めてユーザーにオススメするサービス)は、Webコンテンツを分類する為に内部で辞書を持っています。その辞書をもとにコンテンツの文章を単語に分け、その単語群からそのコンテンツの特徴を把握します。この辞書はキュレーションサービスにとって、ビジネスの要であると言えます。なぜならば、正確に単語を分ける事ができるのならば、後は定番の機械学習アルゴリズム(ex.Complement Naive Bayes)にかけるだけである程度の精度の分類は行えるからです。先の辞書は秘伝のタレに比喩される事も多いです。 さて、その辞書ですが、世の中で最も多く使われているのはWikipediaのデータセットを元にしたものです。Wikipediaの記事のタイトルは

    Wikipediaを元にした単語辞書に頒布義務はあるのか? キュレーションサービスを巡る法的論争。 - Qiita
  • 1