タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

db設計に関するaprlのブックマーク (1)

  • 記事-タグの関係をMySQLicious化 (2008-05-05)

    この構造の問題点は、たとえば「Opera」と「ノウハウ」を含んで「演劇」を含まない記事を出したい! というのが面倒なこと。そのかわり正規化されているからとってもリレーショナル。ある時期に頻出するタグを求めるみたいなことがTF-IDFの応用ですぐできる。HarmanとSparck Jonesによる正規化を組み合わせると、ある期間に頻出するタグiは、log2(タグiのある期間内での登場数+1) / log2(ある期間内に登場したタグの種類数) * (log2(全記事数 / タグiがつけられた記事数) + 1)で求められる。ちゃんと正規化されていればこの計算をSQLで行うのは簡単だが、1セルにすべて閉じ込めてしまうととたんに面倒になる。ただ、そんな頻度の少ない処理が面倒になることよりもいつも行う処理が1つのテーブルを参照するだけですむことのほうが重要だ。記事のCRUDが1テーブルでできるようにな

    aprl
    aprl 2008/05/08
    ある時期に頻出するタグを求める。記事のCRUDが1テーブルでできるようになれば、記事の更新をphpMyAdminから行うことだってできる。
  • 1