タグ

2009年4月28日のブックマーク (2件)

  • 日笠陽子のひよっ子記 : み、み、ミラクル! - ライブドアブログ

    2009年04月26日 み、み、ミラクル! 先程しゅがりんから オリコンデイリー ED1位、OP2位になってる というメールがっ! あわあわ 皆様ほんとにありがとございます!!! 嬉しすぎです!(Pд<。) どうしよう…! 一生分の幸せ貯金使い果たしてるっぽくないですか私(@_@;) そわそわしてどうしようもない! とりあえず近くの公園走ってきますね! あああああああ

  • DO++ : 部分文字列の話

    ここしばらく、部分文字列の統計量を利用した機械学習やデータマイニングをやっている。そこの話からちょっと抜粋。 長さnの文字列T[1,...,n]が与えられた時、T中に出現する部分文字列T[i...j] (1≦i≦j≦n)の数はn個の中からiとjの2箇所を選ぶのでO(n^2)個ある。例えば、n=10^6(1MB)だったら、部分文字列の数は約10^12個(1T)と非常に大きい。 しかし、これらの部分文字列の出現位置は同じである場合が多い。例えばT="abracadabra"であれば、"abra"と"abr"の出現場所は1番目と8番目であり、全く同じである。 では出現位置(部分文字列の左端を出現位置とする)が全く同じであるような部分文字列をまとめてグループにした場合、グループの数はいくつになるのだろうか。 これは接尾辞木(wikipedia 授業の資料)を知っているなら簡単に説明できる。 Tに対

    DO++ : 部分文字列の話