エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ユニークな文字列検索 (SUS, MUSについて) - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
ユニークな文字列検索 (SUS, MUSについて) - Qiita
これは「文字列アルゴリズム Advent Calendar 2016」18日目の記事です。 はじめに この記事では文字列か... これは「文字列アルゴリズム Advent Calendar 2016」18日目の記事です。 はじめに この記事では文字列からSUS, MUSと呼ばれる特徴的な部分を見つけ出す研究について紹介します。 Unique Substring 文字列にはDNA配列(A, T, G, C)や文章などがあります。それらの文字列にとって一度しか出現しない(ユニークな)部分文字列は、重要な意味を持つ可能性があります。例えば、DNA配列でユニークな配列は特徴のある遺伝情報を持つはずです。 ユニークな部分文字列を見つける事は、部分文字列が短いほど難しくなります。例えば"山田"がユニークな部分文字列であったとして、それに一文字追加した"山田優"は必ずユニークですが、一文字削った"山"はユニークでないことがあります。 "山田優は山へ芝刈りに行く" 下記のような短くてユニークな部分文字列を見つけ出す研究が行われました