[关闭]
@zzzxxxyyy 2018-10-29T17:13:04.000000Z 字数 1746 阅读 1992

序列模式挖掘(Sequential Pattern Mining)--核心算法学习



1. Suffix Tree(ST)----Ukkonen's Algorithm(UA)

Key: 如果 P 是 S 某个后缀的前缀,那么 P 是 S 的 substring


1 预先构造一个 Suffix trie

PS: 叶子数 = 后缀的数目


2 构建隐式 ST

3 UA

  1. $I_{i} = S[1,i]$ ##Prefix of S
  2. construct I_{1}
  3. ## 从 I_{i} 构建I_{i+1}
  4. for i = 1 to m-1
  5. for j = 1 to i + 1
  6. 找出P 从根部开始结束位置的label,逐一使用 S[i+1] P进行 extend
  7. convert I to ST

4 减少 Runtime ---> O(m)


扩展后,直接跳转到下一个需要扩展的地方,而不是从根部开始搜索查询

2 Count


5 使用的数据结构

6 广义后缀树

Define : A set of Strings S.

2 Apriori-like 算法

Key: 不频繁的子序列的额超集也不频繁

1 Apriori Alg

2 GSP

3 FP-Tree

3 PrefixSpan 前缀投影的模式挖掘


针对特定的实际情况优化算法


刘闯
2018/10/30

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注