[关闭]
@xzyxzy 2018-07-02T10:15:00.000000Z 字数 3980 阅读 568

AC自动机

字符串

作业部落

评论地址


一、概述

,中文名自动机,是图的一种,实现高效多串匹配单串的一种字符串算法
跟踪dalao的blog
树上令一个点表示从根到它的串,那么一个点的fail指向和它拥有最长后缀的串(所以可以指向

二、题单

三、做题经验

1
用来多串匹配单串或多串,效率高于(可以代替),但是字符集很大时候需要大空间或用时间换空间(开
2
套路:表示到第号节点(长串匹配到),匹配长度为(短串匹配到)的方案数啥的

四、Tip

! 是一棵树,但是自动机是图,可以存在环(病毒
! 构造数据的时候,可以检查自己写的自动机是否可以从第一位开始匹配

五、模板

洛谷3808模板1
首先建出树(),然后通过算出,再进行匹配

  1. #include<iostream>
  2. #include<cstdio>
  3. #include<cstdlib>
  4. #include<cstring>
  5. #include<queue>
  6. #define end end1
  7. using namespace std;
  8. const int MAXN=1000100;
  9. int ch[MAXN][26],end[MAXN],fail[MAXN];
  10. char s[MAXN];
  11. int N,node;
  12. queue<int> Q;
  13. void Build()
  14. {
  15. int len=strlen(s),x=0;
  16. for(int i=0;i<len;i++)
  17. {
  18. if(!ch[x][s[i]-'a']) ch[x][s[i]-'a']=++node;
  19. x=ch[x][s[i]-'a'];
  20. }
  21. end[x]++;
  22. }
  23. void Get_Fail()
  24. {
  25. for(int i=0;i<26;i++) if(ch[0][i]) Q.push(ch[0][i]);
  26. while(!Q.empty())
  27. {
  28. int x=Q.front();Q.pop();
  29. for(int i=0;i<26;i++)
  30. if(ch[x][i]) fail[ch[x][i]]=ch[fail[x]][i],Q.push(ch[x][i]);
  31. else ch[x][i]=ch[fail[x]][i];
  32. }
  33. }
  34. int AC()
  35. {
  36. int len=strlen(s),x=0,ans=0;
  37. for(int i=0;i<len;i++)
  38. {
  39. x=ch[x][s[i]-'a'];
  40. for(int p=x;p&&~end[p];p=fail[p])
  41. ans+=end[p],end[p]=-1;
  42. }
  43. return ans;
  44. }
  45. int main()
  46. {
  47. cin>>N;while(N--){scanf("%s",s);Build();}
  48. Get_Fail();scanf("%s",s);
  49. printf("%d\n",AC());return 0;
  50. }

六、一句话题解

[luogu3808]【模板】AC自动机(简单版)
把模式串的AC自动机建好后用文本串匹配,匹配完成就删去此串及其后缀

[luogu3796]【模板】AC自动机(加强版)
[CJOJ1435] 【模板题 USACO】AC自动机
[BZOJ3172][TJOI2013]单词
统计每个模式串出现次数,匹配时打个标记,然后用树DFS完成统计数量

[HDU2296]Ring
表示母串匹配到第位,匹配到AC自动机上第个节点的最大权值,同时记录表示选择的方案

[BZOJ1030][JSOI2007]文本生成器
表示生成文本长度为,匹配到AC自动机上第个节点的没有出现认识的单词的方案数,最后用总方案减去所有不合法方案即为答案

[Luogu2444][POI2000]病毒Hard
如果AC自动机上出现了没有标记的环那么就存在无限长的串使得不存在任何模式串

[BZOJ1009][HNOI2008]GT考试Hard
表示长串枚举到短串匹配到的方案数,由于短串很短,所以另表示短串从上次匹配的下一位将要匹配从而匹配/失配到了的方案数,使用矩阵乘法,表示枚举下一位数字是几来更新方案数

[BZOJ3530][SDOI2014]数数Hard
数位DP,表示数字有位,AC自动机上匹配到第个节点,比小/等/大的方案数,最后统计位数比小的所有答案以及位数等于

[Luogu3121][USACO15FEB]审查CensoringHard
建好AC自动机后跑匹配,记录匹配母串中每个字符出现的位置,如果遇到节点那么回到该词前一个字符的位置,继续向下匹配

[BZOJ1212][HNOI2004]L语言Hard
AC自动机:可以识别的是若干个区间,从起点起,能够被搜到的最右端节点即为答案
Trie树DP:字符串反转后建表示能否被识别,当树上的一个单词的时候

[Luogu3041][USACO12JAN]视频游戏的连击Video Game Combos
表示母串长度为,匹配到AC自动机上第个节点的最大分数

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注