[关闭]
@evilking 2017-10-15T03:03:43.000000Z 字数 858 阅读 971

杂谈

微服务重启注意事项

  1. 代码更新
    这个没什么好说的了

  2. 资源文件更新
    资源文件更新后部署到指定目录,需要把之前的资源目录给删除,因为其中有缓存文件生成,程序会先读取缓存文件,如果没有缓存文件才会去读这些资源文件,所以如果没有删除这些缓存文件,那就不会去读这些新更新的资源文件,导致更新的资源文件没有生效;
    主要有data/目录下的

    • dictionary/custom/CustomDictionary.txt.bin
    • dictionary/person/nr.txt.trie.dat
    • dictionary/person/nr.txt.value.dat
    • dictionary/person/nrj.txt.trie.dat
    • dictionary/person/nrj.txt.value.dat
    • dictionary/CoreNatureDictionary.ngram.txt.table.bin
    • dictionary/CoreNatureDictionary.txt.bin
    • dictionary/stopwords.txt.bin

    这几个缓存文件,需要删除,以免影响数据更新

  3. 警告信息的打印
    上面资源文件的更新中说了,会先去读缓存文件,如果找不到缓存文件,控制台会打印警告信息,如" "之类的信息,这些信息都属于正常情况;

    至于其他关于大数据平台工具的相关信息,就需要大数据开发人员配合去分析了.

  4. 正常启动非常慢
    企业全称匹配和简称匹配这块,使用了新的算法,这个算法使用了数组链表的数据结构,当数据量非常大时,需要调整数组链表中数组块的大小;数组块的大小比较小时,数组元素查找就涉及到很多的引用查询,就比较耗时;如果正常构建速度很慢,可以适当增大数组块的大小.

  5. 内存溢出
    多模式匹配这块使用了双数组字典树,并且是以空间换时间的方式来构建字典树;内存占用会先接近原来所需内存的两倍,后面双数组这个数据结构构建完成后,中间使用的一些数据结构占用的内存会释放掉,从而整体内存占用会比原来的算法小很多。
    但是中间过程的内存占用消耗会比较大,有可能这里发生内存溢出.

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注