@evilking
2017-10-15T11:03:43.000000Z
字数 858
阅读 1087
杂谈
代码更新
这个没什么好说的了
资源文件更新
资源文件更新后部署到指定目录,需要把之前的资源目录给删除,因为其中有缓存文件生成,程序会先读取缓存文件,如果没有缓存文件才会去读这些资源文件,所以如果没有删除这些缓存文件,那就不会去读这些新更新的资源文件,导致更新的资源文件没有生效;
主要有data/目录下的
这几个缓存文件,需要删除,以免影响数据更新
警告信息的打印
上面资源文件的更新中说了,会先去读缓存文件,如果找不到缓存文件,控制台会打印警告信息,如" "之类的信息,这些信息都属于正常情况;
至于其他关于大数据平台工具的相关信息,就需要大数据开发人员配合去分析了.
正常启动非常慢
企业全称匹配和简称匹配这块,使用了新的算法,这个算法使用了数组链表的数据结构,当数据量非常大时,需要调整数组链表中数组块的大小;数组块的大小比较小时,数组元素查找就涉及到很多的引用查询,就比较耗时;如果正常构建速度很慢,可以适当增大数组块的大小.
内存溢出
多模式匹配这块使用了双数组字典树,并且是以空间换时间的方式来构建字典树;内存占用会先接近原来所需内存的两倍,后面双数组这个数据结构构建完成后,中间使用的一些数据结构占用的内存会释放掉,从而整体内存占用会比原来的算法小很多。
但是中间过程的内存占用消耗会比较大,有可能这里发生内存溢出.