字符串词典压缩索引算法研究 06月30日
【摘要】近年来,随着互联网的迅猛发展和移动设备的大量普及,尤其是大数据时代的到来,越来越多的数据需要处理,其中文本数据占据着越来越大的比重,如何对大规模文本数据进行高效地存储和索引成为一个新的挑战。面对这一挑战,主要有两种解决思路:一种是对数据进行空间上的压缩,使得在相同存储资源的情况下,能存储和处理更多的数据;另一种是设计更加高效的外存算法和数据结构,把数据放在外存,每次只读取需要的部分到内存中 […]
【摘要】近年来,随着互联网的迅猛发展和移动设备的大量普及,尤其是大数据时代的到来,越来越多的数据需要处理,其中文本数据占据着越来越大的比重,如何对大规模文本数据进行高效地存储和索引成为一个新的挑战。面对这一挑战,主要有两种解决思路:一种是对数据进行空间上的压缩,使得在相同存储资源的情况下,能存储和处理更多的数据;另一种是设计更加高效的外存算法和数据结构,把数据放在外存,每次只读取需要的部分到内存中 […]