基于词项依赖信息的中文信息检索方法研究 03月27日
【摘要】随着我国智能手机的普及,移动互联网使用人数的增加,促使了移动互联网的飞速发展,网络中存储的各种数据呈指数级增长。如何利用信息检索技术快捷有效地从这些海量的数据中获取有用的信息,是工业界和学术界都极其关注的问题。传统的信息检索技术大多基于“词袋”模型,假设词项之间是相互独立的,而忽略了词项之间的依赖关系。本文利用统计方法捕获词项之间的依赖关系,构建更有效的中文信息检索模型。主要的工作包括以下 […]
基于语义分析的文档排序方法研究 07月22日
【摘要】随着社会的快速发展,科学技术的不断进步,人们所能接触到的信息也成几何级的增长,这些信息的不断积累就形成了我们熟知的“海量数据”。那么如何在海量数据中准确而快速地检索到用户需要的信息成为互联网信息时代所面临的机遇和挑战。本文分析了语义相关度计算和主题模型的国内外研究方法,发现在现有的研究中大都是简单的从统计学的角度来对查询语句和文档进行匹配而忽略了对文档语义知识的挖掘。因此,本文从这个方面对 […]
基于特征抽取和转换方法的全文检索研究 07月22日
【摘要】在信息检索技术随着互联网的迅猛发展而日趋成熟的同时,搜索引擎也已经成为人们日常生活中越来越不可缺少的重要工具和手段。传统的信息检索是在基于关键词匹配的基础上,机械地匹配仅仅包含有指定关键词的文档来获得相关文档,这种方式常常会带来语义理解上的错误,越来越不能满足现状用户的需求和科学研究的需要,于是语义分析和挖掘显现了在检索中的重要性。由于汉语语言的二义性和相关性,在一定程度上造成了不确定性和 […]
基于MapReduce的分布式聚类算法在社交网络上的应用研究 01月11日
【摘要】在信息爆炸的大数据时代,人们的生活、工作和思维方式逐渐在改变。对于数据分析而言,传统的抽样方法有悖于数据量的增长态势,使用全体数据取代随机抽样成为时代的发展需求。为了实现这个目标,仅仅依赖摩尔定律来提升计算性能是远远不够的,云计算等弹性计算体系架构逐渐受到关注。社交网络作为互联网发展史上的一个重要和成功的应用领域,也是大数据时代的重要数据来源之一。这不论对于社交网络服务提供商自身还是对其商 […]
林业本体的构建及检索研究 07月27日
【摘要】信息化已经成为国家、地区、行业综合实力和现代化水平的重要标志。林业信息化是现代林业的发展趋势,在多年的发展中取得了较大的成果。但是,目前对于林业信息资源的利用仍然处在较低水平,具体表现为林业信息化标准缺乏全面性和一致性,林业信息资源整合共享不足,统一管理难度较大等。现有的信息检索方法主要是基于关键词匹配,该类方法在很多方面并不能满足用户的查询检索要求。例如,由于一词多义现象的存在,检索工具 […]
信息检索中虚拟域重排技术的研究与实现 10月09日
【摘要】随着Web技术的发展,人们对于信息的需求也与日俱增。用户希望获得信息的渠道和方式更加便捷和高效,尤其是在搜索信息时,期望所需求的信息尽量排在前边,这便是SEO(SearchEngineOptimization,搜索引擎优化)问题。检索结果重排序技术的研究是SEO课题一个重要的分支,且该技术的研究也趋于多样化。近几年在查询扩展中提出了虚拟域概念,取得了很好的效果,构成虚拟域的方法有许多种,但 […]
预测数据空间检索使用概率的隐藏的信息 05月30日
【摘要】由于并非所有的相关数据能有效地融入单一数据模型,因此现在绝大多数的数据组织依赖于海量的多种数据源。数据空间定义为一个虚拟的空间,它管理多种数据源且并不考虑数据结构及物理位置,因此数据源是异构的。由于管理多种数据模型的数据源的需求越来越多,因此对智能管理系统的需求逐渐增多。这种智能管理系统可以提供对异构和分布式数据源的访问,并且可以将其看作是一个单一的信息源用于搜索及查询。由于数据空间中存在 […]