首页

基于特征抽取和转换方法的全文检索研究 07月22日

【摘要】在信息检索技术随着互联网的迅猛发展而日趋成熟的同时,搜索引擎也已经成为人们日常生活中越来越不可缺少的重要工具和手段。传统的信息检索是在基于关键词匹配的基础上,机械地匹配仅仅包含有指定关键词的文档来获得相关文档,这种方式常常会带来语义理解上的错误,越来越不能满足现状用户的需求和科学研究的需要,于是语义分析和挖掘显现了在检索中的重要性。由于汉语语言的二义性和相关性,在一定程度上造成了不确定性和 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

基于共现词的中文微博观点句识别 05月10日

【摘要】近年来,随着计算机移动技术和社会媒体的发展,微博已经成为一个热门的信息交流平台。但是由于微博平台中的数据量非常庞大,在这样浩瀚的数据海洋中提取出带有观点的句子不是一件容易的事情,所以如何提取出带有用户观点的句子也越来越受到关注。但是,目前的中文微博观点句提取方法都集中在使用句法分析与分类器,忽略了微博主观信息所具有的内容关联性。因此,本文将传统观点句识别方法与共现词相结合,提出了基于内容共 […]

基于主题和结构的微博社区挖掘方法研究 08月22日

【摘要】近几年,随着互联网的兴盛,在线社交网络(Onlinesocialnetwork,OSN)蓬勃发展。其中,微博(Microblog)作为一种全新的社会化媒体工具和网络交流工具,以其“短、平、快”的特点迅速捕获大众的青睐。目前我国微博用户已经超过3亿人,将近占我国互联网用户的一半,全球排名第一。面对如此庞大的用户群,无论是网络管理者还是使用者都面临着许多全新的机遇和挑战。用户如何在茫茫人海中找 […]

中文短文本分类技术的研究与实现 07月26日

【摘要】文本分类是文本挖掘领域的一门重要学科,是指在已知的分类体系中,根据已知文本内容自动确定未知文本类别的过程,文本分类在一定程度上帮助用户处理获得的杂乱信息,有助于用户根据自己的倾向有选择地阅读海量的文本。目前多数情况下,文本分类大多是对于长文本进行分类,所处理的文本包含比较多的信息。然而,随着互联网的飞速发展,越来越多的短文本出现在生活中,由于短文本包含的信息量有限,传统的处理长文本的分类方 […]

基于主题模型的动态场景分类 06月30日

【摘要】场景分类是指根据特定意义对图像数据集进行自动标注,是当前计算机视觉领域的一个研究热点。本文以动态场景为研究对象,以视觉词包-语义主题建模-动态场景语义分类为主线,研究基于主题模型的动态场景分类方法。研究内容主要包括动态场景视觉词典的构建,基于先验知识的消息传递主题模型建模以及动态场景语义分类的实现。论文的主要工作如下:1、针对现有主题语义场景分类方法大多局限于静态图像集,视觉单词生成方法不 […]

基于主题模型的人物行为识别 06月30日

【摘要】人物行为识别是计算机视觉领域研究的基础任务和关键技术之一,被广泛应用于智能视频监控、高级人机交互、视频会议、基于行为的视频检索以及医疗诊断等。因此,研究人物行为特征描述方法并进行行为识别具有理论意义和实际应用价值。论文针对实际场景中由于运动目标和背景复杂带来的行为描述和后期识别困难问题,展开了动态场景下的人物行为识别研究。其主要工作创新体现在:1)针对复杂和动态背景容易造成兴趣点误检,影响 […]

主题模型的评价方法研究 12月31日

【摘要】主题模型可以帮助我们的研究人员在机器学习领域的深入研究,还可以帮助我们解决很多现实世界的问题。本文涉及到的主题模型有LDA,CTM和OnlineLDA三种主题模型,那么三种主题模型中,哪个主题模型更受欢迎呢?本文研究的主要内容是主题模型的评价方法,拟通过不同的方法,分别来评价主题模型。首先通过行为实验来评价主题模型,实验前将各个主题模型运行后提取出各个主题模型词汇云,词汇云会根据相应词出现 […]

基于排序主题模型的自动文摘及评价系统 12月07日

【摘要】随着时代的发展与进步,计算机及互联网成为人们生活中必不可少的一部分,大量信息随着互联网技术的迅猛发展以电子文本的形式出现在人们面前。如何快速、准确地从大量无结构化的文本中获取人们需要的信息成为研究的热点和难点。人们越来越希望用简练的文字表达大量相关文本的主要内容,从而减少获取有用信息的时间。自动文摘技术就是解决这一问题的有效工具。主题模型在自动文摘中被广泛应用,通过得到的主题分布抽取原文中 […]

基于主题模型和社区发现的微博热点事件检测研究 02月13日

【摘要】凭借简便快捷的信息生成机制和传播机制,微博这一新兴的社交网络服务媒体在Web2.0时代已无处不在。与传统媒体相比,在新闻事件的播报和传播上,微博更加及时高效。因而基于微博数据的热点事件检测成为近几年的一个研究热点。但微博的一些特性为微博热点事件检测任务带来挑战。首先,微博数据流中有大量无价值、无意义的“噪声”微博,如何有效的从微博数据流中将令人感兴趣的事件微博与大量“噪声”微博区分开是微博 […]

面向证券应用的WEB主题观点挖掘若干关键问题研究 11月20日

【摘要】受有效市场假说的影响,证券行业不断重视对互联网文本数据的研究。但随着互联网技术的发展,尤其是近年来涌现出各种社交网络平台,互联网上的文本数据发生很大变化,开始出现大量带有感情色彩的主观性信息。这些主观性信息的内容涉及社会生活中的各种热点话题,因此在证券行业拥有巨大的应用空间。然而,主观性信息在文本中的表现形式与客观性信息不同,一般比客观性信息更加复杂,因此利用传统的文本挖掘方法已经无法解决 […]