首页

基于半监督学习的微博情感分析方法研究 11月22日

【摘要】微博的快速发展使其平台积累了大量的文本,其中蕴含着大量的有价值的信息,包括商业信息、社交网络和用户观点与情感等。微博的短文本特征使其文本分析具有一定挑战性,并且中文文本固有的特征使得文本分析性能下降。针对上述特征,本文应用半监督学习对微博文本进行情感分类:结合语言资源和标注集合对文本情感分类器进行训练和优化。情感分类包括两个任务:识别情感的极性,如正性、负性;识别情感类别:如高兴、愤怒。本 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

多分类机器学习及其在蛋白质结构类预测中的应用 04月12日

【摘要】随着人类基因组计划的完成以及生物测序技术的发展,大量的蛋白质序列信息数据不断涌现出来。然而人们对蛋白质高级结构和功能的认识还不够,远远落后于对蛋白质序列的认识。同时通过传统的生物实验方法已经无法满足海量数据的处理需求,因此非常有必要探讨借助计算机的快速计算能力,来进行蛋白质结构和功能的理论研究,这也是摆在生命信息科学工作者面前的极具挑战的任务。蛋白质作为生命活动的主要表现者和承担者,通过研 […]

基于志愿感知的实时交通信息采集研究与系统设计 06月30日

【摘要】实时交通数据的采集作为智能交通系统中最为基础和关键的子系统,以其重要的作用和巨大的应用价值受到各界的广泛关注,特别是大数据时代的来临,使得其潜在价值也越来越凸显。在实时交通数据采集技术的发展过程中,随着移动互联网的发展和智能手机的普及,基于移动感知的实时交通数据采集技术以其成本低、覆盖率高等优势,逐渐成为近年来的研究热点,不少学者对此都展开了一系列研究。本文研究了基于移动感知的实时交通数据 […]

基于T-RBM算法的DBN分类网络的研究 03月22日

【摘要】利用机器学习算法处理数据分类任务已经研究多年,这期间涌现出很多经典有效的算法,如K-means,SVM,梯度下降算法等。这些算法广泛应用于数据分类、数据挖掘、图像识别、医学成像、雷达探测等商业、工业、医疗,军事等领域中。由于使用的环境极其广泛复杂,导致数据分类任务一直是计算机学科领域最具挑战性的任务之一。随着数据分类任务复杂程度的增加,以深度学习(DeepLearning)为基础的分类算法 […]

蛋白质亚细胞定位预测中若干信息提取算法研究 03月22日

【摘要】蛋白质的功能与其亚细胞位置有着密切的联系,对于确定一个未知特性蛋白质的功能,基于机器学习的蛋白质亚细胞定位预测研究能够为其提供重要的参考信息。本文主要关注亚细胞定位预测中的信息提取算法,研究内容如下:(1)基于AAindex数据库挖掘的信息提取算法。根据氨基酸的理化性质,采用自相关函数和氨基酸约化分类的信息提取方法扫描AAindex数据库中的544种氨基酸指数,系统的研究不同的氨基酸指数、 […]

酒店在线评论的情感倾向挖掘方法应用研究 10月03日

【摘要】愈来愈多的在线消费用户开始浏览大量的网络评论来了解产品和服务的口碑,帮助自己做出可靠的决策。同时网络客户评论作为反馈机制也帮助了服务提供商改进其服务从而获得竞争力。但是,网络评论数量的飞速增长,使得信息内容越来越庞杂,造成客户评论中有用信息难以获取的后果,尤其使得客户难以在短时间内获得对于人物、事件、产品的观点和态度。因此,迫切需要一定的技术手段来使这一过程变得更为准确而便捷,此时“评论挖 […]

基于机器学习的膝关节摆动信号分类算法研究 02月09日

【摘要】膝关节(kneejoint)在人体运动过程中起着至关重要的作用,且易受伤和引起骨关节炎。早期的膝关节疾病诊断能帮助医生采用适当的治疗或外科手术以防止膝关节进一步恶化。膝关节摆动信号(kneejointvibrationorvibroarthrographicsignal,VAG)是通过传感器在膝盖骨表面采集到的摆动声音信号,可作为一种无创的膝关节疾病检测技术。计算机辅助分析膝关节摆动信号, […]

基于Boosting思想的半监督学习算法研究 01月24日

【摘要】Boosting算法是一种利用组合分类器思想提高算法学习性能的一种算法。近年来Boosting算法的研究成为机器学习领域的热点,并产生了Adaboost等Boosting系列算法。Boosting算法性能比较好,是一种比较好的提升算法,近年来Boosting系列算法被广泛的应用于很多领域。半监督学习是当前机器学习领域的一个比较热门的方向,半监督学习能够充分利用训练样本中的无标签样本,能够结 […]

基于集成学习的蛋白质结晶偏好性预测 01月19日

【摘要】基于蛋白质结晶的X射线晶体成像技术是目前主要分析蛋白质结构的实验技术,目前大多数已被解析出来结构的蛋白质均使用这个方法,但是这种实验技术存在成功率较低的问题。因此,对于一个给定蛋白质,预测其是否能够结晶或者是有多大结晶可能性具有很强的实际意义。本文针对该问题,首先在网上数据库中下载了最近最新的数据,构建了训练数据集,之后在对相关文献研究的基础上选择了较为全面的特征集合,最后使用集成学习的方 […]

基于Hadoop的医院数据中心系统设计与实现 06月24日

【摘要】随着国民经济的发展,医院信息化进程的不断推进,以电子病历、PACS系统等为代表的临床信息系统得到了广泛的使用。医院推进信息化过程中,数据存储问题日益凸现出来,传统分散式的数据存储模式有着明显的缺陷,数据安全性、可靠性得不到保障,数据备份繁琐,并且无法挖掘数据的潜在价值,因此数据中心建设提上医院信息化日程。鉴于以传统Unix服务器为基础的数据中心具有成本高、计算能力不足、数据读取速度相对较慢 […]