结合miRNA特征选择与SVM分类器的多种CUP分类
【摘要】针对以往方法使用miRNA识别癌症源敏感性较低的问题,以基于病理学理论的树形结构为基础构建了一个用于识别多种未知原发癌(CUP)组织源的分类器。为了有效提高分类敏感性,在树形结构的每个节点处采用miRNA特征选择与分类器相结合的分类方法。主要研究内容分为两个方面:一是miRNA特征选择问题。特征选择对于改善分类器性能来说是很重要的,去除对分类贡献微弱的特征有助于提高分类准确率,去除与分类无关信息可提高计算速率,降低计算复杂度,所以在对癌症进行分类之前,要先对miRNA做特征选择。选择了3种Weka提供的与信息增益相关的特征选择方法:评价方法为InformationGainRankingFilter、GainRationFeatureEvaluator与CFSSubsetEvaluator,相应的搜索策略/排序方法为BestFirst与Ranker。使用这些方法得到有效的miRNA特征并结合其它文献相关信息最终确定最有用的若干个miRNA,以这些miRNA的表达水平为依据对样本进行逐层分类。二是分类器的选取问题。对于一个分类问题而言,模型的设计与分类算法的选择是相当关键的,已决定采用一个现有的树形结构为基本框架,所以剩下的任务就是选择一个性能突出的分类器在树形结构的每个节点处做二分类。通过对C4.5决策树、CART决策树、KNN分类器和SVM分类器的讨论,发现使用多项式核SVM分类器可以达到很好的分类性能,且SVM模型本身的健壮性与处理二分类问题时的普遍适用性使其更加适合处理本文问题。实验基于Weka平台,结果显示特征选择与SVM分类器相结合的分类方法具有最好的性能,最终测试集的总敏感性达到87%,与Rosenfeld等人的工作相比较,有了1%的提升,而测试集中转移性样本(CUP)敏感性由77%提高到86%,对于这部分样本有了9%的显著提升。在做参数选取时,使用10倍交叉验证对模型进行了评估,通过比较最终测试集测试敏感性与训练集的交叉验证敏感性发现这两部分的敏感性非常接近,说明miRNA特征选择与SVM分类器相结合的CUP分类方法是可靠的且无过拟合。
【作者】张小雪;
【导师】王珂;DunweiWEN;
【作者基本信息】吉林大学,电子与通信工程,2014,硕士
【关键词】miRNA;SVM;CUP;特征选择;分类;
【参考文献】
[1]徐广荣.情绪教育对初一学生情绪稳定性影响的研究[D].湖南师范大学,基础心理学,2004,硕士.
[2]王晓红.末端导引康复机器人机构设计与实现[D].华中科技大学,机械工程,2013,硕士.
[3]张麟.樟白痹痛膏治疗膝关节骨性关节炎的临床观察[D].湖北中医药大学,中医骨伤科学(专业学位),2013,硕士.
[4]王鹏.面向回归测试的银行核心系统自动化测试方案设计与实施[D].北京工业大学,软件工程(专业学位),2013,硕士.
[5]姜阳.饱和硅碳素的再生及其除锰机理的试验研究[D].沈阳建筑大学,市政工程,2012,硕士.
[6]段斌.基于PKI的可信计算体系研究及其应用[D].湘潭大学,2004.
[7]陈国栋,常文森,张彭,陈璟.双机械手对称协调力/位混合控制──模型、控制算法与实现[J].自动化学报,1996,04:418-427.
[8]卢晓庆.基于Web的交通旅游订票系统的设计与实现[D].大连理工大学,机械电子工程,2004,硕士.
[9]王钰.肌内效贴布对缓解肩颈部肌肉紧张度的时效性研究[D].北京体育大学,运动人体科学,2013,硕士.
[10]牡丹.科尔沁蒙古族刺绣图案研究[D].内蒙古师范大学,美术学,2012,硕士.
[11]郑琳琳.基于改进ABC-BSC的钢铁企业物流绩效综合评价研究[D].北京交通大学,2014.
[12]肖青梅.长沙市示范性幼儿园家长教育工作的现状研究[D].湖南师范大学,学前教育学,2013,硕士.
[13]张帆.YZ30型振动压路机动力学分析、计算机仿真及参数优化[D].西安理工大学,机械工程,2003,硕士.
[14]李铭.钢筋混凝土不等肢Z形截面短肢剪力墙的非线性分析[D].长安大学,结构工程,2013,硕士.
[15]王义东,王辉民,马泽清,李庆康,施蕾蕾,徐飞.土壤呼吸对降雨响应的研究进展[J].植物生态学报,2010,05:601-610.
[16]胡慧.嵌入跨国外包体系的产业集群品牌培育研究[D].武汉理工大学,技术经济及管理,2012,硕士.
[17]陈阳.地铁突发事故乘客疏散安全评价及西黄村站出入口设置研究[D].北京交通大学,2014.
[18]张伟.南北方女大学生月经情况与中医体质相关性的调查分析[D].黑龙江中医药大学,中医妇科学(专业学位),2014,硕士.
[19]李晓锋,唐功庆,于中振.石墨烯气凝胶的制备及其导电复合材料[A].中国化学会、中国机械工程学会、中国材料研究学会.2014年全国高分子材料科学与工程研讨会学术论文集(下册)[C].中国化学会、中国机械工程学会、中国材料研究学会:,2014:2.
[20]乌吉斯古楞.蒙古羊多羔性状候选基因ADAMTS1的遗传效应分析[D].内蒙古农业大学,农业推广,2013,硕士.
[21]鲁佩涛.身体与服饰:一项关于农民工与现代性的研究[D].沈阳师范大学,社会学,2014,硕士.
[22]徐旭.重庆市主城区大型商品市场空间布局研究[D].兰州大学,城市与区域规划,2013,硕士.
[23]周银香.我国储蓄—投资转化模式的经济分析和现实选择[D].天津财经学院,2003.
[24]王磊.基于改进AdaBoost算法的仓库智能分拣系统设计[D].西安科技大学,控制理论与控制工程,2013,硕士.
[25]冯晓霞.精氨酸/碳酸钾复合溶液吸收二氧化碳的过程研究[D].河北科技大学,化学工程,2013,硕士.
[26]谭锦.中国柑橘黄龙病病原菌原噬菌体遗传多样性研究[D].西南大学,植物病理学,2013,硕士.
[27]张彦菁.论我国环境行政公益诉讼制度的构建[D].安徽大学,法律,2013,硕士.
[28]巩赫.导流筒反应器流场的PIV实验研究[D].北京化工大学,化学工程与技术,2013,硕士.
[29]夏小波.卡莱斯·鲍什的政治转型理论研究[D].辽宁大学,政治学理论,2012,硕士.
[30]徐海铭.突发事件下生命线系统设计与应急响应策略研究[D].上海交通大学,管理科学与工程,2014,硕士.
[31]李文昭.空气离子测量系统的研究与设计[D].河北大学,环境工程,2014,硕士.
[32]牟益东.金牛区现代商贸物流业发展对策研究[D].西南交通大学,物流工程,2013,硕士.
[33]王志刚.低强度微波辐射对兔髂外动脉损伤后再狭窄的影响[D].重庆医科大学,外科学,2004,硕士.
[34]程筠婷.民事诉讼证人制度研究[D].甘肃政法学院,诉讼法学,2012,硕士.
[35]章斯睿.近代上海乳业市场管理研究[D].复旦大学,中国近现代史,2013,博士.
[36]傅元略.基于价值流的财务系统[A].厦门大学会计发展研究中心.转型经济下的会计与财务问题国际学术研讨会论文集(下册)[C].厦门大学会计发展研究中心:,2003:10.
[37]李绍鹏.非小细胞肺癌组织成纤维细胞P-gp表达水平对患者术后早期复发的影响[D].遵义医学院,外科学(专业学位),2012,硕士.
[38]王佳星.同伴反馈在非英语专业大学生英语写作教学中的应用研究[D].沈阳师范大学,课程与教学论,2013,硕士.
[39]王劲龙.论我国税务行政强制[D].湘潭大学,法律,2011,硕士.
[40]黄卓.新型含二甲基硅单元的噁二唑类电子传输材料的合成及性质研究[D].长春工业大学,应用化学,2013,硕士.
[41]韩阳.辽西北地区农村音乐教育现状分析与研究[D].沈阳师范大学,音乐学,2013,硕士.
[42]李兴伟.基于不同状态饱和函数的连续线性系统的稳定性分析[D].哈尔滨理工大学,应用数学,2012,硕士.
[43]李立国.现代企业员工绩效考评体系研究[D].武汉理工大学,思想政治教育,2004,硕士.
[44]戴凌燕.女企业家绩效的影响因素研究[D].浙江大学,管理科学与工程,2003,硕士.
[45]梁金喜.加强理论和业务学习全面提高干部素质[J].合肥工业大学学报(社会科学版).1998(01)
[46]曲云云.语言与国家安全:20世纪50年代后美国外语政策研究及启示[D].宁夏大学,英语语言文学,2014,硕士.
[47]乔小帅.双塔斜拉桥抗震概念设计研究[D].北京交通大学,2013.
[48]韩海花.IEEE 802.11无线网络MAC层协议性能分析[D].山东大学,通信与信息系统,2013,硕士.
[49]马娟.宁夏沿黄城市带城际轨道交通线网规划研究[D].北京交通大学,2014.
[50]赵佳美.新型吸收制冷工质对CO2-[emim][Tf2N]热力学性质理论研究[D].内蒙古科技大学,供热、供燃气、通风及空调工程,2014,硕士.
- 下一篇: 多糖巨球的制备及其在污水处理中的应用研究
- 上一篇: 药食两用中药抑制α-葡萄糖苷酶活性及作用机制研究
相关推荐
- 节能环保产业融资租赁模式研究
- 04月15日
- 大学生的老人刻板印象和反刻板印象干预的研究
- 07月23日
- 我国无辜被告人无罪判决难的成因分析和改革对策
- 07月03日
- 夫妻间冲突性话语回应模式及语用功能分析
- 12月05日