基于2D分子指纹和非平衡数据集的药物与受体交互作用预测研究
【摘要】在开发新药的过程中,传统方法具有周期长、开销大、盲目性强以及药物作用机理不明等显著缺点。随着人类基因组计划的完成以及生物信息学技术快速发展,推动了计算机辅助药物设计的进步。药物与受体蛋白之间交互作用的鉴定是计算机辅助药物设计在药物开发进程中至关重要的环节。生物实验的方法费时费力,而目前研究此类问题的计算方式大都是基于蛋白质三维结构信息的,而对于数量众多的结构未知的蛋白质,必须通过结构已知的同源蛋白来匹配和构造此蛋白质的结构,但许多蛋白并不能找到其结构已知的同源蛋白,因此基于氨基酸序列导出的特征进行药物与蛋白交互作用研究是有益的。本文基于氨基酸序列导出的特征和药物化合物分子指纹描述符特征,结合机器学习方法和模式识别计算理论,开发了一种新的预测药物与受体蛋白交互作用的预测器。在新药研发的过程中,几类蛋白诸如具有酶活性的受体、含离子通道的受体、G蛋白偶联受体(GPCRs)和核受体代表了当前药物受体的绝大多数,是人类体中应用最成功最广泛的受体蛋白。因此,本文对这四类受体蛋白在与药物交互作用方面以计算方式进行了深入的分析和比较,为生物制药提供高效可靠的辅助性研究。本文的主要工作和可能的创新点概括如下:(1)基于蛋白质理论及相关知识,针对氨基酸序列的数字序列模型构建问题,在数据层融合了各种氨基酸序列信息如伪氨基酸成分、PSSM矩阵、物理化学属性、二联体、灰色动态因子等信息。此模型不仅简单,而且包含丰富的物理化学和遗传进化信息。(2)针对基于分子指纹的药物分子结构数值序列描述方法的研究,将药物结构用离散的数字序列表示,此方法不仅能有效的描述分子的结构信息,还具有计算便捷的优点,效果显示非常理想。(3)设计了针对四类受体蛋白的分类预测器,所设计的四类预测器准确率比现有分类方法都有较大的提高,对未考虑数据非平衡性和考虑数据非平衡性问题出现的分类结果进行了较为深入的分析。(4)构建了界面友好的在线预测器网站,说明详细,使用简单,极大方便了生物学家及时在线使用。
【作者】闵建亮;
【导师】肖绚;
【作者基本信息】景德镇陶瓷学院,控制理论与控制工程,2014,硕士
【关键词】生物信息学;计算机辅助药物设计;分子指纹;非平衡数据集;特征提取;伪氨基酸成分;
【参考文献】
[1]陈晓伟.基于模块化的国家电网公司企业文化落地研究及应用[D].重庆大学,工业工程,2014,硕士.
[2]常丽,杜宪峰.柴油机机体结构振动信号特征参数计算分析[J].内燃机工程.
[3]刘艾.论哈菲兹抒情诗思想题材的特色[D].西南大学,比较文学与世界文学,2013,硕士.
[4]邓萍.PCOS不孕患者72例治疗的临床分析[D].吉林大学,临床医学,2013,硕士.
[5]高世宏.西部欠发达地区区域协调发展问题研究[D].内蒙古大学,马克思主义哲学,2014,硕士.
[6]张波.纳微炭基粉体和半导体复合材料的电化学性能研究[D].合肥工业大学,应用化学,2013,硕士.
[7]张鸣鸣.大商集团发展战略研究[D].大连理工大学,工商管理(专业学位),2013,硕士.
[8]朱博.吡唑啉酮类化合物的不对称烷基化反应研究[D].大连理工大学,药物工程,2013,硕士.
[9]高亚雄.新疆民族问题现状与发展探究[D].中央民族大学,马克思主义民族理论与民族政策,2004,硕士.
[10]蒋娟.库滨带典型植物土壤有机碳氮矿化潜势[D].华中农业大学,水土保持与荒漠化防治,2014,硕士.
[11]卢津,赵洪全,许广东.铁路客车舒适度的检测与评价[J].中国铁路.2004(06)
[12]王海骁.《汉书·地理志》中所见风俗研究[D].东北师范大学,中国古典文献学,2012,硕士.
[13]张焱.150天人胎脑海马基因表达信息的处理与分析[D].中国协和医科大学,2002.
[14]王伟.作为媒体的视觉表达形态研究[D].南京艺术学院,2004,硕士.
[15]刘韬,王耀才,王致杰.一种基于人工免疫系统的聚类算法[J].计算机工程与设计,2004,11:2051-2053.
[16]雷克辉,朱广生,毛宁波,段建康.在小波时频域中研究沉积旋回[J].石油地球物理勘探,1998,S1:72-78+177.
[17]金远程,张国兵,饶跃峰,肖遥,马葵芬,李盈,张幸国,虞和永.医院自主开发的医嘱审核系统对静脉药物配置中心不合理医嘱的分析和干预[J].中国医院药学杂志,2014,17:1508-1512.
[18]王法骥.激光扫描织物图案处理系统及其应用[J].自动化学报,1984,01:54-57.
[19]钟禄平.萃取精馏分离甲醇和丙酮共沸物的研究[D].天津大学,化学工艺,2004,硕士.
[20]朱敬芳,邢白灵,居为民,朱高龙,柳艺博.内蒙古草原植被覆盖度遥感估算[J].植物生态学报,2011,06:615-622.
[21]胡文娥.小肽制品对生长肥育猪生产性能和猪肉品质的影响[D].湖南农业大学,养殖,2003,硕士.
[22]邢程.发展型社会政策视角下我国城市住房保障问题研究[D].吉林大学,社会保障,2013,硕士.
[23]蔡鹏.磷酸盐和富里酸、腐殖酸在针铁矿/水界面的竞争吸附研究[D].中国地质大学(北京),应用化学,2013,硕士.
[24]关旭.长双高速怀德服务区综合楼质量管理研究[D].吉林大学,项目管理,2014,硕士.
[25]张文祥,韩江.锥形螺旋叶片参数化建模与五轴刀路生成[J].组合机床与自动化加工技术,2014,11:23-25.
[26]修春,周天宠.三状态串-并联系统的优化分配方法[J].应用泛函分析学报,2014,02:117-120.
[27]楚楚,徐绍静,吴琼琼,胡济宏,李行诺,颜继忠.HPLC同时测定生脉饮(党参方)中多组分的含量[J].中药材,2013,05:820-823.
[28]刘涛,余伟,李彦彬,殷实,何春雨.中厚板超快速冷却多目标控制研究及应用[J].冶金自动化,2015,03:39-43.
[29]周伟,方进,吴维越,逯康康,郑晓东,刘斌,宋文娟.ITER用校正线圈管内电缆导体稳定性分析[J].低温与超导,2014,05:4-7.
[30]周军军.南车电机公司风电产业发展战略研究[D].西南交通大学,工商管理(专业学位),2012,硕士.
[31]张雅静.面向光伏逆变系统的氮化镓功率器件应用研究[D].北京交通大学,2015.
[32]张华强,王新生,魏鹏飞,徐殿国.基于空间矢量调制的直接转矩控制算法研究[J].电机与控制学报,2012,06:13-18.
[33]朱桂杰.坤泰胶囊对小鼠种植窗期子宫内膜LIF、整合素β3和HOXA10表达的影响[D].郑州大学,妇产科学,2013,硕士.
[34]吕成国,王承发,李俊庆,韩纪庆,徐近霈.RASTA-PLP技术与谱减相结合的去噪方法[J].自动化学报,2000,05:717-720.
[35]王实山,吴命利,薛蛟.SS_(4B)型与HX_D2型电力机车电气负荷性能对比分析[J].机车电传动,2014,03:57-61.
[36]谢莎.论网络环境下我国个人信息的立法保护[D].华中科技大学,法律,2013,硕士.
[37]郭贺彬.Web挖掘数据预处理的研究[J].甘肃科技纵横,2005,06:27.
[38]王玉玺.论套曲《冬之旅》的声乐教学设计及其意义[D].武汉音乐学院,音乐与舞蹈学,2013,硕士.
[39]龙思思.石煤中钒硅资源综合利用的理论与新技术研究[D].中南大学,矿业工程,2013,博士.
[40]王笑雪.《东京梦华录(外四种)》演艺史料研究[D].山西师范大学,戏剧戏曲学,2013,硕士.
[41]周爱民.信息检索系统与智能重组[J].情报杂志,2004,11:47-49.
[42]康文杰.基于传感器网络的精细农作物监测系统开发及路由算法研究[D].东北大学,计算机软件与理论,2010,硕士.
[43]张家凤.开都河—孔雀河流域水资源优化配置研究[D].新疆农业大学,生态学,2012,硕士.
[44]李培培.基于系统动力学的中国通货膨胀形成机制研究[D].山东财经大学,金融学,2012,硕士.
[45]李明新,卫汗青,李希凡,蔡义江,杜春耕,张宝章,沈望舒,段启明,张书才,金元浦,严宽,黄亦工,彭哲愚.“将曹雪芹纪念馆列入人文奥运项目”研讨会[J].红楼梦学刊.2006(03)
[46]梁庆标.乔伊斯的犹太意识与世界视野[D].苏州大学,比较文学与世界文学,2003,硕士.
[47]杨佳.几类带积分边界条件的三阶边值问题[D].兰州理工大学,应用数学,2013,硕士.
[48]李航.基于MPI的并行DNA序列比对系统的设计与实现[D].哈尔滨工业大学,计算机技术,2014,硕士.
[49]袁超凤.模型中交互效应检验的方法及其应用[D].黑龙江大学,应用数学,2013,硕士.
[50]白永军.100MW机组低真空深度调峰试验研究[D].华北电力大学(北京),热能工程,2004,硕士.
- 下一篇: 论我国法官职业道德建设
- 上一篇: 镁质瓷的制备与研究