人类DNA序列8-mer模体进化差异及酵母核小体结合序列特征分析
【摘要】本文从8-mer模体和二阶信息冗余出发,分析人类DNA8-mer序列片段的进化分离与功能、酵母核小体中心序列与连接序列的功能差异、酵母核小体中心序列的局域特征和核小体序列与组蛋白的相互作用。整个研究分为4部分,具体内容如下。1.以人类1号染色体DNA序列为样本,将其分成CDS、5’UTR、3’UTR、内含子和基因间5类序列,分别计算它们的8-mer相对模体频数随频数的分布。发现CDS呈现单峰分布,5’UTR和3’UTR近似呈现单峰分布,内含子和基因间序列呈现明显的3峰分布。将全部8-mer按含有2个或2个以上、1个和0个CG二核苷分为CG2、CG1和CGo三个模体子集,重绘8-mer分布。发现三个模体子集可以形成独立的分布,并且3个子集的分布中心与总体八模体3峰分布的分布中心相同。按其它15个二核苷分类出的三个模体子集则不能形成独立分布。在CG模体中计算二核苷与三核苷的相对频数,发现5类序列的二核苷与三核苷相对频数分布,在CG2模体中基本相同,在CG1模体中相近,在CGo模体中差别最大。分析结果表明,CG2和CGl模体在进化上具有保守性,在不同序列中的使用具有趋同性,CGo模体在进化上具有多样性,在不同序列中的使用具有趋异性。2.以酵母全基因组为样本,基于Brogaard等人2012年在Nature上发布的酵母全基因组单碱基精度的核小体定位图谱,从中提取核小体中心序列和连接序列。计算k-mer在两类序列中的相对频数。发现模体越长使用偏置越强,并且极少数强偏置模体表现出使用差异。计算k-mer频数对数比,并按其增序随模体个数进行排列。发现只有8-mer呈现对称分布,且中心序列中一部分8-mer使用远大于连接序列,一部分8-mer使用远小于连接序列。计算8-mer频数对数比随按增序排列的中心相对频数的分布。发现8-mer使用差异主要发生在中心相对频数很小的区域。将k-mer频数对数比按中心相对频数的增序随模体个数进行排列。发现在中心相对频数较小区域只有8-mer的使用差异格外显著。计算0、1万、2万、3万、4万、5万和6万附近局域8-mer的G+C含量和二核苷含量,同时在每组局域8-mer中选取等数量最大和最小的8-mer重复上述计算。发现模体的G+C含量随着相对频率的增大而逐步减小。中心序列更加偏好GG和CC二核苷,而连接序列更加偏好GC二核苷。连接序列中CG二核苷的使用总是高于中心序列。分析结果表明发挥功能的核小体结合模体至少8bp长,并且含CG二核苷的模体的序列特征应该与核小体中心序列密切相关。3.以酵母2号染色体为样本,根据Brogaard等人获得的酵母全基因组单碱基精度的核小体定位图谱,在酵母2号染色体上所有转录起始位点(TSS)和转录终止位点附近(TTS)提取全部的+1与-1、+2与-2核小体序列,并在2号染色体、2号染色体的CDS和基因间区域上提取全部的核小体序列。将组蛋白八聚体在核小体中心序列上进行展开。发现组蛋白排列在核小体中心位点两侧具有不对称性。根据组蛋白的位置排列及Brogaard等得到的/AA/TA/AT/TT二核苷的频率分布,将每类核小体序列分为五组,并按行计算它们的二阶信息冗余(D:)。因为不同的序列长度和C+G含量会影响D2取值,所以对于每类核小体的五组序列,每组序列分别随机生成100个随机序列,且随机序列与原序列等长且A+T总量相同。按行计算五组随机序列的二阶信息冗余(是100个随机序列的二阶信息冗余的平均值)。将原序列与随机序列的二阶信息冗余作对数处理(以2为底),发现在动态平衡下-1和-2核小体(TSS和TTS)具有向3’端移动的趋势;+1和+2(TSS和TTS)核小体具有向5’端移动的趋势。4.以酵母全基因组16条染色体为样本,根据Brogaard等人获得的核小体定位图谱,按上述方法在酵母全基因组上提取同样的10类核小体序列。为了保证10类样本序列的随机涨落是相同的,每类核小体都取6363条。将核小体单个对齐排列,按列计算每类核小体序列的二阶信息冗余。发现二阶信息冗余分布虽然比较凌乱,但在核小体中心两侧存在不对称性分布。因为二阶信息冗余反映了核小体序列与组蛋白相互作用的强弱,所以它的不对称性可能揭示了核小体移动的本质原因。对10类核小体的二阶信息冗余分布采取平滑处理。平滑后二阶信息冗余分布具有显著的不对称性。研究结果表明+1和+2核小体(TSS和TTS)具有向5’端移动的趋势,-1(TSS和TTS)和-2(TTS)具有向3’端移动的趋势,-2(TSS)具有向5’端移动的趋势。
【作者】周德良;
【导师】李宏;
【作者基本信息】内蒙古大学,物理学,2014,硕士
【关键词】DNA序列;8-mer频数;三峰分布;核小体移动;核小体中心序列与连接序列;二阶信息冗余;
【参考文献】
[1]王立超.STAT3与SURVIVIN在胃癌中的表达及临床意义[D].河北医科大学,外科学,2013,硕士.
[2]胡传映.对我国物资流通社会化现代化的认识和意见[J].中国物资经济.1990(08)
[3]任燚,陈宗海.基于强化学习算法的多机器人系统的冲突消解策略[J].控制与决策,2006,04:430-434+439.
[4]李慧玲,余贻鑫,韩琪,宿吉锋,赵金利,StephenTLEE,PeiZHANG.割集功率空间上静态电压稳定域的实用边界[J].电力系统自动化,2005,04:18-23.
[5]王娜.费菜多糖的提取及分离纯化研究[D].华侨大学,生物学,2013,硕士.
[6]王提学.单开门颈椎管扩大成形Neulen钛板内固定术后轴侧骨愈合临床研究[D].山东大学,骨外科,2013,硕士.
[7]段秀明,杨清娟.轧机用四列圆柱滚子轴承的选用要点[J].一重技术.2007(01)
[8]薛英林,徐政,唐庚,郑翔,刘正富.新型混合级联多电平换流器调制策略[J].电力系统自动化,2012,22:108-114.
[9]王灿.区域高新技术产业创新绩效评价研究[D].合肥工业大学,企业管理,2013,硕士.
[10]张裕翔.超多类分类器的设计与实现[D].吉林大学,计算机软件与理论,2013,硕士.
[11]王浩.GPS信号可用性评价及定位精度改善方法研究[D].沈阳航空航天大学,信号与信息处理,2013,硕士.
[12]龚利华.黑色金属矿山清洁生产评价指标体系的建立[J].金属矿山.2003(07)
[13]段艳妮.基于PIC的小型纯电动教练车电机控制器研究[D].长安大学,车辆工程,2013,硕士.
[14]温琦,王志,武崇道.并联混合动力飞机牵引车控制系统设计与试验[J].农业机械学报.2007(08)
[15]王鸿文.中小企业生产包装纸板降低成本之路[J].造纸信息.2002(05)
[16]黄大春.锡林郭勒草原潜在生产力研究[D].内蒙古农业大学,2005.
[17]巴卓.论我国资格刑类型的改良[D].吉林大学,刑法学,2013,硕士.
[18]黄夏.论我国反垄断损害赔偿制度的构建[D].山东大学,经济法学,2013,硕士.
[19]高治国.置换通风条件下地板辐射供冷的热环境数值模拟[D].山东建筑大学,供热、供燃气、通风及空调工程,2013,硕士.
[20]范学敏.基于ZigBee的无线传感器网络定位研究[D].燕山大学,精密仪器及机械,2014,硕士.
[21]周华林.镜众传播范式下的高校图书馆信息服务模式研究[D].吉林大学,图书馆学,2013,硕士.
[22]王宁,孟宪尧.输入采用广义梯形隶属函数的两维最简模糊控制器结构分析[J].自动化学报,2008,04:466-471.
[23]陈思华.二硼化镁超导线材稳定性研究[D].东北大学,凝聚态物理,2010,硕士.
[24]梁志元.小微企业融资难问题分析[D].吉林大学,金融学,2013,硕士.
[25]宋桂敏.奶牛养殖小区经营模式与饲养管理技术研究[D].中国农业大学,养殖业,2004,硕士.
[26]唐存雨.基于仪表盘的铝电解生产数据智能分析系统的研究与开发[D].北方工业大学,计算机软件与理论,2013,硕士.
[27]陈振宇.我国钢铁工业CIMS的发展与展望[J].冶金自动化,1994,06:3-6+25.
[28]曾贺川.人体重量一维分布识别系统研究[D].重庆大学,力学,2014,硕士.
[29]温静.后殖民语境下的文学翻译[D].湖南师范大学,英语语言文学,2004,硕士.
[30]张文俊.化学吸收法处理烟库磷化氢废气的研究与工程应用[D].合肥工业大学,化学工程,2013,硕士.
[31]薛帅.标准CPCI板卡的多操作系统驱动程序开发[D].西安电子科技大学,信号与信息处理,2013,硕士.
[32]王海.BY公司PC工厂停车安全检修项目管理研究[D].东华大学,项目管理(专业学位),2014,硕士.
[33]王翠翠.三氧化二砷联合维生素C抑制肺腺癌A549细胞增殖及对PPO与VEGF表达的影响[D].延安大学,内科学,2014,硕士.
[34]证券时报记者牛溪 建业.中国宝安石墨烯已在中试三大产业稳步推进[N].证券时报,2011-03-23B01.
[35]高扬.团体出境游客的满意和不满意:建构及测量[D].湖南师范大学,旅游管理,2013,硕士.
[36]刘小伟.诉讼诈骗的刑法规制[D].南昌大学,法律(专业学位),2014,硕士.
[37]林青.天癸散敷脐干预围绝经期妇女骨量减少的临床研究[D].广州中医药大学,中医骨伤科学(专业学位),2013,硕士.
[38]聂仁峰,石娟娟,杜玮辰,侯昭胤.石墨烯上氧化镍隔离的高分散钯催化剂的制备及其在suzuki偶联反应中的应用[A].中国化学会催化委员会.第十四届全国青年催化学术会议会议论文集[C].中国化学会催化委员会:,2013:2.
[39]张炳男.人口结构变化与经常项目调整[D].南京大学,国际贸易学,2013,硕士.
[40]张沂洁.早产儿输血相关性移植物抗宿主相关DNA微卫星位点多态性分析[D].青岛大学,儿科学,2013,硕士.
[41]焦文静.海水养殖池内的传热传质机理研究[D].天津大学,工程热物理,2013,硕士.
[42]郭远静.论孝的美学意蕴[D].武汉纺织大学,美学,2013,硕士.
[43]盛永进.盲校个别化教学管理问题与策略探究[D].南京师范大学,2004.
[44]杨恒.原文修辞的翻译—《信息节食》翻译报告[D].广东外语外贸大学,翻译(专业学位),2013,硕士.
[45]王尚.微网中光伏逆变器并联技术研究[D].哈尔滨工业大学,电气工程,2013,硕士.
[46]郎世俊.中国自动化学会1965年学术年会及第二届代表大会[J].自动化学报,1965,04:251.
[47]苏瑞.“五保”供养制度调查研究[D].沈阳师范大学,社会保障,2014,硕士.
[48]蔡力.江苏盐城水污染案件的定性分析及法律完善[D].西南政法大学,刑法学(专业学位),2012,硕士.
[49]姜顺然.基于韩国经验分析银行业竞争度、贷款成本与企业绩效[D].吉林大学,世界经济,2014,硕士.
[50]李阳勇.新型壳聚糖伤口敷料治疗下肢慢性血管性溃疡的临床研究[D].广州医科大学,外科学(专业学位),2014,硕士.
- 下一篇: 高频脉冲电镀电源的研究与设计
- 上一篇: 电力数据综合分析展示平台的设计与实现
相关推荐
- 基于Flex平台的企业能效管理系统的设计与实现
- 08月03日
- 物资管理系统的设计与实现
- 12月27日
- 以航天哲学思维提升企业战略管理能力的探索与实践
- 06月16日
- 法社会学视野下的农村人民调解
- 11月24日