Meta分析中发表偏倚的校正方法研究

Meta分析中发表偏倚的校正方法研究

作者:师大云端图书馆 时间:2015-11-26 分类:参考文献 喜欢:2287
师大云端图书馆

【摘要】研究背景与目的:Meta分析是一种将多个同类研究效应进行定量综合研究的统计方法。由于该方法在集合证据上的优势给临床和医学研究的决策提供了有效信息,因而在循证医学领域得到广泛应用,并随着循证医学的迅猛发展,成为方法学领域研究的热点。然而,meta分析所纳入的文献大部分都只能局限在正式发表的研究中,甚至可能会有许多有意义的研究因未发表而被忽视,这样的综合效应将存在结论偏倚的风险,甚至可能会改变整体的结论。导致这种现象的原因称为发表偏倚。发表偏倚的存在严重的威胁系统评价的有效性。发表偏倚被定义为“部分研究人员、审稿人和编辑提交或接受基于研究的某个方向的结果”。造成这一现象的主要原因是具统计学意义的研究结果比不具统计学意义的结果更可能被普遍接受和发表。发表偏倚所带来的直接后果是对现有的研究进行过度评价,甚至得到相反的结论,这给研究者们造成科学上的误导。因而涌现出一些探测与校正发表偏倚的方法。研究者们真正开始认识发表偏倚最早始于1959年,Sterling和Smart的研究显示在心理学和教育学领域期刊上绝大多数的文章都具有统计学意义。这一现象现也出现在医学期刊,继而在医学领域受到研究者们的重视。Light和Pillemer于1984年提出的漏斗图方法是最早关于探测发表偏倚的方法,也成为目前为止应用最为广泛的探测发表偏倚的理论基础。该方法实质上是一种图示法,统计学上大样本的对称性规律是其核心思想,虽具有直观性,但无法量化评价.Egger将漏斗图用回归的方法表示出来,实现了量化评价,但受纳入研究数的限制而使得该方法的应用和推广有局限性。其它类似的回归方法也同样存在同样的问题。Begg首次提出了非参数的秩相关法来对发表偏倚进行探测,接着出现Schwarzer检验以及Rucher反正弦变换后的秩相关检验,但仍然克服不了研究数过少的问题。对于发表偏倚的校正,剪补法是基于漏斗图的思想发展而来,通过对称性对图像的剪补迭代达到对称平衡以实现校正偏倚的目的。但该方法更多时候会受极值的影响而使得纠正偏倚的效果并不理想。失安全系数法通过假定的极端情形估算出未发表的研究数,该方法可以做为确定是否存在发表偏倚的方法,但却对于无统计学意义的效应量的合并值不适用。近年来的贝叶斯数据扩增方法因为太过复杂可操作性不强。Sterne等提出较小的的样本研究只有获得较大的效应量才可能得到统计显著的阳性结果。继而有各种选择模型被提出,但均限于在模拟选择性发表的过程,确切地说是做了关于发表偏倚的敏感性分析,而没有进一步的研究结果。因此,如何准确探测meta分析中的发表偏倚并使其得以校正,是循证医学研究领域迄今为止尚未解决的难题。这一问题的解决无疑对于提高证据的可信度和准确度具有极为重要的科学价值和现实意义。本研究针对在发表偏倚中由选择性发表产生的偏倚,探讨该偏倚的产生机制,通过对随机变量的选择,将选择性偏倚转化成加权分布的随机抽样,进而实现对偏倚的定量评价,最终达到校正效应量的目的。研究方法:在已有选择模型的基础上将效应量模型与选择模型合并,给出更具一般性的选择模型,称之为广义选择模型。广义选择模型的基本思想是将“选择”因素看作一个随机变量,将其与效应量模型结合,得到存在选择偏倚的研究样本的密度函数,即加权概率密度:f(xi|μ,τ2,σi2,w)=w(xi,σi)f(xi|μ,τ2,σi2)/∫w(xi,σi)f(xi|μ,τ2,σi2)dxi在选择性偏倚发生前,观测样本视为来自真实总体的随机抽样。而在选择性偏倚发生后,可以看作是从上式所列的加权分布中进行随机抽样得到的样本。因此,可以说加权分布的建立消除了非随机抽样的影响,便于为后面的统计推断做准备。本研究在给出加权密度的基础上推导出其相应的期望、二阶矩、协方差等数字特征,从而明确“选择”变量对偏倚的影响,并给出观测样本的加权似然函数的一般形式。通过解析式精确表达了选择变量和偏倚之间的关系,即E[w(xi,σt)]=∫w(xi,σi)f(xi|μ,τ2,σi2)dxiE(Ti)=∫xig(xi|μ,τ2,σi2)dxi=E[w(xi,σi)Xi]/E(w(Xi,σi)]E(Ti2)=∫xi2g(xi|μ,τ2,σi2)dxi=E[w(xi,σi)Xi2]/E(w(Xi,σi)]E(T)-E(X)=cov(X,Y)/E[w(X,σ)]作为推广,文章进一步在Hedges以及Copas研究的基础上,给出单边检验时分段选择函数、左删失选择、相关系数选择的数字特征与加权样本似然函数,以及必要的参数估计。在所建立的选择模型基础上,根据贝叶斯思想赋予未知参数不确定性,将其定义为一个拥有特定先验分布的随机变量。结合选择偏倚发生后研究样本的似然函数,推导出未知参数在样本条件下的后验概率密度。同时为解决参数的后验估计中的高维积分计算问题,运用MCMC算法进行Gibbs抽样。利用加权样本似然函数给出一般的贝叶斯后验分布和Gibbs抽样步骤。通过计算实现对未知参数的贝叶斯估计。作为实际应用,特别对单边检验的分段选择函数的加权密度函数形式,推出其满条件分布。对给定的真实效应量,分别设定参数:异质性τ2=0.1,0.35,0.7,1;研究数N=15,30,50;进行完全数据集的模拟。对模拟的完全数据集利用分段选择函数进行选择,再应用本研究所建立的广义贝叶斯选择模型,通过MCMC算法的Gibbs抽样对meta分析所发生的选择性偏倚的合并效应量进行校正。同时,给出校正效应量的平均偏倚和均方误差用以评价所提出方法的有效性和可行性。由于诊断试验meta分析的特殊性,本研究专门对诊断试验最佳诊断界点的选择进行了深入探讨。对于双正态连续型变量的诊断试验,综合评价指标可表达为关于灵敏度和特异度的一次多项式函数,更详细地可以表示为诊断界点的函数,其中每个指标都是该一次多项式函数的一个特例,即(?)于是最佳诊断界点的确定问题转化为求一次多项式函数的极值点问题。利用连续函数的极值点求得最佳诊断界点。这一问题的解决为消除不同诊断界点确定方法所导致的合并效应量的偏倚奠定了基础。结果:设定不同的异质性及研究数,以模拟不同的数据背景。通过设定选择概率为w1=1,w2=0.3,选择造成了从0.1141到0.5171不等的偏倚,通过剪补法进行校正后,尽管有缩减,但偏倚范围仍然在0.1058到0.4349;再经过贝叶斯选择模型进行校正后,偏倚范围缩至0.0001至0.0588。相比剪补法的均方误差从0.0217至0.3006,贝叶斯的均方误差为0.0023至0.1280。数据模拟显示贝叶斯选择模型可以实现对效应量的校正,并有较高的准确性和较小的均方误差。同时,可以看到贝叶斯选择模型校正效应量的偏倚和均方误差在异质性τ2≤1时,并未显示出随异质性的变化而显著变化。而在异质性固定时,该模型对效应量的校正会随着研究数的变化而波动。进一步与校正前的合并效应量及剪补法比较。经过贝叶斯选择模型校正的合并效应量不论与校正前的合并效应量及剪补法校正后的的结果相比,都具有较小的平均偏倚和均方误差。而在诊断试验的最佳诊断界点合并中,给出统一的确定最佳诊断界点c的方法分为两种情况:当σX2=σY2时,当σX2≠σY2且△≥0时(△=(μX-μY)2+(σX2-σY2)ln(λYσX/λXσY)2),解得结论:本研究提出将选择因素视为一个随机变量加入选择模型,通过加权分布定义广义选择模型。由于加权分布的引入,使得存在选择性偏倚的观测样本由非随机抽样转变为随机抽样,并对其数字特征给出了相应统计推断,便于定量化评价选择性发表偏倚的程度。对广义选择模型中未知参数可以进行贝叶斯估计,利用满条件分布进行Gibbs抽样实现研究效应量的校正。本研究给出了统一的确定最佳诊断界点的方法,以消除因方法不同而造成的偏倚,为诊断试验中基于最佳诊断界点的meta分析做了必要准备。
【作者】朱玲湘;
【导师】陈平雁;
【作者基本信息】南方医科大学,流行病与卫生统计学,2014,博士
【关键词】Meta分析;发表偏倚;加权分布;广义选择模型;贝叶斯估计;最佳诊断界点;

【参考文献】
[1]龚虹.不同穴位刺激方式对乳腺手术患者术后恶心呕吐的防范作用[D].广州中医药大学,麻醉学,2013,硕士.
[2]骆向兵.我国医疗卫生行业政府投入管理制度研究[D].财政部财政科学研究所,财政学,2014,博士.
[3]袁宇波,卜强生,高磊,张道农,陈久林,宋亮亮.智能变电站数字采样延时特性分析与试验[J].电力系统自动化,2013,24:76-80+88.
[4]俞露.面向智慧城市建设的信息内容产业发展政策研究[D].苏州大学,情报学,2014,硕士.
[5]张真真.产品平台知识共享和团队连续性对平台绩效的影响研究[D].哈尔滨工业大学,企业管理,2014,硕士.
[6]谭志中.加强型多边形电阻或电容网络的等效值研究[J].大学物理,2011,12:29-32+37.
[7]孟学雷,贾利民.一类新的粒子群算法[J].控制与决策,2009,06:941-944+948.
[8]冯晓欣.基于数值模拟的高强度钢22MnB5热冲压工艺研究[D].中南林业科技大学,2014.
[9]夏勇亮.轻烧白云石粉料制备氧化镁研究[D].北京化工大学,材料科学与工程,2013,硕士.
[10]石昊.补肾活血法治疗绝经后骨质疏松症的临床研究[D].湖北民族学院,中医基础理论,2014,硕士.
[11]卢静涵.金属多孔材料动态特性的实验研究[D].太原理工大学,固体力学,2004,硕士.
[12]李鹏飞.喻家湖底泥氮磷形态及释放规律研究[D].华中科技大学,环境工程,2013,硕士.
[13]刘敏.武汉城市圈区域经济差异研究[D].华中师范大学,区域经济学,2012,硕士.
[14]李波.快递企业服务网络布局优化研究[D].北京交通大学,2010.
[15]张惠.饲养方式对雪山草鸡肉品质的影响[D].南京农业大学,动物营养与饲料科学,2012,硕士.
[16]张珂.拆船港池通航安全研究及其应用[D].大连海事大学,交通运输工程,2014,硕士.
[17]王艳芳.永磁同步发电机的设计与制造[D].西南交通大学,电气工程,2012,硕士.
[18]刘文斌.高速公路单坡面中央分隔带混凝土护栏开发应用研究[D].北京工业大学,交通运输规划与管理,2004,硕士.
[19]程爱丽.生态翻译学视域下的武汉东湖磨山景区公示语的英译研究[D].华中师范大学,英语语言文学,2014,硕士.
[20]方子风.关于水压试验问题的分析与比较[J].石油化工设备.1992(04)
[21]廖建钢.中职学校项目教学评价体系的研究与实践[D].广东技术师范学院,职业技术教育学,2014,硕士.
[22]徐俊丹.会计信息化对企业内部控制的影响[J].电子制作.
[23]霍建维.突发事件下的列车运行调整模型与算法[D].北京交通大学,2014.
[24]刘良安.知识城市构建过程中创新元素研究[D].西南大学,社会学,2013,硕士.
[25]万佳.基于多种群并行粒子群优化算法研究[D].南昌大学,软件工程(专业学位),2012,硕士.
[26]孟丽华.环境友好型土地利用模式实施效果研究[D].东北师范大学,土地资源管理,2012,硕士.
[27]楼立明.城市地价信息的空间分析及其应用研究[D].浙江大学,2004.
[28]张旭芳.高校教师知识管理系统的研究与设计[D].北京交通大学,2009.
[29]王文钊.室内采暖分布式计量与网络传输的研究[D].沈阳理工大学,信号与信息处理,2013,硕士.
[30]赵丽君,殷群.企业资源配置的新视角[J].技术经济,2005,07:73-76.
[31]吴国英.长白山3种橐吾属植物生物活性成分研究[D].吉林农业大学,作物资源学,2012,硕士.
[32]张蓉蓉.H公司人力资源管理外包的可行性及决策研究[D].苏州大学,工商管理(专业学位),2013,硕士.
[33]臧婷.朱践耳钢琴组曲《南国印象》教学及演秦分析[D].东北师范大学,音乐学,2012,硕士.
[34]李明富.新平台新应用——新型电子银行平台助力农行全面信息化[J].金融电子化,2004,02:23-25.
[35]安建奇.新规则下世界男子柔道优秀运动员技战术发展特征[D].北京体育大学,体育教育训练学,2013,硕士.
[36]陈佳贵,黄群慧,钟宏武.中国地区工业化进程的综合评价和特征分析[J].经济研究,2006,06:4-15.
[37]赵东辉.我国大企业税收风险管理问题研究[D].首都经济贸易大学,税务(专业学位),2014,硕士.
[38]魏海泉.杜邦分析体系在房地产企业中的应用研究[D].山东财经大学,会计(专业学位),2014,硕士.
[39]覃世利.重庆战略性新兴产业培育策略研究[D].西南大学,企业管理,2013,硕士.
[40]梁瑞英.论改革和完善党的执政方式[D].福建师范大学,马克思主义理论与思想政治教育,2004,硕士.
[41]焦晓娟.油液体积弹性模量对液压机械换段过程影响的仿真与实验[D].燕山大学,车辆工程,2014,硕士.
[42]吕宏骉.融入环境因素的企业业绩评价体系研究[D].吉林财经大学,会计学,2014,硕士.
[43]彭筱丽.审美与传播视角下中国户外广告发展研究[D].山东大学,设计艺术学,2013,硕士.
[44]高建霞.Sm_2Fe_(17-x)Nb_xN_y磁粉的制备工艺及磁性能的研究[D].河北工业大学,材料学,2004,硕士.
[45]刘丹.磁场处理对纳米碳材料/聚乙烯复合材料结构及性能的影响[D].哈尔滨理工大学,2014.
[46]陈建平.当前优抚安置对象的服务管理需求研究[D].湖南师范大学,社会学,2014,硕士.
[47]段永辞.徽商题材电视剧艺术研究[D].河北大学,广播电视艺术学,2014,硕士.
[48]黄侦荣.安全生产执法监察规范化体系建设研究[D].华南理工大学,工业工程,2012,硕士.
[49]郑舟舟.论猥亵犯罪的立法完善[D].吉林大学,法律,2014,硕士.
[50]薄颖.全程物流服务下的铁路货运业务流程设计研究[D].北京交通大学,2014.

相关推荐
更多