1、临床科研中常见偏倚及其预防,陈世耀 复旦大学临床流行病学中心,?高血压与急性心梗预后研究,设计:队列研究; 病例:19851998年急性心梗住院病人543例; 分组:按有无高血压分两组; 结果测量:两组病人住院病死率; 结果:高血压组病死率高于无高血压组; 结论:高血压是影响急性心梗预后的重要因素。,临床研究中的一些基本概念,总体:同质个体所构成的全体; 样本:从总体中取出的部分个体; 目的:从样本估计总体 目标人群:又称靶人群,是样本人群来源的总体,也是样本人群研究结果用以说明或推广应用的总体人群;,抽样及其抽样误差,抽样:从总体中取出部分个体(进行研究)的过程。原因: 我们不可能获得总体的
2、全部资料; 我们没有足够的人力、物力研究总体; 抽样误差:样本与总体之间由于抽样过程引起的差异,在统计学上称为抽样误差。,偏倚的定义,偏倚是从样本研究中所得结果不能如实反映目标人群真实结果的一种系统误差; 临床研究比基础研究更容易产生偏倚: 两组可比性、心里因素、中途退出研究等; 偏倚的控制: 科研的设计和实施阶段; 统计学方法纠正。,机遇与偏倚(1),机遇:是观察结果的精确性及可重复性受到影响;机遇是一种随机误差。 任何观察所固有,只能设法缩小,不能避免。 偏倚:观察结果系统地、向一个方向(或大、或小)发生偏差而不能反映真实情况。 在科研设计、实施和分析阶段避免或校正。,机遇与偏倚(2),机
3、遇与偏倚反映了一项研究或测量结果的两方面:精确性(随机误差)和真实度(系统误差),真实度高,真实度低,精确度高,精确度低,机遇对研究结果的影响,假阳性:如实际上两种方法治疗疗效相同,如少数病人的抽样研究发现甲、乙两方法疗效不同,这是由于机遇的影响而发生的假阳性错误,统计上称一类错误,用表示。 假阴性:如实际两种治疗一种比另一种好,但由于抽样研究中机遇的影响,两者疗效十分相近而作出假阴性的错误判断;统计上称二类错误,用表示。,可信区间,直接估计机遇在临床研究中的作用大小; 表明机遇所致的围绕真实值变动的范围,通常用95或99可信区间表示; 变动范围越窄,真实值越稳定。,真实性,指一项研究或观察所
4、作推论的正确及可靠程度,即结果反映观测对象的真实情况; 内部真实性:为正确反映研究人群或靶人群真实状况的研究结果的外延部分; 外部真实性:内部真实性的结果推广到靶人群以外的其他人群仍然有效。,内部真实性和外部真实性,样本,样本,偏倚 机遇 研究结论,内部真实性,外部真实性:外推到样本所属总体或其他人群,病人总体 (包括其他设施中的人群),偏倚的特性,偏倚是一种系统误差,具有一定的方向性; 偏倚的分类: 选择偏倚:发生在设计阶段; 测量偏倚:发生在观察、研究、测量等实施阶段; 混杂偏倚:又称外来因素的影响,发生在设计阶段,可通过统计方法加以纠正。,选择性偏倚,产生环节:设计阶段; 产生原因:被选
5、入对象同落选对象间在与研究有关的特征方面有系统差别,同时在比较组间除研究因素外,其他一些有关因素也分布不均,导致结果偏离真实情况。,入院率偏倚(Berkson bias),研究某危险因素是否与A病有关,A病来源于住院病人,对照为同期住院的其他病人(B病); A病与B病由于各种因素在该医院入院率不同; 危险因素具有一定独立性,与疾病无关的入院率。 A病:糖尿病;B病:肿瘤;危险因素:高血压,人群A、B两病及C因素分布,病种 有C因素 无C因素 总人数 A病 750 4250 5000 B病 750 4250 5000 OR(7504250)/(4250750)1,假设:A病入院率60,B病25,
6、危险因素C的入院率40,病种 有C因素 无C因素 总人数 A病 75060 425060 31207504040570 2550 B病 750 75025 425025 14767507540413 1063 OR(5701063)/(2550413)0.575,检出征候偏倚,口服雌激素与子宫内膜癌病例对照研究; 病例组:子宫内膜癌患者,对照:无子宫内膜癌患者; 结果:子宫内膜癌患者口腹雌激素比例高; 结论:口服雌激素是子宫内膜癌的危险因素。 偏倚:无症状早期子宫内膜癌病人服雌激素后易致出血就诊。即病例入选受暴露因子影响,具有该暴露因子的病例会早期出现临床症状,入选病例与未入选病例之间存在系统
7、差别。,奈曼偏倚(存活偏倚或患病率发病率偏倚),病例对照研究大量饮用咖啡与心梗; 病例组:医院心梗病人,对照组:医院非心梗病人; 结果:大量饮用咖啡与心梗无关; 偏倚:调查对象为存活者,只是一般饮用咖啡或减少饮用量,入院前死亡病人多是大量饮用咖啡者。,无应答偏倚,调查吸烟在男女人群中的比例; 人群调查表返回: 男性回答率90以上;女性回答率50,且多数为女性吸烟者未回答。 结果:低估女性吸烟率。,志愿者偏倚,体锻与冠心病队列研究: 研究组为志愿者,对照组为非志愿者 结论:体锻减少冠心病发生 偏倚:志愿参加研究者更关心自己的健康:注意饮食及营养,禁烟酒、坚持体锻。,失访偏倚,失访是一种无应答,只
8、是发生在队列及干预的前瞻性研究中; 包括:失访或退出; 主动失访常常与暴露因素或结果有关。 应减少到最小程度; 研究中应了解退出的原因; 处理时可做“最坏打算”校正或评价,健康工人偏倚,化学物质接触与白血病发生的队列研究; 研究组:接触苯的工人,对照组:普通工人; 结果:两组发生白血病比例相似; 结论:接触苯与白血病发生无关 偏倚:进入研究组的工人是留下来不易患白血病人群,患病工人早已转出;又归为易感性偏倚。,转组偏倚,研究运动与冠心病关系; 设计:码头工人,根据劳动强度分组,然后观察22年冠心病发生率; 结论:运动(劳动强度)与冠心病发生无关。 偏倚:劳动强度的变化。,非同期对照偏倚,研究监
9、护室建立在心梗中作用; 研究组:19992000年监护室建立后死亡率15,对照组:19971998年监护室建立前死亡率25; 结果:建立监护室减少心梗死亡率。 偏倚:没有考虑心梗诊断和治疗改进的作用,异地对照偏倚,抗凝药治疗心梗; 治疗组与对照组分别来自两家医院; 结果:抗凝药减少或不能减少死亡率。 偏倚:两家医院死亡率差别?,易感性偏倚,溃疡病病因病例对照研究: 病例组:溃疡病人,调查发现:面食多; 对照组:非溃疡病人,面食少; 结论:多面食与溃疡发生有关。 偏倚:溃疡发生在先,面食在后。,时间效应偏倚,某饮食与急性肝炎的病例对照研究。 病例组:急肝病人;对照组:同单位其他人。 结果:该饮食
10、与急性肝炎发生无关。 许多慢性病,自接触有效暴露到出现临床症状,其间经过漫长过程。在此期间,他们实际是有暴露史但未出现症状,也未能用现有手段发现异常的病人。这类病人常被归入健康对照内。在遗传病中同样(疾病发生的外显年龄)。 研究结果的过低估计。,领先时间偏倚,研究肿瘤等慢性病,自症状出现,临床处理,平均存活12月; 筛检诊断,临床处理,平均存活15月; 结论:筛检措施能延长生存时间。 偏倚:延长3月时间系提早发现及诊断时间。,测量偏倚,又称观察性偏倚、信息偏倚; 发生在研究的实施阶段; 原因:资料的观察、测量、收集方法不当,诊断试验的灵敏度、特异度以及患者提供有关信息的准确性不足,并且这种不足
11、在比较组之间存在差别。,诊断怀疑偏倚,病例对照研究:DMII病人中口服降糖药与心血管并发症死亡 口服药物组 对照组(胰岛素治疗组) 尸体解剖 不作尸体解剖 寻找心血管并发症死因 归于其他死因,暴露怀疑偏倚,研究者在收集并确定病例组的暴露比例时所具认真、细致、深入的程度同对照组相比有重大差别;如医生知道某因素与疾病的关系,不同收集者差别。,回忆偏倚,发生于病因与危险因素的病例对照研究中,询问的发病因素与结果或研究时间隔时间较长; 如家族史、用药史等。,归类错误偏倚,每项诊断试验的灵敏度和特异度不可能达到100,就会产生假阳性和假阴性,即误诊和漏诊在研究中将病人分入对照组,而将非病人分入病例组。
12、错分有均衡与非均衡之分;均衡错分使偏倚趋向无效,而非均衡错分对结果判断有影响。,混杂性偏倚,研究危险因素与疾病之间的关系时,如果存在第三因子,且第三因子与研究因素及疾病之间均有联系,研究因素与第三因子的效应混在一起,便产生混杂偏倚,从而掩盖或夸大研究因素与疾病之间的联系。 如研究饮酒与肺癌关系,发现饮酒是肺癌的危险因素吸烟的混杂偏倚。,混杂偏倚与其他偏倚的异同,选择偏倚与测量偏倚:选取样本不当或者在观察过程中、测量过程中产生; 混杂偏倚: 也是一种系统误差,不能通过增大样本量来控制,可发生在临床科研设计阶段,但不易识别,难于控制,但可以通过统计学方法消除。 第三因子在在目标人群中同所研究的结果
13、变量存在固有联系,如也为一危险因子。 第三因子同所研究的暴露因素存在固有联系,如吸烟与饮酒,产生混杂的条件,第三因子在在目标人群中同所研究的结果变量存在固有联系,如也为一危险因子; 第三因子同所研究的暴露因素存在固有联系,如吸烟与饮酒; 否定或排除条件:若第三因子为暴露与疾病因果联系中的一中间环节,那么该第三因子不可能为一混杂因子。,评价诊断试验的指标,诊断试验的四格表 黄金标准病例组 非病例组 诊断 阳性 (真阳性)a b(假阳性) a+b 试验 阴性 (假阴性)c d(真阴性) c+da+c b+d a+b+c+d 灵敏度=a/a+c 阳性预测值=a/a+b 特异度=d/b+d 阴性预测值
14、=d/c+d 准确度=a+d/a+b+c+d 患病率=a+c/a+b+c+d,诊断试验研究中的偏倚(1),选择样本误差: 由常规试验引起的误差:阳性结果的病人通常被选择用标准方法进行鉴别,在19901993年,38的研究有此现象。 由不明确结果引起的误差:带有不明确或中间检查结果的病人往往被排除出分析之外。在19901993年,62的研究有此现象。,参考试验偏差,参考试验: 灵敏度90,特异度90, 新的诊断试验: 真敏感度90,真特异度90,,问题1:若患病率为10,结果如何?,疾病+ 疾病 参考试验 90 90 10 810 100 900 1000 研究结果(低流行率)参考试验+ 参考试
15、验 新试验 90(81+9) 90(9+81) 90(9+81) 730(1+729) 总数 180(90+90) 820(10+810) 灵敏度90/180=50%;特异度730/820=89%,问题2:若患病率为90,结果如何?,疾病+ 疾病 参考试验 810 10 90 90 900 100 1000 研究结果(高流行率)参考试验+ 参考试验 新试验 730(729+1) 90(9+81) 90(81+9) 90(81+9) 总数 820(810+10) 180(90+90) 灵敏度730/820=89%;特异度90/180=50%,参考试验影响,在评价一个新的诊断试验时,如果误差是独立
16、的话,不完满的参考试验会产生假的灵敏度以及特异度。 在高流行情况下,对灵敏度的误差将小些,在低流行情况下,对特异度的误差将会小些。,试验结果中不明确部分的影响,病例: 15岁女性,临床怀疑是患阑尾炎,外科医师估计其概率是90,外科医师认为只要其概率(可能性)大于50就应做手术,然而,下腹超声波做了,如果超声波结果是阴性的话,患有阑尾炎的可能性是多大呢?这位病人应送去外科吗?,方法1,文献资料:金标准(剖腹探查) 超声波 16(80%) 4 4 36(90%)20 40 验前比9/1 验后比(9/1)*(20%/90%)=2 验后概率2/3=66.7% OK?,方法2,文献资料剖腹探查结果阑尾炎
17、 无阑尾炎 超声结果 16 4 4 36? 36 4合计 56 44 验前比9/1 验后比9*(4/56)/(36/44)=0.8 验后概率0.8/1.850% Not Surgery!,诊断试验研究中的偏倚(2),测量误差: 审阅误差:评价标准的人已事前知道结果,在19901993年,53的研究有此现象。,观察者偏倚,调查者在解释参考实验结果时,不应该事前知道试验的结果,而在解释试验结果时,亦不应该事前知道参考试验的结果。,诊断试验研究中的偏倚(3),随机误差: 试验进行得不准确,并不知道或没有重复试验的结果;对试验观察者,试验仪器及时间的变化无进行评价。 试验特征的不准确:样本不足,而且没
18、有关于敏感度,特异度,或似然比的可信区间域的描述。在19901993年,76的研究有此问题,诊断试验研究中的偏倚(4),推广性(外部正确性) 没有对病人的特征进行描述:对疾病的情况,其它临床及病人特征没有足够的描述; 忽视了可能的相互作用因素或效果修正因素:没有对重要的临床或人群分组的特征进行评价,亦没有对测定患病率对试验特征的影响进行评价。,预后研究中的关键问题,队列研究的起始点:必须有明确的标准; 研究对象的来源和分组: 研究人群与目标人群一致 分组具有可比性 随访和失访,预后研究中的常见偏倚,集合偏倚:又称分组偏倚,就诊偏倚;主要表现在不同医疗单位之间。 存活队列偏倚:分组偏倚的特殊形式
19、,死亡病例没有进入研究。 迁移偏倚:退出、失访、转移 测量偏倚:观察与判定结局过程发生偏倚。,偏倚的防止和纠正,严格的科研设计; 采用适当地统计方法,强调严格的科研设计,选择研究对象或对照不妥: 抽样方法不正确, 诊断标准不统一, 样本大小不适当, 观察组与对照组缺乏可比性。 决定调查方法和资料收集方法考虑不周: 调查表设计不好, 实验室指标缺乏质控, 判断结果缺乏客观方法。,随机化方法,指每个研究对象都有同样的机会进入治疗组或对照组; 检验随机化效果的方法是比较两组的基本特征; 随机化是消除选择性偏倚的最好方法 平衡治疗组与对照组已知可能影响疗效和预后的因素, 平衡我们不清楚地因素;,盲法比
20、较,单盲、双盲; 医(考核疗效者、各种检查的报告者)、患(受试者)双盲; 盲法原则是消除测量偏倚的有效方法,限制,除研究因素外,期望两组其他因素均相同时采用的一种方法; 应用结论时受到限制; 如:研究年龄与心肌梗死的预后,需要限制性别、种族、心梗部位、并发症、等。,配对,用于消除某些潜在地混杂因素,如年龄、性别、种族等特征; 配对条件越多越好,但越困难,注意不能将研究因素或与研究因素有联系的因素配对。,分层,主要用于资料分析阶段; 常用Mantel-Haenszel方法; 例:研究吸烟与冠心病关系时,采用病例对照研究,年龄、性别可能是混杂因素,可采用年龄大于或小于60岁分层分别比较、也可采用男
21、女性别分层比较,标准化,当两个率进行比较时,如果两组内部构成存在差别足以影响结论,需要标准化或校正。 例:冠状动脉手术死亡率 甲医院:48/1200=4% 乙医院:64/2400=2.6%,两医院手术死亡率比较,危险因素 甲医院 乙医院 分级 病例数 死亡数 率 病例数 死亡数 率 高 500 30 6 400 24 6 中 400 16 4 800 32 4 低 300 2 0.67% 1200 8 0.67%标准化:不同等级的危险因素权重在两医院均为1/3 标化死亡率1/3*6%+1/3*4%+1/3*0.67%=3.6%,多变量分析(Logistic回归模型),用途:病因、危险因素、预后因素研究; 优点: 平衡多个混杂因素,且可以是连续变量; 估计混杂因素的相互作用; 减少样本量; 决定危险因素或预后因素的相对比重;,谢谢,