1、1,第五章 队列研究 ( Cohort Study ),卫 生 系 黄民主 教授,2,队列原意是指古罗马军团中的一个分队,流行病学家加以借用,表示有共同经历或共同状态的一群人,例如一组出生队列有相同的出生年代,一组吸烟队列有共同的吸烟经历。,引言,3,大多数慢性病都是历时多年的一个过程所形成。在此期间发生的许多事件都可能起致病作用。队列研究通过对某一人群在某种病尚未明显发生前,某个(或某些)可能起病因作用或保护作用的事件的后果进行随访监测,进行从“因”观“果”的流行病学研究。,引言,4,研究对象是加入研究时未患所研究疾病的一群人,根据是否暴露于所研究的病因(或保护因子)或暴露程度而划分为不同组
2、别,然后在一定期间内随访观察不同组别的该病(或多种疾病)的发病率或死亡率。如果暴露组(或大剂量组)的率显著高于未暴露组(或小剂量组)的率,则可认为这种暴露与疾病存在联系,并在符合一些条件时有可能是因果联系。,引言,5,队列研究所观察的结局是可疑病因引起的效应(发病或死亡),除了所研究的一种病,还可能与其他多种疾病也有联系,这样就可观察一个因素的多种效应,而这正是队列法不可取代的用途。,引言,6,第一节 概 述 第二节 研究实例 第三节 设计与实施 第四节 资料的整理与分析 第五节 偏倚及其控制 第六节 优缺点,7,概 述,一 病因研究步骤 二 基本概念 三 基本原理 四 特 点 五 目 的 六
3、 分 类,8,一 病因研究步骤,分析性研究,描述性研究,病因推断,验证病因假设,提出病因线索 形成病因假设,推断暴露和疾病之间的因果关系,队列研究,流行病学实验,病例对照研究,第一节概述,9,二 基本概念,暴露(exposure)指接触过某种物质、具备某种特征或处于某种状态 队列(cohort)有共同经历或有共同暴露特征的一群人分为固定队列和动态队列,第一节概述,10,固定队列 Fixed Cohort,研究开始,研究结束,出现结局,未出现结局,第一节概述,11,动态队列 Dynamic Cohort,研究开始,研究结束,出现结局,失访,第一节概述,12,根据研究对象是否暴露于某研究因素或其不
4、同水平将研究对象分成暴露组与非暴露组 随访一定时间,比较两组之间所研究结局(outcome)发生率的差异,研究暴露因素与研究结局之间的关系,三 基本原理,第一节概述,13,目标人群未患某研究疾病,代表性样本,Yes,No,Yes,No,暴露组,非暴露组,时间顺序,是否暴露某个危险因子,结局(疾病),队列研究的结构模式图,第一节概述,14,四 特 点,观察法 设立对照 由因到果,符合时间顺序 确证暴露和结局因果关系,第一节概述,15,五 目 的,检验病因假设 ( hypothesis) 评价预防效果 (effect of prevention) 研究疾病自然史( natural history
5、of disease),第一节概述,16,六 分 类,前瞻性队列研究 历史性队列研究 双向性队列研究,第一节概述,17,时间顺序,过去,现在,将来,历史性队列,双向性队列,前瞻性队列,回顾性收集已有的历史资料,回顾性收集已有的历史资料,继续前瞻性收集资料,前瞻性收集资料,队列研究类型示意图,第一节概述,18,前瞻性队列研究 Prospective Cohort Study,研究队列的确定是现在(concurrent) 根据研究对象现在暴露分组 需要随访(follow-up) 结局在将来某时刻出现,第一节概述,19,优点,时间顺序增强病因推断可信度 直接获得暴露与结局资料,结果可信 能获得发病率
6、,缺点,所需样本量大,花费大,时间长 影响可行性,第一节概述-前瞻性队列研究,20,应用条件,明确地检验假设 所研究疾病的发生率较高,一般不低于5 明确规定暴露因素和结局变量 可靠的测量手段 足够的观察人群和暴露情况 能完成随访的人群 足够的人、财、物力,第一节概述-前瞻性队列研究,21,历史性队列研究 Historical (Retrospective) Cohort Study,根据研究开始时研究者掌握的有关研究对象在过去某时刻的暴露情况的历史材料分组 不需要随访,研究开始时结局已出现,第一节概述-历史性队列研究,22,优点,短期内完成资料的收集和分析 时间顺序仍是由因到果 省时、省力、出
7、结果快,缺点,资料积累时未受到研究者的控制,内容上未必符合要求 需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料,第一节概述-历史性队列研究,23,双向性队列研究 Mixed (Ambispective) Cohort Study,研究队列的确定是过去 根据研究对象过去某时刻的暴露情况分组 需要随访 结局可能已出现,第一节概述-双向性队列研究,24,研究实例,二硫化碳长期低剂量的暴露与冠心病的关系,25,二硫化碳(CS2),神经系统毒物,抑制酶的活性,影响脂蛋白代谢,造成心血管疾病 长期接触低浓度二硫化碳可引起慢性中毒,引起精神病、多发性神经炎、动脉粥样硬样等 短时间
8、接触高浓度的二硫化碳蒸气可急性中毒,第一节研究实例,26,20世纪60年代芬兰职业卫生研究所Hernberg和Tolonen教授所做的5年前瞻性队列研究确定了二硫化碳长期低剂量暴露与冠心病的因果关系,第一节研究实例,27,一 确定研究因素,研究因素长期低剂量的CS2暴露定义有CS2暴露,在不至引起急性中毒的车间工作至少5年以上,第一节研究实例,28,二 确定研究结局,结局指标 心肌梗死血压变化 心电图的改变 心绞痛发作,第一节研究实例,29,三 确定研究现场和人群,暴露组19421967年间某粘纤厂25至64岁,至少有5年CS2暴露史的所有工人(343名,全为男性) 对照组年龄相差不超过3岁,
9、出生地区相同,工种的体力消耗相当,在同一城市的造纸厂随机选择的343名男性工人,第一节研究实例,30,四 资料收集,查阅档案记录用药情况、既往车间CS2的浓度等 询问 姓名、性别、年龄、工种及工作年限、吸烟、业余时间的体力活动情况 实验室检查 血糖、血脂、血清胆固醇水平、血压、心电图、心脏大小、体重及车间CS2浓度的动态变化,第一节研究实例,31,五 质量控制,采用国际通用的标准和规定 事先校准各种仪器和设备 重复测量和分析某些指标,第一节研究实例,32,六 资料分析,CS2暴露组发生心肌梗死的相对危险度为3.57,两组致死性心肌梗死发生率和总的心肌梗死发生率差异有显著性(表1) CS2在不同
10、临床类型冠心病的发生中作用程度不同(表2),第一节研究实例,33,表1 暴露组和对照组的心机梗死发生率及相对危险度,第一节研究实例,34,表2 CS2与不同临床类型冠心病的RR与AR比较,第二节研究实例,35,七 结论,长期低剂量(2030ppm)CS2暴露与冠心病的发病和死亡存在因果关系 CS2所致的冠心病,以致死性心肌梗死表现突出,其他类型也有不同程度的表现 措施 芬兰当局已于1972年把CS2的车间最高容许浓度从20ppm降至10ppm,第二节研究实例,36,设 计 和 实 施,一 确定研究因素 二 确定研究结局 三 确定研究现场和研究人群 四 确定队列大小 五 资料收集与随访 六 质量
11、控制,37,主要暴露因素在描述性研究和病例对照研究的基础上确定,一 确定研究因素,可能影响结局暴露因素混杂因素 人口学特征等,暴露测量,性质 定性(quality) 定量(quantity) 方法 访谈 实验室检查 查阅记录,第三节设计与实施,38,结局是研究队列中预期结果事件,发病或死亡某些血清指标分子标志的变化定性或定量,二 确定研究结局,39,一次研究可有多个结局,吸烟,吸烟,慢性支气管炎,冠心病,肺癌,40,结局的测量采用国际或国内通用的标准,41,有足够符合条件的研究对象 领导重视、群众支持 医疗条件较好,交通较便利 发病率较高,三 确定研究现场和人群,研究现场,42,从目标人群中抽
12、出的具有代表性的人群 未患所研究疾病 分为暴露人群和非暴露人群,研究人群,43,暴露人群的选择,职业人群 (occupational exposure) 特殊暴露人群 一般人群(general population) 有组织的人群团体,44,非暴露(对照)人群的选择,内对照(internal controls) 一群研究对象内部 外对照(external controls) 一群研究对象外部 总人口对照整个地区现成的发病或死亡资料 多重对照(multiple controls) 两种或以上的形式,45,影响样本大小因素 抽样方法 暴露组与非暴露组的比例 失访,四 确定队列大小,46,影响样本含
13、量参数,非暴露人群或全人群中所研究疾病的发病率p0 暴露人群与对照中疾病发病率之差 第一类错误概率 把握度(power) 1-,47,公式法,样本大小的计算,条件 暴露组和对照组样本含量相等,:两个发病率的平均值,P1:暴露组预期发病率 P0:对照组预期发病率,48,已知 p0=0.007,RR=2.5,=0.05,=0.1,计算样本量根据上述条件Z=1.96, Z=1.282 ,q0=0.993p1=p0RR=0.0175,q1=0.9825代入公式得 N=2310考虑到失访,实际上每组需扩大10%,即2541人,49,查表法,条件 已知、 、p0、 RR,50,基线资料 随访 资料收集,五
14、 资料收集与随访,51,基线(base-line)资料暴露的资料个体的其他信息,52,随访(follow-up),随访对象、内容和方法 随访间隔 随访者 观察终点 观察终止时间,53,观察终点(end-point) 研究对象出现了预期的结果 观察终止时间整个研究工作截止的时间,54,查阅纪录 调查询问 健康或疾病检查 环境监测等,资料收集方式,55,调查员选择 调查员培训 制定调查员手册 监督,六 质量控制,56,资 料 的 整 理 和 分 析,一 资料整理表 二 人时的计算 三 率的计算 四 率的显著性检验 五 效应估计,57,一 资料整理表,暴露组发病率=a/(a+b) 对照组发病率=c/
15、(c+d) 如果二者差异显著,并且无明显偏倚,则暴露因 素与疾病之间有可能存在因果关系,58,二 人时的计算,精确法 近似法 寿命表法,59,三 率的计算,累积发病率 发病密度 标化死亡比 标化比例死亡比,60,变化范围 01适用条件 样本大,人口稳定,整齐的资料,累积发病率 (cumulative incidence),61,发病密度 (incidence density),变化范围 0适用条件观察时间长,人口不稳定,存在失访, 资料不很整齐,62,标化死亡比 (standardized mortality ratio SMR) (1),变化范围 0 适用条件 结局事件的发生率比较低,无论观
16、察的时间长或短,都不宜直接计算率时,63,预期发病(死亡)数的计算以全人口某病的发病(死亡)率乘以某单位 人口数,标化死亡比 (SMR) (2),64,标化死亡比 (SMR) (3),SMR=1 研究人群某病发病(死亡)危险等于标准人群SMR1 研究人群某病发病(死亡)危险大于标准人群,是标准人群的SMR倍SMR1 研究人群某病发病(死亡)危险小于标准人群,意义 被研究人群发生(死于)某病的危险性是标准人群的多少倍,65,标化比例死亡比(1) (standardized proportional mortality ratio, SPMR),变化范围 0 适用条件 不能得到历年人口资料,仅有死
17、亡人数、原因、日期和年龄,66,预期死亡数的计算以全人口中某病因死亡占全部死亡之比例乘以某单位实际全部死亡数,标化比例死亡比(2),67,四 率的显著性检验,U检验 直接概率法 二项分布检验 泊松(Poisson)分布检验 卡方检验 计分检验(score test),68,五 效应估计,相对危险度 归因危险度 归因危险度百分比 人群归因危险度 人群归因危险度百分比 剂量反应关系,69,相对危险度RR(relative risk),意义 暴露组发病或死亡的危险是非暴露组的多少倍 RR值越大,暴露的效应越大,暴露与结局关联强度越大,Ie:暴露组率 Io:非暴露组率,70,意义 吸烟者因肺癌死亡的危
18、险是非吸烟者的10.7倍吸烟者因心血管疾病死亡的危险是非吸烟者的1.7倍,吸烟者与非吸烟者死于不同疾病的RR,(1/10万人年),71,RR与关联强度,72,lnRR的95%CI,RR95%CI,反自然对数即为RR95%CI,Woolf法,73,归因危险度AR (Attributable risk),意义 暴露与非暴露人群比较,所增加的疾病发生数量 AR值越大,暴露因素消除后所减少的疾病数量越大,或,74,意义 RR 吸烟对肺癌的病因学意义较大 AR 戒烟对心血管疾病的预防作用较大,即公共卫生意义较大,RR与AR的区别,(1/10万人年),75,归因危险度百分比 AR%,意义暴露人群中的发病或
19、死亡归因于 暴露的部分占全部发病或死亡百分比,或,(病因分值 EF),76,人群归因危险度 population attributable risk PAR,意义 暴露人群与一般人群比较,所增加的疾病发生率的大小 PAR值越大,暴露因素消除后所减少的疾病数量越大,PAR= ItI0,It:总人群率 Io:非暴露组率,77,人群归因危险度百分比 PAR%,意义PAR占总人群全部发病(或死亡)的百分比,或,Pe:总人群的暴露比例,(人群病因分值),78,分析方法 列出不同暴露水平下的发病率 以最低暴露水平组为对照,计算各暴露水平的RR和RD 必要时,应对率的变化作率的趋势性检验,剂量反应关系,79
20、,表4-10 4059岁男子按初始血清胆固醇分组冠心病6年发生情况,结果,随着血清胆固醇水平的升高,其患冠心病的RR增大,说明存在剂量效应关系,80,偏倚及其控制,选择偏倚 失访偏倚 信息偏倚 混杂偏倚,81,selection bias,选择偏倚,研究人群在一些重要因素方面与一般人群或待研究的总体人群存在的差异,82,产生原因 选择对象的方法不当 最初选定参加研究的对象中有人拒绝参加 历史性队列研究中部分档案丢失或记录不全 志愿者队列 研究开始时未能发现早期病人等,预防为主,抽样方法正确,严格按规定标准选择对象,控制,选择偏倚,83,lost to follow-up,失访偏倚,研究对象因迁
21、移、外出、死于非终点疾病或拒绝继续参加观察而退出队列所引起的偏倚,84,控制,设计时 选择便于随访的人群在计算的研究样本的基础上扩大10%实施时加强对随访员的管理制定随访计划和监测措施期中分析整理资料时对于有缺项或漏项的对象进行补查,失访偏倚,85,information bias,信息偏倚,在获取暴露、结局或其他信息时所出现的系统误差或偏差,86,疾病、暴露标准不明确 检验仪器不精确、检验技术不熟 询问技巧不佳记录错误,造假等,产生原因,信息偏倚,87,控制 提高临床诊断技术、明确各项标准 选择精确稳定的测量方法 事前调准仪器 严格实验操作规程 同等对待每个研究对象 培训调查员,提高技巧,统
22、一标准,信息偏倚,88,confounding bias,与所研究因素和结果均有联系的第三因素在暴露组与对照组的分布不均衡,混淆了研究因素和结果间的真实联系,混杂偏倚,89,研究设计阶段限制研究对象,匹配 分析阶段分层分析、标准化或多因素分析,控制,混杂偏倚,90,优缺点,91,优 点,直接获得暴露组和非暴露组的发病率或死亡率 直接估计危险度 符合时间顺序,验证病因的能力较强 获得一种暴露与多种结局的关系 收集的资料完整可靠,不存在回忆偏倚 可研究疾病的自然史,92,缺 点,不适于发病率很低的疾病的病因研究 易发生失访偏倚 耗时,耗人力、物力、财力 设计要求严密,资料的收集和分析难度较大 随访过程中,已知变量的变化或未知变量的引入增加分析难度,