" 一天一苹果,医生远离我 "(An apple a day keeps the doctor away),这句著名的谚语已经流传了上百年,难道苹果真的能预防疾病?
2016 年,来自中国人群的一项研究揭示了新鲜水果对心血管疾病的潜在预防作用:与从不或很少食用新鲜水果的人相比,每天食用新鲜水果的人心血管疾病死亡风险降低 40%,主要心血管疾病发生风险降低 34%。
这项发表在著名期刊《新英格兰医学杂志》(NEJM)上的研究,一经发表便在国内外学界引起了轰动,也让这项研究所使用的超大队列蜚声海内外,那就是由 51 万中国人组成的 " 中国慢性病前瞻性研究"队列。

你问什么是队列?队列(Cohort)一词来自拉丁语,本来是指古罗马军团中的战斗编制单位。古罗马用队列,排兵布阵来打仗。而科学研究中用队列,通常是为了研究某种因素和特定结果之间有没有潜在的关联,比如抽烟是不是会引起肺癌。
这个时候,科研人员通常要做的事,就是将队列中的人按是否暴露以及暴露程度分组。所谓的 " 暴露 ",含义非常丰富,它可以是服用过某种药物,可以是接触过什么化学物质,可以是拥有某类生活习惯,甚至可以是年龄、性别等特征。


然后,科研人员会持续追踪队列中的这些人,看一段时间后他们是否出现了想要研究的特定结果,从而判断暴露与结果之间的关系。
那今天我们就介绍一些有代表性的队列吧。
最古老的现代队列:1946 出生队列
真正现代意义上的队列研究,要追溯到第二次世界大战之后。
1946 年,英国人想要研究本国生育服务的问题,找出生育率下降的可能原因,研究最初计划纳入英格兰、苏格兰和威尔士三个地区 1946 年 3 月 3 日 ~9 日内分娩的所有妇女,实际招募了 13687 名妇女。
后来,研究结果引起了英国卫生服务部(NHS)的极大兴趣,他们意识到,可以基于这些数据来进一步研究家庭和社会环境对个人发展、行为和儿童期健康的影响。因此,1948 年,NHS 随机抽取了初始研究人群中的 5362 名儿童,并对其进行了长期的追踪随访,这就是有名的 1946 出生队列(1946 Birth Cohort),是最早的现代队列之一。

该队列研究早期的关注点,主要聚焦在家庭关系和教育设施对个人发展和行为的影响上,随后研究开始集中在与社会背景相关的因素上,此后又开始关注与疾病发病率相关的因素。
该研究产生了很多重要成果,但由于队列中的儿童人数较少,代表性有欠缺,对于许多问题的研究证据不足。不过,这也促使了之后一些更大规模研究的开展。
最听话的队列:英国医生队列
随访是队列研究中十分关键的一环,但在这个过程中,尤其是时间跨度很长的研究,受试者中途跑路是家常便饭,这在专业上属于 " 失访 "。但是有个队列的 " 乖巧 " 程度,可称之为史诗级别,那就是英国医生队列。
这项队列研究的初衷,是因为吸烟和肺癌关联的早期研究结果受到一些质疑。因此,英国流行病学和统计学家布拉德福德 · 希尔(Bradford Hill)提出了队列研究设计:首先获取大量个体的吸烟习惯,然后检验几年后吸烟者的肺癌死亡率是否高于非吸烟者,且死于肺癌的风险是否随吸烟量的增加而增加。

研究者在 1951 年 10 月向医疗登记系统记录在案的所有医生发出了问卷,共收回 40564 份有效问卷,这些作出回应的人便成为了队列中的个体。健康结局则从国家生命统计局提供的死亡证明中获取。
以医生为研究对象的优势不言而喻。首先,他们都受过专业的训练,可以更为准确地描述自己的吸烟习惯;其次,他们可能比其他人群对吸烟习惯的调查更感兴趣从而参与研究;而最重要的原因是,英国相关法律规定医生需要在医疗登记系统上注册并登记个人信息,因此医生群体更容易追踪随访。

1954 年,研究者在《英国医学杂志》(BMJ)上发布了男性医生的观察结果:吸烟与肺癌之间存在显著的相关性,同时吸烟量越大肺癌风险也越高。而正如希尔所预期的那样,医生很容易追踪,20 年后,原来的男性队列人群中只有 101 名调查对象 " 下落不明 ",失访率仅 0.3%。不仅如此,随后研究者对其中仍然健在且居住在英国的 2 万余人继续追踪了 20 年,仍然仅有 118 人失访,失访率仅 0.5%。
最打脸的队列:美国癌症学会研究队列
几乎与英国医生队列研究同步,美国癌症协会统计研究室主任爱德华 · 哈蒙德(Edward Hammond)和同事丹尼尔 · 霍恩 (Daniel Horn)在美国癌症协会的支持下,试图证明吸烟和肺癌并无关联。然而最终他们用破记录的超大队列,进一步有力地证明了吸烟与肺癌不仅相关,而且关系非常密切。
哈蒙德和霍恩通过问卷获得了近 19 万名年龄在 50~69 岁之间的美国白人的吸烟习惯,并追踪受访者的存活状态,然后从死亡证明中获得死因,同时还通过私人医生、医院记录和肿瘤登记系统获得癌症的相关诊断信息。1953 年 10 月,其中 187766 人成功随访并追踪到结局。

1954 年该研究在《美国医学会杂志》(JAMA)上发表了初始的研究报告,研究结果表明:肺癌死亡中高达 83% 归因于吸烟。同时,该研究还观察到吸烟与非肺部癌症、冠心病等疾病之间的显著关联。而最令这项研究名留青史的还是,它是首个研究人群接近 20 万的队列,而且这一记录一直保持到 20 世纪 60 年代。
很有意思的是,哈蒙德先生嗜好抽烟,甚至一天 4 包卷烟,在研究结果发表的当年他开始戒卷烟,但却改抽烟斗,1986 年他死于癌症,这可能与他爱好抽烟不无关系。
最长久的队列:弗明翰心脏研究队列
弗明翰心脏研究(Framingham Heart Study, FHS)队列是美国第一个研究心血管疾病的大队列。研究从 1948 年开始,大约每 2~4 年会对所有研究对象随访一次,一直持续至今,长达 70 多年,是随访时间最长的队列之一。
上世纪中叶,随着美国心血管疾病患病率的上升,系统性研究心血管疾病的病因以及防治措施成为迫切的需要。1948 年,美国国家心脏研究所选择在弗明翰地区开展流行病学研究,以确定心血管疾病的危险因素,指导公共卫生预防策略。

调查人员随机抽取了弗明翰镇三分之二的有 30~59 岁成员的家庭,最终共 5209 名居民组成初始队列。
为了进一步研究遗传等因素对心血管疾病的的影响,1971 年,初始队列成员的后代及其配偶共 5124 人被招募到子代队列(Offspring Cohort)中,并继续定期追踪和随访。
2002 年,为了扩展心血管疾病遗传模式和遗传决定因素的相关研究,又招募了初始队列人群的第三代参与研究,最终 4095 人同意参与第三代队列(Generation Three Cohort)。

此外,为了增加家庭数,研究还纳入了 103 名此前没有被纳入子代队列的第三代队列成员的父母,形成新的子代配偶队列(New Offspring Spouses Cohort)。
由于弗明翰镇及周边社区的种族和民族多样性在研究开始后的几十年里有所增加,1994 年和 2003 年,研究还分别启动了两个包括非裔美国人、西班牙人、亚洲人、印度人等后裔在内的多民族和多种族人群队列。
最宏大的中国队列:
中国慢性病前瞻性研究队列
队列规模哪家强,可以说哪里都比不上中国的人口基数优势。2004 年,中英合作启动了中国慢性病前瞻性研究项目(China Kadoorie Biobank,CKB ) ,2004~2008 年间,该项目从中国 10 个地区招募了 512891 名 30~79 岁的成年人,是中国目前规模最大的人群队列,也是世界上少有的 50 万人以上的队列。
我国人口众多,慢性病负担日益加重,其发病率和风险暴露模式有别于发达国家,而既往关于中国人群的许多常见慢性病的研究证据有限。在这样的背景下,该项目将中国疾病监测点系统、公安部门户籍系统、居民死亡医学证明书、医疗保险数据库等数据与调查数据进行匹配和关联,从而获得队列人群十分完备的暴露信息以及研究对象出现的各种健康结局。

CKB 项目庞大的人群研究数据形成了丰富而独特的研究资料,为许多常见慢性病的病因探索提供数据支持。时至今日,CKB 项目已经随访近 15 年,产生了大量有影响力的研究成果,2017 年和 2018 年论文产出均超过了 40 篇,对丰富人类关于慢性病的认识具有重要价值。
随着各国政府、各种基金组织对科学研究的重视与投入的增加,以及现代管理技术的发展,目前已经建立起来了多个类似于 CKB 的超大型队列。例如欧洲 10 国共同参与的癌症和营养前瞻性研究(EPIC)样本人群达 519978 人,样本量达 567169 人的美国国立卫生研究院退休人员协会饮食与健康研究(NIH-AARP Diet and Health Study),英国 132 万人的百万妇女研究(Million Women Study)以及 50 万人群的英国生物银行(UK Biobank)等。

队列研究一直在发展,时至今日,其研究设计变得更加复杂、研究内容更加广泛和深入。随着大数据时代的兴起,电子医疗和保险等医疗大数据也已经达到了空前的规模,这为基于这些数据开展规模更加庞大的队列研究提供了契机,这些研究也将为人类更加深入地认识和更有效地防治疾病做出重要贡献。
参考文献
[ 1 ] Davis M A, Bynum J P, Sirovich B E. Association between apple consumption and physician visits: appealing the conventional wisdom that an apple a day keeps the doctor away [ J ] . JAMA Intern Med, 2015,175 ( 5 ) :777-783.
[ 2 ] Rothman K J. Epidemiology: An Introduction [ M ] . 2. New York: Oxford University Press, Inc., 2012.
[ 3 ] 詹思延 , 叶冬青 , 谭红专 . 流行病学 [ M ] . 7. 北京 : 人民卫生出版社 , 2014.
[ 4 ] Ed. A M. A History of Epidemiologic Methods and Concepts [ M ] . Springer Basel AG, 2004.
[ 5 ] Frost W H. The age selection of mortality from tuberculosis in successive decades [ J ] . Am J Hyg, 1939,141 ( 1 ) :4-9, 3.
[ 6 ] Doll R. Cohort studies: history of the method. I. Prospective cohort studies [ J ] . Soz Praventivmed, 2001,46 ( 2 ) :75-86.
[ 7 ] Liddell F D. The development of cohort studies in epidemiology: a review [ J ] . J Clin Epidemiol, 1988,41 ( 12 ) :1217-1237.
[ 8 ] Wadsworth M, Kuh D, Richards M, et al. Cohort Profile: The 1946 National Birth Cohort ( MRC National Survey of Health and Development ) [ J ] . Int J Epidemiol, 2006,35 ( 1 ) :49-54. [ 9 ] Chamberlain R, Davey A. Physical growth in twins, postmature and small-for-dates children [ J ] . Arch Dis Child, 1975,50 ( 6 ) :437-442.
[ 10 ] Doll R, Hill A B. The mortality of doctors in relation to their smoking habits; a preliminary report [ J ] . BMJ, 1954,1 ( 4877 ) :1451-1455.
[ 11 ] Tsao C W, Vasan R S. Cohort Profile: The Framingham Heart Study ( FHS ) : overview of milestones in cardiovascular epidemiology [ J ] . Int J Epidemiol, 2015,44 ( 6 ) :1800-1813.
[ 12 ] Stavitsky K, Du Y, Seichepine D, et al. White matter hyperintensity and cognitive functioning in the racial and ethnic minority cohort of the Framingham Heart Study [ J ] . Neuroepidemiology, 2010,35 ( 2 ) :117-122.
[ 13 ] Benjamin I, Brown N, Burke G, et al. American Heart Association Cardiovascular Genome-Phenome Study [ J ] . Circulation, 2015,131 ( 1 ) :100-112.
[ 14 ] China Kadoorie Biobank. China Kadoorie Biobank [ EB/OL ] . [ 2019/06/17 ] . http://www.ckbiobank.org/site/.
[ 15 ] 李立明 , 吕筠 , 郭彧 , 等 . 中国慢性病前瞻性研究 : 研究方法和调查对象的基线特征 [ J ] . 中华流行病学杂志 , 2012,33 ( 3 ) :249-255.
[ 16 ] Chen Z, Chen J, Collins R, et al. China Kadoorie Biobank of 0.5 million people: survey methods, baseline characteristics and long-term follow-up [ J ] . Int J Epidemiol, 2011,40 ( 6 ) :1652-1666.
[ 17 ] China Kadoorie Biobank. CKB Publications [ EB/OL ] . [ 2019/06/17 ] .http://www.ckbiobank.org/site/Research/CKB+Publications.
[ 18 ] 李立明 , 吕筠 . 大型前瞻性人群队列研究进展 [ J ] . 中华流行病学杂志 , 2015,36 ( 11 ) :1187-1189.
[ 19 ] Riboli E, Hunt K J, Slimani N, et al. European Prospective Investigation into Cancer and Nutrition ( EPIC ) : study populations and data collection [ J ] . Public Health Nutr, 2002,5 ( 6b ) :1113-1124.
[ 20 ] Schatzkin A, Subar A F, Thompson F E, et al. Design and serendipity in establishing a large cohort with wide dietary intake distributions : the National Institutes of Health-American Association of Retired Persons Diet and Health Study [ J ] . Am J Epidemiol, 2001,154 ( 12 ) :1119-1125.
[ 21 ] Allen N, Sudlow C, Downey P, et al. UK Biobank: Current status and what it means for epidemiology [ J ] . Health Policy Techn, 2012,1 ( 3 ) :123-126.
作者:肖禺
编辑:黎小球

(欢迎转发到朋友圈 ~)
果壳
ID:Guokr42
靠谱科普
就看果壳
困扰你最久的慢性病是什么?进群落聊一聊吧。
BTW,我们设置了小小的门槛,相信热爱科学的你肯定会通过考验!扫描下面的二维码,在 42 秒内答对尽可能多的题,达到一定分数才可以加入,每 24 小时仅能答题一次。呼 ~ 深吸一口气,然后好好答题吧!
果壳正在招新媒体实习生
运营一流科技媒体的机会在向你招手
新媒体实习生招聘!欢迎你的加入