“个人基因测序服务又添新产品:想知道您能否长命百岁?只需要刮取少量口腔上皮细胞,我们将为您解读命运的天书!”
面对这样的广告,你是急不可待,跃跃欲试?还是绞着手帕,万般纠结?若属后者,令人心安的是这样的产品远未上市;而对于前者,则有捷报传来――科学家们向此目标大大迈进了一步。
波士顿大学生物统计系的保拉・萨巴斯蒂亚尼(Paola Sebastiani)与医学院的托马斯・波尔斯(ThomasPerls)所领导的研究团队在《科学》杂志上,声称通过分析150个遗传基因的记号,可以预测个人活过百岁的概率。“预测模型的正确率达到77%。”这是否意味着已经炙手可热的个人基因测序业务将很快提供该项服务?波尔斯澄清:“作为文章作者,我们并不认为时机已经成熟。”此外,除了预测,我们还能做些什么?这项研究是否意味着科学家们成功定位150个“长寿基因”,进而很快就能弄清了长寿的生物机制,甚至可以利用医药或者基因工程的方式来促使人人长寿?萨巴斯蒂亚尼却冷静地告诉记者:“此刻所做的一切只是统计分析而已,若想要了解其中的生物机制,以及这些基因记号究竟为(人类长寿)做出了多大贡献,还有许多工作要做。所以,这只是第一步。”那么,我们究竟应该怎样解读这项科研的意义?且从这150个遗传基因的记号从头说起。
百里挑一的差异
我们绝大部分的遗传密码,记载在细胞核内二十三对长链般的DNA上,而每条长链由四种核苷酸分子组成。你可以将核苷酸看做四色的珠子,千万颗乃至上亿颗这样的珠子串在一起,它们的颜色和顺序,记载了我们从双亲那里继承而来的遗传信息。如果从北京街头随便抓来两个毫无亲缘关系的陌生人,他们体内每条长链99.5%以上的部分都是完全一致的。也就是说,这俩人之间,平均每上百颗珠子里,只有一颗的颜色不同。
如果在一小段DNA里,只有一颗珠子在人群中有不同颜色(通常只有两种颜色),这颗珠子所在的位置,就被称作“单核苷酸多态性”(singlenucleotide polymorphism, 缩写SNP,读音snip)位点。纵观人类基因组,平均每100到300个核苷酸里会出现一个SNP位点,而我们个体基因组中90%的花样,都以SNP的形态存在。可以说,每人都有一套颜色特异的SNP珠子,它们虽然相对数量不大,却使得我们遗传密码个性鲜明,并为个体差异起到可观的决定作用。
既然SNP如此关键,近年来,运用一种叫做全基因组关联(genomewide association, 缩写GWA,读音giwa)分析的特殊研究手段,从众多SNP位点中找到与特定健康状况“有关”的那些,成为遗传界炙手可热的领域。简而言之,这样的研究通常找来两组人群,一组有特定健康状况――譬如患有某种疾病,而另一组没有。科学家们通过分子生物学的手段,确定每个被试个体体内一组SNP珠子的颜色是红是绿,再通过统计方法,计算红色(或绿色)珠子是否特别容易出现在患有疾病的被试体内,如果答案卫士,该SNP就被判为与这种疾病“相关”。
预示长寿的密文
过去五年里,利用GWA,科学家们已经先后发现成百上千个SNP,分别与40多种疾病相关――其中包括心血管疾病、糖尿病、自闭症、癌症等常见疾病。而本文开头所提到的研究者,则找来两组已过世的老人的血样:一组特别高寿,终年在95岁-119岁;而另一组则与广大群众差别不大,终年在53岁-90岁之间。研究者先从26万个SNP中,找出数十个各自与长寿相关的单个SNP位点;又建立统计模型,找到一套“具有预测性的”SNP,共有150个。通过确定每一个被试体内这套SNP的颜色,他们可以计算出该个体活过百岁的概率――如果超过一半,就被定义为“很可能高寿”。由于被试的寿命都已知,把计算机算出来的结果和实际情况一比较,发现77%的百岁老人都确实被模型预测为高寿者,这,就是“准确性达到77%”的来源。
那这是否意味着,如果有人对你体内这150个SNP进行测定,就能以77%的准确度预测你能否活到百岁呢?显然并不是这么简单。首先,GWA手段很容易受到被试的特定遗传背景(譬如所属人种)的影响,利用GWA手段所得到的类似研究结果,都需要在不同人群中得到多次重复确认,才能被学界认可。而预测的准确性,也很容易受到影响。事实上,波尔斯他们也在研究中重复过两次,每次的准确性都不相同。
其次,“统计是最大的谎言”虽然是一句行内人的笑话,但也说明对统计结果的解释,需要格外谨慎:用任何统计方法计算出来的、代表概率或准确性的结果,严格来说,都只在统计学本身的范畴里有意义。在科学家们做出进一步的功能性实验和分析之前,这些结果并没有显著的生物学意义。事实上,GWA所找到的大多数SNP,都很可能与长寿毫无关系,只是因为误差、实验设计的特点,或者这些SNP正巧和导致长寿的基因做了近邻,才被找了出来。另外,这150个SNP远未涵盖所有与长寿相关的遗传密码――在异常高寿的老人中,有30位被模型判断为“活到百岁希望渺茫”,而他们之中不少人却有着悠久的长寿家族史,这就暗示着还有其他促进长寿的遗传因素并未被发现。
最后,科学家们最担心的,则是如果这项研究被直接用于个人基因测序,会对每个接受测序的顾客产生什么样的心理暗示――如果你知道自己基因优良,会不会纵容自己抽烟酗酒?又或者如果你发现自己活过百岁的可能性不大,会不会自暴自弃,变成一只沙发土豆?事实上,虽然遗传密码对我们的健康起到至关重要的作用,但外界环境的影响却绝对不容忽视――在很多情况下,环境的作用甚至远远大于基因。过于强调基因的作用,而忽略健康生活习惯的重要性,对于任何人,都将是一场灾难。有研究表明,基因对我们是否能活到85岁,只起到20%-30%的作用。而就在这项研究之中,有15%的未活到百岁的被试却被计算机定位为“高寿者”。换言之,他们很可能继承了优秀的长寿密码,却因为其他因素而无缘高寿。
刚刚起步的探索
对于生物医学研究者,统计概率固然重要,但最关键的,恐怕是怎样利用这些统计结果,来摸清生命现象之下的生理基础,并进一步探索能为人类健康服务的道路。这些年来,GWA研究之所以风起云涌,则在于科学家们认为,它能有效地为进一步的研究指明方向,提供***靶。在GWA之前,为了找到疾病的遗传根源,遗传学家往往需要做大量的家族连锁分析。这样的工作,相当费时费力,并需要研究者提出预设猜想――猜测致病基因在DNA上的大致位置。而且,大多数常见疾病的罪魁祸首都可归结于多个基因的共同作用,可传统的遗传连锁分析却对多基因分析效果不佳。而GWA相对简便快捷,不需要任何关于基因位置的预设,可以同时分析数以十万计的遗传基因位点,一举找出多个与疾病有统计相关性的基因密码,自然备受研究者的青睐。
GWA找到的与健康状况相关的SNP位点中,有两种对生物医学研究意义重大:一种能直接影响基因功能的SNP位点。这些位点是红是绿,往往可以决定该基因所制造出来的蛋白质的序列、功能,直接影响生理。2005年,科学家们曾经利用GWA一举发现导致老年性黄斑变性(age-relatedmacular egeneration,一种在老人中极为常见的致盲因素)的基因“补体因子H”(ComplementFactor H)。这个基因与炎症相关,似乎和视力风马牛不相及,若非GWA研究,恐怕很少有人会想到它是重要嫌犯之一。另一种SNP位点,本身并不影响到任何基因的功能,可是却因为与嫌犯在DNA上位置接近,被GWA发现。科学家们于是可以顺藤摸瓜,通过这些地***标识般的SNP,找到真正的罪魁祸首。恐怕大多数的GWA研究所能找到的SNP,还是属于这后一种情况。
萨巴斯蒂亚尼和波尔斯的研究中所找到的与长寿相关的SNP,有一些似乎确实在衰老机制中有着一席之地。这些SNP曾在过去的遗传相关性研究中被发现,与老年痴呆、肌肉萎缩、骨骼代谢、免***应激等方面相关。今后,它们将会作为备选基因,供研究衰老的科学家细细省视。另外,当这篇文章的作者们分析那些2000多个已知的、与老年疾病相关的SNP位点时,他们惊讶地发现,这些SNP的分布,在长寿组与对照组之间,并没有任何区别。这可能预示着,长寿的秘诀不在于免于继承那些致病基因,而在于拥有一批“健康基因”,能延缓老年疾病的发作――事实上,大多数百岁老人,在他们90来岁时,还相当健康,少有病痛。
不过,这样研究结果的复杂性意味着:想通过一两个基因来全面解释为何有人能特别长寿?这样的努力不太可能“结出硕果”,英国纽卡斯特大学衰老与健康研究中心的主任托马斯・柯克伍德(ThomasKirkwood)说,“我们不是在寻找那几个设定生命时钟的基因。事实的真相,当它被揭露时,将会异常繁杂。”