人和其他大多数生物的遗传信息被记录在脱氧核糖核酸(DNA)或核糖核酸(RNA)中,DNA和RNA中所含的所有基因也称基因组。DNA中每个有功能的单位被称作基因,每个基因都是由一连串单核苷酸组成。每个单核苷酸都由碱基、戊糖(即五碳糖,DNA中为脱氧核糖,RNA中为核糖)和磷酸3部分组成。
碱基不同构成了不同的单核苷酸。组成DNA的碱基有腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的碱基以尿嘧啶(U)代替了胸腺嘧啶(T)。
4个遗传密码的发现
龙生龙、凤生凤依靠的是遗传信息,而遗传信息又是靠遗传密码锁定的。基本的遗传密码就是DNA的4个碱基,以及它们的排列顺序或序列。通过4个碱基密码的不同顺序可以编码不同的蛋白质,从而形成千差万别但在本质又相似的生命。
由于DNA双链中一般只有一条单链(称为模板链)被转录为信使核糖核酸(mRNA),而另一条单链(称为编码链)不被转录,所以需要mRNA转录DNA的遗传密码,即碱基(核苷酸)顺序。
在有机体制造蛋白质的过程中,基因先从DNA转录为对应的RNA范本,即信使RNA(mRNA)。接下来在核糖体和转移RNA(tRNA)以及一些酶的作用下,由mRNA转录为氨基酸组成的链(多肽),然后经过转译修饰形成蛋白质。
mRNA和DNA都含有4种不同的碱基,即遗传密码A、G、C和T(U)组成的核苷酸。但是,生物体中组成蛋白质的氨基酸有20种,因此,在只有4个碱基的情况下,1个碱基决定1种氨基酸,就只能编码4种氨基酸,显然不够产生20种氨基酸。如果是2个碱基决定1个氨基酸,也只能决定16种氨基酸(4的平方),显然还是不够。如果3个碱基组合在一起决定1个氨基酸,则有64种组合方式(4的三次方),因此,3个碱基的三联体可以满足对20种氨基酸编码,而且会产生多余的密码子。
后来,研究人员证明,每个特定的氨基酸确实是由1个或多个三联体密码决定的。DNA中的4种碱基密码A、G、C、T的互补原则是,A-T、T-A、C-G和G-C。在以DNA的一条链为模板合成与它互补的mRNA后,碱基互补配对原则在这条mRNA链上是A变为U,T变为A,C变为G,G变为C。所以,在mRNA上的碱基互补是A-U、U-A、C-G和G-C。
因此,mRNA上的遗传密码与原来模板DNA链是一样的,所不同的只是U代替了T。然后再由mRNA上的遗传密码翻译成多肽链中的氨基酸序列。
不过,现在研究人员发现,生物体中并非只有这4种遗传密码,它们有可能达到9个甚至更多。
第5和第6种遗传密码
在A、G、C和T(U)4种遗传密码之外,还存在第5和第6种遗传密码,它们就是5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC),它们都是通过对胞嘧啶碱基(C)的甲基化修饰而产生的。
5-甲基胞嘧啶是胞嘧啶受到甲基化之后,有一个甲基附着于5号碳上的形态,尽管分子结构有改变,但它与互补碱基的配对原则不变。在细菌体内,5-甲基胞嘧啶可见于各种不同的位置,可作为一种标记,保护DNA不受自身的甲基化敏感限制酶破坏。
在植物体内,5-甲基胞嘧啶出现于CpG岛(即碱基三联体中第一和最后一个分别是C和G,中间的碱基p是随机出现的A、T、C或G,CpG岛就是DNA序列中CpG形式的三联体占全部三联体的55%以上的序列)与CpNpG(C与G是碱基,p是磷酸根,N是任意的核苷酸)序列里。在真菌及动物中,5-甲基胞嘧啶主要存在于CpG岛中。
5-甲基胞嘧啶作为第5种遗传密码主要在控制基因表达方面具有重要作用,它能根据每个组织的需求来开启或关闭基因,因此,5-甲基胞嘧啶参与基因表达和调控、X染色体失活、基因组印记、转座子的长期沉默和癌症的发生。例如,研究证实5-甲基胞嘧啶可促进癌症等许多疾病的发生。
第6种遗传密码5-羟甲基胞嘧啶是研究人员于1952年在噬菌体DNA中首次发现的,它能被糖基转移酶介导糖基化修饰,从而使噬菌体基因组在进入宿主后能抵抗宿主限制酶的降解。
1972年又有研究人员在大鼠、小鼠和卵生动物牛蛙脑组织提取的DNA中发现了5-羟甲基胞嘧啶,约占DNA总胞嘧啶的15%。2009年,又有两个研究团队发现,在人、小鼠大脑及胚胎干细胞中有较多的5-羟甲基胞嘧啶。
5-羟甲基胞嘧啶是一种经过修饰的碱基,以低水平存在于哺***动物的多种细胞类型中。5-羟甲基胞嘧啶是TET蛋白通过氧化5-甲基胞嘧啶产生的。TET蛋白是生物体内存在的一种α-酮戊二酸(α-KG)和Fe2+依赖的双加氧酶,TET蛋白可以催化5-甲基胞嘧啶(5-mC),从而转化为5-羟甲基胞嘧啶(5-hmC)。
第6种遗传密码5-羟甲基胞嘧啶的作用直到最近才慢慢被发现。5-羟甲基胞嘧啶也能参与基因表达的调控和转录,同时还参与DNA甲基化过程。由于这种作用,对疾病的产生和防治有重要作用。例如,研究人员发现,5羟甲基胞嘧啶的形成与恶性血液肿瘤相关。因此,5-羟甲基胞嘧啶和5-甲基胞嘧啶都是未来研发抗癌药物的靶点。
此外,通过新研制的5-羟甲基胞嘧啶检测仪发现,5-羟甲基胞嘧啶在人体不同组织中有不同的丰度,在多种癌组织中5-羟甲基胞嘧啶水平显著下降,例如,在大肠癌组织中5-羟甲基胞嘧啶的丰度显著降低,尽管其中的机理还不太明了,但这意味着,5-羟甲基胞嘧啶至少可以成为一种预测癌症的因子,或许是一种癌症密码。
第7和第8种密码
随着研究的深入,研究人员又陆续发现了第7和第8种遗传密码,即5-胞嘧啶甲酰(5fC)和5-胞嘧啶羧基(5caC)。
2011年,美国北卡罗来纳州大学教堂山分校生物化学与生物物理学系的华裔科学家张毅等人在美国《科学》杂志称,他们在人体胚胎干细胞和实验老鼠器官染色体中发现了两种新型的DNA碱基5-胞嘧啶甲酰和5-胞嘧啶羧基。
这两种碱基实际上都是胞嘧啶被TET蛋白修饰后形成。前面提到,TET蛋白可以催化5-甲基胞嘧啶(第5种遗传密码)转化为5-羟甲基胞嘧啶(第6种遗传密码),说明TET蛋白可以创造一系列新的碱基,至少可以产生第6至第8种遗传密码。
TET蛋白是重新编程已经分化的细胞的一种重要功能蛋白,人类和小鼠都拥有TET蛋白,这种蛋白在DNA脱甲基过程和干细胞重新编程方面起到关键作用。
当然,研究人员对第7和第8种遗传密码还存在争议,但这两种新碱基的发现说明一个问题,它们代表了DNA脱甲基过程的一个中间状态。通过去甲基化或重新激活DNA甲基化所沉默的肿瘤抑制基因,它们可能为干细胞重新编程和癌症研究提供非常重要的信息。第7和第8种碱基的发现也说明,它们可能蕴藏着征服癌症的信息,研究人员可以利用DNA甲基化,重新激活已沉默的肿瘤抑制基因,抑制肿瘤。
从第5到第8种新的遗传密码,即新的碱基都是基于胞嘧啶的变种,本质上也许还是属于胞嘧啶。那么,有没有其他的不属于胞嘧啶的新遗传密码呢?现在似乎有了答案,这就是第9种遗传密码甲基腺嘌呤。
第9种遗传密码
西班牙巴塞罗那大学遗传学教授埃斯特勒等人最近在《细胞》杂志称,人和高等生物细胞内存在一种新的腺嘌呤变种甲基腺嘌呤(mA),并认为这是第9种遗传密码,这种甲基腺嘌呤也是表观基因组的重要组成因素,对于细胞功能至关重要。埃斯特勒认为,在细菌等低等生命的基因组中就存在甲基腺嘌呤,这种密码子能避免外来基因序列的插入,因此具有稳定基因的功能。
现在,研究人员认为,不仅藻类、线虫和果蝇都拥有甲基腺嘌呤,而且在包括人类在内的哺***动物中也同样拥有甲基腺嘌呤。第9种遗传密码的作用目前还不太清楚,但推测它能调节基因表达,在干细胞和胚胎早期发育阶段中能发挥特殊作用。
当然,遗传密码也许不止这9种,而且科学界最终是否承认除4种基本遗传密码外的第5至第9种遗传密码还有待时间检验。但是,随着研究的深入,也许会发现更多的遗传密码并阐明它们的功能。现在,包括中国研究人员在内的一些研究者也提出,可能存在第10种遗传密码。是否属实,需要更多研究来验证。
而且,如果从RNA的尿嘧啶(U)代替DNA的胸腺嘧啶(T)来看,基本遗传密码也应当是5种,即A、G、C、T和U。如果以此排序,后来发现的第5至第9种遗传密码就应当顺延为第6至第10种遗传密码。