|
来自:http://www.sciei.com/bbs/dispbbs ... p;ID=552&page=1
随着人类基因组计划不断深入,对于占人类基因组97%的非表达序列的研究也逐渐成为热点。在基因克隆和基因表达研究的过程中,返座假基因是我们经常碰到的问题。本文不仅对返座假基因的结构特征进行了小结,并且对返座假基因编码潜能、返座机理以及在进化过程中的作用进行了综述,并报道了该领域的研究成果及发展方向.科研中国SciEi.com.
随着人类基因组计划的进行,我们发现只有约3%的人类基因组是由外显子序列组成的,其余所谓“垃圾DNA”主要包括内含子、简单重复序列、移动元件(mobile element)及其遗留物。移动元件分为三大类:以DNA为基础的移动元件(DNA-based transposable element)、自主的返座子(autonomous retrotransposon)以及非自主的返座子(non-autonomous retrotransposon)。通常所说的假基因就属于一种非自主的返座子。
假基因(pseudogene)最初由Jacq等人[1]提出。他们在非洲爪蟾DNA中克隆了一个5SrRNA相关基因,比较其功能基因后发现,这个基因的5’端有16bp的缺失以及另外14bp的错配,就将这个截短的5SrRNA的同源物描述为假基因。随着大量不同家族的假基因的发现,假基因就被明确限定为与功能基因相关的、有缺陷的序列。
根据是否保留相应功能基因的间隔序列(如内含子),假基因分为两大类:一类保留了间隔序列(如珠蛋白假基因家族),另一类则缺少间隔序列。后一类假基因又称为处理后的假基因(processed pseudogene)或返座假基因(retropseudogene)。本文着重就返座假基因的结构特征、编码潜能、返座机理以及在进化过程中的作用进行综述。科研中国SciEi.com.
1 返座假基因的结构特征与定位
1.1 序列特征
对不同基因家族的返座假基因与其相应的功能基因的序列分析显示,返座假基因存在一些共同的特点。
1)大多数假基因本身存在多种遗传缺陷。这些遗传缺陷包括:a)阅读框中的无义突变;b)非3的整数倍的核苷酸的插入或缺失,导致阅读框的移码。但是到目前为止,至少有以下几个返座假基因无上述有害的遗传缺陷:人metallothioneinⅡ假基因[2, 3],人多肽链延伸因子EEF1A假基因[4], 大鼠RC9细胞色素C假基因[5],鼠L32核糖体蛋白的一个假基因rpL32-4A[6]等等。其中大鼠RC9细胞色素C假基因的编码区与其功能基因完全一致。
2)除了多种多样的遗传缺陷外,大多数返座假基因具有以下4个较鲜明的特征:a) 完全缺失存在于功能基因中的间隔序列,即内含子序列;b) 假基因的序列只与功能基因转录产物的起点和终点之间的序列相似,而与其5’端调控序列无关。但是鼠Ψα3-珠蛋白假基因[7],鼠促皮质素-β-脂蛋白前体假基因[8]、人免疫球蛋白ε及λΨ1假基因[9,10]是其中的例外;c) 假基因的3’末端紧接着有多聚腺嘌呤尾。以上3个特征明显提示这些序列是从成熟mRNA衍生而来,因此这类假基因又被称为处理后的假基因(图1)。d) 这类假基因的序列两端常被7~21bp的正向重复序列包围。这种正向重复序列也在snRNA假基因家族和AluⅠ家族中被发现,提示正向重复序列的产生可能是一种共同的插入机制的结果。
1.2 染色体定位
返座假基因与其功能基因在染色体上的排列并非是共线性的。返座假基因往往位于某些染色体的“断裂热点”(hot spot)处。
2 返座假基因的编码潜能
到目前为止,少数无致命突变而可能存在编码能力的返座假基因已作功能研究,如人metallothioneinⅡ假基因[2,3],鼠L32核糖体蛋白的一个假基因rpL32-4A[6]等等。人metallothioneinⅡ假基因5’端上游缺乏RNA聚合酶Ⅱ转录所需的各种元件,且在Hela细胞及鼠L细胞中未发现转录活性。鼠L32核糖体蛋白的一个假基因rpL32-4A的5’端上游-30bp位置上有“ATA”盒(RNA聚合酶Ⅱ转录所需元件之一),虽然其转录活性未经直接检测,但对其序列的甲基化程度研究显示,它可能不被转录。所以,返座假基因可能在其插入基因组时就失活了,即它们不能被RNA聚合酶Ⅱ转录而形成有活性的mRNA。考虑到返座假基因是随机插入到哺乳动物基因组中,能准确插入到一个RNA聚合酶Ⅱ启动子下游的可能性是很小的。在一些极罕见的例子中,即从mRNA上游启始的异常转录本(往往由RNA聚合酶Ⅲ转录)可能带有正常的启动子序列,从而能够产生一个有功能活性的返座基因(retrogene),如鼠前胰岛素原Ⅰ基因[14,15]。科研中国SciEi.com.
3 返座假基因的返座机理
对于许多已知的返座假基因,如肌管蛋白假基因、肌动蛋白假基因、葡萄糖-3-磷酸脱氢酶等等,它们的功能基因能够在非分化细胞(如生殖细胞和非分化的肿瘤细胞)中表达。这些返座假基因的长度和多聚腺嘌呤尾提示着它由RNA聚合酶Ⅱ转录而来。对于上面提到的异常转录本(如人免疫球蛋白ε及λΨ1假基因和鼠Ψα3-珠蛋白假基因),现在认为可能是由RNA聚合酶Ⅲ转录而来。
Mathias等[16]认为有自主返座能力的长散布重复序列 L1 产生的蛋白质能够作用于Alu转座子及细胞的mRNA(如返座假基因)并促进其返座。Luan等[17]在对昆虫非长末端重复元件(non-LTR element)R2BM的研究基础上,提出了目标引导反转录(target-primed reverse transcription, TPRT)的返座机制。尽管一些资料已证实这种机制,但所提出的返座途径的具体步骤仍存在未解决的问题。科研中国SciEi.com.
4 返座假基因的进化时间及作用
在进化年代上,所有的返座假基因都在哺乳动物辐射(mammalian radiation)之后出现[18],即返座假基因只存在于哺乳动物中。人DHFR Ψ1假基因在人群中甚至还有一定的多态性。
由于返座假基因对于物种本身没有提供什么明显的选择优势,因此曾被认为是一种“分子寄生物”(molecular parasite)。现在普遍认为,产生大量返座假基因的非病毒返座作用(retroposition)作为一种进化的主要动力,通过促进序列连续性的复制、散布和重组,保持着真核生物基因组的流动性(fluidity)。由于基因组的流动性保证了胞核和胞质这两个不同遗传区域的遗传信息的持续交换,通过遗传信息复制性散布产生大量新的序列组合的返座作用就能从很多不同的方面来塑造和重塑真核生物基因组。
假基因与内含子、卫星序列、转位因子等冗余DNA一样,是不受进化的负选择作用的。从这个意义上说,假基因是功能基因的“弃儿”。但正是这些看似无用的遗传变异为物种进化的正选择、负选择以及中性漂变提供了丰富的原材料,从而成为物种进化不可或缺的有用“工具”。
随着人类基因组计划的顺利实施,人们分离、鉴定新基因的速度越来越快,人类基因组3×109bp的全序列也将于下世纪初全部测序完成,对于占人类基因组97%的非表达序列的研究,即对包括返座假基因在内的所谓“垃圾DNA”的研究正逐步展开,它们在进化方面的作用已经得到肯定,其中对主移动元件(master mobile element)L1的研究已成为当今的一大研究“热点”。其实,早在1988年,移动元件L1就被证实与人类疾病有关。到目前为止,共发现8例导致人类疾病。Alu返座子的插入也与多种疾病有关。科研中国SciEi.com.
Mathias等[16]关于长散布重复序列(LINE)编码新型逆转录酶的发现,不仅向“非病毒性返座元都是被动返座”的传统观点提出了挑战,而且为证实物种起源的“RNA世界”学说以及揭示长散布重复序列与短散布重复序列(SINE)形成的相关性开启了大门。尽管我们现在具有的知识还不足以开发利用人类返座子,但L1仍有诱人的应用前景:它既可以作为ES细胞转染小鼠以及转基因小鼠精子的插入诱变剂,还可以作为基因的运输载体。当然,我们必须克服插入序列的截短以及L1插入位点的随机性等技术上的困难。对这些移动元件的复杂的生物学本质的进一步研究,不仅能够克服这些困难,拓展实际应用的空间,而且还能够对人类基因组本身以及复杂的进化起源和进化过程有一个更深刻的理解。 |
|