找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 422|回复: 0

[【学科前沿】] 通过寡核苷酸微矩阵进行测序和变异分析

[复制链接]
发表于 2007-7-5 15:09:59 | 显示全部楼层 |阅读模式
基于寡核苷酸的微矩阵(基因芯片)的杂交分析为探明基因组所有可能的突变和序列多样性提供了新的技术。它能实现快速、高效筛选。这里,我们例举了用基因芯片再测序和进行变异分析的基本实验原理、设计方法,以及提高芯片检测的灵敏度和特异性的方法。

人类基因组计划期望完成人类基因组相关序列的同时,揭示不同人群及个体DNA序列的多样性方面的研究也正迅速升温。对这些多样性进行确定和分类是决定基因位置和侯选基因的重要组成部分,也是确定疾病的易感性和抗病的遗传基础。这些序列多样性将在疾病、复杂的遗传模型以及外界环境作用的研究中作为遗传标记。一旦确定发生了突变,基于群体的遗传风险的估计和测试之上地大规模序列分析是必要的,传统的技术方法都不能满足快速、高效地大规模序列比较和突变分析。

基于微矩阵(芯片)技术的杂交分析是一种新兴的技术,有多种用途。两种常见的DNA应用芯片仅在用于点样的核苷酸长度不同:相对大的核苷酸(大于100个核苷酸)通常用于RNA表达分析;而那些短的核苷酸(寡核苷酸最多为25个核苷酸)除了应用于RNA分析以外,还用来进行序列分析。

大规模、基于杂交的序列分析的最初原理是:包括所有可能寡核苷酸(最典型的是8个核苷酸)联合排列的库与目标DNA进行杂交分析。理论上,应用这样的联合矩阵能得到所有可能的在目标DNA中存在的互补序列。但是,由于杂交不完全,以及对包含短的重复单元序列分析还存在很多困难,多个分离的重复八聚体引起的问题也使大规模测序的应用还没有报道。在相关方法中,从12个样品通过PCR扩增得到TP53的第5~第8个外显子片段被点到尼龙膜上,并分别用8192个互相不匹配的、 含7个碱基同位素标记寡核苷酸进行杂交。所有13个被确认的纯合体及杂合的突变体通过寡核苷酸探针与固定的靶基因杂交检测。尽管这种方法是有希望,但是否有必要分别进行上万次地杂交反应来评估每一个样品还值得探讨,大规模的诊断实验室比常规设置的实验室应用该方法更有意义。

大多数通过芯片进行序列分析是对特殊序列进行矩阵设计实现的。目前的文献很大部分关注于微矩阵(基因芯片)的生产,它是由Affymetrix公司在照相平版印刷的方法上发展起来的。虽然我们关注已发表的数据,但很多用基因芯片研究的策略还在调查中,主要是私人研究者的部分。部分技术,如基于光谱原理的大规模分析检测,在未来几年将扮演非常重要的角色。

原有特征序列多样性的筛选

最早报道通过寡核苷酸矩阵来检测已知基因组DNA序列多样性是在1989年。与6个HLA-DQA等位基因互补的探针,同时也是HBB(编码b-球蛋白)的突变体被点到尼龙膜上,并用探针引发用生物素标记的PCR产物。通过对每一特异的等位基因的探针引起的杂交信号的强弱,决定基因型——应用“反转点杂交”(reserve dot blot)的方法对相关的药物遗传学的简单系统来加以说明。改进的寡核苷酸矩阵的制造方法为估计更复杂的系统开辟了道路。1480个寡核苷酸探针的矩阵同照相平版方法进行原位合成,用来检测编码CFTR片段的37个已知突变体,包括所有可能的单核苷酸替换。在一项研究,10个基因组DNA样品通过测试样品和野生型样品特异荧光杂交信号成功地确定了基因型,样品所用的特异突变探针和野生型的样品有关。在另一项研究中,6个核苷酸组成的探针矩阵点到活化的表面,用来检测HBB中三种不同的突变体。

筛选所有可能的序列多样性

通常人体大多数高渗透性疾病基因有复杂的突变体,可能的例外的等位基因与正常的相关,但也可能与低渗透性疾病相关,反映了人类基因组等位基因的异质性。一个相关的例子是遗传性的乳癌和卵巢癌基因BRCA1,400多个突变体已被报道(突变体列于http://nhgri.nih.gov/Intramural_research/Lab_transfer/Bic/)。将杂合子所有可能的变化进行彻底序列比较和突变体分析的检测,可以得到序列多样性的结果。

这里我们关心的是应用两次杂交、依赖一种酶的芯片分析方法,用寡核苷酸芯片在所有可能的序列变化中筛选我们所感兴趣的序列。最早的方法基于严谨的杂交,应用与我们感兴趣的序列变化互补的探针来进行杂交,就象CFTR中所阐述的(参考文献21),测得这些探针和测试样本及参比样本的杂交信号的强弱。使用这些探针得到相对增加的信号意味着序列变化类似于传统的点杂交分析。第二次杂交分析杂交信号削弱,匹配的探针和野生型的序列完全互补方式,类似于比较基因组杂交研究。依赖酶的短序列方法分析引物延伸的反应,完全匹配的探针与我们感兴趣的靶标序列杂交。[将不标记样品杂交后的芯片上寡核苷酸探针的3’端用酶延伸作标记,使末端能掺入荧光的ddNTP的点产生不同的荧光,由此来判别序列。]

杂交信号增加的途径

信号增加的途径,允许所有可能的序列多样性的DNA片段进行部分扫描。用来判断长度为N的目标DNA双链的所有可能的单核苷酸碱基置换,需要设计包含有8*N个探针,探针的长度通常是20~25个核苷酸。在单链的特定位置出现的四个可能核苷酸互补的4*N个探针(分别称为“A”,“C”,“G”和“T” 探针)。探针的设计通常在靶标的中心部位的碱基,提供了杂交特异性最佳的识别位点。为了确定靶标双链所有的碱基缺失,需要有2*N个探针。但是,确定长度为N靶标双链所有可能的X个碱基的插入,需要2*(4x)*N个探针。如果要筛选长度为10kb的双链DNA靶标中所有可能的单核苷酸置换,需要80, 000个探针;筛选所有可能的1~5个碱基缺失还需要再加100,000个探针;而筛选所有1~5个碱基的插入需要27,280,000个探针。用分析普遍的联合文库的芯片来判断整个序列的变化可以缩短探针的长度,减少探针的数量,但付出的代价是提高探针的特异性和敏感性。虽然,目前在芯片的生产技术上有所改进,但搜索一个以上碱基插入通常没有实际的意义。

297bp的整个HIV-1蛋白酶基因编码序列,?用得到杂交信号的方法来筛选167个病毒单体所有单个核苷酸的变化。荧光标记的RNA碱基与包含有12,224核苷酸的两张芯片杂交。与单核苷酸置换的探针杂交的基本信号赋予核苷酸特性。分析114个样品33,858bp的HIV-1序列,结果显示98.26%的数据集有一致性。从生物物理的观点来看,在基因组DNA中筛选杂合子的变化,双脱氧测序和芯片测序有同等的功效。

杂交信号减少的途径

在信号减少的途径中,评价序列多样性是依赖于参试样本和野生型的参比靶标与完全匹配的寡核苷酸探针之间杂交信号削弱的相对量。从理想化的状态来说,纯合子的序列变化导致了与完全匹配探针之间的杂交信号会大幅度削弱,从而判断在某一片段附近序列发生了变化。由于杂合子序列的多样性,与杂交野生的靶标杂交信号的强度回减低50%,理论上将发现完全匹配的探针信号确定旁边的序列发生了变化。

削弱信号的分析适合用来于对任何序列的多样性进行实际筛选,。用这一方法,设计芯片确定两条目标链N个bp所有可能的序列变化,最少包含2*N的重叠的探针。例如,包含有11,000条寡核苷酸的芯片是筛选5.5kb的BRCA1所有可能的序列多样性所必需的。探针加倍(N个探针,核苷酸的长度为N)对检测序列多样性是有益的,可以把杂交信号波动的随机性降到最低。如果仅仅依赖于两个突变特异性的探针(每条链一个),产生的波动使信号增强的分析有所偏差。使用信号削弱途径,可以通过绘制测试样品和参比样品与完全匹配的探针杂交信号强度的比率的图,来体现序列的多样性。真正的杂交信号的损失可以通过信号峰清晰的宽度和高度的特征来体现。信号削弱分析的不足之处在于:突变体不易找出;序列变化的特性需由后续地对信号特征削弱的周围片段的双脱氧测序来得到。

该方法能应用国际标准的双色分析进一步改进。在这种设计中,已知序列的参比靶标可以和带待测的靶标的芯片共杂交。用不同的荧光团分别标记靶标,可以对两个靶标的杂交信号直接对比。应用两种颜色分析半合子(线粒体DNA)和杂合子(BRCA1)DNA大片段序列分析一有两篇报道。

类似地,研究10个样品整个16.6kb的人类线粒体基因组的突变需要使用两张芯片,包含135,000个探针。通过简单的信号增强分析,99%的基因组信号是正确的,平行进行的双脱氧测序也是这样的结果。更彻底地分析12个样品的2.5kb的线粒体序列,通过应用信号增强和削弱分析,180种多态性种可以检测到179种。该序列的2%,分散遍及在序列中大约50个碱基需要双脱氧序列分析进行明确的定位。尽管这是首次研究所有可能的序列多样性,还没有测验用该方法筛选杂合子碱基改变的途径。

对比增加和削弱信号分析方法,我们扫描了3.43kb的BRCA1外显子11个序列,搜索杂合子序列多样性。通过对两张芯片上96,000多条寡核苷酸用信号增加的方法,可直接确定所有的单核苷酸置换,单个碱基插入和1~5个碱基缺失。对信号增加、削弱同时进行估计,导致分析突变两级算法的发展,检测到15个杂合子突变中14个杂合子突变,它们分散地遍及外显子。单个核苷酸字换通常比断定插入和缺失产生出更强的信号削减特征。在重复序列中插入的突变不能检测到,如在7个多聚A的位置再加入一个A的突变。我们还发现对靶基因双链进行数据分析是必要的,有些序列变化一条链比另一条链更容易检测到。信号削弱的分析方法比信号增强的分析方法灵敏度和特异性都更高。由于野生型的靶标和探针之间的交叉杂交增强了,信号增强的分析方法对几个碱基的缺失和单碱基的插入(相对单碱基的置换而言)不敏感。另外,当使用与突变特异的探针来确定特定区域的序列变化时要分外小心。如果靶标序列有单碱基缺失,类似的序列也会引起单碱基置换探针的交叉杂交。识别错序列的变化会戏剧性地改变生物影响的评估,根据已知的杂交模式,对普通的的序列多样性进行测定弄错的可能性很小。请牢记这一点:信号增强的分析方法通常在信号削弱方法效果有疑问时使用,作为补充的方法。

最近我们实验室的研究集中于用所有可能的杂合子序列变化筛选编码BRCA1的整个序列,我们使用的是由Affmetrix提供的高密度寡核苷酸矩阵。我们做了代表所有22个BRCA1编码的外显子的测试样本和参比样本的两个颜色共杂交实验。我们联合使用了杂交信号增强和削弱的方法对BRCA1的第11号外显子进行分析。用已知的ARM和BRCA1的突变体样品进行初步分析表明:90%以上的突变体在该体系下用聚核苷酸芯片检测是敏感的。

聚核苷酸矩阵在人类基因组的单核苷酸多态性的研究中,被用来大规模地确定基因类型。我们设计了149张芯片,每一张芯片包含了15万~30万个寡聚核苷酸。我们总共筛选了2300万碱基的人类序列,通过信号增强和削弱的分析,发现了3241个侯选的SNP,没有使用双色共杂交的方法。另一张单独的芯片只包含简单的覆瓦序列,对靶标双链等位基因的SNP进行打分,同时检测500种标记的基因型。用矩阵技术,包含碱基替换的SNP比插入、缺失更容易检测到,因为SNP的筛选还不能完全作到没有遗漏。

没有内部双色杂交标准的杂交信号削弱分析中,所有完全匹配的探针杂交信号和靶标的浓度呈线形的关系是比较困难的。尽管预先选定序列的探针在RNA定量表达的实验中是忠实的,我们还没有发现覆瓦通过整个BRCA1基因的完全匹配探针必须要忠实的。信号削弱分析中杂交信号的加强,诸如经常发生那些单核苷酸替换,可以用没有内部标准的单色方法检测。然而,在我们的体系中,较多缺失和插入突变体强信号的减弱没有共杂交的内部标准就不能检测。值得注意的是平缓的基线率的数值对杂合子突变的筛选运用是必要的,这方面在双色共杂交实验中有应用。

基于微序列的分析

微序列分析微所有可能的序列多样性提供了强有力的筛选工具。它们用酶的引物延伸反应加倍靶标杂交。寡聚核苷酸典型范围通过5’端的表面连接,暴露了自由的3’端OH,或替代单片缩影胶片。有标签的双脱氧核苷三磷酸用在引物延伸反应,杂交靶标和核苷酸探针分别用来做模板和引物。所有四种脱氧核苷三磷酸,每一种标记上不同的荧光染料,被用在引物延伸的反应中。脱氧核苷酸的延伸由荧光的微拷贝数来决定,还用来决定每个探针3’端的延伸。类似于信号削弱方法,设计微序列矩阵来确定Nbp的靶标两条链中所有可能的序列变化,最少包含2*N个重叠探针。杂合子的单核苷酸替换将产生和两个等位基因相关的2个信号。尽管靶标插入和缺失的种类不能完全被测定,他们的终点仍能被确定。到目前为止,用该法分析所有可能的序列变化中最复杂的是33个bp的TP53核苷酸片段。

为了在更复杂的系统中测试微序列方法,必须有正确表面连接的高密度核苷酸矩阵。商业化的Affymetrix矩阵不适合这样的任务,因为他们的寡核苷酸通过3’端和表面粘连。使用照相平版生产的其它类型芯片需要化学修饰。其它过程,诸如喷墨墨水和点样技术可以被使用。

未来的挑战

用芯片进行突变分析的最强大功能是检测我们所感兴趣的特定序列的变化。一旦特殊的杂交模式或大量的突变体等位基因的信号已知的话,对很多不同的样品同时寻找这些信号是可以做到的。对所有的序列变化进行筛选是有一定难度的。类似于其它突变筛选的程序,芯片系统在检测纯合子的变化有更高的灵敏度,但在应用上有量的限制。

应用寡聚核苷酸微矩阵来筛选突变体是可行的,但准确性还需进一步提高。与几乎所有的突变体筛选技术相类似,在复杂的常染色体序列中,芯片方法还不适宜应用于检测98%以上的杂合突变体。在允许适度假阴性(5%~10%)的情况下, 诸如在不必得到详尽的单核苷酸多态性标记时对多态性进行筛选,或是对一些群体的遗传性进行研究,而研究者并不需要得到个体的基因型,在这些情况下目前的方法比较适用。用杂交进行突变体分析时,最大的挑战是减少假阴性率。靶标核苷酸序列组成的多样性,包括重复序列单元的存在,都会极大地影响用杂交方法进行序列分析的灵敏度。对任两个序列用同一实验方法进行分析会产生精确度相差很大的结果。例如,用基因芯片对基因重复三次的疾病的基因型进行分析是不合理的,如Hunting疾病基因,弄清串联重复单元在序列中插入的位置,基于凝胶分析的简单系统是当前所需要的。

靶标或探针分子内或分子间存在诸如发夹结构或G-四集体(quartets),都会影响靶标的杂交结果. 变异序列的二级结构被破坏,比包含有二级结构的野生型序列对探针的匹配更有吸引力。因此,根据二级结构引起的微弱的杂交信号来判断所有靶标的序列是不太可能的。插入或缺失的序列变异使靶标在与野生型探针匹配时形成双链,包含有凸出核苷酸的序列。在同聚核苷酸序列等重复序列中,凸出的双链结构更倾向于形成包含中心区(centrally-placed)单碱基对不匹配。由于这些因素,用杂交方法检测插入或缺失比确定单核苷酸替代更有挑战。

影响几乎所有突变体检测方案的一些专门问题也同样存在于矩阵分析技术中。基于PCR的所有分析都可能在一个靶标中存在同源序列,使引物结合位点的是非特异的。在一个标记群体中检测存在的序列变化还存在着另一特殊问题。这可能在分析肿瘤DNA样品或微量菌种时会存在。在这些例子中,提高靶标制备是必须的,如使用激光捕获微解剖技术。

在所有排列探针中产生规格化的杂交信号,会增加一次判断序列的多样性。例如,虽然应用了包含四甲基铵氯化物的缓冲体系,同时分析高G/C含量或高A/T含量的局部区域的序列还是特别困难。未达最佳标准的杂交条件使富含A/T的地稳定双螺旋区杂交信号充分,而富含G/C的高稳定区域信号会引起错误的判断。化学修饰的寡核苷酸将被运用。一个相关的例子是核酸蛋白多肽矩阵的发展,增加了杂交的灵敏度和多态性。而且,RNA靶标中的尿苷三磷酸混合修饰在BRCA1分析中被证明是有效的,其它三磷酸修饰也有有益的影响。通过使用高能的有最佳光谱特性的迁移染料和酶的滚环复制分析,可以对杂交信号进行放大。改进的综合方案不仅提高了质量,也使每一矩阵的寡核苷酸数增加,从而增加分析的稳定性。生产的芯片的排列及杂交结果的可重复性是关键的。规范杂交信号的成熟的方法涉及结合电泳技术的杂交。靶标和特定探针的亲和力将随着特定探针结核位点的带电区而改变。

为了增加芯片杂交的特异性还用到了其它一些原理。其一是在杂交系统中联合运用酶联反应,使双链末端错配的不稳定影响最大化。另一建议包括用未标记的靶标和寡聚核苷酸序列矩阵杂交,其后再用系列荧光标记的5碱基的寡聚核苷酸和稳定的双链发生杂交。 在这种“临近累计杂交”(contiguous stacking hybridization)方法中,序列信息来自短核苷酸本身,它与靶标-探针复合物杂交。该方法必须在更复杂的系统中加以应用,其实际的效用才能得到评估。

尽管基于杂交的序列分析方法还面临着一些技术难题,但仍有乐观的空间。在突变体的分析中,该方法存在着前所未有的高通量、高准确度,极有潜力。双脱氧测序方法逐步发展成为高通量的测序工具,经历了10多年的时间,而基于杂交的序列分析方法还处于婴儿期。我们确信它会进一步发展,成为准确的、高通量的重新测序和突变分析的强有力分析工具。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-10-8 08:24 , Processed in 0.143800 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表