找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 614|回复: 0

生物信息学介绍

[复制链接]
发表于 2005-1-15 22:16:24 | 显示全部楼层 |阅读模式
一 什么是生物信息学
  生物信息学(bioinformatics)是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科。它通过对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目的。目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索。
  数以亿计的ACGT碱基序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?生物信息学就是把基因组DNA序列信息作为源头,破译隐藏在DNA序列中的遗传语言,找到代表蛋白质和RNA基因的编码区,特别是阐明非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;然后依据特定蛋白质功能进行必要的药物设计。

二 生物信息学的由来
  随着人类基因组计划的实施,通过基因组测序,蛋白质序列测定结构解析等实验,分子生物学家提供了大量的有关生物分子的原始数据。如何将实验室中得到的生物学信息转化为计算机能够处理的数字信息,是生物学的一个重要课题,需要利用现代计算机技术对这些原始数据进行收集、整理、管理以便于检索使用。生物信息学不仅仅是一门科学学科,它更是一种重要的研究开发工具。

三 生物信息学在人类基因组计划中的应用

近期任务

1. 新基因和新SNPs(单核苷酸多态性)的发现与鉴定
  人类基因组的工作草图即将完成,因此发现新基因就成了当务之急。使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段,可以说大部分新基因是靠理论方法预测出来的。比如啤酒酵母完整基因组(约1300万bp)所包含的6千多个基因,大约60%是通过信息分析得到的。当人类基因找到之后,自然要解决的问题是:不同人种间基因有什么差别;正常人和病人基因又有什么差别。\"这就是通常所说的SNPs(单核苷酸多态性)。构建SNPs及其相关数据库是基因组研究走向应用的重要步骤。1998年国际已开展了以EST为主发现新Spps的研究。在我国开展中华民族SNPs研究也是至关重要的。
2. 完整基因组的比较研究
  现在,生物信息学家不仅有大量的序列和基因而且有越来越多的完整基因组。有了这些资料人们就能对若干重大生物学问题进行分析,比如:研究生命是从哪里起源的?生命是如何进化的?遗传密码是如何起源的?估计最小独立生活的生物至少需要多少基因,这些基因是如何使它们活起来的?比如,鼠和人的基因组大小相似,都含有约三十亿碱基对,基因的数目也类似。可是鼠和人差异确如此之大,这是为什么?同样,有的科学家估计不同人种间基因组的差别仅为0.1%;人猿间差别约为1%。但他们表型间的差异十分显著。因此其表型差异不仅应从基因、DNA序列找原因,也应考虑到整个研究组、考虑染色体组织上的差异。总之,这些例子说明由完整基因组研究所导致的比较基因组学必将为基因组研究开辟新的领域。
3. 大规模基因功能表达谱的分析
  随着人类基因组测序逐渐接近完成,一些学者就提出如下的问题:即使我们已经获得了人的完整基因图谱,那我们对人的生命活动能说明到什么程度呢?于是他们提出了一系列由上述数据所不能说明的问题,例如:基因表达的产物是否出现与何时出现;基因表达产物的浓度是多少;是否存在翻译后的修饰过程,若存在是如何修饰的;基因敲除(knock-out)或基因过度表达的影响是什么;多基因的表现型如何等。概括这些问题,其实质应该是:我们虽然知道了基因,知道了核酸序列,但我们不知道它们是如何发挥功能的,或者说它们是如何按照特定的时间、空间进行基因表达的,表达量有多少。
  为了得到基因表达的功能谱,国际上在核酸和蛋白质两个层次上都发展了新技术。这就是在核酸层次上的DNA芯片技术和在蛋白质层次上的二维凝胶电泳和测序质谱技术,也称蛋白质组技术。
4. 生物大分子的结构模拟与药物设计
  随着人类基因组计划的执行,估计几年之内就可找到人类的8万到10万个基因,也就是发现它们的一级序列。然而要了解他们的功能、要找到这些蛋白质功能的分子基础,必须进一步知道它们的三维结构。与此同时,要设计药物也需要了解相应的蛋白质受体的三维结构。这是摆在科学家面前的紧迫任务。

远期任务

  生物信息学的远期任务是读懂人类基因组,发现人类遗传语言的根本规律。从而阐明若干生物学中的重大自然哲学问题,像生命的起源与进化等。这一研究的关键和核心是了解非编码区。

1. 非编码区信息结构分析
  近年来完整基因组的研究表明,在细菌这样的微生物中非编码区只占整个基因组序列的10%到 20%。而高等生物和人的基因组中非编码区都占到基因组序列的绝大部分。从生物进化的观点看来,随着生物体功能的完善和复杂化非编码区序列明显增加的趋势表明:这部分序列必定具有重要的生物功能。普遍的认识是,它们与基因在四维时空的表达调控有关。因此寻找这些区域的编码特征以及信息调节与表达规律是未来相当长时间内的热点课题。
  对人类基因组来说,迄今为止,人们真正掌握规律的只有DNA上的编码蛋白质的区域(基因),很多资料说明这部分序列只占基因组的3%到5%,也就是说,人类基因组中多达 95%到97%是非编码区。如何深人了解这些非编码区序列的功能是当前科学家们面临的一个真正的挑战。

2. 遗传密码起源和生物进化的研究
  自 1859年Darwin的物种起源发表以来,进化论成为对人类自然科学和自然哲学发展的最重大贡献之一。进化论研究的核心是描述生物进化的历史(系统进化树)和探索进化过程的机制。自本世纪中叶以来,随着分子生物学的不断发展,进化论的研究也进入了分子水平。当前分子进化的研究已是进化论研究的重要手段,并建立了一套依赖于核酸、蛋白质序列信息的理论方法。近年来,随着序列数据的大量增加,对序列差异和进化关系的争论也越来越激烈。不少的研究结果并不支持分子钟的假设。因为基于某一种分子序列所重构出的进化树,只能反映这种序列的系统发育关系,并不一定能代表物种之间真正的进化关系,即可能存在着基因树与物种树之间的差异。同时,对垂直进化和水平演化之间关系的讨论正逐渐引起人们的重视。当前的资料给了我们。一个更为复杂也更为丰满的进化模式,它启示我们要彻底了解进化的规律必须使用整个基因组的信息。相应地必须发展新的理论方法。

  总之,当前是生物信息学研究的一个有活力的新时代。不少科学家还说它是人类基因组研究的收获时代,它不仅将赋予人们各种基础研究的重要成果,也会带来巨大的经济效益和社会效益。在未来的几年中DNA序列数据将以意想不到的速度增长,这是一个难得的机会,我国应尽早利用这些数据就可能走在国际科学界的最前沿。
四 生物信息学的发展和前景
  生物信息学至今已有两大板块:一是基因组信息学;二是神经信息学(neuroinformatics)。
例如就疾病而言,生物信息学就是要系统地理解导致机体功能异常的生物机制并从而得出科学的治疗方案;就生物演化而言,生物信息学就是要系统地解释生物界演化的从微观分子水平到宏观形体功能水平的根本原则,从而使人类更好地认识自己在自然界中的地位,科学地认识和改造人类的未来。
(1) 理论研究。
(2) 软件的重用和说明。
(3) 集成数据库。公共数据库与因特网相连,为世界各地的科学家提供快速高效的服务,因而成为获取生物学数据的最佳媒介。目前,国际上著名的公共数据库有Genebank、EMBL、DDBJ、Swiss-Port、PIR、PDB等。
(4) 生物数据的质量监控。
(5) 加强生物学家和计算机科学家以及数学家之间的沟通
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-12-25 11:05 , Processed in 0.234662 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表