系统生物学——一生命科学的新领域

来源:岁月联盟 作者:徐强 王长亮 李胜 时间:2010-07-12

    [摘要] 20世纪生物学从宏观到微观进步巨大,传统的分析还原的研究方法受到质疑。在此背景下,系统生物学是继基因组学、蛋白质组学之后一门新兴的生物学交叉学科。从系统角度来进行生物学研究逐步成为生物学研究方法的主流。在研究上,了解一个复杂的生物系统需要整合实验和方法、基因组学和蛋白质组学中的高通量方法为系统生物学提供大量的数据,计算生物学通过数据处理、模型构建和理论分析,成为系统生物学发展的一个必不可缺的、强有力的工具,已经在诸多医学前沿领域的研究中成为重要研究方法而被广泛应用。本文旨在阐述系统生物学的发展现状及其应用前景,希望能对广大相关领域的读者有所价值。

  [关键词] 系统生物学;基因组学;蛋白质组学;计算生物学

  近代生物学研究主要是以分子生物学和细胞生物学研究为主。研究方法皆采用典型的还原论方法。目前为止,还原论的研究已经取得了大量的成就,在细胞甚至在分子层次对生物体都有了很具体的了解,但对生物体整体的行为却很难给出系统、圆满的解释。生物还停留在实验科学的阶段,没有形成一套完整的理论来描述生物体如何在整体上实现其功能行为,这实际上是还停留在牛顿力学思想体系的简单系统的研究阶段。但是生物体系统具有纷繁的复杂性[1,2]。尽管对一个复杂的生物系统来说,研究基因和蛋白质是非常重要的,而且它将是我们系统生物学的基础,但是仅仅这些尚不能充分揭示一个生物系统的全部信息。这种研究结果只限于解释生物系统的微观或局部现象,并不能解释系统整体整合功能的来源,不能充分揭示一个生物系统的信息,且忽略了系统中各个层面的交互、支持、整合等作用,限制了生物学研究的发展。在这种现状下,20世纪末人类基因组计划完成后,生物学领域的科学家都在考虑一个问题:未来生物学研究的方向在哪里?为此学术界也不乏辩论。得出的共识是:生物学的发展未来主要面对如下问题:(1)如何弄清楚单一生物反应,包括反应分子之间的关系、反应方式等;(2)如何研究生物反应网络之间的关系,包括量化生物学反应及生物反应网络;(3)如何利用计算机信息及生物工程技术进行生物反应,生物反应网络,乃至器官及生物体的重建。
  早在1969年,Bertalanfy LV就提出了一般系统理论(general systems theory),他在文章中指出生物体是一个开放系统,对其组成及生物学功能的深入研究最终需要借助于计算机和工程学等其他分支学科才能完成[3]。1999年,由Leroy Hood创立的系统生物学(systems biology)则是在以还原论为主流的现代生物学中反其道而行之,把这种以整体为研究对象的概念重新提出。他给系统生物学赋予了这样的定义,系统生物学(systems biology)是研究一个生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系的学科。换言之,以往的实验生物学仅关心基因和蛋白质的个案,而系统生物学则要研究所有的基因、所有的蛋白质、组分间的所有相互关系。显然,系统生物学是以整体性研究为特征的一种大科学,是生物学领域革命性的方法论。以胡德的观点,基因、蛋白质以及环境之间不同层次的交互作用共同架构了整个系统的完整功能。因此,用系统的方法来理解一个生物系统应当成为并正在成为生物学研究方法的主流。利用系统的方法对其进行解析,综合分析观察实验的数据来进行系统分析。具体通过建立一定的数学模型,并利用其对真实生物系统进行预测来验证模型的有效性,从而揭示出生物体系所蕴涵的奥秘,这正是生物学研究方法的关键所在。
  1 系统生物学的主要研究内容
  系统生物学主要研究实体系统(如生物个体、器官、组织和细胞)的建模与仿真、生化代谢途径的动态分析、各种信号转导途径的相互作用、基因调控网络以及疾病机制等[4,5]。
  系统生物学的首要任务是对系统状态和结构进行描述,即致力于对系统的分析与模式识别,包括对系统的元素与系统所处环境的定义,以及对系统元素之间的相互作用关系和环境与系统之间的相互作用的深入分析。具体如生物反应中反应成分之间的量的关系,空间位置,时间次序,反应成分之间的因果关系,特别是反馈调节和变量控制等有关整个反应体系的问题等。其次要对系统的演化进行动态分析,包括对系统的稳态特征、分岔行为、相图等的分析。掌握了系统的基本演化机制,使系统具有目标性和可操作性,使之按照我们所期望的方向演化,也有助于我们重新构建或修复系统,为组织工程学的组织设计提供指导。另外,系统科学对生物系统状态的描述是分层次的,对不同层次进行的描述可能是完全不同的;系统科学对系统演化机制的分析更强调整体与局部的关系,要分析子系统之间的作用如何形成系统整体的表现、功能,而且对系统整体的每一行为都要找出其与微观层次的联系。
  系统生物学的研究包括两方面的内容。首先是实验数据的取得,这主要包括提供生物数据的各种组学技术平台,其次是利用计算生物学建立生物模型。因此科学家把系统生物学分为“湿”的实验部分(实验室内的研究)和“干”的实验部分(计算机模拟和理论分析)。“湿”、“干”实验的完美整合才是真正的系统生物学。
  系统生物学的技术平台主要为各种组学研究。这些高通量的组学实验构成了系统生物学的技术平台。提供建立模型所需的数据,并辨识出系统的结构。其中包括基因组学、转录组学、蛋白质组学、代谢组学、相互作用组学和表型组学计算生物学通过建模和理论探索。可以为生物系统的阐明和定量预测提供强有力的基础。计算生物学包括数据开采和模拟分析。数据开采是从各实验平台产生的大量数据和信息中抽取隐含其内的并形成假说。模拟分析是用计算机验证所形成的假说,并对拟进行的体内、体外生物学实验进行预测,最终形成可用于各种生物学研究和预测的虚拟系统。计算生物学涉及一些新的数学原理和运算规则,需要物理和数学来研究生物学的最基本的原理,也需要计算科学、信息学、工程学等进行生物工程重建和生物信息传递的研究。
  2 系统生物学的研究思路及特点
  系统生物学识别目标生物系统中的各种因素,然后构架一个系统模型,在其中赋予这个生物系统能动性。在此模型中研究细胞、组织、器官和生物体整体水平,研究结构和功能各异的各种分子及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为。系统生物学最大的特点即整合。这里的整合主要包括三重含义。首先,把系统内不同性质的构成要素(DNA、mRNA、蛋白质、生物小分子等)整合在一起进行研究;其次,对于多细胞生物,系统生物学要实现从基因到细胞、到器官、到组织甚至是个体的各个层次的整合。第三,研究思路和方法的整合。经典的分子生物学研究是一种垂直型的研究,即采用多种手段研究个别的基因和蛋白质。而基因组学、蛋白质组学和其他各种“组学”则是水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种“三维”的研究[6]。
3 系统生物学的研究方法
  系统生物学最重要的研究手段是干涉(perturbation)。系统生物学的发展正是由于对生物系统的干扰手段不断进步促成的。干涉主要分为从上到下(top-down)或从下到上(bottom-up)两种。从上到下,即由外至里,主要指在系统内添加新的元素,观察系统变化。例如,在系统中增加一个新的分子以阻断某一反应通路。而从下到上,即由内到外,主要是改变系统内部结构的某些特征,从而改变整个系统,如利用基因敲除,改变在信号传导通路中起重要作用的蛋白质的转录和翻译水平[7]。

  目前国际上系统生物学的研究方法根据所使用研究工具的不同可分为两类:一类是实验性方法,一类是数学建模方法。实验性方法主要是通过进行控制性的反复实验来理解系统[8,9]。首先明确要研究的系统以及所关注的系统现象或功能,鉴别系统中的所有主要元素,如DNA、mRNA、蛋白质等,并收集所有可用的实验数据,建立一个描述性的初级模型(比如图形的),用以解释系统是如何通过这些元素及其之间的相互作用实现自身功能的。其次在控制其他条件不变的情况下,干扰系统中的某个元素,由此得到这种干扰情况下系统各种层次水平的一些数据,同时收集系统状态随时变化的数据,整合这些数据并与初级模型进行比较,对模型与实际之间的不符之处通过提出各种假设来进行解释,同时修正模型。再设计不同的干扰,重复上面的步骤,直到实验数据与模型相一致为止。
  数学建模[10,11]方法在根据系统内在机制对系统建立动力学模型,来定量描述系统各元素之间的相互作用,进而预测系统的动态演化结果。首先选定要研究的系统,确定描述系统状态的主要变量,以及系统内部和外部环境中所有影响这些变量的重要因素。然后深入分析这些因素与状态变量之间的因果关系,以及变量之间的相互作用方式,建立状态变量的动态演化模型。再利用数学工具对模型进行求解或者定性定量分析,充分挖掘数学模型所反映系统的动态演化性质,给出可能的演化结果,从而对系统行为进行预测。
  4 当代系统生物学研究热点
  基因表达、基因转换开关、信号转导途径,以及系统出现疾病的机制分析等四个方面是目前系统生物学研究的主要阵地。
  基因组医学(genomic medicine)是以人类基因组为基础的生命和临床医学的革命。生命科学和临床医学结合,将人类基因组研究成果转化应用到临床实践中,是后基因组时代最重要的研究方向之一。人类基因组计划从完成和多种疾病相关的基因研究发现,迅速进入到蛋白质组学、染色体组和人类疾病基因的研究,通过单基因或复杂多基因疾病的相关基因研究和疾病易感因素分析,达到揭示基因与疾病的关系之目的;遗传背景与环境因素综合作用对疾病发生的影响;为疾病的诊断、预防和、预后和风险预测提供依据。基因组医学将大大提高我们对健康和疾病状态的分子基础的认识,增强研制有效干预方法的能力。
  后基因组(post-genome)的交叉学科研究是目前生命科学研究的前沿。交叉学科是一个新的研究领域,范围非常广阔,如基因组、蛋白质组、转录组等等,从而出现许多新的交叉学科。
  细胞信号转导(signal transduction)的研究是当前细胞生命活动研究的重要课题。细胞信号转导蛋白质组学是功能蛋白质组学的重要组成部分。系统地研究多条信号转导通路中蛋白质及蛋白质间相互关系及其作用,细胞信号转导通路化,其作用模式、通路、功能机制、调控多样化,细胞信号转导结构、功能、途径的异常在癌症、心血管疾病、糖尿病和大多数疾病中起重要作用。对细胞信号转导机制的了解,已成为创新药物、防病治病的关键。细胞信号转导不是一门单一学科,而是多种学科,如细胞学、生物化学、生物物和药理学等多学科的交叉学科。
  5 现阶段系统生物学存在的问题
  目前的系统生物学研究还只是初步使用动力学建模方法来定量描述系统的动态演化行为,这种方法对简单巨系统是适用的,但是在运用到复杂适应性系统时就会表现出很多的局限性,有很多问题就不能解决。生物体系统的复杂程度超乎我们的想象,现阶段不宜研究整个生物体系统,可以从研究“小系统”(生物体中具有一定功能、相对独立的部分,将其看成一个“系统”)开始,当然如何正确地分析这个小系统本身也不是件易事。
  5.1现有技术水平的限制
  着眼于整体的系统生物学对技术、仪器的依赖性大大超过传统的分子生物学。高通量、大规模的基因组及蛋白质组等的发展都是建立于新技术、新仪器出现基础之上。就目前的技术水平来讲,距系统生物学所要求达到的理想水平还相差很远。由于技术发展的不均衡造成了系统中各个水平上的研究不均衡。基因组和基因表达方面的研究已经比较成熟,而在其他水平如蛋白质、小分子代谢物等的研究仍处于起步阶段。各种蛋白质在数量上的巨大差异是全面分析低丰度蛋白质的一大障碍。而低丰度蛋白往往是最重要的生物调节分子,如何加强对低丰度蛋白的高通量研究,将是对蛋白质组应用前景的重要保障。同样,如何研究系统内存在的非遗传性分子即细胞中存在的成百上千的独立的代谢底物及其他各种类型的大小分子,它们在基因表达、酶的构象形成等方面有着重要作用。建立适当的方法来系统检测这些分子的变化是系统生物学能否发展的关键。
  5.2分析水平的限制
  系统的复杂性决定了全面分析的复杂性。人类基因组计划的实施提供了庞大的信息资源,已让人眼花缭乱,而对于较核苷酸复杂得多的蛋白质及代谢物等的分析将是更大的挑战。如何系统而详尽地为公共数据库中的信息加上注解,对这些复杂数据进行储存和分析将成为系统生物学发展的瓶颈。

  []
  [1]Wang Kunren,Xue Shaobai,uu Huitu.Cell Biology[M].Beijing:Beijing Normal University Press,1998.
  [2]朱玉贤,李毅.分子生物学[M].北京:高等出版社,2001.
  [3]Dickson BJ, Moser EI.Neurobiology of behaviour[J].Curr Opin Neurobiol,2007,17(6):672-674.
  [4]Nottale L, Auffray C.Scale relativity theory and integrative systems biology:2 Macroscopic quantum-type mechanics[J].Prog Biophys Mol Biol,2008,97(1):115-157.
  [5]Rho S, You S, Kim Y, et al.From proteomics toward systems biology: integration of different types of proteomics data into network models[J].BMB Rep,2008,41(3):184-193.
  [6]吴家睿.系统生物学面面观[J].科学杂志,2002,54(6):26-28.
  [7]Sreenivasulu N, Graner A, Wobus U.Barley genomics: an overview[J].Int J Plant Genomics,2008,486258.
  [8]Price ND, Foltz G, Madan A,et al.Systems biology and cancer stem cells[J].J Cell Mol Med,2008,12(1):97-110.
  [9]Bonneau R, Reiss DJ, Shannon P,et al. The Inferelator: an algorithm for learning parsimonious regulatory networks from systems-biology data sets de novo[J].Genome Biol,2006,7(5):R36.
  [10]Ullah M, Wolkenhauer O.Family tree of Markov models in systems biology[J].IET Syst Biol,2007,1(4):247-254.
  [11]Wolkenhauer O.Mathematical modelling in the post-genome era: understanding genome expression and regulation——a system theoretic approach[J].Biosystems, 2002,65(1):1-18.