创建生物学反应计算机模型的两大难题及其解决方法

来源:岁月联盟 作者:莫简,解亚 时间:2010-07-12

【关键词】  机模型;生物学反应;自由基

  【关键词】 计算机模型;生物学反应;自由基

  0引言

  创建生物学反应的计算机模型是很有意义的. 例如,国外一个研究小组创建了一个包括近8000化学信号的介质和细胞凋亡模型,就被美国《》杂志评为2005年十大科学突破之一. 近两年来,我们也在创建一个能根据细胞或机体的反应而创作和显示各种生物学反应的反应机制图的计算机模型. 我们在研究中感到, 创建仅能创作和显示一种生物学反应的反应机制图的计算机模型并不难,而要创建能创作和显示各种生物学反应的反应机制图的计算机模型则困难较大.在这方面有两大难题必须解决;但是,通过反复研究,我们已找出了解决这两大难题的方法.

  1两大难题及其解决方法

  其一,将各种生物学反应的数据存储在同一数据库后,计算机虽能创作出很多反应机制图,但多数都是不符合实际的,或只能显示输入的原图,而不能进行创作. 例如,当我们将细胞的增殖与分化,凋亡与坏死,血管的扩张与收缩,机体的免疫与炎症等反应的数据都存储到同一个数据库,在达到329个数据时,如果要查阅内皮生长因子(EGF)对内皮细胞(EC)的作用及其机制,在键入“EGF”和“EC”作为关键词, 并键入“(contin )”表示“要求显示各种可能的反应结果”,计算机就立即创作出202个反应机制图. 但是,其中绝大多数都是不符合实际的;如关于EGF对EC的作用的反应结果有些竟是细胞凋亡,抑止呼吸,产生细胞因子,产生抗体,吞噬杀菌等等. 分析这些反应机制图可以看出,产生这种现象的主要原因,是由于细胞增殖及其他许多生物学反应都涉及superoxide自由基的作用;计算机在创作这些反应机制图的过程中,常常是在到达选用superoxide自由基的步骤时就步入歧途.

  在研究自由基在生物学反应中作用的基础上,我们曾提出一个新学说[1],这个学说认为,生物学反应常涉及两类介质(specific and general mediators)的作用,specific enzymes, transcription factors, cytokines and eicosanoids 等生物活性分子系生物学反应的specific mediator; 它们在体内常仅作用于特定的分子,二者之间只有具备钥匙和锁样的结构关系,才能反应,因此不需要外在因子来约束它们的反应,而super oxide和nitric oxide等自由基则系生物学反应的general mediator,它们都具有直接或通过生成OH等强氧化剂的途径而修饰各种生物分子的能力,因此它们在体内的作用不仅决定于其本身的结构而且还要受其他一些外在因子的约束,以免有关的反应出现紊乱现象. 按照这个学说,我们在构建数据库时,对这两类介质就应给以不同的处理,如为了使计算机能正确地选定这些介质;对specific mediator只要标明其名称就可以了;对general mediator,除要标明其名称外,还要说明约束其反应的因子,否则就会创作出很多不符合实际的反应机制图[2-5].

  当我们创建<能创作和显示各种生物学反应的反应机制图的计算机模型>时,在构建数据库和编写程序方面,都按照这个学说将生物学反应介质分为两类而进行不同的处理后,计算机就确实不再创作出不符合实际的反应机制图,但正常创作能力不受影响. 例如,在经过这样的改进后,再键入“EGF”和“EC”作为关键词,并键入“(contin )”表示“要求显示各种可能的反应结果”,由这329数据,就只创作出一个反应机制图,即内皮生长因子(EGF)引起内皮细胞(EC)增殖(proliferation)的反应机制图;但是,在分别键入“proliferation and differentiation,”“apoptosis and necrosis”及“antigen”等关键词后,计算机还能创作并显示16个关于细胞增殖与分化的反应机制图,47个关于细胞凋亡与坏死的反应机制图和248个关于免疫反应的反应机制图.

  其二,在建立数据库时必须查阅大量的,并从中摘录出所需要的内容,然后再将这些资料按照一定的要求进行编写,并将它们存入数据库,这必须花费大量的人力和时间. 为了克服这个困难,我们又编写了两个名为Ereader和Ecreator的新程序.

  Ereader是一个阅读器. 如果我们已拥有大量文献,只要将它们都存入专用的文献库;然后输入关键词,计算机就可立即从中摘取出全部含有此关键词的句子或段落. 例如,当我们将涉及自由基在生物体系中作用的数万篇文献存入了专用的文献库. 为了查阅有关细胞信号转导的内容,键入“signaling”作为其关键词,并选定阅读“全部”或“部分” 文献,摘取含有此关键词的“段落”或“句子”,计算机就立即从这数万篇文献中摘录出含有signaling的各个段落或各个句子,而不显示其他不需要的部分;同时,每一段落或每一个句子都附有文献.

  Ecreator是一个电子创作器. 对于用Ereader摘取出来的段落或句子,可再从中选出所需要的内容及其参考文献,将它们复制到Ecreator页面; 然后,再按照一定的格式行编写,并传送到数据库,计算机则可用这些数据创作生物学反应历程图或介质网络图.

  我们开发的EReader和Ecreator, 从它们的页面就可看出,对于建立数据库的五个步骤:收集文献->.存入文献库 ->阅读 ->编写 ->存入数据库,它们不仅可节省第3步和第4步的时间,同时,还可节省由第2步转入第3步,第3步转入第4步及由第4步转入第5步的时间.

  由于有了这两个工具,在创建数据库方面就可节省大量的人力和时间. 据估计,如果有10~15名具有一定外语水平和一定生物学或医学知识的人员参加,在1年的时间内就可建成一个含10万个以上数据的数据库和能显示各种生物学反应的反应机制图的计算机模型.

  2生物学反应计算机模型及其数据库的应用

  2.1创作生物学反应机制图只要将新的数据存入数据库,计算机就可将这些新输入的数据和库中原有的有关数据结合而创作出新的反应机制图[3-4]. 例如,通过实验,已知某试剂(agent_X)可引起癌细胞凋亡(apoptosis),并可引起线粒体(mitochondria)内细胞色素C(cytochrome _c)的释放. 只要将说明“Agent_X与Release of cytochrome C 关系”的数据输入数据库,再键入“Agent_X”和“Apoptosis”作为关键词,计算机就可创作出如下的反应机制图:
   
  Agent_X→Mitochondria → Release_of_cytochrome_C → Activation_of_caspase9 → Activation_of_caspase3 → Cleavage_of_PARP → DNA_fragmentation → Apoptosis(Death).

  2.2查阅生物学反应机制图如果要查阅一个生物学反应的反应机制,只要键入适当的关键词,计算机就立即显示其反应机制图. 例如,关于天然杀伤细胞(NK cell)在免疫反应中杀伤肿瘤细胞(tumor cell)的可能机制,只要键入“Tumor”, “NK”和“death”, 计算机就可立即显示如下的反应机制图.

  Tumor_cell_(X/A) → NK_cell_(A/G) → CD3zeta/gamm(NK_cell)FcgammaR111 → IgG →CD3zeta_and_gamma(NK)FcgammaR111IgG → AgFc(Tumor_cell) →CD3zeta/gamma(NK_cell)FcgammaR111/IgGAg/Fc(Tumor_cell) →Activated_NK_cell →TNFalpha_(G/A) Receptor(Tumor_cell) Activation_of_caspase8 Activation of caspase3Cleavage_of_PARP→ DNA_fragmentation →Apoptosis(Death).

  Tumor_cell_(X/A) → NK_cell_(A/G) → CD3zeta/gamm(NK_cell)FcgammaR111 → IgG→CD3zeta_and_gamma(NK)FcgammaR111IgG →AgFc(Tumor_cell) →CD3zeta/gamma (NK_cell)FcgammaR111/IgGAg/Fc(Tumor_cell) →Activated_NK_cell →Perfoxin_(G/D) → Tumor_cell_(D/E) → Lysis(Death).

  生物学反应的介质的整体非常复杂,非常庞大,很难用一个简图表示;但是,也很易用机查出其中两种介质的相互关系. 例如,在键入macrophage和neutrophil作为关键词,计算机就可立即显示一些如下的简图来表示这两种细胞在免疫反应中的相互关系:

  Macrophage_(A/G) → AntigenDNA_complex_(G/A) → Th1/Th2_balance→Th1_cell_(A/G)→ IL2_(G/A) → Th1_cell_(A/G) → IFNgamma_(G/A) → Monocyte/Macrophage_(A/G) →TNFalpha_(G/A) →Neutrophil_(A/A).

  Monocyte/Macrophage_(A/G) → Superoxide (ROS)_(G/A) → Dendritic_cell/APC_(+) → Th1/Th2_balance → Th1_cell_(A/G) → Lymphotoxin_(G/A) → Neutrophil_(A/A).

  创建能创作和显示各种生物学反应的反应机制图的计算机模型,对于生物学,生物化学,生,病理学,毒理学及药理学等领域的科研工作者和教师,特别是研究细胞信号转导的人员可能很有用. 在创建这样的计算机模型时,计算机常会出现创作出很多不符合实际的反应机制图的现象.

  我们的研究认为,只要根据生物学反应常涉及两类介质(general and specific mediators)的学说编写程序和存储数据;计算机就不会创作出很多不符合实际的反应机制图. 另外,为了构建数据库我们又开发了一个阅读器和一个电子创作器,从而可以大量节省构建数据库所需花费的人力和时间. 现在,我们建立的这种计算机模型已具雏形;虽然其数据库还有待输入大量的数据,但已可供广大研究人员使用,已可通过互联网输入数据和创作各种生物学反应机制图,并可利用它们查阅一些生物学反应的反应机制图和介质网络图(http://mojianxy.vicp.net/cgibin/test2006_249.cgi; http://mojianxy.vicp.net/re.htm服务器开放时间:周一至周五09:00-17:00).

  【】

  [1] Mo J. A novel theory: biological processes mostly involve two types of mediators, namely general and specific mediators Endogenous small radicals such as superoxide and nitric oxide may play a role of general mediator in biological processes [J]. Med Hypoth, 2005, 65:728-735.

  [2]  Torreilles J. Nitric oxide: one of the conserved and widespread signaling molecules[J]. FrontBiosci 2001, 6:D1161-72.

  [3]  Cannio R, Fiorentino G, Morana A, et al. Oxygen: friend or foe? Archaeal superoxide dismutases in the protection of intra and extracellular oxidative stress [J]. FrontBiosci, 2000, 5:D768-79.

  [4]  Droge W. Free radical in the physiological control of cell function[J]. Physiol Rev, 2002, 82(1):47-95.

  [5]  Moncada S, Palmer RM, Higgs EA. Nitric oxide: physiology, pathophysiology, and pharmacology [J]. Pharmacol Rev, 1991, 43(2): 109-42.