亚洲带绦虫烯醇酶基因及其蛋白质的结构与功能
【摘要】 分析和预测亚洲带绦虫烯醇酶基因及其编码蛋白的结构和特性,用于指导其生物学功能的实验研究。【方法】 利用美国国家生物技术信息中心和瑞士生物信息学研究所的蛋白分析专家系统中有关基因和蛋白的序列和结构信息分析的各种工具,结合其他生物信息学分析软件包,如Pcgene和Vector NTI suite, 从亚洲带绦虫全长cDNA质粒文库中识别烯醇酶基因及其编码区,分析、预测该基因编码的蛋白质的理化特性、翻译后的修饰位点、功能域、亚细胞定位、拓扑结构、二级结构、三维空间构象等。【结果】 该基因全长1737 bp,编码区为第205~1503 bp,编码433个氨基酸,为全长基因。GenBank中与棘口吸虫烯醇酶氨基酸序列同源性最高,达78%。相对分子量理论预测值为46653.5 Ku。没有质体、线粒体定位序列。预测编码蛋白有1个跨膜区,3个亲水性部位。与吸虫属的烯醇酶进化关系最近。 【结论】 应用生物信息方法从亚洲带绦虫成虫cDNA文库中筛选出了亚洲带绦虫烯醇酶cDNA全长序列并预测得到其结构与功能方面信息。
【关键词】 亚洲带绦虫 烯醇酶 结构 能 生物信息学
Abstract: 【Objective】 To get the messages on the structures and characteristics of enolase from Taenia asiatica(T.a.ENO) by bioinformatics. 【Methods】 A full-length cDNA sequence encoding enolase from cDNA plasmid library of Taenia asiatica was identified by using tools of bioinformatics at webs sites of NCBI. The characteristics of the deduced protein including the physico-chemical characteristics, modification sites after translation, domains, subcelluar location, topological structure, secondary structures, and 3D structure were predicted by employing bioinformatics software package supplied by the website of ExPaSy. 【Results】 The full cDNA sequence encoding T.a.ENO includes a complete open reading frame of 1299bp which encoded a putative protein of 433 amino acids. The coding region is 205 bp ~ 1503 bp. The amino acids sequence has a high identity with enolase from other species in GenBank. The protein has one transmembrane region and stable physico-chemical characteristics. The molecular weight of T.a.ENO is predicted to be 46653.5u. The protein has three hydrophilic regions. The relationship of phylogenesis between T.a.ENO and enolase of other trematodes is close. 【Conclusion】 The cDNA sequence encoding enolase was screened from cDNA library of adult Taenia asiatica by bioinformatics. The structure and characteristics of the gene and protein of T.a.ENO were obtained.
Key words:Taenia asiatica; Enolase; structure; function;bioinformatics
亚洲带绦虫(Taenia asiatica,T.a.)广泛分布于东南亚,包括我国西南地区及, 韩国、泰国、印尼和菲律宾等地[1-3]。人们通过食生或半生含有亚洲带绦虫囊尾蚴的猪、或野猪的内脏, 特别是肝脏而感染,对劳动生产力和畜产品破坏极大。亚洲带绦虫成虫形态与牛带绦虫成虫相似,但其幼虫却与猪带绦虫的囊尾蚴相似。亚洲带绦虫成虫与牛带绦虫成虫的形态极为相似,人们长期以来把亚洲带绦虫误认为是牛带绦虫。上世纪80年代以来人们对其形态学、流行分布、中间宿主及实验动物感染、遗传学进行了研究,但大部分工作仍局限在细胞水平[4]。本课题组构建了亚洲带绦虫成虫的cDNA质粒文库,获得了大量的Unigene,在这些工作的基础上开展了对亚洲带绦虫基因组及蛋白质组学的研究,以期从分子水平寻求3种带绦虫的起源、演化和彼此间的亲缘关系及宿主选择性的形成等问题的答案。本文分析的烯醇酶(enolase, ENO)是进行这方面研究中感兴趣的分子之一。
1 材料与方法
1.1 材 料
亚洲带绦虫成虫全长cDNA质粒文库, 由上海联合基因公司构建。大规模测序得到多个表达序列标签(EST),Washington University BLAST(WU-BLASTX)方法归并EST获得UniGene[5], 由本课题组与该公司合作完成。编码亚洲带绦虫烯醇酶(T.a.ENO)基因的文库质粒编号为HC1-G6。其他寄生虫及其他物种的ENO氨基酸序列源自GenBank(http://www.ncbi.nlm.nih.gov/Genbank/index.html):肝片形吸虫烯醇酶基因(Fasciola hepatica ENO,登录号AAA57450),棘口吸虫烯醇酶基因(Echinostoma caproni ENO,登录号ABI26619),秀丽隐杆线虫烯醇酶基因(Caenorhabditis elegans ENO,登录号CAH10783),布氏锥虫烯醇酶基因(Trypanosoma brucei ENO,登录号EAN77714),人烯醇酶基因(Homo sapiens ENO1,登录号AAY43128;Homo sapiens ENO2,登录号AAH02745;Homo sapiens ENO3 登录号AH17249),褐鼠(Rattus norvegicus ENO 登录号AAH83566), 牛烯醇酶基因(Bos taurus ENO 登录号AAI02989),野猪烯醇酶基因(Sus scrofa ENO 登录号ABC75829)。
1.2 方 法
1.2.1 T.a.ENO基因的识别
通过美国国家生物技术信息中心(National Center for Biotechnology Information, NCBI, http://www.ncbi.nlm.nih.gov/)网站的基本局部比对搜索工具(basic local alignment search tool,BlastX,http://www.ncbi.nlm.nih.gov/BLAST/)程序[6],将文库质粒编号为HC1-G6的插入序列与GenBank中的序列进行比对,分析该基因的翻译序列与其他蛋白质氨基酸序列的一致性、判断其是否为全长基因。利用rpsblast分析其保守功能域。
1.2.2 T.a.ENO核酸和氨基酸序列分析
综合性蛋白核酸分析工具包(vector NTI suite)中的ORF Finder确定其完整的编码序列(complete coding sequence,cds),然后用Translation程序推导并输出氨基酸序列。AlignX对T.a.ENO与GenBank中其他物种的同源蛋白氨基酸序列进行比对分析,构建分子进化树。
1.2.3 T.a.ENO蛋白理化性质及结构分析
通过瑞士生物信息学研究所的蛋白分析专家系统(Expert Protein Analysis Systerm,ExPASy, http://ca.expasy.org/)所提供的蛋白组学和序列分析工具, 对目的基因及其产物进行生物信息学分析。 预测T.a.ENO的理化性质,如分子量、等电点、氨基酸组成、摩尔消光系数、重组产物在细菌、酵母和哺乳动物细胞中的半衰期、在溶液中的稳定性等。预测T.a.ENO一级结构中糖基化、脂酰化、磷酸化、硫酸化等修饰位点、亚细胞定位。预测氨基酸序列的跨膜区和拓扑结构以及二级结构、分子的亲水性、溶液中的分子形态等, 通过二级结构比对和折叠,对蛋白质的空间构象建模。
1.2.4 T.a.ENO的亲水性分析
Pcgene软件分析绘制氨基酸亲水性分布图,确定强亲水性的线性表位位置。
2 结 果
2.1 文库质粒编号为HC1-G6插入序列的Blastx分析
该基因是烯醇酶的同源基因,与GenBank中棘口吸虫(Echinostomatidae caproni)的烯醇酶同源性高达78%。该克隆基因的5'端序列长于棘口吸虫烯醇酶的完整编码序列,所以该基因应该是亚洲带绦虫烯醇酶的全长基因序列,其最大的ORF就是其完整的编码区(图1)。用rpsblast分析发现有完整的烯醇酶的保守结构域(图2)。
2.2 T.a.ENO蛋白质的理化性质
T.a.ENO的相对分子量理论值和等电点分别为46 653.5和6.77。含有5个半胱氨酸,预测这5个半胱氨酸之间形成二硫键的可能性较小,该蛋白在水溶液中280 nm处的摩尔消光系数为33 140 mol·L-1·cm-1;蛋白浓度为1 g/L时,半胱氨酸未形成二硫键时吸光系数(Abs)为 0.708。若其成熟肽N端为蛋氨酸时,在哺乳动物网状红细胞体外表达的半衰期为30 h, 在酵母和大肠埃希菌中表达的半衰期分别大于20 h和10 h。在溶液中的不稳定指数为32.33, 在溶液中性质稳定。疏水指数为89.47, 疏水性较高。
2.3 T.a.ENO翻译后修饰、亚细胞定位的预测
用Motif scanning(Motifscan)分析T.a.ENO特定位点结果显示,T.a.ENO含有6个潜在的酪蛋白激酶Ⅱ(CK2)磷酸化位点, 5个潜在的蛋白激酶C(PKC)磷酸化位点,2个酪氨酸激酶磷酸化位点,10个潜在的N-肉豆蔻酰位点, 1个潜在的天冬氨酸糖基化位点。T.a.ENO没有分泌信号肽序列和质体以及线粒体定位序列。
2.4 T.a.ENO的拓扑结构、二级结构和亲水性特征
用Predict protein预测结果如图3所示。Htm预测该蛋白是一个膜蛋白,有1个跨膜区(M),N端位于膜内(i),C端位于膜外(o)。Sec预测α螺旋(H)、β折叠(E)和无规卷曲(空白部分)的比例分别是40.42 ∶ 21.15 ∶ 38.43。
2.5 T.a.ENO的亲水性分析
利用 Pcgene软件包预测T.a.ENO氨基酸的亲水性分布(图4)。推导其线性抗原决定簇的位置分别是:①Ah = 2.03 From 50 to 55:Arg-Asp-Gly-Asp-Lys-Asn;②Ah = 1.73 From 86 to 92: Asp-Gln-Glu-Lys-Ile-Asp-Glu;③Ah = 1.48 From 373 to 380:Arg-Ser-Gly-Glu-Thr-Glu-Asp-Ser(Ah,average hydrophilicity,平均亲水性)。
根据拓扑图,其中①和②序列位于膜内,③序列位于膜外,是另一个高亲水性的线性表位。该序列位于膜外区域,而且③的序列是ENO蛋白质特征指纹序列。
2.6 T.a.ENO的三维结构图和酶关键氨基酸的位置
利用同源建模法服务器(SWISS-MODEL)将T.a.ENO 与蛋白结构数据库中的蛋白质三维结构进行匹配,输回模拟的T.a.ENO三维结构图,文件在综合性蛋白核酸分析工具包中打开该蛋白质结构文件,将构成酶活性中心的关键氨基酸标示在结构图上:ENO的关键氨基酸分别为第211位的谷氨酸(Glu211)、第343位的赖氨酸(Lys343)、和第371位的组氨酸(His371)[7],它们在空间位置上十分靠近,并且 His 371 出现在ENO的蛋白指纹区域[8](图5)。
2.7 T.a.ENO与其他物种ENO的比较和分子进化树的构建
应用vector NTI suite软件邻位相连法(neighbour joining 法)对 9 个物种11个ENO的氨基酸序列构建分子进化树(图6)。结果显示在这9个物种中T.a.ENO与吸虫属的ENO的进化关系最近。这几个物种ENO的关键氨基酸都处在相对保守的区域中。在与人的3个型别的ENO比对中,T.a.ENO与ENO3的同源性高达74.7%,与ENO1、ENO2同源性为74.3%(图6),这与BlastX分析的结果是一致的。
3 讨 论
生物信息学可以通过对已有的核酸和蛋白质序列数据库进行扫描和比对,搜索目标序列特殊的结构特征(如各种亚细胞的定位信号、翻译后的修饰位点、功能域等),对基因的功能进行初步的理论预测,为其功能研究寻找线索。生物信息学对基因的编码区、限制性酶识别位点、编码的蛋白质的理化性质(包括等电点、分子量、半衰期、稳定性、疏水性等)的分析,有助于采取合理的克隆和表达策略,选用适合的表达载体,提高目的蛋白高效的可溶性表达的可能性,获得有活性的重组蛋白[5]。
本文分析亚洲带绦虫烯醇酶基因,在GenBank中有其同源序列,经多个生物信息学分析软件预测,该基因与其他物种的烯醇酶编码基因同源性较高,具有烯醇酶的特征氨基酸序列和保守功能域。基于这个分析结果,作者认为可以在以后的实验中验证其是否具有催化2-磷酸甘油酸与磷酸烯醇式丙酮酸间转化的活性、是否具有烯醇酶的其他已被确定的特点,从而确定其是否为亚洲带绦虫的烯醇酶编码基因。
在进行验证性的工作时,生物信息学分析获得的结果(如:烯醇酶的分子量、等电点、在溶液中的稳定性、在不同系统或细胞中的半衰期等)可以帮助我们更好地进行实验,避免实验的盲目性。
烯醇酶是糖酵解途径中催化2-磷酸甘油酸与磷酸烯醇式丙酮酸之间进行转化的酶,是一个比较保守的蛋白,对它的分析可以提供一些亚洲带绦虫进化的信息。但由于目前GenBank中还没有猪带绦虫、牛带绦虫及其他绦虫的烯醇酶氨基酸序列,所以在本文中仅将T.a.ENO氨基酸序列与可以作为亚洲带绦虫的宿主的人、猪、牛、鼠,以及其他寄生虫的烯醇酶进行了比对、构建了进化树。这个比对结果虽然不能判断T.a.ENO与猪带绦虫、牛带绦虫或其他绦虫的进化关系,但是如果把T.a.ENO作为药物靶点, 或者从其中寻找表位来研制疫苗, 则必需考虑它与宿主烯醇酶氨基酸的同源性,要选取T.a.ENO与宿主有差别、但又比较关键的序列来进行实验研究。
另外,对T.a.ENO拓扑结构的预测显示,T.a.ENO是一个膜蛋白,没有质体及线粒体的定位序列,很多研究发现烯醇酶定位于细菌、真菌、原虫[9]、蠕虫[10]的表面,也可通过免疫定位来确定T.a.ENO是否位于亚洲带绦虫的表膜, 从而进一步研究其在致病及免疫方面的作用。
绦虫生理代谢所需的能量来自糖酵解,虽然烯醇酶不是糖酵解途径的关键酶,但它是一种多功能蛋白,是一个嗜神经因子。它能与细胞骨架蛋白和多聚核苷酸结合、还具有热休克蛋白的功能[11-13]。此外,它还是纤溶酶原及层粘连蛋白的受体[14],在寄生虫侵袭宿主组织过程中发挥作用[9],它在感染和免疫中还作为抗体作用的靶分子[15]。利用生物信息学方法分析得到的结果将有助于全面了解T.a.ENO的功能。
【】
Fan PC, Lin CY, Kosman ML, et al. Experimental infection of Indonesia Taenia (Somosir strain) in domestic animals [J]. Int J Parasitol, 1989,19(7):809-812.
Fan PC, Chung WC, Lin CY, et al. Experimental infection of Thailand Taenia (Chiengma strain) in domestic animals [J]. Int J Parasitol, 1990, 20(1):121-123.
Fan PC, Lin CY, Chung WC, et al. Experimental infevtion of philippine Taenia in domestic animals [J]. Int J Parasitol, 1992, 22(2):235-238.
王正蓉. 亚洲牛带绦虫分类学研究进展[J].贵阳医学院学报,2001,26(1):43-45.
黄 江,胡旭初,包怀恩,等. 亚洲带绦虫成虫全长cDNA质粒文库的构建及EST测序[J]. 热带医学杂志, 2007,7(2):116-118.
吴忠道,余新炳,徐 劲,等.日本血吸虫(大陆株)成虫基因表达谱的研究[J].中山医科大学学报, 2002,23(6):401-404.
Zhang E, Brewer JM, Minor W, et al. Mechanism of enolase: the crystal structure of asymmetric dimer enolase-2-phospho-D-glycerate/enolase-phosphoenolpy-ruvate at 2.0 A resolution [J]. Biochemistry, 1997, 36(41):12526-12534.
Babitt PC, Hasson MS, Wedekind JE, et al. The enolase superfamily: a general strategy for enzyme-catalyzed abstraction of the a-protons of carboxylic acids [J]. Biochemistry, 1996, 35(51):16401-16489.
Pancholi V. Multifunctional alpha-enolase: its role in diseases [J]. Cell Mol Life Sci, 2001, 58(7):902-920.
Jolodar A, Fischer P, Bergmann S, et al. Molecular cloning of an alpha-enolase from the human filarial parasite Onchocerca volvulus that binds human plasminogen [J]. Biochim Biophys Acta, 2003, 1627(2-3):111-120.
Williams LA, Ding L, Horwitz J, et al. Tau-crystallin from the turtle lens: purification and partial characteri-zation [J]. Exp Eye Res, 1985,40(5):741-749.
Takei N, Kondo J, Nagaike K, et al. Neuronal survival factor from bovine brain is identical to neuron-specific enolase [J]. J Neurochem,1991,57(4):1178-1184.
al-Giery AG, Brewer JM. Characterization of the interaction of yeast enolase with polynucleotides [J]. Biochim Biophys Acta, 1992, 1159(2):134-140.
Carneiro CR, Postol E, Nomizo R, et al. Identification of enolase as a laminin-binding protein on the surface of Staphylococcus aureus [J]. Microbes Infect, 2004, 6(6):604-608.