新基因FLJ39061在淋巴瘤中的表达及其功能分析

来源:岁月联盟 作者: 时间:2010-07-12

         作者:严玲玲,朱涛,白向阳,卢运萍,周剑锋,马丁

【摘要】  目的 研究淋巴瘤与反应性增生淋巴结的基因表达差异,并对淋巴瘤高表达基因FLJ39061进行初步分析。方法 将淋巴瘤淋巴结标本和反应性增生淋巴结标本液氮速冻切片,使用激光显微切割技术分离淋巴细胞,提取淋巴细胞中的mRNA与表达谱芯片杂交,通过信号扫描、处理后获得两者的表达差异基因。用生物信息学方法对一条有显著性差异的新基因FLJ39061进行初步分析。结果 表达谱芯片发现了152条差异表达基因。对淋巴瘤相关基因FLJ39061的性质进行了有效的预测,基本明确了该基因编码蛋白为一核蛋白,很可能是人MAP激酶激活的蛋白激酶2的前体或异构体。结论 FLJ39061可能作为激酶磷酸化底物调节细胞代谢,与淋巴瘤发生有关,可作为靶点做进一步的功能研究。

【关键词】  淋巴瘤;表达谱芯片;FLJ39061;生物信息学;MAPK    
  Expression of a Novel Gene FLJ39061 in Lymphoma and Its Function Analysis

  Abstract:Objective  To explore the differential expressed genes in lymphoma and reactive lymph node and performed an initial analysis on a novel gene. Hypethetical Protein FIJ39061,which is highly expressed in lymphnode of lymphoma. Methods  The samples were collected and flash frozen quickly to maintain the integrity of mRNA. The mRNA of the tissue from the lymphoma and reactive lymph node are marked with biotin respectively and hybridized with expression profile microarray, and the differential expressed genes are obtained. Initial bioinformatics analysis is performed on a novel gene named FLJ39061 which have no functional researches at present. Its gene structure, genomic localization, the physical and chemical characteristics of the putative protein, subcellular localization, functional domain and so on are predicted, and the systematic evolution analysis is performed on the similar proteins among several species. Results  Using expression profile microarray, 152 differential expressed genes are uncovered. Efficient bioinformatics analysis have fundamentally identified that FLJ39061 is a nuclear protein, and probably is precursor or isomer of MAP kinase?activated protein kinase 2. Conclusion  By bioinformatics analysis, FLJ39061 may involved in the phosphorylation regulation. It is anticipated that this project will advance our understanding of the molecular mechanisms in the neoplastic transformation of lymphoma and the new insights will help to identify promising molecular targets for therapeutic intervention.

  Key words:Lymphoma; Expression profile microarray; FLJ39061; Bioinformatics; MAPK

  0  引言

    近年来,恶性淋巴瘤发病有渐增趋势,而其发病机制至今仍不清楚。随着基因芯片、基因表达系列分析(SAGE)、抑制性消减杂交(SSH)等高通量研究方法的,使得从分子调控水平上研究肿瘤相关的分子机制和调控途径成为可能。这里使用基因芯片对激光显微切割获得的淋巴瘤淋巴结样本的基因表达谱进行分析,发现一个在T细胞淋巴瘤淋巴结中高表达的基因FLJ39061,并对它进行初步的生物信息学分析研究,基本明确了这个基因的生物功能与意义,为今后进一步的分子生物学实验提供了信息和方法指导。

  1  材料与方法

  1.1  材料

    6例淋巴瘤淋巴结标本和反应性增生淋巴结标本来源于华中科技大学同济医学院附属同济2005年9月~2005年12月血液科患者的手术标本,其中3名术后病理结果证实为淋巴瘤(2名为B细胞淋巴瘤,1名为T细胞淋巴瘤),另3名淋巴结肿大患者病理鉴定为反应性增生。微量mRNA提取试剂购自Qiagen公司。表达谱芯片采用Affymetrix生物芯片公司提供的人类基因组U133 plus2.0芯片。该芯片涵盖了大约54 000个人类基因序列。

  1.2  方法

  1.2.1  总RNA的提取及纯化 

  新鲜淋巴结组织标本取材后无菌保存于冰冷的固定液中送回实验室。将组织冰冻切片,激光显微捕获淋巴瘤细胞,微量法提取细胞中的总RNA。

  1.2.2  微量RNA的体外扩增 

  使用T7?OligodT做逆转录反应,合成的双链cDNA用T7 RNA聚合酶做体外转录。mRNA进行无偏线性扩增以后,用1%琼脂糖凝胶电泳和紫外分光光度计检测所获aRNA的纯度和浓度。

  1.2.3  表达谱芯片的样品制备及检测 

  对扩增后的aRNA进行质量鉴定,以biotin掺入进行逆转录,标记aRNA。然后进行芯片杂交。

  1.2.4  表达谱芯片原始数据分析 

  基因芯片上的每一个基因或EST由11?20对25碱基的探针组成。测得的杂交信号数据扣除背景值以后,使用Wilcoxon符号秩检验探针杂交信号强度与相应对照错配基因探针的差异。以0.05作为显著性差异标准。P≤0.05的基因作为阳性基因。6次检测结果综合比较后返回淋巴瘤和反应性增生淋巴结表达差异序列的相关信息。

  1.2.5  生物信息学分析 

  序列的序列及基本注释来源于NCBI的GenBank数据库,用map viewer观看基因组定位及基因结构。利用Spidey工具(http://www.ncbi.nlm.nih.gov/IEB/Research /Ostell/Spidey/)将mRNA序列对齐到相应的基因组序列以验证基因结构。Expasy站点(http://www.expasy.org/)的ProtParam工具预测蛋白质的理化性质,ProtScale工具预测亲水性轮廓。InterProScan [2](http://www.ebi.ac.uk/InterProS?can/)预测蛋白质功能域与结构域。PSORT II(http://psort.nibb.ac.jp/form2.html)预测亚细胞定位信息。SignalP3.0服务器(http://www.cbs.dtu.dk/services/SignalP/)预测可能的信号肽剪切位点 [3]。TMHMM服务器(http://www.cbs.dtu.dk/services/TMHMM/)预测跨膜信息。Motif Scan(http://myhits.isb?sib.ch/cgi?bin/motif_sc?an)搜寻已知功能基序。ELM [4](http://elm.eu.org/)预测蛋白质功能性位点。查询NCBI的UniGene(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=unigene)了解蛋白质组织表达丰度和不同发育阶段表达丰度。利用BlastP工具查询NCBI的非冗余蛋白质数据库以了解其他物种中是否有相似的蛋白质存在。ClustalX软件进行蛋白质多序列比对,并构建进化树。采用Bootstrap法产生随机种子自检验1 000次以验证进化树的可靠性。TreeView软件观察进化树结构。

  2  结果

  2.1  组织完整性鉴定与RNA提取结果

    组织冰冻切片后HE染色,激光显微捕获淋巴结中的淋巴细胞。微量法提取RNA,体外扩增后RNA完整性检测结果表明18S、28S RNA条带清晰,比例适当,RNA完整性良好。

  2.2  表达谱芯片结果

    根据芯片公司提供的表达谱芯片的结果,为了保证足够的特异性,对差异基因的选取标准为:以0.05为差异显著性判断标准,连续3次淋巴瘤中表现为阳性,而在反应性增生中连续3次表现为阴性的基因做为备选基因。根据该筛选标准,淋巴瘤中表达上调的核苷酸序列有80条,从属于已知基因有13条,无相关已知基因的序列有67条;表达下调的核苷酸序列有72条,从属于已知基因的序列有26条,无相关已知基因的序列有46条。这些基因中最有可能有生物学研究意义的基因有15条。其中Hypothetical Protein FLJ39061是一个新蛋白,至今还没有相关的研究报道。所以对FLJ39061的核苷酸序列进行了进一步的生物信息学分析。

  2.3  生物信息学分析结果

    FLJ39061全长2492 bp,CDS位于315~2492 bp,编码具有725aa的蛋白质XP_092342。利用MegaBlast工具将基因FLJ39061的序列XM_092342对人类基因组数据库进行检索,发现其位于人类染色体2q33.1的正链,MapViewer可以很直观的看出该基因具有14个外显子和13个内含子,见图1。Spidey也确证了该结果,利用XM_092342的序列和基因组序列NC_000002进行联配,14个外显子与基因组序列匹配的一致性为100%,并且提示所有外显子均见典型的剪切供体位点和剪切受体位点。AK096380序列是含有不完整编码区的cDNA克隆。把AK096380和XM_092342的核酸序列和两者编码的蛋白质序列进行对比。比对结果如图2所示。结果显示,AK096380几乎和XM_092342全部比对上,比对情况为Identities=2110/2113(99%),除去3处点突变,基本上可以认为两者在AK096380全长上是匹配的,并且两者匹配的长度十分接近前11个外显子长度。另外,两者蛋白质序列的比对结果为Identities=547/582(93%),Positives=547/582(93%)。从而可以说明,AK096380可能是XM_092342的部分序列或者是其剪切变异体,只是前者序列里有几处点突变,造成蛋白质编码略有不同。而且AK096380序列没有终止密码,可能不是全长mRNA逆转录产物。

    将基因FLJ39061的蛋白质参考序列XP_092342提交至ProParam,预测其分子量为81253.5,理论等电点为9.16,为一碱性的大分子蛋白。半衰期在体外人网织红细胞为30h,不稳定指数为60.59,被分类为不稳定蛋白质。ProScale参考Hphob./Kyte & Doolittle的评分标准 [5],未见该蛋白有明显的亲疏水性倾向,见图2。将该序列提交至InterProScan,未见任何分析结果。提交至PSORT II,在蛋白质全长发现多个4肽和7肽的核定位信号,利用k-最邻接算法预测核定位概率为87.0%,表明该蛋白很有可能定位于核。SignalP3.0服务器是利用神经和隐马可夫模型方法 [6]预测蛋白质信号肽剪切位点的工具,用上述两种方法均未预测出信号肽剪切位点。TMHMM服务器预测未见跨膜结构。Motif Scan发现有多个ASN糖基化位点、CK2及PKC磷酸化位点等。ELM查询参数Species选Homo sapiens,Cell compartment选nucleus,预测有MAPK、CK1、CK2等磷酸化位点,Cyclin底物识别位点,FHA域作用基序和SH2结合基序等。

    查询NCBI的UniGene,可知该基因在正常组织中的表达丰度由高到低依次为喉、睾丸、卵巢等。以BlastP工具检索非冗余蛋白质数据库,在多物种中可以找到FLJ39061的高度或中度相似性蛋白。

  在高等哺乳动物中,这个基因相似性最大,进化距离最近。在黑腹果蝇和线虫等多细胞生物中,这个基因也表现出与高等动物相应的相似性。甚至在单细胞生物酵母中也发现与此基因保守序列基本一致的类似基因。ClustalX软件进行蛋白质多序列比对,并构建进化树,多物种间相似蛋白的多序列比对结果和系统发生树,见图3。

  3  讨论

    对疾病发生过程中的组织损害要进行分子水平分析,首要步骤就是纯净目标细胞的分离。近年起来的激光捕获显微切割(Lasercapturemicrodissection,LCM)技术可以在显微镜直视下快速、准确地获取所需的单一细胞亚群,甚至单个细胞,从而成功解决了组织中细胞异质性问题 [7]。本研究中我们联合应用激光捕获显微切割技术及基因芯片技术对淋巴瘤及反应性增生淋巴结的基因表达谱进行了分析,探讨淋巴瘤发生、发展相关的基因。

    FLJ39061基因是通过GNOMON程序对基因组序列进行分析预测得到的基因序列。目前对该基因的试验研究仅有一篇相关文章,而且这篇文章涵盖了一万五千条基因的表达情况,对这条基因只是略有一提,并未进行过深入研究 [8]。在本实验的3次重复实验当中,这个基因的探针连续检测到了该基因转录产物的存在,因此值得重点研究。

    利用现有的分析工具和公共数据库,生物信息学方法提供了一条快速寻找和研究新基因的新途径。通过生物信息学可以对基因结构、基因组定位、蛋白质结构与功能、蛋白质分子进化和功能分类等进行分析和预测,为后面的基础试验提供有力的支持和指导作用。

    首先,对该基因做了染色体定位和外显子分析。然后将mRNA在基因数据库中进行比较,发现一个cDNA序列和mRNA的5’序列大体相同,cDNA序列是大规模测序得到的结果。实验结果和理论预测的一致从实践上证明了基因结构预测的正确性。然后,分析了该基因编码的蛋白。发现该蛋白上有一个细胞核定位位点,同时也发现了多个修饰位点和功能基序,表明它是一个功能活跃的核蛋白。但基于以上分析仍不能确定蛋白的功能,因此又做了多物种相似蛋白分析。分析表明FLJ39061在多种模式生物中均有相似蛋白表达,而且这个蛋白的前250个氨基酸与人的MAPKAPK2有高度同源性。此现象说明蛋白在进化中比较保守,推测这种蛋白很可能是MAPK途径中的一个激酶,而且很可能是人MAP激酶激活的蛋白激酶2的前体或异构体。

    MAPK的激活是细胞内磷酸化级联反应的最终步骤,经典的MAPK级联反应包括三个细胞内蛋白激酶激活的序贯步骤,始发于MAPK激酶(MAPKK)的激活 [7?9]。MAPK及其信号通路在肿瘤侵袭和转移中起中介和信号放大作用,一方面接受大量来自生长因子、丝裂原、环境刺激等的信号;另一方面,通过MAPK级联反应作用于核转录因子,调控基因表达,期间伴有与其他信号通路的相互作用,如整合素通路及PKC通路 [9?12]。受控的MAPK级联反应系统参与细胞增殖和分化,但当其活力失控时会导致肿瘤 [13]。

    FLJ39061基因在T细胞淋巴瘤淋巴结中高表达,而在反应性增生淋巴结中低表达,表明是一个T细胞淋巴瘤相关基因。下一步将着手对该基因进行功能试验研究。

【参考】
    [1]Zhang Z, Schwartz S, Wagner L, et al. A greedy algorithm for aligning DNA sequences [J]. J Comput Biol, 2000,7(1?2):203?214.

   [2] Apweiler R, Attwood TK, Bairoch A, et al. InterPro??an integrated documentation resource for protein families, domains and functional sites [J]. Nucleic Acids Res, 2001,29(1):37?40.

   [3] Bendtsen JD, Nielsen H, Von Heijne G, et al. Improved prediction of signal peptides: SignalP 3.0 [J]. J Mol Biol, 2004,340(4):783?795.

   [4] Puntervoll P, Linding R, Gemund C, et al. ELM server: A new resource for investigating short functional sites in modular eukaryotic proteins [J]. Nucleic Acids Res, 2003,31(13):3625?3630.

   [5] Kyte J, Doolittle RF. A simple method for displaying the hydropathic character of a protein [J].J Mol Biol,1982,157(1):105?132.

   [6] Nielsen H, Krogh A. Prediction of signal peptides and signal anchors by a hidden Markov model [J].Proc Int Conf Intell Syst Mol Biol, 1998,6:122?130.

   [7] 闫峰.激光捕获显微切割技术应用研究新进展 [J].癌症,2004,23(7):860?864.

   [8] Ota T, Suzuki Y, Nishikawa T, et al. Complete sequencing and characterization of 21,243 full?length human cDNAs [J]. Nat Genet,2004,36(1):40?45.

   [9] 曾亮. MAPK信号通路与肿瘤侵袭和转移研究进展 [J].肿瘤防治研究,2002,29(5):419?421.

   [10]Eyers CE, McNeill H, Knebel A, et al. The phosphorylation of CapZ?interacting protein (CapZIP) by stress?activated protein kinases triggers its dissociation from CapZ [J]. Biochem J,2005,389(Pt 1):127?135.

   [11]Rousseau S, Morrice N, Peggie M, et al. Inhibition of SAPK2a/p38 prevents hnRNP A0 phosphorylation by MAPKAP?K2 and its interaction with cytokine mRNAs [J]. EMBO J, 2002,21(23):6505?6514.

   [12]Makondo K, Sakane N, Yoshida T, et al. Proinsulin C?peptide activates cAMP response element?binding proteins through the p38 mitogen?activated protein kinase pathway in mouse lung capillary endothelial cells [J]. Biochem J,2002,366(Pt 3):737?744.

   [13]Pedersen IM, Buhl AM, Klausen P, et al. The chimeric anti?CD20 antibody rituximab induces apoptosis in B?cell chronic lymphocytic leukemia cells through a p38 mitogen activated protein?kinase?dependent mechanism [J]. Blood,2002,99(4):1314?1319.