家猪百日胚胎胸腺的基因表达谱

来源:岁月联盟 作者: 时间:2010-07-12

          作者:陈艳炯,邓亚军,叶琳,耿佳宁,李生斌

【关键词】  猪

  Gene expression pattern in 100day porcine foetus thymus

  【Abstract】  AIM: To get a better understanding of the thymus development and differentiation,we constructed the gene expression pattern of 100day foetus porcine thymus(FTY). METHODS: 11712 randomly picked clones from FTY cDNA library were singlepass sequenced. After contamination was removed, 7071 cleaned ESTs were used for gene expression analysis. RESULTS:  After clustering the 7071 cleaned ESTs by PHRAP, 959 contigs(size>1) and 3074 singletons were obtained. Blast search showed that 806 contigs and 1669 singletons (totally 5442 ESTs) had homologues in nonredundant nucleic acid database, the SwissProt database and Unigene database of human, cattle and mouse. The 1629 ESTs without similarities were considered novel. According to function,  the known genes were classified into 7 group and 36.99% of ESTs were classified into the gene expression group. The thymus functional genes were expressed in a certain degree (accounting for 7.55%). Comparative expression analysis showed that the gene expression pattern of FTY was very similar to human infant thymus gene expression profile and different from that of adult human. Blast search found that 58 of 109 novel sequences with both poly A and ORF prediction had homologues to human genome sequence. CONCLUSION:  EST strategy is economical and virtual in finding new genes. The 100day porcine thymus is still at a developmental stage.

  【Keywords】 swine; thymus gland/embryology; EST

  【摘要】 目的: 构建家猪100 d胚胎胸腺基因表达谱,为研究胸腺的发育和分化机制奠定基础. 方法: 随机挑取家猪100 d胸腺cDNA文库(FTY)的11 712个克隆,进行单向全自动大规模测序,去污染后共获得7071个高质量的表达序列标签(EST)用于基因表达分析. 结果: 对7071个高质量EST的聚类分析结果获得959个多拷贝基因和3074个单拷贝基因. 与非冗余的核酸数据库、SwissProt数据库及人、牛和鼠的Unigene数据库进行BLAST,发现806个多拷贝基因和1669个单拷贝基因(共计5442个ESTs)与已知序列有同源性,1629个EST没有发现同源序列被认为是新基因. 根据功能将已知基因归为7类,其中基因表达相关基因占36.99%,胸腺特异的防御功能相关基因有一定程度表达(占7.55%),这与人婴儿胸腺基因表达谱相类似而不同于成年人胸腺组织. 将109个既发现有ORF又具有PolyA的多拷贝新基因与人类基因组框架序列进行BLAST,发现其中58个有同源序列. 结论: EST技术是发现新基因的有效手段之一;此期家猪胸腺仍处于发育阶段.

  【关键词】 猪;胸腺/胚胎学;EST

  0引言

  表达序列标签(expressed sequence tag, EST)是从由组织、细胞mRNA构建的cDNA文库中随机取出一个克隆,从5′末端或3′末端对插入的cDNA片段进行单向(single pass or  single run)自动测序,所获得的长约60~500 bp的一段cDNA序列. 通过对EST进行分析,有助于新基因的发现和克隆,为人类基因组图谱绘制、基因组编码区序列的确定、分析基因在不同组织中的表达特异性提供序列信息[1,2]. 目前EST技术已经广泛应用于比较基因组学、功能基因组学和疾病基因组学等研究领域,并且已经成为连接基因组学和后基因组学的桥梁和工具.
 
  胸腺是T细胞发育的场所. 淋巴样干细胞迁入胸腺进行分化,约95%以上的胸腺细胞死亡,只有不足5%的细胞存活,分化为成熟的辅助T细胞及细胞毒性T细胞,输出胸腺,定位于外周淋巴器官及组织. 在孕14 wk胚胎胸腺中交错突细胞和巨噬细胞已经出现,孕17 wk胸腺已经完全分化有各种淋巴细胞释放[3]. 孕14~15 wk是早期胸腺细胞向普通型胸腺细胞分化的关键时期,研究此期胸腺的基因表达特点有助于阐明胸腺的发育机制. 我们以家猪100 d胚胎胸腺组织cDNA文库(FTY)为材料,共投入11 712个测序反应,获得7071个高质量的EST,建立了家猪100 d胚胎胸腺组织的基因表达谱.

  1材料和方法

  1.1材料家猪100 d胚胎胸腺cDNA文库由Division of Animal Genetics Department of Animal Science & Animal Health The Royal Veterinary and Agricultural University提供. 文库构建载体为pBluescript SK(+). ET dye terminator mix,MegaBACETM  Longread Matrix,MegaBACE LPA buffer,MegaBACE1000核酸分析仪、VDS均购自Amersham Pharmacia公司;Eppendorf 5810R离心机;ABI9700 PCR仪,鼎国公司生产T7引物等.
 
  1.2方法
 
  1.2.1ESTs序列测定用碱裂解法进行测序模板制备;用ddNTP荧光标记的末端终止法进行测序反应;毛细管电泳测序.
 
  1.2.2信息收集与处理basecalling软件读取胶图文件; phred程序(trim_cutoff 默认为 0.05),去除克隆中的低质量部分[4,5];phd2fasta软件将PHD格式文件转化为FASTA格式的文件;crossmatch软件通过与载体序列数据库进行比较后进行载体屏蔽(vector  mask),提取每一克隆中无载体污染的最长片段,提取出超过100 bp的形成新的高质量克隆.
 
  1.2.3聚类分析利用Phrap软件,对cleaned ests(高质量ESTs)进行聚类,得到多拷贝基因(clusters)及单拷贝基因(singletons),合起来称作Unigenes.
 
  1.2.4数据比较将得到的Unigenes与Genbank中非冗余核苷酸库进行比较,blastn标准(e值=1e-10)与Genbank中的蛋白质数据库进行blastx比较, blastx标准(e=1e-5),与Genbank中的Unigene人(UnigeneHS)、牛(UnigeneBt)、鼠(UnigeneMM)数据库进行比较(e=1e-10);利用比对结果去除线粒体、细菌基因组、重复序列和核糖体RNA;对聚类后的Unigenes进行ORF预测及加尾信号分析;将未在数据库中发现同源性的Unigenes与人类基因组序列进行BLAST(默认参数).

  2结果

  2.1FTY文库质量评估共投入11 712个反应,经过去污染(细菌核基因组DNA线粒体)和低质量序列,获得高质量EST共7071个, EST平均读长为427 bp. 将ESTs与线粒体基因、人重复序列数据库、细菌基因组库、人核糖体RNA库进行了同源性比较,得到线粒体基因19个(244个克隆),占4.48%,核糖体基因1个(2 个克隆),占0.003%,重复序列4个(69个克隆),占0.98%,基因组DNA 9个(15个克隆),占0.17 %,新基因和新EST 1629个,占23.04%,其他已知基因5112个克隆,占72.3%.

  2.2聚类分析使用Phrap软件进行聚类分析,得到4033个基因聚类(clusters),包括3074个singlet基因和959个多拷贝基因;将cluster序列与nr库,SwissProt库及Unigne库比较,得到2013个已知基因,其中singlet基因为1670个,多拷贝基因为805(3772个克隆)个;未知基因为1629个.
 
  其中表达量最多的一个基因(含有162个拷贝数)为:牛延长因子11 alpha(Bos taurus EF1A mRNA for elongation factor 1 alpha),其次为猪G蛋白基因(S.scrofa mRNA encoding Gbeta like protein),含42个拷贝数.
   
  由于测定的是未经均一化处理的cDNA文库,我们得到了这一特定时期猪胸腺组织EST表达的信息,获得此文库内所表达的基因类型,还可研究表达基因的丰余度和组织特异基因表达的信息.
 
  2.3BLAST结果的种属比较获得的人类的注释最多,猪类的其次,牛的第三,鼠类的最少. 虽然存在人的EST数据要远远多于其他物种的原因,但鼠的数据远多于牛,依然得到了多于鼠的注释,由此推测猪和人的同源性最高,猪和牛的同源性较鼠要近(Tab 1).

  表1种属比较 (略)
 
  2.4FTY表达谱的构建根据Blast结果,利用Genbank Accession No.为索引,构建FTY已知功能基因的表达谱. 所有已知基因按功能分为以下7大类[1]:细胞分裂、信号传导或传递、结构和运动、细胞和机体防御、基因和蛋白表达、代谢和未分类(Tab 2).

  表2已知基因的分类 (略)

  从Tab 2可以看出,在这7 大类的功能基因中,参与基因表达的克隆数在已分类的功能基因中含量最为丰富,提示100 d的猪胸腺组织生长旺盛,而胸腺分化标志性的免疫防御功能的基因数量很少. 从各类功能分类的基因数目来看,参与基因表达的基因数目明显少于所测定的克隆数,这种基因的高度冗余说明基因表达功能的实现所需基因种类局限,而其相关基因转录活性增强是增强基因表达的途径.


 
  2.5与胸腺有关的基因的表达在对已知基因进行分类的过程中,还同时检测了与胸腺功能相关的基因,其中Thymosin基因有67个EST,61个EST代表TCR基因,10个EST代表CD3基因,2个EST代表CD8. 造血相关基因的表达(27EST,占0.53%)提示此期胸腺与造血功能相关.

  3讨论

  3.1文库质量检测cDNA文库的质量对于EST序列测定尤其是大规模EST序列测定是至关重要的[6,7]. 文库的质量取决于文库滴度和插入片段大小,文库滴度对于所构建cDNA文库来说是首要的判断指标,文库滴度过低,则文库含有的组织内表达基因的特异性和代表性就会受到质疑. 文库的质量主要经小规模测序,对蓝白斑筛选结果、重组率、测序质量和污染情况及聚类分析结果等评估获得. 插入片段要求大于500 bp.
 本试验采用文库通过了质量检测,未进行均一化处理,包含了100 d猪胚胎胸腺的基因表达的信息, FTY大规模EST序列测定共进行了11 712个反应,大于100 bp的高质量克隆(Q20)数量为7071,平均读长为427 bp,获得真实的功能基因表达谱.

  3.2和数据库同源性比较目前,大规模序列测定是EST序列增长的主要源泉. 但这些序列增长主要局限于人类和小鼠. 对于猪鸡等禽畜来说,EST序列的增长较落后,中丹合作的家猪基因组计划很大程度上弥补了这一差距. 猪肉是大多数人摄取蛋白质的第一来源,家猪基因组序列及组织EST的分析研究,对发现决定肉用质量基因,提高高质量猪肉产出率,加强养猪业在我国国民中的地位具有重要的社会经济效益. 家猪与人的基因相似程度高,微型化(miniature swine)家猪体质量接近于人类,内脏器官大小和重量与人的相似,猪可以是人类进行器官移植的最理想材料[8],比较猪与人的基因组,培育基因改良猪,使提供的器官或细胞异种移植后不出现排斥反应. 在医学领域有着广泛的研究和应用前景;猪同样可作为人类常见的多基因病和与年龄相关的老年病的比较基因组学研究材料和理想的实验动物模型.
 
  胸腺是中枢免疫器官,衰老及HIV等感染情况下胸腺功能衰退或减弱,是造成老人和AIDS病患者免疫缺乏症的重要原因. 研究胸腺组织发育不同阶段基因表达的特点为揭示前T细胞(proT cell)进入胸腺后获得免疫耐受的机制,进一步深入地了解并为进行更有效的免疫重建工作奠定基础. 种间移植研究发现家猪胸腺移植可以促进人和灵长类造血干细胞分化,现在猪胸腺组织移植被认为是HIV感染患者免疫系统重建的有效手段. 猪源性的移植过程中,猪内生性反转录病毒(PERV)感染一直困扰人们,从猪源性器官移植的安全性的角度出发,对PERV的研究很受重视[9]. 我们的研究发现,FTY有5个猪内生性反转录病毒基因包括10个ESTs,占0.14%. 不过令人鼓舞的是,BioTansplant Inc.严格筛选培育的杂交微型猪有望提供没有PERV感染的移植器官.
 
  3.3FTY基因表达谱的构建作为人类基因组计划的组成部分,系统地分析转录单位已经成为基因组学和功能基因组学的重要桥梁之一. 尽管dbEST的数量已经非常多,然而猪胚胎期胸腺组织的特异表达基因的研究并不多见. 本实验的目的之一是尝试用EST大规模测序的方法,来研究猪胚胎期胸腺组织特异表达基因的表达情况,为全面了解胸腺发育和T细胞分化成熟的调控机制奠定基础.
 
  本实验中所表达的基因共分为7类,具体结果如Tab 2示. 从各类功能分类的基因数目来看,蛋白表达相关基因数目远少于所测定的克隆数,说明这些功能的实现可能不是依靠表达基因的数量而是依赖于转录活性的增强. 细胞分裂和基因表达类基因的克隆数较高,能量代谢相关的基因克隆数和依赖Ubiquitin的蛋白降解途径的基因的克隆数较多,而作为免疫器官特意的防御类基因的克隆数较少,说明此期胸腺组织处于组织细胞构建过程,蛋白质代谢旺盛,能量需要较多. 这和人婴儿胸腺的基因表达谱结果一致[10].
 
  在基因表达谱构建的过程中,最使人关心的是发现组织特异表达基因,据认为特异表达基因可能占特定组织和细胞内可表达全部基因的10%-20%,而种类上绝大多数应为低表达量基因. 本实验结果表明,在所测定的2013个已知功能的基因中, Thymosin基因有67个EST,61个EST代表TCR基因,10个EST代表CD3基因,2个EST代表CD8,远低于延长因子(160EST),成熟T细胞的表面标志TCR,CD4,CD8表达较少,说明此期胸腺的分化尚不完全. 组织及阶段特异的基因表达分析还在继续.
 
  3.4对novel序列的研究对组织细胞EST的研究,是发现新基因的有力工具[1,2]. 与核酸数据库和蛋白数据库的同源性比较为EST的研究提供了一种简捷、快速鉴别基因功能的有效方法. 本文把与核酸数据库和蛋白数据库(nt, nr, SwissProt detabase,Unigenehuman, Unigenecattle, UnigenMouse)没有发现同源性的序列认为是新基因,对它们的ORF进行了预测,并且与人类基因组框架序列进行了同源性比较. 结果表明,BLAST的109个序列中有58个与人类基因组有同源序列,其中有的在相同的期望值发现多处基因组同源序列,而有的则在一个基因中具有多处同源序列存在. 有关这些EST的蛋白质功能,还需要进一步研究和确定.

  【】

  [1] Yu YT,  Zhang CG,  Zhou GQ,  Wu SF,  Qu XH,  Wei HD,  Xing GC,  Dong CN, Zhai Y,  Wan JH,  Ouyang SG,  Li L,  Zhang SW,  Zhou KX,  Zhang YA,  Wu CT,  He FC. Gene expression profiling in human fetal liver and identification of  tissue and developmentalstagespecific genes through compiled expression profiles and efficient cloning of fulllength cDNAs [J]. Genome Res, 2001; 11: 1392-1403.
 
  [2] Asamizu E, Nakamura Y, Sato S, Tabata S. A large scale analysis of cDNA in Arabidopsis thaliana: Generation of 12,028 nonredundant expressed sequence tags from normalized and sizeselected cDNA libraries [J]. DNA Res, 2000 ;7(3):175-180.
 
  [3] Arif S, Mufti A.  Mosbys  crash course: Immune, blood and lymphatic systems [M].  Beijing: Authorized Reprinting by Science Press, 2002:9.

  [4] Ewing B, Hillier L, Wendl MC, Green P. Basecalling of automated sequencer traces using phred. I. Accuracy assessment [J]. Genome Res, 1998;8(3):175-185.

  [5] Ewing B,Green P. Basecalling of automated sequencer traces using phred. II. Error probabilities [J]. Genome Res, 1998; 8(3):186-194.

  [6]  Li N, Zhao ZH, Liu ZL, Zhao XB, Lian ZX, Wu CX. Analysis of expressed tags from porcine liver organ[J]. Zhongguo Nongye Kexue (Scientia Agricultura Sinic), 2002; 35(12):1525-1528.

  [7] Wang XL, Li N, Zhao ZH, Feng JD, Zhao XB, Li CL, Wu CX. Analysis of succeed percentage on sequencing ESTs and construction of porcine muscle cDNA library [J]. Yichuan (Hereditas), 2002; 24(3): 263-266.

  [8]  Appel JZ 3rd, Buhler L, Cooper DK. The pig as a source of cardiac xenografts  [J]. J Card Surg, 2001; 16(5): 345-356.

  [9]  Avidan O, Loya S, Tonjes RR, Sevilya Z, Hizi A. Expression and characterization of a recombinant novel reverse transcriptase of a porcine endogenous retrovirus  [J]. Virology, 2003;307(2):341-357.

  [10] Hwang MY, Kang YJ, Kim YH, Scherer SW, Tsui LC, Sohn U. Generation and chromosome mapping of expressed sequence tags (ESTs) from a human infant thymus  [J]. Genome, 1999; 42(3):457-464.