药物靶向调控ID4基因表达的生物信息学预测与分析
作者:卢学春,迟小华,楼方定,朱宏丽,范辉,李素霞,于力
【摘要】 ID4基因低表达与肿瘤发生关系密切,其高表达具有明确的抗白血病作用,但在白血病细胞无表达。本研究初步通过生物信息学方法分析ID4基因启动子的结构,预测调控ID4基因表达的顺式元件及相关药物,为筛选有靶向调控ID4基因表达的药物创造前提。以人类基因组数据库和机互联网为平台,钓取ID4基因5′侧翼区3 000 bp非编码DNA序列和mRNA序列中的ORF序列;利用TESS和Genomax等在线启动子分析软件在人类转录因子数据库中搜索可能存在的顺式结构;利用SAGE和GEO数据库对影响ID4基因表达的相关因素进行分析。结果表明: ID4基因具有II型启动子,在5'-非翻译区的-45 bp处有1个典型的TATA盒。在长度为1 300 bp的ID4启动子区,存在多个顺式结构,其中包括Sp1、c?Myb、abaA、C/EBPalpha、GR、ERE和Zeste可能具有正向调控作用;CCAAT?binding factor、GCF、WT1 ?KTS、HiNF?C和EGR2可能具有负向调控作用。结论: ID4基因的表达可能受糖皮质激素、雌激素、甲状腺素和卵泡刺激素等多种活性物质的调控。
【关键词】 ID4基因 白血病 地塞米松 雌激素 卵泡刺激素 生物信息学分析
Bioinformatics Scan Analysis for Predicting Drug Targeted Modulation on ID4 Gene Expression
Abstract Low expression of ID4 gene is tightly related with carcinogenesis and high expression shows a definite anti?leukemia effect, though little expression in some leukemia cells. The main purpose of this preliminary work was to analyze the construction of ID4 gene promoter and to predict the cis elements in the ID4 promoter region by scanning the drug candidate with bioinformatics method. All these work are the primary part for finding effective drugs in the treatment of leukemia via the way of ID4 expression regulation. According to the data in GenBank and Internet platform, the 5'?untranslated sequence just upstream of ID4 ORF was virtually cloned. TESS, Genomatix and GenBank databank were used to analyze the cis elements in this area. RSA was used to find the distribution patterns for all these possible elements. SAGE and GEO datasets were used to find active substances which have the effect on the ID4 expression. The rsults indicated that ID4 had a type II promoter with a typical TATA box?45 bp upstream the transcriptional original site. There were a lot of various cis elements in the 5'?untranslated region upstream, including both positive element candidates such as Sp1, c?Myb, abaA, GR, ER, Zeste and C/EBPalpha and negative element candidates such as CCAAT?binding factor, GCF, WT1 ?KTS, HiNF?C and EGR2. It is concluded that estrogen, dexamethasone, thyroid hormone and follicle stimulating hormone may participate in the regulation of ID4 gene expression in both positive and negative manners.
Key words ID4 gene; leukemia; dexamethasone; Estrogen; follicle stimulating hormone; bioinformatics
J Exp Hematol 2007; 15(3):594-598
ID4基因属于螺旋?环?螺旋(HLH)蛋白家族,对多种转录因子与DNA的结合起抑制作用[1]。我国于力教授[2]通过基因组甲基化扫描技术(RLGS)发现ID4基因在急性白血病细胞中的表达低下,而在正常人的骨髓中具有很高的表达水平。将ID4基因转染入急性白血病细胞系后发现,白血病细胞在过表达ID4时,会出现生长受抑,凋亡增加以及成瘤作用减弱等现象, ID4基因具有抗白血病作用,是一个白血病抑制基因。由于该基因具有明显的抗白血病作用,因此如何诱导ID4基因在白血病细胞中恢复表达,并发挥其在体内的抗肿瘤的作用,有可能成为白血病的一个新途径。作为进一步研究工作的基础,本研究初步利用互联网平台,对ID4基因mRNA和理论蛋白在正常组织和肿瘤细胞中的分布进行分析,为最终研究ID4基因的表达调控机制提供前提。
数据来源
本研究所有数据均来源于互联网开放的免费数据库,其中包括: Gene expression omnibus (GEO) 、基因芯片表达数据库Affymetrix (Hu35KsubB、Hu35KsubD、HG?U95A、HG?U133A、HG?U133B、 HG?U95Av2、HuGeneFL、HG?Focus、HG?U?133 Plus)、Clontech(Atlas Human Toxicology 1.2 Array、Atlas Plastic Human 8K Microarray、Atlas Glass Human 3.8 I Microarray和MWG Human 30k Array;人类基因组数据库(GeneBank);基因表达数据库SAGE、GeneCard、InterPro、ProtoNet、UniProt和BLOCKS。
分析方法
通过计算机互联网平台,在人类基因组数据库中钓取ID4基因5'非翻译区3 000 bp的DNA序列和mRNA序列中的蛋白编码(ORF)序列,将此序列或GenBank序号调入上述在线数据库中进行表达信息搜索,具体参数采用数据库通用值。
收集
以"ID4 protein, human"为主题词在PubMed数据库中自1964年以来关于ID4研究公开发表的所有文献。以ID4为关键词在中文CMCC(1994?2005.09)和Cbmdisc(1978?2005.09) 中检索所有公开发表的文献。
结 果
ID4基因5′侧翼非编码区结构特点
ID4基因的5′侧翼区非编码序列为1个典型的II型启动子结构,具有2个非常显著的上游元件TATA box和GC box,其中TATA box位于-45 bp处,序列为TATAAAA;在这一区域上还分布着6个GC box,均位于TATA box上游,序列为CCCGCC,此外还有多个CpG岛结构;ID4基因的起始序列为5′?AGGCGCGGTTGT?3′,不具有典型的起始子结构(图1)。
ID4基因启动子活性分析
将不同长度的ID4基因5′侧翼非编码区DNA序列与荧光素酶报告质粒相连后检测不同片段的启动子活性[1],结果发现,ID4基因启动子区在-269至+10是ID4基因的核心启动子区,是ID4基因启动转录所必需的序列(图1)。
ID4基因启动子活性区域存在的顺式元件
根据于力等对启动子活性分析结果发现,在-454至-269区域可能存在增加启动子活性的增强子结构;在+10和+276之间可能存在具有抑制活性的下游调控元件;在+10至+276 bp被截取以后,即当5′侧翼非编码区DNA序列由-454至+276共730 bp变成-454至+10共464 bp以后启动子活性明显增强,这说明在+10至+276之间存在抑制ID4表达的调控元件。对上述区域进行顺式结构分析后筛选处相应的调控元件(表1)。
ID4基因调控的基因芯片表达数据库分析
在GEO数据库中,其中有988个子数据有关于ID4基因表达的数据,其中对调控ID4基因有意义的子数据库有10个()。C57BL/6小鼠切除卵巢后注射雌二醇或其同系物[3],结果胸腺ID4基因的表达有增加(图3A)。切除子宫的小鼠在注射孕激素后ID4的表达明显受到抑制[4](图3B)。在氧化损伤敏感Nrf2基因敲除的小鼠,纯氧作用24小时后ID4的表达消失(图4A);REtsAF?Bcl?2细胞在p53基因抑制剂ZVAD作用下,ID4的表达受到抑制(图4B);在患有严重自身免疫疾病的B10BL小鼠,200 ng的1,25Table 1. Candidate cis elements on the 5′upstream region of ID4 gene
二羟维生素D3对ID4基因的表达具有抑制作用(图4C);辛德毕斯病毒敏感的WT293细胞ID4基因表达明显高于对该病毒不敏感的克隆(图4D)。另一方面,地塞米松(DEX)、全反式维甲酸(ATRA)、大剂量胆碱酯酶(ACHE)和炎性物质白三烯(LTD4)、干扰素β(IFN?β)和干扰素γ(IFN?γ)对ID4基因的表达具有正向调控作用(图5A、B、C、D)。
调控ID4基因表达活性物质的检索
以ID4为主题词,在PubMed数据库和CMCC中检索公开发表的,一共检索到67篇英文文献和1篇中文文献,其中关于ID4基因表达调控的文献有7篇(表2),中文数据库中未检索出有关ID4表达调控的文献。
讨 论
目前研究者们采用RLGS技术发现了很多抑癌基因,ID4基因就是这样一个具有抗白血病作用的基因。通过靶向诱导抑癌基因的表达来肿瘤,有可能成为肿瘤治疗的一个新途径,对白血病的治疗更是如此。本研究以ID4基因为例,尝试通过生物信息学的方法初步筛选具有诱导ID4基因表达作用的药物,为进一步研究通过调控ID4基因的表达发挥抗白血病作用提供理论依据。
在研究LRP16基因表达调控的工作中,我们成功利用生物信息学方法预测了该基因的表达调控机制[10],并通过实验室工作进行了证实[11]。从上述工作中我们体会,启动子序列分析是寻找调控ID4基因表达的第一步,以于力对ID4基因启动子活性的分析为基础,从不同活性区域的顺式作用元件分布筛选出了可能具有调控ID4基因表达的活性物质,包括糖皮质激素和雌激素等。为了在mRNA表达水平对上述的结构分析进行验证,采用SAGE和GEO数据库对影响ID4基因表达的活性物质进行了进一步分析,结果不但证实了地塞米松和雌激素对ID4基因的表达可能具有正向调控作用,还进一步发现了其他有促进ID4基因表达的活性物质,包括全反式维甲酸和炎性物质白三烯(LTD4)、干扰素?β和干扰素γ。此外,从数据库的分析还发现,p53基因表达抑制剂ZVAD和1,25二羟维生素D3对ID4基因的表达具有抑制作用。
对ID4基因表达调控分析的最后一步就是文献复习。在7篇有关ID4基因表达调控的文献中,一共提及了地塞米松、cAMP、FSH和甲基化等几种因素和条件对ID4基因表达的影响。这一方面证实了数据库分析结果的准确性,另一方面也说明了仅依靠文献了解靶基因表达调控信息的局限性。因此,采用生物信息学的综合分析方法是进一步研究靶基因表达调控的基础,是一种方便快捷的途径。
总之,通过生物信息学分析发现,ID4基因的表达存在正向和负向调控两种作用,其中正向调控因素或物质包括:地塞米松、cAMP、全反式维甲酸、炎性物质白三烯(LTD4)、干扰素β和干扰素γ,负向调控表达的因素或物质包括:甲基化、ZVAD和1,25二羟维生素D3。
【文献】
1van Cruchten I,Cinato E,Fox M, et al. Structure, chromosomal localization and expression of the murine dominant negative helix?loop?helix Id4 gene. Biochim Biophys Acta, 1998; 1443: 55-64
2Yu L, Liu C, Vandeusen J, et al. Global assessment of promoter methylation in a mouse model of cancer identifies ID4 as a putative tumor?suppressor gene in human leukemia. Nat Genet, 2005; 37: 265-274
3Selvaraj V, Bunick D, Finnigan?Bunick C, et al. Gene expression profiling of 17 beta?estradiol and genistein effects on mouse thymus. Toxicol Sci, 2005; 87: 97-112
4Umetani N, Mori T, Koyanagi K, et al. Aberrant hypermethylation of ID4 gene promoter region increases risk of lymph node metastasis in T1 breast cancer. Oncogene, 2005; 24: 4721-4727
5Chan AS, Tsui WY, Chen X, et al. Downregulation of ID4 by promoter hypermethylation in gastric adenocarcinoma. Oncogene, 2003; 22: 6946-6953
6Semov A, Marcotte R, Semova N, et al. Microarray analysis of E?box binding?related gene expression in young and replicatively senescent human fibroblasts. Anal Biochem, 2002; 302: 38-51
7Chaudhary J, Johnson J, Kim G, et al. Hormonal regulation and differential actions of the helix?loop?helix transcriptional inhibitors of differentiation (Id1, Id2, Id3, and Id4) in Sertoli cells. Endocrinology, 2001; 142: 1727-1736
8Andres?Barquin PJ, Hernandez MC, Israel MA. Id4 expression induces apoptosis in astrocytic cultures and is down?regulated by activation of the cAMP?dependent signal transduction pathway. Exp Cell Res, 1999; 247: 347-355
9Pagliuca A, Cannada?Bartoli P, Lania L. A role for Sp and helix?loop?helix transcription factors in the regulation of the human Id4 gene promoter activity. J Biol Chem, 1998; 273: 7668-7674
10卢学春,楼方定,韩为东等. LRP16基因启动子活性分析. 实验血液学杂志,2006;14:146-149
11Han WD, Mu YM, Lu XC, et al. Up?regulation of LRP16 mRNA by 17beta?estradiol through activation of estrogen receptor alpha (ERalpha), but not ERbeta, and promotion of human breast cancer MCF?7 cell proliferation: a preliminary report. Endocr Relat Cancer, 2003; 10:217-224