聚类分析在苯中毒患者肿瘤相关基因表达谱研究中的应用

来源:岁月联盟 作者: 时间:2010-07-12

            作者:徐持华 张国良 夏颖 李玲 毕勇毅

【关键词】  聚类

  摘 要:  目的:探讨聚类分析方法在苯中毒基因表达谱研究中的应用价值。方法:从7组正常对照及苯中毒患者外周血提取总RNA,逆转录合成cDNA后,体外转录合成生物素标记的mRNA,与含有2780个cDNA克隆的微阵列肿瘤相关基因芯片杂交,经荧光染料标记后,用芯片扫描仪进行图像扫描,经MIDAS分析软件将扫描的图像信息转化为数据,对样本和基因做聚类分析。结果:重度苯中毒和再障患者的基因表达谱和轻、中度中毒的表达谱明显不同,且具有相似功能的基因具有相似的表达模式。结论:聚类分析方法能根据基因表达谱,将样本进行疾病类型分类,将基因进行功能分类,为苯中毒的早期诊断和预后评估的生物标记物研究提供依据。

  关键词:  聚类分析;  基因表达;  基因芯片;  苯中毒    基因芯片,亦称
  cDNA微阵列(cDNAmicroarray),是将许多特定的基因片段作为探针有地排列于固相载体上,样品RNA经荧光标记后与其杂交,机系统对杂交信号进行检测分析,从而可同时反应上千个基因的表达状况的一种方法[1,2]。为从成千上万个基因数据中获取更多的基因功能信息,现已有多种数据分析方法,如聚类分析、比值分析、相关性分析等等[3]。本研究采用聚类分析方法对苯中毒患者基因表达谱进行初步分析,以探讨基因表达谱与基因功能和不同中毒类型间的关系。

  1  对象与方法

  11  样本来源

  7名苯中毒工人选自某皮鞋厂被某法定职业病诊断机构确诊研究所确诊为苯中毒患者的女工,其中疑为含苯化学物中毒1例,慢性轻度苯中毒2例,慢性中度苯中毒2例,慢性重度苯中毒1例,再障1例;另选取与实验组性别、年龄、工龄、吸烟饮酒状况等均无显著性差异的健康成人7例。全部研究对象无癌症史、放疗及化疗史,无其他骨髓毒性化学物接触史和放射线接触史。

  12  样品及制备

  采集实验样本及对照样本新鲜血液,Percoll法分离白细胞,Trizol裂解,进行总RNA提取,并采用电泳和紫外光吸收法检测RNA的浓度和总量。

  13  芯片制备

  采用人类肿瘤相关基因表达谱芯片CSCCA26,共有2780个基因点。cDNA样品购自美国Invitrogen公司,内外参照标准基因样品由法玛西亚公司提供。

  14  探针标记及杂交

  实验组样品采用反转录Cy3荧光标记cDNA,对照组样品采用反转录Cy5荧光标记cDNA。将基因芯片和杂交探针分别在95℃的水浴中变性5min,将探针加在基因芯片上,用盖玻片封片,置于42℃杂交16个小时后揭开盖玻片,用洗涤液I(0.2%SDS+0.2×SSC)和洗涤液Ⅱ(0,2×SSC)洗涤,室温晾干。

  15  信号的检测与分析

  用GenⅢ Microarray Scanner (Amersham Pharmacia Biotech, Ltd)扫描仪对扫描夹中的芯片进行扫描,扫描后将图像转化为基于荧光强度的数字信号,进行数据分析处理。数据筛选标准为以芯片中平均密度值(Density)在5×108以上的数据点为有效数据,同时cy3/cy5平均比值(Ratio)大于2或小于05的数据点为存在显著性表达差异的基因点。

  16  聚类分析

  用非监督聚类和监督聚类的方法将得到的数据进行样本和基因的聚类分析。非监督聚类法即事先不知道任何背景知识而直接进行的聚类分析法,此方法是基于标准相关系的计算,它主要是通过表达谱聚类来发现具有协同调节性的基因或具有相关性的样本;而监督聚类法是事先知道背景知识(如已知明确诊断的苯中毒患者外周血细胞的基因表达谱),将这些表达谱数据输入分析软件中,进行预测找出能代表该疾病特征的少数基因表达束。监督聚类法采用PAM(Prediction Analysis of Microarray)法进行分析,具体分析步骤参见stat.stanford.edu/~tibs/PAM。

  2  结果

  21  样本的非监督聚类结果

  MIDAS分析软件将1例疑似含苯化学物中毒、2例慢性轻度本中毒、2例慢性中度苯中毒、1例慢性重度苯中毒、1例再障患者标本放在一起做非监督聚类分析(图1)。发现2例慢性轻度中毒病人聚类在一起,他们然后又和慢性中度中毒病人聚类在一起;再障病人、慢性重度中毒病人及疑似中毒病人聚类在一起。结果显示基因表达谱分类与临床诊断分类基本一致。

  22  表达基因的非监督聚类
由图1可见,部分差异表达基因根据其外周血基因表达谱模式聚类在一起。聚类在一起的基因在7个样本中具有类似的表达谱。考虑这些基因在病理或生理条件下受某些共同基因的调节,或者这些基因在作用机制上存在某些共同点而聚类在一起。

  23  基因表达谱的监督聚类

  采用PAM监督聚类分析的预测方法来分析表达谱,以诊断明确的慢性轻度苯中毒、慢性中度苯中毒、慢性重度苯中毒患者外周血基因表达的数据为依据,预测出96个能区分这些疾病分级特征的基因表达束,仅靠这96个基因就可将不同样本进行较为准确的分类,见图2。图2  监督聚类分析图

  3  讨论

  非监督聚类分析是分析前并不知道样本来自何种疾病以及芯片上基因的功能,单纯依靠基因表达谱表现出的相似性来进行聚类分析的方法。当得到基因表达谱的信息后,机可根据基因表达谱的信息来分析未知疾病标本的基因表达谱,如果与已知疾病的基因表达谱相似,则可认为该标本来自同种疾病,反之亦然。用这种分析方法还可设计出将来用于疾病诊断和鉴别诊断和检测试剂盒[4]。
 
  本实验中,运用非监督聚类法对不同类型的慢性苯中毒患者外周血细胞基因表达谱进行初步分析,结果表明,该方法能快速、高效地根据基因表达谱将中毒程度不同的疾病标本区分开来,也能将功能相似的基因聚类在一起。有报道,Hippo等[5]应用寡核酸微阵列,对符合条件的6272个差异基因表达数据进行聚类分析,将22个胃癌和8个非肿瘤胃组织各聚为一类。Sorlie等[6]检测乳腺癌的基因表达谱,不仅将肿瘤与非肿瘤组织各自聚为一类,而且将不同生物学特性的乳腺肿瘤进行聚类。我们的实验也获得了相似的结果。

  采用监督聚类分析法对差异表达基因进行研究,能够从大量基因中挑选出少部分基因,仅靠这些基因就可将不同样本进行聚类,且与采用全部基因的表达谱分析具有较强的一致性。这说明根据外周血基因表达谱可筛选出少数基因进行疾病的诊断和鉴别诊断。Golub等[7]采用监督聚类分析方法分析白血病样本,寻找哪些基因的表达和已知的急性髓性白血病(AML)和急性淋巴细胞白血病(ALL)两类白血病最相关。他们基于50个基因(选自6871个基因),利用监督聚类分析方法分析38个样本,然后把它应用于34个新收集的样本上,结果有29个样本被正确分类。研究者还预测这种方法还能发现新的白血病种类。本实验中利用监督聚类同96条差异表达基因,根据这些基因即可对不同程度的本中毒进行诊断和鉴别诊断。

  聚类分析方法能根据基因表达谱,将样本作疾病分类、基因作功能分类。根据聚类结果可透过不同程度的苯中毒看相关基因的变化的本质,以便更客观、更准确、更及时的分析并把握病程的与预后。

  参  考  文  献

  1  Ramsay G. DNA Chips: stateofthe art. Nature Biotechnol, 1998,16:40~44.

  2  Lockhart DJ. Winzeler EA. Genomics, gene expression and DNA arrays. Nature, 2000,405:827~836.

  3  Sherlock G. Analysis of largescale gene expression data. Curr Opin Immunol, 2000,12:201~205.

  4  韩光明,陈顺乐,等聚类分析在自身免疫病基因表达谱研究中的初步应用中华检验医学杂志,2003,26(8):473~475.

  5  Hippo Y, Taniguchi H, Tsutsumi S, et al. Global gene expression analysis of gastric cancer by oligonucleotide microarrays. Cancer Res, 2002,62:233~240.

  6  Sorlie T, Perou CM, Tibshirani R, et al. Gene expression patterns of breast carcinom as distinguish tum or subclasses with clinical implications. Proc Natl Acad Sci USA, 2001,98:10869~10874.

  7  Golub TR, Slonim DK, Tamayo P, et al. Molecular clasification of cancer: class discovery and class prediction by gene expression monitoring. Science, 1999,286:531~537.