乳腺癌针吸细胞形态定量的人工神经网络诊断模型的建立及应用研究

来源:岁月联盟 作者: 时间:2010-07-14

                  作者:龚平, 郭华雄, 王文清, 李春燕

【摘要】  目的 建立乳腺癌针吸细胞形态定量参数的人工神经诊断模型,并验证其在辅助FNA诊断乳腺癌的价值。方法 利用MPIAS?2000系统对60例乳腺癌及30例乳腺良性病变的针吸细胞学涂片进行形态定量测定,对获得的29项形态参数进行人工神经网络建模分析,并用盲法对其鉴别诊断能力进行评价。结果 所建立的网络模型经过14次训练后即可达到误差要求,诊断模型对乳腺癌及乳腺良性病变的诊断正确率为100%,其特异性和敏感性均为100%。结论 乳腺良恶性病变的针吸细胞学涂片进行ANN分析所建立的诊断模型,对乳腺癌及良性病病变的鉴别诊断具有较高的应用价值,为辅助针吸细胞学诊断乳腺良恶性病变提供了新的思路。

【关键词】  针吸细胞学; 乳腺癌; 细胞形态定量参数; 人工神经网络; 诊断模型

    Abstract: Objective  To establish diagnostic models of cell form parameters in mammary carcinoma FNA?s smears by an artificial neural network (ANN) methods,and apply the models to discriminate the mammary cancer and benign lesion. Method  The cell form quantitative parameters of 60 breast cancer cases and 30 benign lesion cases were analysis by MPIAS?2000,all of cases were provided pathologically. The ANN diagnosis models of cancer and benign lesion were established combined with the 29 cell quantitative parameters. The blind?test set were used to confirm the models. Results  The ANN model?s  meet performance goal by 14 times trainlm. ANN model of cell form quantitative parameters had an accuracy and specialty of 100% for differentiation of breast carcinoma and benign lesion. Conclusion  Method of erecting models based on cell form quantitative parameters with ANN could identify breast carcinoma and benign lesion. It may be valuable and new idea for FNA?c in the differentiation of breast diseases.

    Key words: fine needle aspiration cytology; mammary carcinoma; cell form quantity parameter;   artificial neural network; diagnostic model

    乳腺癌是人类最常见的一种恶性肿瘤,也是女性主要恶性肿瘤之一。 针吸细胞学对术前早期诊断乳腺肿块的性质具有简便、快速、准确等特点,其诊断的准确率达到90%以上。目前对乳腺癌的针吸细胞学研究大多基于细胞形态学描述及肿瘤标志物的检测,少有对其肿瘤细胞本身进行形态学定量的研究。本研究通过细胞形态定量方法,并用人工神经网络(artificial neural network,ANN)进行建模分析,以建立高特异性和敏感性的乳腺癌的针吸细胞学定量诊断模型;同时用盲法验证模型的准确诊断率,判断其应用价值。

    1  对象和方法

  1.1  对象    2000年至2007年本院住院经病理确诊的乳腺癌患者60例,乳腺良性病变30例。乳腺癌均为女性,年龄24~68岁;良性病变也为女性,年龄18~47岁,良性病变中乳腺纤维腺瘤24例,乳腺增生6例。所有病例均先行细胞病检查,最后经组织病理学证实。

    1.2  细胞学制片与染色

    研究标本均为针吸细胞学涂片,用推片法制成,待干燥后用瑞—吉氏复合染色法(Wright?s?Giemsa?s staining)染色[1]。染色时间10  min。

    2  图像分析与参数选择

  2.1  图像分析    在HPIAS?2000图像分析系统(武汉清平影像有限公司)中通过定标处理后,选择细胞—细胞核测量功能,对CCD获取的细胞涂片图像进行二值化处理,将二值化的细胞进行滤波及连断分隔,用点测量或自动测量法进行测量。如细胞与背景二值化不明显时,可采用画的方式(椭圆逼近法或自由画线法)进行标记测量。

    2.2  测量细胞个数

    乳腺癌每例随机选择细胞50个,60例;乳腺良性病变每例随机选择细胞30个,30例。

    2.3  参数选择

    选择的定量参数共有29个,分别是:与细胞及细胞核有关的面积、周长、直径、形态因子、圆球度、异形指数、X投影、Y投影、S体积、L体积等20个参数,与细胞浆有关的细胞浆面积、胞浆厚度Me、胞浆厚度Ma、胞浆厚度Mi等4个及核浆比值、核浆中心距及细胞比表面、细胞浆及细胞核体密度。

    2.4  定量参数获取

    HPIAS?2000所测定数据为Access格式,转换后进行数据归一化处理,以备后续建模分析。

    3  数据处理及ANN建模设计

    用ANN软件MATLAB建立诊断模型。ANN采用前馈式反向传播算法,分设三层,输入层29个神经元,隐含层8个神经元,输出层2个神经元。各层之间均采用Tan?Sigoid传递函数(tansig),训练函数使用Scaled Conjugate Gradient算法;权重与偏值随机初始化,系统误差阈值为10-8。本研究的乳腺癌与乳腺良性病变的针吸细胞形态定量参数作为输入值,设定乳腺癌的目标值为1,乳腺良性病变的目标值为0,所有样本随机划分,2/3作为训练组,1/3样本为盲法测试组;所用软件为MATLAB 7(R14)For Windows。

    4  模型验证

    用盲法测试所建模型对乳腺癌及乳腺良性病变的鉴别诊断准确率。

    5  结果

  5.1  建模训练结果    ANN 模型建立后,经过机程序处理,得到的网络训练结果为:

    TRAINLM, Epoch 0/3000, MSE 0.481259/1e?008, Gradient 5.66104/1e?020

    TRAINLM, Epoch 14/3000, MSE 4.58661e?009/1e?008, Gradient 1.69586e?006/1e?020

    TRAINLM, Performance goal met.

    从上可知,网络经过14次训练后即可达到误差要求,结果如图1所示:

    图1  训练结果

    5.2  盲法测试结果

    60例乳腺癌及30例乳腺良性病变中的2/3进行建模训练(癌目标值为1,良性目标值为0,0~0.5为良性病变,0.5~1为癌)。用模型对剩余1/3病例作盲法诊断测试,其敏感性为100%,特异性为100%。见表1:表1  乳腺癌(20例)与乳腺良性病变(10例) 人工神经

    模型的盲法测试结果

    分组预测

    例数预测

    乳腺癌

    (0.5~1)预测良性

    病变

    (0~0.5)预测指标

    (%)乳腺癌20200100(敏感性)乳腺良性病变10010100(特异性)合计302010100

    6  讨论

    针吸细胞学作为早期诊断乳腺癌的工具,仍然有近10%的病例依靠传统方法不能作出明确诊断。以往用定性的方法,常常描述如“细胞增大”、“核增大”,“核浆比例增大”等不确切的宏观量的变化,没有严格的数学论据,这样描述给细胞病理研究带来较多问题。由于在很大程度上带有观察者的主观性和片面性,对同一样本不同时间、不同观察者甚至同一观察者可能作出不同的结论。因此人们一直在寻找一个比较严格的数量来规范这些抽象的描述。随着的,新技术和新方法在不同学科间的相互交叉融合,边缘学科不断出现,推动着诊断细胞学的进步。图像分析技术在细胞形态学中的成功应用,使得细胞学研究由传统的描述定性向形态定量定性转变。我们以前的研究[2~6]用图像分析技术对乳腺良恶性病变的针吸细胞的形态进行定量描述研究,发现乳腺癌与乳腺良性病变的部分细胞形态定量参数有明显的统计学差异;这些参数的差异可以用于辅助针吸细胞学鉴别诊断乳腺良恶性病变。

    由于数学方法学的进步和机技术的发展,人工神经网络技术的应用日益成熟。人工神经网络技术是在神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理的一种方法。它是涉及神经科学、思维科学、人工智能、计算机科学等多个领域的交叉学科。人工神经网络是并行分布式系统,采用了与传统人工智能和信息处理技术完全不同的机理,克服了传统的基于逻辑符号的人工智能在处理直觉、非结构化信息方面的缺陷,具有自适应、自组织和实时学习的特点,使之在神经专家系统、模式识别、智能控制、组合优化、预测等领域得到成功应用[7]。ANN作为一种自适应的模式识别技术,并不需要预先给出有关模式的经验知识和判别函数,它通过自身的学习机制自动形成所要求的决策区域;网络的特性由其拓扑结构、神经元特性、学习和训练规则所决定。它可以充分利用状态信息对来自不同状态的信息逐一进行训练,而求得某种映射关系,而且网络可以连续学习,如果环境发生改变,这种映射关系还可以自适应的进行调整。基于其特性,本研究将ANN的前馈式反向传算法与细胞形态学定量相结合,对乳腺良恶性病变的细胞形态参数进行建模分析,以辅助鉴别诊断乳腺肿块的性质。本研究的盲法测试结果表明ANN模型诊断乳腺癌与乳腺良性病变的准确性与特异性均达到了100%。

    本研究为生物信息学结合临床细胞学诊断的应用性研究,ANN应用于临床细胞学领域可见于口腔脱落细胞[8,9]、胆管刷片细胞[10]及甲状腺滤泡型肿瘤的细胞学中[11],我们首次在乳腺针吸细胞学领域,用ANN的方法对细胞形态定量参数进行建模分析,且定量参数多达29项,未见相同报道。由于ANN能同时分析处理较多样本数据,并非一对一的诊断判定摸式,而是模拟大脑神经网络处理、记忆方式进行信息处理,具有的自适应、自组织和实时学习等特性,最终优化了检测结果的判断。本研究模型结果与结论由于病例数及病种的限制,而且均为细胞学与病确诊病例的回顾性研究,因此具有相当的敏感性和特异性。作为临床初步性的研究,预计后期增加病例数和病种数,特别是针吸细胞形态学不典型的乳腺癌及乳腺良性病变的病例,同时对定量参数数量进一步优化,以进一步提高模型的适用性和通用性,为辅助针吸细胞学诊断乳腺良恶性病变提供了新的方法和思路。

【】
  [1]赵桂芝, 王淑娟.临床检验学 [M].四川科学技术出版社,200l:20-21.

  [2]周治兰, 张国明, 王昌富,等. 细胞形态在乳腺良恶性病变中的体视学定量研究 [J].体视学与图像分析,1998,(32):105-108.

  [3]周治兰, 郭华雄, 龚平,等. 乳腺癌针吸细胞体视学定量与细胞形态学分型的探讨 [J].肿瘤防治研究,1998,25(5):48-352.

  [4]周治兰, 龚平, 王昌富,等. 细胞形态计量对针吸细胞学诊断小细胞型乳腺癌的探讨 [J].同济医科大学学报,2001,30(2):181-183.

  [5]周治兰, 王昌富, 郭华雄,等.乳腺癌针吸细胞图像光度学计量研究 [J].肿瘤防治研究,2002,29(5):370-372.

  [6]周治兰, 许州, 龚平,等.细胞图像光度学计量对鉴别诊断小细胞型乳腺癌的价值研究 [J].中国体视学与图像分析,2003, 8(2):88-90.

  [7]飞思科技产品研发中心.神经网络理论与MATLAB7实现 [J].出版社, 2005年3月第1版,26-32.

  [8]龚平, 周治兰, 王昌富.脱落细胞学技术在口腔癌诊断中的应用 [J].国际检验医学杂志,2006,27(8):745-747.

  [9]Brickley M R, Cowpe J G, Shepherd J P. Performance of a computer simulated neural network trained to categorise normal, premalignant andmalignant oral smears[J]. Oral PatholMed, 1996, 25(8): 424-428.

  [10]龚平, 周治兰, 王昌富.胆管癌刷片细胞学诊断进展 [J].中华肝胆外科杂志,2007, 13(04):283-285.

  [11]Poloz T L, Shkurupii V A, Poloz V V,et al.The results of quantitative cytological analysis of the structure of follicular thyroid tumors using computer and neural network technologies [J]. Akad Med Nauk, 2006,(8):7-10.