人工神经网络在医学研究中的应用

来源:岁月联盟 作者: 时间:2010-07-12

                 作者:李丽霞 张敏 郜艳晖 张丕德 周舒冬

【摘要】  人工神经由于其具有高度的自适应性、非线性、善于处理复杂关系的特点,在许多研究领域得到了广泛应用,并取得了令人瞩目的成就。对其目前在医学研究领域中的应用做一简单综述。

【关键词】  人工神经网络; 应用

人工神经网络(Artificial Neural Network,ANN)方法自从本世纪40年代被提出以来,许多从事人工智能、机、信息科学的科学家都在对它进行研究,已在军事、医疗、航天、自动控制、等许多领域取得了成功的应用。目前出现了许多模仿动物和人的智能形式与功能的某个方面的神经网络,例如,Grossberg提出的自适应共振理论(Adaptive Resonance Theory,ART),T-Kohenen的自组织特征映射网络(Self-Organizing feature Map,SOM),径向基函数网络(Radial Basis Function,RBF),Hopfield网等。进入90年代以后,由于计算机技术和信息技术的,以及各种算法的不断提出,神经网络的研究逐渐深化,应用面也逐步扩大,本研究对常用的神经网络方法及其在医学领域中的应用做一简单综述。

    1  自组织特征映射网络(self-organizing feature map,SOM)在基因表达数据分析中的应用

   1.1   方法介绍

    脑神经学的研究表明,人脑中大量的神经元处于空间的不同区域,有着不同的功能,各自敏感着各自的输入信息模式的不同特征。芬兰赫尔辛基大学神经网络专家T.Kohonen根据大脑神经系统的这一特性,于1981年提出了自组织特征映射网络,它模拟人的大脑,利用竞争学习的方式进行网络学习,具有很强的自组织、自适应学习能力,鲁棒性和容错能力,其理论及应用发展很快,目前已在信息处理、模式识别、图像处理、语音识别、机器人控制、数据挖掘等方面都有成功应用的实例。

    Kohonen网络由输入层和竞争层组成,网络结构见图1。输入层由N个神经元组成,竞争层由M个输出神经元组成,输入层与竞争层各神经元之间实现全互连接,竞争层之间实行侧向连接。设输入向量为x=(x1,…,xd)T ,输出神经元j对应的权重向量为wj=(wj1,…,wjd)T ,对每一输出神经元计算输入向量x 和权重向量wj 间的距离,据此利用竞争学习规则对权向量进行调节。在网络的竞争层,各神经元竞争对输入模式的响应机会,最后仅一个神经元成为胜利者,并对与获胜神经元有关的各权重朝着更有利于它竞争的方向调整,这样在每个获胜神经元附近形成一个“聚类区”,学习的结果使聚类区内各神经元的权重向量保持与输入向量逼近的趋势,从而使具有相近特性的输入向量聚集在一起,这种自组织聚类过程是系统自主、无教师示教的聚类方法,能将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变。网络通过对输入模式的学习,网络竞争层神经元相互竞争,自适应地形成对输入模式的不同响应,模拟大脑信息处理的聚类功能、自组织、自学习功能,实现用低维目标空间的点去表示高维原始空间的点,其工作原理和聚类算法及改进方法参见相关[1]。

    1.2  应用

    基因芯片技术的应用使得人们可以从基因水平探讨疾病的病因及预后,而基因芯片产生的数据具有高维度(变量多)、样本量小、高噪声的特点,样本量远小于变量数,如何从海量的数据中挖掘信息或知识成为重大课题。聚类分析是数据挖掘中的一类重要技术,传统方法主要有系统聚类、k-means聚类等,但在处理复杂非线性关系及变量间的交互作用时效果较差,受异常值影响较大。近年来神经网络技术法成为聚类领域的研究热点,其中自组织特征映射网络由于其良好的自适应性,其算法对基因表达数据的聚类有较高的稳定性和智能性,尤其在处理基因表达中有缺失数据及原始空间到目标空间存在非线性映射结构时有较好的体现,适用于复杂的多维数据的模式识别和特征分类等探索性分析,同时可实现聚类过程和结果的可视化[2]。目前Kohonen网络已被成功用到许多基因表达数据的分析中,Jihua Huang等[3]设计6×6的网络对酵母细胞周期数据进行分析,总正确率为67.7%;曹晖等[4]将其算法改进后用在酵母菌基因表达数据中,总正确率高达84.73%,有较高的聚类效能;邓庆山[5]将该模型与K平均值聚类方法结合用于公开的结肠基因表达数据集和白血病基因表达数据集,聚类的准确率分别为94.12%和90.32%。目前Kohonen网络在医学领域中主要应用前景有:① 发现与疾病相关的新的未知基因,对目标基因进一步研究,提高诊断的正确率,并对药物的开发研究提供重要的线索;② 对肿瘤组织的基因表达谱数据聚类,以期发现新的、未知的疾病亚型(肿瘤亚型),以便提出更加有针对性的方案,为从分子水平对疾病分型、诊断、预后等提供依据;③ 发现与已知基因有相似功能的基因,为推断未知基因的可能功能提供线索。

    2  BP神经网络在医学研究中的应用

    2.1  BP神经网络在疾病辅助诊断中的应用

    2.1.1  方法介绍

    BP神经网络是目前应用最多的神经网络,一般由一个输入层(input layer)、一个输出层(output layer)、一个或几个中间层(隐层)组成。每一层可包含一个或多个神经元,其中每一层的每个神经元和前一层相连接,同一层之间没有连接。输入层神经元传递输入信息到第一隐层或直接传到输出层,隐层的神经元对输入层的信息加权求和,加一个常数后,经传递函数运算后传到下一个隐层(或输出层),常用的传递函数是logistic函数,即Φh=1/(1+exp(-z)) ,输出层神经元对前一层的输入信息加权求和经传递函数Φ0 (线性或logistic函数或门限函数)运算后输出,BP神经网络一般采用BP算法训练网络,关于BP算法及改进可相关文献[1]。

    人工神经网络具有强大的非线性映射能力,含一个隐层的网络可以实现从输入到输出间的任意非线性映射,是典型的非线性数学模型,建立BP神经网络模型的一般步骤为:① BP网训练集、校验集、测试集的确定;② 输入数据的预处理:使输入变量的取值落在0到1的范围内,如果是无序分类变量,以哑变量的形式赋值;③ 神经网络模型的建立及训练:学习率、传递函数、隐层数、隐单元数的选择,注意防止过度拟合。一般使用灵敏度、特异度、阳性预测值、阴性预测值、ROC曲线对模型的预测性能进行评价。

    2.1.2  应用 

    BP神经网络已广泛用于临床辅助诊断中,白云静等[6]用于中医证候的非线性建模,建立了RA证侯BP网络模型和DN证侯BP网络模型,结果显示平均诊断准确率分别为90.72%、92.21%,具有较高的诊断、预测能力。曹志峰[7]采用PROBEN1中的甲状腺疾病数据库用于甲状腺疾病(甲亢、甲减、正常)的诊断,结果显示训练样本的正确识别率为99.3% ,测试样本的正确识别率为98.2%,提示对临床诊断甲状腺疾病提供有益的帮助;还有学者用于急性心肌梗塞、甲状腺功能紊乱、乳腺癌、前列腺癌、宫颈癌、肺癌、卵巢癌、急性肺梗塞等的辅助诊断等[8]。

    2.2  BP神经网络在生存分析中的应用

    2.2.1  方法介绍 

    传统的生存分析方法有非参数、半参数、参数模型,参数模型主要有指数回归模型、Weibull回归模型,都要求对基线风险做一定的假设,但实际资料常常不符合条件,生存分析中应用最为广泛的半参数模型:Cox比例风险模型,但它要求满足比例风险的假定,在很多情况下也难以满足。基于神经网络的生存分析模型可以克服这些困难,可以探测复杂的非线性效应,复杂的交互效应,模型中协变量的效应可以随时间变化,对数据的分布不做要求。目前一些策略被用到神经网络预测方法中分析含有删失的生存数据,主要有Faraggi-Simon(1995)法、Liestol-Andersen-Andersen(1994) 法、改良uckley-James(1979)法等。

    BP神经网络建立生存分析模型常用的方法有[9]:连续时间模型(continuous time models)与离散时间模型(discrete time models)。常用的Faraggi和Simon[10]提出的连续时间模型扩展了Cox回归模型,允许非线性函数代替通常的协变量的线性组合,这种方法既保持了Cox回归模型的比例风险的特点,又提供了处理复杂非线性关系、交互作用能力的好方法。

    离散时间模型常用的模型有:① 输出层为单个结点:模型的输出层只有一个神经元结点,是最简单的神经网络模型,生存时间被分成两个区间,当研究者仅仅对某一时间点的预后感兴趣时,例如预测癌症患者的5年生存情况,如欲预测多个时间点,则需建立多个神经网络模型(每个模型对应一个时间区间);② 输出层为多个结点:生存时间被分成几个离散的区间,估计某个时间区间事件发生的概率,Liestol法是常用的离散时间模型。还有研究者在建立多个时间区间模型时将时间也做为一个输入变量,也有学者将神经网络纳入Bayes方法的研究框架。

    一般采用灵敏度、特异度、一致性指数C(Concordance index)作为预测准确性的评价指标,神经网络在生存分析中的应用主要在于[11]:个体患者预后的预测,研究预后因子的重要性,研究预后因子的相互作用,对于预测变量的影响力强弱及解释性,还有待进一步探讨。

    2.2.2  应用  

    国外Ruth M.Ripley等[9]将7种不同的神经生存分析模型(3种离散时间模型,4种连续时间模型)用于1335例乳腺癌患者复发概率的预测,并对其精确性、灵敏度、特异度等预测性能指标进行比较,结果证明神经网络方法能成功用于生存分析问题,可以提取预后因子所蕴涵的最大可能的信息。Anny Xiang等[12]采用Monte Carlo模拟研究方法,在9种实验条件下(不同的输入结点、删失比例、样本含量等)对Faraggi-Simon法、Liestol-Andersen-Andersen法、改良Buckley-James法处理右删失生存数据的性能与Cox回归作比较,研究结果提示神经网络方法可以作为分析右删失数据的一个有效的方法。D.J.Groves[13]等将Cox回归与神经网络方法对儿童急性淋巴母细胞白血病的预后进行了比较,Lucila Ohno-Machado等[14]建立输出层为4个结点的离散时间神经网络模型做为AIDS预后研究的工具,并使用ROC曲线下面积、灵敏度、特异度、阳性预测值、阴性预测值对不同时间区间的预测性能做了评价。国内用于生存分析方面的研究还较少,黄德生[15]等利用BP神经网络建立time-coded model和single-time point model用于肺鳞癌预后预测,贺佳[16]等把BP网络用于预测肝癌患者术后无瘤生存期,也有学者对AIDS、恶性肿瘤的预后做了相关的研究。

    2.3  BP神经网络在其它方面的应用

    近年来BP神经网络在疾病筛查中的的应用引起学者的关注,例如在乳腺癌、宫颈癌、糖尿病的筛查都有成功的应用[17]。神经网络在法医学研究领域具有实用性和广泛的应用前景,法医学家将其用在死亡时间推断、死因分析、个体识别和毒物分析等研究中[18]。在药学研究中也有一定的应用,例如在定量药物设计、药物分析、药动/药效学研究中,都有成功的应用案例,相秉仁等[19]对其做了详细的综述。曹显庆[20]等还将神经网络用于ECG、EEG等信号的识别和处理、医学图像分析中,取得了较好的结果。

    人工神经网络是在研究生物神经网络的基础上建立的模型,迄今为止有代表性的网络模型已达数10种,人工神经网络不需要精确的数学模型,没有任何对变量的假设要求,能通过模拟人的智能行为处理复杂的、不确定的、非线性问题。在医学研究领域,变量间关系往往非常复杂,为了探测变量间的复杂模式,神经网络正逐渐变成分析数据的流行工具。目前国际上已出现许多著名的神经网络专业杂志:Neural Network,Neural Computation,IEEE Transaction on Neural Networks等,同时已有许多商业化的神经网络开发软件,如Matlab软件, S-plus软件,SNNS(Stuttgart Neural Network Simulator)等,高版本SAS系统中的Enterprise Miner应用模块中也可以建立神经网络模型,随着机技术的进一步,人工神经网络在医学领域的应用前景也会更加广阔。

【】
  1 余雪丽,主编.神经网络与实例学习.铁道出版社,1996.

2 白耀辉,陈明.利用自组织特征映射神经网络进行可视化聚类.计算机仿真,2006,23(1):180~183.

3 Jinua Huang,Hiroshi Shimizu,Suteaki Shioya.Clustering gene expression pattern and extracting relationship in gene network based on artificial neural networks.Journal of bioscience and bioengineering,2003,96(5):421~428.

4 曹晖,席斌,米红.一种新聚类算法在基因表达数据分析中的应用.计算机工程与应用,2007,43(18):234~238.

5 邓庆山.聚类分析在基因表达数据上的应用研究.计算机工程与应用,2005,41(35):210~212.

6 白云静,申洪波,孟庆刚,等.基于人工神经网络的中医证侯非线性建模研究.中国中医药信息杂志,2007,14(7):3~4.

7 曹志峰. BP 神经网络在临床诊断中的应用与探讨.实用医技杂志,2005,12(9):2656~2657.

8 William G Baxt. Application of artificial neural networks to clinical medicine. The Lancet,1995,346(8983):1135~1138.

9 Ruth M.Ripley,Adrian L.Harris,Lionel Tarassenko.Non-linear survival analysis using neural networks. Statistics in medicine,2004,23(5):825~842.

10 David Faraggi,Richard Simon.A neural network model for survival data. Statistics in medicine,1995,14(1):73~82.

11 高蔚,聂绍发,施侣元,等.神经网络在生存分析中的应用进展.中国卫生统计,2006,23(4):358~360.

12 Anny Xiang,Pablo Lapuerta, Alex Ryutov.Comparison of the performance of neural network methods and Cox regression for censored survival data.Computational statistics & data analysis,2000,34(2):243~257.

13 D.J.Groves,S.W.Smye,S.E.Kinsey.A comparison of Cox regression and neural networks for risk stratification in case of acute lymphoblastic leukaemia in children.Neural computing & applications,1999,8(3):257~264.

14 Lucila Ohno-Machado.A comparison of cox proportional hazards and artificial neural network models for medicial prognosis.Comput Biol Med,1997,27(1):55~65.

15 黄德生,周宝森,刘延龄,等.BP人工神经网络用于肺鳞癌预后预测.中国卫生统计,2000,17(6):337~340.

16 贺佳,张智坚,贺宪民.肝癌术后无瘤生存期的人工神经网络预测.数理统计与管理,2002,21(4):14~16.

17 黎衍云,李锐,张胜年.人工神经网络及其在疾病筛查中的应用前景.环境与职业医学,2006,23(1):71~73.

18 汪岚,刘良.人工神经网络的法医学应用.中国法医学杂志,2005,20(3):161~163.

19 相秉仁,高守国.人工神经网络在药学中的应用.上海医药,2001,22(5):210~212.

20 曹显庆.人工神经网络技术在医学研究中的应用. 临床医学生物工程学杂志,2003,9(1):57~60.