基于神经网络的方法预测生物活性介质网络调控矽肺纤维化的研究

来源:岁月联盟 作者: 时间:2010-07-11

                     作者:杜海舰 高宏生 伍瑞昌 王运斗

【摘要】  目的: 探讨矽肺纤维化同生物活性介质之间的关系。方法: 利用Delphi语言编制了BP人工神经模型机程序,建立并分析了矽肺胶原纤维预测的数学模型。结果: 选定网络隐含层节点为9,初始权值阈值约为(-0.2,0.2),最大相对误差为4%,最小相对误差为0.2%。 结论: 应用神经网络具有较好的预测效果,可为临床医学研究提供一个很好的研究思路。

【关键词】  BP神经网络; 生物活性介质; 矽肺; 胶原纤维; 预测

矽肺是尘肺中最严重的一种类型,是由于长期吸入超过一定浓度的含有游离二氧化硅的粉尘,肺内发生广泛的结节性纤维化。矽肺纤维化的预测困难,诊断滞后。目前,矽肺的发病机理仍然不完全清楚,尚无有效的早期诊断(筛检)方法,也无早期诊断的特异性指标和特异性的药物和方法。一经传统的后前位胸大片确诊,肺部病变已经无法逆转。因此,寻找早期诊断(筛检)特异性的生物介质组合,对预防、治疗乃至最终消除矽肺具有重要意义。矽肺的发病与细胞因子(Cytokine,CK)网络调控有密切联系,高宏生等用系统生物学的方法论证了细胞因子对矽肺纤维化的网络调控关系[1,2],论证了细胞因子复杂非线性致炎致纤维化的网络调控假说。王世鑫等用判别方程的方法,通过诊断肺纤维化正确率。矽肺纤维化与不同活性介质、基因表达等多种因素密切相关[3],因此预计是一个多目标决策问题。传统的预测方法是用多元线性回归来进行预测,统计者千方百计的想找出决策目标和各因素之间找出一个线性的公式关系,试图想用一个严格的数学模型公式表达出相应的关系。实际上,具有良好的非线性的神经网络可以预测矽肺纤维化结果。本研究图基于神经网络的方法预测生物活性介质网络调控的矽肺纤维化。

    1  神经网络的基本理论

    人工神经网络是基于对人脑组织结构、活动机制的初步认识提出的一种新型信息处理体系。通过模仿脑神经系统的组织结构以及某些活动机理,人工神经网络可呈现出人脑的许多特征,并具有人脑的一些基本功能。从本质上讲,人工神经网络是一种大规模并行的非线性动力系统。它具有许多引人注目的特点:大规模的复杂系统,有大量可供调节的参数;高度并行的处理机制,具有高速运算的能力;高度冗余的组织方式等。

    在预测领域中应用最广泛的还是BP网络。BP网络的学习算法是一种误差反向传播式网络权值训练方法。实质就象最小二乘法一样,BP算法是在样本空间中耦合这样一个曲面,即使所有的样本点均在这个曲面上,若这样的曲面不存在,就找到离样本点的距离之和最小的曲面作为近似解。

    BP网络的学习过程包括:正向传播和反向传播。当正向传播时,输入信息从输入层经隐单元处理,后传向输出层,每一层神经元的状态只影响下一层的神经元的状态。如果在输出层得不到希望的输出,则转入反向传播,将误差信号沿原来的神经连接通路返回。返回过程中,逐一修改各层神经元连接的权值。这种过程不断迭代,最后使得信号误差达到允许的误差范围之内。如图1所示为3层神经网络结构图。

    输入层      隐含层      输出层

    图1  神经网络结构

    设3层BP神经网络,输入向量为X=(x1,x2,…xn)T ;隐层输出向量为Y=(y1,y2,…ym)T ,输出层向量为O=(o1,o2,…ol)T ,期望输出向量为d=(d1,d2,…dl)T 。

    对于输出层,有ok =f(net),netk=?m   j=0wjkyj ,k=1,2,…l

    对于隐层,有yj =f(net),netj=?n   i=0vijxi ,k=1,2,…m

    f(x)=1   1+e-x ,BP学习算法权值调整计算公式为:

    Δwjk=η(dk-ok)ok(1-ok)yj

    Δvij=η(?l   k=1δ0k wjk)yj(1-yj)xi

    δ0k =(dk-ok)ok(1-ok)

    η∈(0,1)

    2  应用实例

    2.1  矽肺预测的影响因素

    大量研究表明,肺泡巨噬细胞和肺泡上皮细胞在肺组织炎症反应及纤维化病变的启动、过程中起到最为关键的作用,主要是通过分泌细胞因子、炎性介质等生物活性物质,发挥直接或间接的生物学作用。这些CK包括:白介素(interleukin,IL)、肿瘤坏死因子(tumor necrosis factor ,TNF)、转化生长因子(transforming growth factor,TGF)等。根据分泌细胞因子不同将Th 细胞分为Th1 和Th2 两种类型。Th1主要分泌白介素-2(interleukin-2,IL-2)、白介素-12(interleukin-12,IL-12)、白介素-18(interleukin-18,IL-18)、干扰素-γ(Interferon-γ,IFN-γ)等,主要介导细胞免疫应答,与炎症有关,具有抗纤维化作用,可抑制成纤维细胞的增殖及纤维的生成。Th2主要分泌白介素-4 (interleukin-4,IL-4)、白介素-5 (interleukin-5,IL-5)、白介素-10 (interleukin-10,IL-10)、白介素-13(interleukin-13,IL-13)、单核细胞趋化蛋白-1 (monocyte chemoattractant protein-1,MCP-1)等,而Th2主要介导体液免疫反应,可促进成纤维细胞的增生,导致胶原蛋白合成增加,并抑制胶原蛋白的降解,最终导致细胞外的基质蛋白沉积和纤维生成。Th1 型和Th2 型免疫应答之间存在着交互的负反馈作用,维持着正常的免疫平衡。其负反馈调节通常就是靠产生的细胞因子起作用的,即一型CK可以下调另一型CK的功能。Th1/Th2型CK失衡可导致机体对损伤的异常反应。总之,矽肺病人存在CK网络的平衡紊乱,其错综复杂的调控机制可能参与矽肺的发生和发展[6~9],如图2所示。

    图2  细胞因子网络调控图

    2.2  矽肺预测的BP网络模型的设计

    本研究运用神经网络的模型方法,对矽肺预测进行设计,得出其预测模型。

    2.2.1  输入层、隐含层、输出层的设计

    矽肺纤维化输入层的确定:根据meta分析和微分方程网络模型确定生物活性介质为输入层。

    对于矽肺预测,应当依据其关键要素来确定输入层各因素,在神经模型中,输入层可以选定白介素(interleukin,IL)、肿瘤坏死因子(tumor necrosis factor ,TNF)、转化生长因子(transforming growth factor,TGF)等。根据分泌细胞因子不同将Th 细胞分为Th1 和Th2 两种类型。Th1主要分泌白介素-2(interleukin-2,IL-2)、白介素-12(interleukin-12,IL-12)、白介素-18(interleukin-18,IL-18)、干扰素-γ(Interferon-γ,IFN-γ)作为输入层,输入单元数为8,隐含层节点的确定下面单元公式:

    c=n+m+a

    其中c 为隐层单元数,n为输入神经元个数,m 为输出神经元个数,a 为1~10之间的常数。本研究中,隐层单元数计算如下:

    8+2+1≤c≤8+2+10

      即:4.33≤c≤13.33

    根据c 的计算值,由小到大改变节点数训练并检验其精度,当节点数的增加误差不进一步减小时,其临界值即为应采用的值。最后,经过网络的实际训练结果比较,选定网络隐含层节点为9,此时网络能较快地收敛至所要求的精度。

    2.2.2  初始权值的确定

    在神经网络模型中,初始权值选取对于输出结果是否最接近实际,及是否能够收敛、学习时间的长短等关系很大。初始权值太大,使得加权之后的输入和N落在了网络模型的s型激活函数的饱和期中,从而会导致φ′(·)非常小,而由于当 φ′(·)→0时,则有δ→0,使得Δwji →0,最终使得调节过程没有什么效果。所以权值及阈值的初始值应选为均匀分布的小数经验值,约为(-2.4/F,2.4/F)之间,其中F为所连单元的输入层节点数。本模型输入端节点数为11,所以初始值约为(-0.2,0.2),可随机选取[4]。

    2.2.3  目标值及学习步长的选取

    对矽肺预测之前,应先根据影响矽肺预测的因素进行综合预测。在实际操作时,还应结合经验值。若Sigmoid函数选取反对称函数——双曲正切函数,综合评估指标的目标值D的范围也应在[-1,1]之间,也即是综合指标的无量纲数值在[0,1]之间。通常输出单元的局部梯度比输入端的大,所以输出单元的学习的步长应比输入单元小一些[5]。

    通过以上分析可得网络模型结构如图3。利用Delphi语言编制了BP人工神经网络模型计算机程序进行训练集样本训练,训练输入节点数为8,表1为矽肺预测输入训练样本和检测样本,当误差给定E=0.00005,学习步长为0.1,经200次训练,网络精度达到要求,如表2和图4所示。表1  矽肺预测输入训练样本和检测样本表2  训练样本训练次数网络误差

    样本经200次训练后,网络误差满足精度要求,隐含单元到各输入单元的权值和阈值及输出单元到各隐含单元的权值和阈值调整为表3和表4所示。

    由于矽肺预测神经网络模型经训练后,网络精度已经达到要求,可以用检验样本检测预测效果,如表5所示。

    从预测结果看,最大相对误差为4.0%,最小相对误差为0.2%,预测效果非常明显,该网络的检验性能稳定,可以很好的对矽肺进行预测。表3  隐含单元到各输入单元的权值和阈值表4  输出单元到各隐含单元的权值和阈值表5  检验样本及矽肺预测结果

    3  讨论

    本研究通过采用神经网络的方法,探讨矽肺纤维化同生物活性介质之间的关系,并建立了矽肺纤维化的影响因素和Ⅰ型胶原、Ⅲ型胶原的BP神经网络,从预测效果看,能够较准确的预测矽肺纤维化。但还应当看到神经网络应用到预测还有许多不尽如意的问题,主要的弱点之一是它是一种黑盒方法,无法表达和分析被预测系统的输入与输出间的关系,因此,也难于对所得结果作任何解释,对任何求得数据做统计检验; 二是采用神经网络作预测时,没有一个便于选定最合适的神经网络结构的标准方法,只能花大量时间采用凑试法,从许多次实验中找出“最合适”的一种。本研究在矽肺预测上运用神经网络建模上进行了初步的探讨,对网络模型的拓展性、收敛性等问题还有待于进一步的研究 。

【参考】
  1 高宏生, 伍瑞昌, 张双德, 等. 基于meta分析和微分方程模型的肺纤维化细胞因子调控网络研究. 军事医学院院刊,2008,32(3):312~316.

2 高宏生,杨霞,丁朋,等. 应用meta分析肺纤维化TNF-α的时空变化. 武警医学院学报,2008,17(8):561~562.

3 刘萍 王世鑫 陈蕾,等. 矽肺患者血清克拉拉细胞蛋白和表面活性蛋白D的改变. 中华劳动卫生职业病杂志, 2007, 25(01):18~21.

4 韩力群.人工神经网络理论、设计及应用.化学出版社,2001.

5 何海龙,王青海,王精业.神经网络在装备保障性评估中的应用. 系统工程理论与实践,2003,9:111~116.

6 Kohonen T.Self-Organization and Associative Memory. Berlin Heidelberg:Springer-Verlag,1984.

7 Lapedes A,Farber.Nonlinear signal processing using neural networks :prediction and system modelling[R].Technical Report LA-UR-87-2662,Los Alam os National Laboratory.Los Alamos.NM,1987.

8 Wang CH, Mo LR, Lin RC, et al. Artificial neural network model is superior to logistic regression model in predicting treatment outcomes of interferon-based combination therapy in patients with chronic hepatitis C.Intervirology,2008,51(1):14~20.

9 Kato H, Kanematsu M, Zhang X,et al. Computer-aided diagnosis of hepatic fibrosis: preliminary evaluation of MRI texture analysis using the finite difference method and an artificial neural network.AJR Am J Roentgenol, 2007,189(1):117~122.

10 Piscaglia F, Cucchetti A, Benlloch S,et al. Prediction of significant fibrosis in hepatitis C virus infected liver transplant recipients by artificial neural network analysis of clinical factors. J Gastroenterol Hepatol, 2006,18(12):1255~1261.

11 Paul RR, Mukherjee A, Dutta PK, et al. A novel wavelet neural network based pathological stage detection technique for an oral precancerous condition.J Clin Pathol, 2005,58(9):932~938.

12 Wang CY, Tsai T, Chen HM, et al. PLS-ANN based classification model for oral submucous fibrosis and oral carcinogenesis.Lasers Surg Med, 2003,32(4):318~326.