基于细胞散点图构建的细胞核心自动提取技术
【摘要】 本文提出细胞散点图的概念和用途。通过分析比较经典的距离变换技术的原理和结果,提出基于细胞散点图构建的细胞核心提取技术,其基本思想是:如果是单个细胞,则根据区域内像素的平均坐标值来提取核心;如果是重叠细胞,则利用数学形态学的腐蚀操作,将重叠细胞边界一层剥离,直至分离成单个细胞,之后提取分离后单个细胞的核心作为重叠细胞区域中各个细胞的核心。实验结果证明这一提取技术可靠,准确度高。
【关键词】 细胞散点图; 核心提取; 距离变换; 数学形态学; 重叠细胞
Abstract: A concept and application of cell scatter plot was proposed in this article. A technique on extracting cell core based on creating scatter plot was proposed by comparing and analyzing the principle and results of distance transformation. If the target is a single cell, the cell core can be calculated by the means of coordinates of all pixels in the cell region. If the target is overlapping cells, erode operation can be used to separate the overlapping cells into some single cells, then to calculate the cores of these separate cells. The results of the present study demonstrated that the proposed technique is accurate and satisfactory.
Key words: scatter plot, cells; extracting cell core; distance transformation; arithmetic morphology; overlapping cells
引言
在细胞图像分析中,细胞计数以及细胞分布均匀度是非常重要的指标[1]。然而在实际的测量过程中,由于切片和细胞本身的原因,经常会出现多个细胞重叠在一起形成一个较大的区域,如淋巴结中的淋巴细胞,癌组织中的癌细胞等,这种现象影响了细胞计数和细胞分布均匀度的测量结果。将重叠的细胞分离成单个细胞之后测量细胞个数和分布均匀度准确性高,但这样增加了技术的复杂度。如果能设计一种方法,将每个细胞图像用位于图像核心的一个像素点来表示,这样构成的图定义为细胞散点图。在细胞散点图中,我们很容易出细胞个数以及分布均匀度[2]。从细胞散点图的定义可知,获取细胞散点图的关键是提取出单个细胞以及重叠细胞的核心。目前,提取细胞核心经典的方法是距离变换[3-6],但这一技术能否用于细胞散点图情况下的核心提取呢?本文对距离变换的原理和结果进行分析,针对其不足提出一个新的细胞核心提取技术。1 基于距离变换的细胞核心提取原理及结果分析所谓距离变换,就是将图像中目标区域的像素值变换为与该区域边缘的最短距离值,用距离值来表示的图像称距离变换图像。因此在距离变换图像中,越接近区域边界的像素点,其距离值越小;越接近核心的像素点,距离值越大,而核心处的距离值最大。因此通过距离变换后提取图像中的最大值就可确定核心。
我们将基于距离变换的核心提取技术应用于细胞图像时发现:如果是单个类圆形细胞,得到的核心位于细胞的中央,如图1a所示;如果是单个类椭圆形细胞,得到的核心近似一条不连续的直线,如图1b所示;如果是串联的重叠细胞[7],得到的核心近似多条不连续的直线,如图1c所示;如果是并联的重叠细胞[7],获得的核心是一些散在的点,如图1d所示。在基于距离变换的核心提取技术中,由于等距离的原因,距离变换计算得到的每个细胞核心可能不止一个,它是由多个像素点组成的核心区,这显然不符合本研究的要求。在细胞散点图的研究中,每个细胞核心必须是一个位于图形核心的像素点。由此可见,基于距离变换的核心提取技术仅适合于类圆形细胞。而本文研究的细胞图像中包含形态不一的细胞,且存在许多细胞重叠情况,因而需要设计新的技术应用于细胞散点图中的细胞核心提取。图1 基于距离变换的细胞核心提取
2 细胞核心提取新技术
细胞重叠在一起时,各细胞一般都有自己的核心(注意:此处的核心不是细胞学意义上的核心,是细胞图形的核心)。对于重叠细胞,如果能它分开成单个细胞,就能将问题简化为计算单个细胞的核心坐标。因此关键技术是如何将重叠细胞分开。基于这样的考虑,本文提出重叠细胞核心提取新技术:首先采用数学形态学上的腐蚀操作将重叠细胞的边界一层层地剥离,直至细胞分开,不再重叠。在腐蚀的过程中,细胞的形状缩小,但细胞的核心位置未发生改变,因此可以利用腐蚀后被分开的单个细胞核心作为腐蚀前重叠细胞的核心。
2.1 单个细胞核心提取
单个细胞的核心坐标可用细胞区域内所有像素点的平均坐标来表示。假定单个细胞区域的像素总个数为N,每个像素的水平坐标为Xi,垂直坐标为Yi,其中0
腐蚀操作是数学形态学的基本运算,其原理是反复去除图形表面像素,将图形逐步缩小,以达到消去点状图形的效果。其运算符定义为“?”,公式定义如下:A?B={x|(B)x?A}.(2) 我们设计的重叠细胞核心提取技术是在腐蚀操作的基础上实现的,技术流程如图2所示。
具体实现步骤如下:
1. 提取细胞图像中的每个连通区,判断是否存在细胞重叠的情况。在前一段的研究中,我们提出了基于形状因子分析的重叠细胞判别研究[8],即根据重叠细胞形状因子的阈值P0=0.5进行判断:当目标的形状因子PE≦P0,认为目标存在细胞重叠;PE>P0,认为目标是单个细胞。实验结果证明本法能检测出不同形状的重叠细胞,准确率为95%。在本文中,我们利用这一原理对连通区是否存在细胞重叠进行判断。
2. 如果是单个细胞,计算单个细胞的核心坐标。核心个数变量count加1,核心坐标值存放在数组X(count)和Y(count)内。如果是重叠细胞,转入步骤3。图2 细胞核心提取新技术流程图
3. 令结构元素B是半径为2,圆心在圆点的欧几里德圆盘。对重叠细胞图像A反复利用B连续地腐蚀。每腐蚀一次,计算出图像A中连通区的个数num。
4. 如果连通区的个数num=1,再次判断细胞是否重叠:如果还是重叠,返回步骤3;没有重叠,核心数count自动加1,计算单个细胞的核心坐标,存放在数组X(count)和Y(count)中,转入步骤6。如果连通区的个数num大于1,执行步骤5。
5. 分别提取出图像A中的各个连通区,对每个连通区分别处理。首先判断每个连通区是否重叠:如果连通区不重叠,所有不重叠的连通区的个数count1, 重叠细胞核心数count=count+count1;并计算出所有不重叠连通区的核心坐标,存放在数组X(count)和Y(count)中;然后将此连通区的所有像素值置为0,即将已计算出核心的连通区从图像A中清除。对仍然存在重叠的连通区,返回步骤2。
6. 根据X(count)和Y(count)的值生成细胞散点图。
3 实验结果
我们在Matlab6.1环境下将上述技术应用于串联细胞和并联细胞的核心提取,效果满意。图3显示2个串联细胞的核心提取过程及结果,图4显示3个串联细胞的核心提取过程及结果,图5显示3个并联细胞的核心提取过程及结果。
图6a是我们采集到的实际细胞图,图6b是提取核心之后的散点图。此散点图可用于细胞个数以及分布参数的定量。图3 2个串联细胞核心提取过程及结果
图4 3个串联细胞核心提取过程及结果
图5 3个并联细胞核心提取过程及结果
图6 细胞散点图提取过程
图7 重叠紧密的细胞提取核心前的处理
4 讨论
在计算细胞核心时,用结构元素B对重叠区域A反复腐蚀,其中结构元素的大小和形状会影响核心的计算结果,需结合实际应用情况合理地选择。由于细胞的形状通常是类圆形或类椭圆形,因此结构元素往往采用圆形结构。此外圆形结构的大小要根据图像的特点反复训练,如果细胞小,圆形结构的半径也相应地要小。
由于本技术是在腐蚀分离细胞的基础上计算各个细胞的核心,如果细胞重叠比较紧密,如图7a所示,即使重叠区域全部腐蚀完也不能完全分离细胞。对于这类细胞,可以先做一次距离变换,使得细胞重叠处凹陷变得明显,如图7b所示,再运用本技术计算出核心。
如果细胞重叠在一起时基本上不产生凹陷,有可能得到的核心个数少于实际的核心。任何一种算法都有它的局限性,本技术计算核心的前提是细胞重叠在一起时需要一定的凹陷特征。对于没有明显凹陷特征的重叠细胞,必要时需提取出来之后,在程序中借助鼠标来半自动地提取核心。
5 结论
本文在分析比较了经典的距离变换技术的原理与结果后,提出了细胞核心提取新技术,目的是获得细胞散点图,用于细胞计数以及分布均匀度等分布参数的定量。如果是单个细胞,则根据区域内像素的坐标平均值提取核心。重叠细胞核心提取采用了数学形态学的腐蚀操作,其基本思想是将细胞边界一层层剥离,直至分离成单个细胞,之后提取分离后单个细胞的核心作为重叠细胞区域中各个细胞的核心。实验结果证明这一提取技术可靠,准确度高。不足之处是:如果细胞重叠比较多,凹陷不是很明显时,该技术有可能不能提取出所有的核心,对于这一问题,需先运行一次距离变换,然后运用本技术。必要时需借助鼠标来半自动地提取核心。
【】
[1]申洪,沈仲英. 实用生物体视学技术. 中山大学出版社[M]. 1990,10:142-146.
[2]申洪. 二维粒子分布均匀度测算方法研究. 数理医药学杂志[J]. 1993, 6 (1): 5-8.
[3]Dwi Anoragaingrum. Cell segmentation with median filter and mathematical morphology operation [A].In Proc of the IEEE 10th International Conference on Image Analysis and Processing9ICIAP[C].1999,1034-1046.
[4]Wu Keng. Live cell image segmentation. IEEE Trans On Biomedical Engineering[J].1995,42(1):1-12.
[5]孙忠林,李盛阳. 数学形态学在细胞分离中的应用. 山东科技大学学报(版) [J]. 2004, 23(1):28-31.
[6]刘秉瀚,王伟智,郑智勇,等. 病理图像中重叠细胞自动分离的研究. 体视学与图像分析[J].2002, 1:28-31.
[7]傅蓉, 申洪. 基于凹点搜寻的重叠细胞图像自动分离的算法研究.计算机工程与应用[J]. 2007, 17.
[8]傅蓉, 申洪. 基于形状因子分析的重叠细胞判别技术研究. 军事医学科学院院刊[J], 已录用.











