第八章 图像分割、特征提取与描述
DESCRIPTION
第八章 图像分割、特征提取与描述. 主要内容 8.1 引言 8.2 图像分割 8.3 图像的特征 8.4 图像的描述. 8.1 引言. 图像分割是将图像划分为若干互不相交的小区域的过程。 小区域是某种意义下具有 共同属性 的象素的连通集合, 如物体所占的图像区域、天空区域等。 连通的概念是指集合中任意两个点之间都存在着完全属于该集合的连通路径。对于离散图像而言,连通有 4 连通和 8 连通之分. 8 连通. 4 连通. 8.1 引言. - PowerPoint PPT PresentationTRANSCRIPT
第八章 图像分割、特征提取与描述
主要内容 8.1 引言 8.2 图像分割 8.3 图像的特征 8.4 图像的描述
8.1 引言 图像分割是将图像划分为若干互不相交的小区域的
过程。小区域是某种意义下具有共同属性的象素的连通集合,如物体所占的图像区域、天空区域等。
连通的概念是指集合中任意两个点之间都存在着完全属于该集合的连通路径。对于离散图像而言,连通有 4 连通和 8 连通之分
4 连通 8 连通
8.1 引言
图像分割是图像理解的基础,而在理论上图像分割又依赖图像理解,彼此是紧密关联的。图像分割在一般意义下是十分困难的问题,目前的图像分割一般作为图像的前期处理阶段,是针对分割对象的技术,是与问题相关的,如最常用到的利用阈值化处理进行的图像分割。
8.1 引言
图像分割有二种不同的途径:1. 区域法:将各象素划归到相应物体或区域的
象素聚类方法2. 边界方法:通过直接确定区域间的边界来实
现分割
8.2 图像的分割
8.2.1 、并行区域技术-基于阈值的图像分割技术8.2.2 、串行区域技术8.2.3 、并行边界技术-基于边界的图像分割
8.2 图像的分割
8.2.1 、并行区域技术-基于阈值的图像分割技术8.2.2 、串行区域技术8.2.3 、并行边界技术-基于边界的图像分割
8.2.1 并行区域技术-基于阈值
取阈值是最常见的并行的直接检测区域的分割方法。阈值是在分割时作为区分物体与背景象素的门限,大于或等于阈值的象素属于物体,而其它属于背景。这种方法对于在物体与背景之间存在明显差别(对比)的景物分割十分有效。实际上,在任何实际应用的图像处理系统中,都要用到阈值化技术。为了有效地分割物体与背景,人们发展了各种各样的阈值处理技术,包括全局阈值、自适应阈值、最佳阈值、局部阈值 等。
8.2.1 并行区域技术-基于阈值 单阈值分割
只用一个阈值分割。 多阈值分割 用多个阈值分割。在一般的多阈值情况下,多阈值
分割取为:
kkTyxfTkyxg
),(),(
1如
Tyxf
Tyxfyxg
),(
),(
0
1),(
如如
8.2.1 并行区域技术-基于阈值
( 1 )极小值点阈值 对于双峰直方图,选取两个峰之间的谷对应的灰度
值作为阈值。
将直方图的包络看作一条曲线,求直方图包络线的极小值点对应的灰度值作为阈值。
8.2.1 并行区域技术-基于阈值
在阈值化处理之后,可以通过直接跟踪物体边界的方法将物体区域分割出来,得到其轮廓并进一步分析其几何形状特征。
8.2.1 并行区域技术-基于阈值
8.2.1 并行区域技术-基于阈值
( 2 )最佳阈值
有时目标和背景的灰度值有部分交错,用1个全局阈值不能将它们绝然分开。希望减小误分割的概率,选取一个最佳阈值。阈值的选择需要根据具体问题来确定,一般通过实验来确定。
8.2.1 并行区域技术-基于阈值
( 3 )直方图变换
利用象素邻域的局部性质变换原来的直
方图得到一个新的直方图。新的直方图
或者谷更深或者谷变成峰,更容易检测。
常用的方法是用象素的梯度值。
8.2.1 并行区域技术-基于阈值
( 4)灰度和灰度平均图 物体与背景各自的灰度都较均匀二者相差不大时,分割时可以这样处理:横轴取象素的灰度r,纵轴取 r 的邻域的平均 。直方图 为坐标点上的象素数目。边界上的点将远离对角线,因此选远离对角线的点的灰度作为分割的灰度门限将获得较好的分割效果。
r ), rr(
8.2.1 并行区域技术-基于阈值
( 5)灰度值和梯度值散射图 做直方图( r, g)横轴取象素的灰度 r,纵轴取 r的梯度 g。直方图( r, g)为具有某个灰度和梯度值的象素数目。
8.2 图像的分割
8.2.1 、并行区域技术-基于阈值的图像分割技术8.2.2 、串行区域技术8.2.3 、并行边界技术-基于边界的图像分割
8.2.2 串行区域技术
一、区域生长
二、分裂合并
一、区域生长
区域生长方法是根据同一物体区域内象素的相似性质来聚集象素点的方法,从初始区域(如小邻域或甚至于每个象素)开始,将相邻的具有同样性质的象素或其它区域归并到目前的区域中从而逐步增长区域,直至没有可以归并的点或其它小区域为止。区域内象素的相似性度量可以包括平均灰度值、纹理、颜色等信息。关键是相似性度量准则以及初始区域或象素的确定。
8.2.2 串行区域技术
8.2.2 串行区域技术 图像:
5 5 8 6 取跟踪门限 T = 2 5 5 8 6 4 8 9 7 4 8 9 72 2 8 3 2 2 8 33 3 3 3 3 3 3 3
生长准则:区域任一象素与其邻点灰度差 <T
结果与起始点选择和门限选择有关
8.2.2 串行区域技术 图像:
5 5 8 6 5 5 8 6 5 5 8 64 8 9 7 4 8 9 7 4 8 9 72 2 8 3 2 2 8 3 2 2 8 33 3 3 3 3 3 3 3 3 3 3 3
生长准则:待检测象素的灰度与已检测的区域的平均灰
度差 <T 例:取跟踪门限 T = 2
结果与起始点选择 ( 如选 6) 和门限选择有关
8.2.2 串行区域技术 二、区域分裂与合并
从整个图像开始不断分裂得到各个区域。实际中常
常先把图像分成任意大小且不重叠的区域,然后再合并或分裂这些区域以满足要求。
8.2.2 串行区域技术
确定均匀性准则。例如以一个区对某种特征(如灰度、
彩色或纹理)的均匀性为准则,通常用门限 T 来约束。
对满足均匀性准则的小区则合并,不满足均匀性准则
的小区则采用四叉树的方式将此区等分为四个小区。
8.2.2 串行区域技术
1 0 0 0 8 7 7 7
1 1 1 1 8 8 8 8
0 0 0 0 7 8 8 8
0 0 0 1 7 8 8 7
4 4 3 3 7 8 1 0
3 3 4 4 8 8 1 0
8 7 1 1 1 1 1 1
8 7 1 1 1 1 0 1
1 0 0 0 8 7 7 7
1 1 1 1 8 8 8 8
0 0 0 0 7 8 8 8
0 0 0 1 7 8 8 7
4 4 3 3 7 8 1 0
3 3 4 4 8 8 1 0
8 7 1 1 1 1 1 1
8 7 1 1 1 1 0 1
8.2.2 串行区域技术
1 0 0 0 8 7 7 7
1 1 1 1 8 8 8 8
0 0 0 0 7 8 8 8
0 0 0 1 7 8 8 7
4 4 3 3 7 8 1 0
3 3 4 4 8 8 1 0
8 7 1 1 1 1 1 1
8 7 1 1 1 1 0 1
1 0 0 0 8 7 7 7
1 1 1 1 8 8 8 8
0 0 0 0 7 8 8 8
0 0 0 1 7 8 8 7
4 4 3 3 7 8 1 0
3 3 4 4 8 8 1 0
8 7 1 1 1 1 1 1
8 7 1 1 1 1 0 1
8.2 图像的分割
8.2.1 、并行区域技术-基于阈值的图像分割技术8.2.2 、串行区域技术8.2.3 、并行边界技术-基于边界的图像分割
8.2.3 并行边界技术-基于边界的图像分割
边缘检测是所有基于边界的分割方法的第一步。视觉系统对图像的边缘更敏感,而不是根据点的灰度区分出物体,人对边界的识别机理也不是设置一个灰度门限 T 来分割物体的。
图像增强讨论了用梯度、拉普拉斯算子以及高通滤波增强图像边缘轮廓的方法,实际上,对增强后的图像边缘轮廓进行门限化处理,就可以用于边缘检测。
8.2.3 并行边界技术-基于边界的图像分割
一、梯度边缘检测 当物体与背景有明显对比度时,物体的边界处于图像梯
度最高的点上,通过跟踪图像中具有最高梯度的点的方式获得物体的边界,可以实现图像分割。这种方法容易受到噪声的影响而偏离物体边界,通常需要在跟踪前对梯度图像进行平滑等处理,再采用边界搜索跟踪算法来实现。
8.2.3 并行边界技术-基于边界的图像分割
梯度图像 阈值化梯度图像
8.2.3 并行边界技术-基于边界的图像分割
二、边界提取与轮廓跟踪 为了获得图像的边缘人们提出了多种边缘检测方法。在
边缘图像的基础上,需要通过平滑等处理去除噪声点、毛刺、空洞等不需要的部分,再通过细化、边缘连接和跟踪等方法获得物体的轮廓边界。
例:采用光栅跟踪(顺序跟踪)的方法
8.2.3 并行边界技术-基于边界的图像分割
步骤:
1 )先用高阈值 Th(检测阈值)检出图像轨迹曲线的初选点。
2 )从第一行的初选点开始用较低阈值 Tl(跟踪阈值)对初选
点的下三个点进行判断。在阈值范围之内的接收,反之去除。
3 )对应于某个检出点,如果下一行无可接收的对象,则这条曲线跟踪即可结束。
8.2.3 并行边界技术-基于边界的图像分割
步骤:4 )对应于某个检出点,如果下一行有多个可接收的对象,
则这条曲线发生分支。跟踪对各个分支同时进行。
5 )对于不在第一行的其他初选出来的象素,从该点开始,重新使用跟踪阈值进行跟踪,以检出不是从第一行开始的其他曲线。
8.2.3 并行边界技术-基于边界的图像分割
原图像 用阈值 T = 7 处理的结果
9 0 0 0 8 0 0 0
4 7 1 2 5 3 3 2
2 2 8 0 1 7 2 1
0 5 3 2 6 0 0 9
8 7 0 1 7 1 6 0
2 1 1 1 8 0 7 0
3 2 6 5 9 2 1 8
4 1 0 7 3 0 3 1
9 8
7
8 7
9
8 7 7
8 7
9 8
7
8.2.3 并行边界技术-基于边界的图像分割
用阈值 T = 4 处理的结果 用检测阈值 Th= 7 和跟踪阈值
Tl= 4 处理的结果
9 8
7 5
8 7
5 6 9
8 7 7 6
8 7
6 5 9 8
4 7
9 0 0 0 8 0 0 0
0 7 1 2 5 3 3 2
2 2 8 0 1 7 2 1
0 5 3 2 6 0 0 9
8 7 0 1 7 1 6 0
2 1 1 1 8 0 7 0
3 2 6 5 9 2 1 8
4 1 0 7 0 1 3 1
8.2.3 并行边界技术-基于边界的图像分割
检测与跟踪时的准则不一定是灰度,也可以是梯度等反映局部性质的量。
光栅顺序跟踪跟光扫描方向有关,最好用其他方向再跟踪一次,例如逆序向上,两种方法综合起来能得到更好的效果。
若边缘和扫描方向平行时效果不好,最好在垂直方向跟踪一次。
8.2.3 并行边界技术-基于边界的图像分割 三、 HOUGH 变换 HOUGH变换是利用图像全局特性而将边缘象素连接起来组
成区域封闭边界的一种方法。在预先知道区域形状的情况下,用哈夫变换可以很方便的得到边界曲线而将不连续的边缘象素点连接起来。哈夫变换的主要优点:受噪声和曲线间断的影响较小。利用哈夫变换可以检测图像中某些符合参数模型的主导特征,如直线、圆、椭圆等,可以通过对其参数进行聚类的方法,抽取相应的特征。适用于二值图像。
8.2.3 并行边界技术-基于边界的图像分割 哈夫变换的基本思想是:点――线对偶性。在图像空
间 XY中,所有过点的直线满足直线方程:
p为斜率, q为截距
所以: 可以认为该式是参数空间 PQ中过点 (p,q) 的一条直线。
qpxy ypxq
Y
X0
Q
P
jj yx , ii yx , ‘q
‘p
ii ypxq
jj ypxq
这条直线上所有点的 p , q 相同
8.2.3 并行边界技术-基于边界的图像分割
显然, XY空间中的共线的点对应 PQ空间中一组相交的线,这组线的交点就是 p, q。反过来,在参数空间相交于同一个点的所有直线在图像空间中都有共线的点与之对应。这就是点―线对偶性。哈夫变换就是根据这些关系把图像空间中的检测问题转换到了参数空间中,通过在参数空间中进行简单的累加统计完成检测任务。
8.2.3 并行边界技术-基于边界的图像分割
具体实现时,考虑p、 q的可能取值范围,从大到小进行累加。
1) 初始化 A(p,q)=0
2) 对 XY空间中的每一点, P取遍所有可能值
3 )算出对应的 q,给A(p,q) 单元加 1
4 )根据maxA(p,q) ,求出直线
8.2.3 并行边界技术-基于边界的图像分割
问题: p、 q的取值较大时,计算量增加,可以采用极坐标系形式。
直线在极坐标系下具有如下的参数方程形式:
这条直线在极坐标下表示为一个点
sincos yx +
),(
8.2.3 并行边界技术-基于边界的图像分割
8.3 图像的特征
图像特征是图像的重要属性,它一般应具备 4个特点:可区分性、可靠性、独立性、数量少
图像的特征主要有: 1) 颜色(灰度)特征 2) 形状特征 3) 纹理特征 4) 空间关系特征
8.4 图像的描述
边界描述 区域或闭合边界的描述
8.4.1 图像的边界描述
一、像元之间的连通和邻接(略) 二、距离(略)
8.4.1 图像的边界描述
三、周长和边长 L
周长的定义通常有 3 种:
1 )把区域像元看为正方形,边界只有水平和垂直两种线,相当于
像元小方格的四个边的四邻码
2 )把像元看做一个点,可用弧长的 8 邻码计算
3 )用边界所占面积
8.4.1 图像的边界描述
方法 1 : L= 25d; d为小正
方
形的边长
方法 2 :
方法 3 : 18@,其中@为小正
方
形的面积
dL )2414(
8.4.1 图像的边界描述
四、边界链码
链码是从物体边界上的任意一个点( x, y)出发,而后
只记录下一个边界点的方向码,直至回到出发点为止
的编码序列。在采用边界跟踪方法获取物体边界轮廓
时,可以直接得到边界链码。
8.4.1 图像的边界描述 8 方向链码
12
3
4
56
7
0
8.4.1 图像的边界描述 下面的图像用链码表示为: 20206644
这个结果与起点有关,为 了避免这个问题,用循环 码(归一化)表示: 02066442 具体方法为:首尾相连循 环形成的自然数最小
2
2
44
0
6
60
8.4.1 图像的边界描述 图像平移链码不变,但旋转时链码会发生变化,为此可用差分码表示
原链码 (4)20206644 原链码 (3)17175533 差分码 66266060(模 8 、反向) 差分码 66266060
2
2
44
0
6
60
1 1
3
3
7
5
5
7
8.4.1 图像的边界描述
五、线条的描述 若图中相继相邻的点集能拟合与某些曲线函数,那么这些曲线函数的少量参数就可做为该点集的一种描述。
如:常用 B样条曲线来拟合,用于从边界识别零件等场合。
能用少量数据描述物体特征叫做描述子。 区域的描述子应满足四点要求:
1 )能精确地描述特征 2 )对大小变化不敏感 3 )对描述的起点不敏感 4 )对平移旋转不敏感
8.4.1 图像的边界描述
8.4.1 图像的边界描述
六、傅立叶描述子 从任一点开始的一个 N点的闭合边界序列( xk,yk) (k=0,…,N) 可以认为是一个周期为 N的周期函数,把
它放到复平面上, 就形成了一个 1维 的复数序列 {uk+jvk}
( xk,yk )
uk+jvkX
U
Y V
8.4.1 图像的边界描述 对这个复数序列
进行傅立叶变换
10)()()( Nkkjvkuks
1...0]/2exp[)(1 1
0
NwNwkjksN
Nk
k
8.4.1 图像的边界描述 我们只利用 s(w) 的前M个系数,其余系数置0,反变
换就得到 s(k) 的一个近似
傅立叶变换的低频信息对应总体形状而高频信息对应一
些细节,这样我们可用对应低频分量的傅立叶系数(个
数M远 <N)来近似描述边界的形状。( P231 图)
10]/2exp[)()(1
0
NkNwkjwsksN
w
8.4.2 区域的描述
一、矩描述子
对数字图像 f(x,y) ,如果它分段连续且在 XY平面上只
有有限个点不为零,可证明其各阶矩存在, f(x,y) 的 p
+ q阶矩定义为: x y
qppq yxfyxm ),(
8.4.2 区域的描述 可以证明 f(x,y) 与mpq是一一对应的。 区域的矩是用所有区域的点计算出来的,抗干扰性能较好。
f(x,y) 的 p+ q阶中心矩定义为:
其中:
x y
qppq yxfyyxxu ),()()(
00010010 // mmymmx
8.4.2 区域的描述
三阶以下的中心矩: u00、 u01 = u10、 u11 、 u20、 u
02 、 u30、 u12 、 u21 、 u03
f(x,y) 的归一化中心矩可表示为:
其中
rpqpq uu
00/
3,22
qpqp
r
8.4.2 区域的描述 可以导出具有平移、旋转和尺度变换不变性的 7 个不变矩:
P241 图
02201 211
202202 4)(
20321
212303 )3()3( 2
03212
12304 )()(
])()(3)[)((3
])(3))[()(3(2
03212
123003210321
20321
21230123012305
))((4])())[(( 03211230112
03212
123002206
])()(3)[)((3
])(3))[()(3(2
03212
123003210321
20321
21230123030127
8.4.2 区域的描述
二、区域面积 通常面积的计算可以直接对分割出的物体内像元计数
即可。
从闭合边界来计算面积有类似计算周长的 4 连通和 8
连通的问题
用不同方法描述的边界计算面积时有很大差异。
8.4.2 区域的描述
A= 31 (每一小块面积认为
是 1 )
8.4.2 区域的描述
第一层有 1 个白小块 (标记为 1 的 ) ,面积= 4m-1=43-1=16 第二层有 2 个白小块,面积= 2×4m-2=2×43-2=8 第三层有 11 个白小块,面积= 11×4m-3=11×43-3=11 总面积= 16+ 8+ 11 = 35
0 0 0 0 0 0 0 0
0 0 1 0 0 0 0 0
0 0 0 0 0 1 0 0
1 1 1 1 1 1 1 0
1 1 1 1 1 1 1 0
1 1 1 1 1 1 1 0
1 1 1 1 1 1 0 0
1 1 1 1 1 1 0 0
用四叉树描述区域时,只需将叶
节点的面积相加即可。
叶节点面积为 4m - l , l为叶节
点所在层数,m为图像层数,
N= 2m
8.4.2 区域的描述
三、区域重心
重心是一种全局描述符,区域重心的坐标是根据所有
属于区域的点计算出来的。
在区域本身尺寸与各区域间的距离相对很小时,可将
区域用其重心坐标的质点来代替
Ryx
xA
x),(
1
Ryx
yA
y),(
1
8.4.2 区域的描述
四、区域的拓扑结构
拓扑学是研究图形不受畸变变形影响性质的。
欧拉数 E= C(连通组元个数)- H(孔)
E=1-2=-1 E=1-1=0
B A
8.4.2 区域的描述
五、区域的纹理 纹理是物体表面结构的模式,如木材、水泥、沙子、玻璃等等,对图像分析和理解十分重要。
纹理可以看做许多基本纹理小单元的重复,这些小单元可称作纹理元,纹理元常包含多个象素。
常用的纹理描述方法分为统计法和结构法。统计法用于分析木纹、沙地等不规则的纹理;结构法常用于分析印刷图案等规则的纹理。
8.4.2 区域的描述
1 、统计法
1 )灰度直方图
2 )共生矩阵
8.4.2 区域的描述
1 )灰度直方图特征
最简单的统计法借助于灰度直方图的矩来描述纹理。
设灰度为 r ,灰度量化级别为 N,定义直方图对原点的
P阶矩为:
当p= 1时为一阶矩, u为均值。
1
0
)(Nr
r
pp rprm
urprmNr
r
1
01 )(
8.4.2 区域的描述
1 )灰度直方图特征
定义直方图对均值 u的 P阶中心矩为:
当p= 2时为二阶中心矩: 为方差。
1
0
)()(Nr
r
pp rpur
21
0
22 )()(
Nr
r
rpur
2
8.4.2 区域的描述
1 )灰度直方图特征
定义直方图的偏度 S为( S表示直方图分布偏离对称
的大小)
定义直方图的峰度 K为: (K表示直方图是聚集在均值
附近还是散布于直方图的尾端)
])()([1 1
0
333
3
Nr
r
rpurS
])()([1 1
0
444
4
Nr
r
rpurK
8.4.2 区域的描述
2 )共生矩阵 共生矩阵 P定义为:
#表示数目
}1,...1,0;1,...,1,0;),(
,),(|)],(),,[({#),,,(
NyNxjyyxxf
iyxfyyxxyxyxjiP
8.4.2 区域的描述
2 )共生矩阵 例:灰度为 0- 3 ,共生矩阵为 4×4
原图像
0 0 1 1
0 0 1 1
0 2 2 2
2 2 3 3
1000
1300
0020
0122
)0,1,,( jiP
8.4.2 区域的描述
2 )共生矩阵 共生矩阵 P也可以定义为:
共生矩阵第 i行,第 j 列的元素表示所有在 θ方向上,相隔为 r ,一个灰度为 i,一个灰度为 j的象素点对出现的频率
),,,( rjiP
8.4.2 区域的描述
2 )共生矩阵
例:原图像
0 1 2 3 0 1
1 2 3 0 1 2
2 3 0 1 2 3
3 0 1 2 3 0
0 1 2 3 0 1
1 2 3 0 1 2
0707
7080
0808
7080
)0,1,,( jiP
12000
01200
00140
00012
)45,1,,( jiP
主对角线元素为 0:说明水平方向没有两两相同的象素对,也就是水平方向灰度变化频繁,水平纹理细
对角阵:说明 45 度方向灰度无变化,即 45 度方向为等值线,例如纹理类似沿 45 度走向的山脉
8.4.2 区域的描述
2 、结构法
复杂的纹理可用一些简单的纹理元以一定的规
律重复排列组合而成。
定义出纹理元排列的规则,就可表示出所需的
纹理。