图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析...

64
图像对象层次的 遥感影像分析 陈建裕 张汉松 科学出版社 职教技术出版中心 www.abook.cn

Upload: others

Post on 14-Jan-2020

14 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的 遥感影像分析

陈建裕 张汉松 著

北 京

学出版社

职教技术出版中心

www.abook.cn

Page 2: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>
Page 3: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

内 容 简 介

图像对象层次的高分辨率遥感图像信息获取是近十年来遥感应用领

域的研究前沿。本书系统地阐述了高分辨率遥感图像多尺度分析的基础理

论、算法实现、尺度优化及其应用技术。首先,叙述了面向地理对象的遥

感图像分析方法的发展过程、高分辨率遥感影像蕴含的地物信息。其后,

分析了多种类型的遥感图像分割算法,重点讲述了多尺度分析方法的理论

基础与技术实现、 优分割的尺度问题、集成边缘信息的图像多尺度分析

技术途径等。 后,探讨了利用分割技术实现图像对象层次的遥感分类和

变化检测方法。结合实际需求,还给出了高分辨率遥感图像应用多尺度分

析的若干案例。

本书可供从事遥感测绘、图像处理、地理信息科学等领域研究的人员

和工程技术人员参考使用,也可作为高等院校相关专业的教学和研究资料。

图书在版编目(CIP)数据

图像对象层次的遥感影像分析/陈建裕,张汉松著. —北京:科学出版社,

2016

ISBN 978-7-03-047847-4 Ⅰ. ①图… Ⅱ. ①陈…②张… Ⅲ. ①遥感图像-图像分析 Ⅳ. ①TP751

中国版本图书馆 CIP 数据核字(2016)第 057575 号

责任编辑:赵丽欣 张瑞涛 / 责任校对:马英菊 责任印制:吕春珉 / 封面设计:东方人华平面设计部

出版

北京东黄城根北街 16 号 邮政编码:100717

http://www.sciencep.com 北京双清印刷厂 印刷

科学出版社发行 各地新华书店经销 *11

2016 年 3 月第 一 版 2016 年 3 月第一次印刷

开本:787×1092 1/16 印张:13

字数:300 000

定价:54.00 元 (如有印装质量问题,我社负责调换〈环伟〉) 销售部电话 010-62136230 编辑部电话 010-62134021

版权所有,侵权必究

举报电话:010-64030229;010-64034315;13501151303

学出版社

职教技术出版中心

www.abook.cn

Page 4: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>
Page 5: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

前 言

遥感技术的出现,改变了人类观测地球的方式;可重复性的遥感资料的获取,使得

人类具有了周期性了解广域地表环境动态变化的新途径。随着遥感技术的发展,光学遥

感影像的空间分辨率已从 初的百米级提高到米级,甚至更高,重访周期也已大大缩短。

随着图像技术的发展,以利用遥感图像中的空间信息为目标的面向地理对象的图像分析

方法得到了迅速发展。

现阶段,米级/亚米级的分辨率卫星遥感数据众多,国外商业卫星数据如 SPOT、

IKONOS、QuickBird、WorldView、GeoEye 等,我国高分辨率遥感数据有高分一号、高

分二号等。此类卫星一般采用太阳同步轨道获取数据,卫星姿态控制灵活,可以通过倾

斜和摆动偏离星下点对地观测。与早期的 Landsat 卫星等获取星下点地表覆盖类型的成

像机制相比,米级遥感图像中目标对象的几何结构所蕴含的空间信息是识别地物对象的

重要信息源。传统遥感信息获取方法往往将地表场景中的地物简单理解为具有相似朗伯

体系光谱反射发射结构,缺乏对场景空间信息进一步的解译过程。然而,在高分辨率的

遥感影像中,地物的空间结构外化为多个相邻像素的集合,传统的遥感信息获取手段面

临新的挑战。

丰富的高分辨率商业遥感卫星、多种类型的无人飞行器、载人航空等遥感平台及其

传感器各具优势,高分辨率遥感数据的获取能力得到长足的提高。遥感空间分辨率的提

高,给我们提供了一种身临其境的感官认知,而当前的遥感图像处理技术却是缺乏人类

视觉感知过程中的视觉加工机制。目前的遥感影像处理方法主要是基于像元光谱特征,

在复杂区域中的地学应用却达不到我们对技术本身的要求。遥感信息获取能力不及常人

目视所获取的信息丰富。遥感影像从中低分辨率提高到亚米级高分辨率,地物目标的影

像特征发生了显著变化,信息更加丰富,采用单一光谱特征难以全面描述高分辨率影像

上众多复杂的地物目标。然而,复杂环境遥感的数据分析处理能力却没有得到相应的提高,

不断增长的海量遥感数据中的大部分数据并没有得到有效的分析利用。由此可见,实现遥

感数据向空间信息智能转化的影像认知模式与图像理解等相关研究需求迫切。如何充分利

用高分辨率遥感信息中所蕴含的地物光谱、空间结构、成像信息等先验知识,建立可计算

的遥感信息解析机制来分析复杂场景环境,是高分辨率遥感图像理解的难点。

空间分辨率的提高,使得我们认知的地物在遥感影像中呈现为像素集合。在高分辨

率的遥感影像中,需要通过图像处理的方式去获取其反映在影像上的像素集合及其空间

结构。在 近十年内,以获取和利用图像中像素集合为目标的各种分割算法及面向对象

的图像分析方法(OBIA/ GEOBIA)迅速发展,相对于像素级而言已是技术发展的一大

进步。与此同时,利用地物空间信息提高遥感信息获取能力得到更多重视,利用空间信

息的关键在于获取图像对象,图像对象是指遥感影像上与地物内在尺度一致的像元集

合。因此,综合遥感影像所能反映的光谱和空间信息等全部信息,发展图像对象层次的

遥感影像信息处理技术已是从根本上提高遥感信息获取能力的必然,也是进一步实现遥

感图像解译推理的基础。

GEOBIA 概念与技术为图像与地表信息的多尺度分析提供了连接,同时能有效克服

学出版社

职教技术出版中心

www.abook.cn

Page 6: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·ii·

传统分类方法中的“椒盐”效应。面向图像对象的分析方法在于充分利用高分辨率多源

遥感数据中所蕴含光谱、空间和上下文信息,提高复杂环境的遥感信息获取能力,促进

遥感图像分析和信息获取自动化程度,解决遥感数据利用率低的问题。对于高分辨率遥

感而言,传统图像分类这种粗犷型的遥感数据处理技术已难以适应信息获取的需求。近

年来,以利用地物空间信息为目标的基于图像对象的处理方法在遥感应用中得到普遍认

可。在遥感变化检测领域,图像对象是利用地物空间信息提高变化检测能力的自然手段,

当地物的大小形状发生变化时,体现在遥感影像为图像对象的大小形状随之变化。常识

告诉我们,地物对象的大小、形状发生了变化,即使不考虑地物的其他信息,我们也能

认知到变化发生了。面向图像对象的分析方法迅速发展,并在高分辨率遥感应用方面得

到日益重视和广泛应用。图像对象层次的遥感影像处理技术相对于像元级的处理而言,

技术发展是跨越式的,这是显而易见的。

面向对象的遥感图像处理是目前高分辨率遥感信息处理中的热点,本书系统地阐述

了面向地理对象遥感图像分析的基本概念、模型方法和应用技术,也包括作者近几年来

的研究成果。重点讲述了高分辨率遥感影像多尺度分割算法、从多尺度分析中确定具有

地物内在尺度的 优分割图像对象、利用边缘信息约束多尺度分割中的图斑增长等,并

从多个方面展示了面向对象的遥感影像分析方法在变化检测中的应用。

全书分为 11 章。第 1 章绪论,通过文献分析,着重分析了面向对象遥感影像分析

发展历程、概念、软件实现等。在第 2 章为影像与图像对象所蕴含的信息,介绍了常见

的高分辨率卫星遥感数据,描述了遥感影像中面向地学应用的光谱信息、纹理信息、几

何形状及空间关系等信息。第 3 章综述图像分割方法,在阐述图像分割原理和相似性度

量的基础上,展示了多种类型的分割算法结果。第 4 章重点围绕遥感影像多尺度分析技

术,全面叙述了多尺度分析方法原理、算法实现、算法中参数选择等细节。第 5 章在多

尺度分析中集成边缘信息,描述了图像中边缘获取、如何在多尺度分割算法中有效利用

图像的边缘信息。第 6 章针对图像对象的 优分割问题,涉及 优分割尺度、 优分割

算法的实现,并从理论上探讨了图像分割中对象的可分离性。第 7 章为图像分割方法的

精度评价,强调分割结果评价的多样性,从非监督评价方法和监督评价方法两方面进行

叙述。第 8 章图像对象分类及信息获取是多尺度分析方法的主要应用方向,通过分类方

法实现遥感影像中专题信息的获取。第 9 章和第 10 章都是讲述基于分割技术的遥感变

化检测,第 9 章在分割结果基础上利用区域协方差阵进行遥感图像的变化检测,第 10

章在图像多尺度分析基础上,基于栅格的叠置分析,识别并利用图像对象的形状变化信

息实现变化认知。第 11 章在分析多个类型的形状描述后,以云检测和云阴影为例,叙

述了图像对象的形状表达与匹配方法及其应用。

本书内容由多位合作者联合贡献,包括了多位研究生、博士生的工作。作者前后与

吴均平、陈晓东、张汉松、李著、吴永月、黄河羚婕等博士、硕士研究生一起合作研究,

特此表示感谢。感谢卫星海洋环境动力学国家重点实验室以潘德炉院士、毛志华研究员

为首的海洋卫星遥感技术创新团队;感谢浙江大学地球科学系的陈宁华教授、黄清波、

倪妮娜、董津津等同行朋友。

陈建裕 2015 年 10 月终稿于杭州

Page 7: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

目 录

第 1 章 绪论 ············································································································· 1

1.1 面向地理对象的遥感图像分析技术 ······························································ 1

1.1.1 概念 ····································································································· 1

1.1.2 技术背景与历程 ······················································································ 2

1.1.3 GEOBIA 思想与特色 ················································································ 4

1.2 GEOBIA 发展与工具软件 ············································································ 6

1.3 GEOBIA 研究进展 ······················································································· 9

1.3.1 分割尺度的选择与优化 ··········································································· 10

1.3.2 面向对象的遥感信息获取 ········································································· 11

1.3.3 面向对象的遥感变化检测 ········································································ 12

1.3.4 GEOBIA 与地学知识的关联 ····································································· 14

第 2 章 影像与图像对象所蕴含的信息 ···································································· 17 2.1 高空间分辨率遥感影像 ·············································································· 17 2.2 图像对象中蕴含的信息 ·············································································· 21

2.2.1 遥感影像中的物理量 ·············································································· 22 2.2.2 地物波谱信息 ······················································································· 24 2.2.3 图像的颜色信息 ···················································································· 25 2.2.4 纹理信息 ····························································································· 26

2.3 图像对象中的空间信息 ·············································································· 29 2.3.1 几何位置信息 ······················································································· 29 2.3.2 关系特征 ····························································································· 31 2.3.3 形状特征 ····························································································· 33 2.3.4 空间结构信息 ······················································································· 34 2.3.5 空间信息的矢量表达 ·············································································· 34

第 3 章 图像分割方法 ····························································································· 36 3.1 相似性度量 ······························································································· 36

3.2 图像分割基础 ···························································································· 39

3.3 超像素图像分割 ························································································ 41

3.4 均值漂移聚类图像分割 ·············································································· 42

3.5 纹理图像分割 ···························································································· 44

3.6 图像混合分割 ···························································································· 45

3.6.1 图像分割预处理 ···················································································· 46

3.6.2 基于分水岭变换的混合分割算法 ······························································· 49

3.6.3 分割实验与结果分析 ·············································································· 52

学出版社

职教技术出版中心

www.abook.cn

Page 8: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·iv·

第 4 章 遥感影像多尺度分析技术 ··········································································· 55 4.1 遥感影像多尺度分割算法 ·········································································· 55

4.1.1 多尺度分割算法原理 ·············································································· 55

4.1.2 图像对象的合并 ···················································································· 57

4.2 分割算法优化 ···························································································· 61

4.2.1 波段选择 ····························································································· 61

4.2.2 分割参数选择 ······················································································· 62

4.2.3 分割过程描述 ······················································································· 63

4.3 分割结果分析 ···························································································· 64

4.3.1 分割策略对结果的影响分析 ····································································· 64

4.3.2 不同地物分割结果分析 ··········································································· 66

4.4 算法的变化 ······························································································· 68

4.4.1 分割中合并代价的计算方法 ····································································· 68

4.4.2 生长点的选择 ······················································································· 70

4.4.3 合并准则及次序 ···················································································· 71

第 5 章 集成边缘的多尺度分析 ··············································································· 75 5.1 边缘与多尺度分析 ····················································································· 75

5.2 边缘检测 ··································································································· 76

5.2.1 Canny 边缘检测 ···················································································· 76

5.2.2 SUSAN 边缘检测 ·················································································· 78

5.2.3 置信度边缘检测 ···················································································· 78

5.3 边缘引导的多尺度分割方法 ······································································· 81

5.3.1 边缘获取 ····························································································· 83

5.3.2 边缘约束的图像分割 ·············································································· 84

5.3.3 应用案例 ····························································································· 85

第 6 章 图像对象的最优分割 ·················································································· 89 6.1 优分割问题 ···························································································· 90

6.2 全局 优分割尺度 ····················································································· 91

6.3 图像对象的 优分割尺度 ·········································································· 94

6.3.1 算法原理 ····························································································· 94

6.3.2 分割过程分析 ······················································································· 96

6.3.3 基于显著性曲线的 优分割结果确定 ························································· 97

6.3.4 基于差异性的图像对象识别 ····································································· 99

6.4 图像对象可分性理论分析 ········································································· 103

6.4.1 相邻图斑之间的分类可分性问题 ······························································ 103

6.4.2 分割过程中显著性差异的变化 ································································· 104

第 7 章 图像分割精度评价 ····················································································· 108 7.1 图像分割精度评价概述 ············································································· 108

7.2 非监督评价方法 ······················································································· 109

Page 9: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

目 录 ·v·

7.2.1 区域内部一致性度量 ············································································· 110

7.2.2 区域差异性度量 ··················································································· 113

7.2.3 复合度量 ···························································································· 114

7.2.4 基于边界的分割评价 ············································································· 115

7.3 监督评价方法 ··························································································· 115

7.4 应用案例 ·································································································· 119

第 8 章 图像对象分类及信息获取 ·········································································· 123 8.1 模糊聚类法 ······························································································ 124

8.2 邻近分类法 ··························································································· 126

8.3 支持向量机分类法 ···················································································· 130

8.3.1 SVM 分类基本原理 ·············································································· 130

8.3.2 SVM 分类实现途径 ·············································································· 131

8.3.3 决策树支持向量机的遥感图像分类 ··························································· 134

8.3.4 案例分析 ···························································································· 136

第 9 章 基于图像分割的变化检测 ·········································································· 139 9.1 遥感变化检测法 ······················································································· 140

9.1.1 遥感变化检测的一般步骤 ······································································· 141

9.1.2 遥感变化检测精度评价 ·········································································· 142

9.2 基于图像分割的变化检测概述 ·································································· 142

9.3 面向图斑的直接遥感变化检测法 ······························································· 145

9.3.1 区域协方差阵描述子 ············································································· 148

9.3.2 算法描述 ···························································································· 149

9.4 案例分析 ·································································································· 151

9.4.1 变化检测法对分割尺度的依赖 ································································· 153

9.4.2 特征集成影像与图斑协方差阵表 ······························································ 153

9.4.3 结果讨论 ···························································································· 154

第 10 章 图像对象层次的变化检测 ········································································ 158 10.1 相关研究工作 ························································································· 159

10.2 算法基础 ································································································ 160

10.3 方法描述 ································································································ 162

10.4 应用案例 ································································································ 163

10.4.1 变化检测结果 ···················································································· 165

10.4.2 与常规变化检测方法比较 ····································································· 167

10.5 讨论与结论 ····························································································· 170

10.5.1 形状变化意味着变化 ··········································································· 170

10.5.2 有意义的图像对象至关重要 ·································································· 171

第 11 章 图像对象的形状表达及匹配 ····································································· 172 11.1 基于轮廓特征的形状匹配 ········································································ 172

11.1.1 基于图像矩的形状匹配 ········································································ 173

学出版社

职教技术出版中心

www.abook.cn

Page 10: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·vi·

11.1.2 基于 Shape Context 的形状匹配算法 ························································ 174

11.1.3 基于 MPHD 的形状匹配算法 ································································· 175

11.2 云和云的阴影的形状表达及匹配 ····························································· 177

11.2.1 云与云阴影图像对象获取 ····································································· 177

11.2.2 云与云阴影图像对象的匹配前处理 ························································· 180

11.2.3 匹配过程优化 ···················································································· 181

11.2.4 云及云阴影替补 ················································································· 184

参考文献 ················································································································· 187 后记 ························································································································ 200

Page 11: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 1 章 绪 论

1.1 面向地理对象的遥感图像分析技术

1.1.1 概念

在过去十多年时间里,面向对象的图像分析处理技术(Object-Based Image Analysis,

OBIA)引起了世界上诸多学者的极大关注,其理论和方法得到了快速发展。OBIA(即

GEOBIA,本书以下同)的核心思想是把图像对象而不是像元作为遥感数据中的最小处

理单元,它的核心技术是通过影像分割与特征空间聚类,在图像对象与地理对象之间建

立链接。

近年来,随着 OBIA 理论的提出、认可和深入,一个高度争议性的学术讨论广泛地

出现在这个多学科交叉领域:地理空间(Geographic Space, GS)的含义是否应包含在

OBIA 的名字里面,即这个概念究竟应被称为“GEOBIA”还是“OBIA”?加拿大学者

Hay 和 Castilla(2008)认为:“当我们利用 Google 搜索‘OBIA’时,我们找到的信息

可能是 Offshore Biologically Important Area、Ontario Brain Injury Association 和 Oregon

Building Industry Association 等;在众多的名称中,‘GEOBIA’更符合 Remote Sensing (RS)

和 Geographic Information Science(GIS)应用的内涵。”一般认为,“OBIA”的表达更

宽泛且方便广泛使用,但它不专属于遥感科学家、GIS 专家以及众多环境学者。但

“GEOBIA”本身带有明显的地学概念,我们能将它同广泛意义上的面向对象的图像分析

方法(Object-Based Image Analysis)有所区别,而且后者更多地和计算机视觉、生物图

像处理联系在一起。国际上大部分学者也认为:OBIA 应该被称为面向地理对象的图像

分析(Geographic Object Based Image Analysis,GEOBIA),这样才能更加准确地代表地

理信息科学(GIScience)领域的一个分支。英文名称 Geographic Object-Based Image

Analysis(GEOBIA,发音为 ge-o-be-uh),即面向地理对象的图像分析,类似的翻译还

包括“面向对象的地理分析”、“对象导向的地理分析”等。GEOBIA 是地理信息科学下

面的子学科,在于发展将遥感图像分割成有意义图像对象的算法,并在空间、光谱、时

间尺度上评估其规格参数,产生适宜 GIS 的数据。GEOBIA 信息处理的对象是地球遥感

数据,依赖于遥感科学的理论与方法,它在遥感图像与 GIS 之间建立关键桥接。虽然有

关 OBIA 命名的争论仍在持续(如 Blaschke et al., 2001;Blaschke, 2010),但为方便行文

中术语的使用,本书认为两种表达方式是一致的。本书也不纠结于中文翻译“基于对象”、

“面向对象”和“面向地理对象”等用词之间的差异,也不严格区分“像元”和“像素”、

“影像”和“图像”等,尊重相关文献中两者原有的表达和行文简捷。

面向地理对象的遥感影像分析理论中的一些概念随技术发展而更新。早期遥感图像

多尺度分割的结果(Baatz et al., 2000)被称为不规则碎片形(Fractal);后来一些文献中

学出版社

职教技术出版中心

www.abook.cn

Page 12: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·2·

将分割结果称为图斑(Parcel/Patch)、图像区域(Region/Segment)等;当认识到多尺度

分析中的分割结果与人们对土地覆盖与土地利用中研究中概念有差异(Burnett and

Blaschke, 2003)时,开始将这些分割结果称为图像候选对象(Object Candidate);为此

Lang 等(2007)在地理信息科学领域对 GEON(Geographic Objects or Units)这个概念

进行了重新定义,GEON 是包括地理信息和基本单元的组合。一般而言,图像对象

(Image-Object)则是目前普遍接受的作为分割结果的一般化名词(eCognition, 2010;

Blaschke et al., 2008),是图像多尺度分割后形成的,特定尺度下树形结构表达的地表对

象。Chen 等(2006, 2009)进一步将那些理想的分割结果称为有意义的图像对象

(Meaningful Image-object)。

遥感信息处理技术的发展,总是随着我们对事物认识的深入而发展。Blaschke 和

Strobl(2001)提出了一个挑战性的问题——“像素出了什么问题”,认为基于图像像素

的影像分析方法越来越不能满足高分辨率遥感影像应用的要求。尽管这不是该领域首次

评论(Cracknell, 1998),却进一步激发了学术界研究“超”像素的兴趣。以地物 H 在低

分辨率、中等分辨率和高分辨率影像中的表现为例,地物 H 在低分辨率影像中不足一个

像素(图 1.1(a));在中等分辨率影像中占据一个半像素(图 1.1(b));而在高分辨率

影像中需多个像素表达(图 1.1(c))。根据奈奎斯特—香农采样定理(Nyquist-Shannon

Sampling Theorem),通常像素大小须保证等于或小于地物对象的 1/10,才能准确表达地

物对象(如位置、朝向等)。示例中,图 1.1(a)、(b)的分析以像素或亚像素为单元是

合适的,而图 1.1(c)的分析应以区域为单元。因此,图像分割产生图像对象是高空间

分辨率遥感影像分析的前提和关键。

(a)80m 像素 (b)20m 像素 (c)5m 像素

图 1.1 地物大小与空间分辨率

1.1.2 技术背景与历程

在遥感领域较早使用面向对象技术的是 Kerrig 和 Landgebe(1976),他们提出了一

种 ECHO 分类器(Extraction and Classification for Homogeneous Objects),该方法认为中

心像元的概率密度函数是与其相邻像元相关的,它利用邻域像元的同质性来提取上下文

特征,取同质性最大的类别作为中心像元的识别结果。Kettig 和 Landgrebe 同时也指出

这项技术考虑的是比像素更大的处理单元,因此无法在当时以 TM 和 SPOT 为主流数据

的中分辨率遥感时代进行广泛的测试和应用。一般认为,GEOBIA 的迅速发展始于

eCognition 软件(Baatz and Schäpe, 2000;Benz et al., 2004),该软件曾改名为“Definiens”

Page 13: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 1 章 绪 论 ·3·

(Lang and Tiede, 2007)。GEOBIA 早期的先行者们使用“object oriented”(Blaschke et al.,

2000;Blaschke and Hay, 2001),后来大部分作者习惯于改用“object-based”。这是由于

“object oriented”与面向对象的程序规范极其相近,所以多数人更倾向于使用术语

“object-based”(Hay and Castilla, 2008)。众多研究人员已认可 GEOBIA 方法能够克服高

空间分辨率遥感影像处理中常见的“椒盐效应”(Blaschke et al., 2000),研究案例表明

图像分割技术的最新发展使得面向对象方法能高效应用于遥感数据的土地覆盖分类

(Duveiller et al., 2008)。面向地理对象的遥感影像分析处理技术逐渐显示出它是一种优

于传统的基于像素的影像分析方法(Gamanya et al., 2009)。

自 2006 年开始,两年一届的世界 GEOBIA 国际会议迄今已经召开五届:

GEOBIA2006(Salzburg, Austria)、GEOBIA2008(Calgary, Canada)、GEOBIA2010(Ghent,

Belgium)、GEOBIA2012(Rio de Janeiro, Brazil)和 GEOBIA2014(Thessaloniki, Greece)。

2006 年 6 月,首届面向地理对象影像分析国际会议在奥地利萨尔茨堡大学(University of

Salzburg)召开,该届与会论文可以参考国际摄影测量与遥感国际组织期刊的论文集(见

www.isprs.org/ proceedings/XXXVI/4-C42/)。两年后,第二届面向地理对象影像分析国际

会议在加拿大卡尔加里大学(Calgery University)举行(会议网址:www.ucalgary.ca/geobia/),

会后出版了面向对象影像分析领域的论文集 Object-Based Image Analysis-Spatial Concepts for Knowledge-Driven Remote Sensing Applications(Springer 出版社,2008 年,

817 页)。2010 年第三届面向地理对象影像分析国际会议在比利时根特大学(Ghent

University)举行(会议网址:geobia.ugent.be/2010)。第四届国际会议于 2012 年在巴西

里约热内卢天主教大学(Pontificia Universidade Catolica)举行(会议网址:www.inpe.br/

geobia2012/index.php)。2014 年 5 月,第五届世界 GEOBIA 国际会议“GEOBIA 2014”

在希腊塞萨洛尼基(Thessaloniki)举行(会议网址:geobia2014.web.auth.gr/geobia14/)。预

期最新一届国际会议“GEOBIA 2016”将于 2016 年 9 月在荷兰 University of Twente 举

行。此外,该领域的一些学术会议还包括 2007 年 6 月于美国 Berkeley 举行的主题为

“Object-based Geographic Information Extraction”,2009 年于英国 Nottingham 举行的主题

为“Object-based Landscape Analysis”等会议。

许多学者已经对 GEOBIA 方法与高空间分辨率影像的人类解译行为进行了比较分

析(Shackelford and Davis, 2003; Ivits et al., 2005)。奥地利 Salzburg 大学教授 T. Blaschke

(2010)通过对 820 多篇文章中 GEOBIA 技术的详细分析,综述了面向对象影像分析的

发展历程,内容覆盖 GEOBIA 的多个方向,包括尺度概念、GEOBIA 分割、GEOBIA

信息提取、GEOBIA 变化监测以及 GEOBIA 精度评定等方面。目前 GEOBIA 领域前沿

性研究也正在不断拓展,自 2004/2005 年开始,GEOBIA 应用得到了更为广泛的发展。

现在越来越多 GEOBIA 文献及应用的最终目标不再仅仅局限于建立好的分割算法,而是

聚焦在整合与开发地理信息智能化方面,例如如何有效集成多源地理环境信息等。为此,

需要综合考虑所有的地理环境信息,面向地理对象的遥感影像分析处理可以作为人类解

译/理解遥感影像重要的半自动/自动途径,成为人们准确获取地学信息的高效方式

(Neubert et al., 2008)。

Blaschke 等学者(2014)认为,面向地理对象的遥感影像分析方法已开始进化成为

一种新的遥感影像分析“范式”。“范式(Paradigm)”是美国著名科学哲学家托马斯·库

学出版社

职教技术出版中心

www.abook.cn

Page 14: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·4·

恩(Thomas S. Kuhn)最早提出来的,是指“特定的科学共同体从事某一类科学活动所

必须遵循的公认的‘模式’,它包括共有的世界观、基本理论、范例、方法、手段、标

准等与科学研究有关的所有东西。”自 1972 年 Landsat-1 开始真正意义上的遥感以来,

围绕“像素(Pixel)”的影像处理方法一直是遥感工作者的主流处理方法。然而,在过

去的 20 多年间,作为遥感信息获取的主要手段——遥感影像分类方法,已经脱离了以

像素为核心的技术框架。Weng(2009)归纳了现有的主流分类方法,其中基于像素

(per-pixel)的分类方法 17 类,亚像素(sub-pixel)方法 7 类,图斑相关(per-field)方

法 6 类,上下文相关(contextual based)方法 13 类,基于知识(knowledge based)的方

法 6 类,混合分类(combinational approaches)方法 14 类。显然,基于像素的影像分析

方法在地学信息处理领域面临诸多挑战,如对象、形状、纹理、上下文及模式、语义与

知识集成。而面向对象的影像分析方法更加遵循人类认知世界的感知方式,以图像分割

为基础,但又不仅仅限于此,能自然地将影像中的像素融入到上下文信息中,结合面向

对象的数据模型、地理信息分析手段以多尺度、多层次的方式处理数据,同时又易于结

合本体论、语义网络等知识表达途径。因此,面向地理对象的图像分析方式必然成为一

种新的影像分析“范式”。

1.1.3 GEOBIA 思想与特色

当前高分辨率对地观测的若干前沿科学问题主要集中在高分辨遥感影像的精确处

理、遥感影像理解与信息提取以及对地观测传感网与聚焦服务(李德仁、童庆禧等,

2012)。其中遥感影像理解与信息提取又可进一步划分为面向对象的影像处理、多尺度

影像处理和多层次影像场景认知等。在高空间分辨率遥感影像信息处理中,图像分割

及面向对象的思想十分重要(宫鹏、黎夏等,2006)。根据遥感图像分析中研究对象的

不同,把遥感图像的分析划分为以下 3 个层次(Woods, 2006)。

① 全局层 以整幅影像或子图像为分析单元(图 1.2(a)),服务于整体图像工程

的需要。以图像或子图像为研究对象,它们不寻求区分图像中的地学对象,实际上它

们只能用来组合全局图像特征。主要应用于遥感影像库的管理与检索、遥感影像的集

成与制图等。

② 对象层 以图像中的区域为分析单元(图 1.2(b)),区域即图像中连通的像素

子集。从输入图像中检测感兴趣目标的符号表示(如区域光谱特征、纹理特征、形状特

征等),通过对目标符号的分析来完成应用。它具备高层次的遥感图像分析模式,而图

像分割是整个过程的基础。

③ 像素层 以图像中的像元或以像元为中心的窗口为分析单元(图 1.2(c)),它

是一种低层次的遥感图像分析模式,该模式下图像数据没有经过任何抽象和精炼。像素

层遥感图像分析容易理解,操作简单,如传统遥感图像定量分析、分类、目标识别、变

化检测等应用。

GEOBIA(或 OBIA)定位于遥感图像分析层次中的对象层。更通俗的解释为,在

地学应用领域,多源地学数据以面向对象的多尺度分析为基础,结合上下文与专家知识

的智能化分析处理技术。它是地学应用导向的,它的数据源所表达的是地球的地表信息;

它是多源数据兼容的,从遥感栅格数据到可用的 GIS 矢量数据;它是面向对象的,图像

Page 15: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 1 章 绪 论 ·5·

图 1.2 图像分析的 3 个层次

对象作为影像处理分析的最小单元,而不再是像素;它是多尺度的,地表场景的影像数

据中包含不同尺度的地表对象,无论是形状或者是空间位置,因而场景的理解需要影像

的多尺度分析;它是基于图像上下文信息的,进而可以使用专家系统、领域知识解释以

及为特定应用量身定制的分析功能。GEOBIA 工具需要构建在开放的 GIS 标准之上,并

提供与特定领域的用户和特定专业知识一致的工作机制,将特定领域的专业知识集成到

面向对象分析的语义网络。

面向地理对象的影像分析处理方法随着高分辨率遥感影像数据的广泛使用而迅速

发展,一些学者认为其原因在于该方法本身:①能减小影像局部的光谱变化,增强区域

同质性,减少椒盐效应;②能减小地物类内方差,增加特征空间的可区分度;③模拟人

类感知和观察目标的方式;④能进一步提取影像的结构、形状等几何属性;⑤矢量化的

输出能更有效地与 GIS 系统结合。

一般认为 GEOBIA 的优越性表现(Blaschke et al., 2008)在以下 4 个方面。

(1)图像分析方式和处理理念的进步:与基于像素的分析方法相比,GEOBIA 的分

析和处理方法更符合人类大脑思维和逻辑分析方式。通过执行不同尺度的分割和有效的

信息提取步骤,可以获取出各个图像对象的差异性特征,如光谱特征、纹理特征、几何

形状特征、空间关系特征等。凭借这些特征及其上下文语义关系,进一步融合到后续各

种影像分析(如特征提取、模式识别等)中。将遥感图像分割成不同尺度下的图像对象,

更符合人类概念化组织、理解遥感图像中地物对象与现象的思维过程。因而,借助这种

方法,影像分析与处理过程能够模拟人类大脑,更加“智能”地进行“思维”和“推理”

活动,从而在不同程度上改善了图像处理和分析的效果。

(2)提高图像分析和处理效率:GEOBIA 分析方法首先将一幅遥感图像进行多次分

割,以一系列分割尺度将光谱、形状因子相关联的像素聚合形成对象图层。这样,以对

象为最小处理单元的数量相对于原先以像素为单元的原始影像将大为缩小,后续的处理

和分析都以这些对象展开,这无疑会显著提高图像处理和分析的效率。此外,这些“压

缩”后生成的对象更方便存储在数据库中。将图像对象作为信息处理的基本单元,有利

原 图

(a)全局层(子图像) (b)对象层 (绿色代表填充的区域

红色曲线代表区域轮廓)

(c)像素层 (绿色代表窗口,蓝色代表

中心像素)

学出版社

职教技术出版中心

www.abook.cn

Page 16: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·6·

于降低诸如后续分类等遥感图像进一步处理的复杂性,同时有助于使用者应用更高层次

的工具来分析数据。

(3)挖掘影像潜力,提升影像空间分析功能:GEOBIA 方法能够引入额外的空间特

征,如方向、距离和拓扑关系等,从而将地学领域的众多概念融入其中。当该分析方法

应用于地理信息系统和遥感中,这些空间特征将使后续操作对遥感影像的空间分析变得

容易,空间分析能力提升。图像对象一经产生就具备了许多增量信息(如自身的形状和

纹理以及与其相关的对象上下文信息),这些图像对象中所蕴含的空间信息正是单个像

素所缺乏的。

(4)促成 GIS 和 RS 等多源数据整合和系统集成:对于多源空间数据而言,影像区

域之间的拓扑关系能够使这些不同来源的数据之间建立具体的局部联系,从而使多源数

据的整合成为可能。事实上,正是由于不同数据之间的融合对于 GIS 和 RS 系统集成的

重要性日益凸显,GEOBIA 的分析方法也更具意义。与传统基于像素的分类方法等像素

层面上的数据处理而言,图像对象层次的信息处理更有利于与地理信息系统的矢量数据

集成,这也是实际中遥感处理软件正在稳步推进的方向。

目前,GEOBIA 尚存在许多不足之处,主要表现为:在“灵活性原则”指导下的一

些商业软件,提供了过于复杂的选项,使得现有的图像对象层次的信息处理更耗时。在

图像大数据组织和分割等信息处理中,高分辨率遥感影像的分割过程仍是一个令人生畏

的任务。对于大数据量的图像分割而言,对现阶段计算时间与计算资源依然是一个挑战。

实质上,“图像分割”是一种病态问题,并不能导致理想的单一结果。一方面仅仅改变

对图像异质性的度量,就可以导致不同的分割结果;另一方面,人类自身的目视解译结

果也往往得到完全不一样的对象勾划结果。在图像分割与地学应用之间,必然存在实际

操作中的差异。例如,图像分割结果与地表对象之间存在的问题:①分割结果并不意味

着就是地学概念上的结构与功能单元;②如何认知是否是好的分割结果;③是否存在一

致可接受的概念基础。

1.2 GEOBIA 发展与工具软件

面向地理对象的遥感影像分析处理技术是在2000年后逐渐形成的遥感科学和GIS科学

领域里的一个崭新而重要的方向。由于数据分辨率提升与空间信息获取能力受限之间的矛

盾,Markham 和 Townshend(1981)就指出,遥感分类精度主要受两个因素影响,一是分

类结果中类别边缘的像素,即混合像元,当遥感数据空间分辨率高时,处于地物类别边缘

的混合像元数量减少,分类精度就会提高;二是空间分辨率变高时,同一类别内部的光谱

响应差异增大,使类别间的可分性降低,从而导致分类精度降低。遥感数据分类精度变化

取决于空间分辨率和遥感数据中地物目标大小之间的相对关系,这就涉及遥感影像分析中

的尺度问题。尺度和分辨率不同,分辨率通常表达了一个像元覆盖区域的平均大小,而尺

度则描述了地物信息提取的空间维。面向对象的遥感影像分析处理技术还处于青年、发展

阶段,远远没达到成熟。回顾二十多年的历程,它的出现是以下两个方面共同驱动的结果。

首先,新一代高空间分辨率遥感卫星的发射对遥感图像的处理技术提出了新的要

求。传统的像素级遥感图像处理方式已经远远不能满足高空间分辨率遥感数据的处理与

Page 17: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 1 章 绪 论 ·7·

应用,难以满足基于图像上下文的空间分析的需要。商业高分辨率影像数据的轻松获取

极大地促进了 GEOBIA 相关文章数量的增长(图 1.3)。在 IKONOS 卫星和 QuickBird

卫星成功发射之后的 1~2 年,即 2001/2002 年前后就出现了几十篇相关应用性文章。超

高分辨率数字航空相机和 Lidar 数据的出现又加深了这一趋势。其原因在于存在不断增

加的影像分析需求,即要从数亿像素数据中获得对 GIS 客观、适合的对象信息。

图 1.3 GEOBIA 的文献增长与发展历程(Blaschke 2010)

其次,随着技术的发展,以利用遥感图像中的空间信息为目标的面向对象的图像处

理方法得到了迅速发展,面向对象影像分析软件的成熟与广泛使用为地理空间对象分析

提供了强大的工具支持,同时也把遥感图像处理和 GIS 联系起来,为图像处理和 GIS

架起了一座桥梁。在 1999~2000 年之间,商业软件包“eCognition”出现在各种会议上,

并且在 2000 年成为第一家商业性面向对象的影像分析软件(Flanders et al., 2003; Benz et

al., 2004)。eCognition 软件最初是建立在分形网络演化理论方法上的,后来发展为完全

可程序化的工作流程(Baatz et al., 2008),就是今天我们所熟知的“Definiens”(Lang and

Tiede, 2007)。Definiens 软件的成功应用也带动了其他软件的发展,例如 SAGA(Böhner

et al., 2006)、Feature Analyst(Opitz and Blundell, 2008)以及最新的 ENVI Feature

Extraction(Hölbling and Neubert, 2008)模块和 Erdas Imagine 9.3。此外,具有类似功能

的软件也是在学术背景下发展起来的,其中一部分是免费发布或者开源的。例如 Wuest

和 Zhang(2009)运用了 Ojala 和 Pietikainen(1999)提出的 HSMR(逐级分裂合并细

化)分割框架,可应用于遥感领域,Tilton(1998)的逐级分裂合并算法后来发展为实

用的非商业性软件(Neubert et al., 2008)。一些大学与学术机构也推出公众应用的免费

分割软件,如加州大学的 BerkleyImgseg(见 berkenviro.com/berkeley imgseg/)和巴西的

InterImage(见 www.lvc.ele.puc-rio.br/projects/ interimage/index. html)。SAGA(System for

Automated Geoscientific Analyses)于 2005 年正式推出,以它们为代表的免费、开源地

理信息软件为新算法的研究和应用提供了平台。

商业化软件的推出进一步促进了面向对象遥感影像分析处理技术的普及。全球第一

个商业化的面向对象影像分析软件易康(eCognition)是直到 2000 年由德国 Definiens

公司开发问世的。Definiens 公司创始人是诺贝尔物理学奖获得者格尔德·宾宁博士/教

OBIA 文献

1991 2000 2001 2002 2003 2004 2005 2006 2007 2008

IKONOS eCognition OrbView SAGA 软件

QuickBirdDefiniens 商业软件

第一届OBIA

国际会议

GEOBIA 国际 会议 Calgary

学出版社

职教技术出版中心

www.abook.cn

Page 18: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·8·

授(德语:Gerd Binnig,1947 年 7 月 20 日-),德国物理学家,扫描隧道显微镜和原子

力显微镜的发明者之一,1986 年获得诺贝尔物理学奖。1994 年,他组建了 Delphi Creative

Technologies GmbH 公司,后改名 Definiens GmbH 有限责任公司,现在是 Definiens AG

股份公司(总部位于慕尼黑)。该公司旗下 Definiens Imaging GmbH 公司开发的影像分

析软件 eCognition 在面向对象的图像分类领域获得了巨大成功。它是首个模拟人类大脑

认知原理与计算机超级处理能力有机结合的产物,即融合计算机自动分类的速度和人工

判读解译的精度。2009 年 11 月 2 日,eCognition 8.0 系列软件产品在德国慕尼黑全球首

发。2010 年 6 月 11 日,Definiens 地理科学业务已与美国 Trimble 公司正式达成整合协

议,Trimble 收购 Definiens 的地理科学所有相关业务。eCognition 为 Trimble 提供了世界

一流的图像分析功能,为 Trimble 的地理空间产品和解决方案提供了补充。

eCognition 是目前所有商用遥感软件中第一个面向对象的遥感信息提取的智能化专

业软件。它采用决策专家系统支持的模糊分类算法以及根据上下文语义的网络层次关系

提取信息,突破了传统商业遥感软件单纯基于像素的光谱信息进行影像分类的局限性,

提出了革命性的分类技术——面向对象的分类方法。该方法大大提高了不同空间分辨率

数据的自动识别精度,有效地满足了地学领域科研和工程应用的需求。由于以单个像素

为单元的常规信息提取技术过于着眼于局部而忽略了图像局部区域的几何结构特征,从

而严重制约了信息提取的精度,eCognition 所采用的面向对象的信息提取方法,针对的

是对象而不是传统意义上的像素,充分利用了对象信息(色调、形状、纹理、层次),

类间信息(与邻近对象、子对象、父对象的相关特征)。在面向对象的信息提取方法探

索中,eCognition 是目前研究最早、技术较为成熟、功能丰富、关注度和认可度高的商

业化软件。在近十年的发展过程中,为业界领先的数据提供者、产品增值者以及可为遥

感专家提供一种应用解决方案。

近年来,随着地理信息系统和影像分析技术的发展,一些专业遥感处理软件相继出

现了面向对象的图像处理分析系统或模块(如 ERDAS IMAGINE Objective 和 ENVI

Feature Extraction),也帮助了面向地理对象的图像分析走进了应用主流(Addink et al.,

2012)。这些插件或独立运行的软件,可集成到 ArcGIS、RemoteView、ELT、ERDAS

IMAGINE、SOCET SET、GeoMedia 等平台上加以应用,极大推动了面向地理对象遥感

影像分析处理技术的实践与应用。如美国 ITT 公司基于面向对象分析技术,研发了特征

提取模型,并集成到 ENVI 平台上应用。“面向对象空间特征提取模块—— Feature

Extraction”是面向对象、基于影像空间以及影像光谱特征,从高分辨率全色或者多光谱

数据中提取信息。该模块可以提取各种特征地物(如车辆、建筑、道路、桥、河流、湖

泊以及田地等),并且可以在操作过程中随时预览影像分割效果。在高空间分辨率遥感

数据中,目标地物往往呈现为一个光谱或者纹理特性的感兴趣区域,因而基于对象的提

取方法能更好地提取具有多种特征的地物。

Meinel 和 Neubert(2004)对多个商业和自由软件的分割算法进行了比较,Srivastava

(2013)从完整性(Completeness)、正确性(Correctness)、质量(Quality)等 3 个方面

比较了 ERDAS Imagine(USDA Forest Service 提供的 Segmentation Module),ENVI 4.0

和 eCognition 4.0,对于利用全色的 IKONOS 数据检测建筑物而言,eCognition 的分割

及目标检测能力要略强于 ERDAS Imagine 和 ENVI(表 1.1)。

Page 19: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 1 章 绪 论 ·9·

表 1.1 主要面向对象分析软件比较

分割软件 eCognition 3.0 ENVI feature

extraction 4.5

Image Segmentation

(for Erdas Imagine) SPRING 4.0 RHSEG 1.47

开发商 Definiens

Imaging GmbH ITT Corporation

USDA Forest Service,

Remote Sensing

Applications Center

National Institute for

Space Research NASA

网站 www.definiensi

maging.com

http://www.exelisvis.

com/

www2.erdas.com/Suppo-

rtSite/ www.dpi.inpe.br/spring

http://opensour-

ce.gsfc.nasa.gov

/projects/HSEG/

index.php

算法 区域增长 区域增长 区域增长 区域增长/分水岭 区域增长

主要文献 Baatz & Schäpe

2000

Robinson, Redding

and Crisp (2002) Ruefenacht et al. 2002 Bins et al. 1996 Tilton 2000

发布时间 11/2002 12/2008 02/2002 08/2003 12/2009

操作系统 Win Win Win Win, UNIX Win,Linux

系统环境 独立运行 IDL Erdas Imagine 独立软件 独立软件

参数 3 2 2 2 3

运行时间 10 分钟 快速 1.5 小时 30 分钟 140 分钟(128

×128)

重现性 好 好 差 差 好

分类 决策树 支持 不支持 支持 不支持

最大像素

数量 10000×10000 未知 2000×2000 2000×2000 65535(行列)

像素位数 32bit 32bit 8bit 8bit 32bit

输入格式 栅格 ENVI file format IMG GeoTIFF, IMG GeoTIFF

矢量输出 支持 不支持 ArcCoverage 不支持 不支持

外部数据 是 可以 可以 否 否

可获得性 商业 商业 自由软件 自由软件 自由软件

1.3 GEOBIA 研究进展

GEOBIA 的一个重要目标是提升图像分析能力(Johansen et al.,2010; Lizarazo,

2012)。面向对象的遥感影像分析一般由以下步骤组成(Hussain et al., 2013):图像分割,

对象分级利用,以及(Benz et al.,2004; Blaschke,2010)。GEOBIA 中基础的步骤是抽

取图像对象,它由图像分割或分层来实现,其中也可以应用外部的信息如轮廓边界

(Addink et al.,2012)。这些图像对象进一步作为后续影像分析与图像理解的基本单元。

国内外在面向地理对象的图像分析领域的研究大致体现在以下方面:分割尺度的选择与

学出版社

职教技术出版中心

www.abook.cn

Page 20: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·10·

优化、面向对象的遥感信息获取与变化检测,以及面向对象分析方法在人工智能、图像

理解等领域的深入应用。这里需要指出,GEOBIA 是一种思想,而不是一种具体的方法。

因此,面向对象分析的具体实施和处理方法,是需要我们比较、研究和分析的。

1.3.1 分割尺度的选择与优化

利用地物空间信息能提高遥感信息获取能力,其关键在于获取适宜的图像对象。适

宜的图像对象是指遥感影像上“与地物对象内在尺度一致的”像元集合(Chen et al.,

2006)。影像中的空间信息包括影像纹理、上下文信息,邻近像素以及地理特征属性。

人们越来越认识到,对象的空间信息,尤其是邻域结构信息在当像素连接为对象时才能

得到体现(Burnett and Blaschke,2003)。期间涉及尺度的概念:①观察尺度,即用于识

别现实中的特定对象,如一棵树、一栋房子、建筑区、林区、水域等;②测量尺度,即

数据的分辨率。尺度又称为“感知窗口”(Marceau,1999)或者函数/功能(Strahler et al.,

1986),因此地理应用中都需要有一个目标尺度。许多环境或空间规划问题都与一定的

尺度集有关,众多学者已认识到尺度在环境遥感中的重要性(李小文,2006;李德仁,

2007)。Burnett 和 Blaschke(2003)提出了一种同时获取不同分割尺度对象的方法,并

把这种不同尺度的信息应用在影像分类中,称之为多尺度分割中的对象相关模式表达

(MSS/ORM)。Lang 和 Langanke(2006)指出,在具体情况中,单层对象表达对于土地

覆盖分类而言已经足够,并且非常直接。

国内,黄慧萍(2003)较早讨论了面向对象的遥感影像多尺度分析中的尺度问题。

陈建裕等(2006)通过分析分割过程中图斑及相邻图斑光谱差异,通过构建基于图斑演

进的分割尺度曲线,提出了图像中地物的最优分割方法。何敏等(2009)用空间相关性

来表示对象之间的异质性,提出了整个影像范围内最优分割尺度的计算模型;胡文亮等

(2010)对此进行了改进,增加了面积和周长的一致性评价。张俊等(2011)根据“类

内同质性大,类间异质性大”的最佳分类原则,提出了面向对象的 RMAS 方法,该方

法认为“对象 RMAS 值最大时,对象内部的异质性最小,对象外部的异质性最大,此

时的分割尺度为类别提取的最优分割尺度。”李秦等(2011)采用各对象的方差均值与

变化率随分割尺度变化曲线,确定方差均值的峰值,以变化率开始呈现下降趋势时所对

应的分割值为最优分割尺度参考。陈春雷等(2011)将组成对象的像素灰度值的标准差

作为衡量对象内同质性的标准,用与邻域的平均差分的绝对值作为对象间异质性的度

量,同时考虑面积权重的影响,根据上述评价指标,在考虑多光谱影像的基础上,构造

了平均分割评价指数,以此确定不同地物类型的最优分割尺度。于欢等(2010)以分割

后影像区域对象矢量边界线与目标对象真实矢量边界的吻合程度为标准,提出了矢量距

离指数法作为最优分割尺度定量选择的指标。在国外,Hay 及其合作者(Hay et al.,2001;

Castilla et al.,2008)提出了一种具体对象的泛化方法,不管对象在几个尺度上,都是按

照几何方式精确地建立在彼此基础上的,不同分割过程独立进行,从而产生最适合的轮

廓线。Moller 等(2007)通过比较分割区域与真实对象区域的覆盖程度及重心位置差异

来判断分割的优劣。

现阶段多种 GEOBIA 实现方法的共同特性是为了获得“有意义的对象”,区别在于

不同的尺度解析,建立图像对象的方式不同。既然合适的尺度是环境与地学信息分析的

Page 21: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 1 章 绪 论 ·11·

重要“感知窗口”,那么尺度选择在遥感信息获取中是非常重要的,也是 GEOBIA 研究

的热门。

1.3.2 面向对象的遥感信息获取

遥感影像中像素的集合形成了图像对象,它在图像场景中代表了有意义的地理对

象。更一般的,图像对象化技术提供了与不同的空间比例尺下地图数据一致的像素层匀

质对象的能力(Johansen et al.,2010)。Yu 等(2006)对加利福尼亚北部一个研究区进

行了详细的植被资源普查,经验性地证明了 GEOBIA 方法能够克服逐像素分类法中的椒

盐效应。Yan 等(2006)分别采用逐像素和 GEOBIA 两种分类方法绘制了内蒙古一个煤

田区的土地覆盖图,对比发现二者在分类精度上存在差别,运用面向对象的影像分析方

法获得的专题图较使用逐像素分析法得到的精度更高。Duveiller 等(2008)通过一个系

统化的区域样区方案,调查了土地覆盖变化情况,获得了与土地覆盖变化一致的对象,

并采用非监督方法进行了分类,其中采样方案是由高分辨率遥感影像应用基于面向对象

和非监督分类的多尺度方法得到的,该方法用于精确评估刚果河流域在区域、国家及景

观尺度上的森林退化情况。在景观规划与景观生态许多应用中,GEOBIA 的方法常用于

联接景观生态学中的地理对象与斑块(Lang and Langanke,2006),如 Lathrop 等(2006)

通过实验论证了采用 OBIA 方法进行生境测图的有效性。Radoux 和 Defourny(2007)

使用高分辨率影像和OBIA方法生成了用于森林资源范围管理的大比例尺高精度地图和

定量信息,Chen(2012)利用面向对象的分析方法再结合 Lidar 与 Quickbird 数据估算

了加拿大魁北克地区的森林参数。Powers(2012)等认为尺度的选择会影响湿地制图。

Turker 和 Sumer(2008)监测了在土耳其秋克地区一次地震中的建筑物受损情况,利用

建筑物与阴影之间的关系对灾后航空影像进行分割,并正确地标注出 80.6%的建筑物(或

为受损建筑或为未受损建筑)受损情况。Radoux 和 Bogaert(2014)也对面向对象方法

中采样与分类的精度进行了详细讨论。

陈秋晓等(2004)提出了基于多特征的面向对象遥感影像分类方法。吴均平等(2006)

将面向对象的遥感影像分割结果用于海岸带土地覆盖分类。崔林丽等(2006)采用面向

对象的思想,通过图像分割和分割对象的矢量化等一系列的处理,并在此基础上提取了

目标的形状信息,最后综合光谱和形状特征,应用模糊分类器实现了两种典型人造目标

的分类提取。陈云浩等(2006)基于 Aster 数据对北京市区及近郊区土地利用进行了分

类提取,验证了面向对象和规则的光学遥感影像分类方法。苏伟等(2007)使用高分辨

率遥感影像 QuickBird 和激光扫描 Lidar 数据,对马来西亚吉隆坡市城市中心区的土地

覆盖进行了分类研究,结果表明,利用多尺度、多变量的影像分类方法能得到较理想的

城市土地覆盖与利用分类结果,其分类精度从常规面向对象分类方法的 83. 04%提升到

88.52%。

此外,邓广(2009)采用面向对象的遥感影像分析方式和不同的图像分割方法,提

取了单株立木及林分参数。陈建裕等(2005)将面向对象的分析方法应用于珊瑚环礁遥

感分析中。高伟(2010)在面向对象遥感影像分割的基础上,提出了“特征+规则”的

基于知识库的遥感信息获取途径,并对目标地物的特征组合问题进行了分析。陈杰等

(2010)结合支持向量机技术与基于粗糙集的粒度计算, 提出一种新的高分辨率遥感影像

学出版社

职教技术出版中心

www.abook.cn

Page 22: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·12·

面向对象分类方法。王琰(2012)对基于像斑统计分析的高分辨率遥感影像土地利用/

覆盖变化检测方法进行了研究。朱庆(2013)提出了基于图像对象的高分辨率影像真正

射校正方法,能保持准确的几何特征和完整的纹理结构,还能自适应地处理遮挡和阴影。

已有许多学者致力于研讨逐像素法和面向对象方法在遥感信息获取中的差异

(Ehlers et al.,2006)。例如,基于分割后的图像对象以及整幅影像中的滑动窗口,Su 等

(2008)使用 OBIA 的方法改善了纹理分析,并计算了图像对象的灰度共生矩阵(GLCM)

纹理特征(包括同质性、反差、二阶距、熵),对比光谱与纹理(空间)信息分类结果

可以看出,运用高分辨率影像中的纹理空间信息可以提高面向对象的影像分类精度。更

多案例研究发现,OBIA 的分析单元是图像对象,它能获得更丰富的信息包括纹理、形

状、与邻近对象的空间关系和不同空间分辨率的辅助空间数据(Aguirre-Gutiérrez et al.,

2012),并允许直接利用空间上下文语境。这与人工解译相似,它直观地从一幅图像中

辨别出对象,通过考虑不同的空间属性(比如尺寸、纹理、形状)和这些特征的空间组

合来理解场景语义(Addink et al.,2012)。特别在当前绝大部分商业高分辨率影像数据

由 4 个多光谱和一个全色波段组成时,OBIA 中图像对象蕴含的语境信息和空间关系信

息变得愈加重要(Johansen et al.,2008)。

1.3.3 面向对象的遥感变化检测

遥感变化检测技术(Change Detection,CD)起始于 20 世纪 60 年代。1961 年,

Rosefield 第一次发表用数字化的侦察遥感图像进行自动变化检测论文,并首次提出像素

灰度差分的变化检测方法。在此后的 50 年里,遥感变化检测逐渐成为遥感的重要应用

领域之一。Mouat 等(1993)认为“遥感变化检测是一个确定和评价各种地表现象随时

间发生变化的过程”;Coppin 等(2004)指出“数字化变化检测包括从星载多光谱传感

器获取的多时相遥感影像中对各种时态现象进行定量化描述的过程”;我国学者赵英时

认为“变化检测就是从不同时期的遥感数据中,定量地分析和确定地表变化的特征与工

程”。目前,学术界关于变化检测的权威定义是由印度学者 Singh(1989)提出的,即:

变化检测是通过对同一目标或现象不同时间的观测来确定其状态差别的处理过程。这是

一种广义的定义,可以具体地理解为遥感变化检测就是利用多时相获取的同一地表区域

的遥感影像来确定和分析地表变化,提供地物的空间分布及其变化的定性与定量信息。

利用遥感数据获取地表信息已成为一种广泛使用的有效途径,当可重复性地获取同一地

区高分辨率遥感资料已不是遥感应用的一个障碍时,使用者更关注于通过新旧影像间的

变化检测确定更具意义的变化区域,即识别地理位置和变化的类型、定量变化,以及评

价遥感变化检测结果的精确性(Im and Jensen,2005)。

目前像素级变化检测方法是否适用于复杂环境的高分辨率遥感影像已引起了广泛

争论,仅依赖像元光谱信息的应用有其显而易见的局限性。李德仁院士(2003)更是指

出,目前的变化检测技术主要停留在像元级的数据导引的方法,缺少知识导引的特征级

变化检测方法,尚未充分利用新旧影像间的许多关联信息,未将所有未变化目标的几何

信息加以利用,也没有成熟的方法来处理不同时相数据中由于大气条件、传感器噪声和

大气辐射的差异性带来的干扰,这些都是变化检测中的关键性问题,需要加紧研究和解

决。因此,综合遥感影像所能反映的光谱和空间信息等全部信息,发展图像对象层次的

Page 23: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 1 章 绪 论 ·13·

变化检测技术已是根本上提高遥感信息获取能力的必然。

图像分析的基础单元一般是像素,基于像素遥感变化检测的方法、优点和缺点已有

大量的研究和深入总结(Coppin et al.,2004; Lu et al.,2004; Hussain et al., 2013)。例如,

Metternicht(1999)将模糊数学引入到变化检测;Walter(2004)将遥感数据分类结果

导入到 GIS 系统后再进行变化检测;Liu 等(2004)分析了 4 种变化检测方法的误差传

播;Lu 等(2005)在 Amazon 地区比较了 10 种变化检测方法的应用能力;Hégarat-Mascle

等(2005)认为高分辨率遥感图像的变化检测具有与低分辨率图像不同的特征;Dai 等

(2006)发展和利用贝叶斯网络进行多时相长序列的遥感变化检测;Oort (2007)着重讨论

了变化检测分析应用的误差矩阵;李亚平等(2008)提出了变化检测光谱阈值智能计算

方法。Im 等(2008)通过对三种不同的遥感变化检测方法即基于影像分割、影像分类

和对象分析(邻近相关)的方法与两种不同的逐像素方法对比分析,结果发现面向对象

的分类变化监测结果高于另外两种逐像素的分类变化检测法。大量应用表明,当应用于

高分辨率影像时,基于像素的变化检测策略的结果存在很强的不确定性(Wulder et al.,

2008)。包括:①地理参考精度;②地物类别内部中存在较大的反射率变化;③影像不

同的获取特性(例如传感器观测姿态、阴影和光照角度)。高分辨率影像呈现同类地物

内部变异导致了过多的“伪变化”被检测到,亦被称作“椒盐”效应。基于像素的 CD

方法另一个主要的局限性是难以对图像语境信息建模(Blaschke and Strobl,2001)。客

观世界地理对象的空间特性、空间关系以及组合的空间分布,都不能在基于像素的分析

中建模应用。这导致了基于像素的 CD 方法对空间语境的排斥,但空间语境却提供了至

关重要的关于区域的线索。

面向对象的遥感变化检测(Object-Based Change Detection,OBCD)可追溯到较早

时期。2003 年以后一些学者已试图在变化检测方面应用 OBIA 方法,Hay 等(2003)提

出一种面向多尺度对象的遥感变化检测法;胡岩峰等(2005)将一个矩形子区内像元的

统计结果作为判断变化的依据,刘臻等(2005)尝试进行基于相似度验证的变化检测技

术;Desclée 等(2006)将特定尺度下的多尺度分割结果与图像差值变化检测方法结合

应用;苏娟等(2007)提出了一种针对人工地物的目标级检测方法,都是试图提高像素

级变化检测方法的应用能力。上述方法强调以像素邻域窗口或子图像为处理单元,已有

脱离单个像元的趋势。Im 等(2007)尝试利用邻域约束和对象约束提高变化检测能力,

利用图像关联分析和图像分割方法进行对象级的遥感变化检测研究。张汉松(2010)在

国内较为详细地阐述了 OBIA 和 CD 相关理论,并进一步发展了面向对象的海岸带遥感

变化检测法,倾向于像素级与 OBIA 方法的混合应用。祝锦霞(2011)提出了一种以多

变量变换(MAD)得到的差异影像为基础,面向对象后分类处理的变化检测法,减少

了高分辨率遥感影像变化检测中不可避免的几何配准误差和阴影等造成的伪变化影响。

目前,OBCD 可以实现评价不同的对象属性(包括尺寸、形状和边界范围)的变化。

Niemeyer 等(2008)描述了在 OBIA 中地物对象的变化如何被度量,如基于光谱要素(如

平均值、标准差、比率、纹理)、形状要素(如面积、方向、位置)、邻近关系(如子对

象、父对象)和地理对象要素类。与基于纯像素的 CD 方法相比,OBCD 使用光谱、纹

理、空间、地形和分层的对象特性来对现实世界建模与变化分析,但关于地理对象的确

认这一核心问题总是不能很好解决。例如,Radoux 等(2014)只是论证了基于点的取

学出版社

职教技术出版中心

www.abook.cn

Page 24: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·14·

样不依赖于对象的概念。此外,变化检测误差矩阵仍然用于大部分的 OBCD 研究,但

Hernando 等(2012)已指出它仅是基于像素的方法而建立,针对面向对象的方法其精度

评价结果是不充分的。

许多 OBCD 的实际应用以采用分类(监督或非监督方法)为主。分类后的 OBCD

方法检测精度是一个关于多时相图像分类精度的函数。每一时相数据分类的误差都将累

积传播,降低整体变化分析的精度。分类中若采用监督方法需使用训练集,训练数据的

质量、精度和完整性是生产出高质量分类结果以及其后 CD 结果的关键(Nackaerts et al.,

2005)。然而选择高质量的训练样本集对于图像分类总是充满不确定性且耗时,尤其针

对一些历史影像数据的分类。若采用非监督分类,由于不需要区域的先验知识,则无需

事先构建样本集合提供给算法。但基于非监督分类的 CD 方法更面临着辨别和标记变化

的困难(Lu et al.,2004)、参数确定(如组份数目等)等诸多问题。

需要强调的是,以利用地物空间信息为目标的面向图像对象的处理方法在遥感应用

中已得到普遍认可。图像对象是利用地物空间信息提高变化检测能力的自然手段。当地

物的大小形状发生变化时,体现在遥感影像中为图像对象的大小形状随之变化。常识告

诉我们,地物对象的大小、形状发生了变化,即使不考虑地物的其他信息,我们也能认

知到变化发生了。这并不意味着我们可以不需要地物的光谱信息,相反,光谱信息的差

异仍是识别地物差异的基础。显然图像对象层次的变化检测技术相对于像素级的处理而

言,技术发展是跨越式的,大量理论、方法和技术问题亟待解决。

1.3.4 GEOBIA 与地学知识的关联

传统的遥感影像分类结果难以全面描述高分辨率影像中错综复杂的目标地物,实现

遥感数据到空间地理信息智能转化的认知模式和相关图像理解的迫切需求。面向对象的

影像分析(GEOBIA)正是专门用于将遥感图像分割为有意义对象集合的方法,并通过

空间、光谱和时间尺度来评价其特性。与传统分类方法比较,GEOBIA 呈现了至少四个

在基于像素分类中没有的新特性(包括分割步骤、分类器、专家知识集成和要素空间最

优化),它们具备挖掘遥感影像信息的潜力。事实上,图像分析的整个过程实质是知识

的转换(Lang,2008)。GEOBIA 现在被广泛地采用,它的大量应用也突显了以下几个

重要问题(Arvor,2013)。首先,不同的 GEOBIA 专家有其不同的影像理解其处理方式。

面向对象的影像分析技术是基于专家知识,并使之转化为计算机辅助图像解译的过程,

由于其不同的知识背景和应用经验,分析相同的数据仍会获得不同的结果。其次,分割

后的分类处理过程不被完全地控制和记录存档。例如 GEOBIA 包含了分割过程,这是一

个不确定性问题(Hay and Castilla,2008),再者,参数选择有赖于使用者和特定应用,

从而阻碍了分类的质量评价。因此,GEOBIA 方法移植困难(Durbha et al., 2010; Gao et

al.,2011)。

图像分割步骤描述出图像中拥有相同属性(即低级要素,如光谱波段一致)的区域

(Liu et al.,2008),继而,分割结果与人类概念上地物对象的解译建立联系(Hay and

Castilla,2008),分类步骤是将图像区域归属到语义类中(即高级概念,如植被)。这个

过程通过图斑属性的分析和图斑之间的关系来确定他们的地理属性(Liu et al.,2008),

突出了空间信息在改善分类的重要性(Blaschke and Strobl,2001)。图像对象拥有更丰

Page 25: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 1 章 绪 论 ·15·

富的信息,例如可以获得图斑像素集每个波段的光谱平均值、中值、极值、比率、方差

等光谱信息(Blaschke, 2010),也可以分析图像对象的纹理特征信息,更可以提取图像

对象的形状、大小等空间信息和对象间的空间关系(方向、距离和拓扑关系),进一步

地可以分析多个对象形成的空间格局,发掘其空间上下文特征,这对地理空间分析与研

究有着十分重大的意义,这也是 GEOBIA 在近十年中迅速发展的重要原因之一。

实际上,遥感信息处理专家已认知到空间结构对遥感信息处理的影响,如几何光学

模型或几何光学辐射传输混合模型(李小文,2006)关注成像过程中的空间结构信息;

遥感数据的 DEM 校正、正射投影处理(李德仁,2007),则试图消除空间差异带来的信

息偏差。在高分辨率的遥感影像中,地物的内部结构外化为多个相邻像素的集合,需要

通过图像处理的方式去获取其反映在影像上的像素集合及其空间结构。进一步面向对象

的遥感影像技术可以作为更高层次的影像处理的基础,遥感图像理解的基础。因为图像

理解需要图像低层信息的支持(高隽等,2010;孙显等,2011),而遥感影像多尺度分

析正是为图像构建可理解的图斑信息。目前,图像分割和图像分类这两个步骤依然需要

依赖于专家知识,这限制了图像解译程序的自动化。自动图像解译的问题在于发展自动

目标识别算法来映射地理对象。这个问题涉及“语义鸿沟”,即可视数据中抽取的信息

与图像理解之间的缺乏一致性(Smeulders et al.,2000)。

GEOBIA 的进一步发展涉及地理知识的组织管理,知识的表达方法可能在遥感发展

中起到至关重要的作用。目前,本体论已广泛地被使用在各个科学领域,通过数据访问、

数据共享和数据传播提供解决方案来解决数据异构性问题。“本体论”的一个广泛被接

受的定义是由 Gruber(1993)提出的,定义本体论为正式、详尽以及可共享的概念化规

格说明。多位学者都强调在地球信息科学中发展本体论的重要性(Agarwal,2005;

Buccella et al.,2009)。在 GEOBIA 应用的背景下,地学本体论已能够被应用于根据应

用的目标辅助用户确定需求的数据等方面。例如,本体论被用来实现基于内容的语义信

息的图像检索(Almendros-Jimenez et al., 2010)。基于内容检索的图像处理主要是对图像

信息查询能力的提升,不是对全部图像内容的描述(Smeulders et al.,2000),但它却是

图像语义解译的目标。事实上,遥感图像解译是为图像对象赋地理对象类型值。“图像

对象”与“地理对象”两者已被 Castilla 和 Hay(2008)广泛深入地讨论过,他们定义

地理对象为某个最小尺寸的地表或近地表对象(如森林、湖泊或山),图像对象是独立、

内聚且与它周围不同的数字图像区域。

GEOBIA 中本体论的应用突显了地理的概念复杂性和图像解译相关这一重要问题。

应用 GEOBIA 程序处理遥感影像关键在于为图像对象赋予地理对象类型值(Castilla and

Hay,2008)。换句话说,该过程要求基于“概念表示”的场景描述解译图像内容(Lang,

2008)。本体论在以这种方式描述场景中很有价值,因为对于图像分析而言,本体论有

能力在现实中被观测的地表对象与遥感数据分析过程中创建出的对象之间建立关系,如

已经提出并广泛接受了的描述空间和时间关系的标准九交矩阵、RCC8 拓扑关系和艾伦

区间代数等。在遥感影像智能解译方面,1999 年 Findler 和 Malyankar 研究建立了沿海

地物实体的本体论,Mark 和 Smith(1999)对地理本体基本理论和地理目标的本体特征

进行了深入研究,杜云艳等(2008)提出了基于地理本体的海湾空间数据组织的方法。

空间语义网络已是遥感影像理解方面重要的知识表示方法。例如,ERNEST、GeoAIDA

学出版社

职教技术出版中心

www.abook.cn

Page 26: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·16·

系统等都采用语义网络模型来表示知识;Buckner 等(2000)利用语义网络描述来进行

智能、简单、灵活的图像理解操作,包括目标地物的结构、上下文信息和目标地物关联

的属性;Keller 和 Wang(2000)则使用基于模糊规则推理的方法来进行场景解析。

由于遥感图像本身存在解释的模糊性,很难直接由传感器获得的图像数据去建立场

景描述,所以需要引入“知识”去消除局部的模糊和成像差异。Kodratoff 和 Mosoatelli

(1994)探讨了使用机器学习的智能方法识别遥感影像中的目标与场景。Barnsley(1997)

使用类似 ARG 模型的“图”结构对高分辨率卫星遥感影像进行目标地物的空间分布结

构分析。Tonjes 等(1999)在语义网络中引入先验知识进行航空图像解译。Matsakis 和

Keller(2001)使用模糊语义描述图像中物体的相对位置关系,结合标记图建立了图像

理解系统。Durbha 和 King(2005)提出了一种基于概念的领域相关本体模型框架,用

于地球观测数据中知识的发现。Rajan 等(2006)应用层次分类进行地学知识转化。Baraldi

等 (2006, 2010) 引入了基于光谱规则的分类方法,将光谱信息与土地覆盖类型关联。张

国敏(2010)应用基于图的方法进行高分辨率遥感图像中特定目标识别。Anders 等

(2011)采用了图像对象的层次化组织进行半自动的地貌分析。

众多研究表明,GEOBIA 和图像理解是一个基于知识的过程,需要知识的支持。因

而,选择合适的知识表示和推理方法,在遥感影像信息转换中尤为重要。GEOBIA 代表

了遥感影像处理的新方法,它已在近十多年里得到广泛使用并证明其应用价值。

Page 27: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息

2.1 高空间分辨率遥感影像

面向地理对象遥感影像分析处理技术的发展,是与遥感图像空间分辨率提升紧密联

系在一起的。遥感技术的迅速发展呈现出多个层次遥感平台、多种类型遥感数据的获取

手段,突出体现在高空间分辨率、高光谱分辨率、高时间分辨率遥感数据的大量出现。

高空间分辨率卫星遥感是空间技术发展和应用需求共同推动的产物。同时,高分辨率是

一个特定的、相对的概念,不同历史时期高分辨率的含义不同。

高空间分辨率(一般简称“高分辨率”,本书中的高分辨率特指高空间分辨率)对

地观测卫星可以划分为军用和民用两大类,二者都有广阔的应用领域。军用遥感卫星和

民用遥感卫星在原理上并无差别,主要区别体现在卫星所使用的谱段、对地面分辨率要

求上及其应用目标上的差异。民用遥感卫星则主要用在多光谱成像,以便识别地面各种

光谱特征,其分辨率高低差异参差不齐,但其总体水平普遍在军用卫星之下。

在军用高分辨率光学成像遥感卫星领域,前苏联与美国先后于 1960 年发射了各自

的侦察卫星,拉开了高空间分辨率遥感序幕。例如,美国的 CORONA 系列照相侦察卫

星(Altmaier & Kany, 2002),从 1958 年开始至 1972 年结束(示例影像数据见图 2.1),

采用代码 KH 编号,从初期 KH-1 到高级型的 KH-12“水晶”。这些早期“敌对”卫星的

遥感侦察行为,却为缺乏历史地面调查资料的区域提供了宝贵的“立此存照”数据(Chen

et al., 2014)。法国太阳神 2 号 A、B 卫星空间分辨率已达 0.5m,其军民两用光学成像遥

感卫星的分辨率达 0.7m;以色列 先进的地平线 9 号小型光学成像遥感卫星空间分辨率

也已达到 0.5m;日本现役的第二代光学成像“情报收集卫星”分辨率则为 0.6m。在众

多军用高分辨率光学成像遥感卫星中,以美国锁眼 12 号卫星 为突出。它采用了大面

阵探测器、大型反射望远镜系统、数字成像系统、自适应光学成像技术、实时图像传输

技术等,空间分辨率竟达 0.1m。

在民用光学成像遥感卫星领域,美国于 1972 年首次发射地球资源卫星(ERTS-1),

1975 年正式命名为陆地卫星(Landsat),其多光谱扫描仪 MSS(Multi-Spectral Scanner)

的空间分辨率为 80m。1986 年法国 SPOT 1 卫星的可见光传感器(High Resolution Visible,

HRV)的地面分辨率全色为 10m,多光谱分辨率为 20m,目前正在工作的是 SPOT5 和

SPOT6。1999 年美国空间成像公司(Space Imaging)发射了分辨率为 1m 的 IKONOS

卫星;2001 年,数字地球公司(DigitalGlobe)发射了分辨率为 0.6m 的 QuickBird 卫星;

2003 年,轨道成像公司(OrbImage)发射了轨道观测卫星 OrbView-3;2007 年,DigitalGlobe

发射了第二代卫星系统中的 WorldView-1,空间分辨率为 0.5m。该类高分辨率卫星机械

设计灵活,指向性好,可以前后左右侧视成像,获取同轨或异轨立体像对,且高分辨率

卫星一般采用近极地太阳同步轨道,保证了频繁的重访周期。

学出版社

职教技术出版中心

www.abook.cn

Page 28: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·18·

图 2.1 CORONA 影像(浙江朱家尖局部)

我国对地观测技术,尤其高空间分辨率卫星遥感应用发展迅速。在民用高分辨率遥

感卫星领域,我国已经可以获取米级或亚米级的全色或多光谱的遥感数据。资源三号

(ZY-3)卫星是中国第一颗自主的民用高分辨率立体测绘卫星,通过立体观测,可以测

制 1 5∶ 万比例尺地形图,为国土资源、农业、林业等领域提供服务,资源三号填补了

中国立体测图领域的空白。“高分一号”卫星于 2013 年 4 月 26 日在酒泉卫星发射中心

由长征二号丁运载火箭成功发射。“高分一号”配置了 2 台 2m 分辨率全色和 8m 分辨率

多光谱相机,4 台 16m 分辨率多光谱宽幅相机。虽然我国在发展高分辨率对地观测卫星

方面起步晚了几十年,但作为高分辨率对地观测系统的首发星,高分一号卫星突破了高

空间分辨率、多光谱与宽覆盖相结合的光学遥感等关键技术,所获取的影像地面分辨率

可达 2m,经过相机多角度视场拼接,优于 16m 分辨率的视场可达 800 多千米,4 天即

可完成一次重访,在分辨率和幅宽的综合指标上达到了目前国内外民用光学遥感卫星的

领先水平。2014 年 8 月 19 日 11 时 15 分,太原卫星发射中心用长征四号乙运载火箭成

功发射“高分二号”卫星,卫星顺利进入预定轨道,标志着中国遥感卫星进入亚米级“高

分时代”。高分二号卫星是中国自主研制的首颗空间分辨优于 1m 的民用光学遥感卫星,

观测幅宽达到 45km,在亚米级分辨率国际卫星中幅宽达到 高水平,同时具备快速机

动侧摆能力和较高的定位精度,有效地提升了卫星综合观测效能。

在民用高分辨率遥感卫星领域,商业卫星提供的米级或亚米级的全色或多光谱的遥

感数据众多,例如 IKONOS、QuickBird2、EROS、WorldView-1、WorldView-2、SPOT5

和 SPOT6 等。我们将目前常用的一些商业化高空间分辨率遥感卫星介绍如下。

IKONOS 卫星是 GeoEye 公司为获取高解析度和高精确度空间信息而设计制造的。

它是高分辨率商业卫星发展史上的里程碑,首次在民用领域将星载传感器的地面分辨率

提高到 1m 以上。IKONOS 卫星轨道高度 681km、太阳同步、倾角 98.1°。当地太阳时上

午 10 点 30 分卫星通过降交点获取影像,以保证遥感数据较好的光照条件和阴影水平。

Page 29: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息 ·19·

卫星姿态灵活,分别为 45°和 26°侧视,重访周期分别为 1 天和 3 天。IKONOS 卫星能

提供 1m 全色和 4m 多光谱遥感影像。

QuickBird 卫星由 Ball 航天技术公司、柯达公司和 Fokker 空间公司联合研制,2001

年 10 月 18 日由波音 Delta 火箭发射成功。QuickBird 卫星轨道为近极轨太阳同步轨道,

在各地太阳时上午 10 点 30 分左右成像,保证了较好的光照条件和适中的阴影水平。

QuickBird 卫星采用推扫式 CCD 扫描仪,卫星星下点空间分辨率全色为 0.61m,多光谱

为 2.44m。同时,卫星平台上装备了三轴姿态稳定、恒星跟踪和星上 GPS 系统等。因此,

QuickBird 卫星不仅具有大面积采集能力和 15500km2 的存储能力,而且高质量的遥感影

像具有大视场、高对比度、高信噪比等特点。

WorldView-1 卫星运行在高度 496km、倾角 98°、周期 94.6min 的太阳同步轨道上,

平均重访周期为 1.7 天。WorldView-1 卫星星载大容量全色成像系统,每天能够拍摄多

达 100 万 km2 的 0.5 m 分辨率全色遥感影像。该卫星还具备现代化的地理定位能力和灵

活的响应能力,能快速瞄准目标区域,并有效地进行同轨立体成像。WorldView-2 卫星

于 2009 年 10 月 8 日发射升空,运行在 770 km 高的太阳同步轨道上,能够提供 0.5 m 全

色和 1.84m 分辨率的多光谱遥感影像。 新的 WorldView-3 卫星已于 2014 年 8 月 13 日

发射成功。WorldView-3 卫星运行在 617 km 高的太阳同步轨道上,能提供 0.31 m 全色、

1.24 m 多光谱和 3.7m 短红外遥感影像。

目前,高空间分辨率遥感影像的分辨率一般认为应在 10m 以内。高空间分辨率遥感

影像因为其自身的辐射特点,像元的混合程度明显低于中、低分辨率影像;同时也具有

丰富的空间信息,如地物几何结构、纹理信息更加明显;具备更多便于认知地物目标的

属性特征,如地物的光谱值、上下文信息和专题信息属性等。遥感影像中的光谱值反映

了地表地物波谱特性。一些遥感传感器的光谱通道设置还专门针对特定类别的地物。

例如,WorldView-2 卫星提供了独有的 8 波段高清晰商业遥感数据(见图 2.2)。除了

图 2.2 WorldView-2 多波段影像融合(中国浙江朱家尖局部)

学出版社

职教技术出版中心

www.abook.cn

Page 30: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·20·

4 个常见的波段外(蓝色波段:450~510nm、绿色波段:510~580nm、红色波段:630~

690nm、近红外波段:770~895nm),WorldView-2 卫星还提供了以下新的光谱通道以利

于多领域的应用分析:①海岸波段(400~450nm)支持植被鉴定和分析,可透过水生植

物的叶绿素和地表渗水率特性来帮助进行水岸测深研究,由于该波段易受大气传输影

响,也应用于大气纠正研究;②黄色波段(585~625nm)是重要的植物应用波段,该波

段也可作为辅助校正真色度的波段,以符合人类视觉习惯;③红色边缘波段(705~

745nm)辅助分析有关植物生长情况,可以直接反映出有关植物健康状况信息;④近红

外 2 波段(860~1040nm)部分重叠在近红外波段上,但较少受到大气层的影响,该波

段支持植被分析和单位面积内生物量的研究。

在大量遥感应用与实践中,高分辨率数据在带来强烈视觉冲击的同时,也带来了

一系列信息处理与模式识别的新问题。大量的实验表明:卫星遥感影像空间分辨率的

提高并不一定意味着影像解译精度的提高(Myint et al., 2004)。与传统的中低分辨率

卫星影像相比, 显然卫星空间分辨率的提高确实增强了地物信息的获取能力,可以描

述一些中低分辨率无法探测到的新目标(如屋顶、小路、阴影、花园、停车场等)。但

是, 随着影像空间分辨率的提高,数据量大幅度增加,地物信息呈现高度细节化,影

像中地物的光谱分布也更具变化和差异性。不同地物的光谱相互重叠,“同物异谱”、

“异谱同物”现象大量发生(见图 2.3,表 2.1)。同类地物的光谱特性差异变大,异类

目标的光谱特性出现相互重叠,使得类内方差变大、类间方差变小,这减弱了影像光

谱域的统计可分性(Bruzzone & Carlin,2006)。一方面,由于受空间成像技术的影响,

高分辨率传感器提供的光谱波段数减少,比如 IKONOS、QuickBird、SPOT5 等传感器

只有 4 个多光谱波段,与 Landsat 等中低分辨率影像相比,地物波谱信息大幅度减少。

另一方面,光谱分辨率减少,但高分辨率影像所提供的空间信息却丰富了传统遥感影

像的类别定义和地物光谱统计特征。正是由于光谱波段的减少和影像信息的细节化,

造成了类内方差的增大和类间方差的减少。因此,建立在中低分辨率影像处理基础上

的光谱解译方法,在解译高分辨率数据的特征时,面临着很大的困难,需要发展新的

处理方法和技术。

居民点 农田 树林

图 2.3 WorldView-2 多波段影像融合(朱家尖影像中的典型地物)

Page 31: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息 ·21·

表 2.1 WorldView-2 多波段影像中的 3 类地物的表观反射率

树林 Min Max Mean Stdev 城区 Min Max Mean Stdev 农田 Min Max Mean Stdev

Band 1 0.216 0.223 0.219 0.0009 Band 1 0.226 0.385 0.24 0.0091 Band 1 0.224 0.248 0.229 0.0026

Band 2 0.183 0.193 0.188 0.0014 Band 2 0.198 0.414 0.22 0.0152 Band 2 0.193 0.23 0.205 0.0043

Band 3 0.147 0.178 0.158 0.0049 Band 3 0.163 0.457 0.191 0.0206 Band 3 0.171 0.211 0.183 0.0054

Band 4 0.121 0.152 0.132 0.0049 Band 4 0.139 0.518 0.177 0.0233 Band 4 0.141 0.212 0.162 0.0085

Band 5 0.103 0.136 0.112 0.0029 Band 5 0.125 0.555 0.172 0.0279 Band 5 0.119 0.212 0.149 0.0111

Band 6 0.166 0.293 0.224 0.0217 Band 6 0.134 0.534 0.191 0.0279 Band 6 0.188 0.308 0.249 0.0209

Band 7 0.221 0.429 0.318 0.0351 Band 7 0.136 0.622 0.215 0.0375 Band 7 0.221 0.514 0.325 0.0405

Band 8 0.193 0.367 0.275 0.0293 Band 8 0.108 0.457 0.181 0.0329 Band 8 0.179 0.437 0.277 0.0361

2.2 图像对象中蕴含的信息

在遥感数据海洋中,人们现在能用到的遥感信息仅占全部获取信息的 5%左右,而

深层次的信息挖掘更少,极大地限制了遥感技术实际应用效果。传统遥感影像信息提取

方法以像素作为识别的基本单元,依靠不同光谱数据组合等统计特征来进行,因此适合

用于多光谱和高光谱分辨率的遥感图像,对于分析低分辨率遥感图像中大面积区域会取

得较好的结果。这些传统方法主要分为人工解译和计算机解译两种。人工解译方法需要

专家丰富的经验和对特定知识的了解。计算机解译方法则包括监督分类、非监督分类、

人工神经网络分类和专家系统分类等。这些传统图像解译、分类方法都是基于像元的光

谱信息,未能充分利用遥感影像提供的大小、形状、纹理、像素间的上下文关系等空间

形状和空间关系特征,无法发挥高空间分辨率遥感影像的优势。大量的文献表明基于像

元的遥感影像分析方法存在如下难以克服的问题。

(1)忽略丰富且重要的空间信息,获得的信息十分有限。

(2)无法解决同物异谱和异物同谱的现象,增加地物分类难度,造成提取结果存在

更为严重的“椒盐现象”。

(3)随着空间分辨率的提高,遥感影像的数据量成指数级增长,用传统方法对高分

辨率影像进行信息提取运算量大、速度慢,不能满足遥感信息快速提取的要求。

因此,对于高空间分辨率遥感影像分析而言,需要发展“超像素”的处理方法。

GEOBIA 的相关理论和方法正是在高空间分辨率遥感影像的广泛应用中迅速形成、稳定

发展的。

目前遥感影像的机器解译大都采用没有语义信息的低层特征(如颜色、纹理等统计

特征)。而用户实际判读影像时并非只建立在影像低层特征上,更是建立在对影像所描

述内容或事件的语义理解的基础上。由于计算机获取的影像低层信息和用户对影像理解

的语义信息的不一致性而导致低层特征和高层语义特征之间的距离被称为“语义鸿沟”。

“语义鸿沟”的存在正是长久以来遥感影像机器解译精度、自动化水平不能有根本性突

破而依赖于人工判读的主要障碍。

学出版社

职教技术出版中心

www.abook.cn

Page 32: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·22·

事实上,影像的语义信息根据从具体到抽象的顺序大致可以分为 3 个层次(图 2.4)。

图中每一部分对应于影像的一个语义层次,箭头表示语义的级别趋势。 低层是简单特

征层,它包括颜色、纹理和大小等统计特征,从本质上这个层次没有影像的语义信息;

中间层是利用低层特征进行一定的推理导出对象特征层, 高层涉及影像的抽象属性

(如行为、情感、专家知识等),需要对所描述场景的含义和目标进行深层的推理。许多

学者更愿意将对象层和语义概念层一起称为“语义层次”,语义鸿沟正是特征层和语义

层次之间的差别。一般而言,只有通过影像分割才能有效获取语义层次信息。相较于基

于像素的低层信息,图像对象不仅蕴含了低层信息,更提炼出了丰富的对象层和语义概

论层信息。虽然可以从低层信息直接推理高层信息,但 GEOBIA 的相关理论和方法必然

是遥感影像解译中通往语义层次的主要途径。

面向对象影像分析软件根据应用将图像对象中蕴

含的信息细分为多个层次,包括对象特征、基于子对

象的线状特征、位置、与父对象、纹理、特征距离、

层次等级、专题属性、与邻域对象的关系、与子对象

的关系、与上层对象的关系、标准 邻近度、与类型

的相似性。依据图 2.4,将图像对象蕴含的信息分为低

层特征信息、对象特征信息和语义特征信息三大类,

有助于理解和掌握图像对象的特征。

2.2.1 遥感影像中的物理量

遥感图像数据反映的是成像区域内地表地物的电磁波能量特征,有明确的物理意

义。而地物反射和发射电磁波能量的能力又直接与地物本身的属性和状态有关,因而遥

感图像数据值的大小及其变化主要是由地物的类型及变化所引起的。遥感信息的获取,

不仅和各种地物反射、散射和发射电磁波的特性有关,而且还受到大气透射条件的影响,

无论是太阳辐射入射到地面,还是地面对太阳辐射的反射都需要经过大气层才能到达遥

感平台。电磁辐射在大气层的传输过程中,受大气层的反射、散射和吸收作用,其不同

的波长所受的影响不同。

遥感影像之所以区别于一般图像,在于遥感影像获取具有明确的电磁波特性。不同

地物的波谱特征差异可以作为区分地物类型的途径,相同物质的同类地物在遥感影像中

体现为具有相对一致的光谱特性。光谱特征在图像中表现为像素值(或为像元值)。像

素值大多是经过量化后无量纲的 DN 值,而进行遥感定量化分析时,常用到辐射亮度值、

反射率值、亮温等物理量。

以下是遥感影像分析中常用的一些专业术语。

① 像素值 其通用术语是数字量化值或 DN(Digital Number)值,它通常被用来

描述还没有被校准到具有物理单位的像素值。

② 辐射度(Radiance) 也称辐射亮度值(Radiance Pixel Values),是某一方向上

单位投影面积单位立体角度单位波长辐射能量的总和。辐射亮度值常用单位标识是

W/cm2.μm.sr(读作瓦每球面度平方厘米每微米)。

辐射亮度值包括物体反射的辐射能量,也包括临近地物的辐射贡献,还包括大气层

语义概念层

(场景、行为和情感语义)

对象特征层

(对象层次数、对象之间空间关系等特征)

简单特征层 (光谱、颜色、纹理等特征)

图 2.4 影像的语义层次图

Page 33: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息 ·23·

的影响。同时,辐射亮度值也会受到辐射源的影响,如太阳光。当我们查看一个像元的

辐射亮度波谱曲线时,这条曲线整体基本就是太阳波谱形状。例如,通常在绿色波段

(500nm 左右)具有反射峰,因为太阳在 500nm 具有光谱峰值。如在像元的反射率波谱

中可能看到有些波段被大气强吸收,在影像上应是较小值。因此,通常情况下在对多光

谱和高光谱遥感影像数据进行定量分析时,辐射亮度图像需要转成反射率图像。

③ 反射率(Reflectance) 物体表面所能反射的辐射量和它所接受的辐射量的比值。

反射率值一般在[0, 1]范围,有时为了分析储存方便而扩大一定的倍数,如放大一万倍—

[0, 10000]。一些物质可以通过它们的反射光谱来识别,因此为了更好地识别遥感影像特

征,通常将图像定标为反射率图像。

反射率又分为表观反射率和地表反射率。

大气表观反射率(Top of Atmosphere Reflectance,TOA Reflectance)是飞行在大气

层之外的航天传感器量测的反射率。这种反射率包含了地表、云层、气溶胶和气体的贡

献。大气表观反射率可以通过辐射亮度定标参数、太阳辐照度、太阳高度角和成像时间

等参数计算得到。

地表反射率(Surface Reflectance)是地球表面的反射率,它不包括云层和大气组分

的影响。通常情况,地表反射率是从辐射亮度图像中计算得到的。目前,许多已经建立

的模型用于计算地表反射率,主要包括几何光学模型和辐射传输模型。

④ 发射率(Emissivity) 也称比辐射率,指物体的辐射能力与相同温度下黑体的

辐射能力之比。比辐射率值一般在[0, 1]范围,经常用来描述热红外图像特征。比辐射率

也包括大气表观比辐射率和地表比辐射率,意义和反射率类似。通常采用线性变换模型

将未定标的 DN 图像转换成发射率图像。

⑤ 亮温(Brightness Temperature) 当一个物体的辐射亮度与某一黑体的辐射亮度

相等时,该黑体的物理温度就被称之为该物体的“亮度温度”。亮度温度具有温度的量

纲,但区别于地物实际温度,它是一个地物辐射亮度的代表名词。亮温单位是开尔文

(K)或者摄氏度(℃)。这是一个广义的温度定义,它的数值是由很多因素贡献的,

比如大气下行、上行辐射等。我们可以通过普朗克方程,将热红外辐射亮度图像转换

成亮温图像。

传感器定标就是建立传感器每个探测器输出值与该探测器对应的实际地物辐射亮

度之间的定量关系,即建立遥感传感器的数字量化输出值 DN 与其所对应视场中辐射亮

度值之间的定量关系。传感器定标可分为 3 个阶段或者说 3 个方面内容:①发射前的实

验室定标;②基于星载定标器的星上定标;③发射后的定标(场地定标)。实际使用中

在对遥感影像进行定标时,只需要知道这类影像的定标公式和参数,这些公式和参数一

般在影像数据的元数据文件中,或者固定的公式和参数。大气校正的目的是消除大气和

光照等因素对地物反射的影响,广义上讲是获得地物反射率、辐射率或者地表温度等真

实物理模型参数;狭义上是获取地物真实反射率数据。用来消除大气中水蒸气、氧气、

二氧化碳、甲烷和臭氧等物质对地物反射的影响,消除大气分子和气溶胶散射的影响。

大多数情况下,大气校正同时也是反演地物真实反射率的过程。常用的大气校正模型和

软件有 6S 模型、MODTRAN 模型、FLAASH、ACTOR 和 ACORN 等。

学出版社

职教技术出版中心

www.abook.cn

Page 34: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·24·

2.2.2 地物波谱信息

遥感影像各个波段中每个像素的亮度值代表了该像素中地物的平均辐射值,也称灰

度。灰度的大小随该像素所反映的地物组成、纹理、状态、表面特征及探测的电磁波段

的不同而变化,这种特性被称为地物的波谱特征。像素所记载的信息值实际是在波段记

录信息的极小值与极大值之间,灰度以 G 表示,则有

G=f (i,j,Δx,Δy,Δλ,Δt) (2.1)

式中,像素大小一般以长度和宽度来表示,即 i 行方向上采样间隔为 Δx,j 列方向上采

样间隔为 Δy,Δλ、Δt 表征波段范围与积分时间。

从灰度的定义可以看出,它与影像的空间分辨率、时间分辨率、辐射分辨率和光谱

分辨率有密切的关系。具有灰度的像素是构成遥感图像单元的基础,但具有灰度的像素

之间的变化才是构成遥感信息单元的基础。遥感影像的信息量,可以用波段光谱信息熵

表达:

entropy 21log( ) ( )

k

if P i P i (2.2)

式中, ( )P i 为图像上的第 i 级灰度概率值,k 为灰度级数,一般 k=2b,b 为正整数, ( )P i可以用影像灰度直方图的各级频数来代替。

像素作为遥感影像中的基本信息单元,其几何属性决定于获取遥感图像的遥感平台及

其载荷。影像空间分辨率,即像素的大小以传感器的地面瞬时视场角度来衡量,星下点

的地面瞬时视场线度为 D0,飞行方向的地面瞬时视场线度为 Df,则扫描方向的地面瞬

时视场线度为 Ds。

0D θH=

f 0 secD D = (2.3) 2

s 0 secD D =

式中, θ 为传感器瞬时视场角;H 为卫星轨道高度;为星下点为 0°的扫描角。

图像光谱特征反映地物的光谱特性,是根据多波段光谱数据的统计得到的参数,常

用的比如平均值、标准差、亮度、比率等。

① 平均值(Mean,μ) 是图像各波段数据中图像对象或者图像区域的光谱均值,

对于特定分割结果上的一个图像对象,该图像对象所有像素在波段数据层(L)的光谱

值 νLi总和除以总的统计像素数 n。计算公式如下:

1

1 n

L Liiv

n= (2.4)

② 标准差(Standard,σ) 对于特定分割结果内的一个图像对象而言,其内部所

有像素在波段(L)的灰度值 νi 减去图像对象均值 μL差的平方和,再除以图像对象内像

素总数 n 减 1 所得的商的开方。计算公式如下:

21

1( )

LnL Li Li

vn

= --

(2.5)

③ 亮度(Brightness) 是遥感图像各波段的灰度均值的平均值,特定分割结果上

一个图像对象的亮度是将图像对象内像素光谱均值 μL求和后除以对象中数据层 n 所得。

计算公式如下:

Page 35: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息 ·25·

1

1 Ln

LiL

Bn

= (2.6)

④ 比率(Ratio) 是图像对象在单个波段(L)上的平均值与所在图层平均值总和

的比例,在特定分割结果内,一个图像对象在第 L 层的平均值 μL 除以各层均值 μi之和

所得的商。计算公式如下:

i

i

i1

L n

i

r = (2.7)

式中,L 为某一图层;n 为图层个数。

⑤ 指数 一些特定波段的组合,如植被指数是利用卫星不同波段探测数据组合而

成的,能反映植物生长状况的指数。植物叶面在可见光红光波段有很强的吸收特性,在

近红外波段有很强的反射特性,这是植被遥感监测的物理基础,通过这两个波段测值的

不同组合可得到不同的植被指数。例如,标准化植被指数 NDVI 计算公式如下: NIR red NIR red

NDVI mean mean mean mean( ) / ( )f f f f f= - + (2.8)

2.2.3 图像的颜色信息

当遥感图像以 RGB 颜色图像呈现时,图像还具有颜色信息。颜色特征是一种全局

特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的

特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区

域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。

对于图像对象或者图像区域而言,颜色直方图是 常用的表达颜色特征的方法,其优点

是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,

基缺点是没有表达出颜色空间分布的信息。与颜色信息相关的常用特征提取与分析方法

包括颜色直方图、颜色集、颜色矩和颜色聚合向量等。

1.颜色直方图

颜色直方图优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整

幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间

位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位

置,即无法描述图像中的某一具体的对象或物体。 常用的颜色空间有 RGB 颜色空间、

HSV 颜色空间。颜色直方图特征匹配方法有直方图相交法、距离法、中心距法、参考颜

色表法、累加颜色直方图法。

2.颜色集

颜色直方图法是一种全局颜色特征提取与匹配方法,不能区分局部颜色信息。颜色

集是对颜色直方图的一种近似。首先将图像从 RGB 颜色空间转化成视觉均衡的颜色空

间(如 HSV 空间),并将颜色空间量化成若干个值。然后,用色彩自动分割技术将图像

分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一

个二进制的颜色索引集。在图像匹配中,只需比较不同图像颜色集之间的距离和色彩区

域的空间关系。

学出版社

职教技术出版中心

www.abook.cn

Page 36: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·26·

3.颜色矩

图像中任何的颜色分布均可以用它的矩来表示。由于颜色分布信息主要集中在低阶

矩中,因此,仅采用颜色的一阶矩、二阶矩或三阶矩就足以表达图像的颜色分布。

2.2.4 纹理信息

在高空间分辨率遥感影像中,地物的结构、形状和纹理特征表现得更加清晰和丰富。

显然纹理分析对于高分辨率影像解译精度的提高有着显著作用。以纹理特性为主导特性

的图像,常称之为纹理图像;以纹理特性为主导特性的区域,常称之为纹理区域。

纹理是图像中一个重要而又难于描述的特征,因为图像可能在某些区域内呈现了不

规则性,而在另一区域上表现出某种规律性。而现有的大多数纹理分析方法一般只采用

单一窗口提取特征,在高空间分辨率下,地物具有多尺度的特性,对于包含复杂空间结

构的高空间分辨率遥感影像而言,很难用单一窗口充分描述所有的纹理信息(Conners &

Harlow, 1980)。一些研究表明,遥感图像 90%的分类精度变化与计算纹理所采用的窗口

大小有关,而具体使用哪种纹理提取算法的影响只占 10%。

为了定量描述纹理,近三十年来学者们陆续提出了很多种的纹理特征提取算法,也

发表了不少综述性文献,这些算法主要可分为两类:基于统计的方法和基于结构的方法。

前者从图像相关属性的统计分析出发,将纹理看作一种对区域中密度分布的定量测量结

果。它们一般利用图像灰度分布的统计规则来描述纹理,例如由 Haralick 等人(1973)

和 Weszka 等人(1976)提出的灰度共生矩阵、自相关函数等方法已是这类方法中普遍

使用的分析手段。基于结构的方法则致力于寻找纹理基元,再从结构组成上探索纹理的

规律。在基于结构的方法中,复杂的纹理被看作是一些简单的纹理基元(primitive)以

某种规则的或重复的关系结合的结果。实际应用中需要解决两个关键问题,一是确定纹

理基元;二是建立排列规则,比较典型的结构方法是利用 Voronoi 多边形来描述纹理。

正如 Lizarraga-Morales 等(2014)人所指出的,上述两种截然不同的描述方法的问题在

于:“任何纹理均包含了规则和统计两种特性,而大多数纹理应属于完全周期和完全随

机这两种极端形式的过渡状态。”Ojala 等人(1996)提出了 LBP 算子,有效地将纹理基

元描述与属性分布统计相结合,成为一种真正意义上基于统计与结构相联合的纹理描述

方法。

此外,近年来快速发展的一类纹理描述算法则建立在多尺度分析与时频分析基础

上,被称为空间/频域法。例如多尺度分析(Unser & Eden, 1989)、Gabor 滤波(Jain &

Farrokhnia, 1991)、小波分析等(Arivazhagan & Ganesan, 2003; Hiremath & Shivashankar,

2006)等。Gabor 变换已被公认为信号处理和图像表示的 好方法之一,广泛用于影像

纹理特征的提取。Gabor 小波是将 Gabor 基函数经过移位、旋转和比例变换后得到的一

组相似的 90°相移的 Gabor 函数。Gabor 函数 g(x,y)表示如下:

2 2

2 2

1 1 y( , ) exp 2πj

2π 2x y x y

xg x y φx

= + + (2.9)

其傅里叶变换为

Page 37: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息 ·27·

2 2

2 2

1 ( )( , ) exp

2

μ v

μ w vG μ v = + (2.10)

式中, 1/(2π )μ x = , 1/(2π )v Y = ,w 为高斯函数的复调制频率。以 g(x,y)为母

小波,通过对 g(x,y)进行适当的尺度和旋转变换,可得到自相似的一组滤波器,因

此被称为 Gabor 小波。

1. 灰度共生矩阵

基于统计的纹理反映了图像亮度的空间变化,表现了图像纹理的重复性、平滑性、

方向性、均匀性及组合排列等状况。图像纹理统计方法发展至今 40 多年,其思想简单,

易于实现且使用广泛。纹理主要应用在高分辨率图像的分类, 常用的是 Haralick 等

(1973)提出的灰度共生矩阵(Grey Level Concurrence Matrix,GLCM),该矩阵不能直

接应用,需计算其纹理表达测度,常用的 GLCM 纹理统计量如下。

① 同质性(Homogeneity) 衡量局部同质性。计算公式如下:

,

, 21 ( )i j

i j

PHOM

i j=+ -

(2.11)

式中,i, j 分别为行数和列数;Pi,j 为灰度共生矩阵元素的值。

② 异质性(Dissimilarity) 与同质性相反。反差越大,其值越大。

,, i ji jDIS P i j= - (2.12)

③ 对比度(Contrast) 度量图像局部变动数量。与异质性相似,表示区域的 大

值与 小值之间的差异。 2

,,( )i ji j

COM P i j= - (2.13)

④ 熵(Entropy) 衡量图像的无序性。纹理越不均匀,其值越大。

, ,,( ln )i j i ji j

ENT P P= (2.14)

⑤ 相关性(Correlation) 衡量相邻像元灰度值的线性关系,即

,,2 2

( )( )i ji ji j

i j

i jCOR P

- -

= (2.15)

式中,μ为 GLCM 均值;σ为 GLCM 标准差。

2. LBP 算子

LBP(Local Binary Pattern)算子 初用于度量局部图像的对比度(He & Wangs, 1990)。

该算子 初定义的基本形式作用于像素的 8-邻域中。具体来说,以邻域中心像素的灰度

值为阈值,将邻域中的 8 个像素进行阈值化处理,然后乘以相应的权值,把结果相加后

就得到了对应像素的 LBP 码值,如图 2.5 所示。

原始的 LBP 算子定义为在 3×3 的窗口内,以窗口中心像素为阈值,将相邻的 8 个

像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记

为 1,否则为 0。这样,3×3 邻域内的 8 个点经比较可产生 8 位二进制数(通常转换为

学出版社

职教技术出版中心

www.abook.cn

Page 38: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·28·

图 2.5 LBP 纹理算法中图像阈值化过程

十进制数即 LBP 码,共 256 种),即得到该窗口中心像素点的 LBP 值,并用这个值来反

映该区域的纹理信息。

原始的 LBP 提出后,研究人员不断对其提出了各种改进和优化。

1)圆形 LBP 算子

基本的 LBP 算子的 大缺陷在于它只覆盖了一个固定半径范围内的小区域,这显

然不能满足不同尺寸和频率纹理的需要。为了适应不同尺度的纹理特征,并达到灰度

和旋转不变性的要求,Ojala 等(1996)对 LBP 算子进行了改进,将 3×3 邻域扩展到

任意邻域,并用圆形邻域代替了正方形邻域,改进后的 LBP 算子允许在半径为 R 的圆

形邻域内有任意多个像素点。从而得到了诸如半径为 R 的圆形区域内含有 P 个采样点

的 LBP 算子;以 R 为半径的 P 点邻域,gc 为中心,gp 为邻域点,区分邻域比中心亮度

大还是小: 1

, p c0

( )2P

pP R

pLBP s g g

= - (2.16)

1, 0( )

0, 0

xs x

x

=<

(2.17)

2)LBP 旋转不变模式

从 LBP 的定义可以看出,LBP 算子是灰度不变的,但却不是旋转不变的。图像的

旋转就会得到不同的 LBP 值。因此,Maenpaa (2003)又将 LBP 算子进行了扩展,提

出了具有旋转不变性的 LBP 算子,即不断旋转圆形邻域得到一系列初始定义的 LBP 值,

取其 小值作为该邻域的 LBP 值。

3)LBP 等价模式

一个 LBP 算子可以产生不同的二进制模式,对于半径为 R 的圆形区域内含有 P 个

采样点的 LBP 算子将会产生 2P 种模式。显然,随着邻域集内采样点数的增加,二进制

模式的种类是急剧增加的。例如,5×5 邻域内 20 个采样点,有 220=1 048 576 种二进制

模式。如此多的二值模式无论对于纹理的提取还是对于纹理的识别、分类及信息的存取

都是不利的。同时,过多的模式种类对于纹理的表达也是不利的。将 LBP 算子用于纹

理分类时,常采用 LBP 模式的统计直方图来表达图像的信息,而较多的模式种类将使

得数据量过大,且直方图过于稀疏。因此,需要对原始的 LBP 模式进行降维,使得数

据量减少的情况下能 好地代表图像的信息。

为了解决二进制模式过多的问题,提高统计性,Ojala 提出了采用一种“等价模式”

(Uniform Pattern)来对 LBP 算子的模式种类进行降维。Ojala 等认为,在实际图像中,

绝大多数 LBP 模式 多只包含两次从 1 到 0 或从 0 到 1 的跳变。因此,Ojala 将“等价

模式”定义为:当某个 LBP 所对应的循环二进制数从 0 到 1 或从 1 到 0 多有两次跳变

阈值化 按对应权值相加

LBP=1+2+4+8+128=143

5 4 3

4 3 1

2 0 3

1 1 1

1 0

0 0 1

1 2 4

8 16

32 64 128

1 2 4

8 0

0 0 128

Page 39: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息 ·29·

时,该 LBP 所对应的二进制就称为一个等价模式类。如 00000000(0 次跳变),00000111

(只含一次从 0 到 1 的跳变),10001111(先由 1 跳到 0,再由 0 跳到 1,共两次跳变)

都是等价模式类。除等价模式类以外的模式都归为另一类,称为混合模式类。通过这样

的改进,二进制模式的种类大大减少,而不会丢失任何信息。模式数量由原来的 2P 种

减少为 P(P-1)+2 种,其中 P 表示邻域集内的采样点数。对于 3×3 邻域内 8 个采样点

来说,二进制模式由原始的 256 种减少为 58 种,这使得特征向量的维数更少,并且可

以减少高频噪声带来的影响。

2.3 图像对象中的空间信息

遥感图像所反映的地物空间信息和形状特征,一般包括空间频率信息、边缘和线性

信息、结构或纹理、几何位置信息等。空间信息是通过图像亮度值在空间上的变化反映

出来的,图像中有意义的点、线、面或者图像区域(对象)的空间位置、长度、面积、

距离及其空间相互关系都属于图像的空间信息(关元秀和程晓阳 ,2008; eCognition

2008)。影响遥感影像空间信息的主要因素有成像遥感器的空间分辨率、图像投影性质、

比例尺和几何畸变等。

2.3.1 几何位置信息

许多基于图像对象的几何形状特征值的计算是来源于像素空间分配的统计值,协

方差矩阵在其中发挥了巨大的作用。在图像对象的几何特征值计算中,定义协方差

矩阵。

Var( ) Cov( , )

Cov( , ) Var( )

X X YS

X Y Y

= (2.18)

2211

1Var( )

1

n

iX X n X

n = --

(2.19)

2211

1Var( )

1

n

iY Y nY

n = --

(2.20)

式中,X 表示在影像对象中所有像素点的 X 坐标;Y 表示在影像对象中所有像素点的 Y坐标;Var(X)表示对 X 求方差;Var(Y)则是对 Y 求方差,Cov(X,Y)是 X 和 Y 的协

方差。常见的典型几何特征值如下:

① 最小外接矩形 几何特征的一个非常重要的数据,相关的特征包括长度 a、宽度 b、面积 A 和填充度 f。A 为考查的图像对象实际的像素个数,a 为图像对象中

外接边框的长度,b 为图像对象中外接边框的宽度,f 表示真实面积占外接 小矩形

的比率。

f=A/(a×b) (2.21)

② 面积(Area) 与实际地理坐标相关联,对象面积为实际面积,一个像素所代

表面积乘以像素数目,即对象像元个数(n)与像元单位面积(a)乘积。

A=n×a (2.22)

学出版社

职教技术出版中心

www.abook.cn

Page 40: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·30·

③ 边界长度(Border length) 对象的边长,若图像与地理坐标不相关,则像素单

位为 1,边界像元个数与单个像元边长 l 乘积。

e=n×l (2.23)

边界长度 e 定义影像对象边界上的像素点的个数,对分割完成后的遥感图像对象,

该值的求取需要判断边界像素点上下左右的标签是否相同,如果不相同,则边界长度要

加上该像素,否则不加。

④ 长宽比 一般的 l>w,可用协方差矩阵的特征值表示。

计算长宽比(r)将会涉及有关协方差矩阵和 小外接矩形的有关数据,首先根据

下列两个公式求出 r1 和 r2:

11 1 2

2

eig ( ),eig ( ) eig ( )

eig ( ) '

l sr s sw s

= = (2.24)

2 2

2

((1 ) )l a f brw A

+ -= =

× (2.25)

式中,eig1(s)和 eig2(s)是矩阵 S 的两个特征值,eig1(s)是较大的那个。a、f、A、b 的定义

见前面,长宽比的值 r 是 r1 和 r2 中的较大者。

⑤ 长度 是由长宽比和面积两个特征值得到的,图像对象不是通常规则的矩阵,

故其长度也并非等于绑定盒的长度,而要经过一些数学处理。

l A r= × (2.26)

式中,A 表示图像对象的面积,也就是该图像对象的像素个数,r 为求得的长宽比。长

度特征值在模糊分类中有不可或缺的作用,对于其他分类方式,也会有积极的影响。

⑥ 宽度 也是由长宽比和面积两个特征值得到的,图像对象的宽度也并非等于绑

定盒的宽度,同样需经过一些数学处理。

/l A r= (2.27)

宽度特征值在模糊分类中和长度特征值一样,作用很大,对于其他分类方式,也同

样会有积极的影响。

⑦ 形状指数(Shape Index) 是图像对象边界长度和面积的平方根值的 4 倍的比值:

4

eSA

= (2.28)

式中,e 是图像对象的边界长度;A 是图像对象的面积。形状指数的作用是揭示了图像

对象边界的平滑度,图像对象越不规则,则形状指数的值会越高。

⑧ 紧密度(Compactness) 对象 小外接矩形面积与对象包含像素数目之比。

24π

AreaCperimeter

= × (2.29)

⑨ 密度(Density) 图像对象形状越似正方形,值越大;密度是图像对象面积的

平方根值与有关坐标轴方差的多项式的比值。

1 Var( ) Var( )

nDX Y

=+ +

(2.30)

式中,n 表示图像对象的面积,其值和求得的 A 的值是相等的;Var(X)表示对 X 求方差;

Page 41: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息 ·31·

Var(Y)则是对 Y 求方差。密度特征值的作用是揭示了图像对象的紧密度,正方形的紧密

度是 理想的。故一个图像对象的紧密度同样可以反映它和正方形的相似程度。

⑩ 边界指数 图像对象的真实周长与该对象 小包围矩形的周长之比,图像对象形

状越不规则,该特征越大。 ○11 非对称(Asymmetry) 图像对象近似椭圆的长轴与短轴之比,形状越狭长,非

对称值越大(图 2.6)。

1nkm

= - (2.31)

○12 主要方向 图像对象椭圆近似的长轴与竖直方向的夹角。

○13 矩形适合性(Rectangular fit) 计算一个与图像对象面积相等的矩形,求矩形

之外的对象面积与对象之外的矩形面积之比。

图 2.6 图像对象及其椭圆近似表达(eCognition,2008)

2.3.2 关系特征

像素之间的空间关系,用像素邻域进行定义,常用的邻域包括 4 邻域和 8 邻域

(图 2.7)。4 邻域,像素或者对象只有边相邻的才为相邻;8 邻域,边和角是相邻的,

就为相邻。

(a)蓝色像素为中心像素的 4 邻域像素 (b)蓝色像素为中心像素的 8 邻域像素

图 2.7 邻域像素

图像对象的相邻关系包括空间相邻关系和层间相邻关系(图 2.8)。周围对象之间的

关系可以存在于同一个层中,也可以存在于影像对象层次中的下级或上级层中。对于每

个图像对象来说,其相邻对象有两种情况,一种是直接相邻关系,一种是间接相邻关系。

前者是分割后仍保持遥感图像原样,相邻对象之间的距离为 0。后者则是在相邻对象之

间加入了用于标记的人为的标签。

学出版社

职教技术出版中心

www.abook.cn

Page 42: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·32·

图 2.8 图像对象层内及层间关系示意图(eCognition,2008)

层间均差和相邻对象均差的意义相似,求法也相似,在某些分类模式中,可能比相

邻对象均差更有意义,求法并不是简单的对相邻对象均差直接求绝对值,同样,对于不

同的分割结果,也有两种求解方法。图像对象 c 与相邻对象 c'的光谱距离为

21( )

mb bb

d C C == - (2.32)

与邻域对象的平均差分为

1

1 n

b b bxxd C C

N == - (2.33)

对于图像对象 c 的相邻对象集合,计算层平均值,根据对象间的边界长度赋予权重为

1

1 n

b x b bxxd l C C

l == - (2.34)

式中,下标 b 表示波段;Cb 表示该影像对象第 b 波段的均值;m 表示总波段数;x 表示

该影像对象的第 x 个相邻对象;Cbx表示该影像对象第 x 个相邻对象第 b 波段的均值;n表示该影像对象的相邻对象的个数;l 表示该影像对象的边界长度;lx表示该影像对象和

第 x 个相邻对象的重叠边界长度;l 的值即为边界上像素点的个数;lx即为重叠边界上像

素点的个数。

对于图像对象 c 的相邻对象集合,计算层平均值,根据相邻对象的面积赋予权重为

1

1 n

L x b bxxc A C C

A == - (2.35)

式中,下标 b 表示波段数;Cb 表示该影像对象第 b 波段的均值;x 表示该影像对象的第

x 个相邻对象;Cbx表示该影像对象的第 x 个相邻对象第 b 波段的均值;n 表示该影像对

象的相邻对象的个数;A 表示该影像对象的总面积;Ax为该影像对象的第 x 个相邻对象

的总面积。

层间关系可以分为光谱信息与空间信息。层间 大偏差(Max diff)描述了多光谱

遥感影像层与层之间的关系,对于一个影像对象而言, 大的层均值减去 小的层均值

与该层亮度的比即为该特征。

Max( ) Min( ) b br C C B= - (2.36)

式中,下标 b 表示波段数;Max(Cb)表示的是该影像对象 大的层均值;Min(Cb)表示的

是该影像对象 小的层均值;B 表示的是该影像对象的亮度值。

Page 43: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息 ·33·

2.3.3 形状特征

通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图

像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。

下面介绍几种典型的形状特征描述方法。

1)边界特征法

通过对边界特征的描述来获取图像的形状参数。其中 Hough 变换检测平行直线方

法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连

接起来组成区域封闭边界的一种方法,其基本思想是点-线的对偶性;边界方向直方图

法首先微分图像求得图像边缘,然后,构建关于边缘大小和方向的直方图,通常的方法

是构造图像灰度梯度方向矩阵。

2)傅里叶形状描述符法

傅里叶形状描述符(Fourier Shape Descriptors)基本思想是用物体边界的傅里叶变

换作为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。

3)几何参数法

形状的表达和匹配经常采用更为简单的区域特征描述方法,例如采用有关形状定量

测度(如矩、面积、周长等)的形状参数法(Shape Factor)。形状参数的提取,必须以

图像处理及图像分割为前提,参数的准确性必然受到分割效果的影响,对分割效果很差

的图像,形状参数甚至无法提取。

4)形状不变矩法

利用目标所占区域的矩作为形状描述参数。

5)其他方法

近年来,在形状的表示和匹配方面的工作还包括有限元法(Finite Element Method,

FEM)、旋转函数(Turning Function)和小波描述符(Wavelet Descriptor)等方法。

在多尺度遥感图像分析中,一个典型的层间空间关系是父对象从子对象中得到线状

特征,主要方式是通过将子对象的中心点连接起来以获得线状特征。例如:

(1)线状对象宽:对象的面积 A / 对象从子类分析中得到的长度(图 2.9)。

1 21

n

SO ii

l r r d

(2.37)

(2)线状对象的曲率/长度,表示线状对象的弯曲程度(图 2.10)。

曲率计算公式:

1

n n

i i ni m i

cv d a a

(2.38)

图 2.9 图像对象的线性宽(eCognition,2008) 图 2.10 图像对象的弯曲程度示意(eCognition,2008)

r1 d1 d2

di

dn r2

图像对象的中心点

子对象的中心点

距离图像对象 中心点 近的子对象

子对象

子对象

学出版社

职教技术出版中心

www.abook.cn

Page 44: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·34·

2.3.4 空间结构信息

空间结构描述图像对象的内部结构。通常可以被点集(Point set),轮廓(Contour)

和骨架(Skeleton)等形状描述符所表示(图 2.11)。相比点集,轮廓多了对象边界的顺

序关系,是一种含更多信息量的形状表示方式。而骨架,又被称为对象的中轴(Medial

Axis),不但包含了图像对象形状的几何特征,而且表示了对象各个部分的连接关系等

拓扑结构信息。对象骨架可以表示图像多边形的内部结构,用于更精确的描述对象的形

状。为了得到 Skeleton 首先要对多边形进行 Delaunay 三角剖分,Skeleton 是将所有的三

角形中心点连接后得到的。多边形内部三角形分为三类:①边界三角形——只有一个相

邻三角形,意味着其中心点为 Skeleton 的终止点;②连接三角形——有两个相邻三角形,

意味着其中心点为 Skeleton 的连接点;③分支三角形——三角形的三边皆有相邻,意味

着其中心点为 Skeleton 的分支点;Skeleton 中有一条为主线,表示多边形的内部 大长

度,每一条分支都有一个 order value,主线上的 order value 为 0,其他分支越是靠外,

其 order value 也就越大,取决于多边形形状的复杂程度。

图 2.11 图像对象及其骨架结构表达

2.3.5 空间信息的矢量表达

遥感影像中的图像对象为栅格数据形式,栅格数据通过栅格转矢量算法可以转化为

矢量数据(图 2.12)。许多遥感影像处理软件都提供了栅格转矢量算法(图 2.13)。

在矢量化过程中,需要对曲线进行采样简化,即在曲线上取有限个点,将其变为折

线,并且能够在一定程度上保持原有的形状。应用 Douglas-Peucker 算法(Douglas &

Peucker,1973)对新产生的线数据简化,和原有矢量相交的节点不能被简化掉。

经典的 Douglas-Peucker 算法描述如下。

(1)在曲线首尾两点 A,B 之间连接一条直线 AB,该直线为曲线的弦。

(2)得到曲线上距离该直线段距离 大的点 C,计算其与 AB 的距离 d。

(3)比较该距离与预先给定的阈值 threshold 的大小,如果小于 threshold,则该直线

段作为曲线的近似,该段曲线处理完毕。

(4)如果距离大于阈值,则用 C 将曲线分为两段 AC 和 BC,并分别对两段曲线进

行 1~3 的处理。

(5)当所有曲线都处理完毕时,依次连接各个分割点形成的折线,即作为曲线的

近似。

Page 45: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 2 章 影像与图像对象所蕴含的信息 ·35·

图 2.12 栅格的矢量化结果 图 2.13 Douglas-Peucker 线简化算法

由于栅格数据和矢量数据相互转化时存在信息损失,在遥感图像处理中信息提取的

常用方法是分类算法,而常用的遥感图像分类方法又是基于像元的,这样,分类结果矢

量化后的矢量信息对于 GIS 应用而言并不友好。将地理数据一致性概念引入到整个遥感

图像处理流程中,在遥感图像处理过程中的各个步骤中时刻注意 GIS 的一些原则,使得

分类结果矢量化后的矢量信息对于 GIS 应用而言:曲线是光滑的、拓扑是一致的。

0

1

2

3

4

学出版社

职教技术出版中心

www.abook.cn

Page 46: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法

图像分割是 GEOBIA 分析的核心。日至今日,各种各样的分割技术已经被开发出来,

得到了不同的结果(Neubert et al.,2006)。图像分割并不是全新的概念,且对其的早期

讨论可以追溯到 Haralick 等(1973)。图像的分割算法众多(Pal and Pal,1993),在过

去几年中发展迅速(Kartikeyan et al.,1998; Baatz and Schäpe,2000; Neubert et al.,2008)。

这些分割算法大概可以分为四类:①基于点;②基于边缘;③基于区域;④基于物理模

型。大部分的分割方法反映了图像的两个特性:像素的不连续(基于边界)或像素的相

似性(基于区域)(Freixenet et al.,2002)。无论采用何种分割方法,至少现行的分割过

程都提供用于影像分析的对象或区域(Cova and Goodchild,2002)。相比单一像素,分

割结果拥有额外的光谱信息(如每个波段的均值,中值, 小/ 大值,平均比值,方差

等),但较对象光谱值描述多元化更重要的优势是对象附加表达的空间形状信息

(Blaschke and Strobl,2001;Flanders et al.,2003)、几何与空间维(距离,邻近,拓扑

等)信息,这些空间信息对 GEOBIA 方法是至关重要的。

3.1 相似性度量

图像分割时,需要计算不同区域(或者样本)之间的相似性度量(Similarity

Measurement),通常采用的方法就是计算区域(或者样本)间的“距离”(Distance)。

对于具有光谱信息的遥感数据而言,像素的光谱信息可以用向量表示,n 个波段数据可

以用 n 维向量表示,全色数据则为一维向量,光谱信息的相似性度量即可以用距离表示。

常用的距离包括欧氏距离、曼哈顿距离、马氏距离等。

1)欧氏距离(Euclidean Distance)

欧氏距离是 易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。

二维平面上两点 a(x1, y1)与 b(x2, y2)间的欧氏距离为 2 2

12 1 2 1 2( ) ( )d x x y y= - + -

两个 n 维向量 a(x11,x12,…,x1n)与 b(x21, x22,…,x2n)间的欧氏距离为

212 1 2

1

( )n

k kk

d x x= -

也可以用表示成向量运算的形式:

12 ( )( )Td a b a b= - -

2)曼哈顿距离(Manhattan Distance)

曼哈顿距离也称为城市街区距离(City Block Distance)。二维平面两点 a(x1, y1)与

b(x2, y2)间的曼哈顿距离为

12 1 2 1 2d x x y y= - + -

Page 47: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法 ·37·

两个 n 维向量 a(x11,x12,…,x1n)与 b(x21, x22,…,x2n)间的曼哈顿距离为

12 1 21

n

k kk

d x x= -

3)切比雪夫距离(Chebyshev Distance)

二维平面两点 a(x1, y1)与 b(x2, y2)间的切比雪夫距离为

12 1 2 1 2max( , )d x x y y= - -

两个 n 维向量 a(x11, x12,…,x1n)与 b(x21, x22,…, x2n)间的切比雪夫距离为

12 1 2max i iid x x= -

4)闵可夫斯基距离(Minkowski Distance)

闵氏距离不是一种距离,而是一组距离的定义。两个 n 维变量 a(x11, x12,…, x1n)与 b(x21,

x22,…, x2n)间的闵可夫斯基距离定义为

12 1 21

| |p n

pk k

k

d x x= -

其中,p 是一个变参数。当 p=1 时,就是曼哈顿距离;当 p=2 时,就是欧氏距离;当

p→∞时,就是切比雪夫距离。

根据变参数的不同,闵氏距离可以表示一类的距离。

闵氏距离,包括曼哈顿距离、欧氏距离和切比雪夫距离都存在明显的缺点。简单说

来,闵氏距离的缺点主要有两个:①将各个分量的量纲(scale),也就是“单位”同等

看待;②没有考虑各个分量的分布(期望、方差等)可能是不同的。

5)标准化欧氏距离(Standardized Euclidean Distance)

标准化欧氏距离是针对欧氏距离的缺点而做的一种改进方案。标准欧氏距离将各个

分量都“标准化”到均值、方差相等。假设样本集 X 的均值(mean)为 m,标准差(standard

deviation)为 s,X 的“标准化变量”表示为:标准化变量的数学期望为 0,方差为 1。

因此样本集的标准化过程用公式描述就是:

'X mX

s-

=

经过简单的推导就可以得到两个 n维向量 a(x11, x12,…,x1n)与 b(x21, x22,…, x2n)间的标准

化欧氏距离的公式: 2

1 212

1

nk k

k k

x xds

-=

这个公式可以看成是一种加权欧氏距离(Weighted Euclidean Distance)。

6)马氏距离(Mahalanobis Distance)

有 M 个样本向量 X1~Xm,协方差矩阵记为 S,均值记为向量 μ,则其中样本向量 X到 u 的马氏距离表示为

1( ) ( ) ( )TD X x S x = - -

而其中向量 Xi 与 Xj 之间的马氏距离定义为 1( , ) ( ) ( )T

i j i j i jD X X X X S X X= - -

学出版社

职教技术出版中心

www.abook.cn

Page 48: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·38·

若协方差矩阵是单位矩阵(各个样本向量之间独立同分布),则公式就成了欧氏距

离;若协方差矩阵是对角矩阵,公式变成了标准化欧氏距离。

马氏距离是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的

协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧式距离不同的

是,它考虑到各种特性之间的联系,并且是尺度无关的(Scale-invariant),即独立于测

量尺度。马氏距离的优点是量纲无关,排除变量之间的相关性的干扰。

7)巴氏距离(Bhattacharyya Distance)

巴氏距离(巴塔恰里雅距离)用于测量两离散概率分布的可分离性(相似度)。基

于直方图的图像相似度可应用巴氏距离进行测量相似度,定义巴氏距离为

B( , ) ln ( , )D p q BC p q=

其中

( , ) ( ) ( )x X

BC p q p x q x=

BC 即为巴氏系数(Bhattacharyya Coefficient)。

8)夹角余弦距离(Cosine Distance)

在二维空间中,向量 A(x1, y1)与向量 B(x2, y2)的夹角余弦公式为

1 2 1 2

2 2 2 21 1 2 2

cosx x y y

x y x y +=

+ +

类似地,对于两个 n 维样本点 a(x11, x12,…, x1n)和 b(x21, x22,…, x2n),可以使用类似于

夹角余弦的概念来衡量它们间的相似程度。

1 21

2 21 2

1 1

cos

n

k kk

n n

k kk k

x x

x x

=

其中,夹角余弦取值范围为[-1,1]。夹角余弦越大表示两个向量的夹角越小,夹角余弦

越小表示两向量的夹角越大。当两个向量的方向重合时夹角余弦取 大值 1,当两个向

量的方向完全相反时,夹角余弦取 小值-1。

9)相关系数(Correlation Coefficient)与相关距离(Correlation Distance) 相关系数的定义为

( )( )( , )

( ) ( ) ( ) ( )XY

E X EX Y EYCov X YD X D Y D X D Y

- -

= =

相关系数是衡量随机变量 X 与 Y 相关程度的一种方法,其取值范围是[-1,1]。相关

系数的绝对值越大,则表明 X 与 Y 相关度越高。当 X 与 Y 线性相关时,相关系数取值

为 1(正线性相关)或-1(负线性相关)。

相关距离的定义为

1xy XYD = -

10)信息熵(Information Entropy)

信息熵是衡量分布的混乱程度或分散程度的一种度量。分布越分散(或者说分布越

Page 49: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法 ·39·

平均),信息熵就越大。分布越有序(或者说分布越集中),信息熵就越小。计算给定的

样本集 X 的信息熵的公式为

21

( ) logn

i ii

Entropy X p p= -

其中,n 表示样本集 X 的分类数,pi表示 X 中第 i 类元素出现的概率。信息熵越大表明

样本集 S 分类越分散,信息熵越小则表明样本集 X 分类越集中。当 S 中 n 个分类出现的

概率一样大时(都是 1/n),信息熵取 大值 2log n 。当 X 只有一个分类时,信息熵取

小值 0。

3.2 图像分割基础

图像分割的基本定义可以严格描述如下:设一幅图像为 X,HS(·)是一系列分割尺

度 S(S=0,1,2,……)下的一致性规则,PS(X)是满足一致性规则 HS(·)图像 X 的分割

区域标记图, SiR (PS(X)={ 1

SR ,…, SnR })表示其中某一区域,则区域 S

iR 即一个图像对

象(或称基元、图斑、区域等),整幅图像 X 在尺度 S 下被分割为 n 个图像对象。必须

满足以下 5 个条件(Gonzalez and Woods, 2007):

(1)任意图像对象 SiR 中的像素是空间连续的。

(2) 1n Si iU R X= 。

(3) S Si jR R = (图像对象 S

iR , SjR 彼此邻接, i, j = 1,2,…,n 且 i j)。

(4)HS ( SiR ) =TRUE。

(5)每对彼此邻接的图像对象 SiR , S

jR ,满足 HS ( S Si jR R )=FALSE。

其中,H 是集合 iR 中元素的逻辑谓语,称为一致性(同质性)规则,代表空集。条

件(1)~(3)指出图像在某一尺度下分割的所有区域的并集应该等于整幅图像,且保

证图像 X 在该尺度下被分割为互相邻接却又不重合的 n 个图像对象,即任何一个像素不

能同时属于两个区域;条件(4)保证每个图像对象都满足一致性规则,分割结果中同

一区域内的像素都是连通的;条件(5)保证每个图像对象内部都满足 大一致性规则

(即相邻图像对象间不能继续合并)。

至今为止,研究者们已经发展了千种以上不同类型的图像分割算法(崔卫红,

2010)。由于图像的复杂性,不是所有方法都适用于遥感影像的处理,适宜遥感影像的

图像分割算法从整体上可分为知识驱动型方法和数据驱动型方法两大类。绝大多数分

割算法都属于数据驱动型方法,即根据图像数据自身特征直接进行分割。从具体的原

理和方法区分,可以将图像分割方法细分为四大类:基于点的分割算法、基于边缘的

分割算法、基于区域的分割算法和基于物理模型的分割算法。这些分割算法的应用分

析如下。

1)基于点的分割算法

基于点的分割算法是以像元为研究对象的一类分割方法,这类方法又可细分为阈值

法和聚类法。阈值分割是根据图像中目标物与其背景在灰度值上的差异,把图像视为两

类具有不同灰度级的区域(目标和背景)组合。通过确定一个合适的阈值,将图像中每

个像元划分到目标或背景区域,从而可以产生相应的二值图像。典型的阈值分割方法有

学出版社

职教技术出版中心

www.abook.cn

Page 50: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·40·

半阈值法、类间方差阈值分割法(OTSU)、二维 大熵值分割法等。聚类分割就是将物

体或抽象对象进行分组,将类似对象组成一个类的过程(章毓晋,2001)。该类方法将

像元表示为对应特征空间(模式)的点,通过将特征空间的点聚集成团形成单独的簇而

得到分割结果。从类和区域的实施关系入手,聚类分割又可分为系统聚类和分割聚类。

目前遥感影像常用的聚类分割方法有 Mean-Shift、K-Means、ISODATA、EM、N-Cut 等

方法,这些均属于分割聚类。

2)基于边缘的分割算法

图像边缘是图像中地物目标的相似特征在对应时空范围处的终结。这些边缘标示出

了图像在灰度、彩色、纹理等方面不连续的位置,它们是图像分割、纹理特征提取和形

状特征提取等图像分析的重要基础。边缘广泛存在于物体与背景之间,可以通过边缘检

测来分离目标对象和背景。基于边缘的分割通常先进行边缘检测,一般采用图像一阶导

数极值和二阶导数过零点信息作为边缘点的判断依据(丁亮等, 2010),常用的检测算子

有 Sobel 算子和 Laplacian 算子等,但边缘检测的图像结果不能作为分割结果。然后应将

边缘点合并成边缘链,它应与图像中语义地物的边界吻合良好, 终的目标至少达到部

分分割。因此该类方法常用于地面特定目标的分割。基于边缘的分割算法按照图像处理

的方式可以分为并行法和串行法。

3)基于区域的分割算法

基于区域的分割方法(或称区域增长技术)是根据事先确定的一致性准则,直接

提取若干特征相近或相同的像素来组成区域。它的基本思想是图像划分为 大一致性

分区。该类方法可以综合图像的灰度、纹理、像素统计特性、上下文关系、空间关系

和模型(使用语义信息)等多重特征。基于区域的分割方法按照区域形成的基本形式

又可细分为区域归并法(Merging)、区域分裂法(Splitting)和区域分裂与合并法

(Split-and-Merge)。这类分割算法由于能够综合图像的光谱特征和空间特征,分割的正

确性、稳定性和鲁棒性相对较高,实践中应用 广泛。

4)基于物理模型的分割算法

从遥感成像过程来看,影像数据的获取取决于地表特征、大气、光照以及成像设备

等因素,描述这种关系的模型称为影像的物理模型。这类物理模型又包括物理光学模型

和几何光学模型。几何光学模型由于采用反射与折射定律并相应简化,是影像物理模型

的主要应用形式,其中 著名的是由 Shafer 提出的二分光反射模型。高空间分辨率遥感

影像普遍存在“同物异谱”、“同谱异物”的现象,给相关地物的分割带来了极大困难。

基于二分光反射模型的分割能够识别阴影和描述地物表面朝向,并获得精确的分割边界

(Shafer, 1985; Lucchese, 1999),能有效解决图像中“同物异谱、同谱异物”的现象。但

基于物理模型的分割通常具有一定的约束条件,如光照条件、成像物体表面反射特性等,

因此这类方法在遥感生产实践中操作难度大,应用较少。尽管如此,基于物理模型的分

割方法仍然是一个值得重视的研究方向。

表 3.1 进一步比较了上述分割算法的特点。

Page 51: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法 ·41·

表 3.1 图像分割算法的比较

分割方法 优势 缺点

阈值分割法 实现简单,应用广泛

执行效率高

忽略了图像中的空间信息

多维特征空间中计算复杂度高

抗噪能力差

聚类分割法

可以进行非监督分割

使用灵活,应用广泛

计算复杂度适中

初始分类数确定困难

调整类与区域的关系困难

基于边缘的

分割法

符合人类视觉认知习惯

对边界显著的地物分割效果 好

抗噪能力差,易受虚假边缘影响

提取的边缘易中断

区域合并分割法

算法鲁棒性强

易结合图像的空间信息

分割结果形状紧凑且闭合

无需事先确定类别数

易扩展到多维特征空间

确定种子点和一致性准则困难

对过渡区分割易混淆

算法计算复杂度高

区域分裂合并

分割法

算法鲁棒性强

易结合图像的空间信息

对均质区域的图像分割效果 好

确定一致性准则困难

分割结果边界粗糙易产生折线状

算法计算复杂度高

基于物理模型的

分割法

能够识别阴影、光斑并描述表面的朝向,获得精确的分割边界

能得到分割结果的物理解释

突破依赖低层次特征和统计方法局限

模型参数求解困难

算法鲁棒性差,应用都有一定约束

条件

3.3 超像素图像分割

目前对图像的处理大多以像素为单位,并未考虑像素之间的空间组织关系,这使得

很多图像处理效率过低。2003 年 Ren 等人 早提出了超像素这一概念。所谓超像素

(Superpixel)是指具有相似纹理、颜色、亮度等特征的相邻像素构成的图像块。它利用

像素之间特征的相似程度将像素分组,可以消除图像的冗余信息,在很大程度上降低了

后续图像处理任务的复杂度。

超像素分割是计算机图像处理及机器视觉中的常用技术手段,超像素分割算法常用

的有基于图论的方法和基于梯度下降的方法两大类。具有代表性的基于图论的超像素分

割方法有 Felzenswalb 等人(2004)提出的 Graph Based 方法、Shi 等人(2000)提出的

N-Cut 方法(Normalized Cuts)、Moore 等人提出的 Superpixel Lattice 方法和 Liu 等人提

出的基于熵率的方法。基于梯度下降的超像素分割方法有 Vincent 等人提出的分水岭

Watershed 方法、Comaniciu 和 Meer(2002)提出的 Mean Shift 方法、Vedaldi 等人(2008)

提出的 Quick Shift 方法、Levinshtein 等人(2009)提出的 Turbopixels 方法和 Achanta

等人(2010)提出的 SLIC 方法。各种超像素分割方法主要基于聚类的基本思想,但各

自具体方法不同,也有不同的优缺点。

SLIC(Simple Linear Iterative Clustering)即简单线性迭代聚类。采用图像局部像素

进行 K-Means 算法聚类(local clustering)。由 LAB 颜色空间中的 l、a、b 数值以及 x、y 像素坐标 5 维特征空间来计算,不仅可以分割彩色图,也可以分割灰度图。SLIC 因为

学出版社

职教技术出版中心

www.abook.cn

Page 52: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·42·

采用了一种全新的距离计算方法加强了超像素形状的整齐性。它的另一个优点就是可以

人工设置需要分割的超像素的数量。SLIC 更具有合理的计算性能,产生的超像素大小

相同且紧凑。经典的 K-Means 算法的时间复杂度是 O(N,K,I),N 是数据量(像元总

数),K 是聚类数(Seeds 数量),I 是迭代次数。SLIC 方法却只有了 O(N)级别的复杂

度,因为计算距离(不超过 8 个聚类中心)和迭代次数都是常量。因此,不同于 K 均值

SLIC 是专门用来处理超像素分割的,且避免了一些多余的距离计算。

SLIC 算法首先将图像均匀分成大小相同的 K 个正方形区域,假设图像像素个数为

N,则正方形的边长约为 /S N K= 。SLIC 使用 5 维特征,用 5D 空间取代简单的欧式

距离,聚类中心 Ck=[lk, ak, bk, xk, yk]T。为了防止初始中心选在边界上,选择在八邻域上

梯度 小的像素作为初始聚类中心,梯度计算为: G(x,y)=||I(x+1,y) −I(x−1,y)||2+||I(x,y+1)−I(x,y−1)||2 (3.1)

式中,I 是 Lab 向量,|⋅|取范数 2。每个聚类中心在迭代过程中的搜索区域范围是 2S×2S,距离使用欧氏距离,即

2 2 2( ) ( ) ( )lab k i k i k id l l a a b b= - + - + - (3.2)

2 2( ) ( )xy k i k id x x y y= - + - (3.3)

s lab xymd d dS

= + (3.4)

其中 m 决定了平滑程度,一般取 m=10。S 为步长,根据要分割的超像素的个数决

定,每次迭代,每个像素选择 ds 小的聚类中心,直到聚类中心移动的范围小于一定程

度迭代停止,一些实验表明,算法在 4 到 10 次迭代左右即可收敛。具体实现算法如下。

(1)初始化聚类中心:按照设定的超像素个数,在图像内均匀的分配聚类中心。

(2)在 n×n 邻域内打乱聚类中心(n 取 3),将聚类中心移到邻域内梯度 小的地

方,这样是为了防止聚类中心落在边界上。

(3)在聚类中心的 2S×2S 的邻域内为每个聚类中心分配匹配点,按照各点与聚类

中心的设定距离计算(距离由 dlab与 dxy计算得出)。

(4)计算新的聚类中心与之前聚类中心的 L1距离,根据阈值判断是否需要重新打乱聚

类中心(即一直进行迭代运算,直至 近两次的聚类

中心之间的距离小于某一阈值)。

(5)结束运算。迭代之后可能出现不连续的

聚类,需要将不连续的区域分配给 近的相邻的

聚类。

对于多波段遥感影像而言,SLIC 超像素分割

算法需要从 LAB 颜色空间改为多波段数据之间的

距离。图 3.1 是浙江舟山地区 SPOT5 多波段数据的

SLIC 超像素分割结果。

3.4 均值漂移聚类图像分割

Mean Shift 概念 早是由 Fukunaga 等人于 1975 年在一篇关于概率密度梯度函数的

图 3.1 基于 SLIC 的遥感影像分割结果

Page 53: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法 ·43·

估计中提出来的。Mean Shift 初含义就是指偏移的均值向量,指代的是一个向量(见

式(3.5)、式(3.6)。随着 Mean Shift 理论的发展,Mean Shift 的含义也发生了变化,现

在的 Mean Shift 算法(Comaniciu and Meer, 2002),一般是指一个迭代的步骤,即先算

出当前点的偏移均值,移动该点到其偏移均值,然后以此为新的起始点,继续移动,直

到满足一定的条件结束。

给定 d 维空间 Rd 的 n 个样本点,i=1,…,n,在空间中任选一点 x,那么 Mean Shift 向

量的基本形式定义为 1

( )i K

h ix S

M x xK = - (3.5)

Sk是一个半径为 h 的高维球区域,满足以下关系的 y 点的集合为

2( ) :( ) ( )Th i iS x y y x y x h= - - (3.6)

k 表示在给定的 n 个样本点 xi 中有 k 个点落入 Sk区域中。

式(3.5)、式(3.6)通俗的解释如下:在 d 维空间中,任选一个点,然后以这个点为

圆心,h 为半径做一个高维球。落在这个球内的所有点和圆心都会产生一个向量,向量是以

圆心为起点落在球内的点为终点。然后把这些向量都相加,相加的结果就是 Meanshift 向量。

Mean Shift 算法同样适用于图像或者遥感影像数据的聚类分析。图像就是一个二维

矩阵,像素点均匀地分布在图像上,没有点的稠密性。因此如何定义像素点的概率密度,

这是图像处理的关键。我们以 x 为圆心,以 h 为半径。为落在球内的像素点 xi 定义以下

两个规则。

(1)x 像素点的颜色与 xi像素点颜色越相近,定义概率密度越高。

(2)离 x 的位置越近的像素点 xi,定义概率密度越高。

因此定义总的概率密度是两个规则概率密度乘积的结果,可以用下式表示:

,

2 2

2 2( )

s r

s s r ri i

h hs r s r

x x x xCK x k kh h h h

- -= (3.7)

式中,2

s si

s

x xkh

- 代表空间位置的信息,离远点越近,其值就越大;2

r ri

r

x xkh

- 表

示颜色信息,颜色越相似,其值越大。对于多波段遥感数据而言,相邻像素之间的光谱

曲线的接近程度,可以光谱之间的欧式距离表达。实验数据同样采用浙江舟山地区

SPOT5 多波段数据,利用 Meanshift 算法对其进行图像分割的结果见图 3.2。

图 3.2 基于 Mean Shift 聚类的分割结果

学出版社

职教技术出版中心

www.abook.cn

Page 54: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·44·

3.5 纹理图像分割

基于纹理的图像分割只是强调纹理特征在分割中的应用,并不能区别不同的分割方

法。但它却是遥感影像分割的重要工具,因为对于空间复杂、光谱混合的遥感影像,如

果使用多特征进行分割可以提高影像分析的精确度。纹理特征图像具有稀疏性、对比性

和方向性等特点,通过这些特征可以将不同的目标分割开来。纹理特征提取的主要目的

就是将随机纹理或几何纹理的空间结构转换为特征灰度值。然而基于结构的方法一般只

适用于规则性较强的人工特征,因此纹理在应用上受到很大的限制。

JSEG 图像分割(Deng and Manjunath, 2001)是一种经典的基于区域生长的无监督纹

理图像分割方法,其分割结果较准确且具有良好的鲁棒性,受到了广泛的使用和关注。

一般的基于纹理特征的图像分割方法,都需要对纹理模型进行参数估计,而参数的估计

则是一个比较困难的问题。一个鲁棒性的估计通常对区域的同质性要求很高。但 JSEG

算法测试给定颜色纹理模板的同质性,这种方法比估计模板参数可行性更好。为了识别

这种同质性,对图像做了以下假设:首先,图像是一组同质颜色纹理区域的集合;其次,

图像中每个区域的颜色信息都可以表示成为量化的颜色值; 后,图像中相邻区域的颜

色是可区分的。

JSEG 图像分割可以分为两个阶段,即颜色矢量量化和空间分割。颜色矢量量化又分为

两个步骤:首先对图像进行预处理—平滑去噪,然后利用 LGA(劳埃德)算法进行动态聚

类形成“类图”,并量化“类图”形成“J 图”。JSEG 算法的空间分割采用区域增长的方法,

空间分割不是在原图像上进行的,而是在“J 图”上进行基于区域增长的分割算法。

在动态聚类后,图像的颜色被量化为 N 个类别,将每一个颜色类用一个相应的标号

来代替,即 N 个标号,由这些标号所组成的图像就是“类图”。“类图”可以看作一种特

殊类型的纹理图像。“J 图”是按照一定的准则利用“类图”计算而得到的,即图像中像

素值由局部 J 值来表示,而每个像素点的局部 J 值是用一个以该像素点为中心点的圆形

模板扫描“类图”而得到的。具体计算如下所示:

设 Z 是 N 个数据点的集合,对集合 ( , )z x y z Z 其均值为 m;设 Z 分为 c 个颜色类,

即 Zi(i=1,...,c) ,相应的类有 Ni 个数据点,均值为 mi;有如下公式: 1

z Zm z

N = (3.8)

1

i

iz Zi

m zN = (3.9)

2

Tz Z

S z m

= (3.10)

2

1 1 i

c c

W i ii i z Z

S S z m = = - (3.11)

式中,ST代表 N 个数据总的方差;SW代表每一类的方差总和,即类内差。则 J 值的定义为

T W

W

S SJS-

= (3.12)

Page 55: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法 ·45·

J 值的大小代表了图像区域颜色模式的均匀程度。当整个图像的颜色分布比较均匀

时,则 J 值就比较小;若颜色分布均匀,颜色类彼此分开时,则 J 值会比较大;若量化

后的颜色类不易区分,则 J 值会很小,甚至为零。图像分割好坏的标准可以由每个分割

区域 J 值的加权平均值来描述,即用 J 来表示,计算公式为 1

k kk

J M JN = (3.13)

式中,Jk是区域 k 的 J 值;Mk是区域 k 中的像素点数。对于图像一个好的分割,则其中

每个分割区域中的颜色类分布是均匀的,因此区域的 J 值就比较小,那么 J 就越小。

计算 J 值时采用圆形模板。J 值的大小也区分了区域边界与内部,因此模板尺寸的

选择至关重要。一般来说,如果计算 J 值的窗口较大,则计算出的区域局部 J 值分布比较

均匀,分割出的区域就比较完整;但分割区域可能存在欠分割现象,获得的边界也不够精

确。相反,如果采用较小的窗口,则容易获得较精确的边界,但可能导致过分割现象。因

此,JSEG 算法应在多个尺度下进行局部 J 值计算后综合构建 J 图像。图 3.3 是浙江舟山

地区 SPOT5 多波段遥感数据的颜色矢量量化的结果,图 3.4 是 JSEG 分割的结果。

图 3.3 JSEG 颜色矢量量化结果 图 3.4 JSEG 分割结果

3.6 图像混合分割

图像的混合分割是综合基本图像分割算法和 新科学理论与方法完善的图像分割

解决方案(见图 3.5)。从表 3.1 知每类分割算

法都存在着其固有的缺陷,不能满足图像

优分割的需求;另一方面,尽管人们在图像

分割方面做了许多工作,不同思想的分割方

法层出不穷,但目前仍尚无通用的分割理论,

提出的分割算法都是针对具体问题,并没有

一种适合于所有图像的通用分割算法。因此,

根据具体情况采取有效的方法,结合已有的

先验知识,研究符合具体图像特性的混合分

割是图像分割方法发展的重要方向。

1)基于区域法和聚类法的分割

区域生长法实际应用时总是需要面对三 图 3.5 图像的混合分割

学出版社

职教技术出版中心

www.abook.cn

Page 56: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·46·

大问题:①选择或确定一组能正确代表所需区域的种子像素(选取种子);②确定在生

长过程中能将相邻像素包括进来的准则(确定合并准则);③确定让生长过程停止的条

件或规则(确定终止条件)。区域合并法能有效利用图像光谱和形状信息,但初始区域

生成困难。聚类法自适应性强,但不考虑图像的空间邻接性。因此,综合三类基本分割

算法提出了许多有效的混合分割方法。RISA(基于 K 均值聚类的区域归并分割,Wang

et al.,2010)混合分割法正是其中一种。它首先应用 K 均值聚类初始化种子点,然后基

于种子点进行区域生长生成初始区域, 后应用区域合并避免过度分割。

2)基于不同聚类算法的分割

模式识别理论中聚类算法多种多样,但应用于图像分割自身总是存在不足。有的

算法不考虑空间邻接性,抗干扰能力差(如 K-Means 算法);有的算法计算复杂度,

如基于图论的聚类方法则属于 NP-hard 问题;有的算法自适应性不足,易受参数影响

(如 Mean-Shift 算法)。因此,融合多种聚类算法发展了大量的混合分割方法。基于

均值漂移和图模型的图像混合分割就是其中一种(康海洋等,2007)。该方法首先利

用均值漂移技术对图像进行滤波,然后再使用图模型对图像进行分割。实验表明,

均值漂移算法分割结果对参数比较敏感,但基于均值漂移和图模型的混合分割算法

则较为稳定。

3)结合特定数学理论和技术的分割

新的理论和方法的出现、加入、应用和推广,进一步改善了图像分割的效果。例如,

由于 新机器学习方法的引入,遗传算法(GA)或蚁群算法(ACO)已能较好引导种

子点的初始化,有效解决了区域生长算法中种子点选择的难题;利用小波变换能较好保

持图像结构信息的特点,结合分水岭算法在特定区域能得到图像的 优分割;为模仿人

在信息处理时的智能行为,将神经网络法应用于图像分割不仅能提高输出的实时性而且

能实现算法的自适应性。

从人工智能角度看,图像分割又可以划分为两大类,一类是监督式图像分割,另一

类是非监督式图像分割。混合分割算法的发展对于图像分割处理的贡献在于:①提升监

督式图像分割处理的准确性和自适应性;②提升非监督式图像分割处理的鲁棒性和高效

性,促进传统的图像分割方法向基于知识驱动型的分割方法转变。

3.6.1 图像分割预处理

图像信号在获取和传输的过程中由于噪声的引入使图像质量下降,对图像分割的结

果会产生严重的影响。因此,图像滤波是图像分割预处理的主要环节。目前,针对图像

分割滤波的方法可以分为两大类,一类是标量滤波,另一类是矢量滤波,对它们的分析

如下。

① 标量滤波 对图像的各光谱通道分别进行处理后再合成结果图(如高斯滤波、

中值滤波等),这类方法要求光谱间相互独立,但图像中光谱之间可能不再相互独立,

而且这类方法不能有效保护多通道的光谱信息(Tang,2001)。

② 矢量滤波 矢量滤波较标量滤波方法更适合图像的预处理(Chan et al., 2001)。

近年来,人们对矢量滤波的方法做了大量的研究,其中矢量中值法(Vector Median

Filtering)、矢量方向法(Vector Directional Filtering)是具有代表性的高效滤波方法(Astola

Page 57: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法 ·47·

et al.,1990;Trahanias et al.,1996)。但这些方法的共同不足是对滤波窗口中所有邻域像

素都采用一致的处理,从而引入误差,容易损坏图像的边缘和细节。

图像分割的预处理中 重要的是保护图像边缘和细节信息,因此,Deng et al.(1999)

提出了同类组(Peer Group Filtering, PGF)非线性滤波方法。PGF 滤波的主要思想是找

出滤波窗口中与中心像素距离相近的领域像素作为同组成员参加滤波。PGF 滤波流程见

图 3.6,具体步骤描述如下。

图 3.6 PGF 滤波流程图

(1)窗口像素距离排序。以图像中每个像素为中心,其所在位置记为 n; 0 ( )x n 表示

像素光谱矢量,记为 T1 2 3( ) , , ,...Bx n B B= ,其中图像 B1、B2…为各通道光谱值;计算以

该点为中心的 W×W 小窗口的每个像素到中心点的欧氏距离,并按升序排列。

02

0 1

( ) ( ) ( ) , 0, ,

( ) ( ) ( ), 1≤ ≤ ≤i i

k

d n x n x n i kd n d n d n k w

= - == -

(3.14)

(2)脉冲噪声判断。为了消除滤波窗口中噪声的影响,通过计算 ( )id n 的一阶差分

来判断脉冲噪声,即若

1( ) ( ) ( )i i if n d n d n = - (3.15)

则认为对应的像素为脉冲噪声,剔除之(α为调节参数)。

(3)同类组像素确定。确定小窗口中参与计算新中心像素值的邻域像素和个数 m(n),

这只需要使用 Fisher 判别规则找出该中心像素的同组成员 P(n),即

0 1 2 1( ) ( ), ( ), ( ), , ,P n x n x n x n x j = = 且满足

2

1 2

2 21 2

( ) ( )max ( )

( ) ( )a j a j

J j s j s j

-=

+, j=1,…, k

学出版社

职教技术出版中心

www.abook.cn

Page 58: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·48·

( ) arg max ( )j

m n J j=

其中 1

1 20

1 1( ) ( ), ( ) ( )

1

j k

i ii i j

a j d n a j d nj k j

= =

+ - (3.16)

2 21

2 21 1 1 2

0

( ) ( ) ( ) , ( ) ( ) ( )j k

i ii i j

s j d n a n s j d n a n

= - = -

(4)高斯平滑滤波。新中心像素值通过其滤波窗口中同类组元素的高斯平均来获

得,即 ( ) 1

0new ( ) 1

0

( )( ) , ( ) ( )

m ni ii

im nii

w p nx n p n P n

w

= (3.17)

式中,wi 是同类组元素的权重,其值为同类组元素与中心元素距离的标准高斯函数。由

于距离计算、排序、Fisher 判别需要大量数学运算,该步骤中新中心像素值也可以用同

类组元素的平均值来代替用以简化计算。

为了验证 PGF 滤波算法对图像分割处理的有效性,我们以图 3.7(a)为测试图

像,分别进行中值滤波、高斯低通滤波、PGF 滤波处理,其结果见图 3.7。图 3.7(a)

中红色标记区域中的脉冲噪声在 PGF 滤波处理后的图 3.7(c)中完全被抑制;图 3.7(a)

中黄色标记区域中的边缘细节部分在中值滤波后图 3.7(b)中完全被模糊与滤除,但在

图 3.7(c)中边缘细节则保存完好。

(a)原图 (b)中值滤波后图像

(c)PGF 滤波后图像

图 3.7 PGF 滤波结果比较

Page 59: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法 ·49·

基于区域的分割算法分割结果的好坏都与初始区域的产生有很大联系。由于图

像的复杂性,在产生初始区域时必然出现严重的过分割现象,大量小区域的产生严

重影响图像分割的计算效率和分割准确性,必须尽可能减少初始区域的数量。由于

图像中非规则光谱的扰动和噪声是产生初始小区域的原因之一,因此图像滤波处理

对图像的分割有着重要作用。为了进一步说明 PGF 滤波算法对图像分割的有效性,

我们用基于 近邻图(Nearest Neighbor Groph)的区域合并法产生的初始分割区域数量

和图像峰值信噪比(Peak Signal-to-Noise ratio,PSNR 见式(3.18))来量化,比较结果

见表 3.2。 1 1

2

0 0

2

1( ( , ) ( , ))

25510ln

M N

x yMSE O x y f x y

M N

PSNRMSE

= -

=

× (3.18)

式中,MSE 表示图像的均方误差,O(x, y)和 f(x, y)分别表示输出和输入图像,M、N 表示

图像的长和高。从表 3.2 中可以看出 PGF 滤波算法既保证了滤波后的图像不失真(高图

像峰值信噪比),保留了图像细节特征,又有效地减少了分割的初始区域数量,特别适

合于图像的分割预处理。

表 3.2 PGF 滤波算法性能比较

图像 PSNR/dB 分割初始区域数

原图 — 18 869

PGF 滤波后图像 90.8 17 998

中值滤波后图像 52.7 14 981

高斯滤波后图像 66.1 15 215

3.6.2 基于分水岭变换的混合分割算法

以像素为初始区域,以像素的光谱特征为基础,直接进行区域合并。这种分割方法

的局限性在于以下两点:

(1)不适合纹理丰富的图像。在地势起伏、纹理丰富的图像中,以光谱均一性为主

要合并准则的方法并不能产生令人满意的分割效果。又由于图像中非规则灰度扰动和噪

声的影响,采用单一的区域合并分割算法得到的结果或是区域破碎,或是区域轮廓不准,

结果不理想甚至不能使用。

(2)计算负荷大。当图像数据量大时,其宽和高可能达到上万像素,以像素为区域

进行合并,分割中有可能对上百万级或亿级个数的区域进行合并,这种处理对时间和空

间的消耗实在太大。当图像的尺寸过大时,该算法很难完成图像的分割。

分水岭算法是一种基于拓扑理论的灰度形态学分割方法。该算法突出的优点是计算

效率高,其结果可以作为其他分割算法的前导分割。在此,我们将分水岭算法作为基于

近邻图 NNG 的区域合并分割算法的前置分割,用其分割结果构建混合分割算法中的

初始对象。

学出版社

职教技术出版中心

www.abook.cn

Page 60: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·50·

1.分水岭变换原理

分水岭概念以图像三维可视化处理为基础,其中两个是坐标,另一个是灰度级。考

虑三类点:①局部性 小值点;②当一滴水放在某点位置之上时,水一定会下落到一个

单一的 小值点;③当水处在某点位置之上时,水会等概率地流向不止一个这样的 小

值点。对某一区域的 小值,满足②的点集合称为“集水盆”(Catchment Basin),满足

③的点集合组成的地形表面峰线称为“分水线”(Watershed Line)(见图 3.8)。

分水岭变换(Watershed Transformation)是一种

基于拓扑理论的数学形态学方法(Hansen and

Higgins, 1999)。计算它的算法很多,其中 具代表

性的算法是基于沉浸模拟(Immersion Simulation)

模型的,该算法由 Vincent 和 Soille 在 1991 年提出。

该方法的基本思想是:把图像看作一种地理表面,

图像中每一点像素的灰度值表示该点的高程,在每

一个局部极小值表面涌出泉水,首先涌到较低盆地,

而后涌到较高盆地,当两个集水盆即将汇合时构筑

大坝隔开,即形成分水线,对整个地理表面实施淹没就会分割出许多区域。该算法是一

个迭代标注过程,分成两个步骤。

(1)梯度排序。在多光谱梯度图基础上,对每个像素的梯度进行从低到高排序,并

采用先进先出(FIFO)队结构进行记录。

(2)淹没标记。从低到高实现淹没,对每一个局部极小值在 h 阶高度的影响域进行

判断和标注,记录新出现的盆地极小值,迭代完成。

整幅图像被分割成从 1 开始的一系列标号区域。有关分水岭算法的严格数学描述和

实现伪代码请查阅相关文献(Bleau and Leon, 2000)。

2.算法描述

分水岭变换是一种有效的基于区域的图像分割方法,它

可以得到单像素宽、连通、封闭且位置准确的轮廓,因而被

广泛地应用于医学图像、自然图像和视频图像等的分割。它

的缺点也很突出,即对图像中噪声敏感,容易产生过分割

(Grau et al., 2004)。区域合并算法能有效合并区域,但初始区

域的产生困难。以上任何一种单一方法的缺点和优点都同样

突出,因此,我们提出了基于分水岭变换的混合分割方法,

其流程见图 3.9,具体步骤描述如下。

(1)计算多光谱梯度图像。分水岭变换不是直接在原图

像上进行的,而是基于多光谱梯度图进行的。

(2)分水岭变换。对多光谱梯度图进行分水岭变换,产

生初始区域。在这一分割中,初始区域过分割严重,需进一

步处理。

图 3.8 水线阈值法

局部极小值区

多光谱遥感影像

计算多光谱梯度图像

水分岭变换

分水线区域确定

初始合并

图 3.9 基于分水岭变换与

NNG 的混合分割流程

分水线 集水盆

Page 61: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法 ·51·

(3)分水线区域确定。分水线是分水岭变换后生成的单像素宽的封闭轮廓,这些分

水线不属于任何一个初始区域,这些分水线会对图像的处理造成一定困难。此处根据多

光谱均值,采用 8 邻域搜索法,把分水线上的像素逐个归入邻近 相似区域。

(4)初始合并。初始区域图中存在若干小区域或单像素,针对这些小区域不存在有

意义的空间特征信息,通常是噪声像素引起。去除这样的小区域可以进一步减少区域个

数,还可以降低区域合并的代价。因此,我们提出根据区域面积进行初始区域合并,这

是混合分割区域合并的第一阶段。

小区域面积可以用一个阈值 M 来约束,区域的面积定义为区域内像素的个数,M取值一般不超过 8。这些小区域虽然像素个数少,但区域的方差通常较大,如果以一个

区域整体进行合并,往往使得合并后的区域不能真实地反映该区域的特征并影响其周围

的特征。因此,这里的合并准则是采用逐像素寻找与之光谱特征 接近的邻近区域,每

合并一个像素或小区域,相邻区域的属性更新一次,标记图像对应像素的标记也要更新。

(5)区域合并。

3.多通道图像的梯度图计算

梯度图能很好地表现图像的变化趋势,并且大量的实验证明分水岭算法与图像的梯

度有很大关系,而与图像本身相关性不大(Soille, 1999; 高丽等, 2006)。由于图像暗噪

声和暗纹理细节的影响,梯度图中存在大量的伪局部极小值,它们在分水岭变换中会产

生相应的伪积水盆地。当这些伪局部极小值和真正的局部极小值一起被作为独立的区域

通过分水岭变换分割出来时, 终会造成严重的过分割问题。

在初始分割时尽量抑制噪声和细密纹理的影响,同时保留重要轮廓,合理降低区域

数量,避免区域合并或减小合并难度和复杂度,才是解决传统分水岭变换问题的根本途

径。因此梯度图的计算是关键,不同的梯度图会产生不同的分割结果。

多通道图像的梯度图计算方法很多,常用计算方式有以下 3 种:

① Sobel 算子综合梯度 利用 Sobel 算子(Kittler,1983)计算多通道图像的各个通道

的梯度,然后综合计算其梯度大小(见公式(3.19))。 22

1/2

1

1

( , ) ( ( , ) ( , ) )

1( , ) ( , )

1( , ) ( , )

x y

bi

x xib

iy y

i

f x y f x y f x y

f x y f x yb

f x y f x yb

= +

=

=

(3.19)

式中, ( , )xf x y 、 ( , )yf x y 分别表示像素(x, y)在水平和垂直方向的梯度;i 表示多通

道图像的第几波段;b 表示多通道图像的波段数。

② 二阶矩图 多通道图像的局部二阶矩(Alain and Philippe, 2000)定义见公式(3.20)。 2

2( , ) ( , )

( ', ') ( , )V

( , )( ', ') ( , )V

1( ', ')

1( ', ')

x y V x yx y V x y

V x yx y V x y

c x y uN

u c x yN

= -

= (3.20)

式中,V(x, y)代表以(x, y)像素为中心的一个窗口;NV表示窗口像素的个数。这里窗

学出版社

职教技术出版中心

www.abook.cn

Page 62: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·52·

口的大小一般取 5×5,这样可以包括足够的邻域信息,取得太大,不仅增加计算量,而

且还会造成局部细节模糊。

③ 数学形态学梯度 多通道图像的数学形态学(Serra, 1986)梯度定义见公式(3.21)。

1

( , ) ( , )

1( , ) ( , )

( , ) ( ) ( )

b

ii

i x y x y

I x y I x yb

I x y I M I M

=

= - (3.21)

式中,I 表示输入图像;M 表示形态处理采用的结构单元; I M 表示对输入图像进行

膨胀处理; I M 表示对输入图像进行腐蚀处理。

在 Sobel 梯度图和二阶矩图的基础上,可以采用多通道图像均匀性图的计算方法,它

能更准确反映图像的局部信息,更适合用于分水岭变换。均匀性表示像素及其邻域的相似

程度,它包括局域 Sobel 梯度信息和邻域均方差表示的全局信息,其定义见公式 3.22。

0

1 0

1( , ) Max { ( , ), ( , )}

b

i Nk j N

p i j i j i jb

=≤ ≤≤ ≤

(3.22)

式中, ( , )i j 、 ( , )i j 分别是多通道图像的 Sobel 梯度图和二阶矩图;k 表示多通道图像

的第几波段;b 表示多通道图像的波段数。

这种均匀性图不仅结合了多通道图像的梯度和局部矩信息,保留了图像中细节,又滤

除了图像中局部扰动伪信息,而且还体现了多识别尺度特点,梯度识别尺度一般是 3×3,

而局部矩的识别尺度一般是 5×5。因此,均匀性图能反映多通道图像更准确的信息。

3.6.3 分割实验与结果分析

为了验证本文提出的基于分水岭变换的图像混合分割算法的有效性,以图 3.10 为测

试图像,图像大小为 512×512,是 2006 年 3 月拍摄的 SPOT5 多光谱遥感影像,共有 4

个波段。该图像是 2006 年 2 月洋山深水港一期工程完成后北面区域的场景,图像中有

东海大桥、道路、房屋、山、水塘、礁石等景观。

图 3.10 2006 年 SPOT5 影像

图 3.10 的 Sobel 算子梯度图、二阶矩图、形态梯度图和均匀性图分别见图 3.11(a)、

(b)、(c)、(d)。图 3.11(a)细节过多,其中有很多因灰度扰动而出现的伪细节,图 3.11

(b)滤除了很多细节,许多局部区域模糊;图 3.11(c)虽然在除去伪细节、保留局部信息

方面很有优势,但容易引起区域轮廓移位,不易控制;图 3.11(d)保留了图 3.11(a)中

大部分细节,同时也滤除了一些明显的局部伪细节,是分水岭变换中不错的梯度计算方法。

Page 63: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

第 3 章 图像分割方法 ·53·

(a)Sobel 梯度图 (b)二阶矩图

(c)形态梯度图 (d)均匀性图

图 3.11 梯度图

图 3.12(b)、(c)、(d)分别为基于形态梯度的混合分割、基于 NNG 区域合并的分

割和基于均匀性图的混合分割结果,图中蓝色线条表示分割的区域轮廓线。三种方法都

是在同一尺度参数下完成分割的,表 3.3 是对不同分割方法的统计。基于 NNG 区域合

并算法的分割区域数 多,对山坡区域过分割现象明显,这是由于山坡区域纹理丰富所

致;基于形态梯度的混合分割算法产生的区域 少,但其对礁石、房屋的分割都有轮廓

扩大的趋势,对道路、大桥的分割没有其他两种方法准确、细致,这是由于形态梯度图

模糊细节所致;而基于均匀性图的混合分割与基于形态学梯度的混合分割产生的区域近

似,典型地物轮廓准确,并且计算效率优势明显,因此,此处可以得到以下结论。

(1)不同的分割方法产生不同的分割结果。在地势起伏、纹理丰富的区域基于分水

岭变换的混合分割算法优于基于 NNG 区域合并的分割算法。

(2)不同的梯度产生不同的分割结果。基于均匀性图的混合分割结果较佳,但应用

中也要根据实际需求进行选择。

(3)基于分水岭变换的混合分割实质是一种改进的基于区域的图像分割方法,该方

法 大的困难在于确定一致性准则困难,即不同的参数对应不同的分割结果。

表 3.3 分割方法性能统计

分割方法 分割区域数 计算时间/min

基于形态梯度的混合分割 195 10.1

基于 NNG 区域合并分割 237 14.8

基于均匀性图的混合分割 210 8.6

学出版社

职教技术出版中心

www.abook.cn

Page 64: 图像对象层次的 遥感影像分析 - abook.cn图像对象层次的 遥感影像分析 陈建裕 张汉松 著 北 京 LeYb g/QúrHN-_Ã yÑ[fQúrHy>

图像对象层次的遥感影像分析

·54·

(a)原图 (b)基于形态梯度的分水岭混合分割

RGB(nir,green,red)三波段合成 尺度参数 31,光谱权值 0.8,光滑度权值 0.8

(c)基于 NNG 区域合并的分割 (d)基于均匀性图的分水岭混合分割

尺度参数 31,光谱权值 0.8,光滑度权值 0.8 尺度参数 31,光谱权值 0.8,光滑度权值 0.8

图 3.12 不同梯度图、不同方法的分割结果