画像の分類(1)-判別法による分類-imgprolab.sys.fit.ac.jp/~yama/imgproc/lec/imgproc_class...画像の分類...
TRANSCRIPT
画像処理工学
画像の分類(1) -判別法による分類-
画像の分類
• 分類
– 画像の各画素を,画像を構成する複数のものに対応づける(意味づけを行う)こと
– 画像上の各パターンについて特徴量(特徴ベクトル)を求め,それらの類似性が高いもの同士に分別する
– 類似度を統計的に求めることから,統計的パターン認識ともいう
2
画像の分類
• カテゴリ
– 下の画像上のパターンにおいて,りんごやみかんといったもの(意味づけされたもの)
• 分類クラス
– 分類処理において,類似性の高いものどうしの集合
– ひとつのカテゴリが複数のクラスから成り立っていることもある
なしりんご カテゴリ
葉
みかん
かご
濃い赤
薄い赤分類クラス
3
画像の分類
• リモートセンシング画像の分類
Landsat / TM 画像の分類 (多摩地方の土地被覆)
x
黄 : 緑地緑 : 都市域青 : 裸地
元画像 分類結果画像
4
特徴空間
• カラー画像の構成
R 成分 G 成分
B 成分
カラー画像
たとえば,赤色のところはR 成分画像で明るく(値が大きい),他の成分画像では暗い(値が小さい)
5
特徴空間
• 特徴ベクトル(画素の濃淡レベル)x
y gR gG gB
各成分画像上で同じ座標(x, y)にある濃度値を並べたベクトル量
たとえば,鼻の部分は(白,黒,黒)という特徴ベクトルをもつ
R 成分 G 成分 B 成分
特徴ベクトル (gR, gG, gB)
6
特徴空間
B 成分
0
255
255
各成分における値が近い画素の集まり(クラス)
R 成分
• 特徴空間(画素の濃淡レベル)
R
B
カラー画像
特徴空間 ( R-B 空間)
特徴ベクトル
7
特徴空間
B 成分
0
255
255
境界線(識別関数)を統計的に求める
R 成分
• 特徴空間の分割 (= 分類)
– 特徴空間上の各クラス間の境界を求める
– 境界線を識別関数(判別関数)という
特徴空間 ( R-B 空間)
B 成分
0
255
255R 成分
特徴空間の分割
クラス1
クラス2クラス3
8
x
• 分類クラスの特徴量
– 分類クラスの特徴量としては,濃淡レベルの平均値,分散(分散・共分散)などがよく用いられる
– 平均ベクトル:クラス分布の中心
– 分散・共分散行列:クラス分布の広がりの度合い
特徴空間
B 成
分
0
255
255R 成分
xx
クラスの平均
クラスの分散・共分散
9
• 分類クラスの特徴量
特徴空間
[ ]1 2c c c c KM M M= M[ ]1 2t t t t KX X XX =
11 12 1
21 22
1 2
c c c K
c cc
c K c K c KK
V V VV V
V V V
=
V
1
1 N
c k t kt
M XN =
= ∑
( )( )1
11
N
c ij t i c i t j c jt
V X M X MN =
= − −− ∑
1, 2, , t N=
クラス c の平均ベクトル
クラス c 分散・共分散行列
K : 特徴量の数(ベクトルの次元数)N : クラスのデータの数
(特徴 k の平均値)
10
• 判別法
– 与えられた特徴量を使用して類似度を求め,画素を分類クラスに分類する手法
– 類似度(判別関数)をいかに定義するかで分類結果が変わってくる
– 最短距離法と最尤法などがある
判別法による分類
11
x
• 最短距離法
– 特徴空間において,データと分類クラスとの距離を類似度(相違度)として定義し,距離が最小となる分類クラスにデータを分類する
– 距離として,ユークリッド距離,マハラノビス距離が用いられる
判別法による分類
0
255
255
xx
xx
クラス1
クラス2 クラス3
クラスの中心との距離を求め,距離が最小となるクラスにデータ x を分類する
12
• 最短距離法(続き)
– ユークリッド距離
• いわゆる空間上の点と点との距離
– マハラノビス距離
• ユークリッド距離を分散・共分散で正規化したもの
判別法による分類
( ) ( )( ) ( )22
1,
Kt
E x c x c x k c kk
d x c X M=
= − − = −∑X M X M
( ) ( ) ( )
[ ]
2 1
1 1
2 211 1 2 2
, tM x c c x c
x c
x cx c x c x K c K c
x K c K
d x c
X MX M
X M X M X M
X M
−
−
= − −
− − = − − − −
X M V X M
V
13
判別法による分類
( )2 , 2Md b∗ =
• ユークリッド距離とマハラノビス距離の違い
クラスの確率密度
特徴空間
x
クラス a クラス b確率密度
X1
X1
X2
( )2 , 1Md b∗ =( )2 , 1Md a∗ =
11aV
( )2 , 2Md a∗ =
xX1
xX1
aM1
aM1 bM1
bM1データ x はユークリッド距離では2つのクラスから同じ距離にあるが,マハラノビス距離ではクラス b に近いとみなされる
( )2 ,Ed x b( )2 ,Ed x a
11bV
14
• 最尤法
– クラス c に対するデータ x の尤度を考える
– 尤度が最大となるクラス c にデータ x を分類する
– 尤度 : クラス c におけるデータの分布を表す関数(正規分布に従うと仮定する)
判別法による分類
( )( )
( )21 22
1 1, exp , 22 MK
c
L x c d x cπ
= − V
|cV|: cV の行列式の値
データ x がクラス c に属することが尤もらしい度合い
( ), Md x c : マハラノビス距離
→ 最大となる c
15
• 最尤法(続き)
– 尤度に対して対数をとることで計算量を削減
判別法による分類
( ){ } ( ) ( ) ( )
( ) ( ) ( )
2
2
1 12log , 2 log 2 log , 2 2 2
log 2 log ,
c M
c M
KL x c d x c
K d x c
π
π
− = − − − − = + +
V
V
実際の分類処理ではこの式を用いる
( ) ( ){ } ( )( ) ( )2
, 2 log , log 2
log , c M
L x c L x c K
d x c
π′ = − −
= +V → 最小となる c
上の式の両辺から K log(2π) を削除すると
16
• 最尤法(続き)
– さらに計算量を削減するために,分散・共分散行列がすべてのクラスで等しいとする
判別法による分類
( )2 1 1, 2LDF x c c cd x c − −= −t tXV M MV M
L’(x, c)について,cV = V とし,またクラスに依らない項を省略すると
(線形識別関数)
各クラスの分布の広がりを同じにする
L’(x, c) ( )2 , LDFd x c
17
• 最尤法(続き)
– さらに計算量を削減するために,分散・共分散行列を単位行列とする
について, V = I とすると
判別法による分類
( )2 , 2MED x c c cd x c = −t tX M M M
( )2 , LDFd x c
( )2 , LDFd x c
( ≒ ユークリッド距離 )
各クラスの分布の広がりが円になる(分散が1)
( )2 , MEDd x c
18
• 最尤法(続き)
– さらに計算量を削減するために,cM cMt を一定とする
について, cM cMt をクラスに依らず一定とすると
判別法による分類
( )2 , CCM x cd x c = tX M
( )2 , MEDd x c
( )2 , MEDd x c
( xX と cM との成す角)
平均ベクトルとデータ x ベクトルとの成す角度が小さいクラスに分類する
( )2 , CCMd x c
x
19
• 尤度関数から導かれた判別関数の性能
– データ x が正規分布に従うと仮定した場合,それぞれの判別関数の分類性能は,以下のとおり
判別法による分類
( )2 , LDFd x c
( )2 , CCMd x c
( )2 , MEDd x c
L’(x, c)
L(x, c)
分類精度
高
計算時間
速
20