data clustering: a review

9
Data Clustering: A Rev iew A.K. Jain, M.N. Murty, P.J. Flynn 院院院院 ‘ 04 院 5 院 18 院 院院院院 () 院院 院院 5.5 Fuzzy Cluster ing

Upload: parson

Post on 05-Jan-2016

44 views

Category:

Documents


3 download

DESCRIPTION

Data Clustering: A Review. A.K. Jain, M.N. Murty, P.J. Flynn. ~ 5.5 Fuzzy Clustering ~. 院生ゼミ ‘ 04 年 5 月 18 日(火曜日) 谷津 哲平. Fuzzy Clustering. Fuzzy Clustering  の概念. 伝統的なクラスタリング手法では,パーティションを発生させる .      ⇒各パターン(個体)は唯一の1個のクラスタに属する - PowerPoint PPT Presentation

TRANSCRIPT

Data Clustering: A ReviewA.K. Jain, M.N. Murty, P.J. Flynn

院生ゼミ ‘ 04 年 5 月 18 日(火曜日)

谷津 哲平

~ 5.5   Fuzzy Clustering ~

Fuzzy Clustering

伝統的なクラスタリング手法では,パーティションを発生させる .      ⇒各パターン(個体)は唯一の1個のクラスタに属する

ファジィクラスタリングでは,帰属度関数( membership function )を使って ,  各パターンを全てのクラスタに関連付ける 

Fuzzy Clustering  の概念

Zadeh [1965]

Hard vs. Fuzzy

Y

X

3

2 5

4

7

9

8

6

H1

H2

H1 = { 1, 2, 3, 4, 5}

H2 = { 6, 7, 8, 9}

Hard Clustering

Hard vs. Fuzzy

Y

X

3

2 5

4

7

9

8

6

H1

H2

F1

F2

F1 = { (1,0.9), (2,0.8), (3,0.7), (4,0.6), (5,0.55), (6,0.2) , (7,0.2), (8,0.0), (9,0.0)}

F2 = { (1,0.0), (2,0.0), (3,0.0), (4,0.1), (5,0.15), (6,0.4) , (7,0.35), (8,1.0), (9,0.9)}

Fuzzy Clustering

Membership value

F1 = { (1,0.9), (2,0.8), (3,0.7), (4,0.6), (5,0.55), (6,0.2) , (7,0.2), (8,0.0), (9,0.0)}

F2 = { (1,0.0), (2,0.0), (3,0.0), (4,0.1), (5,0.15), (6,0.4) , (7,0.35), (8,1.0), (9,0.9)}

Y

X

3

2 5

4

7

9

8

6

H1

H2

F1

F2

Y

X

3

2 5

4

7

9

8

6

Y

X

3

2 5

4

7

9

8

6

3

2 5

4

7

9

8

6

H1

H2

F1

F2

帰属度(メンバシップ値)

・各クラスタへの帰属性の度合い

・各個体において , 全てのクラスタに対する帰属度の合計は「1」

↓  ( i, μi ) : ( i 番目の個体 , その帰属度 )

Membership value

Y

X

3

2 5

4

7

9

8

6

F1

F2

Fuzzy Clustering

0.9

0.0

0.3

0.0

0.6

0.1

0.2

0.35

0.2

0.4

0.0

1.00.0

0.90.8

0.0

0.55

0.15

帰属度の最も大きい値のクラスタに属させることでハードに変換できる例) ある個体 x i がクラスタ c k に属するなら uik= 1,属さ

ないなら uik= 0

Fuzzy Clustering Algorithm

U : 帰属度行列. N × K の行列

uij : U の要素.個体 x i のクラスタ cj に対する帰属度を表す

N: 個体数  K: クラスタ数 

評価関数

xi : i 番目の個体 

ck : k 番目のファジィクラスタ中心 

Fuzzy Clustering Algorithm

Step1  帰属度行列 U によって,ファジィパーティションの 初期値を選ぶ

Step2   U を使って評価関数の値を求める

Step3   U の著しい変化がなくなるまで, Step2 を繰り返す

N: 個体数  K: クラスタ数  U: 帰属度行列 x:個体  c:クラスタ中心

E2 の値を小さくしていく

Fuzzy c-means (FCM)1961 Ruspini : fuzzy set theory を初めて適用

1981 Bezdek : FCM アルゴリズムの一般化

1992 Dave : fuzzy c-shell と 楕円境界の検出の提示

< FCM >・最もポピュラーなファジィクラスタリング手法

・ hard k-means よりも局所的な最小値を避けることが優れている

・二乗エラー基準の局所的な最小値に集めることができる