ii.3 classificação não-supervisionada

18
Marcus Sampaio DSC/UFCG

Upload: majed

Post on 06-Jan-2016

23 views

Category:

Documents


0 download

DESCRIPTION

II.3 Classificação Não-Supervisionada. Classificação Não Supervisionada. As instâncias não são previamente classificadas Um algoritmo de classificação não supervisionada define dinamicamente o atributo de classificação e as classes Algoritmos de lógica muito complexa. Lógica de Clustering. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

Page 2: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

Classificação Não Supervisionada

• As instâncias não são previamente classificadas• Um algoritmo de classificação não supervisionada

define dinamicamente o atributo de classificação e as classes– Algoritmos de lógica muito complexa

Page 3: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

• O objetivo é mostrar as instâncias caem dentro de um grupo (cluster)– Um grupo podia ser clientes que compram muito

equipamentos eletrônicos

• Os algoritmos de clustering diferem– Na forma como os grupos são visualizados– Na precisão com que os grupos são definidos

Lógica de Clustering

Page 4: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCGVisualização de Grupos

a

d

k

j

h

e

c

b

g

i

f

Page 5: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCGVisualização de Grupos (2)

a

d

k

j

g

e

h

c

i

f

b

Note que uma instância pode pertencer a mais de um grupo

Page 6: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

• O estágio de agrupamento (clustering) é muitas vezes seguido de outro estágio– Dado um grupo, uma árvore de decisão ou um

conjunto de regras de classificação são inferidas para o grupo (definição do grupo)

Semântica de Grupos

Page 7: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCGAlgoritmo CobWeb

• Técnica incremental de agrupamento• Atributos nominais• Agrupamentos hierárquicos de instâncias• Category Utility

– Medida de qualidade de um grupo

Page 8: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

Estado Temp Umid Vento Jogoensol quente alta falso não (a)

ensol quente alta verdade não (b)

nublado quente alta falso sim (c)

chuvoso amena alta falso sim (d)

chuvoso fria normal falso sim (e)

chuvoso fria normal verdade não (f)

nublado fria normal verdade sim (g)

ensol amena alta falso não (h)

ensol fria normal falso sim (i)

Algoritmo CobWeb (2)

Page 9: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

chuvoso amena normal falso sim (j)

ensol amena normal verdade sim (k)

nublado amena alta verdade sim (l)

nublado quente normal falso sim (m)

chuvoso amena alta verdade não (n)

Algoritmo CobWeb (3)

Page 10: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

a:não a:não b:não d:simc:sim

e:sim

e:sim

a:não b:não d:simc:sim

f:não

(1) (2)

(3)

Algoritmo CobWeb (4)

Page 11: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

e:sim

a:não b:não d:simc:sim

f:não

(4)

g:sim

Algoritmo CobWeb (5)

Page 12: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

e:sima:não

c:simb:não

f:não

(5)

g:simd:sim h:não

Algoritmo CobWeb (6)

Page 13: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

e:sim

a:não

i:sim

b:não

f:não

(6)

g:sim

d:sim h:não

k:sim

l:simc:sim

n:não

j:sim

m:sim

1

2 3

4 5 6

7

Algoritmo CobWeb (7)

Page 14: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

Estado Temp Umid Vento Jogoensol quente alta falso não (a, 1-2-

4)

ensol quente alta verdade não (b), 1-2-5-7

nublado quente alta falso sim (c), 1-2-5

chuvoso amena alta falso sim (d, 1-2-4)

chuvoso fria normal falso sim (e), 1-3-6

chuvoso fria normal verdade não (f), 1-3

nublado fria normal verdade sim (g), 1-3

ensol amena alta falso não (h, 1-2-4)

ensol fria normal falso sim (i), 1-3-6

Algoritmo CobWeb (8)

Page 15: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCG

chuvoso amena normal falso sim (j), 1-3

ensol amena normal verdade sim (k), 1-2-5-7

nublado amena alta verdade sim (l), 1-2-5

nublado quente normal falso sim (m), 1-3

chuvoso amena alta verdade não (n), 1-3

Algoritmo CobWeb (9)

Page 16: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCGAlgoritmo CobWeb (10)

• Aplicando um algoritmo de classificação, pode-se inferir a semântica dos grupos– 1-2-4– 1-2-5-7– 1-2-5– 1-3-6– 1-3

Page 17: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCGAlgoritmo CobWeb (11)

• Para ver como a qualidade — category utility — de um grupo é calculada, consulte o livro-texto– Págs. 217-218

Page 18: II.3  Classificação Não-Supervisionada

Marcus SampaioDSC/UFCGAlgoritmo CobWeb (12)

• Como fazer predição com um modelo induzido por um algoritmo clustering?– Dada uma instância de execução, o algoritmo

classifica a instância como pertencendo a um ou mais grupos