curso datamining

132
Seres Humanos e Padr˜oes Conceito Intuitivo Formalizando Na Pr´ atica Distˆ ancias Classificadores Elementares Avalia¸c˜ ao de Clas Introdu¸c˜ ao ao Reconhecimento de Padr˜ oes (Aprendizagem de M´ aquina / Data Mining) Exemplos em Python Prof. Ronaldo F. Ramos, Dr 29 de maio de 2015 Prof. Ronaldo F. Ramos, Dr Introdu¸c˜ ao ao Reconhecimento de Padr˜oes (Aprendizagem de M´ aquina / Data Mining)

Upload: ronaldo-ramos

Post on 13-Apr-2017

303 views

Category:

Education


4 download

TRANSCRIPT

Page 1: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Introducao ao Reconhecimento de Padroes(Aprendizagem de Maquina / Data Mining)

Exemplos em Python

Prof. Ronaldo F. Ramos, Dr

29 de maio de 2015

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 2: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Roteiro

1 Seres Humanos e Padroes

2 Conceito Intuitivo

3 Formalizando

4 Na Pratica

5 Distancias

6 Classificadores Elementares

7 Avaliacao de Classificadores

8 Classificadores Diversos

9 Formacao de Agrupamentos

10 Selecao de Atributos

11 Limpeza de Dados

12 Contatos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 3: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Seres Humanos e Padroes

Os sentidos humanos enviam informacoes ao cerebro quereconhece alguns aspectos da realidade.

Sons

Imagens

Sensacao Tatil

Odores

Permitem tambem a identificacao de padroes logico-matematicos(o que exige um pouco mais do cerebro ;-) ).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 4: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Conceito de Reconhecimento de Padroes

Reconhecer um padrao equivale a classificar um objeto fısico oulogico como pertencente ou nao a uma predeterminada categoria.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 5: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Conceito Intuitivo

Dadas as categorias abaixo:

(a) Laranjas (b) Macas

A qual delas pertencem os objetos abaixo?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 6: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Conceito Intuitivo - Novo Grupo

(c) Laranjas (d) Macas (e) Tangerinas

A qual delas pertence o objeto abaixo?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 7: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Similaridade

Seu cerebro fez uma analise de

similaridade.

Pode-se fazer esta mesma analise no

computador?O que precisaremos para tal?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 8: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Uma definicao quase formal de RP

Um problema de RP e composto de ...

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 9: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Um Conjunto de K Classes

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 10: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Um Conjunto de objetos Ni por Classes Ki

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 11: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Um Conjunto de atributos nj por objeto Ni

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 12: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Mecanismo de Memoria e Aprendizagem

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 13: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Regra de Decisao para Calcular Novos Objetos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 14: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Criterios de Avaliacao do Classificador

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 15: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 16: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 17: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 18: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 19: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? AtivoProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 20: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Sobre os Atributos

Os atributos sao igualmente importantes?

E facil definir os atributos de um objeto?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 21: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Sobre os Atributos

Nem sempre.

Nem sempre.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 22: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Transformacao de Atributos

Atributos devem ser expressos na forma de numeros.Desta forma o conjunto de atributos da tangerina [Formato, FrutaCıtrica, Cor, Rugosidade da Casca, Cheiro] devem ser expressoscomo um vetor de atributos tais como:X = [0, 1, 2, 1, 1] 1

1A forma de numeralizar pode fazer muita diferenca no uso do modeloProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 23: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Adotando as seguintes convencoes:

Atributo Valores Textuais Numericos

Formato Esferico,Oval,Alongado 0,1,2

Fruta Cıtrica Nao,Sim 0,1

Cor Amarelo,Vermelho,Alaranjado,Verde 0,1,2,3

Rugosidade lisa,rugosa 0,1

Cheiro Nao,Sim 0,1

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 24: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Terıamos as seguintes representacoes para as frutas

Objeto Laranja (X) [0, 1, 2, 1, 0]

Objeto Maca (Y) [0, 0, 1, 0, 0]

Objeto Tangerina (Z)[0, 1, 2, 1, 1]

O Objeto tangerina (Z) se assemelha mais a

laranja(X) ou a Maca(Y)?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 25: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Conceito de Distancia

Uma forma de medir a similaridade entre dois padroes ecalcular a distancia entre eles.

Distancia city-block, quarteirao ou manhattan.Dq(X,Y) = |X1 − Y1|+ |X2 − Y2|+ ... + |Xn − Yn|Distancia Euclidiana.De(X,Y) =

√(X1 − Y1)2 + (X2 − Y2)2 + ... + (Xn − Yn)2

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 26: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comparacao entre Euclidiana e Quarteirao

ZZZZZZ

ZZZZZZ

C B

A

53

4

Dq(A,B) = 3 + 4 = 7De(A,B) =

√32 + 42 = 5

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 27: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Agora e so fazer as contas

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 28: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Classificadores Elementares

Agora voce sabe que uma tangerina e mais parecida com umalaranja do que com uma maca..;-).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 29: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Classificadores Elementares

Agora vamos estudar as flores....

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 30: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Morfologia das Flores

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 31: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Iris (Flor-de-lis)

Valei-me Deus e o fim do nosso amor .....

Iris Setosa Iris Virgınica Iris Versicolor

Estudo feito por Sir Ronald Fischer em 1936(Analise Discriminante).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 32: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris I

Na WIKIPEDIA e em outros lugares encontraremos a base dedados de Fischer.SL=Comprimento da Sepala SW=Largura da SepalaPL=Comprimento da Petala PW = Largura da Petala

SL SW PL PW Species5.1 3.5 1.4 0.2 setosa4.9 3.0 1.4 0.2 setosa4.7 3.2 1.3 0.2 setosa4.6 3.1 1.5 0.2 setosa5.0 3.6 1.4 0.2 setosa5.4 3.9 1.7 0.4 setosa4.6 3.4 1.4 0.3 setosa5.0 3.4 1.5 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 33: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris II

4.4 2.9 1.4 0.2 setosa4.9 3.1 1.5 0.1 setosa5.4 3.7 1.5 0.2 setosa4.8 3.4 1.6 0.2 setosa4.8 3.0 1.4 0.1 setosa4.3 3.0 1.1 0.1 setosa5.8 4.0 1.2 0.2 setosa5.7 4.4 1.5 0.4 setosa5.4 3.9 1.3 0.4 setosa5.1 3.5 1.4 0.3 setosa5.7 3.8 1.7 0.3 setosa5.1 3.8 1.5 0.3 setosa5.4 3.4 1.7 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 34: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris III

5.1 3.7 1.5 0.4 setosa4.6 3.6 1.0 0.2 setosa5.1 3.3 1.7 0.5 setosa4.8 3.4 1.9 0.2 setosa5.0 3.0 1.6 0.2 setosa5.0 3.4 1.6 0.4 setosa5.2 3.5 1.5 0.2 setosa5.2 3.4 1.4 0.2 setosa4.7 3.2 1.6 0.2 setosa4.8 3.1 1.6 0.2 setosa5.4 3.4 1.5 0.4 setosa5.2 4.1 1.5 0.1 setosa5.5 4.2 1.4 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 35: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris IV

4.9 3.1 1.5 0.2 setosa5.0 3.2 1.2 0.2 setosa5.5 3.5 1.3 0.2 setosa4.9 3.6 1.4 0.1 setosa4.4 3.0 1.3 0.2 setosa5.1 3.4 1.5 0.2 setosa5.0 3.5 1.3 0.3 setosa4.5 2.3 1.3 0.3 setosa4.4 3.2 1.3 0.2 setosa5.0 3.5 1.6 0.6 setosa5.1 3.8 1.9 0.4 setosa4.8 3.0 1.4 0.3 setosa5.1 3.8 1.6 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 36: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris V

4.6 3.2 1.4 0.2 setosa5.3 3.7 1.5 0.2 setosa5.0 3.3 1.4 0.2 setosa7.0 3.2 4.7 1.4 versicolor6.4 3.2 4.5 1.5 versicolor6.9 3.1 4.9 1.5 versicolor5.5 2.3 4.0 1.3 versicolor6.5 2.8 4.6 1.5 versicolor5.7 2.8 4.5 1.3 versicolor6.3 3.3 4.7 1.6 versicolor4.9 2.4 3.3 1.0 versicolor6.6 2.9 4.6 1.3 versicolor5.2 2.7 3.9 1.4 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 37: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris VI

5.0 2.0 3.5 1.0 versicolor5.9 3.0 4.2 1.5 versicolor6.0 2.2 4.0 1.0 versicolor6.1 2.9 4.7 1.4 versicolor5.6 2.9 3.6 1.3 versicolor6.7 3.1 4.4 1.4 versicolor5.6 3.0 4.5 1.5 versicolor5.8 2.7 4.1 1.0 versicolor6.2 2.2 4.5 1.5 versicolor5.6 2.5 3.9 1.1 versicolor5.9 3.2 4.8 1.8 versicolor6.1 2.8 4.0 1.3 versicolor6.3 2.5 4.9 1.5 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 38: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris VII

6.1 2.8 4.7 1.2 versicolor6.4 2.9 4.3 1.3 versicolor6.6 3.0 4.4 1.4 versicolor6.8 2.8 4.8 1.4 versicolor6.7 3.0 5.0 1.7 versicolor6.0 2.9 4.5 1.5 versicolor5.7 2.6 3.5 1.0 versicolor5.5 2.4 3.8 1.1 versicolor5.5 2.4 3.7 1.0 versicolor5.8 2.7 3.9 1.2 versicolor6.0 2.7 5.1 1.6 versicolor5.4 3.0 4.5 1.5 versicolor6.0 3.4 4.5 1.6 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 39: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris VIII

6.7 3.1 4.7 1.5 versicolor6.3 2.3 4.4 1.3 versicolor5.6 3.0 4.1 1.3 versicolor5.5 2.5 4.0 1.3 versicolor5.5 2.6 4.4 1.2 versicolor6.1 3.0 4.6 1.4 versicolor5.8 2.6 4.0 1.2 versicolor5.0 2.3 3.3 1.0 versicolor5.6 2.7 4.2 1.3 versicolor5.7 3.0 4.2 1.2 versicolor5.7 2.9 4.2 1.3 versicolor6.2 2.9 4.3 1.3 versicolor5.1 2.5 3.0 1.1 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 40: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris IX

5.7 2.8 4.1 1.3 versicolor6.3 3.3 6.0 2.5 virginica5.8 2.7 5.1 1.9 virginica7.1 3.0 5.9 2.1 virginica6.3 2.9 5.6 1.8 virginica6.5 3.0 5.8 2.2 virginica7.6 3.0 6.6 2.1 virginica4.9 2.5 4.5 1.7 virginica7.3 2.9 6.3 1.8 virginica6.7 2.5 5.8 1.8 virginica7.2 3.6 6.1 2.5 virginica6.5 3.2 5.1 2.0 virginica6.4 2.7 5.3 1.9 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 41: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris X

6.8 3.0 5.5 2.1 virginica5.7 2.5 5.0 2.0 virginica5.8 2.8 5.1 2.4 virginica6.4 3.2 5.3 2.3 virginica6.5 3.0 5.5 1.8 virginica7.7 3.8 6.7 2.2 virginica7.7 2.6 6.9 2.3 virginica6.0 2.2 5.0 1.5 virginica6.9 3.2 5.7 2.3 virginica5.6 2.8 4.9 2.0 virginica7.7 2.8 6.7 2.0 virginica6.3 2.7 4.9 1.8 virginica6.7 3.3 5.7 2.1 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 42: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris XI

7.2 3.2 6.0 1.8 virginica6.2 2.8 4.8 1.8 virginica6.1 3.0 4.9 1.8 virginica6.4 2.8 5.6 2.1 virginica7.2 3.0 5.8 1.6 virginica7.4 2.8 6.1 1.9 virginica7.9 3.8 6.4 2.0 virginica6.4 2.8 5.6 2.2 virginica6.3 2.8 5.1 1.5 virginica6.1 2.6 5.6 1.4 virginica7.7 3.0 6.1 2.3 virginica6.3 3.4 5.6 2.4 virginica6.4 3.1 5.5 1.8 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 43: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris XII

6.0 3.0 4.8 1.8 virginica6.9 3.1 5.4 2.1 virginica6.7 3.1 5.6 2.4 virginica6.9 3.1 5.1 2.3 virginica5.8 2.7 5.1 1.9 virginica6.8 3.2 5.9 2.3 virginica6.7 3.3 5.7 2.5 virginica6.7 3.0 5.2 2.3 virginica6.3 2.5 5.0 1.9 virginica6.5 3.0 5.2 2.0 virginica6.2 3.4 5.4 2.3 virginica5.9 3.0 5.1 1.8 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 44: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Algoritmo do Vizinho Mais Proximo - Neareast Neighbor

1 Seja Xnew um vetor cuja classe e desconhecida.

2 Procurar na tabela o vetor armazenado mais proximo deXnew.

3 Chamar de Xnear o vetor mais proximo de Xnew

4 Atribuir a Xnew a mesma classe de Xnear

5 Se a classificacao for correta incluir Xnew na tabela.

Mao a obra, ou melhor ao codigo ...

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 45: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Qual o problema com o Vizinho Mais Proximo?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 46: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Uma Solucao

KNN - K Vizinhos Mais Proximos(K=Numero Impar Inteiro)O Padrao e classificado de acordo com a maioria dos vizinhos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 47: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Algoritmo dos K Vizinhos Mais Proximos - K NeareastNeighbors

1 Armazenar os exemplos em uma tabela.

2 seja Xnew um vetor de classe desconhecida.

3 Encontrar na tabela os K vetores mais proximos de Xnew

4 Seja Ck a classe a que pertence a maioria dos vetores.

5 Atribuir Classe(Xnew) = Ck

6 Se a classificacao for correta incluir Xnew na tabela.

Bom, vamos ao codigo ...

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 48: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Vantagens e Desvantagens do KNN

Vantagens

Simplicidade de Implementacao.

Ideal para tabelas pequenas ou medias.

Nao requer treinamento.

Desvantagens

Alto custo computacional para tabelas grandes.

A constante K e obtida por tentativa e erro.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 49: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Distancia Mınima ao Centroide

Cada classe passa a ter um unico vetor que a representachamado de centroide.

Apos o ”treinamento”nao sera necessario armazenar osexemplos. Apenas os centroides permanecem na memoria.

O centroide e o vetor medio, ou seja, a media dos exemplosda classe.

O centroide e o representante de sua classe.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 50: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Distancia Mınima ao Centroide

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 51: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Atualizando o Centroide

Como foi visto o centroide representa a classe, portanto,descoberto um novo indivıduo da classe, o centroide deve/pode seratualizado.Mj(nj + 1) = (1− a)Mj(nj) + a(Xnew)Onde:a = 1/(nj + 1) e o fator de aprendizagemnj e o total de exemplos utilizados antes da chegada do XnewMj(nj) e o centroide antes da chegada do XnewMj(nj + 1) e o novo centroide com Xnew incorporado.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 52: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Estrategias de Avaliacao(Montando um Experimento de Avaliacao)

Cuidado. O vilao se chama superadaptacao ou sobre-ajuste.(OVERFITTING)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 53: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Estrategias de Avaliacao(Treinamento e Teste)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 54: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Estrategias de Avaliacao(Validacao Cruzada)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 55: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Matriz de Confusao

Corretamente Classificadas = 5 + 3 + 11 = 19Erroneamente Classificadas = 2 + 3 + 0 + 0 + 2 + 1 = 8Total de Instancias = 27Taxa de Acerto = 19/27 (70,4 % )Taxa de Erro = 8/27 (29,6 % )

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 56: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Matriz de Confusao

Entao basta termos uma boa taxa de acerto e nosso classificadoresta pronto pra ser usado?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 57: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Matriz de Confusao

Nao necessariamente.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 58: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Matriz de Confusao

Para cada uma das classes existem os elementos (instancias)que pertecem a classe. Sao os POSITIVOS para a classe.

Para cada classe existem as instancias que nao pertecem aclasse. Sao os NEGATIVOS para a classe.

Os elementos classificados como POSITIVOS, quandocorretos, sao chamados de VERDADEIROS POSITIVOS.

Os elementos classificados como POSITIVOS, quandoincorretamente classificados, sao chamados de FALSOSPOSITIVOS

Os elementos classificados como NEGATIVOS, quandocorretos, sao chamados de VERDADEIROS NEGATIVOS.

Os elementos classificados como NEGATIVOS, quandoincorretamente classificados, sao chamados de FALSOSNEGATIVOS.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 59: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Tabela de Confusao para a Classe dos Gatos

TP = True Positives. Verdadeiros Positivos. Classificados corretamente como gatos.FP = False Positives. Falsos Positivos. Classificados como gatos que sao outra coisaFN = False Negatives. Falsos Negativos. Classificados como outra coisa, mas sao realmente gatos.TN = True Negatives. Classificados como outra coisa e realmente nao sao gatos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 60: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Dentre os elementos classificados como positivos, qual opercentual, ou melhor, a TAXA de VERDADEIROS POSITIVOS?(TAXA de VERDADEIROS POSITIVOS OU ”TRUE POSITIVERATE”) (TPR).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 61: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Quem sao os positivos? R. Sao os Verdadeiros Positivos (TP) maisos FALSOS NEGATIVOS (FN).Portanto: TPR = TP / (TP + FN)OBSs:

O TPR se aproxima de um quando o FN se aproxima de zero.

Queremos um TPR alto quando nao queremos deixar umPOSITIVO passar por NEGATIVO. Imagine que se trata de umexame para deteccao de uma doenca altamente contagiosa. Melhortermos muitos falsos positivos do que falsos negativos. (Melhor terum inocente preso que um bandido solto, hehehe)

TPR tambem e chamada de RECALL.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 62: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Dentre os elementos classificados como negativos, qual opercentual, ou melhor, a TAXA dos VERDADEIROS NEGATIVOS?(TAXA de VERDADEIROS NEGATIVOS OU ”TRUE NEGATIVERATE”)(TNR).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 63: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Quem sao os negativos? R. Sao os VERDADEIROS NEGATIVOS(TN) mais os FALSOS POSITIVOS (FP).Portanto: TNR = TN / (TN + FP)

O TNR se aproxima de um quando o FP se aproxima de zero.

Queremos um TNR alto quando nao queremos deixar umNEGATIVO passar por POSITIVO. Imagine que voce tem umaempresa que possa ser processada por danos morais caso voceafirme que um de seus clientes esta fraudando quando na realidadeele nao esta. (FP)

TNR tambem e chamada de Especificidade (Specificity).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 64: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Voce ja deve ter percebido que a Taxa de Acerto sozinha nao querdizer muita coisa e nem sempre e o fator mais importante naescolha de um classificador para o seu problema. A seguir oresumo.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 65: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Metricas

True Positive Rate (Recall) (TPR). TPR = TP / (TP + FN)

True Negative Rate (Specificity) SPC = TN / (FP + TN)

Positive Predictive Value (Precision) PPV = TP / (TP + FP)

Negative Predictive Value (NPV) NPV = TN / (TN + FN)

False Positive Rate (fall-out) FPR = FP /( FP + TN)

False Discovery Rate (FDR) FDR = FP /(FP + TP) = 1 -PPV

False Negative Rate (Miss Rate) FNR = FN / ( FN + TP)

etc etc etc

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 66: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Metricas Curva ROC - Receiver Operating Characteritics

Area Sob a curva. Acima de 0.9 (excelente). Entre 0.8 e 0.9(bom). Entre 0.7 e 0.8 (medio). Entre 0.6 e 0.7 (fraco).Abaixo de0.6 (ineficaz).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 67: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ZERO R - O Classificador do Preconceito

Seja o DataSet Jogar Tenis (Disponıvel na Literatura)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 68: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ZERO R - O Classificador do Preconceito

O ZERO R classifica as instancias pela maioria. No caso do destedataset temos:Instancias classificadas como P (Positivo = SIM) : 9Instancias classificadas como N (Negativo = Nao) : 5Classe Maioria: SIM.

Matriz de Confusao:Real \Predito P (SIM) N (Nao)

P (SIM) 9 0

N (Nao) 5 0

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 69: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ZERO R - O Classificador do Preconceito

Metricas

Classe TPR FPR ROC

P (SIM) 1 1 0,5

N (Nao) 0 0 0,5

Taxa de Acerto (Acuracidade) : 9/13 = 0,69

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 70: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ZERO R - O Classificador do Preconceito

Na pratica, o classificador Zero R pode ser usado para criar uma”baseline”para avaliar o seu classificador.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 71: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ONE R - Melhorando um Pouco

Observemos o atributo tempo:Valor \Classes P (SIM) N (Nao)

Ensolarado 2 3

Nublado 4 0

Chuva 4 1

Que regra podemos extrair daı? (Descoberta de regras)R. SE Esta nublado ou com Chuva ENTAO P (SIM) SENAO N(Nao)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 72: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ONE R - Melhorando um Pouco - Aplicando ao Dataset

Instancia Real Classificado (Predito)1 N N2 N N3 P P4 P P5 P P6 N P7 P P8 N N9 P N

10 P P11 N P12 P P13 P P14 N P

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 73: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ONE R - Melhorando um Pouco - Aplicando ao Dataset

Instancias classificadas corretamente : 10Instancias classificadas erroneamente : 4Daı..

Matriz de ConfusaoReal \Predito P(SIM) N(NAO)

P(SIM) 7 2

N(NAO) 2 3

MedidasClasse TPR FPR ROC

P (SIM) 0,778 0,4 0,689

N (Nao) 0,6 0,222 0,689

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 74: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ONE R - Melhorando um Pouco - Aplicando ao Dataset

Moral da Historia: Encontre um atributo mais util para fazer seusjulgamentos. ;-)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 75: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

O que e ?

Uma arvore de decisao e uma ferramenta de apoio a decisao que,graficamente, apresenta a forma de uma arvore (de cabeca parabaixo). A raiz e a parte de cima e as folhas ficam na parte debaixo. Veja o desenho abaixo.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 76: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Exemplo

A Raiz e os nos sao as variaveis a serem avaliadas, os ramos(arcos) que ligam os nos sao os valores admissıveis ou caminhos aserem seguidos no processo de decisao e as folhas sao as saıdas.Veja o exemplo de uma arvore de decisao para o caso de decidir sevc vai jogar ou nao tenis.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 77: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Tabela

A partir da arvore acima podemos construir a seguinte tabela.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 78: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Questao

Entao a proxima pergunta e: Porque usar uma arvore e naosimplesmente consultar a tabela?

Resposta

Economia e, consequentemente, viabilidade dos calculos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 79: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Questao

Entao a proxima pergunta e: Porque usar uma arvore e naosimplesmente consultar a tabela?

Resposta

Economia e, consequentemente, viabilidade dos calculos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 80: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Seja o dataset (Ida ao restaurante):

Por onde comecar?Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 81: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Atributo Clientela

lotado (0 casos positivos, 4 casos negativos); medio (4 casospositivos, 0 casos negativos) e vazio (4 casos negativos, 0 casospositivos).

Atributo Tipo

a la carte (2 casos negativos, 1 caso positivo); self service (2 casosnegativos, 1 caso positivo) fast food (2 casos negativos, 1 casopositivo) e sushi bar (2 casos negativos e 1 caso positivo).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 82: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Atributo Clientela

lotado (0 casos positivos, 4 casos negativos); medio (4 casospositivos, 0 casos negativos) e vazio (4 casos negativos, 0 casospositivos).

Atributo Tipo

a la carte (2 casos negativos, 1 caso positivo); self service (2 casosnegativos, 1 caso positivo) fast food (2 casos negativos, 1 casopositivo) e sushi bar (2 casos negativos e 1 caso positivo).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 83: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Proposta 1

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 84: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Proposta 2

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 85: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Manual Selecionar sempre o atributo que levar mais rapido para asfolhas (Decisao). Atributos que dividem as instanciasequilibradamente nao sao bons.

ID3 Desenvolvido por Ross Quillan, usa a teoria do ganho dainformacao para selecao dos atributos. Ver no BLOG (https://lambrain.wordpress.com/page/4/) e(https://lambrain.wordpress.com/2014/10/13/tutorial-arvores-de-decisao-continuacao-ia/)

C4.5 Melhoria para trabalhar com valores continuos e poda a arvoreapos criacao

C5.0 Mais rapido. Bom para grandes volumes de dados. Os autoresdizem que e o melhor classificador que existe.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 86: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Redes Neurais Artificiais

1011 Neuronios — + 20 Tipos — 1014 Sinapses — 1 a 10 ms deciclo.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 87: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Redes Neurais Artificiais

Neuronio artificial.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 88: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Redes Neurais Artificiais

Funcoes de Ativacao. Limiar e Sigmoide.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 89: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Separabilidade

Problema da separacao.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 90: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Topologias de Redes Neurais

Redes Feed Forward.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 91: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Topologias de Redes Neurais

Redes com recorrencia, inibicao, etc.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 92: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Redes Bayesianas

P(X1, . . . ,Xn) =∏

i P(Xi |Pais(Xi)) Exemplo:P(j ∧m ∧ a ∧ ¬b ∧ ¬e) = P(j |a)P(m|a)P(a|¬b,¬e)P(¬b)P(¬e)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 93: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Formacao de Agrupamentos - Clustering

FILO - CLASSE - ORDEM - FAMILIA - GENERO - ESPECIEProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 94: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Formacao de Agrupamentos - Clustering

Doencas do Ovario.

Figura:Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 95: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 96: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 97: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 98: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 99: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Algoritmo aglomerativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 100: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 101: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 102: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 103: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Seja um dataset com seu conjunto de indivıduos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 104: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 1 - Selecionar K elementos como as medias iniciais (KDefinido antes)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 105: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 2: Classificar os elementos usando as medias (Formacao dosprimeiros K Grupos)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 106: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 3: Recalcular as medias de cada grupo.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 107: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 4: Reclassificar todos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 108: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 5: Recalcular medias

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 109: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Repetir passos 4 e 5 ate convergencia.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 110: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 111: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 112: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 113: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 114: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 115: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 116: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Selecao de Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 117: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Limpeza de Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 118: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Limpeza de Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 119: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Limpeza de Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 120: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Extracao de Regras a Partir dos Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 121: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Extracao de Regras a Partir dos Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 122: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Extracao de Regras a Partir dos Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 123: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Construcao Automatica de Ontologias

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 124: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Construcao Automatica de Ontologias

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 125: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Proposta Gissa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 126: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Porque combinar?

Duas cabecas pensam melhor do que uma?

Todos tem direito a uma segunda opiniao ;-)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 127: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Vantagens

Melhor do que o melhor dos classificadores selecionados

Aumenta a estabilidade do classificador 2

bias-variance decomposition. Bias = “erro persistente” de umalgoritmo de aprendizagem. Variance = “erro particular” deum modelo treinado.

. Sistemas combinados reduzem a variancia

. Quanto mais sistemas combinados mais se reduz a variancia

2O quanto um algoritmo e perturbado por pequenas mudancas nas entradasProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 128: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Desvantagens

Nenhuma garantia que sera sempre melhor do que o usosimples de um classificador

Ainda e uma area de pesquisas

Difıceis de analisar.

Complexo e custoso para construir

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 129: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Elementos a definir.

Estrutura

Componentes

Metodo de combinacao

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 130: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Continua

Temos assunto para varios outros cursos ....

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 131: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Continua

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 132: Curso datamining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Contatos

Prof. Ronaldo F. RamosDoutor em Systemes Informatiques (Informatica)- Universidade de Evry - Franca.Pos Doutorado - UFC - DETIMestre em Engenharia de Producao/Inteligencia Aplicada - Universidade Federal deSanta CatarinaEngenheiro Mecanico - Universidade Federal do Ceara30 Anos de experiencia em Projetos de Engenharia e Sistemas [email protected]

Prof. Guilherme de Alencar BarretoDoutor em Engenharia Eletrica - Universidade de Sao Paulo - USP - Sao Carlos /Universidade de Bielefeld, UB, AlemanhaMestre em Engenharia Eletrica - Universidade de Sao Paulo - USP - Sao CarlosEngenheiro de Teleinformatica - Universidade Federal do CearaBolsista CNPQ Nıvel 2http://lattes.cnpq.br/8902002461422112

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)