curso datamining

Post on 13-Apr-2017

303 Views

Category:

Education

4 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Introducao ao Reconhecimento de Padroes(Aprendizagem de Maquina / Data Mining)

Exemplos em Python

Prof. Ronaldo F. Ramos, Dr

29 de maio de 2015

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Roteiro

1 Seres Humanos e Padroes

2 Conceito Intuitivo

3 Formalizando

4 Na Pratica

5 Distancias

6 Classificadores Elementares

7 Avaliacao de Classificadores

8 Classificadores Diversos

9 Formacao de Agrupamentos

10 Selecao de Atributos

11 Limpeza de Dados

12 Contatos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Seres Humanos e Padroes

Os sentidos humanos enviam informacoes ao cerebro quereconhece alguns aspectos da realidade.

Sons

Imagens

Sensacao Tatil

Odores

Permitem tambem a identificacao de padroes logico-matematicos(o que exige um pouco mais do cerebro ;-) ).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Conceito de Reconhecimento de Padroes

Reconhecer um padrao equivale a classificar um objeto fısico oulogico como pertencente ou nao a uma predeterminada categoria.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Conceito Intuitivo

Dadas as categorias abaixo:

(a) Laranjas (b) Macas

A qual delas pertencem os objetos abaixo?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Conceito Intuitivo - Novo Grupo

(c) Laranjas (d) Macas (e) Tangerinas

A qual delas pertence o objeto abaixo?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Similaridade

Seu cerebro fez uma analise de

similaridade.

Pode-se fazer esta mesma analise no

computador?O que precisaremos para tal?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Uma definicao quase formal de RP

Um problema de RP e composto de ...

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Um Conjunto de K Classes

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Um Conjunto de objetos Ni por Classes Ki

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Um Conjunto de atributos nj por objeto Ni

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Mecanismo de Memoria e Aprendizagem

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Regra de Decisao para Calcular Novos Objetos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Criterios de Avaliacao do Classificador

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? AtivoProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Sobre os Atributos

Os atributos sao igualmente importantes?

E facil definir os atributos de um objeto?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Sobre os Atributos

Nem sempre.

Nem sempre.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Transformacao de Atributos

Atributos devem ser expressos na forma de numeros.Desta forma o conjunto de atributos da tangerina [Formato, FrutaCıtrica, Cor, Rugosidade da Casca, Cheiro] devem ser expressoscomo um vetor de atributos tais como:X = [0, 1, 2, 1, 1] 1

1A forma de numeralizar pode fazer muita diferenca no uso do modeloProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Adotando as seguintes convencoes:

Atributo Valores Textuais Numericos

Formato Esferico,Oval,Alongado 0,1,2

Fruta Cıtrica Nao,Sim 0,1

Cor Amarelo,Vermelho,Alaranjado,Verde 0,1,2,3

Rugosidade lisa,rugosa 0,1

Cheiro Nao,Sim 0,1

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Terıamos as seguintes representacoes para as frutas

Objeto Laranja (X) [0, 1, 2, 1, 0]

Objeto Maca (Y) [0, 0, 1, 0, 0]

Objeto Tangerina (Z)[0, 1, 2, 1, 1]

O Objeto tangerina (Z) se assemelha mais a

laranja(X) ou a Maca(Y)?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Conceito de Distancia

Uma forma de medir a similaridade entre dois padroes ecalcular a distancia entre eles.

Distancia city-block, quarteirao ou manhattan.Dq(X,Y) = |X1 − Y1|+ |X2 − Y2|+ ... + |Xn − Yn|Distancia Euclidiana.De(X,Y) =

√(X1 − Y1)2 + (X2 − Y2)2 + ... + (Xn − Yn)2

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comparacao entre Euclidiana e Quarteirao

ZZZZZZ

ZZZZZZ

C B

A

53

4

Dq(A,B) = 3 + 4 = 7De(A,B) =

√32 + 42 = 5

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Agora e so fazer as contas

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Classificadores Elementares

Agora voce sabe que uma tangerina e mais parecida com umalaranja do que com uma maca..;-).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Classificadores Elementares

Agora vamos estudar as flores....

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Morfologia das Flores

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Iris (Flor-de-lis)

Valei-me Deus e o fim do nosso amor .....

Iris Setosa Iris Virgınica Iris Versicolor

Estudo feito por Sir Ronald Fischer em 1936(Analise Discriminante).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris I

Na WIKIPEDIA e em outros lugares encontraremos a base dedados de Fischer.SL=Comprimento da Sepala SW=Largura da SepalaPL=Comprimento da Petala PW = Largura da Petala

SL SW PL PW Species5.1 3.5 1.4 0.2 setosa4.9 3.0 1.4 0.2 setosa4.7 3.2 1.3 0.2 setosa4.6 3.1 1.5 0.2 setosa5.0 3.6 1.4 0.2 setosa5.4 3.9 1.7 0.4 setosa4.6 3.4 1.4 0.3 setosa5.0 3.4 1.5 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris II

4.4 2.9 1.4 0.2 setosa4.9 3.1 1.5 0.1 setosa5.4 3.7 1.5 0.2 setosa4.8 3.4 1.6 0.2 setosa4.8 3.0 1.4 0.1 setosa4.3 3.0 1.1 0.1 setosa5.8 4.0 1.2 0.2 setosa5.7 4.4 1.5 0.4 setosa5.4 3.9 1.3 0.4 setosa5.1 3.5 1.4 0.3 setosa5.7 3.8 1.7 0.3 setosa5.1 3.8 1.5 0.3 setosa5.4 3.4 1.7 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris III

5.1 3.7 1.5 0.4 setosa4.6 3.6 1.0 0.2 setosa5.1 3.3 1.7 0.5 setosa4.8 3.4 1.9 0.2 setosa5.0 3.0 1.6 0.2 setosa5.0 3.4 1.6 0.4 setosa5.2 3.5 1.5 0.2 setosa5.2 3.4 1.4 0.2 setosa4.7 3.2 1.6 0.2 setosa4.8 3.1 1.6 0.2 setosa5.4 3.4 1.5 0.4 setosa5.2 4.1 1.5 0.1 setosa5.5 4.2 1.4 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris IV

4.9 3.1 1.5 0.2 setosa5.0 3.2 1.2 0.2 setosa5.5 3.5 1.3 0.2 setosa4.9 3.6 1.4 0.1 setosa4.4 3.0 1.3 0.2 setosa5.1 3.4 1.5 0.2 setosa5.0 3.5 1.3 0.3 setosa4.5 2.3 1.3 0.3 setosa4.4 3.2 1.3 0.2 setosa5.0 3.5 1.6 0.6 setosa5.1 3.8 1.9 0.4 setosa4.8 3.0 1.4 0.3 setosa5.1 3.8 1.6 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris V

4.6 3.2 1.4 0.2 setosa5.3 3.7 1.5 0.2 setosa5.0 3.3 1.4 0.2 setosa7.0 3.2 4.7 1.4 versicolor6.4 3.2 4.5 1.5 versicolor6.9 3.1 4.9 1.5 versicolor5.5 2.3 4.0 1.3 versicolor6.5 2.8 4.6 1.5 versicolor5.7 2.8 4.5 1.3 versicolor6.3 3.3 4.7 1.6 versicolor4.9 2.4 3.3 1.0 versicolor6.6 2.9 4.6 1.3 versicolor5.2 2.7 3.9 1.4 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris VI

5.0 2.0 3.5 1.0 versicolor5.9 3.0 4.2 1.5 versicolor6.0 2.2 4.0 1.0 versicolor6.1 2.9 4.7 1.4 versicolor5.6 2.9 3.6 1.3 versicolor6.7 3.1 4.4 1.4 versicolor5.6 3.0 4.5 1.5 versicolor5.8 2.7 4.1 1.0 versicolor6.2 2.2 4.5 1.5 versicolor5.6 2.5 3.9 1.1 versicolor5.9 3.2 4.8 1.8 versicolor6.1 2.8 4.0 1.3 versicolor6.3 2.5 4.9 1.5 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris VII

6.1 2.8 4.7 1.2 versicolor6.4 2.9 4.3 1.3 versicolor6.6 3.0 4.4 1.4 versicolor6.8 2.8 4.8 1.4 versicolor6.7 3.0 5.0 1.7 versicolor6.0 2.9 4.5 1.5 versicolor5.7 2.6 3.5 1.0 versicolor5.5 2.4 3.8 1.1 versicolor5.5 2.4 3.7 1.0 versicolor5.8 2.7 3.9 1.2 versicolor6.0 2.7 5.1 1.6 versicolor5.4 3.0 4.5 1.5 versicolor6.0 3.4 4.5 1.6 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris VIII

6.7 3.1 4.7 1.5 versicolor6.3 2.3 4.4 1.3 versicolor5.6 3.0 4.1 1.3 versicolor5.5 2.5 4.0 1.3 versicolor5.5 2.6 4.4 1.2 versicolor6.1 3.0 4.6 1.4 versicolor5.8 2.6 4.0 1.2 versicolor5.0 2.3 3.3 1.0 versicolor5.6 2.7 4.2 1.3 versicolor5.7 3.0 4.2 1.2 versicolor5.7 2.9 4.2 1.3 versicolor6.2 2.9 4.3 1.3 versicolor5.1 2.5 3.0 1.1 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris IX

5.7 2.8 4.1 1.3 versicolor6.3 3.3 6.0 2.5 virginica5.8 2.7 5.1 1.9 virginica7.1 3.0 5.9 2.1 virginica6.3 2.9 5.6 1.8 virginica6.5 3.0 5.8 2.2 virginica7.6 3.0 6.6 2.1 virginica4.9 2.5 4.5 1.7 virginica7.3 2.9 6.3 1.8 virginica6.7 2.5 5.8 1.8 virginica7.2 3.6 6.1 2.5 virginica6.5 3.2 5.1 2.0 virginica6.4 2.7 5.3 1.9 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris X

6.8 3.0 5.5 2.1 virginica5.7 2.5 5.0 2.0 virginica5.8 2.8 5.1 2.4 virginica6.4 3.2 5.3 2.3 virginica6.5 3.0 5.5 1.8 virginica7.7 3.8 6.7 2.2 virginica7.7 2.6 6.9 2.3 virginica6.0 2.2 5.0 1.5 virginica6.9 3.2 5.7 2.3 virginica5.6 2.8 4.9 2.0 virginica7.7 2.8 6.7 2.0 virginica6.3 2.7 4.9 1.8 virginica6.7 3.3 5.7 2.1 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris XI

7.2 3.2 6.0 1.8 virginica6.2 2.8 4.8 1.8 virginica6.1 3.0 4.9 1.8 virginica6.4 2.8 5.6 2.1 virginica7.2 3.0 5.8 1.6 virginica7.4 2.8 6.1 1.9 virginica7.9 3.8 6.4 2.0 virginica6.4 2.8 5.6 2.2 virginica6.3 2.8 5.1 1.5 virginica6.1 2.6 5.6 1.4 virginica7.7 3.0 6.1 2.3 virginica6.3 3.4 5.6 2.4 virginica6.4 3.1 5.5 1.8 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Base de Dados de Iris XII

6.0 3.0 4.8 1.8 virginica6.9 3.1 5.4 2.1 virginica6.7 3.1 5.6 2.4 virginica6.9 3.1 5.1 2.3 virginica5.8 2.7 5.1 1.9 virginica6.8 3.2 5.9 2.3 virginica6.7 3.3 5.7 2.5 virginica6.7 3.0 5.2 2.3 virginica6.3 2.5 5.0 1.9 virginica6.5 3.0 5.2 2.0 virginica6.2 3.4 5.4 2.3 virginica5.9 3.0 5.1 1.8 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Algoritmo do Vizinho Mais Proximo - Neareast Neighbor

1 Seja Xnew um vetor cuja classe e desconhecida.

2 Procurar na tabela o vetor armazenado mais proximo deXnew.

3 Chamar de Xnear o vetor mais proximo de Xnew

4 Atribuir a Xnew a mesma classe de Xnear

5 Se a classificacao for correta incluir Xnew na tabela.

Mao a obra, ou melhor ao codigo ...

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Qual o problema com o Vizinho Mais Proximo?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Uma Solucao

KNN - K Vizinhos Mais Proximos(K=Numero Impar Inteiro)O Padrao e classificado de acordo com a maioria dos vizinhos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Algoritmo dos K Vizinhos Mais Proximos - K NeareastNeighbors

1 Armazenar os exemplos em uma tabela.

2 seja Xnew um vetor de classe desconhecida.

3 Encontrar na tabela os K vetores mais proximos de Xnew

4 Seja Ck a classe a que pertence a maioria dos vetores.

5 Atribuir Classe(Xnew) = Ck

6 Se a classificacao for correta incluir Xnew na tabela.

Bom, vamos ao codigo ...

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Vantagens e Desvantagens do KNN

Vantagens

Simplicidade de Implementacao.

Ideal para tabelas pequenas ou medias.

Nao requer treinamento.

Desvantagens

Alto custo computacional para tabelas grandes.

A constante K e obtida por tentativa e erro.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Distancia Mınima ao Centroide

Cada classe passa a ter um unico vetor que a representachamado de centroide.

Apos o ”treinamento”nao sera necessario armazenar osexemplos. Apenas os centroides permanecem na memoria.

O centroide e o vetor medio, ou seja, a media dos exemplosda classe.

O centroide e o representante de sua classe.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Distancia Mınima ao Centroide

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Atualizando o Centroide

Como foi visto o centroide representa a classe, portanto,descoberto um novo indivıduo da classe, o centroide deve/pode seratualizado.Mj(nj + 1) = (1− a)Mj(nj) + a(Xnew)Onde:a = 1/(nj + 1) e o fator de aprendizagemnj e o total de exemplos utilizados antes da chegada do XnewMj(nj) e o centroide antes da chegada do XnewMj(nj + 1) e o novo centroide com Xnew incorporado.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Estrategias de Avaliacao(Montando um Experimento de Avaliacao)

Cuidado. O vilao se chama superadaptacao ou sobre-ajuste.(OVERFITTING)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Estrategias de Avaliacao(Treinamento e Teste)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Estrategias de Avaliacao(Validacao Cruzada)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Matriz de Confusao

Corretamente Classificadas = 5 + 3 + 11 = 19Erroneamente Classificadas = 2 + 3 + 0 + 0 + 2 + 1 = 8Total de Instancias = 27Taxa de Acerto = 19/27 (70,4 % )Taxa de Erro = 8/27 (29,6 % )

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Matriz de Confusao

Entao basta termos uma boa taxa de acerto e nosso classificadoresta pronto pra ser usado?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Matriz de Confusao

Nao necessariamente.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Matriz de Confusao

Para cada uma das classes existem os elementos (instancias)que pertecem a classe. Sao os POSITIVOS para a classe.

Para cada classe existem as instancias que nao pertecem aclasse. Sao os NEGATIVOS para a classe.

Os elementos classificados como POSITIVOS, quandocorretos, sao chamados de VERDADEIROS POSITIVOS.

Os elementos classificados como POSITIVOS, quandoincorretamente classificados, sao chamados de FALSOSPOSITIVOS

Os elementos classificados como NEGATIVOS, quandocorretos, sao chamados de VERDADEIROS NEGATIVOS.

Os elementos classificados como NEGATIVOS, quandoincorretamente classificados, sao chamados de FALSOSNEGATIVOS.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Tabela de Confusao para a Classe dos Gatos

TP = True Positives. Verdadeiros Positivos. Classificados corretamente como gatos.FP = False Positives. Falsos Positivos. Classificados como gatos que sao outra coisaFN = False Negatives. Falsos Negativos. Classificados como outra coisa, mas sao realmente gatos.TN = True Negatives. Classificados como outra coisa e realmente nao sao gatos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Dentre os elementos classificados como positivos, qual opercentual, ou melhor, a TAXA de VERDADEIROS POSITIVOS?(TAXA de VERDADEIROS POSITIVOS OU ”TRUE POSITIVERATE”) (TPR).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Quem sao os positivos? R. Sao os Verdadeiros Positivos (TP) maisos FALSOS NEGATIVOS (FN).Portanto: TPR = TP / (TP + FN)OBSs:

O TPR se aproxima de um quando o FN se aproxima de zero.

Queremos um TPR alto quando nao queremos deixar umPOSITIVO passar por NEGATIVO. Imagine que se trata de umexame para deteccao de uma doenca altamente contagiosa. Melhortermos muitos falsos positivos do que falsos negativos. (Melhor terum inocente preso que um bandido solto, hehehe)

TPR tambem e chamada de RECALL.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Dentre os elementos classificados como negativos, qual opercentual, ou melhor, a TAXA dos VERDADEIROS NEGATIVOS?(TAXA de VERDADEIROS NEGATIVOS OU ”TRUE NEGATIVERATE”)(TNR).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Quem sao os negativos? R. Sao os VERDADEIROS NEGATIVOS(TN) mais os FALSOS POSITIVOS (FP).Portanto: TNR = TN / (TN + FP)

O TNR se aproxima de um quando o FP se aproxima de zero.

Queremos um TNR alto quando nao queremos deixar umNEGATIVO passar por POSITIVO. Imagine que voce tem umaempresa que possa ser processada por danos morais caso voceafirme que um de seus clientes esta fraudando quando na realidadeele nao esta. (FP)

TNR tambem e chamada de Especificidade (Specificity).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Avaliando Classificadores - Questoes

Voce ja deve ter percebido que a Taxa de Acerto sozinha nao querdizer muita coisa e nem sempre e o fator mais importante naescolha de um classificador para o seu problema. A seguir oresumo.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Metricas

True Positive Rate (Recall) (TPR). TPR = TP / (TP + FN)

True Negative Rate (Specificity) SPC = TN / (FP + TN)

Positive Predictive Value (Precision) PPV = TP / (TP + FP)

Negative Predictive Value (NPV) NPV = TN / (TN + FN)

False Positive Rate (fall-out) FPR = FP /( FP + TN)

False Discovery Rate (FDR) FDR = FP /(FP + TP) = 1 -PPV

False Negative Rate (Miss Rate) FNR = FN / ( FN + TP)

etc etc etc

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Metricas Curva ROC - Receiver Operating Characteritics

Area Sob a curva. Acima de 0.9 (excelente). Entre 0.8 e 0.9(bom). Entre 0.7 e 0.8 (medio). Entre 0.6 e 0.7 (fraco).Abaixo de0.6 (ineficaz).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ZERO R - O Classificador do Preconceito

Seja o DataSet Jogar Tenis (Disponıvel na Literatura)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ZERO R - O Classificador do Preconceito

O ZERO R classifica as instancias pela maioria. No caso do destedataset temos:Instancias classificadas como P (Positivo = SIM) : 9Instancias classificadas como N (Negativo = Nao) : 5Classe Maioria: SIM.

Matriz de Confusao:Real \Predito P (SIM) N (Nao)

P (SIM) 9 0

N (Nao) 5 0

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ZERO R - O Classificador do Preconceito

Metricas

Classe TPR FPR ROC

P (SIM) 1 1 0,5

N (Nao) 0 0 0,5

Taxa de Acerto (Acuracidade) : 9/13 = 0,69

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ZERO R - O Classificador do Preconceito

Na pratica, o classificador Zero R pode ser usado para criar uma”baseline”para avaliar o seu classificador.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ONE R - Melhorando um Pouco

Observemos o atributo tempo:Valor \Classes P (SIM) N (Nao)

Ensolarado 2 3

Nublado 4 0

Chuva 4 1

Que regra podemos extrair daı? (Descoberta de regras)R. SE Esta nublado ou com Chuva ENTAO P (SIM) SENAO N(Nao)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ONE R - Melhorando um Pouco - Aplicando ao Dataset

Instancia Real Classificado (Predito)1 N N2 N N3 P P4 P P5 P P6 N P7 P P8 N N9 P N

10 P P11 N P12 P P13 P P14 N P

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ONE R - Melhorando um Pouco - Aplicando ao Dataset

Instancias classificadas corretamente : 10Instancias classificadas erroneamente : 4Daı..

Matriz de ConfusaoReal \Predito P(SIM) N(NAO)

P(SIM) 7 2

N(NAO) 2 3

MedidasClasse TPR FPR ROC

P (SIM) 0,778 0,4 0,689

N (Nao) 0,6 0,222 0,689

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

ONE R - Melhorando um Pouco - Aplicando ao Dataset

Moral da Historia: Encontre um atributo mais util para fazer seusjulgamentos. ;-)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

O que e ?

Uma arvore de decisao e uma ferramenta de apoio a decisao que,graficamente, apresenta a forma de uma arvore (de cabeca parabaixo). A raiz e a parte de cima e as folhas ficam na parte debaixo. Veja o desenho abaixo.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Exemplo

A Raiz e os nos sao as variaveis a serem avaliadas, os ramos(arcos) que ligam os nos sao os valores admissıveis ou caminhos aserem seguidos no processo de decisao e as folhas sao as saıdas.Veja o exemplo de uma arvore de decisao para o caso de decidir sevc vai jogar ou nao tenis.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Tabela

A partir da arvore acima podemos construir a seguinte tabela.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Questao

Entao a proxima pergunta e: Porque usar uma arvore e naosimplesmente consultar a tabela?

Resposta

Economia e, consequentemente, viabilidade dos calculos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Questao

Entao a proxima pergunta e: Porque usar uma arvore e naosimplesmente consultar a tabela?

Resposta

Economia e, consequentemente, viabilidade dos calculos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Seja o dataset (Ida ao restaurante):

Por onde comecar?Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Atributo Clientela

lotado (0 casos positivos, 4 casos negativos); medio (4 casospositivos, 0 casos negativos) e vazio (4 casos negativos, 0 casospositivos).

Atributo Tipo

a la carte (2 casos negativos, 1 caso positivo); self service (2 casosnegativos, 1 caso positivo) fast food (2 casos negativos, 1 casopositivo) e sushi bar (2 casos negativos e 1 caso positivo).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Atributo Clientela

lotado (0 casos positivos, 4 casos negativos); medio (4 casospositivos, 0 casos negativos) e vazio (4 casos negativos, 0 casospositivos).

Atributo Tipo

a la carte (2 casos negativos, 1 caso positivo); self service (2 casosnegativos, 1 caso positivo) fast food (2 casos negativos, 1 casopositivo) e sushi bar (2 casos negativos e 1 caso positivo).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Proposta 1

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Proposta 2

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Alguns classificadores Interessantes - Arvores de Decisao

Manual Selecionar sempre o atributo que levar mais rapido para asfolhas (Decisao). Atributos que dividem as instanciasequilibradamente nao sao bons.

ID3 Desenvolvido por Ross Quillan, usa a teoria do ganho dainformacao para selecao dos atributos. Ver no BLOG (https://lambrain.wordpress.com/page/4/) e(https://lambrain.wordpress.com/2014/10/13/tutorial-arvores-de-decisao-continuacao-ia/)

C4.5 Melhoria para trabalhar com valores continuos e poda a arvoreapos criacao

C5.0 Mais rapido. Bom para grandes volumes de dados. Os autoresdizem que e o melhor classificador que existe.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Redes Neurais Artificiais

1011 Neuronios — + 20 Tipos — 1014 Sinapses — 1 a 10 ms deciclo.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Redes Neurais Artificiais

Neuronio artificial.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Redes Neurais Artificiais

Funcoes de Ativacao. Limiar e Sigmoide.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Separabilidade

Problema da separacao.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Topologias de Redes Neurais

Redes Feed Forward.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Topologias de Redes Neurais

Redes com recorrencia, inibicao, etc.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Redes Bayesianas

P(X1, . . . ,Xn) =∏

i P(Xi |Pais(Xi)) Exemplo:P(j ∧m ∧ a ∧ ¬b ∧ ¬e) = P(j |a)P(m|a)P(a|¬b,¬e)P(¬b)P(¬e)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Formacao de Agrupamentos - Clustering

FILO - CLASSE - ORDEM - FAMILIA - GENERO - ESPECIEProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Formacao de Agrupamentos - Clustering

Doencas do Ovario.

Figura:Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Algoritmo aglomerativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Cluster Hierarquico

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Seja um dataset com seu conjunto de indivıduos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 1 - Selecionar K elementos como as medias iniciais (KDefinido antes)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 2: Classificar os elementos usando as medias (Formacao dosprimeiros K Grupos)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 3: Recalcular as medias de cada grupo.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 4: Reclassificar todos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Passo 5: Recalcular medias

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

K-Means

Repetir passos 4 e 5 ate convergencia.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Correlacao Entre Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Selecao de Atributos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Limpeza de Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Limpeza de Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Limpeza de Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Extracao de Regras a Partir dos Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Extracao de Regras a Partir dos Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Extracao de Regras a Partir dos Dados

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Construcao Automatica de Ontologias

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Construcao Automatica de Ontologias

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Proposta Gissa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Porque combinar?

Duas cabecas pensam melhor do que uma?

Todos tem direito a uma segunda opiniao ;-)

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Vantagens

Melhor do que o melhor dos classificadores selecionados

Aumenta a estabilidade do classificador 2

bias-variance decomposition. Bias = “erro persistente” de umalgoritmo de aprendizagem. Variance = “erro particular” deum modelo treinado.

. Sistemas combinados reduzem a variancia

. Quanto mais sistemas combinados mais se reduz a variancia

2O quanto um algoritmo e perturbado por pequenas mudancas nas entradasProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Desvantagens

Nenhuma garantia que sera sempre melhor do que o usosimples de um classificador

Ainda e uma area de pesquisas

Difıceis de analisar.

Complexo e custoso para construir

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Comites de Classificadores

Elementos a definir.

Estrutura

Componentes

Metodo de combinacao

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Continua

Temos assunto para varios outros cursos ....

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Continua

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos

Contatos

Prof. Ronaldo F. RamosDoutor em Systemes Informatiques (Informatica)- Universidade de Evry - Franca.Pos Doutorado - UFC - DETIMestre em Engenharia de Producao/Inteligencia Aplicada - Universidade Federal deSanta CatarinaEngenheiro Mecanico - Universidade Federal do Ceara30 Anos de experiencia em Projetos de Engenharia e Sistemas Informatizados.ronaldo.ramos@gmail.com

Prof. Guilherme de Alencar BarretoDoutor em Engenharia Eletrica - Universidade de Sao Paulo - USP - Sao Carlos /Universidade de Bielefeld, UB, AlemanhaMestre em Engenharia Eletrica - Universidade de Sao Paulo - USP - Sao CarlosEngenheiro de Teleinformatica - Universidade Federal do CearaBolsista CNPQ Nıvel 2http://lattes.cnpq.br/8902002461422112

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

top related