curso datamining
Post on 13-Apr-2017
303 Views
Preview:
TRANSCRIPT
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Introducao ao Reconhecimento de Padroes(Aprendizagem de Maquina / Data Mining)
Exemplos em Python
Prof. Ronaldo F. Ramos, Dr
29 de maio de 2015
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Roteiro
1 Seres Humanos e Padroes
2 Conceito Intuitivo
3 Formalizando
4 Na Pratica
5 Distancias
6 Classificadores Elementares
7 Avaliacao de Classificadores
8 Classificadores Diversos
9 Formacao de Agrupamentos
10 Selecao de Atributos
11 Limpeza de Dados
12 Contatos
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Seres Humanos e Padroes
Os sentidos humanos enviam informacoes ao cerebro quereconhece alguns aspectos da realidade.
Sons
Imagens
Sensacao Tatil
Odores
Permitem tambem a identificacao de padroes logico-matematicos(o que exige um pouco mais do cerebro ;-) ).
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Conceito de Reconhecimento de Padroes
Reconhecer um padrao equivale a classificar um objeto fısico oulogico como pertencente ou nao a uma predeterminada categoria.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Conceito Intuitivo
Dadas as categorias abaixo:
(a) Laranjas (b) Macas
A qual delas pertencem os objetos abaixo?
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Conceito Intuitivo - Novo Grupo
(c) Laranjas (d) Macas (e) Tangerinas
A qual delas pertence o objeto abaixo?
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Similaridade
Seu cerebro fez uma analise de
similaridade.
Pode-se fazer esta mesma analise no
computador?O que precisaremos para tal?
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Uma definicao quase formal de RP
Um problema de RP e composto de ...
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Um Conjunto de K Classes
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Um Conjunto de objetos Ni por Classes Ki
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Um Conjunto de atributos nj por objeto Ni
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Mecanismo de Memoria e Aprendizagem
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Regra de Decisao para Calcular Novos Objetos
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Criterios de Avaliacao do Classificador
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Fruta Cıtrica
Sim/Nao Sim
Cor
Laranja????Alaranjado
Rugosidade da Casca
Lisa ou Rugosa?Rugosa
Cheiro
Ativo/Fraco? Ativo
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Fruta Cıtrica
Sim/Nao Sim
Cor
Laranja????Alaranjado
Rugosidade da Casca
Lisa ou Rugosa?Rugosa
Cheiro
Ativo/Fraco? Ativo
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Fruta Cıtrica
Sim/Nao Sim
Cor
Laranja????Alaranjado
Rugosidade da Casca
Lisa ou Rugosa?Rugosa
Cheiro
Ativo/Fraco? Ativo
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Fruta Cıtrica
Sim/Nao Sim
Cor
Laranja????Alaranjado
Rugosidade da Casca
Lisa ou Rugosa?Rugosa
Cheiro
Ativo/Fraco? Ativo
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Fruta Cıtrica
Sim/Nao Sim
Cor
Laranja????Alaranjado
Rugosidade da Casca
Lisa ou Rugosa?Rugosa
Cheiro
Ativo/Fraco? AtivoProf. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Sobre os Atributos
Os atributos sao igualmente importantes?
E facil definir os atributos de um objeto?
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Sobre os Atributos
Nem sempre.
Nem sempre.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Transformacao de Atributos
Atributos devem ser expressos na forma de numeros.Desta forma o conjunto de atributos da tangerina [Formato, FrutaCıtrica, Cor, Rugosidade da Casca, Cheiro] devem ser expressoscomo um vetor de atributos tais como:X = [0, 1, 2, 1, 1] 1
1A forma de numeralizar pode fazer muita diferenca no uso do modeloProf. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Adotando as seguintes convencoes:
Atributo Valores Textuais Numericos
Formato Esferico,Oval,Alongado 0,1,2
Fruta Cıtrica Nao,Sim 0,1
Cor Amarelo,Vermelho,Alaranjado,Verde 0,1,2,3
Rugosidade lisa,rugosa 0,1
Cheiro Nao,Sim 0,1
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Terıamos as seguintes representacoes para as frutas
Objeto Laranja (X) [0, 1, 2, 1, 0]
Objeto Maca (Y) [0, 0, 1, 0, 0]
Objeto Tangerina (Z)[0, 1, 2, 1, 1]
O Objeto tangerina (Z) se assemelha mais a
laranja(X) ou a Maca(Y)?
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Conceito de Distancia
Uma forma de medir a similaridade entre dois padroes ecalcular a distancia entre eles.
Distancia city-block, quarteirao ou manhattan.Dq(X,Y) = |X1 − Y1|+ |X2 − Y2|+ ... + |Xn − Yn|Distancia Euclidiana.De(X,Y) =
√(X1 − Y1)2 + (X2 − Y2)2 + ... + (Xn − Yn)2
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Comparacao entre Euclidiana e Quarteirao
ZZZZZZ
ZZZZZZ
C B
A
53
4
Dq(A,B) = 3 + 4 = 7De(A,B) =
√32 + 42 = 5
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Agora e so fazer as contas
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Classificadores Elementares
Agora voce sabe que uma tangerina e mais parecida com umalaranja do que com uma maca..;-).
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Classificadores Elementares
Agora vamos estudar as flores....
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Morfologia das Flores
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Iris (Flor-de-lis)
Valei-me Deus e o fim do nosso amor .....
Iris Setosa Iris Virgınica Iris Versicolor
Estudo feito por Sir Ronald Fischer em 1936(Analise Discriminante).
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris I
Na WIKIPEDIA e em outros lugares encontraremos a base dedados de Fischer.SL=Comprimento da Sepala SW=Largura da SepalaPL=Comprimento da Petala PW = Largura da Petala
SL SW PL PW Species5.1 3.5 1.4 0.2 setosa4.9 3.0 1.4 0.2 setosa4.7 3.2 1.3 0.2 setosa4.6 3.1 1.5 0.2 setosa5.0 3.6 1.4 0.2 setosa5.4 3.9 1.7 0.4 setosa4.6 3.4 1.4 0.3 setosa5.0 3.4 1.5 0.2 setosa
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris II
4.4 2.9 1.4 0.2 setosa4.9 3.1 1.5 0.1 setosa5.4 3.7 1.5 0.2 setosa4.8 3.4 1.6 0.2 setosa4.8 3.0 1.4 0.1 setosa4.3 3.0 1.1 0.1 setosa5.8 4.0 1.2 0.2 setosa5.7 4.4 1.5 0.4 setosa5.4 3.9 1.3 0.4 setosa5.1 3.5 1.4 0.3 setosa5.7 3.8 1.7 0.3 setosa5.1 3.8 1.5 0.3 setosa5.4 3.4 1.7 0.2 setosa
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris III
5.1 3.7 1.5 0.4 setosa4.6 3.6 1.0 0.2 setosa5.1 3.3 1.7 0.5 setosa4.8 3.4 1.9 0.2 setosa5.0 3.0 1.6 0.2 setosa5.0 3.4 1.6 0.4 setosa5.2 3.5 1.5 0.2 setosa5.2 3.4 1.4 0.2 setosa4.7 3.2 1.6 0.2 setosa4.8 3.1 1.6 0.2 setosa5.4 3.4 1.5 0.4 setosa5.2 4.1 1.5 0.1 setosa5.5 4.2 1.4 0.2 setosa
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris IV
4.9 3.1 1.5 0.2 setosa5.0 3.2 1.2 0.2 setosa5.5 3.5 1.3 0.2 setosa4.9 3.6 1.4 0.1 setosa4.4 3.0 1.3 0.2 setosa5.1 3.4 1.5 0.2 setosa5.0 3.5 1.3 0.3 setosa4.5 2.3 1.3 0.3 setosa4.4 3.2 1.3 0.2 setosa5.0 3.5 1.6 0.6 setosa5.1 3.8 1.9 0.4 setosa4.8 3.0 1.4 0.3 setosa5.1 3.8 1.6 0.2 setosa
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris V
4.6 3.2 1.4 0.2 setosa5.3 3.7 1.5 0.2 setosa5.0 3.3 1.4 0.2 setosa7.0 3.2 4.7 1.4 versicolor6.4 3.2 4.5 1.5 versicolor6.9 3.1 4.9 1.5 versicolor5.5 2.3 4.0 1.3 versicolor6.5 2.8 4.6 1.5 versicolor5.7 2.8 4.5 1.3 versicolor6.3 3.3 4.7 1.6 versicolor4.9 2.4 3.3 1.0 versicolor6.6 2.9 4.6 1.3 versicolor5.2 2.7 3.9 1.4 versicolor
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris VI
5.0 2.0 3.5 1.0 versicolor5.9 3.0 4.2 1.5 versicolor6.0 2.2 4.0 1.0 versicolor6.1 2.9 4.7 1.4 versicolor5.6 2.9 3.6 1.3 versicolor6.7 3.1 4.4 1.4 versicolor5.6 3.0 4.5 1.5 versicolor5.8 2.7 4.1 1.0 versicolor6.2 2.2 4.5 1.5 versicolor5.6 2.5 3.9 1.1 versicolor5.9 3.2 4.8 1.8 versicolor6.1 2.8 4.0 1.3 versicolor6.3 2.5 4.9 1.5 versicolor
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris VII
6.1 2.8 4.7 1.2 versicolor6.4 2.9 4.3 1.3 versicolor6.6 3.0 4.4 1.4 versicolor6.8 2.8 4.8 1.4 versicolor6.7 3.0 5.0 1.7 versicolor6.0 2.9 4.5 1.5 versicolor5.7 2.6 3.5 1.0 versicolor5.5 2.4 3.8 1.1 versicolor5.5 2.4 3.7 1.0 versicolor5.8 2.7 3.9 1.2 versicolor6.0 2.7 5.1 1.6 versicolor5.4 3.0 4.5 1.5 versicolor6.0 3.4 4.5 1.6 versicolor
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris VIII
6.7 3.1 4.7 1.5 versicolor6.3 2.3 4.4 1.3 versicolor5.6 3.0 4.1 1.3 versicolor5.5 2.5 4.0 1.3 versicolor5.5 2.6 4.4 1.2 versicolor6.1 3.0 4.6 1.4 versicolor5.8 2.6 4.0 1.2 versicolor5.0 2.3 3.3 1.0 versicolor5.6 2.7 4.2 1.3 versicolor5.7 3.0 4.2 1.2 versicolor5.7 2.9 4.2 1.3 versicolor6.2 2.9 4.3 1.3 versicolor5.1 2.5 3.0 1.1 versicolor
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris IX
5.7 2.8 4.1 1.3 versicolor6.3 3.3 6.0 2.5 virginica5.8 2.7 5.1 1.9 virginica7.1 3.0 5.9 2.1 virginica6.3 2.9 5.6 1.8 virginica6.5 3.0 5.8 2.2 virginica7.6 3.0 6.6 2.1 virginica4.9 2.5 4.5 1.7 virginica7.3 2.9 6.3 1.8 virginica6.7 2.5 5.8 1.8 virginica7.2 3.6 6.1 2.5 virginica6.5 3.2 5.1 2.0 virginica6.4 2.7 5.3 1.9 virginica
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris X
6.8 3.0 5.5 2.1 virginica5.7 2.5 5.0 2.0 virginica5.8 2.8 5.1 2.4 virginica6.4 3.2 5.3 2.3 virginica6.5 3.0 5.5 1.8 virginica7.7 3.8 6.7 2.2 virginica7.7 2.6 6.9 2.3 virginica6.0 2.2 5.0 1.5 virginica6.9 3.2 5.7 2.3 virginica5.6 2.8 4.9 2.0 virginica7.7 2.8 6.7 2.0 virginica6.3 2.7 4.9 1.8 virginica6.7 3.3 5.7 2.1 virginica
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris XI
7.2 3.2 6.0 1.8 virginica6.2 2.8 4.8 1.8 virginica6.1 3.0 4.9 1.8 virginica6.4 2.8 5.6 2.1 virginica7.2 3.0 5.8 1.6 virginica7.4 2.8 6.1 1.9 virginica7.9 3.8 6.4 2.0 virginica6.4 2.8 5.6 2.2 virginica6.3 2.8 5.1 1.5 virginica6.1 2.6 5.6 1.4 virginica7.7 3.0 6.1 2.3 virginica6.3 3.4 5.6 2.4 virginica6.4 3.1 5.5 1.8 virginica
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Base de Dados de Iris XII
6.0 3.0 4.8 1.8 virginica6.9 3.1 5.4 2.1 virginica6.7 3.1 5.6 2.4 virginica6.9 3.1 5.1 2.3 virginica5.8 2.7 5.1 1.9 virginica6.8 3.2 5.9 2.3 virginica6.7 3.3 5.7 2.5 virginica6.7 3.0 5.2 2.3 virginica6.3 2.5 5.0 1.9 virginica6.5 3.0 5.2 2.0 virginica6.2 3.4 5.4 2.3 virginica5.9 3.0 5.1 1.8 virginica
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Algoritmo do Vizinho Mais Proximo - Neareast Neighbor
1 Seja Xnew um vetor cuja classe e desconhecida.
2 Procurar na tabela o vetor armazenado mais proximo deXnew.
3 Chamar de Xnear o vetor mais proximo de Xnew
4 Atribuir a Xnew a mesma classe de Xnear
5 Se a classificacao for correta incluir Xnew na tabela.
Mao a obra, ou melhor ao codigo ...
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Qual o problema com o Vizinho Mais Proximo?
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Uma Solucao
KNN - K Vizinhos Mais Proximos(K=Numero Impar Inteiro)O Padrao e classificado de acordo com a maioria dos vizinhos.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Algoritmo dos K Vizinhos Mais Proximos - K NeareastNeighbors
1 Armazenar os exemplos em uma tabela.
2 seja Xnew um vetor de classe desconhecida.
3 Encontrar na tabela os K vetores mais proximos de Xnew
4 Seja Ck a classe a que pertence a maioria dos vetores.
5 Atribuir Classe(Xnew) = Ck
6 Se a classificacao for correta incluir Xnew na tabela.
Bom, vamos ao codigo ...
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Vantagens e Desvantagens do KNN
Vantagens
Simplicidade de Implementacao.
Ideal para tabelas pequenas ou medias.
Nao requer treinamento.
Desvantagens
Alto custo computacional para tabelas grandes.
A constante K e obtida por tentativa e erro.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Distancia Mınima ao Centroide
Cada classe passa a ter um unico vetor que a representachamado de centroide.
Apos o ”treinamento”nao sera necessario armazenar osexemplos. Apenas os centroides permanecem na memoria.
O centroide e o vetor medio, ou seja, a media dos exemplosda classe.
O centroide e o representante de sua classe.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Distancia Mınima ao Centroide
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Atualizando o Centroide
Como foi visto o centroide representa a classe, portanto,descoberto um novo indivıduo da classe, o centroide deve/pode seratualizado.Mj(nj + 1) = (1− a)Mj(nj) + a(Xnew)Onde:a = 1/(nj + 1) e o fator de aprendizagemnj e o total de exemplos utilizados antes da chegada do XnewMj(nj) e o centroide antes da chegada do XnewMj(nj + 1) e o novo centroide com Xnew incorporado.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Estrategias de Avaliacao(Montando um Experimento de Avaliacao)
Cuidado. O vilao se chama superadaptacao ou sobre-ajuste.(OVERFITTING)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Estrategias de Avaliacao(Treinamento e Teste)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Estrategias de Avaliacao(Validacao Cruzada)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Avaliando Classificadores - Matriz de Confusao
Corretamente Classificadas = 5 + 3 + 11 = 19Erroneamente Classificadas = 2 + 3 + 0 + 0 + 2 + 1 = 8Total de Instancias = 27Taxa de Acerto = 19/27 (70,4 % )Taxa de Erro = 8/27 (29,6 % )
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Avaliando Classificadores - Matriz de Confusao
Entao basta termos uma boa taxa de acerto e nosso classificadoresta pronto pra ser usado?
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Avaliando Classificadores - Matriz de Confusao
Nao necessariamente.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Avaliando Classificadores - Matriz de Confusao
Para cada uma das classes existem os elementos (instancias)que pertecem a classe. Sao os POSITIVOS para a classe.
Para cada classe existem as instancias que nao pertecem aclasse. Sao os NEGATIVOS para a classe.
Os elementos classificados como POSITIVOS, quandocorretos, sao chamados de VERDADEIROS POSITIVOS.
Os elementos classificados como POSITIVOS, quandoincorretamente classificados, sao chamados de FALSOSPOSITIVOS
Os elementos classificados como NEGATIVOS, quandocorretos, sao chamados de VERDADEIROS NEGATIVOS.
Os elementos classificados como NEGATIVOS, quandoincorretamente classificados, sao chamados de FALSOSNEGATIVOS.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Tabela de Confusao para a Classe dos Gatos
TP = True Positives. Verdadeiros Positivos. Classificados corretamente como gatos.FP = False Positives. Falsos Positivos. Classificados como gatos que sao outra coisaFN = False Negatives. Falsos Negativos. Classificados como outra coisa, mas sao realmente gatos.TN = True Negatives. Classificados como outra coisa e realmente nao sao gatos.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Avaliando Classificadores - Questoes
Dentre os elementos classificados como positivos, qual opercentual, ou melhor, a TAXA de VERDADEIROS POSITIVOS?(TAXA de VERDADEIROS POSITIVOS OU ”TRUE POSITIVERATE”) (TPR).
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Avaliando Classificadores - Questoes
Quem sao os positivos? R. Sao os Verdadeiros Positivos (TP) maisos FALSOS NEGATIVOS (FN).Portanto: TPR = TP / (TP + FN)OBSs:
O TPR se aproxima de um quando o FN se aproxima de zero.
Queremos um TPR alto quando nao queremos deixar umPOSITIVO passar por NEGATIVO. Imagine que se trata de umexame para deteccao de uma doenca altamente contagiosa. Melhortermos muitos falsos positivos do que falsos negativos. (Melhor terum inocente preso que um bandido solto, hehehe)
TPR tambem e chamada de RECALL.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Avaliando Classificadores - Questoes
Dentre os elementos classificados como negativos, qual opercentual, ou melhor, a TAXA dos VERDADEIROS NEGATIVOS?(TAXA de VERDADEIROS NEGATIVOS OU ”TRUE NEGATIVERATE”)(TNR).
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Avaliando Classificadores - Questoes
Quem sao os negativos? R. Sao os VERDADEIROS NEGATIVOS(TN) mais os FALSOS POSITIVOS (FP).Portanto: TNR = TN / (TN + FP)
O TNR se aproxima de um quando o FP se aproxima de zero.
Queremos um TNR alto quando nao queremos deixar umNEGATIVO passar por POSITIVO. Imagine que voce tem umaempresa que possa ser processada por danos morais caso voceafirme que um de seus clientes esta fraudando quando na realidadeele nao esta. (FP)
TNR tambem e chamada de Especificidade (Specificity).
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Avaliando Classificadores - Questoes
Voce ja deve ter percebido que a Taxa de Acerto sozinha nao querdizer muita coisa e nem sempre e o fator mais importante naescolha de um classificador para o seu problema. A seguir oresumo.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Metricas
True Positive Rate (Recall) (TPR). TPR = TP / (TP + FN)
True Negative Rate (Specificity) SPC = TN / (FP + TN)
Positive Predictive Value (Precision) PPV = TP / (TP + FP)
Negative Predictive Value (NPV) NPV = TN / (TN + FN)
False Positive Rate (fall-out) FPR = FP /( FP + TN)
False Discovery Rate (FDR) FDR = FP /(FP + TP) = 1 -PPV
False Negative Rate (Miss Rate) FNR = FN / ( FN + TP)
etc etc etc
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Metricas Curva ROC - Receiver Operating Characteritics
Area Sob a curva. Acima de 0.9 (excelente). Entre 0.8 e 0.9(bom). Entre 0.7 e 0.8 (medio). Entre 0.6 e 0.7 (fraco).Abaixo de0.6 (ineficaz).
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
ZERO R - O Classificador do Preconceito
Seja o DataSet Jogar Tenis (Disponıvel na Literatura)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
ZERO R - O Classificador do Preconceito
O ZERO R classifica as instancias pela maioria. No caso do destedataset temos:Instancias classificadas como P (Positivo = SIM) : 9Instancias classificadas como N (Negativo = Nao) : 5Classe Maioria: SIM.
Matriz de Confusao:Real \Predito P (SIM) N (Nao)
P (SIM) 9 0
N (Nao) 5 0
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
ZERO R - O Classificador do Preconceito
Metricas
Classe TPR FPR ROC
P (SIM) 1 1 0,5
N (Nao) 0 0 0,5
Taxa de Acerto (Acuracidade) : 9/13 = 0,69
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
ZERO R - O Classificador do Preconceito
Na pratica, o classificador Zero R pode ser usado para criar uma”baseline”para avaliar o seu classificador.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
ONE R - Melhorando um Pouco
Observemos o atributo tempo:Valor \Classes P (SIM) N (Nao)
Ensolarado 2 3
Nublado 4 0
Chuva 4 1
Que regra podemos extrair daı? (Descoberta de regras)R. SE Esta nublado ou com Chuva ENTAO P (SIM) SENAO N(Nao)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
ONE R - Melhorando um Pouco - Aplicando ao Dataset
Instancia Real Classificado (Predito)1 N N2 N N3 P P4 P P5 P P6 N P7 P P8 N N9 P N
10 P P11 N P12 P P13 P P14 N P
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
ONE R - Melhorando um Pouco - Aplicando ao Dataset
Instancias classificadas corretamente : 10Instancias classificadas erroneamente : 4Daı..
Matriz de ConfusaoReal \Predito P(SIM) N(NAO)
P(SIM) 7 2
N(NAO) 2 3
MedidasClasse TPR FPR ROC
P (SIM) 0,778 0,4 0,689
N (Nao) 0,6 0,222 0,689
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
ONE R - Melhorando um Pouco - Aplicando ao Dataset
Moral da Historia: Encontre um atributo mais util para fazer seusjulgamentos. ;-)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
O que e ?
Uma arvore de decisao e uma ferramenta de apoio a decisao que,graficamente, apresenta a forma de uma arvore (de cabeca parabaixo). A raiz e a parte de cima e as folhas ficam na parte debaixo. Veja o desenho abaixo.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Exemplo
A Raiz e os nos sao as variaveis a serem avaliadas, os ramos(arcos) que ligam os nos sao os valores admissıveis ou caminhos aserem seguidos no processo de decisao e as folhas sao as saıdas.Veja o exemplo de uma arvore de decisao para o caso de decidir sevc vai jogar ou nao tenis.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Tabela
A partir da arvore acima podemos construir a seguinte tabela.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Questao
Entao a proxima pergunta e: Porque usar uma arvore e naosimplesmente consultar a tabela?
Resposta
Economia e, consequentemente, viabilidade dos calculos.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Questao
Entao a proxima pergunta e: Porque usar uma arvore e naosimplesmente consultar a tabela?
Resposta
Economia e, consequentemente, viabilidade dos calculos.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Seja o dataset (Ida ao restaurante):
Por onde comecar?Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Atributo Clientela
lotado (0 casos positivos, 4 casos negativos); medio (4 casospositivos, 0 casos negativos) e vazio (4 casos negativos, 0 casospositivos).
Atributo Tipo
a la carte (2 casos negativos, 1 caso positivo); self service (2 casosnegativos, 1 caso positivo) fast food (2 casos negativos, 1 casopositivo) e sushi bar (2 casos negativos e 1 caso positivo).
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Atributo Clientela
lotado (0 casos positivos, 4 casos negativos); medio (4 casospositivos, 0 casos negativos) e vazio (4 casos negativos, 0 casospositivos).
Atributo Tipo
a la carte (2 casos negativos, 1 caso positivo); self service (2 casosnegativos, 1 caso positivo) fast food (2 casos negativos, 1 casopositivo) e sushi bar (2 casos negativos e 1 caso positivo).
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Proposta 1
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Proposta 2
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Alguns classificadores Interessantes - Arvores de Decisao
Manual Selecionar sempre o atributo que levar mais rapido para asfolhas (Decisao). Atributos que dividem as instanciasequilibradamente nao sao bons.
ID3 Desenvolvido por Ross Quillan, usa a teoria do ganho dainformacao para selecao dos atributos. Ver no BLOG (https://lambrain.wordpress.com/page/4/) e(https://lambrain.wordpress.com/2014/10/13/tutorial-arvores-de-decisao-continuacao-ia/)
C4.5 Melhoria para trabalhar com valores continuos e poda a arvoreapos criacao
C5.0 Mais rapido. Bom para grandes volumes de dados. Os autoresdizem que e o melhor classificador que existe.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Redes Neurais Artificiais
1011 Neuronios — + 20 Tipos — 1014 Sinapses — 1 a 10 ms deciclo.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Redes Neurais Artificiais
Neuronio artificial.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Redes Neurais Artificiais
Funcoes de Ativacao. Limiar e Sigmoide.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Separabilidade
Problema da separacao.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Topologias de Redes Neurais
Redes Feed Forward.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Topologias de Redes Neurais
Redes com recorrencia, inibicao, etc.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Redes Bayesianas
P(X1, . . . ,Xn) =∏
i P(Xi |Pais(Xi)) Exemplo:P(j ∧m ∧ a ∧ ¬b ∧ ¬e) = P(j |a)P(m|a)P(a|¬b,¬e)P(¬b)P(¬e)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Formacao de Agrupamentos - Clustering
FILO - CLASSE - ORDEM - FAMILIA - GENERO - ESPECIEProf. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Formacao de Agrupamentos - Clustering
Doencas do Ovario.
Figura:Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Cluster Hierarquico
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Cluster Hierarquico
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Cluster Hierarquico
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Cluster Hierarquico
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Cluster Hierarquico
Algoritmo aglomerativo
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Cluster Hierarquico
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Cluster Hierarquico
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Cluster Hierarquico
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
K-Means
Seja um dataset com seu conjunto de indivıduos.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
K-Means
Passo 1 - Selecionar K elementos como as medias iniciais (KDefinido antes)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
K-Means
Passo 2: Classificar os elementos usando as medias (Formacao dosprimeiros K Grupos)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
K-Means
Passo 3: Recalcular as medias de cada grupo.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
K-Means
Passo 4: Reclassificar todos.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
K-Means
Passo 5: Recalcular medias
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
K-Means
Repetir passos 4 e 5 ate convergencia.
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Correlacao Entre Atributos
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Correlacao Entre Atributos
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Correlacao Entre Atributos
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Correlacao Entre Atributos
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Correlacao Entre Atributos
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Correlacao Entre Atributos
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Selecao de Atributos
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Limpeza de Dados
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Limpeza de Dados
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Limpeza de Dados
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Extracao de Regras a Partir dos Dados
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Extracao de Regras a Partir dos Dados
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Extracao de Regras a Partir dos Dados
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Construcao Automatica de Ontologias
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Construcao Automatica de Ontologias
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Comites de Classificadores
Proposta Gissa
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Comites de Classificadores
Porque combinar?
Duas cabecas pensam melhor do que uma?
Todos tem direito a uma segunda opiniao ;-)
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Comites de Classificadores
Vantagens
Melhor do que o melhor dos classificadores selecionados
Aumenta a estabilidade do classificador 2
bias-variance decomposition. Bias = “erro persistente” de umalgoritmo de aprendizagem. Variance = “erro particular” deum modelo treinado.
. Sistemas combinados reduzem a variancia
. Quanto mais sistemas combinados mais se reduz a variancia
2O quanto um algoritmo e perturbado por pequenas mudancas nas entradasProf. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Comites de Classificadores
Desvantagens
Nenhuma garantia que sera sempre melhor do que o usosimples de um classificador
Ainda e uma area de pesquisas
Difıceis de analisar.
Complexo e custoso para construir
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Comites de Classificadores
Elementos a definir.
Estrutura
Componentes
Metodo de combinacao
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Continua
Temos assunto para varios outros cursos ....
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Continua
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Avaliacao de Classificadores Classificadores Diversos Formacao de Agrupamentos Selecao de Atributos Limpeza de Dados Contatos
Contatos
Prof. Ronaldo F. RamosDoutor em Systemes Informatiques (Informatica)- Universidade de Evry - Franca.Pos Doutorado - UFC - DETIMestre em Engenharia de Producao/Inteligencia Aplicada - Universidade Federal deSanta CatarinaEngenheiro Mecanico - Universidade Federal do Ceara30 Anos de experiencia em Projetos de Engenharia e Sistemas Informatizados.ronaldo.ramos@gmail.com
Prof. Guilherme de Alencar BarretoDoutor em Engenharia Eletrica - Universidade de Sao Paulo - USP - Sao Carlos /Universidade de Bielefeld, UB, AlemanhaMestre em Engenharia Eletrica - Universidade de Sao Paulo - USP - Sao CarlosEngenheiro de Teleinformatica - Universidade Federal do CearaBolsista CNPQ Nıvel 2http://lattes.cnpq.br/8902002461422112
Prof. Ronaldo F. Ramos, Dr
Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)
top related