probabilistic svm algorithm

35
Probabilistic SVM Algorithm Laércio Nascimento Mesquita 2015.2 Picos – PI 18/02/2016

Upload: laercio-mesquita

Post on 16-Jan-2017

374 views

Category:

Internet


0 download

TRANSCRIPT

Page 1: Probabilistic svm algorithm

Probabilistic SVM Algorithm

Laércio Nascimento Mesquita

2015.2 Picos – PI 18/02/2016

Page 2: Probabilistic svm algorithm

Roteiro

--- Introdução

--- Aprendizado de Máquina (AM)

-- Aprendizado não-supervisonado (descritivo)

-- Aprendizado Supervisonado (preditivo)

--- Support Vector Machine (SVM)

--- Aplicações

--- Referências

Page 3: Probabilistic svm algorithm

Introdução

l Até os anos 70 a Inteligência Artificial era vista como uma disciplina

meramente teórica;

l Dificuldade de aquisição do conhecimento por parte de especialistas;

l Dificuldade na resolução de problemas complexos;

l Necessidade de ferramentas sofisticadas;

Page 4: Probabilistic svm algorithm

O que é Aprendizado de

Máquina?

fonte: http://migre.me/t15Mw

Page 5: Probabilistic svm algorithm

Aprendizado de Máquina

“A capacidade de melhorar o desempenho na realização de de alguma tarefa por meio da experiência (MITCHELL 1997).”

fonte:http://migre.me/t15We

Page 6: Probabilistic svm algorithm

Aprendizado de Máquina

Algumas áreas de pesquisa têm dado contribuições diretas e significativas no avanço a AM, como Probabilidade, Estatística Teoria da Computação Neurociência, Teoria da Informação.

Page 7: Probabilistic svm algorithm

Aprendizado de Máquina

Aprendizado Indutivo

SupervisionadoNão

supervisionado

Classificação Regressão

Sumarização Agrupamento Associação

Hierarquia de aprendizado.

Page 8: Probabilistic svm algorithm

Aprendizado Não - supervisionado

Algoritmo KNN

Page 9: Probabilistic svm algorithm

Aprendizado Supervisionado

Page 10: Probabilistic svm algorithm

Modelo de Estimação de Função

Page 11: Probabilistic svm algorithm

Modelo de Estimação de Função, Santos(2002) p. 20.

Page 12: Probabilistic svm algorithm

Modelo de Estimação de Função

l Seja (x 1 , y 1 ),... , (x i , y i ) , tal que x R n e y {− ∈ ∈1, 1 }, i = 1, ..., N, onde N é o número de instâncias do treinamento, x é o vetor de entrada e y é a classificação desejada. O objetivo é estimar uma função F: R n -> {-1 ou 1}, usando os exemplos de treinamento, e aplicá-la nos exemplos de teste, não utilizados anteriormente, com o objetivo de que sejam classificados corretamente.

Page 13: Probabilistic svm algorithm

Modelo de Estimação de Função

l Problemas:l Overfitting → onde a complexidade da função

obtida é superior a necessidade do problema; l Underfitting → onde a complexidade da função

obtida é inferior a necessidade do problema.

Page 14: Probabilistic svm algorithm

Modelo de Estimação de Função

l

(a) sobre-ajuste, (b) sub-ajuste, (c) função de aproximação maisadequada.

Page 15: Probabilistic svm algorithm

Support Vector Machine - (SVM)

Page 16: Probabilistic svm algorithm

Support Vector Machine

The original SVM algorithm was invented by Vladimir N. Vapnik and Alexey Ya. Chervonenkis in 1963. In 1992, Bernhard E. Boser, Isabelle M. Guyon and Vladimir N. Vapnik suggested a way to create nonlinear classifiers by applying the kernel trick to maximum-margin hyperplanes (VAPNIK 1998).

Page 17: Probabilistic svm algorithm

Support Vector Machine

l Valores discretos e valores contínuos;l Ex1: Sexo { masculino, feminino} – Problema de

Classificação;l Ex2: Peso { 80.4, 50.2, 93.5 … } - Problema de

Regressão ou em classicação em caso de pesado ou leve;

l Em classificação se k = 2, diz-se ser um problema binário, para k>2 problema multiclasse.

Page 18: Probabilistic svm algorithm

Support Vector Machine

l Máquinas de vetor de suporte (SVM)(VAPNIK, 1998) têm obtido sucesso em um grande número de aplicações.

l A SVM constrói um hiperplano com várias dimensões que separa de forma otimizada os dados em duas categorias.

Page 19: Probabilistic svm algorithm

Support Vector Machine

Hiperplano de separação Ótimo, Lima(2014), p. 06.

Page 20: Probabilistic svm algorithm

Teoria de Aprendizado Estatístico

Page 21: Probabilistic svm algorithm

Teoria de Aprendizado Estatístico

Que a mágica comece!

Page 22: Probabilistic svm algorithm

Teoria de Aprendizado Estatístico

Minimização do risco. Sousa (2002).

Page 23: Probabilistic svm algorithm

Teoria de Aprendizado Estatístico

Risco empírico da função R (f). Oliveira Junior (2010), p. 07.

Page 24: Probabilistic svm algorithm

Teoria de Aprendizado Estatístico

l Na equação, h denota a dimensão VC (Vapnik-Chervonenkis) da classe de funções a qual f pertence e n representa a quantidade de instâncias de treinamento. A dimensão VC, mede a capacidade das funções contidas em F. Quanto maior for o valor de VC, mais complexas são as funções de classificação.

Page 25: Probabilistic svm algorithm

Representação da dimensão VC(Vapnik-Chervonenkis) . Oliveira Junior (2010), p. 07.

Teoria de Aprendizado Estatístico

Page 26: Probabilistic svm algorithm

Funções Kernel

Page 27: Probabilistic svm algorithm

Funções Kernel

As funções de kernel têm a finalidade de projetar os vetores de características de entrada em um espaço de características de alta dimensão para classificação de problemas que se encontram em espaços não linearmente separáveis.

Page 28: Probabilistic svm algorithm

Funções Kernel

Transformação de um problema linear mente separável.

Page 29: Probabilistic svm algorithm

Funções Kernel

Funções Kernels mais utilizadas.

Funções kernels mais utilizados.

Page 30: Probabilistic svm algorithm

Funções Kernel

Separação usando função de kernel linear

D(x) = w T x + b

Page 31: Probabilistic svm algorithm

Funções Kernel

Aplicação de uma função RBF em clusters .Oliveira Junior (2010), p. 11.

Page 32: Probabilistic svm algorithm

Aplicações

Page 33: Probabilistic svm algorithm

Aplicações de Aprendizado de Máquina

-- Reconhecimento de palavras faladas;

-- Predição de taxas de cura de pacientes com diferentes

doenças;

-- Detecção do uso fraudulento de cartões de crédito;

-- Condução de automóveis de forma autônoma em rodovias;

-- Diagnóstico de câncer por meio de análise de dados de

expressão gênica.

Page 34: Probabilistic svm algorithm

Referência

Lima, B. V. A. de .Rotulação de Dados com Aprendizado Semi-Supervisionado. Dissertação de Mestrado na área de Ciência da Computação. (Programa de Pós-Graduação em Ciência da Computação) – Universidade Federal do Piauí, Teresina, 2014.

Oliveira Junior, G. M. de. Máquina de Vetores Suporte: estudo e análise de parâmetros para otimização de resultado. Trabalho de graduação na área de Ciência da Computação. Universidade Federal de Pernambuco, Recife, 2010.

Santos, E. M. dos. Teoria e Aplicação de Support Vector Machines à Aprendizagem e Reconhecimento de Objetos Baseado na Aparência. Dissertação de Mestrado na área de Modelos Computacionais e Cognitivos. (Programa de Pós-Graduação em Informática da Universidade Federal da Paraíba) - Universidade Federal da Paraíba, Paraíba, 2002.

VAPNIK. N, Statistical Learning Theory. New York: John Wiley & Sons, 1998.

Page 35: Probabilistic svm algorithm

Dúvidas?Obrigado!