343o [modo de compatibilidade]) - ufpr · conceitos básicos de classificação • apesar de...
TRANSCRIPT
![Page 1: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/1.jpg)
1
Reconhecimento de Padrões
Introdução
Luiz Eduardo S. Oliveira, Ph.D.
http://lesoliveira.net
Universidade Federal do ParanáDepartamento de Informática
Objetivos
• Introduzir os conceito básicos de reconhecimento de padrões através de um exemplo de um sistema de classificação clássico.
![Page 2: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/2.jpg)
2
Introdução
• Pense em ações simples que realizamos no nosso dia-a-dia, e na complexidade envolvida, como por exemplo:
Interpretar placas de trânsito
Introdução
Ler um jornal: Diferentes Fontes, Figuras, Gráficos, Ilustrações, etc...
![Page 3: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/3.jpg)
3
Introdução
• Agora imagine como implementar essas simples ações em um sistema de computador!
• Complicado? • O que seria necessário?
– Adquirir a imagem, ler, entender (classificar), tomar uma ação.
Introdução
• Diferentes abordagem para Reconhecimento de Padrões.– Estatística– Estrutural– Sintática
![Page 4: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/4.jpg)
4
Um Exemplo
• Para ilustrar a complexidade desse tipo de sistema, considere o seguinte exemplo:– Uma indústria recebe dois tipos de peixe:
Salmão e Robalo. Os peixes são recebido em uma esteira, e o processo de classificação é manual.
– A industria gostaria de automatizar esse processo, usando para isso uma câmera CCD.
Um Exemplo (cont)
![Page 5: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/5.jpg)
5
Um Exemplo (cont)
• Primeiramente devemos encontrar as características que distinguem um salmão de um robalo.– Altura, largura, coloração, posição da boca,
etc...
• Características (Features): Qualquer medida que se possa extrair de um determinado objeto.
Um Exemplo (cont)
• Características podem ser:– Simbólicas.– Numéricas (Continuas ou binárias).
• Ruídos (Erros):– Conceito originário da teoria das comunicações;– Podem estar presente no objeto.
• Uma mancha no peixe, por exemplo.
– Devidos ao sistema de aquisição. • Iluminação por exemplo.
![Page 6: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/6.jpg)
6
Um Exemplo (cont)
• Dado as diferenças entre as populações de Salmão e Robalo, podemos dizer que cada uma possui um modelo específico.
• Modelo: Um descritor, geralmente representado através de uma função matemática.– Bom modelo é capaz de absorver ruídos.
Sistema Clássico
Aquisição
Pré-Processamento
Classificação
Salmão Robalo
Segmentação
Extração de Características
![Page 7: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/7.jpg)
7
Área Multidisciplinar
Algoritmos/Estrutura de Dados
Reconhecimentode Padrões
ProcessamentoDe Imagens
Aprendizagem deMáquina
Estatística
Álgebra Linear &GeometriaComputação
Evolutiva
Domínio daAplicação
Sistema Clássico –Pré-processamento
• Simplificação do sinal capturado pela câmera. – Ex: Eliminação de alguns ruídos.– Processamento digital de imagens.
• Tornar os processos subseqüentes mais simples e rápidos.
![Page 8: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/8.jpg)
8
Sistema Clássico –Segmentação
• Isolar os objetos de interesse na imagem.– No nosso exemplo,
encontrar o que é peixe e o que não é peixe.
– Processamento Digital de Imagens
• Filtros, morfologia matemática, etc...
Sistema Clássico –Segmentação
• Segundo nível de segmentação.– Encontrar e segmentar
os objetos de interesse detectados na primeira fase da segmentação.
![Page 9: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/9.jpg)
9
Sistema Clássico –Extração de Características
• A imagem do objeto de interesse é enviada para o módulo de extração de características.– Reduzir a complexidade através da extração
de certas “características” ou “propriedades”.
Sistema Clássico –Classificação
• As características (valores) são passadas para o classificador, o qual toma uma decisão– No nosso exemplo: Salmão ou Robalo.
• Mas que tipo de características devemos usar?
![Page 10: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/10.jpg)
10
Conceitos básicos de classificação
• Suponha que alguém nos diga que:– Robalos geralmente são maiores que
salmões.– Isso nos dá uma direção para modelar nosso
problema, ou seja,– Se o peixe ultrapassa um tamanho t, então
ele é um robalo, caso contrário, é um salmão.– Mas como determinar t ??
Conceitos básicos de classificação
• Podemos selecionar alguns exemplares (base de treinamento) de peixe e verificar seus tamanhos.
• Suponha que após analisarmos nossa base de treinamento, tenhamos os seguintes histogramas
![Page 11: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/11.jpg)
11
Conceitos básicos de classificação
t
salmão
robalo Usando somente a medidade tamanho, não podemosseparar de maneira confiável nossas duas classes de peixes. Portanto, devemos tentar outras características.
Conceitos básicos de classificação
salmão robalo
x
Outra característica: Medida de Claridade (coloração)
Como podemos notar,essa característica émuito mais confiável, mas não é perfeita.
Robalos que serão classificados comosalmão.
Noção deCUSTO
![Page 12: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/12.jpg)
12
Conceitos básicos de classificação
• Suponha que os clientes da nossa industria aceitem um pedaço de salmão embalado junto com robalo, mas o contrário é inaceitável.
• Devemos então alterar nossa fronteira para que isso não aconteça.
Conceitos básicos de classificação
salmão robalo
Custo maior, uma vez que mais salmões serão classificados comorobalos
x
Erro Bayesiano
![Page 13: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/13.jpg)
13
Conceitos básicos de classificação
• Isso sugere que existe um custoassociado com a nossa decisão.
• Nossa tarefa consiste em encontrar uma regra de decisão que minimize o custo.– Isso é o papel central da Teoria da Decisão.
– Também pode ser visto como um problema de otimização.
Conceitos básicos de classificação
• Como minimizar o custo?– Buscar outras características.
• Suponha que a claridade seja a melhor.
– Podemos utilizar duas características ao mesmo tempo.
=
2
1
x
x
x
Vetor de características bi-dimensional.
![Page 14: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/14.jpg)
14
Conceitos básicos de classificação
Nossa base de treinamento em um gráfico de dispersão
salmão robalo
altu
ra
claridade
Conceitos básicos de classificação
• Nosso problema consiste em encontrar a fronteira de decisão que minimize o custo.
• Modelo mais simples:– Separação linear, y = ax+b– Algoritmos tradicionais:
• Perceptron, Funções Discriminantes Lineares.
![Page 15: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/15.jpg)
15
Conceitos básicos de classificação
salmão robalo
altu
ra
claridade
Conceitos básicos de classificação
• Essa regra fornece uma boa fronteira de decisão, entretanto pode ser melhorada.– Adicionar mais características, como por
exemplo, dimensões do peixe, posição relativa dos olhos, etc..., poderiam ajudar.
• Quanto mais características, mais base de treinamento será necessária.– Maldição da dimensionalidade.
![Page 16: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/16.jpg)
16
Conceitos básicos de classificação
• Suponha que não dispomos de mais características.
• Solução: – Construir um modelo mais complexo do que
um modelo linear.
Conceitos básicos de classificação
salmão robalo
altu
ra
claridade
Fronteira muito maiscomplexa.Separação perfeita!
Um exemplo (salmão) de teste
![Page 17: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/17.jpg)
17
Conceitos básicos de classificação
• Apesar de complexo, esse modelo é pior do que o modelo linear.
• A principal característica de um modelo deve ser a sua capacidade de generalizar.
• Modelos muito complexos geralmente não generalizam bem, pois decoram a base de treinamento (over-fitting).
Conceitos básicos de classificação
• Por outro lado, modelos muito simples tendem a generalizar demais (under-fitting).
• Na aprendizagem de máquina, veremos técnicas para evitar over- e under-fitting, ou seja, construir fronteiras de decisão nem tão simples e nem tão complexas.
![Page 18: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/18.jpg)
18
Conceitos básicos de classificação
salmão robalo
altu
ra
claridade
Taxas
• Um sistema pode ser avaliado usando diferente taxas.
• A mais comuns são– Taxa de rec = (N_rec/Total_Img) * 100– Taxa de Erro = (N_err/Total_Img) * 100– Taxa de Rej = N_rej/Total_img) * 100– Confiabilidade = (Taxa de Rec / (Taxa Rec + Taxa de Erro)) * 100
![Page 19: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/19.jpg)
19
Taxas
• Outra forma bastante utilizada para se avaliar classificadores são as curvas ROC (Receiver Operating Characteristics)– TP, TN (Diagonal principal da matriz)– FP, FN
![Page 20: 343o [Modo de Compatibilidade]) - UFPR · Conceitos básicos de classificação • Apesar de complexo, esse modelo é pior do que o modelo linear. • A principal característica](https://reader033.vdocuments.pub/reader033/viewer/2022051923/6011a547633f7f2e45255147/html5/thumbnails/20.jpg)
20
Exercício
• Planeje um sistema que inspecione automaticamente uma linha de produção de biscoitos. Os seguintes aspectos devem ser observados:
1. Forma (redondo) e tamanho (2cm de raio).2. Integridade (Quebrado, mordido, etc) 3. Quantidade de recheio (pelo menos 3
marcas de chocolate).
� Considere todos os aspectos, desde a aquisição da imagem até a classificação.