o paradigma indutivo Álvaro degas alvaro_degas@yahoo.com.br
Post on 07-Apr-2016
216 Views
Preview:
TRANSCRIPT
O paradigma IndutivoÁlvaro Degas
alvaro_degas@yahoo.com.br
O Paradigma Indutivo
• Idéia Geral– Arrocha é baiano e faz música medíocre– Pissirico é baiano e faz música medíocre– Harmonia do Samba é baiano e faz música
medíocre
– Todo Baiano faz música medíocre
O Paradigma Indutivo
• Elementos do processo de KD• Um aprendiz
– Programa• Um conjunto de treinamento
– Dados• Conhecimento sobre um domínio
– Regras
O Paradigma Indutivo
• Data Mining Paradigma Indutivo• Mais precisamente, DM PI• Data Mining: O Conjunto de Treinamento é um
Banco de Dados• Tipos de Classificação de Data Mining:
– Bancos de Dados – Relacional, Orientado a Objetos, Web etc.
– Conhecimentos – Associativos, Classificativos, Agrupadores, etc.
– Técnicas – Redes Neurais, Apriori, ID3, etc.
Tipos de Conhecimento Indutivo• Regras de Classificação
• Agrupamento
• Regras de Associação
• Seqüências
• Etc...
Supervisão
• Métodos de Data Mining podem ser supervisionados ou não
• Aprendizagem supervisionada– O Aprendiz recebe informações a respeito do
domínio onde vai se dar o processo (classes)• Aprendizagem não-supervisionada
– Cabe ao aprendiz descobrir as informações no domínio onde vai se dar o processo (classes)
O Paradigma Indutivo• Pode-se adquirir conhecimento espúrio em
decorrência do processo indutivo• A expressão “induzir ao erro”• Exemplos (reais):
– Se idade < 10 então diagnóstico=“Vaginite”• Amostra mal-construída
– Se Sistema Operacional = “Linux” então SGBD=“Sql Server”
• Dados mal-preparados
Formem suas equipes!Total de 4 times
Cada time pega um tipo de conhecimento e um dos algoritmos associados
Mostrar: o tipo de conhecimento, o funcionamento do algoritmo e uma implementação funcional
Regras de Classificação
Agrupamento
Regras de Associação
Seqüências
Aplicações• Padrões de Comportamento de Clientes• Auxílio a especialistas• Prevenção e auditoria de fraudes• Meteorologia• Geologia• Marketing direto• Planejamento de sistemas de informações
distribuídas• etc
Ética e Aprendizado Automático
• Ética– “1. Estudos dos juízos de apreciação referentes à
conduta humana, do ponto de vista do bem e do mal. 2. Conjuntos de normas e princípios que norteiam a boa conduta do ser humano” Aurélio
• Bem e Mal?– “Bem: Qualidade atribuída a ações e obras que lhes
confere um caráter moral. (...) Mal: (...) Antônimo de bem” Aurélio
• Muitas questões éticas surgem no uso prático de ferramentas desta natureza!– De modo geral é a mesma ética que se impõe ao
profissional de TI mas...• Data Mining é usado, em última análise, para
discriminar– Uma aplicação de empréstimo que use sexo, religião, raça,
preferência sexual como determinantes– Uma fábrica de produtos de consumo pede a seleção de
padrões de consumidores que não reinvindicam seus direitos
Ética e Aprendizado Automático
• A ética é algo cultural e extremamente contextualizado– Informações positivas de exames em aplicações
médicas• Atributos podem conter informações
problemáticas – “disfarçando” a discriminação– Bairro pode ser correlacionado com raça
Ética e Aprendizado Automático
• Questões cruciais:– A quem é dado o acesso aos dados?– Com que propósito houve a coleta de dados?– Quais as conclusões são (ou não são) legítimas
sob o ponto de vista ético de serem extraídas dali?
Ética e Aprendizado Automático
• Pode-se interpretar os resultados– Se raça=“Negro” então mau-pagador=True
(C=0.5)– Isso significa que é potencialmente um mau
negócio emprestar a negros?– Se religião=“Umbanda” e
Música_Preferida=“Samba” então QI<100– É razoável crer nesta correlação?
Ética e Aprendizado Automático
• Argumentos puramente estatísticos nunca são suficientes– Interpretar e contextualizar– Validar semanticamente resultados
• Os recursos e os resultados servem a um bom propósito?– Militar, Questões científicas polêmicas
(clonagem, células-tronco, transgenia), etc.
Ética e Aprendizado Automático
Conclusões• O paradigma indutivo, embora passivo de
erro é uma ferramenta cada vez mais importante
• Há vários tipos de conhecimento - um estudo para cada caso
Conclusões• Os métodos são devoradores de recursos
computacionais• Há muita pesquisa na área• A última palavra ainda não foi dada
Paradigma Indutivo
FIM!
“Deixadas a si mesmas, as coisas irão de mal a pior. A natureza conspira pela falha. Posto que a natureza é canalha,
para algo dar certo é preciso deixar de fazer por onde”Lei de Murphy aplicada à MetafísicaEscher
top related