taxonomias difusas em tarefas de mineração (status do projeto) aluno: mauricio jacó cerri...
TRANSCRIPT
Taxonomias Difusas em Tarefas de Mineração
(Status do Projeto)
Aluno: Mauricio Jacó CerriOrientadora: Dra. Marilde Terezinha Prado Santos
Co- Orientadora: Dra. Marcela Xavier RibeiroColaboração: Grupo de Banco de Dados UFSCar
Área: Banco de Dados
Universidade Federal de São Carlos - UFSCarDepartamento de Computação - DC
Programa de Pós-Graduação em Ciência da Computação - PPGCC
Roteiro Introdução
Resumo do Projeto Atividades Realizadas Próximas Atividades e Cronograma
Status Projeto- Mauricio J. Cerri16/11/20092/21
Roteiro Introdução
Resumo do Projeto Atividades Realizadas Próximas Atividades e Cronograma
Status Projeto- Mauricio J. Cerri3/21
16/11/2009
Resumo do Projeto - Contextualização Mineração de Dados
Tarefa de mineração de dados: Regra de Associação Obtenção de Padrão Sequencial
Melhorias na busca de informações relevantes Busca cada vez maior por informações relevantes
(Semanticamente)
Status Projeto- Mauricio J. Cerri
(AGRAWAL; IMIIELINSKI; SWAMI, 1993)
(AGRAWAL; SRIKANT, 1995)
NARFO (Non-redundant and generalized Association Rule based on Fuzzy Ontologies) (MIANI et al., 2009)
4/2116/11/2009
Resumo do Projeto - Contextualização Mineração de Dados utilizando Ontologias Difusas
Ontologias conhecimento de apoio na mineração de dados
Taxonomias grau difuso de especialização entre classes na Ontologia
Status Projeto- Mauricio J. CerriFonte: Miani et al. (2009)
5/2116/11/2009
Resumo do Projeto - Objetivos Baseado no algoritmo NARFO
Explorar grau de especialização classes na taxonomia difusa
Utilizar a análise do grau de especialização para obter padrões sequenciais
Status Projeto- Mauricio J. Cerri6/21
16/11/2009
Roteiro
Introdução Atividades Realizadas Próximas Atividades e Cronograma
Status Projeto- Mauricio J. Cerri7/21
16/11/2009
Atividades Realizadas
Estudo sobre grau de especialização entre Classes da Ontologia;
Estudo do código fonte do algoritmo NARFO; Inicio dos testes e adaptações sobre grau de
especialização entre classes; Criação e adaptação de Ontologias para testes; Busca de algoritmos sobre padrão sequencial e
estudo de adaptações.
Status Projeto- Mauricio J. Cerri8/21
16/11/2009
Atividades Realizadas
Status Projeto- Mauricio J. Cerri9/21
Projeto para aplicação de padrão sequencial em base médica;
Estudo contínuo.
16/11/2009
Atividades Realizadas
Status Projeto- Mauricio J. Cerri10/21
Grau de especialização considerando contextoGrau de especialização considerando contexto
FormatoFormato
0.8 0.6 0.7
SaborSabor
0.9 0.9 0.1
Grau de similaridade poderá também considerar contextoGrau de similaridade poderá também considerar contexto
16/11/2009
Aplicação para Padrão Sequencial
Status Projeto- Mauricio J. Cerri11/21
16/11/2009
Aplicação para Padrão Sequencial
Status Projeto- Mauricio J. Cerri12/21
16/11/2009
Aplicação para Padrão Sequencial
Status Projeto- Mauricio J. Cerri13/21
16/11/2009
Roteiro
Introdução Atividades Realizadas Próximas Atividades e Cronograma
Status Projeto- Mauricio J. Cerri14/21
16/11/2009
Próximas Atividades e Cronograma Conclusão da adaptação da busca pelo grau de
especialização; Finalização dos testes e busca por contexto; Escrita de artigo; Melhorarias contínuas no código fonte; Término das adaptações do Padrão Sequencial; Inicio testes; Escrita de Artigos.
Status Projeto- Mauricio J. Cerri15/21
16/11/2009
Cronograma de Atividades
Qualificação - Mauricio J. Cerri
Preparação e Defesa da QualificaçãoPreparação e Defesa da Qualificação
Levantamento bibliográfico contínuo sobre os temas pertinentes à proposta apresentadaLevantamento bibliográfico contínuo sobre os temas pertinentes à proposta apresentadaMelhoramento do NARFO para explorar regras
de pertinência na taxonomia difusaMelhoramento do NARFO para explorar regras de pertinência na taxonomia difusaRefinamento e início dos testes do NARFO estendido para regras de associação, considerando grau de pertinência
Refinamento e início dos testes do NARFO estendido para regras de associação, considerando grau de pertinênciaEscrita de artigo para explorar as adaptações feitasEscrita de artigo para explorar as adaptações feitasAdaptação do NARFO para padrões sequenciaisAdaptação do NARFO para padrões sequenciaisRefinamento e início dos testes das adaptações para padrões sequenciaisRefinamento e início dos testes das adaptações para padrões sequenciaisEscrita de artigo para explorar as adaptações feitas referente a padrões sequenciaisEscrita de artigo para explorar as adaptações feitas referente a padrões sequenciaisRefinamento e teste do NARFO estendido e adaptado para padrões sequenciaisRefinamento e teste do NARFO estendido e adaptado para padrões sequenciaisInício dos testes comparativos com outros algoritmos e análise de impacto na busca de padrão sequencial, mantendo os itemsets não frequentes
Início dos testes comparativos com outros algoritmos e análise de impacto na busca de padrão sequencial, mantendo os itemsets não frequentes
Escrita de artigo para explorar as adaptações feitasEscrita de artigo para explorar as adaptações feitasRedação da dissertação de mestradoRedação da dissertação de mestrado
Preparação para a defesa da dissertação de mestradoPreparação para a defesa da dissertação de mestrado17/21
16/11/2009
Taxonomias Difusas em Tarefas de Mineração
(Status do Projeto)
Aluno: Mauricio Jacó CerriOrientadora: Dra. Marilde Terezinha Prado Santos
Co- Orientadora: Dra. Marcela Xavier RibeiroColaboração: Grupo de Banco de Dados UFSCar
Área: Banco de Dados
Universidade Federal de São Carlos - UFSCarDepartamento de Computação - DC
Programa de Pós-Graduação em Ciência da Computação - PPGCC
Referências AGRAWAL, R.; IMIELINSKI, T.; SWAMI, A. Mining association rules
between sets of items in large databases. In: ACM SIGMOD INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA, 1993, Washington, D.C. Proceedings... ACM, 1993. p. 207-216.
AGRAWAL, R.; SRIKANT, R. Fast Algorithms for Mining Association Rules in Large Databases. In: INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES, 20th, 1994, Proceedings... Morgan Kaufmann Publishers Inc., 1994.
DUBOIS, D.; HULLERMEIER, E.; PRADE, H. A systematic approach to the assessment of fuzzy association rules. Data Min. Knowl. Discov., v. 13, n. 2, p. 167-192, 2006.
ELMASRI, R.; NAVATHE, S. B. Sistemas de Banco de Dados. 4 ed. Pearson Addison Wesley, 2005. 624-642 p.
FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery: an overview. In: (Ed.). Advances in knowledge discovery and data mining. American Association for Artificial Intelligence, 1996. p. 1-34.
Status Projeto- Mauricio J. Cerri19/21
16/11/2009
Referências (cont. 1) HAN, J.; KAMBER, M. Data Mining: Concepts and Techniques. 2nd ed.
San Francisco: 2006. 770 p. HAN, J. et al. Mining Frequent Patterns without Candidate Generation: A
Frequent-Pattern Tree Approach. Data Min. Knowl. Discov., v. 8, n. 1, p. 53-87, 2004.
HULLERMEIER, E.; YI, Y. In Defense of Fuzzy Association Analysis. IEEE Transactions on Systems, Man, and Cybernetics Part B, v. 37, n. 4, p. 1039-1043, Aug,2007, 2007.
MIANI, R. G. et al. NARFO Algorithm: Mining Non-redundant and Generalized Association Rules Based on Fuzzy Ontologies. In: INTERNATIONAL CONFERENCE ENTERPRISE INFORMATION SYSTEMS (ICEIS), 11th, 2009, Milan, Italy. Proceedings... 2009.
PASQUIER, N. et al. Efficient mining of association rules using closed itemset lattices. Inf. Syst., v. 24, n. 1, p. 25-46, 1999.
PEI, J. et al. PrefixSpan: Mining Sequential Patterns Efficiently by Prefix-Projected Pattern Growth. In: INTERNATIONAL CONFERENCE ON DATA ENGINEERING, 17th, 2001, Proceedings... IEEE Computer Society, 2001. p.
Status Projeto- Mauricio J. Cerri20/21
16/11/2009
Referências (cont. 2) SRIKANT, R.; AGRAWAL, R. Mining Generalized Association Rules. In:
INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES, 21th, 1995, Proceedings... Morgan Kaufmann Publishers Inc., 1995. p. 407-419.
ZAKI, M. J. SPADE: An Efficient Algorithm for Mining Frequent Sequences. Mach. Learn., v. 42, n. 1-2, p. 31-60, 2001.
Qualificação - Mauricio J. Cerri21/21
16/11/2009
Assunto Extra Prontuário Eletrônico do Paciente, evolução para RES (Registro Eletrônico de
Saúde) – Palestra Beatriz Faria Leão Software Inglês feito em .NET, será adaptado para JAVA (Brasil); Utilização de Data Mining no projeto RES (Brasil).
Qualificação - Mauricio J. Cerri22/21
16/11/2009
Assunto Extra
Qualificação - Mauricio J. Cerri23/21
16/11/2009
Assunto Extra
Qualificação - Mauricio J. Cerri24/21
16/11/2009