taxonomias difusas em tarefas de mineração (status do projeto) aluno: mauricio jacó cerri...

23
Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora: Dra. Marcela Xavier Ribeiro Colaboração: Grupo de Banco de Dados UFSCar Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC

Upload: internet

Post on 17-Apr-2015

115 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Taxonomias Difusas em Tarefas de Mineração

(Status do Projeto)

Aluno: Mauricio Jacó CerriOrientadora: Dra. Marilde Terezinha Prado Santos

Co- Orientadora: Dra. Marcela Xavier RibeiroColaboração: Grupo de Banco de Dados UFSCar

Área: Banco de Dados

Universidade Federal de São Carlos - UFSCarDepartamento de Computação - DC

Programa de Pós-Graduação em Ciência da Computação - PPGCC

Page 2: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Roteiro Introdução

Resumo do Projeto Atividades Realizadas Próximas Atividades e Cronograma

Status Projeto- Mauricio J. Cerri16/11/20092/21

Page 3: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Roteiro Introdução

Resumo do Projeto Atividades Realizadas Próximas Atividades e Cronograma

Status Projeto- Mauricio J. Cerri3/21

16/11/2009

Page 4: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Resumo do Projeto - Contextualização Mineração de Dados

Tarefa de mineração de dados: Regra de Associação Obtenção de Padrão Sequencial

Melhorias na busca de informações relevantes Busca cada vez maior por informações relevantes

(Semanticamente)

Status Projeto- Mauricio J. Cerri

(AGRAWAL; IMIIELINSKI; SWAMI, 1993)

(AGRAWAL; SRIKANT, 1995)

NARFO (Non-redundant and generalized Association Rule based on Fuzzy Ontologies) (MIANI et al., 2009)

4/2116/11/2009

Page 5: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Resumo do Projeto - Contextualização Mineração de Dados utilizando Ontologias Difusas

Ontologias conhecimento de apoio na mineração de dados

Taxonomias grau difuso de especialização entre classes na Ontologia

Status Projeto- Mauricio J. CerriFonte: Miani et al. (2009)

5/2116/11/2009

Page 6: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Resumo do Projeto - Objetivos Baseado no algoritmo NARFO

Explorar grau de especialização classes na taxonomia difusa

Utilizar a análise do grau de especialização para obter padrões sequenciais

Status Projeto- Mauricio J. Cerri6/21

16/11/2009

Page 7: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Roteiro

Introdução Atividades Realizadas Próximas Atividades e Cronograma

Status Projeto- Mauricio J. Cerri7/21

16/11/2009

Page 8: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Atividades Realizadas

Estudo sobre grau de especialização entre Classes da Ontologia;

Estudo do código fonte do algoritmo NARFO; Inicio dos testes e adaptações sobre grau de

especialização entre classes; Criação e adaptação de Ontologias para testes; Busca de algoritmos sobre padrão sequencial e

estudo de adaptações.

Status Projeto- Mauricio J. Cerri8/21

16/11/2009

Page 9: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Atividades Realizadas

Status Projeto- Mauricio J. Cerri9/21

Projeto para aplicação de padrão sequencial em base médica;

Estudo contínuo.

16/11/2009

Page 10: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Atividades Realizadas

Status Projeto- Mauricio J. Cerri10/21

Grau de especialização considerando contextoGrau de especialização considerando contexto

FormatoFormato

0.8 0.6 0.7

SaborSabor

0.9 0.9 0.1

Grau de similaridade poderá também considerar contextoGrau de similaridade poderá também considerar contexto

16/11/2009

Page 11: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Aplicação para Padrão Sequencial

Status Projeto- Mauricio J. Cerri11/21

16/11/2009

Page 12: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Aplicação para Padrão Sequencial

Status Projeto- Mauricio J. Cerri12/21

16/11/2009

Page 13: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Aplicação para Padrão Sequencial

Status Projeto- Mauricio J. Cerri13/21

16/11/2009

Page 14: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Roteiro

Introdução Atividades Realizadas Próximas Atividades e Cronograma

Status Projeto- Mauricio J. Cerri14/21

16/11/2009

Page 15: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Próximas Atividades e Cronograma Conclusão da adaptação da busca pelo grau de

especialização; Finalização dos testes e busca por contexto; Escrita de artigo; Melhorarias contínuas no código fonte; Término das adaptações do Padrão Sequencial; Inicio testes; Escrita de Artigos.

Status Projeto- Mauricio J. Cerri15/21

16/11/2009

Page 16: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Cronograma de Atividades

Qualificação - Mauricio J. Cerri

Preparação e Defesa da QualificaçãoPreparação e Defesa da Qualificação

Levantamento bibliográfico contínuo sobre os temas pertinentes à proposta apresentadaLevantamento bibliográfico contínuo sobre os temas pertinentes à proposta apresentadaMelhoramento do NARFO para explorar regras

de pertinência na taxonomia difusaMelhoramento do NARFO para explorar regras de pertinência na taxonomia difusaRefinamento e início dos testes do NARFO estendido para regras de associação, considerando grau de pertinência

Refinamento e início dos testes do NARFO estendido para regras de associação, considerando grau de pertinênciaEscrita de artigo para explorar as adaptações feitasEscrita de artigo para explorar as adaptações feitasAdaptação do NARFO para padrões sequenciaisAdaptação do NARFO para padrões sequenciaisRefinamento e início dos testes das adaptações para padrões sequenciaisRefinamento e início dos testes das adaptações para padrões sequenciaisEscrita de artigo para explorar as adaptações feitas referente a padrões sequenciaisEscrita de artigo para explorar as adaptações feitas referente a padrões sequenciaisRefinamento e teste do NARFO estendido e adaptado para padrões sequenciaisRefinamento e teste do NARFO estendido e adaptado para padrões sequenciaisInício dos testes comparativos com outros algoritmos e análise de impacto na busca de padrão sequencial, mantendo os itemsets não frequentes

Início dos testes comparativos com outros algoritmos e análise de impacto na busca de padrão sequencial, mantendo os itemsets não frequentes

Escrita de artigo para explorar as adaptações feitasEscrita de artigo para explorar as adaptações feitasRedação da dissertação de mestradoRedação da dissertação de mestrado

Preparação para a defesa da dissertação de mestradoPreparação para a defesa da dissertação de mestrado17/21

16/11/2009

Page 17: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Taxonomias Difusas em Tarefas de Mineração

(Status do Projeto)

Aluno: Mauricio Jacó CerriOrientadora: Dra. Marilde Terezinha Prado Santos

Co- Orientadora: Dra. Marcela Xavier RibeiroColaboração: Grupo de Banco de Dados UFSCar

Área: Banco de Dados

Universidade Federal de São Carlos - UFSCarDepartamento de Computação - DC

Programa de Pós-Graduação em Ciência da Computação - PPGCC

Page 18: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Referências AGRAWAL, R.; IMIELINSKI, T.; SWAMI, A. Mining association rules

between sets of items in large databases. In: ACM SIGMOD INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA, 1993, Washington, D.C. Proceedings... ACM, 1993. p. 207-216.  

AGRAWAL, R.; SRIKANT, R. Fast Algorithms for Mining Association Rules in Large Databases. In: INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES, 20th, 1994, Proceedings... Morgan Kaufmann Publishers Inc., 1994.

DUBOIS, D.; HULLERMEIER, E.; PRADE, H. A systematic approach to the assessment of fuzzy association rules. Data Min. Knowl. Discov., v. 13, n. 2, p. 167-192, 2006.

ELMASRI, R.; NAVATHE, S. B. Sistemas de Banco de Dados. 4 ed. Pearson Addison Wesley, 2005. 624-642 p.

FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery: an overview. In: (Ed.). Advances in knowledge discovery and data mining. American Association for Artificial Intelligence, 1996. p. 1-34.

Status Projeto- Mauricio J. Cerri19/21

16/11/2009

Page 19: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Referências (cont. 1) HAN, J.; KAMBER, M. Data Mining: Concepts and Techniques. 2nd ed.

San Francisco: 2006. 770 p. HAN, J. et al. Mining Frequent Patterns without Candidate Generation: A

Frequent-Pattern Tree Approach. Data Min. Knowl. Discov., v. 8, n. 1, p. 53-87, 2004.

HULLERMEIER, E.; YI, Y. In Defense of Fuzzy Association Analysis. IEEE Transactions on Systems, Man, and Cybernetics Part B, v. 37, n. 4, p. 1039-1043, Aug,2007, 2007.

MIANI, R. G. et al. NARFO Algorithm: Mining Non-redundant and Generalized Association Rules Based on Fuzzy Ontologies. In: INTERNATIONAL CONFERENCE ENTERPRISE INFORMATION SYSTEMS (ICEIS), 11th, 2009, Milan, Italy. Proceedings... 2009.

PASQUIER, N. et al. Efficient mining of association rules using closed itemset lattices. Inf. Syst., v. 24, n. 1, p. 25-46, 1999.

PEI, J. et al. PrefixSpan: Mining Sequential Patterns Efficiently by Prefix-Projected Pattern Growth. In: INTERNATIONAL CONFERENCE ON DATA ENGINEERING, 17th, 2001, Proceedings... IEEE Computer Society, 2001. p.

Status Projeto- Mauricio J. Cerri20/21

16/11/2009

Page 20: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Referências (cont. 2) SRIKANT, R.; AGRAWAL, R. Mining Generalized Association Rules. In:

INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES, 21th, 1995, Proceedings... Morgan Kaufmann Publishers Inc., 1995. p. 407-419.

ZAKI, M. J. SPADE: An Efficient Algorithm for Mining Frequent Sequences. Mach. Learn., v. 42, n. 1-2, p. 31-60, 2001.

Qualificação - Mauricio J. Cerri21/21

16/11/2009

Page 21: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Assunto Extra Prontuário Eletrônico do Paciente, evolução para RES (Registro Eletrônico de

Saúde) – Palestra Beatriz Faria Leão Software Inglês feito em .NET, será adaptado para JAVA (Brasil); Utilização de Data Mining no projeto RES (Brasil).

Qualificação - Mauricio J. Cerri22/21

16/11/2009

Page 22: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Assunto Extra

Qualificação - Mauricio J. Cerri23/21

16/11/2009

Page 23: Taxonomias Difusas em Tarefas de Mineração (Status do Projeto) Aluno: Mauricio Jacó Cerri Orientadora: Dra. Marilde Terezinha Prado Santos Co- Orientadora:

Assunto Extra

Qualificação - Mauricio J. Cerri24/21

16/11/2009