proposta disciplina projeto rodrigo

9
Universidade Federal do Maranhão Centro de Ciências Exatas e Tecnologia Ciência da Computação Proposta de Projeto de Monografia Construção de Ontologias: Desenvolvimento automático de Ontologias de aplicação. Rodrigo Sousa Monteiro Aluno Maria Del Rosario Girardi Professora Responsável Av. dos Portugueses, s/n Campus Universitário do Bacanga 65080-040 São Luís - MA Brasil Fone (98) 3301-8242 Fax (98) 3301-8241 [email protected] http://www.ppgee.ufma.br

Upload: rodrigo-sousa

Post on 28-Sep-2015

214 views

Category:

Documents


1 download

DESCRIPTION

Projeto de Monografia em Ciência da Computação

TRANSCRIPT

Universidade Federal do Maranho

Universidade Federal do Maranho

Centro de Cincias Exatas e TecnologiaCincia da Computao

Proposta de Projeto de MonografiaConstruo de Ontologias:

Desenvolvimento automtico de Ontologias de aplicao.Rodrigo Sousa MonteiroAlunoMaria Del Rosario GirardiProfessora ResponsvelSo Luis - MA, 12 de setembro de 2013.Sumario

1- INTRODUO.............................................................................................3

1.1 Justificativa

2- DESCRIO DO PROJETO.........................................................................4

3.1 Objetivos Gerais

3.2 Objetivos Especficos

3.3 Metodologia

3.4 Atividades e Cronograma

3.5 Resultados Esperados

3- BIBLIOGRAFIA............................................................................................61. Introduo As Ontologias constituem uma abordagem para a representao de conhecimento capaz de expressar um conjunto de entidades e seus relacionamentos, restries, axiomas e o vocabulrio de um dado domnio.

Uma ontologia uma especificao formal explcita de uma conceituao de um domnio de interesse[X][X]. So utilizadas principalmente em sistemas baseados em conhecimento com a finalidade de representar e compartilhar o conhecimento sobre um domnio da aplicao, alm de permitir o processamento semntico das informaes, propiciando uma maior efetividade e usabilidade a esses sistemas[X].

Normalmente, as ontologias so construdas por engenheiros de conhecimento e especialistas de domnio o que se caracteriza por ser uma tarefa lenta, cara e que necessita de um grande esforo por parte desses profissionais.

Nesse contexto, percebe-se a importncia do desenvolvimento de um ambiente que possibilite a construo das ontologias de aplicao de forma semiautomtica ou automtica Nesse contexto surge uma nova rea denominada Descoberta de Conhecimento em Bases de Dados (Knowledge Discovery in Databases - KDD). Segundo GOLDSCHMIDT e PASSOS (2005) a expresso Minerao de Dados, na realidade, uma das etapas da Descoberta de Conhecimento em Bases de Dados. Afirmam ainda que a Minerao de Dados a principal etapa do processo de KDD onde ocorre a busca efetiva por conhecimentos novos e teis a partir dos dados.

A minerao de dados composta de varias tarefas como: tarefas de previso, tarefas descritivas e a modelagem de previso, mas sem dvida uma das mais importantes delas a classificao, que tem como propsito encontra uma funo que seja capaz de atribuir um rtulo de classe a um determinado exemplo. A figura abaixo demonstra as fases de um processo de KDD.

Etapas do processo de KDD

Com o intuito de classificar dados at ento desconhecimentos em algum dos conjuntos de rtulos de classes pr-definidas que surge a necessidade de se utilizar tcnicas que realizem esse processo de forma automtica. Entre os vrios classificadores podemos citar um dos mais usado que a arvore de deciso.O intuito desse trabalho comparar o desempenho de dois classificares: a rvore de Deciso e o classificador Bayesiano, mostrando assim quais vantagens e desvantagens do uso de cada um.

JustificativaEsta proposta de Projeto de Monografia justifica-se primeiramente porque no tem uma disciplina no curso que possa dar uma viso sobre o assunto e depois pela grande necessidade de se classificar os dados j que os mesmos esto disponveis em grandes quantidades e so de suma importncia para a tomada de deciso em vrios setores. Tendo em vista que h diversos classificadores disponveis, h a necessidade tambm de se descobrir o ponto fraco e forte de cada um com a finalidade de se tirar o melhor que cada um pode oferecer. Com esse estudo orientado pretende-se, baseado em testes, identificar para que aplicao ou em que situaes usar a arvore de deciso ou o classificador Bayesiano.2. Descrio do ProjetoObjetivos GeralContribuir com o aprendizado e povoamento de ontologias atravs da concepo e criao de ambiente de desenvolvimento de ontologias de aplicao. Objetivos Especficos ( Anlise do processo Apponto-pro, tcnicas e ferramentas associadas;( Concepo e criao de um ambiente integrado de desenvolvimento de ontologias de aplicao; ( Avaliao do ambiente atravs do desenvolvimento de um estudo de caso no domnio do direito sucessrio.

Metodologia

A metodologia da pesquisa se desenvolver em trs etapas, cada uma visando atingir um objetivo especfico da proposta do projeto.Etapa 1: Coletar os dados e prepar-los para a minerao, fazendo-os passar pelas seguintes etapas do pr-processamento: Limpeza de dados, Integrao, Transformao, Reduo, com o objetivo de se eliminar rudos, inconsistncia e duplicao.Etapa 2. Ser aplicado um algoritmo de aprendizagem para a identificar o modelo mais apropriado para o relacionamento entre o conjunto de atributos e o rotulo da classe dos dados de entrada.Etapa 3: Escrita e submisso de um artigo com os resultados alcanados.

A metodologia da pesquisa abordar principalmente estudos experimentais na rea de minerao de dados.

Primeiro os dados sero coletado e posteriormente sero pr-processados com o objetivo de que se adaptem melhor a uma ferramenta ou tcnica especifica de minerao de dados. Em seguida sero aplicados algoritmos como o ID3, C4.5 e CART para induzir a arvore de deciso assim como o algoritmo bayesiano (naive Bayes).Atividades e Cronograma

1.Realizar o pr-processamento dos dados coletados necessrios para formar os dados de entrada, aplicando as tcnicas de minerao de dados;2. Avaliar experimentalmente os resultados apresentados por cada algoritmo de aprendizagem, verificando os valores apresentados na matriz de confuso.

3.Submisso de artigo: Elaborao de um artigo cientfico a ser submetido a evento da rea para divulgao dos resultados e avaliao dos comentrios.

Atividades20122013

Out.Nov.DezJan.Fev.

Pesquisa BibliogrficaXX

Coleta e a realizao do pr-processamento dadosXX

Aplicao dos algoritmos de aprendizagemXX

Avaliao dos resultados obtidosX

Defesa da dissertaoX

Submisso de artigoX

Resultados esperados(Identificar e comparar os resultados obtidos pelos mtodos de arvore de deciso e o mtodos de Bayes, demonstrando assim os pontos fortes e fracos de cada mtodo;

(Publicao de artigo cientfico para divulgao e avaliao dos resultados obtidos.Bibliografia

[1]TAN, Pang Ning; STEINBACH, Michael; KUMAR, Vipin Introduo ao DATAMING Minerao de Dados Editora Cincia Moderna Ltda., 2009.[2]Disponvel em: http://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados Acessado em: 28 nov. 2012.[3]Disponvel em: < http://www.deamo.prof.ufu.br/arquivos/Aula13.pdf.>Acessado em: 01 nov. 2012. [4]Disponvel em :< http://pt.wikipedia.org/wiki/Filtro_bayesiano.> Acessado em: 28 nov. 2012[5]Disponvel em : Acessado em: 28 out. 2012.

[6]Disponvel em : Acessado em: 28 set. 2012.

_______________________________

Alessandro Jorge Rodrigues da SilvaAluno_______________________________

Ivo Jos da Cunha Serra

Professor responsvelPAGE Av. dos Portugueses, s/n Campus Universitrio do Bacanga 65080-040 So Lus - MA Brasil Fone (98) 3301-8242 Fax (98) 3301-8241 [email protected] http://www.ppgee.ufma.br