![Page 1: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/1.jpg)
SABENÇAUm arcabouço computacional para
aprendizagem semi-automatizada de
ontologias a partir de textos
Defesa de Mestrado
Mestrando: Norton Coelho Guimarães
Orientador: Dr. Cedric Luiz de Carvalho
- 22 de abril de 2015 -
![Page 2: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/2.jpg)
Agenda
Introdução
O projeto
Estudo de caso
Considerações finais
Referências bibliográficas
![Page 3: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/3.jpg)
O que é
ontologia?
![Page 4: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/4.jpg)
Aristóteles (222 a.C.)
... trata do estudo do ser
enquanto ser (EIBEN, e
SMITH, 2008).
... visão abstrata do mundo
que se deseja representar...
(GRUBER, 1995)
Tom GRUBER
![Page 5: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/5.jpg)
.. servem como esquemas
de metadados...
(MÄEDCHE e STAAB,
2001).
Alexander MÄEDCHE Steffen STAAB Lucas Rego DRUMMOND
... devem ser compreensíveis
para os agentes e outras
entidades computacionais
(DRUMMOND, 2009).
![Page 6: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/6.jpg)
Exemplo de Ontologia
(LOPES e VIEIRA, 2010)
Termos
Relações
Propriedades
Hierarquias
![Page 7: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/7.jpg)
Onde se
utiliza
ontologias?
![Page 8: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/8.jpg)
Ambiguidade
Comunicação Homem-Máquina
Dedução do Significado
Interoperabilidade Semântica
![Page 9: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/9.jpg)
Como se
constrói uma
ontologia?
![Page 10: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/10.jpg)
...complexo e demorado, não existe uma
solução universal (CIMIANO, 2006).
Philipp CIMIANO
![Page 11: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/11.jpg)
O que é a
aprendizagem
de ontologias?
![Page 12: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/12.jpg)
Alexander MÄEDCHE Steffen STAAB
...serve para descrever o processo de
aquisição de um modelo de domínio a partir
de dados (MÄEDCHE e STAAB, 2001).
![Page 13: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/13.jpg)
Tipos de aprendizagem de ontologias
textos dicionáriosbase de
conhecimento
esquemas semi-
estruturados
esquemas relacionais
(Gómez-Pérez e Manzano-Macho, 2003)
![Page 14: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/14.jpg)
Tipos de aprendizagem de ontologias
textos dicionáriosbase de
conhecimento
esquemas semi-
estruturados
esquemas relacionais
(Gómez-Pérez e Manzano-Macho, 2003)
![Page 15: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/15.jpg)
Como é a
aprendizagem
de ontologias a
partir de
textos?
![Page 16: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/16.jpg)
Escrevem
(CIMIANO, 2006)
![Page 17: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/17.jpg)
Quais são
essas
etapas?
![Page 18: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/18.jpg)
disjuntos(rio, montanha)
rio, país, nação, cidade, capital, . . .
{país, nação}
c:= país:= < i(país),[[país]], 𝑅𝑒𝑓𝐶(país) >
flue_através(dom:rio, range: estado)
∀𝑥 (pais (x) → ∃𝑦 capita_de (y, x) ∧ ∀𝑧 (capital_de(z, x) → y = z) )
capital≤𝐶 cidade
capital_de ≤𝑅 localizado_em
≤𝐶 = redução de c
∀𝑥 = regra universal
→ = implica
∧ = e lógico
i = instância de
[[ ]] = subconjunto
𝑅𝑒𝑓𝐶 = Conjunto
Legenda
(CIMIANO, 2006)
Termo Sinônimo ConceitosHierarquia
de Conceitos
RelaçõesHierarquias
de Relações
Esquema de Axiomas
Axiomas Gerais
![Page 19: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/19.jpg)
disjuntos(rio, montanha)
rio, país, nação, cidade, capital, . . .
{país, nação}
c:= país:= < i(país),[[país]], 𝑅𝑒𝑓𝐶(país) >
flue_através(dom:rio, range: estado)
∀𝑥 (pais (x) → ∃𝑦 capita_de (y, x) ∧ ∀𝑧 (capital_de(z, x) → y = z) )
capital≤𝐶 cidade
capital_de ≤𝑅 localizado_em
≤𝐶 = redução de c
∀𝑥 = regra universal
→ = implica
∧ = e lógico
i = instância de
[[ ]] = subconjunto
𝑅𝑒𝑓𝐶 = Conjunto
Legenda
(CIMIANO, 2006)
Termo Sinônimo ConceitosHierarquia
de Conceitos
RelaçõesHierarquias
de Relações
Esquema de Axiomas
Axiomas Gerais
![Page 20: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/20.jpg)
disjuntos(rio, montanha)
rio, país, nação, cidade, capital, . . .
{país, nação}
c:= país:= < i(país),[[país]], 𝑅𝑒𝑓𝐶(país) >
flue_através(dom:rio, range: estado)
∀𝑥 (pais (x) → ∃𝑦 capita_de (y, x) ∧ ∀𝑧 (capital_de(z, x) → y = z) )
capital≤𝐶 cidade
capital_de ≤𝑅 localizado_em
≤𝐶 = redução de c
∀𝑥 = regra universal
→ = implica
∧ = e lógico
i = instância de
[[ ]] = subconjunto
𝑅𝑒𝑓𝐶 = Conjunto
Legenda
(CIMIANO, 2006)
Termo Sinônimo ConceitosHierarquia
de Conceitos
RelaçõesHierarquias
de Relações
Esquema de Axiomas
Axiomas Gerais
![Page 21: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/21.jpg)
disjuntos(rio, montanha)
rio, país, nação, cidade, capital, . . .
{país, nação}
c:= país:= < i(país),[[país]], 𝑅𝑒𝑓𝐶(país) >
flue_através(dom:rio, range: estado)
∀𝑥 (pais (x) → ∃𝑦 capita_de (y, x) ∧ ∀𝑧 (capital_de(z, x) → y = z) )
capital≤𝐶 cidade
capital_de ≤𝑅 localizado_em
≤𝐶 = redução de c
∀𝑥 = regra universal
→ = implica
∧ = e lógico
i = instância de
[[ ]] = subconjunto
𝑅𝑒𝑓𝐶 = Conjunto
Legenda
(CIMIANO, 2006)
Termo Sinônimo ConceitosHierarquia
de Conceitos
RelaçõesHierarquias
de Relações
Esquema de Axiomas
Axiomas Gerais
![Page 22: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/22.jpg)
disjuntos(rio, montanha)
rio, país, nação, cidade, capital, . . .
{país, nação}
c:= país:= < i(país),[[país]], 𝑅𝑒𝑓𝐶(país) >
flue_através(dom:rio, range: estado)
∀𝑥 (pais (x) → ∃𝑦 capita_de (y, x) ∧ ∀𝑧 (capital_de(z, x) → y = z) )
capital≤𝐶 cidade
capital_de ≤𝑅 localizado_em
≤𝐶 = redução de c
∀𝑥 = regra universal
→ = implica
∧ = e lógico
i = instância de
[[ ]] = subconjunto
𝑅𝑒𝑓𝐶 = Conjunto
Legenda
(CIMIANO, 2006)
Termo Sinônimo ConceitosHierarquia
de Conceitos
RelaçõesHierarquias
de Relações
Esquema de Axiomas
Axiomas Gerais
![Page 23: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/23.jpg)
disjuntos(rio, montanha)
rio, país, nação, cidade, capital, . . .
{país, nação}
c:= país:= < i(país),[[país]], 𝑅𝑒𝑓𝐶(país) >
flue_através(dom:rio, range: estado)
∀𝑥 (pais (x) → ∃𝑦 capita_de (y, x) ∧ ∀𝑧 (capital_de(z, x) → y = z) )
capital≤𝐶 cidade
capital_de ≤𝑅 localizado_em
≤𝐶 = redução de c
∀𝑥 = regra universal
→ = implica
∧ = e lógico
i = instância de
[[ ]] = subconjunto
𝑅𝑒𝑓𝐶 = Conjunto
Legenda
(CIMIANO, 2006)
Termo Sinônimo ConceitosHierarquia
de Conceitos
RelaçõesHierarquias
de Relações
Esquema de Axiomas
Axiomas Gerais
![Page 24: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/24.jpg)
disjuntos(rio, montanha)
rio, país, nação, cidade, capital, . . .
{país, nação}
c:= país:= < i(país),[[país]], 𝑅𝑒𝑓𝐶(país) >
flue_através(dom:rio, range: estado)
∀𝑥 (pais (x) → ∃𝑦 capita_de (y, x) ∧ ∀𝑧 (capital_de(z, x) → y = z) )
capital≤𝐶 cidade
capital_de ≤𝑅 localizado_em
≤𝐶 = redução de c
∀𝑥 = regra universal
→ = implica
∧ = e lógico
i = instância de
[[ ]] = subconjunto
𝑅𝑒𝑓𝐶 = Conjunto
Legenda
(CIMIANO, 2006)
Termo Sinônimo ConceitosHierarquia
de Conceitos
RelaçõesHierarquias
de Relações
Esquema de Axiomas
Axiomas Gerais
![Page 25: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/25.jpg)
disjuntos(rio, montanha)
rio, país, nação, cidade, capital, . . .
{país, nação}
c:= país:= < i(país),[[país]], 𝑅𝑒𝑓𝐶(país) >
flue_através(dom:rio, range: estado)
∀𝑥 (pais (x) → ∃𝑦 capita_de (y, x) ∧ ∀𝑧 (capital_de(z, x) → y = z) )
capital≤𝐶 cidade
capital_de ≤𝑅 localizado_em
≤𝐶 = redução de c
∀𝑥 = regra universal
→ = implica
∧ = e lógico
i = instância de
[[ ]] = subconjunto
𝑅𝑒𝑓𝐶 = Conjunto
Legenda
(CIMIANO, 2006)
Termo Sinônimo ConceitosHierarquia
de Conceitos
RelaçõesHierarquias
de Relações
Esquema de Axiomas
Axiomas Gerais
![Page 26: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/26.jpg)
Como
automatizar
esta
proposta?
![Page 27: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/27.jpg)
Wilson WONG
Atualmente, não pode ser, por sua
própria natureza, totalmente
automatizada (WONG, 2012).
![Page 28: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/28.jpg)
Trabalhos relacionadosFonte Objetivo e Escopo Validação Domínio
BASÉGIO, 2007 Extração semi-automática de estruturas ontológicas,
termos e relações taxonômicas.
Manual (1) Turismo
JUNIOR, 2008 ONTOlp geração semi-automática de ontologias. Manual (1) Pediatria
LOPES, 2009 ExATOlp extração de termos, conceitos, hierarquias
segundo abordagens linguísticas e estatísticas.
- Pediatria
MOTTA, 2009 Geração semi-automática de ontologias. Manual (1) História
MPB
ZAHRA, 2009 PORONTO extração semi-automática de extração de
termos e relações taxonômicas.
Manual (2) Câncer de
Mama
GONÇALVES,
2011
Geração semi-automática de ontologias, identificação de
conceitos e relações com o uso de grafos.
- Biologia
![Page 29: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/29.jpg)
Trabalhos relacionadosFonte Objetivo e Escopo Validação Domínio
BASÉGIO, 2007 Extração semi-automática de estruturas ontológicas,
termos e relações taxonômicas.
Manual (1) Turismo
JUNIOR, 2008 ONTOlp geração semi-automática de ontologias. Manual (1) Pediatria
LOPES, 2009 ExATOlp extração de termos, conceitos, hierarquias
segundo abordagens linguísticas e estatísticas.
- Pediatria
MOTTA, 2009 Geração semi-automática de ontologias. Manual (1) História
MPB
ZAHRA, 2009 PORONTO extração semi-automática de extração de
termos e relações taxonômicas.
Manual (2) Câncer de
Mama
GONÇALVES,
2011
Geração semi-automática de ontologias, identificação de
conceitos e relações com o uso de grafos.
- Biologia
![Page 30: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/30.jpg)
Um campo de pesquisa em constante evolução.
Uso de ontologias na interoperabilidade semântica.
As ontologias melhoram a comunicação homem-máquina.
As ontologias tornam a tomada de decisão precisa.
Motivação
![Page 31: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/31.jpg)
Objetivo
![Page 32: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/32.jpg)
Sabença v 1.0
![Page 33: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/33.jpg)
É um arcabouço computacional (framework)
Fundamentado na aprendizagem de
ontologias a partir de textos
Integra ferramentas de PLN, técnicas morfossintáticas e
abordagens estatísticas.
![Page 34: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/34.jpg)
Metodologia
Analisar as principais metodologias, ferramentas, técnicas e trabalhos correlatos.
Projetar e desenvolver o arcabouço computacional.
Aplicar o arcabouço computacional aos documentos selecionados.
![Page 35: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/35.jpg)
Análise
![Page 36: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/36.jpg)
Análise
Requisitos Funcionais Casos de Uso
16
09
![Page 37: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/37.jpg)
Projeto
![Page 38: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/38.jpg)
Visão Geral
Documentos textuais
Sabença
(.pdf, .doc, .docx etc.)
Pré-processamento
textual
Extração de
termos
Identificação de
termos
Identificação de
Relações
taxonômicas
XML -> OWL
Ontologia
![Page 39: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/39.jpg)
Tipos de Arcabouços
Frozen Spots Hot Spots
![Page 40: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/40.jpg)
Arquitetura
Visualização
Aplicação GUI
Módulo Construtor
Módulo Analisador Módulo Conversor
Módulo Etiquetador
Módulo Pesador
Módulo Extrator
Módulo Exportador
Compartilhado
![Page 41: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/41.jpg)
Digrama de Classes
![Page 42: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/42.jpg)
Sabença - Módulos
![Page 43: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/43.jpg)
Módulo Construtor• Controlar o fluxo;
• Recebe requisições externas;
• Controlar o mapeamento;
• Controlar as parametrizações;
• Controlar a importação.
Frozen Spots
![Page 44: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/44.jpg)
prop.linguagem=pt
prop.diretorio.compartilhado=C:/temp/importados/
prop.diretorio.origem=C:/Users/norton/Dropbox/Mestrado
UFG/Material de Estudo/Estudo de Caso/Grupo01/
prop.importador=Importador
prop.convertido.nome=documento
prop.conversor.doc=ConverteDOCparaTXT
prop.conversor.pdf=ConvertePDFparaTXT
prop.conversor.docx=ConverteDOCxparaTXT
prop.stopwords.nome=StopWords
prop.etiquetado.nome=etiquetado
prop.etiquetador.padrao=OpenNLP
Arq
uiv
o d
e P
rop
ried
ad
es
![Page 45: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/45.jpg)
prop.etiquetador.caminho.modelo=src\\br\\ufg\\inf\\
sabenca\\etiquetador\\modelsOpenNLP
prop.etiquetador.ngrama=4
prop.pesador.tipo=FrequenciaIDF
prop.pesador.MIN=0.1
prop.pesagem=termosPesagem
prop.extrator.formatoXML=ISO-8859-1
prop.extrator.termoSimples=termosPesagem
prop.extrator.termoComposto=termoComposto
prop.extrator.padraoHearst=padraoHearst
prop.exportador.padrao=NovoExportador
prop.extensao.padrao.saida=.txt
Arq
uiv
o d
e P
rop
ried
ad
es
![Page 46: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/46.jpg)
Módulo Analisador• Lista documentos;
• Encaminha para a conversão;
• Identifica protegidos.
![Page 47: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/47.jpg)
Módulo Conversor• Conversão textual
• Codificação ASCII
![Page 48: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/48.jpg)
Módulo Etiquetador• Realiza a etiquetagem.
• Gera Stopwords.
![Page 49: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/49.jpg)
Módulo Pesador• Realiza a pesagem
• Implementa TF-idf
![Page 50: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/50.jpg)
Módulo Extrator• Realiza a extração
• Gera padrões Hearst
• Gera n-gramas
• Gera termos compostos
• Gera as relações taxonômicas
Frozen Spots
![Page 51: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/51.jpg)
Padrões Hearst
(BASÉGIO, 2007)
![Page 52: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/52.jpg)
Termo Composto
(BASÉGIO, 2007)
![Page 53: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/53.jpg)
Módulo Exportador• Estrutura a ontologia
![Page 54: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/54.jpg)
Customização
![Page 55: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/55.jpg)
Extensão do Sabença
NovoExportador
![Page 56: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/56.jpg)
Instanciação do arcabouço
![Page 57: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/57.jpg)
Execução
![Page 58: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/58.jpg)
Fluxo de execuçãoConstrutor Analisador Conversor Etiquetador Pesador Extrator Exportador
1 2
3
4
5
6
7
![Page 59: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/59.jpg)
Fluxo de execuçãoConstrutor Analisador Conversor Etiquetador Pesador Extrator Exportador
1 2
3
4
5
6
7
![Page 60: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/60.jpg)
Fluxo de execuçãoConstrutor Analisador Conversor Etiquetador Pesador Extrator Exportador
1 2
3
4
5
6
7
![Page 61: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/61.jpg)
Fluxo de execuçãoConstrutor Analisador Conversor Etiquetador Pesador Extrator Exportador
1 2
3
4
5
6
7
![Page 62: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/62.jpg)
Fluxo de execuçãoConstrutor Analisador Conversor Etiquetador Pesador Extrator Exportador
1 2
3
4
5
6
7
![Page 63: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/63.jpg)
Fluxo de execuçãoConstrutor Analisador Conversor Etiquetador Pesador Extrator Exportador
1 2
3
4
5
6
7
![Page 64: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/64.jpg)
Fluxo de execuçãoConstrutor Analisador Conversor Etiquetador Pesador Extrator Exportador
1 2
3
4
5
6
7
![Page 65: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/65.jpg)
Recursos Computacionais
![Page 66: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/66.jpg)
Estudo de caso
![Page 67: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/67.jpg)
Metodologia
Escolher o domínio;
Selecionar documentos digitais;
Aplicar o arcabouço computacional nos documentos selecionados;
Validar os resultados com especialistas.
Gerar ontologia sobre o domínio escolhido.
![Page 68: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/68.jpg)
Domínio
![Page 69: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/69.jpg)
Convertidos
78
73
01
144
08
3958 pág.
![Page 70: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/70.jpg)
Resultados
3958 páginas
Termos Relevantes
1.516
104
Termos Compostos Padrões Hearst
![Page 71: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/71.jpg)
Tempo de Execução
![Page 72: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/72.jpg)
Validação
![Page 73: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/73.jpg)
Validação
... ... é frequentemente mais prático avaliar as diferentes
camadas da ontologia separadamente, em vez de tentar
avaliar diretamente a ontologia como um todo (BRANK,
J.; GROBELNIK, M.; MLADENI´C , D., 2005).
Marko GROBELNIKJanez BRANK Dunja MLADENIC
![Page 74: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/74.jpg)
![Page 75: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/75.jpg)
Métodos avaliativos
Precisão: identificar os termos corretos, considerando a lista de
referência (JUNIOR, 2008).
Abrangência: avalia a quantidade de termos corretos extraídos pelo
método (JUNIOR, 2008).
Medida f: expressar o equilíbrio entre os valores da precisão (P) e
abrangência (A) (JUNIOR, 2008).
![Page 76: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/76.jpg)
Termos Relevantes
314TF-idf > 0.1
![Page 77: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/77.jpg)
Termos Compostos
![Page 78: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/78.jpg)
Padrões Hearst
![Page 79: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/79.jpg)
Termos Relevantes
Padrão Hearst
Termos Compostos
Ontologia
![Page 80: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/80.jpg)
194
![Page 81: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/81.jpg)
Considerações Finais
![Page 82: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/82.jpg)
Documentos textuais podem gerar distorções nos resultados.
O corpus utilizado tem mais de 1 milhão de termos.
O uso de ferramentas de terceiros nos torna dependentes.
Utilizar n-gramas de 4 níveis, obtiveram resultados melhores que os padrões Hearst.
O arcabouço computacional semi-automatizado agiliza a estruturação de ontologias.
As ontologias mudam de acordo com a mudança do conhecimento adquirido.
![Page 83: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/83.jpg)
Contribuições
Desenvolvimento do arcabouço computacional.
Utilização de soluções livres no desenvolvimento do arcabouço computacional.
Desenvolvimento de uma ontologia de domínio na área de segurança pública.
![Page 84: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/84.jpg)
Trabalhos futuros
Extrair textos de áudio e vídeo.
Permitir outros idiomas.
Relações não-taxonômicas.
Classificador automático de documentos.
![Page 85: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/85.jpg)
Dicionário de sinônimos.
Construção automatizada de axiomas.
Processamento paralelo.
Merge de ontologias.
Validação automática.
![Page 86: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/86.jpg)
Referências
![Page 87: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/87.jpg)
BASÉGIO, T. L. Uma abordagem semi-automática para identificação de estruturas ontológicas
a partir de textos na língua portuguesa do brasil, 2007. Dissertação (Mestrado em Ciência
da Computação) – Faculdade de Informática, Universidade Católica do Rio Grande do Sul,
Porto Alegre. Disponível em: <http://tede.pucrs.br/tde_arquivos/4/TDE-2009-06-
09T170445Z-1994/Publico/403014.pdf>. Acesso em: 22 dez. 2013.
BRANK, J.; GROBELNIK, M.; MLADENI´C , D. A survey of ontology evaluation techniques. In:
Proc. of 8th Int. multi-conf. Information Society, p. 166–169, 2005.
CIMIANO, P. Ontology Learning and Population from Text: Algorithms, Evaluation and
Applications. Springer-Verlag New York, Inc., Secaucus, NJ, USA, 2006.
DE FARIA, C. G.; DEL ROSARIO GIRARDI GUTIERREZ, M. Um processo semiautomático
para o povoamento de ontologias a partir de fontes textuais. In: iSys - Revista Brasileira de
Sistemas de Informação, volume 3, 2010.
DRUMOND, L. R. Aquisição automatizada de hierarquias de conceitos de ontologias utilizando
aprendizagem estatística relacional, 2009. Dissertação (Mestrado em Engenharia e
Eletricidade) – Centro de Ciências exatas e tecnologia, Universidade Federal do Maranhão,
São Luís. Disponível em:
<http://www.tedebc.ufma.br//tde_busca/arquivo.php?codArquivo=380>. Acesso em: 29 abr.
2014.
![Page 88: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/88.jpg)
EIBEN, A.; SMITH, J. E. Introduction to Evolutionary Computing, volume XV de Natural
Computing. Springer, 2 edition, 2008.
GÓMEZ-PÉREZ, A.; MANZANO-MACHO, D. An overview of methods and tools for ontology
learning from texts. Knowl. Eng. Rev., 19(3):187–212, Sept. 2004.
GONÇALVES, G.; WILKENS, R.; VILLAVICENCIO, A. Sistema de aquisição semiautomática de
ontologias. In: Vieira, R.; Guizzardi, G.; Fiorini, S. R., editors, ONTOBRAS-MOST, volume
776 de CEUR Workshop Proceedings, p. 189–194. CEUR-WS.org, 2011.
GRUBER, T. Toward principles for the design of ontologies used for knowledge sharing.
International Journal Human-Computer Studies Vol. 43, Issues 5-6,Novemer 1995, p.907-
928., 1995.
HEARST, M. A. Automatic acquisition of hyponyms from large text corpora. In: Proceedings of
the 14th Conference on Computational Linguistics - Volume 2, COLING ’92, p. 539–545,
Stroudsburg, PA, USA, 1992. Association for Computational Linguistics.
JUNIOR, L. C. R. Ontolp: Construção semi-automática de ontologias a partir de textos da
língua portuguesa, 2008. Dissertação (Mestrado em Computação Aplicada) – Universidade
do Vale do Rio dos Sinos, São Leopoldo. Disponível em:
<http://bdtd.unisinos.br/tde_busca/arquivo.php?codArquivo=603>. Acesso em: 29 abr. 2013.
![Page 89: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/89.jpg)
LOPES, L. Extração automática de conceitos a partir de textos em língua portuguesa, 2012.
Tese (Doutorado em Ciência da Computação) – Faculdade de Informática, Pontifícia
Universidade Católica do Rio Grande do Sul, Porto Alegre. Disponível em:
<http://hdl.handle.net/10923/1651>. Acesso em: 29 abr. 2014.
LOPES, L.; VIEIRA, R. Processamento de linguagem natural e o tratamento computacional de
linguagens científicas. In: Linguagens Especializadas em Corpora: modos de dizer e
interfaces de pesquisa, p. 183–201. Cristina Lopes Perna; Heloísa Koch Delgado; Maria
José Finatto. (Org.), EDIPUCRS, 2010.
MAEDCHE, A.; STAAB, S. Ontology Learning for the Semantic Web. IEEE Intelligent Systems,
16(2):72–79, Mar. 2001.
MOTTA, E. N. Preenchimento semi-automático de ontologias de domínio a partir de textos em
língua portuguesa, 2009. Dissertação (Mestrado em Informática) – Centro de Ciências
exatas em tecnologia, Universidade Estadual do Rio de Janeiro, Rio de Janeiro. Disponível
em: <http://www2.uniriotec.br/ppgi/banco-dedissertacoes-ppgi-unirio/ano-
2009/preenchimento-semi-automatico-de-ontologiasde-dominio-a-partir-de-textos-em-
lingua-portuguesa/view>. Acesso em: 29 abr. 2014.
![Page 90: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/90.jpg)
SABOU, M.; WROE, C.; GOBLE, C.; STUCKENSCHMIDT, H. Learning domain ontologies for
semantic web service descriptions. Web Semantics: Science, Services and Agents on the
World Wide Web, 3(4):340 – 365, 2005.
ZAHRA, F. M. Poronto - ferramenta para construção semiautomática de ontologias em
português, 2009. Dissertação (Mestrado em Tecnologia em Saúde) – Centro de Ciências
Biológicas e da Saúde, Pontifícia Universidade Católica do Paraná, Curitiba. Disponível em:
<http://www.dominiopublico.gov.br/>. Acesso em: 29 abr. 2014.
WONG, W.; LIU, W.; BENNAMOUN, M. Ontology learning from text: A look back and into the
future. ACM Comput. Surv., 44(4):20:1–20:36, Sept. 2012.
![Page 91: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/91.jpg)
Desembarque de Cabral em Porto
Seguro (óleo sobre tela), autor: Oscar
Pereira da Silva, 1904.
![Page 92: Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de textos (versão 1.0)](https://reader030.vdocuments.com.br/reader030/viewer/2022020208/55aa6ff21a28abb7208b45af/html5/thumbnails/92.jpg)
Norton Coelho Guimarães@nortoncg
OBRIGADO!