extração da informação cirdes borges, flávio dantas, rafael barbosa, samuel arcoverde, tiago...
TRANSCRIPT
![Page 1: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/1.jpg)
Extração da Informação
Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha
Modificado por Flávia Barros
![Page 2: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/2.jpg)
Índice
Motivação Introdução Processo de extração da informação Abordagens para um sistema de EI Desafios Conclusão
![Page 3: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/3.jpg)
Motivação
Problema:
Vasta quantidade de documentos textuais na Web Como apresentar ao usuário apenas o que interessa?
Como transmitir os dados entre Web services e bases de dados existentes? Necessário definir templates
![Page 4: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/4.jpg)
Motivação O que se quer?
Respostas relevantes para o usuário Não apenas links para documentos
Gerar resumos/sumários de textos
Minerar dados
Preencher Base de dados e Bases de conhecimento
![Page 5: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/5.jpg)
Introdução
Sistemas de Extração de informação (EI) visam Localizar e extrair,informações relevantes em um
documento ou uma coleção de documentos De forma automática A fim de preencher um template de saída.
![Page 6: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/6.jpg)
Extração de informação
Trata o problema de extração de dados relevantes a partir de uma coleção de documentos.
Os dados a serem extraídos são previamente definidos em um template (formulário)
CriaçãoDos slots
Documentocom tags
Tabelas com campos pré-definidos ou templates
![Page 7: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/7.jpg)
Extração de informação
Sistema de
Extração de
Informação
Sistema de
Extração de
Informação
![Page 8: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/8.jpg)
Exemplo de Sistema de EI
![Page 9: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/9.jpg)
Exemplo de Sistema de EI
![Page 10: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/10.jpg)
RI x EI Recuperação de Informação
Recupera documentos relevantes baseando-se em cálculos estatísticos sobre os termos que ocorrem no documento.
Visualiza o documento apenas como um conjunto de palavras.
Extração de Informação Extrai informações relevantes baseando-se no domínio de
conhecimento do documento Filtra o resultado de uma tarefa de RI graças a restrição do
domínio Busca derivar conhecimento dos documentos recuperados
segundo a estruturada do documento.
![Page 11: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/11.jpg)
Breve História
JASPER (1980s) Sistema para finanças
MUC-Message Understanding Conference [final da década de 80]
Internet/Web [década de 90]
![Page 12: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/12.jpg)
Abordagens para Sistema de EI
Observamos nos sistemas de Extração de Informação a distinção entre duas abordagens: Engenharia de conhecimento Aprendizagem de Máquina
As abordagens são diferenciadas pela forma com que as regras são definidas
![Page 13: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/13.jpg)
Engenharia de conhecimento Construção de regras é feita manualmente. Requer que um especialista em sistemas de
Extração de Informação participe efetivamente da criação das regras.
Construção baseada no conhecimento que o engenheiro possui do cenário e domínio com o qual vai trabalhar.
Precisão nos resultados é maior. O tempo de desenvolvimento é maior Possibilita reuso de regras e extensibilidade
Para lidar com pequenas mudanças no template
Alana Brito – Fernando Rodrigues – Josias Barbosa 05/05/2010
![Page 14: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/14.jpg)
Aprendizagem de Máquina Utiliza algoritmos de Inteligência Artificial
Algoritmos de treinamento automático Para indução de regras de extração
Um corpus de documentos etiquetados é usado para treinamento e vallidação das regras induzidas
Tempo menor de desenvolvimento Boa precisão nos resultados Difícil adaptação a novos domínios/problemas
(reuso) Requer novo processo de treinamento
![Page 15: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/15.jpg)
Tipos de texto e Técnicas para EI A técnica mais adequada para construir o sistema
de EI depende do tipo do texto a ser tratado
Processamento de Linguagem Natural – PLN Textos livres
Wrappers Textos estruturados
com formato predefinido e rígido Textos semi estruturados
permitem a ocorrência de variações na ordem e no formato dos dados
E.g., notícias de classificados de jornal
![Page 16: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/16.jpg)
Processamento de Linguagem Natural – PLN
Utilizado no tratamento de documentos com pouco ou nenhum grau de estruturação
Caracteriza-se pela análise e manipulação ou codificação de informações expressas em língua natural
![Page 17: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/17.jpg)
PLN – Níveis de Análise Nível Morfológico
Estuda a constituição das palavras em seus elementos básicos;
Nível Sintático Determina a relação entre as palavras em uma sentença
(papel) Nível Semântico
Determina o significado e inter-relacionamento semântico das palavras
Nível Discursivo Estuda as relações entre sentenças
Nível Pragmático Estuda o objetivo do uso da língua
![Page 18: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/18.jpg)
Nível Morfológico
A análise Morfológica determina: O radical + sufixo da palavra, e geralmente constrói um dicionário adicionando informações relacionadas como: Classe da palavra Conjugação Pessoa A análise morfológica pode ser implementada através de algorítmos baseados em regras
eats eat + s verbo, singular, 3rd persdog dog nome, singular
![Page 19: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/19.jpg)
Nível Sintático A análise sintática faz uso do dicionário gerado pela
análise morfológica procurando mostrar relacionamento entre palavras.
As palavras que apresentam apenas um sentido possível podem ser substituídas pela sua representação semântica
Tem como saída a representação da sentença que representa as dependências entre palavras
As sentenças de exemplo apenas diferem na sintáxi e apresentam significados diferentes
‘The dog chased the cat.’ ‘The cat chased the dog.’
![Page 20: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/20.jpg)
Nível Semântico
Não é apenas neste nível que o significado é determinado, todos os níveis contribuem para a determinação do significado
O nível semântico determina o possível significado de uma sentença, focando nas interações entre os significados das palavras na sentença
Desambigüidade semântica
A cabeça une-se ao tronco pelo pescoçoEle é o cabeça da rebeliãoSabrina tem boa cabeça
![Page 21: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/21.jpg)
Nível Discursivo
Analisa textos maiores que sentenças Foca nas propriedades do texto como um
todo, determinando significado através das conexões de sentenças
Resolução de Anáfora: Substituição de pronomes pelas entidades que eles referenciam
Reconhecimento de Estrutura de Texto: Em um jornal temos; Artigos de capa, opniões, eventos passados, anúcios
![Page 22: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/22.jpg)
Nível Pragmático
Foca no significado que vai além do contexto do texto
Requer um conhecimento global Os exemplos seguintes utilizam anáforas mas as
resoluções necessitam de um conhecimento global
Os vereadores recusaram receber os manifestantes, porque eles temiam o confrontoOs vereadores recusaram receber os manifestantes, porque eles defendiam a revolução.
![Page 23: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/23.jpg)
Processo de extração de informação
Documento
Analisador sintático/semânti
co
Integração e preenchimento de templates Templates preenchidos
Processador léxico
Analisador do discurso
Reconhecimento de nomes
Padrões de extração
![Page 24: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/24.jpg)
ClusterizaçãoAssociaçãoClassificação
Processo de extração de informaçãoEI
Segmentação
Microsoft CorporationCEOBill GatesMicrosoftGatesMicrosoftBill VeghteMicrosoftVPRichard StallmanfounderFree Software Foundation
Microsoft CorporationCEOBill GatesMicrosoftGatesMicrosoftBill VeghteMicrosoftVPRichard StallmanfounderFree Software Foundation
Cluster A
Cluster B
Cluster C
![Page 25: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/25.jpg)
Problemas com sistemas de PLN
Maior desenvolvimento da WEB nos anos 90... Necessidade de sistemas mais eficientes
Sistemas baseados em PLN são computacionalmente caros
Baixa precisão nos resultados Devido à imprecisão e à flexibilidade das línguas
naturais
![Page 26: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/26.jpg)
Wrappers Extraem informação de documentos
A fim de preencher templates Relembrando...
Textos estruturados com formato predefinido e rígido
Textos semi estruturados permitem a ocorrência de variações na ordem e no
formato dos dados Utilizam dados sobre a formatação do texto,
marcadores, freqüência estatística das palavras, etc.
![Page 27: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/27.jpg)
Wrappers - Técnicas de Extração
Autômatos finitos
Casamento de padrões
Classificadores de texto
Modelos de Markov escondidos (HMM)
![Page 28: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/28.jpg)
Autômatos Finitos
Regras de extração na forma de autômatos finitos
Bons para textos estruturados e semi estruturados
Definidos manualmente ou aprendidos automaticamente.
Definidos por: Estados que “aceitam” os símbolos do texto que
preenchem algum campo do fórmulario de saída Os estados que apenas consomem os símbolos
irrelevantes encontrados no texto Os símbolos que provocam as transições de
estado
![Page 29: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/29.jpg)
Autômatos Finitos
![Page 30: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/30.jpg)
Casamento de Padrões Padrões descritos através de expressões
regulares (ER) que “casam” com o texto para extrair as informações.
ER mais intuitivas do que autômatos.
Exemplo:
![Page 31: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/31.jpg)
Classificadores de Texto Textos semi-estruturados Documento é dividido em fragmentos
podendo utilizar várias características de cada segmento para a classificação tamanho, posição, formatação, presença de palavras
Desvantagem: realiza classificação local independente para cada fragmento, erdendo informações estruturais importantes do
documento
![Page 32: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/32.jpg)
Classificadores de Texto
Classificam fragmentos do documento para determinar que campo do fórmulario eles devem preencher
![Page 33: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/33.jpg)
Classificadores de Texto
![Page 34: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/34.jpg)
Modelos de Markov Escondidos (HMM) Textos livres e semi-estruturados. Verifica a ocorrência de padrões em sequência
no texto de entrada. Maximiza a probabilidade de acerto para o
conjunto todo de padrões.
![Page 35: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/35.jpg)
Modelos de Markov Escondidos (HMM) É um autômato finito probabilístico que
consiste em: Um conjunto de estados ocultos Uma probabilidade de transição entre os
estados ocultos Um conjunto de símbolos emitidos pelos
estados ocultos Uma distribuição de probabilidade de emissão
de cada símbolo que pertence ao conjunto de símbolos para cada estado oculto
Processo de classificação Algoritmo de Viterbi Retorna a sequência de estados ocultos com
maior probabilidade de ter emitido cada sequência de símbolos de entrada.
![Page 36: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/36.jpg)
Modelos de Markov Escondidos (HMM)
![Page 37: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/37.jpg)
Modelos de Markov Escondidos (HMM) Vantagens
Classificação ótima para a sequência de entrada Desvantagens
Não é capaz de fazer uso de múltiplas características de Tokens
por exemplo, formatação, tamanho e posição
![Page 38: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/38.jpg)
Construção de Wrappers
Automática Define regras de extração com um corpus de
treinamento com de técnicas de aprendizagem de máquina.
Semi-automática Auxiliado por ferramentas, o usuário especifica a
estrutura e o contexto dos dados a serem extraídos.
Manual Mais demorada e trabalhosa, porém com maior precisão
nos dados extraídos.
![Page 39: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/39.jpg)
PLN x Wrappers
![Page 40: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/40.jpg)
Desafios
Técnicas de Extração “Dividir pra Conquistar” Linguagem natural Idiomas Métricas de avaliação Classificar stop words Apredizagem de Máquina
![Page 41: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/41.jpg)
Desafios
Ontologias Acesso do Usuário Conteúdo preciso, claro Padrões de Ontologia
![Page 42: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/42.jpg)
Aplicações de EI
Filtragem de Fóruns Controle de Conteúdo Assunto do Dialogo
Monitoramento da WEB Buscar por Hackers Busca por Terroristas
![Page 43: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/43.jpg)
Aplicações de EI Extração de Informações Estratégicas
Inteligência de Negócios Análise de mercado
Análise de Arquivos de LOG Análise de LOGs de erro Análise de LOGs de acesso
![Page 44: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/44.jpg)
Conclusões
Extrair Informação é preciso Web é um pandemônio de informações Precisamos de soluções inteligentes
![Page 45: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/45.jpg)
Dúvidas
![Page 46: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/46.jpg)
Referências MANFREDINI, V. H.; Proposta de uma Técnica de
Extração de Informação de Arquivos de Log de Servidores Proxy
Silva, E. F. A.; Barros, F. A.; Prudencio, R. B. C.; Uma Abordagem de Aprendizagem Híbrida para Extração de Informação em Textos Semi-Estruturados
http://en.wikipedia.org/wiki/Information_extraction
Liddy, E. D. In Encyclopedia of Library and Information Science, 2nd Ed. Marcel Decker, Inc http://www.cnlp.org/publications/03NLP.LIS.Encyclopedia.pdf
![Page 47: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/47.jpg)
Referências
Schneider O. M., Rosa, L.J., Processamento de Linguagem Natural (PLN), http://moschneider.tripod.com/pln.pdf
Aranha C., Passos E. A Tecnologia de Mineração de Textos, PUC-RIO
Bulegon H., Moro M. C. C., Text Mining and Natural Language Processing in Discharge Summaries, PPGTS,PUCPR
http://143.54.31.10/reic/edicoes/2003e2/tutoriais/MineracaoNaWeb.pdf
![Page 48: Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros](https://reader036.vdocuments.com.br/reader036/viewer/2022062819/5706386b1a28abb823904fca/html5/thumbnails/48.jpg)
Referências
www.cin.ufpe.br/~if796/2006-1/ExtracaoInformacao.ppt
http://sare.unianhanguera.edu.br/index.php/rcext/article/viewFile/413/409
MELO, Taciana. Um Sistema Especialista para Extração e Classificação de Receitas Culinárias em Páginas Eletrônicas. Trabalho de Conclusão de Curso. UFPE, CIn. 2000. - www.cin.ufpe.br/~tg/2000-2/tmlm.doc