um algoritmo de busca utilizando tesauros

Download Um Algoritmo De Busca Utilizando Tesauros

If you can't read please download the document

Upload: daniel-ferreira

Post on 16-Apr-2017

1.268 views

Category:

Technology


0 download

TRANSCRIPT

PowerPoint Presentation

Um algoritmo de busca utilizando recuperao da informao e tesauros

Aluno: Daniel Ferreira de LimaOrientao: Edgar NodaTrabalho de Concluso de Curso

Introduo

Panorama

Conceitos Bsicos

Algoritmo de busca

Obteno de contedo

Testes

Projetos futuros

Roteiro

Roteiro

Introduo

Panorama

Conceitos Bsicos

Algoritmo de busca

Obteno de contedo

Testes

Projetos futuros

Introduo

Internet Repositrios de dado

Buscas

Recuperar informao

Roteiro

Introduo

Panorama

Conceitos Bsicos

Algoritmo de busca

Obteno de contedo

Testes

Projetos futuros

BING

Panorama

Google

Panorama

Muita informao?

Panorama

Roteiro

Introduo

Panorama

Conceitos Bsicos

Algoritmo de busca

Obteno de contedo

Testes

Projetos futuros

Recuperao da informao

Forma de obter contedoInternet

Textos

Bancos de dados

Procurar por um livro

Achar contedo em um livro

Uma procura no Google

Recuperao da informao

Sinnimos Palavra (sinonimo1, sinonimo2, ..)

OrganizaoTermo inicial mais relevante

Termo final menos relevante.

Primeiro termo recebe maior pontuao (100).

s1=100sn=100-n*10 ; Condio: sn >=10

Tesauros

Tesauros

dog:dog, domestic dog, Canis familiaris

=> canine, canid => domestic animal, domesticated animal

dog (100), domestic dog(90), canis familiares(80), canine(70)

Algoritmo de buscas e recuperao da informaoUtiliza tesauros rede de computadores

Pontuao de relevncia

Obteno de contedoVrias fontes de dados

Objetivo

Roteiro

Introduo

Panorama

Conceitos Bsicos

Algoritmo de busca

Obteno de contedo

Testes

Projetos futuros

Algoritmo de busca

Dicionrio

Tesauros

Algoritmo de pontuao e seleo

Recuperao de contedo

Dicionrio

DicionrioRecebe massa de dados

Trata

Gera base de informaes

Dicionrio dinmico Se adequa a novos termos

Dicionrio

Dicionrio a ser criado: redes

Massa de dados Livro de redesExtrai termos frequentesCalcula peso dos termosCalcula peso por palavra encontradaGera XML com estas informaes

Dicionrio

...

Clculo de pontos

Ativao de categoria

t1tnsnsn

tn+sn

...

tn*sn=total de pontos para o termo

s1

sn

tn = termossn = sinnimos

Qualificao da resposta

Nvel de relevncia

Realimentao de dicionrio

DicionrioMassa de dados = nova massa de dados

Recria dicionrio

Novos termos e pesos

Roteiro

Introduo

Panorama

Conceitos Bsicos

Algoritmo de busca

Obteno de contedo

Testes

Projetos futuros

Local Rede/ Web Remoto

Obteno de contedo

Algoritmo de busca

Obteno de contedo

Busca Internet

Busca Local

Busca Remota

Busca de Mquinas

Busca Internet

Spider Site

Recupera informao

Navega link a link Gera cache

Busca Local

BuscadorSistema deArquivos

Varre diretrios

Retorna contedo

Busca Remota

ClienteClienteServidorServidor

redeEnvia objeto 'Busca Local'Aguarda o retorno

Mquina remota Executa objeto

Envia resposta

Busca Mquinas

RedeBusca mquinas

Permite buscas massivas

Exemplo: No diretrio /media/msicas/
procure *.mp3 no
endereo 10.9.8.[1-255]

Roteiro

Introduo

Panorama

Conceitos Bsicos

Algoritmo de busca

Obteno de contedo

Testes

Projetos futuros

Testes

Texto de redes passado para o buscador

Resultado:

Categoria: NETWORK

Pontos: [ 10350 ]

Relevncia: [ ALTA ]

Pontos por palavra: [ 62 ]

Testes

Texto sobre um assunto qualquer passado para o buscador

Resultado:

Categoria: NETWORK

Pontos: [ 0 ]

Relevncia: [ BAIXA ]

Pontos por palavra: [ 0 ]

Roteiro

Introduo

Panorama

Conceitos Bsicos

Algoritmo de busca

Obteno de contedo

Testes

Projetos futuros

Projetos futuros

Aplicao de redes neurais com propagao

Suporte a outras categorias e idiomas (deteco)

Utilizao da Wordnet Outros relacionamentos alm de sinnimos

Usar semntica das tags HTML para influenciar pontuao (hn, p, b)

Utilizao de agentes

Mltipla ativao

Busca em outros tipos de contedoImagens, vdeo, udio

Concluso

Resultado do algoritmo

Necessidade dos algoritmos de busca

Quantidade de informaoAumento exponencial

Novas formas de gerar contedoTwitter, blogs, waves

Aluno: Daniel Ferreira de LimaFIM
\n

Complementos

Demonstraes prticas

Linguagem de programao: Python

33 mdulos, 15 classes

Demo:slide31.py

slide37.py

Bibliografia

http://tinyurl.com/lkzlx4

http://tinyurl.com/m2x2xq

http://tinyurl.com/5psocx

FAM - Faculdade de AmericanaNovembro de 2009

Muokkaa otsikon tekstimuotoa napsauttamalla

Muokkaa jsennyksen tekstimuotoa napsauttamallaToinen jsennystasoKolmas jsennystasoNeljs jsennystasoViides jsennystasoKuudes jsennystasoSeitsems jsennystasoKahdeksas jsennystasoYhdekss jsennystaso

Baixa Mdia Alta

Relevncia

0 1