sri modelos

39
SISTEMAS DE RECUPERAÇÃO SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÃO - SRI DE INFORMAÇÃO - SRI Profa. Odete Máyra Mesquita

Upload: mayramesquita

Post on 18-Aug-2015

243 views

Category:

Documents


3 download

DESCRIPTION

Apresentação

TRANSCRIPT

SISTEMAS DE RECUPERAO SISTEMAS DE RECUPERAO DE INFORMAO - SRIDE INFORMAO - SRIProfa. Odete Myra MesquitaOrigemOrigemDesdeseunco,eestmestadofortemente reaconadosaodesenvovmentotecnogco, tantonoqueconcerneasteecomuncaes bemcomocomaaparodosprmeros computadores.Utzadosparagerencaraexplosoda informaonateraturacentcaepara facilitaravidadousurioparaqueo mesmopudesseencontrarnoemaranhado deinformaesaqueasqueatendessemas suas necessdades nformaconas.DefniesDefniesAs denes de SRI buscam abranger as necessdades de nformao e as vras metodoogas e tecnoogas que, atravs dos tempos, foram geradas para atender a essas necessdades, desde as atvdades de organzao de coees de documentos em acervos bbogrcos, at os modernos sstemas nformatzados que dam com documentos em formato dgta (SOUZA, 2006).MOOERS (1951):"engobaosaspectosintelectuaisda descrodenformaesesuas especifcidadesparaabusca,amde quasquersstemas,tcncasoumqunas empregadasparaodesempenhoda operao".Desde Mooers, a Recuperao de Informao (RI) tem sdo desenvovda e aperfeoada, transformando-se em uma atvdade mut e nterdscpnar, podendo ser consderada como vertente tecnogca da CI (SARACEVIC, 1999).Embora a proposta de Mooers parea novadora, na readade, o sentdo de seu conceto | vnha sendo utzado na prtca dos antgos bbotecros. Ana, na preocupao do campo da Bboteconoma os aspectos de tratamento e recuperao de nformao sempre estveram presentes. Apesar das mportantes mudanas produzdas, nestes pouco mas de 50 anos, nos suportes e mtodos empregados bem como no tpo e formatos de nformao, a essnca do sgncado do termo Recuperao de Informao permanece nvarve. Cendn (2005, p. 62), "consstenabuscadeumacoeodedocumentos paradentcaraqueesquesatsfazemuma determnadanecessdadedenformaoeosSRIso aquees sstemas crados para factar essa busca". Ortega (2006, p. 1) armaqueum(SRI)podeserdendocomoum con|untodedadospadronzados,armazenadosem meo eetrnco, utzados para dentcar nformao e fornecer sua ocazao. Robredo (2005) adescrevecomopartentegrantedoprocessogoba degestodanformaoedoconhecmento.Para tanto,nodeveserdssocadadanecessdadede estruturaodedadosenformaonadescro,na organzao e na armazenagemSe acompanharmos a evouo tecnogca e, consequentemente os SRI, nos daremos conta de que ees se desenvoveram de forma muto rpda, comparatvamente s dcadas anterores. Ao ongo de mas de cnquenta anos de seu aparecmento, dversas stuaes socas, potcas e econmcas estmuaram o desenvovmento desses sstemas.Misso fundamentalMisso fundamentalSempre esteve pautada em responder s necessdades dos usuros e suprmr as dcudades que se coocavam na busca de nformao.Dto de outro modo, permtr que um usuro recupere documentos atravs de certas caracterstcas especcas (por autor, ttuo conhecdo, assunto ou quaquer combnao desses eementos).Processo de RI e seus ComponentesProcesso de RI e seus Componentes Pode-se dzer que a RI um processo no qua se reazam uma sre de atvdades orentadas a procurar e encontrar nformao reevante que a|ude a satsfazer as necessdades nformaconas dos usuros. Como dz Edberto Ferneda (2012, p. 13) o usuro de um SRI geramente est "nteressado em recuperar nformao sobre um determnado assunto e no em recuperar dados que satsfaam somente sua expresso de busca". "Essa caracterstca o que dferenca os Sstemas de Recuperao de Informao dos Sstemas de Bancos de Dados". OsSstemasdeBancodeDadostmporob|etvoa recuperaodetodosostensquesatsfazems condesformuadasatravsdeumaexpressode busca. | em um SRI, essa precso no to estrta. A prncpa razo para esta dferena est na natureza dos ob|etos tratados por estes dos tpos de sstema. oOsSRIdamcomtextoseherdamtodososprobemas ntrnsecosaotratamentodanguagemnatura, portanto,soafetadospeasub|etvdadedoser humano. oOSstemadeBancodeDadosorganzatensdedados, que tm uma estrutura e uma semntca bem dendas (FERNEDA, 2003). SegundoCendn(2003),normamenteosSRIdam com documentos que contm texto e esse o grande probema,peofatodesedefrontarcoma ambgudade da paavra na recuperaoSRIs podem ser estudados como "um con|unto de operaes consecutvas, executadas para ocazar uma nformao necessra ou documentos que a contenham, com a recuperao subsequente desses documentos".(CESARINO, 1985, p. 158)Modelo de Recuperao de Modelo de Recuperao de InformaoInformaoRepresentao dos documentos: Busca descrever ou dentcar cada documento do atravs de seu contedo.Sendo,amehorformadereazaressarepresentao por meo da ndexao.Representao da expresso de busca: Refere-setraduodaexpressodebuscaformuadapeo usuro para a nguagem utzada peo sstema;Funo de busca: "Comparaasrepresentaesdosdocumentoscoma representaodaexpressodebuscadousuroerecuperaos tensquesupostamentefornecemanformaoqueousuro procura" (FERNEDA, 2012, p. 19).UsabilidadeUsabilidadeUsurio: Apartrdesuanecessdadedenformaorinteragircom um!"amdebuscardocumentosqueatendamta necessdade; Expresso de busca: Trata-sedomeioqueousuroapcaparacomunicarasua necessidade de informao para o sstema. Esses termos so geramenteespeccadosemlinguagemnaturaloupormeo deumalinguagemartifcial,dependendodosrecursos oferecdos peo sstema (FERNEDA, 2012); Resultados da busca: Soexpressospormeodeumalistaderefer#nciasde documentos que supostamente so relevantes para suprr a necessdade de nformao do usuro (BANHOS, 2008).O ponto essenca que precsa ser consderado ao se buscar resover probemas de RI e que no se encontra no domno de mqunas e sstemas o eemento usurio, responsve no apenas por formuar representaes de nformao ou de busca, mas por desgnar o carter sub|etvo de mportnca aos resutados apresentados em uma busca. Como o prpro ser humano que dene quadade para resutados de consutas, nada mas natura que caracterstcas cogntvas, como comportamento e contextuazao, se|am avo de modeagem especca para recuperar nformaes RI|SBERGEN, 1979). De acordo com Gonzez de Gmez (2003, p. 56) a RI temsdoestudada,nareadaCI,atravsdeduas grandes vertentes: oaprmeranaperspectvadossstemasdenformao (informationsearching),consttundoumcenrodebuscas formazadas; oeasegundanaperspectvadeumcenrodebuscasno formazadasdenformao(informationseeking),quese assentanosprncposdequenecessro"|...|conhecero modo como as pessoas denem, cram e buscam a nformao eascondesquefactamounbemseuacessonos cotdanos de gerao e uso de nformao". Dessemodo,observamosque,aoongodeseu desenvovmento,ocampodaRItemsdo nuencadospordosparadgmasoutendncasem suasprtcas,concepesenvestgaes,os denomnados: enfoque centrado nos sistemas e o enfoque centrado nos usurios.Viso centrada no sistema O probema consste prncpamente em construr ndces ecentes, processar consutas de usuros com o mehor desempenho possve, e desenvover agortmos de ordenao que possam trazer quadade resposta do usuro" (CARDOSO, 2003). Desta forma, a RI se reduz a uma atvdade muto smpes, em que se observam stuaes, como quando a soctao de nformao do usuro no corresponde com a stagem de documentos, nesses casos, se reaza uma anse peo prpro sstema. Neste sentdo, ambas as entdades, usuro e sstema, so vstas como undades ndependentesRecuperao da nformao no enfoque centrado no sstemaFonte: Mans e Vesquez (2006).Viso centrada no usurio"O probema prncpamente consste no estudo da conduta do usuro, no entendmento de suas prncpas necessdades, e em como este entendmento afeta a organzao e as operaes do SRI" (CARDOSO, 2003, p.5). Este enfoque ncu o usuro como um eemento a mas do SRI e ao ncur a este, ncorpora tambm ao meo do mesmo.Recuperao da nformao no enfoque centrado no usuroFonte: Mans e Vesquez (2006).Estratgias de BuscaEstratgias de BuscaDefniesDefniesROWLEY (1994):"Con|untodedecsestomadase procedmentosadotadosduranteuma busca"LOPES (2002):"Tcncaoucon|unto deregras paratornar possveoencontroentreumapergunta formuadaeanformaoarmazenadaem uma base de dados".CENDON (2005):"Umpanoqueserveparaencontrara nformaodese|adaemquevras expresses de busca podem ser utzadas". Modelos de Estratgias de BuscaModelos de Estratgias de BuscaBooeanoVetoraProbabstcoProcessamento de Lnguagem NaturaFuzzyRedes NeurasModelo BooleanoModelo BooleanoModeo baseado na teora de con|untos e na gebra de George Booe.Agebrabooeanaumsstemabnronoqua exstemsomentedosvaorespossvesparaquaquer smboo agbrco: 1 ou 0, verdadero ou faso.Asconsutasseexpressamcomoexpressesbooeanas com uma semntca cara e concreta: Operadores booeanos AND (E ou +) NOT (NO ou -) OR (OU)Prncpas probemas Ausnca de ordem na resposta; Respostas podem ser nuas ou muto grandes. ExemploExemplo bboteconoma AN bbotecro AN !UR prossona da nformao podera ser representada pea segunte operao entre con|untos:Coleo completaConj.de docs. que contm bibliotecrioConj.de docs.que contm profissional da informaoConj.de docs.que contm biblioteconomiaConjunto resposta Operadores de ProximidadeOperadores de ProximidadeSurgmento dos sstemas de texto competo. $%& - Permte pesqusar duas paavras ad|acente no texto deumdocumento,naordemespeccadanaexpresso de busca. - Pronto AD| Socorro/ "Pronto Socorro" '($!(ndeproxmdade)-Permtepesqusaruma paavra prxma da outra, denndo o nmero de paavras de dstnca. - Recuperao NEAR/10 Informao )"*+-Permterecuperardocumentoscu|ostermos apareamnomesmopargrafo.-RecuperaoWITH Informao $M(-Permterecuperardocumentoscu|ostermos apareamnamesmasentena-RecuperaoSAME Informao Frase Exata - "Recuperao de Informao" ComposodeOperadores-"Recuperaode"AD| (nformao OR documentos)Modelo VetorialModelo VetorialOmodeovetora,outambmchamadodemodeo espao vetora, prope um ambente no qua possve obterdocumentosquerespondemparcialmentea uma expresso de busca. Isto feto associando,se pesos tanto aos termos de ndexao dos documentos como aos termos utzados na expresso de busca. Esses pesos so utili-ados para calcular o grau de similaridade entre a expresso de busca e cada um dos documentos do corpus. Como resutado, obtm-se um con|unto de documentos ordenado peo grau de smardade de cada documento em reao expresso de busca.O Sistema SMARTO Sistema SMARTO pro|eto SMART ("#stem for the $anipulation and Retrie%al of &ext)tevencoem1961naUnversdadedeHarvarde mudou-se para a Unversdade de Corne aps 1965. O sstema SMART o resutado da vda de pesqusa de Gerard Satoneteveumpapesgncatvonodesenvovmentode toda a rea da Recuperao de Informao. O SMART uma mpementao do modeo vetora, proposto peo prpro Saton nos anos 60.OsstemaSMARTforneceummtodoautomtcoparao ccuodospesosnosdosvetoresquerepresentamos documentos, mas tambm para os vetores das expresses de busca.Modelo ProbabilsticoModelo ProbabilsticoNamatemtca,ateoradasprobabdades estuda os expermentos aeatros que, repetdos emcondesdntcas,podemapresentar resutados dferentes e mprevsves.Issoocorre,porexempo,quandoseobservaa face superor de um dado aps o seu anamento ouquandosevercaonapedeumacarta retrada de um baraho.Porapresentaremresutadosmprevsves, possveapenasestmarapossbdadeoua chance de um determnado evento ocorrer.Tentarepresentaroprocessoderecuperaode nformao sob um ponto de vsta probabstco.Dadaumaexpressodebusca,pode-sedvdro corpus(comNdocumentos)emquatrosubcon|untos dstntos:Re: con|unto dos documentos reevantes;Rec: con|unto dos documentos recuperados;RR:con|untodosdocumentosreevantesqueforam recuperados;No recuperados e no reevantes O con|unto dos documentos reevantes e recuperados RR resutante da nterseo dos con|untos Re e Rec.Processamento da Linguagem NaturalProcessamento da Linguagem NaturalSurgecomoumapossveabordagemdos probemasreaconadosrecuperaode nformaopeasmpesobservaodequeos documentos e as expresses de busca formuadas peos usuros so ob|etos ngustcos. O PLN um con|unto de tcncas computaconas paraaansedetextosemumoumasnves ngustcos,comopropstodesmuaro processamento humano da ngua.Odesenvovmentodesstemasderecuperaode nformaoquepodem"entender"osdocumentos exgetcncascomputaconasdegrande compexdade.Porestarazo,namaoradasvezes astcncasdePLNsoutzadasapenasna mehoradodesempenhodeagumastarefasda recuperaodenformaotradcona,comoa ndexao automtca (FALOUTSOS; OARD, 1995).Atravs do PLN a Cnca da Informao se aproxma doarsenametodogcodaIntegncaArtcae vabza soues para aguns de seus probemas;Modelo FuzzyModelo FuzzyNaconcepotradconaumeementopertenceou noaumdetermnadocon|unto,damesmaforma comonomodeobooeanoumdocumentoouno reevante para uma determnada expresso de busca.Porm, em um sstema de recuperao de nformao essemtecaroeprecsonoexste.Entreum documentoreevanteeumno-reevantepodem exstem gradaes (reevnca parca) com as quas o modeo booeano no consegue dar.Agrandemaoradosexpermentosreazadoscom este modeo consdera apenas pequenos corpora, que nocomprovamsuaefetva superordade emreao a outros modeos de recuperao de nformao.Redes NeuraisRedes NeuraisMozer(1984)fooponeronautzaodetcncas de RNA na recuperao de nformao.Ee utzou uma arqutetura bastante smpes que no empregavaumadasprncpascaracterstcasdas redes neuras, que a capacdade de aprender.AguramostraumexempoapresentadoporFord (1991,p.108),queutzaaarquteturadeRNA deazada por Mozer.RefernciasRefernciasCARDOSO, Onda Noguera Paes. !ecuperao de "nformao. Lavras: UFLA, 2003.CESARINO, Mara Augusta da Nbrega. Sstemas de Recuperao daInformao.!evistada(scolade.iblioteconomiada /0M12 .elo +ori-onte, v.14, n.2, set., 1985.FERNEDA, Edberto. !ecuperao de "nformao: anse sobre acontrbuodaCncadaComputaoparaaCncada Informao.2003.147f.Tese(DoutoradoemCncada Comuncao) - Escoa de Comuncao e Artes, Unversdade de So Pauo, So Pauo, 2003.LOPES,IzaLete.Estratgcadebuscanarecuperaoda nformao:revsodeteratura.!evista3i#nciada "nformao,Brasa,v.31,n.2,p.60-71,mao/ago,2002. Dsponveem:.Acesso em: 03 out. 2006.