notas sobre agentes inteligentes

Download Notas sobre agentes inteligentes

If you can't read please download the document

Upload: necio-de-lima-veras

Post on 27-May-2015

589 views

Category:

Documents


1 download

TRANSCRIPT

  • 1. Notas sobreAgentes InteligentesNcio de Lima Veras

2. O que um Agente? Qualquer coisa que pode perceber seu ambienteatravs de sensores e interagir com ele por meiode atuadores. Exemplos O ser humano possui viso e audio como sensores e mo epernas como atuadores. Um rob possui cmeras e localizadores como sensores emotores como atuadores. Um software possui arquivos de entrada, pacotes de rede, basede dados como sensores e atua escrevendo arquivos, enviandopacotes, exibindo dados em telas, . 3. Em imagem... 4. Agent Function O comportamento de um agente descrito pelo agent function que mapeia qualquer sequncia de percepo para uma ao; uma descrio matemtica abstrata; Pode ser descrito com uma tabela de percepes e aes; Agent ProgramInternamente, o agent function para um agente inteligente implementado por um agent program;Materializa o comportamento do agente; Assim temos:Uma caracterizao externa (abstrao matemtica - agent function);Uma caracterizao interna (concretizao do agente agent program);Uma arquitetura de agente que capaz de por em funcionamento o agente. 5. Comportamentos deAgentes 6. Um agente pode ser racional um agente que faz a coisa certa; Para cada entrada na tabela do agent function preenchido corretamente uma sada (ao); Mas o que significa fazer a coisa certa? Podemos dizer que uma ao correta ir gerarum resultado mais correto ainda; Mas, para tanto preciso saber mensuraresse sucesso (ou performance); Assim, essa mensurao contm os critrios desucesso para um bom comportamento de agente; 7. Um agente racionalEnto a racionalidade de um agentedepende basicamente de quatro coisas: A mensurao que define os critrios de sucesso; O conhecimento prvio do ambiente; As aes que podem ser realizadas; As sequncias de percepo de um perodo; o histrico de qualquer coisa queo agente pde perceber. 8. Um agente racional Definio: Para cada sequncia de percepespossvel, um agente racional deve selecionaruma ao que esperada para maximizar aavaliao de performance, dada a evidnciafornecida pela sequncia de percepes detodo o conhecimento incorporado ao agente. 9. Oniscincia Capacidade de saber de tudo infinitamente!! Deus do saber! Um agent omniscience sabe o atual resultadodas suas aes e pode agir adequadamente; Porm, na realidade a oniscincia impossvelpara um agente. O exemplo de um idiota morre atingido por umconteiner ao atravessar a rua mostra que aracionalidade no a mesma coisa que perfeio; 10. Information Gathering(coleta de informaes) Aes que devem ser realizadas de modo amodificar percepes futuras; Exemplo: a travessia da rua olhando para ambos os lados; um agente aspirador de p realizando uma exploraode um ambiente inicialmente desconhecido; uma importante parte da racionalidade; 11. Learning (aprendizagem) Um agente deve aprender o mximo possveldo que ele percebe; Uma configurao inicial poderia refletir algumconhecimento anterior do ambiente, mascomo o agente ganha conhecimento entoisto pode ser modificado e aumentado; 12. Autonomy (autonomia) Um agente autnomo precisa basear-se emsuas prprias percepes ao invs doconhecimento anterior do seu projetista; Um agente racional deve ser autnomo; Ele deve aprender tudo que puder paracompensar um conhecimento anterior parcial ouincorreto; 13. A natureza do ambiente 14. Ambiente Basicamente um ambiente o problema que oagente dever ser a soluo; Um ambiente de tarefa formado por PEAS(Performance, Environment, Actuatos, Sensors); Deve ser especificado de forma mais completapossvel durante a concepo de um agente(inclusive, retirando conflitos para as medidas dedesempenho); 15. Ambiente: um exemplo PEAS paraum motorista de txi 16. Ambiente: outros exemplos 17. Propriedades dosAmbientes de Tarefas 18. Sobre a cobertura de observao Totalmente observvel: Os sensores detectam todos os aspectos que sorelevantes para a escolha da ao; Os agente no precisa manter nenhum estado internopara controlar o mundo; Parcialmente observvel: Ou os sensores so imprecisos e possuem rudos; Ou os estados esto ausentes nos dados dos sensores; Ex.: o motorista de txi no pode saber o que os outrosmotoristas esto pensando. 19. Sobre a mudana de estado Determinstica: O prximo estado do ambiente completamente determinadopelo estado atual e pela ao executada; Estocstica: Quando a completa determinao do prximo estado no forpossvel; Cuidados: Um ambiente parcialmente observvel pode parecer estocstico. frequentemente melhor considerar que um ambiente determinstico ou estocstico pelo ponto de vista do agente. Se um ambiente determinstico exceto pelas aes de outrosagentes ento ele estratgico. 20. Sobre observaes durante asmudanas de estado Episdico: Nesse ambiente a experincia do agente dividida emepisdios atmicos, onde cada episdio gera uma nica ao; importante que cada ao s dependa dela mesma e queela no interfira em aes futuras; Ex: localizao de peas defeituosas em uma esteira rolantede uma linha de montagem; Sequencial: A deciso (ao) atual afeta todas as futuras aes; So mais complexos, pois os agentes precisam pensar frente; Ex: jogar xadrez ou dirigir um txi. 21. Sobre mudanas no prprio ambiente Dinmico: Quando um ambiente pode se alterar enquanto um agente estiverdeliberando ento esse ambiente dinmico para esse agente; Ex: dirigir o txi; Esttico: O ambiente no muda durante as deliberaes do agente. So mais simples; Ex.: jogo de palavras cruzadas; Semidinmico: quando o ambiente no muda com o tempo, mas o agentesobre alteraes no seu desempenho; Ex: jogo de xadrez com contagem de tempo. 22. Sobre o estado do ambiente Esto relacionados com o nmero de estadospossveis, o modo como o tempo tratado e aindaas percepes e aes dos agentes; Discreto: Ex.: o ambiente do xadrez discreto porque temos umnmero finito de estados distintos; Contnuo: Ex: Dirigir um txi um problema de estado contnuo etempo contnuo. As aes tambm so contnuas. 23. Sobre a atuao do(s) agente(s) em um ambiente Agente nico: Ambiente povoado com um nico agente capaz deresolver o problema; Ex.: um agente que resolve o jogo das palavras cruzadas; Multiagentes: Ambiente povoado com dois ou mais agentes que secomportam e possuem objetivos diferenciados; Esses comportamentos podem ser visando: competio,cooperao, comunicao, etc. Ex: jogo de xadrez que dois agentes se enfrentam. 24. O ambiente mais hostil Parcialmente observvel Estocstico Sequencial Dinmico Contnuo Multiagente As situaes reais so to complexas que para finalidades prticas devem ser tratadas comoestocsticas. 25. A estrutura dos Agentes 26. Entendendo... O objetivo projetar um programa de agentepara implementar uma funo de agente deforma a mapear as percepes em aes;Esse programa precisar ser executado emalgum dispositivo de computao dotado desensores e atuadores. Arquitetura 27. Ento... Agente = Arquitetura + Programa Obviamente o programa deve ser apropriadopara a arquitetura; Se o programa precisa caminhar ento naarquitetura deve existir o atuador perna. 28. Agentes reativos simples o agente mais simples de todos! Ele seleciona aes com base na percepoatual e ignora o histrico de percepes; Diagrama esquemtico: 29. Agentes reativos simples Programa de agente genrico: Esses agentes podem recorrer aaleatoriedade para escapar de laos infinitos(ou fugir de falhas fsicas). 30. Agente reativo simples:nossos exemplos concretosAgente irrigador deAgente designador decultura. tarefas e gerncia em uma equipe de projeto. PercepoAoPercepo AoSolo seco e temp. > 22 Irrigar 10 Nova tarefa Designar a tarefa para um membro da equipeSolo seco e temp. < 22 Irrigar 3Novo projeto Designar gerenteSolo mido e temp. > 22Irrigar 5TarefaDesignar ouros membros para atrasadauma tarefaSolo mido e temp. < 22Irrigar 1TarefaRemanejar membros para adiantada outras tarefasSolo enchar. e temp > 22 Irrigar 12 ProjetoDesignar outro gerente problemticoSolo enchar. e temp < 22 Irrigar 4... ... 31. Agentes reativos baseados emmodelos Agente que pode controlar parte do mundo que eleno v; Ele deve manter um estado interno com histrico depercepo de modo que seja possvel us-los emalguns dos aspectos no observados do estado atual. Para isso ele deve implementar um modelo de como omundo funciona; necessrios saber: como o mundo evolui independentemente da atuaoagente; Informaes sobre como as aes do agente afetam omundo. 32. Agentes reativos baseados em modelos (em imagem) 33. Agentes reativos baseados em modelos (em pseudocdigo) 34. Agentes reativos baseados emmodelos: nossos exemplos (1) Agente irrigador de cultura.O agente percebe informaes do estado do solo e de temperatura ambiente e pensa quaismudanas aconteceriam se ele aplicasse uma irrigao de X minutos. Ele deve buscar em seuhistrico de aes as ltimas irrigaes e imaginar o que acontece caso ele no tomenenhuma ao.Percepo Outras percepes (modelo)Regras p/ AoSolo eltimas irrigaes aplicadas (natural ou Complementar irrigao com (10 temperatura artificial) t) se a ltima irrigao estiverMudanas do estado do solo com uma vencidairrigao complementar. No aplicar nova irrigao casoComo o ambiente se comporta caso tenha ocorrido irrigao naturalno seja aplicado nenhuma irrigao ...(natural ou artificial)...... ... ... 35. Agentes reativos baseados emmodelos: nossos exemplos (2)Agente designador de tarefas e gerncia em uma equipe de projeto.O agente percebe informaes sobre o estado atual de tarefas para um ambiente de projetose pensa quais mudanas aconteceriam se ele designasse uma determinada tarefa ou agerncia de um projeto para um membro da equipe. Ele deve buscar em seu histrico deaes as ltimas designaes, suas consequncias e ainda imaginar o que acontece casoele no tome nenhuma ao.Percepo Outras percepes (modelo) Regras p/ AoAmbiente de ltimas designaes aplicadas (e suasDesignar a tarefa tarefa para umtarefas consequncias)determinado membro se forAs mudanas do estado para uma cabveldeterminada designao de tarefaNo deixar de designar caso aO que acontece ao ambiente caso otarefa no seja possvel concluir aagente no realize nenhuma tarefa.tarefaAmbiente de Valores de desempenho dos ltimosDesignar um gerente apropriadoprojeto projetos com seus gerentespara um novo projetoAs mudanas de estado na gerncia do No permitir que um projeto fiqueprojeto sem gerenteO que ocorre se nenhuma ao acontecer 36. Agentes baseados em objetivos O agente busca atingir objetivos que descrevam uma situaodesejvel; Ele pode combinar: Uma descrio do estado atual; Situao desejvel (objetivo); Informaes sobre resultados de aes possveis;Assim, ele escolheuma ao apropriada que atinja oobjetivo almejado. Pode ser: Direta (quando apenas uma ao atingir o objetivo); Complicada (considera-se longas sequncias de aes para atingir oobjetivo); Busca e Planejamento (subreas da IA) so dedicados aencontrar sequncias de aes que alcancem objetivos do agente 37. Agentes baseados em objetivos(em imagem) 38. Agentes reativos baseados em objetivos: nossos exemplos (1)Agente irrigador de cultura.O agente objetiva manter o solo irrigado sem encharc-lo. Para isso ele percebe o estado dosolo, dados de temperatura e umidade do ar. importante conhecer possveis evoluesnaturais do ambiente e quais consequncias acontecero diante de uma determinada ao doagente. Aes e estados Aes dos agentes e as suas possveisPercepopossveis consequnciasSolo,Pode choverSe est chovendo ento no Irrigar, pois certamentetemperaturaEst chovendoisso vai encharcar o soloambiente e No choveSe a temperatura est alta e no vai chover entoumidade do No vai chover devo irrigar para manter o solo irrigadoar IrrigarSe o solo tiver sido irrigado ento no devo irrigar No irrigarSe no chove, a temperatura baixa e a umidade tambm ento melhor no irrigar imediatamente ......... ... 39. Agentes reativos baseados em objetivos: nossos exemplos (2)Agente designador de tarefas e gerncia em uma equipe de projeto.O agente objetiva designar membros de um projeto para realizarem tarefas, sejam elas novasou problemticas (remanejamento), assim tambm como para gerenciarem um projeto. Paratanto ele percebe as mudanas dos estados das tarefas e dos projetos. importante sabercomo o ambiente natural de projeto evolui e quais consequncias acontecero diante de umadeterminada ao do agente.Aes e estados Aes dos agentes e as suas possveisPercepo possveis consequnciasAmbiente de Nova tarefa foiSe uma nova tarefa foi includa ento um membro quetarefaincluda no projeto pode realizar melhor a tarefa deve ser designado paraUma tarefa estelaatrasadaSe uma tarefa est atrasada ento devem serUma tarefa foi remanejados novos membros para elaconcluda Se no h novas tarefas e todas as atuais no estoUma tarefa est semsem problemas ento no designe ningumproblemas Se um tarefa foi concluda e outra est atrasada entodesigne os membros eficazes para a tarefaproblemtica.... ... ... 40. Agentes baseados na utilidade Os objetivos sozinhos no garantem um comportamento dealta qualidade, por isso: Um agente que usa uma funo de utilidade para medir o seu graude eficincia ou felicidade (utilidade) um agente baseado emutilidade. interessante para ser usando quando: Existem objetivos contraditrios (apenas alguns podem seratingidos) Existem vrios que a serem alcanados e nenhum deles pode seratingido com certeza;Em ambos a utilidade pode ponderar a importnciados mesmos. Normalmente o agente ir buscar a maximizao dautilidade. 41. Agentes baseados na utilidade(em imagem) 42. Agentes baseados na utilidade: nossos exemplos (1)Agente irrigador de cultura.O agente deve usar como funo de utilidade uma mensurao do seu grau de sucesso emrelao irrigao. Para tanto, ele buscar minimizar o consumo de gua sem afetar odesenvolvimento da cultura irrigada. Aes eAes dos agentes e as suas possveis Funo dePercepoestados consequncias utilidadepossveisSolo,Pode chover Se est chovendo ento no Irrigar, pois Para determinadatemperatur Est chovendo certamente isso vai encharcar o soloirrigao quantoa ambiente No chove Se a temperatura est alta e no vai economizei dee umidade No vaichover ento devo irrigar para manter o gua e qual ado archover solo irrigado contribuio para Irrigar Se o solo tiver sido irrigado ento no devo o desenvolvimento No irrigar irrigar da planta?Se no chove, a temperatura baixa e aQuando noumidade tambm ento melhor no irrigar irrigar ento aimediatamente funo nula. 43. Agentes baseados na utilidade:nossos exemplos (2) Agente designador de tarefas e gerncia em uma equipe de projeto.O agente deve usar como funo de utilidade uma mensurao do seu grau de sucesso emrelao s suas designaes. Para tanto, ele poder calcular a probabilidade de sucessopara o estado proposto em curto e longo prazo e, assim, majorar medidas que indicam oquando eficiente foi sua escolha. Aes eAes dos agentes e as suas possveisPercepoestados Funo de utilidade consequnciaspossveisAmbienteNova tarefaSe uma nova tarefa foi includa ento umQual a probabilidadede tarefa foi includamembro que pode realizar melhor a tarefa de sucesso se umno projetodeve ser designado para eladeterminado membroUma tarefa Se uma tarefa est atrasada ento devem for designado paraest atrasada ser remanejados novos membros para ela uma determinadaUma tarefa Se no h novas tarefas e todas as atuais tarefa?foi concluda no esto sem problemas ento noSe no houverUma tarefa designe ningumdesignaes ento aest semSe um tarefa foi concluda e outra est funo nula.problemas atrasada ento designe os membroseficazes para a tarefa problemtica. 44. Agentes com aprendizagem Proposta de Turing: necessrio construir mquinas comaprendizagem e depois ensin-las; O agente opera em ambientes inicialmente desconhecidos e torna-se mais competente do que o seu conhecimento inicialsozinho poderia permitir. Um agente assim pode ter 4 componentes: Elemento de aprendizado (execuo de aperfeioamentos) Elemento de desempenho (seleo de aes externas) Crtico (sobre o funcionamento do agente; determina como oelemento de desempenho deve ser melhorado em relao a umpadro fixo) Gerado de problemas (sugere aes que podem levar novasexperincias e informaes) 45. Agentes com aprendizagem Ao se projetar um agente deve-se perguntar: Que tipo de elemento de desempenho meuagente precisar ter para fazer isso depois de teraprendido como faz-lo? Ao invs de: como farei com que ele aprendaisso? O padro de desempenho externo pode aindadistinguir parte da percepo de entrada comoum recompensa ou penalidade. 46. Agentes com aprendizagem 47. Agentes com aprendizagem:nossos exemplos (1)Agente irrigador de cultura. Solo; Temperatura ambiente; Umidade do ar; Pode chover; Est chovendo; Percepes: No chove; No vai chover.Estados: Irrigar; No irrigar. Pode fazer mudanas em qualquer um dos componentes abaixo. Ele que Elemento de observa os resultados da aes e aprende. Por exemplo: se for aplicada umaaprendizado: irrigao desnecessria ele logo aprender que naquela situao no se deve irrigar. Elemento de Colees de conhecimentos e procedimentos que o agente tem paradesempenho: selecionar suas aes de irrigao. Observa o mundo (chuva, sol, temperatura, umidade) e alimenta de informaes o elemento de aprendizado. Por exemplo a percepo podeCrtico: chover ficar mais eficiente com as experincias e observaes do crtico. Ele ir a partir disso formular uma regra para saber se a experincia foi boa ou ruim. Identifica reas comportamentais que necessitam de melhorias e propeGerador de experimentos ou testes, como por exemplo, experimentar uma irrigao curtaproblemas: com uma umidade do ar alta. 48. Agentes com aprendizagem:nossos exemplos (2)Agente designador de tarefas e gerncia em uma equipe de projeto. Ambiente de tarefa: Nova tarefa foi includa no projeto; Uma tarefa Percepes: problemtica; Uma tarefa foi concluda; Uma tarefa est sem problemas.Estados: Designar um membro; No designar um membro. Pode fazer mudanas em qualquer um dos componentes abaixo. Ele que Elemento de observa os resultados da aes e aprende. Por exemplo: se for feita umaaprendizado: designao que gere insucesso de uma tarefa ento ele ir aprender lies sobre a ao realizada. Elemento de Colees de conhecimentos e procedimentos que o agente tem paradesempenho: selecionar suas aes para designar membros a tarefas. Observa o mundo de tarefas e alimenta de informaes o elemento de aprendizado. Por exemplo a percepo tarefa problemtica ficar maisCrtico: eficiente com as experincias e observaes do crtico. Ele ir partir disso e formular uma regra para saber se a experincia foi boa ou ruim. Exemplo de padro fixo: a tarefa foi concluda com sucesso antes do prazo? Identifica reas comportamentais que necessitam de melhorias e propeGerador de experimentos ou testes, como por exemplo, experimentar uma designao deproblemas: alto risco. 49. Referncia Russell, S.; Norvig, P. Inteligncia Artificial: uma abordagem moderna.2 ed. So Paulo: Prentice- Hall (2004)