1 agentes inteligentes alex f. v. machado. definição um agente é tudo aquilo que pode ser visto...

Post on 17-Apr-2015

109 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

Agentes Inteligentes

Alex F. V. Machado

DefiniçãoUm agente é tudo aquilo que pode ser visto como percebendo um

ambiente e agindo sobre ele em busca de um conjunto de objetivos.

3

Um programa de IA pode ser visto como um Agente Racional

Plano da aula

O que é um Agente Racional (inteligente)?

Qual sua utilidade em IA?

Ambientes e arquiteturas

Aplicações

Estado atual do conceito de agente

sensoresAgente

atuadores

a m

b i e n

t e

Raciocinadormodelo do ambiente

O que é um agente Agente é qualquer entidade que:

percebe seu ambiente através de sensores (ex. câmeras, microfone, teclado, finger...)

age sobre ele através de atuadores (ex. vídeo, auto-falante, impressora, braços, ftp, ...)

Mapeamento: seqüência de percepções => ação

Características Cognitivas (1/2)

Básicas:Autonomia – capacidade de agir sem intervenção de outros agentes.Reatividade – habilidade de reagir a estímulos do ambiente.Proatividade – propriedade de agir guiado por objetivos, a partir de iniciativa própria.

Características Cognitivas (2/2)Adicionais:Sociabilidade – potencialidade de se comunicar com outros agentes do ambiente.Adaptatividade – capacidade de se adaptar ao ambiente (aprendizado).Mobilidade – habilidade de se mover entre ambientes. Veracidade – propriedade de dizer sempre a verdade.Benevolência – característica de realizar tudo aquilo que lhe é solicitado.Racionalidade – capacidade de agir sempre em busca dos próprios objetivos.

7

Medida de Desempenho (MD)

Critério que define o grau de sucesso de um agente na realização de uma dada tarefa Esta medida deve ser imposta do exterior Exs. aspirador de pó, provador de teoremas, filtragem

de e-mails, policial de trânsito, avaliador de clima...

8

Agente Racional (McCarthy & Hayes 69, Newell 81)

Agente Racional: fazer a melhor coisa possível segue o princípio da racionalidade: dada uma seqüência de

percepções, o agente escolhe, segundo seus conhecimentos, as ações que satisfazem melhor seu objetivo.

Problema estado inicial + ações => estado final (objetivo)

Racionalidade Onisciência, limitações de: sensores atuadores raciocinador (conhecimento, tempo, etc.) Agir para obter mais dados perceptivos é racional

9

A metáfora de agente decompõe1) Problema em:

percepções, ações, objetivos, e ambiente (e outros agentes)

2) Tipo de conhecimento em: Quais são as propriedades relevantes do mundo Como o mundo evolui Como identificar os estados desejáveis do mundo Como interpretar suas percepções Quais as conseqüências de suas ações no mundo Como medir o sucesso de suas ações Como avaliar seus próprios conhecimentos

3) Arquitetura e método de resolução de problema

Agente de Polícia de Trânsito

Ambiente

Agenteraciocínio

Conhecimento:- leis- comportamento dos indivíduos,...

Objetivo:- fazer com que as leis sejam respeitadas

Ações:- multar- apitar- parar, ...

execuçãopercepção

Exemplos de AgentesAgente Dados

perceptivosAções Objetivos Ambiente

Diagnósticomédico

Sintomas,paciente, exames

respostas, ...

Perguntar,prescrever exames,

testar

Saúde do paciente,minimizar custos

Paciente,gabinete, ...

Análise deimagens de

satélite

Pixels imprimir umacategorização

categorizarcorretamente

Imagens desatélite

Tutorial deportuguês

Palavrasdigitadas

Imprimir exercícios,sugestões,

correções, ...

Melhorar odesempenho do

estudante

Conjunto deestudantes

Filtrador demails

mensagens Aceitar ou rejeitarmensagens

Aliviar a carga deleitura do usuário

Mensagens,usuários

Motorista detaxi

Imagens,velocímetro,

sons

brecar, acelerar,dobrar, falar com

passageiro, ...

Segurança,rapidez, economia,

conforto,...

Ruas, pedestres,carros, ...

Músico de jazz Sons seus e deoutros músicos,

grades deacordes

Escolher e tocarnotas no andamento

Tocar bem, sedivertir, agradar

Musicos,publico, grades

de acordes

12

Ambiente

Classes de ambientes Físico: robôs Software: softbots Realidade virtual (simulação do ambiente físico): softbots e avatares

Propriedades de um ambiente acessível (completamente observável) x inacessível (parcialmente

observável) determinista x não-determinista episódico x não-episódico (seqüêncial) estático x dinâmico discreto x contínuo

Outras propriedades Número de percepções, ações, objetivos,...

13

Ambientes: propriedades

Acessível: quando os sensores do agente conseguem perceber o estado completo do ambiente.

Episódico: a experiência do agente é dividida em episódios. Cada episódio consiste em o agente perceber e então agir. Cada episódio não depende das ações que ocorreram em episódios prévios.

Determinístico: o próximo estado do ambiente pode ser completamente determinado pelo estado atual e as ações selecionadas pelo agente.

Ambiente Determinístico

Próximo estado = estado atual + ações dos agentes.

Devemos dizer se um ambiente é ou não determinístico do ponto de vista de um agente.

Ex.: xadrez – determinístico

robô que seleciona peças – não-determinístico

15

Ambientes: propriedades

Estático: o ambiente não muda enquanto o agente está escolhendo a ação a realizar. Semi-dinâmico: o ambiente não muda enquanto o

agente delibera, mas o "score" do agente muda. Discreto: quando existe um número distinto e

claramente definido de percepções e ações em cada turno. Contínuo: percepções e ações mudam em um

espectro contínuo de valores.

Exemplos de Ambientes

Agente acessível determinista episódico estático discreto

xadrez sem relógio Sim Sim Não Sim Sim

xadrez com relógio Sim Sim Não Semi sim

motorista de taxi Não Não Não Não Não

médico Não Não Não Não Não

tutor Não Não Não Não Sim

Analisador de imagem Sim Sim Sim Semi Não

Busca na web Não Não Sim Não Sim

Filtrador de mail Sim Não Sim Não Sim

17

O que é um agente

18

Agentes Inteligentes

Arquiteturas Agente tabela Agente reativo simples Agente reativo com estado interno Agente orientado a objetivos Agente baseado em utilidade Agente com aprendizagem autonomia

complexidade

ambiente

sensores

atuadores

Tabelapercepções ações

. .

. .

Agente

Agente Tabela

Limitações Mesmo Problemas simples -> tabelas muito grandes

ex. xadrez 30^100 Nem sempre é possível, por ignorância ou questão de tempo, construir a tabela Não há autonomia nem flexibilidade Este agente só tem fins didáticos!!! Não vale nem a pena pensar nele

Ambientes acessível, determinístico, episódico, estático, discreto e minúsculo!

Agente sensores

atuadores

Qual a aparência atual do mundo?

Que ação devo executar agora? Regras “condição-ação”

a m

b i e n

t e

Agente Reativo Simples

Vantagens e desvantagens Regras condição-ação: representação inteligível, modular e eficiente

ex. Se velocidade > 60 então multar Não pode armazenar uma seqüência de percepções, pouca autonomia

Ambientes: Reflexo imprescindível em ambientes dinâmicos Acessível, episódico, pequeno

Agente Reativo com Estado Interno

Necessários quando um histórico é necessário, além da informação sensorial.

Am

biente

Estado do Mundo

Sensors

Que ação eu devo tomarregras condição-ação

Effectors

estado interno

como o mundo evolui

conseqüências de minhas ações

Agente Orientado a Objetivos

Am

bienteEstado do

Mundo

Sensors

Que ação eu devo tomarobjetivos

Effectors

estado interno

como o mundo evolui

conseqüências de minhas ações Como será o mundo

se eu tomar ação A

Ambiente: sem restrição Desvantagem: não tem adaptabilidade Ex. motorista recifence

Agente Baseado em Utilidade

Funciona escolhendo sempre um estado mais útil.Função de utilidade: determina o grau de satisfação do agente em relação a um determinado estado.

Am

bienteEstado do

Mundo

Sensors

Que ação eu devo tomar

utility

Effectors

estado interno

como o mundo evolui

conseqüências de minhas ações Como será o mundo

se eu tomar ação A

O quão feliz vou ficar nesse estado

Ambiente: sem restrição Desvantagem: não tem adaptabilidade

Agente com Aprendizado

sensores

atuadores

Agente

Gerador de problemas

crítico

elemento de aprendizagem

avaliação

objetivos de aprendizagem

elemento de desempenho (agente)

trocas

conhecimento

a m

b i e n

t e

Ambiente: sem restrição Vantagem: tem adaptabilidade (aprende) Ex. motorista sem o mapa da cidade

t

t+1

t

25

Simulação do Ambiente Às vezes é mais conveniente simular o ambiente

mais simples permite testes prévios evita riscos, etc...

O ambiente (programa) recebe os agentes como entrada fornece repetidamente a cada um deles as percepções

corretas e recebe as ações atualiza os dados do ambiente em função dessas ações e de

outros processos (ex. dia-noite) é definido por um estado inicial e uma função de atualização deve refletir a realidade

26

Simulação de ambiente

função simulaAmbiente (estado, funçãoAtualização,agentes,final)

repita

para cada agente em agentes faça

Percept[agente] := pegaPercepção(agente,estado)

para cada agente em agentes faça

Action[agente] := Programa[agente] (Percept[agente])

estado := funçãoAtualização(ações, agentes, estado)

scores := avaliaDesempenho(scores,agente,estado) //opcional

até final

Observação: não cair em tentação “roubando” do ambiente a descrição do que

aconteceu. Usar a memória do agente!

27

Inteligência Coletiva Porque pensar a inteligência/racionalidade como

propriedade de um único indivíduo?

Não existe inteligência ... Em um time de futebol? Em um formigueiro? Em uma empresa (ex. correios)? Na sociedade?

Solução: IA Distribuída Agentes simples que juntos resolvem problemas complexos

tendo ou não consciência do objetivo global Proposta por Marvin Minsky e em franca expansão... o próprio ambiente pode ser modelado como um agente

28

IA Distribuída: dois tipos de sistemas Resolução distribuída de problemas

consciência do objetivo global e divisão clara de tarefas Exemplos: Robótica clássica, Busca na Web, Gerência de

sistemas distribuídos, ... Sistemas Multi-agentes

não consciência do objetivo global e nem divisão clara de tarefas Exemplos: n-puzzle, futebol de robôs, balanceamento de carga,

robótica, ...

29

Exemplos de Sistemas Multi-Agentes Ant Colony (Colônia de Formigas) Termite Behaviour (Comportamento de Cupins)

30

Termite Behaviour

31

Termite Behaviour

Ambiente:

- Espaço em preto: área vazia

- Pontos amarelos: madeira

- Pontos vermelhos: cupins

Objetivo:

- Criar pilhas de madeira

Comportamentos dos cupins:

- Se não estiver carregando nada:Anda aleatoriamente até achar uma madeira e a carrega

- Se estiver carregando madeira: anda aleatoriamente, no espaço vazio, deixando a madeira em um espaço vazio.

32

Termite Behaviour

Aplicação:

Sistemas de roteamento de redes de computadores

Problemas de Clusterização / Classificação de Dados(Ex. construção de grupos homogêneos de municípios de acordo

com alguma variável sócio-econômica)

33

Ant Colony

34

Ant ColonyObjetivo:

- Achar comida e trazer para a toca no menor caminho

Comportamento das formigas:

- Andam em caminhos aleatórios e deixam um rastro de feromônio (rastro) por um determinado espaço de tempo.

- Tendem a andar em caminhos cujo o rastro de ferômonio seja mais forte.

35

Ant ColonyAplicação:

- Sistemas de roteamento de redes de computadores

-Transporte urbano e logística

- Modelagem de Proteínas(Bioinformática)

36

Propriedades Autonomia

raciocínio, comportamento guiado por objetivos reatividade

Adaptabilidade & aprendizagem

Comunicação & Cooperação

Personalidade

top related