dsc/cct/ufcg fonte: josé francisco salm junior (diretor de engenharia de sistemas instituto stela)...

Post on 07-Apr-2016

212 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

DSC/CCT/UFCG

Font

e: J

osé

Fran

cisc

o S

alm

Jun

ior (

Dire

tor d

e E

ngen

haria

de

Sis

tem

as In

stitu

to S

tela

)

Inteligência Artificial IInteligência Artificial I

Introdução a Agentes Introdução a Agentes (Adicional II)(Adicional II)

Prof.Prof.aa Joseana Macêdo Fechine Joseana Macêdo Fechine joseana@dsc.ufcg.edu.brjoseana@dsc.ufcg.edu.br

Carga Horária: 60 horas

Universidade Federal de Campina GrandeUniversidade Federal de Campina GrandeDepartamento de Sistemas e Computação Departamento de Sistemas e Computação

Curso de Bacharelado em Ciência da Curso de Bacharelado em Ciência da ComputaçãoComputação

2

DSC/CCT/UFCG

Agentes

Tópico

Caracterização dos Agentes

3DSC/CCT/UFCG

Propriedades de um ambiente acessível (completamente observável) x

inacessível (parcialmente observável) estático x dinâmico determinístico x não-determinístico discreto x contínuo episódico x não-episódico (seqüencial)

Agentes

4

DSC/CCT/UFCG

Ambientes: propriedades Acessível: quando os sensores do agente

conseguem perceber o estado completo do ambiente.

Determinístico: o próximo estado do ambiente pode ser completamente determinado pelo estado atual e as ações selecionadas pelo agente.

Episódico: a experiência do agente é dividida em episódios. Cada episódio consiste em o agente perceber e então agir. Cada episódio não depende das ações que ocorreram em episódios prévios.

5

DSC/CCT/UFCG

Ambientes: propriedades

Estático: o ambiente não muda enquanto o agente está escolhendo a ação a realizar. Semi-dinâmico: o ambiente não muda enquanto o

agente delibera, mas o "score" do agente muda.

Discreto: quando existe um número distinto e claramente definido de percepções e ações em cada turno.

Contínuo: percepções e ações mudam em um espectro contínuo de valores.

6

DSC/CCT/UFCG

Agentes - Estrutura

Agentes reativos simples

Agentes reativos baseados em modelo

Agentes baseados em objetivos

Agentes baseados na utilidade

Agentes com aprendizagem

7

DSC/CCT/UFCG

Agente Reativo Simples

Agente sensores

atuadores

Qual a aparência atual do mundo?

Que ação devo executar agora? Regras “condição-ação”a

m b

i e

n t e

8

DSC/CCT/UFCG

Tipo mais simples.

Seleciona ações com base na percepção atual, ignorando o restante do histórico de percepções.

Exemplo: Agente aspirador de pó, porque sua decisão se baseia apenas na posição atual e no fato de essa posição conter ou não sujeira.

Agente Reativo Simples

9

DSC/CCT/UFCG

Agente Reativo Simples

Vantagens e desvantagens Regras condição-ação: representação inteligível, modular e eficiente

ex. Se velocidade > 60 então multar Não pode armazenar uma seqüência de percepções, pouca autonomia

Ambientes: Reflexo imprescindível em ambientes dinâmicos Acessível, episódico, pequeno

10

DSC/CCT/UFCG

Agente Reativo Simples

Funcionará somente se a decisão correta puder ser tomada com base apenas na percepção atual Ambiente completamente observável

Exemplos de alguns problemas: Talvez somente uma imagem não é suficiente para determinar se o

carro da frente esta dando sinal de mudança de direção, alerta ou freio

11

DSC/CCT/UFCG

Agente Reativo Baseado em Modelos

sensoresAgente

Qual é a aparência atual mundo?

Regras “condição-ação”

estado: como o mundo era antes

como o mundo evolui

atuadores

Que ação devo executaragora?

a m

b i

e n

t e

impacto de minhas ações

12

DSC/CCT/UFCG

Agente controla a parte do mundo que ele não pode ver agora (agente mantém estado interno que depende do histórico de percepções).

Exemplo: agente taxista vai trocar de pista e pode não ver momentaneamente alguns carros à sua volta

Agente Reativo Baseado em Modelos

13

DSC/CCT/UFCG

O agente deve manter um estado interno que dependa do histórico de percepções e reflita os aspectos não observados no estado atual

Dois tipos de conhecimento são necessários para atualizar o estado interno do agente (modelo do mundo): Como o ambiente evolui independente do agente

Um carro que está ultrapassando, em geral estará mais perto do que estava um instante anterior

Como as ações do próprio agente afetam o mundo Se o agente virar o volante à direita, o carro irá virar p/ a direita

Agente Reativo Baseado em Modelos

14

DSC/CCT/UFCG

Um agente que utiliza o modelo de mundo

Desvantagem: pouca autonomia não tem objetivo, não encadeia regras

Ambientes: determinístico e pequeno

Agente Reativo Baseado em Modelos

15

DSC/CCT/UFCG

sensoresAgente

Qual a aparência atual domundo?

Objetivos

como o mundo evolui

atuadores

Que ação devo executaragora?a

m b

i e

n t e

impacto de minhas açõesQual será a aparência se forexecutada a ação A?

estado: como o mundo era antes

Agente Baseado em Objetivo

16

DSC/CCT/UFCG

Agente combina seu objetivo com as informações sobre os resultados de ações possíveis a fim de escolher ações que alcancem os seus objetivos

Exemplo: Táxi em um entroncamento de estradas: virar à esquerda, à direita ou ir em frente?

Necessidade de busca e planejamento: áreas da IA dedicadas a encontrar seqüências de ações que alcançam os objetivos do agente.

Agente Baseado em Objetivo

17

DSC/CCT/UFCG

O agente precisa de algum tipo de informação sobre o seu objetivo Objetivos descrevem situações desejáveis. Ex: estar no destino

Combinando informações sobre: O objetivo do agente Os resultados de suas ações

O agente pode escolher ações que alcancem o objetivo

A seleção da ação baseada em objetivo pode ser: Direta: quando o resultado de uma única ação atinge o objetivo Mais complexa: quando será necessário longas seqüências de ações

para atingir o objetivo

Agente Baseado em Objetivo

18

DSC/CCT/UFCG

Para encontrar seqüências de ações que alcançam os objetivos Algoritmos de Busca e Planejamento

A tomada de decisão envolve a consideração do futuro -> distinta das regras de condição-ação “O que acontecerá se eu fizer isso ou aquilo?” “O quanto isso me ajudará a atingir o objetivo?”

Agentes reativos: reação -> frear quando carro da frente frear

Agentes baseado em objetivo: raciocínio -> carro da frente freia -> carro da frente diminui velocidade -> objetivo: não atingir outros carros -> ação para atingir objetivo: frear

Agente Baseado em Objetivo

19

DSC/CCT/UFCG

Agente Baseado em Objetivo

Vantagens e desvantagens: Mais complicado e “ineficiente”, porém mais flexível,

autônomo Não trata objetivos conflitantes

Ambientes: determinístico

20

DSC/CCT/UFCG

Agente Baseado em Utilidade

ambiente

sensores

atuadores

Agente

Qual a aparência atual domundo?

Que ação devo executar agora?Função de Utilidade

qual é o impacto de minhas ações

como o mundo evolui

Este novo mundo é melhor?

Qual será a aparência se forexecutada a ação A?

estado: como o mundo era antes

21

DSC/CCT/UFCG

Existem muitas seqüências de ações que levam o agente ao seu objetivo. Algumas mais rápidas, mais seguras, mais econômicas, etc.

Agentes baseados em utilidade utilizam uma medida de desempenho (função de utilidade) que permite uma comparação entre diferentes estados do mundo, permitindo selecionar a seqüência de ações

Agente Baseado em Utilidade

22

DSC/CCT/UFCG

Se um estado do mundo é mais desejável que outro, então ele terá maior utilidade para o agente Utilidade é uma função que mapeia um estado para um

número real que representa o grau de satisfação com este estado

Especificação completa da função de utilidade – decisões racionais em dois tipos de casos: Quando existem objetivos conflitantes (velocidade x segurança)

a função de utilidade especifica o compromisso apropriado Quando existem vários objetivos que se deseja alcançar e

nenhum deles pode ser atingido com certeza – ponderar a importância dos objetivos

Agente Baseado em Utilidade

23

DSC/CCT/UFCG

Agente Baseado em Utilidade

Ambiente: sem restrição

Desvantagem: não tem adaptabilidade

24

DSC/CCT/UFCG

Agente com Aprendizagem

sensores

atuadores

Agente

Gerador de problemas

crítico

elemento de aprendizagem

avaliação

objetivos de aprendizagem

elemento de desempenho (agente)

trocas

conhecimento

a m

b i

e n

t e

t

t+1

t

25

DSC/CCT/UFCG

Um elemento de aprendizado utiliza realimentação sobre como um agente está funcionando e determina de que maneira o elemento de desempenho deve ser modificado para funcionar melhor no futuro.

Agente com Aprendizagem

26

DSC/CCT/UFCG

Em agentes sem aprendizagem tudo o que o agente sabe foi colocado nele pelo projetista

Turing propõe construir máquinas com aprendizagem e depois ensiná-las

Aprendizagem também permite ao agente atuar em ambientes totalmente desconhecidos e se tornar mais competente do que o seu conhecimento inicial poderia permitir

Agente com Aprendizagem

27

DSC/CCT/UFCG

Agente com Aprendizagem

Ambiente: sem restrição

Vantagem: tem adaptabilidade (aprende)

top related