dsc/cct/ufcg fonte: josé francisco salm junior (diretor de engenharia de sistemas instituto stela)...
Post on 07-Apr-2016
212 Views
Preview:
TRANSCRIPT
DSC/CCT/UFCG
Font
e: J
osé
Fran
cisc
o S
alm
Jun
ior (
Dire
tor d
e E
ngen
haria
de
Sis
tem
as In
stitu
to S
tela
)
Inteligência Artificial IInteligência Artificial I
Introdução a Agentes Introdução a Agentes (Adicional II)(Adicional II)
Prof.Prof.aa Joseana Macêdo Fechine Joseana Macêdo Fechine joseana@dsc.ufcg.edu.brjoseana@dsc.ufcg.edu.br
Carga Horária: 60 horas
Universidade Federal de Campina GrandeUniversidade Federal de Campina GrandeDepartamento de Sistemas e Computação Departamento de Sistemas e Computação
Curso de Bacharelado em Ciência da Curso de Bacharelado em Ciência da ComputaçãoComputação
2
DSC/CCT/UFCG
Agentes
Tópico
Caracterização dos Agentes
3DSC/CCT/UFCG
Propriedades de um ambiente acessível (completamente observável) x
inacessível (parcialmente observável) estático x dinâmico determinístico x não-determinístico discreto x contínuo episódico x não-episódico (seqüencial)
Agentes
4
DSC/CCT/UFCG
Ambientes: propriedades Acessível: quando os sensores do agente
conseguem perceber o estado completo do ambiente.
Determinístico: o próximo estado do ambiente pode ser completamente determinado pelo estado atual e as ações selecionadas pelo agente.
Episódico: a experiência do agente é dividida em episódios. Cada episódio consiste em o agente perceber e então agir. Cada episódio não depende das ações que ocorreram em episódios prévios.
5
DSC/CCT/UFCG
Ambientes: propriedades
Estático: o ambiente não muda enquanto o agente está escolhendo a ação a realizar. Semi-dinâmico: o ambiente não muda enquanto o
agente delibera, mas o "score" do agente muda.
Discreto: quando existe um número distinto e claramente definido de percepções e ações em cada turno.
Contínuo: percepções e ações mudam em um espectro contínuo de valores.
6
DSC/CCT/UFCG
Agentes - Estrutura
Agentes reativos simples
Agentes reativos baseados em modelo
Agentes baseados em objetivos
Agentes baseados na utilidade
Agentes com aprendizagem
7
DSC/CCT/UFCG
Agente Reativo Simples
Agente sensores
atuadores
Qual a aparência atual do mundo?
Que ação devo executar agora? Regras “condição-ação”a
m b
i e
n t e
8
DSC/CCT/UFCG
Tipo mais simples.
Seleciona ações com base na percepção atual, ignorando o restante do histórico de percepções.
Exemplo: Agente aspirador de pó, porque sua decisão se baseia apenas na posição atual e no fato de essa posição conter ou não sujeira.
Agente Reativo Simples
9
DSC/CCT/UFCG
Agente Reativo Simples
Vantagens e desvantagens Regras condição-ação: representação inteligível, modular e eficiente
ex. Se velocidade > 60 então multar Não pode armazenar uma seqüência de percepções, pouca autonomia
Ambientes: Reflexo imprescindível em ambientes dinâmicos Acessível, episódico, pequeno
10
DSC/CCT/UFCG
Agente Reativo Simples
Funcionará somente se a decisão correta puder ser tomada com base apenas na percepção atual Ambiente completamente observável
Exemplos de alguns problemas: Talvez somente uma imagem não é suficiente para determinar se o
carro da frente esta dando sinal de mudança de direção, alerta ou freio
11
DSC/CCT/UFCG
Agente Reativo Baseado em Modelos
sensoresAgente
Qual é a aparência atual mundo?
Regras “condição-ação”
estado: como o mundo era antes
como o mundo evolui
atuadores
Que ação devo executaragora?
a m
b i
e n
t e
impacto de minhas ações
12
DSC/CCT/UFCG
Agente controla a parte do mundo que ele não pode ver agora (agente mantém estado interno que depende do histórico de percepções).
Exemplo: agente taxista vai trocar de pista e pode não ver momentaneamente alguns carros à sua volta
Agente Reativo Baseado em Modelos
13
DSC/CCT/UFCG
O agente deve manter um estado interno que dependa do histórico de percepções e reflita os aspectos não observados no estado atual
Dois tipos de conhecimento são necessários para atualizar o estado interno do agente (modelo do mundo): Como o ambiente evolui independente do agente
Um carro que está ultrapassando, em geral estará mais perto do que estava um instante anterior
Como as ações do próprio agente afetam o mundo Se o agente virar o volante à direita, o carro irá virar p/ a direita
Agente Reativo Baseado em Modelos
14
DSC/CCT/UFCG
Um agente que utiliza o modelo de mundo
Desvantagem: pouca autonomia não tem objetivo, não encadeia regras
Ambientes: determinístico e pequeno
Agente Reativo Baseado em Modelos
15
DSC/CCT/UFCG
sensoresAgente
Qual a aparência atual domundo?
Objetivos
como o mundo evolui
atuadores
Que ação devo executaragora?a
m b
i e
n t e
impacto de minhas açõesQual será a aparência se forexecutada a ação A?
estado: como o mundo era antes
Agente Baseado em Objetivo
16
DSC/CCT/UFCG
Agente combina seu objetivo com as informações sobre os resultados de ações possíveis a fim de escolher ações que alcancem os seus objetivos
Exemplo: Táxi em um entroncamento de estradas: virar à esquerda, à direita ou ir em frente?
Necessidade de busca e planejamento: áreas da IA dedicadas a encontrar seqüências de ações que alcançam os objetivos do agente.
Agente Baseado em Objetivo
17
DSC/CCT/UFCG
O agente precisa de algum tipo de informação sobre o seu objetivo Objetivos descrevem situações desejáveis. Ex: estar no destino
Combinando informações sobre: O objetivo do agente Os resultados de suas ações
O agente pode escolher ações que alcancem o objetivo
A seleção da ação baseada em objetivo pode ser: Direta: quando o resultado de uma única ação atinge o objetivo Mais complexa: quando será necessário longas seqüências de ações
para atingir o objetivo
Agente Baseado em Objetivo
18
DSC/CCT/UFCG
Para encontrar seqüências de ações que alcançam os objetivos Algoritmos de Busca e Planejamento
A tomada de decisão envolve a consideração do futuro -> distinta das regras de condição-ação “O que acontecerá se eu fizer isso ou aquilo?” “O quanto isso me ajudará a atingir o objetivo?”
Agentes reativos: reação -> frear quando carro da frente frear
Agentes baseado em objetivo: raciocínio -> carro da frente freia -> carro da frente diminui velocidade -> objetivo: não atingir outros carros -> ação para atingir objetivo: frear
Agente Baseado em Objetivo
19
DSC/CCT/UFCG
Agente Baseado em Objetivo
Vantagens e desvantagens: Mais complicado e “ineficiente”, porém mais flexível,
autônomo Não trata objetivos conflitantes
Ambientes: determinístico
20
DSC/CCT/UFCG
Agente Baseado em Utilidade
ambiente
sensores
atuadores
Agente
Qual a aparência atual domundo?
Que ação devo executar agora?Função de Utilidade
qual é o impacto de minhas ações
como o mundo evolui
Este novo mundo é melhor?
Qual será a aparência se forexecutada a ação A?
estado: como o mundo era antes
21
DSC/CCT/UFCG
Existem muitas seqüências de ações que levam o agente ao seu objetivo. Algumas mais rápidas, mais seguras, mais econômicas, etc.
Agentes baseados em utilidade utilizam uma medida de desempenho (função de utilidade) que permite uma comparação entre diferentes estados do mundo, permitindo selecionar a seqüência de ações
Agente Baseado em Utilidade
22
DSC/CCT/UFCG
Se um estado do mundo é mais desejável que outro, então ele terá maior utilidade para o agente Utilidade é uma função que mapeia um estado para um
número real que representa o grau de satisfação com este estado
Especificação completa da função de utilidade – decisões racionais em dois tipos de casos: Quando existem objetivos conflitantes (velocidade x segurança)
a função de utilidade especifica o compromisso apropriado Quando existem vários objetivos que se deseja alcançar e
nenhum deles pode ser atingido com certeza – ponderar a importância dos objetivos
Agente Baseado em Utilidade
23
DSC/CCT/UFCG
Agente Baseado em Utilidade
Ambiente: sem restrição
Desvantagem: não tem adaptabilidade
24
DSC/CCT/UFCG
Agente com Aprendizagem
sensores
atuadores
Agente
Gerador de problemas
crítico
elemento de aprendizagem
avaliação
objetivos de aprendizagem
elemento de desempenho (agente)
trocas
conhecimento
a m
b i
e n
t e
t
t+1
t
25
DSC/CCT/UFCG
Um elemento de aprendizado utiliza realimentação sobre como um agente está funcionando e determina de que maneira o elemento de desempenho deve ser modificado para funcionar melhor no futuro.
Agente com Aprendizagem
26
DSC/CCT/UFCG
Em agentes sem aprendizagem tudo o que o agente sabe foi colocado nele pelo projetista
Turing propõe construir máquinas com aprendizagem e depois ensiná-las
Aprendizagem também permite ao agente atuar em ambientes totalmente desconhecidos e se tornar mais competente do que o seu conhecimento inicial poderia permitir
Agente com Aprendizagem
27
DSC/CCT/UFCG
Agente com Aprendizagem
Ambiente: sem restrição
Vantagem: tem adaptabilidade (aprende)
top related