arquitecturas de controlode robôs (móveis)eol/robo/20052006/3a_ar.pdf · i é um triplo [x,y, θ]...
TRANSCRIPT
1
2004 Eugénio Oliveira
Arquitecturas de Controlo de Robôs (Móveis)
2004 Eugénio Oliveira
Arquitecturas de Controlo de Robôs Móveis
Tipos:
• Hierárquico
• Reactivo
• Baseado emComportamentos
• HibridoReactivo/Deliberativo
2
2004 Eugénio Oliveira
Raciocínio Deliberativo
• Características dos Sistemas de Controlo baseadosem Raciocínio Deliberativo:
• Maior gama de Aplicações• Estrutura hierárquica• Comunicações e controlo pré-determinados• Planeamento com detalhe crescente (níveis)• Modelos simbólicos do Mundo
2004 Eugénio OliveiraSist
ema
de C
ontr
olo
em R
obô
Móv
el
Behaviour-Based robotics, R.Arkin, MIT Press
3
2004 Eugénio Oliveira
Sistema de Controlo em Robô MóvelSistema hierárquico de 3 níveis: Organização, Coordenação, Execução
2004 Eugénio Oliveira
Sistema de Controlo em Robô Móvel
Métodos formais para descrever comportamentos de Robôs:
• Diagramas Estímulo Resposta
• Diagramas FSA (“Finite State Accept “)
• Notação Funcional
4
2004 Eugénio Oliveira
Agentes Reactivos
Métodos formais para descrever comportamentos de Robôs:
Exemplo de navegaçãoNa sala de aula
Diagramas Estímulo-RespostaIntuitivo e informal
2004 Eugénio Oliveira
Sistema de Controlo em Robô Móvel
Métodos formais para descrever comportamentos de Robôs:
• Diagramas FSA (“Finite State Accept “)
δ q input δ(q,input)
b a bb
a
5
2004 Eugénio Oliveira
Agentes Reactivos
Representação de Comportamentos:
•Diagramas FSA (“Finite State Acceptor”)• bons para descrever agregações e conjuntos de comportamentos• menos bons para descrever comportamentos simples (trivial)
Q : Conjunto de estados permitidosδ : Função de transição mapeando entrada e estado corrente no estado
seguinteq0 : Estado inicialF : Conjunto de estados finais aceitáveis, F ε Q
2004 Eugénio Oliveira
Agentes Reactivos
Representação de Comportamentos:
Onde “Journey” representa uma agregação dos outros comportamentosde baixo nível referidos antes: “move-to-classroom”, “avoid-objects”, “dodge-students”, “stay-to-right”, “defer-to-elders”
•Diagramas FSA (“Finite State Acceptor”)• Exemplo de Navegação na sala de Aula:
6
2004 Eugénio Oliveira
Agentes Reactivos
Métodos formais para descrever comportamentos de Robôs:
Notação funcional é um Método matemático formal
• Comportamentos como triplos (S,R,β) onde:
• S denota o domínio dos Estímulos interpretáveis (input),• R o conjunto das Respostas possíveis (estados seguintes)• β: SàR a função de mapeamento entre S e R (arco)
2004 Eugénio Oliveira
Agentes Reactivos
β(s)=rβ Comportamentos Estímulo
(s pode ser uma percepção com um valor p e uma certeza λ quepode ter de ultrapassar um limiar)
r Resposta(r no domínio por exemplo dos motores pode ser
potência, orientação)
Considera-se que o tempo não é um parâmetro de β pois a respostaseria instântanea
7
2004 Eugénio Oliveira
Agentes Reactivos
Representação de Comportamentos:
Notação funcional:Exemplo de Navegação na Sala de aula:
2004 Eugénio Oliveira
Sistema de Controlo em Robô Móvel
Descrição de Múltiplos comportamentos activos:
S: vector de estímulos relevantes no instante tΒ: vector de comportamentos activos βi em tG: vector com a força relativa (ganho gi) de cada comportamento activo (βi) em tR: vector das respostas geradas pelo conjunto dos βi activos
Definição da função de Coordenação C:ρ= C(G*Β(S)) ou ρ=C(G*R)
A emergência é o resultado da coordenação e da imprevisibilidade do meio e do processo da percepção
8
2004 Eugénio Oliveira
Sistema de Controlo em Robô Móvel
S= (coordenadas_sala, 1.0)(objecto_detectado, 0.2) Si=(s,λ)(estudante_detectado, 0.8) s: estímulo; (passo_detectado, 1.0) λ percentagem da força máxima(idoso_detectado, 1.0)
Neste exemplo, embora exista o estímulo objecto_detectado ele é fraco por o objecto estar ainda longe.
Exemplo de um Robô em uma sala no instante t:
Resposta comportamental: Comportamentos activados:B(S) = βmove_sala (s1)
βevita_objecto (s2)βfoje_estudante (s3)βvai-direita (s4)βaproxima_idoso (S5)
2004 Eugénio Oliveira
Sistema de Controlo em Robô Móvel
Exemplo de um Robô em uma sala no instante t:R é computado a partir de cada comportamento β
arbitrando magnitudes das respostas:R= (rmove_sala) 1.0
(revita _objecto) Rmag= 0(rfoje_estudante) 0.8(rvai_direita) 1.0(raproxima _idoso) 0
ri é um triplo [x,y,θ] exprimindo a direcção do movimentoDe acodo com Rmag, “evita_objecto” e “aproxima_idoso”, estão abaixo de um limiar e não produzem resposta. Enquanto que “ move_sala” e “vai_direito” tem a força máxima.
Como ρ=C(G*R) então vamos multiplicar o Ganho pelas respostas: R’ = R * G G é importante por atribuír força relativa aos comportamentos quando existemmúltiplos comportamentos concorrentes
9
2004 Eugénio Oliveira
Sistema de Controlo em Robô Móvel
arbitrando magnitudes das respostas:G= (gmove_sala) 0.8
(gevita_objecto) = 1.2(gfoje_estudante) 1.5(gvai_direita) 0.4(gaproxima_idoso) 0.8
g1*r1 0.8e ρ= C(R’) = C( g2*r2 ) = C( 0 )
g3*r3 1.2g4*r4 0.4g5*r5 0
C depende da estratégia escolhida!Com uma estratégia “vencedor leva tudo”, C escolhe a componente com R’=1.2E ρ fica com o comportamento “foje_estudante” para executar.Atenção que este comportamento é dominante apenas devido à situação actual depercepção (no instante t)
2004 Eugénio Oliveira
Métodos Competitivos
Arbitragem via rede de supressões
Arquitecturade“subsunção”
10
2004 Eugénio Oliveira
Agentes Reactivos
GAgentes Reactivos (Reflexivos):
2004 Eugénio Oliveira
Arquitectura de AgentesReactivos
GAgentes Reactivos (Reflexivos):GNão tem Estado internoG see mapeia Estados do ambiente em Percepções: S --> PG action mapeia sequencias de percepções em Acções: P*-->A
G Arquitectura de “Sub-assunção” (subordinação) (R.Brooks)G Comportamentos como RegrasG Emergência de Comportamento Social InteligenteG Racionalidade
11
2004 Eugénio Oliveira
Agentes Reactivos
Agentes Reactivos na Robótica:
Domínio privilegiado e exigente relativamente à IA.
Robôs flexíveis e de tempo-real mostram limitações da IA clássica
Brooks (MIT) propôs arquitecturas de agentes mais flexíveis, simples, autónomose interactivos.
Modelo do Mundo implicarepresentação do estado interno eplaneamento moroso.
Modelo da IA clássica para o controlo do Robô inteligente por camadas
2004 Eugénio Oliveira
Agentes ReactivosSistemas Biológicos e Robótica:
Introdução de conceitos vindos da Etologia
Etologia: Ciência que estuda os comportamentos animais em condiçõesNaturais (Konrad Lorenz, Niko Tinbergen)
A inteligência passa a ser a habilidade de melhorar a capacidadede animais ou humanos sobreviverem no mundo real e, quandoapropriado, cooperar ou competir com outros agentes com essemesmo fim.
Certos comportamentos passam a ser vistos como inteligência.
12
2004 Eugénio Oliveira
Agentes ReactivosSistemas Biológicos e Robótica:
Biónica: Libelinhas e Aviões; Sapos (orienta-se para a presa; salta para a zona escura se predador.
Retina:1 milhão de receptores, milhares de neurónios“ganglios” em várias camadas paralelas e especializadas. sensíveis ao movimento) e Visão Robótica
Pombos e Orientação (ângulo com o sol; campo magnético)Programa de controlo de orientação do pombo:
2004 Eugénio Oliveira
Agentes ReactivosSistemas Biológicos e Robótica:
Etologia diz que há:
• Comportamentos inatos
• Sequências de comportamentos inatos como máquinas de estado
• Comportamentos inatos com memória. •Precisam de inicialização e parametrização
• Comportamentos Aprendidos
13
2004 Eugénio Oliveira
Agentes ReactivosEncadeamento de comportamentos:
2004 Eugénio Oliveira
Agentes Reactivos Vs IASENSORES
percepção
modelação do mundo
planeamento
execução dasacções
ACTUADORES
A Inteligência Artificial desenvolveu diversosAlgoritmos de Planeamento:“Análise meios-Fins” introduzindo a noção de Operadores e redução de distânciasPlaneamento Linear: tipo “STRIPS” (Fykes…) usando pilha de objectivos e condiçõesPlaneamento Não-Linear: tipo “ABSTRIPS” usando conjunto de objectivosPlaneamento Hierárquico:tipo NOAH(Sacerdoti ) com diversos graus de abstracçãoPlaneadores produzem uma correcta ordenação de acções feita depois da interpretaçãoda informação sensorial e usando o Modelo do Mundo: AbordagemCOGNITIVA
Abordagem cognitiva
14
2004 Eugénio Oliveira
Agentes Reactivos Vs IA
Desvantagens:• Tempo de Computação• Representação complexa da Informação• Difícil ter uma representação adequada do mundoquando o ambiente é dinâmico ou os sensores não sãototalmente fiáveis
Há domínios onde são relevantes características como:Rapidez de actuaçãoSimplicidade de RepresentaçãoFlexibilidade na composição das acçõesComunicação simplificada
Arquitecturas Reactivas são adequadas para estas característicasDomínios: Robótica, pesquisa na internet, Controlo de tráfego
2004 Eugénio Oliveira
Agentes Reactivos
Tipos de Comportamentos:
• Comportamentos de exploração direccional:• Na direcção de…• Vaguear
• Comportamentos guiados por objectivos:• Atraídos por objecto específico• Atraídos por uma área
• Comportamentos de aversão e protecção:• Evitar obstáculos estáticos• Evitar obstáculos móveis• Agressão
15
2004 Eugénio Oliveira
Agentes Reactivos
Tipos de Comportamentos:
• Comportamentos de seguimento:• seguir caminho• navegar em corredor• seguir linha
• Comportamentos sociais e cooperativos:• partilha• recolha (“foraging”)• agrupamento (“flocking”, “herding”)
•Comportamentos de percepção• varrimento• pesquisa visual
• Comportamentos para Manipuladores• alcançar, agarrar,…
2004 Eugénio Oliveira
Agentes reactivos: ideias chave
G decomposição de tarefasG propriedades emergentesG operações sobre representações simples
(próximas dos dados)
16
2004 Eugénio Oliveira
Decomposição de Tarefas
G Agentes reactivos como uma colecção de módulosG Módulos operam autonomamenteG Módulos responsáveis por tarefas
específicasG Ex: Sentir, controlo do motor, cálculo de
valor de função, etc.G Comunicação entre módulos limitada e de
baixo nível
2004 Eugénio Oliveira
Emergência
G agentes são relativamente simples (e numerosos)
G interagem de modo básico
G padrões complexos de comportamentoemergem das interacções quando o sistema é visto na globalidadeG nenhuma especificação a priori (ou plano) do
comportamento do sistema reactivo
17
2004 Eugénio Oliveira
VirtudesG Elimina a necessidade de representações
simbólicas ou Modelo pois: O Mundo é o seu própriomelhor modelo
G Tal “modelo” está sempre actualizado
G O sistema está ligado ao mundo via sensores e actuadores
2004 Eugénio Oliveira
G robustos e tolerantes às falhas: ex: um agente pode perder-se sem efeitoscatastróficos
G flexibilidadeG adaptaçãoG tempos de resposta rápidos
Virtudes
18
2004 Eugénio Oliveira
ARQUITECTURA REACTIVA
Arquitectura Reactiva
Evitar ObstáculosVaguear
Explorar o espaço
AC
ÇÃ
O
PER
CE
PÇÃ
O
Construir mapas
Identificar Objectos
… … ...
2004 Eugénio Oliveira
Arquitecturas de “sub-assunção”Uma alternativa à arquitectura modelo/plano é a arquitecturadita de “subsumpção” (sub-assunção) proposta por Brooks.É baseada em comportamentos que são unidades de controlotrabalhando em paralelo sempre que certos valores de entradasão detectados.
Em vez de "fusão sensorial" passa-se para o problema dafusão de comportamentos o qual é resolvido por um esquema de arbitragem sobre as prioridades de tais comportamentos.Comportamentos não se encaixam, uns não chamam os outros,mas estão todos em paralelo.
Ex. de um comportamento em um robô:
Percepção Comportamento Acçãoentrada do sonar evitar comando motor
Arquitectura de Sub-assunção
19
2004 Eugénio Oliveira .
Arquitectura de Sub-assunção
No entanto existe uma hierarquia que pode levar algunsComportamentos a suprimir outros temporariamente.
Exemplo de Arquitectura de Sub-assunção: Robô Móvel (“Rug Warrior” – MIT)
• Robô controlodo por Microprocessador e dispondo de Sensores de proximidade (infra-vermelhos), distância(ultra-sons) e de nível de energia.• Objectivo: movimentação sem colisão.
• Rede de Comportamentos reagindo aos sensores
2004 Eugénio Oliveira
Arquitectura de Sub-assunção
•Quando o robô está suficintemente próximo do Alimentador de Baterias, o comportamento EVITAR obstáculo é suprimido eos comandos do motor são só enviados pelo comportamentoALIMENTAR que dirige o robô directamente para o Alimentador
•Acções: Controlo dos Motores
• Ex. de Comportamentos:
• Evitar activa o sentido de marcha de acordocom valores dos sensores (virar no sentido oposto à distância maiscurta lida).
• Alimentar de acordo com nível de bateria
20
2004 Eugénio Oliveira
Arquitectura de Sub-assunção
Módulo completo representando comportamento para inserirNa arquitectura de sub-assunção.Equivale a uma Máquina Finita de Estados Aumentada
2004 Eugénio Oliveira
Nível Bateria
Detector IV
Sonar
Alimentar
Evitar S Motores
Arquitectura de Sub-assunção
21
2004 Eugénio Oliveira
Arquitectura de Sub-assunção
• O potencial conflito entre os dois comportamentos é resolvidopelo nó S (Supressão) cujo significado é:
O comando “Evitar” passa, a não ser que chegue ao nó S um comando em simultâneo na linha com seta (comportamentohierarquicamente superior).
• O comportamento “Alimentar” produz uma competência de maisAlto nível e subsume o comportamento “Evitar”.
• Este sistema não usa modelo do mundo e é reactivo.• É extensível uma vez que pode ser incrementado com novas camadasde comportamentos
2004 Eugénio Oliveira
Microfone
Para-choques
Detector IV
Fotocélulas
Detector padrão sonoro
ESCAPA
S
S
S S
EVITA
SEGUE
CRUZEIRO
Buzina
Motores
Arquitectura de Sub-assunção
O Robot “Rug Warrior” implementado no NIAD&R tem a seguinte Arquitectura de base:
22
2004 Eugénio Oliveira
Arquitectura de Sub-assunção
Cada comportamento pode funcionar “em paralelo”, de acordo com as entradas.O comportamento “CRUZEIRO”apenas comanda os motores para movimento em frente.
Duas fotocélulas comparam a intensidade luminosa e, detectando uma diferença, geramum comando “SEGUE” que subsume o anterior, dirigindo o robô para a fonte de luz.
O comportamento “EVITA” é superior aqueles na hierarquia. Recebe do sensor IVum sinal de proximidade. Havendo obstáculo (p.ex. à direita ) o robô vira à esquerda.Se este sensor falha e o robô colidircom obstáculo (pára-choques), então o comportamento“ESCAPA” suprime as ordens dos anteriores e envia outro comando (recua).
O Microfone detector de som (batimento de palmas, p.ex.) activa uma buzina parandoos motores.
A implementação desta arquitectura em um processador simples, implica terum programa com um Ciclo que partilhava o tempo entre cada um dos comportamentos, simulando o efeito dos comportamentos actuando em paralelo.
2004 Eugénio Oliveira
Arquitectura de Sub-assunçãoArquitectura de sub-assunção do Genghisque tem 2 motores por pata :
α avança, patas para a frente e para trásβ balança, levanta e baixa pernas
Comportamentos:levantarandar simplesbalançarlevantar pernaestabilização….
Comportamentos básicos:levantarandar simples
23
2004 Eugénio Oliveira
Aplicações
Sistema Aplicações
Ferber (1994) Simulação de sociedades animais (ex. Formigas)
Simulação de ecosistemas
RUG WARRIOR (1997) Robôs reactivos
PENGI(Agre & Chapman 1987)
Wavish & Graham (1995)
Jogo de VideoJogos com animação 3D
NIAD&R (1998) Controlo de Tráfego
2004 Eugénio Oliveira
CríticasG Âmbito da aplicabilidade limitada
sobretudo a jogos e simulações
G Não é clara a forma de projectar estessistemas tal que o comportamentopretendido se torne emergente
G Como se poderá tornar estes sistemasextensíveis, escaláveis e fáceis de corrigir?G O que acontece quando o ambiente é
dinâmico?
24
2004 Eugénio Oliveira
CONCLUSÕES•A Arquitectura de “Sub-assunção” baseada em comportamentossimples permite a criação de agentes reactivos.
• Evitam-se Agentes cognitivos o que em domínios como a Robóticapode ser essencial.
• Robôs reactivos deixam de ter necessidade do modelo do mundoe de raciocinar antes de agir. Em situações muito dinâmicas comona Robótica móvel esta abordagem pode ser preferível.
• As interacções entre agentes reactivos devem ser elementares
Arquitectura de Sub-assunção
2004 Eugénio Oliveira
Arbitragem via selecção da acção
Arquitecturas Competitivas
Resposta pelo ComportamentoCom mais elevado grauDe activação
Arbitragem via selecção de acção (P.Maes):Depende dos níveis de activação resultantes dos objectivos dos Agentes e das percepções actuais. Selecciona o Máximo actual.(respostas do tipo: mto_esq, pco_esq, frente, pco_dir, mto_dir)
25
2004 Eugénio Oliveira
Métodos Competitivos
Arbitragem via votação (Rosenblatt 89):Comportamentos votam nas acções. A mais votada é seleccionada (Distributed Architecture for Mobile Navigation Rosenblatt 95)
Repo
sta
do c
ompo
rtam
ento
mai
s vo
tado
2004 Eugénio Oliveira
Métodos CooperativosNa Fusão de Comportamentos as respostas de vários são tidas em conta (concorrem) para a saída final
Fusão de Comportamentos:A saída depende em simultâneo de mais do que um comportamento
Ex. Soma dos comportamentos ponderada pelos ganhos
Resp
osta
res
ulta
nte
da f
usão
de
com
port
amm
ento
s
26
2004 Eugénio Oliveira
Métodos Cooperativos
Macro-Comportamentos:
Colecção de Comportamentos primitivos coordenados (por exemplo por fusão)
Ex: vaguear
testa (detecta_área_livre)evita_obstáculo_estático (detecta_obstáculos)ruído (gera_direcção_var) alto ganhoevita_repetir(detecta_áreas_visitadas)
2004 Eugénio Oliveira
Métodos Cooperativos
Resposta:
Vaguear
Diagrama de Junção de Comportamentos para “Vaguear” (macro)
27
2004 Eugénio Oliveira
Métodos Cooperativos
A Junção de comportamentos “Vaguear” pode ainda ser combinada com outras macros :
Competição
(visitar postes)
2004 Eugénio Oliveira
Exemplo do Robô CompetidorArquitectura para robô competidor (encontrar posições assinaladas por postes)Comportamentos: vaguear; encontrar_poste; mover_p_polo
Diagrama FSA para robô competidor:
Parar
VaguearMove_pposte
Retornainício
Encontrapx_posteInício
Não_no_iníciooutros
Não_no_poste
Todos_postesencontrados
compete
Escolhe poste
no poste Não_encontrapostetimeout
Há_tempo
todos
No_início
28
2004 Eugénio Oliveira
Exemplo do Robô ColectorArquitectura para robô colectorComportamentos: vaguear; evitar, colectar; entregar
Diagrama FSA para robô colector:
2004 Eugénio Oliveira
Exemplo do Robô ColectorArquitectura de “subsumpção” para robô colector:Comportamentos: vaguear; evitar, colectar; entregar
Resposta (comando motores)
Percepções
29
2004 Eugénio Oliveira
Arquitecturas
Comparação de Arquitecturas:
• “Comunalidades”:
• enfatizam a ligação forte entre percepção e acção
• evitam pesadas representações de conhecimento
• decomposição em unidades significativas (comportamentos)
• Disparidades:
• granularidade da decomposição em comportamentos
• base da decomposição comportamental (etológica, actividade, ...)
• métodos de coordenação (competitivos, cooperativos)
• pogramação, plataformas,....
2004 Eugénio Oliveira
Agentes Inteligentes
• Dar inteligência aos Agentes:ex: Ele estuda porque quer passar no exame
Modelar intenções requer raciocínio + inteligência
• Técnicas para implementar racionalidade:•Raciocinio Simbólico•Planeamento•Satisfação de Restrições
•--> Sistemas Baseados em Conhecimento
• Qual a importância?•Comportamento mais complexo•Adaptação às condições dinâmicas•Aproximar-se do seu Objectivo•Aprender e usar Conhecimento novo
30
2004 Eugénio Oliveira
Agentes DeliberativosG Basedos em Lógica :GAgentes com estado internoG see mapeia estados do ambiente em Percepções: S --> PG action mapeia estados Internos em Acções: I-->AG next constrói o próximo estado Interno : I X P--> I
G Qual a representação do estado?GComo representar a função Acção?
2004 Eugénio Oliveira
Arquitecturas de Agentes : basedas em Lógica
GAgente Baseado em Lógica:GTomada de Decisão vista como deduçãoG Estado Interno visto como uma base de dadosG Programa do Agente como uma Teoria LógicaGVantagens: programas provados em TeoriaGDesvantagens: difícil em ambientes com restrições temporais
G Acções: emfrente, vira, limpaG predicados de estado : em(x,y); lixo(x,y); voltado(direcção)
0 1 2
0
1
2
Exemplo
31
2004 Eugénio Oliveira
G See Percepções: lixo, nullG Next Si: altere Si-1 com Percepçõesusando predicados do domínio
G Descrição extensiva do Conhecimento: muita memória
0 1 2
0
1
2
GAcções : em(X,Y) Λ lixo(X,Y) --> limpa(X,Y)em(0,0) Λ voltado(norte) Λ∼lixo(0,0) --> fazer(emfrente)em(0,2) Λ voltado(norte) Λ ∼lixo(0,2) --> fazer(vira)
… … …… … ...
Arquitecturas de Agentes : baseadas em Lógica
2004 Eugénio Oliveira
Arquitecturas de Agentes cognitivos
GAgentes com capacidades de dedução lógica :
G Demonstradores de Teoremas“impraticáveis” pois a decisão tomada seria óptima só quandoo processo de decisão se iniciou.G inaceitável em ambiente muito dinâmicoG problema da função “see” (mapear o mundo em percepçõese representá -lo em fórmulas)
32
2004 Eugénio Oliveira
Arquitecturas de Agentes cognitivos
2004 Eugénio Oliveira
Agentes ComunicativosG Programas/ObjectosG Chamadas a Procedimentos/invoca MétodosG possibilidades pré-definidas
G Agentes:G Decisão autónoma sobre resposta a pedidosG Linguagens de ComunicaçãoG Mensagens e Conteúdos não pré-fixadosG Comunicação sobre:
GCrençasGObjectivosGPlanos
GQual a importância da Comunicação:GCoordenação, Cooperação e Negociaçãoentre Agentes heterogéneos
33
2004 Eugénio Oliveira
Arquitectura BDIGArquitectura de agentes BDI
G Intenções dos Agentes guiam as AcçõesG Intenções baseiam-se em Crenças
G Raciocínio prático em Agentes BDI usa:G Crenças acerca do ambienteG Função de Revisão baseada nas actuais PercepçõesG Gerador de hipóteses (Desejos)G Função de Filtragem (processo de Deliberação)G Intenções Correntes (foco)G Função de Selecção da Acção
2004 Eugénio Oliveira
Garquitectura BDI do agente
crenças
desejos
intenções
frc
Ger.opções
Filtro
Acção
Acção output
percepções
Arquitectura BDI
34
2004 Eugénio Oliveira
Arquitectura BDI (CDI)“Beliefs- Desires- Intentions
Raciocínio Prático Vs Raciocínio Teórico
Acções Crenças
Raciocinio
G Agentes não usam raciocínio lógico puro paratomada de decisão
2004 Eugénio Oliveira
G Raciocínio Prático:GDeliberação: O quê? (se deve fazer)
GPlaneamento: Como? (se deve fazer)
GDeliberação e Planeamento usam recursos que são limitados
G Lógica Intencional necessária para os Agentes definiremo seu comportamento (p.ex. o operador Ki φ)
G“Intenções” tem mais peso que “Desejos” (Opções)G“Intenções” são pró-atitudes levando a acções e Objectivosque foi decidido atingir.G “Intenções“ persistem e guiam o raciocíneo de planeamentorestrinjem deliberações futuras e influenciam novas crenças
Raciocínio Prático
35
2004 Eugénio Oliveira
GRepresentação explícita dos BDI no Agente
G deliberação é modelada por duas funções de assinaturas:
G geração de Opções opç: Φ(Bel) X Φ(Int) à Φ(Des)
G filtragem filtro: Φ(Bel) X Φ(Des) à Φ(Int)
G A Revisão de Crenças é modelada por:
G brf: Φ(Bel) X percepções à Φ(Bel)
Arquitectura BDI
2004 Eugénio Oliveira
• Processo de Deliberação:
– Gerar Opções– Ponderar Opções– Escolher (filtrar)– Comprometer-se com as Opções escolhidas (Intenções)
• Processo de Planeamento:
– Raciocínio por Análise-Meios-Fins (MEA)– Representação de Objectivos/Intenções (ontologia de situações)– representação do Estado do Mundo (idem)– Acções possíveis/operadores (ontologia de operações)– Representação do Plano
Arquitectura BDI
36
2004 Eugénio Oliveira
– Ciclo simples do Controlo do Agente BDI:
•B:=B0 % Crenças iniciais•I:=I0 % Intenções iniciais•ENQUANTO Verdade FAZER
•Busca próxima percepção P;•B:= frc(B,P); % Actualiza Crenças•D:=opções(B,I); % Das Crenças e actuais Intensões gera
opções possíveis•I:=filtro(B,D,I); % selecção de novas Intensões coerêntes
• Π:=planeamento(B,I);•Execução(Π)
•FIM ENQUANTO
Arquitectura BDI
2004 Eugénio Oliveira
– Ciclo completo do Controlo do Agente BDI:
•B:=B0 % Crenças iniciais•I:=I0 % Intenções iniciais•ENQUANTO Verdade FAZER
•Busca próxima percepção P;•B:= frc(B,P); % Actualiza Crenças•D:=opções(B,I); % Das Crenças e actuais Intensões gera
opções possíveis•I:=filtro(B,D,I); % selecção de novas Intensões coerêntes• π:=planeamento(B,I);•ENQUANTO NÃO π =[]
OU sucesso(I,B)OU impossível(I,B) FAZER
• π = [A1|RP]; α:=A1;•executa(α);• π = RP;
Arquitectura BDI
37
2004 Eugénio Oliveira
– Ciclo completo do Controlo do Agente BDI (cont.):
•Busca nova percepção p; % através da função “see”•B:= frc(B,P); % Actualiza Crenças•SE reconsidera(B,I) ENTÃO
•D:=opções(B,I); % Das Crenças e actuais Intensõesgera opções possíveis
•I:=filtro(B,D,I); % selecção de novas Intensõescoerêntes
•FIM SE•SE NÃO coerência(π,I,B) ENTÃO
π:=planeamento(B,I);•FIM SE
•FIM ENQUANTO•FIM ENQUANTO
Arquitectura BDI
2004 Eugénio Oliveira
– Reconsiderar:
– Agentes tem estratégias diferentes para “reconsiderar”–“fanáticos”: Nunca reconsideram as suas intenções– “cautelosos”: reconsideram as suas intenções depois de cadaacção.
– Agentes “cautelosos” tem melhor desempenho que os“fanáticos” quando o ambiente é muito dinâmico. – O contrário verifica-se para ambientes pouco dinâmicos.
Arquitectura BDI