arquitecturas de controlode robôs (móveis)eol/robo/20052006/3a_ar.pdf · i é um triplo [x,y, θ]...

1

2004 Eugénio Oliveira

Arquitecturas de Controlo de Robôs (Móveis)


Arquitecturas de Controlo de Robôs Móveis

Tipos:

• Hierárquico

• Reactivo

• Baseado emComportamentos

• HibridoReactivo/Deliberativo

2


Raciocínio Deliberativo

• Características dos Sistemas de Controlo baseadosem Raciocínio Deliberativo:

• Maior gama de Aplicações• Estrutura hierárquica• Comunicações e controlo pré-determinados• Planeamento com detalhe crescente (níveis)• Modelos simbólicos do Mundo

2004 Eugénio OliveiraSist

ema

de C

ontr

olo

em R

obô

Móv

el

Behaviour-Based robotics, R.Arkin, MIT Press

3


Sistema de Controlo em Robô MóvelSistema hierárquico de 3 níveis: Organização, Coordenação, Execução


Sistema de Controlo em Robô Móvel

Métodos formais para descrever comportamentos de Robôs:

• Diagramas Estímulo Resposta

• Diagramas FSA (“Finite State Accept “)

• Notação Funcional

4


Agentes Reactivos


Exemplo de navegaçãoNa sala de aula

Diagramas Estímulo-RespostaIntuitivo e informal




• Diagramas FSA (“Finite State Accept “)

δ q input δ(q,input)

b a bb

a

5


Agentes Reactivos

Representação de Comportamentos:

•Diagramas FSA (“Finite State Acceptor”)• bons para descrever agregações e conjuntos de comportamentos• menos bons para descrever comportamentos simples (trivial)

Q : Conjunto de estados permitidosδ : Função de transição mapeando entrada e estado corrente no estado

seguinteq0 : Estado inicialF : Conjunto de estados finais aceitáveis, F ε Q


Agentes Reactivos


Onde “Journey” representa uma agregação dos outros comportamentosde baixo nível referidos antes: “move-to-classroom”, “avoid-objects”, “dodge-students”, “stay-to-right”, “defer-to-elders”

•Diagramas FSA (“Finite State Acceptor”)• Exemplo de Navegação na sala de Aula:

6


Agentes Reactivos


Notação funcional é um Método matemático formal

• Comportamentos como triplos (S,R,β) onde:

• S denota o domínio dos Estímulos interpretáveis (input),• R o conjunto das Respostas possíveis (estados seguintes)• β: SàR a função de mapeamento entre S e R (arco)


Agentes Reactivos

β(s)=rβ Comportamentos Estímulo

(s pode ser uma percepção com um valor p e uma certeza λ quepode ter de ultrapassar um limiar)

r Resposta(r no domínio por exemplo dos motores pode ser

potência, orientação)

Considera-se que o tempo não é um parâmetro de β pois a respostaseria instântanea

7


Agentes Reactivos


Notação funcional:Exemplo de Navegação na Sala de aula:



Descrição de Múltiplos comportamentos activos:

S: vector de estímulos relevantes no instante tΒ: vector de comportamentos activos βi em tG: vector com a força relativa (ganho gi) de cada comportamento activo (βi) em tR: vector das respostas geradas pelo conjunto dos βi activos

Definição da função de Coordenação C:ρ= C(G*Β(S)) ou ρ=C(G*R)

A emergência é o resultado da coordenação e da imprevisibilidade do meio e do processo da percepção

8



S= (coordenadas_sala, 1.0)(objecto_detectado, 0.2) Si=(s,λ)(estudante_detectado, 0.8) s: estímulo; (passo_detectado, 1.0) λ percentagem da força máxima(idoso_detectado, 1.0)

Neste exemplo, embora exista o estímulo objecto_detectado ele é fraco por o objecto estar ainda longe.

Exemplo de um Robô em uma sala no instante t:

Resposta comportamental: Comportamentos activados:B(S) = βmove_sala (s1)

βevita_objecto (s2)βfoje_estudante (s3)βvai-direita (s4)βaproxima_idoso (S5)



Exemplo de um Robô em uma sala no instante t:R é computado a partir de cada comportamento β

arbitrando magnitudes das respostas:R= (rmove_sala) 1.0

(revita _objecto) Rmag= 0(rfoje_estudante) 0.8(rvai_direita) 1.0(raproxima _idoso) 0

ri é um triplo [x,y,θ] exprimindo a direcção do movimentoDe acodo com Rmag, “evita_objecto” e “aproxima_idoso”, estão abaixo de um limiar e não produzem resposta. Enquanto que “ move_sala” e “vai_direito” tem a força máxima.

Como ρ=C(G*R) então vamos multiplicar o Ganho pelas respostas: R’ = R * G G é importante por atribuír força relativa aos comportamentos quando existemmúltiplos comportamentos concorrentes

9



arbitrando magnitudes das respostas:G= (gmove_sala) 0.8

(gevita_objecto) = 1.2(gfoje_estudante) 1.5(gvai_direita) 0.4(gaproxima_idoso) 0.8

g1*r1 0.8e ρ= C(R’) = C( g2*r2 ) = C( 0 )

g3*r3 1.2g4*r4 0.4g5*r5 0

C depende da estratégia escolhida!Com uma estratégia “vencedor leva tudo”, C escolhe a componente com R’=1.2E ρ fica com o comportamento “foje_estudante” para executar.Atenção que este comportamento é dominante apenas devido à situação actual depercepção (no instante t)


Métodos Competitivos

Arbitragem via rede de supressões

Arquitecturade“subsunção”

10


Agentes Reactivos

GAgentes Reactivos (Reflexivos):


Arquitectura de AgentesReactivos

GAgentes Reactivos (Reflexivos):GNão tem Estado internoG see mapeia Estados do ambiente em Percepções: S --> PG action mapeia sequencias de percepções em Acções: P*-->A

G Arquitectura de “Sub-assunção” (subordinação) (R.Brooks)G Comportamentos como RegrasG Emergência de Comportamento Social InteligenteG Racionalidade

11


Agentes Reactivos

Agentes Reactivos na Robótica:

Domínio privilegiado e exigente relativamente à IA.

Robôs flexíveis e de tempo-real mostram limitações da IA clássica

Brooks (MIT) propôs arquitecturas de agentes mais flexíveis, simples, autónomose interactivos.

Modelo do Mundo implicarepresentação do estado interno eplaneamento moroso.

Modelo da IA clássica para o controlo do Robô inteligente por camadas


Agentes ReactivosSistemas Biológicos e Robótica:

Introdução de conceitos vindos da Etologia

Etologia: Ciência que estuda os comportamentos animais em condiçõesNaturais (Konrad Lorenz, Niko Tinbergen)

A inteligência passa a ser a habilidade de melhorar a capacidadede animais ou humanos sobreviverem no mundo real e, quandoapropriado, cooperar ou competir com outros agentes com essemesmo fim.

Certos comportamentos passam a ser vistos como inteligência.

12



Biónica: Libelinhas e Aviões; Sapos (orienta-se para a presa; salta para a zona escura se predador.

Retina:1 milhão de receptores, milhares de neurónios“ganglios” em várias camadas paralelas e especializadas. sensíveis ao movimento) e Visão Robótica

Pombos e Orientação (ângulo com o sol; campo magnético)Programa de controlo de orientação do pombo:



Etologia diz que há:

• Comportamentos inatos

• Sequências de comportamentos inatos como máquinas de estado

• Comportamentos inatos com memória. •Precisam de inicialização e parametrização

• Comportamentos Aprendidos

13


Agentes ReactivosEncadeamento de comportamentos:


Agentes Reactivos Vs IASENSORES

percepção

modelação do mundo

planeamento

execução dasacções

ACTUADORES

A Inteligência Artificial desenvolveu diversosAlgoritmos de Planeamento:“Análise meios-Fins” introduzindo a noção de Operadores e redução de distânciasPlaneamento Linear: tipo “STRIPS” (Fykes…) usando pilha de objectivos e condiçõesPlaneamento Não-Linear: tipo “ABSTRIPS” usando conjunto de objectivosPlaneamento Hierárquico:tipo NOAH(Sacerdoti ) com diversos graus de abstracçãoPlaneadores produzem uma correcta ordenação de acções feita depois da interpretaçãoda informação sensorial e usando o Modelo do Mundo: AbordagemCOGNITIVA

Abordagem cognitiva

14


Agentes Reactivos Vs IA

Desvantagens:• Tempo de Computação• Representação complexa da Informação• Difícil ter uma representação adequada do mundoquando o ambiente é dinâmico ou os sensores não sãototalmente fiáveis

Há domínios onde são relevantes características como:Rapidez de actuaçãoSimplicidade de RepresentaçãoFlexibilidade na composição das acçõesComunicação simplificada

Arquitecturas Reactivas são adequadas para estas característicasDomínios: Robótica, pesquisa na internet, Controlo de tráfego


Agentes Reactivos

Tipos de Comportamentos:

• Comportamentos de exploração direccional:• Na direcção de…• Vaguear

• Comportamentos guiados por objectivos:• Atraídos por objecto específico• Atraídos por uma área

• Comportamentos de aversão e protecção:• Evitar obstáculos estáticos• Evitar obstáculos móveis• Agressão

15


Agentes Reactivos

Tipos de Comportamentos:

• Comportamentos de seguimento:• seguir caminho• navegar em corredor• seguir linha

• Comportamentos sociais e cooperativos:• partilha• recolha (“foraging”)• agrupamento (“flocking”, “herding”)

•Comportamentos de percepção• varrimento• pesquisa visual

• Comportamentos para Manipuladores• alcançar, agarrar,…


Agentes reactivos: ideias chave

G decomposição de tarefasG propriedades emergentesG operações sobre representações simples

(próximas dos dados)

16


Decomposição de Tarefas

G Agentes reactivos como uma colecção de módulosG Módulos operam autonomamenteG Módulos responsáveis por tarefas

específicasG Ex: Sentir, controlo do motor, cálculo de

valor de função, etc.G Comunicação entre módulos limitada e de

baixo nível


Emergência

G agentes são relativamente simples (e numerosos)

G interagem de modo básico

G padrões complexos de comportamentoemergem das interacções quando o sistema é visto na globalidadeG nenhuma especificação a priori (ou plano) do

comportamento do sistema reactivo

17


VirtudesG Elimina a necessidade de representações

simbólicas ou Modelo pois: O Mundo é o seu própriomelhor modelo

G Tal “modelo” está sempre actualizado

G O sistema está ligado ao mundo via sensores e actuadores


G robustos e tolerantes às falhas: ex: um agente pode perder-se sem efeitoscatastróficos

G flexibilidadeG adaptaçãoG tempos de resposta rápidos

Virtudes

18


ARQUITECTURA REACTIVA

Arquitectura Reactiva

Evitar ObstáculosVaguear

Explorar o espaço

AC

ÇÃ

O

PER

CE

PÇÃ

O

Construir mapas

Identificar Objectos

… … ...


Arquitecturas de “sub-assunção”Uma alternativa à arquitectura modelo/plano é a arquitecturadita de “subsumpção” (sub-assunção) proposta por Brooks.É baseada em comportamentos que são unidades de controlotrabalhando em paralelo sempre que certos valores de entradasão detectados.

Em vez de "fusão sensorial" passa-se para o problema dafusão de comportamentos o qual é resolvido por um esquema de arbitragem sobre as prioridades de tais comportamentos.Comportamentos não se encaixam, uns não chamam os outros,mas estão todos em paralelo.

Ex. de um comportamento em um robô:

Percepção Comportamento Acçãoentrada do sonar evitar comando motor

Arquitectura de Sub-assunção

19

2004 Eugénio Oliveira .


No entanto existe uma hierarquia que pode levar algunsComportamentos a suprimir outros temporariamente.

Exemplo de Arquitectura de Sub-assunção: Robô Móvel (“Rug Warrior” – MIT)

• Robô controlodo por Microprocessador e dispondo de Sensores de proximidade (infra-vermelhos), distância(ultra-sons) e de nível de energia.• Objectivo: movimentação sem colisão.

• Rede de Comportamentos reagindo aos sensores



•Quando o robô está suficintemente próximo do Alimentador de Baterias, o comportamento EVITAR obstáculo é suprimido eos comandos do motor são só enviados pelo comportamentoALIMENTAR que dirige o robô directamente para o Alimentador

•Acções: Controlo dos Motores

• Ex. de Comportamentos:

• Evitar activa o sentido de marcha de acordocom valores dos sensores (virar no sentido oposto à distância maiscurta lida).

• Alimentar de acordo com nível de bateria

20



Módulo completo representando comportamento para inserirNa arquitectura de sub-assunção.Equivale a uma Máquina Finita de Estados Aumentada


Nível Bateria

Detector IV

Sonar

Alimentar

Evitar S Motores


21



• O potencial conflito entre os dois comportamentos é resolvidopelo nó S (Supressão) cujo significado é:

O comando “Evitar” passa, a não ser que chegue ao nó S um comando em simultâneo na linha com seta (comportamentohierarquicamente superior).

• O comportamento “Alimentar” produz uma competência de maisAlto nível e subsume o comportamento “Evitar”.

• Este sistema não usa modelo do mundo e é reactivo.• É extensível uma vez que pode ser incrementado com novas camadasde comportamentos


Microfone

Para-choques

Detector IV

Fotocélulas

Detector padrão sonoro

ESCAPA

S

S

S S

EVITA

SEGUE

CRUZEIRO

Buzina

Motores


O Robot “Rug Warrior” implementado no NIAD&R tem a seguinte Arquitectura de base:

22



Cada comportamento pode funcionar “em paralelo”, de acordo com as entradas.O comportamento “CRUZEIRO”apenas comanda os motores para movimento em frente.

Duas fotocélulas comparam a intensidade luminosa e, detectando uma diferença, geramum comando “SEGUE” que subsume o anterior, dirigindo o robô para a fonte de luz.

O comportamento “EVITA” é superior aqueles na hierarquia. Recebe do sensor IVum sinal de proximidade. Havendo obstáculo (p.ex. à direita ) o robô vira à esquerda.Se este sensor falha e o robô colidircom obstáculo (pára-choques), então o comportamento“ESCAPA” suprime as ordens dos anteriores e envia outro comando (recua).

O Microfone detector de som (batimento de palmas, p.ex.) activa uma buzina parandoos motores.

A implementação desta arquitectura em um processador simples, implica terum programa com um Ciclo que partilhava o tempo entre cada um dos comportamentos, simulando o efeito dos comportamentos actuando em paralelo.


Arquitectura de Sub-assunçãoArquitectura de sub-assunção do Genghisque tem 2 motores por pata :

α avança, patas para a frente e para trásβ balança, levanta e baixa pernas

Comportamentos:levantarandar simplesbalançarlevantar pernaestabilização….

Comportamentos básicos:levantarandar simples

23


Aplicações

Sistema Aplicações

Ferber (1994) Simulação de sociedades animais (ex. Formigas)

Simulação de ecosistemas

RUG WARRIOR (1997) Robôs reactivos

PENGI(Agre & Chapman 1987)

Wavish & Graham (1995)

Jogo de VideoJogos com animação 3D

NIAD&R (1998) Controlo de Tráfego


CríticasG Âmbito da aplicabilidade limitada

sobretudo a jogos e simulações

G Não é clara a forma de projectar estessistemas tal que o comportamentopretendido se torne emergente

G Como se poderá tornar estes sistemasextensíveis, escaláveis e fáceis de corrigir?G O que acontece quando o ambiente é

dinâmico?

24


CONCLUSÕES•A Arquitectura de “Sub-assunção” baseada em comportamentossimples permite a criação de agentes reactivos.

• Evitam-se Agentes cognitivos o que em domínios como a Robóticapode ser essencial.

• Robôs reactivos deixam de ter necessidade do modelo do mundoe de raciocinar antes de agir. Em situações muito dinâmicas comona Robótica móvel esta abordagem pode ser preferível.

• As interacções entre agentes reactivos devem ser elementares



Arbitragem via selecção da acção

Arquitecturas Competitivas

Resposta pelo ComportamentoCom mais elevado grauDe activação

Arbitragem via selecção de acção (P.Maes):Depende dos níveis de activação resultantes dos objectivos dos Agentes e das percepções actuais. Selecciona o Máximo actual.(respostas do tipo: mto_esq, pco_esq, frente, pco_dir, mto_dir)

25


Métodos Competitivos

Arbitragem via votação (Rosenblatt 89):Comportamentos votam nas acções. A mais votada é seleccionada (Distributed Architecture for Mobile Navigation Rosenblatt 95)

Repo

sta

do c

ompo

rtam

ento

mai

s vo

tado


Métodos CooperativosNa Fusão de Comportamentos as respostas de vários são tidas em conta (concorrem) para a saída final

Fusão de Comportamentos:A saída depende em simultâneo de mais do que um comportamento

Ex. Soma dos comportamentos ponderada pelos ganhos

Resp

osta

res

ulta

nte

da f

usão

de

com

port

amm

ento

s

26


Métodos Cooperativos

Macro-Comportamentos:

Colecção de Comportamentos primitivos coordenados (por exemplo por fusão)

Ex: vaguear

testa (detecta_área_livre)evita_obstáculo_estático (detecta_obstáculos)ruído (gera_direcção_var) alto ganhoevita_repetir(detecta_áreas_visitadas)



Resposta:

Vaguear

Diagrama de Junção de Comportamentos para “Vaguear” (macro)

27



A Junção de comportamentos “Vaguear” pode ainda ser combinada com outras macros :

Competição

(visitar postes)


Exemplo do Robô CompetidorArquitectura para robô competidor (encontrar posições assinaladas por postes)Comportamentos: vaguear; encontrar_poste; mover_p_polo

Diagrama FSA para robô competidor:

Parar

VaguearMove_pposte

Retornainício

Encontrapx_posteInício

Não_no_iníciooutros

Não_no_poste

Todos_postesencontrados

compete

Escolhe poste

no poste Não_encontrapostetimeout

Há_tempo

todos

No_início

28


Exemplo do Robô ColectorArquitectura para robô colectorComportamentos: vaguear; evitar, colectar; entregar

Diagrama FSA para robô colector:


Exemplo do Robô ColectorArquitectura de “subsumpção” para robô colector:Comportamentos: vaguear; evitar, colectar; entregar

Resposta (comando motores)

Percepções

29


Arquitecturas

Comparação de Arquitecturas:

• “Comunalidades”:

• enfatizam a ligação forte entre percepção e acção

• evitam pesadas representações de conhecimento

• decomposição em unidades significativas (comportamentos)

• Disparidades:

• granularidade da decomposição em comportamentos

• base da decomposição comportamental (etológica, actividade, ...)

• métodos de coordenação (competitivos, cooperativos)

• pogramação, plataformas,....


Agentes Inteligentes

• Dar inteligência aos Agentes:ex: Ele estuda porque quer passar no exame

Modelar intenções requer raciocínio + inteligência

• Técnicas para implementar racionalidade:•Raciocinio Simbólico•Planeamento•Satisfação de Restrições

•--> Sistemas Baseados em Conhecimento

• Qual a importância?•Comportamento mais complexo•Adaptação às condições dinâmicas•Aproximar-se do seu Objectivo•Aprender e usar Conhecimento novo

30


Agentes DeliberativosG Basedos em Lógica :GAgentes com estado internoG see mapeia estados do ambiente em Percepções: S --> PG action mapeia estados Internos em Acções: I-->AG next constrói o próximo estado Interno : I X P--> I

G Qual a representação do estado?GComo representar a função Acção?


Arquitecturas de Agentes : basedas em Lógica

GAgente Baseado em Lógica:GTomada de Decisão vista como deduçãoG Estado Interno visto como uma base de dadosG Programa do Agente como uma Teoria LógicaGVantagens: programas provados em TeoriaGDesvantagens: difícil em ambientes com restrições temporais

G Acções: emfrente, vira, limpaG predicados de estado : em(x,y); lixo(x,y); voltado(direcção)

0 1 2

0

1

2

Exemplo

31


G See Percepções: lixo, nullG Next Si: altere Si-1 com Percepçõesusando predicados do domínio

G Descrição extensiva do Conhecimento: muita memória

0 1 2

0

1

2

GAcções : em(X,Y) Λ lixo(X,Y) --> limpa(X,Y)em(0,0) Λ voltado(norte) Λ∼lixo(0,0) --> fazer(emfrente)em(0,2) Λ voltado(norte) Λ ∼lixo(0,2) --> fazer(vira)

… … …… … ...

Arquitecturas de Agentes : baseadas em Lógica


Arquitecturas de Agentes cognitivos

GAgentes com capacidades de dedução lógica :

G Demonstradores de Teoremas“impraticáveis” pois a decisão tomada seria óptima só quandoo processo de decisão se iniciou.G inaceitável em ambiente muito dinâmicoG problema da função “see” (mapear o mundo em percepçõese representá -lo em fórmulas)

32


Arquitecturas de Agentes cognitivos


Agentes ComunicativosG Programas/ObjectosG Chamadas a Procedimentos/invoca MétodosG possibilidades pré-definidas

G Agentes:G Decisão autónoma sobre resposta a pedidosG Linguagens de ComunicaçãoG Mensagens e Conteúdos não pré-fixadosG Comunicação sobre:

GCrençasGObjectivosGPlanos

GQual a importância da Comunicação:GCoordenação, Cooperação e Negociaçãoentre Agentes heterogéneos

33


Arquitectura BDIGArquitectura de agentes BDI

G Intenções dos Agentes guiam as AcçõesG Intenções baseiam-se em Crenças

G Raciocínio prático em Agentes BDI usa:G Crenças acerca do ambienteG Função de Revisão baseada nas actuais PercepçõesG Gerador de hipóteses (Desejos)G Função de Filtragem (processo de Deliberação)G Intenções Correntes (foco)G Função de Selecção da Acção


Garquitectura BDI do agente

crenças

desejos

intenções

frc

Ger.opções

Filtro

Acção

Acção output

percepções

Arquitectura BDI

34


Arquitectura BDI (CDI)“Beliefs- Desires- Intentions

Raciocínio Prático Vs Raciocínio Teórico

Acções Crenças

Raciocinio

G Agentes não usam raciocínio lógico puro paratomada de decisão


G Raciocínio Prático:GDeliberação: O quê? (se deve fazer)

GPlaneamento: Como? (se deve fazer)

GDeliberação e Planeamento usam recursos que são limitados

G Lógica Intencional necessária para os Agentes definiremo seu comportamento (p.ex. o operador Ki φ)

G“Intenções” tem mais peso que “Desejos” (Opções)G“Intenções” são pró-atitudes levando a acções e Objectivosque foi decidido atingir.G “Intenções“ persistem e guiam o raciocíneo de planeamentorestrinjem deliberações futuras e influenciam novas crenças

Raciocínio Prático

35


GRepresentação explícita dos BDI no Agente

G deliberação é modelada por duas funções de assinaturas:

G geração de Opções opç: Φ(Bel) X Φ(Int) à Φ(Des)

G filtragem filtro: Φ(Bel) X Φ(Des) à Φ(Int)

G A Revisão de Crenças é modelada por:

G brf: Φ(Bel) X percepções à Φ(Bel)

Arquitectura BDI


• Processo de Deliberação:

– Gerar Opções– Ponderar Opções– Escolher (filtrar)– Comprometer-se com as Opções escolhidas (Intenções)

• Processo de Planeamento:

– Raciocínio por Análise-Meios-Fins (MEA)– Representação de Objectivos/Intenções (ontologia de situações)– representação do Estado do Mundo (idem)– Acções possíveis/operadores (ontologia de operações)– Representação do Plano

Arquitectura BDI

36


– Ciclo simples do Controlo do Agente BDI:

•B:=B0 % Crenças iniciais•I:=I0 % Intenções iniciais•ENQUANTO Verdade FAZER

•Busca próxima percepção P;•B:= frc(B,P); % Actualiza Crenças•D:=opções(B,I); % Das Crenças e actuais Intensões gera

opções possíveis•I:=filtro(B,D,I); % selecção de novas Intensões coerêntes

• Π:=planeamento(B,I);•Execução(Π)

•FIM ENQUANTO

Arquitectura BDI


– Ciclo completo do Controlo do Agente BDI:

•B:=B0 % Crenças iniciais•I:=I0 % Intenções iniciais•ENQUANTO Verdade FAZER

•Busca próxima percepção P;•B:= frc(B,P); % Actualiza Crenças•D:=opções(B,I); % Das Crenças e actuais Intensões gera

opções possíveis•I:=filtro(B,D,I); % selecção de novas Intensões coerêntes• π:=planeamento(B,I);•ENQUANTO NÃO π =[]

OU sucesso(I,B)OU impossível(I,B) FAZER

• π = [A1|RP]; α:=A1;•executa(α);• π = RP;

Arquitectura BDI

37


– Ciclo completo do Controlo do Agente BDI (cont.):

•Busca nova percepção p; % através da função “see”•B:= frc(B,P); % Actualiza Crenças•SE reconsidera(B,I) ENTÃO

•D:=opções(B,I); % Das Crenças e actuais Intensõesgera opções possíveis

•I:=filtro(B,D,I); % selecção de novas Intensõescoerêntes

•FIM SE•SE NÃO coerência(π,I,B) ENTÃO

π:=planeamento(B,I);•FIM SE

•FIM ENQUANTO•FIM ENQUANTO

Arquitectura BDI


– Reconsiderar:

– Agentes tem estratégias diferentes para “reconsiderar”–“fanáticos”: Nunca reconsideram as suas intenções– “cautelosos”: reconsideram as suas intenções depois de cadaacção.

– Agentes “cautelosos” tem melhor desempenho que os“fanáticos” quando o ambiente é muito dinâmico. – O contrário verifica-se para ambientes pouco dinâmicos.

Arquitectura BDI

arquitecturas de controlode robôs (móveis)eol/robo/20052006/3a_ar.pdf · i é um triplo [x,y, θ]...

Documents