arquitecturas de controlode robôs (móveis)eol/robo/20052006/3a_ar.pdf · i é um triplo [x,y, θ]...

37
2004 Eugénio Oliveira Arquitecturas de Controlo de Robôs (Móveis) 2004 Eugénio Oliveira Arquitecturas de Controlo de Robôs Móveis Tipos: • Hierárquico • Reactivo • Baseado em Comportamentos Hibrido Reactivo/ Deliberativo

Upload: others

Post on 30-Aug-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

1

2004 Eugénio Oliveira

Arquitecturas de Controlo de Robôs (Móveis)

2004 Eugénio Oliveira

Arquitecturas de Controlo de Robôs Móveis

Tipos:

• Hierárquico

• Reactivo

• Baseado emComportamentos

• HibridoReactivo/Deliberativo

Page 2: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

2

2004 Eugénio Oliveira

Raciocínio Deliberativo

• Características dos Sistemas de Controlo baseadosem Raciocínio Deliberativo:

• Maior gama de Aplicações• Estrutura hierárquica• Comunicações e controlo pré-determinados• Planeamento com detalhe crescente (níveis)• Modelos simbólicos do Mundo

2004 Eugénio OliveiraSist

ema

de C

ontr

olo

em R

obô

Móv

el

Behaviour-Based robotics, R.Arkin, MIT Press

Page 3: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

3

2004 Eugénio Oliveira

Sistema de Controlo em Robô MóvelSistema hierárquico de 3 níveis: Organização, Coordenação, Execução

2004 Eugénio Oliveira

Sistema de Controlo em Robô Móvel

Métodos formais para descrever comportamentos de Robôs:

• Diagramas Estímulo Resposta

• Diagramas FSA (“Finite State Accept “)

• Notação Funcional

Page 4: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

4

2004 Eugénio Oliveira

Agentes Reactivos

Métodos formais para descrever comportamentos de Robôs:

Exemplo de navegaçãoNa sala de aula

Diagramas Estímulo-RespostaIntuitivo e informal

2004 Eugénio Oliveira

Sistema de Controlo em Robô Móvel

Métodos formais para descrever comportamentos de Robôs:

• Diagramas FSA (“Finite State Accept “)

δ q input δ(q,input)

b a bb

a

Page 5: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

5

2004 Eugénio Oliveira

Agentes Reactivos

Representação de Comportamentos:

•Diagramas FSA (“Finite State Acceptor”)• bons para descrever agregações e conjuntos de comportamentos• menos bons para descrever comportamentos simples (trivial)

Q : Conjunto de estados permitidosδ : Função de transição mapeando entrada e estado corrente no estado

seguinteq0 : Estado inicialF : Conjunto de estados finais aceitáveis, F ε Q

2004 Eugénio Oliveira

Agentes Reactivos

Representação de Comportamentos:

Onde “Journey” representa uma agregação dos outros comportamentosde baixo nível referidos antes: “move-to-classroom”, “avoid-objects”, “dodge-students”, “stay-to-right”, “defer-to-elders”

•Diagramas FSA (“Finite State Acceptor”)• Exemplo de Navegação na sala de Aula:

Page 6: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

6

2004 Eugénio Oliveira

Agentes Reactivos

Métodos formais para descrever comportamentos de Robôs:

Notação funcional é um Método matemático formal

• Comportamentos como triplos (S,R,β) onde:

• S denota o domínio dos Estímulos interpretáveis (input),• R o conjunto das Respostas possíveis (estados seguintes)• β: SàR a função de mapeamento entre S e R (arco)

2004 Eugénio Oliveira

Agentes Reactivos

β(s)=rβ Comportamentos Estímulo

(s pode ser uma percepção com um valor p e uma certeza λ quepode ter de ultrapassar um limiar)

r Resposta(r no domínio por exemplo dos motores pode ser

potência, orientação)

Considera-se que o tempo não é um parâmetro de β pois a respostaseria instântanea

Page 7: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

7

2004 Eugénio Oliveira

Agentes Reactivos

Representação de Comportamentos:

Notação funcional:Exemplo de Navegação na Sala de aula:

2004 Eugénio Oliveira

Sistema de Controlo em Robô Móvel

Descrição de Múltiplos comportamentos activos:

S: vector de estímulos relevantes no instante tΒ: vector de comportamentos activos βi em tG: vector com a força relativa (ganho gi) de cada comportamento activo (βi) em tR: vector das respostas geradas pelo conjunto dos βi activos

Definição da função de Coordenação C:ρ= C(G*Β(S)) ou ρ=C(G*R)

A emergência é o resultado da coordenação e da imprevisibilidade do meio e do processo da percepção

Page 8: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

8

2004 Eugénio Oliveira

Sistema de Controlo em Robô Móvel

S= (coordenadas_sala, 1.0)(objecto_detectado, 0.2) Si=(s,λ)(estudante_detectado, 0.8) s: estímulo; (passo_detectado, 1.0) λ percentagem da força máxima(idoso_detectado, 1.0)

Neste exemplo, embora exista o estímulo objecto_detectado ele é fraco por o objecto estar ainda longe.

Exemplo de um Robô em uma sala no instante t:

Resposta comportamental: Comportamentos activados:B(S) = βmove_sala (s1)

βevita_objecto (s2)βfoje_estudante (s3)βvai-direita (s4)βaproxima_idoso (S5)

2004 Eugénio Oliveira

Sistema de Controlo em Robô Móvel

Exemplo de um Robô em uma sala no instante t:R é computado a partir de cada comportamento β

arbitrando magnitudes das respostas:R= (rmove_sala) 1.0

(revita _objecto) Rmag= 0(rfoje_estudante) 0.8(rvai_direita) 1.0(raproxima _idoso) 0

ri é um triplo [x,y,θ] exprimindo a direcção do movimentoDe acodo com Rmag, “evita_objecto” e “aproxima_idoso”, estão abaixo de um limiar e não produzem resposta. Enquanto que “ move_sala” e “vai_direito” tem a força máxima.

Como ρ=C(G*R) então vamos multiplicar o Ganho pelas respostas: R’ = R * G G é importante por atribuír força relativa aos comportamentos quando existemmúltiplos comportamentos concorrentes

Page 9: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

9

2004 Eugénio Oliveira

Sistema de Controlo em Robô Móvel

arbitrando magnitudes das respostas:G= (gmove_sala) 0.8

(gevita_objecto) = 1.2(gfoje_estudante) 1.5(gvai_direita) 0.4(gaproxima_idoso) 0.8

g1*r1 0.8e ρ= C(R’) = C( g2*r2 ) = C( 0 )

g3*r3 1.2g4*r4 0.4g5*r5 0

C depende da estratégia escolhida!Com uma estratégia “vencedor leva tudo”, C escolhe a componente com R’=1.2E ρ fica com o comportamento “foje_estudante” para executar.Atenção que este comportamento é dominante apenas devido à situação actual depercepção (no instante t)

2004 Eugénio Oliveira

Métodos Competitivos

Arbitragem via rede de supressões

Arquitecturade“subsunção”

Page 10: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

10

2004 Eugénio Oliveira

Agentes Reactivos

GAgentes Reactivos (Reflexivos):

2004 Eugénio Oliveira

Arquitectura de AgentesReactivos

GAgentes Reactivos (Reflexivos):GNão tem Estado internoG see mapeia Estados do ambiente em Percepções: S --> PG action mapeia sequencias de percepções em Acções: P*-->A

G Arquitectura de “Sub-assunção” (subordinação) (R.Brooks)G Comportamentos como RegrasG Emergência de Comportamento Social InteligenteG Racionalidade

Page 11: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

11

2004 Eugénio Oliveira

Agentes Reactivos

Agentes Reactivos na Robótica:

Domínio privilegiado e exigente relativamente à IA.

Robôs flexíveis e de tempo-real mostram limitações da IA clássica

Brooks (MIT) propôs arquitecturas de agentes mais flexíveis, simples, autónomose interactivos.

Modelo do Mundo implicarepresentação do estado interno eplaneamento moroso.

Modelo da IA clássica para o controlo do Robô inteligente por camadas

2004 Eugénio Oliveira

Agentes ReactivosSistemas Biológicos e Robótica:

Introdução de conceitos vindos da Etologia

Etologia: Ciência que estuda os comportamentos animais em condiçõesNaturais (Konrad Lorenz, Niko Tinbergen)

A inteligência passa a ser a habilidade de melhorar a capacidadede animais ou humanos sobreviverem no mundo real e, quandoapropriado, cooperar ou competir com outros agentes com essemesmo fim.

Certos comportamentos passam a ser vistos como inteligência.

Page 12: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

12

2004 Eugénio Oliveira

Agentes ReactivosSistemas Biológicos e Robótica:

Biónica: Libelinhas e Aviões; Sapos (orienta-se para a presa; salta para a zona escura se predador.

Retina:1 milhão de receptores, milhares de neurónios“ganglios” em várias camadas paralelas e especializadas. sensíveis ao movimento) e Visão Robótica

Pombos e Orientação (ângulo com o sol; campo magnético)Programa de controlo de orientação do pombo:

2004 Eugénio Oliveira

Agentes ReactivosSistemas Biológicos e Robótica:

Etologia diz que há:

• Comportamentos inatos

• Sequências de comportamentos inatos como máquinas de estado

• Comportamentos inatos com memória. •Precisam de inicialização e parametrização

• Comportamentos Aprendidos

Page 13: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

13

2004 Eugénio Oliveira

Agentes ReactivosEncadeamento de comportamentos:

2004 Eugénio Oliveira

Agentes Reactivos Vs IASENSORES

percepção

modelação do mundo

planeamento

execução dasacções

ACTUADORES

A Inteligência Artificial desenvolveu diversosAlgoritmos de Planeamento:“Análise meios-Fins” introduzindo a noção de Operadores e redução de distânciasPlaneamento Linear: tipo “STRIPS” (Fykes…) usando pilha de objectivos e condiçõesPlaneamento Não-Linear: tipo “ABSTRIPS” usando conjunto de objectivosPlaneamento Hierárquico:tipo NOAH(Sacerdoti ) com diversos graus de abstracçãoPlaneadores produzem uma correcta ordenação de acções feita depois da interpretaçãoda informação sensorial e usando o Modelo do Mundo: AbordagemCOGNITIVA

Abordagem cognitiva

Page 14: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

14

2004 Eugénio Oliveira

Agentes Reactivos Vs IA

Desvantagens:• Tempo de Computação• Representação complexa da Informação• Difícil ter uma representação adequada do mundoquando o ambiente é dinâmico ou os sensores não sãototalmente fiáveis

Há domínios onde são relevantes características como:Rapidez de actuaçãoSimplicidade de RepresentaçãoFlexibilidade na composição das acçõesComunicação simplificada

Arquitecturas Reactivas são adequadas para estas característicasDomínios: Robótica, pesquisa na internet, Controlo de tráfego

2004 Eugénio Oliveira

Agentes Reactivos

Tipos de Comportamentos:

• Comportamentos de exploração direccional:• Na direcção de…• Vaguear

• Comportamentos guiados por objectivos:• Atraídos por objecto específico• Atraídos por uma área

• Comportamentos de aversão e protecção:• Evitar obstáculos estáticos• Evitar obstáculos móveis• Agressão

Page 15: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

15

2004 Eugénio Oliveira

Agentes Reactivos

Tipos de Comportamentos:

• Comportamentos de seguimento:• seguir caminho• navegar em corredor• seguir linha

• Comportamentos sociais e cooperativos:• partilha• recolha (“foraging”)• agrupamento (“flocking”, “herding”)

•Comportamentos de percepção• varrimento• pesquisa visual

• Comportamentos para Manipuladores• alcançar, agarrar,…

2004 Eugénio Oliveira

Agentes reactivos: ideias chave

G decomposição de tarefasG propriedades emergentesG operações sobre representações simples

(próximas dos dados)

Page 16: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

16

2004 Eugénio Oliveira

Decomposição de Tarefas

G Agentes reactivos como uma colecção de módulosG Módulos operam autonomamenteG Módulos responsáveis por tarefas

específicasG Ex: Sentir, controlo do motor, cálculo de

valor de função, etc.G Comunicação entre módulos limitada e de

baixo nível

2004 Eugénio Oliveira

Emergência

G agentes são relativamente simples (e numerosos)

G interagem de modo básico

G padrões complexos de comportamentoemergem das interacções quando o sistema é visto na globalidadeG nenhuma especificação a priori (ou plano) do

comportamento do sistema reactivo

Page 17: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

17

2004 Eugénio Oliveira

VirtudesG Elimina a necessidade de representações

simbólicas ou Modelo pois: O Mundo é o seu própriomelhor modelo

G Tal “modelo” está sempre actualizado

G O sistema está ligado ao mundo via sensores e actuadores

2004 Eugénio Oliveira

G robustos e tolerantes às falhas: ex: um agente pode perder-se sem efeitoscatastróficos

G flexibilidadeG adaptaçãoG tempos de resposta rápidos

Virtudes

Page 18: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

18

2004 Eugénio Oliveira

ARQUITECTURA REACTIVA

Arquitectura Reactiva

Evitar ObstáculosVaguear

Explorar o espaço

AC

ÇÃ

O

PER

CE

PÇÃ

O

Construir mapas

Identificar Objectos

… … ...

2004 Eugénio Oliveira

Arquitecturas de “sub-assunção”Uma alternativa à arquitectura modelo/plano é a arquitecturadita de “subsumpção” (sub-assunção) proposta por Brooks.É baseada em comportamentos que são unidades de controlotrabalhando em paralelo sempre que certos valores de entradasão detectados.

Em vez de "fusão sensorial" passa-se para o problema dafusão de comportamentos o qual é resolvido por um esquema de arbitragem sobre as prioridades de tais comportamentos.Comportamentos não se encaixam, uns não chamam os outros,mas estão todos em paralelo.

Ex. de um comportamento em um robô:

Percepção Comportamento Acçãoentrada do sonar evitar comando motor

Arquitectura de Sub-assunção

Page 19: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

19

2004 Eugénio Oliveira .

Arquitectura de Sub-assunção

No entanto existe uma hierarquia que pode levar algunsComportamentos a suprimir outros temporariamente.

Exemplo de Arquitectura de Sub-assunção: Robô Móvel (“Rug Warrior” – MIT)

• Robô controlodo por Microprocessador e dispondo de Sensores de proximidade (infra-vermelhos), distância(ultra-sons) e de nível de energia.• Objectivo: movimentação sem colisão.

• Rede de Comportamentos reagindo aos sensores

2004 Eugénio Oliveira

Arquitectura de Sub-assunção

•Quando o robô está suficintemente próximo do Alimentador de Baterias, o comportamento EVITAR obstáculo é suprimido eos comandos do motor são só enviados pelo comportamentoALIMENTAR que dirige o robô directamente para o Alimentador

•Acções: Controlo dos Motores

• Ex. de Comportamentos:

• Evitar activa o sentido de marcha de acordocom valores dos sensores (virar no sentido oposto à distância maiscurta lida).

• Alimentar de acordo com nível de bateria

Page 20: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

20

2004 Eugénio Oliveira

Arquitectura de Sub-assunção

Módulo completo representando comportamento para inserirNa arquitectura de sub-assunção.Equivale a uma Máquina Finita de Estados Aumentada

2004 Eugénio Oliveira

Nível Bateria

Detector IV

Sonar

Alimentar

Evitar S Motores

Arquitectura de Sub-assunção

Page 21: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

21

2004 Eugénio Oliveira

Arquitectura de Sub-assunção

• O potencial conflito entre os dois comportamentos é resolvidopelo nó S (Supressão) cujo significado é:

O comando “Evitar” passa, a não ser que chegue ao nó S um comando em simultâneo na linha com seta (comportamentohierarquicamente superior).

• O comportamento “Alimentar” produz uma competência de maisAlto nível e subsume o comportamento “Evitar”.

• Este sistema não usa modelo do mundo e é reactivo.• É extensível uma vez que pode ser incrementado com novas camadasde comportamentos

2004 Eugénio Oliveira

Microfone

Para-choques

Detector IV

Fotocélulas

Detector padrão sonoro

ESCAPA

S

S

S S

EVITA

SEGUE

CRUZEIRO

Buzina

Motores

Arquitectura de Sub-assunção

O Robot “Rug Warrior” implementado no NIAD&R tem a seguinte Arquitectura de base:

Page 22: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

22

2004 Eugénio Oliveira

Arquitectura de Sub-assunção

Cada comportamento pode funcionar “em paralelo”, de acordo com as entradas.O comportamento “CRUZEIRO”apenas comanda os motores para movimento em frente.

Duas fotocélulas comparam a intensidade luminosa e, detectando uma diferença, geramum comando “SEGUE” que subsume o anterior, dirigindo o robô para a fonte de luz.

O comportamento “EVITA” é superior aqueles na hierarquia. Recebe do sensor IVum sinal de proximidade. Havendo obstáculo (p.ex. à direita ) o robô vira à esquerda.Se este sensor falha e o robô colidircom obstáculo (pára-choques), então o comportamento“ESCAPA” suprime as ordens dos anteriores e envia outro comando (recua).

O Microfone detector de som (batimento de palmas, p.ex.) activa uma buzina parandoos motores.

A implementação desta arquitectura em um processador simples, implica terum programa com um Ciclo que partilhava o tempo entre cada um dos comportamentos, simulando o efeito dos comportamentos actuando em paralelo.

2004 Eugénio Oliveira

Arquitectura de Sub-assunçãoArquitectura de sub-assunção do Genghisque tem 2 motores por pata :

α avança, patas para a frente e para trásβ balança, levanta e baixa pernas

Comportamentos:levantarandar simplesbalançarlevantar pernaestabilização….

Comportamentos básicos:levantarandar simples

Page 23: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

23

2004 Eugénio Oliveira

Aplicações

Sistema Aplicações

Ferber (1994) Simulação de sociedades animais (ex. Formigas)

Simulação de ecosistemas

RUG WARRIOR (1997) Robôs reactivos

PENGI(Agre & Chapman 1987)

Wavish & Graham (1995)

Jogo de VideoJogos com animação 3D

NIAD&R (1998) Controlo de Tráfego

2004 Eugénio Oliveira

CríticasG Âmbito da aplicabilidade limitada

sobretudo a jogos e simulações

G Não é clara a forma de projectar estessistemas tal que o comportamentopretendido se torne emergente

G Como se poderá tornar estes sistemasextensíveis, escaláveis e fáceis de corrigir?G O que acontece quando o ambiente é

dinâmico?

Page 24: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

24

2004 Eugénio Oliveira

CONCLUSÕES•A Arquitectura de “Sub-assunção” baseada em comportamentossimples permite a criação de agentes reactivos.

• Evitam-se Agentes cognitivos o que em domínios como a Robóticapode ser essencial.

• Robôs reactivos deixam de ter necessidade do modelo do mundoe de raciocinar antes de agir. Em situações muito dinâmicas comona Robótica móvel esta abordagem pode ser preferível.

• As interacções entre agentes reactivos devem ser elementares

Arquitectura de Sub-assunção

2004 Eugénio Oliveira

Arbitragem via selecção da acção

Arquitecturas Competitivas

Resposta pelo ComportamentoCom mais elevado grauDe activação

Arbitragem via selecção de acção (P.Maes):Depende dos níveis de activação resultantes dos objectivos dos Agentes e das percepções actuais. Selecciona o Máximo actual.(respostas do tipo: mto_esq, pco_esq, frente, pco_dir, mto_dir)

Page 25: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

25

2004 Eugénio Oliveira

Métodos Competitivos

Arbitragem via votação (Rosenblatt 89):Comportamentos votam nas acções. A mais votada é seleccionada (Distributed Architecture for Mobile Navigation Rosenblatt 95)

Repo

sta

do c

ompo

rtam

ento

mai

s vo

tado

2004 Eugénio Oliveira

Métodos CooperativosNa Fusão de Comportamentos as respostas de vários são tidas em conta (concorrem) para a saída final

Fusão de Comportamentos:A saída depende em simultâneo de mais do que um comportamento

Ex. Soma dos comportamentos ponderada pelos ganhos

Resp

osta

res

ulta

nte

da f

usão

de

com

port

amm

ento

s

Page 26: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

26

2004 Eugénio Oliveira

Métodos Cooperativos

Macro-Comportamentos:

Colecção de Comportamentos primitivos coordenados (por exemplo por fusão)

Ex: vaguear

testa (detecta_área_livre)evita_obstáculo_estático (detecta_obstáculos)ruído (gera_direcção_var) alto ganhoevita_repetir(detecta_áreas_visitadas)

2004 Eugénio Oliveira

Métodos Cooperativos

Resposta:

Vaguear

Diagrama de Junção de Comportamentos para “Vaguear” (macro)

Page 27: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

27

2004 Eugénio Oliveira

Métodos Cooperativos

A Junção de comportamentos “Vaguear” pode ainda ser combinada com outras macros :

Competição

(visitar postes)

2004 Eugénio Oliveira

Exemplo do Robô CompetidorArquitectura para robô competidor (encontrar posições assinaladas por postes)Comportamentos: vaguear; encontrar_poste; mover_p_polo

Diagrama FSA para robô competidor:

Parar

VaguearMove_pposte

Retornainício

Encontrapx_posteInício

Não_no_iníciooutros

Não_no_poste

Todos_postesencontrados

compete

Escolhe poste

no poste Não_encontrapostetimeout

Há_tempo

todos

No_início

Page 28: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

28

2004 Eugénio Oliveira

Exemplo do Robô ColectorArquitectura para robô colectorComportamentos: vaguear; evitar, colectar; entregar

Diagrama FSA para robô colector:

2004 Eugénio Oliveira

Exemplo do Robô ColectorArquitectura de “subsumpção” para robô colector:Comportamentos: vaguear; evitar, colectar; entregar

Resposta (comando motores)

Percepções

Page 29: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

29

2004 Eugénio Oliveira

Arquitecturas

Comparação de Arquitecturas:

• “Comunalidades”:

• enfatizam a ligação forte entre percepção e acção

• evitam pesadas representações de conhecimento

• decomposição em unidades significativas (comportamentos)

• Disparidades:

• granularidade da decomposição em comportamentos

• base da decomposição comportamental (etológica, actividade, ...)

• métodos de coordenação (competitivos, cooperativos)

• pogramação, plataformas,....

2004 Eugénio Oliveira

Agentes Inteligentes

• Dar inteligência aos Agentes:ex: Ele estuda porque quer passar no exame

Modelar intenções requer raciocínio + inteligência

• Técnicas para implementar racionalidade:•Raciocinio Simbólico•Planeamento•Satisfação de Restrições

•--> Sistemas Baseados em Conhecimento

• Qual a importância?•Comportamento mais complexo•Adaptação às condições dinâmicas•Aproximar-se do seu Objectivo•Aprender e usar Conhecimento novo

Page 30: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

30

2004 Eugénio Oliveira

Agentes DeliberativosG Basedos em Lógica :GAgentes com estado internoG see mapeia estados do ambiente em Percepções: S --> PG action mapeia estados Internos em Acções: I-->AG next constrói o próximo estado Interno : I X P--> I

G Qual a representação do estado?GComo representar a função Acção?

2004 Eugénio Oliveira

Arquitecturas de Agentes : basedas em Lógica

GAgente Baseado em Lógica:GTomada de Decisão vista como deduçãoG Estado Interno visto como uma base de dadosG Programa do Agente como uma Teoria LógicaGVantagens: programas provados em TeoriaGDesvantagens: difícil em ambientes com restrições temporais

G Acções: emfrente, vira, limpaG predicados de estado : em(x,y); lixo(x,y); voltado(direcção)

0 1 2

0

1

2

Exemplo

Page 31: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

31

2004 Eugénio Oliveira

G See Percepções: lixo, nullG Next Si: altere Si-1 com Percepçõesusando predicados do domínio

G Descrição extensiva do Conhecimento: muita memória

0 1 2

0

1

2

GAcções : em(X,Y) Λ lixo(X,Y) --> limpa(X,Y)em(0,0) Λ voltado(norte) Λ∼lixo(0,0) --> fazer(emfrente)em(0,2) Λ voltado(norte) Λ ∼lixo(0,2) --> fazer(vira)

… … …… … ...

Arquitecturas de Agentes : baseadas em Lógica

2004 Eugénio Oliveira

Arquitecturas de Agentes cognitivos

GAgentes com capacidades de dedução lógica :

G Demonstradores de Teoremas“impraticáveis” pois a decisão tomada seria óptima só quandoo processo de decisão se iniciou.G inaceitável em ambiente muito dinâmicoG problema da função “see” (mapear o mundo em percepçõese representá -lo em fórmulas)

Page 32: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

32

2004 Eugénio Oliveira

Arquitecturas de Agentes cognitivos

2004 Eugénio Oliveira

Agentes ComunicativosG Programas/ObjectosG Chamadas a Procedimentos/invoca MétodosG possibilidades pré-definidas

G Agentes:G Decisão autónoma sobre resposta a pedidosG Linguagens de ComunicaçãoG Mensagens e Conteúdos não pré-fixadosG Comunicação sobre:

GCrençasGObjectivosGPlanos

GQual a importância da Comunicação:GCoordenação, Cooperação e Negociaçãoentre Agentes heterogéneos

Page 33: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

33

2004 Eugénio Oliveira

Arquitectura BDIGArquitectura de agentes BDI

G Intenções dos Agentes guiam as AcçõesG Intenções baseiam-se em Crenças

G Raciocínio prático em Agentes BDI usa:G Crenças acerca do ambienteG Função de Revisão baseada nas actuais PercepçõesG Gerador de hipóteses (Desejos)G Função de Filtragem (processo de Deliberação)G Intenções Correntes (foco)G Função de Selecção da Acção

2004 Eugénio Oliveira

Garquitectura BDI do agente

crenças

desejos

intenções

frc

Ger.opções

Filtro

Acção

Acção output

percepções

Arquitectura BDI

Page 34: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

34

2004 Eugénio Oliveira

Arquitectura BDI (CDI)“Beliefs- Desires- Intentions

Raciocínio Prático Vs Raciocínio Teórico

Acções Crenças

Raciocinio

G Agentes não usam raciocínio lógico puro paratomada de decisão

2004 Eugénio Oliveira

G Raciocínio Prático:GDeliberação: O quê? (se deve fazer)

GPlaneamento: Como? (se deve fazer)

GDeliberação e Planeamento usam recursos que são limitados

G Lógica Intencional necessária para os Agentes definiremo seu comportamento (p.ex. o operador Ki φ)

G“Intenções” tem mais peso que “Desejos” (Opções)G“Intenções” são pró-atitudes levando a acções e Objectivosque foi decidido atingir.G “Intenções“ persistem e guiam o raciocíneo de planeamentorestrinjem deliberações futuras e influenciam novas crenças

Raciocínio Prático

Page 35: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

35

2004 Eugénio Oliveira

GRepresentação explícita dos BDI no Agente

G deliberação é modelada por duas funções de assinaturas:

G geração de Opções opç: Φ(Bel) X Φ(Int) à Φ(Des)

G filtragem filtro: Φ(Bel) X Φ(Des) à Φ(Int)

G A Revisão de Crenças é modelada por:

G brf: Φ(Bel) X percepções à Φ(Bel)

Arquitectura BDI

2004 Eugénio Oliveira

• Processo de Deliberação:

– Gerar Opções– Ponderar Opções– Escolher (filtrar)– Comprometer-se com as Opções escolhidas (Intenções)

• Processo de Planeamento:

– Raciocínio por Análise-Meios-Fins (MEA)– Representação de Objectivos/Intenções (ontologia de situações)– representação do Estado do Mundo (idem)– Acções possíveis/operadores (ontologia de operações)– Representação do Plano

Arquitectura BDI

Page 36: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

36

2004 Eugénio Oliveira

– Ciclo simples do Controlo do Agente BDI:

•B:=B0 % Crenças iniciais•I:=I0 % Intenções iniciais•ENQUANTO Verdade FAZER

•Busca próxima percepção P;•B:= frc(B,P); % Actualiza Crenças•D:=opções(B,I); % Das Crenças e actuais Intensões gera

opções possíveis•I:=filtro(B,D,I); % selecção de novas Intensões coerêntes

• Π:=planeamento(B,I);•Execução(Π)

•FIM ENQUANTO

Arquitectura BDI

2004 Eugénio Oliveira

– Ciclo completo do Controlo do Agente BDI:

•B:=B0 % Crenças iniciais•I:=I0 % Intenções iniciais•ENQUANTO Verdade FAZER

•Busca próxima percepção P;•B:= frc(B,P); % Actualiza Crenças•D:=opções(B,I); % Das Crenças e actuais Intensões gera

opções possíveis•I:=filtro(B,D,I); % selecção de novas Intensões coerêntes• π:=planeamento(B,I);•ENQUANTO NÃO π =[]

OU sucesso(I,B)OU impossível(I,B) FAZER

• π = [A1|RP]; α:=A1;•executa(α);• π = RP;

Arquitectura BDI

Page 37: Arquitecturas de Controlode Robôs (Móveis)eol/ROBO/20052006/3a_AR.pdf · i é um triplo [x,y, θ] exprimindo a direcção do movimento De acodo com Rmag, “evita_objecto” e “aproxima_idoso”,

37

2004 Eugénio Oliveira

– Ciclo completo do Controlo do Agente BDI (cont.):

•Busca nova percepção p; % através da função “see”•B:= frc(B,P); % Actualiza Crenças•SE reconsidera(B,I) ENTÃO

•D:=opções(B,I); % Das Crenças e actuais Intensõesgera opções possíveis

•I:=filtro(B,D,I); % selecção de novas Intensõescoerêntes

•FIM SE•SE NÃO coerência(π,I,B) ENTÃO

π:=planeamento(B,I);•FIM SE

•FIM ENQUANTO•FIM ENQUANTO

Arquitectura BDI

2004 Eugénio Oliveira

– Reconsiderar:

– Agentes tem estratégias diferentes para “reconsiderar”–“fanáticos”: Nunca reconsideram as suas intenções– “cautelosos”: reconsideram as suas intenções depois de cadaacção.

– Agentes “cautelosos” tem melhor desempenho que os“fanáticos” quando o ambiente é muito dinâmico. – O contrário verifica-se para ambientes pouco dinâmicos.

Arquitectura BDI