raciocínio prático

23
Raciocínio Prático Luiz A M Palazzo Abril de 2010

Upload: hanae-thompson

Post on 03-Jan-2016

45 views

Category:

Documents


0 download

DESCRIPTION

Raciocínio Prático. Luiz A M Palazzo Abril de 2010. Agentes Inteligentes. Sensores. AGENTE. Racionalidade. AMBIENTE. Atuadores. Raciocínio Prático. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Raciocínio Prático

Raciocínio Prático

Luiz A M PalazzoAbril de 2010

Page 2: Raciocínio Prático

Agentes Inteligentes

Sensores

Atuadores

AGENTE

Page 3: Raciocínio Prático

Raciocínio Prático

• É o raciocínio orientado à É o raciocínio orientado à açãoação (o processo de (o processo de descobrir o que fazer) em contraponto ao descobrir o que fazer) em contraponto ao raciocínio teórico, que é raciocínio teórico, que é orientado às crenças do agente.orientado às crenças do agente.

• O raciocínio prático humano consiste em duas O raciocínio prático humano consiste em duas atividades:atividades:

• DeliberaçãoDeliberação: decidir onde se quer chegar, e: decidir onde se quer chegar, e• Raciocínio Meios-FimRaciocínio Meios-Fim: decidir como chegar lá: decidir como chegar lá

• O resultado da deliberação é a O resultado da deliberação é a intençãointenção

• A intenção é muito mais forte do que meros desejosA intenção é muito mais forte do que meros desejos

Page 4: Raciocínio Prático

Planejamento

• Agentes PlanejadoresAgentes Planejadores• Planejamento é essencialmente programação Planejamento é essencialmente programação

automáticaautomática

• Raciocínio Meios-Fim: Dar ao agente:Raciocínio Meios-Fim: Dar ao agente:• Representação da Representação da meta/intençãometa/intenção a atingir, a atingir,• Representação das Representação das açõesações que podem ser que podem ser

executadas,executadas,• Representação do Representação do ambienteambiente......• ... e receber um ... e receber um plano plano para atingir a meta para atingir a meta

Page 5: Raciocínio Prático

Exemplo: Mundo dos Blocos

• Contém (a) um braço robô, (b) três blocos A, B e C e (c) um Contém (a) um braço robô, (b) três blocos A, B e C e (c) um

topo de mesa topo de mesa

• Ontologia on(x,y), ontable(x), clear(x), holding(x)Ontologia on(x,y), ontable(x), clear(x), holding(x)

• Ex: clear(A). on(A,B). ontable(B). ontable(C).Ex: clear(A). on(A,B). ontable(B). ontable(C).

• Emprega-se a Hipótese do Mundo Fechado.Emprega-se a Hipótese do Mundo Fechado.

• Um objetivo é representado por um conjunto de fórmulas: Um objetivo é representado por um conjunto de fórmulas: ontable(A) ^ ontable(B) ^ ontable(C)ontable(A) ^ ontable(B) ^ ontable(C)

• As ações são representadas como no sistema STRIPS. As ações são representadas como no sistema STRIPS.

• Cada ação possui: (a) um nome, (b) uma pré-condição, (c) Cada ação possui: (a) um nome, (b) uma pré-condição, (c) uma uma del-list e (d) uma add-list. Cada um destes elementos pode del-list e (d) uma add-list. Cada um destes elementos pode possuir variáveis.possuir variáveis.

Page 6: Raciocínio Prático

Exemplo: stack(x,y)

• A ação stack(x,y) pode ser assim definida:A ação stack(x,y) pode ser assim definida:

• Nome:Nome: stack(x,y)stack(x,y)• Pré:Pré: clear(y) ^ holding(x)clear(y) ^ holding(x)• Del:Del: clear(y) ^ holding(x)clear(y) ^ holding(x)• Add:Add: armempty ^ on(x,y)armempty ^ on(x,y)

• Exemplos: definir unstack(x,y), pickup(x), Exemplos: definir unstack(x,y), pickup(x), putdown(x)putdown(x)

Page 7: Raciocínio Prático

Loop de Controle do Agente

• O que é um plano? Uma seqüência de ações com O que é um plano? Uma seqüência de ações com variáveis sendo substituídas por constantes.variáveis sendo substituídas por constantes.

• Agent Control Loop Agent Control Loop

1. while true1. while true2. 2. observe the world;observe the world;3. 3. update internal world model;update internal world model;4. 4. deliberate about what intention to achieve next;deliberate about what intention to achieve next;5. 5. use means-ends reasoning to get a plan for the intention;use means-ends reasoning to get a plan for the intention;6. 6. execute the planexecute the plan

7. end while7. end while

Page 8: Raciocínio Prático

Deliberação

• Como um agente delibera?Como um agente delibera?• Começa por tentar entender que Começa por tentar entender que opçõesopções tem tem

disponíveisdisponíveis• Escolhe entre elas e se Escolhe entre elas e se comprometecompromete com uma com uma

delasdelas• As opções escolhidas são então As opções escolhidas são então intençõesintenções

• A A função de deliberação função de deliberação pode ser pode ser decomposta em dois componentes funcionais:decomposta em dois componentes funcionais:• Geração de opçõesGeração de opções• FiltragemFiltragem

Page 9: Raciocínio Prático

Raciocínio Meios - Fim• Simulação Simulação (1)(1)

8

A(8)

Estado Inicial

4 4

Estado Objetivo

B(5)

C(3)

A(8)

B(5)

C(3)

Passo 1

Passo 2

Passo 3

Passo 4

Passo 5

Passo 6

Passo 7

Page 10: Raciocínio Prático

Conferindo...

• Teseu e o Minotauro:Teseu e o Minotauro:• http://www.logicmazes.com/theseus.html

• Vários DesafiosVários Desafios• http://www.logicmazes.com

Page 11: Raciocínio Prático

As Torres de Hanói

ESTADO INICIAL ESTADO OBJETIVO

?

Clique aqui para jogar: http://www.mazeworks.com/hanoi/

Page 12: Raciocínio Prático

Busca em Espaços de Estados

A solução é um caminho no

ESPAÇO DE ESTADOS

Estado Inicial

Estado Final

Espaço de EstadosSolução

Page 13: Raciocínio Prático

Estratégias de Busca

•Tentativa e ErroTentativa e Erro•Hill ClimbingHill Climbing•Análise Meios-FinsAnálise Meios-Fins

Page 14: Raciocínio Prático

Tentativa e Erro

Pode ser organizada: pesquisa em amplitude, ou em profundidade.

Chega ao objetivo após um grande número de passos aleatórios

Muitos movimentos são desperdiçados

Mas pode ser a saída quando não se tem outra alternativa

Page 15: Raciocínio Prático

A cada estado possívelA cada estado possívelum valor é atribuído. um valor é atribuído. Aqui quanto mais baixo Aqui quanto mais baixo melhor.melhor.

A cada passo um novo A cada passo um novo estado é escolhido com estado é escolhido com um valor melhor.um valor melhor.

Pode “empacar”. Pode “empacar”. (Onde?)(Onde?)

Nesse caso usar T&E;Nesse caso usar T&E;

Estado Inicial

Estado Objetivo

12

12

3

4 3 2

34

Hill Climbing

Page 16: Raciocínio Prático

Hill Climbing

• Dependendo do estado inicial o trajeto pode ficar Dependendo do estado inicial o trajeto pode ficar empacado em um máximo localempacado em um máximo local

Page 17: Raciocínio Prático

Análise Meios-Fim

• Não há planejamento envolvido nas estratégias Não há planejamento envolvido nas estratégias “Tentativa e Erro” e “Hill Climbing”“Tentativa e Erro” e “Hill Climbing”

• A Análise Meios-Fim distingue entre A Análise Meios-Fim distingue entre planejar planejar um um movimento e movimento e executarexecutar um movimento um movimento

• Foi proposta como parte do General Problem Solver Foi proposta como parte do General Problem Solver (GPS) por Newell e Simon em 1972.(GPS) por Newell e Simon em 1972.

Page 18: Raciocínio Prático

Análise Meios-Fim

A busca é guiada pela detecção das diferenças entre o estado corrente A busca é guiada pela detecção das diferenças entre o estado corrente e o e o estado objetivo.estado objetivo.

1) 1) Comparar o estado corrente com o estado objetivo e identificar as Comparar o estado corrente com o estado objetivo e identificar as diferenças. diferenças.

2) 2) Selecionar um operador para reduzir a diferença.Selecionar um operador para reduzir a diferença.

3)3) Se o operador pode ser aplicado, fazer isto;Se o operador pode ser aplicado, fazer isto;

4)4) Se não, estabelecer um novo sub-objetivo, de atingir um estado no qual Se não, estabelecer um novo sub-objetivo, de atingir um estado no qual o o operador possa ser aplicado. operador possa ser aplicado.

5)5) A análise meios-fim é então recursivamente aplicada a este novo A análise meios-fim é então recursivamente aplicada a este novo sub-objetivo.sub-objetivo.

6)6) Voltar a 1Voltar a 1

Page 19: Raciocínio Prático

Um Exemplo Simples

• Pintar sua casa Pintar sua casa • Aplicar pintura Aplicar pintura • Precisa de tinta e pincel Precisa de tinta e pincel • Ir até a ferragem Ir até a ferragem • Achar as chaves do carro …Achar as chaves do carro …

Page 20: Raciocínio Prático

A Pilha de Objetivos

• Pintar a casaPintar a casa (Objetivo 1)(Objetivo 1)• Aplicar a pinturaAplicar a pintura (Sub-objetivo 2)(Sub-objetivo 2)

• Precisa de tinta e pincelPrecisa de tinta e pincel (Sub-objetivo 3)(Sub-objetivo 3)• Vai até a ferragemVai até a ferragem (Sub-objetivo 4)(Sub-objetivo 4)

• Chega na ferragemChega na ferragem (Sub-objetivo 4)(Sub-objetivo 4)• Adquire tinta e pincelAdquire tinta e pincel (Sub-objetivo 3)(Sub-objetivo 3)• Aplica a pinturaAplica a pintura (Sub-objetivo 2)(Sub-objetivo 2)• Pinta a casaPinta a casa (Objetivo 1)(Objetivo 1)

Page 21: Raciocínio Prático

G1

Funcionamento da Pilha de Objetivos

G1G2

G1G2G3

G1G2G3G4

Push Goal 1

on Stack

G1G2G3

G4

Push Goal 2

on Stack

Push Goal 3

on Stack

Push Goal 4

on Stack

Solved Goal 4:Pop-off Stack

Page 22: Raciocínio Prático

Sistemas de Produções

Um conjunto de regras de produção (regras se-então)Um conjunto de regras de produção (regras se-então)

SESE você tem um pincel de rolo, você tem um pincel de rolo,E você tem tintaE você tem tintaE você tem uma superfície pronta para ser pintadaE você tem uma superfície pronta para ser pintadaE a superfície é grandeE a superfície é grandeE o seu objetivo é pintar a superfícieE o seu objetivo é pintar a superfície

ENTÃOENTÃO use o rolo embebido em tinta para pintar a use o rolo embebido em tinta para pintar a superfíciesuperfícieE espere que a superfície resulte pintada.E espere que a superfície resulte pintada.

Page 23: Raciocínio Prático

Aplicando Sistemas de Produções

1) As condições das regras são comparadas com o conteúdo 1) As condições das regras são comparadas com o conteúdo correntemente ativo na memória de trabalho. correntemente ativo na memória de trabalho.

2) Se mais do que uma regra pode ser aplicada, aplicar 2) Se mais do que uma regra pode ser aplicada, aplicar procedimentos de solução de conflito. procedimentos de solução de conflito.

3) A regra selecionada é disparada.3) A regra selecionada é disparada.

4) Retorna a 14) Retorna a 1

(O Modelo ACT de Anderson: (O Modelo ACT de Anderson: “a cognição humana baseia-se em sistemas de produções”). “a cognição humana baseia-se em sistemas de produções”).