raciocínio prático luiz a m palazzo abril de 2010
Post on 17-Apr-2015
102 Views
Preview:
TRANSCRIPT
Raciocínio Prático
Luiz A M PalazzoAbril de 2010
Agentes Inteligentes
Sensores
Atuadores
AGENTE
Raciocínio Prático
• É o raciocínio orientado à É o raciocínio orientado à açãoação (o processo de (o processo de descobrir o que fazer) em contraponto ao descobrir o que fazer) em contraponto ao raciocínio teórico, que é raciocínio teórico, que é orientado às crenças do agente.orientado às crenças do agente.
• O raciocínio prático humano consiste em duas O raciocínio prático humano consiste em duas atividades:atividades:
• DeliberaçãoDeliberação: decidir onde se quer chegar, e: decidir onde se quer chegar, e• Raciocínio Meios-FimRaciocínio Meios-Fim: decidir como chegar lá: decidir como chegar lá
• O resultado da deliberação é a O resultado da deliberação é a intençãointenção
• A intenção é muito mais forte do que meros desejosA intenção é muito mais forte do que meros desejos
Planejamento
• Agentes PlanejadoresAgentes Planejadores• Planejamento é essencialmente programação Planejamento é essencialmente programação
automáticaautomática
• Raciocínio Meios-Fim: Dar ao agente:Raciocínio Meios-Fim: Dar ao agente:• Representação da Representação da meta/intençãometa/intenção a atingir, a atingir,• Representação das Representação das açõesações que podem ser que podem ser
executadas,executadas,• Representação do Representação do ambienteambiente......• ... e receber um ... e receber um plano plano para atingir a meta para atingir a meta
Exemplo: Mundo dos Blocos
• Contém (a) um braço robô, (b) três blocos A, B e C e (c) um Contém (a) um braço robô, (b) três blocos A, B e C e (c) um
topo de mesa topo de mesa
• Ontologia on(x,y), ontable(x), clear(x), holding(x)Ontologia on(x,y), ontable(x), clear(x), holding(x)
• Ex: clear(A). on(A,B). ontable(B). ontable(C).Ex: clear(A). on(A,B). ontable(B). ontable(C).
• Emprega-se a Hipótese do Mundo Fechado.Emprega-se a Hipótese do Mundo Fechado.
• Um objetivo é representado por um conjunto de fórmulas: Um objetivo é representado por um conjunto de fórmulas: ontable(A) ^ ontable(B) ^ ontable(C)ontable(A) ^ ontable(B) ^ ontable(C)
• As ações são representadas como no sistema STRIPS. As ações são representadas como no sistema STRIPS.
• Cada ação possui: (a) um nome, (b) uma pré-condição, (c) Cada ação possui: (a) um nome, (b) uma pré-condição, (c) uma uma del-list e (d) uma add-list. Cada um destes elementos pode del-list e (d) uma add-list. Cada um destes elementos pode possuir variáveis.possuir variáveis.
Exemplo: stack(x,y)
• A ação stack(x,y) pode ser assim definida:A ação stack(x,y) pode ser assim definida:
• Nome:Nome: stack(x,y)stack(x,y)• Pré:Pré: clear(y) ^ holding(x)clear(y) ^ holding(x)• Del:Del: clear(y) ^ holding(x)clear(y) ^ holding(x)• Add:Add: armempty ^ on(x,y)armempty ^ on(x,y)
• Exemplos: definir unstack(x,y), pickup(x), Exemplos: definir unstack(x,y), pickup(x), putdown(x)putdown(x)
Loop de Controle do Agente
• O que é um plano? Uma seqüência de ações com O que é um plano? Uma seqüência de ações com variáveis sendo substituídas por constantes.variáveis sendo substituídas por constantes.
• Agent Control Loop Agent Control Loop
1. while true1. while true2. 2. observe the world;observe the world;3. 3. update internal world model;update internal world model;4. 4. deliberate about what intention to achieve next;deliberate about what intention to achieve next;5. 5. use means-ends reasoning to get a plan for the intention;use means-ends reasoning to get a plan for the intention;6. 6. execute the planexecute the plan
7. end while7. end while
Deliberação
• Como um agente delibera?Como um agente delibera?• Começa por tentar entender que Começa por tentar entender que opçõesopções tem tem
disponíveisdisponíveis• Escolhe entre elas e se Escolhe entre elas e se comprometecompromete com uma com uma
delasdelas• As opções escolhidas são então As opções escolhidas são então intençõesintenções
• A A função de deliberação função de deliberação pode ser pode ser decomposta em dois componentes funcionais:decomposta em dois componentes funcionais:• Geração de opçõesGeração de opções• FiltragemFiltragem
Raciocínio Meios - Fim• Simulação Simulação (1)(1)
8
A(8)
Estado Inicial
4 4
Estado Objetivo
B(5)
C(3)
A(8)
B(5)
C(3)
Passo 1
Passo 2
Passo 3
Passo 4
Passo 5
Passo 6
Passo 7
Conferindo...
• Teseu e o Minotauro:Teseu e o Minotauro:• http://www.logicmazes.com/theseus.html
• Vários DesafiosVários Desafios• http://www.logicmazes.com
As Torres de Hanói
ESTADO INICIAL ESTADO OBJETIVO
?
Clique aqui para jogar: http://www.mazeworks.com/hanoi/
Busca em Espaços de Estados
A solução é um caminho no
ESPAÇO DE ESTADOS
Estado Inicial
Estado Final
Espaço de EstadosSolução
Estratégias de Busca
•Tentativa e ErroTentativa e Erro•Hill ClimbingHill Climbing•Análise Meios-FinsAnálise Meios-Fins
Tentativa e Erro
Pode ser organizada: pesquisa em amplitude, ou em profundidade.
Chega ao objetivo após um grande número de passos aleatórios
Muitos movimentos são desperdiçados
Mas pode ser a saída quando não se tem outra alternativa
A cada estado possívelA cada estado possívelum valor é atribuído. um valor é atribuído. Aqui quanto mais baixo Aqui quanto mais baixo melhor.melhor.
A cada passo um novo A cada passo um novo estado é escolhido com estado é escolhido com um valor melhor.um valor melhor.
Pode “empacar”. Pode “empacar”. (Onde?)(Onde?)
Nesse caso usar T&E;Nesse caso usar T&E;
Estado Inicial
Estado Objetivo
12
12
3
4 3 2
34
Hill Climbing
Hill Climbing
• Dependendo do estado inicial o trajeto pode ficar Dependendo do estado inicial o trajeto pode ficar empacado em um máximo localempacado em um máximo local
Análise Meios-Fim
• Não há planejamento envolvido nas estratégias Não há planejamento envolvido nas estratégias “Tentativa e Erro” e “Hill Climbing”“Tentativa e Erro” e “Hill Climbing”
• A Análise Meios-Fim distingue entre A Análise Meios-Fim distingue entre planejar planejar um um movimento e movimento e executarexecutar um movimento um movimento
• Foi proposta como parte do General Problem Solver Foi proposta como parte do General Problem Solver (GPS) por Newell e Simon em 1972.(GPS) por Newell e Simon em 1972.
Análise Meios-Fim
A busca é guiada pela detecção das diferenças entre o estado corrente A busca é guiada pela detecção das diferenças entre o estado corrente e o e o estado objetivo.estado objetivo.
1) 1) Comparar o estado corrente com o estado objetivo e identificar as Comparar o estado corrente com o estado objetivo e identificar as diferenças. diferenças.
2) 2) Selecionar um operador para reduzir a diferença.Selecionar um operador para reduzir a diferença.
3)3) Se o operador pode ser aplicado, fazer isto;Se o operador pode ser aplicado, fazer isto;
4)4) Se não, estabelecer um novo sub-objetivo, de atingir um estado no qual Se não, estabelecer um novo sub-objetivo, de atingir um estado no qual o o operador possa ser aplicado. operador possa ser aplicado.
5)5) A análise meios-fim é então recursivamente aplicada a este novo A análise meios-fim é então recursivamente aplicada a este novo sub-objetivo.sub-objetivo.
6)6) Voltar a 1Voltar a 1
Um Exemplo Simples
• Pintar sua casa Pintar sua casa • Aplicar pintura Aplicar pintura • Precisa de tinta e pincel Precisa de tinta e pincel • Ir até a ferragem Ir até a ferragem • Achar as chaves do carro …Achar as chaves do carro …
A Pilha de Objetivos
• Pintar a casaPintar a casa (Objetivo 1)(Objetivo 1)• Aplicar a pinturaAplicar a pintura (Sub-objetivo 2)(Sub-objetivo 2)
• Precisa de tinta e pincelPrecisa de tinta e pincel (Sub-objetivo 3)(Sub-objetivo 3)• Vai até a ferragemVai até a ferragem (Sub-objetivo 4)(Sub-objetivo 4)
• Chega na ferragemChega na ferragem (Sub-objetivo 4)(Sub-objetivo 4)• Adquire tinta e pincelAdquire tinta e pincel (Sub-objetivo 3)(Sub-objetivo 3)• Aplica a pinturaAplica a pintura (Sub-objetivo 2)(Sub-objetivo 2)• Pinta a casaPinta a casa (Objetivo 1)(Objetivo 1)
G1
Funcionamento da Pilha de Objetivos
G1G2
G1G2G3
G1G2G3G4
Push Goal 1
on Stack
G1G2G3
G4
Push Goal 2
on Stack
Push Goal 3
on Stack
Push Goal 4
on Stack
Solved Goal 4:Pop-off Stack
Sistemas de Produções
Um conjunto de regras de produção (regras se-então)Um conjunto de regras de produção (regras se-então)
SESE você tem um pincel de rolo, você tem um pincel de rolo,E você tem tintaE você tem tintaE você tem uma superfície pronta para ser pintadaE você tem uma superfície pronta para ser pintadaE a superfície é grandeE a superfície é grandeE o seu objetivo é pintar a superfícieE o seu objetivo é pintar a superfície
ENTÃOENTÃO use o rolo embebido em tinta para pintar a use o rolo embebido em tinta para pintar a superfíciesuperfícieE espere que a superfície resulte pintada.E espere que a superfície resulte pintada.
Aplicando Sistemas de Produções
1) As condições das regras são comparadas com o conteúdo 1) As condições das regras são comparadas com o conteúdo correntemente ativo na memória de trabalho. correntemente ativo na memória de trabalho.
2) Se mais do que uma regra pode ser aplicada, aplicar 2) Se mais do que uma regra pode ser aplicada, aplicar procedimentos de solução de conflito. procedimentos de solução de conflito.
3) A regra selecionada é disparada.3) A regra selecionada é disparada.
4) Retorna a 14) Retorna a 1
(O Modelo ACT de Anderson: (O Modelo ACT de Anderson: “a cognição humana baseia-se em sistemas de produções”). “a cognição humana baseia-se em sistemas de produções”).
top related