aprendizagem

15
Aprendizagem Viviane Torres da Silva [email protected] http://www.ic.uff.br/~viviane.silva/isma

Upload: tyne

Post on 19-Jan-2016

25 views

Category:

Documents


0 download

DESCRIPTION

Aprendizagem. Viviane Torres da Silva [email protected] http://www.ic.uff.br/~viviane.silva/ isma. Introdução. Sistemas de aprendizagem são sistemas adaptáveis e com técnicas de aprendizagem - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Aprendizagem

Aprendizagem

Viviane Torres da Silva

[email protected]

http://www.ic.uff.br/~viviane.silva/isma

Page 2: Aprendizagem

Introdução

Sistemas de aprendizagem são sistemas adaptáveis e com técnicas de aprendizagem

O conjunto de situações é tão grande que não definimos todas as possibilidades quando descrevemos o problema

Aprendizagem: melhora do comportamento futuro baseada na experiência passada

Normalmente dizemos que se o agente inteligente então é porque ele tem a capacidade de aprener. E se tem a capacidade de aprender então é porque o agente é inteligente.

Page 3: Aprendizagem

Aprendizagem

Aprendizagem de um agente– O agente tem a capacidade de aprender e melhorar seu rendimento e o

rendimento do sistema

Aprendizagem do sistema multi-agente– Não é simplesmente a soma da aprendizagem de todos os agentes do

sistema de maneira isolada

– A aprendizagem de um agente é influenciada pelos demais agentes

– Vários agentes podem aprender de uma maneira distribuída e interativa como se fossem um único corpo

Page 4: Aprendizagem

Categoria principal

Processo de aprendizagem: planejamento, inferência e passos de decisões

Aprendizagem centralizado (aprendizagem isolada)– Todos as etapas do processo de aprendizagem são executadas por um

único agente que não interage com os outros

– O agente é completamente independente dos outros

Aprendizagem descentralizada (aprendizagem interativa)– Vários agentes estão envolvidos no processo de aprendizagem

– As atividades do processo de aprendizagem são executadas por diferentes agentes

Page 5: Aprendizagem

Características da aprendizagem I/IV

Grau de descentralização– Distribuição e paralelismo das atividades do processo de aprendizagem

Características especificas da interação– Nível de interação (desde pura observação até diálogos complexos como

a negociação)– Persistência da interação (desde pouca até muita)– Freqüência da interação (desde pouca interação até muita)– Padrão de interação (desde completamente não estruturada até

hierárquica)– Variedade da interação (desde fixa até variável)

Características específicas do envolvimento– Relevância do envolvimento– Papel desempenhado na interação (generalista, aquele executa todas as

tarefas do processo de aprendizagem, ou especialista, que executa somente algumas)

Page 6: Aprendizagem

Características da aprendizagem II/IV Características específicas do objetivo

– Tipo de melhora que o agente deseja alcançar com a aprendizagem– Compatibilidade entre os objetivos de aprendizagem dos agentes

Método ou estratégia de aprendizagem– Aprendizagem direta (implantação do conhecimento sem necessidade

de inferência do aprendiz)– Aprendizagem a partir de um conselho ou instrução (aprende quando

recebe um conselho, não foi una experiência do agente)– Aprendizagem por exemplos ou práticas (extração ou refinamento do

conhecimento a partir de experiências positivas ou negativas)– Aprendizagem por analogia (conhecimento adquirido a partir de

soluções de problemas similares)– Aprendizagem por descoberta (conhecimento adquirido a partir de

observações, execuções de experimentos, teste de hipóteses,…)

Page 7: Aprendizagem

Características da aprendizagem III/IV

Reação da aprendizagem– Aprendizagem inspecionada

• a resposta enviada pelo aprendiz especifica as atividades desejadas• o objetivo da aprendizagem é encontrar as ações desejadas

– Aprendizagem por reforço• a resposta somente informa a utilidade da atividade realizada pelo

aprendiz• o objetivo da aprendizagem é maximizar a função de utilidade

– Aprendizagem não inspecionada• Nenhuma resposta é fornecida• O objetivo é encontrar atividades úteis e desejadas utilizando o

processo de tentativa e errp

Page 8: Aprendizagem

Características da aprendizagem IV/IV

Reação da aprendizagem– As respostas à ações são fornecidas pelo ambiente ou por outros agentes

do sistema

– São eles que “ensinam” o agente no caso de aprendizagem inspecionada

– São eles que “criticam” o agente no caso de aprendizagem por reforço

– São eles que “observam” o agente no caso de aprendizagem não inspecionada

Page 9: Aprendizagem

Problema da atribuição de créditos e culpas

A resposta do ambiente e dos outros agentes avaliam o comportamento do agente

A resposta dará crédito para os comportamentos bons e punirá o agente por mal comportamento

Avaliação inter-agente: – Avalia todo o comportamento em geral (varias ações de uma só vez)

– Problema no caso de sistemas multi-agente: Como saber qual agente executou qual tarefa?

Avaliação intra-agente:– Avalia uma determinada ação do agente

Page 10: Aprendizagem

Problema da aprendizagem por reforço em SMA

Aprendizagem por reforço pode ser utilizada quando:– Os agentes têm pouco ou nenhum conhecimento do domínio

– Os agentes têm pouca informação sobre as capacidades e os objetivos dos outros agentes

Problemas:– Pouca informação sobre os outros agentes torna a coordenação ainda

mais difícil

– Quando os agentes necessitam comunicar-se para coordenar-se, se a qualidade da comunicação é má, a coordenação é afetada

Page 11: Aprendizagem

Características da aprendizagem por reforço em SMA

Acoplamento entre os agentes:– Uma ação de um agente pode afeta muito ou pouco os planos de outros

agentes Relação entre os agentes

– Os agentes podem estar agrupados para alcançar um objetivo– Os agentes interagem através do recurso que utilizam– Os agentes tem interesses distintos

Tempo de resposta– O tempo de resposta do ambiente depois que a ação foi executada pode

variar de um domínio para outro Combinações de comportamentos

– Quantas combinações de comportamento irão encontrar um solução ótima?

Page 12: Aprendizagem

Exemplos

1. Os agentes aprendem a empurrar uma caixa de um local ao local objetivo– Acoplamento entre os agentes: muito acoplados

– Relação entre os agentes: cooperação ou competição

– Tempo de resposta: imediato

– Combinações de comportamentos: múltiplos comportamentos ótimos

2. Dois agentes que necessitam aprender a compartilhar um recurso– Acoplamento entre os agentes: muito acoplados

– Relação entre os agentes: cooperação

– Tempo de resposta: com atraso (não sabem em um determinado momento se estão fazendo bem)

– Combinação de comportamentos: único comportamento ótimo

Page 13: Aprendizagem

Aprendendo a partir de outros agentes

Aprendendo os papéis de una organização:– Os agentes necessitam aprender a executar de acordo com os papéis que

irão desempenhar– Necessitam aprender a estrutura dos papéis da organização para colaborar

com os demais agentes

Aprendendo para se beneficiar da negociação:– Os agentes necessitam se adaptar às condições do ambiente onde está

ocorrendo a negociação– Os agentes podem aprender como os demais agentes “pensam” para tentar

melhorar a negociação. Ex: o vendedor aprende quais são os desejos do comprador

Aprendendo para melhor combater o oponente– O agente pode aprender quais são os golpes que o oponente executa, qual

é a melhor maneira de se esquivar dos golpes e os pontos de debilidade do oponente

Page 14: Aprendizagem

Aprendizagem e Comunicação I/II

Aprendendo a comunicar-se:– A aprendizagem é um método para o aprendiz aprender a se comunicar

Comunicação como método de aprendizagem:– A comunicação é o método utilizado para o aprendiz aprender

O que comunicar?– Que informação é de interesse para os outros?

Quando comunicar? – Quanto tempo o agente deve dedicar-se somente a solucionar um

problema antes de comunicar-se com outros agentes?

Page 15: Aprendizagem

Aprendizagem e Comunicação II/II

Com quem comunicar?– Quais agentes estão interessados na informação? – Quais agentes devem ser perguntados?

Como comunicar?– Qual linguagem deve utilizada?