aprendizagem - prof. saulo almeida · medo de objetos inanimados como blocos de madeira e cortinas...

66
Aprendizagem

Upload: vankhue

Post on 08-Nov-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Aprendizagem

Perspectivas Diferentes

• Os psicólogos comportamentais focalizam a aprendizagem

de associações por meio do condicionamento clássico e do

condicionamento operante

• Os psicólogos cognitivos que estudam a aprendizagem

estão interessados no tipo de aprendizagem mais complexo

que envolve a memória humana

Aprendizagem pelo Condicionamento Clássico

Os Elementos e Procedimentos do Condicionamento Clássico

Processos Gerais de Aprendizagem no Condicionamento Clássico

Condicionamento Clássico

• O processo de aprendizagem em que um estímulo sinaliza a

chegada de outro estímulo

• Às vezes chamado de condicionamento “pavloviano”, porque

Ivan Pavlov foi o primeiro pesquisador a estudar

sistematicamente este tipo de aprendizagem

Pavlov

• Um fisiologista russo que estudou os processos digestivos em cães

• Os cães ficavam presos a um equipamento e tinham tubos

inseridos nas bochechas

para medir a quantidade de

salivação, a etapa inicial do

processo digestivo

• Com o tempo, ele notou que

os cães começavam a salivar

antes que o pó de carne fosse

colocado em suas bocas, e quis

saber por que isso acontecia

Os Elementos e Procedimentos do Condicionamento Clássico

Estímulo

Incondicionado

(EI)

Resposta

Incondicionada

(RI)

Estímulo

Condicionado

(EC)

Resposta

Condicionada

(RC)

Associada Similar

EI e RI

• Os cães salivam quando o pó de carne é colocado em suas

bocas – isto é um reflexo, uma resposta que ocorre

automaticamente na presença de um determinado estímulo

(i.e., o pó de carne)

• Um estímulo incondicionado (EI)

é um estímulo que elicia a resposta reflexa (aqui, o EI é o pó

de carne)

• Uma resposta incondicionada (RI)

é uma resposta eliciada automaticamente pelo EI (aqui, a RI é

salivar em resposta ao pó de carne)

EC e RC

• Um estímulo neutro é um estímulo que não elicia, naturalmente, a resposta a ser

condicionada (p. ex., tons auditivos)

• Para se obter condicionamento, o estímulo neutro (uma campainha) é apresentado logo antes

(idealmente, de meio segundo a um segundo antes) do EI (pó de carne) por várias tentativas

• Depois de ocorrer o condicionamento (isto é, o cão

começa a salivar ao som da campainha antes de

o alimento ser colocado em sua boca), o

estímulo neutro é chamado de estímulo

condicionado (EC)

• A resposta aprendida ao estímulo condicionado

se chama resposta condicionada (RC)

Condicionamento Retardado e de Traço

• No condicionamento retardado, o EC é mantido até depois de

ser apresentado o EI para que os dois estímulos ocorram ao

mesmo tempo

• A campainha seria ligada e continuaria a soar até o pó de carne ser colocado

na boca do cão

• No condicionamento de traço, existe um período de tempo entre

o desligamento do EC e o início do EI em que nenhum dos estímulos

está presente

• É chamado de condicionamento “de traço” porque precisa haver um traço de memória do EC para que seja aprendida a associação entre os estímulos

• O condicionamento retardado é o procedimento de condicionamento

clássico mais eficiente; o condicionamento de traço pode ser eficiente

se o intervalo entre os estímulos for muito breve

Um Resumo do Condicionamento Clássico

O Estudo do “Pequeno Albert”

• John Watson e Rosalie Rayner realizaram um estudo com um bebê

de 11 meses chamado Albert

• Enquanto Albert estava olhando para um ratinho branco, Watson se

esgueirou silenciosamente por trás dele com uma barra de ferro e

um martelo e bateu um no outro

• A resposta reflexa de Albert, a RI, foi uma resposta de medo-

evitação (p. ex., chorar e tentar engatinhar para longe) ao ruído

alto, que era o EI

• Depois de emparelhar o rato branco com o ruído alto e inesperado

apenas 7 vezes, o ratinho branco se tornou um EC

Outras Comprovações

• Elise Bregman não conseguiu condicionar bebês a sentir

medo de objetos inanimados como blocos de madeira e

cortinas de tecido, o que sugere possíveis predisposições

biológicas a aprender certos medos mais facilmente do que

outros

• O condicionamento clássico pode ser usado para condicionar

reações positivas, como é feito na propaganda para

condicionar atitudes e sentimentos positivos em relação a

determinados produtos (p. ex., uma celebridade serve como

um EI e o produto como o EC)

Processos Gerais de Aprendizagem no Condicionamento Clássico

• Aquisição é o processo de adquirir uma nova resposta, isto

é, uma RC a um EC

• A força da RC aumenta durante a aquisição

• Outros processos:

Extinção

Recuperação

Espontânea

Generalização

do Estímulo

Discriminação

do Estímulo

Extinção

• Um EC deve sinalizar, confiavelmente, que o EI está

chegando

• Extinção é o desaparecimento da RC quando o EI deixa de

se seguir ao EC

• A força da RC diminui durante a extinção

Recuperação Espontânea

• Durante o processo de extinção, todavia, a força da RC

misteriosamente aumenta um pouco após um intervalo de

descanso

• Isto se chama recuperação espontânea

• Conforme a extinção continua, a recuperação observada depois de

intervalos de descanso segue diminuindo até ser minimizada

Aquisição, Extinção e Recuperação Espontânea

Generalização do Estímulo

• Generalização do estímulo é dar a RC a um estímulo semelhante

ao EC

• Quanto mais semelhante for o estímulo ao EC, mais

forte será a resposta

• Por exemplo, se um cão aprende a latir ao som da

campainha da porta, ele também pode latir ao som do

telefone se for para uma nova casa, porque ambos os

estímulos são sons de campainha

• Este é um processo adaptativo, porque o

condicionamento clássico não seria muito útil se só

nos permitisse aprender relações entre estímulos

específicos

Discriminação do Estímulo

• No entanto, supergeneralizar uma resposta pode não ser

adaptativo; assim, nós precisamos aprender a discriminar os

estímulos

• Discriminação do Estímulo é aprender a dar a RC somente

ao EC ou somente a um pequeno conjunto de estímulos muito

semelhantes incluindo o EC

• Por exemplo, depois de estar morando na

nova casa já há algum tempo, o cão

aprenderá a diferenciar/discriminar

os sons da campainha da porta e

do telefone

Treinamento da Discriminação

• Durante o treinamento da discriminação, apresentamos

muitos estímulos diferentes numerosas vezes, mas o EI só vai

se seguir a um EC

• Este procedimento extinguirá as respostas aos outros estímulos

Generalização e Discriminação do Estímulo

Aprendizagem por Condicionamento Operante

Aprendizagem por Reforço e Punição

Processos Gerais de Aprendizagem no Condicionamento Operante

Esquemas de Reforço Parcial no Condicionamento Operante

Motivação, Comportamento e Reforço

Condicionamento Operante

Aprender a associar comportamentos àssuas consequências

• Comportamentos que são reforçados (levam a consequênciassatisfatórias) serão fortalecidos, e comportamentos que sãopunidos (levam a consequências insatisfatórias) serãoenfraquecidos

• Chama-se condicionamento “operante” porque o organismoprecisa “operar” sobre o ambiente para produzir as consequências com as quais aprenderá

A Lei do Efeito

• A Lei do Efeito de Thorndike afirma que qualquer

comportamento que resulte em consequências satisfatórias

tende a ser repetido, e qualquer comportamento que resulte

em consequências insatisfatórias tende a não ser repetido

Aprendizagem por Reforço e Punição

• Um reforçador é um estímulo que aumenta a probabilidade de

uma resposta anterior

• Reforço é o processo pelo qual a probabilidade de uma resposta é

aumentada pela apresentação de um reforçador após a resposta

• Por exemplo, se você condicionar

operantemente o seu cão a latir

dando-lhe comida cada vez que

ele “falar,” o alimento seria um

reforçador, e o processo de

aumentar o comportamento de

latir usando esse reforçador

seria chamado de reforço

Aprendizagem por Reforço e Punição

• Um punitivo é um estímulo que diminui a

probabilidade de uma resposta anterior

• Punição é o processo pelo qual a

probabilidade de uma resposta é diminuída

pela apresentação de um punitivo após a

resposta

• Por exemplo, se você condicionou o seu cão a

parar de subir no sofá molhando-o com um spray

de água cada vez que ele subia no sofá, o spray

de água seria o punitivo, e o processo de

diminuir o comportamento de subir no sofá seria

chamado de punição

Positivo e Negativo

• Positivo significa que um estímulo é apresentado

• Tanto no reforço positivo quanto na punição positiva é apresentado

um estímulo

• Negativo significa que um estímulo é removido

• Tanto no reforço negativo quanto na punição negativa é removido

um estímulo

Apetitivo e Aversivo

• Um estímulo apetitivo é um estímulo que o organismo

considera agradável (p. ex., comida, dinheiro)

• Um estímulo aversivo é um estímulo que o organismo

considera desagradável (p. ex., doença, isolamento social)

Apetitivo e Aversivo

• Consequentemente...

• No reforço positivo é apresentado um estímulo apetitivo (p. ex., um

elogio pelo trabalho bem feito)

• Na punição positiva é apresentado um estímulo aversivo (p. ex.,

uma repreensão por um trabalho malfeito)

• No reforço negativo é removido um estímulo aversivo (p. ex., usar

uma bolsa quente para uma dor nas costas)

• Na punição negativa é removido um estímulo apetitivo (p. ex., os

pais tiram a sobremesa de uma criança)

Reforço e Punição Positivos e Negativos

Positivo Negativo

Reforço

É apresentado

um estímulo

apetitivo

É removido

um estímulo

aversivo

Punição

É apresentado

um estímulo

aversivo

É removido

um estímulo

apetitivo

Como Saber?

• Em qualquer exemplo de reforço ou punição, positivos ou

negativos, é essencial perceber que nós só saberemos que

um estímulo serviu como reforçador ou punitivo e levou ao

reforço ou à punição se o comportamento acontecer

novamente ou parar de acontecer

Reforçadores Primários e Secundários

• Um reforçador primário é inatamente reforçador desde o

nascimento (p. ex., comida, contato social)

• Um reforçador secundário não é inatamente reforçador, mas

adquire propriedades reforçadoras por meio da aprendizagem

(p. ex., dinheiro, boas notas)

Processos Gerais de Aprendizagem no Condicionamento Operante

• A modelagem ocorre quando um animal é treinado para dar uma

determinada resposta reforçando-se aproximações sucessivamente mais

próximas da resposta desejada

• Com os seres humanos, isso significaria reforçar uma criança conforme ela se aproxima

cada vez mais do comportamento de arrumar a sua cama corretamente pela manhã

• As respostas, em um experimento de condicionamento

operante, são apresentadas em um

registro cumulativo – um registro do

número total de respostas ao longo

do tempo

• É uma descrição visual do índice de respostas

• Conforme a inclinação da linha do registro aumenta,

o ritmo de resposta fica mais rápido

Como Compreender um Registro Cumulativo

Aquisição, Extinção e Recuperação Espontânea

• Aquisição refere-se ao fortalecimento da resposta operante

reforçada

• Extinção é o desaparecimento da resposta operante quando

ela deixa de ser reforçada

• A inclinação decrescente do registro indica que a resposta está

sendo extinta (i.e., há cada vez menos respostas no decorrer do

tempo)

• Recuperação espontânea é a recuperação temporária da

resposta operante após um intervalo durante o treinamento de

extinção

Aquisição, Extinção e Recuperação Espontânea

Máquinas Automáticas de Venda

• Nós aprendemos que, colocando dinheiro em uma máquina

automática de venda, obtemos alguma coisa da qual gostamos muito.

Nós adquirimos a resposta de inserir dinheiro nessa máquina

específica.

• Mas, um dia, colocamos o dinheiro e não sai o alimento ou a bebida

que esperamos. Isso segue acontecendo. Nós logo paramos de pôr

dinheiro na máquina. A nossa resposta está sendo extinta.

• Entretanto, depois de um período de tempo, nós voltamos e tentamos

novamente (recuperação espontânea). Se a máquina tiver sido

consertada, conseguiremos a nossa bebida ou alimento e o nosso

índice de resposta retornará ao seu nível anterior. Se não, nós

seguiremos pelo caminho da extinção.

Discriminação e Generalização

• Um estímulo discriminativo é um estímulo que precisa estar

presente para que a resposta operante seja reforçada

• Ele “cria a oportunidade” para que a resposta seja reforçada

• Por exemplo, um rato aprende que pressionar uma alavanca resultará em

comida só quando uma luz estiver acesa, não quando ela estiver apagada

• Generalização do estímulo é dar a resposta operante na

presença de estímulos semelhantes ao estímulo discriminativo

• Por exemplo, o rato aprende a pressionar a alavanca

por comida somente quando a luz tiver um

determinado tom de vermelho. A apresentação de

luzes com cores diferentes depois da aquisição

constitui um teste para a generalização.

Esquemas de Reforço Parcial no Condicionamento Operante

• Reforçar todas as respostas é um esquema de reforço

contínuo

• Os esquemas de reforço parcial reforçam o comportamento

apenas parte do tempo

• O efeito de reforço parcial afirma que as respostas que são

reforçadas segundo um esquema parcial em vez de um esquema

contínuo são mais resistentes à extinção

Esquemas de Reforço Parcial

• Um esquema de razão baseia-se no número de respostas

dadas

• Um esquema de intervalo baseia-se no período de tempo

decorrido

• Em um esquema fixo, o número de respostas requerido para

um esquema de razão ou o período de tempo necessário para

um esquema de intervalo são fixos

• Em um esquema variável, o número de respostas requerido

para um esquema de razão e o período de tempo necessário

para um esquema de intervalo variam em cada tentativa

Esquemas de Razão

• Em um esquema de razão fixa, um reforçador é entregue

depois que um número fixo de respostas foi dado (p. ex., um

rato tem de pressionar uma alavanca 10 vezes antes de

receber o reforçador de alimento)

• Em um esquema de razão variável, o número de respostas

necessário para se obter um reforçador varia em cada

tentativa, mas atinge uma média numérica entre as repetições

(p. ex., os prêmios nas máquinas de jogo)

Esquemas de Reforço Parcial de Razão Fixa e Razão Variável

Esquemas de Intervalo

• Em um esquema de intervalo fixo, um reforçador é entregue

depois que a primeira resposta é dada e é decorrido um

intervalo de tempo determinado (p. ex., exames periódicos em

uma turma, com os alunos se comportando melhor e

estudando mais logo antes do exame/reforçador)

• Em um esquema de intervalo variável, um reforçador é

entregue depois de um intervalo de tempo diferente em cada

repetição, mas os intervalos de tempo atingem uma média

determinada ao longo das repetições (p. ex., provas-surpresa)

Esquemas de Reforço Parcial de Intervalo Fixo e Intervalo Variável

Qual é Melhor?

• Os esquemas de razão levam a índices mais altos de resposta do que os esquemas de intervalo (inclinações maisíngremes no registro cumulativo)

• Os esquemas variáveis levam a menos pausas (quando nãoocorre nenhuma resposta) após o reforço do que os esquemasfixos

• Com respeito à extinção, é necessário mais tempo paraextinguir uma resposta com um esquema de reforço parcialdo que com um esquema de reforço contínuo

Motivação, Comportamento e Reforço

Motivação é o conjunto de fatores internos e externos que

energizam o nosso comportamento e o dirigem para objetivos

Teorias da Motivação

• A teoria da redução do impulso propõe que, primeiro, uma

necessidade corporal (tal como a fome) cria um estado de tensão

corporal chamado impulso ou pulsão; então,o comportamento motivado

(buscar alimento) funciona para reduzir esse impulso obtendo

o reforço (alimento), para eliminar essa

necessidade e fazer o corpo retornar a um

estado de equilíbrio interno.

• Em essência, nós somos “empurrados” para a ação

por estados pulsionais desagradáveis

• É eficaz para explicar necessidades biológicas como

a fome e a sede

Teorias da Motivação

• A teoria do incentivo propõe que somos “puxados” para a

ação pelos incentivos, estímulos externos ambientais que não

envolvem a redução do impulso

• Por exemplo, os alunos podem ser motivados

por tirar boas notas, o que os levará a se

esforçar e estudar mais

• O dinheiro é outro exemplo clássico de um

incentivo que nos “puxa” para determinados

comportamentos

Teorias da Motivação

• A teoria da excitação afirma que o nosso comportamento é

motivado para manter um nível ótimo de excitação, o que

varia de pessoa para pessoa

• Quando abaixo do nível ótimo, somos motivados a elevar a nossa

excitação até aquele nível

• Quando superexcitados, somos motivados a reduzir o nosso nível de

excitação até o nosso nível ótimo

• A teoria da excitação argumenta que o nosso nível de excitação

influencia o nosso nível de desempenho, com um certo nível sendo

ótimo

A Lei de Yerkes-Dodson

Uma excitação

aumentada

ajudará o

desempenho até

um certo ponto,

após o qual uma

excitação

adicional

prejudicará o

desempenho

Motivação Extrínseca vs. Intrínseca

• Motivação extrínseca é o desejo de realizar um

comportamento para obter um reforço externo ou para evitar

um estímulo externo aversivo

• Motivação intrínseca é o desejo de realizar um

comportamento de modo eficiente e pelo comportamento em

si

• O reforço é fornecido pela própria atividade

• Por exemplo, por que os alunos estudam para as aulas?

• Um motivador extrínseco seriam as notas

• Um motivador intrínseco seria o prazer de obter informações

O Efeito da Superjustificação

• Em um estudo de Lepper, Greene e Nisbett (1973), algumas

crianças que gostavam de desenhar com canetas hidrocor

(elas faziam isso durante os períodos de brincar livre e,

portanto, estavam no início intrinsecamente motivadas)

receberam prêmios,

um incentivo extrínseco, por

desenhar com as canetas.

Outras crianças não receberam

nenhum prêmio por desenhar

com as canetas.

O Efeito da Superjustificação

• Uma semana depois, quando não foi dado nenhum prêmio

pelos desenhos feitos com as canetas, as crianças que não

tinham recebido

prêmios ainda continuavam

desenhando, mas aquelas que

tinham recebido os prêmios

passaram muito menos tempo

usando as canetas para

desenhar.

O Efeito da Superjustificação

• Ocorre quando há um decréscimo em um comportamento

intrinsecamente motivado depois que o comportamento é

extrinsecamente reforçado e então o reforço é interrompido

• O efeito de superjustificação indica que o processamento

cognitivo da pessoa está influenciando o seu comportamento,

e que esse processamento pode diminuir a eficácia de

reforçadores extrínsecos

• Entretanto, não é provável que o reforço extrínseco influencie

a motivação intrínseca se o reforço extrínseco depende de se

fazer bem alguma coisa versus apenas fazê-la

Aspectos Biológicos e Cognitivos da Aprendizagem

Prontidão Biológica na Aprendizagem

Aprendizagem Latente e

Aprendizagem Observacional

Prontidão Biológica na Aprendizagem

A nossa prontidão para aprender a temer objetos ou situações

perigosos para nós (p. ex., alturas) e para evitar alimentos e

bebidas que nos fazem mal tem importância adaptativa

Aversão de Paladar

• Garcia e Koelling (1966) estavam estudando os efeitos da

radiação sobre os ratos

• Depois de vários tratamentos com radiação, os ratos

continuavam entrando nas câmaras experimentais onde

tinham sofrido a radiação, mas não bebiam mais a água que

havia dentro dessas gaiolas

Aversão de Paladar

• Os pesquisadores descobriram que as garrafas de água das

câmaras experimentais eram feitas de uma substância

diferente da das gaiolas – plástico versus vidro

• Assim, a água tinha um gosto diferente em cada local, e os

ratos aprenderam rapidamente uma aversão às garrafas de

água da câmara experimental, mesmo que a náusea viesse

horas depois de terem estado na câmara experimental

Aversão de Paladar

• Assim, a aversão de paladar é um surpreendente

contraexemplo da regra de que o EI (náusea) precisa se

seguir imediatamente ao EC (a água com gosto diferente)

para que a aprendizagem aconteça

• Os ratos aprenderam a

aversão de paladar sem

que houvesse um

emparelhamento de deixa

e consequência…

Aversão de Paladar

• Os pesquisadores examinaram duas deixas que foram associadas à náusea

provocada pela radiação:

• Água adoçada

• Água de gosto normal acompanhada por estalidos e luzes piscantes quando os ratos

bebiam a água

• Os ratos que beberam a água adoçada aprenderam facilmente a aversão à

água, mas os ratos que beberam a água de gosto normal acompanhada por

estalidos e luzes piscantes não aprenderam

• Os ratos, simplesmente, não aprenderam a associar essas deixas ambientais auditivas e

visuais, que ocorriam enquanto eles bebiam, com a náusea que sentiam posteriormente;

esta associação não fazia nenhum sentido “biológico” para eles

Tendência Instintiva

• A tendência de um animal de recuar de uma resposta

operante aprendida a um objeto para uma resposta inata,

instintiva

• Portanto, respostas biologicamente instintivas às vezes

limitam ou atrapalham a nossa capacidade de condicionar

outras respostas menos naturais

• Os organismos aprenderão certas associações (aquelas

consistentes com o seu comportamento natural) mais

facilmente do que outras (aquelas menos consistentes com o

seu comportamento natural)

Aprendizagem Latente e Aprendizagem Observacional

• A aprendizagem latente é a aprendizagem que ocorre, mas

não é demonstrada até haver um incentivo para isso

• Por exemplo, os alunos estudam para as aulas, mas não

demonstram abertamente a aprendizagem até uma prova, para a

qual o incentivo é uma boa nota

• A aprendizagem observacional (modelagem) é aprender

observando os outros e imitando o seu comportamento

Aprendizagem Latente

• Edward Tolman foi um pesquisador pioneiro da

aprendizagem latente

• Ratos privados de comida tinham de encontrar seu caminho

em um labirinto, e o número de voltas erradas/erros era

contado

• Por exemplo, em um experimento com três

grupos, o alimento (reforço) estava sempre

presente na caixa-alvo que havia no final

do labirinto para um grupo, mas nunca

para outro. Para um terceiro grupo,

não havia comida nenhuma até o

décimo primeiro dia do experimento.

Aprendizagem Latente

• Interessantemente, o desempenho do grupo que só começou

a obter o reforço do alimento no décimo

primeiro dia melhorou imediatamente no dia seguinte,

igualando-se ao desempenho do grupo que sempre

encontrara o reforço

• Assim, parece que eles estiveram aprendendo

o labirinto todo o tempo, mas não

demonstraram a sua aprendizagem até o

incentivo ser apresentado

Aprendizagem Latente

Aprendizagem Observacional

A pesquisa pioneira de Albert Bandura sobre a modelagem

• Em um experimento, algumas crianças foram expostas a um adulto que batia,

chutava e gritava com um boneco Bobo

• Depois de observar esse comportamento, cada criança era levada para outra sala cheia de

brinquedos atraentes, mas lhe diziam que os brinquedos eram para outras crianças e que ela

não poderia brincar com eles

• Mais tarde, a criança era levada para uma outra sala com brinquedos com os quais ela poderia

brincar, incluindo um boneco Bobo

• A criança passava a bater no boneco exatamente como o modelo adulto fizera

• No entanto, quando expostas a um modelo gentil, as crianças agiam mais

gentilmente em relação ao boneco do que as crianças expostas ao outro modelo

• Assim, o comportamento das crianças era guiado pelo comportamento do modelo ao

qual tinham sido expostas

Aprendizagem Observacional

• Em outro experimento, um adulto era recompensado pelo comportamento agressivo, punido pelo comportamento agressivo, ou não sofria nenhuma consequência pelo seu comportamento

• As crianças que viam o adulto ser reforçado por seu comportamento agressivo agiam mais agressivamente em relação ao boneco Bobo do que aquelas que tinham visto o modelo agir e não sofrer nenhuma consequência

• Além disso, as crianças que tinham visto o adulto ser punido foram menos agressivas em relação ao boneco do que aquelas que não tinham visto o adulto não sofrer nenhuma consequência por agir agressivamente em relação ao boneco