5) millenson, j. r. (1967). princípios de análise do comportamento [pag 23-35]

J. R. MILLENSON

p r in c íp io s d e ANÁLISE DO

COMPORTAMENTOA mais moderna e sistemática coleção de princípios elementares universais que existem para a modificação do comportamento

Kl V

k l :

\

Obtura- Retículo de difração dor §

L * tf) 1__

■4

\Monocromador Fonte de Luz

ÍHesbiirUÍ

PRINCÍPIOS DE ANÁLISE DO COMPORTAMENTO

J.R. MILLENSON

PRINCÍPIOS DE ANÁLISE DO COMPORTAMENTO

T rad u ção de

A lina de A lm eida Souza

Dioue tie Kezende

COORDENADATHESAURUS

© Copyright, J. R. Milleonson, 1967

Título original: Principles-of Behavior Analysis

THI MACMILLAN COMPANY, NLW YORK

Library of Congress catalog card number: 67 15540

Montagem: Afonso Rocha Fotomontagem de : João PintoComposição de: Antonio Carlos da Silva e Clemente Silva l 'ilho Capa: Paulo Magalhães

MCMLXXV

Todos os direitos, em língua portuguesa no Brasil, reservados de acordo com a lei. Nenhuma parte deste livro pode ser reproduzida ou transmitida de qualquer forma ou por qualquer meio, incluindo fotocópia, gravação ou informação computadorizada, sem permissão por escrito da editora COORDENADA / THESAURUS EDITORA DE BRASÍLIA LTDA. SIG Q. 08 LOTE 2356 - FONE: (061) 344 3738 - FAX: (061) 344 2353 - Brasília - DF.

Para

VIVIENNE

PREFÁCI O À ED I Ç Ã O B R AS I L E I RA

A maior parte do livro PRINCÍPIOS DE ANÁLISE DO COMPORTAMENTO fo i escrita durante o ano acadêmico de 1964, enquanto eu era um jovem professor assistente de Psicologia no Institu to de Tecnologia Carnegie (agora Universidade Carnegie-Mellon), em Pittsburgh, Pensylvania. Eu o concebi como um texto sistemático de introdução dos estudantes, em nível elementar e avançado, àqueles princípios conhecidos de modificação do comportamento que devem servir de base à grande porção da conduta adaptativa do homem e de organismos relacionados com ele. Em sua maior parte, escrever este livro fo i um trabalho de amor. Eu ensinava Psicologia a iniciantes, para quem eu a interpretava como a ciência que se preocupa com as interações do comportamento com o meio ambiente e para quem havia tantas coisas que desejava dizer (e que o fiz muitas e muitas vezes!) que não se encontravam em qualquer dos livros textos existentes, que decidi desenvolvê-los por escrito. Aquela época existia apenas um livro tex to sistemático e elementar sobre esse campo de estudo que, embora suportando majestosamente a sua idade, muita coisa tinha acontecido desde a sua publicação em 1950.

Parece-me claro agora, como o fo i ent£o, que a Psicologia é um campo c ien tífico a mover-se rapidamente de seu estágio pré-paradigmático para a exploração sistemática de um conjunto unificado de comportamentos. Gosto de pensar que em sua d im inuta trilha, o livro PRINCÍPIOS DE ANÁLIS E DO COMPORTAMENTO continua a dar uma contribuição permanente pc.ra o estabelecimento desse novo paradigma da Psicologia. Agor.i, olhando para trás, uma década desde que esse livro apareceu, posso ver mais claramente as suas virtudes e falhas. É certo que nessa ciência de desenvolvimento tão rápido qualquer livro texto logo se desatualiza. Novos processos importantes, como a ^uto-modelagcm, o comportamento adjuntivo e o biofeedback entraram em cena; outros processos familiares, como o da punição e do condicionamento clássico, foram consideravelmente relormulados. Por outro lado, enquanto em 1964 não tinhamos quase nenhuma teoria que merecesse esse nome, os anos de 70 testemunharam a chegada de modelos quantitativos tanto na teoria do reforço como na do condicionamento clássico. Esses modelos, embora deliberadamente restritos à área que cobrem, têm uma certa aura de au ten tic idade que íalta totalmente nas grandiosas teorias prim itivas sobre aprendizagem da era anterior. As descobertas complementares de que as atividades autônomas reflexas são reíorcáveis e nue os comportamentos emitidos nodem ser

excitados por contingências associadas/ colocam em questão nossa distinção fechada entre operantes e respondentes. É m uito cedo para dizer quão drasticamente essas descobertas vão abalar nossos fundamentos teóricos, mas é certo que maiores modificações estão no ar.

Há dez anos atrás, como reação às prematuras teorizações das décadas de 1940 e 1950, a disposição dos que trabalhavam nesse campo era fortemente descritiva. A análise que B.F. Skinner fez do comportamento proposital, sua preocupação com o organismo individual e sua ênfase no controle pelo reforçamento de contingências eram as bases do cultivo em pírico vigoroso dos princípios de reforçamento positivo. A lei do efeito de Thorndike estava no seu zênite e este livro é um produto daquele clímax. Porém algumas mudanças sutis estão acontecendo no Zeitgeist. O controle de contingências — pervasivo e importante como é — começou a ceder lugar a um conjunto de efeitos perplexantes que, mesmo parecendo intimamente ligados ao reforço, vão alem da lei do efeito. Por outro lado, o condicionamento clássico, a outra face da moeda do determinismo na Psicologia, acha-se menos e menos seguro de seu papel como o segundo maior princíp io de modificação do comportamento. Suspeito mesmo que devemos logo nos preparar para aceitar a idéia de que as modificações das respostas no condicionamento clássico pode ser grandemente reduzido a uma forma de aprendizagem instrumental. Naturalmente que, quando e se, essa integração vier, ela certamente não eliminará Pavlov. Pelo contrário, os diques serão finalmente eliminados para a exploração das descobertas do grande fisiólogo Russo, em sua área mais apropriada: a modulação do comportamento corrente pelos efeitos Pavlovianos sobre a motivação, a emoção e a criação de reforçadores.

O livro PRINCÍPIOS DE ANÁLISE DO COMPORTAMENTO guarda um silêncio virtual sobre as contribuições dos biólogos comportamentais às fontes evolucionistas da variação do comportamento; fator este não facilmente manipulável mas não facilmente ignorado. Enquanto eu sempre senti a negligência às contribuições dos etologisias às características comportamentais das espécies, como a maior omissão de meu livro, e o enfoque no meio-ambientalismo (que poderia ter sido d ifíc il conseguir com uma apresentação balanceada de biologia e psicologia) fo i e é a sua maior força. Porquanto a sua preocupação com as variáveis do meio ambiente do passado e do presente permitiram-me aplicar a teoria do reforço de maneira criativa a um amplo espectro de com p o rta m e n to s humanos complexos, incluindo a aprendizagem de conceitos, significado e compreensão, solução de problemas, motivação e emoção, de tal modo que ainda hoje parece-me que retêm um sabor moderno. Assim, por todas as mudanças e fermentos que ocorreram desde o seu aparecimento e por todas as suas omissões, pode muito bem ser qüe o livro PRINCÍPIOS DE ANÁLISE DO COMPORTAMENTO ainda contenha a mais noderna e sistemática coleção de princípios elementares universais que existem para a jodificação do comportamento. Certamente eu creio que minha atenção meticulosa para a elaboração e a aplicação de conceitos fundamentais, minha pressão neste livro na descrição formal de contingências de reforçamento, a preocupação no texto com os detalhes íntimos, em profundidade, de um número lim itado de processos fundamentais do comportamento, seu comprometimento em compreender, opondo-se a uma ( obertura superficial dos temas, sua natureza programada e, finalmente, sua fé em que a teoria psicológica pode e deve ser desenvolvida a um nível comportamental são, todos eles, características que permanecem distintas e perenes.

Tornando este livro disponível numa edição em Português a, talvez, uma audiência bem maior, esta poderá ser introduzida aos recentes insights e às promessas conceituais dessa ciência do século XX

PREFACIO

O objetivo deste livro é fornecer uma introdução rigorosa à Psicologia Experimental orientada para os dados. Ele se dirige principalmente ao estudante do primeiro curso em Psicologia e contém material adequado para dois semestres consecutivos ou um período de um ano. Embora o texto atinja um grau incomum de sistematização para o nível introdutório, o material que ele contém não é necessariamente mais difícil do queo encontrado na maioria dos textos de abordagem geral no campo. Com um grupo limitado de conceitos gerais, tentei construir uma estrutura razoável de modo que o estudante tenha, se este fôr o seu primeiro, único ou último curso em ciência, os meios para interpretar e ordenar uma ampla variedade de fenômenos psicológicos.

Não fiz tentativa alguma para rever todas as atividades variadas dos psicólogos em geral na metade do século vinte. Na maior parte mantive o caminho direto e estrito da Psicologia Experimental. Dentro desses limites, concentrei-me no que, em termos tradicionais, seria chamado aprendizagem e condicionamento, motivação e emoção e, em menor extensão, Psicofísica, percepção e resolução de problemas. Os correlatos fisiológicos do comportamento são apresentados nas discussões sobre motivação e emoção. As desordens do comportamento são estruturadas como fenômenos emocionais patoló-

>s. Não há um capítulo com títulos como os de Percepção e Psicofísica, mas seus 1'miiTilns básicos e alguns dados representativos são considerados no texto, nos capítulos h*>l»ic* controle de estímulo, discriminação e aquisição de conceitos, e em outras partes. A aluminum na área é feita em termos da análise funcional do comportamento, um ponto do visla há muito tempo associado com B. F. Skinnei. Embora a maioria dos “princípios’* dosciilos tenham suas origens no laboratório de pesquisa animal,sua relevância para as atividades humanas é repetidamente enfatizada.

Algumas noçoes de Estatística elementar são apresentadas, principalmente para fornecei algum sabor à variabilidade dos dados e para apontar a utilidade de instrumentos estatísticos no losumo e interpretação dos resultados. Utilizei o método de anexar alguns capítulos com seçoes sobre análise de dados, muitos dos quais descrevem conceitos estatísticos simples. Embora estas seções estejam organizadas de modo a incorporar os dados empíricos citados nos capítulos em que aparecem, eles fornecem seqüência independente colocada à narte do corno do textn

Um sistema de notação de R e S para descrever os procedimentos comportamentais é uma parte integral do texto. Os procedimentos no campo estão se tornando cada vez mais complexos e algum esquema formal para reduzí-los aos seus elementos parece desejável se se quer que o estudante aprecie diferenças e similaridades de procedimento. 0 problema de se a notação particular, aqui elaborada, há de encontrar um lugar permanente na ciência não será resolvido aqui. Mas, com sua inclusão, desejo enfatizar que uma representação simbólica da lógica de nossos procedimentos está se tornando obrigatória para uma exposição e comun icação e ficientes.

Espero que o instrutor encontre dificuldade para modificar a seqüência dos capítulos ou omitir qualquer um completamente. (As seções que podem ser omitidas sem destruir a continuidade estão em tipo pequeno.) Os conceitos se constroem uns sobre os outros e o livro é uma unidade. O nível de dificuldade parece-me ser uma função direta do número do capítulo. Ao usar o material com estudantes de vários níveis, o principal grau de liberdade parece ser a velocidade em que o instrutor pode progredir. Mantendo o princípio de Bruner1, que “qualquer assunto pode ser ensinado, de modo efetivo e de uma forma intelectualmente honesta, a qualquer indivíduo em qualquer estágio de desenvolvimento” , espera que o livro seja útil para diversos níveis: talvez, como um texto auxiliar para o curso de aprendizagem em graduação, ou mesmo como um livro de consulta para cursos de pós-graduação em análise experimental do comportamento.

Um laboratório seria um complemento valioso para um curso tal como este e a seqüência do texto é tal que facilita uma ordem lógica de tópicos experimentais para o laboratório.

Meus agradecimentos são para muitos dos meus ex-alunos da Columbia University, Birkbeck College (University of London) e Carnegie Institute of Technology que, durante anos, estabeleceram as condições para escrever o livro e que modelaram amplamente a sua estrutura. A Susan Alcott, Nancy Innes, Mary Carol Perrott, e particularmente Isabelle Alter, tenho uma dívida pela leitura crítica, releitura, e edição dos rascunhos preliminares. As sugestões dos meus colegas Daryl Bem, John Boren, Derek Hendry, Dennis Kelly, Bernard Migler e do editor dessa serie, Melvin Marx, que entre eles ieu cada capítu lo do livro, esclareceram , apreciavelmente, a versão final. Evalyn Segai, generosam ente, realizou o árduo trabalho de reler todo o manuscritc durante as férias de verão, e seus comentários detalhados ajudaram a melhorar o livro de muitas maneiras. W. N. Schoenfeld e Francis Mechner merecem o crédito por aquilo que de valor original aqui for encontrado. Não seria necessário dizer que eles não são de modo algum responsáveis pelos defeitos e deficiências e espero que eles perdoem quaisquer distorções de suas idéias que eu possa ter, inadvertidamente, criado.

J. R. M.

J. S. Bruner, The process of education. Cambridge: Harvard llnivrr Press 196^ n ^1

S U M Á R I O

NOTA AOS ESTUDANTES......................................................................................... 19

PRIMEIRA PARTE: A REGULARIDADE DO COMPORTAMENTO..................... 21

CAPÍTULO 1 - UM BACKGROUND PARA A ABORDAGEM CIENTÍFICA AOCOMPORTAMENTO....................................................................... 23

1.1 Primeiras tentativas para explicar e classificar o comportamento hum ano..... 231.2 A ação reflexa........................................................................................................ 251.3 Reflexos condicionados ou adquiridos........... .................................................... 251.4 A teoria da evolução e o comportamento adaptativo....................................... 261.5 Os primeiros experimentos sobre o comportamento “voluntário” .................. 271.6 O Zeitgeist.............................................................................................................. 291.7 A psicologia perde a sua m ente............................................................................ 301.8 O firme estabelecimento de uma análise experimental do comportamento .... 321.9 Revisão.................................................................................................................... 34

CAPÍTULO 2 - COMPORTAMENTO REFLEXO (ELICIADO)........................... 37

2.1 A fórmula S - R .................................................................................................... 372.2 Leis do reflexo primário........................................................................................ 392.3 Leis secundárias do reflexo................................................................................... 412.4 Força do reflexo: um constructo hipotético....................................................... 422.5 Exemplos comuns de reflexos.............................................................................. 442.6 Variabilidade nas medidas; resumo de dados em distribuição de freqüência;

estatística básica; a curva norm al........................................................................ 45

CAPÍTULO 3 - CONDICIONAMENTO PAVLOVIANO ....................................... 53

3.1 Reflexos condicionados e a natureza de um experimento................................. 533.2 O paradigma Pavloviano: um método esquemático de representar o condi

cionamento 563.3 Relações temporais nos paradigmas de condicionamento................................. 623.4 A extensão do condicionamento clássico................................ ........................... 64

3.5 O método experimental ........................................................................................ 663.6 Introdução aos conceitos elementares de probabilidade................................... 70

CAPÍTULO 4 - FORTALECIMENTO OPERANTE............................................... 75

4.1 Introdução ao comportamento proposital.......................................................... 754.2 Um experimento protótipo.................................................................................. 774.3 Mudanças na taxa absoluta................................................................................... 794.4 Mudanças na taxa relativa.................................................................................... 844.5 Mudanças seqüenciais no responder.................................................................... 854.6 Mudanças na variabilidade.................................................................................... 864.7 Operantes e estímulos reforçadores..................................................................... 874.8 O paradigma do fortalecimento operante........................................................... 894.9 Operantes vocais..................................................................................................... 904.10 A extensão do fortalecimento operante............................................................. 924.11 Superstição............................................................................................................. 944.12 Condicionamento operante .................................................................................. 95

CAPÍTULO 5 - EXTINÇÃO E RECONDICIONAMENTO DO OPERANTE....... 99

5.1 Mudanças na taxa de resposta durante a extinção.............................................. 1005.2 Mudanças topográficas e estruturais na extinção............................................... 1015.3 Resistência à extinção........................................................................................... 1025.4 Recuperação espontânea ....................................................................................... 1065.5 Condicionamento e extinção sucessivos............................................................. 1075.6 Esquecimento e extinção...................................................................................... 1085.7 Uma definição compreensiva de extinção operante........................................... 1125.8 A extensão dos conceitos de extinção................................................................. 1125.9 Representações gráficas dos resultados de experimentos nos quais muitas

variáveis independentes são estudadas em conjunto........................................ 116

SEGUNDA PARTE: AS UNIDADES FUNDAMENTAIS DE ANÁLISE............... 121

CAPÍTULO 6 - NOTAÇÃO DE CONTINGÊNCIA DE RESPOSTA E ESTÍMULO................................................................................................ 123

6.1 Respostas e eventos ambientais............................................................................ 1246.2 Situações e eventos ambientais............................................................................. 1266.3 A noção de uma contingência comportamental................................................ 1276.4 A situação inicial (Sa ) .......................................................................................... 1296.5 Contingências múltiplas na mesma situação....................................................... 1306.6 A contingência n u la .............................................................................................. 1326.7 A duração das situações e das contingências....................................................... 1336.8 Mais de uma resposta é exigida para a conseqüência S ....................................... 134

6.9 Contingências repetitivas......................................................................... ........... 1356.10 Facilitação............................................................................................................. 1366.11 Çontingências negativas....................................................................................... 1376.12 Contingências probabilísticas............................................................................. 1386.13 Discriminações...................................................................................................... 1396.14 R e S funcionalmente dependentes................................................................... 1406.15 Contingências agrupadas...................................................................................... 141

CAPÍTULO 7 - REFORÇAMENTO INTERMITENTE......................................... 143

7.1 Contingência de intervalo.................................................................................... 1447.2 Probabilidade de reforçamento.......................................................................... 1497.3 Notas teóricas sobre esquemas de reforçamento.............................................. 1527.4 Os efeitos do reforçamento intermitente na resistência à extinção................. 1537.5 Outros efeitos comportamentais do reforçamento intermitente.................... 1557.6 Estados estáveis do comportamento.................................................................. 155

CAPITULO 8 - A ESPECIFICAÇÃO DA RESPOSTA.......................................... 159

8.1 A definição de classes de resposta............................................... ..................... 1598.2 Uma definição de resposta operante em termos da teoria dos conjuntos....... 1638.3 O paradigma da diferenciação............................................................................ 1648.4 Aproximação sucessiva........................................................................................ 1698.5 Extensão do conceito de operante.................................................................... 1708.6 Diferenciação de tax a .......................................................................................... 1768.7 Reforçamento do responder contínuo.............................................................. 1788.8 Sumário................................................................................................................. 1798.9 A linguagem e lógica dos conjuntos................................................................... 180

CAPÍTULO 9 - CONTROLE AMBIENTAL............................................................ 185

9.1 Dimensões do estím ulo....................................................................................... 1859.2 Generalização de estím ulo................................................................................... 1909.3 Generalização da extinção................................................................................... 1979.4 Algumas implicações da generalização............................................................... 1999.5 Notas sobre o delineamento de experimentos em psicologia usando sujeitos

animais................................................................................................................... 201

TERCEIRA PARTE: UNIDADES COMPONENTES DO COMPORTAMENTO .... 203

CAPÍTULO 10 - DISCRIMINAÇÃO........................................................................... 205

10.1 Duas condições do estímulo, uma classe de resposta......................................... 20610.2 O paradigma da discriminação............................................................................ 210

10.3 Duas condições do estímulo, duas classes de resposta..................................... 21 i10.4 m Condições do estímulo, n classes de resposta............................................... 21310.5 Mudanças contínuas no comportamento em função de mudanças contínuas

numa dimensão do estím ulo............................................................................... 21510.6 Discriminação sem respostas em S^ .................................................................. 21710.7 Tempos de reação discriminativos..................................................................... 21910.8 As implicações do controle de estímulo operante........................................... 22010.9 A significância das diferenças entre duas matérias........................................... 221

CAPITULO 11 - REFORÇADORES ADQUIRIDOS................................ 227

11.1 As propriedades reforçadoras dos estímulos discriminativos positivos.......... 22811.2 Como aumentar a durabilidade de reforçadores condicionados..................... 22911.3 Recompensas “token” ......................................................................................... 23311.4 Reforçadores generalizados ................................................................................. 23411.5 Respostas de observação ..................................................................................... 23511.6 As condições necessárias e suficientes para se criar reforçadores condi

cionados ................................................................................................................. 23711.7 O reforçamento secundário no comportamento social................................... 239

CAPÍTULO 12 - ENCADEAMENTO........................................................... 245

12.1 Os elementos de cadeias comportamentais............................................. ......... 24512.2 O desenvolvimento de uma cadeia complexa................................................... 24712.3 A aprendizagem de labirinto como um encadeamento................................... 25112.4 Os efeitos da extinção seletiva em pontos diferentes na cadeia..................... 25212.5 Esquemas encadeados.......................................................................................... 25512.6 O comportamento humano cotidiano como encadeamento........................... 25712.7 Cadeias vocais....................................................................................................... 26012.8 Cadeias ramificadas e representação do diagrama de fluxo............................ 26312.9 Cadeias de comportamento encoberto.............................................................. 267

QUARTA PARTE: CONTINGÊNCIAS COMPLEXAS.............................................. 271

CAPÍTULO 13 - AQUISIÇÃO DE CONCEITO ......................................... 273

13.1 Dispc' íção para aprender (simples)................................................................... 27413.2 Algumas variáveis que interferem na aquisição da disposição para aprender

(L -SE T )................................................................................................................. 27813.3 L-SETS mais complexos.................................................................................... 27813.4 Experimentos simples sobre formação de conceito em sujeitos humanos..... 28013.5 Estudos sobre formação de conceito em animais............................................ 28413.6 Classes arbitrárias de S^; conceitos disjuntivos............................................... 28813.7 Significado e compreensão considerados como interrelações entre conceitos 291

13.8 A aquisição de conceito através da instrução programada............................. 29813.9 As constâncias perceptivas.................................................................................. 305

CAPÍTULO 14 - SOLUÇÃO DE PROBLEMA E INTELIGÊNCIA........................ 311

14.1 A estrutura de um problema e a natureza de uma solução............................ 31114.2 Quebra-cabeças..................................................................................................... 31514.3 Estratégias de procura de heurísticas................................................................ 31814.4 Identificação do conceito.................................................................................... 32114.5 A mensuração de habilidades para solucionar problema: testes de inteli

gência ..................................................................................................................... 32314.6 Correlação, teste de confiabilidade e validade.................................................. 327

QUINTA PARTE: DINÂMICA DO REFORÇO......................................................... 335

CAPÍTULO 15 - MOTIVAÇÃO I ................................................................................ 337

15.1 Causa e efeito e a noção de lei científica......................................................... 33715.2 Causas fictícias do comportamento .................................................................. 33915.3 História passada com contingências de condicionamento e extinção como

causas do comportamento................................................................................... 34015.4 Motivos e reforçadores................................................................... ..................... 34215.5 Operações de impulso ......................................................................................... 34315.6 Periodicidades no valor do reforçamento......................................................... 34415.7 Paradigmas de privação e saciação.................................................................... 34615.8 A mensuração dos impulsos................................................................................ 348

CAPÍTULO 16 - MOTIVAÇÃO I I ............................................................................... 361

16.1 Ativação e aspectos direcionais da motivação.................................................. 36116.2 Incentivo ............................................................................................................... 36516.3 Fatores fisiológicos na motivação ...................................................................... 36616.4 Reforçadores primários adicionais...................................................................... 37116.5 Drives adquiridos.................................................................................................. 377

CAPÍTULO 17 - CONTINGÊNCIAS AVERSIVAS................................................... 383

17.1 Reforçadores negativos........................................................................................ 38317.2 Condicionamento de fuga ................................................................................... 38417.3 Parâmetros de S'".................................................................................................. 38517.4 Estímulos aversivos condicionados..................................................................... 39017.5 Condicionamento de esquiva.............................................................................. 39217.6 Punição................................................................................................................... 3981 7.7 Masoquismo........................................................................................................... 402

CAPfrULO 18 - COMPORTAMENTO EMOCIONAL..............................P................ 405

18.1 É a emoção uma causa do comportamento ou um efeito comportamental? .. 40518.2 Três conceitos de em oção.................................................................................. 40718.3 O paradigma da ansiedade.................................................................................. 41218.4 R aiva...................................................................................................................... 41618.5 Elação..................................................................................................................... 41818.6 Um modelo para representar e interrelacionar fenômenos emocionais.......... 42118.7 Medicina psicossomática...................................................................................... 42518.8 O sistema nervoso autônom o.................................................................... i........ 42718.9 Controle emocional, maturidade emocional e comportamento emocional

patológico............................................................................................................... 43118.10Um índice de mudança emocional..................................................................... 434

ÍNDICE ANALÍTICO.......................................................................................................... 437

NOTAS AOS ESTUDANTES

UMA PSICOLOGIA INTRODUTÓRIA PODE SER INTERPRETADA COMO UMAintrodução aos métodos e princípios da análise científica do comportamento. Embora as definições antigas de Psicologia enfatizassem os “processos mentais”, por razões que serão esclarecidas através deste texto, uma abordagem moderna àPsicologia toma o comportamento dos seres humanos assim como dos animais inferiores como seu objeto de estudo. Apoiando-se firmemente no canone de que apenas o que pode ser observado pode ser cientificamente estudado, este ponto de vista moderno ataca problemas da Psicologia tradicional através da análise do comportamento. No decorrer deste texto encontrar-nos-emos estudando e representando na linguagem do comportamento, tópicos tais como aprendizagem e memória, solução de problema e inteligência, sensação e percepção, emoção e motivação.

A organização deste livro permitirá que você chegue a uma compreensão preliminar dos princípios básicos do comportamento humano. Embora muitos dos paradigmas e conceitos fundamentais, que são tratados com detalhes, tenham sido derivados originalmente de experimentos de laboratório com sujeitos animais, eles não são de modo algum limitados aos animais. Empregamos sujeitos animais na pesquisa psicológica por razões pragmáticas: o ser humano do século vinte provavelmente não se submeteria livremente a uma faixa ampla de controle ambiental necessária para um estudo científico; e mesmo que se submetesse, a sociedade não o permitiria.

Para chegar a uma compreensão das causas do comportamento humano e animal, será necessário que você adquira primeiro um vocabulário técnico e uma familiaridade completa com os conceitos básicos da Psicologia. Não se conhece um caminho mais curto para se chegar a tal vocabulário. Você deverá aprendê-lo do mesmo modo que, ao se preparar para uma partida de xadrez, é necessário aprender os nomes e movimentos permissíveis das peças, as saídas mais comuns e os princípios básicos de ataque e defesa.

Ao estudar Psicologia, você pode ter uma desvantagem peculiar que não existe na aprendizagem inicial de xadrez. Certas opiniões e pontos de vista pré-concebidos sobre as causas do comportamento, os quais são uma parte padrão da interpretação do mundo dada pelo bom senso, devem primeiro ser esquecidas. Infelizmente, esta visão do bom senso da natureza humana não é sempre a mais útil para a formulação de uma ciência

- 1 9 -

sistemática das relações entre o comportamento e suas variáveis controladoras. Por essa razão, será melhor que você tente colocar de lado seus preconceitos sobre as ações das pessoas e, em particular, seu sistema de representação dos assim chamados processos mentais internos. Tente, assim, abordar a matéria com um ponto de vista novo, contentando-se, inicialmente, em fazer perguntas ingênuas tais como “O que o organismo observado estava fazendo? ” e “O que se relaciona consistentemente com o que ele fazia? ” No início, seu progresso pode parecer lento mas ele será sempre seguro.

J. R. M.

- 2 0 -

PRIMEIRA PARTEA REGULARIDADE DO COMPORTAMENTO

1. UM BACKGROUND PARA A ABORDAGEM CIENTIFICA AO COMPORTAMENTO

2. COMPORTAMENTO REFLEXO (EL1CIADO)3. CONDICIONAMENTO PAVLOV1ANO4. FORTALECIMENTO OPERANTE5. EXTINÇÃO E RECONDICIONAMENTO DO OPERANTE

Capítulo 1 UM BACKGROUND PARA A ABORDAGEM CIENTIFICA AO COMPORTAMENTO

Quando Sócrates ouviu falar das novas descobertas no campo da anatomia, que se propunham a provar que as causas dos movimentos corporais eram derivadas de um engenhoso arranjo mecânico dos músculos, ossos e articulações, disse: “ Isto dificilmente explica porque estou sentado aqui, numa posição recurvada... falando com vocês” (Kantor, 1963). Passaram-se 2.300 anos desde este comentário de Sócrates e nos séculos subsequentes, as causas do comportamento humano foram atribuídas a marés, espirito divino, posição das estrelas e, com freqüência, simplesmente ao capricho. Nos últimos cem anos, surgiu uma ciência do comportamento trazendo um conceito estrutural novo, com novas atitudes em relação às causas do comportamento. Uma breve história dos eventos que levaram ao desenvolvimento desta ciência é uma introdução apropriada para seu estudo. Assim como não existe um modo melhor de entender as atividades presentes de uma pessoa do que estando a par de sua história passada, também não há melhor meio de entender as atividades presentes de uma ciência do que através do conhecimento do seu passado.

1.1 PRIMEIRAS TENTATIVAS PARA EXPLICAR E CLASSIFICAR O COMPORTA MENTO HUMANO

As origens precisas da ciência do comportamento, como aquelas todos os campos do conhecimento, estão perdidas na obscuridade dos tempos. Mesmo assim, sabemos que pelo ano 325 a.C., na Grécia antiga, Aristóteles combinou a observação e a interpretação num sistema naturalístico de comportamento, ainda que primitivo. Aristóteles procurou as causas (1) do movimento dos corpos, e (2) das discriminações feitas pelos organismos. Descreveu muitas categorias de comportamento tais como a percepção dos sentidos, visão, olfato, audição, bom senso, pensamento simples e complexo, apetite, memória, sono e sonho..Seus tópicos soam-nos familiares, atualmente, e eles rão ainda encontrados de uma forma ou de outra, em quase todos os textos de Psicologia. Aristóteles estava menos interessado na previsão e controle da natureza do que estamos atualmente e, desta torma, suas explicações do comportamento têm um sabor mais antiquado. Aristóteles estava preocupado em explicar as várias atividades de um indivíduo, mostrando serem eias padrões específicos de “qualidades” gerais, tais como apetite, paixão, razão, vontade e habilidade sensorial (Toulmin e Goodfield, 1962).

- 23 -

As observações e classificações de Aristóteles e dos estudiosos gregos que o seguiram foram um início substancial na tentativa naturalística de entender as causas do compor-' tamento humano. Mas a nova ciência declinou com o desaparecimento da civilização helênica. O início da Era Cristã e da Idade Média produziu um clima intelectual pobre para o desenvolvimento da observação e pesquisa: o homem voltou sua atenção para os problemas metafísicos. Os Padres da Igreja iniciaram e os teólogos medievais completaram uma transformação conceituai de uma das “qualidades” puramente abstratas de Aristóteles numa alma sobrenatural a quem as causas do comportamento humano eram atribuídas. Encarando esta alma como imaterial, insubstancial, e sobrenatural, um dualismo definitivo foi estabelecido entre alma e corpo. Colocando as causas do comportamento numa região não observável do espírito, este dualismo inibiu o estudo natura- lístico do comportamento. Então, por um longo período de tempo, as ciências do comportamento permaneceram adormecidas. Temos que pular adiante para o século dezessete, no tempo de Galileu e o surgimento da física moderna para retomar os fios que eventualmente, deram-lhes uma estrutura científica.

As teorias do filósofo e matemático Renè Descartes (1596-1650), contemporâneo francês de Galileu, representam uma quebra parcial da explicação metafísica do comportamento. Tomando como modelo as figuras mecânicas dos jardins reais de Versailles que se moviam e produziam sons, Descartes sugeriu que o movimento corporal era o resultado de causas mecânicas semelhantes.

As máquinas nos nrdins reais operavam baseadas em princípios hidráulicos. A água era bombeada em tubos fechados para impulsionar os membros das figuras, produzindo movimentos, ou era conduzida através de aparelhos que emitiam palavras ou músicas quando a água passava. Descartes imaginou que animais e homens eram, na realidade, um tipo de máquina complicada, analogamente construída. Ele substituiu a água das figuras reais pelos espíritos animais, um tipo de substância intangível, elástica e invisível; e supôs que os espíritos fluíssem nos nervos de tal modo que entravam nos músculos causando, assim, sua expansão e contração e, por sua vez, fazendo os membros se movimentarem.

Algumas das Figuras Reais estavam arrumadas de maneira que, se os visitantes passassem por cima de ladrilhos escondidos, o mecanismo hidráulico atuante fazia as figuras se aproximarem ou se afastarem. Descartes tomou essa resposta mecânica como modelo para explicar como um estímulo ambiental externo poderia causar um movimento corporal. Uma ilustração (ver la. Parte, p.21) num dos seus trabalhos, mostra o retraimentc de um membro de um homem próximo de uma chama. De acordo com Descartes, “a máquina do nosso corpo é assim formada” de tal modo que o calor de uma chama excita um nervo que conduz essa excitação ao cérebro. Do cérebro, os espíritos animais são transmitidos ou refletidos de volta ao membro, através do nervo, aumentando o músculo e causando assim a contração e retraimento (Fearing 1930).

O desejo de Descartes de encarar o comportamento humano como determinado por íorças naturais foi somente parcial. Hle limitou sua hipótese mecânica para certos comportamentos “ involuntários” e supôs que o resto era governado pela alma, localizada no cérebro. A alma guiava inclusive os mecanismos dos comportamentos “ involuntários” , mais ou menos do mesmo modo que uma máquina poderia dirigir as Figuras Reais. A despeito deste dualismo e a despeito de sua escolha de um princípio hidráulico, as formulações de Descartes representaram um avanço no pensamento inicial sobre o comportamento. A teoria do corpo como um tipo específico de máquina poderia ser testada por observação e experimentação. Hsta foi a propriedade seriamente omitida nas

- 24

explicações medievais. Ao'restabelecer a idéia de que, pelo menos, algumas das causas do comportamento humano e animal poderiaim ser encontradas no ambiente observável, Descartes estabeleceu as bases filosóficas que eventualmente iriam justificar uma abordagem experimental do comportamento.

1 .2 - A AÇÃO REFLEXA

O ponto de vista de Descartes simboliza o novo interesse num mecanismo que conduziu à experimentação sobre a ação “reflexa” do animal. Em 1750, um psicólogo escocês, Robert Whytt, redescobriu e expandiu experimentalmente o princípio do estímulo, de Descartes. Pela observação da contração sistemática da pupila à luz, salivação a irritantes e vários outros reflexos, Whytt foi capaz de estabelecer uma relação necessária entre dois eventos separados: um estímulo externo (por exemplo, a luz), e uma resposta corporal (por exemplo, a contração da pupila). Além disso, a demonstração de Whytt que um número de comportamentos reflexos poderia ser eliciado numa rã decapitada, enfraqueceu a atratividade de uma explicação em termos de alma. Contudo, não foi possível, ainda no século dezoito, olhar o estímulo isoladamente como uma causa suficiente do comportamento. A alma, pensou Whytt, provavelmente se difunde através da medula e do cérebro, retendo, consequentemente, o controle mestre dos reflexos.

Nos 150 anos seguintes, mais e mais relações reflexas foram descobertas e elaboradas e o conceito de estímulo adquiriu mais força. Ao mesmo tempo, a ação do nervo passou a ser compreendida como um sistema elétrico ao invés de hidráulico. No inicio do século XIX, a tendência espiritual tomou-se supérflua para explicar a ação “involuntária” e Sir Charles Sherrington, célebre fisiologista inglês, pôde resumir as causas do comportamento reflexo em leis quantitativas de estímulo-resposta. Essas leis relacionavam a velocidade, magnitude e probabilidade da resposta reflexa à intensidade, freqüência e outras propriedades mensuráveis do estímulo. A ciência havia anexado inteiramente o reflexo. Mesmo assim, uma grande proporção do comportamento humano e dos animais superiores permaneceu ligada a forças sobrenaturais.

1.3 - REFLEXOS CONDICIONADOS OU ADQUIRIDOS

Pouco antes do início do século XX, Ivan Pavlov, fisiologista russo, estava pesquisando as secreções digestivas de cães. No curso desses experimentos, notou que enquanto a introdução de alimento ou ácido, na bôca, resultava num fluxo de saliva, a mera aparição do experimentador trazendo alimento poderia também eliciar um fluxo similar. Pavlov não foi, de modo algum, o primeiro homem a fazer observações deste tipo. Mas parece ter sido o primeiro a suspeitar de que seu estudo detalhado poderia fornecer um indício para a compreensão do comportamento ajustado e adaptado dos organismos. Foi esta visão que o ievou ao estudo sistemático desses reflexos, os quais chamou de reflexos condicionais, porque eles dependiam ou eram condicionais a um evento prévio na vida do organismo. A aparição do experimentador não eliciava originalmente a saliva. Somente depois que sua aparição era frequentemente associada com alimento ou ácido, ela apresentava esse efeito. A contribuição particular de Pavlov foi mostrar experimentalmente como os reflexos condicionais eram adquiridos, como poderiam ser removidos (extintos) e que faixa de energias do ambiente era efetiva em sua produção. Pavlov, em tempo, apontou uma lei geral de condicionamento: depois de uma

- 2 5 -

associação temporal repetida de dois estímulos, aquele que ocorre primeiro, eventualmente, passa a eliciar a resposta que, normalmente, é eliciada pelo segundo estímulo.' Esta lei continua conosco até hoje, ligeiramente modificada.

Três aspectos gerais do trabalho de Pavlov merecem nossa atenção. Primeiro, ele não estava satisfeito em observar simplesmente os aspectos gerais do condicionamento, como muitos outros fizeram antes dele (c. f. Hall e Hodge, 1890). E m vez disso, ele prosseguiu para verificar a generalidade do fenômeno usando muitos estímulos e muitos cães. Foi somente depois de numerosas demonstrações que ele codificou numa lei o que havia descoberto -- lei esta aplicável, pensou ele, a todos os estímulos e a todos os organismos superiores. Segundo, Pavlov, preocupou-se com os aspectos mensuráveis ou quantitativos do fenômeno. Essas quantidades mensuráveis, tais como a quantidade de saliva e o número de emparelhamentos do retlexo, foram úteis por permitirem uma análise detalhada do condicionamento. Um terceiro aspecto do trabalho de Pavlov foi sua natureza sistemática. Limitando seus estudos aos efeitos de numerosas condições sobre uma única grandeza (quantidade de saliva), Pavlov assegurou que suas descobertas experimentais pudessem ser interrelacionadas e, consequentemente, mais significativas.

Pavlov viu claramente como se deve proceder na explicação do comportamento.

“o naturalista deve considerar somente uma coisa: qual é a relação desta ou daquela reação extema do animal com os fenômenos do mundo externo? Esta resposta pode ser extremamente complicada em comparação com a reação de qualquer objeto inanimado, mas o princípio envolvido permanece o mesmo.Estritamente falando, a ciência natural tem por obrigação determinar somente a conexão precisa que existe entre um dado fenômeno natural e a resposta do organis mo vivo a este fenômeno (Pavlov, 1928, p. 82)” .

Contudo, apesar de seu próprio interesse declarado na relação meio e resposta, Pavlov gradativamente passou a encarar o condicionamento como um estudo da função do cérebro. Suas explicações tendiam a ser em termos de processos cerebrais hipotéticos. Mas, na verdade, Pavlov raramente mediu qualquer relação real entre cérebro e compor tamento. Assim, estas explicações eram tão fictícias como as primeiras explicações em termos da alma. Tentando explicar o comportamento através de funções desconhecidas do cérebro, ele evitava uma descrição direta do próprio comportamento violando, deste modo, uma das suas próprias afirmações de que uma ciência do comportamento necessita determinar somente a "conexão precisa que existe entre um dado fenômeno natural e a resposta do organismo vivo a este fenômeno” .

L4 - A TEORIA DA EVOLUÇÃO E O COMPORTAMENTO ADAPT ATIVO

De certo modo, o trabalho de Pavlov representa o auge da doutrina mecanicista de Descartes sobre o comportamento reflexo. Com respeito ao comportamento que tradicionalmente era colocado sob o controle do desejo ou volição, Descartes seguiu os preconceitos de seu tempo, atribuindo-o ao controle de uma alma não observável. Tal “solução” , todavia, apenas adiou a investigação científica, uma vez que o problema original de explicar o comportamento foi simplesmente transferido para um outro mais difícil, o de explicar o comportamento da alma postulada. Em 1859, ocorreu um grande evento científico que alterou o clima intelectual tornando-o favorável para um estudo

- 2 6 -

naturalistic*) do comportamento voluntário. Naquele ano, Charles Darwin propôs a teoria da evolução, dizendo que o homem era membro do reino animal e que diferenças entre o homem e outros animais eram quantitativas e somente uma questão de graus. Assim um conhecido historiador da Psicologia colocou a questão;

“A teoria da evolução levantou o problema da Psicologia animal porque ela exige uma continuidade entre diferentes formas animais e entre o homem e os animais. De uma maneira vaga, a noção Cartesiana [de Descartes] ainda prevalecia. O homem possuia uma alma e os animais eram considerados sem alma, e havia, além disso, pouca distinção entre uma alma e uma mente. A oposição à teoria da evolução era baseada principalmente na suposição que fazia de haver continuidade entre homens e feras e a réplica óbvia para a crítica foi demonstrar a continuidade. A existência de mente nos animais e a continuidade entre a mente humana e animal, deste modo, tornou-se crucial para a sobrevivência da nova teoria (Boring, 1929, p. 462-463)” .

A teoria de Darwin era baseada em muitas observações cuidadosas que ele havia feito de fósseis e da estrutura da flora e fauna vivas, em áreas isoladas da Terra. Além disso, ele pesquisou o comportamento através do qual os animais se adaptavam aos seus meios. As observações comportamentais de Darwin foram tão amplas e detalhadas que marcam a primeira tentativa sistemática de uma Psicologia Animal Comparativa (ver Darwin, 1873).

O interesse de Darwin no comportamento foi, como observou o professor Boring, baseado naquilo que tal comportamento revelaria sobre a mente. Assim, a demonstração da complexidade e variedade nos comportamentos adaptativos de animais em relação a seus ambientes mutáveis, pareceria provar que eles, como o homem, deviam também pensar, ter idéias, e sentir desejos. Consequentemente, Darwin foi criticado por seu antropomorfismo, isto é, por tentar explicar o comportamento animal em termos de conceitos mentalistas. Mas pouco se pensou neste tempo em levantar a questão metodológica mais radicai; se os conceitos mentalistas tradicionais (pensamento, idéia, desejos) têm valor explicativo mesmo para o comportamento humano.

George John Romanes, amigo de Darwin, escritor inglês e popularizador da ciência escreveu um livro sobre a inteligência animal (Romanes, 1886) no qual comparou o comportamento de várias espécies de animais. Romanes colheu material da observação cuidadosa de animais, mas, também levou em consideração evidências de cunho popular sobre animais de estimação e de circo. Por esta razão, seu método veio a ser chamado anedótico. Os métodos, antropomòrfico e anedótico de Darwin e Romanes, respectivamente, marcaram uma renovação no interesse pelo comportamento adaptativo do animal e pela relação deste com o comportamento humano. Consequentemente, eles representam importantes precursores históricos de uma verdadeira análise experimental do comportamento.1 .5- O S PRIM EIROS EXPERIM ENTOS SOBRE O COMPORTAMENTO

“VOLUNTÁRIO”

Em 1898, Edward L. Thorndike, da Universidade de Columbia, publicou os resultados de alguns estudos de laboratório com gatos, cães e pintos. Seus métodos eram radicalmente opostos àqueles da observação casual que o haviam precedido. A aparelhagem utilizada por Thorndike é mostrada na Fig. 1-1.0 comportamento estudado foi a fuga de um ambiente fechado e atos, tais como, puxar um cordão, mover um trinco,

- 27 -

pressionar uma barra ou abrir uma porta erguendo uma tramela, foram escolhidos por sua conveniência e exatidão de observação. Uma vez que qualquer um destes comportamentos podia ser organizado de modo a servir como instrumento que produziria a fuga da caixa, Thorndike os chamou de comportamentos instrumentais.

I igura 1-1. A caixa quebra-cabeças utilizada por Thorndike para estudar a aprendizagem instrumental de animais (Garret, 1951).

Quatro elementos do trabalho de Thorndike sobre o comportamento instrumental demonstram uma qualidade moderna não vista nas pesquisas comportamentais antes de sua época. (1) Ele reconheceu a importância de se fazer observações de animais cujas histórias passadas fossem conhecidas e mais ou menos uniformes. Logo, criou seus animais no laboratório onde poderiam obter condições ambientais semelhantes antes do experimento. (2) Thorndike compreendeu a necessidade de se fazer observações repetidas de um mesmo animal e de se fazer observações em mais de um animal e em mais de uma espécie. Somente deste modo poderia estar certo de que os resultados que ele obtinha eram aplicáveis aos animais em geral. (3) Thorndike viu que, a menos que considerasse mais do que um ato particular do comportamento, suas conclusões, seriam válidas apenas para o único aspecto do comportamento que ele escolhesse. Logo, empregou diversos comportamentos em vários aparelhos diferentes. (4) Ainda outra qualidade do trabalho de Thorndike, caracteristicamente científica, foi sua tentativa de fazer uma apresentação quantitativa dos resultados.

De seus trabalhos com animais nas caixas quebra-cabeça, Thorndike apresentou um conjunto de princípios ou leis gerais do comportamento que acreditava serem válidas para muitas espécies e muitos tipos de comportamento. Um desses, princípios, embora

- 2 8 -

modificado chegou até nossos dias. Thorndike notou que, quando os animais eram inicialmente colocados na caixa quebra-cabeça, eles apresentavam muitas respostas difusas de debater-se. Eventualmente, um desses comportamentos difusos poderia, por acaso, fazer funcionar o mecanismo de fuga. A porta, então, abrir-se-ia, permitindo ao animal sair da caixa e o b te r um a pequena quantidade de alimento. Thorndike observou que o comportamento, que inicialmente permitia ao animal sair, era apenas um dos muitos que ele executava na situação. Assim, à medida que o animal era repetidamente submetido à situação , ele passava a ap resen tar menos comportamentos supérfluos, até que eventualmente não apresentasse, praticamente, nenhum daqueles mal sucedidos. Thorndike concluiu disto que os resultados bem sucedidos do passado, ou efeitos do comportamento, deveriam ter uma influência importante na determinação das tendências comportamentais presentes do animal. Thorndike chamou isto — a capacidade dos efeitos passados do comportamento modificarem os padrões do comportamento animal — a lei do efeito. Esta lei sobrevive ainda hoje como um princípio fundamental na análise fundamental e controle do comportamento adaptativo.

1 .6- O ZEITGEIST

Thorndike forneceu um novo método experimental e com sua ajuda formulou o que logo seria aceito como uma lei básica do comportamento adaptativo. Do mesmo modo que Whytt, 1 50 anos antes, deixou o conceito de reflexos parcialmente no estado de fato observado e parcialmente no estado de interpretação supérflua, assim tambémThórndike deixou a lei do efeito. Na sua proposição do princípio, Thorndike não estava satisfeito em considerar o “efeito” como uma mera fuga do confinamento ou mero acesso ao alimento. Mas em vez disso, sentiu necessidade de inferir que o sucesso levava ao prazer e a satisfação, e que estas eram as causas verdadeiras das mudanças observadas no comportamento. Deste modo, ele deixou a explicação a cargo de estados mentais hipotéticos, prazer e satisfação, os quais não eram mais reais do que a “alma” de Descartes. Para Thorndike, como para seus contemporâneos, o comportamento de um gato escapar de uma caixa quebra-cabeça não era importante como comportamento, mas somente como um meio de esclarecer os processos mentais e associações de idéias do animal.

T hornd ike foi, então, fiel à sua época e suas tradições considerando o comportamento principalmente interessante pelo que podia revelar sobre algum outro sistema. O que as épocas e as tradições impõem aos mais originais pensadores são frequentemente denominadas de Zeigeist. Os grandes homens de uma era erguer-se-ão acima de Zeitgeist de algumas maneiras mas, mesmo assim, serão por ele acorrentados de outras maneiras. Descartes superou-o quando propôs uma teoria mecanicista original sobre o movimento do corpo. Que ele foi acorrentado pelo Zeitgeist, é evidente, pela sua permanência no dualismo “mente-corpo” . Vimos o Zeitgeist em Whytt, que redescobriu o princípio do estímulo, mas não foi capaz de eliminar a alma como a causa final dos reflexos que observou. Pavlov estudou os reflexos condicionados, um fenômeno cuja importância foi negligenciada durante séculos. Mesmo assim, vimos que Pavlov estava preso pelo Zeitgeist; ele manteve o ponto de vista de que os reflexos condicionados, embora, claramente, um fenômeno comportamental, eram de interesse para a compreensão do cérebro ao invés do comportamento. Agora, vemos o Zeitgeist em Thorndike, que realizou alguns dos primeiros experimentos sobre o comportamento “voluntário” , mas explicou suas descobertas através da associação de idéias. De fato, o

- 2 9 -

princípio do Zeitgeist penetra de tal forma todas as ciências que podemos tomar como regra geral que todo trabalho humano será colorido pelas teorias e ponlos de vistas aceitos em sua época. Assim, embora a grandeza de um homem consista em libertar-se de certas maneiras de pensar estabelecidas e ver o que ninguém antes dele viu claramente, ou, do mesmo modo, ele não escapará completamente do clima social, filosófico e 1 cultural no qual trabalha.

1.7 - A PSICOLOGIA PERDE A SUA MENTE

Thorndike introduziu o comportamento adaptativo no laboratório e, assim fazendo, descobriu a importância da le i do efeito. Os estudos de Thorndike sobre o comportamento surgiram do seu interesse, como Psicólogo, nos processos mentais. Será instrutivo, neste ponto, examinar a disciplina da Psicologia que, na primeira metade do século vinte, fundir-se-ia com outras contribuições históricas da ciência do comportamento. A pesquisa psicológica experimental iniciou-se em meados do século dezenove como uma disciplina derivada da fisiologia dos órgãos dos sentidos. De fato, os pioneiros Herman Helmholtz, Johannes Müller e Wilhelm Wundt eram todos físicos e fisiologistas. Estes primeiros psicólogos experimentais adotaram as categorias de comportamento descritas por Aristóteles mas, de um modo diferente deste, eles estavam interessados no comportamento, apenas, na medida em que esclarecia os processos mentais. Logo, o trabalho dos primeiros psicologistas representava uma tentativa para tornar os métodos experimentais naturalísticos, introduzidos por Galileu, compatíveis com as doutrinas metafísicas da Idade Média.

Foi Wundt que, em 1879, fundou o primeiro laboratório de Psicologia em Leipzig. Podemos considerar o seu sistema como representativo das atividades desta nova disciplina, a qual tinha menos de vinte anos quando Thorndike estava fazendo seus experimentos com gatos e pintos na Colúmbia. Wundt advogou que a psicologia era a ciência da experiência; e, como tal% seu objeto de estudo abrangia sentimentos, pensamentos e sensação. Ele formulou a doutrina de que o método da Psicologia era introspectivo, um exame dos processos conscientes do organismo em experiencia. Logo, Wundt esquematizou o problema da Psicologia como “(1) a análise dos elementos dos processos conscientes, (2) a determinação de como esses elementos são conectados e (3) a determinação das leis de conexão” (Boring, 1929, p. 328, ital. omitidos). Os experimentos que Wundt e seus seguidores realizaram dão uma imagem melhor do conteúdo da psicologia do que as definições fornecidas por Wundt. A maioria dos trabalhos foi classificada sob o título de sensação humana e dizia respeito ao sentido visual em particular. Numerosos experimentos mediam as intensidades mínimas de luz que um observador poderia detectar sob várias condições. Outros estavam voltados para as menores mudanças ambientais necessárias para um observador relatar diferenças apenas percebidas çm luminosidade, cor e distância dos objetos. Tais pesquisas vieram a ser chamadas de experimentos de limiares em Psicofísica. Psico— porque as sensações eram consideradas estar sob estudo; física - porque mudanças físicas no ambiente eram manipuladas e medidas experimentalmente. Audição, tato, gosto, olfato e o sentido do tempo também foram pesquisados, assim como o tempo de reação, atenção e sentimento. A memorização de vários tipos de sílabas sem sentido era um método para tratar a associação de idéias e deduzir as propriedades da memória.

Embora se afirmasse ser a psicologia uma ciência dos conteúdos, processos e atos mentais, o que de fato ela investigava era o comportamento. Associações de idéias eram

- 3 0 -

inferidas a partir da aprendizagem de sílabas sem sentido; sensações idênticas eram inferidas de observações do comportamento quando um sujeito humano agrupava dois objetos ambientais diferentes em contextos diferentes (por exemplo, duas amostras de papel cinza sob diferentes condições de iluminação); a velocidade do processo mental era inferida do tempo de reação do indivíduo. Assim, não foi paradoxo algum o fato de que quando Thorndike veio a fazer uma observação mais detalhada da associação de idéias, estivesse livre para escolher animais como sujeitos. Se o comportamento dos organismos humanos poderia levar à inferência sobre o processo mental, por que não o comportamento animal? Logo, aconteceu que o trabalho de Thorndike ajudou a introduzir os métodos de pesquisa animal na Psicologia. Aí eles pejmanecem ao lado dos descendentes metodológicos da psicologia sensorial clássica e da Psicologia introspect iva do século dezenove.

Mas, talvez o homem que mais contribuiu para esclarecer a relação entre o comportamento e Psicologia foi John B. Watson. O primeiro trabalho deste psicologista americano dizia respeito às modalidades sensoriais que o rato usa na aprendizagem de um labirinto. À medida que Watson continuava seus estudos com animais, tornava-se mais e mais preocupado com o ponto de vista predominante de que o comportamento era significativo somente quando esclarecia processos mentais ou conscientes. Ocorreu a Watson que os dados do comportamento tinham valor em si mesmos e que os problemas tradicionais da Psicologia — imaginação, sensação, sentimento, associação de idéias — poderiam ser todos estudados estritamento por métodos comportamentais.

Em 1913, Watson publicou um trabalho, atualmente clássico, definindo a psicologia como ciência do comportamento e chamando esta nova Psicologia de “behaviorismo” . Watson argumentava, neste trabalho, que o estudo do comportamento poderia chegar a u m ‘status’ independente dentro da ciência. O objetivo de tal ciência seria a previsão e controle do comportamento de todos os animais, sem nenhuma preferência especial para os seres humanos. O behaviorista, dizia Watson, deve relacionar seus estudos de ratos e gatos com o comportamento humano não mais (não menos) do que o zoologista deve relacionar suas dissecações de sapos e vermes à anatomia humana. Através de sua doutrina, Watson estava destruindo a teoria homocêntrica da importância do homem no mundo do comportamento tão eficazmente como Copérnico, quatrocentos anos antes, havia destruído a teoria do universo geocêntrico (terra no centro).

O ponto crítico de Watson era o de que a psicologia deveria ser objetiva — isto é, ela deveria ter um objeto de estudo que, como nas outras ciências, fosse independente do observador. A Psicologia clássica, tentando estabelecer como seu objeto a auto- observação, carecia de um observador independente, localizado fora do sistema em consideração. A adoção do comportamento como objeto a ser observado deu à nova psicologia o observador independente necessário.

O programa de Watson tinha um grande alcance e era para sua época, notavelmente sofisticado. Ao enfatizar o comportamento como um objeto independente de uma ciência dirigida para a previsão e controle do comportamento e a análise microscópica do ambiente e comportamento em termos de estímulo e resposta como a maneira para a compreensão eventual de padrões complexos do comportamento, o programa de Watson preparou a base para nossos pontos de vista modernos.

- 31 -

1 . 8 - 0 FIRME ESTABELECIMENTO DE UMA ANÁLISE EXPERIMENTAL DO COMPORTAMENTO

Os primeiros experimentos de Thorndike sobre o comportamento animal e a definição de Psicologia dada por Watson, como uma ciência do comportamento, introduziram a pesquisa animal na Psicologia,Mesmo assim, o ‘status’ científico da nova Psicologia era precário. No princípio dos reflexos condicionados formulado por Pavlov, Watson pensou ter encontrado um mecanismo explicativo para muitos dos ajustamentos complexos e sutis de organismos adultos, inclusive o homem, aos seus ambientes. Mas a tentativa de forçar todos os comportamentos no modelo do reflexo foi um fracasso. Watson não soube apreciar a importância daJei do efeito de Thorndike, principalmente, pode-se supor, devido ao excesso de bagagem conceituai com que Thorndike envolvera a questão. O ponto de vista de Watson de que a tarefa de uma ciência preditiva do comportamento fosse a compilação de todas as correlações estímulo-resposta hereditárias e adquiridas que um dado organismo exibisse, desviou a atenção da procura de leis gerais do comportamento. Neste vácuo teórico, conceitos mentalistas tradicionais continuaram a sobreviver. O rigor experimental do behaviorismo estava fora de questão, mas sua metodologia corria o risco de ser estéril.

“Vinte anos de “método de ciência natural” sustentados pelo behaviorismo fracassaram em fornecer uma formulação sistemática consistente e útil. Os dados experimentais refletiam muitas propriedades arbitrárias dos aparelhos. Conclusões aceitáveis com qualquer grau de generalidade referiam-se a aspectos, características ou capacidades limitantes. Enquanto muitas dessas eram bastantes válidas, poucas eram logicamente convincentes e preferências pessoais levavam a muitas ‘ciências’ individuais do comportamento” (Skinner, 1944; p. 276).

Numa série de publicações iniciadas em 1930, B. F. Skinner propôs uma formulação do comportamento que surgiu de observações feitas num único organismo respondendo numa situação experimental artificial, cuidadosamente controlada e altamente padronizada. O organismo que Skinner usou foi o rato branco, e a aparelhagem consistia numa caixa contendo uma pequena barra que, se pressionada pelo rato, fornecia uma pequena pelota de alimento em um recipiente localizado diretamente abaixo da barra

Figura 1-2. A caixa de Skinner para o estudo do comportamento operante de pequenos animais (Skinner, 1938).

- 3 2 -

Sob essas condições experimentais, um rato faminto deixado só na caixa, logo viria a pressionar a barra com uma taxa constante e moderada até que um dado número de pelotas de alimento liberadas começasse a saciar o animal. A situação experimental utilizada por Skinner e sua abordagem aos problemas do comportamento foram únicas em muitos aspectos. Skinner viu a necessidade de encontrar uma variável dependente sensível e exata. Isto é, algum aspecto quantitativo do comportamento que pudesse variar numa ampla faixa e ter uma relação ordenada e regular com as variáveis ambientais passadas e presentes, relação esta que pudesse ser formulada em termos de uma lei. Sua descoberta de que a freqüência de ocorrência da resposta de pressionar a barra durante um intervalo de tempo (sua taxa) satisfazia essas condições, foi o principal avanço em direção a uma análise sofisticada do comportamento individual.

A abordagem de Skinner aos problemas do comportamento diferia, de certo modo, daquelas dos seus precursores assim como de seus contemporâneos que trabalhavam com a psicologia animal. Como proposição fundamental, ele sustentou que uma ciência do comportamento poderia ser o que chamou de descritiva ou funcional; isto é, poderia limitar-se a descobertas de relações ou correlações entre variáveis mensuráveis. Skinner também argumentou que as pesquisas deveriam ser sistemáticas, no sentido de que as relações obtidas estivessem ligadas por um ponto comum. Limitando suas observações às formas pelas quais uma única variável dependente (a freqüência por unidade de tempo de um ato arbitrário mas, mesmo assim, representativo) mudavam com as condições ambientais variadas, Skinner manteve seu próprio trabalho altamente sistemático.

Um objeto de estudo, frequentemente, espera instrumentos para colocar o observador em melhor contato com ele. Skinner inventou um registrador que realiza um registro visual das respostas sucessivas através de um ligeiro deslocamento vertical de uma pena, movendo-se horizontalmente no tempo. À medida que o experimento progride, um gráfico de respostas acumuladas é desenhado em função do tempo. Esse registrador cumulativo de respostas torna possível um registro de alta qualidade do processo comportamental para inspeção imediata que funciona para os behavioristas de uma maneira não diferente da que o microscópio funciona para o biologista.

As contribuições metodológicas reais de Skinner para a ciência moderna do comportamento são numerosas e podemos apresentar, aqui, somente um esboço de algumas das mais importantes. Ele reconheceu a antiga dicotomia entre ações reflexas e voluntárias ou, como chamou mais tarde, operantes. Mas mostrando que o princípio de Pavlov se aplicava ao fortalecimento dos reflexos, enquanto a lei do efeito de Thorndike descrevia o fortalecimento de operantes, ele colocou ambos os tipos em perspectiva harmoniosa. Formulou, tambérq um vocabulário preciso cujos termos foram definidos com referência aos fatores observáveis que ele media e manipulava. Nessa terminologia está a base do nosso quadro conceituai moderno.

Desde o inicio, Skinner enfatizou a importância da predição e controle detalhados do comportamento individual, ao invés de diferenças gerais entre grupos de animais. Suas próprias pesquisas foram invariavelmente caracterizadas por um grande número de medidas em poucos organismos, sendo a reprodutibilidade do processo sob estudo o teste de sua validade. O enfoque de Skinner na taxa de uma resposta operante representativa evitou muitos dos problemas associados com as medidas mais indiretas do comportamento. Thorndike observou o número de erros cometidos e o tempo gasto para alcançar o sucesso no seu quebra-cabeça, mas nenhuma dessas era, na realidade, uma propriedade real do comportamento instrumental que estava sendo adquirido. Se desejamos treinar um cão a pular através de um aro, por exemplo, não estamos interessados

- 3 3 -

nos erros que ele comete, mas no seu comportamento de pular através do aro. Os erros são medidas de comportamentos outros que não aqueles que estamos investigando. Questões interessantes sobre se um dado ato ocorrerá ou não, ou com que freqüência ocorrerá, nunca poderiam ser respondidas em termos de erros ou escores de tempo. O dado básico de Skinner, a taxa de respostas, está relacionado de perto com a probabilidade de ocorrência do comportamento e tem sido especialmente útil em fornecer respostas a questões sobre a probabilidade da resposta.

Com o passar dos tempos, Skinner ampliou sua base empírica. Combinações de respostas e organismos outras que não o pressionar a barra por ratos têm sido estudadas. A expectativa original de que este ato seria característico do comportamento operante, de um modo geral, tem sido aparentemente confirmada. Além disso, as relações que Skinner obteve garantem, em muitos casos, o título de princípios comportamentais, já que elas parecem manter-se para um grande número de organismos, incluindo o homem, e para todas as respostas que podem ser classificadas como operantes.

O trabalho de B.F. Skinner nos leva a um ponto próximo da nossa conceituação moderna de ciência do comportamento. Estamos ainda muito perto desse período histórico, muito envolvidos em nosso próprio Zeitgeist, para termos a perspectiva necessária para determinar os pontos fracos no sistema de Skinner. Nos capítulos que se seguem, todavia, veremos que a ciência do comportamento, atualmente restabelecida de um modo firme como uma ciência natural, está se expandindo em muitas áreas de pesquisas. Talvez, a prova mais convincente de que essa ciência se desenvolveu encontra-se no surgimento recente de uma tecnologia do comportamento esboçada diretamente a partir dela. Como veremos, as aplicações de técnicas do comportamento estão sendo ampliadas a pesquisas de drogas, treino de animais, guerras, tratamento do comportamento humano anormal e educação.

1.9 - REVISÃO

A história da ciência do comportamento começa com a classificação naturalística do comportamento feita por Aristóteles. Logo foi sucedida por uma Filosofia Teológica e a análise do comportamento permaneceu adormecida por quase dois mil anos. Mas no século XVII, surge novamente com a concepção de Descartes de que o corpo animal é uma máquina, e alguns dos seus movimentos são ordenados e regulares. Robert Whytt e várias gerações de fisiologistas posteriores mostraram que estes movimentos de característica automática se relacionavam, de forma precisa, a eventos particulares nc ambiente do animal. Essa relação entre um evento ambiental e um movimento particular torna- e a primeira unidade organizada de análise para a ciência do comportamento. Ê o reflexo. Eventualmente, Pavlov amplia o conceito de reflexo para incluir relações ambiente-comportamento que são condicionais a operações anteriores na história do animal. Esses reflexos condicionais tornam possível uma análise de alguns dos comportamentos que um organismo adquire durante sua vida. Thorndike é o primeiro a mostrar que o comportamento que possui uma espontaneidade não observada nos reflexos obedece a certas leis qualitativas que diferem das leis do reflexo. Nessa época, John Watson inicia a sua campanha para convencer a Psicologia, o estudo da mente, de que a mente é, em grande parte, comportamento. Com a descoberta de B. F. Skinner de um objeto de estudo fidedigno, a taxa de respostas operante, o comportamento espontaneamente emitido começa a desenvolver leis próprias, sendo cada ocorrência tão

- 3 4 -

geral e previsível como aquelas do reflexo. Aiiistória da análise do comportamento revela que os homens estão bastante enclinados a adotar interpretações supérfluas sobre o com portam ento, ao invés de aceitar a realidade das descrições do próprio comportamento. Quase todo contribuinte da ciência compartilhou de algumas superstições da sua época sobre o comportamento que estava pesquisando.

REFERÊNCIAS PARA O CAPITULO 1.

Boring, E. G. A history of experimental psychology. New York: The Century Company, 1929.

Darwin, C. R. The expression of the emotions in man and animals.London: Murray, 1873.

Dennis, W. Readings in the history of psychology. New York: Appleton- Century, 1948. (Chapters 3, 45, 48, and 50.)

Fearing, F. Reflex action: a study in the history of physiological psychology. Baltimore: Williams and Wilkins, 1930.

Garrett, H. Great experiments in psychology, New York: Appleton- Century-Crofts, 1951.

Hall, G. S., and Hodge, C. F. A sketch of the history of reflex action.Amer. J. Psychol., 1890, 3, 71-86; 149-173; 343-363.

Kantor, J. R. The scientific evolution of psychology. Vol. 1. Chicago: Principia Press, 1963.

Pavlov, I. P. Lectures on conditioned reflexes. New York: International Publishers, 1928.

Romanes, G. J. Animal intelligence. (4th ed.) London: Kegan Paul,1886.

Skinner, B. F. A review of C. L. Hull’s Principles of behavior. Amer.J. Psychol., 1944, 57, 276-281.

Skinner, B. F. The concept of the reflex in the description of behavior./ . gen. P s y c h o l1931, 5, 427-458.

Thorndike, E. L. Animal intelligence. Psychol. R ev . Monogr. Suppl.1898, No. 8.

Toulmin, S., and Goodfield, June. The architecture of matter. New York: Harper and Row, 1962.

Watson, J. B. Psychology as the behaviorist views it. Psychol. R ev.f 1913, 20, 158-177.

- 3 5 -

Capítulo 2 - COMPORTAMENTO REFLEXO (ELICIADO)

Seria consistente com a nossa argumentação histórica sobre a ciência do compor* tamento afirmar que a Psicologia é a ciência que se preocupa com o modo pelo qual o comportamento de um organismo está relacionado com o seu ambiente. Talvez a mais simples dessas relações comportamento-ambiente seja o reflexo.

Para o fisiologista, o reflexo é um fenômeno a ser explicado. Isto é, o fisiologista está interessado nas estruturas anatômicas subjacentes ao reflexo e os eventos corporais que ocorrem entre o estímulo eliciador e a resposta. Seu interesse baseia-se na composição ou análise do reflexo. Para o Psicólogo, por outro lado, o reflexo é um fenômeno a ser empregado para explicar outros comportamentos. Isto é, o Psicólogo está interessado em mostrar que padrões complexos de comportamento são compostos de, ou podem ser sintetizados a partir dos reflexos. A distinção análise-síntese mostra de uma vez o ponto comum e o ponto de partida das duas ciências. A partir do reflexo, as duas disciplinas movem-se em direções diferentes. Como Psicólogos, desejamos usar o reflexo como um princípio explanatório ou como uma unidade de análise do comportamento mais complexo. Portanto, devemos entender algumas das propriedades quantitativas e conceituais dos reflexos.

2.1 - A FÓRMULA S - R

Como vimos ao considerar o comportamento reflexo no capítulo 1, Descartes e Whytt representaram o ambiente com o conceito de estímulo. E representaram o com portamento em termos dos movimentos do organismo ou resposta a este estímulo. Esses conceitos continuam a ser úteis para a descrição de relações ordenadas entre ambiente e comportamento. Neste capítulo, designaremos o estímulo na relação reflexa pelo símbolo S e a resposta pelo símbolo R. A regularidade existente na relação entre eventos ambientais e ações reflexas podem ser resumidas pela fórmula.

R2 = / ( S2)^ssa fórmula diz que uma certa resposta reflexa, R2 (chamada um respondente). é uma função de (isto é, depende de) um evento estímulo S2 (chamado um eliciador)1. Essa

1. Os índ ices num éricos serão esclarecidos no C ap ítu lo 3.

- 3 7 -

fórmula expressa uma relação ou correlação importante, entre dois eventos. No decorrer deste capítulo, examinaremos esta correlação em detalhe.

Um dos experimentos de Sherrington serve de ilustração. Ele conectou um músculo da perna de um gato a um aparelho para medir a contração deste músculo. Anteriormente, sob anestesia, o cérebro do gato havia sido desconectado da medula. (No estudo dos reflexos, as influências que não estão sob o controle direto do experimentador são frequentemente removidas cirurgicamente. Neste caso, separar o cérebro da medula espinhal remove qualquer efeito possível que o cérebro possa ter sobre o músculo em estudo.) Choques elétricos breves de várias intensidades foram, então, aplicados a um nervo sensorial que se sabia estar envolvido em um arco reflexo neste músculo.

A Fig. 2. 1 ilustra os resultados hipotéticos do tipo que Sherrington poderia ter obtido, à medida que aumentasse gradualmente a intensidade do choque em sete tentativas sucessivas. Algumas das propriedades de um reflexo típico estão representadas: por exemplo, se observarmos, na Fig. 2.1, que a linha relativa ao tempo se desloca da esquerda para a direita, observaremos primeiramente que o choque mais fraco (o choque mais fraco e localizado na extrema esquerda) não elicia um respondente. Valores de choque não suficientes para eliciar uma resposta . Mas para estarmos certos, apresentamos o mesmo valor do choque novamente na tentativa 3. Desta vez, obtemos uma resposta. Este valor do choque se encontra no que chamaremos a região de penumbra ou limiar: é o bastante forte para, algumas vezes, eliciar um respondente e outras vezes não. Continuando nossas apresentações de choque de maior intensidade observamos um número de efeitos interessantes: (1) cada apresentação de choque é seguida por (elicia) um respondente, (2) choques eliciadores mais fortes são seguidos por respondentes mais fortes, (3) os respondentes ocorrem mais rapidamente após eliciadores mais fortes; isto é, o tempo entre o eliciador e o respondente, chamado latência, é menor quando o eliciador é mais forte.

latência longa latência curta

Respondente

Choques elétricos no músculo

A

r*— —►i

.k A AM—

hregião de penumbra ■

J L JL

T em po ►- ----- 1-----1-----1-----1---- J-----1-----1-----1-----1-----1----- 1——J-----L——i---------- 1-------------l

Figura 2 1 Seqüência temporal esquemática de apresentações repetidas de umeliciador e a ocorrência de respondentes associados. A altura dos respondentes indica sua magnitude. A altura dos eliciadores indica sua intensidade. A distância entre o apàreci- mento do eliciador e o aparecimento do respondente representa a latência. A linha do tempo é feita por um marcador periódico que marca intervalos de tempo iguais e arbitrários.

- 3 8 -

A descoberta de relações e propriedades como essas ilustradas na Fig. 2. 1 é um dos objetivos permanentes da ciência. Quando relações quç se mantém entre os valores de um evento (tais como intensidades de choque) e valores de outro evento (tais como a magnitude ou rapidez de movimento do músculo) podem ser isoladas ou reproduzidas dia após dia, experimento após experimento, frequentemente falamos da regularidade da natureza. De um modo figurado, estamos dizendo que a natureza parece ser limitada por certas leis cuja descoberta é o principal objetivo da pesquisa científica.

Devemos qualificar cuidadosamente essa última proposição * todavia, porque parece certo que as relações ou leis da natureza não são como conchas numa praia, esperando por nós para ajuntá-las numa cesta científica.

Antes de podermos estabelecer leis relacionando nossos conceitos, é preciso termos formulado, pelo menos numa primeira aproximação, os nossos conceitos. A descoberta das leis do reflexo foram precedidas por quase trezentos anos de uma evolução gradual do conceito de estímulo, iniciando-se com Descartes. Então, a ciênciaé uma operação similar ao funcionamento de uma armadilha. Em estágios pré-científicos, nossa intuição e experiência ingênua levam-nos a suspeitar que uma certa ordem existe na natureza a especulamos qual a natureza desta ordem. (Por exemplo, consideremos a suposição de Descartes de que o comportamento involuntário era como uma máquina.) Então, começamos a perturbar um pouco a natureza, isto é, a fazer experimentos e, assim, mudar o curso natural dos eventos de modo que possamos obter uma idéia melhor do que pode acontecer com um fenômeno particular.

Mas mesmo para fazer um primeiro experimento exploratório, necessitamos, geralmente, definir nosso fenômeno de um modo mais preciso, bem como decidir sobre o que alterar e onde procurar pelos efeitos de nossa alteração experimental. Os resultados do nosso primeiro experimento permitir-nos-ão definir nossos termos ainda mais precisamente. Deste modo, modificamos continuamente os nossos conceitos. Ao mesmo tempo, enriquecemo-los, relacionando-os a outras coisas que são conhecidas. Além disso, tendo refinado nossos conceitos na base de experimentos, somos levados a novos experimentos. Diz-se, às vezes, que um bom experimento responde uma velha questão e levanta duas novas. Não há um ponto final para esse processo (o qual é a ciência) uma vez que estamos continuamente refinando e redefinindo os nossos conceitos e continuamente relacionando uns aos outros.

2.2 - LEIS DO REFLEXO PRIMÁRIOA ordem ou regularidade ilustrada pela Fig. 2-1 está ao nível de uma das unidades

mais simples do comportamento, o reflexo. Devido ao fato de que esta regularidade envolve o comportamento dos organismos como a propriedade que é sujeita a, ou sensível a mudanças no estímulo eliciador, chamamos essas leis de leis do comportamento.

Os cientistas tentam formular suas leis de um modo tão geral quanto possível. Não estariam satisfeitos em ter uma lei para o efeito de choques elétricos' sobre o músculo da perna, outra para os efeitos de ácidos na boca sobre a salivação e ainda outra para o reflexo pupilar. Eles preferem expressar suas leis em termos de certas propriedades comuns a todas essas relações, de modo que possam abranger uma faixa de fenômenos tão ampla quanto possível. Assim, quando Sherrington estudou os reflexos, ele fez um estudo de muitos reflexos envolvendo eliciadores e respondentes diferentes. A partir de experimentos deste tipo, ele formulou três leis que podemos chamar as três leis

- 3 9 -

primárias do reflexo. Essas leis não são deformuladas em termos de qualquer eliciador particular como o choque elétrico, ou de qualquer respondente particular como um determinado movimento muscular. Elas são, ao invés disso, formuladas genericamente em termos de estímulos eliciadores (qualquer eliciador) e respostas (qualquer respondente). Formulando-as assim, obtemos uma generalidade adequada, mas com sacrifícios de detalhes particulares. Por exemplo, a relação exata entre a intensidade do estímulo e a magnitude do respondente varia de reflexo para reflexo. Algumas vezes, a relação é quase diretamente proporcional, de modo que numa ampla faixa de intensidade de estímulos, dobrando-se a intensidade do estímulo, a magnitude do respondente será dobrada, e assim por diante. Em outros reflexos, um aumento de dez vezes na intensidade do estímulo seria necessário para produzir o dobro da magnitude do respondente. Nossas leis do reflexo primário são expressas de tal forma que essas diferenças ficam encobertas.

Os eliciadores sempre podem ser especificados por uma dimensão de intensidade. E n tão , eliciadores do tipo do choque podem ser fracos, moderados, ou de maior intensidade. Eliciadores do tipo da luz para respostas pupilares podem variar de intensidades tão fracas, que mal podemos ver, a intensidades tão altas que a luz torna-se dolorosa. Como notamos, energias abaixo de um certo nível na dimensão da intensidade são insuficientes para eliciar qualquer resposta. À medida que a intensidade é gradativamente aumentada, encontramos uma região em torno da qual valores da intensidade podem ou não eliciar um movimento. Essa região de indeterminação onde a intensidade pode ou não ser o bastante forte para eliciar um respondente é a região de penumbra do limiar. Podemos formular essa informação mais especificamente numa lei:

1. Lei do limiar. Existe uma faixa de intensidade abaixo da qual nenhuma resposta ocorrerá e acima da qual uma resposta sempre ocorrerá. Dentro dessa faixa as respostas ocorrerão com alguma incerteza. Um ponto arbitrário, nessa região de incerteza (digamos, aquela intensidade que elicia a resposta 50 por cento das vezes) é chamado de limiar, intensidade acima desse ponto são chamados estímulos eliciadores.

À medida que a intensidade do estímulo é aumentada a resposta ocorre sempre e é graduada em relação ao estímulo. Então, eliciadores fortes eliciam rapidamente respondentes fortes e de longa duração. Eliciadores fracos são seguidos mais lentamente por respostas fracas e de curta duração. A maior parte dessa informação pode ser representada por duas leis do reflexo:

2. Lei da Intensidade-Magnitude. A medida que a intensidade de um estímulo eliciador é aumentada, a magnitude do respondente eliciado também aumenta.3. Lei da latência. À medida que a intensidade do estímulo eliciador é aumentada, o tempo (latência) entre o aparecimento do estímulo eliciador e o aparecimento do respondente diminui.

As leis do reflexo são importantes para definir o conceito de reflexo. Pode-se dizer que um reflexo é uma correlação entre uma mudança em parte do ambiente e umapropriedade comportamental, tal que as três leis muito especiais que descrevemos acima sejam válidas. Esquematicainente, um reflexo pode ser representado assim

S2 — R-2

- 40 -

onde S2 representa um eliciador, —> representa “causa pelas leis do reflexo” e R2 representa a mudança comportamental produzida. Nessa fórmula vazia nada é dito sobre como R2 depende de S2 . Tal fórmula pode ser considerada extremamente geral (ela descreve toda ação reflexa) e muito pouco precisa (ela nâo especifica os detalhes de qualquer ação reflexa particular). A seta — > pode ser lida elicia, onde elicia é definido como 'conduz à, pelas leis do reflexo” . O termo elicia é de alguma importância na ciência do comportamento porque denota um grupo muito específico de leis causais entre ambiente e comportamento, isto é, as leis do reflexo. Então, S2 pode ser dito um estímulo eliciador, uma mudança no ambiente que está correlacionada com o comportamento através das leis do reflexo. Similarmente, R2 *o respondente, é definido como uma resposta eliciada. E útil reservar a palavra eliciar para a definição precisa formulada acima. Nos capítulos subseqüentes empregaremos o termo estímulo repetidamente em conjunção com um tipo diferente de controle sobre o comportamento. Mas distingui- remos tal controle pela omissão cuidadosa do qualificador "eliciar" naquele contexto.

2.3 - LEIS SECUNDÁRIAS DO REFLEXO

Certas leis, chamadas leis secundárias do reflexo, codificam uma informação adicional. Uma delas é a lei da fadiga do reflexo. Quando um respondente é repetidamente eliciado muitas vezes por segundo, por uma intensidade de estímulo constante, a magnitude do respondente declina gradualmente, e eventualmente a resposta pode cessar de todo. Esse fenômeno é chamado façiiga do reflexo e é visto esquematicamente na Fig. 2- 2 .

Pf Ílílririnnnnnri--- ----------- ------------------

s 2 n n n n n n n n n n n n n n n n n n n r i n . n - - - - F ig u ra 2-2. Fadiga do R enexo.

Tem po__1------1------1------1------1------1------1------1------1------

Um erro comum é cometido ao se dizer que o declínio do respondente a zero é devido à fadiga. Isto é um exemplo de uma explicação inteiramente vazia e deveria ser evitado. Um fenômeno, (y), é parcialmente explicado quando pode ser relacionado a outro fenômeno, (x), que ocorre anteriormente no tempo. A chuva, (y), é parcialmente explicada quando pode ser relacionada à condensação de vapor de água que ocorre quando uma nuvem quente é rapidamente esfriada, (x). A febre tifóide, (y), é parcialmente explicada quando pode ser relacionada às atividades, (x), de um pequeno microorganismo, a Salmonella typhosa. Mas para explicar que o declínio do respondente, (y) da Fig. 2-2, é devido à fadiga, a que (x) o estamos relacionando? A fadiga, usada neste sentido, é uma entidade não observável - sem qualquer propriedade independente a ser relacionada ao fenômeno observável. Esse declínio do respondente é a fadiga, e não devido à fadiga.

Outra lei secundária do reflexo é a lei da Somação Temporal de Subliminares. Lembremo-nos de que na Lei do Limiar, apresentações muito fracas de energias apropria

- 4 1 -

das não eliciam respondentes. Diz-se que esses valores baixos de energia estão abaixo do limiar, e são chamados subliminares. Todavia, se apresentarmos dois ou mais desses subliminares em sucessão rápida podemos, sob certas condições, produzir um respondente. Esse fenômeno é visto esquematicamente na Fig. 2-3. É como se as duas intensidades subliminares se somassem para formar um único eliciador. A somação temporal, vista na Fig. 2-3, define exatamente o que queremos dizer por esses conceitos que chamamos de reflexos, estímulos eliciadores e respostas eliciadas.

Figura 2-3. Somação Temporal. -----* ------------ m --------------------- -------------------

Tempo ------1------1____i____i------1------1____i----- j------1------

Podemos notar em relação a isto que a palavra eliciar é frequentemente tomada sem crítica, como sendo idêntica a “causar”. (Por exemplo um estímulo luminoso pode ser dito “causa”, de um comportamento pupilar.) O termo “causa” é uma palavra antiga usada, às vezes, na história da filosifia e da ciência para denotar uma relação necessária e suficiente entre eventos. A palavra parece ter sido empregada para descrever um evento X, sempre que X se relaciona a um evento Y, de tal forma que se há o evento X entáo o evento Y ocorrerá; e se não Yf então não X. Tente essa fórmula. Faça de Y um respondente, digamos uma contração muscular, “causada” por um estímulo-choque que chamamos X. Logicamente, é certo que: se o choque, então a contração. É também certo que, se não observarmos a contração (não Y), então não terá havido um dado estímulo, o choque (não X). É, então, evidente que, logicamente, um estímulo eliciador pode ser dito “causar” uma resposta na ação reflexa, mas é também claro que essa proposição oferece pouca informação sobre a natureza exata da relação causai. Em geral necessitaremos de uma descrição mais detalhada da relação entre o comportamento e suas causas do que é possível por uma mera proposição da sua sucessão lógica na fórmula X e Y. Logo, o termo eliciar é preferível ao termo “causar” no presente contexto — não porque seja algo mais objetivo ou lógico que a palavra “causar” — mas porque “eliciar” contém uma grande proporção de todas as leis primárias e secundárias do reflexo. Evidentemente, quando chutamos uma bola “causamos” sua “resposta” de viajar no ar. Mas as leis que governam essa “resposta” são as leis do movimento, de Galileu enão as leis do reflexo, de Sherrington.

2.4 - FORÇA DO REFLEXO: UM CONSTRUCTO HIPOTÉTICO

Consideremos uir. dado reflexo, digamos, flexionar o joelho a uma pancada no mesmo. Em qualquer momento, esse reflexo terá um certo limiar, indicado pela menor intensidade da pancada necessária para eliciar algum movimento da perna. Além disso, em qualquer momento, uma pancada com uma intensidade fixa eliciará um movimento de uma determinada magnitude, com uma dada laténcia entre S2 e R2 . E ainda, no mesmo momento podemos conceber que um dado número de pancadas será necessário

- 4 2 -

para fatigar o reflexo. Uma característica importante dos reflexos é encontrada na od- servação de que, nos momentos em que o limiar é baixp (uma pancada muito fraca é efetiva) a magnitude de R.2 para um dado valor de S2 (padrão) será alta, a latência será curta e o número de S2 sucessivos necessários para fatigar o reflexo será grande. Ao contrário, naqueles momentos em que o limiar é alto (uma pancada forte é necessária para qualquer movimento), a magnitude de R2 para um valor padrão de S2 será baixa, a latência será longa e apenas poucos S2 sucessivos serão necessários para fatigar o reflexo. Essa associação sistemática ou co-variância das propriedades do reflexo (limiar, magnitude, latência, etc.) levaaurna interessante construção lógica. Somos levados a identificar essa co-variância e inferir que existe uma entidade hipotética que intervém entre o estírtiulo e o respondente. Deduz-se que esta entidade, a ser designada como força do reflexo, determina a variação sistemática, ou co-variância de cada propriedade do respondente. No caso do reflexo, o cons true to força do reflexo é definido por essa co-variância de tal modo que grandes magnitudes, latências curtas, limiares baixos, R2 fatigadas lentamente, etc; representam reflexos fortes. Ao contrário, pequenas magnitudes, latências longas, limiares altos, R2 rapidamente fatigadas, etc. constituem reflexos fracos. Note que o constructo não é definido exclusivamente em termos dos valores respondente. Ele incorpora (no limiar) também o valor do eliciador. Então, uma R2 de graitde magnitude não precisa necessariamente representar um reflexo forte. Ela pode bem ser o resultado de um reflexo fraco sendo testado com um S2 intenso. O construto força do reflexo é representado na Fig. 2.4.

Diz-se que o construto da Fig. 2-4 é hipotético, simplesmente porque não é diretamente observado. Ninguém viu a força de um reflexo; o que vemos são meramente as mudanças no comportamento. Mas o fato de mudanças comportamentais estarem correlacionadas umas às outras induz-nos a agrupá-las como reflexões de uma entidade única subjacente. O formar construtos como a íorça do reflexo apresenta certos riscos, particularmente ao se determinar propriedades para o construto hipotético que vão muito além das observações que lhe dão origem. Ainda assim a construção hipotética é um tipo importante e persistente de formação de conceito em todas as ciências e sua justificação encontra-se na sua utilidade. No caso particular da força do reflexo, ela entra como um conceito útil na formação de outras leis num sistema de comportamento. (Lembre-se, primeiro devemos ter nossos conceitos, então, chegar às nossas leis.) Por exemplo, drogas, doenças do sistema nervoso central e eliciação simultânea de outros reflexos todos causam mudanças concorrentes nas grandezas que definem a força do reflexo. Então, é conveniente representar essas leis correlacionadas por um único termo, força do reflexo. Veremos outros exemplos desse tipo de representação e composição de relações em capítulos seguintes.

Magnitude

Figura 2-4. O construto força do

Limiar

- 4 3 -

2.5 - EXEMPLOS COMUNS DE REFLEXOS

Às observações que são resumidas como leis do reflexo são mais facilmente feitas em músculos cirurgicamente isolados de influências outras que não aquelas do eliciador em estudo. Embora estudemos reflexos em músculos cirurgicamente preparados para obtermos precisão de controle, os reflexos são facilmente vistos em formas qualitativa no comportamento intacto de todos os animais, desde o homem às espécies mais inferiores. A ilustração de Descartes relativa ao retraimento do membro de um homem de uma chama (ver p. 1) é um reflexo humano intacto. Outros são as eliciações de lágrimas pelo sumo de cebola, espirro devido à pimenta no nariz, flexão do joelho devido a uma pancada no tendão patelar, descarga de saliva quando alimento é colocado na boca, mudança no batimento cardíaco devido a um som alto,e assim por diante. Todos esses reflexos estlo de acordo com o nosso modelo fundamental, ou paradigma,

S2 —> R2

onde algum S2 elicia algum respondente R2 ; e se o reflexo pudesse ser apropriadamente isolado, uma relação como aquela na Fig. 2-1 seria obtida. Alguns exemplos de seqüências eliciador-respondente são vistos na Tabela 2.1. Todas as correlações na Tabela 2.1 são reflexos. Alguns envolvem músculos do esqueleto (espirro, flexionar o joelho, tremores), alguns envolvem músculos cardíacos (mudanças na taxa cardíaca), outros envolvem glândulas (salivação, lágrimas) e outros envolvem músculos lisos (palidez da pele, mudanças pupil ares).

Tabela 2.1 SEQÜÊNCIA COMUM DE REFLEXOS

NOME DO REFLEXO ELICIADOR S2

PELAS LEIS DO REFLEXO CONDUZ À RESPONDRNTE R-,

LacrimalEspirrar

Patelar

Salivar

Sobressalto

Tiritar

sumo de cebola nos olhosPena no nariz,Pancada no joelhoAlimento na bôca

Barulho alto

Frio

Lacrimejar

EspirroFlexão do joelho Salivação

Taxa cardíaca aumenta, músculos do esqueleto contraem-se, pupila dilata-se, :tc.

Tremor, palidez t pele

Pupilar Luz no olho Contração pupila

- 44 -

Uma vez ou outra, esses reflexos têm sido chamados de involuntários, involuntário é um termo histórico empregado para expressar grosseiramente a natureza automática e eliciada de certos comportamentos. Desde a análise quantitativa de Sherrington sobre o reflexo, o conceito original de eliciação tem sido bastante refinado. Parece criterioso, assim, substituir.o mais velho e o mais vulgar dos termos “involuntário” pelo mais exato “eliciado” , que compreende todas as leis do reflexo em sua definição. Essa substituição eventual de um termo pobremente especificado, que, com freqüência, foi associado a um quadro pré-científico de referência, é uma ocorrência comum e típica na ciência. Por outro lado, algumas vezes, uma análise científica retem a velha palavra mas imprime-lhe um significado novo e preciso. A ciência reteve do vernáculo as palavras força em física, elemento em química e motivo em psicologia, mas tem mudado e expandido bastante os seus significados. Mas não é sempre fácil separar as conotações de conceitos pré- científicos e, algumas vezes, uma nova palavra ajuda na mudança conceituai. A velha palavra, então, será deixada de lado para morrer lentamente pelo desuso. Tal é o caso da palavra “involuntário” em psicologia.

2.6 - VARIABILIDADE NAS MEDIDAS: RESUMO DOS DADOS COM DISTRIBUIÇÕES DE FREQUÊNCIA; ESTATÍSTICA BÁSICA; A CURVA NORMAL

Um importante passo em direção à análise de qualquer fenômeno natural ocorre quando certos aspectos deste fenômeno podem ser medidos. Medidas implicam em números e os números que são registrados pelos pesquisadores sob várias condições de observação são o que chamamos de dados quantiativos brutos. Um número prodigioso de medidas ou dados são geralmente coletados no curso de um únicn experimento. Mesmo uma demonstração muito casual de uma das leis do reflexo poderia facilmente requerer até 250 medidas da magnitude do respondente. As numerosas medidas que constituem os dados brutos de um experimento são inconvenientes. Seu grande volume torna-se de difícil compreensão, mesmo para o pesquisador que as coletou. Certamente, elas dificilmente poderiam ser comunicadas em sua forma bruta a uma comunidade científica como um todo. Sob tais pressões, desenvolveram-se métodos de resumir os dados e caracterizá- los por alguns de seus aspectos proeminentes. Estas caracterizações sumárias e descritivas constituem o que chamamos estatística descritiva. No restante desta seção, consideraremos brevemente certos conceitos estatísticos simples considerados úteis pelos experimentalistas na descrição e resumo de seus dados.

Suponha que estejamos com a tarefa de determinar a magnitude do respondente patelar eliciado por uma pancada com uma força de 70,00 g aplicada no joelho. Iniciamos sentando nosso sujeito confortavelmente, colocando suas pernas numa posição padrão e aplicando, então, nossa pancada de 70,00 g num ponto determinado tão precisamente quanto possível. Prosseguimos, medindo a extensão resultante da flexão do joelho, anotando a altura máxima (excursão) que a perna alcança, digamos o ponto que o tornozelo atinge antes de voltar à posição original. Suponha que nossa medida da extensão da perna seja feita com uma régua comum e que observamos, neste caso, que a perna percorreu uma distância de 4,25 cm. Neste ponto, podemos ser inclinados a dizer que a magnitude do flexionar o joelho para um eliciador de 70,00 g de força e 4,25 cm.

A ciência, geralmente, nunca se contenta com observações não replicáveis e, desta forma, somos levados a repetir nossas operações simples. Podemos, então, voltar a eliciar o reflexo e medir novamente a magnitude do respondente por várias vezes, anotando

- 4 5 -

cada vez o resultado numénco das nossas operações de medida. Embora tenhamos siao cuidadosos em bater no mesmo ponto cada vez, em chegar a posição original da perna e em dar ao sujeito um descanso breve entre as pancadas, observamos contudo, que a magnitude do respondente é 4,25 cm numa tentativa, 4,12 cm em outra, e 431 numa terceira. Ficamos um tanto perdidos em relação a qual medida particular devemos relatar como sendo o valor verdadeiro da magnitude do respondente a uma pancada de 70,00 g. O que foi iniciado como uma simples tarefa tomou-se mais complicado do que supúnhamos originalmente.

Suponha agora que decidamos fazer algum tipo de média de nossas medidas e chamar essa média a magnitude do respondente a uma pancada de 70,00 g. Somamos nossos valores

4,254,124,3112,68

e, então, para dar a cada medida uma representação igual na média, dividimos pelo número de medidas que temos, neste caso, 3. Obtemos o seguinte número 4.2266... uma vez que não era possível originalmente ler nossa régua mais do que 0,10 arredondamos nossa resposta para duas casas decimais, relatando a magnitude da flexão do joelho como 4,23 centímetros.

Mas considere agora o que realmente foi feito através de uma coisa simples como tirar a m édia das m edidas. Com que base é-nos permitido somar os nossos valores e dividir pelo número de medidas e chamar isso o valor ‘ verdadeiro”? Descobriremos que a questão não é facilmente respondida. Porque não escolhemos, por exemplo, o resultado intermediário entre todas as medidas como o "verdadeiro", neste caso 4,25 ?

Uma dificuldade ainda mais importante apresenta-se quando tentamos medir novamente a flexão do joelho no dia seguinte e descobrimos que, embora nossas medidas sejam novamente próximas umas das outras (digamos, 4,00, 4,25, 4,19), elas não são exatamente os mesmos valores que os do dia anterior. Que números tomaremos agora como o valor verdadeiro do respondente para 70,00 g? . Não somente os erros de medida presentes, mas condições não controladas tais como temperatura, umidade e o quanto nosso sujeito dormiu na noite anterior podem estar afetando nossas medidas. Não é provável que possamos sempre controlar completamente todas as influências que têm um efeito perturbador em nossas medidas. Somos forçados, por fim,a concluir que o valor “verdadeiro” do respondente é apenas fictício e que não existe nenhuma operação para descobrí-lo.

Na prática, naturalmente, a situação não é tão ruim quanto a tornamos aqui. De fato, nossas medidas são todas razoavelmente próximas uma das outras e frequentemente podemos computar apenas tal média, ou média aritmética. Uma vez tendo essa média aritmética computada, podemos tomá-la como nossa melhor estimativa da magnitude do respondente e considerar como irreal nossa procura de um e somente um valor verdadeiro.

A média ou média aritmética é um dos conceitos mais primitivos da estatística embora comum em todas as ciências. Este conceito torna possível a abstração de um valor, a partir de um número de medidas repetidas, o qual é tomado para representar todo o grupo de medidas. Então, podemos medir várias vezes o ponto de ebulição do

- 4 6 -

álcool etílico e concluir que o ponto médio de ebulição é igual a 78°C. Ou, podemos observar, durante uma hora, a freqüência de carros que atravessam uma ponte em intervalos de 5 minutos sucessivos e concluir que a taxa média é igual a 31 carros por 5 min. Justificamos esta média apelando para certas propriedades gerais das medidas que examinaremos agora.

A justificativa para o uso de uma média é melhor observada olhando-se de perto algumas propriedades das medidas repetidas de R2- Suponha que obtivemos 20 valores para a magnitude de R2 , em centímetros, que são registrados na Tabela 2-2.

Tabela 2-2

MAGNITUDE DE RESPONDENTES DE FLEXIONAR O JOELHO, EM CENTÍMETROS, EM 20 APLICAÇÕES SUCESSIVAS DE UMA PANCADA NO JOELHO

TENTATIVA EXCURSÃO R2 EM CENTlkETROS

1 4,252 4,123 4,314 4,005 4,256 4,197 3,968 4,059 4,12

10 4; 1911 3,8812 4,2513 4,1914 4,1915 4,1216 4,0517 4,3118 4,4419 4,2020 3,92

Desejamos agora apresentar ou representar esses dados brutos numa forma que revelará algumas de suas propriedades, à primeira vista. Para esse objetivo, a primeira manipulação que frequentemente se mostra útil é agrupar as medidas em classes mais amplas do que aquelas nas quais são originalmente dadas. Suponha que agrupemos os resultados da Tabela 2-2 em categorias de décimos de centímetro. Então, poderíamos estabelecer o grupo de categorias mostrado no lado esquerdo da Tabela 2-3. Essas categorias têm uma faixa de um décimo de centímetro. Na Tabela 2-3 os números das tentativas em que o respondente ocorreu numa dada categoria são colocados na coluna do lado direito.

- 4 7 -

A Tabela 2-3 reduz nossos dados a 7 categorias de 3,80 a 4,49. As 20 medidas individuais iniciais foram reduzidas a 7 categorias de medidas. Perdemos alguma precisão (4,00 não pode mais ser distinguido de 4,05 na Tabela 2-3), mas ganhamos alguma economia na representação. O ganho não é grande com apenas 20 medidas originais, mas seria muito grande se tivéssemos começado com 20.000.

Tabela 2-3

REAGRUPAMENTO DAS MEDIDAS DA TABELA 2-2 EM CATEGORIAS MAIS AMPLAS

(1/10 cm)

CATEGORIA TENTATIVAS NAS QUAIS O RESPONDENTE CAI NUMA CATEGORIA PARTICULAR

3,50 -3 ,5 93,60 -3 ,693,70 -3 ,7 9 113,80 -3 ,8 9 7,203,90 -3 ,9 9 4 ,8 ,1 64,00 -4 ,0 9 2,6,9,10,13,14,154,10 -4 ,1 9 1,5,12,194,20 -4 ,2 9 3,17430 - 4 3 9 184,40 -4 ,4 94,50 -4 ,5 94,60 -4 ,6 9

Um outro sumário útil poderia ser feito se nossos dados fossem mostrados graficamente. Um número de esquemas visuais tem sido sugerido como auxilio na representação de dados do tipo que temos aqui. Consideremos uma classe deles. É possível, em primeiro lugar, espaçar regularmente os vários valores de nossos grupos de medidas numa linha horizontal, chamada o eixo do x ou abscissa. Segundo, podemos colocar uma linha vertical que intercepta a abscissa (chamada o eixo do V, ou ordenada) para representar o número ou freqüência de medidas. Dessa maneira, se colocamos um x para cada uma de nossas medidas em tal referência (chamada um sistema de coordenada Cartesiana ou retangular) obteremos a representação pictorial da distribuição dos valores vista na Fig. 2-5.

Alguns aspectos da Fig. 2-5 são de interesse particular. Primeiro, notamos que existem exatamente 20 X. Então, cada medida aparece como um único X na Fig. 2-5 e o número total de X é o número de medidas tomadas.

Um segundo aspecto da Fig. 2-5 é a sua forma. Parece avolumar-se em volta de um valor central e ser grosseiramente simétrica. Essa característica de muitas medidas repetidas justifica o uso de um único valor médio para resumir todo o grupo de medidas. Atrás desse valor “médio” , tacitamente se esconde uma figura mais ou menos como a Fig. 2-5. Diz-se que o número que indica o valor prevalente de uma distribuição de freqüência, tal como a Fig. 2-5, representa um índice da chamada tendência central da distribuição. Mas podemos notar que existem várias possibilidades de escolha para índices

- 4 8 -

de tendência central. Dessas, uma simples seria escolher a categoria contendo maior freqüência (maior número de X). Quando se escolhe o valor da tendência central dessa

Figura 2-5. Medidas hipotéticas da flexão do joelho (categorizadas em décimos de centímetro) representadas como uma distribuição de freqüência num sistema de coordenadas retangulares.

TJItít.oonVc

10

Ordenada

rModa

XXXX X

XXX X X X X X

X X X X X X X .1.0 2.0

Magnitude da flexão do joelho (centímetros)

- Abscissa

maneira diz-se que se encontra a moda da distribuição. No presente caso, a moda é a categoria 4,10 — 4,19, porque contém 7 medidas, número este maior do que qualquer outra categoria (ver Fig. 2-5). Um segundo tipo de índice de tendência central é obtido, isolando-se a categoria de medida particular que tem o mesmo número de medidas abaixo e acima dela. Tal estatística de tendência central é chamada o valor mediano da distribuição. A categoria mediana dos dados presentes está na categoria 4,10 — 4,19, porque pode ser encontrado um valor nesta categoria que seria maior do que os 10 valores inferiores e menor do que os 10 superiores.

O terceiro tipo, conhecido como média, é o que calculamos previamente somando as medidas e dividindo pelo número total de medidas. No caso presente, esse índice, ou média aritmética, é cerca de 4,15.

Qual desses três “índices” representa o mais próximo da magnitude real do respondente? Nenhuma resposta geral é possível para esta questão porque “a magnitude real do respondente” é uma quantidade fictícia. A única maneira disponível para se avaliar a magnitude do respondente é obter-se medidas repetidas dele sob condições tãoconstantes quanto possíveis.

Essas medidas seriam como aquelas representadas pela Fig. 2-5. Se precisássemos deum único número para resumi-las, o melhor que poderíamos fazer seria calcular um ou mais índices de tendência central. No caso presente, a forma simétrica nos assegura que qualquer desses três índices concordará aproximadamente, mas, em algumas distribuições contendo umas poucas medidas muito distantes da moda (tal como na distribuição de rendas nos Estados Unidos onde poucas pessoas são muito ricas mas a maioria do povo está agrupada em torno de um ponto central), a média aritmética é deslocada em direção às poucas enquanto a mediana é menos afetada e a moda não é perturbada.

A distribuição da Fig. 2-5 é convenientemente representada por (A) ou(B)daFig. 2-6. Em (A) os X foram substituídos por barras cujas alturas são proporcionais à frequência real, f. A parte (A) é chamada um histograma e será empregada com freqüência na descrição de dados comportamentais nos capítulos subseqüentes. Em(B), os X foram substituídos por linhas retas conectando a altura de cada categoria. A parte (B) é chamada um polígono de freqüência. Ambas as respresentações vistas na Fig. 2-6 são apenas maneiras alternativas de representar distribuições de frequência.

Em todas as distribuições de freqüência, os índices de tendência central assumem grande importância.

- 4 9 -

3,50 4 ,50Magnitude da flexão do joelho

(centímetros)Figura 2-6. Mais duas representações de distribuições de freqüência (A) como histogram a e (B) como polígono de freqüência. Os dados são derivados da Figura 2-5.

Magnitude da flexão do joelho (centímetros)

(B) Polígono de Freqüência

Mas outra propriedade importante das distribuições de frequência é o espalhamento das medidas, tecnicamente chamado sua dispersão. Consideremos as duas distribuições de magnitude do respondente da Fig. 2-7. tomadas, digamos, de dois sujeitos diferentes. Ambas as distribuições têm medidas de tendência central idênticas (médias, medianas e modas). Mesmo assim, elas diferem de maneira tão óbvia que seria interessante ter-se um índice sumário para caracterizar esse tipo de diferença. Notemos, antes de tudo, que a diferença entre as duas curvas da Fig. 2-7 é grosseiramente a de "espalhamento”. Mas, logicamente, o espalhamento de uma distribuição está relacionada com a variabilidade das medidas que contém. Quanto mais variáveis nossas medidas e mais elas diferirem umas das outras, maior será o espalhamento. Uma estatística simpes, embora grosseira, para resumir o espalhamento ou dispersão de medidas

Figura 2-7. Distribuições de duas freqüências com tendências centrais idênticas e dispersões diferentes.

Magnitude de R2

pode ser calculada, descobrindo-se a maior (em nossos dados originais do reflexo 4,44) e subtraindo desta o menor escore obtido, 3,88. Com tais dados à mão, a operação resulta num valor 4,44 — 3,88 = 0, 56. Tal estatística é chamada amplitude da distribuição. A amplitude é fácil de ser calculada, mas não é tão útil como desejaríamos. Sua dificuldade é que uma única medida muito extrema muda-a drasticamente. Por essa razão, preferimos dizer que a amplitude é uma estatística que não tem estabilidade.

Outra medida mais sofisticada da dispersão de uma distribuição é possível, aproximando-se, em primeiro lugar, os dados resumidos pelas Figs. 2-5 e 2-6 com o tipo de curvas matematicamente suaves, em forma de sino, vistas na Fig. 2-7. Essas curvas suaves são simétricas e são chamadas curvas normais. O estudante curioso pode muito bem estar interessado em saber como essas curvas suaves da Fig. 2-7 foram descobertas, mas infelizmente sua derivação matemática não pode ser tratada aqui. Devemos nos contentar em dizer que elas parecem aproximar, razoavelmente bem, muitos tipos de medidas repetidas, das quais nossa magnitude do respondente é uma. Um índice adequado para a dispersão ou variabilidade pode ser encontrado através do exame acurado da forma das duas curvas da Fig. 2-7. Se iniciamos no extremo mais à esquerda de cada curva, devemos observar que, inicialmente, a curva é côncava crescente. Então, para ambas as distribuições, a curva passa através de uma região em que é quase uma linha reta. Finalmente, continuando em direção à direita, as curvas adquirem uma forma côncava decrescente, alcançando eventualmente, um máximo no ponto rotulado de média. Já que essas curvas normais são simétricas, uma análise correspondente pode ser feita iniciando-se na extremidade direita e movendo-se para a esquerda. Os dois pontos simétricos em que as curvas mudam de concavidade crescente para concavidade decrescente são chamados os pontos de inflexão e estão localizados nas setas horizontais na Fig. 2-7. Esses pontos localizados tomam-se bons marcos para caracterizar a dispersão das distribuições (compare a distância entre os dois grupos de setas da Fig. 2-7 colocados nesses pontos). E, embora sejam difícies para um julgamento a òlho nú, não é difícil calculá-los a partir de medidas reais.

Deveria ser notado que os pontos de inflexão estão relacionados à média da distribuição, tal que quanto maior dispersão de uma curva normal, tanto mais distante da média estão esses pontos. Em outras palavras, quanto maior a dispersão, mais os pontos de inflexão serão desviados da média. Essa idéia de desvio está incluída no nome usualmente dado aos pontos de inflexão da curva normal, os pontos de desvio padrão. O desvio padrão (abreviado 0 , ou sigma) é a distância da média a qualquer um dos pontos de inflexão. A grande vantagem desses pontos como índices de dispersão da distribuição sobre outras medidas (por exemplo a amplitude) é que eles dividem a distribuição normal de uma maneira extremamente útil, como é visto na Fig. 2-8. Em particular, o resultado é que para dados que podem ser aproximados por uma curva normal, cerca de 34 por cento das medidas cairão na região entre — 1 O e a média; e cerca de 34 por cento cairão na região + 1 O e a média. Assim, cerca, de 68 por cento das medidas estarão contidas dentro da média de 1 10. Similarmente, cerca de 95 por cento estarão contidas dentro de í_ 2 Qe acima de 99 por cento dentro de± 3Q. Então, existe uma relação bastante exata entre o desvio padrão e a percentagem de medidas a serem encontradas nas diferentes regiões da curva, um fato não verdadeiro para a amplitude ou outras medidas comuns de variabilidade. Métodos de computação para estimar qualquer grupo de medidas são encontrados em numerosos textos elementares de estatísticas e não serão descritos aqui.

- 51 -

Figura 2-8. Curva normal dividida por seu desvio padrão, mostrando a porcentagem de medidas contidas em cada região.

Transformações para distribuições de freqüência relativa. Uma transformação muito útil e simples é frequentemente feita nas medidas originais quando se lida com distribuições. Em vez de se fazer diretamente gráficos do número real de eventos numa dada categoria, frequentemente divide-se o número observado numa dada categoria pelo número total de medidas que se tem. O resultado dessa operação é sempre um número menor do que ou igual a 1, que é chamado a freqüência relativa desta categoria. Por exemplo, com referência à Tabela 2-3, podemos dividir o número total de medidas na categoria 4,20 - 4,29 (4) pelo número total de medidas (20) e obteremos 4/20 - 0,2, a freqüência relativa nessa categoria particular. Uma maneira útil de pensar sobre a freqüência relativa é considerá-la como a proporção das medidas totais que ocorrem numa dada categoçia. Se multiplicarmos este número por 100, obtemos a percentagem de todas as medidas que caem na categoria particular. Um grupo de tais percentagens, ou freqüências relativas, fornece-nos uma maneira conveniente para comparar duas distribuições quando o número total de medidas em cada uma não é necessariamente o mesmo. Note que a curva da distribuição de freqiência relativa ou de distribuição de percentagem tem o mesmo modelo, ou forma, que a curva de distribuição das freqüências reais observadas da qual ela foi derivada.

EXERCÍCIO 1: Transforme a distribuição da Fig. 2-5 numa distribuição de freqüênciarelativa.

- 5 2 -

C apítulo 3 - CONDICIONAMENTO PAVLOVIANO

Por volta de 1903, PAVLOV, fisiologista russo, interessou-se pelo fenômeno que primeiro chamou de “secreções psíquicas’.. Pavlov descreve o ponto de partida de suas pesquisas na seguinte citação:

“Se alimento ou alguma substância rejeitável é colocada na boca, uma secreção de saliva é produzida. O objetivo dessa secreção é, no caso de alimento, alterá-lo quimicamente, e no caso de uma substância rejeitável, diluí-la e removê-la da boca. Este é um exemplo de um reflexo que ocorre devido às propriedades físicas e químicas de uma substância quando ela entra em contato com a membrana mucosa da boca e língua. Mas, além disto, uma secreção reflexa semelhante é evocada quando essas substâncias são colocadas a uma distância do cão e os órgãos receptores afetados são apenas aqueles do olfato e da visão. Mesmo o recipiente no qual o alimento é dadoé suficiente para evocar um reflexo alimentar completo em todos os seus detalhes; e, além disto, a secreção pode ser provocada mesmo pela visão da pessoa que trouxe o recipiente, ou pelo ruído de seus passos” . (Pavlov, 1927, p. 13).

Desde o início, estava claro para Pavlov que algum tipo de associação entre o reflexo salivar S2 —> R2 e eventos arbitrários como vasilhas de alimento e ruído de passos era responsável pela capacidade destes evocarem “secreções psíquicas” . A primeira e mais importante contribuição de Pavlov para a ciência do comportamento foi sua descrição e elaboração das condições necessárias e suficientes para essa associação. Através de um estudo sistemático do respondente salivar de cães, Pavlov descobriu que, se qualquer mudança ambiental arbitrária (digamos. S j) precedia direta e exatamente o reflexo eliciador de salivação, S] poderia por si só vir a produzir a salivação.

3 1 - REFLEXOS CONDICIONADOS E A NATUREZA DE UM EXPERIMENTO

Examinaremos com detalhes um experimento realizado por um dos discípulos de Pavlov (Anrep, 1920) como exemplo do método Pavloviano e os resultados que levaram a essa conclusão importante. A Fig. 3-1 mostra a situação experimental empregada por Pavlov e seus colegas no Instituto de Medicina Experimental em Petrogrado (hoje Lenin- grado). Ele é bem descrito por Keller e Shoenfeld:

- 5 3 -

Figura 3-1. Representação de uma situação Pavloviana para condicionar a resposta salivar num cão (Paviov, 1928).

“Em primeiro lugar, familiariza-se um cão normal com a situação experimental até que não apresente nenhum distúrbio quando colocado em arreios e deixado sozinho numa sala especialmente construída para eliminar estímulos indesejáveis externos. Uma pequena abertura ou fistula é feita na pele da mandíbula, perto do conduto de uma das glândulas salivares. Quando a fistula cicatriza, um tubo de vidro é cuidadosamente cimentado externamente na fistula de modo a drenar a saliva sempre que a glândula for ativada. Do funil, a saliva então flui para um vidro ou cai, gota a gota, numa plataforma de registro levemente equilibrada. A magnitude das respostas aos vários estímulos pode ser medida pelo volume total ou número de gotas secretadas numá dada unidade de tempo. O experimentador, que fica sentado numa sala adjacente, pode fazer suas medidas, aplicar os estímulos desejados (incluindo alimento) e observar o comportamento do cão através de uma janela” (Keller e Schoenfeld, 1950, pp. 16-17).

O experimentador tem, então, condições para medir precisamente o reflexo salivar. É também capaz de controlar cuidadosamente a apresentação de vários eventos estímulo para o organismo.

Num experimento realizado por Anrep (1920), um tom soava na sala do animal por 5 seg. Dois ou três seg mais tarde um pouco de alimento era dado ao cão. Esse empare- Ihamento de tom com alimento foi repetido depois de intervalos que variavam de 5 a 35 min. A fim de observar o efeito de um tom sozinho, o experimentador ocasionalmente, apresentava-o por 30 seg. desemparelhado do alimento. No curso de 16 dias, foram feitas50 associações alimento-tom e 6 testes do tom. Os principais dados do experimento de Anrep foram obtidos durante os 6 testes apenas com o tom. Durante esses testes, ele mediu cuidadosamente o total de gotas de saliva e o tempo entre o aparecimento do tom de 30 seg. e a primeira gota de saliva. A Tabela 3-1 apresenta os dados.

- 54 -

Tahela 3-1

AQUISIÇÃO DE UM RESPONDENTE SALIVAR A UM TOM (DADOS DE ANREP, 1920)

NÚMERO DE EMPARELHAMENTOS

TEMPO DECORRIDO ENTRE O APARECIMENTO

DO TOM E A GOTAS DE SALIVAÇÃO SUBSEQUENTE

PRÉVIOS DE ALIMENTO-TOM SALIVA (SEGUNDOS)

X Y Z

1 010 6 1820 20 930 60 240 62 150 59 2

Vê-se na Tabela que, depois de um emparelhamento alimento-tom, a apresentação do tom sozinho não produziu salivação. Depois de 10 emparelhamentos, todavia, 6 gotas apareceram no teste com o tom sozinho, e a primeira dessas 6 gotas apareceu 18 segundos depois do aparecimento do tom do teste. Depois de 20 de tais emparelhamentos, 20 gotas foram produzidas e a primeira gota demorou só 9 seg. para aparecer. De 30 emparelhamentos em diante, aproximadamente 60 gotas de saliva foram obtidas para cada teste e, então, elas começaram a aparecer um ou dois segundos depois do aparecimento do tom do teste. Os resultados do experimento são claros. A salivação ocorre exatamente a um tom selecionado, arbitrariamente, depois que este é emparelhado 30 vezes com alimento.

O processo pelo qual um tom adquire a capacidade de produzir uma resposta salivar por si mesmo, à medida que os emparelhamentos com alimento aumentam, é chamado “condicionamento”. Pavlov viu uma semelhança próxima entre essa nova correlação de tom com salivação e a ação reflexa comum e foi levado, assim, a chamar essa nova correlação de reflexo condicional (pobremente traduzido como um “reflexo condicionado”). Vemos nas palavras seguintes porque ele fez isto:

“Denominei esses novos reflexos, reflexos c o n d ic i o n a d o s , para distinguí-los dos inatos ou reflexos incondicionados. O emprego do termo ‘condicionado’cada vez mais torna-se generalizado e penso que seu uso é totalmente justificado. Isto porque, comparado com os reflexos inatos, esses novos reflexos realmente dependem- de muitas condições, (ital. adicionados) tanto sua formação como na manutenção de sua atividade fisiológica. Naturalmente, os termos ‘condicionado’ e ‘incondicionado’ poderiam ser substituídos por outros de igual mérito. Então, por exemplo, podemos conservar o termo ‘reflexos inatos’ e chamar o novo tipo de ‘reflexos adquiridos’; ou

- 5 5 -

chamar os primeiros de ‘reflexos da espécie", uma vez que são característicos das espécies e os últimos de ‘reflexos do indivíduo’, já que eles variam de animal para animal numa mesma espécie, e no mesmo animal variam em ocasiões diferentes e sob diferentes condições” (Pavlov, 1927, p. 25).

3.2 - O PARADIGMA PAVLOVIANO: UM MÉTODO ESQUEMÁTICO DE REPRESENTAR O CONDICIONAMENTO.

O princípio do reflexo condicionado é convenientemente resumido por um modelo simples de estímulo-resposta, ou paradigma. Os elementos do paradigma são os dois reflexos iniciais e um novo “reflexo” condicionado desenvolvido.

Representemos os reflexos nos quais o condicionamento está baseado comoSi — -> Ri e S2 — > R2- No procedimento de Pavlov, Si precede S2 . Se ignorarmos 0 respondente a S i , esse emparelhamento pode ser representado como

Si

S2 -> R2

De acordo com o princípio de Pavlov, depois de um número de emparelhamentos (S1)S2;S 1,S 2;S 1,S 2 ;...) Sj passa a evocar uma nova resposta, a resposta condicionada (CR) no diagrama f 3 .11 *

CR [3-11

O diagrama [3.1] é conhecido como o paradigma pavloviano, e representa esquematicamente o procedimento e os resultados do condicionamento pavloviano ou dàssíco

O Diagrama [3:11 dá uma descrição esquemática ou simbólica de certos aspectos do paradigma, mas podemos desejar uma especificação mais completa. Como um guia útil para resumir o paradigma pavloviano, assim como muitos outros paradigmas comportamentais que serão descritos em capítulos subsequentes, introduziremos uma representação estrutural, de quatro partes, de tais paradigmas. Em geral, todo paradigma coinportamental consistirá de um Dado, um Procedimento, um Processo e um Resultado. Neste quadro de referência, o paradigma pavloviano funciona como se segue:

DADOS: dois eliciadores S\ e S2PROCEDIMENTO: emparelhamento repetido de S\ com S2 , sempre na ordem S1 ,

$2>^1’^25 • •■PROCESSO: S\ passa gradualmente a controlar a nova resposta (CR), que pode se

assemelhar à R2 de S2 .RESULTADO: Si elicia seguramente uma CR.

- 5 6 -

Note certas características de tal paradigma. O Dado frequentemente contém umo descrição do estado comportamental anterior ao Procedimento. Aqui,é necessário ter-se dois eliciadores, ou dois reflexos intactos, antes que se possa começar. O Procedimento é uma descrição suscinta do que os experimentadores fazem. (Notaremos, com freqüência, que é útil representar o aspecto do procedimento de nossos paradigmas comportamentais através de símbolos). O Processo diz brevemente o que acontece no tempo com os aspectos significativos do comportamento, à medida que aplicamos o nosso procedimento. Uma descrição de um processo compor tamental adquire, tipicamente, a forma de um gráfico, com o tempo no eixo horizontal (X) e alguma propriedade do comportamento do organismo no eixo vertical (Y). Discutiremos isso mais completamente numa seção posterior. Finalmente, o Resultado é o estado final do processo. Quando o comportamento cessou de mudar significantemente sob o determinado procedimento, o resultado foi alcançado. Nas subseções seguintes, elaboraremos alguns dos mais importantes aspectos do paradigma pavloviano.

A reiaçáo de CR com R2. Podemos considerar um acidente histórico o fato de Pavlov iniciar sua pesquisa sobre o condicionamento com um reflexo que gerava uma CR muitosemelhante àR2,incondicionada. Tanto CR como R2 envolvem a produção de secreção das glândulas salivares. Realmente, não é provável que o observador casual detecte qualquer diferença entre a salivação condicionada e a incondicionada. A similaridade entre CR e R2 no reflexo salivar é, provavelmente, responsável pela crença geral, perpetuada até aos tempos modernos, de que CR é R2- Mas Pavlov sabia que isto não era verdade. Não somente a magnitude de CR era diferente de R2 , mas a composição química real da saliva diferia entre CR e R2 . Pavlov preferiu ignorar as diferenças entre CR e R2 e se concentrar nas similaridades. Isto é frequentemente uma estrategia segura na pesquisa científica preliminar Foi o gênio de Galileu que o permitiu ignorar as pequenas diferenças na velocidade de queda de objetos leves e pesados em favor de uma teoria que os idealizava caindo na mesma velocidade. Ele fez isso em face de uma teoria bem estabelecida da natureza que exigia exatamente a conclusão oposta. Ao formular um princípio teórico que afirmava ser CR = R2 , Pavlov estava empregando a estratégia de Galileu de ignorar pequenas diferenças. S i,ele supòs, passa a eliciar o respondente de S2 como um resultado de seu emparelhamento com S2-

P sse princípio, conhecido como o princípio de substituição de estímulo (Sj substitui S2), tinhauma grande atração em termos de suas aparentes (1) generalidade, (2) simplicidade, e (3) capacidade para explicar outros fenômenos. Uma vez que estes aspectos são característicos dos nossos melhores conceitos na ciência, não é surpreendente que o princípiode substituição de estímulo fosse adotado por John Watson e outros primeiros behavioristascomo base paraexplicar todo comportamento. Na substituição de estímulo eles pensavam ver o mecanismo subjacente aos padrões complexos de comportamentos aprendidos e hábitos compostos. Consideremos o programa arrojado de Watson para'uma análise experimental do comportamento: “dado o estímulo, podemos predizer a resposta; iada a resposta, podemos predizer o estímulo” .Neste quadro de referência era natural considerar a ligação dos novos estímulos com as velhas respostas (substituição de estímulo) como um princípio poderoso para criar novas seqüências de comportamento. Watson acreditava que o comportamento complexo humano e animal representava o embasamento e a composição de reflexos condicionados. Devido à importância teórica da substituição de estímulo nas teorias de Pavlov e Watson, os pesquisadores posteriores ignoraram as diferenças entre CRs e &2S Por algum tempo. Contudo, por duas razões, o princípio da substituição, de Pavlov, não resistiu ao teste do tempo.

- 5 7 -

(1) Embora Watson propusesse que todo comportamento poderia ser visto como uma interação e composição de reflexos condicionados, a proposição não conduziu a novas formas poderosas de prever e controlar o comportamento. O teste de todos os conceitos científicos é o seu emprego na previsão, controle e organização da matéria prima da natureza. No início, a substituição de estímulo parecia ser útil para ordenar o comportamento, mas à medida que os anos se passavam ela permanecia estéril na previsão e controle. Mesmo os homens que o haviam empregado muito entusiasticamente começaram a duvidar de sua natureza fundamental. Eventualmente, com uma nova exploração da lei do efeito de Thorndike, tornou-se claro que grande parte do comportamento não cabia dentro do modelo Pavloviano. Mas esta é uma história que fica para o próximo capítulo.

(2): À medida que dispunha de mais e mais informações sobre o condicionamento descobriram-se casos em que a CR era apenas ligeiramente diferente de R2 mas, em alguns casos era exatamente o oposto. Um experimento realizado por Notterman, Schoenfeld e Bersh (1952) empregando sujeitos humanos é ilustrativo. No seu estudo, S] era um tom audível e S2 um choque elétrico suave, liberado na mão esquerda do sujeito. Esses pesquisadores mediram a taxa cardíaca respondente com um aparelho um pouco diferente do conhecido como um eletrocardiógrafo familiar em muitos consultórios médicos. Em vez de manter seus sujeitos numa situação pavloviana (Fig. 3-1), eles sentaram-nos em cadeiras comuns, instruindo-os para permanecerem tão quietos quanto possível por cerca de 90 min. Durante este período, os experimentadores registravam a taxa cardíaca de seus sujeitos enquanto apresentavam tons e choques. Notterman, Schoenfeld e Bersh encontraram evidência clara de uma taxa cardíaca (CR) depois de 11 emparelhamentos de choque e tom. Todavia, enquanto a resposta incondicionada ao choque (R2) era uma aceleração da taxa cardíaca, a resposta condicionada (CR) envolvia uma diminuição dessa taxa. Embora um trabalho posterior (Zeaman e Smith, 1965) mostre que as diferenças entre CR e R2 na taxa cardíaca estão estritamente relacionadas a diferenças respiratórias correspondentes, a disparidade entre as formas dos comportamentos condicionado e incondicionado permanece.

Exemplos extremos como este levaram-nos a ver de uma forma diferente o condicionamento pavloviano ou clássico. Em quase todos os casos de uma suposta substituição de estímulo, existem diferenças marcantes entre CR e R2- Em muitos casos, elas estavam ocultas devido as medidas grosseiras tomadas quando os pesquisadores estavam somente interessados no condicionamento como um fenômeno de substituição.

Abreve história da substituição de estímulo é exemplo interessante do crescimento contínuo da ciência. Um conceito pode influenciar por alguns anos ou décadas porque parece fornecer comorto intelectual e prometer a ordem da natureza. Mas, a menos que cumpra a sua promessa, eventualmente, ele dará lugar ao peso da evidencia experimental. Durante seus dias de glória, todavia, tal conceito pode dirigir pesquisas de maneiras que efetivamente colocam vendas nos cientistas em relação a fraqueza do conceito. É quase como se, para dar ao conceito uma “chance”, ignoremos por um tempo, certas discre- pâncias, certa indeterminação em sua definição. Essa permissividade temporária no estágio inicial da exploração é justificada a longo prazo porque muitos de nossos conceitos bem estabelecidos passaram através de tal iniciação e emergiram fortes e lógicos por causa dela. O próprio reflexo é um bom exemplo disso, e assim são muitos conceitos da ciência física que sobreviveram ao teste do tempo.

— 58 —

A importância do Reflexo S\ ---- > R i Pavlov sugeriu que S \ -----> R\ deveria serum reflexo “biologicamente mais fraco” do que S2 ---- > R2 para que o condicionamento clássico ocorresse. A noção “de fraqueza biológica” não está inteiramente clara. Presumivelmente, é uma maneira de dizer que, se as energias de S \ e S2 fossem de algum modo igualadas, então R \ seria sempre menor ou ocorreria menos frequentemente do que R2 . Um fato relacionado que Pavlov enfatizou foi que o condicionamento é maií fácil de ser observado (embora não necessariamente mais fácil de ser obtido) quando S] não elicia inicialmente R2 - Deveria estar claro que, se S\ elicia R2 antes do condicionamento, então o efeito do emparelhamento de Sj e S2 pode ficar obscuro. Assim, na maioria dos experimentos de condicionamento, toma-se o cuidado de selecionar um Si que não tenha a capacidade original de eliciar R2 - Diz-se que tal S] é neutro com respeito a R2 - Um S\ neutro é especialmente desejável se, durante o condicionamento, vamos procurar pela CR no mesmo lugar onde observamos R2 . Contudo, a neutralidade inicial de S\ em relação a R2 não é um aspecto necessário para a ocorrência do condicionamento clássico, como Long (1941) demonstrou algum tempo atrás. Num dos experimentos de Long, um tom de 1/7 seg. de duração foi usado como S\ e um breve flash de luz como S2 . Em ambos os casos, o respondente de piscar os olhos em sujeitos humanos foi medido. Tanto a luz como o tom eliciava o piscar desde o inicia Mas depois dos emparelhamentos, o S] tom sozinho, passou a eliciar duas piscadas sucessivas. A Fig. 3-2 dá um exemplo de um dos registros de Long quando S] era apresentado.

Figura 3-2. Resposta de piscar a um tom de 1/7 seg. depois de 30 emparelhamentos tom-luz (segundo Long, 1941)

Ainda mais impressionante foi um experimento realizado por Long no qual S\ e S2 eram tons idênticos. Neste experimento um resultado semelhante foi obtido: o primeiro tom passou a produzir dois movimentos das pálpebras depois dos emparelhamentos. Assim, o caso especial do paradigma Pavloviano com Si = S2 produz resultados condizentes com o paradigma geral.

Os resultados de Long têm um significado adicional. Se antes do condicionamento, um estímulo elicia Ri e depois do condicionamento evoca Ri e CR podemos generalizar isto para casos em que um único estímulo pode vir a controlar uma variedade

- 59 -

de comportamentos diferentes, dependendo das várias histórias passadas de emparelhamento com S2 s diferentes. Este resultado pode ser representado diagramaticamentecomo

R

C R '

S, C R ” [3.2]

CR

\ •

etc.Assim, um tom emparelhado independentemente com um choque, uma luz e alimento pode simultaneamente evocar CRs de mudanças na taxa cardíaca, piscar de olho e salivação, respectivamente. Essa constelação inteira de comportamentos evocados por um unico estimulo pode ter importância para o nosso estudo da emoção como veremos num capítulo posterior. Naturalmente, deveria ser enfatizado que, no Diagrama 13-21 Rj é um sumário de todos os comportamentos inicialmente eliciados por Si - Embora frequentemente limitemos nossas discussões sobre o condicionamento a uma ou duas respostas, o condicionamento é um fenômeno que invade todo o sistema compor tamental de um indivíduo. Quando examinamos uma única resposta em detalhe, assim o fazemos porque julgamo-la representativa do que está ocorrendo em geral no sistema de resposta e não porque seja tudo o que está ocorrendo. Tentar pesquisar o sistema total de uma vez nos sobrecarregaria com detalhes não controláveis. Tomamos uma amostra representativa e tentamos explorá-la em profundidade. Essa é outra estratégia de pesquisa que tem tido sucesso na pesquisa científica embora tal sucesso evidentemente, dependa de quanta sorte temos ao escolher uma amostra que seja realmente representativa de um fenômeno em geral. O fato de que a CR e R2 salivar sejam tao semelhantes e tão dominantes no caso de Pavlov sugere a possibilidade de que a sua amostra não fosse tão representativa como ele poderia té-lo desejado.

É S -|-----> CR um "Novo Reflexo"? No velho princípio de substituição,S] ---- > R2 era visto como o novo reflexo “condicionado” . Embora possamos preferirrepresentar os efeitos do condicionamento clássico como a formação de uma CR para S 1 ainda temos de encarar a questão sistemática de se S \ — > CR é um reflexo, ou um outro tipo de correlação estímulo resposta. Existe muito pouca evidência experimental disponível que trata do assunto, mas o pouco que temos indica que ele não é de fato um reflexo verdadeiro.

Em primeiro lugar, aumentos na intensidade de S\ não resultam em aumentos na magnitude de CR, ou em decréscimos na sua latência. Ao contrário, o máximo de magnitude de CR e sua latência mínima são obtidos com o valor exato de S\ empregado no condicionamerto (Mostofsky, 1965). Valores mais ou menos intensos resultam em CRs mais fracas. Por outio lado, lembremo-nos do Capítulo 2 onde foi dito que as leis de magnitude *: latência do reflexo especificam uma simples proporcionalidade entre a intensidade de S2 e a força de R2 -

- 60 -

Segundo, a laténcia da CR adquirida para S \ é geralmente mais longa do que a latência dos respondentes (Ris) associados com aquele mesmo S i . Isto pode ser demonstrado atrave's do emparelhamento de uma luz (S \) com uma corrente de ar na pálpebra (S2 ). Originalmente, tanto Si como S2 eliciam o piscar de olho. Como resultado do emparelhamento, Si passa a evocar duas piscadas de olho distintas, uma Ri seguida por uma CR. Usando esse procedimento com sujeitos humanos, Grant e Norris (1947) identificaram várias regiões modais de latência, como mostra o histograma da Fig. 3-3. Esses

Latência (milisegundos)

Figura 3-3. Distribuição da latência de todas as respostas de piscar o olho eliciadas por uma luz forte no curso de um experimento de condicionamento com sujeitos humanos (segundo Grant e Norris, 1947).

pesquisadores chamaram a região entre 50 e 110 mil segundos (1 mseg. S 3 se^ = 1/1000 seg.) a faixa do reflexo verdadeiro; a região entre 260 e 450 mseg representa a faixa de CR.

Terceiro, se S \— CR é um reflexo verdadeiro, deveria ser possível construir mais reflexos condicionados a partir dele. O próprio Pavlov viu as possibilidades dessa acumulação de condicionamentos, assim como as implicações disso para o comportamento humano. Por exemplo, num experimento realizado por Frolov (citado por Pavlov1927, pp. 33-34). um metrônomo foi primeiro utilizado como S\ no paradigma, onde Alimento — > Saliva era o reflexo incondicionado. Depois de alguns emparelhamentos o resultado usual foi obtido: o metrônomo sozinho evocava uma CR salivar. Frolov então, tentou usar a nova correlação S \ ------ CR como a base para um reflexo condicionado de segunda ordem. Ele colocou um quadrado preto no campo visual do cão por 10 seg. Então, esperou 15 seg mais e, finalmente, soou o metrônomo por 30 seg. Essa é uma variação do emparelhamento “simultâneo1’ discutido acima e, de acordo com Pavlov, ele seria necessário para se chegar a um condicionamento de segunda ordem. Depois de 10 de tais tentativas, o quadrado preto passou a evocar alguma salivação embora nunca tivesse sido emparelhado com alimento. Representamos esse exemplo de condicionamento de ordem superior como uma operação de dois estáeios na Fig. 34 .

61

Este reflexo foi omtido apóss S i-----CR ter sido formado.................

j s 2 - - - - - - - - - - - - * - R* JFigura 3-4. Procedimento de Ordem ---------------------- JFrolov para estabelecer o condicionamento de segundaordem. I) S i— -------- R|

^ C R 'II) S0 ^ --------- R 0

Tipicamente, a CR’ de ordem superior era pequena em magnitude, longa em latência, variável em ocorrência e de pouca duração. As tentativas para se chegar além do condicionamento de segunda ordem sem o emprego do S2 — > ^ 2 original não foram bem sucedidas com respondentes salivares. A importância do condicionamento de superior desse tipo ainda está em discussão entre os psicólogos. Seu caráter transitório (se o S2 é omitido por várias tentativas, ele desaparece de todo)a dificuldade em estabelecè-lo e sua incapacidade para se estender a muitas ordens,levaram alguns autores a comentar que “dificilmente poder-se-ia esperar que a influência do condicionamento de ordem superior fosse muito grande no comportamento cotidiano dos organismos” (Keller e Shoenfeld 1950, p. 32). Por outro lado, suas possibilidades teóricas como um princípio expla- natório, têm impressionado favoravelmente outros autores, tais como C.E. Osgood (1953) que considera que *‘esse processo certamente se estende de maneira ampla na aprendizagem humana, especialmente na área da linguagem” (Osgood, 1953, p. 316)

Em resumo, parece que as relações S\ CR estabelecidas pelo condicionamento são, provavelmente, bastante diferentes dos reflexos verdadeiros, o que justifica agrupá- las separadamente.

3.3 RELAÇÕES TEMPORAIS NOS PARADIGMAS DE CONDICIONAMENTO

O condicionamento Pavloviano ou clássico pode convenientemente ser considerado como o efeito característico da apresentação de estímulos em certas relações temporais, isto é, numa certa ordem no tempo. Até agora, content amo-nos em colocar a operação fundamental do condicionamento Pavloviano como um "emparelhamento" de dois estímulos eliciadores. Já é tempo de considerar com mais detalhes a natureza desta operação de emparelhamento. Na Fig. 3-5, são apresentadas quatro maneiras diferentes em que Sj pode ser emparelhado no tempo com S2

S,

S,

Si

S,

X IJZL

(A) “Simultâneo”

(C) Traço

Figura 3-5. Algumas relações temporais possíveis entre S j e S2 no condicionamento clássico.

S,

S,

s,

St

r z L(B) Retardo

___EL_

(D) Retroativo

- 6 2 -

O primeiro caso (A) talvez seja o tipo mais comum e é referido na literatura de condicionamento como condicionamento “simultâneo” . O S i é curto e seu aparecimento ocorre cerca de 1/2 seg. antes de S2 . Na Fig. 3-5A, S\ termina antes de S2 ; todavia Si pode ultrapassar S2 sem alterar os resultados. Outro procedimento temporal empregado no condicionamento clássico é visto na Fig. 3-5B. O Si é iniciado antes de S2 e permanece por um intervalo de tempo considerável. Quase no final de S j, S2 é apresentado. Este é chamado um procedimento de retardo.Étambém possível, sob as condições de Pavlov, obter-se CRs com retardos até de vários minutos. O caso ilustrado na Fig. 3-5C é semelhante ao condicionamento “simultâneo” exceto que S\ é apresentado mais cedo e termina antes da apresentação de S2 . Este é o procedimento que Frolov usou em seu experimento de segunda ordem. Este caso é referido como um procedimento de traço, na suposição de que um “traço” de S\ permanece no sistema nervoso do organismo depois que S] termina. Se o tempo entre S\ e S2 não for muito grande (uns poucos minutos) é possível se formar CRs para S\ através do procedimento de traço.

Quão longo pode ser o tempo entre S] e S2 antes que o condicionamento se torne impossível? Nenhumá resposta geral é possível, pois isto depende do reflexo particular S2 — R2 , das intensidades de S\ e $2 e de muitos outros fatores. Uma questão relacionada é mais fácil de ser respondida: qual é o intervalo ótimo entre o aparecimento de S\ e o aparecimento de S2 ? Isto é, que intervalo permite asCRsmais consistentes?Um estudo realizado por Wolfle (1932) usando a retração do dedo a um choque elétricocomo S2 ---- ^ -R 2 gerou a curva vista na Fig 3-6. Note que a percentagem máxima deCRs ocorreu em

o•8 «I

c O

Intervalo S i ---- S2 (seg)

Figura 3-6. Condicionabilidade relativa em função do intervalo Sj Wolfle, 1932).

S2 (segundo

(Xíca de 1/2 segundo e esse valor é frequentemente tido como sendo o intervalo ótimo deS i ------ S2 . Poucas CRs foram registradas em 0 seg. (simultaneidade verdadeira). Osvalores negativos do intervalo S i ----- S2 (aqueles a esquerda de 0 na Fig. 3-6) apresentam algum interesse teórico. Eles representam o caso (visto na Fig. 3-5D) em que S\ vem

- 6 3 -

depois (!) de S2 - Esse é o procedimento chamado de condicionamento retroativo. Concorda-se atualmente que o procedimento de condicic. jnento retroativo não resulta na formação de uma nova CR para S\ e a Fig. 3-6 apoia este ponto de vista. Da nossa análise na seção anterior, poderíamos esperar, todavia, que S2 (agora o primeiro estímulo) adquirisse uma CR. Embora tal resultado não seja consistente com a noção de Pavlov de que o estímulo anterior deva pertencer a um reflexo biologicamente mais fraco ele seria compatível com uma análise do condicionamento clássico puramente em termos de relações temporais entre estímulos.

Um procedimento final, não visto na Fig. 3-5, ocorre quando S2 é apresentado periodicamente sozinho, sem qualquer Si . Num experimento, Pavlov alimentou um cão regularmente em cada 30 min. Nenhuma mudança de estímulo precedia a alimentação. Quando esta rotina de alimentação estava bem estabelecida, o alimento foi totalmente retirado, medindo-se os efeitos. Sob essas condições observou-se que a salivação começava aproximadamente no fim do período de 30 min, o período em que o alimento normalmente viria. Pavlov chamou esse procedimento de condicionamento de temporal com base na analogia de que o intervalo de tempo desde a alimentação anterior passava a atuar, de alguma forma, como um S\.

3.4 - A EXTENSÃO DO CONDICIONAMENTO CLÁSSICOO leitor deve sair dessa introdução ao condicionamento clássico com uma compreen

são clara da natureza invariante de um aspecto do fenômeno. Sempre que dois eliciadores são associados no tempo através das regras apresentadas em nossa discussão sobre “emparelhamento” um resultado inevitável é obtido. O primeiro eliciador passa, eventualmente, a evocar algum novo conjunto de comportamento no organismo. Isto é verdadeiro, caso o emparelhamento seja realizado ou por um experimentador num lab o ra tó rio cuidadosam ente construído ou pela ação da natureza na selva. Frequentemente, algum novo comportamento assim evocado oü “condicionado” assemelhar-se-á a alguns dos respondentes do segundo eliciador, mas isso não é necessariamente verdadeiro.

Esse fenômeno parece ser bastante geral, estendendo-se em todo reino animal. Já se obteve CRs em vermes, caranguejos, peixes, répteis, pombos, galinhas, carneiros, cães, macacos e fetos humanos de sete meses de idade ainda no útero materno (Hilgard e Marquis, 1940).

Na história inicial da pesquisa sobre o condicionamento clássico, quando o paradigma era tido como Sj —5* R2 > pensava-se que qualquer reflexo poderia ser “condicionado” . Isto é, qualquer respondente (R2) poderia ser transferido por substituição de estímulo para novos Sis. Com a queda da substituição de estímulo e a aceitação geral de que a CR pode não ser idêntica a R2 , essa posição foi enfraquecida. Alguns insucessos na obtenção de condicionamento são esclarecedores. Numa série de experimentos cuidadosos com o ernprego de S]s e S2S diferentes e vários intervalos Si — S2 , F.A. Young (1958) foi incapaz de obter uma transferência do respondente pupilar para S j. Young resume a literatura dos últimos trinta anos sobre um suposto condicionamento desse respondente e conclui que a evidência indica que nenhum pesquisador demonstrou inequivocamente o condicionamento desse respondente. Schlosberg (1928) indica que condicionamento da flexão do joelho pode ser um artefato devido aos processos que veremos no Capítulo 4. Reinwald (citado em Keller e Schoenfeld, 1950) não foi capaz de obter uma CR de flexão do joelho em mais de 1.000 emparelhamentos de uma iuz com

- 6 4 -

uma pancada no tendão patelar. É possível que esses pesquisadores estivessem procurando por uma CR muito parecida com a R2, original. O condicionamento clássico pode ter sido algo distorcido por muitos anos devido a procura de CRs somente ao longo de dimensões mais óbvias de R2 - O fato é que podem existir CRs em dimensões comportamentais diferentes de R2 - Realmente, é bem conhecido que o condicionamento clássico é um fenômeno que invade muitos aspectos do sistema comportamental de resposta do organismo. Moore e Marcuse (1945) mostraram que quando vários sistemas comportamentais são examinados, as CRs são vistas mais claramente em alguns desses (como respiração, salivação e taxa cardíaca) do que em outros (atividade motora ou geral). A Fig 3-7, um dos registros de Moore e Marcuse, tomados de um porco colocado num arreio Pavloviano e previamente sujeito a tons (S i) emparelhados com biscoitos (S2) é ilustrativa.

Cabeça ____ ____

Salivação (1/60 cc) ________________________

Coração __________________________________________

Alimentação________________________ ___________________Tom (480 )A lim en to ----------------------------------------*-------------------------------------------- ----- .Tempo (seg.^.................. - ............... -...... -..... -............................ -........ -

Figura 3-7. Respostas de um porco em um número de sistemascomportamentaisa um sinal sonoro que havia sido previamente emparelhado com alimento (segundo Moore e Marcuse, 1945).

As CRs parecem mais convincentemente formadas em respondentes que dependem das funções do sistema nervoso autônomo. Como Keller e Shoenfeld em (1950) salientam:

“Estes envolvem as ações de glândulas e músculos lisos (e.g. a secreção de suor e a contração das veias). Desde que a ação de tais 7efetores'é frequentemente associada com estados de emoção (no'm edo" a saliva seca, o suor é excretado, a pele esfria, ar pupilas dos olhos se dilatam, etc.) não seria surpresa.... saber-se que esses estados podem ser condicionados à maneira Pavloviana” (Keller eSchoenfeld, 1950 pp. 27-28).

Com a não confirmação da expectativa de Watson de que a substituição de estímulo seria a pedra fundamental para construir uma teoria geral de todo comportamento aprendido, a pesquisa básica sobre o condicionamento clássico tem sido, até recentemente, pouco enfatizada nos Estados. Unidos. (Prokasy, 1965). Os russos por outro lado, nunca estiveram tão interessados no condicionamento como um instrumento para a análise psicológica. Por essa razão, talvez, a pesquisa sobre reflexos condicionados nunca entrou em declínio naquele país. Embora o condicionamento clássico nunca possa atuar como seus entusiásticos adeptos esperavam a 30 ou 40 anos atrás, parece provável que ele ainda possa emergir, se bem que numa forma diferente como um conceito importante

— 65 —

para a compreensão do comportamento. O fato de que nossas emoções pareçam seguir as leis de Pavlov, ao invés ua lei do efeito de Thorndike fornece um indício da possível importância do condicionamento clássico. Em vez de serem as unidades de comportamento aprendido como Watson concebeu, pode ser que os estados emocionais classicamente condicionados acompanhem e sejam mesmo essenciais para a manutenção de muitos de nossos padrões de comportamento. Mas, no momento, isso é uma mera especularão e uma apresentação mais detalhada deve esperar um capitulo posterior.

3.5 O MÉTODO EXPERIMENTAL

A partir daqui, faremos uso recorrente de certos conceitos básicos da ciência experimental. Na presente seção começaremos a introduzir alguns princípios simples do método experimental como são usados na psicologia, motivando a discussão através de referências a experimentos de Pavlov e seus colaboradores.

Em todo experimento, o cientista procura estudar certos aspectos do mundo natural na medida em que se relacionam a outros aspectos. Uma das primeiras tarefas do cientista é tentar eliminar as influências sobre o objeto de seu estudo nas quais ele não está diretamente interessado, na ocasião do seu experimento. Assim, ao estudar como a magnitude do respondente variava com mudanças da intensidade do estímulo, Sherrington separou o cérebro da medula para eliminar as influências desconhecidas que o cérebro pudesse ter sobre a magnitude do respondente. De um modo similar, Pavlov rotineiramente colocava os cães numa sala especial onde eram isolados do mundo exterior. Ele diz:

“Pensávamos, no início de nossa pesquisa, que seria suficiente simplesmente isolar o experimentador na câmara de pesquisa com o cão a sua frente e impedir a entrada de qualquer pessoa durante o curso de um experimento. Mas essa precaução mostrou-se ser completamente inadequada, uma vez que o experimentador, por mais que tentasse ficar quieto, era uma fonte constante de um grande número de estímulos. Seus menores movimentos — o piscar o olho ou o movimento dos olhos, a postura, respiração e assim por diante — todos agiam como estímulos que, chegando até ao cão, eram suficientes para viciar os experimentos, tornando a interpretação exata dos resultados extremamente difícil. A fim de excluir essa influência imprópria do experimentador tanto quanto possível, ele deveria ficar localizado fora da sala em que o cão estivesse colocado, e mesmo essa precaução provou-se insatisfatória em labora tó rio s não construídos especialmente para o estudo desses reflexos particulares. O ambiente do animal, mesmo quando fechado numa sala, está sempre mudando. Os passos de uma pessoa que passa, conversas ocasionais nas salas vizinhas, o bater de uma porta ou a vibração de um furgão passando, vozes da rua, bondes e mesmo sombras que penetram através da janela para dentro da sala, qualquer desses estímulos casuais, não controlados, que chega aos receptores do animal... vicia os experimentos” (Pavlov, 1927), p. 20).

Fica claro a partir do relato de Pavlov que os cientistas se esmeram para controlar as influências indesejáveis nos seus experimentos. Este é o sentido que damos à sxpressão “experimento controlado” . Algumas vezes todavia, é impossível eliminar uma temperatura e umidade da sala onde fica o animal não podem ser alteradas. Se estas

- 6 6 -

mudam drasticamente, elas alteram as propriedades do reflexo. A idade do animal, sua saúde e o grau de privação de alimento são influências semelhantes. O melhor que podemos fazer é mantê-las tão constantes quanto possível durante o curso do experimento. Este é, então, um segundo significado de um experimento controlado: mantemos constantes muitas influências no nosso fenômeno em questão.

Tendo controlado as influências indesejáveis, removendo-as ou mantendo-as constantes, prosseguimos na execução de um experimento. Mas o que isso impõe? Em cada experimento, não importa em que ciência, há certos ingredientes básicos na sua preparação. Em primeiro lugar, uma vez que cada experimento é uma tentativa de relacionar duas ou mais coisas entre si, ele trata com pelo menos duas grandezas que possam assumir valores diferentes. (Nos experimentos de Pavlov, duas de tais grandezas eram frequentemente o número de emparelhamentos e a magnitude da resposta.) As grandezas que podem adquirir valores diferentes receberam dos matemáticos o nome de variáveis. Adotaremos esse nome, empregando-o frequentemente através do restante deste texto. Ambas as variáveis num experimento devem ser mensuráveis e uma delas deve ser controlável ou manipulável pelo experimentador. Isto é, ele deve ser capaz de mudar ao menos uma delas como desejar.

No experimento de Anrep (ver seção 3.1) existem três variáveis, três grandezas que assumem valores diferentes: o número de emparelhamentos prévios alimento-tom gotas de saliva e o tempo passado entre o aparecimento do tom e a salivação subsequente (Tabela 3-1). Para simplificar, limitemos nossa atenção a somente duas delas: número de emparelhamentos e gotas de saliva. Ambas as variáveis foram medidas pelo Dr. Anrep. Todavia, somente uma foi manipulada por ele. Isto é, ele determinava diretamente o valor de só uma delas. Essa variável foi o número de emparelhamentos. Uma variável que é medida e manipulada num experimento é chamada de variável independente. Qualquer outra variável que for concorrentemente medida neste experimento mas não manipulada, é chamada variável dependente. Anrep, assim tinha duas variáveis dependentes: gotas de saliva e o tempo para a primeira gota aparecer. Consideremos, por um momento, somente a primeira delas.

80 r Y

6 0 -ct•Í51•8 40 -BOO

2 0 -

0 ---------- 1---------- 1_______i_______i_______i_______ Y10 20 30 40 50

Número de emparelhamentos sucessivos de X

Figura 3-8. Representação da variável independente de Anrep (1920) e uma de suas variáveis dependentes num sistema de coordenada retangular.

- 6 7 -

Suponha que tentemos representar nossas variáveis e nossos resultados num sistema de coordenada retangular bidimensional como na Fig. 3-8. Designamos a variável independente para o eixo horizontal (eixo do X) e a variável dependente para o eixo vertical (eixo do Y). (Essa localização da variável dependente é exatamente oposta aquela de um histograma. Ver Fig. 2-6.) Várias propriedades da Fig. 3-8 são interessantes de se notar. (1) Sempre damos aos nossos eixos rótulos informativos descrevendo nossas variáveis. (2) Marcamos distâncias iguais nos eixos e fazemos com que essas distâncias representem aumentos iguais de nossas variáveis. (3) As escalas dos eixos (X) e (Y) não precisam ser as mesmas. (4) O zero coincide para ambos os eixos onde as linhas coordenadas se encontram no ponto chamado de origem.

80

>< 60 a .fe13

40

20

10 20 30 40 50

Número de emparelhamentos sucessivos X

Figura 3-9. Os dados de Anrep (1920) sobre gotas de saliva e número de emparelhamentos indicados como pontos bidimensionais num sistema de coordenada retangular.

Prosseguimos representando os dados de Anrep no sistema de coordenada retangular. Utilizamos as colunas 1 e 2 da Tabela 3-1 para colocar os pontos nos locais apropriados dentro do quadro de referências. Cada ponto representa um par de números: o número de gotas de saliva associado com o número de um dado emparelhamento. Ao fazermos isso, obtemos a Fig 8-9.

O último passo é conectar os pontos com linhas retas. Com esta operação, obtemos a Fig. 3-10, que chamamos a curva ou função que relaciona o número de gotas de saliva ao número de emparelhamentos prévios alimento-tom, numa faixa da variável independente que varia de 0 a 60 emparelhamentos. A forma de tais curvas ou funções é de algum in teresse . No p resen te caso, vemos que além do ponto que representa 30 emparelhamentos não ocorre muita mudança na variável dependente. Quando uma função alcança um valor limite em torno do qual flutua daí em diante, dizemos que alcançou a assíntota. Presumivelmente, mesmo que quiséssemos continuar com milhares de emparelhamentos adicionais, obteríamos, aproximadamente, apenas 60 gotas em cada teste.

- 6 8 -

Linha assintótica

>73ooa>T3ãoOD

Figura 3-10. A funçáo de Anrep (1920) relacionando gotas de saliva e numero de emparelhamentos, mostrando sua assíntota.

Estamos agora, em condições de definir um experimento como a medida e manipulação de uma variável e a medida concorrente e não manipulação de outra. Estritamente falando, essa defin ição vale apenas para os experimentos mais simples, aqueles com uma variável independente e uma variável dependente. Experimentos mais complicados podem ter muitas variáveis dependentes e independentes, mas aqui é suficiente compreender que um acréscimo de variáveis não contém novos princípios.

O experimento de Anrep serve ainda para ilustrar uma característica especial dos experimentos em Psicologia. Num experimento psicológico, a variável dependente é inevitavelmente algum aspecto do comportamento do organismo, a variável independente é inevitavelmente algum aspecto do ambiente imediato ou anterior do organismo. Aqui por exemplo, gotas de saliva é uma grandeza comportamental; o número de emparelhamentos refere-se à freqüência de algum estado anterior do ambiente do animal. Note cuidadosamente que nem saliva nem tom são variáveis segundo nossa definição. Gotas de saliva e número de tons apresentados é que são variáveis. Assim, uma variável é a grandeza que pode assumir valores diferentes (variáveis); é aquilo que medimos e registramos.

Agora que temos os instrumentos para compreender e representar os experimentos seus resultados, estamos numa posição muito melhor para compreender os dados obtidos por Anrep e resultados semelhantes. A função da Fig. 3-10 representa o nosso primeiro exemplo de um processo comportamental. Um processo comportamental pode ser definido como uma mudança no comportamento no tempo (ou tentativas no tempo) em que um procedimento constante é mantido em efeito. Podemos verificar que o experimento de Anrep preenche essas condições. Ele seguiu o mesmo procedimento- emparelhamento de tom com alimento — tentativa após tentativa, testando ocasionalmente o efeito do tom sozinho. Em nenhum ponto de suas cinqüenta tentativas ele desviou e instituiu um procedimento novo e diferente. Foi sempre o mesmo: tom-alimento, esperar um pouco, tom-alimento, ... e assim por diante. Então, a curva da Fig. 3-10 que cresce até alcançar assíntota, é o processo através do qual um tom passa, gradualmente, à medida que au r v ;,»am os emparelhamentos, a adquirir a habilidade de produzir uma resposta de saliva p* >i mesmo.

- 69 -

3.6 - INTRODUÇÃO AOS CONCEITOS ELEMENTARES DE PROBABILIDADE

Muitas das coisas que os psicólogos registram e observam ocorrem aquém da certeza perfeita, mesmo quando todas as condições de experimentação e observação são tão cuidadosamente controladas quanto possível. Por exemplo, em qualquer tentativa teste antes de assíntota de aquisição ser atingida, a apresentação do S\ no experimento de Anrep (ver figura 3-4) poderia não ter gerado nenhuma CR. Se imaginarmos qualquer tentativa teste realizada antes da assíntota, teríamos de admitir que haveria uma incerteza muito real ligada à predição de se ou não qualquer CR ocorreria para S\. Naturalmente, à medida que o número de tentativas prossegue, a incerteza diminui Diz-se que um respondente condicionado está complementamente adquirido quando suas chances de ocorrer depois de S\ tom aram-se certas ao máximo. O que é verdadeiro para os reflexos condicionados é verdadeiro para muitos outros eventos comportamentais e não comportamentais. Algumas vezes, uma pessoa comerá o que é colocado diante dela, outras vezes não. Algumas vezes, um trem chegará atrasado; algumas vezes, chegará pontualmente. O que gostaríamos de ter seria uma régua ou um instrumento de medida com o qual pudessemos representar e comparar, de uma maneira precisa, a certeza de eventos tais como CRs, comer sobremesas, chegada de trem. Felizmente, encontramos este instrumento no conceito matemático de probabilidade. Para o presente objetivo, consideraremos a probabilidade de um evento como um número que podemos associar a este evento, um número que caracterizará a certeza relativa do evento sob condições bem definidas de observação.

A fim de determinar esse número para um evento, devemos primeiro estabelecer um grupo de condições padrão sob o qual iremos procurar pelo evento. Um dos tipos de condições padrão envolve uma certa operação (procedimento) que executamos tal como jogar uma moeda, apresentar um S{ ou ordenhar uma vaca. Num segundo tipo as condições padrão são estabelecidas pela natureza e meramente fazemos nossas observações em ocasiões definidas. Assim, podemos observar se o trem local das 7h34min. chega ou não pontualmente, ou podemos observar o número de carros que cruza a ponte George Washington numa determinada hora. Por conveniência, daqui em diante referir- nos-emos a qualquer tipo de condições padrão de observação simplesmente como a observação padrão.

Denominaremos de resultados os eventos de interesse que surgem quando fazemos as observações padrão. Por exemplo, ao apresentar um estímulo e procurar por um respondente (uma observação padrão), podemos observar a ocorrência de uma flexão do joelho (um resultado). Ao atirar uma moeda, podemos estar interessados na ocorrência de “cara” (um resultado). Em geral, sempre que a ocorrência de um determinado evento ou resultado não é perfeitamente certa, isto pode significar que, ao se fazer a observação padrão algum outro evento ocorreu, evento este diferente daquele no qual estávamos principalmente interessados. Assim, se estivéssemos interessados no evento “cara” ao jogar uma moeda, o evento “coroa” seria aquele que ocorre sempre que o evento “cara” não ocorre. Para aplicar as noções de probabilidade deveremos classificar todos os resultados possíveis de uma observação padrão.

No caso de uma moeda de dois lados, os resultados possíveis são óbvios. Mas quantos resultados possíveis poderiam resultar da observação de carros ou da ordenhação de uma vaca? Nesses casos, seria útil classificar o grande número de possibilidades em um

- 7 0 -

número fixo e pequeno de categorias. Por exemplo, ao medir a produção de leite podemos achar conveniente preocuparmo-nos apenas com o fato de se Mimosa dará 0 — 0 — 21, 2 — 41 ou mais do que 41 toda manhã, ao ser ordenhada. A ordenha é a observação padrão e quebramos arbitrariamente os eventos possíveis em apenas três resultados. Parece que esse é um procedimento arbitrário e que poderíamos ter escolhido dois (algum leite ou nenhum leite), ou mais do que três resultados, estabelecendo mais categorias. Nos experimentos de condicionamento, quase sempre perguntamos se uma resposta condicionada é ou não observada após cada apresentação de um estímulo. Aqui, a observação padrão é a apresentação de um estímulo e existem dois resultados — uma resposta de nenhuma resposta. Mas poderíamos escolher uma característica da resposta para examinar (digamos, sua magnitude) e categorizá-la tal como fizemos com a quantidade de leite produzido pela manhã. O ponto importante de todas essas classificações é que elas nos permitem tomar cada resultado real da observação padrão e classificá-lo em uma ou outra categoria de resultado.

Uma vez fixadas quais as categorias de resultado que nossa observação padrão deve ter, seguimos adiante. Nosso próximo passo para medir a certeza de qualquer resultado particular pode consistir em se fazer a observação padrão algumas vezes a fim de se obter uma idéia de quão frequentemente o resultado em questão ocorrerá em relação a outros

Figura 3-11. Razáo de freqüência de “caras” numa seqüência de atirar uma moeda. Note a escala comprimida (logarítmica) do eixo horizontal. (Cramér, 1955).

resultados possíveis. Esse é um procedimento fundamental na estimativa de probabilidades. Por exemplo, podemos jogar uma moeda 100 vezes e obtermos 53 caras e 47 coroas. Ou podemos notar que, em 50 apresentações de um S j , observa-se uma CR 45

- 71

vezes. Se tomarmos agora a razão entre a freqüência dos resultados observados do evento em questão, e a freqüência total de resultados observados, obteremos um número entre 0 e 1. Este número dos dá alguma noção da certeza do evento em questão. Assim, a razão da freqüência de caras no total de eventos de atirar moedas é 53/100 = 0,53. Analogamente, a razão da freqüência de CRs nas apresentações de S\ ê 45/50 = 0,90.

Desses exemplos deveria ficar claro que as razões de freqüência podem ser calculadas sempre que tivermos obtido freqüências de determinados eventos e freqüências de todos os eventos. A idéia de uma razão de freqüência nos aproxima muito do nosso índice desejado de certeza. Mas uma outra característica da razão de freqüência deve ser notada. Uma razão de freqüência está sujeita aos erros usuais de medidas discutidas na seção 2.6. Isto é, as razões de freqüência observadas variarão de algum modo em blocos diferentes de observações padrão. Mas, a medida que fazemos mais e mais observações padrão, algo interessante ocorre com a razão de freqüência: ela tende assintoticamente a se aproximar de um valor limite. A Fig. 3-11 mostra como isto acontece quando jogamos uma moeda e observamos os valores da razão de freqüência de ‘ caras ’, à medida que se faz mais e mais observações padrão. Evidentemente, estamos chegando cada vez mais perto de uma assíntota^ neste caso 0,50. A assíntota de uma razão de freqüência é definida como a probabilidade do evento.

A faixa de variação desse número que chamamos probabilidade é de 0 a 1. Uma probabilidade 0 indica que nunca em qualquer observação padrão anterior, o evento em questão foi observado. Geralmente probabilidades próximas de 0 estão associadas com a previsão de que é improvável que um resultado do tipo em questão ocorra em qualquer tentativa determinada da observação padrão e que em muitas tentativas no futuro, ele ocorrerá apenas algumas vezes. Probabilidades próximas de 0,5 significam que o resultado em questão ocorre aproximadamente metade das vezes que a observação padrão é feita e em conseqüência, essa é a nossa previsão para o futuro. À medida que a probabilidade se aproxima de 1 ficamos cada vez mais certos de que deveremos observar o resultado em questão. Finalmente em 1, dizemos que estamos certos de que o resultado ocorrerá. Assim, a nossa convicção de que o sol nascerá amanhã recebe uma expressão quantitativa dada por uma probabilidade igual a 1 ,0 , já que toda observação no passado resultou em “o sol aparece” . O resultado “o sol não aparece” , todavia, tem até agora uma freqüência igual a 0 e, então, uma probabilidade 0. Esse valor expressa nossa falta de confiança em prever esse resultado. Uma maneira útil de representar a escala de probabilidade é vista na Fig. 3-12.

N unca aconteceu

. Pode ou nãoacontecer

^ Baixa 2Probabilidade

Figura 3-12. A escala de probabilidade.


Anrep, G. V. Pitch discrimination in the dog. / . Physiol., 1920, 53, 367-38"

Perfeitamentecerto

Alta

- 72 -

Cramér, H. 77:./ elements of probability theory. Wiley: New York, 1955.Dashiell, J. F. Fundamentals of general psychology. (3rd ed.) Boston:

Houghton Mifflin, 1949.Grant, D. A., and Norris, E. B. Eyelid conditioning as influenced by the

presence of sensitized Beta-responses. / . exp. Psychol, 1947, 37, 423-433.

Hilgard, E. R., and Marquis, D. G. Conditioning and learning. New York: Appleton-Century-Crofts, 1940.

Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New York: Appleton-Century-Crofts, 1950.

Long, Lillian D. An investigation of the original response to the conditioned stimulus. A rch . Psychol., (New Y ork) 1941, No. 259.

Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964.Moore, A. U., and Marcuse, F. L. Salivary, cardiac, and motor indices of

conditioning in two sows. J. comp. Psychol., 1945, 38* 1-16.Mostofsky, D. (E d.) Stimulus generalization. Stanford: Stanford Univer.

Press, 1965.Notterman, J., Schoenfeld, W. N., and Bersh, P. J. Conditioned heart rate

response in human beings during experimental anxiety. / . comp, physiol. Psychol., 1952, 45, 1-8.

Osgood, C. E. Method and theory in experimental psychology. New York: Oxford Univer. Press, 1953.

Pavlov, I. P. Conditioned reflexes. London: Oxford Univer. Press, 1927.Pavlov, I. P. Lectures on conditioned reflexes. New York: International

Publishers, 1928.Prokasy, W. F. (E d .) Classical conditioning: a symposium. New York:

Appleton-Century-Crofts, 1965.Schlosberg, H. A study of the conditioned patellar reflex. J. exp. Psychol

1928, 11 ,468-494 .Wolfle, H. M. Conditioning as a function of the interval between the

conditioned and the original stimulus. J. gen. Psychol., 1932, 7,• 80-103.Young, F. A. Studies of pupillary conditioning. J. exp. Psychol., 1958,

55, 97-110.Zeaman, D., and Smith, R. W. Review of some recent findings in human

cardiac conditioning. Chap. 19 in W. F. Prokasy (E d .), Classical r *in'nning. New York: Appleton-Century-Crofts, 1965.

- 7 3 -

Capítulo 4 - FORTALECIMENTO OPERANTE

A regularidade demonstrada nos fenômenos reflexos — tanto incondicionado como condicionado - ilustra o tipo de ordem a ser encontrada entre comportamento e ambiente. Todavia, muitas das atividades dos organismos superiores não parecem enquadrar-se num modelo reflexo de comportamento. Essas incluem as ações humanas que foram descritas^ántes de Descartes como voluntárias, espontâneas intencionais e propositais, e que resistiram à análise experimental até o início do século vinte. Uma ilu stração esclarecedora sobre onde terminam os reflexos e começam esses comportamentos é encontrada na seguinte passagem:

quando um gato ouve um rato, volta-se para a fonte do som,vê o rato, corre em sua direção e lança-se sobre ele. Sua postura em cada estágio, mesmo na seleção do pé que dará o primeiro passo, é determinada por reflexos que podem ser demonstrados um a um em condições experimentais. Tudo que o gato tem a fazer é decidir se persegue ou não, todo o resto está preparado para isso pelos seus reflexos posturais e locomotores” (Skinner, 1957, p. 343).

Por trás da proposição ilusoriamente simples de “tudo que o gato tem a fazer e decidir” encontra-se o ponto de partida para uma ciência daqueles comportamentos cujas ocorrências não estão relacionadas reflexamente à presença imediata de um eliciador ou a uma história de emparelhamento de dois eliciadores.

4.1 - INTRODUÇÃO AO COMPORTAMENTO PROPOSITAL

No estudo dos reflexos e respostas condicionadas vimos que a explicação e compreensão científicas surgiram através da descoberta progressiva e da elaboração de relações entre certos aspectos do comportamento (as respostas, variáveis dependentes) e certos aspectos do ambiente (as variáveis independentes, estímulo e história passada). Cada descoberta de uma nova relação ou lei do comportamento foi um evento importante na história do reflexo. Á medida que nossas leis começam a se empilhar e se misturar, sentimo-nos justificados em falar acerca de uma compreensão parcial do comportamento reflexo.

A nálise experim ental tem procedimento similar com os comportamentos

- 75

que chamaremos, por enquanto, “propositais” . Desde o trabalho pioneiro de Thorndike com gatos e pintos sobre aprendizagem, os psicólogos têm, progressivamente, persistido na procura de relações entre o comportamento proposital e outros eventos.Em geral, a procura dessas relações não nos conduziu ao longo dos mesmos caminhos do reflexo. Contudo, uma abordagem funcional já foi iniciada. Considere o problema no desenvolvimento de tal abordagem: como procedemos para encontrar as variáveis ou eventos aos quais o comportamento proposital possa estar significantemente relacionado?Inicialmente, devemos proceder por intuição e observação grosseira. Se tivermos sorte, podemos cumprir nossa tarefa ajudados por uma especulação filosófica avançada. Vinte e cinco anos antes de Thorndike,o filósofo britânico Herbert Spencer escreveu o seguinte.

“Suponha, agora, que ao estender sua cabeça para apanhar uma presa de difícil alcance, uma criatura falhe rapidamente. Suponha que, ao lado do grupo de ações motoras aproximadamente adaptadas para alcançar a presa a esta distância... um pequeno movimento do corpo para a frente (ocorre). O sucesso, ao invés do fracasso, será alcançado... Quando as circunstâncias se repetem, esses movimentos musculares que foram seguidos por sucesso são provavelmente repetidos: o que foi inicialmente uma combinação acidental de movimentos será agora uma combinação que tem probabilidade considerável” (Spencer, 1878).Na proposição de que “aqueles movimentos musculares que foram seguidos por

sucesso são provavelmente repetidos” , Spencer estava enfatizando que o que um organismos faz agora está, de algum modo, relacionado com as conseqüências do que o organismo fez no passado. Aqui, então, está a deixa que Thorndike, e mais tarde Skinner, deveriam seguir extensivamente.

O comportamento proposital é aquele que é quase totalmente definido por suas conseqüências. Considere a Tabela 4.1. Em cada ato ali citado, o objetivo do comportamento está relacionado de perto com as conseqüências. Dizemos que amarramos um

Tabela 4.1

ALGUNS COMPORTAMENTOS “PROPOSITAIS” DOS ANIMAIS E HOMENS, SEUS ASSIM CHAMADOS PROPÓSITOS, E SUAS CONSEQÜÊNCIAS PASSADAS REAIS.

COMPORTAMENTO PROPÓSITO CONSEQÜÊNCIAS

Amarrar um sapato Para manter o sapato 0 sapato fica no péComprar uma capa de chuva Para não molhar A chuva não molhaEntrar em um restaurante Para almoçar Você almocaAbrir uma torneira Para obter água Aparece a águaEscrever uma carta Para assegurar uma resposta A resposta é obtidaCavar um buraco Para escapar do frio Obtém-se calor

sapato para manter nosso sapato no pé, mas uma proposição equivalente é que amarramos nosso sapato e, ontem quando o amarramos, ele ficou no pé. Aproposiçãode que os ratos se refugiam em buracos para escapar do frio pode equivalentemente ser expressa com a proposição de que os ratos frequentemente, no passado, refugiaram-se em buracos e encontraram temperaturas mais elevadas.

- 7 6 -

EXERCÍCIO 2.Transforme cada um dos comportamentos e propósitos da Tabela 4.1 em propo

sições equivalentes que expressem simplesmente o comportamento presente e o comportamento passado com suas conseqüências.

Aparentemente, temos duas maneiras de representar o mesmo comportamento, na nossa língua: 1 ), o proposital no qual empregamos o termo para (ou de modo a) e que implica no tempo futuro; 2), o descritivo, no qual especificamos o comportamento presente e o associamos com o que aconteceu no passado. A redundância na representação é desperdício e usualmente é evitada pelos cientistas. Na presente argumentação, deveremos rejeitar a linguagem proposital e adotar a linguagem mais descritiva por uma razão lógica. O comportamento não pode ser relacionado com eventos futuros, isto é, eventos què ainda não aconteceram. Um lembrete algo desagradável pode ser retirado da seguinte ilüstração:

“Durante a guerra, os russos usaram cães para bombardear tanques. Um cão era treinado para se esconder atrás de uma árvore, arbustos ou outro esconderijo qualquer. Quando um tanque se aproximava e passava, o cão corria ao seu lado e uma pequena mina magnética, presa às suas costas era suficiente para danificar o tanque ou incendiã-lo. O cão, naturalmente, tinha que ser substituído” (Skinner, 1956, p. 228).

Apenas uma das duas possíveis descrições é satisfatória aqui. O cão corre na direção ao tanque devido a certas conseqüências passadas de correr na direção de tanques. (Presumivelmente eles eram ali alimentados ou acariciados, etc.) Nesse exemplo extremo é fácil rejeitar a proposição alternativa de que os cães corriam na direção dos tanques para serem explodidos. Mesmo assim, a ilustração é útil para estabelecer o princípio geral de que o futuro não determina o comportamento.

Em resumo, uma classe muito real e importante de comportamentos surgida de situações que parecem envolver escolha ou decisão, é chamada comportamento proposital. Esse comportamento, deve ficar claro de uma vez, inclui-se na categoria de Descartes de ‘'voluntário” e constitui a ação que os antigos chamavam “intencional” . Nossa análise presente, indica que esse comportamento está de algum modo relacionado com suas conseqüências controlado por elas. Por essa razão, daqui por diante, deveremos substituir o antigo termo proposital pelo termo “ instrumental” de Thorndike, ou “ operante” de Skinner. Chamar o comportamento de “ instrumental” ou de “ operante” sugere que, operando no ambiente, o comportamento é instrumental na obtenção de conseqüências. Nenhum desses termos implica o mesmo quadro conceituai indesejável que o termo “ proposital” , mesmo assim ambos tentam aprender a noção fundamental de que as conseqüências passadas de tal comportamento são um de seus determinadores importantes.

4.2 UM EXPERIMENTO PROTÓTIPO

Se um rato de laboratório, faminto, é colocado na caixa ilustrada na Fig. 4-1 e certos procedimentos são efetuados, um número de efeitos comport ame ntais interessantes podem ser observados.

- 77 -

Para os objetivos da presente análise, as características significativas da caixa são ( 1) uma bandeja para o fornecimento de uma pequena pelota de alimento para o rato e (2) uma alavanca ou barra, projetando-se da parede da frente, que, quando pressionada para baixo com uma força de cerca de 10 g, fecha um micro-interruptor, permitindo um registro automático desse comportamento. Os aspectos significantes do rato são os seguintes: ( 1) é sadio e foi acostumado a comer uma refeição por dia, por volta da mesma hora em que se encontra na caixa. (2) Foi previamente adaptado a essa caixa e, durante este período de adaptação, o alimento era ocasionalmente fornecido na bandeja. Agora, ele se aproxima prontamente da bandeja de alimento e come-o sempre que este'está disponível.

Figura 4.1 - Uma câmara experimental baseada na caixa originalmente usada por B. F. Skinner para o estudo do comportamento instrumental no rato e outros pequenos mamíferos (Will Rapport).

Considere o seguinte experimento. O rato é cuidadosamente observado nessa caixa por um período de 15 minutos. Durante este tempo, nenhum alimento é fornecido na sua bandeja. Não será difícil observar a ocorrência de comportamentos que chamamos exploratórios. O rato cheira os cantos, cheira a bandeja, pressiona ocasionalmente a barra, levanta-se apoiando suas patas dianteiras nas paredes e assim por diante. Além disso, o animal frequentemente se engaja em atividades de “limpeza” e de farejar, e ocasionalmente permanece quase completamente imóveL Todas essas atividades são exemplos daquilo que os psicólogos usualmente rotulam de respostas. É suficiente, no presente, observar a seguinte precaução: esses comportamentos não são respondentes (nenhum eliciador específico pode ser encontrado para eles. Isso não significa que eles

- 7 8 -

não dependam, em grande parte, da construção da caixa para que ocorram. Não obstante, eles parecem ser emitidos na ausência de qualquer estímulo específico. Por essa razão, eles são frequentemente referidos como respostas emitidas.

A observação dos comportamentos emitidos por um animal na situação onde nenhuma conseqüência especial está sendo fornecida para qualquer resposta é conhecida como a observação do nível operante. Os registros do nível operante servem como uma importante linha base em relação à qual deveremos, mais tarde, comparar os efeitos da liberação de conseqüências especiais para uma ou mais respostas emitidas.

Depois de 15 minutos de observação dessas várias respostas emitidas, iniciamos o seguinte procedimento. Cada vez que observamos que o rato pressiona a barra, imediatamente fornecemos uma pelota de alirtiento na bandeja. Agora, pela primeira vez na história do rato, o comportamento de pressionar a barra tem a conseqüência especial de produzir alimento. Não será necessário esperar muito para ver os efeitos dessa nova contingência no comportamento do rato. Logo o animal estará ativamente ocupado com comportamentos de pressionar a barra e comer. Algumas mudanças ou modificações bem marcantes em seu comportamento ocorrem no espaço de poucos minutos.

Na linguagem comum, dizemos que o rato aprendeu a pressionar a barra para obter o alimento. Tal descrição contribui pouco para a proposição de que o rato está agora pressionando a barra frequentemente e está obtendo alimento. 0 que desejamos fazer é descrever em detalhe, e tão quantitativamente quanto possível, as mudanças no comportamento as quais resultam da simples operação de liberar uma conseqüência especial, para apenas uma das atividades normais do indivíduo que ocorre na situação. Para fazer isso, consideremos quatro maneiras complementares de encarar as mudanças no comportamento do rato quando, como o foi aqui, um de seus comportamentos é selecionado e recebe uma conseqüência favorável.

4.3 - MUDANÇAS NA TAXA ABSOLUTA

O experimento que descrevemos é um exemplo dos experimentos protótipos sobre o comportamento operante realizados por B. F. Skinner em 1930. Uma das mudanças comportamentais marcantes que ocorre sempre que um comportamento, como o pressionar uma barra, é seguido por alimento, é que o comportamento aumenta grandemente em freqüência. Será útil considerar o aumento que ocorre na freqüência, quando o comportamento já existente é sujeito a uma conseqüencia especial, como um fortalecimento deste comportamento. Então, o processo que estamos examinando agora poderia ser chamado de fortalecimento do comportamento operante, ou mais brevemente, fortalecimento operante.

As mudanças na freqüência de um dado comportamento são vistas mais claramente no aparelho similar a um quimógrafo, de Skinner, que registra, à tinta, as ocorrências sucessivas da resposta selecionada e as acumula verticalmente num papel de registro, ao mesmo tempo que a pena se move continuamente no tempo na direção horizontal. Para compreender esse aparelho, que pode justificadamente ser chamado de microscópio dos behavioristas, leia o programa da Tabela 4.2 passo por passo. Escreva suas respostas nos espaços fornecidos para isso. Prossiga, passo por passo, até chegar ao fim.

- 79

Tabela 4-2 (continuação)Neste diagrama, a taxa aumenta constantemente de um valor baixopróximo de___________ para um valor alto próximo d e --------------------Um aumento na taxa é chamado aceleração positiva. A aceleração positiva é vista neste diagrama/no diagrama do quadrado acima (marque qual).A aceleração negativa refere-se a um (a)-----------------------------------------

na taxa.A aceleração negativa é vista no diagrama deste quadro/no do quadro acima (marque qual).

Para registrar outros eventos que ocorrem enquanto c animal está respondendo, a pena move-se rapidamente 4 para o sudeste'' e retornanovamente. No diagrama à esquerda, a pena traçou uma linha d e ------para____Nesse ponto, a pena retornará imediatamente para---------------A pequena marca diagonal ("traço ou risco") em --------------------------____foi feita pelo mesmo movimento da pena como mostrado ein d — e.A marca ou risco “sudeste” é frequentemente usada para indicar que uma resposta produziu alguma conseqüência especial.. No diagrama deste quadro, essas respostas foram registradas somente pela marca vertical em ---------------- - e ----------------- •No diagrama deste quadro, uma resposta recebeu uma conseqüência especial e m --------------Na p rá tica , o traço vertical feito por uma umca resposta é muito pequeno para ser facilmente identificado. Entretanto, podemos usara --------------------- da curva em qualquer ponto como um indicador válido da taxa de resposta.No diagrama, a taxa foi mais alta entre_____ e ________zero entre -

— e ------ -- e de um valor intermediário entre____e _____ _________

T abela 4-2 (continuaçao)

/ /

/ £ | '00 ,1' g>50

S 5 10Sl ------- 1------- L_M inutos

Quando os degraus são tão pequenos que nao podemos contar as respostas, podemos ainda determinar o número de respostas entre dois ponto no registro usando uma escala.No diagrama deste quadro, a porção vertical da escala à direita nos diz que aproximadamente respostas foram emitidas entre a e b

no registro cumulativo à esquerda.Se o papel se move muito devagar, não será possível medir acuradamente o tempo entre duas respostas, mas ainda assim podemos determinar o tempo passado entre dois pontos escolhidos^No diagrama deste quadro, a porção horizontal da escala à direita nos diz que as respostas a e b do registro cumulativo à esquerda ocorreram com um intervalo de aproximadamente minutos.

d

f -----/ £ 5 10a £ ---- ------»

a M inutosMD&

No diagrama a esquerda, após completar cerca de 100 respostas entre a e b , o animal parou por um curto p e r ío d o J " q

- " ~ e então emitiu cerca de ------ ------------- respostas entre c e d

Algumas vezes, uma curva cumulativa e usada para registrar a progressão de um automóvel em movimento e, então, a inclinação indica a velocidade do movimento. Quando uma curva cumulativa é usada para registrar o comportamento anima! a inclinação indica---------------------

“Taxa de resposta” significa o número de respostas por unidade de tempo. Num registro acumulativo, o número de respostas pode ser determinado pela distância percorrida pela pena na direção-------------

Num registro cumulativo o tempo é indicado pela distância percorrida pela pena na direção---------------------------------—

TABELA 4-2

UMA SEQÜÊNCIA DE INSTRUÇÃO PROGRAMADA SOBRE COMO LER UM REGISTRO CUMULATIVO DA RESPOSTA (ADAPTADO DE SKINNER. 1959).

O b

Uma larga tira de papel desenrola-se de um rolo. A ponta do papel move-se vagarosa e constantemente para a esquerda. Uma pena fixasobre o papel traçou uma linha que começa em__________ e terminae m -------------------------—__________________________

O movimento vagaroso do papel sob a pena traçou a linha horizontal de _a ____________ . Em b a pena moveu-se repentinamente

percorrendo uma distância pequena para cima até

No diagrama à esquerda, o papel percorreu uma distância pequena além da posição mostrada no diagrama do quadro acima. A pena fixa traçou uma segunda linha horizontal de _____________ a ____________

No diagrama deste quadro, a pena já ocupou as quatro posições a, b,c, d. Ela ocupou a posição____________primeiro e___________porúltimo.

No diagrama deste quadro, o tempo que decorreu entre c e d fo i--------------do que o tempo que decorreu entre a e b ----------------------------------------------

Ao registrar as respostas emitidas por um organismo, a pena move-se para cima e traça uma linha vertical curta cada vez que uma resposta é emitida. No diagrama à esquerda, um experimento começou quando a pena estava em a. A primeira resposta ocorreu emNo diagrama, tres respostas toram emitidas rapidamente e com uma taxa constante em ----------------------- --------------- e ---------------------- —

Tabela 4-2 (continuação)

No diagrama a esquerda, as três respostas registradas em a foram emitidas _____________ rapidamente do que as três em b,------------------

Quanto mais rápido o responder, tanto ---------------- as pausas entre as respostas.Quanto mais alta é a taxa de respostas, tanto — .-------------- a linha horizontal traçadapela pena entre respostas sucessivas.No diagrama do último quadro, quanto mais rápido o responder, tanto_______________

a inclinação da linha em degraus.A taxa de resposta é mostrada pela____________ de linha em degraus.

As respostas no diagrama a esquerda começam com uma taxa relativamente alta em a. O tempo entre as respostas sucessivas torna-se progressivamente_____________ __ ______________________________No diagrama, a inclinação da primeira parte da curva traçada pela pena começando em a é relativamente_________________________________

A que se parecem as curvas cumulativas típicas do processe de fortalecimento instrumental? As curvas vistas na Fig. 4.2 são os registros de quatro ratos individualmente submetidos ao procedimento que descrevemos acima. As curvas indicam que o processo de fortalecimento é abrupto.

Tempo (minutos)

Figura 4.2 - Algumas curvas típicas de respostas acumuladas obtidas de ratos famintos no dia do fortalecimento de uma resposta de pressão a barra pela primeira vez. Como cada resposta produz uma pelota de alimento, os traços de alimento estão omitidos (Skinner, 1938).

0 efeito da conseqüência especial de alimento nem sempre ocorre imediatamente, mas uma vez que ocorre, há uma mudança abrupta para uma nova e alta taxa de resposta que é mantida no restante do experimento.

4.4 MUDANÇAS NA TAXA RELATIVA

Uma segunda maneira conveniente de observar o processo de fortalecimento da resposta é considerar as mudanças de taxa na resposta selecionada em relação as mudanças de taxa que ocorrem em todo o substrato das atividades que ocorrem na situação. Por exemplo, numa demonstração do fortalecimento da resposta de pressionar a barra para uma classe de graduaçã do Cornegie Institute of Technology foram registrados os seguintes comportament' de um rato, em 15 min, de nível operante, e 15 min subsequentes de fortalecimento d? ^ssão a barra.

Rp = atividades de pressão à barra.= farejar= Puxar uma pequena corrente pendurada no teto

Ra = cheirar a bandeja de alimentoRb = Estender uma pata em direção a um bloco de chumbo colocado em um dos can

tos.Ri = permanecer imóvel por aproxjnv«dar\vnre ’9 seg contínuos.

- 8 4 -

As freqüências dessas atividades durante o nível operante e durante o fortalecimento estão representadas nos histogramas da Fig. 4.3.

Rp Rf Rc Ra Rb Ri

COMPORTAMENTOS

Figura 4.3 - Freqüências relativas de vários comportamentos que ocorrem numa caixa experimental antes e depois do fortalecimento do comportamento de pressionar a barra

Olhando a Fig. 4.3, vemos claramente que não apenas a taxa de pressão a barra aumentou, mas as taxas das outras atividades não associadas com alimento na situação diminuíram.

4.5 - MUDANÇAS SEQÜENCIAIS NO RESPONDER

As modificações comportamentais que acompanham o fortalecimento de uma dada resposta se estendem além dessa resposta para muitas outras atividades. Em particular, quando o alimento é dado ao animal, todas as atividades envolvidas na obtenção de alimento são também fortalecidas. Mas o fortalecimento não se limita simplesmente ao aumento na sua freqüência. Uma mudança na ordem em que o animal emite certos comportamentos ocorre no fortalecimento instrumental. Uma ordem particular é rapidamente estabelecida e mantida. No experimento de pressionar a barra, a seqüência é (1) pressionar a barra, (2) aproximar-se da bandeja de alimento, (3) pegar o alimento (4) ingerí-lo, (5) aproximar-se da barra. (1) pressionar a barra... Em resumo, um elo contínuo de comportamento foi formado pela operação de tomar o alimento contingente à pressão à barra. Esse elo é bastante diferente do padrão de seqüência de resposta vistas no ní'^1 operante. Dois membros do elo estabelecido 1 e 2, servirão para ilustrar este ponto. Ignoremos, por um momento, todos os outros comportamentos possíveis na situação e limitemos nossa atenção ao ( 1) pressionar a barra e (2 ) aproximar-se da bandeja (U*

- 8b

alimento. Antes do fortalecimento da pressdo à barra, essas duas respostas ocorrem de tal modo que, quando o animal emite uma delas, é provável que ele repita essa rnesma resposta novamente em vez de emitir a outra (Frick e Miller, 1951). Assim, uma seqüência bastante típica de pressão à barra (Rp) e respostas de aproximar-se da bandeja (Ra), no nível operante, pode ser:

Rp Rp Ra Rp Rp Rp Ra Ra Ra . .

Durante o fortalecimento, essa seqüencia muda rapidamente para a alternação:

Rp Ra Rp Ra Rp Ra . ..

e dificilmente será visto outro padrão (Millenson e Hurwitz, 1961). Não se sabe quão rapidamente esse processo ocorre, mas sob condições favoráveis, parece provável que s ja quase tão instantâneo quanto a mudança na taxa absoluta de pressão à barra.

4.6 - MUDANÇAS NA VARIABILIDADE

Um indivíduo nunca emite um ato duas vezes exatamente da mesma forma. Assim como cada vez que escrevemos nosso nome, fazemo-lo ligeiramente diferente, assim também cada vez que o rato pressiona a barra, ele o faz de um modo ligeiramente diferente. Algumas pressões são feitas com a pata esquerda, algumas com a direita, algumas vom o nariz e algumas com o ombro. Mesmo assim, agrupamos todos esses casos e dizemos que a classe de respostas que chamamos pressões à barra é constituída de todas as possíveis maneiras de pressionar uma barra. Durante o fortalecimento de tal classe de resposta, estamos realmente fortalecendo esses casos individuais de respostas, cada uma das quais difere ligeiramente de seus semelhantes.

Esse fortalecimento dos membros da classe de comportamentos que constituem a pressão a barra tem um efeito marcante na forma final em que o comportamento se estnbelece. Enquanto inicialmente, no nível operante, o rato tende a pressionai a barra de muitas maneiras diferentes, depois do fortalecimento, tende a fazê-lo de poucas maneiras. Em outras palavras, os casos individuais tornam-se cada vez mais semelhantes. Expressamos este resultado dizendo que a topografia do comportamento se restringe durante o fortalecimento instrumental. A topografia de uma resposta refere-se à maneira pela qual o animal emite a resposta. Estritamente falando, a topografia parece dizer respeito aos músculos realmente empregados no momento da ocorrência da resposta. 0 registro de tais eventos, todavia, apresenta dificuldades. Como uma tentativa para fazer isso, pode-se empregar uma câmara para fotografar o animal no momento em que a resposta é concluída. Guthrie e Horton (1946) tiraram fotografias de gatos e cães quando o comportamento que produzia uma conseqüência especial era o de inclinar uma vara que estava no centro da caixa do animal. A Fig. 4.4 ilustra alguns exemplos extremos da estereotipia do comportamento depois do fortalecimento. Cada animal adota uma topografia idiossincrática e só se afasta dela em qualquer ocasião determinada apenas em detalhes. Um exemplo surpreendente de estereotipia humana no comportamento instrumental apren dido é visto na Fig. 4.5.

— 86 —

‘ r f t i ' t f h d i d i

Figura 4.4 - Desenhos das respostas de dois gatos e um cão em emissões sucessivas de uma resposta de inclinar uma vara (Kimble, 1956, segundo Guthrie e Horton, 1946).

4.7 - OPERANTES E ESTÍMULOS REFORÇ ADORES

Em resumo, então, os quatro efeitos do fortalecimento de uma resposta são:1 — aumentar a taxa desta resposta em relação ao seu nível operante;2 — aumentar a taxa dessa resposta em relação à táxa de outro comporta

mento que está ocorrendo na situação;3 — transformar num elo, que é sempre repetido, o padrão ou seqüência das

respostas envolvidas;4 — aumentar a estereotipia da resposta selecionada.

A pressão à barra, o puxar a corrente, explorar com o nariz, inclinar uma vara e assim por diante são atos convenientes escolhidos pelos experimentalistas para estudar esses efeitos. A adequação desses comportamentos para o estudo do fortalecimento operante depende criticamente da sua capacidade de serem modificados como foi descrito. Formalmente, esses e outros comportamentos, assim fortalecidos, são definidos como operantes. Os quatro efeitos do fortalecimento constituem o que chamaremos, daqui por diante, de leis do fortalecimento operante. Pressões à barra e outros comportamentos simples dos animais são escolhidos para estudar essas leis porque eles são facilmente observados e medidos pelo experiinçntador e facilmente executados em várias taxas pelo organismo. No decorrer deste texto, continuaremos a ampliara aplicabilidade dessas leis e do termo operante muito além de pressão à barra e ratos.

- 87 -

Na sua lei do efeito, Thorndike enfatizou a importância de certas consequencias espeicais do comportamento. Eventos que eram “satisfatórios” , dizia ele, e que seguiam o comportamento, atuavam de modo a fixar aquele comportamento. Embora chamar tais eventos de satisfatórios possa, à primeira vista, parecer uma especificação independente e útil das conseqüências especiais, o fato é que fornecer uma definição satisfatória para “satisfatória' 1 é difícil. No caso do animal, não temos uma maneira de saber se um evento é satisfatório, salvo pela observação de se ele atua no comportamento de acordo com as leis do fortalecimento operante. No caso do ser humano podemos pensar que a satisfação possa ser facilmente identificada, mas tente definir o termo. Coisas satisfatórias são aquelas das quais gostamos, mas quais são essas coisas? Em última instância, as coisas de que gostamos são aquelas que trabalharemos para obtçr. Mas dizer que trabalharemos por elas é outra maneira de dizer que faremos por elas o que o nosso rato fará “ por” alimento. Somos, então, levados à conclusão de que a definição dessas conseqüências especiais é melhor concebida em termos de seus efeitos especiais no comportamento.

Figura 4.5 - Ted Williams completando suas 2.000 rebatidas no primeiro turno e 2.001 rebatidas no quinto turno de um jogo disputado no Yankee Stadium em 11 de agosto de 1955 (The New York Times and Patrick A. Burns).

Em resumo, temos um grupo de conseqüências especiais, especiais porque quando usadas em conexão com operantes, como fizemos na seção 4.2, resultam em mudanças características de comportamento.

Uma lista parcial de tais conseqüências é conveniente. Para seres humanos e animais superiores

AlimentoÁguaSexoCalorNovidade

funcionam dessa maneira.

- 8 8 -

Uma conseqüência é sempre uma mudança no ambiente de um indivíduo. A apresentação de alimento para nosso rato foi uma mudança 110 seu ambiente previamente sem alimento. A conseqüência de pedir um copo d’água pode ser um novo ambiente onde o copo d’água aparece na mão de um amigo. A conseqüência de tirar o telefone do gancho é um novo ambiente que agora inclui o sinal de discar. Poderíamos estender tais exemplos indefinidamente. Note, nosso ambiente foram definidas, no contexto dos reflexos e do condicionamento Pavloviano, como estímulos. É, então, evidente que, ao falar de um certo grupo especial de conseqüências, nada mais estamos fazendo do que delimitando, pelos seus efeitos especiais sobre operantes, um certo subconjunto de estímulos. Podemos convencionalmente definir aqueles estímulos que, ao seguirem o comportamento operante, atetam-no através das leis do fortalecimento operante, como estímulos reforçadores (S+) ou simplesmente reforçadores. A operação de apresentar um reforçador denominaremos de reforçamento.

Diz-se, algumas vezes, que os tenros operante e reforçamento são circulares. Parece que cada um é definido em termos do outro. Reforçadores parecem ser definidos como aqueles eventos que fortalecem operantes; mas operantes parecem ser definidos como aqueles comportamentos que são suscetíveis de fortalecimento pelos reforçadores. O “pequeno experimento imaginário’ que se segue mostra como a circularidade pode ser quebrada.

Imagine um experimentador ingênuo diante de um Marciano. Ele observa um “organismo” que nunca viu antes. O organismo faz alguma coisa. O experimentador, de sua mala de conseqüências, apresenta uma aleatória. Será que o organismo executa novamente esse comportamento com maior freqüência ou será que a conseqüência não tem efeito algum? Se não, talvez o experimentador tente novamente outra conseqüência ou tente, talvez, a mesma conseqüência, mas selediona outro comportamento. Por um processo de tentativa e erro, o experimentador pode descobrir certas conseqüências e certos comportamentos que funcionem das maneiras descritas nas seções 4.3 a 4.6. Tendo descoberto uma conseqüência especial, ele pode continuar a usá-la para descobrir outros operantes. Tendo encontrado um operante, ele pode continuar a usá-lo para descobrir outras conseqüências. Pouco a pouco, o experimentador persistente construirá seus conceitos de “ reforçadores ” para o Marciano e “operantes” do Marciano apenas através de tais operações.

4.8 - 0 PARADIGMA DO FORTALECIMENTO OPERANTE

O que temos discutido no fortalecimento operante é diversamente mencionado na literatura de psicologia como suscetiva, de ensaio e êrro, aprendizagem de efeito, aprendizagem instrumental, condicionamento instrumental, aquisição, condicionamento Tipo R (para resposta), aprendizagem operante e condicionamento operante. Preferimos restringir o termo fortalecimento operante para as condições em que o comportamento que é reforçado já existe com uma certa força, maior do que zero, no momento em que o fortalecimento é iniciado. Contudo, ao examinarmos outras fontes, é útil reconhecermos a equivalência desses vários nomes para o processo de fortalecimento.

Estamos agora em condições de dar uma definição compreensiva do paradigma do fortalecimento operante. Tal como o condicionamento Pavloviano, ele tem quatro aspectos: um. Dado, um Procedimento, um Processo e um Resultado.

- 89 -

DADO : 1 — Uma resposta operante sendo emitida numa freqüência maior do que zera2 - Um reforçador apropriado.

PROCEDIMENTO: Seguir cada emissão do operante selecionado com o estímulo reforçador.

É útil representar o procedimento de fortalecimento operante simbolicamente. O procedimento pode ser representado simplesmente como:

R - > S+

Onde R representa uma classe de resposta operante (constituída de r j , r2 . . . rn), S+ representa um estímulo reforçador e a seta é lida como “produz” ou “conduz a”.

PROCESSO: Um aumento abrupto na taxa do operante, sua incorporação rápida num elo de comportamento e uma restrição na topografia do operante.

RESULTADO: O mesrrto que no processo.

4.9 - OPERANTES VOCAIS

As atividades humanas que chamamos linguagem constituem possivelmente, o mais complexo de todos os padrões de comportamento humano. Até o presente momento, a linguagem é ainda tão única para o organismo humano que pode muito bem ser tomada como uma das propriedades principais que definem a espécie. Os elementos comuns de todas as linguas são os sons produzidos pela vibração do ar que é expelido dos pulmões e que passa através de um grupo de músculos na laringe, chamados de cordas vocais. A tensão desses músculos, à medida que o ar passa através deles, está sob o mesmo tipo de controle que governa os movimentos de outras partes do corpo. Conseqüentemente, a produção do som é comportamento operante. A região maxilar, os lábios e a língua agem em combinação com a laringe para moldar os sons e produzir mais de quarenta sons humanos diferentes, conhecidos como fonemas, os quais são usados em várias combinações nas línguas. Devido ao fato de que os sons dos fonemas são diretamente dependentes dos movimentos do aparelho vocal, a medida da produção do fonema constitue uma medida indireta do comportamento, do mesmo modo que a medida da pressão a barra constitue uma medida indireta dos movimentos realizados pelo rato ao pressionar esta barra.

A linguagem humana desenvolve-se a partir de sons não refinados, emitidos pelas crianças. De um modo surpreendente, um bebê, durante os primeiros 5 meses de vida, emite todos os sons usados em todas as línguas fiumanas — nasais e fricativas francesas, guturais germânicas, e assim por diante (Osgood, 1953). Esses sons são emitidos independentemente de estímulos eliciadores e devem ser distinguidos do choro real de um bebê. Durante os primeiros meses de vida, um bebê exibe um nível operante muito alto de produção de sons. Ele pode ficar horas produzindo sons de gargarejo estalos com a língua, sibilos, gritos e roncos. O termo técnico balbucio é empregado para denotar a emissão espontânea desses comportamentos. Um progresso importante no balbucio ocorre por volta de seis meses, quando a estrutura seqüencial do balbucio é alterado de modo que a criança tende a repetir sua própria produção vocal (gu-gu, dá-dá, lá-lá, etc).

As mudanças que ocorrem do balbucio à fala são complexas e um único gráfico não

- 9 0 -

é suficiente para descrever completamente o progresso. Todavia, uma mudança importante que ocorre é a mudança na freqüência relativa dos diferentes sons pronunciados, à medida que o bebê cresce. Assim, na França, os fonemas envolvidos no r francês e as vogais nasais são fortalecidos pela comunidade que reforça — os pais da criança, seus companheiros de brinquedos e, eventualmente, seus professores. Em países de língua inglesa, um grupo diferente de fonemas é modelado em palavras por uma comunidade reforçadora diferente. O resultado desse fortalecimento pode ser inferido de um grupo de histogramas semelhantes aos da Fig. 4.3, porém mais complicados. Na Fig. 4.6, são vistos os histogramas das freqüências relativas de 12 fonemas vocálicos (veja o Apêndice A neste capítulo, para sua explicação) para crianças de várias idades e adultos. Podemos inferir que o reforçamento desses sons ajusta a sua freqüência àquela da comunidade adulta.

c<u60ctfCoo<L>O,

recém-naícido _ -23-24 meses —

— 5-6 meses -

J Z ti I e £ « A e o D o U u

A dulto----

i I e C s A e o o o U u

Figura 4.6 - Perfis da freqüência de fonemas vogais, mostrando a mudança gradual da freqüência relativa em direção a um padrão típico do adulto na comunidade reforçadora das crianças (Irwin, 1952).

Uma prova mais direta dos efeitos de se reforçar sons produzidos pela criança surge de experimentos de laboratório. Num experimento, o comportamento de bebês de 3 meses de idade foi observado enquanto eles permaneciam em seus berços. Durante duas sessões de observação, um experimentador adulto recurvava-se sobre o berço a uma distância um pouco maior do que 30 cm da criança e permanecia relativamente sem movimento e sem expressão. Durante esse período, um segundo observador registrava a freqüência de sons produzidos pela criança. Em duas sessões subseqüentes, o procedimento foi o nesmo, exceto que o primeiro experimentador seguia cada som que não fosse choro com um^sorriso”, três sons utsk” e um leve toque aplicado no abdomen da criança com os dedos da mão”. (Rheingold, Gewirtz e Ross, 1959, p. 28). Isto, natural mente, é apenas:

R(balbucio) —> ^(sorrisos, sons, tocar o^abdomen)

O efeito do procedimento foi um aumento da freqüência do balbucio bem acima da sua taxa ao nível operante durante essas sessões de fortalecimento.

O experimento demonstra a natureza operante dos sons humanos. Muitos' outros animais emitem sons, alguns dos quais são reforçáveis e outros não. Um chimpanzé foi criado, desde o nascimento, com uma família que tentou ensiná-lo a falar. (Hayes, 1951). A tarefa foi difícil, porque o macaco, à primeira vista, não emitia som operante algum. Os únicos sons que produzia eram gritos reflexos quando alimento ou outros eliciadores

- 91 -

apareciam, e sons CR aos estímulos que haviam sido previamente emparelhados com esses eliciadores. Mrs. Hayes tentou seguir o seguinte procedimento

o p PI _j_°1 (visão do alimento) (g ri to excitado) S (alimento) [4.1]

na esperança de fortalecer a CR (gritar), reforçando-a. 0 procedimento foi seguido por muitos meses mais não foi efetivo, mostrando que o comportamento respondente condicionado não está sob o controle de suas conseqüências. Eventualmente, um som ahhhà emitido apareceu, espontaneamente, num dia e mostrou-se ser reforçável. O macaco aprendeu, eventualmente, a dizer Mam^ Papa e Cup através de procedimentos que discutiremos num capítulo posterior.

É interessante especular sobre a importância da história de f4.ll para a produção eventual do operante “ahhha”. Foi £4.1) um precursor necessário para esse operante, ou com a mera passagem do tempo poderia o macaco tê-lo desenvolvido, de qualquer modo, na ausência de [4.1]? Uma das dificuldades principais para o desenvolvimento da fala (como a conhecemos) no macaco é a ausência de balbucio. Enquanto um bebê balbucia para si mesmo por horas sem fim, num estágio comparável de desenvolvimento, o bebê chimpanzé permanece quieto. Em geral, por vários dias, o chimpanzé não pronuncia um único som. Logicamente, um nível operante maior que zero é um requisito para fortalecimento, pois alguma coisa deve existir para se reforçar.

Em experimentos com outros animais, verificou-se que o ladrar de cães, o miar de gatos e alguns dos sons das aves são reforçáveis. Nestes casos, a freqüência da produção de sons pode ser aumentada marcadamente, através de suas conseqüências especiais.

4.10 - A EXTENSÃO DO FORTALECIMENTO OPERANTE

O fortalecimento operante é um fenômeno que, de algum modo, é limitado aos comportamentos simples de animais e crianças que discutimos até agora. Estudamos o animal porque podemos controlar rigorosamente seu ambiente passado e presente. Mas o comportamento operante isto é, o comportamento que pode ser fortalecido por suas conseqüências constitui uma grande proporção das atividades cotidianas dos homens Quando chutamos uma bola de futebol, cozinhamos uma galinha, discutimos a última moda, lamentamos o tempo e lavamos os pratos, estamos constantemente emitindo muitos operantes. Com efeito, estamos emitindo algum operante em cada momento de nossa vida. Na verdade, nossos operantes são freqüentemente arranjados em seqüências mais complicadas do que a simples cadeia repetitiva do rato na seção 4.2 *Mas como veremos em capítulos posteriores, uma complexidade surpreendente pode ser também gerada ao nível do rato, gato, pombo e macaco.

Não é difícil demonstrar o fortalecimento operante em seres humanos. Dadas as condições do paradigma do fortalecimento operante, podemos realizar demonstrações em nossos amigos sem grandes dificuldades. A principal consideração adicional é que acharemos a demonstração mais drástica e convincente se impedirmos nosso sujeito humano de “ tornar cônscio” de que estamos realizando um experimento de fortalecimento. O “ tornar-se cônscio”é uma maneira dedizer que o sujeito é capaz de verbalizar o procedimento que está sendo efetuado. Este “estar cõnscio” verbal é um índice seguro de que o comportamento que estamos tentando fortalecer estará agora sob o controle poderoso de anos de história passada, com o qual a aplicação de um paradigma de

- 92 -

fortalecimento de, digamos, 30 min. com um reforçador fraco terá pouca possibilidade de competir.

Num delineamento experimental interessante, baseado nos trabalhos iniciais de W. Verplanck (1955) um assistente de pesquisa de graduação foi usado como um (‘ator** para tentar fortalecer certo comportamento de conversa em alunos de graduação (Centers, 1963). O assistente e o sujeito eram colocados numa sala, ambos esperando ostensivamente serem chamados para um experimento de psicologia. Na verdade, este era o experimento. Durante esse tempo, o assistente estabelecia uma conversa com o sujeito que de nada suspeitava e, em vários períodos, reforçava diversos tipos de conteúdo de conversa, tais como demonstração de opinião, fornecimento de informação e perguntas, com concordância -e atenção especial. Enquanto isso, sem conhecimento do sujeito, a conversa estava sendo gravada e observada através de um espelho unidirecional.

A “conversa” experimental durava 30 min. sendo dividida em três períodos de 10 min. Durante o primeiro período, ou nível operante, o assistente procurava não demonstrar concordância ou fornecer respostas informativas às opiniões e perguntas do sujeito. Durante os 10 minutos seguintes, o período de fortalecimento comportamental o assistente concordava com, ou parafraseava favoravelmente, todas as demonstrações de opinião emitidas pelo sujeito. Além disso, ele expressava atenção, simpatia, e compreensão para todas as informações propostas e reforçava todas as perguntas ou dando a informação solicitada ou concordando e aprovando, se era isto o que a pergunta indicava desejar. Durante os 10 min. finais, o assistente ou discordava das opiniões do sujeito ou permanecia silencioso depois que elas eram verbalizadas. Ele ignorava as informações fornecidas e era o mais alheio possível às questões.

Os resultados do reforçamento de concordar (fortalecimento) indicaram claramente que a freqüência de demonstração de opinião e fornecimento de informação, em relação a todas as proposições, aumentou. Além disso, nenhum sujeito notou este condicionamento de seu comportamento. Por razões desconhecidas aos experimentadores, o fazer perguntas não mostrou qualquer fortalecimento e assim, de acordo com a nossa definição, ele não constitui uma classe operante.

Num nível diferente de desenvolvimento, Brackbill (1958) fortaleceu com sucesso uma resposta de sorrir em bebês de 4 meses de idade, utilizando o contato físico como reforçamento.

O próprio cientista está empenhado num empreendimento que exige, frequentemente, a emissão de muitos operantes, poucos dos quais são reforçados. Comportamentos que levam à proposição de novas relações, ou de uma nova ordem entre os conceitos, uma descoberta de um novo fenômeno e assim por diante, são reforçados pela comunidade científica. Entre os reforçadores proeminentes para os behavioristas, está a ordem observada quando se vê que algum comportamento de um indivíduo está regularmente relacionado às suas conseqüências, como no caso da pressão a barra pelo rato da seção 4.2. Essa lembrança de que o próprio pesquisador é um organismo que se comporta, sujeito às leis do fortalecimento operante, caracteriza o desenho visto na Fig. 4.7.

A verificação das leis do fortalecimento operante no comportamento humano é importante, porque isto mostra que apesar das diferenças aparentes muito grandes entre homem e animal existem certas similaridades funcionais. São essas similaridades que, em úítima instância, justificam o nosso estudo da psicologia através do comportamento de organismos inferiores. Afinal de contas, o Psicólogo está principalmente interessado no comportamento humano, o a mais exatamente dos comportamentos, que são cornparti-

93 -

Figura 4.7 - Rapaz, este cara está condicionado. Cada vez que eu pressiono a barra, ele joga uma pelota aqui dentro” . (Adaptado com permissão de Jester Columbia College).

lhados por ambos, seres humanos e animais superiores. Frequentemente, utilizamos sujeitos animais em nosso trabalho experimental por razões pragmáticas. Podemos controlar mais facilmente o ambiente imediato e passado do animal. Podemos privá-lo de agentes tais como alimento e água, de modo a utilizá-los mais tarde como reforçadores poderosos. Finalmente, podemos observar continuamente o animal por períodos longos de confinamento.

O uso de animais na pesquisa em psicologia segue uma tradição longa e respeitada na ciência, a de controlar e isolar condições relevantes, de modo a revelar a regularidade básica na natureza. Talvez, a classe mais importante de variáveis independentes em psicologia diga respeito à história passada do indivíduo. Um sujeito humano chega até nós com uma história passada longa, complicada e incompletamente conhecida. 0 fato de que mais ou menos uma hora de reforçamento fraco de operantes apenas parcialmente especificados possa resultar numa modificação comportamental detectável, como no experimento de Centers (1963), deve ser tomado como um tributo à natureza fundamental dos processos que isolamos a partir do estudo animal.

4.11 - SUPERSTIÇÃO

Dizer que o reforçamento é contingente a uma resposta pode significar apenas que ele segue a resposta e não implica necessariamente numa ligação física direta entre a resposta e o reforçador. O reforçamento pode ser mediado pelo comportamento de um experimentador, ou por algum outro aparelho automático. 0 efeito do reforçamento no comportamento é indiferente aos meios pelos quais a correlação temporal entre R e S+ é efetuada. O poder automático do reforçamento em fortalecer o comportamento nos lembra que, do mesmo modo que o condicionamento Pavloviano, sempre que as condições temporais para o procedimento de fortalecimento operante são alcançados (na selva, no lar, no laboratório), é provável a ocorrência de modificações no comportamento.

Quando nos lembramos de que o processo de fortalecimento é quase sempre virtualmente instantâneo, não nos surpreenderíamos ao descobrir que o fortalecimento do comportamento pode ocorrer mesmo em situações onde existe apenas uma coincidência fortuita entre uma dada R e a ocorrência do S+. No experimento realizado por Skinner (1948), um pombo faminto foi colocado numa caixa não diferente daquela vista na Fig.

- 94 -

4.1. Não havia, no entanto, uma barra nesta caixa e o alimento consistia dc pequenas porções de grãos misturados que poderiam ser fornecidos através do alimentador. Cada 15 segundos, o alimento era automaticamente apresentado ao pombo, não importando o que ele estivesse fazendo no momento. Sob essas condições, 6 entre 8 pombos rapidamente desenvolveram respostas caracteristicamente diferentes mas estereotipadas. Um pombo desenvolveu um movimento circular contrário aos ponteiros do relógio, completando duas ou três voltas entre os refçrçamentos. Um segundo pombo repetidamente estendia sua cabeça em direção a um dos cantos superiores da gaiola. Outro apresentou um movimento de “balançar a cabeça'’ no plano vertical. Os outros três pombos desenvolveram uma variedade de outros movimentos bizarros da cabeça e do corpo, característicos.

O processo de fortalecimento casual é, em geral, aparente. Por acaso, o animal estava executando alguma resposta no momento em que o alimento era fornecido. Essa coincidência fortalece essa resposta e, assim, torna-a mais provável de reaparecer novamente e ser reforçada uma segunda vez. Uma vez iniciado, o processo se perpetua. Como Skinner salientou, pode-se dizer que o experimento demonstra um tipo de superstição.

“O animal comporta-se como se existisse uma relação causai entre seu comportamento e a apresentação do alimento, embora tal relação não seja real. Existem muitas analogias no comportamento humano. Os rituais para mudar a sorte de alguém com cartas são bons exemplos. Poucas conexões acidentais entre um ritual e as conseqüências favoráveis são suficientes para estabelecer e manter o comportamento, apesar dos muitos casos não reforçados. Um outro exemplo é o do jogador de boliche que lança a bola fora da pista, mas continua a se comportar como se estivesse controlando-a através da curvatura e torsão de seu braço e ombro. Esses comportamentos não têm, naturalmente, efeito real algum sobre a sorte de alguém ou sobre a bola a meio caminho fora da pista, tal como, no presente caso, o alimento apareceria com a mesma freqüência se o pombo nada fizesse — ou, estritamente falando, se ele fizesse outra coisa qualquer” (Skinner, 1948, p. 171).

4.12 - CONDICIONAMENTO OPERANTE

O fortalecimento operante é um caso especial do que chamaremos mais tarde de um modo mais geral de condicionamento operante. O termo condicionamento é algo infeliz neste contexto porque ele lembra a natureza eliciada do comportamento respondente. Contudo, o fortalecimento operante e o condicionamento Pavloviano têm certas similaridades importantes. Em particular, as modificações do comportamento observadas em ambos os paradigmas são condicionais a alguma história passada anterior. Num caso, a história é um emparelhamento de um S^com um S2 - No outro, é a história de uma determinada R que ocorre imediatamente antes de um S+. É essa natureza condicional das mudanças comportamentais que justifica o uso do termo condicionamento para ambos. Na medida em que as diferenças importantes entre os dois fenômenos sejam sempre lembradas, não há perigo algum em empregar o termo “condicionamento” , qualificado que seu adjetivo apiopriado, Pavloviano ou operante. Todavia para evitar o perigo que advem de se negligenciar essas diferenças, limitamos geralmente o termo condicionamento para o paradigma Pavloviano e utilizaremos outros termos (por exemplo, fortalecimento) para nos referirmos às várias modificações operantes que estudaremos nos capítulos que se seguem. A Tabela 4.3 apresenta algumas comparações diretas entre os dois

tipos de modificações comportamentais que são frequentemente chamadas de condicionamento.

Tabela 4.3

COMPARAÇÃO ENTRE O CONDICIONAMENTO PAVLOVIANO E OPERANTE

CONDICIONAMENTOPAVLOVIANO

CONDICIONAMENTOOPERANTE

PARADIGMA OU

PROCEDIMENTO

Sr

CR R -»S ^

NATUREZA DA

A ____________

CR está sob o controle de S\ (CR pode ter elementos em comum R2) R é emitida

PROCESSOCR é gradualmente evocada

por S\

R aumenta em freqüência sua topografia é reduzida e ela é incorporada a um elo de comportamento.

RESULTADO Formação de alguns comportamentos novos (CR) aSl

Fortalecimento de uma R já existente no repertório comportamental.

COMO É MEDIDOProbabilidade da CR a S\ magnitude da CR, latência da CR.

Taxa de R, forma de R ordem seqüencial relativa a outras Rs que ocorrem

CORRELATOSFISIOLÓGICOS

Em geral envolve músculos lisos e glândulas.

Em geral envolve músculos do esqueleto.

IMPORTÂNCIA PARA A PSICOLOGIA

Envolvido na emoção. Possivelmente, parte do substrato motivacional.

Pedra fundamental para aquisição de atividades complexas de solução de problemas.

- 9 6 -

APÊNDICE A

A tabela seguinte é a chave para os fonemas apresentados na abscissa da Fig. 4-6.

SÍMBOLO EXEMPLO

j o i na palavra fria

1 o i na palavra fácil/

e o a n/á palavra mesa

e o é da palavra fé, seguido do a de rua

X intermediário entre o á de já e o é em fé

A primeiro a da palavra cama

0 som aberto do é na palavra fé

a o a da palavra caro, um pouco mais demorado

c o o na palavra nó

0 como em vou

V o o da palavra porque

u como o u na palavra uva


Brackbill, Yvonne. Extinction of the smiling responses in infants as a function of the reinforcement schedule. Child Develpm., 1958, 29, 115-124.

Centers, R. A laboratory adaptation of the conversational procedure for the conditioning of verbal operants. /. abnorm. soc. Psychol., 1963, 67, 334-339.

Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. NTew York: Appleton-Century-Crofts, 1957.

Frick, F. C., and Miller, G. A. A statistical description of operant conditioning Amer. / . Psychol.. 195 1, 64, 20-36.

Guthrie, E. R., and Horton, G. P. Cats in a puzzle box. New York: Rinehart, 1946.

- 9 7 -

Hayes, C. The ope in ourMause ifevv York Harper and Row, 1951.Irwin, O. C. Infant spcech: development of vowel sounds. / . speech

hearing Disorders, 1952, 17 ,269-279 .Mednick, S. A. Learning. Englewood ClifTs: Prentice-Hall, 1964.Millenson, J. R., and Hurwitz, H. M. B. Some temporal and sequential

properties of behavior during conditioning and extinction. / . exp . Anal. Behav., 1 9 6 1 ,4 ,97 -105 .

Osgood, C. E. M ethod and theory in experimental psychology. New York: Oxford Univcr. Press, 1953.

Rhcingold, II. L., Gewirtz, J. L., and Ross, H. W. Social conditioning of vocalizations in the infant. / . comp, physiol. Psychol., 1959, 52, 68-73.

Skinner, B. F. The behavior of organisms. New York: Appleton-Cen- tury, 1938.

Skinner, B. F. Superstition in the pigeon. / . exp. Psychol., 1948, 38, 168-172.

Skinner, B. F. Walden two. New York: Appleton-Century-Crofts, 1948.Skinner, B. F. A case history in scientific method. A m er . Psychologist,

1956 ,11 ,221-233 .Skinner, B. F. The experimental analysis of behavior. Amer. 5c/., 1957,

45, 343-371.Skinner, B. F. Cumulative Record. New York: Appleton-Century-Crofts,

1959.Spencer, H. The principles of psychology. New York: D. Appleton,

18/78.Verplanck, W. S. The cçntrol of the content of conversation. / . abnorm.

soc. Psychol., 1955, 51, 668-676.

- 9 8 -

Capítulo 5 - EXTINÇÃO E RECONDICIONAMENTO DO OPERANTE

Quando a conexão entre uma resposta operante e seu reforçador é abruptamente desfeita, o resultado é um processo comportamental característico. As características deste processo, que é chamado extinção, representam uma parte importante na instalação e manutenção de padrões comportamentais complexos, sendo por isso examinadas com alguns detalhes neste capítulo.

Historicamen te, o conceito de extinção tem tido uma evolução vagarosa e difícil. O enfraquecimento característico do comportamento (isto é, o declínio em sua freqüência) visto sob o procedimento de extinção foi considerado pelos primeiros pesquisadores como um mero artefato do fortalecimento concorrente de outros comportamentos ‘ competitivos’ . A suposição de que a extinção não poderia ser explicada em termos de uma operação de fortalecimento concomitante em qualquer outra parte na corrente de comportamento veio somente com a descoberta de que a extinção acarreta mais do que o enfraquecimento (diminuição na freqüência) de uma única classe de resposta.

Quando se permite que um operante, previamente reforçado, ocorra sem a conseqüência usual de reforçamento, numerosas respostas não reforçadas ocorrem. Essas respostas são, no início, emitidas com uma alta freqüência, maior mesmo do que quando elas estavam sendo reforçadas. Esse aumento imediato na taxa de resposta está correlacionado com mudanças na topografia e magnitude do comportamento que o implicam como emocional. Um rato, treinado anteriormente a pressionar uma barra por alimento, atacará vigorosamente e morderá a barra quando o reforçamento for omitido. O rato, tal como um homem incapaz de achar suas chaves no bolso, onde ele, usualmente,as encontrava, mostra efeitos que podem ser designados como “ raiva”. Além dessas mudanças comportamentais na taxa e topografia, o elo de comportamento, anteriormente bem estabelecido, degenera-se, voltando aos padrões de atividades vistos antes do fortalecimento. Ao mesmo tempo, à medida que a extinção continua, os comportamentos previamente suprimidos pelo fortalecimento da resposta selecionada começam a retornar à sua proe- minência antiga no repertório de resposta do animal. Muitas dessas mudanças ocorrem gradualmente, estendendo-se por um período de muitas horas. De fato, o processo de extinção é tão demorado, mesmo seguindo uns poucos reforçamentos, que é seguro dizer que provavelmente nenhum estudo delineou o processo em todos os seus aspectos, até seu ponto final.

- 9 9 -

5.1 MUDANÇAS NA TAXA DE RESPOSTA DURANTE A EXTINÇÃO

O declínio na taxa de uma resposta anteriormente reforçada é o efeito mais claio da extinção. As mudanças na taxa são claramente vistas numa curva cumulativa, onde elas nparecem como flutuações ondulatórias superpostas numa aceleração negativa geral. A Fig. 5-1, ilustra a curva de extinção a resposta de pressão à barra de um rato, anteriormente acostumado a receber uma pelota de alimento para cada pressão a barra. A taxa de resposta é mais alta no início (imediatamente após a retirada do reforçamento) e diminui gradualmente durante o período de uma hora e meia. Ao fim de 90 min. o rato está respondendo numa taxa apenas ligeiramente maior do que a do seu nível operante.

omo a Fig. 5-1 mostra, a curva de extinção é muito irregular e contém muitos períodos íl alta atividade intercalados com períodos de pouca atividade (as porções planas da

curva). Esses últimos tornam-se mais proeminentes próximo ao fim da extinção. Alguns

Figura 5-1. Uma curva de extinção para uma resposta de pressão a barra anteriormente reforçada (De Skinner, 1938 dados de í7. S. Keller e A. Kerr).

p v.iüisadores supuseram que o processo de extinção é devido principalmente a um aumento gradual no número desses períodos inativos no decorrer do tempo e que> qua ido o organismo responde, ele o faz na sua taxa alta usual. Hurwitz (1957) apresentou dados sugestivos que suportam essa noção. Ele analisou um número de curvas similares as da Fig. 5-1, dividindo-as em intervalos sucessivos de tempo de 2 min. Dividiu, então, os intervalos em duas classes, dependendo de quantas respostas eles continham. Aqueles que continham zero ou somente uma resposta, ele chamou de silenciosos . aqueles que continham duas ou mais, ele chamou de "ativos". Hurwitz descobriu que o número de respostas nos períodos k ativos’ não declinava a medida que a extinção progredia, mas que mais e mais intervalos tornavam-se "silenciosos". Seus resultados para

trupo de animais estão resumidos na Fig. 5-2.

Intervalos sucessivos de 2 min. (A)

10 20 30t

40 50 60

Intervalos sucessivos de 2 min. (B)

Figura 5-2. Análise do responder durnnte a extinção. (Segundo Hurwitz, 1957).

/ -5.2 - MUDANÇAS T0P0GJRAFICAS E ESTRUTURAIS NA EXTINÇÃO

Os efeitos da extinção não se limitam a mudanças na freqüência de uma determinada resposta. Ocorrem, em particular, mudanças marcantes na forma do comportamento durante a extinção. Num estudo de Antonitis (1951), onde foi estudado o operante do rato de introduzir o focinho por entre uma fenda de uma das paredes, mediu-se os efeitos de várias sessões de extinção intercaladas com fortalecimento. Uma parede da gaiola utilizada por Antonitis continha uma fenda horizontal de 50 cm de comprimento. Sempre que o rato introduzia o focinho dentro da fenda, um raio de luz era interrompido, sendo tirada uma fotografia do rato no momento exato em que a resposta era dada. Media-se a posição em que o rato estava ao longo da fenda, naquele momento, e o ângulo que seu côrpo formava com uma linha perpendicular à fenda. A Fig. 5-3 ilustra o aparelho.

Figura 5-3. Representação pictorial da resposta estudada por Antonitis (195 1 ).

- 101 -

Reforçando, com aliipento, a colocação do focinho na fenda, a freqüência desse comportamento foi primeiro aumentada acima do nível operante. Subsequentemente, o colocar o nariz na fenda foi extinguido, refortalecido, reextinguido e refortalecido novamente. Confirmando os resultados de Guthrie e Horton (1946) com a resposta de inclinai uma vara em gatos e cães, Antonitis notou que o ângulo e a posição da resposta tendiam a se tornar estereotipados durante o fortalecimento: o animal limitava suas respostas a uma região restrita da fenda. A extinção, entretanto, produziu uma variabilidade no comportamento de colocar o focinho na fenda pelo menos tão grande quanto a que foi observada durante o nível operante: o animal variou suas respostas sobre o comprimento inteiro da fenda. Finalmente, o refortalecimento resultou em maior estereotipia (respostas mais restritas) do que o fortalecimento original havia produzido.

Resultados similares foram obtidos por Notterman (1959), que estudou a força com que um rato pressionava a barra durante o nível operante, fortalecimento e extinção. Uma descoberta adicional emergiu dos dados de Notterman. Os registros individuais revelaram forças ocasionais, emitidas durante a extinção, que excediam qualquer observação anterior, tanto no nível operante como no fortalecimento. Retornaremos a essa descoberta mais tarde, nas discussões de diferenciação e habilidades.

O elo ou cadeia de comportamento estabelecida pelo reforçamento degenera-se quando se retira o reforçamento para os operantes. Frick e Miller (1951) forneceram a ratos 300 reforçamentos espaçados durante 5 sessões pelo pressionar uma barra, no aparelho mostrado na Fig. 5-4. (Note que a bandeja de alimento, neste aparelho, está um pouco mais distante da barra do que na caixa-protótipo usada por Skinner, já descrita). Após o 300^ reforçamento, obteve-se um registro de 24 horas de extinção para cada rato. Durante a extinção, Miller e Frick observaram a degeneração da cadeia... Rp Ra Rp Ra . . . fortalecida. À medida que a extinção progredia, começavam a suceder-se pressões à barra (Rp Rp, etc.) e idas à bandeja (Ra Ra etc.). Houve pouca tendência para o padrão se tornar aleatório durante a extinção. Ao contrário, o padrão fortalecido de Rp Ra Rp Ra . . . gradualmente, deu lugar ao padrão do nível operante, o de ocorrências repetidas da mesma resposta. Talvez deva ser enfatizado que este resultado não foi, de modo algum, forçado logicamente. O elo de comportamento poderia ter simplesmente diminuído em freqüência durante a extinção, embora permanecendo intacto.

Em resumo, o efeito do procedimento de extinção é induzir um processo gradual de comportamento cujas mudanças incluem diminuição na freqüência da resposta, aumento na variabilidade da forma e intensidade da resposta e quebra estrutural da seqüência do comportamento. Estas são todas propriedades importantes da extinção e serão mencionadas frequentemente, daqui por diante, como mecanismos explicativos.

5.3 RESISTÊNCIA À EXTINÇÃO

Se se peimitisse que o processo de extinção se completasse, os estados de nível operante poderiam eventualmente ser alcançados. O tempo para que isso*ocorra é aparen temente um índice da persistência do indivíduo em face à extinção. Em experimentos reais, uma volta ao nível operante raramente, se alguma vez é alcançada.

Consequentemente, medidas mais convenientes e práticas da persistência ectão baseadas na rapidez com que a taxa de resposta diminui durante a extinção. Por exemplo, o número de respostas emitidas ou a quantidade de tempo até o ponto em que algum critério de taxa baixa é alcançado, são chamados medidas de resistência à extinção.

- 102 -

Foto célula

Figura 5-4. Aparelho usado pára estudar as mudanças na seqüência do comportamento durante o fortalecimento e extinção (Frick e Miller, 1951).

A maneira pela qual os valores reais dessas medidas são obtidos é ilustrada na Fig 5-5, onde a curva de extinção da Fig. 5-1 reaparece.

Figura 5-5. Uma curva de extinção da pressão à barra apòs o fortalecimento. No ponto a nenhuma resposta havia sido emitida por cinco minutos consecutivos (segundo Skinner,1938, dados de F.S. Keiler e A. Kerr).

Suponha que adotemos o critério arbitrário de qué, se em qualquer momento durante a extinção, mais de 5 min decorram sem uma ocorrência da resposta selecionada, a extinção deve ser considerada ‘completa’ para todos os objetivos práticos e devemos, então, terminar nosso experimento. Examinando, então a Fig. 5-5, nosso experimento terminará em a. Neste ponto, nenhuma resposta ocorreu por 5 min, 130 respostas foram emitidas e 32 min se passaram. Qualquer um desses dois últimos valores, juntamente com a especifi-

cação do critério de taxa baixa (nenhuma resposta durante 5min), serve como um índice da resistência à extinção.

Um critério diferente pode afetar o resultado da resistência a extinção. Na Fig. 5-5, por exemplo, um critério de 5 minutos sem resposta teria sido bastante frouxo, já que muito mais respostas, bem acima da taxa no nível operante, ainda seriam emitidas. Por outro lado, se tivéssemos escolhido 10 minutos sem resposta, os 90 minutos do experimento de Keller e Kerr não seriam suficientes para alcançar o nosso critério, uma vez que nenhuma pausa de tal duração ocorreu. A fim de evitar a natureza arbitrária de um critério de extinção, muitos pesquisadores prosseguem com o procedimento de extinção até que a inclinação geral da curva indique que a função está próxima de sua assíntota. Então, o número de respostas emitidas em qualquer tempo arbitrariamente conveniente, daí em diante, pode facilmente ser lido no registro cumulativo como a resistência à extinção. Esse procedimento é ilustrado no ponto b da Fig. 5-5 onde, em 1 hora, a resistência à extinção é definida como 190 respostas.

A resistência à extinção fornece um índice comportamental quantitativo cuja relação com um número de operações experimentais é de interesse. Oportunamente, referir- nos-emos a estudos em que a resistência à extinção é a principal variável dependente comportamental. Na vida real, estamos frequentemente interessados em saber o quão persistente será uma pessoa face a nenhuma recompensa. Diz-se que um homem, cuja resistência à extinção é baixa, "desiste muito f acilmente” “ ou” "não tem perseverança’' diante de uma tarefa difícil. Por outro lado, muita resistência à extinção é algumas vezes indesejável. O homem que passa muito tempo, improdutivamente, tentando restabelecer uma relação amorosa interrompida, pode perder uma boa chance de uma relação nova e melhor.

Uma das variáveis que inicialmente se suspeitava afetar a resistência à extinção era a quantidade de fortalecimento anterior. Parecia plausível que, se muitos reforçamentos fortalecedores fossem dados, a resistência à extinção poderia ser maior do que se apenas poucos fossem fornecidos. Essa hipótese geral foi confirmada por vários experimentos (Williams, 1938; Perin, 1942 ; Hearst, 1961) que indicaram que a resistência à extinção de um operante é baixa quando apenas alguns reforçamentos são dados no fortalecimento, aumentando, gradativamente até alcançar um máximo depois de 50 e 80 reforçamentos.

Outra variável que provavelmente afetaria a persistência de uma resposta à extinção seria o esforço despendido na resposta Mowrer e Jones (4943) levantaram a hipótese de que as respostas que exigem grande esforço são mais rapidamente extinguidas do que as que requerem menos esforço. Esta previsão foi confirmada num estudo realizado por Capehart, Viney e Hulicka (1958) que treinaram ratos a pressionar uma barra para obter alimento. Eles variaram a força necessária para pressionar a barra durante o fortalecimento, de modo que, em algumas sessões, uma barra pesada era apresentada e, em outras, uma leve ou uma intermediária Os animais foram, então, divididos em três grupos, um dos quais foi extinguido na barra pesada, outro na barra leve e o último, na barra intermediária. Usando um critério de nenhuma resposta em 5 minutos como índice de resistência à extinção, eles obtiveram a função vista na Fig. 5-6.

O delineamento desse experimento é bem diferente daqueles que consideramos até aqui. Nas representações gráficas dos efeitos comportamentais neste e em capítulos anteriores, apresentamos dados obtidos com um só sujeito. Algumas vezes, a representação gráfica consistiu de médias de vários sujeitos mas, em todos os casos, cada

- 1 0 4 -

Peso da barra (gramas)

sujeito foi submetido a um procedimento idêntico e completo. Por completo,queremos dizer que o comportamento dq sujeito foi medido em cada valor empregado para a variável independente. Ouso dei vários sujeitos e a média dos resultados é apenas uma tentativa de eliminar erros aleatórios de medidas, que perturbam todo experimento.Em certos estudos comportamentais, contudo, é impossível sujeitar o mesmo indivíduo a mais do que um valor da variável independente sem introduzir novas variáveis perturbadoras. Este é geralmente o caso quando a resistência à extinção é a variável dependente. Para medir os valores da resistência à extinção para cada um dos vários valores de nossa variável independente, teríamos que obter várias curvas de extinção do organismo. Mas, após o fortalecimento original num valor determinado da variável independente, existe apenas uma curva de extinção. Para obter outra deveríamos, ou fortalecer c comportamento ou usar outro sujeito. 0 primeiro caso é justificado somente se ascurvas sucessivas de extinção depois do fortalecimento e refortalecimentos repetidos fererr- idênticas. Acontece, contudo (ver seção 5.6) que elas não o são. Na verdade, elas são sistematicamente diferentes. Então, não temos outro recurso para adotar senão o de usar um sujeito diferente ou grupo de sujeitos para cada condição experimental.

Consequentemente, Capehart, Viney e Hulicka extinguiram a resposta de um rate numa barra de 5 gramas, outro numa de 40 gramas e um terceiro numa de 70 gramas. Deste modo, eles evitaram o problema de como obter curvas de extinção inicial para o mesmo rato em todos os três pesos da barra. Mas, ao fazerem isso, eles introduziram uma nova fonte de erro de medida: as diferenças individuais entre os sujeitos devido a outros fatores como diferenças genéticas ou diferenças não controladas na história passada. Para fazer uma média dessas diferenças individuais entre os sujeitos, média esta que poderia obscurecer qualquer efeito que o esforço da resposta pudesse ter, os pesquisadores replicaram essencialmente o experimento 9 vezes mais e fizeram uma média de seus resultados, usando, ao todo, um total de 27 sujeitos (9 ratos para cada uma das três condições diferentes). Embora a suavidade da sua função que relaciona a resistência à extinção ao peso da barra ateste o sucesso de sua estratégia, seus resultados (e todos os resultados simillares) devem ser interpretados com cautela. Em seu experimento, nenhum sujeito experimentou os três valores da variável independente na extinção. Logo, a generalização do resultado para qualquer organismo individual depende da suposição de que, se fosse possível obter uma curva de extinção inicial para os três valores diferentes da variável independente num único indivíduo, os resultados de tal procedimento corresponderiam aos resultados obtidos ao se sujeitar indivíduos diferentes às diferentes condições experimentais. Em geral, procuramos evitar essa suposição sempre que possível e recor

- 1 0 5 -

remos a tais funções de grupo (das quais a Fig. 5-6 é um exemplo) somente quando, como neste caso, aparentemente não tivermos outra escdha. Sempre que tivermos uma escolha, é preferível realizar um experimento completo com um sõ sujeito, expondo-o a todas as condições em que estamos interessados. A confiabilidade de nossos resultados pode, então, ser avaliada através de replicações completas de nosso experimento com sujeitos adicionais.

Exercício: Sem consultar a literatura de psicologia, veja se você pode delinear um experimento para testar o efeito do número de reforçamentos durante o fortalecimento na resistência à extinção. Você teve que usar um delineamento de grupo (como Capehart, Viney e Hulicka) ou foi capaz de usar um delineamento individual (como a função de Anrep na Fig. 3-10).?

5.4 - RECUPERAÇÃO ESPONTÂNEA

A extinção pode ser prolongada até que a taxa de um operante anteriormente fortalecido tenha alcançado um nível baixo. Se o sujeito (por exemplo, um rato numa caixa de Skinner) é, então, retirado da situação e colocado de volta um pouco mais tarde, outra, curva de extinção (menor) será obtida (ver Fig. 5-7).

Figura 5-7. Recuperação espontânea da extinção de uma resposta de pressão à barra de um rato. As porções da curva à direita e à esquerda da linha vertical foram separadas por 47 horas durante as quais o organismo esteve fora da situação (Skinner, 1938).

Mesmo que nenhum fortalecimento tenha ocorrido entre as duas sessões de extinção, ocorre uma certa quantidade de aumento espontâneo na força da resposta.

A quantidade de recuperação espontânea (quando medida pela resistência à extinção da segunda curva de extinção) depende, até certo ponto, do intervalo de tempo entre o fim da primeira extinção e o início da segunda. Os efeitos da recuperação espontânea podem ser vistos num intervalo tão pequeno quanto 15 min entre as duas sessões de extinção, na situação de pressionar a barra. O efeito aumenta até cerca de 2 horas de intervalo, depois do que nenhum aumento adicional na recuperação espontânea ocorre. Os fenômenos da recuperação espontânea têm sido assunto para muitas especulações, mas seus pressupostos mecanismos estão além da perspectiva de uma proposição introdutória.

- 106 -

5.5 CONDICIONAMENTO E EXTINÇÃO SUCESSIVOS

Na seçáo 5.4, dissemos que a primeira extinção após o fortalecimento original é um fenômeno único. Extinções posteriores (depois de refortalecimentos) diferem da primeira extinção porque são mais rápidas e contêm um total menor de respostas. O efeito é documentado pelos dados de Bullock e Smith (1953). Eles expuseram ratos a 10 sessões diárias de um procedimento onde se reforçava as 40 primeiras respostas à barra, seguindo-se diretamente 1 hora de extinção. Quando as curvas de extinção foram examinadas, notou-se que elas tornavam progressivamente menores da sessão 1 a 1 0 . O efeito é visto na Fig. 5-8. Enquanto que, na sessão 1, a média da resistência à extinção em 1 hora foi 50 respostas, na sessão 10 isto havia caído para 10 respostas apenas.

Esses resultados podem ser extrapolados para além de dez sessões. Parece que apenas poucas sessões a mais seriam necessárias para que o animal alcançasse o que é chamado extinção numa tentativa. Na extinção numa tentativa, apenas uma única resposta é emitida após a retirada do reforçamento. A mudança no comportamento torna-se abrupta e parece razoável concluir que o organismo passa a discriminar o procedimento de extinção como tal. Poucas respostas em extinção é a regra, no nível humano. Muitas de nossas próprias respostas mostram uma diminuição rápida, quando cessa o reforçamento. Não continuamos a inserir moedas numa máquina de cigarros ou de doces quebrada, quando não obtemos aquilo que pagamos. Ouando abrimos a caixa do correio e descobrimos que está vazia, não continuamos a abri-la. Como os ratos de Bullock e Smith, aprendemos a esperar pelo nosso reforçamento.

Resultados tais como os de Bullock e Smith não deixam dúvidas de que os processos- de extinção sucessiva são diferentes. De fato, eles formam um subprocesso progressivo, à medida que tendem a uma assíntota de uma resposta por período de extinção O que acontece, contudo, se cada período de extinção é prolongado até alcançar a taxa de nível operante? Será cada extinção sucessiva ou pouco mais rápida, que a precedente? Pouca informação existe para responder à questão com autoridade, mas dados não publicados coletados por J. L. Kerr e J. R. Mülenson (1957) mostraram que, quando a pressão à barra de um rato era extinta até ao ponto onde duas sessões consecutivas fossem iguais ou menores do que a taxa ao nível operante, um efeito similar ao de Bullock e Smith era

10

5

Figura 5-8. Curvas medias de respostas acumuladas durante 1 hora de extinção Os números à direita de cada curva iden

tificam a sessão (segundo Bullock e Smith, 1953).

10 20 30 40 50 60Minutos

- 107 -

jLinda obtido. A Fig. 5-9 mostra o resultado desse procedimento para um animal efetuado em quatio desses ciclos de condicionamento e extinção.

50

*8 40s

Figura 5-9. Resistência à extinção num rato em função de procedimentos sucessivos de ^ 30condicionamento e extinções com volta ao 3nível operante (dados não publicados de cKerr e xMillenson 1957) ’g

8 20 H ‘í>£*o 10

5.6 ESQUECIMENTO E EXTINÇÃO Números de ciclos de condicionamento-extinção

Devido ao fato de que o esquecimento e a extinção estão ambos associados a um enfraquecimento do comportamento, eles são frequentemente confundidos. Na extinção, o enfraquecimento está associado à emissão de respostas não reforçadas na situação previamente associada com reforçamento. No esquecimento, o efeito do reforçamento é enfraquecido pela simples passagem do tempo, durante o qual o indivíduo não está na situação previamente associada com o condicionamento. O esquecimento pode ser estudado, fortalecendo-se, em primeiro lugar, um operante e, então, permitindo que se passe um tempo considerável e, finalmente,extinguindo esse operante. Quando isso é feito nas condições controladas da caixa de Skinner, a curva de extinção resultante é muito semelhante aquelas obtidas logo após o fortalecimento. A Fig. 5-10 mostra uma comparação entre duas curvas médias de respostas acumuladas, uma obtida de um grupo de ratos extinguidos 1 dia depois do fortalecimento original e a outra obtida de ratos extinguidos 45 dias depois do fortalecimento original. Os 44 dias de diferença de tempo parecem ter tido apenas um efeito muito pequeno em comparação com o efeito do procedimento de extinção real.

Figura 5-10. Curvas de extinção obtidas 1 dia após o fortalecimeno oiiginal e 45 dias após o fortalecimento original (Skinner, 1938)

30 60Minutos

- 1 0 8 -

Existem' ainda resultados mais surpreendentes que apoiam a noção de que a mera passagem do tempo entre o condicionamento e a extinção tem, espantosamente, pouco efeito. Um grupo de pombos foi treinado, no aparelho visto na Fig. 5-11, a bicar uma chave ou disco iluminado, obtendo alimento. Depois do fortalecimento da resposta de bicar a chave, os animais foram transferidos para o biotério. Quatro anos mais tarde. retomaram ao aparelho e foram testados no procedimento de extinção. Embora os pombos não tivessem visto o disco por mais de 1.400 dias, eles começaram a bicá-lo, imediatamente e deram centenas de respostas em extinção (Skinner, 1950).

Existe uma vasta literatura sobre o esquecimento do comportamento verbal humano. Antes do início do século vinte, Ebbinghaus memorizou listas das chamadas sílabas sem

Figura 5-11. Aparelhagem usada para o estudo do comportamento operante de pombos.

sentido (Ver Fig. 5-12) e registrou a perceniagem de sílabas das quais ele se lembrava em vários períodos de tempo. O uso de sílabas sem sentido ao invés de palavras foi uma tentativa de eliminar fatores de significado e familiaridade que poderiam influenciar os resultados, caso fossem usadas palavras comuns. Ebbinghaus observou (ver Fig. 5-13) que uma queda marcante na retenção ocorria durante as primeiras 8 horas depois de aprendidas as listas. Depois disso, o processo de esquecimento aproximava-se muito lentamente de uma assíntota. Quase a mesma quantidade podia ser relembrada 31 dias ou2 dias depois da aprendizagem.

- 1 0 9 -

BIK NAXFigura 5-12. Uma lista de sílabas sem sentido para o estudo da aprendizagem ZUR KIBverbal e esquecimento. JEK VOD

ZOT MEFYIN BEW

Figura 5-13. Curva de esquecimento, de Ebbinghaus para sílabas sem sentido (segundo Ebbinghaus, 1885, de Keller e Schoenfeld, 1950).

Sílabas sem sentido são facilmente esquecidas. Outros materiais verbais não são tão rapidamente perdidos. A Fig. 5-14 mostra curvas de esquecimento para três tipos de materiais: poesia, prosa e sílabas sem sentido.

Porque as curvas de extinção de animais mostram efeitos tão pequenos depois de passado longo tempo, enquanto um homem pode esquecer mais da metade do que ele aprende em poucas horas? É essa uma superioridade não esperada do rato e do pombo em relação ao homem? Talvez seja, mas encontramos uma explicação mais conveniente ao considerarmos a atividade que interve'm duranie a passagem do tempo nos dois tipos de experimentos. Nos experimentos com animais, o animal é removido da situação experimental e tem pouca chance de emitir respostas que se assemelhem ao operante

Figura 5-14. Curvas de esquecimento mostrando a retenção para diferentes tipos de materiais (segundo Guilford, 1938 e Kendler, 1963).

- 1 1 0 -

fortalecido. No biotério, os animais não experimentam quaisquer situações muito semelhantes às de sua caixa de treinamento. O homem, por outro lado. após memorizar trechos de palavras - sejam palavras sem sentido, prosa ou poesia - não é abruptamente removido de seu ambiente verbal. Ao contrário, ele continua a usar palavras (aprendidas) e a experimentar situações com um certo grau de similaridade com o ambiente onde a memorizaçãov/'riginal foi feita. Sempre que as situações mudam radicalmente depois da aquisição, o esquecimento não é tão grande. As habilidades de datilografia são apenas um pouco afetadas depois de um ano ou mais sem se praticar. Longe da máquina de escrever, as chances de uma pessoa executar respostas similares à datilografia são pequenas. Nadar e andar de bicicleta são duas ilustrações adicionais de habilidades que são retidas por ]ongos períodos sem prática.

Sempre que uma resposta especial é fortalecida num novo ambiente, diferente de qualquer um encontrado na situação cotidiana, o esquecimento é reduzido. Isto é verdadeiro tanto para o homem como para jó animal. É difícil transportar um homem, abruptamente, de uma situação de aprendizagem para um outro ambiente completamente diferente. Jenkins e Dallenbach (1924) tentaram fazer isso. Seus sujeitos aprenderam uma lista de sílabas sem sentido logo antes de dormir. Os sujeitos foram, então, acordados em vários intervalos após a aprendizagem e solicitados a se recordarem da lista que

Horas dcsdc a aprendizagem

Figura 5-15. Curvas mostrando o número de sílabas relembradas após dormir ou ficar acordado (adaptado de Jenkins e Dallenbach, 1924)

haviam aprendido anteriormente. Os resultados (Fig. 5-15) foram comparados com aqueles obtidos de um grupo de sujeitos que não foram dormir após terem aprendido a lista, mas continuaram com suas atividades cotidianas usuais. Aparentemente, o que é feito durante a passsagem do tempo é crítico na determinação de quanto esquecimento ocorre. Podemos convenientemente considerar que, no caso mais extremo de “esquecimento” , ocorre extinção normal e completa, isto é, a resposta é emitida repetidamente, mas sem reforçamento, até que pare de ocorrer. Em outros casos reais, algum enfraqueci

- 111 -

mento ocorre devido à similaridade de outros comportamentos com o comportamento aprendido e à similaridade dos ambientes durante o fortalecimento e o esquecimento.

5.7 - UMA DEFINIÇÃO COMPREENSIVA DE EXTINÇÃO OPERANTEO procedimento de extinção faz surgir o processo de extinção. Como vimos o

processo de extinção consiste, em parte, de um declínio na taxa de resposta. Um número de outros processos comportamentais tais como fadiga, habituação e saciação envolve um declínio similar e devemos ser cuidadosos ao distinguí- los. Se um declínio na taxa de resposta é tudo o que observamos, provavelmente, encontraremos dificuldades para dizer qual processo está envolvido. Ao teorizar posteriormente, podemos atribuir um declínio na taxa de resposta à extinção de certas outras respostas, as quais não estão sendo medidas, mas apenas supostas. Esse é um exemplo de como os conceitos bem conhecidos (por exemplo, extinção) são usados como pedras fundamentais para erigir um edifício explanatório para um processo mais complexo e menos compreendido. Mas devemos estar atentos ao atribuir todos os declínios de taxa a uma presumível extinção. Quando possível, recorra à definição compreensiva de extinção:

DADO: uma resposta ooerame pieviamente lortaleciüd.PROCEDIMENTO: i'etjra<ia do relorçamemo para o operante.

Em notação simbólica:

R, ou R -fr

PROCESSO: 1 - um declínio gradual, algo irregular, na taxa, marcado por aumentos progressivos na freqüência de períodos relativamente longos de não- resposta.2 _ um aumento na variabilidade da forma (topografia) e da magnitude da resposta.3 — um rompimento gradual no elo ordenado do comportamento fortalecido.

RESULTADO: os processos comportameniais aproximam-se dos estados do nível operante como valores limitantes.

5.8 - A EXTENSÃO DOS CONCEITOS DE EXTINÇÃO

A diminuição da força da resposta vista na extinção experimental não se limita a ratos e pombos de laboratório. Isto é demonstrado pela pesquisa original relatada por C. D. Williams, aqui reproduzida integralmente do “Journal of Abnormal and Social Psychology”.

A ELIMINAÇÃO DO COMPORTAMENTO DE BIRRA ATRAVÉS DFPROCEDIMENTOS DE EXTINÇÃO.Carl D. Williams, University of Miami.Este trabalho relata o tratamento bem sucedido do comportamento de birra numacriança do sexo masculino, pela retirada do reforçamento. O sujeito (S) tinhaaproximadamente 2 1 meses de idade. Havia estado seriamente doente durante os

- 112 -

primeiros 18 meses de vida. Sua saúde melhorou, então, consideravelmente e ele adquiriu peso e vigor.

O S, agora exigia o cuidado e a atenção especiais que lhes haviam sido dados durante os meses críticos. Ele impunha alguns de seus desejos, especialmente na hora de dormir, através de um comportamento de birra para controlar as ações de seus pais.

Os pais e uma tia revezavam-se para colocá-lo na cama à noite e à tarde, na horada sesta. Se o pai (ou a mãe) deixava o quarto depois de colocar o S na cama, elo gritava a esperneava até que o pai (ou a mãe) voltasse ao quarto. Assim, não se podia deixar o quarto até que S dormisse. Se o pai (ou a mãe) começava a ler enquanto estava no quarto, S gritava até que o material de leitura fosse posto à parte. Os pais sentiam que S gostava deste controle sobre eles e que se esforçava durante o tempo mais longo possível para não dormir. Em qualquer ocasião, os pais estavam gastando de meia hora a duas horas, cada vez que colocavam a criança para dormir, esperando no quarto até que dormisse. ^

Após um parecer médico a respeito da condição física de S, foi decidido retiraro reforçamento desse comportamento de birra. Consistente com o princípio deaprendizagem de que, em geral, o comportamento que não é reforçado será extinto, um dos pais ou a tia colocava o S na cama dê uma maneira agradável e relaxada. Depois dos agrados característicos da hora de dormir, deixava-se o quarto e se fechava a porta. O S gritava e chorava, mas o pai (ou a mãe) não voltava ao quarto. A duração dos gritos e do choro era medida a partir do momento em que a porta era fechada.

Os resultados são vistos na Fig. 5-16. Pode ser observado que S continuou gritando por 45 min na primeira vez em que foi colocado na cama, na primeira série de extinção.

55504540

0 351 30 O 25.S _ 20O" O

5

1 2 3 4 5 6 7 8 9 !0

Vezes '■ m que a criança foi colocada para dormir

Figura 5-16. Duração d< . oro em duas se'rires de extinção em função d; ocasiões sucessivas de ser colocado na c.-una (Williams. 1

- 113

O S não chorou a segunda vez que íoi posto na cama. Isso talvez seja atribuível à sua fadiga de chorar na ocasião 1. Pela décima sessão, o S não mais choramingava, esperneava ou chorava quando os pais deixavam o quarto. Em vez disso, ele sorria quando eles saiam. Os pais notaram que ele emitia sons alegres até cair no sono.

Cerca de uma semana mais tarde, o S gritou e esperneou após a tia tê-lo colocado na jama, provavelmente refletindo uma recuperação espontânea do comportamento de birra. A tia reforçou, então, o comportamento de birra, voltando ao quarto do S e lá permanecendo até que ele dormisse. Foi, então, necessário extinguir o comportamento uma segunda vez.

A Fig. 5-16 mostra que a segunda curva de extinção é semelhante a primeira. Ambas as curvas são similares às curvas de extinção obtidas com sujeitos subhumanos. A segunda série de extinção atingiu o zero na nona ocasião. Nenhuma birra posterior, na hora de dormir, foi relatada durante os dois anos seguintes.

Deve ser enfatizado que o tratamento, neste caso, não envolveu punição. Tudo o que se fez foi suspender o reforçamento. Ocorreu, então, extinção do comportamento de birra.

Nenhum pós-eíeito ou efeito colateral indesejável desse tratamento foi observado. Aos três anos e 9 meses de idade, S parecia ser uma criança cordial, expressivae“esperta”.

O uso do procedimento de extinção é geral, então, para enfraquecer a força de qualquer operante. Em capítulos posteriores, veremos outras numerosas maneiras de manipular a força do comportamento. Mas apenas com a aplicação simples de duas operações principais — reforçamento e extinção podemos variar amplamente a força do comportamento. A força do comportamento é um conceito importante na psicologia devido a sua relação estrita com a probabilidade de ocorrência do comportamento. Quando uma resposta existe com alta torça, sua freqüência é alta e a probabilidade de que seja emitida em qualquer tempo determinado é também alta. Estas são, simplesmente, maneiras diferentes de dizer a mesma coisa. Essa afirmação é verdadeira para homens e animais. A análise do comportamento operante é, de modo geral, o estudo da forma e, mais particularmente, da probabilidade de ocorrências de tais comportamentos. Se admitimos que os conceitos do reflexo possam explicar os mecanismos simples da execução de comportamentos tais como postura, caminhar e correr, então o território que resta para a exploração psicológica parecer ser o inicio dos operantes. Logo, nosso interesse centraliza-se em situações que proporcionem uma escolha de comportamentos. Mesmo na simples caixa de Skinner, onde frequentemente uma única resposta é medida, a escolha está presente na “ liberdade” aparente do animal de responder ou não responder. Em geral, nossa preocupação é com as causas do comportamento ou, em termos mais técnicos, com os controles sobre a emissão de respostas. Embora uma seqüência de comportamento possa estar integrada, de um modo reflexo, do inicio até o fim podemos ainda estar interessados em saber porque ela começou. Embora todo este livro consista numa série de respostas propostas a esta questão, já podemos perceber que as operações de condicionamento e extinção fornecem dois princípios explanatórios poderosos. Uma resposta pode não ocorrer, por exemplo, porque foi extinta.

“ Um aspirante a escritor que tenha enviado vários originais aos editores, tendo-os todos rejeitados, pode dizer que ‘não consegue escrever nem mais uma palavra'. Ele pode estar parcialmente paralisado com o que é chamado ‘câimbra de escritor’. Ele pode ainda insistir que ‘deseja escrever’ e podemos concordar parafraseando-o: sua

- 114 -

probabilidade extremamente baixa de resposta é devida principalmente à extinção. Outras variáveis continuam efetivas e, se a extinção não houvesse ocorrido, elas produziriam uma alta probabilidade” (Skinner, 1953, pp. 71-72).

A noção de freqüência ou força de resposta é fundamental para a Psicologia, principalmente porque muitos comportamentos parecem ser explicáveis em termos da freqüência com que as unidades de comportamento ocorrem.

“ Dizemos que alguém é um ‘entusiasta’ do bridge quando observamos que ele joga e fala frequentemente sobre bridge. Estar ‘bastante interessado' em música é tocar, ouvir e falar muito sobre música. O jogador ‘inveterado’ é aquele que joga frequentemente. O fã da fotografia está sempre tirando fotografias revelando-as e olhando as fotos feitas por

Figura 5-17. O poder da extinção. (Desenhado por Opie, 1961, The New Yorker Magazine, Inc.).

- 1 1 5 -

ele e por outros. O ‘erotomaiuaco' frequentemente se ocupa com comportamento sexual O dipsomaníaco’ bebe frequentemente" (Skinner, 1953 p. 62)

Embora nossa análise sobre c ■Míinção esteja muito longe de ser completa neste capítulo, ela ilustra alguns dos principais efeitos conhecidos da retirada do reforçamento na força do comportamento.

5.9 - REPRESENTAÇÕES GRÁFICAS DOS RESULTADOS DE EXPERIMENTOS NOS QUAIS MUITAS VARIÁVEIS INDEPENDENTES SÁO ESTUDADAS EM CONJUNTO.

Neste texto, o principal dispositivo para representar os resultados de experimentos é o gráfico bi-dimensional. Nos casos mais simples, tal gráfico é construído de uma tabela que contém pares de valores de x e y (ver Tabelas 2-2 e 3-1). Nas tabelas, cada valor da variável independente forma um par com um único valor da variável dependente (em geral, uma média de muitos valores observados). Num gráfico simples tal como o da Fig. 5.6, três valores da variável independente (peso da barra) formam um par com as respectivas médias observadas da variável dependente - resistência à extinção — e são indicados como pontos. Então, traçam-se linhas retas conectando (isto é, interpolando-as entre) os pontos. A “ curva” resultante permite-nos ver os resultados num quadro único, relacionando, assim, os dados de um modo que a tabela não faz. Os registros cumulativos são mais sofisticados. Na Fig. 5-1, a variável independente (tempo) é contínua e a interpola- ção é desnecessária já que o registrador cumulativo marca a ocorrência ou não ocorrência de uma resposta (a variável dependente) em cada momento no tempo e não em poucos pontos selecionados.

Algumas vezes um pesquisador deseja num único experimento estudar os efeitos de mais do que uma variável independente. O método comum de representar os resultados quantitativos de tais experimentos é ainda o gráfico, mas a forma ê algo generalizada. Considere as duas funções da Fig. 5-18. Uma delas (A) é simplesmente a Fig. 5-6 reproduzida aqui por conveniência. A outra é a função de Perin (1942) — Williams (1938) •cl acionando

150

i- 010 20 30 40 50 60 70 80 90

N úmero dc reforçamentos

(8)

5 40 70Peso da barra (gramas)

(A)

Figura 5-18. (A) Resistência à extinção em função do peso da barra (Capehart. Viney, e Hulicka, 1958). (B) Resistência à extinção em função do número de reforçamentos prévios (adaptado de Perin, 1942, e Williams, 1938).

- 1 1 6 -

a resistência à extinção da pressão, à barra, no rato, com o número de reforçamentos prévios, que fortaleceram a resposta. Poderíamos supor, para o objetivo da presente discussão que o experimento representado por (A) e (B) na Fig. 5-18 tivessem sido efetuados no mesmo laboratório, com o mesmo aparelho e com as condições controladas de modo que as únicas diferenças entre (A) e (B) consistissem das manipulações da variável independente indicada.

Podemos iniciar nossa análise com a observação de que ambos os gráficos correspondem a nossa fórmula simples de um experimento: uma variável independente ligada a uma variável dependente. Há, contudo, uma relação interessante entre os dois exemplos da Fig. 5-18. Ambos (A) e (B) apresentam a mesma variável dependente, resistência à extinção. Além disso, um exame mais detalhado revela que (A) e (B) têm um ponto em comum. Para ver isso, considere a noção, implícita em (A), de que muitas variáveis foram mantidas constantes; somente o peso da barra foi variado. Analogamente, implícita em (B) está a noção de que muitas variáveis foram mantidas constantes; somente o número de reforçamentos foi variado. Contudo, em (A) uma das variáveis mantidas constantes é a variável independente de (B) e uma das variáveis mantidas constantes em (B) é a variável independente de (A). Especificamente, todos os sujeitos em (A) receberam 90 reforçamentos, enquanto que todos os sujeitos em (B) tinham uma barra que pesava 15 gramas. Portanto, tem um ponto em comum: o ponto que representa 90 reforçamentos com uma barra de 15 gramas.

O elo entre (A) e (B) da Fig. 5-18 torna-se mais claro com a representação gráfica de ambas as funções num mesmo sistema de coordenadas. Será útil empregar um sistema de coordenadas tridimensional, uma vez que há duas variáveis independentes e uma variável dependente. Examine a representação tridimensional de (A) e (B) na Fig. 5-19. Nesta figura, a Fig. 5-18A é mostrada como um polígono sombreado no plano xy enquanto que a Fig. 5-18B é mostrada como uma seção cônica traçada no plano zy.

Z

Figura 5-19. Representação das duas funções da Fig. 5-18 como duas superfícies num sistema de coordenadas tridimensional.

- 1 1 7 -

As duas superfícies interceptam-se nos seus pontos comuns x = 15,2 90. (O fato de que os limites das curvas das duas superfícies não coincidam precisamente pode ser explicado pelas várias diferenças nos dois experimentos além das duas variáveis em consideração).

A Fig. 5-19 é um mapa que mostra o território da resistência à extinção limitado por essas duas variáveis independentes. O mapa mostra que as duas funções da Fig. 5-18 fornecem informação compor tamental acerca dos efeitos do peso da barra e número de reforçamentos somente numa pequena região do espaço possível.

A representação espacial da Fig. 5-19 sugere que o território pode ser mais eficientemente estudado num experimento onde ambas as variáveis independentes sejam manipuladas juntamente de modo a cobrir uma porção maior do espaço experimental. Uma manipulação desse tipo poderia ser uma extensão do experimento de Capehart, Viney e Hulicka (1958) onde o número de reforçamentos fosse manipulado juntamente com o peso da barra. A especificação dos grupos para as várias combinações das variáveis independentes pode ser feita de acordo com o esquema que vem descrito na Tabela 5-1.

Tabela 5-1.Especificação dos grupos de um Experimento para Estudar os Efeitos conjuntos do Número de Reforçamentos Anteriores e Peso da Barra sobre a Resistência à Extinção.

GRUPOS NÚMERO DE REFORÇAMENTOS DADOS NO FORTALECIMENTO PESO DA BARRA

A 50 5B 50 15C 50 30D 100 5E 100 15F 100 30G 300 5H 300 15I 300 30

As curvas hipotéticas da Fig. 5-20 sugerem que tipo de resultado pode ser obtido se os grupos que recebem 30, 90, e 270 reforçamentos fossem estudados, usando-se os três pesos da barra. Na Fig. 5-20, a representação é bi-dimensional, sendo que o valor de uma das variáveis independentes (número de reforçamentos) é mostrado simplesmente como um numeral pequeno à direita de cada curva. Essa representação é uma alternativa para a Fig. 5-19. Representações bi-dimensionais como a da Fig. 5-20 são frequentemente encontradas na literatura e são conhecidos como famílias de curvas, ou a forma paramétrica da representação funcional. Essa última terminologia é uma forma aceita de se mencionar as variáveis independentes que se sabe ou se acredita serem relacionadas a uma dada variável dependente. “Parâmetro” é virtualmente sinônimo de “variável independente” embora seja empregado especificamente para denotar as variáveis independentes relacionadas a uma variável dependente comum.Os parâmetros da resistência à extinção mostrados na Fig. 5-20, são, portanto, peso da barra e número de reforçamentos

- 1 1 8 -

200

150-

Peso da barra (gramas).Figurá 5-20. Representação bidimensional dos resultados hipotéticos da manipulação do peso da barra juntamente com a manipulação do número de reforçamentos. Os pontos em 90 são de Capehart, Viney e Hulicka (1 9 5 8 )Os outros pontos indicados são hipotéticos.

antes da e.Uinção. Evidentemente, o número de parâmetros de qualquer variável dependente pode ser bem grande. Em qualquer experimento particular, contudo, raramente estudamos mais do que um ou dois deles ao mesmo tempo.

EXERCÍCIO 4

Desenhe uma representação paramétrica (bidimensional) de possíveis resultados de um experimento similar ao de H.M. Wolfle (Fig. 3-6). usando quatro valores diferentes de intensidade de S2 - Utilize os dados de Wolfle como uma das suas quatro curvas.

REFERÊNCIA PARA O CAPITULO 5

Antonitis, J. J. Variability of response in the white rat during conditioning and succecding extinction and reconditioning. Unpublished doctoral dissertation, Columbia Univer., 1950.

Antoni,tis, J. J. Response variability in the white rat during conditioning, extinction, and reconditioning. J. exp. P s y c h o l 1951, 42, 273-281.

Bullock, D. H., and Smith, W. C. An effect of repeated conditioniiig- cxtinction upon operant strength. J. exp. Psychol., 1953, 46, 349352.

- 1 1 9 -

Capehart, J., Viney, W., and Hulicka, I. M. The efícct of effort upon extinction. J . comp, physiol, Psychol., 1958, 51, 505-507.

Ebbinghaus, H. Memory (Translated by H. A. Ruger and C. E. Bussen- ius). New York: Teachers College, 1913.

Frick, F. S., and Miller, G. A. A statistical description of operant conditioning. Amer. J. Psychol., 1951, 64, 20-36.

Guilford, J. P. General psychology. Princeton: ,D. Van Nostrand, 1939.Guthrie, E. R., and Horton, G. P. Cats in a puzzle box. New York: Rine

hart, 1946.Hearst, E. Resistance-to-extinction functions in the single organism.

J. exp. Anal. Behav., 1961, 4, 133-144Hurwitz, H. M. B. Periodicity of response in operant extinction. Quart.

J. exp. Psychol., 1957, 9, 177-184.Jenkins, J. G., and Dallenbach, K. M. Oblivcsccnce during sleep and

waking. Amer. J. Psychol., 1924, 35, 605-612.Keller, F /S ., and Schoenfeld, W. N. Principles oj psychology. New York.

Appleton-Century-Crofts, 1950.Kendler, H. H. Basic psychology. New York: Appleton-Century-Crofts,

1963.Kimble, G. A. Principles of general psychology. New York: Ronald

Press, 1956.Mowrer, O. H., and Jones, H. M. Extinction and behavior variability as

functions of effortfulness of task. J. exp. Psychol., 1943, 33, 369386.

Notterman, J. M. Force emission during bar pressing. J. exp. Psychol., 1959, 58, 341-347.

Perin, C. T. Behavior potentiality as a joint function of the amount of training and the degree of hunger at the time of extinction. J. exp. Psychol., 1942, 30 ,9 3 -1 1 3 .

Skinner, B. F. The behavior of organisms. New York: Appleton-Century, 1938.

Skinner, B. F. Are theories of learning necessary? Psychol. Rev., 1950, 57, 193-216.

Skinner, B. F. Science and human behavior. New York: Macmillan, 1953.

Williams, C. D. The elimination of tantrum behavior by extinction procedures. / . abnorm. soc. Psychol., 1959, 59, 269.

Williams, S. B. Resistance to extinction as a function of the number of reinforcements. J. exp. Psychol., 1938, 23, 506-522.

- 1 2 0 -

SEGUNDA PARTE

AS UNIDADES FUNDAMENTAIS DE ANÁLISE

6 . NOTAÇÃO DE CONTINGÊNCIA DE RESPOSTA E ESTÍMULO7. REFORÇAMENTO INTERMITENTE8 . A ESPECIFICAÇAO DA RESPOSTA9. CONTROLE AMBIENTAL

Capítulo 6 NOTAÇÃO DE CONTINGÊNCIA DE RESPOSTA E ESTIMULO

Sistemas elaborados de notação abreviada que expressam as relações entre procedimentos, conceitos e eventos são, comumente desenvolvidos pela ciência. Tais sistemas de notação podem ser convenientes para descrever as operações. Como um meio analítico, a notação pode ajudar a reconhecer as similaridades e diferenças entre procedimentos e simplificar sua classificação, foijando uma maneira para sua eventual integração teórica.

Um sistema desse tipo, altamente desenvolvido e bem conhecido, existe na química. Indicando um elemento particular por um símbolo e definindo as relações entre os elementos (por exemplo, + para combinação; —> produz; A para aplicação de calor), uma descrição parcimoniosa de um procedimento e alguns de seus resultados podem ser rapidamente dados e a relação .áésse procedimento com outros procedimentos semelhantes é facilmente vista. Deve-se salientar, todavia, que em todas as notações usadas com o objetivo de resumir, perde-se alguma informação. Quando o sódio, por exemplo, é adicionado à água, o hidrogênio é liberado e forma-se o hidróxido de sódio. Este procedimento e seus resultados são conveniente e quantitativamente ‘expressados assim

2Na + 2HOH---- > 2NaOH + H2Esta expressão omite grande quantidade de detalhes pelo fato de representar certas relações fundamentais de uma maneira simples e concisa. Ela não informa por exemplo, que esta reação gera calor, não dá qualquer informação a respeito do tempo gasto pela reação e não diz sobre o estado (sólido, líquido, gasoso), em que o produto se apresentará. Apesar dessas limitações, a notação tem se mostrado bastante útil para justificar sua inclusão contínua na química, porque ela descreve convenientemente inúmeros eventos com grande generalidade. Por exemplo, a representação é verdadeira para muitas formas diferentes de sódio (pó, sólido, granular, cristalino), em qualquer hora do dia, numa enorme faixa de temperatura e pressões atmosféricas. Como a maioria das generalizações científicas, todavia, ela não é válida universalmente. Se a temperatura for muito baixa e a pressão atmosférica muito alta, a reação não ocorrerá A representação também não informa que o Na não é um material unitário, mas realmente um número de materiais relacionados (isótopos). Todos eles comportam-se de uma forma muito semelhante para a maioria dos objetivos, o que permite que o rótulo Na seja aplicado a todos como ,na aproximação.

- 1 2 3 -

Os psicólogos estão principalmente interessados nas relações entre as atividades dos organismos e outros eventos no mundo. Um sistema de notação que emprega eventos ambientais e eventos comportamentais como termos fundamentais seria conveniente para descrever inúmeros procedimentos psicológicos e, como veremos, tomaria possível uma comparação analítica das operações. O esquema de notação esboçado em detalhe neste capítulo é derivado de um sistema descrito inicialmente por F. Mechner (1959) e elaborado por Vicki Mechner (1963). Ao contrário do exemplo químico, a notação comportamental que esboçaremos esquematiza somente aspectos de procedimento da experimentação. Nesse sentido ele se assemelha à notação da eletrônica. Nesta, um circuito é representado por símbolos e o resultado de tal circuito, quando uma voltagem lhe é aplicada, deve ser descrito por funções que relacionam as variáveis independentes e dependentes que operam no circuito. Ao ser usada, a presente notação poderia igualmente ser suplementada com funções que relacionem as variáveis independentes (mudanças em eventos ambientais) com as medidas do comportamento.

Ao nível da presente consideração, não tentaremos dar definições formais ou rigorosas para as unidades que empregaremos para descrever os procedimentos comportamentais: estas podem ser encontradas em outros capítulos. O nosso interesse aqui é somente fornecer de uma maneira concisa e com o mínimo de comentários, vários instrumentos de notação através de exemplos e problemas que ilustram os poderes, características e limitações principais da notação R e S que é amplamente usada no decorrer deste texto,

6.1. RESPOSTAS E EVENTOS AMBIENTAIS

A notação incorpora eventos comportamentais sob a fom a de respostas instrumentais (operantes), abreviadas como R. Estas são, naturalmente, comportamentos que são controlados por suas conseqüências. Para os objetivos presentes, podemos definir o comportamento como qualquer coisa que um organismo individual faz. Então, podemos ainda identificar uma resposta como uma unidade de comportamento. A palavra chave na especificação do comportamento é o verbo fazer. Um organismo, para se comportar, deve fazer alguma coisa, deve agir. Assim, temos abaixo exemplos de comportamento e também exemplos daquilo que chamaremos de respostas.

( 1 ) João rebateu a bola.(2) O Sr. Mitty engrenou o carro.(3) Eu levei minha bandeja para a mesa.(4) O rato pressionou a barra.(5) O macaco coçou suas costas.(6 ) Jorge esperou pelo ônibus.

Em todos esses exemplos, algum organismo fez alguma ;oisa. De modo geral, ..entamos especificar a resposta em termos dos movimentos que o organismo faz, ao invés de em termos das conseqüências desses movimentos. Então. “João rebatei a bola” implica e que João levantou os braços de uma certa maneira e em corespondéncia com a direção em que a bola vinha e, como uma conseqüência, a bola é rebatida. É impor;ante, ao princípio, separar os eventos comportamentais de suas conseqüências.Portanto, ( 1) é escrito melhor assim: “ Joao levantou o bastão” : e (3) é ('sciito melhor “Eu movi minhas

- 1 2 4 -

pemas em tal e tal direção, segurando uma bandeja em minhas mãos e, eventualmente, cheguei à mesa”. Chegar à mesa foi uma conseqüência do comportamento de mover as pemas.

Note-se que, em cada exemplo, um organismo foi identificado. Seguiremos a convenção de que cada especificação de uma R identificará o organismo para o qual o evento e uma R. Deste modo, evitaremos confundir a R de um organismo com aquelas de um outro.

Uma regra simples para identificar eventos respostas num texto de linguagem comum é selecionar os verbos de ação. Já que uma resposta é um ato, os verbos de ação estão em geral (embora não invariavelmente) associados a eventos resposta.

Os seguintes exemplos ilustram alguns eventos que não são eventos resposta.

(7) A bola rebateu em João(8) 0 furacão assolou o país.(9) O governo sofreu um colapso.(10) A Sra. Brown morreu.( 1 1 ) 0 macaco adormeceu.(12) Jorge ficou cansado de esperar.

Em (7), João nada fez. Houve uma ação sobre ele. Em (8), o furacão não é um organismo, então não pode emitir respostas, tal como as conceituamos. Em (9), o governo não consiste de um organismo individual que sofreu o colapso. O comportamento de um indivíduo não está sendo descrito pelo colapso do governo. Rejeitamos (10) porque morrer é um evento comportamental único para cada organismo e as respostas devem ser eventos repetíveis. Em (11), o dormir, embora um fenômeno comportamental interessante, não deve ser interpretado como um evento resposta. Finalmente, a proposição que diz “Jorge ficou cansado” é uma especificação grosseira de algum estado interior de Jorge, mas não uma descrição de algo que ele esteja fazendo e, assim, não é um evento de resposta.

Escreveremos os eventos resposta de várias maneiras. Podemos representá-los com um R maiúsculo com um índice numérico ou em forma de letra e especificar, à parte, ima chave com sua identidade verdadeira, como no exemplo

onde R^= João ergueu o bastãoRb = João correu para a primeira base

Este exemplo simples mostra algumas características importantes da notação. Em primeiro lugar, cada R, em qualquer exemplo particular, deve ser uma R do mesmo organismo. Então, não poderia ser um exemplo de alguma coisa que João fez e Rg um exemplo de alguma coisa que Jorge fez. Outra maneira de dizer isso, é salientar que somente podemos discutir o comportamento de um organismo de cada vez.

Uma alternativa para indicar a identidade verdadeira de R é subscrever, abreviando o comportamento com uma palavra como

- 1 2 5 -

^(levantou)e

^(correu)

Ambas as formas serão usadas.

6.2 SITUAÇÕES E EVENTOS AMBIENTAIS

Qualquer indivíduo que se comporta é cercado e bombardeado por uma multiplicidade de energias. Alguma dessa energia está muito longe para afetar o organismo. Assim, um sinal luminoso do tráfego em Tóquio não terá efeito em nosso comportamento em Nova York. Um homem atirando contra nós a oito quilômetros de distância não irá, similarmente, ter efeito sobre nós, a menos que o vejamos. Outro tipo de energia pode não ter efeito porque o organismo não possui receptores especializados para captá- la. Ondas de rádio e radiação cósmica rodeiam-nos constantemente mas não detetamos estas energias a menos que estejamos equipados com instrumentos especiais para traduzi-las em sons e deflexões de ponteiros — energias que podemos detetar. O organismo é construído de modo a detetar uma amostra de energias à sua volta e todas elas constituem seu ambiente. Um ambiente, num dado momento, pode ser muito complexo, consistindo de sons, padrões de luz, odores e todas as configurações daquilo que chamamos objetos.

Frequentemente, notaremos que é necessário especificar apenas as mudanças que ocorrem em nossos ambientes. Quando João rebateu a bola, esta viajou na direção geral do campo externo. O restante do seu ambiente permaneceu relativamente constante mas a parte que envolvia a bola mudou. As idéias que se seguem se mostrarão úteis. Uma descrição do ambiente de um organismo em qualquer tempo e lugar determinados e em referência a ele, será designada uma situação, abreviada por S. Além disso, chamaremos uma mudança numa parte ou em todo o ambiente deste organismo de um estímulo. Uma vez que um estímulo é apenas um caso especial da situação, não precisamos de um símbolo especial para ele. Podemos usar o S de situação. Eis algumas s i tu a ç õ e s para váriosorganismos:

(13) A bola veio em direção a João...(14) Walter Mitty no seu Volkswagen 1962 cinza, sob a chuva, com o pé na

embreagem, o motorista do carro de trás buzinando...(15) Minha bandeja contendo o almoço...(16) 0 rato na caixa de Skinner, uma barra na parede da frente, nenhuma comida

presente.,..(17) Uma pulga picando o macaco...(18) Jorge no ponto de ônibus...

Note que três pontos seguem cada uma dessas situações descritas. Isto porque qualquer situação pode sempre ser descrita indefinidamente com maiores detalhes. Felizmente, precisamos descrever apenas os aspectos da situação nos quais estamos interessados. Na maioria das vezes, estes serão as mudanças no ambiente e que ocorrem de

- 1 2 6 -

uma situação para outra. Note também a ausência de quaisquer verbos de ação na descrição de situações ambientais. A penúltima (17), parece ser uma exceção. Contudo, a picada é uma situação (S) para o macaco (embora seja uma resposta da pulga). Esta ilustração enfatiza a importância de se identificar sempre para cada evento R ou cada evento S a que organismo Rs e Ss estão se referindo.As situações (Ss) são escritas de forma semelhante às Rs. Podemos subscrever um número ou uma letra como em

S l6 ” b°la dirigindo-se para João Sb = Walter Mitty no seu carro

ou subscrever o quanto da situação real julgarmos necessário:

S(rato na caixa, alimento ausente)

É importante notar que as situações podem ser simples como a situação

S24 = bomba caiu + a ruafoi destruída + povo gritando + sirenes de ataque aéreo soando + fogo ardendo à minha volta...

Embora muitas mudanças ocorram no ambiente num determinado momento, elas todas constituem uma e somente uma situação: uma situação com muitas mudanças. Deve-se depreender dessas considerações que, logicamente, só uma situação, em cada momento, pode existir para qualquer organismo. Será conveniente usar o sinal + para combinar mudanças separadas no mesmo evento S.

6.3 A NOÇÃO DE UMA CONTINGÊNCIA COMPORTAMENTAL

O fazer alguma coisa frequentemente produz algumas conseqüências importantes. Na linguagem de eventos resposta e estímulo, essa proposição significa que a R frequentemente conduzirá a um S de alguma conseqüência. A presente notação é fundamentalmente uma notação das conseqüências de estímulo do comportamento. Sempre que observamos que um evento comportamental produziu repetidamente, no passado, alguma conseqüência específica no ambiente, estamos diante de uma contingência comportamental. Formalmente, uma contingência comportamental é definida como uma regra que especifica uma relação condicional entre uma resposta e suas conseqüências. Examine alguns exemplos dessas regras.

(19) Pressionar o botão de partida faz o motor funcionar.(20) Se você disser mais uma palavra, será mandado para a cama sem o jantai.(21) Gire a maçaneta para a esquerda, para abrir a porta.(22) Beba seu leite e você ganhará a sobremesa.(23) Sempre que o macaco pressiona a barra ele recebe um amendoim.

Cada um desses cinco exemplos especifica um evento resposta e uma conseqüência de

- 127 -

estímulo para esse evento R. Considere (19). Se você pressionar, R, o botão de partida, então, o motor funcionará, S (funcionar). Em (20): Se você disser uma palavra, R, então, você estará na cama sem o jantar, S(na cama + sem o jantar). Note que mudamos “você será mandado” em (20) para a forma “você estará” . A mudança acentua a idéia crítica de que os eventos ambientais acontecem para o organismo. Em (20), o mandá-lo para a cama poderá envolver eventos resposta da parte de outro indivíduo (por exemplo, sua mãe) mas desde que estamos discutindo você, este é um evento S para você. É muito importante manter um quadro de referência consistente na notação de contingências. No momento, vamos supor que podemos notar os eventos R e S de um e somente um organismo de cada vez. Assim, não podemos misturar os eventos comportamentais de dois organismos no mesmo diagrama e chamá-los Rs. No exemplo (21), se a maçaneta é girada para a esquerda, R(girar para a esquerda), então a porta se abre S(porta se abre). Os exemplos (22) e (23) também cabem na forma se R, então S.

De um modo geral, uma contingência especifica a dependência de uma mudança ambiental de um evento anterior de comportamento. Embora as contingências sejam muito frequentemente especificadas no tempo futuro (veja os exemplos prévios) deve estar claro que elas são regras baseadas em observações feitas no passado. Podemos usualmente ler a dependência dada por uma contingência com: se Rf então S. Uma maneira equivalente de descrever essa dependência de S sobre R é observar que, numa contingência comportamental R conduz a S, ou R produz S. Estas últimas formas tem uma utilidade tão geral que existe um símbolo especial, -> , cujo significado é conduz a ou produz. Então, podemos escrever os exemplos de contingências de (19) a (23) como se segue.

(19a) R (pressionar)-----> S(m otor funciona)(20a) R a -----> Sa

onde Ra " dizer uma palavra e Sa ~ na cama

(21a) R( 16)---- >Si

onde R(] 6) ” vixar a maçaneta para a esquerda e S\ = porta aberta

(22a) R(beber leite)-----> ^(sobremesa)(23a) R(pressionar a barra) — ->S(amendoim)

Cada um desses cinco casos é convenientemente lido como R conduz a S.A noção de uma contingência comportamental não é difcil, mas é importante notar

alguns de seus aspectos característicos. Primeiro, a contingência descreve as conseqüências de S para dar uma R. Ela não descreve a ocorrência do comportamento. Isto é, não diz que R ocorrerá. Apenas diz que S é condicional (dependente) a R, isto é, que R ocorreu no passado e foi, então, seguida por S. Segundo, a contingência comportamental especifica apenas as conseqüências ambientais para o comportamento. Há um número de outros tipos de contingências que a notação não se destina a manejar. Vários destes estão ilustrados nos seguintes exemplos:

(24) Os selvagens executaram a dança da chuva e no dia seguinte choveu.(25) Se houver sol, irei ao pique-nique.(26) Se ele abrir o livro, começará a ler.

- 1 2 3 -

(27) Quando acordei, podia ouvir Joseila já movimentando-se na cozinha.(28) Se continuar a chover, a lavoura será destruída.

Em (24), estamos diante de uma pseudo-contingência. R(dança) realmente conduziu a(-----£*) S(chuva)* Todavia, a proposição não implica que, no passado, tal dança tambémtenha produzido chuva. O exemplo (24) é meramente uma especificação de uma seqüência única de R e S e a noção crítica de regra está ausente. Em (25), temos a idéia de que algum evento comportamental, R(jr ao pique-nique), condicional a algum evento ambientei S(se houver sol)- Mas isto é o oposto da nossa idéia de contingência comportamental, que propõe a dependência de S a uma R anterior. Em (26) temos R(ler) dependente de R (abrir o livro)- Mas, novamente, isto não é uma conseqüência de estímulo para o emitir uma R. É uma conseqüência comportamental do emitir uma R. Q exemplo (27) é meramente uma proposição descritiva de algum evento e nem especifica, nem implica em qualquer regra. Finalmente, (28) descreve dois eventos ambientais. O segundo, S(colheita destruída), é dependente do primeiro, S(chover mais)- Tal contingência S---- S não se enquadra no modelo básico R—3*S de uma contingência comportamental.

A noção de que as conseqüências de S são dependentes de R é fundamental nas contingências comportamentais. A notação é equipada apenas para representar tais contingências. Isto simplesmente porque, como o texto deixa claro, controlar as conseqüências passadas do comportamento é um dos meios mais poderosos que o psicólogo tem para controlar eficientemente o comportamento que se lhe apresenta no momento. Logo, não será surpreendente que ur^a notação tenha sido desenvolvida para representar o padrão dessas conseqüências em relação ao comportamento, tanto no laboratório como fora dele.

Logicamente, toda contingência comportamental faz parte de algum ambiente. Outra maneira de dizer isso é que as contingências são geralmente possíveis apenas em alguma situação determinada. Assim, no exemplo (19), pressionar o botão de partida é possível somente quando você está em seu carro, com o botão ao alcance e assim por diante. Em(20), a contingência permanece somente quando uma segunda pessoa está presente para escutá-lo e mandá-lo para a cama sem o jantar. Considerações, similares podem ser feitas para o restante dos exemplos de contingência. Em geral, uma determinada situação prevalece num momento em que uma determinada contingência está em efeito. Uma vez que a situação é mudada com a ocorrência de R (R produz uma nova situação, a conseqüência S) é frequentemente desejável, por questões de comparação, indicar essa situação inicial, de pré-conseqüência. Na notação, isto é feito escrevendo-se a situação inicial (abreviada frequentemente por Sa) verticalmente acima de R. Coloca-se, então, um colchete abrangendo os dois termos, S \ e R, para indicar que a situação e a contingência associadas a R ocorrem simultaneamente. Considere:

6.4 A SITUAÇÃO INICIAL (SA)

S, [6.1]

- 129 -

onde Sa = leite à sua frente R = beber Sb - sobremesa

O diagrama [6 . 1 1 é lido: quando o copo de leite estiver à sua frente e, se você o beber, então ganhará a sobremesa. O diagrama [6.1 | é o tipo mais simples possível de diagrama de contingência a ser escrito na notação. Ele mostra duas situações, uma inicial e uma segunda — as conseqüências de R. Ele especifica um evento resposta. Embora os diagramas que se sucedem sejam mais complicados, todos eles contêm como elementos a idéia expressa em [6 .1 1 Isto é, em alguma Sa, se uma R é emitida, entio Sg ocorrerá. As contingências que se adaptam ao diagrama [6.1 j são melhores lidas como:

quando ou enquanto ou durante ou SA logo após

Se esta fraseologia for adotada, haverá pouca possibilidade de interpretação errônea de qualquer problema.

6.5 CONTINGÊNCIAS MÚLTIPJ AS NA MESMA SITUAÇÃO

Raramente encontramo-nos numa situação onde possamos fazer apenas uma coisa que tenha conseqüências. Normalmente, existem diversos comportamentos que poderíamos desempenhar em cada situação, muitos dos quais poderiam produzir mudanças significantes no ambiente, ou conseqüências. Por exemplo, ao estar sentado diante da máquina de escrever, lá estão quarenta ou mais teclas que podem ser batidas, cada uma produzindo uma conseqüência diferente. Poderíamos também colocar e tirar o papel, apagar as letras com a borracha, mudar a fita, etc. Além disso, se o telefone estiver perto, poderemos telefonar. Se uma segunda pessoa estiver próxima, podemos solicitar seus préstimos e sermos atendidos. Pode-se continuai enumerando indefinidamente várias atividades possíveis nessa situação, todas com conseqüências distintas. Resolvemos este problema na notação escrevendo somente quantas dessas contingências desejarmos notar e isto é feito com a simples adição de Rs nos colchetes. Assim, se estivermos interessados em notar as contingências do bater em qualquer tecla de uma máquina de escrever e produzir uma letra, ou do discar um número num telefone, ou do pedir um copo de água, poderíamos escrever:

Sa (na máquina de escrever, perto do telefone, amigo próximo)Rl (bater na tecla) S(ietra) ^ 2 \R2 (discar o número) -» S (aiguem responde)R3 (pedir água) —> S(um copo com água é trazido)

Em geral, podemos escrever tantas contingências de R quantas desejarmos, simplesmente pela adição de Rs e suas conseqüências dentro de um colchete.

R -----> SB

se então

- 1 3 0 -

SARi SB R2 —>R .3 SD R 4 s E

[6.3]

Os três pontos na vertical significam kke assim por diante” .Note, cuidadosamente, que |6 .2 |e | 6.3 | não são representações dos comportamentos

que serão realizados quando estivermos sentados à maquina de escrever. São representações do que acontecerá se qualquer uma das Rs ocorrer. Os diagramas \6.2\ e 16.3 |não asseguram que alguma dessas Rs seja, na realidade, efetivada ou que algum comportamento ocorra. O máximo que a notação pretende c mostrar quais conseqüencias ocorrerão se alguns comportamentos ocorrerem. Este é um ponto fundamental que deve ser con st an temente lembrado sempre que Se examinar diagramas de R c S.

Um caso especial de contingência múltipla ocorre quando mais de uma R pode produzir as mesmas conseqüências S. Na expressão “há mais de uma maneira de tirar o couro de um gato” , temos um conjunto de contingências do tipo visto no diagrama 6 .4 :

SAR{ ----r—> Sb

R2 — 1 [6.4]R a - 1

onde S \ - gato intactoS[3 gato sem couroR] = um modo de tirar o couro do gatoF*2 - outro modoR3 = ainda outro modo

Para um exemplo mais específico, considere as maneiras pelas quais podemos chamar um garção à nossa mesa. Podemos chamar “garção” , podemos fazer um sinal ao garção mais próximo com as mãos ou podemos meramente olhar na direção do garção, fixando nossos olhos nos dele.

- 131 -

(nao luí garçao à nossa mesa)(cli am a r o g a rç ão) _____

R(olhar o garção)

S(o garção vem) [6.5]

0 diagrama | 6.5 | ilustra um método útil de especificar Sa, a situação inicial. Para produzir o diagrama 16.5 [ escrevemos primeiro todos os com portam ento* envolvidos. Então, escrevemos a conseqüência principal, “o garção vem até nós’\ Finalmente, para determinar o melhor método de especificar Sa, verificamos apenas qual seria o oposto da conseqüência. Neste caso, é simplesmente ‘‘nenhum garção à nossa mesa” . Quando casos,complexos, contêm muitos Ss, é frequentemente útil obter o oposto de cada S, pois o oposto pode dar uma pista de como iniciar o diagrama.

6.6 A CONTINGÊNCIA NULA

Nos diagramas 6.1 a 6.5, Rs produziram Ss. Sempre que uma R conduzia a uma nova situação, esta era incluída num colchete vertical ao longo da situação em vigor. Mas, nesses diagramas, a conseqüência S foi escrita sozinha, fora do colchete. Um S fora de um colchete usualmente indica que nenhuma contingência especial (em que estamos interessados) se mantém nessa situação. Então, o significado de Sg sozinho em 16.1 Jé o mesmo que:

Aqui se infere que a R em questão, R (beber)’ n^° ma*s tem quaisquer conseqüências especiais uma vez o organismo alcance Sg. Assim, a ausência de qualquer R detenninada, num colchete, implica que se esta R fôr emitida durante aquele S, nenhuma conseqüência especial ocorrerá. A ausência de quaisquer conseqüências especiais para uma R define um caso especial de uma contingência e é chamada de contingência nula. Assim, a ausência de qualquer R determinada em qualquer colchete implica que a contingência nula está em ação para esta R durante o S deste colchete. Além disso, o aparecimento implica na contingência nula de um S fora de um colchete nesta situação para todas as Rs em consideração.

Ocasionalmente, em alguma situação, digamos S, desejamos enfatizar que uma R que anteriormente tinha uma conseqüencia, não a tem mais. Uma maneira de fazer isto seria simplesmente omitir a R do colchete que inclui Sa mas para enfaiizar, pode ser adequado escrever:

S*R

os quais são ambos lidos: durante Sa, R não mais produz quaisquer conseqüências especiais. Ambos são equivalentes a

Sa ou [S„* todas as quatro formas ilustram maneiras diferentes de escrever a contingência nula.

R

- 132 -

6.7 A DURAÇÃO DAS SITUAÇÕES E DAS CONTINGÊNCIAS

As situações não duram indefinidamente, façamos ou não alguma coisa para muda las. Podemos subir num ônibus somente enquanto ele permanece no ponto. Podemos acenar para o garção enquanto ele está à vista, mas eventualmente ele desaparece e nossos sinais não são eficazes. As crianças frequentemente têm um limite de tempo para beber o leite. Depois disso, não haverá sobremesa, independentemente do que elas façam.O fato de que muitas situações e contingências tenham uma duração de tempo definida a elas associada, leva à introdução do símbolo T que representa a duração dc tempt'). O uso de T é direto. A situação (S j), que dura um tempo T, e escrita:

Vários pontos devem set levantados a respeito da interpretação de [6 .6 .| Primeiro, T c a duração de Sj. Segundo, em T há sempre uma seta que nele se origina. Se uma situação dura um tempo T, então uma nova situação deve substituí-la. Esta nova situação será encontrada na ponta da seta que se origina em T. Terceiro, T e sua seta são usados para representar “ ao fim de T unidades de tempo''. Então, T é sempre uma determinada duração dc tempo. Temos alguns exemplos do uso dc T, a seguir: (29). A peça dura duar horas, mas há um intervalo de 10 minutos entre o primeiro e o segundo ato. O primeiro ato dura 45 minutos.

S(ato 1) S (intervalo) S (ato II)Z(45 min) > ZOOmin) X(65 min) *

S(Hm da pena)

(30) o rato ficará na caixa por uma hora.

SAT - * S n

onde Sy\ rato na caixa T - 1 hora Sg rato fora da caixa

Nenhuma contingência foi escrita nesses colchetes já que nenhuma conseqüência para quaisquer comportamentos foi especificada. Se houvesse sido especificada alguma, então as Rs teriam sido colocadas nos colchetes.

Algumas vezes, apenas um valor aproximado de T é conhecido. Então, se estamos esperando que alguém saia da cabine telefônica para que possamos fazer uma chamada, não podemos estar certos de quanto tempo a situação de S(cabine tejefônica ocupada)

- 1 3 3 -

durará- O máximo de que somos capazes, nessas condições, seria estimar uma media do tempo de espera, digamos 5 minutos, em media. Uma média de T, assim especificada, é escrita T, onde o - indica “em media”. T é usado exatamente da mesma maneira que T. Por exemplo:

1(5 min) —> S(cabine livre > [6.71S(cabine ocupada)

O diagrama 6.7 ilustra mais duas características da notação. Primeiro, as setas sempre se originam nos Ts (ou Rs), nunca nos Ss. Quando um S sucede outro, a seta deve vir de um T (ou de- R). Segundo, a posição vertical de T e S, num colchete, é irrelevante. Um pode estar abaixo ou acima do outro. Os eventos dentro de um colchete entram em ação simultaneamente.

6.8 MAIS DE UMA RESPOSTA É EXIGIDA PARA A CONSEQÜÊNCIA S.

Quando mais de uma ocorrência de uma dada resposta é necessária para produzir alguma conseqüência S, este fato pode ser indicado de uma ou duas maneiras. Antes de tudo, o evento, comportamental associado com a contingência pode ser definido em termos do número de elementos requeridos. Então, o exemplo “ escreva uma palavra no quadro negro 100 vezes e, então, você pode ir para casa” , poderia ser notado assim:

Ra SaSi

onde Sj = dentro da sala de aulaRa ~ escrever uma palavra 100 vezes Sa = permissão para sair

Aqui, o número de elementos requerido está envolvido na definição de Ra. Alternativamente, este caso poderia ser notado assim:

on de s j = dent ro d a sa 1 a de au 1 a Ra = escrever uma palavra Sa = permissão para sair n = 100

Assim como o T, algumas vezes pode-se conhecer apenas o valor médio de a. Quando somente o número médio de respostas requeridas para uma mudança S é conhecido, escrevemos n.

Rn.a SaS,

- 1 3 4 -

6.9 CONTINGÊNCIAS REPETITIVA.

Nos diagramas [6.1 | a [6.5 [ as respostas produziram consequencias ambientais. Mesmo assim, todas essas contingências poderiam ser descritas de uma vez. Isto é, uma vez que a R especificada ocorreu, apareceu uma nova situação e a contingência nula entrou, então, em efeito para todas as Rs enumeradas no colchete seguinte. Todavia, esta é uma condiçãoque nem sempre é verdadeira. Em 6.2, por exemplo, uma simplificação grosseira foi feita, desde que está claro que, quase que imediatamente depois de bater numa tecla, podemos bater em outra e produzir uma letra. Evidentemente, necessitamos de alguma maneira para descrever a natureza repetitiva de certas contingências.

Talvez a contingência repetitiva mais comum seja aquela que a máquina de escrever ilustra. Depois de fazer alguma coisa obtemos uma conseqüência, mas podemos fazer a mesma coisa novamente, se desejarmos, e ainda obtermos uma conseqüência e assim indefinidamente. A maneira mais simples de descrever este caso seria diagramá-lo de modo a indicar que a contingência antiga está novamente em efeito logo depois da conseqüência. Esta seria uma representação exata, porque é certo que não podeipos datilografar uma nova letra no momento em que a tecla está batendo no rolo. Se fizermos assim, teremos a sobreposição de tipos e outros efeitos indesejáveis. A idéia principal é que devemos esperar um pouquinho, apenas uma fração de um segundo. Assim, a contingência nula que está em efeito no momento da conseqüência dura somente uma pequena fração de segundo, depois do que voltamos ànosssa contingência original. Na seção 6.7, discutimos como o tempo pode produzir novas situações. Precisamos apenas ampliar este conceito para permitir que o tempo conduza de volta às situações antigas e também ás antigas contingências. Essa ampliação de nossas idéias permitirá uma representação exata de muitas contingências repetitivas. No caso da máquina de escrever, podemos notar:

SARa

Sb |T - 2

, 16.8| onde Sa " à máquina de escrever, teclado em repouso.

Ra - ^ater numa tecla S[} a letra aparece j pequena fração de segundo.

No diagrama 16.8 | representamos o fato de que numa situação S^, podemos bater numa tecla e produzir uma marca na página e na outra Sb , não podemos obter esse efeito batendo na tecla. Para nos referirmos às duas contingências distintas (uma das quais, naturalmente, é o caso nulo) subscrevemos os numerais 1 e 2 embaixo dos colchetes. Outros exemplos de contingências repetitivas simples são:

- 135 -

(31)A ave recebe uma apresentação de 3 seg de alimento cada vez que bica o disco.(32)Você pode encher sua caneta tintoiro colocando-a no tinteircr e empurrando o

émbolo. (Aqui, o T da contingência 2 é bem longo, dependendo do quanto você escreve).

(33)Cada pressão no gatilho faz a arma disparar um tiro.

Um segundo tipo de contingência repetitiva ocorre quando uma segunda resposta, em vez da mera passagem do tempo, faz voltar às condições da primeira situação e suas contingências. Quando um rato é reforçado com uma gota de leite cada vez que pressiona a barra, um?. segunda pressão à barra não p ro duz irá uma segunda gota de leite até que a primeira seja consumida. Assim,

onde Sa leite ausente Sr - gota de leite RA pressão à barra RB - beber o leite

representa aquelas condições. Este tipo de reciclagem comportamental é muito comum Algumas armas de fogo pequenas são construídas para atirar somente quando reguladas entre cada tiro.

S(arma regulada) _______ ^ |S(fogo) ________R(puxar o gatilho) [R(regular)1 2

Similarmente, você pode obter muitas garrafas de uma máquina de Coca-Cola, inserindo as moedas, mas você deve remover cada garrafa para que a próxima moeda seja eficiente.

Em resumo, há dois modos principais de reciclar uma contingência repetitiva: através da passagem de tempo (indicado por T ^ ) } no por meio de um evento resposta (indicado por R -----1 )

6.10 FAC1LITAÇÃO

Ocasionalmente, acontece que a emissão de uma resposta, embora não altere o ambiente, torna possível que uma segunda resposta produza um estímulo. Assim, quando chegamos ao final de uma linha com a nossa máquina de escrever, o teclado não mais opera. Se pressionarmos o soltador de margem, as teclas não operam, mas esta resposta não muda nosso ambiente de um modo apreciável. A máquina de escrever parece exatamente a mesma antes e depois de ter sido pressionada a tecla de soltar a margem. As mudanças ocorrem, naturalmente, dentro da máquina de escrever e são reveladas pela possibilidade, de ígora, se produzir letras,batendo nas teclas. Notamos es.se caso, assim:

1 3 6 -

onde S24 =■ término da linha$23 - a letra apareceRa = pressionar o soltador de margemRb = bater na teclaT - pequena fração de segundo

Assim, o aparecimento de no colchete, 2, sem um S, implica em que o S do colchete precedente, S2 4 , está ainda em vigor. E realmente isto é correto. Casos tais como [6.9] são indicados esquematicamente

Rj -----> R2 *

e são lidos: Se Rj, então se R2 -.

0 comportamento verbal humano frequentemente configura-se numa representação semelhante a [6.9 j. Quase sempre prefaciamos os nossos comentários com “Escute isso” , ou “Ouviu falar desta? ” . Estas proposições introdutórias têm o efeito de captar a atenção, embora a atenção nem sempre seja revelada por qualquer mudança aparente na face da nossa audiência, isto é, no nosso ambiente. 0 que acontece, todavia, é que os nossos comentários subsequentes certamente serão mais observados (isto é, produzirão conseqüências) se forem prefaciados por táis proposições.

Para assar um bolo somos aconselhados a untar levemente o fundo da forma. Assim, o bolo não ficará agarrado à fornia quando formos removê-lo. Não podemos ver diretamente os efeitos do untar a forma uma vez que tenhamos colocado o bolo, mas podemos observar que a resposta de untar torna possível a resposta de removê-lo.

Em termos mais técnicos, a facilitação é a produção de uma contingência comportamental através da ocorrência de uma resposta que por si mesrna não produz qualquer conseqüência ambiental direta.

6.11 CONTINGÊNCIAS NEGATIVAS

As contingências de comportamento são, muitas vezes, especificadas de maneira negativa. A menos que você beba seu leite, será mandado para cama. Se você não pagar sua conta de telefone, eles cortarão o seu telefone. Todos os que não votarem serão severamente repreendidos. Um erro comum é considerar o “não beber” , “não pagar’., “não votar” , como Rs. Desde que o comportamento é alguma coisa que o organismo faz, tais assertivas são claramente uma violação de nossas definições. Uma solução para a especificação da R está na observação de que o tempo, invariavelmente, tem um im p o rtan te papel, em bora frequentemente camuflado, nessas contingências. Logicamente, se uma conseqüência ocorrerá para 0 não fazer algo, o administrador da conseqüência tem que decidir quanto tempo de não fazer constitui o “não fazer” . Assim.

- 1 3 7 -

o tempo está intimamente ligaao às contingências negativas, porque é sempre alguma duração de inatividade que produz as conseqüencias.

Ao considerar as contingências negativas, é útil levar em conta todos os comportamentos possíveis, exceto a R determinada, como uma classe única de comportamentos. Embora essa classe seja, em geral, muito diversa e não bem especificada, podemos estar certos de que, pelo menos, não incluirá R como membro. Para indicar esse conjunto complementar de comportamentos que não inclui R comc membro, empregamos o símbolo R (lê-se “R barra”) para referirmo-nos a todos os comportamentos, exceto R. Desde que, como notamos, é sempre uma certa duração de R (não executar R) que produz as conseqüências, devemos sempre subscrever um T para R. Assim, “a menos que paguemos nossa conta de telefone dentro de duas semanas, a partir do momento em que a recebemos, o telefone será cortado” é diagramado assim

on( e Sa = recebimento da conta R = pagar a conta T = 1 4 dias Sb = telefone cortado

Note que R não está representada na chave como qualquer comportamento específico. Todavia, sua R complementar está especificada na chave, embora apareça no diagrama real apenas por implicação (isto é, se a quantidade de T de R não ocorre, então fT deve ocorrer). Assim, R é sempre definida em relação a R de modo que uma ou outra deve ocorrer, mas, evidentemente, ambas não podem ocorrer. Em [6.10 [ se a quantidade T de R ocorrer, então, o telefone será cortado, mas se.R ocorrer, então nada de especial acontecerá. Uma vez que R não está representada em [6.10,] isto significa que R está numa contingência nula com relação a Sa e Sg e, realmente, isto é verdadeiro. Não pagá-la (duas semanas de qualquer coisa, exceto pagá-la) resulta nas conseqüências.

Como um guia geral, observar-se-á, frequentemente, que Sg nessas contingências negativas, é um evento aversivo ou indesejável. Logo, 6.10 pode ser tido como uma prescrição para a produção de eventos aversivos. Logicamente, isto significa que é também uma prescrição para evitá-los e é isto precisamente o que desejávamos notar quando introduzimos este tipo de exemplo.

6.12 CONTINGÊNCIAS PROBABILISTIC AS

Algumas vezes, as conseqüências S de uma resposta variam. Quando atiramos uma moeda, nem sempre obtemos o mesmo resultado. Metade das vezes obtemos cara, metade das vezes, coroa. Este caso é notado pela inclusão de mais de uma seta originando em R e colocando os valores da probabilidade sobre cada seta. Quando mais de uma seta com origem em R é empregada desta m aneirados valores especificados da probabilidade devem som ar l. Na moeda não viciada, temos:

[6.10]

- 1 3 8 -

Em geral, quando o comportamento pode ter um número de conseqüências possíveis, devemos escrever

indicando a probabilidade de cada conseqüência S sobre sua seta correspondente. Naturalmente p + q + r + s+...deve somar 1 .

As situações dc estímulo podem também se suceder probabilisticamente. Quando chove rui segunda-feira, c provável que chova também na terça-feira mas, algumas vezes, o tempo podo mudar em 24 horas, e, na terça-feira, o sol brilhar:

onde S\ = chuvaT24 = 24 horas52 = dia de sol53 = mais chuva

o

6.13 DISCRIMINAÇÕES

Em todos os diagramas apresentados supôs-se que o tempo corresse da esquerda para a direita. Isto é, a sucessão temporal de Ss e contingências era da esquerda para a direita. (As contingências que reciclam não são exceções, porque a seta que recicla da direita para a esquerda é meramente uma abreviação para escrever uma série infinita de símbolos à direita.) A dimensão vertical foi empregada para indicar que os eventos escritos no mesmo colchete entram em efeito simultaneamente. Em algumas ocasiões, é útil considerar várias contingências que poderiam estar em efeito simultaneamente. Assim-, podemos pretender discutir as contingências que surgem de discriminações simples de laboratório. Se a luz for vermelha, o macaco deve pressionar a barra para conseguir alimento; mas se a luz fôr alaranjada, o macaco deve girar uma roda para conseguir o alimento:

- 1 3 9 -

§R(vermelha)y(pressionar)

S"R(alaranjado)

(girar a roda)

Em 16.11] nenhuma regra é dada para a ordem do vermelho e alaranjado. Portanto, nenhuma reciclagem é apresentada. O aparecimento de dois colchetes, um acima do outro, implica em que., antes do reforçamento, ambas as contingências estarão em efeito. O diagrama [6.11] também ilustra o fato ôbvio de que mais de uma R pode produzir a mesma situação.

6.14 R e S FUNCIONALMENTE DEPENDENTES

Os casos complexos de contingências repetitivas podem envolver mais do que uma simples reciclagem para a situação original. Frequentemente, a situação original é modificada por cada ocorrência do evento resposta. Quando inflamos uma câmara de bicicleta, cada bombada infla a câmara um pouco mais. Para notar isso, usamos as últimas letras do alfabeto (u, v, x, y, z) como índices de S, querendo implicar a natureza variável e inconstante de S. Assim, em

onde Sx = pneu inflado com uma quantidade x x = uma função de nR R = inflar

vemos que a quantidade de ar na câmara é uma função do número de Rs que ocorreu. O diagrama 6 .12 é ilusoriamente simples mas um número de casos comuns usam-no como um elemento. Quando cortamos uma árvore, batemos creme e corremos 100 metros, cada resposta que executamos, modifica um pouco a situação. Tão logo seja dada uma R, modificando a situação, outra R pode ser emitida imediatamente modificando-a uin pouco mais, e assim por diante. Eventualmente, no final, um novo conjunto de contingências estará em efeito: podemos colocar a árvore caída num caminhão, o creme em cima de um pedaço de bolo e podemos receber uma medalha pela nossa velocidade na corrida.

Algumas vezes, a resposta que produzirá as conseqüências é uma função de algum aspecto da situação existente. No capítulo 1 ° discutiremos um caso no qual o comportamento de procurar resulta na descoberta de um objeto. Mas a direção em que a procura é efetiva é uma função da localização espacial do objeto. Este é um caso simples onde tanto a R como o S no mesmo colchete requerem índices variáveis. A forma correta de R

-r S4(alimento)

[6.11]

- 140 -

depende de S, mas, a mçjios que o objeto seja encontrado sempre no mesmo lugar, S sera variável. O diagrama [6.13 (representa este caso

Sc [6.13JRj, * S2

onde S2 = objeto na mão R = procurar y = direção no espaço x ” posição do objeto S = objeto a alguma distância de nos

e y = f(x)

6.15 CONTINGÊNCIAS AGRUPADAS

0 tempo (T) tem sido usado como referência à duração de situações e contingências. Algumas vezes, é útil representar por um único T a duração de um conjunto inteiro de contingências. Para indicar essa possibilidade, uma nova facilidade notacional deve ser desenvolvida. Considere que a época dos morangos vá de março a setembro, isto é, 7 meses. Se você vai à mercearia durante esta época, encontrará morangos anunciados e em exposição. Se você perguntar se há morangos para vender, receberá uma afirmativa. Naturalmente, a mercearia não permanece aberta 0 dia todo. A loja abre às 9 horas e fecha às 18 horas. Aqui, temos dois ciclos de tempo independentes. Primeiro, temos a época dos morangos que dura 7 meses e a época em que não há morangos, que dura 5 meses.

S(na época) T(7 meses)

S(fora de época) T(cinco meses) z i

Mas também temos o horário de 9 horas por dia de trabalho da mercearia. Isto é

(9 horas)[ (mercearia aberta)

T( 15 horas) __S(mercearia fechada)

Precisamos conseguir uma maneira de combinar as situações e ciclos de tempo. O diagrama 6.14 mostra esta representação. Aqui, os colchetes aparecem agrupados dentro de colchetes.

- 141 -

0 T7 meses e o T5 meses aplicam-se à duração de todas as contingências neles incluídas. T2 é incluído apenas para permitir a reciclagem do seu pedido de morangos. Provavelmente, leva um certo tempo para que você profira as palavras e tenha a primeira caixa em suas mãos. Então, você pode pedir novamente e receber outra caixa. O exemplo mostra um agrupamento tríplice. Uma vez que uma e somente uma situação pode estar presente em qualquer tempo, Sg inclui muitos dos elementos de S\

REFERÊNCIAS PARA O CAPITULO 6

Mechner, F. A notation system for the description of behavioral procedures./ . exp. A n a l Behav., 1959, 2 , 133-150.

Mechner, Vicki. A notation system jor behavioral contingencies: an instructional program. New York: Basic Systems, 1963.

- 1 4 2 -

Capítulo 7 REFORÇAMENTO INTERMITENTE

No paradigma do fortalecimento operante, cada membro de uma classe de resposta selecionada emitido é tipicamente seguido por um estímulo reforçador. Esse paradigma pode ser efetuado por cientistas do comportamento, pais, professores, amigos ou pela própria natureza. Sempre que o procedimento de fortalecimento operante é iniciado, o resultado típico é um aumento na probabilidade da resposta. O reforçamento de cada membro de uma classe selecionada de resposta, nesse paradigma, é chamado de reforçamento contínuo (daqui por diante, abreviado por crf). O termo não significa que o reforçamento esteja continuamente disponível. Ele simplesmente significa que uma contingência do tipo R S+ prevalece /Continuamente entre a resposta e o reforçamento.

No mundo civilizado e na selva, as relações entre os comportamentos emitidos e as mudanças subsequentes no ambiente são frequentemente mais complexas do que o crf. Em certos dias, muitas vezes por razões obscuras ou desconhecidas, o mesmo comportamento que teve êxito em outras ocasiões não o terá. Este caráter fortuito da relação entre operantes e conseqüências subsequente s.pode ser evitado no laboratório. Aí, controlando explicitamente o reforçamento dos comportamentos, podemos decidir para os nossos sujeitos humanos e animais exatamente quais comportamentos de uma série emitida serão bem sucedidos. De um modo típico, tal controle é descrito na forma de regras. Essas regras especificam em detalhes as relações que existem entre certas respostas operantes e os estímulos reforçadores subsequentes. As regras são apenas casos especiais das contingências comportamentais do Capítulo 6 , mas elas incorporam como eventos S críticos as conseqüências especiais que já denominam os reforçadores.

Os comportamentos humanos nas situações cotidianas revelam ambas as contingências: reforçamento contínuo e intermitente. Sob circunstâncias normais, muito do nosso comportamento é reforçado continuamente. Os interruptores acendem e apagam a luz com regularidade. Quando ouvimos uma voz e olhamos na direção em que ela vem, normalmente vemos a face de outra pessoa. Quando perguntamos a um amigo quantas horas são, regularmente obtemos uma resposta. Exceções ocorrem, mas são tão infre* quentes que causam surpresa e perplexidade quando acontecem. Em outras situações, todavia, o reforçamento intermitente é a regra. A paciência do pescador em lançar e retirar o anzol da água por horas a fio, sem a ocorrência de uma mordiscada, desenvolve-se através de uma história de reforçamento intermitente. No basebol, o reforçamento sob a forma de uma rebatida é considerado adequado quando em séte entre dez

- 1 4 3 -

ou mais tentativas o jogador perde a vez. O cinemeiro inveterado, talvez raramente vcj« um bom filme, mas seu comportamento de ir ao cinema semanalmente permanece forte. Neste capitulo, analisaremos alguns dos princípios do reforçamento intermitente que foram isolados no laboratório com sujeitos animais e humanos e mostraremos alguns dos muitos procedimentos possíveis. ( 1)

7.1 CONTINGÊNCIAS DE INTERVALO

Como ponto de partida, lembre-se do procedimento de condicionamento e extinção sucessivos (ver seção 5.5). Tipicamente, este procedimento proporcionava n reforçamentos contínuos para uma resposta, seguindo-se T horas de extinção. Este ciclo característico, consistindo de uns poucos reforçamentos c, depois, uma extinção prolongada, estendia-se por uma ou mais sessões experimentais. Quando a extinção havia resultado numa reduçíTo acentuada do responder, o ciclo era repetido. Considere agora uma variação desse procedimento, consistindo do reforçamento de uma única resposta, seguido por apenas um minuto de extinção, novamente um segundo reforçamento e assim por diante. Nessa variação, muitos ciclos de condicionamento e extinção são condensados em uma única sessão de uma hora. Depois de efetuar este procedimento, surge um efeito comportamental característico, que se vê estilizada da Fig. 7-1.

Inicialmente, curvas condensadas de extinção, negativamente aceleradas, seguem cada reforçamento (Fig. 7-1), (parte a). A resposta que produz o reforçamento é freqüente mente a última de uma série de respostas cm taxa baixa. Esse quadro, no entanto, é transitório e depois de um certo número de reforçamentos ter ocorrido, desenvolve-se uma taxa moderada e estável (parte b). Esta é também uma fase evanescentc, que dá lugar a uma terceira fase (c), caracterizada por uma pausa depois de cada reforçamento, pausa esta que é seguida por uma mudança gradual ou abrupta para uma taxa de resposta aoderadamente alta, mantida até ao final do intervalo de 1 minuto.

As fases transitórias b c c são ilustradas com dados reais na Fig. 7-2. Esta figura representa as sessões 2, 3 c 4 da resposta de bicar o disco (chave) de um pombo, que recebia alimento de acordo com o procedimento condicionamcnto-cxtinção descrito acima. As curvas da Fig. 7-2 foram “empilhadas” ; isto c, foram tiradas do seu sistema de coordenadas usual e colocadas horizontalmente mais próximas, para economizar espaço e facilitar a comparação. As taxas reais de resposta em qualquer momento e também o número de respostas acumuladas emitidas cm qualquer momento podem ser estimados por comparação com a pequena chave inserida na parte inferior direita da figura.

O procedimento descrito é uma das várias maneiras possíveis em que um experimentador pode programar contingências de reforçamento em relação ao tempo. No caso em questão, o experimentador estabeleceu um intervalo fixo de tempo entre o último reforçamento c o restabelecimento da contingência de reforçamento. Até que esse intervalo fixo tenha passado, nenhuma resposta pode ser reforçada. Tal procedimento fixa o tempo entre o reforçamento e a próxima contingência de reforçamento e, por isso, é apropriadamente denominado um esquema de Intervalo Fixo (abreviado por IF). Note, todavia, queo intervalo de tempo entre o recebimento de quaisquer dos reforçamentos reais nao c fixo.

- 1 4 4 -

Reforçamento (tempo)

Figuro 7-1.. Curva estilizada da transição do crf para reforçamento intermitente em intervalos periódicos fixos. O uso de ti para rotular a abeissa sugere que os segmentos sucessivos de resposta devem estar associados nào com reforçamentos sucessivos, mas,

(1) Faz-se necessária uma palavra a respeito do delineamento dos experimentos sobre reforçamento interm itente discutidos neste capítulo. É típ ico desses experimentos que os sujeitos sejam inicialmente treinados num esquema crf de reforçamento. Somente quando uma taxa estável de resposta é estabelecida sob as condições crf o e x p e r im e n ta d o r in tro d u z as interm itências desejadas.

- 14 5 -

Embora o valor mínimo deste intervalo seja o tempo fixo entre um reforçamento e o estabelecimento de uma contingência, seu valor real depende de quão rápido a resposta ocorre depois que a contingência entra em efeito. O elemento básico aparece em notação, assim

Os eteitos principais de um esquema em intervalo fixo (IE), imposto após um crf podem ser resumidos da seguinte maneira:

1 . O comportamento do indivíduo mostra um ajustamento gradual ao procedimento, que se nota através das mudanças no padrão da taxa de resposta. Já discutimos este efeito.

2 . O padrão que emerge no final tem a forma de ondas (ondulado). Num esquema IF, o reforçamento c seguido por um período subsequente de não reforçamento. Uma longa história passada neste estado de coisas faz com que o animal pause por um tempo apreciável apôs um reforçamento. Essa cessação do responder é uma conseqüência natural do fato de que, no passado, uma resposta após o reforçamento numea foi reforçada. É uma forma de extinção discriminada, que será esclarecida mais tarde, quando discutirmos o processo comportamental da discriminação.

3. O comportamento pode ser mantido indefinidamente em IFs de apenas poucos segundos até IFs de várias horas de duração.

(fixo) —> R —> S*

DIA

24O

68O

144O

Figura 7-3. t-stágios no desenvolvimento do comportamento num esquema 11* 30 min. Dados de int 'rretorçamento selecionados são apresentados para os dias indicados. O número à esquerda de cada segmento indica o número ordinal do reforçamento que termina este segmento (segundo Cummine e Schoenfeld, 1958).

- 1 4 6 -

Num experimento, pombos famintos foram expostos 16 horas por dia a contingências de reforçamento com alimento em IF -30 min, em 144 dias consecutivos, representando uma história experimental dc mais de 1.300 horas. O comportamento de bicar a chaye foi mantido através do experimento e verificou-se a natureza transitória de certos efeitos de IF Na Fig. 7-3, as mudanças no padrão de resposta são ilustradas através do registro de comportamento de um animal durante intervalos interreforçamento selecionados, obtido nas sessões 24, 68 e 144. A mudança progressiva de uma ondulação gradual para uma ondulação abrupta é evidente.

IR 4 min

Figura 7-4. Registros cumulativos de animais em IR4 min, obtidos nas sessões iniciais (4a. ou 5a.) e Finais (15a., 17a. ou 20a.) (Millenson, 1963).

Contingências em IF não são raras na vida cotidiana. O conteúdo de uma panela ferve, aproximadamente, após um certo tempo fixo que o calor é aplicado. Os ônibus que andam no horário reforçam a espera dos passageiros no ponto em intervalos fixos. O fato dc o IF não manter um nível constante de comportamento num período de tempo é, com freqüência, um obstáculo importante para o seu uso no controle prático do comportamento. Em cursos universitários, onde a principal contingência estabelecida é um exame final, muitos estudantes trabalham muito pouco durante o curso. Poucos dias antes do exame final, ocorre um frenesi de atividades.

Suponha que os intervalos de tempo entre o reforçamento e a próxima contingência de reforçamento tenham durações aleatórias e sejam imprevisíveis. O resultado é um novo tipo de procedimento chamado esquema de Intervalo Randômico (IR). Este esquema pode ser especificado apenas pelo intervalo médio entre o reforçamento e o restabelecimento da contingência. Para dar alguma indicação da variação em intervalos que pode ser encontrada, num esquema de IR 1 min, por exemplo, cerca dc 95% dos intervalos entre o reforçamento e as contingências de reforçamento cairão na faixa de 0 a 2 minutos. A exposição inicial a um procedimento IR após uma história em crf, produz somente os dois primeiros estágios de transição descritos para a IF na Fig. 7-1. O resul-

- 147 -

tado final em IR é uma taxa de resposta estável e uniforme, cujo registro cumulativo não apresenta desvios sistemáticos de uma linha reta (ver Fig. 7-4).

Figura 7-5. Registros cumulativos de respostas para esquemas IV de deflexôes de ponteiro, com intervalos médios, de 15 seg, 30 seg, 1 min e 2 min, respectivamente.Todos os registros sâo do mesmo sujeito. Km cada caso, o registro apresentado foi feito depois de sessões prévias no esquema (Holland, 1958).

Aproximações de esquemas IR são frequentemente encontrados fora do laboratório. Os operadores de radar que observam o osciloscópio para detectar sinais infrequentes encontram-se numa intermitênciasimilar ao esquema IR, Sua resposta ó o comportamento de observar; o reforçamento é a descoberta de um sinal. Um caso similar ocorre quando um operador tem de observar o marcador para detectar deflexôes infrequentes, mas críticas. Nesses exemplos, pode-se pressupor que o comportamento visível de observar

- 148 -

segue as leis do comportamento operante, mas ele nem sempre é facilmente medido. No procedimento de Holland (1958), sujeitos humanos foram instruídos a examinar um marcador e relatar (pela pressão de uma chave telegráfica) cada deflexão observada a partir de um ponto zero. Ambos, marcador e sujeito, todavia, estavam num quarto escuro e o marcador podia ser visto somente após a pressão de uma segunda chave telegráfica que fornecia iluminação por uma fração de segundo. Deste modo, Holland estabeleceu um operante convenientemente mensurável que se correlacionava com o comportamento de “observar” do sujeito; para olhar o marcador, o sujeito tinha que pressionar uma chave. Para colocar o comportamento de pressionar a chave sob um esquema similar ao de intervalo randômico, o experimentador programou deflexões no ponteiro (reforçamentos) separadas por diferentes intervalos de tempo. Os intervalos não eram propriamente randômicos, mas tinham durações variadas. O procedimento é um exemplo do que é chamado um esquema de Intervalo Variável (TV). Sob as condições de Holland, o esquema manteve taxas de pressionar a chave (resposta de observação) superiores a uma resposta por segundo. Holland pesquisou os efeitos da mudança do intervalo médio entre asdeflexões programadas do ponteiro. Começando com um intervalo médio de 15 seg, ele aumentou progressivamente o intervalo médio para 30 seg, 1 min e, finalmente, 2 min, em várias sessões consecutivas. A fig. 7-5 mostra os resultados obtidos com um de seus sujeitos, um homem alistado ha Marinha dos Estados Unidos. Os padrões de taxa observados estão de acordo com qs estudos animais sobre os efeitos comportamentais deste esquema (Ferster e Skinner, 1957). Os resultados de Holland na Fig. 7-5 indicam, além disso, que o IV produz uma taxa de resposta que tende a aumentar à medida que o intervalo médio entre as deflexões (reforçamentos) diminui. Uma implicação interessante desta descoberta é que, se as deflexões forem transitórias (isto é, se durarem apenas pouco tempo), então menos deflexões serão perdidas (isto é, mais serão observadas) quando o intervalo médio entre elas for pequeno. Então, um homem que observa uma tela de radar onde os sinais raramente ocorrem tem uma boa chance de perder um sinal transitório crítico quando este aparece , porque é provável que sua taxa de observação seja baixa. Os resultados da Fig. 7-5 sugerem a possibilidade de se inserir sinais artificiais suplementares para manter a taxa de observação alta, ao nível que assegurará a detecção de todos os sinais críticos.7.2 PROBABILIDADE DE REFORÇAMENTO

Um esquema de reforçamento pode ser provisoriamente definido como um procedimento ou plano que determina quando e por quanto tempo uma contingência de reforçamento estará em efeito. Como tal, ele deve ser estabelecido e mantido por um experimentador. Um esquema de reforçamento é, assim, um fenômeno de laboratório. Embora haja esquemas que se assemelhem a algumas intermitências de reforçamento vistas na natureza, o conceito de esquema é independente dessas comparações e tem implicações que vão muito além delas. Um esquema de reforçamento pode ser considerado um caso idealizado de uma intermitencia de reforçamento.

Um esquema de reforçamento é fundamentalmente uma especificação da probabilidade 'de reforçamento para uma resposta selecionada em determinadas ocasiões. Na seção anterior, apresentamos contingências que programavam muoaiiças apartir de, epan valores extremos de probabilidade, 0 e 1. Evidentemente, extinção é outro nome para o valor extremo, probabilidade de reforçamento = 1. Nos esquemas de intervalo discutidos acima, foram estabelecidas contingências que especificavam uma probabilidade de

- 149 -

reforçamento 1 , após intervalos fixos, randômicos e variáveis, durante os quais essa probabilidade era 0. Mas o campo dos esquemas dc refo.çamento não é, de modo algum, restrito a misturas temporais, embora complexas, dos extremos superiores e inferiores da probabilidade de reforçamento.

É possível, por exemplo, construir um esquema no qual a probabilidade de reforçamento para uma determinada resposta seja a mesma o tempo todo. Certas situações da vida real aproximam-se desses esquemas de probabilidade constante ou uniforme de reforçamento. Os resultados de se atirar uma moeda não viciada ocorrem em tais bases probabilísticas. Numa aposta, por exemplo, uma série de lançamentos pode ser feita e eventualmente obtém-se o reforçador desejado, digamos, cara. Todavia, a cara pode não aparecer em um grande número de lançamentos, embora a probabilidade de se obter cara, em qualquer lançamento, seja uniformemente constante e igual a 1/2. A

Tempo (minutos)

Figura 7-6. Taxas dc respostas acumuladas quando o bicar c reforçado num esquema dc probabilidade* uniforme (dados de J. Farmer).

- 150 -

imprevisibilidade de um lançamento de moeda é característica da probabilidade uniforme dc contingências de reforçamento. Apostar e jogar, em geral, são realmente probabilís- ticos deste modo. Se o bom tempo é tido como um reforçador e o comportamento de ir ao piquenique é efetuado, o reforçamento ocorre probabilisticamente. Podemos consultar o departamento de meteorologia para confirmar o número de dias bons previstos para junho. Mas, embora a probabilidade de que faça bom tempo possa ser muito alta, nosso comportamento de ir ao piquenique pode, ainda assim, não ser reforçado com um dia bom.

Geralmente, partimos do princípio de que, em qualquer período de tempo determinado, é vantajoso para o indivíduo ganhar tantos reforçamentos quanto possível. Na extensão em que esta generalização é verdadeira, diante de um esquema de probabilidade uniforme a melhor estratégia é responder tão frequentemente quanto possível. Se somos pagos para achar conchas bonitas numa praia, quanto mais conchas examinarmos, mais conchas bonitas encontraremos. Isto é verdadeiro seja qual fôr a probabilidade de encontrar conchas bonitas. Algumas praias podem permitir-nos uma probabilidade mais alta do que outras, mas, em qualquer praia, será vantajoso para nós examinar tantos espécimes quanto possível . Outro modo de dizer isto seria afirmar que é vantajoso que o nosso comportamento de examinar/tenha a máxima taxa possível.

Um pombo faminto, exposto a um esquema de probabilidade uniforme de reforçamento com alimento desta natureza, rapidamente se ajustará a uma estratégia ótima, se a probabilidade fixada não foi muito baixa. O esquema gera taxas de resposta extremamente altas ("Brandauer, 1958).

A figura 7-6 é uma amostra de alguns resultados típicos obtidos neste esquema, onde a probabilidade de receber alimento por bicar era de 1/25. Em alguns momentos na Fig.7-6, o pombo estava bicando a uma taxa de três por quatro respostas por segundo por oeríodos consecutivos. Quando Sidley e Schoenfled (1964) expuseram pombos a vários valores de probabilidade dc reforçamento variando de 1 até 1/160, obtiveram a interessante função da Fig. 7-7. Fm seu estudo, a taxa total de respostas foi maior quando a

2.50-

fz.oo1

I 1.50-O8 1.0 0 -od

0.50

0 V 10 l ' * ~ 0.1000 0.0500 0.0250 00125 0 0068

1 igura 7-7. 1'axas totais dc resposta em função da probabilidade de reforçamento (segundo Sidley e Sclioenfeld, 1964).

probabilidade dc reforçamento era 1/10. Probabilidades de reforçamentos superiores c inferiores a 1/ 10 , levaram a uma redução na produção, o que não representa uma estratégia ót ima.

- 151 -

1.3 NOTAS TEÓRICAS SOBRE ESQUEMAS DE REFORÇAMENTO

Podemos resumir a importancia sistemática das seções 7.1 e 7.2 pela observação de que um esquema é um conjunto de regras que especificam: ( 1 ) quando estabelecer uma contingência de reforçamento; (2) quanto tempo mantê-la em vigor; (3) qual valor da probabilidade de reforçamento atribuir a ela. Quando as variações nessas três condições são permutadas com os diversos parâmetros de resporta a serem discutidos no próximo capítulo, as possíveis variações de procedimento para manter operantes tornam-se enormes. Pressionados no sentido de economizar representações, os teóricos têm desenvolvido representações tais como as da Fig. 7-8 para descrever e relacionar os vários

Probabilidade uniforme ^ de 1/5___________

j___ •___ t___ j___ I___ |

Figura 7-8. Probabilidade dc reforçamento para uma resposta em função do tempo desde o reforçamento anterior.

esquemas. Na Fig. 7-8, a probabilidade de reforçamento para uma resposta é dada em função do intervalo pós-reforçamento para cinco dos esquemas que consideramos. (Devemos notar, entre parênteses, que um acordo universal sobre qual a melhor representação de esquemas ainda não foi conseguido entre os pesquisadores neste campo. Ao consultar a literatura, o estudante avançado deve, assim, estar preparado para encontrar outras maneiras de conceituação dos procedimentos deste capítulo e do Capítulo 8).

A tareia de descrever ou especificar um vasto número de procedimentos de reforçamento em termos de poucas variáveis manipuláveis é um de dois problemas relacionados na análise teórica de esquemas. O outro problema está na explicação de como os esquemas geram seus efeitos característicos na taxa de resposta. Skinner (1953) salientou que os esquemas são apenas maneiras aproximadas de reforçar taxas de resposta. Isto é.

- 1 5 2 -

os esquemas trequentemente sâo programados de modo a liberar reforçamentos numa ocasião cm que o indivíduo, provavelmente, estaria respondendo como um certo tipo de taxa, alta ou baixa, dependendo do esquema particular, Dc acordo com a lei familiar do fortalecimento operante, o comportamento que ocorre imediatamente antes do reforçamento tem sua probabilidade aumentada ou mantida. Nossa analogia com a concha levou-nos à conclusão dc que, num esquema de probabilidade uniforme, por exemplo, quanto mais alta a taxa dc resposta, tanto mais provável torna-se um reforçamento num determinado intervalo curto dc tempo. Neste tipo de esquema, então, uma taxa alta de resposta frequentemente precederá o reforçamento.

Os esquemas de intervalo, logicamente, apresentam, no conjunto, uma contiguração diferente. Nestes, admitindo-se que o organismo responda pelo menos uma vez por intervalo, taxas mais altas não aumentam a probabilidade do reforçamento. Isto porque o restabelecimento da contingência dc reforçamento no intervalo é independente do comportamento do animal. Ela é estabelecida por um relógio no caso de um esquema IF, e por um contador Geiger ou outra fonte aleatória no caso do esquema IR.

Nada que o animal faça pode apressar a liberação do reforçamento. De fato, quanto mais tempo o organismo esperar antes dc responder, maior a probabilidade de reforçamento quando finalmente ele responder. Num esquema IF por exemplo, a probabilidade de reforçamento c igual a 1 /se o organismo esperar todo o período de IF antes de responder (veja o painel IF, Fig. 7 -8 ). Essas relações entre esperar c, então, responder, sugerem que os esquemas dc intervalo agem dc modo a retardar a taxa dc resposta.

7.4 OS EFEITOS DO REFORÇAMENTO INTERMITENTE NA RESISTÊNCIA À EXTINÇÃO

O reforçamento intermitente, quando comparado ao crf, leva a um aumento substancial na resistcncia à extinção da resposta selecionada. Assim,os esquemas de reforçamento fornecem uma técnica importante para aumentar a persistência comportamental. Depois do reforçamento contínuo da pressão à barra ou do bicar uma chave, a curva típica de extinção alcança os critérios dc extinção comumente empregados por volta de uma hora, durante a qual, na maioria dos casos, apenas poucas centenas de respostas são emitidas. Por outro lado, na Fig. 7-9, os registros dc um animal após uma história dc intervalo variável .(IV) dc reforçamento indicam que uma assíntota de mais que 3.000 respostas eslá sendo gradualmente alcançada depois dc 8 horas.

Figura 7-9. Fxtinção após IV (Skinner 15 0 )

- 1 5 3 -

Os esquemas de probabilidade uniforme de reforçamento também produzem maior resistência à extinção do que crf. Um experimento feito por Weinstock (1954) dizia respeito à extinção do comportamento após valores diferentes de probabilidade de refor- çamento no treinamento. Um aparelho com uma pista, semelhante ao visto na Fig. 7-10

Porta que fecha

foi empregado. Em tal aparelho, um animal é colocado na caixa de partida, a porta é aberta no momento apropriado e um cronômetro começa a funcionar. Quando o animal entra na caixa objetivo, onde pode encontrar alimento, o cronômetro para e o animal é removido quando se deseja. Essa seqüência de eventos é chamada uma tentativa. Uma vez que a téntativa realmente continua até que o animal, finalmente, vá até a caixa objetivo, a freqüência de resposta não é uma medida adequada do comportamento nestas circunstâncias. O tempo que é gasto para o animal ir do início até a caixa objetivo, todavia, é relevante e facilmente mensurável. Essa medida é um caso do que chamaremos tempo de reação. Ela contém certas similaridades com a latência, uma vez que é o tempo entre uma mudança ambiental (a porta é aberta) e uma resposta (entrada na caixa objetivo). Mas, a latência é reservada para uma descrição de respondentes e o tempo de reação é reservado para a descriação de operantes

Weinstock (1954) treinou 4 grupos de ratos a correrem num aparelho similar ao da Fig. 7-10. A cada grupo foi dada uma de quatro probabilidades fixas diferentes de encontrar alimento na caixa objetivo, p - 1,0: 0,8; 0,5 e 0,3. Assim, o grupo 1,0 encontrava alimento em cada tentativa (crf), o grupo 0.8 encontrava-o em 80?£ das tentativas, c assim por diante. Depois que todos os animais haviam sido treinados a correr, aparentemente, na sua velocidade máxima, iniciou-se a extinção, retirando-se o alimento da caixa objetivo. Apenas uma tentativa era efetuada por dia. Os resultados indicam que o grupo1,0 foi o mais rápido para extinguir, isto é, após poucas tentativas(4 ou 5), esses animais passaram a gastar muito tempo para atravessar a pista, se é que chegavam a fazê-lo. A ordem da extinção seguiu a ordem inversa da probabilidade. Quanto menor a probabilidade, mais tempo persistiu o comportamento condicionado de correr. O grupo 0,3 foi o

- 1 5 4 -

que levou mais tempo para que seu comportamento de correr fosse enfraquecido pela extinção. Na faixa das probabilidades pesquisadas, portanto, a diminuição da probabilidade de reforçamento aumentou a resistência à extinção, medida pela volta da velocidade do correr ao nível operante. Note que esta proporcionalidade inversa não pode ser mantida abaixo de algum valor mínimo de probabilidade porque, se a probabilidade de reforçamento se torna muito pequena (aproximando-se de 0), o fortalecimento original será impossível.

Por que as contingências intermitentes aumentam a resistência à extinção? Uma explicação prende-se à observação de que, depois de uma história de reforçamento intermitente, a extinção não parece muito diferente do procedimento de fortalecimento real. Durante um reforçamento intermitente de qualquer tipo, ocorrerão períodos de extinção quando nenhum reforçamento estiver disponível para a resposta. Nesse sentido, toda a história de reforçamento intermitente do animal lhe diz que um período de extinção leva, eventualmente, ao reforçamento. Na verdade, o esquema ensinou perseverança ao animal.

7.5 OUTROS EFEITOS COMPORTAMENTAIS DO REFORÇAMENTO INTERMITENTE /

Os esquemas de reforçamento são, obviamente, procedimentos que manipulam taxas de resposta. É bastante surpreendente que a maioria de nossas informações sobre seus efeitos comportamentais seja derivada de análises de taxas de resposta durante e em seguida à exposição a eles. Ainda assim, é válida a questão de como tais procedimentos afetam a constelação total de comportamentos de um indivíduo. Uma resposta parcial poderia ser na forma de proposições que descrevem como os esquemas afetam propriedades do comportamento tais como a topografia da resposta, a magnitude da resposta a ordem seqüencial do responder, etc.

Lane e Shinkman (1963) estudaram os efeitos de um esquema IVsobre a amplitude e duração do p ia r no pinto. Este operante foi inicialmente fortalecido pelo reforçamento de cada piar no pinto, por um pintinho faminto, com uma breve apresentação de alimento. Seguindo-se esse treino, o piar foi reforçado intermitentemente num esquema de IV 100 segundos. Na fase final do experimento, o piar foi extinto. Os resultados mostraram que a duração e amplitude da resposta de piar eram altamente estereotipadas durante o crf, tomando-se significativamente mais variáveis durante o procedimento IV Mas a extinção produziu um nível ainda mais alto de variabilidade nas medidas das respostas.

Quando a duração da pressão à barra de um rato foi analisada sob esquemas de probabilidade uniforme, notou-se que ela era extremamente estereotipada sob crf, algo mais variável durante contingências de probabilidade uniforme e extremamente variável na extinção (Millenson, Hurwitz e Nixon, 1963).

Os dados parecem apoiar a generalização de que a variabilidade de comportamento parece aumentar progressivamente sob condições de crf, esquemas intermitentes e extinção, nesta ordem.

7 6 ESTADOS ESTÁVEIS DO COMPORTAMENTO

Na maior parte de nossa análise precedente do comportamento, enfatizamos a importância de certos procedimentos comportamentais e dos processos comportamentais carac

- 1 5 5 -

terísticos associados a eles. Desta maneira, examinamos os processos de condicionamento Pavloviano e operante e da extinção. Neste capítulo vimos que os estados transitórios — que são os produtos iniciais da exposição a esquemas de reforçamento — constituem um conjunto distinto de processos comportamentais. Embora tais processos sejam importantes no estudo do comportamento, seus pontos finais são, pelo menos, de igual importância. Assim, um reforçador é definido tanto em termos de sua capacidade de manter0 compoitamento nos padrões característicos do esquema como em termos de sua capacidade de aumentar as taxas de respostas durante o processo de fortalecimento operante. A manutenção do comportamento por contingências intermitentes aproxima-nos dos nossos próprios comportamentos cotidianos, muitos dos quais foram fortalecidos ou adquiridos no passado remoto e mantidos, daí em diante, por reforçamento intermitente. No laboratório, esta manutenção permanente do comportamento pode ser melhor descrita pelos chamados estados estáveis. As medidas comportamentais atingem estados estáveis ao final de seu “processo’' ou aspecto transitório. Por exemplo, as curvas da sessão 144 da Fig. 7-3, provavelmente, representam um estado estável do comportamento sob as contingências de IF Similarmente, as curvas de IV da Fig. 7-5 parecem ser representativas do desempenho final nesses tipos de esquemas. Um esquema IV ou IR pode gerar taxas estáveis moderadas de resposta por longas sessões, dia após dia, indefinidamente.

O fato de que os esquemas podem levar a estados estáveis de comportamento, que podem ser mantidos indefinidamente, sugere que esses estados podem servir como linhas-base adequadas, a partir das quais pode-se avaliar os efeitos de numerosas variáveis sobre o comportamento. A noção de uma linha-base é bastante familiar. O nível operante foi usado como linha-base para determinar se o fortalecimento de uma resposta ocorreu. Podemos usar um desempenho que está sendo mantido no momento por um esquema como uma linha-base. Em capítulos posteriores, os efeitos das mudanças de estímulo, contingências interpoladas e de outros procedimentos em tais linhas-base ajudarão a definir muitos conceitos psicológicos importantes. Como uma ilustração da técnica geral, devemos nos contentar, no momento, com uma demonstração do efeito de uma droga tranquilizante sobre o comportamento estável. Dews (1955) estudou o efeito do pentobarbital no responder estável de pombos em IF Depois de ter exposto os pombos às contingências IF 15 minutos o bastante para o surgimento de um padrão estável, Dews injetou pequenas quantidades de droga nos animais durante certas sessões. Observou, então, os efeitos no padrão de IF Neste experimento, a variável independente foi a quantidade de droga injetada e a variável dependente foi a mudança no comportamento a partir do estado normal cm IF (ver Figs. 7-2 e 7-3). Para estar certo de que qualquer efeito observado pudesse ser atribuído apenas à droga e não ao distúrbio causado pela propria injeção, uma solução salina foi injetada nos animais em outras sessões Até um certo nível de concentração de droga, Dews não observou efeitos no comportamento — o desempenho continuou semelhante aquele sob o IF normal. Com concentrações acima de1 mg de pentobarbital, ocorreu uma mudança significativa. A taxa total foi reduzida em cerca de 75%, e a ondulação característica do IF foi praticamente perdida, sendo substituída por uma taxa de resposta constante e muito baixa através do intervalo fixo.

Este é um exemplo relativamente simples dc uma sub-areada ciência do comportamento aplicada muito ampla e em expansão, conhecida como psicofarmacologia — o estudo da ação de drogas no comportamento. Muitas firmas farmacêuticas mantêm atualmente laboratórios comportamentais exclusivamente para o estudo dos eteitos de novas

- 1 5 6 -

drogas no comportamento animal. Na exploração de uma nova droga, muitas linhas-base devem ser usadas. Uma droga não afetará todos os padrões de comportamento da mesma forma. Até aqui, não mencionamos muitos estados de línha-base, mas os seguintes processos que estudamos terminam em estados estáveis estatísticos, que podem ser usados como linhas-base:

L Esquemas de intervalo2. Esquemas probabilísticos3. Condicionamento e extinção sucessivos4. A própria extinção5. A seqüência comportamental vista em elos simples de comportamento6 . A topografia e magnitude do comportamento sob crf.

REFERÊNCIAS PARA O CAPÍTULO 7Brandaucr, C. M. The effects of uniform probabilities of reinforcement

on the response rate of the pigeon. Unpublished doctoral dissertation, Columbia Univer.,/1958. -

Cumming, W. W., and Schpenfeld, W. N. Behavior under extended exposure to a high-value fixed interval reinforcement schedule. / . exp. Anal. Behav., 1958, 1, 245-263*.

Dews, P. B. Studies on behavior. I. Differential sensitivity to pentobarbital of pecking performance in pigeons depending on the schedule of reward. J. Pharmacol, exp. Ther., 1955, 113, 393-401.

Ferster, C. B., and Skinner, B, F. Schedules of reinforcement. New York: Appleton-Century-Crofts, 1957.

Holland, J. G. Human vigilance. Science, 1958, 128, 61-67.Lane, H. L., and Shinkman, P. G. Methods and findings in an analysis

of a vocal operant. J. exp. Anal. Behav., 1963, 6 , 179-188.Millenson, J. R. Random interval schedules of reinforcement. J. exp.

Anal. Behav., 1963, 6 , 437-443.Millenson, J. R., Hurwitz, H. M. B., and Nixon, W. L. B. Influence of

reinforcement schedules on response duration. J. exp. Anal. Behav., 19ul, 4, 243—250.

Sidley. N. A., and Schoenfeld, W. N* Behavior stability and response rate as functions of reinforcement probability on “random ratio” schedules. J . exp. Anal. Behav., 1964, 7, 281-283.

Skinner, B. F. Are theories of learning necessary? Psychol. Rev., 1950,57, 193-216. ~

Skinner, B. F. Science and human behavior. New York: Macmillan, 1953.Weinstock, S. Resistance to extinction of a running response following

partial reinforcement under widely spaced trials. J . comp, physiol. Psychol., 1 9 5 4 ,4 7 ,5 1 -5 6 .

- 1 5 7 -

Capítulo 8 A ESPECIFICAÇÃO DA RESPOSTA

Nas seções precedentes, limitamos nossa análise sobre a modificação comportamental àquelas mudanças dos comportamentos que já existiam com alguma força maior que zero antes do condicionamento. Agora é o momento de abandonar esta restrição simplificado- ra e arbitrária do paradigma de condicionamento operante, verificando como um novo comportamento, não existente antes no repertório do indivíduo, é adquirido. Antes de proceder ao estudo deste processo de aquisição, entretanto, é necessário uma explicação adicional do termo resposta operante e seus componentes.

8.1 A DEFINIÇÃO DE CLASSES DE RESPOSTA

Uma das razões pelas quais a ciência do comportamento demorou a se desenvolver, baseia-se na própria natureza de seu objeto. Ao contrário do tecido renal, cristais jde sais, baterias, o comportamento não pode ser facilmente retido para observação. Em vez disso, os movimentos e ações dos organismos parecem fluir numa corrente contínua, sem início e fim definidos. Quando um rato se move da frente para o fundo de sua gaiola, quando você dirige seu carro 400 km sem parar, quando você prega um botão,é difícil identificar pontos na correnie comportamental contínua, onde as unidades naturais do comportamento possam ser consideradas fracionadas. Uma complicação adicional é que nãohá duas ações de um organismo que sejam exatamente iguais, porque nenhum comportamento é repetido exatamente.

O problema da conceituação das unidades fundamentais de uma corrente comportamental contínua, não repetitiva, baseia-se na própria estrutura da ciência. Para submeter o comportamento a uma análise científica — isto é, de modo a ser possível predizê-lo e controlá-lo — precisamos dividir nosso objeto de estudo de tal modo que alguma coisa fixa e reproduzível possa ser conceituada. Os métodos da ciência são reservados para eventos reproduzíveis. Tanto o termo evento como seu qualificador reproduzível são conceitos científicos básicos. Temporais, cargas elétricas, fluidos, moléculas, planetas, instituições sociais, etc; são a matéria prima das ciências. Embora dois temporais e dois governos democráticos não sejam exatamente iguais, é necessário agrupar eventos semelhantes, embora não idênticos, numa única classe e chamá-los “ temporais” ou “governos democráticos” . Através do uso de tais artifícios, não somente a meteorologia e a ciência política, mas todas as ciências, estabelecem conceitos em termos dos quais se enquadram

- 159 -

suas leis, generalizações e, previsões. A conceituação dc comportamento em termos de tais classes, análogas aos conceitos de classe dc outras ciências, é, assim, uin pré-requisito para uma ciência do comportamento capaz de descobrir leis, fazer generalizações e previsões.

Em se tratando do comportamento, podemos algumas vezes iniciar, classificando numa única categoria um conjunto de comportamentos que são correlacionados com o mesmo estímulo. Assim, podemos observar as flexões sucessivas da perna, em resposta a um toque bem definido no joelho e, embora notando suas diferenças, decidir chamar de resposta patelar à classe (conjunto) de todos os movimentos que ocorrem com uma duraçüo entre os limites de 1/5 a 1 seg. e que caem numa faixa de ângulos ( a ) de 5 a 30 graus (ver Fig. 8-1). Ao admitirmos essa classe, nossa esperança é incluir todos, ou quase todos os comportamentos que estão de fato correlacionados com este eliciador particular. Obtivemos os movimentos sucessivos através da eliciação repetida, usando o mesmo estímulo eliciador com intensidade, duração e localização fixas, e assim por diante Embora a classe, que é assim formada, pareça ser um agrupamento de movimentos aparentemente semelhantes, sua definição formal é apenas a classe de movimentos que ocorre a um dado estímulo.

Figura 8-1. Diagrama esquemático da faixa de movimentos que inclui todos os comportamentos que são chamados “ Reflexos Patelares”.

Tal classe é, naturalmente, um respondente e, neste caso, ela define o respondente patelar.

Para definir estas classes de comportamento, é necessário conceituar certas dimensões através das quais os comportamentos possam ser descritos e medidos. Da mesma forma que uma mesa é exaustivamente descrita através da medida de sua largura, comprimento, altura, número de pés, cor, peso, densidade da madeira, número de gavetas e assim por diante, assim também uma amostra de comportamento pode ser exaustivamente descrita pela medida da posição e. orientação do organismo em referência a partes de seu ambiente, os movimentos que estão ocorrendo, o período de tempo que eles preenchem, a intensidade e freqüência com que ocorrem e assim por diante. Mesas particulares e amostras particulares de comportamento podem, então, ser descritas por sua configuração única de valores dimensionais. Parece, assim, que as classes de “mesas” e de “ amostras comportamentais do tipo X” são determinadas pelo estabelecimento de

- 160 -

restrições, limites e condições ao longo de certas dimensões, de modo que todas as “ coisas” que desejarmos chamar mesas e comportamentos do tipo X, respectivamente, incluir-se-ão, com certeza, nessas classes. Assim, as mesas deveriam ter, digamos, um ou mais pés (uma condição), deveriam ser feitas de material sólido, ao invés de líquido ou gasoso (uma restrição), ter uma superfície plana (uma restrição), ter um comprimento maior que 30 cm e menor que 35 m (um limite), e assim por diante. Da mesma forma, os comportamentos do tipo X poderiam incluir, digamos, qualquer movimento para baixo (uma restrição) do braço esquerdo (uma condição) que esteja entre 15 a 100 gramas de força (um limite) e que não exceda a 1/2 seg. de duração (uma restrição) e assim por diante.

Mencionamos exemplos de dimensões do comportamento tais como posição, duração e força da resposta, em seções anteriores. Essas dimensões foram usadas para descrever a variabilidade de comportamento no nível operante, fortalecimento, extinção e esquemas de reforçamento. Algumas dimensões como posição, ângulo, localização e orientação do comportamento são chamadas dimensões topográficas, uma vez que uma relação de seus valores em qualquer momento determinado especificará a forma exata do comportamento. A especificação do valor dessas dimensões, em qualquer momento determinado, dá o tipo de informação fornecida por uma fotografia do organismo surpreendido em ação. Tendo apreendido a forma estática do comportamento através das variáveis topográficas, podemos usar as dimensões dinâmicas tais como a velocidade, força, duração e taxa de repetição do comportamento para descrever, ainda mais, uma amostra particular do comportamento. Em princípio, uma amostra de comportamento poderia ser completamente descrita por uma especificação dos valores de todas as dimensões pertinentes ao comportamento. Esta descrição, em relaçio a uma e-xplicação mais completa, estaria, sem dúvida, precisamente na mesma relação que há entre um instantâneo e um filme. Na prática, uma descrição exaustiva do comportamento raramente é tentada. Quando a topografia ou forma é de interesse principal, deve-se recorrer ao uso de dispositivos para fotografar o comportamento, mas uma análise quantitativa de uma ou duas dimensões comportamentais representativas será, em geral, preferida. No caso do reflexo patelar, a especificação da classe de comportamento em termos de apenas duas dimensões parece suficiente para uma aproximação adequada. Uma dessas dimensões constitui o ângulo da perna em relação à posição de descanso; a outra dimensão é a duração do movimento. Em geral, a especificação experimental de um fragmento do comportamento nunca é mais que parcial, sendo que os valores de muitas dimensões ficam indeterminados.

Para formar as classes ou unidades para expressar as leis, generalizações e previsões do comportamento emitido, uma estratégia diferente daquela usada para definir respondentes deve ser adotada. No comportamento não eliciado, podemos iniciar pela definição de um conjunto algo arbitrário de comportamentos que preenchem certas restrições e condições e que caem dentro de certos limites ao longo das dimensões especificadas da resposta. Nossos critérios originais para agrupar certas amostras de comportamento podem estar baseados em pouco mais do que a observação superficial de que o conjunto de comportamentos, que cai no que descrevemos como tipo X, poderia ser uma classe de algum interesse. Tendo formado essa classe arbitrária, deve-se solicitar agora - não um eliciador, porque não existe um - mas um reforçador, para a confirmação de que a classe que arbitrariamente selecionamos funcionará realmente como uma unidade. Isto é, prosseguimos aplicando a operação de reforçamento em fragmentos sucessivos do comporta

- 161 -

mento tipo X, como definido. Cada membro da classe será, sem dúvida, um pouco diferente de qualquer outro e, por essa razão, é chamado uma variante. Preparamo-nos para tais diferenças ao especificar os limites (e não valores exatos) dentro dos quais reforçaríamos. Se o reforçamento, agora, afeta o comportamento de modo a fortalecer seletivamente uma classe de comportamentos, estamos certos ao referirmo-nos a esta classe como uma classe de resposta operante, ou mais simplesmente como um operante.

Considere alguns exemplos. Poderíamos definir os limites de uma certa classe de movimentos e tentar reforçar todos os movimentos dentro dos limites. O reforçamento de uma classe de extensões do braço ocorre nos movimentos de pegar. As palavras são exemplos proeminentes da formação de classes arbitrárias de resposta. Todos os sons que caem dentro de certos limites aceitáveis (portanto, são produzidos pela ação muscular dentro de certos limites aceitáveis), constituem as palavras faladas "por favor". Quando uma criança enuncia e pronuncia as palavras corretamente (isto é, emite uma variante que cai na classe desejada), o reforçamento é liberado e a classe de movimentos que produz por favor é fortalecida.

Na natureza, parece pouco provável que o reforçamento seja sempre contingente um conjunto restrito de limites do modo descrito acima. No laboratório, o reforçamento poderia ser tornado contingente a um subconjunto restrito de comportamentos definidos pelas limitações dimensionais. Mas, mesmo aí, as unidades são estimadas de modo mais geral, classificando juntos todos os movimentos que atuam, pelas leis da mecânica simples, para produzir uma mudança específica no ambiente. Portanto, todos os movimentos que pressionam uma barra, ou um disco, ou uma chave telegráfica, ou que conduzem um rato do início ao fim de uma pista, giram uma roda, ou colocam açúcar numa chícara de café, servem para limitar efetivamente a topografia do organismo de tal modo que se consegue uma estimativa da classe topográfica especificada. Isto é verdade, simplesmente porque há limites nas maneiras possíveis de se fazer todas essas coisas. Se construímos nosso aparelho com cuidado, os comportamentos possiveis que poderiam produzir as mudanças ambientais especificadas serão bastante limitados e, portanto, forçados a terem uma forma razoavelmente semelhante. (Os comportamentos de enfiar linha numa agulha são mais limitados que os de fechar uma porta). Na medida em que restringimos nossas dimensões, os comportamentos que constituem a classe terão semelhanças topográficas da mesma forma que os respondentes tem naturalmente. Todavia, a única exigência formal para um operante é que ele seja uma classe de comportamento suscetível, como classe, de reforçamento. Se especificamos uma classe que não pode ser fortalecida ou mantida pelo reforçamento de seus membros, tal classe não constitui uma resposta operante, seus membros não são variantes da resposta e, presumivelmente, não se presta para o uso no estudo do comportamento operante. Isto é verdade se uma especificação dos limites do comportamento fôr feita em termos de limitações dimensionais ou de alguma mudança ambiental necessária que o comportamento deva produzir. Operantes, ou respostas operantes (respostas, para simplificar, se você se lembra de que respostas não significam “ responder a” ), então, são as classes de comportamento, suscetíveis ao reforçamento, que formam as unidades fundamentais de análise de uma grande parte das ações humanas c animais.

Na definição de operantes como uma classe de comportamentos sensíveis de reforçamento, nenhuma lógica exclui a definição de subclasses ou superclasses de operantes contidos em ou que contem qualquer classe operante particular, previamente definida. Esta flexibilidade no modo pelo qual os conjuntos comportamentais básicos

- 1 6 2 -

podem ser subdivididos em “conjuntos” menorjs, ou combinados para formar conjuntos maiores, será de grande importância quando examinarmos os limites extremos aos quais os conceitos de operante podem ser estendidos. Portanto, a definição de um operante, em si mesma, não coloca qualquer restrição 3obre a amplitude de uma classe de resposta, em termos da quantidade de comportamento abrangida por ela. Como veremos na seção 8.5, classes que consistem de contrações musculares muito breves para serem observáveis pelo sujeito que as emite, podem vir a funcionar como operantes. No outro extremo, seqüências longas de ações parecem funcionar como classes únicas de operantes. Sob algumas condições, será possível falar de tricotar um suéter, escrever um livro, ou caminhar para o trabalho, como operantes. Extensões do conceito de operante a tais operantes de grande escala só agora estão sendo exploradas no laboratório.

8.2 UMA DEFINIÇÃO DE RESPOSTA OPERANTE EM TERMOS DA TEORIA DOS CONJUNTOS

Uma definição alternativa do operante, compatível com a exposição precedente, é iOrnecida, aqui, na notação da teoria dos conjuntos (ver seção 8.9).

Considere o conjunto de todas as amostras de comportamentos possíveis.

Neste conjunto U, vamos definir o subconjunto de comportamentos, B, que está dentro dos limites preestabelecidos La — Lb, Mc - Md,-- , e tem restrições ou condições tais que a forma do comportamento deve ser N, O, ..., onde as letras maiúsculas L, M, N, O,

significam as dimensões do comportamento e os índices especificam os limites superiores e inferiores dessas dimensões. Então, este subconjunto pode ser representado por

Como um meio alternativo de definir B, podemos considerar todos os comportamentos que completam um determinado resultado ambiental, S, para constituir o subconjunto B.

Considere uma tentativa de reforçar amostras sucessivas do subconjunto B. Se o fortalecimento dos membros do subconjunto, R, de comportamentos, agora, ocorre ( como evidenciado por um aumento seletivo na sua freqüência, uma mudança na sua ordem seqüencial em relação a outros comportamentos, e assim por diante), então, este subconjunto R será conhecido como um operante e os membros observados de R serão identificados como variantes da resposta operante. Se nenhum fortalecimento de um subconjunto R ocorre, então B c considerado apenas um subconjunto específico de comportamentos, destituído de importância empírica para a análise do comportamento.

Dado um operante R, é possível definir um subconjunto, r, tal que cada membro em r seja também um membro de R.

U

- 1 6 3 -

Na prática, pude-se verificar que muitos desses subconjuntos r ^ r j — podem ser operantes em si mesmos, pela definição anterior. Desde que, todavia, a definição de um operante depende de se observar o fortalecimento pelo reforçamento e desde que o* fortalecimento é definido em relação a outros comportamentos (ver seção 4.4), o limite até o qual o fracionamento e/ ou subdivisão da classe R pode ser ampliado é estabelecido pelo ponto no qual não é possível fortalecer um dado subconjunto ri sem igual fortalecimento de qualquer outro ij. Evidentemente, isto determina o limite inferior da definição de uma classe de operante.

Uma operação oposta é admissível. Dado o operante R, é possível descobrir (ou criar) um superconjunto R de ordem superior, que contém todos os membros de R, além de outros comportamentos.

\ssim, embora os movimentos para pressionar uma barra possam funcionar como um operante, os movimentos de pressionar uma barra vinte e cinco vezes podem funcionar como um operante de orc1em superior, R. Da mesma forma, os movimentos de pressionar uma barra, seguidos pelos movimentos de puxar uma corrente, podem funcionar como um operante de ordem superior. Novamente, os limites aos quais os operantes podem ser estendidos dessa maneira são estabelecidos apenas pelos limites da suscetibilidade comportamental ao reforçamento.

8.3 O PARADIGMA DA DIFERENCIAÇÃO

O reforçamento exclusivo daqueles fragmentos de comportamento que estão dentro dos limites e que têm as restrições e condições estabelecidas pelas dimensões comporta - mentais é conhecido como o procedimento de diferenciação de resposta. Assim, o fortalecimento de comportamentos tais como bicar o disco por pombos, pressionar a barri por ratos, pegar os brinquedos pela criança, envolvem diferenciação de resposta. O que chamamos até aqui de fortalecimento operante é um caso especial de diferenciação .de resposta. Para avaliar os vários aspectos quantitativos da diferenciação de resposta, é útil examinar um caso em que a especificação da classe comportamental a ser reforçada é feita cm termos de uma única dimensão comportamental.

Na definição do pressionar a barra por um rato, a força mínima requerida para que a barra seja pressionada pode quase sempre ser especificada. Essa força mínima é um exemplo do limite inferior de uma dimensão comportamental. Se a força mínima fôr bastante baixa, o nível operante dc pressionar a barra será maior que zero e o fortalecl-

- 1 6 4 -

(A)

» 1 1 i^3 17 21 25 29 33 37 41 45 49 53 57

(B)

l io 8 8 I 1 1 1 i i

13 17 21 25 29 33 37 41 45 4 9 53 57Intensidade das pressões, em gramas

Figura 8-2. Distribuição de força de resposta, quando todas as forças acima de 21g (A) e acima de 36 g (B) eram reforçadas ( segundo Hays e Woodbury, citado em Hull, 1943).

mento da classe operante de pressionar a barra procederá exatamente como descrito no Capitulo 4. Hays e Woodbury (citados em Hull, 1943) realizaram um experimento de fortalecimento semelhante, empregando uma força mínima de 21 gramas. Depois que o processo de fortalecimento havia estabilizado, eles obtiveram respostas distribuídas ao longo da dimensão força, como é visto no histograma superior da Fig. 8-2. A Fig. 8-2A mostra nada mais que a variabilidade familiar que caracteriza o comportamento, mesmo quando este é reforçado em condições de crf.Em (A), as forças emitidas estão distribuídas quase simetricamente em torno de um ponto cerca de 8 g acima do limite inferior da classe de resposta operante. Note que poucas pressões (representadas por círculos vazios na Fig. 8-2) não alcançam adequadamente o critério de uma resposta e, portanto, não são reforçadas. Quando os experimentadores estavam convencidos de que a Fig. 8-2 representava o estado final estável do comportamento sob suas condições, eles aumentaram a força mínima requerida para 36 g O resultado dessa mudança na classe de resposta foi o ajustamento do comportamento do rato mostrado no histograma da Fig. 8-2B. A distribuição de forças deslocou-se para os valores maiores e centralizou-se em aproximadamente 41-45 g. O condicionamento desta nova classe de comportamento foi bem sucedido; a condição necessária para conferir à classe o 'status' de uma resposta operante foi alcançada. Houve uma outra conseqüência importante desse condicionamento. Novas forças emitidas, nunca antes vistas no repertório do animal (aquelas além de 45 g), ocorrem agora com freqüência moderada.

- 1 6 5 -

O procedimento dc diferenciação resultou no aparecimento e estabilização de um conjunto de novos comportamentos. Como isto ocorreu? Dois processos com piemen tares parecem ser responsáveis. Primeiro,observe que, no momento em que foi colocada em efeito, a nova condição de 36 g incorporava algumas forças existentes (veja a extremidade direita da Fig. 8-2A). Esperar-se-ia que o fortalecimento desses comportamentos com forças maiores que 36 gramas os manteria. Se esta condição não tivesse sido alcançada, quase que certamente teria ocorrido a extinção normal. Então, em segundo lugar, o mínimo de 36 g excluiu muitas forças anteriormente reforçadas. Quando pressões à barra com essas forças anteriormente reforçadas foram emitidas sob o procedimento de 36 g no mínimo, elas foram extintas. Lembre-se que um dos resultados do procedimento de extinção é um aumento na variabilidade do comportamento (seção 5.2). A extinção das forças de 21-36 gr anteriormente reforçadas, tenderia, assim, a produzir novas forças, tanto superiores quanto inferiores àquelas usualmente emitidas.A emissão de forças muito baixas não teria conseqüências no experimento presente, mas a emissão de forças muito altas teria conseqüências reforçadoras e, logo, seria fortalecida. Eventualmente, esses dois processos — ( 1) extinção diferencial e (2 ) fortalecimento diferencial — que interagiam ao longo da dimensão força, conduziram à estabilização comportamental na forma do histograma (B) da Fig. 8-2.

A extinção teve um papel duplo, crucial nessa diferenciação de pressões à barra mais fortes. (1) Agiu de modo a trazer novas e excepcionais variantes da resposta, algumas das quais com possibilidades de serem reforçadas. (2) Agiu de modo a enfraquecer o comportamento ao longo da porção da dimensão onde o reforçamento havia sido suspenso.

Como outros paradigmas comportamentais, a diferenciação tem uma definição completa apenas na especificação de seu dado, procedimento, processo e resultado.

DADA: uma classe de comportamento sendo emitida com algumaforça maior que zero.

PROCEDIMENTO: aplicar o reforçamento a* um subconjunto de variantesdessa classe e submeter o resto ao procedimento de extinção.

PROCESSO: ° fortalecimento gradual das variantes reforçadas e oenfraquecim ento gradua! do grupo dc variantes submetidas a extinção.

RESULTADO: uma distribuição estabilizada das variantes reforçadas cujaforça excede aquela das variantes não reforçadas.

O procedimento de diferenciação não precisa ser necessariamente aplicado como o foi no experimento de Hays-Woodbury. Tudo o que é necessário, pela nossa definição, é que um subconjunto de variantes seja reforçado e um segundo subconjunto extinto e que,juntas, essas duas possibilidades esgotem todas as variantes. Na Fig. 8-3, várias possibilidades são vistas esquematicamente. Somente (A) corresponde ao caso de Hays-Woodbury.

Lxcrcício 5. Prediga os efeitos do procedimento de diferenciação aplicado, da maneira mostrada, em cada um dos casos da Fig. 8-3, esboçando novas distribuições de variantes da resposta.

- 166 -

Dimensão comportamental

Figura 8-3. Algumas aplicações possíveis de reforçamento e extinção a variantes de R. As regiões reforçadas estão sombreadas.

Um caso semelhante au da Fig. 8-3D foi descrito por Keller e Schoenfeld (1950). Uma máquina de jogo foi modificada para permitir uma medida precisa de quanto o êmbolo era puxdo antes de ser solto. Variações nos limites inferiores superiores da resposta foram exploradas e o reforçamento para as variantes corretas era um1 flash?'de luz após a liberação do êmbolo. Pode-se selecionar uma faixa de variantes à qual os reforçamentos serão aplicados, tão estreita que um fortalecimento seletivo dessa faixa particular não é obtido. Pelo contrário, as variantes mais próximas da faixa de reforçamento manter-se-ão com forças iguais 'aquelas da faixa reforçada. Nessa situação, o experimentador atingiu as restrições mínimas para a definição de uma classe de resposta. Acima desses limites, os resultados confirmam, todavia, a lei: tudo o que é reforçado é também fortalecido.

Herrick (1963) projetou a barra vista na Fig. 8-4 para estudar o deslocamento da pressão à barra. As pressões realizadas por um rato moviam uma barra em T descrevendo um arco, enquanto um circuito eletrônico registrava o deslocamento máximo de cada pressão. A distância máxima que a barra percorria em cad.: pressão foi classificada em uma de oito zonas. A barra foi planejada de um modo que, quanto maior o número da zona, maior a quantidade de trabalho exigida do rato.

Figura 8-4. Barra usada para estudar o deslocamento da resoost*

Num experimento, Herrick (1964) primeiro reforçou as pressões incluídas em qualquer zona de 1 a 8 . Os resultados de um rato são vistos na Fig. 8-5A. Uma ampla faixa de deslocamentos foi obtida. A faixa das posições reforçadas foi, então, progressivamente, limitada. Quando somente as posições 3-6 eram reforçadas, obteve-se o histograma da Fig. 8-5B. A distribuição dos deslocamentos foi um pouco mais estreita; não obstante, o rato manteve a maior parte de suas pressões dentro dos limites reforçados. Mais além, nas séries experimentais, os únicos deslocamentos reforçados foram aqueles na zona 5. Os resultados são vistos na Fig. 8-5C. As pressões na faixa reforçada foram muito freqüentes mas ocorreram numerosas pressões nas zonas não reforçadas. Um efeito interessante visto no histograma da Fig. 8-5B é que as zonas próximas dos limites inferiores de reforçamento (zonas 3 e 4) incluem mais comportamentos do que as zonas próximas dos

36

18

r-n1 2 3 4 5 6 7 8

(A)

c 54o

36

18

E0>0

1 2 3 4 5 6 7 8(B)

(C)Zona da barra

I'igura 8-5. Distribuição dos deslocamentos da barra em função do tamanho da região reforçada. Às sombreadas do histograma indicam as zonas da barra nas regiões reforçadas (segundo Herrick, 1964)

- 1 6 8 -

limites superiores da zona de reforçamento (zonas 5 e 6 ). Este fenômeno pode ser interpretado como uma tendência do rato de dlspender “menos esforço” : dadas duas zonas de reforçamento, aquela que exigir a menor condição de trabalho será a mais fortalecida.

8.4 APROXIMAÇÃO SUCESSIVA

O maior poder do procedimento de diferenciação consiste na sua habilidade para criar e, então, manter comportamentos ainda não observados no repertório do animal. Este poder estende-se mais além nos casos em que diferenciações progressivas e graduais podem ser feitas no decorrer do tempo. No exemplo de Hays-Woodbury e nos exemplos da Fig. 8-3, uma diferenciação com um passo foi pretendida. Mas um segundo procedimento de diferenciação pode ser feito a partir dos resultados da primeira, e assim sucessivamente, de modo a produzir, eventualmente, comportamentos qué podem ser muito diferentes das formas originais. A menos que a história de diferenciação sucessiva fosse conhecida, seria difícil explicar o aparecimento desses comportamentos. Um bebê inicia a vida com um repertório de todos os sons básicos usados nas várias línguas, mas seu balbucio e murmúrio são muito diferentes da pronúncia adulta de uma frase em português. Ainda mais, o aparecimento de sentenças é precedido pelo de palavras, palavras pelo de sons silábicos e estes são diferenciados a partir da corrente de sons rudes emitidos pelo recém-nascido. As diferenciações progressivas e graduais que se fazem sobre os resultados de cada diferenciação prévia e que, gradualmente, conduzem o comportamento a alguma forma final desejada, são conhecidas como aproximações sucessivas do comportamento, final ou de modo mais simples modelagem do comportamento. O processo é representado esquematicamente na Fig. 8-6 . Pela enésima diferenciação, a distribuição de variantes obtida parece, para o observador casual, não ter relação alguma com a distribuição original da resposta. Contudo, as origens da enésima distribuição baseiam-se no

- fortalecimento c extinção sucessivos dos predecessores dessas variantes. Sem esta história causal a distribuição final na Fig. 8-6 nunca teria surgido

Dimensão da RFigura 8-6. Representação esquemática de diferenciações progressivas (aproximações sucessivas) ao longo de uma dimensão quantitativa da resposta. As áreas sombreadas representam as variantes reforçadas.

- 1 6 9 -

A diferenciação sucessiva deve ter um limite superior, determinado pela capacidade do organismo. Mas, dentro dos limites dessas restrições de capacidade, a aproximação sucessiva de uma forma final de comportamento é um método extremamente poderoso para produzir comportamento. Através deste processo de aproximação -sucessiva na dimensão força da barra, Skinner (1938) foi capaz de treinar um rato de 200 g a realizar o feito hercúleo de pressionar uma barra que requeria o mínimo de 100 g de força.

Nem a diferenciação nem a aproximação sucessiva estão limitadas a mudanças ao longo de uma dimensão quantitativa da resposta. Mesmo que a topografia, ou forma do comportamento seja de difícil mensuração, sua modelagem se dá de forma análoga à aproximação sucessiva ao longo de uma dimensão quantitativa. Anteriormente, fez-se referência ao operante de bicar o disco do pombo. Essa resposta, quase sempre, tem uma freqüência igual a zero, no nível operante e, assim, precisa ser modelada. Neste caso, o experimentador aproxima-se sucessivamente da forma desejada do comportamento, iniciando com uma forma que pode se parecer em nada com o bicar uma chave. O experimentador pode reforçar primeiro todos os movimentos do animal que ocorrem na vizinhança da parede que contém o disco. O efeito deste procedimento de diferenciação é fortalecer os movimentos do animal nas proximidades do disco. Então, o reforçamento é tornado contingente aos movimentos da cabeça próximos ao disco. Quando essa contingência tiver tido efeito de aumentar tais movimentos, o reforçamento será condicional ao tocar o disco com o bico. Neste exemplo, a mudança dos requisitos para o reforçamento combina-se com as mudanças progressivas do comportamento para modelar um novo ato. O aparecimento do bicar o disco é devido a uma história de diferenciação progressiva de antecedentes comportamentais remotos, com relação ao,s quais o bicar o disco contém uma pequena semelhança superficial. É este o processo através do qual muitas de nossas próprias habilidades são modeladas. É interessante notar que, embora a natureza forneça muitas situações de reforçamento seletivo (a corrida do coelho é reforçada somente se fôr bastante rápida para iludir a raposa; a corrida da raposa é reforçada apenas se fôr mais rápida que a do coelho), parece que a aproximação sucessiva é um arranjo de contingências estritamente humano. Professores, pais e amigos seguem tal procedimento, embora raras vezes tão sistematicamente como deveria ser. Talvez seja no laboratório que o maior poder do procedimento possa ser explorado, porque é lá que podemos controlar e mank pular melhor os muitos parâmetros, sugeridos pelas Figs. 8-3 c 8-6 , cujos efeitos no processo são ainda bastante desconhecidos.

8.5 EXTENSÃO DO CONCEITO DE OPERAOTE

Uma história de diferenciação e aproximação sucessiva pode tornar classes de comportamento suscetíveis ao reforçamento, classes estas que, de outra maneira, poderiam permanecer indisponíveis. Neste sentido, os procedimentos de diferenciação e aproximação sucessiva são, adequadamente, considerados métodos de criar operantes. Estamos agora em condições de entender porque a maioria dos operantes que observamos fora do laboratório, tais como o abrir e fechar portas, dizer “por'favor” , operar máquinas, assar bolos, en viar mensagens pelo código morse, chutar bolas de futebol, parecem ter uma estrutura mais unitária, como se fossem um único evento, do que sugerimos, anteriormente, ser característico da corrente de comportamento.O “status”de evento desses atos lhes é c o n fe r id o pelo lato de eles serem produtos da diferenciação.Diferencialmente refor

- 170 -

çados, de início na forma de classes arbitrárias, esses operantes tornam-se unidades funcionais através da ação do reforçamento seletivo de seus membros e extinção concorrente dos membros de todas as outra classes de comportamento.

Uma classe importante desses operantes criados é o conjunto cujos membros são constituídos de elementos que foram previamente modelados como operantes. No caso mais simples, o reforçamento é contingente à emissão de n repetições sucessivas de um operante anteriormente reforçado. Esse procedimento especifica um novo operante de ordem superior, constituído de n ocorrências sucessivas da classe de comportamento anteriormente reforçacfa. Quando descrevemos tal operante de ordem superior, referimo-nos aos membros da classe anteriormente reforçada que o constituem como seus seus elementos ( r i , r2 , r3 , ..., rn). Embora os elementos por si sòs constituíssem, inicialmente, classes unitárias de resposta, eles são tratados agora como componentes de uma classe de resposta de ordem superior (Findley, 1962). A especificação de um operante em termos de um número fixo de tais elementos repetidos é conhecida como operante de Razão Fixa (RF). O termo “ razão” refere-se ao número fixo de elementos repetidos por reforçamento. Por exemplo, depois de ter fortalecido o operante de pressionar a chave telegráfica num macaco, o reforçamento pode ser tornado contingente a 30 pressões consecutivas à chave telegráfica. Depois de modelar o bicar o disco num pombo, pode se tornar o reforçamento contingente a cada 50 bicadas no disco. Esses casos são denotados RF 30 e RF 50, respectivamente. Tais operantes de ordem superior, sendo constituídos de componentes facilmente observáveis e experimentalmente criados, são úteis por permitirem uma micro-análise compreensiva da estrutura do comportamento operante. Os elementos dos operantes RF são estudados tipicamente do mesmo modo que as respostas são estudadas em esquemas de reforçamento intermitente. Assim, os registros cumulativos dos elementos de operantes RF constituem um método de observação das características temporais de classes de resposta altamente ampliadas.

A transição do reforçamento de uma classe que tem somente um elemento para uma Classe contendo n elementos, representa um tipo de aproximação sucessiva, ao longo da dimensão do número (n) de elementos. Antes de mudar a condição para o reforçamento de um único elemento para n elementos, não há, todavia, qualquer informação sobre as variantes acessíveis ao longo das n dimensões. O único valor de n previamente examinado (reforçado) em crf foi sempre 1. Assim, a diferenciação é, em grande parte, um problema de tentativa e erro. Usando o bicar o disco (chave) por pombos, Ferster e Skinner (1957) foram capazes de passar diretamente de um elemento por reforçamento para razões de reforçamento de 40 e 50 elementos sem que a extinção ocorresse. Quando a diferenciação do novo operante havia estabilizado (umaspoucasdúziasdehoras).o padrão da taxa dos elementos era tal que taxas altas e uniformeseram freqüentese uma pequena pausa ocorria depois de cada reforçamento. A diferenciação de razões ainda mais altas requer uma aproximação sucessiva pelo aumento gradual de n. A razão e aumentada de 5 ou 10 c mantida no novo valor por várias sessões. Uma curva cumulativa típica, mostrando-um desempenho estável cm RF 120 por um pombo modelado desse modo, é vista na Fig.8-7. A curva mostra a uniformidade marcante do comportamento, no tempo, sob especificações RF. O reforçamento e seguido caracteristicamentc por pausas que duram 5 ou 6 min, depois do que o animal começa a bicar com uma taxa uniforme e alta que é mantida ate o reíorçamento. A pausa pós-reforçamento está relacionada de perto com o tamanho da razão. Razões grandes são marcadas por pausas longas. Em razões pequenas, a paus;( pode desaparecer totalmente. O limite superior da diferenciação da razão taivez seja

- 171

desconhecido. Skinner (1957) relata dados de Morse e Herrnstein nos quais um operante RF contendo 900 elementos foi estabilizado através de diferenciação progressiva.

Figura 8-7. Curva cumulativa do bicar a cliave, por um pombo reforçado após cada 120 bicadas (Ferster e Skinner, 1957).

Â noção de que o procedimento dc razão define um operante dc ordem superior é baseada em estudos que verificaram que este operante, como outros, pode ser submetido a um esquema de reforçamento e mantido indefinidamente nos moldes característicos dc um esquema particular. Ferster e Skinner (1957) reforçaram operantes em RF 30 sob um esquema de probabilidade uniforme. Isto é,

onde R = 3 0 bicadas na chaveSA = iluminação normalS3 = diminuição da iluminação

- 172 -

O fim de uma RF não reforçada era sinalizado no experimento de Skinner e Fe rs ter, por uma breve mudança na iluminação (colchete 3 no diagrama). Probabilidade de reforçamento (p) para o comportamento de bicar a chave em RF 30, de 0,85 ate 0,50, mantiveram o comportamento. Em 0,50, houve quase sempre uma tendênciaparaaocorrência de longas pausas entre os operantes RF (não entre os elementos) característica de um resultado encontrado por Brandauer (1958), que usou valores de p muito pequenos com um operante mais siipplcs, uma bicada na chave. Uma vez que Brandauer teve que chegar a probabilidades de 1/600 para obter o efeito que aqui foi obtido com 0,50 parece que a quantidade de comportamento envolvida num operante modifica sua suscetibilidade a um esquerna.

A função que relaciona a resistência à extinção ao tamanho da RF recebeu alguma atenção experimental. RFs grandes podem exigir um trabalho substancial do indivíduo e, por essa razão, pode se esperar que ela acarrete uma menor persistência, face à extinção, do que RFs pequenas. Boren (1961) e Weissman e Crossman (1966) apresentaram dados que mostram que na faixa entre RF 1 e RF 64, a pressão à barra em ratos e o bicar a chave em pombos parecem apresentar tal efeito. Apesar desta diminuição na persistência do operante em função do seu tamanho, muito mais elementos são, na realidade, emitidos na extinção de grandes RFs. De fato, dentro de certos limites, quanto maior a RF no treinamento, tanto maior será o número de elementos individuais emitidos durante a extinção.

Uma conclusão importante segue-se. Sc estamos interessados cm aumentar a persistência do comportamento face à extinção, a especificação de RF fornece um método altenativo para um esquema produzir perseverança. Podemos incorporar o comportamento como um elemento de um operante RF dc ordem superior.

Em contraste com os operantes de ordem superior criados pela combinação de elementos que se demonstrou anteriormente serem operantes, Hefferline e Keenan (1963) pesquisaram um operante “miniatura” , tão pequeno que uma amplificação eletrônica precisa ser empregada para detetá-lo. Essespesquisadores generalizaram, com êxito, u conceito de classe de resposta operante para comportamentos tão pequenos em aplitude que o sujeito, geralmente, não é capaz de dizer ter observado suas próprias respostas. Num experimento, potenciais de contração muscular do polegar de sujeitos humanos foram registrados. Eletrodos simulados foram colocados em outros pontos do corpo do sujeito para desviar sua atenção da resposta do polegar. Os sujeitos eram confortavelmente sentados em um cubículo triangular, com ar condicionado e à prova de som e eram instruídos, apenas para se relaxarem. Eles foram avisados de que ocorreria reforçamento na forma de pontos, registrados num contador localizado perto deles, e que cada ponto valeria 5 “cents” . Mas não foi dito aos sujeitos como eles poderiam produzir os pontos. Num sujeito, as contrações do polegar que geravam potenciais na amplitude de 25-30 microvolts eram reforçadas e, depois, extintas. Os histogramas para os 10 min de nível operante, seguidos por 6 blocos sucessivos de 10 min dc fortalecimentQ, seguidos por 10 min finais de extinção, são vistos na Fig. 8-8 . Os histogramas de condicionamento mostram que o procedimento de diferenciação foi bem sucedido no fortalecimento seletivo da classe reforçada de comportamento e que os 10 min de extinção causaram um enfraquecimento marcante na classe. Os registros cumulativos da contração muscular reforçada mostram uma taxa típica dc aumento da classe reforçada, mas - como deve ser esperado de um operante com dimensões tão limitadas o processo é gradual, esten-

- 1 7 3 -

150 - 2 0 -3 0 150 - Extinção

100 100 -

50 - __ , 50 -0 . 1---- 1 Q

10 15 20 25 30 35 40 45Microvolts

10 15 20 25 30 35 40 45

Figura 8-8. Histogramas de frequência de respostas para várias categorias de contrações do polegar, medidas em microvolts, durante o nível operante (NO), condicionamento e extinção. A categoria reforçada está sombreada (Segundo Hefferline e Keenan, 1963).

dendo-sepor 60 minutos de condicionamento. Isto difere, assim, das curvas abruptas de fortalecimento da pressão à barra no rato (Fig. 4-2).

Os resultados de Hefferline e Keenan são importantes na nossa análise do comportamento por várias razões. Primeiro, eles mostram os limites inferiores a que o nosso conceito de operantes pode ser levado e ainda denotam uma unidade funcional de comportamento. wSegundo, demonstram que a inabilidade do sujeito para verbalizar as contingências de reforçamento de modo algum afeta a regularidade do condicionamento e

- 1 7 4 -

extinção. Um terceiro fenômeno empírico — típico do comportamento operante em geral — é demonstrado. No operante de contrair o músculo a classe de resposta foi definida como con trac ts entre 25 e 30 microvolts. Mas uma inspeção mais detalhada dos histogramas da Fig. 8-8 mostra que as classes vizinhas de comportamento, embora não realmente reforçadas, foram também algo fortalecidas. O fortalecimento incidental induzido em comportamentos que realmente não participam das contingências de reforçamento é chamado indução de resposta. A indução de resposta ocorre durante o fortalecimento de qualquer operante, mas nem sempre é fácil verificá-la. Embora o experimentador possa desejar limitar o reforçamento a uma classe específica de comportamento, o fortalecimento pode se estender, através de indução, muito além dos limites estabelecidos. Ratos que aprendem os movimentos necessários para atravessar uma pista complexa, são capazes de nadar na pista, eficientemente, quando esta está alagada, embora o nadar requeira um grupo de movimentos bastante diferentes. Aprender a escrever com a mão direita treina a mão esquerda não usada, embora em grau menor. Aprender a falar o italiano torna mais fácil aprender a falar espanhol. A indução de resposta é estudada no laboratório com ajuda do aparelho para desenhar, que inclui um espelho, visto na Fig. 8-9. O sujeito recebe a tarefa de desenhar uma figura vendo, no espelho, a imagem desta. Uma vez que as relações usuais entre mão e olho são invertidas as primeiras tentativas são reproduções ruins. Gradualmente, o sujeito passa a desempenhar melhor a tarefa. A indução de resposta pode ser medida em qualquer momento, no processo de aquisição, testando-se a quantidade de melhora mostrada pela mãe esquerda, com a qual o sujeito não praticou.

Figura 8-9. D iagram a esquem ático de um apare lho de desenhar, com espelho. O sujeito se senta fren te a um a estrela que lhe é vfsivel so m en te no espelho (M ednick. 1964)

- 1 7 5 -

8.6 DIFERENCIAÇÃO DE TAXAAo se considerar os efeitos de certos esquemas de reforçamento, recorre-se sempre ao

fato de que taxas diferentes de resposta tornam-se diferencialmente correlacionadas com o reforçamento. Assim, esquemas de intervalo randômico tendem a fornecer reforçamento diferencial apôs taxas baixas e esquemas de probabilidade uniforme tendem a fornecer reforçamento diferencial depois de taxas altas. Uma vez que o efeito do reforçamento é fortalecer qualquer que seja o comportamento que vem antes dele, esses esquemas agem indiretamente no fortalecimento de certas taxas de comportamento. Se desejarmos, poderemos fazer surgir uma diferenciação maisdireta e invariante pela especificação dos limites, condições ou restrições da taxa do operante que deve ser reforçado.

No reforçamento diferencial de taxas baixas (drl), um operante R é primeiro especificado e fortalecido. Quando R tiver sido suficientemente fortalecido, ele é tomado um elemento numa nova especificação de resposta de ordem superior: somente os elementos de resposta que estão espaçados entre si pelo mínimo de uma certa quantidade de tempo são agora reforçados. Assim, o procedimento drl reforça um certo comportamento somente quando precedido de uma pausa. Wilson e Keller (1953) efetuaram este procedimento de drl, exigindo que os ratos espaçassem suas respostas de pressão à barra de determinados retardos mínimos, para que o alimento fosse liberado. A especificação do tempo mínimo para o operante foi aumentada gradualmente, em passos de 5 seg, de 10 para 30 seg, num período de 30 sessões. A Fig. 8-10 mostra que as diferentes pausas exigidas, estabelecidas pelas especificações, produziram taxas diferentes de pressão a barra.

Intervalo de Retardo (seg)Figura 8-10 . T axa m édia de pressão à b arra , d u ran te a ú ltim a sessão, em cada um dos cinco valores d iferen tes de um intervalo de re ta rd o m ínim o necessário e n tre pressões re fo r - çadas ( segundo W ilson e K eller, 1953).

- 1 7 6 -

Quando a especificação da pausa do drl foi aumentada, ocorreu um declínio sistemático na taxa dos elementos da pressão à barra. Outra maneira de dizer isso é que, quando se exige um aumento no retardo, ocorre um aumento sistemático na duração média das pausas entre as pressões à barra.

A especificação do drl é um operador poderoso para fortalecer e manter taxas baixas de algum comportamento especificado. Curvas cumulativas do bicar a chave mantido em taxa baixa, em pombos, quando somente bicadas precedidas por pausas de 3 minutos ou mais eram reforçadas, são vistas na Fig. 8-11. Através de um ajustamento adequado da especificação do d r l, manteve-se os pombos trabalhando lenta, mas estavelmente, 24 horas por dia, durante dois meses.

O operante de ordem superior fortalecido pelo procedimento drl consiste de uma topografia bem especificada (por exemplo, uma bicada ou uma pressão) precedida por uma topografia problemente especificada (por exemplo, qualquer coisa exceto uma bicada ou pressão). A classe “ qualquer coisa exceto” é, em geral, o suficientimente ampla para que os sujeitos individuais venham a formar comportamentos idiossincráticos, supersticiosamente reforçados durante a pausa forçada Wilson e Keller relatam que cada

Figura 8-11. Taxas de b icar a chave q u an d o som ente b icadas preced idas por um a pausa de 3 m in o u m ais eram refo rçadas (Sk inner, 1957).

rato desenvolveu uma forma de comportamento colateral, facilmente reconhecível e previsível, constituida ritualmente de limpar-se, farejar e andar em várias partes da câmara experimental durante os intervalos de retardo.

A especificação do operante drl é convenientemente expressada como uma amostra de comportamento que inclui, por um certo tempo,qualquer comportamento outro que não o selecionado, seguido pelo comportamento sejecionado. Fm notação de conjunto, defininmwnicialmente, em U , o operante R. A porção de )J não incluida em R é chamada Re inclui quaisquer comportamentos, exceto aqueles que caem na classe R. Evidentemente, R e R esgotam o espaço comportamental, ]J Sob o d rl, o novo operante, 0, é definido como consistindo de: pelo menos T min de R, + R.

O operante drl foi mantido com sucesso em esquemas de intervalo por Angei (1956) e Ferster e Skinner (1957).

- 1 7 7 -

Em contraste com o d ri, taxas muito altas de comportamento podem ser geradas, tornando-se o reforçamento contingente à completaçao dos elementos de uma razão operante dentro de um intervalo de tempo especificado. Se este intervalo fôr progressivamente diminuído, ou a razão progressivamente aumentada, ocorrerá uma modelagem de taxas extremamente altas dos comportamentos componentes. Este procedimento é conhecido como reforçamento diferencial de taxas altas (d r h ) .

8.7 REFORÇAMENTO DO RESPONDER CONTÍNUO

Como vimos, a criação de operantes através do processo de diferenciação age, tipicamente, impondo um início e um fim arbitrários ao comportamento. A criação de unidades discretas desta natureza é útil para se medir os efeitos comportamentais, pois as unidades prestam-se à contagem. A contagem, naturalmente, toma possível o cálculo de uma taxa de resposta e, consequentemente, da probabilidade da resposta, com todas as vantagens adicionais dessas variáveis.

Todavia, esta separação de operantes em eventos discretos com início e fim definidos não é uma condição necessária para sua definição. Se o fosse, a análise de comportamentos interessantes tais como ficar parado e o seu inverso, mover-se continuamente, estariam fora do âmbito do comportamento operante. Que esses com portam entos são tão suscetíveis ao reforçamento, como as unidades comportamentais mais óbvias, é demonstrado pelo reforçamento de uma resposta contínua de correr, num rato. O aparelho para estudar o correr é uma gaiola rotatória, semelhante à que é vista na Fig. 8-12, mas modificada pela adição de um comedouro para liberar automaticamente uma pelota de alimento, quando necessário. Com o

F igu ra 8-12. G aio la ro ta tó ria e reg istrador au to m ático . A ro d a gira apenas no sen tido an ti-horário .

- 1 7 8 -

objetivo de estabelecer uma classe de comportamento, uma volta de 360 graus fornece uma unidade conveniente, embora perfeitamente arbitrária, do comportamento a nüi reforçado. Se o correr (definido como uma volta completa) é reforçado num intervalo fixo de 5 min ( IF 5 min), somente a primeira volta depois de decorridos os 5 min será reforçada. Os efeitos do reforçamento consistem em fortalecer um padrão de corrur, característico do responder em esquemas IF (ver Figs 7-2 e 74). O rato para por vários minutos logo após um reforçamento e, então, corre numa taxa altá até o próximo reforçamento, e assim por diante (Skinner e Morse, 1958). Aqui o desenvolvimento do padrão da IF serve para verificar a natureza operante do correr.

8.8 SUMÁRIO

Os procedimentos de diferenciação e aproximação sucessiva aumentam fcrandemente o nosso controle experimental sobre o comportamento. Eles são procedimentos que permitem selecionar os aspectos do comportamento que desejamos reforçar e, realmente, tornar os comportamentos desejados disponíveis para o fortalecimento. A combinação de esquemas de reforçamento com várias especificações de resposta (incluindo as especificações de ordem superior compostas de operantes condicionados anteriormente) permite que grandes amostras do comportamento de um organismo, no laboratório, sejam mantidas e estudadas por longos períodos de tempo. Os procedimentos de razão permitem o estudo de como a quantidade dc trabalho necessária para o reforçamento pode afetar o comportamento. Os procedimentos dc d rl e d rh tornam possível o estudo de uma ampla faixa de taxas de comportamento. No pombo, por exemplo, esses procedimentos produzem uma faixa estabilizável do taxas de bicar a chave de menos de 100 respostas por hora até 20.000 respostas poi hora. Frequentemente, especificações de respostas engenhosas podem ser usadas pani estabelecer linhas-base comportamentais, análogas às linhas-base de esquemas, a parlii das quais podem ser estudados os efeitos típicos de drogas e outras operações.

Um número de atividades humanas características são correlacionadas com vária» especificações operantes pesquisadas no laboratório. O trabalho por peça, no qual um trabalhador é pago para produzir um número fixo de artigos, c uma especificação RF clara. Assim também são atividades como datilografar um grande número de páginas, preparar longos exercícios ou bater um prego na madeira. Em muitas dessas, se a quantidade de comportamento envolvida é substancial,uma pausa antes dc “voltar ao trabalho” é vista com freqüência. Podemos observar comportamentos em drh nas atividades onde um prêmio e dado pela execução rápida do trabalho em pouco tempo - isto pode ser visto em garçons, na hora de movimento ou, no basebol, os movimentos de um jogador correndo para a primeira base. Tipos de comportamento mais “intelectuais” também sc ajustam aos paradigmas de diferenciação. Numa discussão verbal, por exemplo, há comu* mente um premio em d rh para “pensar rápido” e replicar. Por outro lado,numa briga,há frequentemente um premio em d rl para o não responder muito precipitadamente e “dizer coisas de que nos arrependeremos mais tarde” .

Segue-se uma nota sobre as similaridades entre os efeitos de certas especificações de resposta e os efeitos de certos esquemas. A Razão Fixa, por exemplo, não difere do IF em seus efeitos sobre o comportamento (compare a Fig. 8-7 e a Fig 7-3 ). Essas semelhanças têm levado os teóricos a tentarem reduzir esquemas e diferenciação a uma estrutura comum, enfatizando os parâmetros de probabilidade de reforçamento^e nâo enfati-

- 1 7 9 -

/.ando variáveis de especificação de resposta, ou vice-versa. O sucesso de tal empreendimento ainda não está assegurado e, para os objetivos presentes preferimos considerar um esquema como um procedimento de especificação de contingências probabilistic as de reforçamento no tempo, dada a classe de R. Por outro lado, consideraremos a diferenciação como um procedimento para especificar em que classe de comportamento se deve agir com um esquema dc reforçamento. A observação de que uma certa definição de R sob um esquema pode produzir efeitos semelhantes,ou mesmo idênticos à outra definição sob um esquema diferente, pode realmente ser interessante. Todavia, tais correspondências comportamentais não significam necessariamente que, em geral, cada especificação ou esquema seja redutível ao outro.

8.9 A LINGUAGEM E LÓGICA DOS CONJUNTOS

Um conjunto é qualquer coleção bem definida de objetos ou entidades conceituais. O termo “ objetos ou entidades conceituais" é tomado num sentido amplo, significando coisas tais como árvores, pessoas, mesas de cozinha, resultados do atirar uma moeda, cor de cabelo, respostas ou números. Dizer que um conjunto é uma coleção bem definida significa o fato dc que, para qualquer objeto ou entidade conceituai, podemos dar uma resposta definida -- sim ou não - no que se refere a se esse objeto está numa coleção particular. Alguns exemplos de conjuntos são:

(1) Todas as pessoas da cidade de Kansas com cabelo vermelho.(2) Os filmes onde Alec Guinness aparece.(3) Os números ímpares.(4) Os países do mundo com parlamentos eleitos.(5) Todos os comportamentos que abrem uma porta.

Para cada um desses conjuntos, podemos dar uma resposta sim ou não no que se refere a se uma dada pessoa, ou filme, o número,ou país, ou comportamento, respectivamente, poderia ser incluido na coleção. Na terminologia dos conjuntos, os itens individuais que compõem a coleção são chamados os membros, ou elementos do conjunto.

Os conjuntos são quase sempre simbolizados por letras maiúsculas. Assim, os inteiros ímpares menores que 10, tomados como um conjunto, podem ser simbolizados pela letraI, c o conjunto das vogais comuns na língua inglesa, pela letra V. Suponha que desejamos indicar os membros de um conjunto. Um método para escrever as coleções que chamamos conjuntos é enumerar cada um dos membros do conjunto, separando cada um por vírgulas e colocando-os em chaves. Assim, o conjunto dos inteiros ímpares menores que10 é escrito.

/ = {1 ,3 ,5 ,7 ,9}

e o conjunto das vogais comuns da língua inglesa é escritoV = {a, e, i, o, u)

Algumas vezes o conjunto ou coleção é muito amplo para que possamos convenientemente escrever todos os seus membros ou elementos. Então, podemos usar três pontos

- 180 -

após escrever um número de membros suficiente para sugerir a regra que d e t e n m n a ;■ filiação. Por exemplo, poderíamos escrever o conjunto dos governos com a s s e m b lé ia s legislativas eleitas, P, como

P {Canadá, Inglaterra, França, Estados Unidos, Islândia...}

Dois conjuntos especiais, são de interesse. Um é o conjunto universal, s im b o l iz a d o por y . O conjunto universal, y , contém todos os elementos aos quais f a z e m o s qualquer referência numa dada discussão.Em termos de nossos exemplos anteriores, todos os seguintes seriam conjuntos universais apropriados:

(1) todas as pessoas da cidade de Kansas.(2) todos os filmes feitos.(3) - todos os números.(4) todos os países do inundo.(5) todos os comportamentos do indivíduo.

O y serve simplesmente para delimitar qualquer discussão particular, estabelecer seus limites c definir o tópico ou região a partir da qual as várias coleções podem, então, sei feitas.

Um segundo conjunto especial é aquele que não tem membro algum. Tal conjunto é chamado conjunto vazio, <p . Todos os números ímpares com um único dígito acima de 10 , todos os países do mundo que têm dinossauros vivos, todas as pessoas da cidade de Kansas com cabelo verde são presumivelmente exemplos do conjunto vazio, $ . Note que há somente um $ , ao passo que há tantos conjuntos universais diferentes quantos quadros de referência houverem para qualquer discussão determinada.

Embora um conjunto se componha de elementos, alguns ou todos os elementos podem ser, por si sós, considerados conjuntos. Considere o conjunto universal, y , de todos os livros, sentenças, palavras e letras. Um elemento desse conjunto é este livro. Mas este livro contem uma coleção de sentenças. Essas sentenças compõem um conjunto: o conjunto das sentenças deste livro. A análise pode ser levada ainda mais longe para palavras c, então, para letras. As sentenças contêm os elementos palavras; as palavras contêm, ainda, como elementos, as letras. Nessa conexão, é importante notar que, ao se enumerarmos elementos de um conjunto, incluimos apenas os elementos diferentes. Assim, os elementos do conjunto L das letras que constituem a palavra “agradável” sao escritos

L — {a, g, r, d, v, e, 1}

Não duplicamos o a que ocorre mais de uma vez na palavra porque é um e le m e n to idêntico. Naturalmente, se a palavra Agradável fosse escrita em letra maiúscula, e n ta o deveríamos incluir o A, assim como o a, como elementos, dependendo se t iv é s s e m o s tomado o nosso conjunto universal como o conjunto de todas as letras, ou s o m e n le o conjunto das letras minúsculas.

A noção de que os conjuntos podem ser divididos em conjuntos está contida n o conceito de um subconjunto. Um subconjunto, B, de A, é um conjunto tal que iada membro de B é também um membro de A. O contrário não é necessariamente ver d a

i Ri

deiro. Assim, se o conjunto de todas as pessoas que vivem nos Estados Unidos é um conjunto universal, então o conjunto das pessoas da cidade ae Kansas é um subconjunto. Além disso, o conjunto das pessoas de cabelo vermelho da cidade de Kansas é um outro subconjunto. Suponha que todas as pessoas sejam um conjunto universal, y . Então, o conjunto dos homens é um subconjunto deste conjunto universal. Mas o conjunto de meninos é ainda um outro subconjunto. Todos os meninos são do sexo masculino, nias nem todas as pessoas do sexo masculino são meninos.

Para representar o fato de que todos os membros ae um dado conjunto B são também do conjunto A, escrevemos

B C A

o que significa que cada elemento de B é também um elemento de A.Para representar estas noções e para ajudar nossa intuição sobre as várias manipu

lações e combinações simples dos conjuntos que desejarmos fazer, os diagramas conhecidos como diagramas Venn são úteis. Num diagrama Venn, o Conjunto P- é representado por urn retângulo e os vários conjuntos e subconjuntos de y são representados poi círculos, figuras oblongas, ou outras figuras irregulares. Assim, na ilustração anterior a relativa ao conjunto das pessoas da cidade de Kansas, desenhamos

[8 .1]

(Hide K são as pessoas da cidade de Kansas. Se desejamos indicar as pessoas de cabelos vermelhos da cidade de Kansas podemos desenhar dois círculos, deixando-os parcialmente sobrepostos, como em:

[8.2]

onde os círculos K e V representam, respectivamente, as pessoas da cidade de Kansas e as pessoas de cabelo vermelho. Nem todas as pessoas de cabelo vermelho vivem na cidade de Kansas, mas aquelas que vivem estão representadas pela região superposta sombreada em 18.21 chamada a intersecçao dos dois conjuntos V eK 0 símbolo a é usado para denotar a intersecçao de dois conjuntos. Logo, [8 .2 1 pode ser escrito como V A K.

Suponha que desejamos nos referir aos dois conjuntos de animais, ratos, R, e gatos,G. Então, se o conjunto universal P consiste de todos os animais conhecidos, temos .

[8.3]

- 1 8 2 -

Em [8.3], nenhum elemento é membro de ambos, R e G. Isto é, não há animal algum que seja, ao mesmo tempo, um rato e um gato. Evidentemente, então, R a G = Corjuntos que nao têm regiões de superposição como em [8.3] são ditos conjuntos m u tu a m e n te e x c lu s iv o s . Se ou não dois conjuntos se sobrepõem, freqüentemente temos ocasião de aludir aos membros de ambos os conjuntos, tomados simultaneamente, como um grupo. Se estivéssemos interessados em animais peludos, então ratos e gatos poderiam ser classificados juntos. Em diagramas Venn, para nos referirmos a essa coleção, poderíamos escrever:

onde P é o grupo de animais peludos.Um conjunto X tal que qualquer elemento x é ou um gato ou um rato é chamado

a u n iã o dos dois conjuntos R e G e é escrito: X "RUG. O conjunto Xé o que está representado pelas áreas sombreadas em |8.4).

Um conceito final será útil. Frequentemente, desejamos discutir o co m p le m e n to de um conjunto S, simbolizado porS,—>S. O complemento de um dado conjunto é aquele conjunto que contem todos os não membros do conjunto dado. Assim, os conjunto* complement ares de cada um dos nossos exemplos originais são dados por:

(1) U - Todas as pessoas que não têm cabelos vermelhos na cidade de Kansas.(2)U -Todos os filmes que não apresentam Guinness(3)U -Todos os números exceto os ímpares(4)U -Todos os países do mundo que não têm parlamentos eleito e(5)U -Todos os comportamentos que não abrem portas.

Note que o complemento e formado pela comparação do conjunto original com o conjunto universal, escrevendo-sc como complemento o que está fora. Assim, o complemento de nosso conjunto K em 18 .11 c convenientemente representado pela área sombreada em [8.5j

[8.5]

Exercício 6 .D e m o n stre que S U S — 11 e que S A S = cí>.

REFERÊNCIAS PARA OCAPÍTUI O 8Anger, D. The dependence of interresponse times upon the relative rein

forcement of different interresponse times. J. exp. Psychol., 1956, 52, 145-161.

- 183

Boren, J. J. Resistance to extinction as a function of the fixed ratio. / . exp. P s y c h o l1961, 61, 304-308.

Brandauer, C. M. The effects of uniform probabilities of reinforcement on the response rate of the pigeon. Unpublished doctoral dissertation, Columbia Univer., 1958.

Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. New York: Appleton-Century-Crofts, 1957.

Findley, J. D. An experimental outline for building and exploring multioperant behavior repertoires. J. exp. Anal. Behav., 1962, 5, 113166.

Hefferline, R. F., and Keenan, B. Amplitude-induction gradient of a small-scale (covert) operant. J. exp. Anal. Behav., 1963, 6 , 307315.

Herrick, R. M. Lever displacement during continuous reinforcement and during a discrimination. J. comp. Physiol. Psychol., 1963, 56, 700-707.

Herrick, R. M. The successive differentiation of a lever displacement response. J. exp. Anal. Behav., 1964, 7, 211-215.

Hull, C. L. Principles of behavior. New York: Appleton-Century-Crofts, 1943.


Mednick, S. A. Learning. Englewood Cliffs: Prentice-Hall, 1964.Skinner, B. F. The behavior of organisms. New York: Appleton-Century,

1938.Skinner, B. F. The experimental analysis of behavior. Amer. Sci.f 1957,

45, 343-371.Skinner, B. F., and Morse, W. H. Fixed-interval reinforcement of running

in a wheel. J. exp. Anal. Behav., 1958, 1, 371-379.Weissman, N. W., and Crossman, E. K. A comparison of two types of

extinction following fixed-ratio training. J. exp. Anal. Behav., 1966, 9 ,4 1 -4 6 .

Wilson, M. P., and Keller, F. S. On the selective reinforcement of spaced responses. J. comp, physiol. Psychol., 1953, 46, 190-193.

- 1 8 4 -

Capítulo 9: CONTROLE AMBIENTAL

Ao discutir os procedimentos de fortalecimento operante, esquemas e diferenciação, dedicamos pouca atenção ao ambiente predominante. Durante o fortalecimento da pressão à barra de um rato, do choro de um bebê, do bicar de um pombo e da expressão de opinião de um estudante, nosso interesse no ambiente se limitou à verificação de que o operante era possível (isto é, que barras, discos, e uma história passada com a língua inglesa existissem quando necessários) e que o reforçamento poderia ser introduzido quando se desejasse. Contudo, é visível, ao se considerar o comportamento de qualquer organismo, que essa negligência das condições predominantes do meio deve resultar numa imagem muito inadequada do comportamento. Em geral, os organismos emitem respostas seletivamente, de acordo com o estado de seus ambientes presentes ou passados. Uma criança aprende a chorar somente quando um dos pais está em casa para reforçar o choro. Um cão não pedirá alimento na ausência de um ser humano. Dificilmente pediremos água quando ninguém estiver na sala para ouvir (e então nos reforçar). Todos esses casos ilustram um tipo de controle do comportamento exercido pelo meio, mas um tipo de controle que difere em vários modos da maneira pela qual os estímulos eliciadores controlam seus respondentes. Exemplificando,não gritamos nosso pedido no restaurante, mais e mais alto quanto mais alto for o garção. Por outro lado, um aviso sussurrado pode gerar uma atividade intensa, se aquilo que se diz justifica tal tipo de atividade. Numa palavra, as leis do reflexo são inaplicáveis ao controle ambiental de operantes. Um grupo de leis bem diferentes, expressas em termos da história passada de reforçamento do organismo, governa a emissão seletiva de operantes. Para formular essas leis,, todavia, precisamos conceituar um número de dimensões para especificar, analisar e , em geral, descrever quantitativamente o ambiente dos organismos.

9.1 DIMENSÕES DO ESTIMULO

O ambiente prevalente de um organismo pode ser considerado como o padrão ou a configuração de todas as energias, presentes num determinado momento, que são capazes

jde entrar em relação funcional com o comportamento. Essas energias são apena^ um pequeno subconjunto das energias estudadas pelos físicos. Elas se limitam, namaiona, àquelas que podem ser detectadas por estruturas anatômicas especializadas, receptores, que os organismos têm para receber certas energias e transformá-las em impulsos elétricos

- 1 85 -

nervosos. 0 olho é especializado para a recepção de uma faixa limitada de radiação eletromagnética, o ouvido para uma faixa limitada da pressão do ar causada por vibrações, a língua e o nariz para certas energias químicas. Existem receptores na pele que detetam a pressão mecânica, mudanças térmicas, etc. Há receptores nos músculos e articulações do corpo que detetam o movimento dos músculos e articulaçõesf, aos quais estão incorporados. Uma especificação completa dos padrões de energia eletromagnéticas, mecânicas, químicas e térmicas que atingem os receptores dos organismos em qualquer momento dificilmente será feita. Felizmente, isto nemé sempre necessário. Uma vez que o comportamento pode estar sob o controle seletivo de partes ou aspectos limitados de configurações de energia que constituem o que chamamos ambiente, somente uma pequena parte selecionada ou aspecto único de energia do ambiente é variada no trabalho experimental. O restante do ambiente é mantido tão constante quanto possível. Esses aspectos ou partes do meio, experimentalmente manipuláveis, são o que chamamos mais comumente estímulos. De todas as leis do comportamento em que os estímulos participam, até agora vimos somente as leis do reforçamento e da eliciação; outras comporão o conteúdo deste capítulo e do seguinte.

O estímulo é uma unidade ambiental arbitrária. Quando manipulamos ou mudamos aspectos limitados do meio e os correlacionamos com o comportamento, estamos manipulando essas unidades. Na manipulação do meio visual, por exemplo, frequentemente restringimos nossas mudanças experimentais a uma das dimensões fundamentais pelas quais os físicos descrevem a luz. Para os nossos objetivos, a luz pode ser considerada como uma faixa limitada de perturbação eletromagnética, irradiada a 300.000 km/seg, em forma de ondas. As ondas de luz podem ser representadas como na Fig. 9-1. O comprimento de onda (X , Fig. 9-1, lê-se “ lambda” ) é uma dimensão importante do estímulo, à qual foram correlacionadas respostas diferentes chamadas nomes das cores. Os comprimentos de onda que constituem a luz formam apenas uma pequena porção de todo o espectro eletromagnético.

Comprimento

Figura 9-1. A natu reza o n d u la tó ria regular da luz pu ra . O com prim en to de onda ( À ), isto é, a d iferença en tre cristas de ondas sucessivas, é inversam ente p roporc ional à freqüência das ondas no tem po e é co rre lacionado com o que cham am os de cor, ou m atiz, da luz. A am plitude está relacionada com a intensidade de luz.

Na Fig. 9-2, vê-se uma dimensão eletromagética mais completa de X .Quase todos os organismos respondem a diferenças na amplitude ou intensidade das

ondas de luz,mas somente um número limitado de espécies tem receptores especializados para detetar mudanças em X Pombos, homens,serpentes e macacos são exemplos de organismos que detetam tais mudanças. Outros, tais como o rato e o cão são ditos cegos a cores porque diferenças em X apenas não controlam o seu responder diferencial. O receptor que chamamos de olho é convenientemente comparado a uma câmara fotográfica porque ambos têm similaridades funcionais (ver Fig. 9-3). Ambos recebem a luz

- as r -

através de um diafragma ajustável. No olho, este diafragma é chamado íris. Ambos, olho e câmara, têm lentes através das quais a luz passa e que servem para focalizar a luz numa superfície sensível. Na câmera, essa superfície constitui a emulsão do filme. No olho a superfície consiste de células nervosas que constituem a retina. Essas células retínicas transformam a luz em impulsos nervosos.

Quando as ondas de luz da Fig. 9-2 incidem sobre o olho, elas são algumas vezes referidas como luzes espectrais puras. Essas são as luzes que aparecem no arco-íris e podem ser reproduzidas no laboratório por um aparelho chamado monocromador. São ditas puras porque contêm apenas um comprimento de onda. A maioria das luzes, incluindo aquelas que atingem o olho refletidas de superfícies como mesas, cadeiras, quadros negros, gramados estão longe de serem puras neste sentido. Geralmente, mesmo a luz de uma superfície homogeneamente colorida ou de uma lâmpada é constituida de uma grande mistura de comprimento de ondas diferentes. Aqueles comprimentos de onda que são predominantes determinam, usualmente, a nossa resposta de denominação da cor. Todavia, algumas misturas de luz não são denominadas por seus comprimentos de onda predominantes. A palavra “púrpura” nunca é usada para n o m e a r uma luz espectral pura de um comprimento de onda. “Purpura” é o nome de cor para uma mistura de azul e vermelho. As luzes que chamamos brancas e as superfícies que chamamos cinzas irradiam misturas heterogêneas de quase todos os comprimentos de onda visíveis. Nenhum comprimento de onda, isoladamente, predomina em tais luzes, mas o rótulo “sem cor” que frequentemente lhes é dado parece se. uma designação incorreta.

As dimensões visuais do estímulo não se limitam a distribuições de comprimentos de onda e intensidades diferentes de feixes de luz isolados. As dimensões relevantes que podem controlar o comportamento podem ser definidas de modo a incluir combinações espaciais das dimensões fundamentais de comprimento de onda e intensidade. Por exemplo, as intensidades relativas de duas regiões de luz adjacentes podem ser uma dimensão poderosa do estímulo controlador que determina a resposta relativa ao brilho que um observador dará a uma parte do padrão. Olhando a Fig. 9-4, vê-se que, quando a quantidade de luz refletida pelo fundo (background) varia, as respostas ao brilho do triângulo central mudam embora este último permaneça constante. Isto é, o observador relatará brilhos diferentes do triângulo. (Este fenômeno é chamado contraste de brilho). De fato, para produzir uma resposta de relatar que o brilho do triângulo não foi alterado, teríamos de Variá-lO de tal modo que, quando a intensidade do fundo fosse aumentada (mais luz no fundo) o triângulo seia também proporcionalmente aumentado em intensidade (triângulo também mais intenso). Na situação ilustrada pela Fig. 9-4, uma resposta de relatar um brilho idêntico para os triângulos diferentes é obtida somente quando a ra zã o entre as intensidades do triângulo e do fundo é a mesma (Wallach, 1948)l O controle funcional da resposta de relatar o brilho para os triângulos da Fig. 9-4 está claramente localizado numa variável ambiental composta. Como esta regularidade entre meio e comportamento é a base sobre a qual atribuimos o “ status” de estímulo aos eventos do meio, não haveria motivo para não denominar de estímulo esta variável composta. Essa designação, naturalmente, não exclui o fato de que, com outras contingências predominantes, o triângulo apenas, ou o fundo apenas, possam também funcionar como estímulos individuais.

Outro exemplo de controle de estímulo complexo é visto nas linhas da Fig. 9-5, comumente referido como “ ilusão” de Müller-Lyer. Os dois segmentos de linha horizontais são julgados de comprimento desigual porque a variável de estímulo que controla o julgamento não é apenas a simples variável do comprimento da linha hori-

- 187 —

Retina

Figura 9-3. O olho comparado Funcional e esquemáticamente com urna câmara fotográfica (segundo Wald, 1950). "

▲

Figura 9-4. Um exemplo de como as relações entre duas partes do campo visual influenciam as respostas (Segundo Boring, Langfeld e Weld, 1948).

>----------<

<------->Figura 9-5. A ilusáb de Müller-Lyer.

1 8 8 -

zontal. Em vez disso, a dimensão relevante do estímulo é composta, formada do comprimento da linha horizontal e ângulo dos dois segmentos das extremidades.

Os estímulos sonoros, como os estímulos luminosos, podem também ser analisados num conjunto de dimensões que os compõem. O som tem uma semelhança superficial com a luz, apresentando certas propriedades de onda. Mas as ondas do som são perturbações na pressão do ar, propagadas lentamente (213,36 m/seg), mais semelhantes às ondas do Mar, que são produtos de perturbações na pressão superficial da água. As mudanças na amplitude das ondas sonoras constituem mudanças na intensidade da energia e estão associadas a alturas (de som) diferentes. A Fig. 9-6 indica várias intensidades de sons em termos de uma escala logarítmica chamada de decibel; a figura fornece alguns exemplos comuns das fontes dessas intensidades.

A dimensão comprimento de onda mostra-se adequada para descrever os estímulos sonoros. O som, todavia, é convencionalmente descrito pelo número de cristas ou ciclos por segundo (cps) em vez de X . O número de ciclos por segundo, ou a freqüência do som, é a dimensão em que estão baseadas as respostas de identificar a tonalidade. O homem é capaz de dar respostas diferenciais de tonalidade numa faixa de 20-20.000 cps. Outros animais, tais como cães e morcegos, são capazes de detetar freqüências duas ou três vezes maiores que nosso limite superior de freqüência. O modo pelo qual as respostas de identificação da tonalidade variam com a freqüência é ilustrado na Fig. 9-7, que dá a principal freqüência das várias notas do piano.

Tal como uma luz pura contendo apenas um X é rara, também o é um tom puro contendo somente uma freqüência. Diapasões e osciladores de laboratório são fontes de tons puros. Os tons de instrumentos musicais contêm uma mistura de freqüências e a tonalidade é geralmente determinada pelas freqüências predominantes. Sons comuns tais como latidos, ruídos de tráfego, conversa e música representam misturas muito complexas de muitas freqüências audíveis em intensidades aproximadamente iguais (tais como aplausos e estática de rádio) é chamado ruído branco, por analogia com a luz branca.

As dimensões foram conceituadas para descrever as energias que compõem partes do nosso meio químico, mecânico e térmico. Respostas relativas a cheiro e gosto estão baseadas em mudanças diferenciais na concentração e estrutura molecular de gases no nariz e soluções na língua, respectivamente. Mudanças na temperatura superficial são detetadas por certos receptores que estão situados na pele.

Para descrever os estímulos que se originam dos movimentos dos músculos e tendões, chamados prop ri ocep tores, surgem problemas experimentais. A mensuração de mudanças no meio interno é difícil sem se invadir cirurgicamente o organismo. A localização dos proprioceptores e seus receptores associados torna tais mudanças no meio interno relativamente inacessíveis, tanto para medir como para manipular. Na prática, os estímulos internos são, portanto, quase sempre mais inferidos que realmente observados.

Note que nesta discussão empregamos um grupo de termos para descrever as dimensões de estímulo e outro grupo para descrever as respostas comportamentais correspondentes. Embora haja correlações regulares entre esses estímulos e as dimensões da resposta (descritas extensamente na área da psicologia chamada psicofísica) as denominações dos estímulos e das respostas não devem ser contundidas. Frequência e intensidade de energia luminosa são dimensões do estímulo; cor e brilho são dimensões da resposta. Freqüência e intensidade de energia sonora são dimensões do estímulo; volume e altura são dimensões da resposta. Cheiro, gosto, temperatura e peso são termos de resposta

- 1 8 9 -

140

120

100

I 80(j 4>T3

» 0T3

•3•s f 10 c4>? 20z

o

2° 3 0 i 100 11,000 I 1 10 ,0 0 0 150 50Q 2Ü Q C1.50Q Q -. 20.0QQ

F reqüência (ciclos po r segundo).

Figura 9-6. Intensidade de alguns sons familiares (segundo Lewis, 1963).

associados com as dimensões de estimulo da estrutura química, energia térmica, quantidade de força, e assim por diante. O reconhecimento da diferença entre os termos apropriados para descrever os estímulos e aqueles para descrever as respostas impedirá bastante confusão e discussão desnecessária.

9.2 GENERALIZAÇÃO DE ESTIMULO

A importância de se ter dimensões quantitativas disponíveis para descrever e manipular os ambientes dos organismos é vista claramente na quantificação do fenômeno comportamental conhecido como generalização de estímulo. Este fenômeno é observado numa forma grosseira quando uma criança aprendendo a falar se refere a todos os objetos peludos como “gatos” e chama todos os homens adultos de “papai” . Ele é exemplificado em nosso próprio comportamento, quando acenamos a um estranho por engano porque se assemelha a um amigo. Nestes exemplos a similaridade de estímulos parece estar claramente envolvida, mas até que possamos especificar as dimensões quantitativas às quais relacionar objetos tais corno gatos, coelhos e casacos de pele, uma avaliação precisa do grau de similaridade de duas quaisquer situações de estímulo é difícil. A disponibilidade de dimensões de estímulos do tipo descrito na seção 9.1 permite um estudo mais sistemático desse tipo de similaridade que pode ser experimentalmente reinterpretada como se segue. Depois que uma resposta foi fortalecida na presença de uma configuração

Sistema dc am pliação de alta potência

Avião - 1600 rpm . 5,5m M artelar em aço, 60 cm TrovãoCaldeira de uma fábricaM etro, estação local (trem passando)

. Local mais ruidoso em Niagara Falls^ Rugido do leão2STrafego m uito in tenso , 4,5m^ Rádio m uito alto- Conversação norm al, lm— Escritório ruidoso ou uma loja

Escritório medio Rua residencial tranqüilaRua pouco m ovim entada R esidência média Música b<’m suave

Sussurro suave, l,5 m Ruído m ínim o ao ar livre

- 190 -

C médio

M iC iW ^ A ^ C D E

T ec lad o do p iano

tA ltu ra p ad rão : 4 4 0 cps

L J-------------------1---------------------1_____________ I__________________ I______________I_____________ I_____________ L_J25 50 100 200 500 1000 2000 4000

F reqüência em ciclos p o r segundo

F igura 9-7. F reqüências do som de vários to n s do p iano (segundo Boring, Langfeld e W eld, 1948).

particular do meio, ela ocorrerá também, mas numa extensão menor, quando o meio estiver ligeiramente alterado de algum modo. A resposta pode desaparecer totalmente quando a mudança no meio fôr grande demais. A importância dessas proposições é enfatizar os comentários feitos na introdução deste capítulo: o estado particular do ambiente na ocasião em que o operante é fortalecido, é um fator importante que controla a emissão da resposta.

O método para avaliar a importância do ambiente predominante durante o condicionamento é simples, em princípio. Um determinado operante de algum organismo deve ser fortalecido com o ambiente num estado ou configuração particular. Após o processo de aquisição se completar, podem ser feitas variações em algum aspecto bem controlado do ambiente e a força da resposta pode ser testada na nova configuração ambiental. Na prática, o experimento oferece bastante complicação para justificar uma descrição um pouco mais detalhada.

Um pombo faminto pode ser colocado numa caixa do tipo descrito anteriormente (Fig. 5-11). A aparelhagem é modificada como é visto na ilustração da Parte 2, à p. 121 (segundo Guttman, 1956), de modo que o painel de bicar é transluminado por uma luz pura vinda de um monocromador. O monocromador permite a seleção precisa e a apresentação de qualquer um de um grande número de comprimentos de onda visíveis. A aparelhagem também permite mudanças rápidas de um comprimento de onda para outro. Num experimento executado por Guttman e Kalish (1956), os animais foram modelados a bicar o disco que era transluminado por uma luz amarelo-esverdeada (ver Fig. 9-2) de 550my (my = milimicron = 10“6 cm: uma medida de X . comprimento de onda).Após alguns treinamentos em crf, os animais foram colocados num esquema de intervalo variável (IV 1 min). Quando o comportamento havia estabilizado em IV, realizou-se testes para se determinar até que ponto a luz específica de 550 my- no disco estava controlando o comportamento. Este teste consistiu de um procedimento de extinção no qual os animais foram expostos a séries aleatórias de apresentações sucessivas de 30 seg de 11 comprimentos de onda diferentes, dos quais somente um era o 550 my realmente

- 191 -

U ia d o no treinamento. Nenhuma outra mudança foi feita no ambiente dos animais. (O procedimento é visto em notação nos diagramas abaixo).

tre in am en to r » s+1 ( 3 seg)- ]

estabilização em IV ÍT(i min) —* IR —* | "+_ L_ [T (3 se g )—j

S.">50 m ju S 5 7 0 $ 5 1 0 m fiTestes em ex tin ção R -/-» R R -/->

X<30 seg) [£ (3 0 SCg)- * H(30 seg)

Quando os números de respostas emitidas em extinção sob cada um dos estímulos diferentes foram examinados, eles se apresentaram sob a forma da Fig. 9-8. Essa figura indica que os animais deram o número máximo de respostas em extinção apenas na presença do estímulo de treinamento e deram gradualmente menos respostas aos estímu- los-teste localizados progressivamente além do estímulo de treinamento ao longo da dimensão X . Esta gradação do responder, observada quando a força da resposta é avaliada em ambientes algo diferentes daquele em que o fortalecimento original ocorreu, é conhecida como gradiente de generalização. Em termos técnicos, “o gradiente de generalização é operacionalmente definido por uma sucessão de decréscimos de um valor estabelecido de força da resposta” (Guttman. 1956).

A técnica de Guttman-Kalish ilustra bem como procedimentos tais como esquema de reforçamento e extinção podem ser combinados para avaliar certos fenômenos fundamentais do comportamento. Por exemplo, considere o objetivo do esquema IV no treino. Reexaminando a Fig. 7-9, vê-se que o IV produz uma grande persistência face à extinção. Vários milhares de respostas podem ocorrer antes que a taxa de extinção comece a cair apreciavelmente. Na generalização, estamos preocupados com a extensão da força da resposta a condições de estímulo outras que não aquelas ern que o reforçamento realmente se efetivou. Para fazer os testes necessários para se avaliar esse extensão, nunca devemos reforçar na presença das novas e diferentes condições de estímulo. Caso contrário qualquer resposta que observássemos podjria ser atribuível ao reforçamento direto na presença dos novos estímulos. Mas o uso do procedimento de extinção enfraquece o comportamento. Como poderemos testar 1 1 valores diferentes de estímulo em face desse enfraquecimento? A solução para esse problema se encontra em ( 1) fazer a apresentação de cada estímulo-teste diferente rapidamente (cerca de 30 seg), (2) apresentar os estímulos-teste diferentes numa ordem aleatória, e(3) usar um esquema IV no treino para desenvolver uma persistência de vários milhares de respostas potenciais em extinção, antes que os sinais característicos deenfraquecimento comecem a ocorrer

- 1 9 2 -

Comprimento dc onda (milimicrons)Figura 9-8. Respostas em extinção, emitidas na presença de 11 comprimentos de onda diferentes projetados um de cada vez na chave. O treino ocorreu apenas em 500m jj (Guttman, 1956)

Os resultados da Fig. 9-8 confirmam a vantagem de se representar quantitativamente os estímulos. Suponhamos que o experimento de Guttman e Kalish tivesse sido execu tado antes de se saber que a luz poderia ser representada por ondas e medida através do comprimento de onda. Se o pombo tivesse sido treinado a bicar um disco coberto com papel verde e, então, testado em extinção com papéis verdes e de outras cores no disco, digamos azul, violeta, vermelho, laranja e amarelo, certamente teriam ocorrido diferenças no responder a essas cores. Mas, considere como um gráfico igual ao da Fig. 9-8 poderia ter sido desenhado. O fato de que nenhuma dimensão quantitativa (numérica) existia para relacionar as diferentes cores umas às outras, teria excluído tal representação funcional. No nosso exemplo hipotético, não temos base para interpolar os valores da força da resposta entre duas quaisquer cores empregadas. Na função da Fig. 9-8, fizemos isso facilmente, conectando as forças da resposta para dois estímulos quantitativamente adjacentes com uma linha reta. Esta interpolação por linhas retas nos permite prever a quantidade de generalização a luzes não usadas no experimento. O máximo que poderíamos fazer com um experimento realizado antes da descoberta de especificações numéricas da luz por seus cumprimentos de onda, teria sido desenhar um gráfico com barras do tipo visto na Fig. 9-9. Na falta de um método melhor, as cores da Fig. 9-9 estão distribuídas alfabeticamente ao longo da abeissa. O fato de nenhuma variável independente ser designado para o eixo do X da Fig. 9-9 mostra quão deficiente esta representação teria sido. Aqui, temos alguma noção da importância de dimensões quantitativas para especificar e relacionar as variáveis independentes em qualquer ciência. Além disso, o exemplo é útil para mostrar como uma ciência (no caso, psicologia), frequentemente toma emprestado os métodos e descobertas de outra (no caso, física), e os explora para seu próprio uso em contextos inteiramente diferentes daqueles nos quais os métodos foram originalmente desenvolvidos.

- 193

A forma real do gradiente de generalização variará de acordo com as dimensões particulares do estímulo empregado , o esquema e tipo de reforçamento no treino do organismo em estudo, e mesmo o valor do estímulo particular de treinamento numa dada dimensão. .Assim, qualquer busca do gradiente de generalização deve ser abandonada. Algumas vezes, um “gradiente” pode mesmo não aparecer e uma curva achatada de generalização é obtida. Quando a freqüência de som é usada num experimento semelhante ao de Guttman e Kalish, o grandiente de generalização do pombo para freqüências de sons apresenta a forma da Fig. 9-10. As curvas da Fig. 9-10 são essencialmente achatadas.

Fig 9-9. Respostas hipotéticas em extinção, emitidas às várias cores depois de um treino na presença do verde.

Embora o bicar o disco fosse originalmente fortalecido exclusivamente em 1.000 cps, todos os tons entre 300 e 3.500 (e também nenhum tom) adquiriram igual poder de controlar a emissão da resposta. Não fosse o fato, conhecido através de outros experimentos, de que o pombo p od e detetar diferencialmente esses vários sons, seriamos inclinados a concluir que a dimensão de freqüência é irrelevante em termos comportamentais. Como tal, seria análoga à porção da dimensão X em torno da região de radiação gama, ou à dimensão que descreve o nível de tráfego numa rua de Tóquio em relação a esse animal se comportando em Nova Jersey. Somos forçados a adiar, todavia, uma discussão detalhada das variáveis responsáveis pelas diferenças entre as Figs. 9-8 e 9-10 até que os princípios do próximo capítulo sejam introduzidos.

Freqüência (ciclos por segundo)Figura 9-10. Gradientes de generalização ao longo da dimensão de freqüência do som para três animais. Um tom de 1.000 cps estava presente durante o fortalecimento da resposta de bicar o disco (Jenkins e Harrison, 1960).

- 1 9 4 -

Mesmo ao longo da própria dimensão comprimento de onda da luz, o uso de estímulos de treinamento diferentes de 550m y produz gradientes de formas diferentes. Blough(1961) obteve os dados apresentados na Fig. 9-11 quando treinou três grupos de animais em 530 my, 550my e 570my, respectivamente. Como a figura indica, a forma real do gradiente obtido varia dependendo de onde o estímulo de treinamento se encontra na dimensão X .

<u•o3 30

l igura 9-11. Gradientes dc generalização em torno de cada um dos três diferentes comprimentos de onda de treinamento. Oito animais deram origem às curvas - dois com 530 my quatro em 5 50m y ,e dois em 570 m y (Blough, 1961).

Em 530 my, a área maior do gradiente encontra-se à esquerda do estímulo dc treinamento. Em 550 my por outro háo, encontra-se à direita. Somente em 570 my aparece um gradiente simétrico. Note que o gradiente em torno de 550 my, na Fig. 9-11 difere um pouco do originalmente obtido por Guttman e Kalish em 1956 (visto na Fig. 9-8). A razão dessa diferença parece estar no fato de que Blough introduziu uma precaução adicional ao coletar seus dados. Sabendo que o olho do pombo é mais sensível a alguns comprimentos de onda que a outros, ele usou intensidades ligeiramente diferentes para cada estímulo-teste. A forma do gradiente obtido por Blough sugere que há regiões circunscritas ao longo do espectro de À nas quais a generalização ocorre mais prontamente. “Treinado próximo ao centro de tal região, o animal generalizaria dentro da região, produzindo um gradiente simétrico e com o topo achatado. Treinado na extremidade de tal região, o animal generalizaria em direção à região; na outra direção, sua curva cairia mais rapidamente, produzindo um gradiente assimétrico” (Blough, 1961, p. 38). As três curvas da Fig. 9-11 sugerem que duas dessas regiões estão centralizadas em aproximadamente 515 my e 570 my, respectivamente. É tentador igualar a presença dessas duas regiões às “bandas de cores” que o homem discrimina no espectro. Esses e outros resultados indicam que o estudo da generalização comportamental promete elucidar as propriedades fundamentais do olho de organismos infra-humanos.

O paradigma simples da generalização pode ser ampliado, examinando*se os efeitos produzidos quando mais de um estímulo é usado no treino. Num experimento de Kalish e Guttman (1957), luzes alternadas de 530 my e 560 my foram usadas durante o fortalecimento inicial e a estabilização subsequente em IV. O teste de generalização foi efetuado do modo usual. A curva obtida é vista na Fig. 9-12. Parece que este gradiente é um composto de gradientes individuais. Um trabalho posterior (Kalish eGuttman, 1959) indicou que ele, provavelmente, representa uma simples superposição de dois gradientes de generalização. Um aspecto importante desse procedimento de treino em mais de um valor do estímulo é a sua capacidade para ampliar o gradiente de generalização. Usando ainda mais que dois estímulos de treinamento, este gradiente pode ser ampliado o quanto

- 1 9 5 -

Comprimento de onda (milimicrons).

/Figura 9-12. Gradientes de generalização ao longo da dimensão comprimento de onda, depois do treino na presença de dois estímulos: 530 my e 560 my (segundo Kalish e Guttman, 1957).

desejarmos, o que, como veremos mais tarde, e bastante signiticante para o ensino de conceitos gerais à criança.Fora do laboratório, naturalmente, a generalização nunca é limitada a uma única dimensão ambiental. Quando ocidentais ingênuos observam que todos os orientais se parecem, está ocorrendo generalização de um estímulo complexo (o primeiro oriental ou o primeiro ocidental visto) para outros estímulos “teste” (outros orientais, ou outros ocidentais). Um estímulo pode ser dito complexo quando mesmo sua descrição parcial envolve mais dimensões do que seria prático enumerar. As generalizações complexas, como as vistas fora do laboratório, podem ser inferidas como sendo baseadas em espalhamentos do tipo da Fig. 9-8, ao longo de cada dimensão que o estímulo de treinamento e aos estímulos- teste compartilham. Podemos tentar verificar esta hipótese, pelo menos parcialmente, ampliando nossos estímulos-teste experimentais de modo a incluir mudanças feitas simultaneamente em duas dimensões de um estímulo-teste. Ao se iluminar um disco de um pombo com luzes puras de vários comprimentos de onda, estabelece-se uma dimensão de estímulo bem controlada, X, como já vimos. Na Fig. 9-13, a luz no disco forma uma espécie de barra. Se este padrão de barra é girado em torno do centro do disco para qualquer de várias posições, adicionamos ao estímulo uma segunda dimensão independente - orientação angular do padrão de luz.

- 1 9 6 -

Verde Amarelo Vermelho Violeta

Figura 9-13. Estímulos criados pela manipulação independente de duas dimensões ambientais fisicamente definidas.

Suponhamos que um animal seja treinado e subsequentemente estabilizado em um esquema IV, na presença de um estímulo que pode ser descrito por um determinado valor de comprimento de onda (digamos 550 my, 4 verde” ) e por uma determinada orientação angular (digamos 0o, “vertical”). Então, usando estímulos-teste que difiram tanto em ângulo como em comprimento de onda durante a extinção, um gradiente de generalização que se estende sobre duas dimensões, pode ser determinado. O tratamento detalhado dos resultados quantitativos de um experimento deste tipo está além do objetivo da presente consideração. É suficiente notar que uma diminuição ordenada da generalização ocorre para os estímulos-teste que diferem em duas dimensões do estímulo original de treinamento. Esta diminuição é uma função complexa da distância de ambos os valores dimensionais do estímulo-teste em relação aos valores iniciais do estímulo original de treinamento (Butter, 1963).

9.3 GENERALIZAÇÃO DA EXTINÇÃO

Assim como os efeitos fortalecedores do reforçamento de uma dada resposta numa determinada configuração de estimulo difundem-se de modo a incorporar outras configurações de estímulo, também os efeitos enfraquecedores da extinção difundem-se para condições de estímulos outras que não aquela particular sob a qual a extinção foi efetuada. Este fenômeno é chamado generalização da extinção. Para observá-lo, iniciamos com um operante que já existe com alta força na presença de uma faixa de estímulos. Processa-se, então, a extinção, na presença de apenas um dos estímulos. Quando o processo de extinção se completa para este estímulo, os outros estímulos de toda a faixa são testados para se verificara extensão em que eles têm ainda o poder de controlar a emissão da resposta. Este procedimento pode ser resumido em quatro fases:

Fase I. Fortalecimento inicial de um operante numasituação de estímulo.

Fase II. Manutenção do operante (usualmente com umesquema IV) na mesma e em outras situações de estímulo.

Fase III. Extinção prolongada do operante em apenas umadas situações de estímulo previamente usadas.

Fase IV. Testes de extinção conduzidos com todos os estimulos usados na Fase II.

19/

Homg vl5ol) executou e:.e experimento e obteve os resultados apresentados na Fig. 9-14. A porção denominada iinha-base foi obtida na fase II. Nesta fase, pombos

Figura 9-14. Generalização de extinção ao longo do continuum comprimento de onda.O treino em IV foi efetuado em 1 3 valores, de 510 a 630 mjJ.A extinção ocorreu em 570 m y( segundo Honig, 1 961).

famintos bicavam o disco num esquema de reforçamento em IV que vigorou para 13 comprimentos de onda diferentes no curso do treinamento. Este procedimento é uma extensão do treinamento empregado por Kalish e Guttman (1957) com dois comprimentos de onda diferentes (ver Fig. 9-12) e produz uma curva de generalização aproximadamente achatada, ao longo de todo o continuum do espectro. Na fase 111, Honig efetuou a extinção exclusivamente em 570 my. Finalmente, o gradiente em forma de U visto na Fig. 9-14 foi obtido testando-se as taxas de resposta em extinção com os outros 12 estímulos. Sob as condições deste experimento, um gradiente de generalização invertido e algo mais achatado é produzido, ao invés daqueles da seção 9.2. É difícil dizer se a diferença no achatamento indica uma diferença fundamental entre generalização de extinção e generalização de reforçamento. Nn estudo de Honig, a extinção em 570 mu

- 1 9 8 -

não foi completada na Fase III; a parte inferior da função em U da Fig. 9-14 mostra que, em 570 my, a taxa de resposta no teste está bem acima do nível operante zero, normalmente associado com o operante de bicar a chave.

A generalização de estímulo na extinção e a generalização de estímulo nore fo rçam en to são procedimentos inversos. Um envolve um espalhamento doenfraquecimento e o outro envolve um espalhamento do fortalecimento. A Tabela 9-1contrasta seus procedimentos de definição.

Tabela 9-1

UMA COMPARAÇÃO DOS PROCEDIMENTOS DE GENERALIZAÇÃO DE ESTIMULO NO REFORÇAMENTO E GENERALIZAÇÃO DE ESTIMULO NA EXTINÇÃO

G E N E R A L I Z A Ç Ã O

REFORÇAMENTO EXTINÇÃO

No iti ício força baixa de R numa faixa de Ss Força alta de R, numa faixa de Ss

Operação fundamental Fortalecimento de R em um valor de S Enfraquecimento de R em um valor de S

Teste Numerosos Ss, ao longo de uma faixa, são apresentados e c procedimento de extinção fica constantemente em efeito.

9.4 ALGUMAS IMPLICAÇÕES DA GENERALIZAÇÃO

Anteriormente, na seção 9.2, destacamos rapidamente alguns exemplos, fora do laboratório, da generalização de estímulo. Esses exemplos de crianças que confundem uma situação com outra através de respostas indiscriminadas são casos em que a generalização parece impedir a adaptação de um organismo a seu mundo. Mas a generalização é. quase sempre, uma propriedade muito útil do comportamento. Por exemplo, as habilidades aprendidas numa situação ambiental podem ser usadas em novas sistuações ambientais. Tendo aprendido a pegar uma bola jogada a uma distância dei ,5m, podemos pegá-la também a 3,0, 6,0 e talvez até 12,0 m. Os pais que ensinam suas crianças a dizerem “obrigado” em casa estão implicitamente contando com a generalização para que o “obrigado” seja emitido fora de casa. Nosso sistema educacional está baseado na suposição de que as habilidades adquiridas na escola se difundirão em ambientes fora da escola. Não obstante, o gradiente de generalização está aí para lembrar e acautelar os educadores de que, quanto mais uma situação de treino se parecer com a situação na qual o comportamento será necessário mais tarde, tanto mais efetivo será o treino. Escolas c outras agências usam este princípio quando fazem a situação de ensino mais próxima possível da “vida real” .

- 199 -

Os resultados vistos nus seções 9.2 e 9.3 fundamentam a conclusão inevitável de que ambos o reforçamento e a extinção são um tanto específicos ao estado do ambiente preciominante quando eles ocorrem. O termo 'um tanto’ tem uma significação precisa na forma dos gradientes de generalização que podem ser observados quando mudanças controladas numa ou duas dimensões de estímulo, fisicamente especificadas, são feitas. Generalização, assim, é um conceito estático. Ao contrário de muitos dos fenômenos comportamentais já familiares (condicionamento, extinção, diferenciação), a generalização, em si mesmaj não é um processo. Isto é, ela não é uma mudança no comportamento, no tempo, com um procedimento fixo mantido constante. Em vez disso, ela é um fenômeno que pode ser observado depois do fortalecimento ou enfraquecimento, através do emprego de uma certa seqüência de operações (por exemplo, as fases da seção 9.3). Num processo comportamental verdadeiro, o tempo aparece como a variável independente. Mas, nos gradientes de generalização, a diferença entre os estímulos de treino e de teste é a variável independente. Embora seja estática neste sentido, veremos no próximo capítulo como a generalização do enfraquecimento e a do fortalecimento se combinam no paradigma de discriminação, gerando um dos mais fundamentais processos comportamentais conhecidos.

As descobenas de. laboratório sobre a generalização trazem certas implicações para um velho problema filosófico, o do significado de similaridade. Os comentários lúcidos de C. E. Osgood ilustram a forma pela qual o método experimental na psicologia pode/ ocasionalmente, fornecer uma re-interpretação moderna de problemas filosóficos tradicionais.

“Suponha que perguntemos (como temos muitas vezes perguntado em aulas introdutórias de filosofia): O que é mais semelhante a um quadrado vermelho um quadrado verde ou um círculo vennelho? O psicólogo com uma orientação empírica cansa-se rapidamente de discutir assuntos como ‘a relação de qualidades únicas’ e corre ao laboratório para “averiguar”! Após estabelecer uma reação, qualquer reação, ao quadrado vennelho, ele testa seu sujeito humano para a generalização ao quadrado verde e círculo vermelho. Irá o círculo vennelho mostrar mais generalização? Se assim o for, o círculo vennelho está mais perto do quadrado vennelho que o círculo verde! Isto significa que temos agora uma escala objetiva para medir‘similaridade'? Somente quando estamos interessados na similaridade quando definida pelo comportamento de um organismo. E este deve ser um tipo específico de organismo, desde que a similaridade para o rato, assim definida (ou para o colono australiano, por exemplo), não seria necessariamente paralela à do Homo Sapiens ocidental.

Isto levanta um problema m enor re la tivo ao jargão psicológico nós tomamos conhecimento periódico mas nunca observamos na totalidade. Seguimos o ímpeto, da nossa linguagem e dizemos que ‘há mais generalização entre esses dois estímulos porque eles são mais aproximadamente ‘similares’, e então (como o psicólogo jovem e impetuoso citado acima), afinnamos que 'esses dois estímulos são mais aproximadamente similares porque há mais generalização entre eles’. Ambas as proposições são válidas,, dependendo da definição particular de similaridade. Utilizando um analisador de freqüência de onda, podemos medir a similaridade física ( proximidade no continuum de freqüência) de dois tons e então medir a generalização em função desta similaridade. Por outro lado, podemos usar um grupo de organismos como instrumentos de medida da similaridade de tons, como na psicofi' ‘ a, o que, na verdade, c medir contínuos físicos em termos de generalização e disc run in ação.

- 200 -

Observe cuidadosamente, todavia, que não há garantia de que as duas medidas de similaridade serão paralelas; de fato, raramente o são. A ilustração mais clara disto se encontra no fenômeno de generalização de oitava. Tanto para o rato como para o homem, pelo menos, a generalização de resposta a tons separados por uma oitava é maior que a tons mais próximos no continuum físico de freqüência, e eles soam mais aproximadamente ‘similares’. Mas, naturalmente, existem aqueles que diriam que o conceito de similaridade é significante apenas em tennos do comportamento dos organismos. Neste caso, devemos nos contentar com tantos tipos de similaridades quantas são as especies e culturas dentro das espécies” (Osgood, 1953, p. 361).

9.5 NOTAS SOBRE O DELINEAMENTO DE EXPERIMENTOS EM PSICOLOGIA USANDO ANIMAIS COMO SUJEITOS.

U uso de animais como sujeitos em experimentos de psicologia pode ser convenientemente datado a partir dos experimentos iniciais de Thorndike sobre aprendizagem em tentativa e erro. Os próprios comentários de Thorndike sobre as vantagens do uso de sujeitos animais em experimentos de psicologia são uma boa leitura, mesmo atualmente. Quando é desejável se obter um melhor controle da história passada e presente de um organismo do que é possível com um ser humano; quando é desejável investigar faixas amplas de variáveis como choques elétricos intensos, luz forte, e assim por diante; e quando exigimos um período de tempo maior do nosso sujeito do que o horário de universitário permita, frequentemente, podemos nos voltar para uma ou outra da grande variedade de espécies animais à disposição, sem muita perda na generalidade dos nossos resultados. O objetivo das presentes notas não é tanto considerar o problema da generalização dos resultados de experimentos com animais para seres humanos, mas, mais que isso, fornecei uma fórmula geral para o delineamento de experimentos com animais em psicologia.

Nota A. Devemos começar com um animal adequado. (Em geral, desejamos que nossos resultados sejam aplicáveis a uma larga faixa de espécies, incluindo o homem). Isto é, primeiro, se o problema psicológico em investigação é um que requer comportamento de escolha ou comportamento instrumental (e praticamente todos requerem), então devemos escolher um organismo que emita este comportamento. Devemos, em outras palavras, escolher um organismo que tenha operantes. De acordo com este critério, podemos então escolher vermes anelídeos, camelos ou delfins e não devemos escolher protozoá- rios, esponjas ou moluscos já que nunca se demonstrou que estes organismos apresentam comportamentos que seguem as leis do fortalecimento operante. Não precisamos, necessariamente, escolher um animal próximo ao homem na escala filogenética, a menos que o nosso experimento pretenda estudar características comportamentais apresentadas somente por esses organismos filogeneticamente superiores . Para muitos problemas em aprendizagem, discriminação, diferenciação ou encadeamento, animais tão modestos como o rato ou o pombo comum satisfarão.

Nota B. Tendo selecionado nossa espécie, devemos tratar do problema relacionado ao tipo de experiência passada que os animais particulares tiveram (ou não tiveram), se queremos que eles sejam sujeitos apropriados. Evidentemente, se estamos delineando um experimento para examinar o processo de aquisição e o nosso animal já adquiriu a resposta selecionada — ou uma muito semelhante - ele não será um sujeito adequado. Similarmente, se estamos interessados em resultados de extinção, um animal com história prévia de extinção da resposta especificada se comportará de um modo bastante diferente

- 201 -

de um que não tenha esta história. Frequentemente, em vez de manter um registro de histórias particulares os psicólogos escolhem animais que não têm qualquer história experimental e que foram criados em condições controladas. Esses animais, quando usados pela primeira vez, são ditos “ ingênuos” experimentalmente. Não é sempre necessário usar tais animais ingênuos; mas devemos nos certificar de que a história particular de nossos animais não vai, indevidamente, prejudicar nossos resultados. A uniformidade de nossos resultados será a nossa justificação final.

Nota C. Finalmente, devemos motivar nosso animal. Aqui, o problema de controle e mensuração é muito mais fácil que com humanos. Podemos privar nosso pombo de alimento por, digamos 22 horas, depois do que podemos usar pequenas quantidades de alimento como um reforçador conveniente; ou podemos esfriar o compartimento de nosso rato até um nível próximo ao do congelamento, depois do que podemos usar um breve sopro de ar quente como um reforçador.

As notas A, B e C são sugestões para se conseguir um animal representativo que sirva como uma preparação experimental para o estudo do compolamento.

REFERÊNCIAS PARA O CAPITULO 9. 'Blough, D. The shape of some wavelength generalization gradients. / .

exp. Anal. Behav., 1 9 6 1 ,4 ,3 1 -4 0 .Boring, E. G., Langfeld, H. W., and Weld, H. P. Foundations of psy

chology. New York: Wiley, 1948.Butter, C. M. Stimulus generalization along one and two dimensions in

pigeons. J. exp. Psychol., 1963, 65, 339-345.Guttman, N. The pigeon and the spectrum and other complexities.

Psychol. Rep., 1956, 2 , 449-460.Guttman, N., and Kalish, H. I. Discriminability and stimulus generaliza

tion. J. exp. Psychol., 1956, 51, 79-88.Guttman, N., and Kalish, H. I. Experiments in discrimination. Sci. Am er.,

Jan. 1958, 198 ,78 -79 .Honig, W. Generalization of extinction on the spectral continuum.

Psychol: Rec., 1961 ,11 ,269-278 .Jenkins, H. ML, and Harrison, R. H. Effect of discrimination training on

auditory generalization. J . exp. Psychol., 1960, 59, 246-253.Kalish, H. I., and Guttman, N. Stimulus generalization after equal train

ing on two stim uli./. exp. Psychol., 1957,53, 139-144.Kalish, H. I., and Guttman, N. Stimulus generalization after training on

three stimuli: a test of the summation hypothesis. J. exp. Psychol., 1 9 5 9 ,57 ,268-272 .

Lewis, D.' J. Scientific principles of psychology. Englewood Cliffs: Prentice-Hall, 1963.

Osgood, C. E. M ethod and theory in experimental psychology. New York: Oxford Univer. Press, 1953.

Wald, G. Eye and camera. Sci. Amer., Aug. 1950, 182, 32-41.Wallach, H. Brightness constancy and the nature of achromatic colors.

. exp. Psychol., 1948, 38, 310-324.- 202 -

TERCEIRA PARTE

UNIDADES COMPONENTES DO COMPORTAMENTO

10 - DISCRIMINAÇÃO

11 - REFORÇADORES ADQUIRIDOS

12 - ENCADEAMENTOS

Capítulo 10 DISCRIMINAÇÃO

Uma característica marcante dos organismos é a sua habilidade para formar discriminações. Definida como o responder diferencial na presença de situações diferentes, a discriminação contrasta com a generalização, definida como o responder similar em situações diferentes.

As discriminações são demonstradas ao nível humano pela habilidade de “distinguir uma coisa da outra” . Alguns de nós, por exemplo, discriminamos os quadros de Monet dos de Manet, manteiga de margarina, dois grupos de impressões digitais semelhantes, dois sinais morse semelhantes. Ao “distinguir uma coisa da outra” estamos fazendo nada mais nada menos do que demonstrando um responder diferencial em suas respectivas presenças.

Para distinguir objetos desta forma, uma certa história passada específica parece ser um pré-requisito. Fazemos estas e outras discriminações tão casual e naturalmente, todavia, que frequentemente negligenciamos a necessidade desta história passada. Lembre-se, do capítulo anterior, que, tendo fortalecido uma resposta na presença de um estímulo, a resposta ocorrerá, embora com menor força, na presença de outros estímulos relacionados. Se um determinado estímulo é muito semelhante ao estímulo de treino, ele pode controlar a resposta quase tão bem quanto o estímulo real de treinamento. O procedimento de discriminação é um método para quebrar o controle generalizado do responder mantido por uma ampla classe de situações, de modo que as situações muito semelhantes passem a ser associadas com comportamentos muito diferentes.

Em termos de generalização quantitativa ao longo de uma única dimensão de estímulo, esta divisão ou quebra determina o estreitamento de um gradiente particular da força da resposta em torno de um valor de estímulo: um animal é treinado a bicar apenas um disco verde e não outros, uma criança é treinada a restringir o nome “gato” para um único subconjunto de animais peludos. O procedimento pelo qual tais efeitos são obtidos é direto: o reforçamento de um determinado comportamento é restrito a uma dada situação. Embora este procedimento de tornar o reforçamento de um operante particular condicional à existência de uma situação o estímuloparticular seja suficientemente gerai para incluir todas as discriminações, há bastante variações que merecem uma classificação de discriminações em termos de complexidade, como é indicado pelo número de situações e estímulos e correlações de resposta associadas requeridas. Em cada um dos

- 2 0 5 -

quatro exemplos que se seguem, um comportamento diferencial está associado com diferentes ambientes.

1 . O cinemeiro que discrimina não vai a todos os filmes que são levados ao cinema da vizinhança. Ele vai (R) a alguns (Sa), e não vai (ausência de R) a outros (Sr).

2. DizemosquealgunsgruposdcpcssoassíK) discriminadas quando elas são tratadas de am modo diferente que outras pessoas são tratadas. Isto é, o grupo discriminado (Sy\ é tratado de um modo (Ra ), e outras pessoas (Sr) são tratadas de outro modo (Rr)

3. O provador de vinhos profissional pode discriminar uma variedade de vinhos que têm o mesmo sabor para o iniciante. A discriminação do profissional é evidenciada porsua habilidade em dar um nome particular (Rj R2 , R3 ........RlOO) Para cada um dc milvinhos diferentes (S j, S2 , S3 , . . S\ .000)-

4. Nas discriminações sutis que um relojoeiro deve fazer quando coloca (Ry) cada uma de uma dúzia de pequenas peças no lugar apropriado (Sx), a diferença entre a posição correta e incorreta é medida em frações de milímetros.

Cada um dos quatro exemplos ilustra um nível progressivamente mais complexo de discriminação. Nas discussões técnicas que se seguem, volte atrás, quando necessário, ao exemplo correspondente para uma base intuitiva.

10.1 DUAS CONDIÇÕES DE ESTÍMULO, UMA CLASSE DE RESPOSTA

Ao analisar a mais simples de todas as possíveis discriminações, notamos que um oiganismo emite um certo comportamento com alta torça numa situação e não emite este comportamento em outra situação. A operação básica para estabelecer tal discriminação entre duas situações consiste em reforçar um determinado operante na presença, ou depois, de um estímulo (S^), mas não liberar reforçamento para este mesmo operante na presença, ou depois de outro estímulo (SA pronuncia-se “esse delta” ). Dois estímulos usados desta maneira são chamados um par de estímulos discriminativos, um positivo (SD) e outro negativo (S A ).

Na prática experimental, o procedimento é geralmente complicado pela adição de várias técnicas de controle. Algumas destas asseguram que a discriminação é formada entre os dois estímulos desejados e não com relação a outras mudanças espúrias do meio. Outras fornecem maneiras e meios para a mensuração quantitativa e contínua da força da resposta durante o processo de discriminação. A necessidade desses refinamentos pode ser vista no exemplo simples de fornecer um amendoim para cada resposta de puxar a corrente que o macaco emite, durante um período de 3 min, quando uma luz verde está acesa e, então, desligar a luz e suspender o reforçamento da resposta de puxar a corrente durante os próximos 3 min . . . . e assim sucessivamente.

1. Se o intervalo de SA é mantido constante, pode ocorrer uma discriminação temporal, permitindo que a resposta venha a ficar sob o controle de um período de tempo fixo de SA . e não das propriedades ambientais de S^ Lembre-se de que os esquemas de reforçamento em FI demonstram que o tempo, correlacionado deste modo com contingências de reforçamento, passa a controlar o comportamento efetivamente.

2. Neste procedimento, as contingências de reforçamento em S^ sã'o crf. Em crf cada uma ae uma série de respostas é reforçada e a taxa de resposta torna-se uma medida sem significado. Para todos os objetivos práticos, a taxa em crf é inteiramente determinada pela quantidade de tempo que o animal passa comendo cada amendoim. Ass;m, quaisquer mudanças que possam ocorrer na força da resposta durante S^ não são detectadas.

- 206 -

3. O macaco poderia fechar os olhos, nunca olhar para as luzes, e ainda fazer uma boa discriminação respondendo apenas esporadicamente. A primeira ocorrência de reforçamento para uma resposta esporádica sinalizaria que todas as outras respostas seriam reforçadas por um momento. Similarmente, a primeira resposta não reforçada sinalizaria que todas as outras seriam por um momento extintas. Assim, o animal poderia basear a discriminação na presença ou ausência de reforçamento ao invés de na presença ou ausência da luz verde.

Herrick, Myers e Korotkin (1959) utilizaram um procedimento instrutivo, empregando ratos como sujeitos, no estudo da discriminação entre períodos de luz (S^) escuros (S^ ), alternados aleatoriamente. Para evitar a falha 1 , eles usaram períodos de sA de duração variável (30, 60 ou 90 seg). Para evitar a falha 2 e obter uma medida significance da taxa de resposta durante a formação da discriminação, eles usaram um esquema de reforçamento VI 30 seg em S^. O esquema VI em S^ evitou também uma discriminação baseada no reforçamento ou não-reforçamento (falha 3) jà que (i) não reforçado não indicava necessariamente S^ , e (ii) a obtenção de um reforçamento não significa que as respostas subsequentes seriam necessariamente reforçadas.

Para ajudar a simplificar a inspeção do processo comportamental que resulta de um procedimento de discriminação desta natureza, as respostas em c as respostas empodem ser registradas em registradores cumulativos separados. O registrador de S^ corre somente enquanto o SD está em efeito, e o registrado de S^ corre somente em S^ . A Fig. 10-1 mostra os registros de pressão a barra de um rato nas sessões 1 , 6 , 1 1 , 21 e 40 no procedimento de Herrick, Myers e Korotkin. A resposta reforçada foi a pressão a

Tempo

Figura 10-1. Amostra de registros diários de um rato durante alguns dos quarenta dias de treino discriminativo (Herrick, Myers e Korotkin,1959).

barra. O dia 1 é essencialmente um teste de generalização: o rato foi treinado originalmente em S^ e então, no dia 1 , S^ foi introduzido pela primeira vez, alternado com SD A Fig. 10-1 indica que as taxas em S^ e S^ foram quase idênticas no dia 1 : ocorreu uma generalização completa da taxa de respostas de S^ para S^ (ver Fig. 9-10,

- 207 -

que e um caso comparável). A medida que o treino discriminativo continuou, todavia, as taxas em e S se diferenciaram. A inclinação em parece aumentar e a inclinação

diminuir através dos 40 dias do procedimento de discriminação.Vários comentários podem ser feitos sobre os dois processos comportamentais

associados a S ^ e S ^ , respectivamente. O aumento na taxa em SD é, provavelmente um exemplo do fato de que a exposição a um esquema de intervalo depois de crf sempre inicia, entre outras coisas, um aumento gradual na taxa (por exemplo, veja as curvas de RI na Fig. 7-4), que eventualmente atinge uma assintota. Russell (1960) mostrou que se 19 sessões de treino em IV são efetuadas em SD antes do início do treino discriminativo, nenhum aumento na taxa em SD é visto durante a discriminação propriamente dita. A mudança na taxa em vista na Fig. 10-1, evidentemente, não é peculiar ac procedimento de discriminação.A segunda mudança comportamental, o declínio da taxa em SA é simplesmente o processo familiar de extinção. Em , a pressão à barra nunca é reforçada e, assim, está sendo continuamente extinta. O processo de extinção em SA é, sem dúvida, prolongado por causa dos efeitos da generalização resultantes da manutenção concorrente da força da pressão à barra em S^. A força da resposta que ocorre em difunde-se para SÀ de acordo com os princípios da generalização. Assim, o processo de discriminação, um procedimento onde a resposta é reforçada sob um estímulo (SD) e não sob outro (SA ), é representado pela diferenciação gradual das forças da resposta nas duas situações de estímulo.

Para medir o estado do processo de discriminação em qualquer momento determinado, uma variável composta conveniente pode ser formada, constituída de ambas as taxas em e S A . Podemos definir o índice de discriminação (ID) como

Taxa emlD

Taxa em SD + Taxa em

Evidentemente, quando a taxa em SD = taxa em = K (isto é, quando a força da resposta se generaliza completamente de S para ), o índice torna-se

i - J l - LD 2A- 2

A medida que a discriminação prossegue, a taxa em aproxima-se do nívçl operante(—>0) e a taxa em permanece constante (K), ou aproximadamente constante e o índice aproxima-se de

i k 1 ■D = j = 1

Assim, a faixa útil do índice de discriminação vai de 0,5 (generalização perfeita sem discriminação) a 1,0 (perfeita discriminação, sem generalização). Valores intermediários indicam graus intermediários de discriminação. Valores menores do 0,5, se confiáveis, indicariam uma preferência de taxa para a condição SA .

- 2 0 8 -

Variáveis compostas como o índice dc discriminação têm um papel importante na construção científica de teoria. O físico define a densidade de uma substância como sendo igual a sua massa por unidade de volume (D m/v). A velocidade média de um corpo em movimento é uma razão entre a distância que o corpo percorre e o período de tempo (V = d/t). A própria taxa de resposta, número de respostas/tempo, é uma variável composta, já que envolve a razão de duas variáveis mais simples. A justificativa para se' formar uma variável composta a certas outras variáveis na ciência são mais simples e informativas do que aquelas para as variáveis componentes tomadas sozinhas, então, a variável composta é dita “útil” . No caso do índice de discriminação, parece claro que nem a taxa em SD, nem a taxa em , sozinhas, poderiam dar uma boa aproximação do nosso conceito de discriminação. Por outro lado, alguma razão dessas duas taxas parece estar mais estritamente relacionada com os conceitos de discriminação e podemos esperar que a razão seja útil no sentido formal descrito. Por exemplo, a Fig. 10-2 mostra que, no estudo de Herrick, Myers e Korotkin, o índice está de fato regularmente relacionado ao número de sessões de treino de discriminação. Somos levados a inferir, pela Fig. 10-2, que o processo de discriminação está virtualmente completo na sessão 1 5, ocasião em que o índice parece ter atingido sua assíntota (11) 0,93).

QCOe

CO

6<DCdXcd+->

+oCO

6<DcdXcd

Figura 10-2. Mudanças no índice de discriminação em quarenta sessões de treino numa discriminação luz-escuro (segundo Herrick, Myers e Korotkin. 1959).

A discriminação que ilustramos é chamada "'simples’ poique envolve um número mínimo de respostas (uma) c um número mínimo de condições de estímulos diferentes (duas) necessárias para demonstrar uma discriminação. A despeito desta simplicidade, tal procedimento tem se mostrado útil para avaliar habilidades e limitações discriminativas nos animais. Pfaffman, Goff e Bare (1958) usaram esta técnica para medir a habilidade do rato em detetar odores. Em S^ , uma concentração controlada de gás odorante era liberada na caixa de Skinner do rato. Em SD, nenhum odor estava presente. Além disso em SD as pressões a barra eram reforçadas intermitentemente com alimento, enquanto em não havia reforçamento. Valores altos do índice de discriminação indicariam que o ralo estava discriminando o gás experimentalmente introduzido. Valores do índice

- 209 -

próximos de 0,5 indicariam que pouca ou nenhuma discriminação estava sendo feita. Com o índice igual a 0,5, poder-se-ia dizer que o rato não detetava nenhum odor, uma vez que ele estaria respondendo na situação como se o gás estivesse ausente. Isto é, sua taxa em S A seria a mesma que em SD. O lim ia r para a deteção de odor pode ser definido como a concentração de odor que produz um valor do índice de discriminação significativamente maior que 0,5. Diminuindo-se gradualmente a concentração de gás ate' que o Iq caia a um ponto onde não seja mais significativamente diferente de 0 ,5 , o limiar (mínimo valor detetável) de qualquer odor experimentalmente introduzido pode ser determinado (Goff, 1961).

Exercício 7.

Delineie um experimento para determinar o som mais fraco que um chimpanzé pode ouvir. Use apenas uma classe de respostas e esteja certo de não incorrer em qualquer das três falhas indicadas.

10.2 O PARADIGMA DA DISCRIMINAÇÃO

O protótipo de todas as discriminações é o paradigma definido pelo caso mais simples. Temos

DADOS: 1. Uma classe de resposta2. Duas condições de estímulo.

PROCEDIMENTO: Reforçar a resposta numa das condições de estímulo (S^)e extinguir a resposta na outra condição de estímulo (S^ ).

PROCESSO: As forças da resposta em S^ e S^ se diferenciam gradualmente, ocorrendo um processo de extinção prolongada em S^

RESULTADO:O organismo passa a responder em S^ e não em S^Ao notar o procedimento dc discriminação, desejamos expressar a

noção de que existe uma contingência diferente para S^ e S^ .

S”R P-i

SAR />2 a

or SA

2b

[ 10. 1]

s +

No diagrama [ 10.1 ] a contingência 1 é lida: “na presença de SD, se R, então algumas vezes S + é produzido” . As contingências 2a e 2b (ambas são maneiras de representar a mesma coisa) são lidas: “na presença de S, se R, então nenhuma mudança no ambiente’.* A contingência 2b talvez seja lida mais convenientemente como “em S^ nenhuma resposta é reforçada” . Evidentemente, cm termos de notação, o procedimento de discriminação simples pode ser definido como a alternação de dois tipos de contingências e seus estímulos associados, como está representado nos colchetes 1 e 2 de 11 0 . 1 1.

- 210 -

10.3 DUAS CONDIÇÕES DE ESTIMULO, DUAS CLASSES DE RESPOSTA

Com o passar dos anos, os psicólogos projetaram uma variedade de aparelhos para testar a capacidade discriminativa dos animais. Muitos desses envolvem pelos menos duas respostas e pelo menos duas condições de estímulo. Um aparelho popular em sua época foi a plataforma de saltar de Lashley (Fig. 10-3). Neste aparelho, um rato faminto fica

Figura 10-3. Uma forma da plataforma de saltar paia testar reações discriminativas em ratos (segundo Lashley, 1938 ; de Munn, 1950).

sobre uma plataforma elevada de frente para janelas à sua direita e à sua esquerda, que estão cobertas por cartões de papelão com desenhos. No treino preliminar, a plataforma elevada fica perto das janelas que estão abertas, tendo os desenhos sido removidos. O rato tem apenas que pular da plataforma, através de qualquer janela, para alcançar o alimento localizado atrás do aparelho. Quando o rato acaba de comer, ele pode ser pego novamente e colocado na plataforma para outra tentativa. Gradualmente, a plataforma é movida para mais longe das janelas, até que uma verdadeira resposta de pular tenha sido sucessivamente aproximada (modelada). Então, os cartões, que serão usados como estímulos discriminativos, são gradualmente inseridos para cobrir as janelas, primeiro parcialmente- e, depois, completamente. Um cartão (algumas vezes chamado cartão + ) será preso levemente por uma mola que o solta se o rato pula em sua direção. Depois do salto, o rato encontra-se de frente a um delicioso prato de farelo amassado. O outro cartão (chamado as vezes cartão —), todavia, esta" preso de modo que, se o rato pula em

- 211 -

sua direção, ele cai na rede localizada abaixo. Essa conseqüência serve como punição para este pulo, além de fornecer uma tentativa de extinção.Considere um experimento em que dois cartões sejam usados:

□ e E l

Esses cartões serão alternados aleatoriamente nos dois lados, em tentativas sucessivas e a janela que contiver o + estará destrancada, enquanto que a janela que contiver o — estará fechada. O rato se ajustará a um procedimento desta natureza numas poucas tentativas, o que pode ser observado no aumento gradual de 0,5 para 1,0 na probabilidade de respostas ao cartão correto.

Não é difícil descrever as contingências existentes em tais discriminações; a chave é avaliar inicialmente todas as situações de estímulos possíveis. Os cartões individuais não são estímulos por si próprios. Apenas, o seu padrão particular e suas posições relativas ajudam a definir a situação de estímulo em qualquer momento. No presente exemplo há, antes de saltar, duas possíveis situações de estímulo:

S □

s AUma vez que o experimentador tentará manter todos os outros aspectos do ambiente do rato constantes, de tentativa para tentativa, não nos preocupamos em incluir esses aspectos constantes na descrição das duas situações de estímulo. Chamemos as duas situações de Sa e S3 . Se ignoramos a rede, as contingências são:

S ar e --> s +RDf*

onde ^ = saltar à esquerda RD - saltar à direita S+ = alimento

A comparação das notações para a discriminação simples de | 10.1] e o presente caso apresentado em | 10.2 | leva à conclusão de que 110.2 | é uma discriminação dupla. Se considerarmos a relaçao dc somente uma resposta num determinado momento ao reforçamento alimentar, vemos que 110 . 21 se assemelha a [ 10.1 | inteiramente, mas, em vez de uma contingência nula prevalecer numa das duas situações, temos uma segunda contingência agindo em conjunção com uma segunda classe de resposta. O diagrama 110 . 21 confirma que os termos S^ e S^ são sempre relativos a uma determinada resposta e devem, portanto, ser cuidadosamente qualificados quando usados íora do paradigma simples de [10.1|. Aqui em [ 10.2 [, por exemplo, é razoável dizer que SA é o S^ para saltar à esquerda bem como o SA para saltar à direita. Da mesma forma, S3 é o SD para e o para Rp;. Em geral, quando nos referimos a alguma situação particular como um S^ ou S-A , a classe de resposta à qual tal situação serve desta maneira, deveria ser mostrada ou pelo menos estar implícita 110 con texto.

S bRj. f* [10.2]R D^ S +

E E l

%

- 2 1 2 -

Figura 104. Aparelho de puxar para macacos. Um dos blocos amarrados com barbante terá alimento escondido atrás (Harlow, 1948).

Embora o delineamento específico de um aparelho de discriminação com duas respostas, dois estímulos varie para cada espécie diferente de animal, dependendo de suas capacidades de resposta, as contingências, de discriminação, invariavelmente, obedecem à form a geral de [10.2| . Macacos, chimpanzés, monos e crianças prestam-se convenientemente ao uso de aparelhos que requerem respostas de manipulação (ver Fig. 10-4 ). O fato de que a resposta do organismo possa ser dirigida ao aspecto físico do meio ao longo do qual o estímulo discriminativo pode ser definido, não deve permitir que se deixe de levar em conta as contingências comuns em todas as discriminações. Na seção 1 0 .1 , examinamos um experimento no qual ratos pressionavam uma barra quando uma luz estava presente, mas, por conveniência experimental, eles poderiam ter apenas que correr em direção à luz. Na Fig. 10-4, o comportamento do animal é ‘’dirigido” a um dos blocos e, além disso, certas propriedades do estímulo, associadas aos próprios blocos, controlam essa resposta. Mas, em ambos os casos, a correlação de comportamentos diferentes com ambientes diferentes caracterizam-nos como discriminações.

10.4 m CONDIÇÕES DE ESTÍMULO, n CLASSES DE RESPOSTA

Aumentando-se o número de estímulos discriminativos usados aumenta-se a complexidade da discriminação. Considere um caso em que um único cartão positivo, + e dois cartões negativos,F~le | | | possam aparecer. As situações possíveis antes da resposta (supondo que em cada situação uma, e somente uma, resposta possa ser reforçada) são:

a b e m B B B BSA S„ S</ S|>

- 213 -

Em S \ e Sb, o pular a esquerda será reforçado, enquanto em Sc e Sd, o pular à direita será reforçado. O uso de cartões adicionais negativos e/ou positivos cria ainda mais situações e pode-se dizer que o grau de complexidade da discriminação aumenta correspondentemente.

As discriminações podem ser ainda mais complicadas pela especificação de contingências para mais de uma ou duas classes de resposta. No Wisconsin General Test Apparatus (visto na Fig. 10-5) os movimentos de apanhar objetos a direita, esquerda e centro são frequentemente especificados. Pode-se colocar alimento em recipientes rasos, localizados debaixo de qualquer de três objetos. O arranjo desses objetos serve para

Figura 10-5. O Wisconsin General Test Apparatus. As respostas do experimentador se limitam a apresentar e retirar a bandeja de estímulo, misturar os objetos na bandeja e colocar alimento nos recipientes que estão debaixo de alguns blocos. As respostas do sujeito se limitam a afastar qualquer dos blocos e pegar a comida (se alguma) no recipiente com alimento, debaixo do bloco deslocado <segundo Harlow, 1949).

definir os estímulos discriminativos. Se apresenta ao macaco a tarefa de escolher um cubo, em vez de uma pirâmide ou uma esfera e supondo-se que cada objeto deva ser apresentado em cada tentativa, então as possíveis situações de estímulo são arranjadas em

® â > o & O O íS )

S. Sc Se

® o & \ O ( S i & ã> o ®

Sr Sp Sptrês grupos, dependendo da localização espacial do cubo.

- 214 -

10.5 MUDANÇAS CONTINUAS NO COMPORTAMENTO EM FUNÇÃO DE MUDANÇAS CONTINUAS NUMA DIMENSÃO DO ESTIMULO

Ao apanhar corretamente urn objeto localizado em qualquer parte de uma mesa, empenhamo-nos numa discriminação que não pode ser facilmente descrita por um número fixo de respostas, em relação a um número fixo de estímulos discriminativos. Isto porque, para cada posição do objeto sobre a mesa, um e somente um conjunto de resposta é otimamente reforçado. Mas existem muitas posições possíveis. Como uma aproximação, podemos representar uma mesa dividida como um tabuleiro de xadrez, com fileiras i e colunas j e, desta maneira, designar, artificialmente, um número limitado de classes de resposta e de estímulos discriminativos possíveis (ver Fig. 10-6). Suponha que localizemos cada classe possível de estímulos discriminativos pelo seu número na fileira (i) e seu número na coluna (j).

Coluna j

7/7

Figura 10-6

Então, o objeto, no momento, repousa na fileira 3 e coluna 4. A classe de estímulo discriminativo que representa essa condição é S3 ?4 e a classe de movimentos de apanhar que serão reforçados pelo contato com o objeto é denotada correspondentemente como R3 ,4 . Essa análise pode ser generalizada como a contingência

S,JRij

[10.3]

onde S = objeto na posição i, j R = movimento de apanhar S+= contato com o objetoi = número de fileira j = número da coluna

Uma vez que i e j são variáveis, o Diagrama [10.3] representa um exemplo da representação funcionai da seção 6.14. As coordenadas espaciais da classe de resposta

715 -

l igura 10-7. Quadros de uma aproximação simulada de um míssil a um alvo estratégico O bicar de um pombo fornece o sinal de controle (de Swartz, 1963, segundo Skinner, 1960)

~ 216 -

reforçada são uma função contínua das coordenadas espaciais do objeto estímulo. No presente exemplo, o ângulo e extensão da resposta de apanhar dependem da posição espacial do objeto. A função é complexa, mas não há razão para se 'suspeitar que o procedimento básico de discriminação empregado em cada uma das outras seções deste capítulo não seja o método para formação dessa discriminação, ou melhor, conjunto de discriminações. As respostas com determinados valores de ângulo e extensão, que caem em certos limites pequenos, são reforçadas somente quando o objeto está numa certa posição relativa ao organismo. As respostas cujos valores de ângulo e extensão se desviam desses limites não são reforçados. ( 0 objeto não é apanhado)* Tal história passada e subseqüente controle do comportamento que ela confere à posição espacial, c imediatamente aparente quando “ tateamos” em busca de uma lanterna no escuro, ou quando procuramos por um lápis que cai debaixo c!e uma mesa, fora da visão.

0 comportamento envolvido quando um operador “rastreia” um alvo móvel é o exemplo mais sofisticado de tais discriminações. Ao dirigir um automóvel ou apontar uma arma para um objeto que se move rapidamente, requer-se um conjunto de respostas que deve variar continuamente com as mudanças constantes das condições de estímulo. Embora tais discriminações sejam complexas, elas são adquiridas através de uma história adequada de contingências de reforçamento. O projeto ORCON (ORganic CONtrol), o resultado de um projeto de pesquisa da II Guerra Mundial, ilustra as sutilezas discriminate as que podem ser conferidas a um organismo tão pouco ilustre como o pombo. O objetivo ORCON era treinar pombos para guiar mísseis para alvos selecionados (Skinner, 1960). Os animais eram colocados no nariz, em forma de cone, de um míssil, frente a uma tela onde era projetada uma imagem simulada de um possível alvo inimigo. Presos em jaquetas especiais, os pombos ficavam imobilizados, apenas com a cabeça e o pescoço livres. Um eletrodo de ouro cobria a ponta do bico de cada pombo. Zomo a tela em que o animal havia sido treinado a bicar era feita de um material semicondutor, a localização exata das bicadas podia ser detetada por um curcuito eletrônico no míssil. A informação assim obtida seria usada para disparar o míssil.

Durante o treino, o reforçamento era contingente a bicadas apenas no centro de um alvo selecionado. Uma vez que um míssil, movendo-se numa velocidade superior a 960 km/h poderia rapidamente mover o alvo na tela enquanto o animal parasse por alguns segundos, um esquema intermitente foi usado, mantendo uma alta taxa de bicar. Alguns quadros de uma aproximação simulada são vistos na Fig. 10-7.0 alvo passa a ser visto no quadro superior e o pombo começa a bicár. O animal continua a manter o míssil em curso por vários minutos, como é visto nos outros três quadros. Os pombos foram treinados, com éxito, a ignorar sinais espúrios que aparecessem em suas telas, tais como aviões da artilharia antiaérea e nuvens, e a manter o curso de apenas um dos vários alvos estratégicos particulares que poderiam aparecer no campo de visão.

10.6 DISCRIMINAÇÃO SEM RESPOSTAS EM SA

Em trabalhos anteriores com o procedimento de discriminação simples, Skinner (1938) relatou que o processo de discriminação seria muito mais rápido se o procedimento de discriminação fosse efetuado simultaneamente com o fortalecimento original do operante. Em certos casos extremos, Skinner foi capaz de mostrar que ratos poderiam formar discriminação luz-escuro imediatamente.

- 217 -

Sugere-se a seguinte explicação para se levar em conta este efeito. Um processo de discriminação, tal como o descrito na seção 1 0 .1 , é prolongado principalmente devido ao processo de extinção que deve ocorrer em S^ . Mas, uma das principais variáveis que afetam a extensão de qualquer processo de extinção é o número de reforçamentos obtidos na aquisição (ver seção 5.9). Se poucos reforçamentos são dados antes da extinção, esta será rápida. No treino discriminativo, a resposta em S^ é devida a generalização do fortalecimento em S^ * O gradiente de generalização implica em que o potencial de respostas em S ^ , gerado pela aquisição, será menor que ou igual aquele estabelecido em S^. Nesta análise, pressupõe-se uma família hipotética de gradientes de generalização, tais como os da Fig. 10-8. O parâmetro da Fig. 10-8 é o número de reforçamentos fortalecedores durante a aquisição. Note que, quanto menor o número de reforçamentos administrados, mais próximo S^ pode estar de SD, sem que ocorram respostas a S A através da generalização.

No procedimento de Skinner, o treino discriminativo começou com uma luz presente (SD). A primeira pressão a barra emitida, no nível operante, foi reforçada e S^ foi imediatamente substituído por um período de 5 min de escuro (S^ ). Depois do período de 5 min em , o S^ foi reintroduzido e novamente a primeira resposta emitida foi reforçada, seguida pelo aparecimento do S^ e suas conseqüências de extinção. Este ciclo foi repetido através do treino discriminativo. Sob essas condições, a generalização a é negligível, havendo pouco ou nada para extinguir em sua presença. Devido ao fato de que o responder em S^ não ocorre na aquisição de tais discriminações, elas são apropriadamente denominadas “sem erro” .

H. S. Terrace (1963 a, b) estendeu essa ténica para demonstrar discriminações sem erro entre pares de estímulos discriminativos muito próximos no gradiente de generalização. No trabalho de Terrace, o princípio do mínimo fortalecimento inicial é combinado com a técnica de usar, inicialmente, estímulos bem diferentes como S^ e SA e, então, progressivamente, reduzir as diferenças físicas entre eles.

Dimensão do Lístímulo

Figura 10-8. Família hipotética de gradientes de generalização com o parãmetrc número de reforçamentos no fortalecimento original. Cada curva representa um número diferente de reforçamentos no treinamento em S^, de 1, 2, 3 ... a n.

- 2 1 8 -

O treino discriminativo é iniciado com um sA bastante diferente de para evitar generalização (ver Fig. .10-8). À medida que se prossegue o treino discriminativo, as diferenças entre e são gradualmente reduzidas, tornando-se o mais e mais semelhante a SD. Isto resulta em tornar o S ^ cada vez mais próximo do SD nas suas dimensões comuns de estímulo.

Num dos procedimentos de Terrace, o bicar um disco vermelho foi modelado e receber poucos reforçamentos. Uma discriminação entre vermelho (S^) e verde (SÀ) foi estabelecida, virtualmente, com nenhuma bicada em com o seguinte método:

“O bicar a chave é condicionado a uma luz vermelha (Sl^). Seguindo cada um dos cinco primeiros reforçamentos, a luz da chave era sempre vermelha. Depois do quinto reforçamento, a chave foi obscurecida por 2 seg, depois do que a luz vermelha aparecia novamente. Seguindo os 20 próximos reforçamentos, o intervalo (escuro) foi progressivamente aumentado até o intervalo máximo de 30 seg, com uma média de 15 seg, ser alcançado. Neste ponto, o S ^ foi introduzido. Inicialmente, SÃ era uma luz verde fraca com 1 seg de duração. Durante tentativas sucessivas em SA , sua duração e intensidade foram aumentadas progressivamente, até que a duração de S A fosse de 5 seg e os brilhos de SD e S ^ fossem iguais” (Terrace, 1963, b, p. 224).

O método de treino discriminativo de fortalecimento mínimo em S&,com redução progressiva de diferenças entre , parece ter um número de vantagens. Lmprimeiro lugar, parece que tais discriminações são formadas bem mais rapidamente do que aquelas em que se emprega os procedimentos das seções 10.1-10.5. Segundo, o valor assintótico de Id é provavelmente mais próximo de 1 ,0 com esta técnica. Terceiro, desde que poucas respostas, ou mesmo nenhuma, ocorrem em S ^ , não há os efeitos emocionais característicos da extinção nessas discriminações sem erros. Os distúrbios que caracterizam esses efeitos emocionais (discutidos mais amplamente no capítulo 18) são geralmente indesejáveis na aprendizagem de habilidades e discriminações cotidianas. Então, o método de treinamento de discriminação sem erro pode ter um emprego importante na tecnologia educacional.

10.7 TEMPOS DE REAÇÃO DISCRIMINATIVOS

A história característica do treino discriminativo S^ - S A estabelece controle de estímulo sobre os operantes. A medida que S^ passa a controlar, progressivamente, seu operante, o tempo entre o aparecimento de S^ e a ocorrência do operante diminui. Este tempo, análogo à latência do reflexo S2 —> R2 > é chamado tempo de reação discriminativo (RT). Sob certas condições, o RT discriminativo pode ser um índice da força de uma resposta, ou do estado de um processo de discriminação. Durante o treinamento SD - S^ do tipo descrito nas seções 10.1 e 10.2, o RT diminui progressivamente, aproximando-se - no rato - de uma assíntota de cerca de 1 seg.

Existe uma vasta literatura sobre RTs assintóticos em discriminação humana na medida em que se relacionam à complexidade da situação de estímulo, número de contingências possíveis, dificuldades em discriminar S^ e S ^ , intensidade de SD, administração de drogas, etc. O RT discriminativo do frear quando ocorre uma situação onde um acidente pode acontecer, tem sido de algum interesse para as ^osquisas de

- 219 -

segurança de estradas. Como se sabe, este RT pode variar de uma pequena fração de segundo até vários segundos, dependendo de fatores tais como a concentração de álcool no sangue, número de horas na direção e presença ou ausência de cafeína no sangue. No laboratório, os tempos de reação são frequentemente medidos dando-se instruções a um sujeito humano para pressionar uma chave telegráfica tão rápido quanto possa, depois de receber um sinal. Tempos de reação da ordem de pequenas frações de segundo (200 — 500 milisegundos) são obtidos com tal procedimento, particularmente se o sinal de ‘Prepare-se” precede o sinal verdadeiro para “ responder” .

“No comportamento cotidiano, a maioria $e nossas respostas não é emitida sob condições favoráveis tais como as do laboràtório e a necessidade de uma reação muito rápida é apenas ocasional, como no atletismo, combate militar e controle de máquinas como o avião e o automóvel. Por várias razões, os valores alcançados em experimentos humanos de tempo de reação raramente são aproximados, mesmo nessas circunstâncias. Os sinais de aviso frequentemente estão ausentes;pode-se não saber de que direção está vindo o estimulo; geralmente, a pessoa está empenhada em fazer outra coisa quando a resposta é subitamente requerida; a resposta pode envolver a ação de grandes grupos de músculos em vez de pequenos grupos; o estímulo pode ser muito fraco, ou tão forte que causa a “imobilização” , e assim por diante. Então, um grupo de jogadores de futebol americano pode levar em média até 400 mseg para desfazer uma formação de jogo a um sinal auditivo; e o tempo de reação de motoiistas de automóvel pode aumentar de vários segundos quando a ameaça de um acidente requer uma mudança do pé do acelerador para o freio” (Keller e Schoenfeld, 1950, p. 146).

10.8 AS IMPLICAÇÕES DO CONTROLE DE ESTIMULO OPERANTE

Passando do simples para o complexo, tentamos mostrar os métodos pelos quais o estado do ambiente imediato passa a controlar uma resposta operante. Operantes sob tal controle são chamados operantes discriminativos. Quando o rato salta para o cartão apropriado, quando o macaco puxa o barbante correto, quando a criança pega um objeto e quando freamos o carro diante de uma luz vermelha a resposta emitida está sob um poderoso controle de estímulo. Logo, é um operante discriminativo e o controle de estímulo dependerá, em cada caso, de uma história anterior com os tipos de contingências de reforçamento descritos nas seções de 10.1 a 10.5.

A natureza do controle de estímulo operante é tal que, não apenas a ocorrência da resposta, mas também certas propriedades d? resposta, podem vir a ser controladas pelo estímulo, dada uma história passada particular de reforçamento. No controle de respondentes por eliciadores, as propriedades da resposta tais como magnitude, duração e latência são uma função fixa do eliciador, determinada pelas leis do reflexo. No controle de estímulo operante, não existe uma relação única entre a intensidade de S^ e as propriedades da resposta tais como duração e RT. Por exemplo, a magnitude da resposta reforçada pode ser, dentro de amplos limites, qualquer uma que as contingências especifiquem que seja. Assim, poderíamos construir um operante discriminativo que imitasse as leis do reflexo. Reforçando-se adequadamente qualquer resposta determinada, a pressão à barra ou a expressão “por favor” , por exemplo, na presença de uma luz ou um tom, por exemplo, a força da resposta reforçada poderia ser diferenciada de modo a

- 220 -

R»s r

[10.4]+s

ser proporciona] à intensidade do estímulo prevalecente. Podemos representar isso, em notação, como onde y é a força da resposta e x a intensidade do estímulo, sendo y definido como proporcional a x. Um observador, olhando o organismo assim treinado, e que não conhece sua história com as contingências de [10.4] poderia ser inclinado a chamar a resposta observada, Ry, de um respondente. Note que este erro decorre ao se negligenciar a história passada relevante desse organismo. Para evitar estas interpretações erradas, deve-se sempre ter cautela ao considerar exemplos de comportamentos fora do laboratório. Frequentemente, a história passada relevante não pode ser descoberta. Nosso próprio comportamento discriminativo, por exemplo, é tão familiar, tão automático, que provavelmente não nos lembramos de como foi adquirido.

Como um exercício instrutivo, considere uma regra de contingência em que o inverso da lei da magnitude do reflexo poderia ser obtido, tornando-se o y de [1 0 .4| = l/x . O resultado, agora, seria criar uma R cuja magnitude fosse uma função inversa da intensidade do estímulo discriminativo na presença do qual ocorreu. Talvez, fique claro, com este exemplo, porque a magnitude da resposta não é uma medida adequada do fortalecimento operante. A magnitude da resposta pode ser modelada arbitrariamente, dependendo das contingências de reforçamento.

Uma vez que uma discriminação operante de qualquer tipo tenha sido formada, controlar a ocorrência de SP é uma forma de controlar a ocorrência da resposta. Depois de 40 sessões de treino discriminativo, para fazer com que ratos como os de Herrick, Myers e Korotkin, pressionem uma barra basta somente apresentar a luz. De forma similar, para fazer com que ratos como os de Pfaffam, Goff e Bare pressionem uma barra, necessitamos somente retirar o odor de suas câmaras e apresentar ar fresco. Para fazer um homem se mover, pedimos que ele se mova. Em todos esses casos, a resposta está sob o controle de um estímulo anterior (a luz, o ar fresco ou o pedido), mas a relação da resposta com o estímulo difere consideravelmente daquela do respondente com seu eliciador. Em primeiro lugar, as leis do reflexo não se mantém entre o e sua R. Aumentos na intensidade de diminuiriam a probabilidade de R, de acordo com o princípio de generalização. (Tente gritar seus pedidos às pessoas). Em segundo lugar, a relação entre e R depende da história de discriminação. Essa história dificilmente pode ser ignorada, porque sem ela um não poderia obter seu status de variável controladora do comportamento. Para distinguir entre o tipo de controle que os eliciadores têm sobre seus operantes, dizemos que um estabelece a ocasião para uma resposta, isto é, é estabelecida uma ocasião onde a emissão de R produz reforçamento.

10.9 A S1GNIFICÃNC1A DAS DIFERENÇAS ENTRE DUAS MÉDIAS

Existem ocasiões em que o comportamento em S^ e SA é tão semelhante que assegurar a presença ou ausência do responder diferencial, o sine qua non de uma discriminação, pode ser difícil. O responder muito similar em SD e em S A pode ocorrer quando o organismo não adquiriu o comportamento de observação adequado, quando SD e SA são muito semelhantes, quando influências que tiram a atenção estão presentes, e assim por diante. Se as diferenças entre as taxas de resposta em S^ e S A são

- 221 -

r

pequenas, o experimentador pode ficar inseguro se qualquer discriminação está sendo feita.

O problema de avaliar pequenas diferenças numéricas transcende as discriminações. Sempre que dois grupos de medidas de qualquer tipo são muito semelhantes, ou há bastante variabilidade entre elas de modo que elas se sobreponham apreciavelmente, aparece uma necessidade de uma avalização objetiva das diferenças numéricas observadas. São as-diferenças observadas, embora pequenas, atribuíveis aos efeitos sutis, mas possivelmente, teroricamente importantes, de condições experimentais diferentes, ou são apenas o produto de erros casuais de medida?

Considere os dados da Tabela 10-1, indicados como histogramas na Fig. 10-9. Esses dados são 60 taxas fictícias de resposta que poderiam ter sido obtidas em 60 apresentações de um minuto das condições S^ e SA 5 alternadas ao acaso. Se isto ajuda a tornar a discussão completa, considere S^ como períodos de 1 min de ar fresco e S ^ como períodos de 1 min de concentração muito baixa de gás odorante, e o sujeito fictício como um dos sujeitos de Pfaffman, Goff e Bare discutidos na seção 10-1. Os dados das condições em S^ e S ^ são claramente semelhantes. Há uma superposição substancial entre os dois histogramas da Fig. 10-9. Muitas respostas são emitidas em SA

Tabela 10-1

NÚMERO DE RESPOSTAS REGISTRADAS EM 60 PERÍODOS DE 1 MIN DE SD E S A , ALTERNADOS AO ACASO. OS VAI ORES DE

SA ESTÃO EM NEGRITO (DADOS HIPOTÉTICOS)

25 21 13 24 29 24 27 16 24 2730 25 25 23 22 29 23 26 26 2527 26 25 0 15 28 19 27 23 1911 27 11 30 28 19 6 26 6 1637 22 25 25 20 32 23 23 26 2426 25 8 27 20 31 21 29 22 25

.5'5cocrt>t-Hu,

1'igura 10-9. Histogramas do número de respostas emitidas em 30 períodos de um minuto de sA (acima) c 30 períodos <te um minuto dcSD (cmbaivo) Dados fictícios

10 15 20 f25Número de respostas emitidas em intervalos de teste de 1 min.

- 222 -

a discriminação entre ar fresco e odor, se existe, é mínima. Contudo, existem,insinuações de uma diferença entre o responder em e .A distribuição em SA está mais à esquerda da discriminação S^; a distribuição em contém a taxa mais baixa (0 respostas) enquanto a distribuição em contém a taxa mais alta (36 respostas); as modas das duas distribuições não são idênticas; a média da distribuição em S A é 20,7 respostas/min e a da distribuição em é 24,7 respostas/min.

São as diferenças nestas duas distribuições o resultado de erros casuais de medida ou elas são, de fato, indicações significantes de uma pequena discriminação? Neste ponto, é útil lembrar alguns aspectos pertinentes da assim chamada curva normal, discutida na seção 2.6 e reproduzida na Fig. 10-10. Em particular, desejamos lembrar que entre mais ou menos um certo número de unidades de desvio padrão, 0 do centro, encontra-se uma certa percentagem de medidas contidas na área sob tal curva. Para rever, 68 por cento das medidas se encontram sob a curva entre + 1 O da média central. Uma maneira

Figura 10-10. A curva normal.

alternativa de expressar esta propriedade é dizer que, se estivéssemos retirando aleatoriamente amostras de medida desta distribuição normal, a probabilidade de se obter uma medida que se encontre dentro desta região seria de 0,68 e a probabilidade de se obter medidas que se encontrem fora desta região seria de 0,32. Similarmente, 95 por cento das medidas estão entre í. 2 O da média. Então a probabilidade de se obter uma medida fora desta região t 2 O é apenas de 0,05.

Agora, suponha que as nossas medidas da taxa de resposta em S^ e S à na Fig. 10-9 representem amostras de medidas tiradas de uma população de dezenas de milhares de medidas potenciais e cuja distribuição seria parecida com a curva normal na Fig. 10-10. Esta distribuição normal teria um certo O a ela associado que descreveria sua variabilidade devido a erros de medidas. Se tivéssemos esta distribuição ao nosso alcance e nos fosse dado ainda uma única medida da taxa de resposta sobre a qual nada saberíamos, exceto o seu valor e se nos perguntassem, subsequentemente, se tal medida pertence aquela distribuição, poderíamos dar uma resposta significativa em termos de probabilidade. Precisamos apenas verificar de quantas unidades C esia nova medida se desvia da média da distribuição normal e dizer, então, qual a probabilidade de que ela pertença a esta distribuição. Suponha que tal medida se encontre na região sob a curva fora da linha limite de exatamente 2 O acima da média. Então, a probabilidade é apenas 0,05 de que ela faça parte da distribuição porque 0,95 (95%) dos valores desta

- 223 -

distribuição estão entre + 2 CJ e somente 0,05 (5%) estão íora. Esta proposição não diz que a medida dissidente não veio desta distribuição; poderia ter vindo. Somente diz que é algo improvável que ela tenha vindo. i

Nosso problema presente tem alguns elementos em comum com a avaliação de uma única medida nova em referência a uma distribuição conhecida. Avaliando nossos dados de discriminação não temos apenas uma comparação de uma medida com uma distribuição de medidas, mas uma comparação de duas distribuições separadas (S^ e SA) de medidas. O que gostaríamos de saber é se a distribuição em S^ difere sistematicamente, embora pouco da distribuição em S^.

Uma maneira proveitosa de abordar este problema é investigar se as médias das duas distribuições diferem significativamente uma da outra. Em outras palavras, será que a diferença de 4,0 entre 20,7 e 24,7 representa apenas flutuações ao acaso na taxa de resposta momento-a-momento que, por acaso, foi detetada na nossa divisão arbitrária da sessão em períodos de “S ^ ” e “S A ” e, no que diz respeito ao rato, S^ e S A constituem tratamentos iguais? Ou, será essa diferença de 4,0 o resultado das condições SD realmente terem um efeito diferente de SA sobre a tendência do responder?

Uma maneira laboriosa de determinar a interpretação mais plausível seria fazer mais sessões adicionais e idênticas do nosso experimento, mas usando um valor para SA que sabemos estar muito próximo de S^ para ser discriminavelmente diferente dele (por exemplo, S^ sA), de modo que quaisquer diferenças nas taxas em S^ e S^ teriam que ser devidas apenas ao acaso. Essas sessões adicionais dariani um grande número dc novas médias de taxas de resposta em S^ e sA. Poderíamos subtrair a média de da média de S A para a sessão e obter uma diferença; poderíamos subtrair a média dc SD da média de SA para a sessão 2 e obter outra diferença e assim, sucessivairente, para todas as sessões que tivéssemos a paciência de realizar.

Terminaríamos com um conjunto de números, as diferenças entre as médias emSD e S ^ . Poderíamos fazer um gráfico da distribuição dessas diferenças entre as médias (os estatísticos nos asseguram que resultará numa curva normal) e calcular o desvio padrão, o sigma das diferenças entre as médias da amostra, O Md. Note que esta distribuição das diferenças entre as médias da amostra deve ter o centro em torno de zero se, ao manter nossas condições experimentais constantes de sessão a sessão, nenhuma discriminação foi possível entre S^ e sA . As diferenças observadas entre as médias obtidas de sessão para sessão seriam, neste caso, apenas aquelas resultantes de flutuações no responder, devido a influências não controladas, mas presumivelmente não sistemáticas, que poderiam ser tanto positivas quanto negativas em qualquer momento. Com a adição de sessões, elas se cancelariam mutuamente, deixando-nos uma diferença média entre as médias igual a zero.

Uma vez com essa distribuição das diferenças entre as taxas médias de resposta durante períodos de S^ e S A não discrimináveis, poderíamos, então, comparar o nosso valor observado de 0,4 com a distribuição das diferenças casuais entre as médias, para ver se 4,0 está além de 2 (T Md unidades do centro em zero. O método seria o mesmo através do qual comparamos uma única medida com uma distribuição conhecida.

L)e fato, não é prático e nem econômico repetir estes experimentos de controle ta.nlas vezes para obter uma estimativa razoável de como a distribuição das diferenças entre as médias da amostra se apresentaria no caso onde houvéssemos arranjado anteriormente para que as amostras não diferissem consideravelmente, exceto por acaso. Na prática, podemos nos valer de uma derivação da estatística matemática que mostra

- 224 -

que uma estimativa do desvio padrão crítico, O Md, pode ser obtido com um pouco dc matemática aplicada às nossas 30 medidas originais em SD e S A.

O que devemos fazer primeiro é calcular o desvio padrão do conjunto das 30 taxas observadas em e o desvio padrão do conjunto das 30 taxas observadas em SA dos dados da Tabela 10-1. Combinamos, então, esses dois desvios padrões obtendo um desvio padrão combinado (chamado cr D para distinguir de outros desvios padrões) que para os dados da Tabela 10-1 é =9,15. Neste ponto aplicamos uma fórmula estatística, com cuja origem não precisamos nos preocupar, para obter uma estimativa de o o desvio padrão das diferenças entre as médias da resposta em SD que esperaríamos obter se repetíssemos o experimento por muitas sessões. A fórmula diz que CTj^ é estimado por cr D /V N - onde N é o número de pares de medidas que temos, neste caso, 30. O resúltado, 9,15/ V 30 = 1,67, pode ser usado para determinar a probabilidade de que a nossa diferença média particular observada, 4,0, aparece apenas devido a erros envolvidos ao se medir as taxas de resposta em S^.

Evidentemente, 4,0 é maior que duas unidades do tamanho de 1,67. Isto é, a diferença obtida, + 4,00, encontra-se na região (+ 4,00 / 1,67) a unidades acima da média da distribuição teórica das diferenças esperadas apenas por acaso. (Lembre-se de que a média desta distribuição teórica, para o caso onde há somente erros casuais em para perturbar as medidas da taxa da resposta em é zero). Realmente, uma diferença t£o giande como 4,0 entre duas médias seria esperada surgir devido ao acaso menos que 5% das vezes. Uma diferença observada tão improvável de surgir devido a erros casuais de medida é convencionalmente dita estatisticamente significante. É neste sentido técnico que, quando nos referimos a resultados numéricos neste texto, a palavra significância é empregada.

Iniciamos com uma certa diferença pequena entre duas distribuições de taxa de resposta. Utilizando certas propriedades da curva normal e certas derivações da estatística matemática, fomos capazes de encontrar a probabilidade do que uma diferença entre as médias de duas distribuições observadas de dados fosse tão grande quanto o seria se atribuída apenas a erros casuais. Ao fazer assim, avaliamos a significância estatística da nossa diferença. A técnica usada foi encontrar, primeiro, um desvio padrão combinado representando a variabilidade em e SA e, segundo, desta estatística derivar o O O método supõe que números iguais de medidas sejam feitos nas duas condições. Esta restrição pode ser superada pelo uso de outras fórmulas, algo menos intuitivas, encontradas em qualquer livro elementar de estatística. Em geral, os métodos para ístimar a probabilidade de que as diferenças observadas entre duas médias são devidas a erros casuais de medida são usados onde ( 1) as diferenças observadas são pequenas, (2) a variabilidade de medidas é alta como um resultado de perturbações não controladas ou não controláveis, (3) o tempo não permite a replicação do experimento bastante vezes de modo a fornecer uma base empírica para estimar a confiabilidade das diferenças encontradas entre as condições experimentais.


Goff, W. R. Measurement of absolute olfactory sensitivity in rats. Amer.J. Psychol., 1961, 74, 384-393.

Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews (E d .), Methods of psychology. New York: Wiley, 1948.

- 2 2 5 -

Harlow, H. F. The formation of learning sets. Psychol. Rev., 1949, 56, 5 1 - 6 5 . “ ’

Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in S° and SA rates during the development of 'an operant discrimination. / . comp, physiol. Psychol, 1959, 52, 3 5 9 - 3 6 3 .


Lashley, K. S. The mechanism of vision XV . Preliminary studies of the rat’s capacity for detail vision. J. gen. Psychol. 1938, 18, 123-193 .

Miüenson, J. R. Random interval schedules of reinforcement. J. exp.Anal. Behav., 1963 6, 4 3 7 - 4 4 3 .

Munn, N. L. Handbook of psychological research on the rat. Boston: Houghton Mifflin, 1950.

Pfaffman, C., Goff, W. R., and Bare, J. K. An olfactometer for the rat.Science, 1958, 128, 10 0 7 - 1 0 0 8 .

Russell, I. S. Analysis of the responding during operant discrimination.Unpublished doctoral dissertation, Indiana Univer. , 1960.

Skinner, B. F. The behavior of organisms. Chapter 5. New York: Ap- pleton-Century, 1938.

Skinner, B. F. Pigeons in a pelican. Amer. Psychol., 1960, 15, 2 8 - 3 7 . Swartz, P. Psychology the study of behavior. Princeton: Van Nostrand,

1963.Terrace, H. S. Discrimination learning with and without “errors.” J. exp.

Anal. Behav., 1963a, 6, 1 -27.Terrace, H. S. Errorless transfer of a discrimination across two continua.

J. exp. Anal. Behav., 1963b, 6, 2 2 4 - 2 3 2 .

- 226 -

Capítulo 11 REFORÇADORES ADQUIRIDOS

É fácil notar, mesmo com um exame rápido do mundo que nos cerca, que algumas das conseqüências especiais que denominamos reforçadoras têm uma primazia mais natural ou biológica do que outras. Poucos discutiriam que alimento, água e sexo estar numa categoria diferente mais “básica” do que livros, dinheiro e automóveis. Mesmo assim, os organismos, uma vez ou outra, trabalham por todos esses. Podemos distinguir essas duas categorias pelo modo em que o organismo chega a possuir uma suscetibilidade ao reforçamento. Para cada indivíduo, existe uma classe de reforçadores cujos poderes são meramente uma conseqüência biológica da filiação do indivíduo a uma certa espécie. Esses reforçadores são uma propriedade das espécies tanto quanto as manchas do leopardo, a pele do gato a cauda do cachorro. As suscetibilidades ao reforçamento que são constru ídas no organismo deste modo definem os reforçadores primários ou incondicionados. Eles serão discutidos em capítulos subsequentes sobre Motivação. Para o presente, voltamo-nos para um segundo grupo de reforçadores, “secundários” , que parecem mais variáveis e menos previsíveis de indivíduo para indivíduo, comparados com os do primeiro grupo.

Dinheiro, carros, lápis, jornais, prestígio, honra e um sem n&mero de outras coisas arbitrárias que os seres humanos trabalham para obter, constituem uma grande fonte de reforçadores fidedignos e potentes. Mas essas coisas não têm valor algum para nós quando nascemos. Claramente, elas devem ter adquirido sua capacidade para reforçar em alguma ocasião durante a história passada de cada indivíduo. Uma história passada individual é um pré-requisito; prova disto é aquele adulto ocasional para quem alguns dos reforçadores convencionais parecem não ter valor algum. Neste sentido, o outro tem pouca importância para um monge Trapista, um homem primitivo dificilmente lutaria por uma cópia do New York Times e nem todos gostam de Brahms.

Dinheiro, material impresso e os trabalhos de um compositor particular não têm o valor universal do alimento, água e sexo, embora para um dado indivíduo sua atração possa parecer igualmente forte. Como mostraremos em seguida, os reforçadores adquiridos obtêm seu poder para fortalecer e manter o comportamento em virtude de uma história passada de associação com reforçadores primários.É sua dependência sobre essa história condicional para que tenham poder de reforçar que lhes dá o nome de reforçadores condicionados.

- 227 -

Os reforçadores condicionados parecem ser especialmente difundidos na manutençao do comportamento humano. Realmente, eles estão ligados com a própria noção de cultura humana. Contudo, eles são facilmente cultivados em sujeitos animais no laboratório, onde as condições exatas para o seu estabelecimento e a medida precisa de suas forças relativas podem ser quantitativamente estudadas.

11.1 AS P R O P R I E D A D E S R E F O R Ç A D O R A S DOS E S T Í M U L O S DISCRIMINATIVOS POSITIVOS

Antes do fortalecimento da resposta de pressão à barra de um rato faminto ou o bicar a chave de um pombo faminto, loma-se, geralmente, cuidado para antecipar cada instante de fornecimento de alimento por um breve clique e um flash de luz que emanam do lugar onde o alimento é fornecido. Uma vez que o alimento está à disposição somente após a combinação clique-luz, este procedimento é suficiente para tornar o clique-luz um estímulo discriminativo positivo (S^) para a resposta de aproximação ao comedouro. Mas, além de tornar a situação clique-luz um S^, um produto colateral inevitável deste procedimento de discriminação é dar ao clique e à luz um poder de reforçar. Este poder é explorado, permitindo-se que a pressão à barra ou o bicar da chave produzam o S^. Deste modo, podem-se fornecer à resposta conseqüências mais imediatas do que seria possível com o alimento em si. O rato leva algum tempo para mover-se da barra para o comedouro e comer; mas o estímulo clique-luz pode alcançá-lo mesmo antes de ter retirado as patas da barra. Este tipo de reforçamento imediato, proporcionado pelo reforçador secundário clique-luz, é essencial para produzir o fortalecimento rápido do operante (ver Fig. 4-2).

O procedimento para demonstrar o poder reforçador da combinação clique-luz pode ser representado como uma notação de duas fases: ( 1) estabelecer o clique-luz como um SD pelo método usual de discriminação:

SARi ■/>

e R, -+ S +2

onde SD = clique-luzSA = ausência de clique-luz S + = alimentoR, = aproximação ao comedouro

(2) Então, em S^ , permitir que uma resposta não fortalecida anteriormente, por exemplo, pressão a barra, produza o estímulo discriminativo positivo, S^, retirando-se, ao mesmo tempo, o reforçador primário final.

SA [SnRi ■/"* Rj -f> [ 111]R2 ----->2 1

onde R2 =• pressão à barra.

- 2 2 3 -

Para testar a eficácia do clique-luz como agente reforçador independente, o reforçador primário deve estar ausente. Na medida em que o alimento ocorrer no final da seqüência, o fortalecimento de um novo operante (em | 1 1 .1 | , pressão à barra) pode ser inteiramente devido à ação do reforçador primário; o clique-luz, por si só, pode ser irrelevante.

É claro que, durante o teste de 111 - 1 1 , a extinção da resposta de aproximação ao comedouro procederá concorrentemente comquaisquer efeitos de fortalecimento que c procedimento possa estar exercendo sobre a pressão à barra. Assim mesmo, o resultado experimental de 111.1| é inequívoco. A resposta de pressão à barra existindo anteriormente numa taxa baixa no nível operante, é rapidamente forlalccida apenas pelo SD clique-luz. A resposta à barra é condicionada a despeito do fato de nenhum alimento estar sendo apresentado, e*a despeito do fato de a resposta ao comedouro estar, simultaneamente, em processo de extinção. Na Fig. 11-1, são vistas curvas cumulativas de quatro ratos neste procedimento. Pela primeira vez na história de condicionamento dos ratos, cada pressão à barra produziu uma conseqüência especial - o para aproximação ao alimento., Durante o tempo em que a Fig. 11-1 foi registrada, o alimento nunca apareceu Comprrada* r.nm curvas de fortalecimento com reforçamento primário (por exemplo, alimento), as curvas são mais variáveis e mais negativamente aceleradas (ver Fig. 4-2). Da observação do aumento geral na taxa de pressão à barra visto na Fig. 11-1, todavia, não há dúvida de que tornar o contingente a pressão à barra, serve, temporariamente, para condicionar o operante. As curvas do fortalecimento apenas pelo clique-luz tomam a forma geral das curvas de extinção. Isto nada tem de surpreendente porque, simultaneamente com o condicionamento de R2 (pressão l\ barra) por SD? Rj (aproximação ao comedouro) está sendo extinta. Logo, o está perdendo, concorrentemente, seu poder para agir como para Rj e, por inferência, também o valor reforçador adquirido. Esta perda é uma conseqüência inevitável do teste de reforçamento secundário.

11.2 COMO AUMENTAR A DURABILIDADE DE REFORÇADORES CONDICIONADOS

O princípio do reforçamento adquirido foi entusiasticamente recebido pelos primeiros behavioristas que viram nele a chave para a explicação das atividades sociais complexas que, no homem , parecem medrar na ausência de reforçamento primário. O reforçamento condicionado parecia uma explicacão pronta para comportamentos sociais tais como o gregarismo ou cooperação e valores sociais tais como a conquista de prestígio, poder ou riqueza. Mas, na investida para contrapolar os conceitos de íaboratório sobre reforçamento condicionado para o campo social, raramente se esclareceu que permaneciam ainda por realizar demonstrações experimentais poderosas do reforçamento secundário. As curvas de Skinner (1938) (Fig. 11-1) eram uma demonstração bastante genuína de que os S^s tornavam-se realmente reforçadores secundários. Mas a produção de comportamentos mantidos pelo S^ como um reforçador condicionado era da ordem de 50 respostas em 45 min — uma produção desprezível e, certamente, uma demonstração não muito convincente de que os reforçadores condicionados do laboratório poderiam, mesmo remotamente, ser a base dos incentivos sociais da vida humana. Por algum tempo, as tentativas dos pesquisadores, utilizando pistas, labirintos e barras, para produzir reforçadores secundários mais poderosos, que pudessem modelar e manter o comportamento por longos períodos sem os reforçadores

- 229 -

Tempo (minutos)

Figura 11-1. Fortalecimento de um operante cie pressão à barra em quatro ratos famintos, quando o único reforçamento é o que anteriormente determinava a ocasião para a aproximação ao comedouro (Skinner, 1938).

primários, obtiveram pouco sucesso. E só recentemente foram descobertas técnicas para ampliar a durabilidade de reforçadores condicionados a um nível em que se pudesse atribuir, de forma razoável, ao conceito experimental um papel importante na teoria da atividade humana.

A habilidade para demonstrar o reforçamento adquirido de uma forma convincente esperou o desenvolvimento dos procedimentos de reforçamento intermitente, isto é, esquemas de reforçamento e as especificações de operantes de ordem superior. A intermitência desempenha dois papéis críticos na ampliação dos efeitos dos reforçadores condicionados. (1) Usada para programar o reforçamento primário (por exemplo, alimento) para um operante discriminativo no treino , ela pode construir umaalta resistência à extinção do operante discriminativo (Rj na cadeia de 1 11 - 1 1 \ 0 método consiste simplesmente em se alternar o conjunto de contingências.

S” [SAe |R, - h

2 1

O resultado é o de limitar a emissão de R\ a e, além disso, já que a contingência 2 é probabilística, desenvolver uma resistência potencial à extinção muito forte de Ri em S^. (2) Usada ao se testar o valor reforçador de S^, a intermitência imposta entre a nova

- 230 -

R a ser condicionada e o SD contingente conserva o poder do reforçador secundário. O método consiste, simplesmente, em deixar a nova R produzir o probabilisticamente, R2 -£ -> SD, ou alternativamente, incorporar R em um operante de ordem superior, nR

SD Uma intermitência bem escolhida, aqui, não somente irá conservar o poder de S^, mas manterá também uma alta taxa de R2 . A conservação do poder de S^, neste procedimento, deriva de sua infreqüência de ocorrência. não perderá seu controle sobre R] até que R[ tenha ocorrido um certo número de vezes (jem reforçamento) napresença de SD. Se SD aparece infrequentemente, Ri tem apenas oportunidadesinfrequentes para enfraquecer.

Numa variante deste método, empregada por D. W. Zimmerman (1957,1959), ratos famintos foram treinados a correr numa pista, obtendo alimento na caixa-objetivo, no final. Uma tentativa na pista iniciava-se quando o rato era colocado na caixa de partida. Uma campainha soava brevemente, a porta da pista se levantava e o rato podia correr até a caixa-objetivo. O tempo de reação (RT) entre o som da campainha e a resposta de entrar na caixa-objetivo foi medido. Até aqui este procedimento consiste de

S"DR , -------> S +

onde SD = som da campainha na raixa de partida e porta aberta R i = correr para a caixa objetivo S+ - alimento

Quando o RT havia se tornado assintoticamente pequeno (depois de cerca de 30 tentativas), o alimento era omitido em algumas tentativas. Isto é, o operante discriminativo de correr foi colocado num esquema probabilístico de reforçamento:

S”R, > S '

Nas 60 tentativas seguintes, essa probabilidade foi gradualmente diminuída de 0,5 para cerca de 0,2. Isto é, no final de 90 tentativas do treino de correr, somente cerca de 1 corrida em 5 terminava com alimento. Nas outras quatro corridas, o rato encontrava a caixa-objetivo vazia. Mesmo assim, o RT de correr à campainha permaneceu curto; a campainha e a abertura da porta continuaram a agir como um S& para uma resposta vigorosa e veloz na pista. A situação neste ponto é reminiscente do nosso próprio comportamento ao atender ao telefone. Embora somente poucas das chamadas possam ser realmente dirigidas a nós, o comportamento de atender permanece (como o comportamento de correr dos ratos de Zimmerman) com alta força.

Seguindo essas 90 tentativas do treino de correr, o alimento foi permanentemente removido e instalou-se uma barra na caixa de partida. Uma tentativa iniciava-se com o rato sendo colocado na caixa de partida como de costume, mas agora a campainha e a abertura da porta tornaram-se contingentes unicamente à pressão à barra. Usando o S^ campainha-abertura da porta como o único reforçamento, Zimmerman modelou progressivamente um operante FR de 15 pressões à barra em três sessões de 90 min. Durante as 11 sessões seguintes, a resposta FR 15 foi mantida completamente pelo S^

- 231

contingente, enquanto, em cada tentativa, o comportamento de correr subsequente foi lentamente enfraquecido em virtude de sua extinção. Este estágio é representado como

R

2

S”R.

[ 11.2]

onde SD= som da campainha na caixa de partida e porta aberta SA = ausência do som na caixa de partida, porta fechada R\ = correr para a caixa-objetivo t^2~ 15 pressões à barra

Exceto pelas diferenças em elementos específicos, os procedimentos de [11.2J e [11.11 são idênticos. Mesmo assim, antes que o poder de reforçador condicionado fosse esgotado, os ratos de Zimmerman tinham emitido milhares de pressões à barra e continuaram trabalhando por 20 horas espaçadas em várias sessões. Curvas cumulativas da pressão à barra na caixa de partida nas sessões 1 , 5, 11 e 14 são vistas na Fig. 11-2. A forma dessas curvas indica claramente que o uso do S^, no procedimento de Zimmerman, atuou de maneira semelhante ao reforçamento primário, gerando e mantendo os efeitos característicos de uma especificação FR de resposta. Pausas, seguidas de taxas altas de pressão à barra, são vistas. A medida que a extinção continua, as pausas se tornam mais longas. Mesmo assim, quando o organismo responde, todo o operante FR é tipicamente efetuado nipida e suavemente.

Figura 11-2. Pressão à barra em FR- 15 baseada apenas em reforçamento condicionado Os traços oblíquos representam a campainha e a porta aberta. O registrador corria apenas enquanto o animal estava na caixa de partida, antes de produzir o SD (Zimmerman, "» 959).

Os desempenhos apresentados pelos ratos de Ziinmerman devem ser contrastados com o comportamento dos ratos de Skinner (Fig. 11-1), que emitiram apenas cerca de 50 pressões para o S D e, ao fim de 45 min, pararam de responder. A diferença em potência entre os reforçadores condicionados, nos dois casos, pode ser atribuída à dupla intermitência usada por Zimmerman no treino e teste. (1) A conexão probabilística entre o operante discriminativo (R j) e seu reforçamento primário (alimento) no treinamento de correr efetuado por Zimmerman, aumentou bastante a resistência à extinção da resposta de correr ao S^ (campainha-porta aberta). Assim, o S^ por si só, permaneceu no controle do comportamento por um período de tempo maior que em [ 1 1 .1 ] e reteve, portanto, seu poder de reforçador condicionado por mais tempo. Os resultados de Zimmerman implicam em que Skinner poderia ter obtido mais pressões à barra se tivesse reforçado probabilisticamente a aproximação ao comedouro quando do clique-luz. (2) Pela incorporação de pressões individuais à barra num operante de ordem superior constituído de 15 elementos, o total da produção comportamental, medido pelo número de elementos de pressão à barra emitidos, foi grandemente aumentado (Weissman e Crossman, 1966). Ao mesmo tempo, a infreqüência de ocorrência do S^ conservou sua função discriminativa no controle do correr. .

Os resultados de Zimmerman sugerem que, enquanto o reforçador condicionado permanece potente, os efeitos de torná-lo contingente a uma resposta parecem indistintos dos efeitos de tornar um reforçador primário contingente à resposta. Os resultados de outros experimentos confirmam tal conclusão. Kelleher (1961) tornou o clique de um comedouro um S^ para o comportamento de aproximação ao comedouro, em pombos. Quando apenas o clique foi usado como um reforçador para o bicar a chave em esquemas FI e especificações FR e drl os animais apresentaram padrões de resposta típicos daqueles procedimentos com reforçamento primário.

11.3 RECOMPENSAS “TOKEN”

A operação de um tipo de reforçamento condicionado, tipicamente humano, é demonstrada em estudos em que fichas de pôquer (“tokens”) foram usadas para reforçar primatas (Wolfe, 1936; Cowles, 1937). As fichas tomaram-se S^s para várias respostas manipulativas, incluindo o ato de inserí-las na máquina de vender para receber uvas, laranjas, amendoins e outros reforçadores primários. Foi esta história de associação com reforçamento primário que transformou as fichas em “ tokens” (dinheiro) com o poder de reforçar.

Em alguns dos experimentos de Wolfe (1936), chimpanzés foram treinados a inserir uma ficha branca numa máquina e obter, assim, uma uva. A resposta de inserção foi modelada através de aproximação sucessiva. Um “token” foi inserido parcialmente na máquina pelo experimentador e qualquer empurrão, no nível operante, dado pelo chimpanzé, fazia com que o “token” acabasse de cair, aparecendo como resultado uma uva. O procedimento de modelagem continuou até que os animais pegassem fichas brancas no chão e as inserissem na máquina de vender uva.

Sc SBR2 -----> Ri ----- - S '

- 233 -

onde Sg= ficha branca na mão.Sç = ficha branca no chão

- uvaRl = inserir ficha na máquinaR2 = apanhar a ficha.

Os animais foram, posteriormente, ensinados a puxar uma barra pesada para obter fichas, uma tarefa que aprenderam facilmente.

Sq [S-c Kl -----> 1^2 -----►

onde So = nenhuma ficha presente R3 = puxar uma barra.

Posteriormente, foi estabelecida uma discriminação adicional entre fichas de metal que nada valiam — isto é, não operavam a máquina de vender, se nela inseridas — e fichas brancas. Uma breve história com este conjunto de contingências foi suficiente para tomar os animais indiferentes às fichas de metal.

Em outros experimentos (Cowles, 1937) com um aparelho análogo à plataforma de saltar de Lashley, na Fig. 10-3, os animais aprenderam discriminações de padrões especiais onde o único reforçamento consistia de ^tokens'.’Nos experimentos de Cowles, a resposta era simplesmente a de empurrar para o lado o cartão contendo o padrão correto. As máquinas de vender ficavam em outra sala, onde, depois que a discriminação havia sido aprendida (Io — > 1 ,0), as fichas acumuladas podiam ser trocadas.

Nesses vários experimentos, os chimpanzés adquiriram novos comportamentos quando o único reforçamento imediato eram as fichas. As fichas são distintas de qualquer outro reforçador secundário apenas por suas propriedades físicas, que as tornam manipuláveis, estocáveis, etc. Naturalmente, um “token” não é apenas o S^ para uma resposta de inserção; ele também fornece os verdadeiros meios físicos através dos quais tal resposta manipulativa pode ser emitida. Uma ficha implica tanto em reforçamento para inserir como torna possível a inserção. Contudo, os “tokens”, tal como campainhas e cliques, tornam-se S^s simplesmente porque uma certa resposta é reforçada em sua presença.

11.4 REFORÇADORES GENERALIZADOS

Muitos estímulos discriminativos positivos estabelecem a ocasião para mais de um único tipo de resposta ser emitido e reforçado. Alguns S^s, de fato, controlam numerosas respostas, cada uma das quais pode levar a um reforçador primário diferente. Fora do laboratório, tais situações são encontradas frequentemente. O dinheiro é um exemplo excelente. Tendo dinheiro, muitas respostas podem ser emitidas, cada uma levando a seu reforçador próprio e distinto.

S(dinheiro)^(comprar bilhetes de teatro)R(comprar um casaco novo)R(pedir uma refeição)

St +S2+ [11.3]S3 +

S BRj -----> S +

- 234

“Atenção” é, algumas vezes, usado como um nome para um tipo semelhante de S^. De modo a obter reforçamento para várias respostas verbais, é <juase sempre necessário que uma pessoa obtenha a “ atenção” de uma outra. Quando o Su atenção é conseguido, muitas respostas (pedidos, ordens, etc.) podem, então, ser emitidas com a chance de serem reforçadas. Na ausência de “atenção” , poderíamos dizer que tais pedidos não são ouvidos ou notados, o que é equivalente a dizer que eles estão sendo submetidos à extinção.

Estímulos disc rim in ativos que podem estabelecer a ocasião para mais de uma seqüência resposta-reforçamento estão baseados numa história de associação com mais de um reforçador primário. No diagrama [ 11.3| por exemplo, o dinheiro foi previamente associado, através de treinamento - SA+, a entretenimento,calor, alimento, etc. Estímu

los discriminativos associados desta maneira a mais de um reforçador primário e cuja disponibilidade se torna, então, contingente a um novo comportamento, são chamados reforçadores generalizados. Embora eles pareçam ter um importante papel na mediação do comportamento humano complexo, tais reforçadores generalizados não têm sido estudados extensivamente no laboratório.

EXERCÍCIO 8

Descreva um método para criar um reforçador generalizado para chimpanzés. Use, como reforçadores primários, alimento, água, remoção da situação experimental. Empregue um operante discriminativo diferente para cada reforçador primário. Use “ tokens” como SD generalizado. Uma vez que o animal possua o " token” , o que determinará o operante discrim inativo que ele emitirá?

11.5 RESPOSTAS DE OBSERVAÇÃO

Diz-se, às vezes que os estímulos discriminativos têm a propriedade de conduzir informação a respeito do estado das contingências ambientais efetivas numa dada ocasião. Assim, quando o pressionar a barra por um rato é reforçado somente na presença de uma luz, pode-se dizer que a luz fornece informação de que uma certa contingência de reforçamento esta em efeito. Similarmente,quando a sirene para de tocar conduz informa ção de que os aviões de bombardeio inimigos se retiram e é seguro sair. Reforçadores “ tokens” também conduzem informações mas aqui a função informativa está obscurecida pelas propriedades físicas d o s “ tokens” que lorn am possível a resposta real. Quando a fechadura automática da porta de um apartamento soa depois que você toca a campainha, você é informado de que pode abrir a porta e de que, quando o fizer, encontrará alguém em casa.

Um tipo diferente de informação é fornecido por sinais indicativos de “não funciona” e “saiu para o almoço” , luz vermelha do tráfego e sinais de ocupado. Estes são anúncios de que certos comportamentos não serão reforçados; como tal eles constituem S^s para esses comportamentos. Pode a informação sobre reforçamento fornecida pelos S^s e SA s desses exemplos ser encarada como reforçadora em si mesma? Pode-se fornecer uma resposta melhor fazendo-se referências a experimentos.

No procedimento de discriminação de Herrick, Myers e Korotkin (1959) da seção10.1 os ratos aprenderam a discriminar entre períodos de luz e escuro alternados aleatoriamente. As contingências eram reforçamento em VI durante S^ (luz) e extinção duran

- 235 -

te S A (escuro). Imagine que, em vez de se fornecer automaticamente, uma luz brilhante como SD e o escuro como SA 9 outro grupo de animais fosse treinado numa condição intermediária de iluminação fraca, que não mudasse quando cada período de V I se iniciava e terminava, nem quando cada período de extinção se iniciava e terminava. Em linguagem vernacular, diríamos que esses animais não teriam meios de dizer se estariam em VI ou em extinção. Se o período de extinção não fôr muito prolongado, ratos treinados nessas condições ajustar-se-ão, produzindo uma taxa constante de respostas tanto em VI como em extinção.

Suponha que, depois de tal estabilização, uma nova contingência seja introduzida pela primeira vez. Se agora o rato puxasse um cordão localizado em seu compartimento, a luz fraca seria imediatamente substituída pelo escuro (SA ) ou pela luz clara (S^), dependendo da contingência que estivesse em efeito naquele momento. O que fizemos foi dar ao organismo a opção de produzir estímulos discriminativos. O resultado comportamental de tal opção é claro. A contingência age rapidamente para condicionar a resposta de puxar a corda (Wyckoff, 1952).

Quando uma resposta permite a um organismo observar uma situação correlacionada com o estado de suas contingências de reforçamento, referimo-nos a ela com uma resposta de observação. Ao observar meramente um aspecto do seu ambiente correlacionado com certas contingências de reforçamento, o animal não modifica qualquer delas, mas tem agora a oportunidade de evitar respostas não reforçadas.

As respostas de observação estão entre as mais comuns das nossas atividades diárias. Para discriminar uma nota genuína de uma falsa, certas respostas de observação muito detalhadas são necessárias. Uma grande parte do treinamento de peritos em notas falsas e impressões digitais envolve o fortalecimento de respostas de observação que usualmente permanecem incondicionadas no leigo. O perito deve aprender quais aspectosde uma situação deve estudar de modo a poder distinguir entre estímulos diferentes que possam estar presentes do seu ambiente puxando um cordão que produz S ^ ou S A s o perito em notas falsas pode checar a impressão significante numa nota bancária que a identificará como genuína ou falsa. Em ambos os casos, a resposta de observação, puxar o cordão ou examinar a impressão, permite ao organismo fazer uma discriminação que aumenta a probabilidade de ele ser reforçado.

A habilidade do perito em fazer discriminações, seja entrevinhos, impressões digitais ou pinturas, é frequentemente vista com algum espanto pelo novato. Para este último, dois casos seguramente discriminados pelo perito parecem, soam ou têm sabor de “semelhante”. O comportamento de observação no iniciante não foi fortalecido, não lhe permitindo “ saber onde procurar as diferenças’ . Ao fortalecer o comportamento de observação em humanos, p o d e m o s muitas vezes “ apontar” , com êxito, as diferenças nas situações. Ao apontar os aspectos da situação de que dependem as diferenças entre e SA . aproveitamo-nos de uma história passada em que o reforçamento foi previamente contingente ao olhar na direção em que o dedo aponta.

Contingências análogas modelam respostas de escutar, bem como o comportamento de observação em outras modalidades sensoriais. Em geral, uma característica importante de uma resposta de observação ó que ela aumenta a probabilidade de reforçamento para o comportamento. Isto certamente c verdadeiro para o rato que tem a opção de produzir seus S^s e s. Se a discriminação do animal é boa, apresentações de S^ e SA irão, pelo menos, permitir que a resposta seja limitada a SD. Isto tem o efeito de aumentar a probabilidade geral de reforçamento para a resposta, bem acima do que aconteceria se S^

e S - distintos não estivessem disponíveis. No basebol, o batedor que observa um movimento rnínimo mas característico do lançador prestes a lançar uma bola que descreverá uma trajetória ci^va tem uma chance meihor de rebatê-la do que teria sem tal S^. Frequentemente, os S^s e s produzidos pelo comportamento de observação são cruciais para a ocorrência de qualquer reforçamento. Tente enfiar uma linha na agulha com os olhos vendados, ou responder a uma questão de prova sem tê-la lido antes. Em ambos os exemplos, a probabüidade de reforçamento é tão pequena que pode ser efetivamente zero na ausência de um comportamento de observação apropriado.

O comportamento de observação é frequentemente encoberto, tal como quando um homem se senta silenciosamente na presença de um rádio. Ele está ouvindo ou não? Isto é, ele está observando ou não? Em geral, a resposta a esta questão pode ser obtida apenas pelo estabelecimento de contingências de reforçamento onde a probabilidade de que o indivíduo emita certas palavras seria insignificantemente pequena na ausência de um comportamento de observação anterior. Se perguntarmos o que foi dito no rádio, a resposta de repetir o que foi dito de fato é tida como evidência prima facie de que o comportamento de observação deve ter ocorrido.

EXERCÍCIO 9

Faça a anotação das contingências que predominam quando um organismo tem a opção de produzir e S ^ , como está descrito no início desta seção. Para tômar o exercício mais simples, suponha que um esquema de probabilidade uniforme seja alternado com extinção.

11.6 AS CONDIÇÕES NECESSÁRIAS E SUFICIENTES PARA SE CRIAR REFORÇADORES CONDICIONADOS

O conteúdo das seções 11.1 — 11.5 implica em que uma condição suficiente para tornar um estímulo um reforçador condicionado é fazê-lo um S^ através do procedimento de discriminação. Existe pouca evidência de que tornar um estímulo um SD seja uma condição necessária e suficiente para torná-lo um reforçador condicionado. (Myers, 1959; Kelleher e Gollub, 1962). Em várias ocasiões, observamos, que, à medida que um estímulo perde sua função de SD? ele perde também sua potência como reforçador condicionado. Dinsmoor (1950) mostrou que a resistência à extinção de um operante discriminative) era a mesma se o operante fosse extinto na presença de seu SD, ou extinto com o SDcontingente a ele. Outro experimento (Notterman, 1951) mostrou que, quanto menor o treino discriminativo que o sujeito receba, menor o valor reforçador que o SD adquiria.' Essas observações sugerem que as funções discriminativas e reforçadoras de um SD são estreitamente ligadas, se não diretamente paralelas.

Schoenfeld, Antonitis e Bersh (1950) mostraram que a simples associação de um evento ambiental como um reforçador primário, por si só, é insuficiente para tomar o evento um reforçador condicionado. Ratos foram treinados a se aproximarem de seus comedouros recebendo uma pelota de alimento. Após o rato ter pegado a pelota e já estar comendo-a, urna luz breve (1 seg) era apresentada. Cem associações luz-comida não conferiu qualquer valor reforçador potencial à luz porque, em testes subsequentes, o animal não pressionava a barra para produzir apenas a luz.

Indícios sobre as associações necessárias e suficientes para produzir reforçadores

237

S,

s tR-*-S+

s,s,

R-*-S*

Convencional

__ D____ 0-SI inefetivo

In te rm iten te

__D____Q.

ü

n n n n n n1 1 1 .... i i i

nSd red u n d a n te

n n ..n n n1 1 ... 1. .

Figura 11-3. Aíguns arranjos de emparelhamentos possíveis de estímulos neutros com reforçamento.

adquiridos foram fornecidos por Egger e Miller (1962, 1963). A representação esquemática, na Fig. 11-3, de três eventos ambientais, S \, S2 e S+, será conveniente para compreender seus resultados. Suponha que o S+ possua o poder de reforçar o comportamento, enquanto S] e S2 não têm originalmente esse poder. Suponha também que a emisão de uma dada R seja necessária para produzir S+. Algumas das associações na Fig. 11-3 correspondem de perto a algumas das relações temporais do condicionamento Pavloviano, descritos na Fig. 3-5. Logo, esperar-se-ia que elas resultassem no condicionamento clássico de alguns respondentes, ao lado de qualquer valor reforçador adquirido que elas emprestassem a S\ ou S2 .

O caso da parte superior esquerda da Fig. 11-3 representa o paradigma convencional para criar reforçadores condicionados. Cada apresentação de S 1 , se sucedida imediatamente de R, é seguida de S+. Quando Si não está presente, as respostas não são reforçadas. Este é o caso do exemplo do clique-luz da seção 11-1 e dos tokens e, em geral, neste caso Si é submetido a uma história de discriminação com relação a R.

No caso da parte inferior esquerda, S+ vem depois de alguns S^s, mas não de todos. Para que as respostas sejam reforçadoras, todavia, elas devem ocorrer depois de S \. Este é o caso intermitente de Zimmerman e também estabelece S\ tanto como um S^ quanto como um reforçador condicionado.

Em cima, à direita, uma contingência de reforçamento pode ocorrer depois de S j, mas também em certas outras ocasiões. Se S+ ocorre com a freqüência de 50 por cento ou mais das vezes sem Sj, este caso pão confere poder reforçador a Si (Melching, 1954). Sj não se torna um SD presumivelmente porque algumas respostas são reforçadas na sua ausência - uma violação do paradigma de discriminação. Note, todavia, que S2 toma-se um reforçador condicionado porque contém a mesma relação a R— >S+ que Si no caso convencional da parte superior esquerda.

Q

I 1

- 2 3 8 -

No caso inferior, à direita, os dois eventos neutros são apresentados quase ao mesmo tempo (separados de poucos segundos), depois do que uma resposta pode produzir reforçamento primário;este caso conferirá valor reforçador condicionado a S j,m as não a S2 (Eggere Miller, 1962, 1963). Parece que S2 é redundante, não fornecendo qualquer informação nova sobre a ocorrência da contingência de reforçamento. Este resultado explicaria o insucesso de Schoenfeld, Antonitis e Bersh em tomar a luz um reforçador condicionado. Em seu experimento, a luz era S2 ,já tendo sido precedida de S], a visão da pelota ou a pelota na boca, etc.

Uma análise geral dos quatro casos da Fig. 11-3 indica dois fatos relevantes. (1) Existem vários paradigmas para estabelecimento de S^s e todos os S^s assim estabelecidos também adquirem o poder de reforçador condicionado. (2) Somente quando um estímulí é informativo (isto é, correlacionado não redundantemente com uma contingência de reforçamento) é que ele se torna um S^ ou um reforçador condicionado. Os argumentos discutidos nesta seção devem ser tomados provisoriamente, porque sua generalidade depende da confirmação de paradigmas temporais, respostas e reforçadores primários adicionais.

11.7 O REFORÇAMENTO SECUNDÁRIO NO COMPORTAMENTO SOCIAL

Um estímulo que controla o comportamento com um SD ou reforçador condicionado não precisa originar-sc apenas do ambiente inanimado. Outros organismos (ou, os estímulos que se originam deles) podem agir desse modo também, e aí está um fato de grande significância para o homem, bem como para outra vida biológica. O comportamento social pode ser descrito como o comportamento para o qual os estímulos reforçadores ou discrimínativos, são, ou foram, mediados pelo comportamento de outro organismo. Por “mediado” queremos dizer ‘que surge de, ou em conexão com’ e não há qualquer intenção de forçar a conotação da palavra. Não poderíamos nem (1) incluir como social a liberação de uma pelota pelo experimentador, ao rato que pressiona a barra

pode ser uma situação social para o experimentador, mas não para o rato. nem (2) excluir como não-social o comportamento do náufrago que fala para si mesmo ou faz roupas de peles, já que ambas as atividades foram adquiridas socialmente.

A partir do nascimento, os estímulos sociais atuam em grande parte da vida dos seres humanos. Muitos cientistas, realmente, pensaram que a própria sociedade tem sua origem na dependência extrema e prolongada da criança. Seja como for, os pais, especialmente a mãe, estão entre os primeiros reforçadores secundários do tipo social que aparecem no círculo visual da criança. Sua potência disc rim in ativa e reforçadora é rapidamente estabelecida pela associação contínua com alimento, calor, alívio da dor, etc. Se, todavia, a criança é criada por uma enfermeira, então ela se torna o reforçador secundário sempre presente e comumente se vê que a ligação com a Enfermeira substitui a com a mãe. Os psiquiatras salientam que, na adolescência e antes, os primeiros objetos sexualmente interessantes podem ser os pais, irmãos ou irmãs. Dentro do ambiente social relativamente restrito da criança, os poucos organismos que servem como estímulos acompanhadores, quando o reforçamento é liberado ou retirado, podem adquirir um controle amplo e vitalício sobre seu comportamento. Com o aumento da idade, a criança amplia suas excursões além do lar, aumentando a faixa de reforçadores secundários que controlam suas reações. Escola, amigos, clubes e atividades relacionadas de todos os tipos levam-na aos estímulos que são os sinais e acompanhamentos, sempre presentes, do

- 139 -

reforçamento final, os S^s e os[reforçadores condicionados]que são a trama e urdidura de sua vida na sociedade (Keller e Schoenfeld, 1950, pp. 257-258).

Um rato ensinado a imitar outro rato está demonstrando uma habilidade, social rudimentar e mostrando a ação de um reforçador social. Miller e Dollard (1941) treinaram ratos famintos a atravessar uma pista elevada em T, vista na Fig. 11-4. Alguns ratos

Figura 11-4. Uma pista elevada, em T, para estudai a imitação no rato (segundo Miller e Dollard, 1941).

foram treinados a correr para um cartão branco ou preto. A posição dos cartões era distribuída aleatoriamente em tentativas sucessivas. Outros ratos foram treinados simplesmente a correr consistentemente para a direita ou para a esquerda. Quando o rato executava uma corrida correta, ele encontrava alimento num recipiente colocado na base do cartão. Esses ratos eram chamados de “líderes” eram treinados até que corressem 20 vezes consecutivas corretamente.

Um segundo grupo de ratos foi treinado para seguir os líderes. Em qualquer tentativa em que seguiam os ratos líderes, os “seguidores” encontravam alimento descoberto num pequeno recipiente no meio do caminho da pista. Em qualquer tentativa em que não

- 240 -

seguiam os líderes, eles eram retirados da pista por um pequeno período e mais tarde fazia-se nova tentativa.

As contingências foram efetivas na produção de seguidores. Notou-se que os ratos imitavam os líderes quando estes viravam na presença ou ausência de cartões brancos ou pretos, que imitavam os líderes que haviam sido treinados a ir para a direita ou para a esquerda e que imitavam indiscriminadamente ratos brancos e cinzentos.

A relação social entre um aluno e um professor é, provavelmente, várias ordens de magnitude mais complexa do que qualquer habilidade social isolada como a imitação, mas os rudimentos de tal relação prestam-se à análise experimental. Do ponto de vista do reforçamento social, podemos considerar que o comportamento do professor é reforçado pelas mudanças no comportamento do aluno. O aluno deve ser quase sempre reforçado diretamente, ou pela promessa de alcançar certas habilidades úteis ou por ameaça de punição.

As contingências envolvidas na situação educacional comum são complexas e raramente formalizadas de um modo consistente. Mas a idéia fundamental - um organismo fortalecendo ou participando do comportamento de outro organismo pode ser demonstrada com pombos, de uma maneira que expõe o processo crítico envolvido.

Na Fig. 11-5, dois pombos estão separados um do outro por um plástico transparente. Antes da demonstração, ambos foram treinados a comer nos seus respectivos alimentadores. Além disso, o “professor” foi treinado a bicar o disco plástico em reforçamento internitente com alimento. A demonstração começa com os animais colocados juntos pehi primeira vez. Cada vez que o professor bica o disco, é liberado alimento para o “ aluno” . O professor é reforçado por bicar somente quando o aluno está de pé, em frente ao canto esquerdo. Consoante com sua história, o professor começa a bicar rápida e indiscriminadamente com relação á posição do aluno. Portanto, no início, poucas bicadas do professor são reforçadas. Gradualmente, todavia, á medida que a demonstração prossegue, mais e mais vezes que o professor bica o disco, ambos os animais são alimentados. O comportamento de ambos vai sofrendo modificação pela interação social. Logo, um desempenho quase cômico evolui. O professor fica olhando para o aluno como se esperando que ele se mova até o canto esquerdo. Enquanto isso, o aluno imita suas atividades a uma ida repetitiva do alimentador para o canto esquerdo. Tão logo o aluno esteja parado de forma adequada. O professor bica, ambos coiYiem, e o padrão é repetido.

Pode-se dizer que o professor manifesta um tipo de discriminação social primitiva. Seu comportamento é reforçado somente quando o aluno está desempenhando um certo ato — ficar de pé no canto esquerdo. É este ato por parte do aluno que fornece o S^ para o professor bicar o disco.

Como tal esta situação precisa também funcionar como um leforçador condicionado para o professor. Se o professor procura obter alimento, ele deve encontrar um modo de tomar essa situação possível, pois, inicialmente, o aluno raramente irá ficar no lugar favorável. Uma interação social sutil está presente: qualquer bicada que o professor dê quando o aluno está em outro lugar resulta em alimento apenas para o aluno. 0 b ;car indiscriminado, então, provavelmente fortalecerá comportamentos do aluno outros que não o ir para o canto esquerdo. “ Esperar” que o aluno vá para o canto esquerdo fica sendo o único comportamento que o professor tem disponível para dirigir as respostas do seu aluno. O pombo professor é rápido em descobrir o valor da paciência.

241 -

(Herrnstein, 1964).

As demonstrações simples desta seção ilustram a continuidade existente entre o comportamento social e não-social. Nenhum princípio novo é necessário para explicar os resultados das contingências de imitação, ou os resultados da interação dos pombos professor-aluno. O comportamento imitativo de correr dos ratos seguidores é indistinguível pela topografia, precisão ou complexidade, de qualquer outro operante de correr sob controle discriminativo. Do mesmo modo, os comportamentos adquiridos pelos nombos professor e aluno são apenas os operantes familiares que tratamos em detalhes no texto. As sutilezas do comportamento socialencontram-se,em grande partenascontin- gências controladoras que surgem de uma fonte complexa de estimulação proporcionada por um outro organismo.

REFERÊNCIAS PARA O CAPÍTULO 11Cowles, J. T. Food-tokcns as incentives for learning by chimpanzees.

Comp. psychol. Motiogr., 1937, 14, 1-96.Thnsmoor, J. A. A quantitative comparison of the discriminative and

reinforcing functions of a stimulus. J. exp. Psychol., 1950, 40, 458 -472 ."

Egger, M. D., and Miller, N. E. Secondary reinforcement in rats as a function of information value and reliability of the stimulus. J. exp. Psychol1962 ,64 ,97 -104 .

Egçcr, M. D , and Miller, N. E. When is a reward reinforcing? An experimental studv of the information hypothesis. J. comp, physiol. Psychol. , 1963, 56, 132-137.

- 242 -

Herrick, R. M., Myers, J. L., and Korotkin, A. L. Changes in Sl) and rates during the development of an operant discrimination. J. com;), physiol. Psychol., 1959, 52, 359-363.

Ilerrnstein, R. J. “Will.” Proc. Amer. Phil. Soc., 1964, 108, 455-458.Kclleher, R. Schedules of conditioned reinforcement during experimental

extinction. /. exp. Anal. Behav., 1961,4, 1-5.Kelleher, R., and Gollub, L. A review of positive conditioned reinforce

ment. J. exp. Anal. Behav., 1962, 5, 543-597.Keller, I7. S., and Schoenfeld, W. N. Principles of psychology, New York:

Applcton-Century-Crofts, 1950.Melching, W. H. The acquired reward value of an intermittently pre

sented neutral stimulus. J. comp, physiol. Psychol., 1954, 47, 370374.

Miller, N. E., and Dollard, J. Social learning and imitation. New Haven: Yale Univer. Press, 1941.

Myers, J. L. Secondary reinforcement: a review of recent experimentation. Psychol. Dull., 1958, 55, 284-301.

Notterman, J. M. A study of some relations among aperiodic reinforce ment, discrimination training, and secondary reinforcement. J . exp. Psychol., 1951,41, 161-169.

Schoenfeld, W. N., Antonitis, J. J., and Bersh, P. J. A preliminary study of training conditions necessary for secondary reinforcement. J. exp. Psychol1950 ,40 ,40 -45 . ”

Skinner, B. F. The behavior of organisms. New York: Appletón-Century, 1938.

Skinner, B. F. A case history in scientific method. Amer. Psychologist, 1956 ,11 ,221-233 .

Weissman, N. W., and Crossman, E. K. A comparison of two types of extinction following fixed-ratio training. J. exp. Anal. Behav., 1966, 9 ,4 1 -4 6 .

Wolfe, J. B. Effectiveness of token-rewards for chimpanzees. Comp. psychol. Monogr., 1936, 1 2 , 1-72.

WyckofT, L. B., Jr. The role of observing responses in discrimination learning: Part I. Psychol. Rev., 1952, 59, 431-442.

Zimmerman, D. W. Durable secondary reinforcement: method and theory. Psychol. Rev., 1957, 64, 373-383.

Zimmerman, D. W. Sustained performance in rats based on secondary reinforcement. J. comp. physiol. Psychol., 1959, 52, 353-358.

- 243 -

Capítulo 12 ENCADEAMENTO

Na seção 11.1 vimos como, através do uso de recompensas tokens atuando como reforçadores adquiridos, seqüências ou cadeias simples de comportamento podiam ser criadas. A mais simples dessas cadeias foi construída a partir de (1) uma resposta nova, não fortalecida previamente; (2) um previamente estabelecido; e (3) o operante controlado por este SP. Em geral, cadeias de qualquer tamanho desejado podem ser formadas pela inclusão indefinida de um número sempre maior de elementos.

12.1 OS ELEMENTOS DE CADEIAS COMPORTAMENTAIS

Uma cadeia de comportamento operante é suscintamente descrita como uma seqüência de respostas operantes e estímulos discriminativos tal que cada R produz o SD para a próxima R. As Rs suscessivas numa cadeia são os seus membros; os S^s sucessivos são os elos. Nas cadeias mais simples, o número de membros e o número de elos são idênticos. O elo de comportamento que envolve o pressionar a barra e o aproximar-se do comedouro, nosso protótipo de fortalecimento operante, constitui uma cadeia repetitiva simples desse tipo. O comportamento do rato é estabelecido pelo procedimento

onde S3 = alimento ausenteS2 = clique-luz S+ = alimento R3 = pressão à barra R2 = aproximar-se do comedouro R | = comer

- 2 4 5 -

O elo de [1 2 . 1 | é um caso especial de uma cadeia comportamental, aquele em que a cadeia é repetida indefinidamente. Um eb pode ser considerado uma cadeia que está “fechada” por permitir que a “última” resposta produza o SD para a “primeira” . Por exemplo, no elo de [ 1 2 .1 ] comer é a última resposta e produz o S^ 5 ausência de alimento, para a primeira resposta, pressionar a barra.

O elo de [ 1 2 .1 ) é representado como sendo composto de três membros da resposta. Por isto, é convencionalmente descrito como uma cadeia de três membros. Mas o número real de membros usados para representar uma cadeia comportamental é arbitrário, sendo ditado principalmente pela conveniência descritiva. Ao discutir o comportamento observado e reforçado, três membros servem adequadamente para ilustrar a natureza encadeada do ato. Ao mesmo tempo, três membros não são muitos para nos assustarem com uma quantidade de detalhes. Ainda, para outros objetivos, podemos desejar representar o ato como se formado por mais membros. Por exemplo, para esclarecer tambe'm a topografia, do ato, poderíamos duplicar o número de membros considerados e expandir r 1 2 .1] para

[ 12.2]

onde Só = alimento ausenteS5 “ barraS4 ~ clique-luz, barra pressionadaS3 = clique-luz, barra soltaS2 - no comedouroS+ = alimento nas patasRè = levantar-se à altura da barraR5 = pressionar a barrar 4- soltar a barraK3 ~ introduzir-se no comedouroR2 = apanhar o alimentoRj = colocar na boca.

0 diagrama [ 12.2 j representa o mesmo comportamento e o mesmo conjunto de contingências que [ 12.11, mas 0 poder de ampliação foi dobrado em [12.2 | Levando-se em conta ainda detalhes topográficos mais sutis e mudanças de estímulo mínimas, a resolução poderia ser facilmente mais ampliada. Em geral, a composição de uma cadeia de comportamento pode ser representada como um número indefinido de operantes. O número não infinito porque, na subdivisão conceituai sucessiva, será inevitavelmente alcançado um ponto onde a especificação de duas classes topográficas adjacentes será tão sem elhante que não se poderá observar que as duas classes funcionam independentemente uma da outra. Isto é, seus membros se sobreporão completamente

- 246 -

nau será possível colocar o animal sob quaisquer condições para diferenciá-los. Neste ponto, teremos alcançado um limite lógico para a resolução da resposta. Na maior, parte, o comportamento é subdivido a um nível em que serve melhor para objetivos ilustrativos de procedimentos. A pressão à barra e a aproximação ao come douro são facilmente observadas, medidas e reforçadas sem qualquer instrumentação especial. Em última análise, estas são as considerações que justificam seu status como unidades conceitualmente discretas.

Uma cadeia tanto pode ser reduzida quanto ampliada. Em princípio, poderíamos também escrever[ 1 2 . l|como

^ (pressão à barra, ir para comedouro) ------» S + [1 2 3]S (alimento ausente)

Os critérios para definir uma classe de resposta são que a classe seja especificável como em 112.3] e que possa ser fortalecida ou mantida, como uma classe, pelo reforçamento. A questão de se a R especificada em[ 12.3)é reforçável é uma questão experimental. Sua solução dependerá de muitos fatores, tais como o peso e altura da barra, sua distância espacial até o comedouro, a nitidez de quaisquer deixas intermediárias usadas para sinalizar a liberação de alimento, as diferenças individuais entre os ratos, e assim por dainte. Naturalmente, se esta R já foi sucessivamente aproximada e fortalecida, 112.3] é uma maneira perfeitamente plausível de abreviar as contingências que irão subsequentemente, manter este comportamento. Infelizmente, todavia, o diagrama [ 12.3] representa as contingências de reforçamento frequentemente usadas quando o experimentador tem pouco tempo para se dedicar a uma modelagem real da resposta. O procedimeto de 1 1 2 .3 ] resulta do “colocar o rato na caixa e esperar que o condicionamento ocorra a seu próprio modo” . A criança que vai à escola de quem se espera que aprenda meramente vendo e ouvindo, ou o universitário que recebe um livro e a ordem para aprender o capítulo 12, são todos vítimas freqüentes de contingências como em [ 12.31 . O resultado é o mesmo tanto para ratos como para humanos — alguns indivíduos adquirem o comportamento desejado, outros não. Podemos praticamente dizer, com referência a [12.3) quando comparado com um arranjo mais deliberado de contingências, que o organismo aprende apesar da conexão não consistente entre os comportamentos requeridos e o reforçamento fornecido.

12.2 O DESENVOLVIMENTO DE UMA CADEIA COMPLEXA

Os princípios com port am ent ais significantes usados no estabelecimento de cadeias são ( 1) aproximação sucessiva de cada membro, (2 ) colocar cada membro sob controle discriminativo, e (3) uso de estímulos com o duplo papel de deixa discriminai iva e reforçador condicionado, para ligar cada membro ao próximo. Várias proliferações desses princípios podem produzir cadeias de complexidade e tamanho surpreendentes, mesmo no rato. O comportamento que pode ser adquirido, frequentemente surpreende o leigo, embora os princípios sejam simplesmente aqueles que operam na aquisição do pressionai a barra ou bicar o disco. Em geral, uma complexidade grande no comportamento não resulta de qualquer complexidade na topografia da resposta, nem mesmo das discriminações requeridas, mas das maneiras complexas em que as várias contingências podem ser permutadas.

- 247 -

Considere como um rato faminto pode ser treinado a pegar uma bola de gude na mão do experimentador, depositá-la num buraco localizado a alguma distância, depois puxar um trapézio em miniatura dependurado em sua caixa e, finalmente, pressionar uma barra (ver Fig. 12-1). É útil delinear cinco classes de respostas,

R5 = pegar a bola de gudeR4 = carregar a bola de gude e segurá-la acima do buraco.R3 = deixar cair a bolaR2 = puxar o trapézioRl = pressionara barra,

e notar que podemos desejar as Rs encadeadas na ordem R5 , R4 , R3 , R2 , Rl- As situações de estímulo necessárias são mais convenientemente apresentadas no texto. As seguintes sugestões serão úteis.

1. Fortalecer primeiro os membros que ocorrem mais próximos do reforçamento primário; isto é, construir a cadeira de trás para frente.

2. Colocar cada operante sob controle de estímulo; isto é, tornar cada operante um operante disc rim in ativo antes de adicionar outro membro à cadeia.

3. Permitir que o para o operante que foi fortalecido aja como o reforçador da próxima resposta a ser adicionada. Deste modo, adicionar membros àcadcia um; de cada vez.

De acordo com a sugestão 1, R \ deve ser condicionada pelosmétodos usuais de fortalecimento operante (ver seção 4.2). Então, aplicando oprincípio 2 , deve-se converter Rj num operante discriminaiivo, reforçando-a na presença de uma situação (SD) e não na presença de uma segunda situação (S A ). Será útil, como veremos em seguida, escolher para S^ uma situação que tenha pelo menos duas dimensões de estímulo convenientemente manipuláveis. Uma pequena luz em combinação com uma campainha suave satisfará. Deixe a cigarra continuamente ligada e faça com que a ausência de luz sirva comoS A para R \. Quando a discriminação atingir um ponto onde a luz controla a pressão à barra disc rim in adam ente, as sugestões 3 e 1 podem ser usadas para fazer com que o puxar o trapézio (R2 ) produza a luz. O resultado deste procedimento será, naturalmente, o fortalecimento de R2 - Até o momento, a campainha soou continuamente, não importando o estado de iluminação. Mas, depois que R2 for fortalecida, a campainha pode ser ligada e desligada, permitindo-se que R2 seja efetiva na produção da luz somente quando a campainha estiver presente. Deste modo, o puxar o trapézio, R2 , logo ficará sob o controle disc rim inativo da campainha, embora permaneça sob o controle reforçador da luz.

A adição do restante dos membros resposta(R3 , R4 , R5) é feita de forma similar, embora uma certa quantidade de aproximação sucessiva seja necessária. Comece com a bola de gude colocada perto do buraco, sendo as condições de estímulo campainha e luz desligadas. As respostas progressivamente mais próximas da bola de gude são reforçadas imediatamente pela produção do som da campainha e a continuação subsequente da cadeia. Por aproximação sucessiva, as respostas de tocar a bola de gude, suspendê-la e deixá-la cair são estabelecidas, sendo todas reforçadas pelo som da campainha. O passo final é a adição de R5 . Isto é feito, levando-se a bola de gude, gradualmente, para mais

- 2 4 8 -

Figura 12-1. Um rato executando uma cadeia de comportamento (segundo Michael,1963).

longe do buraco e exigindo respostas de carregá-la com duração cada vez maior. Eventualmente, a cadeia estará completa. A bola de gude está na mão do experimentador; o rato, quando colocado na gaiola, vai até o experimentador, pega a bola de gude, carrega-a até o buraco e deixa-a cair. A campainha soa e, então, o rato puxa o trapézio. Acende-se a luz, o raio pressiona a barra, e o alimento é liberado. As contingências.são:

- 249 -

S5R.,

S4r 44

r ,3

S3 s2r 22

S|Ri -> S H

Onde S5 - bola de gude na mão de experimentador, campainha e luz desligadasS4 = bola de gude nas patas do rato, campainha e luz desligadasS3 = bola de gude sobre o buraco, campainha e luz desligadasS2 = nenhuma bola de gude, campainha ligada, luz desligadaSi = nenhuma bola de gude, campainha ligada, luz ligada S+ = alim ento .

5

Depois do treino, a cadeia completa será executada suavemente sem os solavan- :os que sugerem as unidades individuais que foram usadas no seu desenvolvimento. Dontudo, sem o fracionamento original do comportameento e nessas unidades menores, a seqüência completa nunca poderia ter sido desenvolvida.

Analisando as cadeias vocais humanas que constituem a linguagem falada, há uma tendência de se negligenciar a longa história passada que torna possível o desenrolar de longas sentenças, compostas do que, há muito tempo atrás, eram unidades em si mesmas: fonemas, sílabas, palavras e frases. A continuidade (fluência) aparente de um episódio de fala não nos deve distrair do fato de que a falaé um produto de uma história passada de encadeamento, ém princípio, não diferente desta do rato educado que acabamos de descrever.

Para amarrar o sapato, a criança se empenha numa cadeia, diferente apenas em detalhes daquela do rato. Cada operante individual, na cadeia de amarrar, serve para avançar o cordão para uma posição onde uma resposta ligeiramente diferente pode ser emitida e reforçada. O reforçamenío final é um nó seguro. No treinamento de uma criança para amarrar um sapato, operam os mesmos princípios que no treino de um rato para executar uma cadeia. O melhor seria iniciar a cadeia pelo fim, com o sapato todo amarrado menos o último aperto do laço. Quando esta resposta estiver fortalecida, o laço é desamarrado ligeiramente e qualquer resposta que produza o S ^ para o laço final será forçada. As respostas executadas inapropriadamente simplesmente irão afrouxar o laço e, então, serão extintas. Na prática, as crianças raramente são ensinadas da melhor maneira, mas sim, na forma de [ 1 2.3| Os pais são frequentemente desiludidos pela falta do que chamam de inteligência, quando uma criança não domina tarefas “simples” rapidamente. A deficiência não está na habilidade da criança em solucionar problemas, mas sim na «apreciação dos princípios de encadeamento pelos pais. Uma criança pode aprender como amarrar um sapato em questão de minutos, se estes princípios são cuidadosamente seguidos. O ideal é que o processo seja automatizado, com o uso de vários sapatos, cada um num estado progressivamente mais desamarrado.

O estudante pode perguntar: onde estão as luzes e campainhas na cadeia de amarrar o sapato? Por que elas foram necessárias para o rato e não para a criança? A discrepância é apenas aparente. Ao amarrar um cadarço, cada resposta na cadeia produz, naturalmente, uma situação de estímulo diferente, um cordão que está mais próximo de ser amarrado. Na caixa de Skinner, o pressionar a barra ou o puxar uma corda não afeta, naturalmente, o ambiente desta maneira, de modo que o experimentador e obrigado a acrescentar mudanças de estímulo algo artificialmente. Mas em ambas as cadeias, os S^s e S ^ s são as forças unificadoras. Quando o cordão está num estado particular, somente certas respostas podem avançá-lo para o próximo estado. Assim, qualquer estado determinado

- 250 -

do cordão é um para uma classe particular de resposta e um S A para o resto. (Note que a criança deve aprender a observar o estado atual do cordão para escolher os S^s 'devantes). Tanto para o comportamento de amarrar os sapatos como para os movimentos do rato, o status de encadearqento permanece uma seqüência de respostas operantes entremeadas com seus S^s.

Pierrel e Sherman (1963) descreveram o treino de uma seqüência exótica de comportamento do rato. O rato subia uma escada em espiral, atravessava uma ponte estreita e subia uma escada de mão. Então, puxava uma corrente ligada a um carro de brinquedo aberto, subia no carro e pedalava-o até uma segunda escada de mao. Depois de subir esta escada, ele passava através de um tubo e entrava num elevador. O peso dc rato fazia baixar lentamente o elevador até a plataforma inicial, onde, como um anticlímax, o animal pressionava uma barra e recebia uma pelota de alimento pelos seus esforços. Depois de comer, o rato estava em condições de iniciar novamente a seqüência. O observador casual, provavelmente, ficaria maravilhado pelo desempenho rápido e seguro desta cadeia, por um organismo tão insignificante como o rato. Um exame da história por trás de tal desempenho, todavia, revela que apenas os princípios bem estabelecidos dos capítulos 4-11 foram empregados. O comportamento do rato foi adquirido pelos princípios de discriminação e modelagem e encadeado pelo uso criterioso de reforçadores condicionados.

12.3 A APRENDIZAGEM DE LABIRINTO COMO UM ENCADEAMENTO

O labirinto tem sido associado com a psicologia há muito tempo. Em experimentos iniciais que datam da passagem do século, animais famintos eram colocados em aparelhos tais como os vistos na Fig. 12-2, permitindo-se que encontiassem o caminho até o alimento. O labirinto foi adaptado para sujeitos humanos com os olhos vendados de modo a permitir que eles traçassem seu caminho com um estilete através dos caminhos tortuosos, com muitos pontos de escolha, talhados na madeira ou feitos de metal.

Caixa-objetivo Caixa-objetivoda esquerda da direita

partida

Caixa objetivo

partidaí igura 12-2. Labirintos representativos. C ada labirinto tem uma caixa de partida e uma ou mais caixas-objetivos ou saídas, onde o alimento pode ser encontrado. Um ponto no labirinto a partir do qual dois caminhos sào possíveis e chamado ponto de escolha.

A força da resposta era inferida de mudanças (1) no número de erros ou entradas em becos sem saída, e (2) no tempo de reação (RT), da caixa de partida até a caixa-objetivo. Depois de um número variado de tentativas de treino, os indivíduos colocados no ponto

- 251 -

de partida percorriam esses labirintos rapidamente e sem erros. As curvas obtidas quando erros ou RTs eram representados em função do número de tentativas eram de várias formas, dependendo da estrutura particular do labirinto usado.Geralmente, à medida que se realizava mais e mais tentativas, os erros diminuíam progressivamente até zero e os RTs diminuíam progressivamente, aproximando-se de uma assíntota.

Havia muitas esperanças, originalmente, de que o estudo de animais em labirintos revelaria os segredos da ação instrumental e forneceria informação fundamental a respeito do processo de aquisição. Infelizmente, a história confirmou poucas dessas esperanças. Em comparação com a topografia de uma pressão à barra ou uma bicada na seqüência do labirinto constitui uma longa e complex a cadeia, cuja aquisição envolve uma mistura não analisada de discriminação, diferenciação e reforçamento condicionado. Como todos esses aspectos do comportamento estarão inestricavelmente misturados durante o treino, não é surpreendente que a aquisição no labirinto seja gradual em vez de abrupta. Os labirintos são usados até hoje na pesquisa psicológica de problemas especializados onde o grau de análise requerido é mínimo; mas, a confusão de um grande número de fatores de aquisição acarreta dificuldades na interpretação de resultados cortiporta- mentais. O estudante é aconselhado a encarar o comportamento no labirinto como uma cadeia de elementos resposta h eterogên eo s (isto é, diferentes), que só gradualmente se tornam ligados em seqüências unitárias de resposta.

12.4 OS EFEITOS DA EXTINÇÃO SELETIVA EM PONTOS DIFERENTES DA CADEIA

Embora possamos concordar que seqüências complexas de comportamento operante são adquiridas como cadeiasque crescem gradativamente,é ainda relevante perguntar se, uma vez formada, uma ação retém todos os aspectos encadeados. Por exemplo, os membros originais da resposta preservam seu status unitário como respostas? Os experimentos em que o procedimento de extinção é aplicado seletivamente aos membros originais de um ato bem condicionado são instrutivos.

Skinner (1938) encadeou a resposta de pressão à barra e a resposta de aproximação ao comedouro no elo usual (fase a )

Fase a:__ __ __^(pressão à barra) S (aproximação s +

^(alimento 3 ausente)

Rao comedouro) —► 2

R —Lf (comer

Ouando esta seqüência estava bem condicionada, introduziu-se a extinção, não se permitindo que a pressão à barra produzisse o som do alimentador (fase b). Esta operação de extinção quebra a cadeia entre cadeia entre os elos 3 e 2.

Fase b: ^(pressão àbarra) ^(alimento ausente)

Sob essas condições, os S^s para os dois membros finais (aproximação ao comedouro e comer) não podiam ser reproduzidos e, naturalmente, a pressão à bara no elo 3

- 252 -

enfraqueceu. Quando a resposta à barra alcançou um nível baixo, a cadeia foi restabelecida para incluir o elo 2 , permitindo-se que a pressão à barra produzisse o som do alimentador. Mas nenhuma outra contingência da cadeia foi restaurada (fase c ) .

Fase c : ^(pressão à barra) S(alimento ausente)

S(som do alimentador)R(aproximação ao comedouro)—- f-

Os resultados dessas operações seletivas de extinção aparecem nas curvas duplas de extinção da Fig. 12-3.

Figura 12.3. A extinção separada de membros dc uma cadeia. A extinção de R (pressão à barra) foi conduzida até a seta. Depois da seta, tanto R (pressão à barra) como R (aproximação ao comedou- .o) foram extintas (segundo Skinner, 1938).

Pela figura, parece que depois da reintrodução do som do comedouro (fase c ) , a resposta de pressão à barra readquiriu força imediatamente e uma segunda curva de extinção foi gerada. A interpretação desse resultado é a seguinte. Durante a extinção na fase b , a resposta de pressão à barra (na ligação 3) enfraqueceu; mas a resposta de aproximação ao comedouro (na ligação 2 ) não, porque esta última estava principalmente sob o controle do estímulo som do comedouro, que não ocorreu nesta fase. Uma vez ausente na fase b , o estímulo do comedouro não perdeu suas propriedadas de SD, nem , ap a ren te m e n te , suas p ro p rie d a d e s de re fo rç a d o r c o n d ic io n a d o . Logo, o restabelecimento da contingência 3 na fase c restituiu à pressão à barra sua fonte usual de reforçamento condicionado, o som do alimentador. Durante a fasec, a resposta discriminativa de aproximação ao comedouro enfraqueceu gradualmente através da extinção, e o som do comedouro perdeu, correspondentemente, suas propriedades de S^, já que não estava sendo mais emparelhado com alimento (S+).

A demonstração de Skinnci sugere que, na extinção, somente os membros de umacadeia até o ponto de fracionamento diminuem em força. A força de membros e S^s alémdesse ponto é preservada.

A extinção pode ser aplicada de uma forma algo diferente para demonstrar ainda a natureza encadeada do comportamento estabelecido. Ratos são inicialmente treinados a percorrei um labirinto em forma de T (Fig. 12-2), obtendo o alimento que é colocado numa das caixas-objetivo (digamos, à direita). Quando os ratos vão para o lado direito consistente e rapidamente, estão prontos para a próxima fase do experimento. O alimento é retirado da caixa-objetivo, os ratos são colocados diretamente na caixa- objetivo agora vazia (onde haviam outrora encontrado alimento depois de percorrer o

- 253 -

labirinto), permanecendo ali por um momento. Numa fase final de teste, os ratos são colocados na caixa de partida com o alimento ainda não presente na caixa-objetivo. O tempo requerido para percorrer a distância entre a caixa de partida e a objetivo é medido. O ato de percorrer o labirinto daqueles ratos que tiveram uma história passada de serem colocados na caixa-objetivo vazia mostra uma extinção rápida, foradonormal. No teste, estes ratos percorriam o labirinto mais devagar e cometiam mais erros do que cometeriam se não tivessem tido a oportunidade de “descobrir” que sua caixa-objetivo estava agora vazia,

Esta redução na força da resposta define um fenômeno conhecido como “extinção latente” . A escolha desta expressão para descrever o comportamento é baseada numa interpretação discutível da fase intermediária do experimento, em que os animais são colocados diretamente no compartimento vazio. “Extinção latente” implica em que esta fase intermediária é um período durante o qual a extinção do comportamento de percorrer o labirinto está ocorrendo de forma implícita, ou latente. É tentador dizer que os ratos param rapidamente de correr no labirinto, em extinção, porque, já tendo t*do bastante tempo para “ investigar” a caixa-objetivo vazia, eles “ sabem” , antes de correr, que a encontrarão vazia. Infelizmente, esta explicação baseia-se no futuro como o fator controlador do comportamento e contém todas as falhas de tais “explicações” , mencionadas anteriormente (seção 4.1) Uma interpretação mais simples, embora mais austera, está baseada na extinção “manifesta” e perdas no reforçamento condicionado. No treinamento, os ratos aprenderam a percorrer o labirinto.Treino: __ ___

S(ponto de escolha)R(virar à direita)— ;2

Na fase intermediária, os ratos estavam na caixa-objetivo, agora vazia, resultando em alguma extinção verdadeira de R \.

S(caixa de partida)R( dirigir-se ao recipiente com alimento) — **

1No teste, toda a cadeia foi submetida a um procedimento padrão de extinção.Teste:

S(caixa de partida) R(correr) ----- »T

S(caixa-objetivo)R(dirigir-se ao recipiente com 1 alimento)-----* S +

S(caixa de partida) R(correr)------^

S(ponto de escolha)R(virarà direita)----

~2 '

S(caixa-objetivo)R(dirigir-se ao recipiente com

alimento) —3 ‘ 2 1 Os membros resposta associados com as contingências 3 e 2 foram significativamente

enfraquecidos pela fase intermediária. A explicação dessa diminuição na força é encontrada na redução drástica do poder reforçador da caixa-objetivo que ocorreu nesta fase. Na “extinção latente” , esta redução parece regredir por toda a cadeia, diminuindo o poder reforçador de todos os SDs anteriores.

Os resultados da “extinção latente” e do experimento de extinção seletiva de Skinner sugerem a seguinte generalização composta de duas partes. Todos os membros de urna cadeia até o ponto em que, nesta cadeia, um membro tenha'sido submetido a extinção, sofrem um enfraquecimento, se ou não estes membros foram realmente emiti

- 2 5 4 -

dos. Por outro lado, nenhum dos membros além do ponto de extinção é enfraquecido. A generalização é de algum interesse como um método prático para reduzir o comportamento não desejado pela simples extinção dos reforçadores condicionados dos quais ele depende. Se o comportamento não desejado consiste de uma seqüência grande e de longa duração, tal princípio, se é que ele se mantém para cadeias de qualquer tamanho, deve ser bem recebido pelos educadores que acham desejável extinguir velhos pontos de vista antes de ensinar os novos.

12.5 ESQUEMAS ENCADEADOS

Nem sempre é fácil avaliar as forças das várias respostas e reforçadores condicionados numa cadeia estabelecida do tipo que descrevemos.

(1) O problema da medida. As respostas nessas cadeias são heterogêneas, isto é, as respostas sucessivas na cadeia diferem uma da outra quanto à forma Quando um rato rola uma bola de gude até um buraco, puxa um cordão e pressiona uma barra, é pouco provável que esses comportamentos ocorram com taxas idênticas. As respostas variam na topografia, duração e esforço requerido. Assim, seria surpreendente se suas taxas de ocorência fossem comparáveis. Mas uma cadeia, cujos membros correm com taxas variadas devido às variações topográficas, presta-se pouco como um meio para o estudo dos efeitos quantitativos que várias operações experimentais, tais como drogas, lesão fisiológica e esquemas de reforçamento poderiam exercer no comportamento encadeado.

(2) O problema da sensibilidade. Quando essas cadeias estão bem estabelecidas,elas funcionam como unidades. Isto é o que queremos dizer quando nos referimos aos seus membros como estando “ ligados” no que eqüivale a um operante de ordem superior. A estrutura unitária dessas cadeias é uma conseqüência da manutenção dos membros sob o controle funcional do reforçamento, como fazemos para um operante mais simples. Embora tenhamos visto que a extinção seletiva é uma forma de revelar a estrutura essencialmente encadeada de tais atos, muitas operações experimentais parecem afetar a seqüência como uma unidade. A cadeia como um todo pode variar em força, em função dessas diferentes variáveis experimentais, mas as forças relativas dos membros individuais da cadeia permanecem insensíveis a essas variáveis.

Em contraste com a cadeia simples, o esquema encadeado (Ferster e Skinner, 1957) fornece uma linha-base quantitativa e sensível para avaliar as propriedades de cadeias. Como as cadeias já descritas, os esquemas encadeados consistem de uma sucessão de contingências ligadas. Mas, ao contrário dessas cadeias, os esquemas encadeados especificam que cada membro da resposta produz a contingência seguinte probabilisticamente. Assim, em qualquer ligação única, um número de respostas pode ter que ser emitido para avançar a cadeia para a próxima ligação. A vantagem disso é que, em qualquer ligação probabilística, a taxa, frequência ou padrão do responder fornece uma variável dependente sensível que pode ser estudada independentemente da taxa, freqüencia ou padrão dos membros resposta numa ligação em qualquer ponto da cadeia. Além disso, já que os membros individuais no esquema encadeado podem ser convenientemente especificados como classes de respostas idênticas (homogêneas), o problema de medida associado com as topografias heterogêneas em cadeias mais simples é contornado.

Considere um esquema encadeado homogêneo com duas ligações. Lembre-se de que o termo ligação se refere aosS^s sucessivos do esquema. Na notação, os colchetes sucessivos de um diagrama denotam as ligações. Numa cadeia simples, cada ligação c

- 255 -

associada com uma e somente uma resposta, mas no esquema encadeado esta correspondência um-a-um entre resposta a ligação não está presente.

Um esquema encadeado representativo está abreviado em [ 12A\ .0 bicar a chave de um pombo na presença de uma luz vermelha produz, num esquema RI, uma luz verde; o bicar a chave na presença da luz verde produz, num esquema FI, o reforçamento com alimento.

0 diagrama [12.4 (descreve uma cadeia de duas ligações mas uma que gera tipicamente muitas respostas de bicar a chave por reforçamento. Além disso, padrões diferentes de resposta se desenvolvem nas diferentes ligações, sendo cada padrão apropriado para a contingência específica da ligação em que ocorre. Assim, as curvas na Fig. 12.4A mostram que efeitos típicos de RI ocorrem na segunda ligação, a situação luz vermelha; as curvas naFig 12-4B mostram que efeitos típicos de FI são gerados na primeira ligação, a situação luz verde. Dois registradores foram usados para obter a Fig. [ 12-4[.Bicadas na presença da luz vermelha (ligação 2) foram registradas num registrador; bicadas na presença da luz verde (ligação 1) foram registradas em outro. Quando o animal estava na situação associada a uma determinada ligação, somente o registrador apropriado para esta ligação era operado.

O procedimento do esquema encadeado tem aplicação na avaliação, em detalhes quantitativos, do poder reforçador de um reforçador condicionado. Na seção 11.2, está- vamos preocupados com a durabilidade de um reforçador condicionado: isto é, quanto tempo um reforçador adquirido retém seu poder de manter comportamentos. Mas a força de um reforçador condicionado em qualquer momento determinado é,

S(vermelho) S (verde)R (bicar) RI > R(bicar) FI ^ g + [12.4]

2 1

6 min

f

' ' f ,

r

(A) (B)

Figura 12-4. Respostas produzidas num esquema encadeado RI 45 seg - FI 45 seg. Bicadas na chave são as respostas de pombos famintos. O aparecimento de uma luz verde associada à contingência FI é o reforçamento em (A). O alimento é o reforça- mento em (B). (Dados não publicados de J. R. Milienson).

- 2 5 6 -

frequentemente, de igual interesse. Em linguagem coloquial, a força de um reforçador é porporcional à quantidade de trabalho que o animal despenderá para obter o reforçador.

Uma discussão completa sobre a força de reforçadores encontra-se no capítulo 15. No momento, é suficiente notar que a taxa em que um organismo trabalha numa situação (onde seu trabalho tenha, no passado, produzido o reforçador) é urna medida de tal força. Em geral, um homem que deseja algo “ardentemente” trabalhará muito para conse^uí-lo. Assim também o pombo. Quando o EI da primeira ligação em 112.41 é aumentado, ou diminuído, a taxa total de bicadas do animal nesta ligação FI dificilmente é afetada. Mas sua taxa de bicadas na ligação RI precedente se altera sistematicamente. A função é suave e é apresentada na Fig. 12-5. A função foi obtida com um procedimento igual ao de [ 12.41 . Em vários meses de experimentação diária, quatro valores de FI na ligação 1 foram estudados. De acordo com a Fig. 12-5, quanto maior o Fl menos o animal tende a trabalhar para produzir a ligação associada ao FJ e, assim, por inferência, menor o valor reforçador a ela associado

Os esquemas encadeados podem ser combinados com especificações de resposta de ordem superior, formando cadeias tais como V I-R F, V I-drl e FR -FI. O número de ligações permissíveis pode ir além de dois. Demonstrou-se que cadeias VI-VI-VI-VI-VI mantêm o comportamento (Kelleher e Gollub, 1962). Muitos fenômenos cómporta- mentais interessantes ocorrem, encadeando-se uma variedade de procedimentos. O estudante interessado pode consultar Ferster e Skinner (1957) e Kelleher e Gollub (1962) para detalhes adicionais.

Figura 12-5. Respostas por minuto na segunda ligação de um esquema encadeado duas ligações em função do esquema FI na primeira ligação (dados não publicados de J. R. MilIcYjson).

12.6 O COMPORTAMENTO HUMANO COTIDIANO COMO ENCADEAMENTO

No co m p o rtam en to hum ano, quase toda ação ou habilidade, desde o atravessar uma sala até o assobiar uma canção, tem a forma de uma cadeia operante. Tais cadeias são compostas da maneira em que as séries de movimentos foram combinadas pelos r-»tos descritos na seção 12.1? Os S^s separam cada movimento simples no desem

- 257 -

penho humano e servem para ligar a seqüência como um todo? A análise sugere uma resposta afirmativa para ambas as questões.

No comportamento conhecido como caminhar, uma perna é erguida, estendida e toca o chão. A outra perna, então, repete um padrão semelhante. A cadeia é claramente algo como

[12.5]

onde So =ambas as pernas apoiadas no chão e R()-erguer a perna esquerda pés juntos

S6 =perna esquerda acima do chão R6 =estender a perna esquerdaS5 =perna esquerda estendida R5=abaixar a perna esquerdaS4 =perna esquerda apoiada no chão e pé R4 =erguer a perna direita

esquerdo adianteS3 =perna direita acima do chão R3 = estender a perna direitaS2 =perna direita estendida R2 = abaixar a perna direitaS\ =perna direita apoiada no chão e pé di- R\ =eiguer a perna esquerda

reito adiante

Nesta cadeia, as descrições dos estímulos podem ser questionadas em termos práticos. Quando caminhamos, em geral não observamos continuamente a posição de nossas pernas em uma relação à outra. De quajqucr foram, caminhamos adequadamente no escuro. Evidentemente, existem eventos dentro do organismo que são parte dos Ss em cada colchete de [ 12. 5]. Estes elementos internos de cada situação de 112.5 | surgem dos próprios movimentos do corpo. Mencionamos brevemente, na seção 9.1, os receptores conhecidos como proprioceptores, que se acham localizados nos músculos c tendões. Esses receptores têm a propriedade de responder diferencialmente a vários movimentos de músculòs e tendões. Assim, cada S em 112.5 | pode ser descrito mais completamente, notando-se não apenas o estado do membro em referência ao ambiente externo como fizemos, mas também o estado exato dc tensão dos conjuntos particulares de músculos usados. No andar comum, esses estados são usados como as deixas principais para manter uma seqüência dc movimentos bem coordenada.

Contudo, a sensibilidade muscular não é sempre suficiente, especialmente na aquisição de seqüências mais complexas, para a coordenação ideal do comportamento. Ao aprendermos um novo passo de dança, um instrutor pode ter que nos aconselhar a não olharmos para nossos pés. Nosso comportamento de observar é uma maneira óbvia de assegurar que colocamos nossos pés “onde deveriam ser colocados” durante a dança. Mas, o comportamento visual de observar não é incentivado pelos mestres de dança porque ele viola certos padrões estéticos, retarda a aquisição do controle apropriado pela propriocepção e torna quase impossível que duas pessoas dancem juntas. Em certas doenças ou lesões da medula vertebral, os receptores proprioceptivos não operam. Nesles

- 2 5 8 -

casos, as pessoas continuam a caminhar, mas somente pela observação visual da posição de suas pernas.

A duplicação de indícios e a superposição informativa comumente encontrada nas situações é explorada na técnica conhecida como “substituição gradual de controle". As cadeias são frequentemente formadas utilizando-se elementos bem grosseiros das situações como S^s preliminares. Então, à medida que a aquisição prossegue, os controles são gradualmente transferidos para porções cada vez mais sutis das situações. Isto pode ser feito não se liberando o reforçamento quando um comportamento grosseiro de observação é detetado, como no exemplo da dança, ou removendo-se gradualmente certos aspectos da situação. Por exemplo, ao aprender a dirigir um carro, o novato pode depender, inicialmente, de comandos verbais do seu instrutor de direção para manter uma cadeia suave de comportamento. Esses comandos são vistos entre aspas em 12.6 na designação dos S^s.

S A S B

R a - — > R n - ----> Rc -*■ SD[12.6]

onde S \ “Coloque em marcha lenta”+ carro parado RA = colocar a alavanca de cambio em marcha lenta Sb = Pise no acelerador” * alavanca em marcha lenta Rg =pisar no aceleradorSç ~“Solte a embreagem” + motor com rotação moderadaRç =soltar a embreagemSd = “Muito bem!” + carro move-se para a frente

O instrutor pode, gradualmente, começar a omitir os elementos verbais das situações, de modo que as deixas provenientes do pedal de embreagem e da alavanca de câmbio passem a atuar diretamente. Os professores, ocasionalmente, se esquecem de que no mundo fora da sala de aula, deixas verbais faladas e escritas — como as “instruções” de 22.6 são muitas vezes chamadas — raramente estão presentes. Assim, é importante que no ensino formal, as deixas verbais usadas no início sejam retiradas antes que o estudantes possa ser considerado treinado. É esta eliminação gradual de partes de uma situação de S^, deixando apenas aspectos mínimos do estímulo em controle, que é conhecida como s u b s t itu iç ã o gradual de controle.

Outros casos de substituição gradual de controle surgem quando um músico aprende uma composição musical de cor. Inicialmente, as notas individuais escritas na pauta fornecem os S^s. Na passagem

1

4 *a cadeia R (tocar FA), R (tocar MI), R (tocar SI), R (tocar LA), é determinada. Inicialmente, os membros individuais da cadeia são controlados pela partitura. Eventualmente, todavia, a partitura é gradualmente removida, as respostas de observar diretamente a partitura não

- 259 -

são incentivadas pelo instrutor e finalmente os próprios sons das notas fornecem todos os S^s necessários. Em geral, o paia tocar uma nota iião será necessariamente o som da nota imediatamente procedente, mas, em vez disso, uma combinação dos sons de várias notas anteriores uma passagem. Assim, por exemplo, a deixa para a execução das nota E acima, geralmente não será apenas a nota B anterior, mas tal execução estará sob o controle de uma longa série de notas precedentes, sendo a B apenas a última dessas. Como seria esperado, portanto, as passagens de execução mais difícil são aquelas que são semelhantes, isto é, aquelas que contêm seqüências de notas idênticas terminando numa nota final diferente. Para tocar a nota correta, o único disponível está localizado a alguma 'istância (nas passagens muito semelhantes, talvez uma meia dúzia ou mais notas anteriores) é as notas imediatamente precedentes devem, no momento, ser ignoradas.

Uma quebra no encadeamento explica a hesitação que um artista algumas vezes exibe ao iniciar uma passagem. Não há um único no início da partitura. Um problema semelhante pode ocorrer na memorização de poesia. Uma vez começada, cada palavra falada marca a ocasião para a próxima palavra, mas é necessário alguma deixa verbal para se iniciar. Quando crianças recitam poesia, frequentemente se observa que elas fazem uma “pausa” entre as linhas. Este é o resultado de se memorizar linha por linha, de modo que a última palayra da linha anterior não adquire poder suficiente de para a primeira palavra da linha seguinte.

12.7 CADEIAS VOCAIS

Não somente a poesia, mas todo comportamento verbal humano (comunicativo) é encadeado. A sentença é uma cadeia de palavras, sendo que cada palavra falada é uma resposta que produz um S^ (o som dessa palavra) que marca ocasião para a próxima palavra. Não distinguimos os ruídos emitidos por seres humanos como sendo fundamentalmente diferentes de outros operantec humanos e animais. Num capítulo anterior (seções 4.10 e 4.11) descrevemos experimentos que indicavam que o comportamento vocal de crianças e estudantes universitários é fortalecido e enfraquecido de acorda com as contingências, de reforçamento apropriadas. Desejamos ampliar, nesta seção, o que já explicamos, indicando, ao mesmo tempo, como a linguagem alcança um status tipicamente encadeado.

Considerando-se que a linguagem é tão intimamente uma parte aa arte, ciência e culjura humanas, estudiosos _e cientistas de várias disciplinas têm sido levados a aplicar seus diferentes pontos de vista e técnicas para analisar a linguagem. O corpo de conhecimento resultante constitui a lingüística. No presente texto, restringimos nosso interesse a três problemas “psicológicos” da linguagem: ( 1) O que constitui uma descrição comportamental conveniente da linguagem? (2) Como este comportamento é adquirido? (3) Qual é o “ significado” da linguagem? Nesta seção, restringimos nossa atenção aos dois primeiros problemas, adiando a análise do “ significado” (que é melhor descrito pela enumeração de condições específicas que controlam as seqüências particulares de linguagem) para o capítulo posterior sobre aquisição de conceito.

Na seção 4.10 notamos que, bem cedo na vida da criança, a distribuição da freqüência relativa de vários fonemas torna-se semelhante aos histogramas de fonema para a comunidade em que a criança está sendo criada. A correspondência é presumivelmente o efeito de contingências de reforçamento seletivo peculiares a essa comunidade. Embora tais distribuições possam nos dizer quais são os sons básicos que mais provavelmente

- "GO

serão enunciados por um dado indivíduo, elas fornecem pouca informação sobre a estrutura do comportamento verbal. Esta estrutura é convenientemente descrita como cadeias de palavras. Além disso, as próprias palavras faladas são convenientemente representadas como cadeias de sílabas ou fonemas. Naturalmente, da mesma forma que os membros resposta no comportamento encadeado do rato relativo à pressão à barra, as unidades de cadeias verbais também desaparecem nas seqüências que fluem suavemente. Sob certas condições, a natureza encadeada das palavras é facilmente demonstrável. Na aquisição de uma palavra nova e difícil, de modo a podermos repetir a palavra corretamente. A palavra “Monongahela” , dos índios Delaware, é de difícil pronúncia para estrangeiros. Quando a palavra é representada como uma cadeia, os S^s dos sons e as Rs de falar são convenientemente descritos como sílabas [12.7.| Inicialmente, os sons podem ser

produzidos pelo aparelho vocal de um instrutor ou, em princípio, por uma máquina. As respostas de 112.7Jsão aquelas de um organismo aprendendo a pronunciar a palavra. Na notação, os elementos falados (R) das palavras são colocados entre colchetes oblíquos < > ; enquanto os sons (S) das palavras são colocados entre aspas “ ” .

No início da aquisição, os S^s de qualquer ligação determinada em [12.7 |não têm controle suficiente sobre as Rs desta ligação para produzir seguramente um comportamento. O instrutor pode ter que fornecer uma deixa verbal para a sílaba desejada. Por exemplo, após o erro comum mongonga , o instrutor pode aconselhar um reinicio e, depois que o aprendiz responde , mo , ele mesmo pode dizer “non” . Sob instruções apropriadas para imitar, o S “non” provavelmente controlará a R non . Naturalmente, o instrutor eventualmente removerá essas deixas verbais de modo que a pronúncia correta se torne independente da sua presença.

Uma nota sobre imitação é aqui inserida entre parênteses. A imitação é, inquestionavelmente, um método valioso para controlar o comportamento. Mas, como uma maneira rápida para o processo completo de aquisição, ele pode ser muitas vezes superestimado. Os professores frequentemente se surpreendem ao observar que, dando ao aluno um pouco de informação, frequentemente nada ensinam ao estudante. O desempenho complicado de um dançarino, de um acrobata hábil ou de um músico não pode ser colocado no repertório de um novato através da mera imitação. Observar alguém a dirigir um carro ou pilotar um avião não desenvolve, por si só, estas habilidades no observador. A imitação é quase sempre útil para aumentar a força de respostas previamente adquiridas, mas não é tão útil para encadear os membros numa seqüência de qualquer tamanho ou complexidade.

A natureza encadeada das palavras é claramente exposta em experimentos que alteram a sucessão normal de S^s. Se respostas silábicas do tipo visto em [ 12.7 ]não produzem seus S^s característicos imediatamente, o padrão da fala rompe-se e se torna caótico, sujeito pode começar a garguejar e, em casos extremos, é totalmente incapaz de falar. No Feedback auditivo com atraso, as relações normais R -* S^ na fala de cada uma das suas próprias Rs de falar, por cerca de 1/5 de seg. (Lee, 1950). O termo feedback foi emprestado da linguagem da eletrônica, onde parte de um sinal de saída “out-put” — (por exemplo, na sua vitrola, parte da energia amplificada que ordinariamente iria para

l ü < h e > I ü < l a > S "la ' 2 1

[12.7]

261 -

seu altofalante) é retornada (feedback) para a entrada — “ input” — (o lugar onde você coloca a tomada de sua vitrola) do mesmo circuito. Por analogia, uma resposta pode ser considerada uma saída do sistema comportamental; o ambiente pode ser considerado a entrada deste sistema. Quando um organismo opera em seu ambiente, emitindo operantes, as mudanças no ambiente produzidas pelas próprias respostas do organismo podem ser consideradas um feedback para o organismo. A palavra “feedback” , despida de sua característica eletrônica, é análoga àquelas conseqüências especiais que chamamos reforçadores primários e secundários.

Imagine um sujeito numa sala á prova de som. Fones de ouvido confortavelmente ajustados e paredes e tetos que absorvem sons impedem-no de escutar sua própria voz pela propagação normal através do ar. (Uma recepção muito reduzida é possível através da propagação nos ossos). Os sons produzidos pelas respostas de falar vão para um gravador através de um microfone. Eles são retardados pelo simples procedimento de primeiro gravá-los e, então, uma fração de segundo mais tarde, tocá-los amplificados para o sujeito. A amplificação serve para anular quase toda a condução óssea de S^s. O eteito obtido é um exagero daquele observado quando um orador fala para o público, num sistema de alto-falante, estando o alto-falante localizado a alguma distância de seu microfone.

Num caso típico de distorção da fala produzida por este tipo de atraso de som, a pronúncia de Monongahela torna-se monongahelala. Considere este efeito em relação à cadeia do diagrama [12.7 |. Na ligação da contingência 1, o sujeito acabou de pronunciar R < la > e, em circunstâncias normais, ouviria imediatamente S “ Ia” , o final na cadeia. Mas, devido ao atraso, ele escuta S “he” , que ainda controla outra R < la>. O efeito é mais pronunciado no final da cadeia porque, na fala normal, o comportamento no meio da cadeia da palavra mantém-se ligado pelos movimentos imediatamente antecedentes do aparelho vocal, em adição aos efeitos sonoros produzidos por esses movimentos. A R final,uma pausa deliberada, é mais dependente do som da sílaba terminal. (A maneira mais segura de você saber que terminou de falar uma palavra é escutar sua última sílaba).

O método de feedback auditivo com atraso, quando com um atraso fixo, pode não ser o melhor para quebrar a cadeia da fala. Com a prática, parece razoável que o sujeito passe a usar os S^s atrasados, uma vez que eles ainda têm uma relação fixa com o comportamento anterior (sempre 1/5 seg mais tarde). Se o atraso fosse uma média de intervalos aleatórios igual a 1/5 seg, intervalos esses que variassem de momento a momento, esperar-se-ia um rompimento mais completo da cadeia de linguagem falada.

As sentenças podem ser analisadas de forma análoga às palavras. Durante a infância, a aquisição de sentenças é baseada na ligação de combinações cada vez mais longas de palavras. Não levando em conta o problema do significado, as cadeias de sentenças diferem das cadeias de comportamento do rato até aqui consideradas, no sentido em que seus membros resposta (palavras) são combinados em muitas seqüências diferentes permissíveis. (Isto também é verdadeiro nas cadeias de sílabas que formam as palavras). A cadeia “ o cachorro morde o homem” é controlada por uma situação muito diferente da cadeia “ o homem morde o cachorro”. Logo, as unidades básicas das sentenças (palavras) não podem ser aprendidas em qualquer seqüência fixa da maneira em que o rato da seção12.2 aprendeu os membros de sua cadeia. A sentença é construída peça por peça, empregando as palavras como unidades. À medida que a criança cresce, a média do tamanho de suas sentenças faladas aumenta, como é visto na tabela 1 2-1 .

- 2 6 2 -

Tabela 12-1

TAMANHO MÉDIO DE SENTENÇAS FALADAS EM VÁRIAS IDADES( s e g u n d o M c C a r th y , 1 95 4)

Idade (anos) 1.5 2.0 2.5 3.0 3.5 4.0 4.5

Número de nalavras

1.2 3.1 3.4 4.3 4.4 4.6

Como as unidades de palavras são organizadas em sentenças? O mecanismo parece ser um encadeamento de operantes discriminativos discretos. Por exemplo, o comportamento verbal de uma criança pode ser modelado (de acordo com os princípios dos Capítulos 7 e 8) de tal modo que a palavra “bola” venha a ser pronunciada, quando solicitada, na presença de objetos esféricos. Similarmente, pode-se tomar o reforçamento contingente à emissão de certos sons pela criança (<azul> <vermelho>,<verde >, etc.), na presença de objetos apropriadamente coloridos. Finalmente, a criança pode ser treinada a vocalizar < Eu tenho... > nas circunstâncias em que esteja com um certo objeto para o qual ela tenha aprendido um nome, como aprendeu “bola” . A chave para esta análise é que cada palavra ou conjunto de palavras fica sob o controle de uma situação ambiental e s p e c íf ic a ,ou, mais exatamente, um conjunto de situações:

S (bola) S (objeto vermelho)

^ ^ b o !a > * S , R< vermelho>----->-S \S ( de posse de... ) R <E u tenho... > — +s

Embora a criança nunca possa ter completado esta seqüência, a questão “O que você uil aí? ” pode produzir a nova cadeia, R < eu tenho > lumajR < bola > R < vermelha> , se os elementos da seqüência — em conjunção com certas regras gramaticais a respeito de artigos indefinidos e suas posições com relação a outras palavras e as regras que governam a ordem dos adjetivos e substantivos — já existem no repertório comportamental. Naturalmente, não há necessidade de que a criança seja capaz de verbalizar estas egras; ela precisa apenas empregá-las apropriadamente. Tipicamente, o fortalecimento do ornportamento de verbalizar regras gramaticais é reservado para os professores de Portu

guês.

12.8 CADEIAS RAMIFICADAS E REPRESENTAÇÃO DO DIAGRAMA DE FLUXO

No estudo das “ recompensas tokens” com chimpanzés, estabeleceu-se uma discriminação entre fichas brancas “com valor” e fichas de metal “sem valor” (seção 11.3) Numa variação do procedimento, os chimpanzés tinham que puxar uma barra para obter fichas. Algumas vezes, eles obtinham uma ficha branca pelo seu esforço, mas outras vezes obtinham uma de metal. Quando recebiam uma ficha branca, eles a colocavam numa máquina de vender que fornecia uvas ou gomos de laranja. Mas, nas ocasiões, em que recebiam fichas de metal, os animais desprezavam-nas e voltavam à barra para uma nova tentativa. Eles aprenderam que colocar fichas de metal na máquina de vender nunca produzia o reforçamento.

- 2 6 3 -

As contingências de puxar a barra para os chimpanzés parecem de alguma forma com aquelas de um motorista que se aproxima de um cruzamento. O comportamento que o motorista emite no cruzamento dependerá de ele encontrar uma luz verde, uma luz vermelha, um sinal para prosseguir ou um policial de trânsito. As conseqüências de estimulo do comportamento de aproximação do motorista e do comportamento de puxar a barra do chimpanzé estão sujeitas a um grau de incerteza. Em ambos os casos, uma determinada resposta — puxar a barra ou aproximar-se do cruzamento — pode levar a várias situações possíveis. E a resposta apropriada que se segue na cadeia(inserir a ficha ou puxar a barra novamente; parar ou seguir) dependerá da situação particular em que de fato ela ocorreu.

Quando uma resposta numa cadeia de comportamento pode, deste modo, levar a uma de várias situações possíveis, diz-se que as contingências naquele ponto se ramificam. Notamos as contingências simples, ramificadas, nas seções anteriores, desenhando várias setas partindo de uma R e indicando as probabilidades de cada conseqüência de estímulo. Muitos dos problemas cotidianos são mais complexos que aqueles encontrados pelo chimpanzé e o motorista. Nestes casos, as soluções são encontradas apenas cruzando-se uma cadeia complexa de tais contingências ramificadas. No problema típico, as contingências são compostas de modo a formar uma rede complexa de ramos, sub-elos, interco- nexões, becos sem saída e rotas alternadas.

E conveniente analisar o arranjo de contingências de reforçamento no caso de resolução de um problema mais complexo. Ao achar a diferença entre dois números, uma criança está resolvendo um “problema” . Para o adulto sofisticado, naturalmente, o exercício de subtração parece uma execução trivial de uma seqüência comportamental automática. O sabor de um “problema” há muito se perdeu; todavia, é por essa razão que uma análise deverá ser esclarecedor a.De fato, o fracionamento do exercício simples revela uma cadeia bastante complexa de contingências, em que pelo menos três habilidades comportamentais participam.Considere o seguinte problema

60048 - 152

Para os objetivos de análise, referir-nos-emos aos inteiros 6 ,0 ,0 ,4 e 8 , que aparecem no número superior, como inteiros superiores, ou simplesmente “superiores” ; e, aqueles números 1, 5 e 2, que aparecem no número inferior, como inteiros inferiores, ou simplesmente “ inferiores” . Supomos que quaisquer espaços existentes sob um superior (por exemplo, aqueles sob o 6 e o último zero à esquerda do mesmo problema) são considerados zeros.

Podemos identificar três operantes que o repertório comportamental do invidíduo deve incluir para que ele execute as várias cadeias que levarão à “solução” do problema.

1. Um repertório de respostas simples de subtração deve estar presente. Uma criança é treinada para responder “ três” ao comando “subtraia quatro de sete” ; a responder “oito” ao comando “dezessete menos nove” ; e assim sucessivamente. Em geral, uma lista de operantes discrim in ativos é adquirida, de modo que a criança pode dar corretamente a resposta a qualquer subtração onde o “superior” não é maior que 18 e o “inferior” não maior que 9. (Acima desses limites, uma subtração será “solucionada” pelo processo a ser

- 2 6 4 -

descrito). Esta lista de respostas constitui um conjunto de operantes discriminativos usualmente adquiridos através da aprendizagem de decorar e ditos serem “memorizados” . As respostas poderiam, naturalmente, ser rapidamente retiradas de uma tabela, mas elas são usadas tão frequentemente em problemas de aritmética que o procurar numa tabela atrasaria drasticamente a execução da cadeia de solução.

2. O comportamento de pedir emprestado deve ter sido previamente adquirido. Dado um “ inferior” maior que seu “superior”

deve-se ser capaz de examinar o primeiro “superior” diferente de zero localizado à esquerda (60048), e diminuir 1 dele. Deve-se, então, transformar quaisquer zeros existentes entre os dois “superiores” em questão em noves (59948), e finalmente adicionar 10 ao “ superior” cujo “inferior” originalmente o excedia (599 114.81).

3. O indivíduo deve ser capaz de discriminar o maior de dois inteiros. Essa discriminação consiste, primeiro, de uma resposta de observação dirigida para o “inferior” , e, então, para o “superior” logo acima dele. Se o “ inferior” é maior do que o “superior” , então uma resposta (pedir emprestado) deve atuar; de outro modo, outra resposta (subtrair) deverá atuar.

Quando tentamos representar por Rs, Ss e colchetes, as contingências que combinarão essas tres habilidades componentes de tal forma que produzam uma solução, encontramos uma dificuldade. Este problema aritmético é relativamente simples quando comparado com muitos outros problemas numéricos e não numéricos. Contudo, suas contingências compreendem tantos ramos,sub-elos, ínterconcxões e rotas alternadas, que nossa notação é sobrecarregada para fornecer uma representação manejávcl. Uma representação menos confusa da estrutura comport am en tal de tais tarefas é necessária.

As respostas e discriminações que o indivíduo faz ao solucionar um problema como a subtração contêm certa semelhança com as operações que um computador digital realiza para solucionar problemas similares. A máquina e o homem podem não empregar métodos idênticos, mas ambos alcançam uma solução através da aplicação de habilidades componentes no momento e local apropriados. Os cientistas de computadores desenvolveram uma notação para descrever o fluxo seqüencial das operações da máquina. Os elementos desta notação são a caixa de teste (Fig. 12-6) com uma entrada e duas saídas, correspondendo comportamentalmente a uma discriminação, e a caixa de operação Fig.12-7) com uma entrada e uma saída, correspondendo comportamentalmente a uma seqüência fixa de respostas.

60048152

entrada entrada

operaçao

saída 2 saída

Figura 12-6 Figura 12-7

- 265-

A Fig. 12-8 é um diagrama de fluxo de testes e operações que descrevem as etapas que levam à solução do nosso problema de encontrar a diferença entre dois números. Um sub-elo (visto em pontilhado) descreve o comportamento de observação que precede o processo real de solução do problema. O comportamento pode circundar várias

Início

Figura 12-8. Diagrama de fluxo comportamental para se encontrar a diferença entre do::, números

- 2 6 6 -

vezes esse elo antes de alcançar as condições de que permitem o avanço da cadeia. O pedir emprestado é visto como um caminho que pode ter que ser percorrido, dependendo dos resultados do teste do inferior mais à esquerda do diagrama.

O arranjo das habilidades componentes na estrutura vista na Fig. 12-8 garante uma “solução” para o problema definido. Comportamentalmente, uma “solução” constitui-se da produção de uma situação (SD) com certas propriedades. No caso presente, este é um número que, quando somado a 152 resulta em 60048. Quando um conjunto de contingências, testes e operações pode ser arranjado de modo a dirigir o comportamento para a produção inevitável de um da solução, referimo-nos à cadeia resultante como um algoritmo. Muitos problemas práticos do cotidiano, desde costurar e cozinhar até calcular e desenhar, são analisados em termos dessas cadeias algorítmicas de comportamento.

12.9 CADEIAS DE COMPORTAMENTO ENCOBERTO

Uma das características principais das cadeias de linguagem é a sua capacidade de se tornarem encobertas, de modo que é difícil dizer por observação direta o que a pessoa está fazendo, se o estiver, quando está resolvendo um problema “por si mesma” . Como nos referimos repetidamente ao comportamento como tudo o que se pode observar que um indivíduo fazendo, existe aí um problema real de definição. Estamos lidando com o comportamento quando uma criança resolve um problema de subtração “para si mesma”? Por inferência, existe uma razão para se acreditar que uma cadeia ramificada do tipo da Fig. 12-8 realmente está se processando, embora a observação minuciosa da criança não revele movimento dos lábios, língua, olhos ou bôca. O valor de tal inferência, naturalmente, encontra-se na sua capacidade de prever e explicar outros comportamentos.

Uma das teorias mais interessantes de J. B. Watson (1914-1920) foi a redução do fenômeno conhecido como pensamento em termos de cadeias de comportamento encoberto. Watson citou, em apoio a esta teoria, o fato de as crianças, se não punidas por isto, frequentemente pensarem alto. De fato, uma história de aproximação sucessiva de respostas cada vez mais silenciosas é necessária para fazer a criança “falar para si mesma” . Além disso, quando os adultos solucionam problemas difíceis, seus lábios frequentemente se movem e se o problema é muito difícil, o indivíduo pode começar a falar abertamente. Watson supôs que a evidência para a linguagem encoberta, provavelmente, poderia ser detetada por instrumentos sensíveis ligados aos músculos usados na linguagem. Ele sugeriu que, ao se pensar em atividades tais como andar de bicicleta ou dirigir um carro, ocorrem respostas de pequena escala nos músculos do corpo normalmente usados nestas atividades.

A teoria de Watson tinha precedentes históricos. Platão havia observado que o pensamento e a linguagem estavam intimamente ligados a vários autores do século XIX chegaram quase a antecipar Watson. Mas ninguém antes de Watson atreveu-se a expor a tese de que todo pensamento era resposta encoberta. Vista com um enfoque moderno, a posição de Watson pode parecer mais ou menos extrema, dependendo dos preconceitos filosóficos de cada um. Mas, cientificamente falando, a equação proposta entre pensamento e contrações musculares é desnecessária e, talvez, intestável. Todavia, a noção de que as cadeias de comportamento podem tornar-se reduzidas em magnitude até que não sejam mais observáveis a olho nu, permanece como uma proposição científica capaz de

- 267 -

gerar experimentos, identificando-se ou não algum ou nenhum “pensamento” com estas cadeias. Neste sentido, a hipótese de Watson permanece como um desenvolvimento criativo importante na h istória da ciência comportamental.

Infelizmente, pouca experimentação conclusiva resultou da hipótese de Watson. Em sua própria época, aparelhos de registros sensíveis ainda não haviam sido aperfeiçoados ao ponto necessário para se fazer as medidas exigidas. Dois experimentos, entretanto, feitos em 1930, fornecem alguma evidência preliminar de que a resposta encoberta ocorre nos músculos apropriados quando são dadas, aos sujeitos, instruções para “pensar” .

Num experimento, colocou-se eletrodos em várias partes do corpo do sujeito (bíceps direito e esquerdo) e o sujeito foi instruído a imaginar o movimento de um membro (Jacobson, 1932). As respostas elétricas dos músculos foram registradas num quimógrafo de movimento rápido (do tipo não cumulativo). Na Fig. 12-9, os registros obtidos do

(A) “Imagine-se erguendo um peso de dez libras com seu braço direito” .

(B) “Imagine-se erguendo-o com o braço esquerdo” .

(C) “ Imagine-se martelando um prego duas vezes, estando o martelo seguro pela sua mão direita” .

Figura 12-9. Potenciais musculares registrados do bíceps direito depois de vários tipos de instruções (segundo Jacobson, 1932).

bíceps direito estão justapostos com as várias instruções que os precedem. As instruções claramente tiveram um efeito seletivo na atividade do músculo e, como mostra o registro (B), o efeito foi localizado no braço direito somente quando a instrução se referia ao braço direito. Durante o registro de (A), (B) e (C ), o experimentador não foi capaz de detetar qualquer movimento real do braço, a olho nu.

Noutro experimento, os eletrodos foram colocados nos músculos da língua e sob os lábios. Sob instruções de se “ imaginar” contando, ou lembrando poemas ou canções ou multiplicando números, os potenciais musculares ocorriam na musculatura da fala do sujeito. A forma da atividade elétrica, embora reduzida em amplitude, era muito parecida com a atividade elétrica que ocorreu quando a instrução “imagine” foi substituída pela instrução de “ fale em voz baixa” . .

Noutros experimentos independentes, os eletrodos foram colocados nos braços de sujeitos surdomudos, cuja linguagem consiste de gestos com as mãos e dedos. Quando os mudos eram instruídos a “pensarem” em palavras ou resolver problemas de multiplicação de forma encoberta, geralmente apareciam potenciais musculares na região do antebraço. Os potenciais musculares de sujeitos que podiam ouvir e falar foram usados como base para a comparação. Sob instruções semelhantes, ou sujeitos normais não apresentaram potenciais nas suas regiões do antebraço (Max, 1937).

Em conclusão, a teoria de Watosn fornece um certo conforto intelectual para o cientista do comportamento: o pensamento tem um lugar no esquema de eventos comportamentais e pode, então, ser descartado como outros fantasmas “mentais” do passado. Mas os experimentos não fluem imediatamente da posição de Watson, talvez um pouco devido às dificuldades de se fazer registros musculares. Mesmo as melhores teorias, frequentemente podem levar a uma complacência que, em vez de favorecer a

(A)

(B)

< C > ♦

- 268 -

pesquisa, pode atravancá-ía. Existem numerosos problemas interessantes a respeito de cadeias encobertas de resposta, como elas são adquiridas, siia superioridade em eficiência em relação às cadeias manifestas correspondentes, questões sobre a sua manutenção, e assim por diante. Mas, enquanto as respostas encobertas forem consideradas apenas uma “explicação” para o “pensamento” , esses problemas pennanecerão enterrados. Neste sentido, o trabalho de Hefferline e Keenan (1963), mencionado na seção 8.5 é animador porque fornece o tipo de neutralidade teórica que promete esclarecer esses problemas e reabrir a discussão sobre as respostas encobertas, tão audaciosamente introduzida por Watson há mais de meio século.


Ferster, C. B., and Skinner, B. F. Schedules of reinforcement. New York: Appleton-Century-Crofts, 1957. Chapter 1 2 .

Hefferline, R. F., and Keenan, B. Amplitude-induction gradient of a small-scale (covert) operant. J. exp. Anal. Behcv., 1963, 6 , 307315.

Jacobson, E. The electrophysiology of mental activities. Amer. J. Psychol., 1932, 44, 677-694.

Kelleher, R., and Gollub, L. A review of positive conditioned reinforcement. / . exp. Anal. Behav., 1962, 5, 543-597.

Lee, B. J. Effects of delayed speech feedback. J. acoust. Soc. Amer., 1950, 22, 824-826.

McCarthy, Dorothea. Language development. In L. Carmichael (E d .), Manual of child psychology. New York: Wiley, 1954.

Max, L. W. Experimental study of the motor theory of consciousness.IV. Action-current responses in the deaf during awakening, kin- aesthetic imagery and abstract thinking. J. comp. Psychol., 1936, 24, 301-344.

Michael, J. Laboratory studies in operant behavior. New York: McGraw- Hill, 1963.

Pierrel, Rosemary, and Sherman, J. G. Train your pet the Barnabus way. Brown Alumni Monthly, Feb. 1963, pp. 8-14.


Watson, J. B. Behavior, an introduction to comparative psychology. New York: Holt, 1914.

Watson, J. B. Is thinking merely the action of language mechanisms? Brit. J. Psychol, 1920, 11, 87-104.

- 2 6 9 -

QUARTA PARTE

13. AQUISIÇÃO DE CONCEITO

14. SOLUÇÃO DE PROBLEMAS E INTELIGÊNCIA

CONTINGÊNCIAS COMPLEXAS

Capítulo 13 AQUISIÇÃO DE CONCEITO

Os princípios elaborados nos capítulos precedentes permitem-nos descrever e classificar uma grande parte do comportamento aprendido de organismos animais e humanos. Mas se terminássemos nossa avaliação do comportamento com as operações aquisição simples, discriminação, diferenciação, encadeamento, reforçamento secundário e generalização, seriamos, então, forçados a admitir que a parte principal do comportamento humano complexo permaneceu intata. As atividades que podem ser classificadas como comportamentos humanos complexos são, naturalmente, muito diversas. Uma característica que todos eles parecem compartilhar, todavia, é uma afiliação íntima com a linguagem. De fato, uma implicação dos capítulos precedentes é de que a existência e o uso da linguagem talvez seja o único atributo comportamental do homem que o distingue dos seus parentes inferiores. Embora possamos concordar que o comportamento inicial de linguagem seja adquirido através do processo de aproximação sucessiva e que as palavras tornam-se S^s, o “significado” da linguagem, contudo, parece estar além dos conceitos derivados de animais no laboratório. O próprio termo “significado” apresenta numerosos problemas de definição. Mas, os aspectos do comportamento humano a que se refere constituem fenômenos bastante reais. Além disso, é claro que qualquer ciência do comportamento que pretenda ser amplamente compreensível deve, eventualmente, dirigir-se para a descrição desses fenômenos. Não podemos ignorar os comportamentos humanos complexos simplesmente porque eles são pobremente especificados. Na verdade, a principal razão pela qual eles são tão pobremente especificados é que eles aguardam uma descrição em termos de uma linguagem geral, compreensivae rigorosa. Assim, a descrição destes comportamentos complexos em termos da estrutura conceituai de fenômenos comportamentais simples resultaria, simultâneamente, na sua compreensão e esclarecimento.

No presente capítulo, portanto, estendemos a análise comportamental para o campo do comportamento humano complexo. Escolhemos como nosso ponto de partida a área conhecida como formação de conceito. São tantas as atividades caracteristicamente humanas que têm sido relacionadas a conceitos — pensamento, compreensão, significado de palavras, raciocínio, solução de problema — que podemos estar certos de que, se se pudermos estabelecer um contato experimental aqui, estaremos numa posição favorável para nos dirigir a uma análise de muitas formas de comportamento humano complexo.

Iniciamos com uma consideração de um tipo de comportamento, desenvolvido no

- 2 7 3 -

laboratório animal, que compartilha de certas propriedades importantes com o comportamento humano conceituai. Novamente, este comportamento de laboratório surge de uma configuração de operações familiares de aquisição, extinção, discriminação e generalização. Devido a suas relações com comportamentos simples e complexos, ele parece representar uma ligação importante entre as duas classes. A simplicidade relativa dos fenômenos de laboratório ajudar-nos-á identificar o termo conceito com certas características precisas de comportamento. Uma vez tenhamos compreendido esta palavra-chave, alguns experimentos simples com sujeitos humanos, onde os aspectos especiais da linguagem não são utilizados, irão elaborar ainda mais a lógica geral do comportamento conceituai Finalmente, guiados pelos nossos paradigmas experimentais, poderemos explorar brevemente os comportamentos humanos complexos associados com termos tais como compreensão, significado, instrução, percepção e (no próximo capítulo) solução de problemas.13.1 DISPOSIÇÃO PARA APRENDER (SIMPLES)

No capítulo 10 (Discriminação), notamos que uma classe de discriminação compreendia duas situações e duas respostas e descrevemos os aparelhos experimentais próprios para o estabelecimento de tais contingências. Um desses aparelhos, o Wiscosin General Test Apparatus, foi mostrado na Fig. 10-5. No WGTA, pode-se apresentar a um macaco ou outro primata vários objetos numa bandeja móvel, sendo que debaixo de um desses objetos encontra-se um recipiente contendo um amendoim. Suponha que sejam usados dois objetos: uma cruz de madeira maciça e um objeto em forma de U, também de madeira maciça. O amendoim é sempre encontrado debaixo da cruz, quer ela apareça à direita ou à esquerda. As duas contingências possíveis podem ser diagramadas como 1

onde a contingência 1 representa a cruz à esquerda e a contingência 2 representa a cruz à direita. Uma resposta “ incorreta” (isto é, R q em 1, o u Re em 2) leva à remoção da bandeja. Depois de um pequeno intervalo, uma das contingências é novamente colocada em efeito. Uma resposta “correta” (isto é, Rg em 1, ou Rj) em 2) produz um amendoim (S+). Após um pequeno intervalo, uma das contingências é novamente estabelecida. Chamemos de uma tentativa uma única apresentação, pelo experimentador, de uma ou outra das situações e contingências de f l3 :l |.C o m o que sabemos sobre discriminação, podemos estar certos de que, dado um número de tais tentativas, ocorrerá um processo comportamental. Durante as primeiras tentativas, o comportamento do animal não estará sob o controle da cruz e, logo, Rs incorretas ocorrerão: Rp em 1 e/ou Rg em 2. Eventualmente, todavia, a medida que mais tentativas são realizadas, o comportamento do animal, gradualmente, passa a ficar sob o controle da localização da cruz. Uma vez que este processo é gradual, dezenas ou centenas de tentativas, dependendo da espécie e de diferenças individuais, podem ser necessárias para se atingir um valor assintótico de aproximadamente 100 por cento de respostas “corretas” .

1 — no decorrer deste capítulo, Rg, Rç e Rq referir-se-ão a pegar o objeto à esquerda, no centro e à direita.

[13.1]R E -* S + e Rd ^ s +

2

- 2 7 4 -

Até agora, descrevemos apenas um conjunto de contingências de discriminações de 2S— 2R. Denominemos um único conjunto de tais contingências (como em [13.1]), um problema de discriminação. Suponha que, uma vez o processo de discriminação tenha atingido sua assíntota, apresentemos uma nova série de congingências. Escolhemos o novo problema de modo que ele difira das contingências anteriores apenas em relação aos objetos usados como seus 2 Ss; por exemplo, uma esfera de madeira maciça e um cone de madeira invertido. O problema, com exceção disso, é idêntico. Qual será a natureza deste novo processo de discriminação? De fato, é muito semelhante ao primeirc processo. C animal começa desempenhando pouco melhor do que se e sp e ra r^ pelo acaso. Mas, eventualmente, ele passa a escolher o objeto correto (agora a esfera) todas as tentativas. Uma inspeção mais detalhada destes dois processos pode revelar, todavia, um deslocamento ligeiramente mais rápido em direção à assíntota, no segundo caso.

Esta comparação de dois processos sucessivos de discriminação sugere um interessante delineamento experimental geral. Evidentemente não estamos limitados a um. dois, ou mesmo alguns de tais problemas de discriminação. Podemos continua» a apresentar novos problemas, um depois do outro, enquanto pudermos encontrar objetos diferentes e nossa paciência aguentar. Felizmente para o último fator, descobrimos que, à medida que apresentamos mais e mais problemas, os processos de discriminação tornam-se apreciavelmente mais rápidos. Embora dezenas a centenas de tentativas possam ter sido necessárias para se chegar ao desempenho assintóticonos problemas iniciais, talvez menos de meia-dúzia de tentativas sejarn necessárias para um desempenho sem erro quando 100 discriminações tiverem sido aprendidas. Eventualmente, depois de várias centenas de problemas, descobrimos um resultado notável. O macaco, agora, é capaz desolucionar qualquer problema deste tipo, imediatamente. Se, por acaso, ele escolhe c objeto correto na primeira tentativa, ele continua, daí em diante, a escolher o objeto correto. Sc, por acaso, escolhe o objeto errado na tentativa 1, ele inverte o padrão de resposta imediatamente e escolhe o objeto correto da tentativa 2 em diante. Em ambos os casos, o desempenho do macaco é quase sempre perfeito a partir da tentativa 2. De fato, a apresentação de uma longa série problemas semelhantes erradicou o processo gradual de discriminação. Ficamos com um animal que soluciona novas discrimi íações imediatamente. .

O exemplo precedente ilustra o desenvolvimento de uma disposição para aprender (leaming-set ou L-setj, um paradigma geral estudado extensivamente e assim denominado por H. F. Harlow. A Fig. 13-1 mostra mais precisamente os resultados obtidos do procedimento de disposição para aprender em macacos rhesus. Cada curva da Fig. 13-1 é a média de um número de processos de discriminação. Os processos são apresentados apenas nas tentativas de 1-6. A chave logo abaixo do gráfico diz exatamente que discriminações são representadas por cada curva. A Fig. 13-1, então mostra com detalhes as mudanças médias na forma dos processos de sicriminação sucessivas. O processo de discriminação de 1-8 é gradual e em forma de / e é claro que a sua assíntota se encontra além da sexta tentativa de aqirsição. O processo médio para os problemasde 9-16 é menos gradual; a curva é mais inclinada e atingirá sua assíntota mais rapidamente. Os processos subsequentes são ainda mais inclinados, até o problema 232, depois do que não há um “processo” propriamente dito. Há somente o resultado: na tentativa 2 o macaco quase sempre acerta. 1

- 275 -

4 5 6Tentativas

DiscriminaçõesH i m i i |-8 ------------- 33-132

------------- 133 -232*♦+++++•►+ 233-288 ------------- 289-344

9-1617- 24 25-32

I igura 13.1. Mudanças cm blocos sucessivos de processos de discriminação de 2S 2R.As curvas são os resultados médios de oito macacos, mas podemos supor que sejam representativas de um único sujeito (segundo Harlw, 1949).

É este resultado comportamental de se apresentar sucessivamente contingências de discriminação semelhantes — uma habilidade adquirida para solucionar qualquer um de uma classe de problemas de discriminação semelhantes com eficiência máxima — que usualmente é descrito como uma (L-set). A natureza adquirida de tal habilidade sugere que ela pode ter um processo característico próprio. E, realmente, a curva que descreve o desenvolvimento do I^set pode ser derivada da Fig. 13-1, se usarmos o desempenho na tentativa 2 como um índice do seu desenvolvimento. A eficiência máxima para solucionar este tipo de discriminação seria indicada pelo desempenho sem erro na tentativa. 2. Deve ficar claro que o desempenho na tentativa 1 não pode ser acima de 50 por cento correto. De imediato, o macaco não tem uma base para discriminar qual dos dois novos objetos é o correto e, assim, ele apanhará o objeto correto ao acaso. A Fig. 13-2 mostra o nível de desempenho na tentativa 2 em função do número de problemas previamente apresentados. A figura é então, uma descrição conveniente do processo de aquisição do L-set. Um aspecto importante do processo visto na Fig. 13-2 é o seu caráter gradual e contínuo. Assim, a habilidade para solucionar um problema de discriminação numa tentativa é adquirida através de um processo gradual.

- 276 -

Número médio de discriminações anteriores.

1'igura 13-2. Um processo de disposição para aprender (L-set), derivado dos dados da Fig 13-1., baseado no desempenho da tentativa 2.

Ao contrastar o processo de discriminação da Fig. 13-1 e o processo de L-set da Fi<:13-2, note que na discriminação, a variável independente: o tempo em relação à qual o comportamento muda com a exposição prolongada a um procedimento constante é chamada de tentativa. No processo de L^set, por outro lado, a variável independente: tempo em relação à qual o comportamento muda é chamada de problemas. Note também que o resultado de cada processo individual da Fig. 13-1 é chamado uma discriminação; mas o resultado do processo da Fig. 13-2 é um I^set — a habilidade de solucionar um tipo de discriminação imediatamente.

Não devemos supor que a disposição para aprender seja restrita ao tipo particular de discriminação descrito em nossos exemplos. Nas discriminações das Figs. 13-1 e 13-2, o comportamento é gradualmente colocado sob o controle de um entre dois objetos — o objeto que cobre o amendoim reforçador na tentativa 1. Mas a noção geral de um L-set consiste de uma habilidade adquirida para solucionar discriminações de uma determinada classe ao primeiro contato. Assim, o colocar o comportamento sob o controle do maior entre dois objetos, o objeto verde ou o de forma triangular entre dois objetos, constitui outros Insets de 2S — 2R simples que podem ser convenientemente estabelecidos por um procedimento semelhante a este descrito. Em geral, podemos supor que o procedimento de l^set é aplicável sempre que fôr possível se estabelecer um conjunto de problemas de discriminação relacionados. Apôs o animal ter sido exposto a um subconjunto desses problemas, ele pode adquirir a habilidade para solucionar todos eles.

Se tentarmos formular o paradigma da (L-set), descobriremos que ele possui um

PROCEDIMENTO • Uma série de discriminações relacionadas é apresentada noorganismo;

PROCESSO : Os processos individuais de discriminação gradualmentemudam sua forma de lenta e gradual para rápida e abrupta;

RESULTADO : Discriminações novas, mas relacionadas, são resolvidas como máximo de eficiência.

- 277 -

O termo Uset é normalmente empregado com referência ao resultado deste paradigma.

13.2 ALGUMAS VARIÁVEIS QUE INTERFEREM NA AQUISIÇÃO DA DISPOSIÇÃO PARA APRENDER (L-SET)

Harlow (1959) fez um resumo das pesquisas sobre a formação do L-set nas quais usou várias espécies de organismos, incluindo crianças. As crianças testadas nesses procedimentos tipicamente superam chimpanzés e macacos no desempenho geral mas elas também apresentam um processo contínuo de aquisição do L-set. Os primatas inferiores na escala filogenética ao macaco rhesus — micos e saguis, por exemplo — mostram um processo de aquisição de Uset mais gradual que o descrito na Fig. 13-2. Mesmo depois de 1000 ou mais problemas, a assíntota de seus processos de L-set é significativamente mais baixa que o desempenho perfeito. Outros animais, como ratos e gatos, mostram um aumento da inclinação nos processos sucessivos de discriminação, mas nunca alcançam resultados sofisticados no Lset dentro dos limites dos experimentos que têm sido executados. Todavia, recomendamos cautela ao se concluir que L-sets verdadeiros são uma habilidade privilegiada dos primatas, em vista das dificuldades metodológicas em se estabelecer ordena omparáveis de “ problemas” de discriminação para animais in f e r io r e s

O num ero de tentativas destinado para cada problema afeta nitidamente a aquisição do L—set Uma vez que os processos iniciais de discriminação são os mais graduais, um grande número de tentativas é necessário nos primeiros problemas para que o comportamento atinja um determinado critério, digamos um desempenho 70 por cento correto. À medida que são dados mais problemas, o processo de discriminação acelera-se e menos tentativas são necessárias para se chegar àquele mesmo critério. Esta diferença foi considerada ao se obter as curvas da Fig. 13-1. Para os primeiros problemas realizaram-se 50 tentativas e para os últimos apenas 6 ou 9 tentativas.E interessante notar, todavia, que mesmo quando poucas tentativas, por exemplo, 6 , são realizadas para todos os problemas, o L-set ainda emerge. Desta maneira, mais problemas, naturalmente, são necessários para compensar o número menor de tentativas por problema. A combinação ideal tentativa-problema tem que ser ainda elaborada.

A taxa de L-set é uma função da dificuldade dos problemas sucessivos de discriminação. Harlow manteve todos os problemas na mesma série uniformemente difíceis. Uma progressão gradual de discriminação fácil para difícil pode produzir o L-set mais eficientemente.

13.3 L-SETS MAIS COMPLEXOS

Evitamos usar o termo “ conceito” nas discussões precedentes sobre L-set mas parece natural perguntar se podemos dizer, em relação a um organismo, que possui um L-set para o maior de dois objetos, ou para o verde entre dois objetos, que ele possui o conceito “ o maior de dois” ou “ o verde de dois” . Tais especulações estariam em boa companhia, porque o próprio Professor Harlow levantou a hipótese de que “ todos m conceitos tais como triangularidade, vermelhidão, número, e lisura surgem somente da formação de L-set (Harlow, 1959, p. 5 10).

- 278

Adiando, por enquanto, uma definição rigorosa do termo conceito, apenas sugerimos que o “conceito” adquirido nas Figs. 13-1 e 13-2 é “o objeto entre dois debaixo do qual havia um amendoim na tentativa anterior” . Sua descrição verbal é maior que a dos conceitos mencionados por Harlow. Falta uma palavra única que o identifique, talvez porque as contingências que compreendem este conceito são raras 110 mundo fora dos laboratórios de comportamento dos macacos. Um exemplo de um L-set mais complexo será útil para esclarecer a relação estreita entre L-set e conceitos.

Uma classe importante de L-sets consiste de discriminações de “singularidade” . Nessas discriminações, um grupo de objetos é apresentado. O reforçamento é contingente à escolha de um único objeto que difira, de algum modo, dos outros objetos do grupo. Tal discriminação pode consistir das contingências vistas na Tabela 13-1. Estas contingências contêm dois tipos de objetos, seis situações e três respostas.

Tabela 13-1UM GRUPO DE CONTINGÊNCIAS DE SINGULARIDADE

SITUAÇÕES RESPOSTA REFORÇADA

S , O A AR es 2 A O O

S3 A O AR cs< O A O

S s A A OR dS r O O A

Uma vez o sujeito primata tenha adquirido a discriminação a um certo nível do critério, um novo problema é apresentado. Dois novos tipos de objetos são usados no novo problema, mas as contingências permanecem de tal modo que a posição do objeto singular entre os três é novamente correlacionada com o reforçamento. Depois de uma série de vários destes problemas, o macaco adquire uma disposição para aprender que poderia ser chamada de “escolha o objeto singular entre três”. O sujeito bem treinado na ilustração da Parte Quatro, p. 271 está demonstrando o comportamento típico desta L-set. O desempenho sofisticado do macaco rhesus é alcançado somente depois da apresentação de muitos problemas semelhantes. Estes resultados indicam o grau de sucesso dos procedimentos de L-set ao colocar o comportamento operante de animais sob o controle de relações bem sutis existentes nas situações.

Tal controle comportamental em sujeitos humanos é frequentemente abase sobre a qual empregamos a palavra “conceito” . Por exemplo, concordamos que uma criança tem o conceito de propriedade quando ela pode discriminar suas próprias possessões daquelas de qualquer outra pessoa. Dizemos que uma criança tem o conceito de uma frase substantiva quando ela pode escolher frases substantivas entre sentenças não familiares. Similarmente, creditamos-lhe o conceito de igualdade de número quando ela pode identificar quantidades iguais em conjuntos não familiares, por exemplo, quando ela pode equiparar o número de contas numa jarra com o número de maçãs em cima de uma mesa. Todavia estas ilustrações são apenas sugestivas. Logicamente, precisamos de uma definição mais

- 279 -

rigorosa de “conceito” se desejamos examinar em detalhes a relação entre L-sets e conceitos. Será conveniente, portanto, voltarmos a alguns dos primeiros experimentos sobre formação de conceitos com sujeitos humanos. É aqui que encontramos uma tentativa explícita para traduzir a formação de conceitos, em sujeitos humanos, em termos comportamentais, com a questão sistemática. “O que uma pessoa faz quando se diz que ela revela um conceito”? Quando esta questão puder ter uma resposta satisfatória, estaremos em condições de determinar os procedimenos pelos quais estes comportamentos conceituais são adquiridos.

13.4 EXPERIMENTOS SIMPLES SOBRE A FORMAÇÃO DE CONCEITO EM SUJEITOS HUMANOS

C.L. Hull (1920) tomou como seu ponto de partida o estudo da formação de conceito a história através da qual uma criança adquire o conceito de “cachorro” .Uma criancinha encontra-se numa certa situação, reage a ela aproximando-se e ouve dizer que isto se chama “cachorro”. Depois de um período indeterminado de intér- venção, ela encontra-se numa situação algo diferente e ouve dizer que aquilo se chama “cachorro” . Mais tarde, encontra-se numa situação ainda algo diferente e ouve dizer aquilo também se chama “cachorro” . Assim o processo continua. As experiências de “cachorro” aparecem em intervalos irregulares (Hull, 1920, p. 5).

Como um resultado dessas “experiências” , surge um momento em que se diz que a criança possui o conceito de cachorro. A interpretação dada por Hull a este conceito foi uma “característica mais ou menos comum a todos os cachorros e incomum a gatos, bonecas e ursinhos” (Hull, 1920, p. 6 ).

Se um conceito consiste de uma característica comum a um grupo diverso de situações, deve ser possível estabelecer condições de laboratório para estudar como o comportamento passa a ficar sob o controle das características comuns de um grupo de situações. Como elementos para seus conceitos experimentais, Hull escolheu os 144 caracteres chineses vistos na Fig. 13-3. A nao familiaridade destes caracteres para seus sujeitos, universitários americanos, assegurou que nenhum dos conceitos experimentais havia sido previamente adquirido. De modo a produzir grupos de situações contendo uma característica comum, selecionaram-se grupos de caracteres contendo certos elementos comuns. Note, por exemplo, que na Fig. 13-3 todos os caracteres na fileira 1 contêm em suas estruturas, de um modo geral diferentes, o traço comum em forma de escova.Em geral, cada caráter numa determinada fileira horizontal está relacionado a todos os outros nessa mesma fileira por possuir algum elemento comum. No experimento, os caracteres foram combinados em grupos (colunas verticais da Fig. 13-3) de modo que cada grupo continha um e somente um dos caracteres com um elemento comum particular. Mostrava-se, então, aos sujeitos, os caracteres do grupo 1, um de cada vez e pedia-se-lhes que dessem a resposta de identificação verbal de acordo com o que se vê na coluna esquerda da Fig. 13-3. O nome correto era pronunciado pelo experimentador poucos segundos depois da apresentação de cada caráter. A tarefa do sujeito era nomear o caráter antes que o experimentador o fizesse. A primeira tentativa, naturalmente, era diferente, pois permitia que o sujeito tomasse conhecimento do grupo de identificadores verbais. Quando o critério de duas tentativas perfeitas era alcançado, isto é, quando o sujeito nomeava corretamente todos os caracteres do grupo 1 duas vezes numa fileira, os

- 280 -

Elemento comum

Identificadorverbal

ooyer

r £ f i

-ETImg iA :

deg

chun

vo

na

Grupo 1 2 3 4 5 6

# HÊ & & & & & &

f a t o M « á í # £

72 caracteres teste

s ( * & & & ãM & & M & . X

mm&wQíer£ £ f e ^ r í L £ .3 ? : M r n f á í R & f è

M & &J£ % M M « ;m aX \ $ * & % £& Z t t â f i i í H

m u m m w k *

Figura 13-3. Os 144 caracteres chineses usados por Hull para estudar a aquisição de conceito. São mostrados para cada série a resposta de identificação verbal e o elemento comum (Hull, 1920).

caracteres do grupo 2 eram apresentados até que todos fossem identificados, então os do grupo 3 e assim sucessivamente, até o grupo 6 .

Uma vez que o sujeito tivesse aprendido a identificar estes 72 caracteres chineses (6 grupos x 12 caracteres por grupo), o experimentador fazia um teste de generalização. Ele apresentava os restantes 72 caracteres, mas não mais pronunciava o identificador. Seria o sujeito capaz de identificá-los, mesmo çiunca os tendo visto antes? Hull descobriu que os sujeitos identificaram corretamente mais de 70 por cento destes novos caracteres. De fato, os sujeitos frequentemente faziam identificações corretas, embora fossem incapazes de verbalizar a regra para a inclusão numa classe particular.

No experimento de Hull, cada membro de uma dada classe de S tinha um certo traço em comum. Smoke (1932) salientou que os conceitos no mundo real raramente, se alguma vez, consistem de uma classe de situações com elementos comuns explícitos. A formação de conceito, geralmente, envolveria uma resposta sob o controle de relações comuns a um grupo de padrões de estímulo. Considere, por exemplo, as figuras da Fig. 13-4 geradas por uma relação bastante artificial sugerida por Smoke. Todas as figuras à esquerda da Fig. 13-4 são membros da classe de S^ denominada “ dax”, enquanto que nenhuma das figuras à direita da Fig. 134 é “dax”. A regra para “dax” é um círculo e dois pontos: um ponto dentro do círculo e outro fora. Smoke descobriu que sujeitos humanos adquiriam rapidamente o comportamento generalizado de categorizar outros padrões como “dax” , mesmo quando seu único “treino discriminativo” anterior consistisse da apresentação de algumas figuras “dax” e não “dax” apropriadamente indicadas e com instruções para se observar as diferenças. Embora fossem frequentemente incapazes

-281 -

Figura 13-4. Amostras de S ^s e S s “ dax” (de Kimble e Garmezy, segundo Smoke, 1932).

de verbalizar a regra para a inclusão na classe, os sujeitos, mesmo assim, podiam identificar corretamente novas figuras “ dax” que não tinham visto antes.

Nos experimentos de Hull e de Smoke, diz-se que os sujeitos adquirem certos conceitos. Podemos agora perguntar de que modo estes experimentos demonstram a aprendizagem de conceito:

1. Tanto no experimento de Hull como no de Smoke, os sujeitos adquiriram a habilidade de dar um rótulo verbal comum para qualquer membro de uma classe de situações.

2 . O comportamento adquirido generaliza-se para novas situações às quais o sujeito não havia sido exposto antes.

3. A classe de situações é determinada por alguma relação comum — um traço ou uma regra geométrica complicada.

Partindo desses dados, somos levados a duas conclusões sobre o comportamento de conceito. Primeiro, diz-se que um organismo revela um conceito quando ele pode identificar qualquer membro de um conjunto de situações relacionadas. Segundo, o organismo adquire esta habilidade através de uma história explicita de reforçamento (ou instruções fundamentadas numa história de reforçamento prévio) na presença de um subconjunto das situações.

Estam os agora em condições de ver a relação do paradigma do L—set c o m a f o r m a ç ã o de c o n c e i t o . O p r o c e d im e n to de L — s e t é simplesmente uma maneira sistemática de ordenar a história de reforçamento que conduz ao comportamento de conceito. Embora os macacos não falem, o comportamento que eles adquirem com os p roced im en tos de L—set parece precisamente análogo ao que os sujeitos humanos fazem, em experimentos sobre formação de conceito, usando respostas verbais. O macaco escolhe o objeto singular de um grupo de objetos que ele pode nunca tervistG anteriormente. O homem escolhe o “dax” entre um grupo de padrões que ele pode nunca ter visto anteriormente. Na vida real, parece que raramente adquirimos nossos conceitos atravéz da progressão ordenada de um problema relacionado para outro, a seqüência característica das disposições para aprender. A criança na escola, em casa e no parque adquire seus conceitos concorrentemente e muito mais casualmente do que em quaisquer arranjos de procedimento no laboratório. Todavia, quando ela pode identificar um novo cachorro como um cachorro, ou uma nova situação social como aquela que requer “boas manpiras” , ela está se empenhando em comportamentos do tipo produzido pelos vários procedimentos que descrevemos.

- 2 8 2 -

Note que o termo conceito, como descrito, não se refere a uma coisa. Como discriminação, condicionamento e extinção, o termo refere-se a certos fatos comportamentais e certas relações entre comportamento e ambiente. A palavra “conceito” denota o fato comportamental de que uma determinada resposta* está sob o controle de uma classe relacionada de SDs. Um corolário interessante dessa definição é que ela não separa um conceito de uma discriminúyão. Podemos lembrar qiie uma discriminação (Resultado) é um nome para o fato comportamental de que um passa a controlar uma resposta operante. Mas sabemos que a generalização toma impossível descobrir um caso perfeito de discriminação onde apenas um controla a resposta. 0 treino discriminativo prolongado pode limitar a classe de eventos ambientais qüe estabelecem a ocasião gara a resposta, mas a classe permanece uma classe. Se tivéssemos sido treinados para dizer “amarelo” na presença de um certo comprimento de onda da luz a probabilidade da resposta “ amarelo”permaneceria alta quando pequenas mudanças fossem feitas no comprimento de onda. Tais resultadçs, que indicam a persistência da generalização mesmo após um longo treino discriminativo, expressam as limitações na capacidade do organismo de fazer discriminações infinitamente refinadas.

Se um conceito também se refere a uma classe de S^s que controlam a emissão de uma resposta, em que ele difere de uma discriminação? Evidentemente, a diferença é apenas de grair nos seus limites, a distinção é vaga e arbitrária. Logo, é plausível se falar ou do concr.tc de amarelo ou da discriminação de amarelo. O emprego da palavra nurti caso particular será determinado meramente pela extensão da classe de S ^s controladores. Se a classe de S^s parecer relativamente pequena, chamamos o comportamento uma discriminação; se parecer relativamente ampla é mais provável chamarmos o comportamento de um conceito.

Embora a noção de extensão per se seja muito imprecisa para permitir uma distinção rigorosa entre conceitos e discriminações com base nos comportamentos observados, ela sugere que a distinção entre os dois pode ser feita em termos de procedimento. Suponha que estivéssemos interessados em treinar um organismo a fazer discriminações cada vez mais refinadas entre um determinado triângulo (S^) e todos os outros triângulos. Nosso procedimento consistiria em apresentar triângulos gradualmente mais semelhantes ao triângulo S^, sem liberar o reforçamento na sua presença. Com efeito, melhoramos a discriminação ampliando a classe de s experimentados. Na formação do conceito de triangularidade, por outio lado, apresentaríamos e reforçaríamos respostas a triângulos semelhantes ao triângulo original, aumentando, assim, a classe de SD. Isto é justamente o que Hull fez oara “oo” , Smoke fez para “dax” e Harlov» fez para a singularidade. Todas essas variantes de procedimento servem gradualmente para estabelecer a agregação de S^s que controlam uma determinada resposta, seja o comportamento dc dizer “oo” , de dizei “dax” ou de selecionar o objeto singular. Os procedimentos para formação de conceitos c discriminações iniciam-se similarmente, com reforçamento na presença de um único S^, mas eles divergem daí em diante para alcançar seus efeito diferentes. O treino discriminativo limita a classe de S^s controladores, enquanto a formação de conceito amplia a classe de S^s controladores. A frase de Keller e Schoenfeld (1950) “discriminação interclasses e generalização intra-classes” é adequada para resumir a característica comportamental de um conceito e nos lembra os processos que participaram na sua evolução.

13.3 ESTUDOS SOBRE FORMAÇÃO DE CONCEITO EM AN1MAÍS

De acordo com a análise apresentada até aqui, um conceito representa o controle adquirido de um conjunto de situações relacionadas (Ss) sobre uma determinada resposta. Na seção precedente, sugerimos que o método geral para estabelecer este controle era o uso anterior de um subconjunto de Ss como SDs num paradigma de discriminação. Esta descrição está de acordo com os procedimentos de treinamento específico de Harlow e Hull que apresentaram uma série de contingências de discriminação relacionadas. A descrição também está de acordo com o procedimento de Smoke, na medida em que supusermos que suas instruções permitiram que seus sujeitos se administrassem um treino discriminativo com os padrões de S^ e S A das figuras geométricas que lhes foram apresentadas. Esses três experimentos representam apenas uma pequena amostra dos procedimentos de treinamento que satisfazem a definição de um procedimento de aquisição de conceito. Existem várias maneiras de se arranjar uma história de discriminação com um subconjunto dos membros de uma classe ampla de Su s relacionados. Na presente seção, consideraremos alguns desses procedimentos adicionais, chamando a atenção, ao mesmo tempo, para a variedade de conceitos que têm sido estabelecidos ao nível infra-humano.

Kelleher (1958) reforçou pressões à chave telegráfica em chimpanzés famintos (num esquema probabilístico p= 0,01 de reforçamento alimentar) apenas quando certos padrões visuais estavam presentes num arranjo de 3 x 3 de pequenas janelas de plexiglass acima da chave. Outros padrões foram associados com contingências de extinção para a pressão à chave. No treinamento do conceito, 13 padrões de SD e 13 padrões de foram apresentados numa seqüência aleatória. A Fig. 13-5a apresenta uma amostra de três dos padrões de SD e três dos padrões de S & . Os registros cumulativos de resposta abaixo desses padrões mostram um desempenho típico alcançado após um treinamento extensivo neste procedimento. As três amostras dos padrões de mostram que a classe de Su foi limitada pela regra “três janelas inferiores iluminadas” . O comportamento da

dois problemas de conceito. Os quadrados escuros correspondem a janelas iluminadas Os traçõs obliquos representam mudanças de um estímulo para outro. Os padrões e as respostas cm S^são indicadas por (+ );os padrões e respostas em S ^ são indicados por ( ) (Kellenher, 1958).

- 284 -

Fig. 13-5a representa uma discriminação estável já avançada, com as respostas limitadas principalmente às ocasiões, em que os padrões de estavam presentes. Em (b), foi feito um teste para o comportamento de conceito, utilizando-se 6 padrões de não familiares e 6 novos padrões de S ^ na seqüência de estímulo, sem alterar as contingências de reforçamento. Três de cada um dos novos padrões são vistos na Fig. 13-5b. Como os registros cumulativos na Fig. 13-5b mostram, o comportamento não foi perturbado, indicando que a formação de conceito foi obtida. O comportamento estabelecido poi uma história de discriminação anterior com um subconjunto de estímulos foi generalizado para novos membros da classe de

Como no exemplo de Hull com os caracteres chineses, esses padrões de da Fig. 13-5a e b têm elementos comuns — iluminação das trcs janelas inferiores. Um resultado um pouco diferente foi obtido quando o experimentador tentou desenvolver um conceito baseado no número de janelas iluminadas. Os padrões de estímulo na seção superior da Fig. 13-5c, ilustram as contingências de treinamento do segundo conceito. Aqui, a classe de é limitada pela regra “ iluminação de três janelas” . Por outro lado, os padrões de S^' contem duas ou quatro janelas iluminadas. Os registros cumulativos da Fig. 13.5c indicam a excelente discriminação alcançada no treino, usando-se a seqüência de 13 padrões de SD e 13 padrões de . Todavia, quando 6 novos padrões de e S A foram introduzidos (Fig. 13-5d), o desempenho deteriorou-se nitidamente. Um número substancial de respostas ocorreu na presença dos novos padrões de SA , enquanto se observou uma diminuição no número de respostas na presença dos novos padrões de S^. O teste crítico para o comportamento de conceito falhou porque não se demonstrou que o responder do animal estava sob o controle geral da classe de “ três janelas acesas” .

Este resultado negativo serve para enfatizar o critério para a existência do comportamento de conceito. Depois de se estabelecer o controle discriminativo de uma R com um subconjunto dos membros de uma classe de S, procuramos ver se o controle discriminativo se generalizou de modo a incorporar os membros restantes da classe de S. Os exemplos descritos nas seções anteriores preencheram o teste requerido; daí, sua designação como comportamento de conceito. Isto não aconteceu com o segundo problema de conceito de Kelleher (Fig. 13-5d). Daí, concluímos que o segundo problema resultou apenas numa discriminação, não num conceito. Todavia, há 9!/3!/6! ~ 84 padrões de possíveis de acordo com a regra três-janelas-acesas, e é possível que o treino com um subconjunto com mais de 13 padrões de fosse bem sucedido no estabelecimento do conceito (Ferster, 1964).

É conveniente comparar o procedimento do experimento de Kelleher com o paradigm a de L—set porque am bos pretendem ser paradigmas de conceito. No procedimento de disposição para aprender, o subconjunto de cada c SAs é arranjado em termos de “problemas" cada um dos quais contendo algumas contingências repetidas. Um novo problema geralmente não é apresentado ate que o anterior tenha sido adquirido de acordo com o critério. No procedimento de Kelleher, todo o subconjunto de cada e é apresentado num único “problema” . Mas seria fácil re-delinear o experim ento de Kelleher, moldando-o na forma de L-sets, através douso de uma série de problemas de discriminação de 2S ---- > IR. Para o conceito 1 ,podemos apresentar p rim eiro

Problema 1:■□ ■□ □ □■■■

versus■□ ■□ □ □■□ ■

- 2 8 5 -

até que o índice de discriminação tenha atingido algum valor arbitrariamente alto. Então apresentaríamos

Problema 2: $ d□ n □□ □ □■ ■ ■

versus S2A■■■■■■□ □ □

e assim sucessivamente. Nosso teste da aquisição do conceito é feito, automaticamente, com o início de cada problema porque neste momento o organismo se defronta com S^s e SA s nunca visto antes.

Poucos experimentos sistemáticos têm sido realizados para testar qual a combinação de todos os possíveis procedimentos treina mais eficientemente o comportamento de conceito. O paradigma da disposição para aprender tem a virtude de proporcionar um;i curva da aquisição de conceito (ver Fig. 13-2) que é uma estimativa do grau dt* obtenção do conceito em qualquer momento durante o experimento. Mas deve ficar claro que, na vida real, aprendemos nossos conceitos de maneira similar à dos chimpanzés de Kelleher para quem várias combinações de S^s e S ^ s apareceram em ordem aleatória.

O fato de os chimpanzés não terem adquirido o conceito de tres-janelas-acesas sugere que o tamanho do subconjunto dos membros de usados no treino é uma variável imporatnte na aprendizagem de conceito. Isto parece estar bem documentado. Andrew e Harlow (1948)treinaram macacos a discriminar um único triângulo de um círculo. Os macacos foram subsequentemente testados em várias situações diferentes que incluíam mudanças na orientação do triângulo original, assim como novos triângulos de tamanhos e ângulos diferentes. Os macacos apresentaram pouca indicação de terem formado o conceito “ triângulo” com a sua história com um único membro da classe de triângulos. No estudo de Hull com os caracteres chineses, um grupo de sujeitos aprendeu a identificar apenas três grupos de caracteres, ao invés dos seis usuais. Para contrabalançar sua exposição a um número menor de grupos, os sujeitos tiveram duas vezes mais tentativas nestes três grupos. Apesar disso, os sujeitos dos três grupos mostraram um desempenho muito pior ao identificar os caracteres que nunca tinham visto. Dentro de limites, parece que a formação de conceito depende diretamente do número ou variedade de S^s empregados no treino.

A técnica experimental conhecida por escolha de acordo com o modelo proporciona um conjunto de contingências de discriminação bem apropriado para o estudo do comportamento de conceito em animais, o comportamento de escolha de acordo com o modelo é estudado convenientemente em pombos, usando um aparelho contendo três discos para bicar, cada um dos quais pode ser transiluminado por cores ou padrões.Para o estudo de escolha de matiz, a seqüência de eventos está descrita esquematicamente pela Fig. 13-6. Durante o treino preliminar, as duas chaves laterais são ocasionalmente iluminadas com luzes de cores diferentes. O bicar uma ou outra chave é, então, reforçado. Quando o bicar está seguramente sob o controle das chaves laterais iluminadas, a cadeia de comportamento pode ser ampliada. As chaves laterais são apagadas e apenas a chave central fica iluminada com uma luz colorida (Fig. 13-6, parte superior). Quando a chave central iluminada é bicada, ambas as chaves laterais são iluminadas e a chave do centro é apagada. Uma das chaves laterais — algumas vezes a esquerda, outras vezes à direita — apresentará o mesmo matiz que a chave do centro apresentou no momento anterior (Fig.

- 2 8 6 -

r- t

O i O

0

E scolha à d ire ita

Padrão na chave cen tra l a té q u e o anim al o ligue

o o o

/ E scolha à esquerda

Reforçamento se a escolha for correta. Caso contário, um breve “time-out” de todas as contingências.

Figura 13-6. A seqüência de eventos na escolha de acordo com o modelo. A iluminação está indicada pelas chaves pontilhadas ou com linhas transversais.

13-6, centro). O bicar a chave lateral que tem o mesmo matiz é reforçado. Uma escolha incorreta, todavia, é seguida pelo apagar de todas as luzes e “time out” de todas as contingências por alguns segundos. Após o reforçamento ou o “ time-out” , a luz central acende-se novamente e uma nova tentativa inicia-se. Experimentos com dois ou três matb.es indicam que o pombo pode ser treinado a escolher matizes de acordo com o padrão com uma precisão acima de 90 por cento (Comming e Berryman, 1961). Nenhum experimento tentou ainda estabelecer um conceito geral de “escolha” usando muitos matizes e muitos padrões. Para estabelecer o conceito geral de escolha, o comportamento de bicar a chave lateral teria que ser colocado sob o controle de qualquer padrão apresentado imediatamente antes na chave central. Quando tais escolhas são feitas com padrões nunca vistos no treino, podemos dizer que o comportamento revela um conceito geral de escolha.

A escolha é apenas um de um número de conceitos relacionados sutis que podem ser estudados experimentalmente através desta técnica de três chaves. Nas contingências indicadas pela Fig. 13-7, requer-se um conceito algo mais complicado. O animal deve bicar a figura que está girada de 90(- no sentido anti-horário, em relação à figura padrão. O estabelecimento destes conceitos em animais, no laboratório, está ainda no estágio preliminar. Há razão para se esperar que sua produção aguarde combinações adequadas dos procedimentos familiares dc aquisição, discriminação e aproximação sucessiva e não quaisquer novos princípios de comportamento.

- 2 8 7 -

O I Op - . l ^ ' ' ^ " " ^ p --1

+© d © © n © h

Figura 13-7. Estímulos para o estabelecimento do conceito relacionai de rotação de 90^ em sentido anti- horário. O + indica a chave onde a bicada será reforçada (Goldiamond, 1966)

Que tais conceitos não estão, provavelmente, além do alcance do pombo é sugerido por uma demonstração interessante feita por Herrnstein e Lovland (1964). Estes pesquisadores treinaram pombos a bicar uma chave plástica por alimento apenas quando uma placa translúcida próxima à chave estava iluminada. Os pombos adquiriram rapidamente a discriminação de bicar quando a placa estava acesa e não bicar quando estava apagada. No procedimento final, a placa foi iluminada com projeções de slides coloridos de 35 mm contendo fotografias de ambientes naturais, incluindo campo, cidades, rios, árvores e campinas. Cada slide era apresentado por cerca de um minuto. Em metade dos slides, havia pessoas em várias posturas e posições e essas projeções eram as ocasiões para o reforçamento intermitente do bicar a chave. Os outros slides não continham pessoas e eram SA s para o bicar a chave. Centenas de slides diferentes foram apresentados durante vários meses de treino com essas contingências. Eventualmente, os animais passaram a iimitar suas bicadas às ocasiões em que os slides com pessoas eram projetados. Quando um novo grupo de slides foi apresentado, os animais continuaram a bicar predominantemente quando havia pessoas presentes, embora nunca tivessem visto estes slides antes. Uma vez que os slides que continham pessoas variavam bastante no número de pessoas mostradas, suas roupas, se estavam perto ou longe, se adultos ou crianças, pode-se dizer que os pombos estavam demonstrando um conceito sofisticado de “pessoa” . Mesmo ás ocasiões em que os pombos erravam eram interessantes. Eles ocasionalmente bicavam quando os slides mostravam objetos frequentemente associados a pessoas tais como casas, barcos e automóveis.

13.6 CLASSES ARBITRÁRIAS DE SD: CONCEITOS DISJUNTIVOS

Nas seções anteriores, sugerimos que, quando o comportamento de organismos está sob o controle discriminativo de membros de uma ampla classe de S^s, esses organismos estão demonstrando um comportamento conceituai. Indicamos vários tipos diferentes de histórias de discriminação que permitem estabelecer-se tal controle complexo. Nos conceitos discutidos, as classes de controlador podem ser descritas como um conjunto de estímulos ligados por uma relação comum de arranjo espacial ou estrutura topológica. Assim, não importando o quão único seja cada animal que constitui a classe de

- 2 8 8 -

“gato” , cada membro desta classe compartilha de certas relações físicas em comum com todos os outros membros. 0 mesmo é verdadeiro para os caracteres chineses agrupados no conceito “oo” , as figuras “dax” etc. Em geral, estas relações comuns caracterizam os nossos conceitos de objetos tais como “casa” , “livro”, “mesa” e a letra impressa “E”. Em outros conceitos como “maior que” , “proveniente de” , “à direita de” /é um membro de”* e “conduz a” , as relações comuns que ligam todos os S^s não são a estrutura espacial mas outros tipos de relações que são identificadas pelas próprias respostas verbais que elas ocasionam . Assim, “maior que” é uma resposta verbal que identifica a relação compartilhada pelos membros da classe de controlador.

Deveria ficar claro que os conceitos relacionais são muito difundidos. Apesar disso, frequentemente pode-se observar que o comportamento está sob o controle de amplas classes de estímulos cujos membros parecem não ter relações comuns de estímulo. Não existe, por exemplo, uma relação óbvia de estímulo físico nos S^s para “alimento” . Uma cenoura, uma ervilha, uma folha de espinafre e um copo de leite aparecem como objetos extremamente diversos. Levando-se em conta apenas suas características visuais, uma ervilha parece-se mais como uma bola de gude do que com uma folha; uma cenoura parece-se mais com um bastão do que com um copo de leite. Uma heterogeneidade semelhante encontra-se nos cristais brancos de iodo, no bromo líquido vermelho e no gás incolor conhecido como cloro que constituem, parcialmente, a classe “halogêneo”. O conjunto de situações apresentadas na Fig. 13-8 controla o comportamento de parar, embora elas tenham pouca semelhança entre si.

a

Figura 13-8. Situações de estímulo fisicamente diferentes que controlam a mesma resposta rparar (Goldiamond, 1966)

Evidentemente, a diversidade nos membros de uma classe ampla de SD não prejudica sua capacidade de controlar uma resposta semelhante. Podemos demonstrar experimentai-

- 289 -

mente o controle apresentado por uma classe de ampla, mas heterogênea, comum procedim ento de L —set. Se treinarm os um m acaco a escolher ou o triângulo ou a esfera entre dois objetos e nunca apresentarmos um triângulo e uma esfere juntos, o comportamento do macaco ficará sob o controle de “triângulos ou esferas” Além disso, o controle se generalizará para novos triângulos e novas esferas. Aqui, a classe de SD controlador consiste de duas subclasses muito diferentes. Os membros triangulares são agrupados devido à sua relação geométrica comum e os membros esféricos também. Mesmo assim, falta uma relação comum entre triângulos e esferas.

Estendendo o procedimento para diversos SDs adicionais, podemos ampliar a classe de SD do macaco para uma lista indefinida de objetos heterogêneos. Se mantivermos os novos elementos de SD não relacionados aos antigos, não haverá razão para se esperar que o macaco generalize para qualquer S novo que decidirmos incluir na classe.

Os exemplos das classes heierogêneas dc S^ do cotidiano e o comportamento do macaco citado no último parágrafo ilustram o que é conhecido como conceito disjuntivo. Os membros da classe de S^ ou triângulos ou esferas, ou cenouras ou ervilhas, ou espinafre ou leite...; ou um guarda de trânsito no cruzamento ou u m a luz vermelha e assim por diante. Em cada caso, uma resposta está sob o controle de uma ampla classe de S^s e, portanto, preenche um dos critérios importantes do comportamento de conceitos. Contudo, a falta de uma única relação comum, algo que una todos os membros da classe, impede a generalização a novos membros, o que é típico de outros conceitos.

A dificuldade em se incluir novos membros de uma classe de S^ disjuntivo na base da generalização pode ser uma das razões pelas quais se diz, algumas vezes, que a humanidade abomina conceitos disjuntivos (Bruner, Goodnow e Austin 1956). Felizmente, muitas vezes é possível encontrar uma relação subjacente entre os membros de uma classe disjuntiva de S^ que pode fornecer a base para a generalização. Por exemplo, os alimentos, embora diferentes em aparência, têm a propriedade comum de serem substâncias que são ingeridas pelos organismos vivos e transformadas em constituintes vitais do corpo. Similarmente, o bromo, cloro e iodo têm a propriedade comum de se combinarem com metais, formando sais cristalinos brancos que, de fato, são intimamente relacionados um ao outro.

Nestes e em muitos outros conceitos disjuntivos, uma relação subjacente é revelada através de uma operação comportamental que transforma os membros de uma classe de SD, originalmente heterogêneas e diversos, em um novo conjunto de membros homogêneos e semelhantes. Essas situações novas têm uma relação comum e esta relação fornece a base para a generalização normal. Algumas vezes, a operação requerida é simples. Para descobrir se certa substância é um alimento , precisamos apenas ingerí-la e esperar pela situação transformada resultante. Para descobrir se alguma substância nova é um halo- géneo, deixamo-la reagir com o sódio e verificamos se um sal cristalino branco “haloge- nado” é produzido.

Frequentemente, pode ser difícil reduzir classes disjuntivas em conceitos relacionais subjacentes. Uma parte significante da atividade científica consiste em se tentar fazer operações em eventos superficialmente diferentes na esperança de transformá-los em situações que são de fato semelhantes. Grande parte deste livro se dedica à elucidação de relações subjacentes descobertas nos eventos comportamentais que, superficialmente, parecem muito diferentes. Por exemplo, um animal bicando um disco e um estudante opinando apresentam uma relação subjacente.

A procura de relações subjacentes é, de modo algum, limitada à ciência. Considere a

- 2 9 0 -

longa tentativa de se descobrir o padrão absoluto para a arte ou a música. Tal padrão, se pudesse ser encontrado, seria uma regra para relacionar as ocorrências extremamente diversas do que identificamos como boa arte ou boa música. O fracasso em se encontrai tais regras pode nos forçar, na exasperação, a concluir que boa música é aquela que os críticos, dizem ser boa; ou, para citar uma ilustração da psicologia, diz-se, algumas vezes, que a inteligência é “o que os testes de inteligência medem” . Ninguém descobriu ainda uma operação para ser realizada em pinturas ou composições musicais que proporcionasse um conjunto de situações em que o genial e o medíocre fôssem inequivocamente distintos. O conceito de genialidade permanece disjuntivo., “Quando parar” também retem uma certa arbitrariedade. Não existe uma operação para transformar os diversos elementos da Fig. 13.8 em elementos que apresentem uma relação de estímulo comum. A classe é feita pelo homem e a escolha dos elementos de estímulo é arbitraria. Por esta razão, não há uma base para a generalização quando um novo S é introduzido. Tudo o que se pode fazer é testar cada novo exemplo à medida que aparece determinando-se a inclusão da classe apenas pelas contingências de reforçamento. Tal classe é estabelecida de um modo similar aquele através do qual formamos, no macaco, o conceito de “triângulo-ou-esfera”.

Em última análise, a única relação comum a todos os tipos de conceitos disjuntjvos é que seus membros diferentes controlam a mesma resposta. Alguns conceitos disjuntivos, por exemplo, alimento e halogêneos, têm uma propriedade além, de modo que seus membros diferentes podem ser transformados e apresentarem uma relação subjacente comum. Outros conceitos disjuntivos tais como a boa música a inteligência podem ter uma relação subjacente; outros ainda, tal como o conceito experimental “triângulo-ou- esfera” , permanecem ihteiramente arbitrários e dissimilares.

13.7 S IG N IF IC A D O E C O M P R E E N S Ã O C O N S ID E R A D O S COMO INTERRELAÇÕES ENTRE CONCEITOS

O significado de uma palavra (resposta verbal) há muito é tido como relacionado à formação de conceito, mas a ausência de uma estrutura sistemática para descrever os conceitos tem dificultado uma análiàe exata da relação. Ao discutir como uma criança desenvolve o conceito de cachorro, Hull equacionou a formação de conceito com a noção de significado. Uma criança sabe o significado de cachorro quando pode, apropriadamente, identificar novos objetos como objetos cachorros. Podemos concordar que o emprego apropriado de uma resposta verbal para identificar os membros de uma classe de SD do conceito é parte do que é tido como saber o significado de uma resposta verbal. Ao equacionar significado com comportamento discriminativo, sentimos que está faltando algo. Considere o conceito de leite. Será que concordaríamos que uma criança sabe o significado de leite quando pode identificar corretamente garrafas de leite, copos de leite e leite derramado? Pode-se dizer que a criança sabe um pouco o significado de leite se tudo o que ela pode fazer é identificar membros da classe de S^, mas somos inclinados a concluir que sua compreensão do conceito não é muito profunda. Analogamente, um chimpanzé pode^ser treinado a escolher os triângulos entre qualquer grupo de objetos, mas poucos psicologos empregariam termos como significado ou compreensão ao descrever o comportamento observado. Significado e compreensão são, todavia, coisas que tentamos ensinar nas escolas. Mesmo a ciência e a arte, algumas vezes, procuram por eles.

Logo, é conveniente perguntar que comportamentos a mais podem estar envolvidos quando se diz que um organismo sabe o significado de, ou comprenede um conceito.

Precisamos primeiro examinar a noção de que um organismo pode adquirir um conceito que, por sua vez, é formado de dois ou mais conceitos. Usando a nossa terminologia, uma resposta (verbal ou outra qualquer), pode ser controlada por uma ampla classe de SD que, por sua vez, pode ser dividida em duas ou mais classes de S^, cada uma controlando sua prnoria resposta particular. Considere, por exemplo, o conceito de “gelo” , cujo equivalente é “ água gelada” . A classe de SD para gelo é, evidentemente, a interseção do conjunto de objetos congelados (C) e o grupo de objetos água (A). Gelo é então, representado pela região sombreada no diagrama Venn de [ 13.2| .

Poucos dos nossos conceitos cotidianos são tão simples como indica esse diagrama, mas a maoria dos conceitos adquiridos pelos organismos humanos podem ser analisados em termos de outros conceitos. Assim, um operante é o < conjunto de respostas>que está sob o < controle de > suas <conseqüências>. Uma enseada é uma < porção de água>< protegida>, com<£ ancoradouros>. Pai é o < progenitor>do <sexo masculino>. Podemos mesmo inventar tais conceitos, como no exemplo tigleão =o <filho> de um <tigr^>< macho> e um <leãq> ^fêm ea^ Muitos desses conceitos são formas generalizadas de

conceito como um conceito c o n ju n t iv o . A natureza composta de um conceito conjuntivo sugere uma questão experimental, a saber, se uma história anterior com seus conceitos componentes afeta a aquisição de tal conceito conjuntivo. Um experimento de Kendler e Vineberg (1954) indica que quando seus componentes são previamente conceituados, um conceito baseado na sua conjunção é adquirido mais rapidamente. Neste experimento, cada uma das 32 figuras da Fig. 13-9 foi desenhada num cartão e a tarefa dos sujeitos era arranjar aleatoriamente, os 32 cartões em duas classes. As respostas de arranjar foram reforçadas com “certo” ou “errado” de acordo com a regra a qual diferia para os diferentes grupos de sujeitos.

Dois grupos de sujeitos foram reforçados para agrupar todas as figuras curvas numa pilha e as figuras retilíneas em outra. Um terceiro grupo de sujeitos foi reforçado para agrupar todas as figuras acromáticas (sem cor) numa pilha e todas as figuras cromáticas (coloridas) em outra. Assim, os três grupos de sujeitos aprenderam primeiro a classificação em termos de forma ou cor. Quando isto estava bem aprendido, as regras para o reforçamento foram mudadas. Os sujeitos do primeiro grupo eram, agora, reforçados para arranjar todas as figuras grandes num grupo e as figuras pequenas em outro, isto é, um arranjo pelo tamanho. 0 segundo grupo era, agora, reforçado para agrupar por cores e o terceiro grupo para arranjar todos os triângulos e crescentes num grupo e todos os círculos e quadrados em outro. No fim desse treinamento, todos os grupos haviam1

[13.2]

- 2 9 2 -

Pequeno Grande

5GÜ

Cores o-

§6

C rom ática ^ *« c? *d3

Acromática

Figura 1 3-9c As 32 figuras usadas p o r K endler e V ineberg (1954) p ara e s tu d a r a aquisição de conceitos conjuntivos.

aprendido dois conceitos, como se vê na primeira e segunda coluna de conceito na Tabela13-2. No procedimento terminal, todos os sujeitos foram reforçados para arranjar os cartões em quatro grupos: curvos pequenos, curvos grandes, retilíneo pequeno, retílineo grande. Tal arranjo é feito na base de conceitos conjuntivos que consistem de conceitos de tamanho e forma. O grupo 1 aprendeu este arranjo final mais rapidamente que o grupo 2, que por sua vez, foi mais rápido que o grupo 3. Os autores concluiram que a taxa de aquisição do conceito conjuntivo está diretamente relacionada ao número de conceitos componentes aprendidos previamente.

Tabela 13-2AS CONDIÇÕES DE TREINO USADAS POR KENDLER E VINEBERG (1954) PARA

ESTUDAR A AQUISIÇÃO DE CONCEITO CONJUNTIVO

Primeiro Conceito Segundo Conceito Terceiro Conceito

Grupo 1 Forma Tamanho Tamanho e formaGrupo 2 Forma Cor Tamanho e formaGrupo 3 Cor

A C vs O □ Tamanho e forma

Na tarefa final do conceito, no experimento de Kendler e Vineberg, dois conceitos componentes (tamanho e forma) foram relacionados, por conjunção, para formar um novo conceito (tamanho-forma). A conjunção é, todavia, apenas uma das muitas maneiras em que os conceitos podem estar relacionados e uma análise de tais relações inter-conceito e mais pertinente para o significado ou a compreenção de um conceito. Argumentamos anteriormente, nesta seção que uma criança que podia identificai exemplos do conceito de leite, ou o macaco que podia pressionar uma barra sempre que fosse apresentado um triângulo, não exibiram todo comportamento necessário para que

• C ■ ▲

© c ü A

c e i A

© c Q A

circulo crescente quadrado triâgiüocurvas rctilíneas

• C ■ A

O c □ A• c n A

© c m Acirculo crescente quadmdo tm ngub

curvas retilíneasF orm a

- 2 9 3 -

pudéssemos dizer que eles estavam demonstrando compreensão. O tipo de comportamento adicional que parece ser requerido está representado esquematicamente na Fig.13-10 para o conceito de leite.

A Fig. 13-10 é explicada como se segue. Cada um dos círculos do diagrama refere-se a uma classe de S^s do tipo descrito previamente. Assim, a criança, para quem pode-se dizer que a Fig. 13-10 tem uma estrutura significante, pode identificar garrafas deleite copos de leite, leite derramado, e assim por diante. Mas ela pode também identificar (com respostas verbais diferentes) vacas de vários tipos, cereais de um tipo ou de outro, queijos, sorvetes e leiteiros. Se ela for uma aluna de ginásio que estuda nutrição, então, ela poderá ser capaz de identificar o soro, a nata e o cálcio. Mas, igualmente importante,o organismo humano sofisticado pode dar uma identificação relacionai para uma situação composta que consiste de um S^ para o leite e um de qualquer outra classe de S^ indicada. Esta habilidade conceituai está indicada pelas linhas entre os círculos com as proposições que descrevem a relação. Cada proposição relacionai, todavia, é também um conceito; na verdade, é o tipo de conceito que encontramos frequentemente nas seções anteriores. O treino requerido para os conceitos relacionais como “proveniente de” e “é um componente de” é precisamente análogo ao treino dado ao macaco quando conceitos como “o singular” , “ o mais alto”, “90 graus de rotação” foram adquiridos. Dizemos que uma criança sabe o significado, ou tem uma compreensão mais completa de leite quando ela pode identificar as relações entre os membros da classe de SD que formam o leite e os membros de várias outras classes de S^

F igura 13-10. Uma represen tação esquem ática do con ce ito de leite e suas relações com vários o u tro s conceitos.

Deve ficar claro que a representação estrutural de significado da Fig. 13-10 está isolada artificialmente. De fato, mostramos apenas as relações entre um único

- 294 -

conceito e um grupo de outros negligenciando as interrelações dos conceitos periféricos com os outros e com todos os conceitos que o organismo' revela. Uma representação completa do repertório conceituai de qualquer indivíduo seria uma tarefa insuperável, embora uma amostra limitada de conceitos e suas interrelações possa ser, possivelmente, descrita,(Reitman, 1965, R. Quillian, manuscrito não publicado).

A Fig. 13-10 é uma maneira grosseira de representar os vários graus de compreensão. Quanto mais densas as interconexões e maior o número de classes de que possam ser unidas, mais facilmente diremos que um individuo compreende um conceito. A compreensão que uma criança tem de leite difere daquela do administrador da leiteria ou do especialista em nutrição, principalmente no número menor de conceitos aos quais a criança pode relacionar o leite. Minha compreensão do meu carro é incompleta comparada com a do meu mecânico, que pode relacionar a palavra carro a milhares de outras classes de incluindo, em particular, o que chamamos as partes do veículo. Contudo, sua compreensão pode terminar com a mecânica da máquina. Um caso interessante é proporcionado pelo físico que pode ser capaz de analisar conceitos tais como fricção, aceleração, trabalho e energia a um nível muito mais básico que o mecânico poderia. Mas quando seu carro não dá a partida, o físico não estará preparado para repará-lo, a menos que possua conceitos tais como feixe de mola, vela de ignição, cilindro, distribuidor e suas várias interrelações. As interrelações entre os conceitos, para qualquer indivíduo, depende da história passada deste indivíduo: as contingências para o chofer de automóvel estão ligadas a certos conjuntos de situações, as para o mecânico a um outro e para o físico ainda a outro. As diferenças entre seus repertórios conceituais sugerem uma distinção de nível embora, frequentemente seja muito difícil estabelecer, na prática, os níveis relativos de conceitos.

Numerosos autores estudaram uma ou outra relação entre conceitos na tentativa de esclarecer, em geral, a estrutura relacionai entre os conceitos. Muitos de nossos próprios conceitos mostram uma estrutura hierárquica interessante (Welch, 1947; Brown, 1958 a, b). Isto é, o conceito cachorro, por exemplo, pode conter como seus membros poodles, dalmatas, cães de caça.

Seres

A nim ados Inan im ados

V egetais A nim ais

Peixes Aves Q uadrúpedes

[13.3]

Cavalos C oelhos | C achorros]

D alm atas Poodles Terriers

O cachorro do o u tro lado da rua

- 2 9 5 -

terriers e assim por diante. Mas Príncipe, meu dâlmata é tambem um conceito completo. Considere todas as situações em que podemos usar a palavra “Principe” para identifica-las: o Principe em casa, o Principe fora de casa caçando gatos Principe acordado etc. A estrutura hierárquica se estende a ambas direções o Principe não é apenas um cachorro - é um quadrúpede , um animal e um ser animado (Brown, 1958a). Evidentemente, as classes de S^que formam os nossos conceitos podem ser ou conjuntos contendo outros conceitos ou subconjuntos de outros conceitos. Por exemplo, ver o dia - grama 13.3 . Adquirir um repertório verbal que colocará um conceito no seu lugar apropriado numa hierarquia é uma parte importante do que queremos dizer por compreender um conceito. n

E por responder às interrelações entre conceitos, ou classes de Su que as respostas de linguagem têm uma vantagem especial sobre outras formas de comportamento. Para ensinar uma criança que o leite é proveniente das vacas, não é necessário trazer uma amostra de leite e uma vaca para a criança e reforçara escolha do leite sob uma série de contingências análogas às contingências da “escolha do acordo com o modelo” que usamos com o pombo. Se a criança já adquiriu os conceitos < vaca >< leiteiros > e< é proveniente de > , isto é, ela emprega as palavras “vaca”, “ leiteiros” e “é proveniente de” , nas situações apropriadas, podemos tratar diretamente com o comportamento verbal. Podemos, primeiro, fornecer uma deixa verbal e, então, reforçar a sentença composta: “o leite é proveniente das vacas” . A única vantagem da linguagem é que, ao contrário de barras, chave e botões, ela proporciona um repertório de resposta portátil que o organismo pode carregar além das situações originais em que o comportamento foi modelado. Além disso, quando as respostas de linguagem de um organismo podem ser colocadas sob o controle discrim in ativo das situações arbitrárias que constituem a palavra impressa, ou as palavras faladas de um segundo organismo, esta vantagemi adquire ainda mais força. Mas essa grande flexibilidade no controle e emissão do sistema de comportamentos que chamamos de linguagem pode ser também uma desvantagem por apresentar a possibilidade de aquisição de cadeias verbais sem o amplo controle de SD ambiental colateral característico de conceitos. Uma criança pode adquirir o que chamamos verbalism os vazios. John Dewey, um conhecido teorista da educação, da geração de Thorndike, uma vez perguntou a um grupo de crianças escolares o que elas encontrariam se cavassem profundamente a terra. Foi recebido com olhares vazios. A professora rapidamente, explicou a Dewey que ele havia feito a pergunta de modo errado. “Qual é o estado do centro da terra? ” ela perguntou. A resposta veio em coro: “Fusão ígnea” . Aqui, uma seqüência verbal estava sob o controle discriminativo das palavras faladas por um segundo organismo (a professora), mas parece que nenhuma criança seria capaz de identificar qualquer dos membros das classes de SD <Jusãq> ou < ígnea>, ou relacionar o conceito <centro da terra>com <cavar na superficie>. Estas são as diferenças principais entre o que muitos educadores chamam de memorizaçãt de cor e aprendizado significativo. Muitas crianças aprendem o Juramento à Bandeira sem compreender sequer uma palavra dele; isto é, sem serem capazes de identificar exemplos dos conceitos representados pelas várias palavras do Juramento.

A presente análise ajuda a esclarecer o papel da definição na linguagem. Considere a definição familiar de um operante = uma resposta que está sob o controle de suas conseqüências. Tal definição é uma proposição de um conceito composto constituído de < resposta > < sob controle de > e < conseqüências - Os estudantes, algumas vezes, tentam adquirir a cadeia verbal do lado direito do sinal de igualdade, pre

- 2 9 6 -

parando-se para serem apresentados com apenas o termo do lado esquerdo, num teste. Mas muitos instrutores têm expectativas maiores. Uma definição é dita ser compreendida quando pode ser analisada gramaticalmente, isto é, decomposta em seus conceitos componentes. Se esta análise é efetuada sucessivamente, conceito por conceito, eventualmente, atinge-se um ponto onde os componentes do conceito original são reduzidos a conceitos simples, em vez de compostos. Cada um desses conceitos simples so podem ser especificados, fazendo-se uma lista de algumas das situações reais do ambiente que constituem sua classe S^. Neste nível,diz-se, algumas vezes, que o conceito ê primitivo. Ilustramos esse tipo de análise conceituai na Fig. 13-11. Esta figura, como a Fig. 13-10, é apenas uma outra maneira de se representar a estrutura parcial do significado. Parece que o grande poder de uma definição está na sua habilidade de codificar um grande número de conceitos e suas interrelações numa única unidade de comportamento verbal. A definição típica seria um exemplo muito complexo do tipo de conceito estudado por Kendler e Vineberg.

As notas nesta seção fornecem um indício do que está faltando nas análises experimentais do comportamento de conceito nas seções anteriores. Nestas, os pesquisadores, ao treinarem seus animais através da L—set ou de outros procedimentos de conceito, têm tentado estabelecer apenas um único conceito. De modo a simular a forma mais simples de compreensão, pelo menos três conceitos

Operante = [Resposta] | S ob o controle de | süãs [conseqüências]

A classe dc jcom poi | ^ cst s°b ° c°n- Urr [:estímulo| que segue uma resposta r trole de P quando

Qéuma função de P J

Qualquer coita que um organism o | faz |

Correr Saltar Dizer “ da” Uma unidade do | ambientef

Uma j descrição | física das energias presentes a qualquertempo dado capaz de controlar o comportamento do orgaaismo

O telefone alimentoperto de João apresentado a *oca um pombo

Três objetos numa bandeja, diretamente em frente de um macacc

Figura 12-11. Uma analise parcial da definição da palavra Operante em alguns dos seus conceitos componentes. Os conceitos comportamentais importantes estão dentro dos quadvados c além disso são analisados.

- 297 -

parecem necessários: duas classes independentes de e uma classe a mais de que conteria, entre seus elementos, situações compostas consistindo de um elemento de cada uma das duas primeiras classes de S^. Isso seria equivalente a dois conceitos e um conceito relacionai unindo seus membros. A tecnologia comportamental precisa ainda ser desenvolvida ao ponto de se poder colocar um número de comportamentos sob o tipo de controle ilustrado pelas Figuras 13-10 e 13-11, mas um progresso nessa direção está ilustrado no comportamento do macaco nos dois quadros da Fig. 13-12. No quadro inferior, o macaco está escolhendo um objeto de forma entre três e seu comportamento está parcialmente sob o controle da cor da bandeja. Quando esta cor é mudada, como no quadro superior da Fig. 13-12, o macaco escolhe o objeto de cor diferente entre os mesmos três objetos. Aqui, dois conceitos relacionais foram desenvolvidos pelos procedimentos de disposição para aprender: “Singularidade de forma” e ‘singularidade de cor” e ambos estão sob o controle discriminativo da cor da bandeja. Mas mesmo estas demonstrações são pequenas para simular as interrelações complexas características da “compreensão” . Nestes e em outros experimentos com animais descritos neste capítulo, apenas um repertório limitado de resposta é desenvolvido. Parece que a análise experimental das relações de conceitos requer o desenvolvimento de repertórios de resposta mais amplos que tenham um papel análogo ao do comportamento verbal do organismo humano.

13.8 A AQUISIÇÃO DE CONCEITO ATRAVÉZ DA INSTRUÇÃO PROGRAMADA

Uma parte da seção anterior foi especulativa por necessidade, uma vez que a tecnologia comportamental ainda não alcançou um estágio onde uma avaliação detalhada da aquisição de conceito complexo e da interação de conceito possa ser feita em organismos inferiores. Esperamos suplementar nossa informação experimental sobre a aquisição de conceito através da análise da aprendizagem humana mas, quando nos voltamos para o lugar onde a aprendizagem humana de conceito mais sistemática supostamente ocorre, a escola, encontramos muitas generalizações amplas mas poucos princípios. Todos são a favor da aprendizagem significante e contra a memorização de cor. Conceitos, concorda-se universalmente, são o que queremos ensinar e não “fatos vazios” . Mesmo assim, poucos negariam que, enquanto muitas crianças adquirem os conceitos básicos que são os objetivos dos seus cursos na escola muitas outras não o fazem. Isto dificilmente seria devido à falta de material conceituai, pois t) currículo escolar está impregnado de uma variedade de conceitos isolados. Considere alguns exemplos adaptados de Brownell e Hendrickson (1950): nação, governo, constituição cidadão (estudos sociais); lei, elemento, imã, feagente, célula, osmose, massa, ácido, ion/ciência); erosão, latitude, região, mapa (geografia); voz, tempo, flexão, sentenças, parágrafo (linguagem); divisão, fração, expoente, equação, número base (aritmética); escala, tom, clave, intervalo, harmonia (música). Entre esta diversidade de material conceituai seria surpreendente se não conseguíssemos aproveitar algo de um exame crítico de como estes conceitos são ensinados. Infelizmente, existe, uma dificuldade dupla: (1) Nenhum método tradicional de ensino garante a aquisição de conceito, e mesmo assim (2) algumas crianças parecem adquirir conceitos, independente de qual seja o método. Isto mostra a impossibilidade de se extrair dos métodos tradicionais de ensino as condições necessárias e suficientes para produzir a aquisição de conceito. Os métodos apropriados para as classes heterogêneas não permitem um controle adequado

- 298 -

SpSdo13<,cT,Jw'OlK,,ín"írlM9,C0mPl“S" P" “ '"l"‘'nW * ”U“‘~

- 2 9 9 -

das contingências individuais de reforçamento para assegurar o desempenho desejado em cada organismo

As implicações deste fato levaram B. F. Skinner (1954, 1958, 1961) a considerar as possibilidades de um método que permitiria um controle melhor das condições de aprendizagem de cada estudante individual. Skinner propôs que se programasse as contingências envolvidas no ensino das matérias cm pequenos passos sistemáticos e se fornecesse reforçamento imediato para os comportamentos corretos. Skinner notou que os métodos tradicionais não garantiam a resposta do estudante. Ao ministrar uma aula para o estudante, ao lhe dar como tarefa a leitura de um livro ou mesmo com a ajuda de material audiovisual sofisticado como aulas televisionadas, o professor não tem meios de estar seguro de que o estudante está ouvindo ou lendo cuidadosamente. Em termos comportamentais, diríamos que o professor não tem meios de estar seguro de que o aluno está respondendo ativamente.

Figura 13-13. Uma máquina de ensinar. O estudante Ir o quadro e escreve sua resposta. I.ntão. move uma barra para descobrir a resposta correta e compará-la u resposta ísecunde' Skinner, 195R).

- 300 -

As contingências programadas dc Skinner supunham implicitamente os tipos de habilidades intelectuais adquiridas nas escolas, e tradicionalmente vistas como idéias, compreensão, interesses, associações, conhecimento e assim por diante, eram comportamentos operantes complexos. Assim sendo sua aquisição e manutenção deveriam seguir todas as leis de comportamento que já descrevemos. Mas o ensino programado, baseado nos princípios de aproximação sucessiva, discriminação, etc., exige uma atenção mais sistemática para as contingências individuais do que as salas de aula tradicionais permitem. Skinner propôs uma solução para este problema sob a forma de uma máquina para apresentar seriadamente o material de ensino e para estabelecer as contingências de reforçamento para o comportamento. A máquina tem três aspectos essenciais. ( 1) O material é apresentado para o estudante em pequenas porções discretas, chamadas quadros, (2) Este material estabelece a ocasião para algum operante discriminativo por parte do estudante, tal como escrever uma palavra ou sentença, preencher uma lacuna ou escolher uma resposta. (3) O comportamento emitido é reforçado imediatamente, apresentando-se a “ resposta” correta tão logo o estudante tenha respondido e permitindo-lhe avançar para o próximo quadro. Uma dessas máquinas usadas por Skinner é vista na Fig. 13-13. Nesta versão, os quadros estão escritos num disco rotativo, e um quadro dc cada vez aparece no centro da janela. Depois de ler o quadro, o estudante escreve sua resposta numa tira de papel exposta através de uma abertura à direita. Ele, então, levanta uma barra que há na frente da máquina, movendo o que ele escreveu sob uma cobertura transparente e revelando a resposta correta na janela central. Os quadros individuais são organizados em pequenos passos seqüenciais. O estudante pode progredir no seu próprio ritmo através da sucessão de quadros, chamada um programa, cometendo muito pouco erro.

Mas a apresentação de progu.mas desse tipo não se limita apenas a máquinas. Os aspectos críticos — pequenos passos seqüenciais, resposta ativa e reforçamento imediato - podem ser organizados na forma de um livro. Uma amostra de um texto programado encontra-se, neste livro, no Capítulo 4.

Muito tem sido escrito a respeito dos méritos e possibilidades da instrução programada. A elaboração de um programa e uma arte delicada e quando um programa está perfeito o professor programador poderá entrar em contato com um número indefinido de estudantes individuais através de contingências íntimas de reforçamento. Apesar da sua natureza individual que prossegue lenta e metodicamente, procurando estar seguro de que cada ponto é compreendido antes de passar para o próximo. O teste e revisão repetidos de um programa em estudantes individuais até que ele seja bem sucedido em ensinar o que pretende, é uma característica da programação que. com freqüência, falta completamente nos métodos tradicionais de ensino. Essas vantagens da instrução programada podem bem ser a base para elevar a qualidade dos métodos mais convencionais de ensino. Quando há um programa apropriado para ensinar os conceitos básicos, o professor fica l ivre para discutir pontos sutis, levar os estudantes à solução de problemas criativos e para treinar as habilidades adquiridas através da máquina num contexto algo mais relacionado com a vida. A programação está ainda num estágio inicial para que possamos estimar com exatidâb o quão radicalmente ela irá mudar nossas práticas educacionais. De qualquer modo, nosso interesse atual não é este. Estamos interessados no programa como um veículo experimental para a aquisição de conceitos.

É conveniente classificar o conteúdo verbal .que constitui um quadro em dois tipos

- 301 -

de proposições: regras e exemplos (Evans, Holme e Glaser, 1962). Uma regra pode ser considerada como uma especificação geral ou definição de uma classe de SU, enquanto um exemplo pode ser considerado como a ocorrência de um dos membros da classe de SD. Uma instrução programada pode ser encarada como um arranjo de várias regras e exemplos, onde algumas porções de cada regra ou exemplo são omitidas, sendo necessário, então o comportamento por parte do aprendiz para completá-las. Deve estar claro que uma apresentação de um subconjunto de exemplos associados com um?, determinada regra é análoga à apresentação de um subconjunto de Ss individuais de uma ampla classe de e o reforçamento de uma determinada resposta de identificação, digamos, a palavra leite ou a resposta de apanhar o objeto singular.

Considere os quatro quadros de um programa para ensinar alguns conceitos de imagem em poesia, vistos na Fig. 13-14. Antes destes quadros, os conceitos de imagem, objeto e similitude foram ensinados através de exemplos. Os quadros 48, 49 e 50 são três exemplos de uma classe de SD que deve ser identificado como símile. Note que cada quadro é arranjado de modo a permitir que as deixas contextuais aumentem a probabilidade da resposta requerida. Os três quadros usados como S^s e para o símile têm certas similaridades, mas também certas diferenças. Uma vez que o

Figura 13-14. Quatro quadros dc um programa delineado para ensinar conceitos relativos à imagem na poesia ( cortesia de Susan Stitt).

48. Uma imagem que expressa uma similitude entre objetos de classes diferentes, masque não significa exatamente o que diz, é chamado um símile. A imagem “a menina é como uma flor” é u m .......................................................................................Resposta. Símile

49. Pelo fato de expressar uma similitude entre objetos de classes diferentes mas nãosignificar exatamente o que diz, a imagem “a face do homem iluminou-se como o sol” é um ...................................................................................................................... ..Resposta. Símile.

50. Um símile não é introduzido apenas pela palavra como, mas pelas palavras ta!qual, como se ou como quando. Assim, a imagem “o homem está vermelho tal qual um pimentão” é um ...............................................................................................

Resposta. Símile.

51. Por outro lado, uma frase que expressa a identidade entre dois objeto mas não significa exatamente o que diz, não é um símile. Assim, a imagem “seus olhos são estrelas” (é/não é) um símile.

Resposta. Não é_____________ _________________________________________programador deseja que o conceito de símile seja tão amplo quanto possível, as contingências de reforçamento são estabelecidas na presença de uma grande variedade de exemplos da classe de S^. O quadro 51, todavia, é um caso de SA . Na aquisição de conceito em humanos e em animais, é importante apresentar situações onde não haja membros da classe de e retirar o reforçamento da resposta ou, como neste caso, reforçar uma resposta incompatível. O quadro 51 ajuda a estabelecer o que o símile não é.

- 302 -

Outro exemplo de rormação de conceito é mostrado no quadro da Fig. 13-15. Posteriormente, neste programa, o estudante encontrará figuras de outros organismos com e sem seis pernas e com muitos outros aspectos que variam. Mas a palavra inseto só terá deixas e será reforçada na presença de figuras de organismos com seis pemas. Eventualmente, o conceito de inseto se generalizará para uma vasta classe de organismos com seis pemas através desta história com um subconjunto dos membros.

Ainda outro exemplo no campo da análise comportamental é fornecido nos quadros da Fig. 13-16. O conceito a ser adquirido é o de evento resposta. Note que os quatros fornecem SDs e S ^ s para o conceito. Eventualmente, aparecerá num quadro onde se pedirá ao aprendiz que induza a definição geral com base na sua história passada com numerosos exemplos.

Os exemplos de formação de conceito através da instrução programada indicam que as noções fundamentais da aquisição de conceito discutidas nas seções anteriores são aplicáveis também à aprendizagem humana. Os exemplos vistos representam ilustrações razoavelmente simples de como o controle de uma resposta verbal (símile, inseto, evento resposta) por uma ampla classe de S^s pode ser estabelecido através da apresentação sistemática de exemplos, com reforçamento 1 para a resposta verbal desejada. É claro que os conceitos desenvolvidos são conceitos compostos de outros. O símile é composto de certas relações entre os conceitos de objeto, similitude e imagem; inseto é a conjunção de organismos e seis pernas evento resposta é um composto de ação e agente. Num programa completo, cada conceito a ser adquirido é estabelecido através de um conjunto de contingências apropriadas com um subconjunto de seus membros e muitos dos conceitos adquiridos são, então, relacionados entre si através de exemplos compostos apropriados. É este entrelaçamento de conceitos que parece ser o carimbo da verdadeira compreensão de um assunto.

Ao se programar a aquisição de conceito surgem algumas questões sistemáticas relativas ao papel de certas variáveis que o programador tem sob o seu controle. O programador pode controlar o número de exemplos de e S ^ ; pode controlar sua

1 Note que para sujeitos humanos normais '"obter a resposta 'correto ' é frequentemente um reforçador suficiente. Veja, por exemplo, o programa na seção 4.3.

- 3 0 3 -

Figura 1 3-16. Uma série de quadres delineados para estabelecer o conceito de evento- resposta. As Rs corretas estão indicadas pelas letras pequenas à direita do quadro (Mecliner, 1963).

1 . Seu nascimento não foi “um evento-resposta” para você. Você jogar seu chocalho fora do seu berço foi “um evento-resposta” para você.Marque as respostas abaixo que descrevem um evento-resposta para. a pessoa ou animai nelas indicado (nota: você pode marcar qualquer número de sentenças).

a. □ Clara pintou o cabelo de vermelho ab □ Herman morreu.c. □ João tem uma cárie.d. □ Aroldo foi ao dentista. de. □ 0 gato miou. e

2. Quando você bate em alguém, o evento-resposta é seu. Quando outra pessoa lhe bate, o evento-resposta não é seu.Para cada sentença abaixo marque o quadrado se a sentença descrever um evento-resposta para o organismo nela indicado.

a. □ Filipe corre depressab. □ Gregório foi atropelado.c. □ Alice colou no exame.d. n Maria foi pega colando.e. n 0 canário perdeu todas as suas penas.f- □ 0 cachorro pegou o doce no primeiro salto

3. Marque as proposiçoes que descrevem eventos-resposta para você.

a. □ Você resolveu um problema difícil de matemática ab. □ Seu professor lhe deu uma boa nota.c. □ Você é um dentista.d. □ Você está estudand.o para ser um dentista. d

4. A sentença “Um gato corre” refere-se a um evento-resposta.A sentença “Uma pessoa corre” refere-se a um evento-resposta. A sentença “O carro corre” não se refere a um evento-resposta. Marque os eventos-respostas abaixo:

0 furacão passou ontem aqui (para o furacão)Tom bateu em Harry, (para Tom)Tom bateu em Harry, (para Harry)O relógio bateu dez horas (para o relógio)Você come uma cenoura (para você)Um mosquito pica você (para você)Um mosquito pica você (para o mosquito)

a. □b. □c. □d. □e. □f. □g- □

- 3 0 4 -

diversidade e suas seqüências. Ào desenvolver alguns conceitos diierentes, ele pode escolher um exemplo multidimensional concreto, apresentando-o sob vários pontos de vista , ou pode usar vários exemplos mais simples, apresentando cada um sob o único ponto de vista. Há pouca informação sistemática disponível a respeito de qualquer destas variáveis, mas é como um meio experimental que a programação tem potenciais importantes par elucidar relações fundamentais na aquisição de conceito.

13.9 AS CONSTÂNCIAS PERCEPTIVAS

A noção de uma “coisa” como uma entidade imutável está tão fortemente arraigada que talvez seja uma surpresa que coisas tão primitivas como objetos possam ser descritas como conceitos. Imagine que a face de um amigo não seja um único estímulo visual. Algumas vezes, ele aparece na sombra, outras na claridade. Às vezes, ele está sorrindo, às vezes franzindo as sobrancelhas. Algumas vezes, você o vê de perfil, outras, de frente. Além disso, perfis e visões frontais são, por sua vez, uma coleção de perfis e visões frontais, nenhum dos quais é, alguma vez, exatamente repetido. Apesar do fato de que você nunca veja a mesma face duas vezes, você não tem dificuldade para identificar seu amigo. Em linguagem técnica, seu amigo é uma ampla classe de S^s e você responde similarmente a todos os membros.

Considere o objeto mostrado na Fig. 13-17. Todos os quatro desenhos represen tam “ a mesma porta” , contudo, os vários padrões que atingem o olho e que constituem as quatro situações que chamamos “porta” , são bastante diferentes. É claro que para portas, ou qualquer outro objeto que possamos imaginar, o nosso conceito do determinado objeto não consiste de uma única situação, mas de uma ampla classe de situações. Os exemplos que acabamos de dar são casos do que pode ser denominado constância do objeto. Apesar das mudanças marcantes na situação, nós retemos uma resposta constante na presença de todas as suas variantes.

Que tipo de conceito é representado pela constância do objeto? Tomados individualmente, os quatro desenhos da Fig. 13-17 sugerem que o conceito de objeto é disjuntivo, já que essas quatro situações parecem tão diferentes. Mas a Fig. 13-17 é apenas uma amostra do conjunto infinito de situações que variam de aberta a fechada, todas as quais controlam a resposta “porta”. E todas essas situações estão mutuamente

- = r

0

1

0□ • • 1

Figura 13-17 Quatro membros da classe de S ^ “porta” (Gibson, 1950)

- 3 0 5 -

relacionadas pelo fato de que uma situação Aporta” pode ser continuamente transformada em outra. Tal série de transformações relaciona as situações de qualquer objeto particular.

A constância do objeto é apenas uma classe do que é geralmente chamado de constâncias perceptivas. Outro exemplo é mostrado através dos dois pedaços de carvão colocados sobre o papel branco, na Fig. 13-18. Dizemos que o carvão é “preto” e o papel é “branco” sem levar em consideração a intensidade absoluta de luz que apenas ou o carvão ou o papel reflete. À sombra, o pedaço de carvão no painel à esquerda da Fig. 13-18. reflete somente 1 millilambert de luz, enquanto que o mesmo pedaço de carvão à luz do sol (painel à direita da Fig. 13-18) reflete 100 vezes mais luz. Ainda

Figura 13-18. Um caso de constância de cor neutra. Um pedaço de carvão colocado sobre uma tolha de papel branco (Hochberg, 1964).

assim, dizemos que o carvão é preto, embora ele agora reflita 10 vezes mais luz que refletia o papel branco à sombra. A resposta à cor neutra (cinza) depende da iluminação relativa do objeto com respeito ao seu fundo ou região imediatamente adjacente. Assim, “preto” é um conceito já que é a resposta na presença de uma classe ampla de S^s relacionados: objeto que reflete 1 unidade de luz, fundo que reflete 9 unidades de luz objeto que reflete 10 unidades de luz, fundo que reflete 90 unidades; objeto que reflete 100, fundo que reflete 900; e assim por diante.

Um exemplo final é proporcionado pelo fenômeno conhecido como constância de tamanho. À medida que uma pessoa caminha em sua direção, você não é capaz de relatar que sua imagem visual está aumentando de tamanho. Contudo, à medida que ela se aproxima, a imagem aumenta de tamanho na sua retina, de uma maneira inversamente proporcional â sua distância de você. Dentro de limites você diz que ela está do mesmo tamanho, independentemente do tamanho da imagem na sua retina. Desse modo, o conceito de tamanho é dependente de uma classe de SD onde a regra para inclusão na classe é uma função complexa do tamanho retínico do objeto mais os valores de muitas outras variáveis visuais que variam com a distância de um objeto. A Fig. 13-19 mostra que o conceito de tamanho constante não é controlado pelo tamanho retínico constante. Os três cilindros da Fig. 13-19 são todos os mesmo tamanho (meça-os) mas tendemos a classificá-los como progressivamente maiores da esquerda para a direita devido às mudanças na perspectiva linear, uma das variáveis que em geral, muda progressivamente com a distância.

Naturalmente, não é por acidente que as constancias de objeto, cor neutra e tamanho se desenvolvem. Contingências de reforçamento estão frequentemente correlacionadas com os “objetos” (um pássaro deve se manter fora de todas as situações que

- 306 -

Figura 13-19. Resposta ao tamanho quando determinada por variáveis de distância (Gibson, 1950).

chamamos “gato”, se quiser viver muito), bem como as variáveis de estímulo composto que controlam a constância de cor acromática e a constância de tamanho. Raramente, consideramos que> um objeto está mudando de cor ou tamanho quando sua iluminação ou distância muda. Por outro lado, é conveniente classificar aquele animal que está se movendo rapidamente em sua direção como “grande”, embora o tamanho de sua imagem seja ainda muito pequeno. Nossos conceitos espelham-se nas contingências de reforçamento da natureza, embora seja uma especulação interessante

- 307 -

saber se esses conceitos perceptivos são geralmente adquiridos na história passada de cada indivíduo ou se, tendo sido bem adquiridos pelos seus ancestrais, são agora uma parte permanente do seu eauioamento de resposta visual.REFERENCIAS PARA O CAPITULO 13.

Andrew, G., and Harlow, H. F. Performance of macaque monkeys on a test of the concept of generalized triangularity. Comp, psychol. Monogr., 194 8 ,1 9 , 1 -20.

Brown, R. How shall a thing be called? Psychol. Rev., 1958a, 65, 14-21 .Brown, R. Words and things. Glencoe, 111.: Free Press, 1958b.Brownell, W. A., and Hendrickson, G. How children learn information,

concepts and generalizations. In Learning and instruction, 49th Yearb., Nat. Soc. Study Ed., 1950, Part I.

Bruner, J., Goodnow, Jacqueline J., and Austin, G. A. A Study of thinking. New York: Wiley, 1956.

Cumming, W. W., and Berryman, R. Some data on matching behavior in the pigeon. J. exp. Anal. Behav., 1961, 4, 2 8 1 -2 8 4 .

Evans, J. L., Homme, L. E., and Glaser, R. The ruleg system for the construction of programmed verbal learning sequences. J. educ.Res., 1962, 5 5 ,5 1 3 -5 1 8 .

Ferster, C. B. Arithmetic behavior in chimpanzees. Sci. Amer., May 1964, 210, 9 8 -106 .

Gibson, J. J. The perception of the visual world. Cambridge: The Riverside Press, 1950.

Goldiamond, I. Perception, language, and conceptualization rules. In B. Kleinmuntz (E d .), Carnegie Institute of Technology annual symposium on cognition, New York: Wiley, 1966.

Harlow, H. F. The formation of learning sets. Psychol. Rev., 1949, 56, 5 1 -6 5 .

Harlow, H. F. Learning set and error factor theory. In S. Koch (E d .), Psychology: a study of a science, Vol. 2. New York: McGraw-Hill,1959.

Harlow, H. F., and Kuenne, M. Learning to think. Sci. Amer., 1949, 181, 3 6-39 . ^

Herrnstein, R. J., and Loveland, D. H. Complex visual concept in the pigeon. Science, 1964, 146, 54 9 -5 5 1 .

Hochberg, J. E. Perception. Englewood Cliffs: Prentice-Hall, 1964.Hull, C. L. Quantitative aspects of the evolution of concepts. Psychol.

Monogr., 1920, 28, Whole No. 123.Kelleher, R. Concept formation in chimpanzees. Science, 1958, 128,

7 7 7 -7 7 8 .Keller, F. S., and Schoenfeld, W. N. Principles of psychology. New York:

Appleton-Century-Crofts, 1950.

- 308 -

Kendler, H. H. Basic psychology. New York: Appbton-Century-Crofts, 1963.

Kendler, H. H., and Vineberg, R. The acquisition of compound concepts as a function of previous training. / . exp. Psychol., 1954, 48, 2 5 2 -2 5 8 .

Kimble, G. A ., and Garmezy, N. Principles of general psychology. (2nd ed.) New York: Ronald Press, 1963.

Lysaught, J. P., and Williams, C. M . A guide to programmed instruction. New York: Wiley, 1963.

Mechner, F. Science education and behavioral technology. New York: Basic Systems, 1963.

Reitman, W. R. Cognition and thought: an information processing approach. New York: Wiley, 1965.

Skinner, B. F. The science of learning and the art of teaching. Harvard educ. Rev., 1954, 24, 86-97 .

Skinner, B. F. Teaching machines. Science, 1 9 5 8 ,128, 969 -9 7 7 .Skinner, B. F. Why we need teaching machines. Harvard educ. R ev .t

19 6 1 ,3 1 , 3 7 7 -398 .Smoke, K. L. An objective study o f concept formation. Psychol. Monogr.,

1932, 42, Whole No. 191.Welch, L. A behaviorist explanation of concept formation. / . genet.

P sychol, 1 9 4 7 ,7 1 ,2 0 1 -2 2 2 .

- 309 -

Capítulo 14 SOLUÇÃO DE PROBLEMA E INTELIGÊNCIA

O TERMO “PROBLEMA” SURGIU OCASIONALMENTE nas discussões anteriores. lhorndike colocou gatos numa caixa quebra-cabeça que continha uma tramela que pode ser aberta através de vários movimentos (Fig. 1-1). Foi dito que os gatos que não tinham uma história anterior com as contingências deste aparelho se defrontavam com um problema — escapar da caixa. Pode-se dizer, assim, que a aquisição de qualquer comportamento instrumental contem elementos de solução de problema. Nos procedimento de disposição para aprender do último capítulo, descrevemos, conjuntos sucessivos de contingências discriminativas apresentadas durante o treino como uma série de problemas de discriminação. Os macacos solucionaram estes problemas e como resultado adquiriram a habilidade para resolver novos problemas similares como uma eficiência maior.

14.1 A ESTRUTURA DE UM PROBLEMA E A NATUREZA DE UMA SOLUÇÃO

Os problemas que os gatos de Thorndike e os macacos de Harlow tinham diante de si diferem em vários aspectos, mas particularmente nas contingências existentes. As contingências estabelecidas para os gatos eram predominantemehte diferenciações e para os macacos, discriminações. Logo, a notação de um “problema” não denota qualquer classe particular de contingências de reforçamento. Discriminações e diferenciações podem ser problemas. O fato de se um conjunto de contingências pode ou não ser interpretado como um problema para um organismo depende dos comportamentos predominantes quando o organsimo se defronta pela primeira vez com a situação problema. Os gatos de Thorndike, evidentemente, defrontaram-se com um problema,na caixa quebra-cabeça nas suas primeiras tentativas. Eventualmente, à medida que o comportamento que conduzia à abertura da tramela era repetidamente reforçado, a situação perdia sua característica de problema. Tão logo os gatos eram colocados na caixa, eles já se encontravam fora dela. Um desenvolvimento semelhante ocorre na formação da disposição para aprender. O macaco com uma disposição para aprender de singularidade bem formada resolve imediatamente, qualquer discriminação nova de singúlaridade. A situação de singularidade não pode mais ser descrita como um “problema” para este organismo.

Essas idéias simples não estão limitadas a grupos de problemas artificiais estabe-

- 311 -

lecidos para animais nos laboratórios de psicologia. Para um aluno de segundo ano primário

25- 1 8

constitui um problema, mas um ano ou mais depois isto não será mais o caso. Similarmente, você pode não achar que / e “^xdx seja problema, dependendo de se você possui certos comportamentos usualmente ensinados nos textos do primeiro ano de cálculo. No extremo de um continuum, podemos dizer que sabemos “como acabar com as guerras” — um problema desde que uma solução universal ainda não existe. Em resumo, nenhuma classe de contingências, nem qualquer contingência em particular, podem ser descritas como um problema até que saibamos que comportamento o organismo vai apresentar na presença daquela contingência. Tentemos, agora, descrever este ponto de vista mais rigorosamente. Para isso, veremos que os conceitos sobre encadeamento introduzidos no Capítulo 12 são indispensáveis.

Numa cadeia de comportamento, um organismo emite operantes numa ordem seqüencial. A ordem particular é controlada pelas conseqüências estabelecidas para cada operante isolado. Para solucionar um problema de divisão, uma criança bem treinada realiza a multiplicação, subtração, empréstimo, transporte, etc., numa certa seqüência que depende do resultado de várias discriminações. Uma criança sem as habilidades componentes não pode executar a cadeia requerida. Esta criança ilustra a possibilidade de que, em qualquer situação determinada, pode não existir qualquer cadeia que produzirá a situação associada com o reforçamento. Isto pode surgir de uma entre duas maneiras relacionadas. (1) o organismo não adquiriu, no passado, uma parte ou toda a cadeia necessária para conduzi- lo da situação presente, S^, para a situação reforçadora, Sb , embora tal cadeia possa ser conhecida por outros organismos. (2) Não existe qualquer cadeia conhecida cuja execução garanta a transformação de Sa em Sb . Examinemos, agora, vários problemas representativos.

0 problema na caixa-quebra-cabeça revela certos aspectos interessantes da solução de problema. Os gatos foram colocados na situação inicial, a caixa fechada, S \ . Alguns comportamentos foram gerados inicialmente. Os gatos correram, miaram, colocaram suas patas nas barras, arranharam as bordas dos orifícios maiores, olharam em várias direções e assim sucessivamente. Muitos destes comportamentos representam operantes generalizados de uma história passada de reforçamento em situaçõe similares. No passado, quando colocados num espaço pequeno, os gatos, normalmente, escapavam olhando ao redor do ambiente, aproximando-se de qualquer orifício, arranhando as partes soltas do ambiente, e assim por diante. Alguns outros comportamentos, como miar, estão indubitavelmente estabelecidos na estrutura do gato. Independentemente de como foram fortalecidos, certos comportamentos, R i, R2, R3 , R4 ..., surgem na situação problema inicial. Além disso, embora esses comportamentos não sejam aleatórios, eles não estão ainda arranjados na seqüência bem ordenada que é emitida quando o gato, eventualmente, soluciona o problema. O repertório inicial do gato consiste de um conjunto seletivo de comportamentos que ele traz para a situação e com os quais ele opera nela. Eventualmente, uma dessas Rs pode ser bem sucedida em abrir a tramela. Quando isto acontecer, o gato transformou a situação de porta fechada em porta aberta.

- 3 1 2 -

SAR,R2 S (porta aberta)R3 —» R (Sair pela —> Sg (fora da caixa)R4 Porta)

Na nova situação, S(p0rta abertaV 0 Sat0 tem uma secluência de resposta bem estabelecida predominante, sair pela poria aberta. Este problema simples ilustra vários aspectos importantes de solução de problema em geral. (1) Um organismo leva um conjunto de respostas R j, R2 , R3 ... para a situação, ou devido à sua história passada com situações similares ou devido à sua estrutura geneticamente determinada. (2) Essas Rs não são igualmente prováveis de ocorrerem; algumas (arranhar as bordas de orifícios, miar), têm maior força do que outras (explorar o teto da caixa; ficar de pé, parada). (3). Uma vez que uma determinada resposta seja bem sucedida em transformar a situação numa familiar, uma seqüência bem estabelecida pode levar o animal à situação reforçadora, Sg.

Thorndike, assim como outros antes dele, referiu-se aos dois primeiros aspectos descritos como responder por tentativa e erro. O animal emite (“tenta”) muitas respostas na situação problema, a maioria delas consistindo de “erros”. Eventualmente, a R “correta” ocorre, ao acaso, e o animal atinge o “sucesso”. Kohler (1925) criticou

- 313 -

esta caracterização da solução de problema. Ele argumentou que a situação de Thorndike não era represencativa de problemas em geral. Os gatos, dizia Kohler, não podiam, logo no início, observar a relação entre a tramela e a caixa aberta. Mas muitos problemas reais, argumentou, permitem ao organismo observar mais aspectos e relações na situação do que no caso dessses gatos. Assim, Kohler estabeleceu o seguinte problema para os animais (Fig. 14-1). Uma banana foi colocada do lado de fora da gaiola do macaco. Havia duas varas de bambu dentro da gaiola, mas nenhuma delas era bastante comprida para alcançar a banana. Uma vara, todavia, tinha um diâmetro menor e podia ser facilmente inserida em qualquer das pontas da outra vara compondo, assim, uma única vara, bastante comprida para alcançar a banana. Os macacos de Kohler, quando colocados nesta situação, apresentavam, inicialmente, comportamentos que haviam sido reforçados no passado. Eles estendiam uma ou outra vara, movendo-as para frente e para trás em direção à banana. Depois de certa quantidade de extinção, esta resposta enfraquecia. Neste ponto, alguns animais sentavam-se calmamente durante um certo tempo, após o que, de repente, encaixavam as duas varas e puxavam a banana.

Sultão, antes de tudo, agacha-se indiferentemente na caixa colocada um pouco atrás da grade. Então, ele se levanta, pega as duas varas, senta-se novamente na caixa e brinca descuidadamente com elas. Ao fazer isso, acontece de se encontrar segurando uma vara em cada mão de modo que elas ficam em linha reta. Ele empurra a mais fina em direção à abertura da mais grossa, pula corre em direção às grades... e começa a puxar a banana em sua direção com as duas varas encaixadas (Kohler, 1925, p. 27).

Kohler chamou esta solução súbita de insight e sugeriu que isto era uma propriedade típica da solução de problema. Ele afirmava que Sultão e outros sujeitos resolviam o problema porque a estrutura do problema tornava-se clara imediatamente e não porque o comportamento de encaixar as duas varas fosse um operante que predominasse na situação. Birch (1945) todavia, demonstrou que uma certa história passada é crítica para solucionar este tipo de problema. Kohler não especificou com detalhes a história passada de seus macacos.

Birch resolveu pesquisar se a manipulação anterior da vara era essencial. Pegou um grupo de macacos que nunca haviam tido experiências com varas e estabeleceu-lhes contingências de um problema idêntico. Ao contrário dos resultados de Kohler, nenhum desses sujeitos foi capaz de solucionar o problema numa sessão de 30 min. Birch, então, realizou várias sessões em que permitia que os macacos brincassem com pequenas varas. Ele observou que os animais passavam, gradualmente, a usar as varas como extensões de seus braços para cutucar, espreitar, revolver, cavoucar e outras operações similares. Num segundo teste, todos os animais resolveram o problema das duas varas em menos de meio minuto. A conclusão é inevitável. A manipulação prévia das varas é essencial para a solução de um problema que requer isto como uma habilidade componente; a estrutura lógica da situação não ajudará um organismo que não possua quaisquer habilidades para utilizar esta estrutura.

A natureza encadeada dos comportamentos componentes que constituem a solução de um problema nos ajuda a explicar a característica súbita das soluções observadas por Kohler, e outros. Uma vez que o organismo tenha produzido uma

- 3 1 4 -

situação que é uma deixa para uma seqüência bem estabelecida de corpporamento, o problema termina. Uma vez que Sultão havia transformado aquelas duas varas pequenas numa mais longa, o problema chegou a um fim, o que nos permite supor, razoavelmente, que Sultão possuía uma história anterior de cutucar objetos com varas de vários tamanhos.14.2 QUEBRA-CABEÇAS

Para estudar a solução de problemas em sujeitos humanos, os psicologos atribuem uma variedade de tarefas aos seus sujeitos. Algumas delas são os quebra-cabeças. Um quebra-cabeça muito conhecido é visto na Fig. 14-2. 0 sujeito é instruído a unir os nove pontos com quatro linhas retas sem tirar o lápis do papel e sem retraçar uma linha. As linhas podem se cruzar, se necessário. A maioria dos sujeitos tenta resolver o problema com um grupo de operantes de conectar os pontos, traçando as linhas na

Figura 14-2. O quebra-cabeça dos nove pontos

periferia. Essa seqüência falha, todavia, e outra resposta emerge com alta força - traçado de uma diagonal. Esse novo comportamento é de pouca ajuda, já que a diagonal mais as três linhas periféricas deixam ainda um ponto isolado. Muito rapidamente, então, o sujeito exaure seu repertório usual para lidar com tais “problemas” e, neste ponto, ele concordará que aquilo é realmente um quebra-cabeça. Uma solução para o problema dos nove pontos consiste dos prolongamentos de linhas além dos limites da matriz do ponto (veja o apêndice deste capítulo).

O fato de esta solução simples requerer algum tempo e, frequentemente, não ser de todo alcançada, mostra um aspecto importante dos quebra-cabeças. Muitos problemas ou quebra-cabeças são difíceis de serem resolvidos porque eles tendem a controlar respostas muito fortes mas inapropriadas. Os quebra-cabeças, frequentemente, parecem-se com situações passadas em que certas respostas eram adequadas e reforçadas. O problema dos nove pontos por exemplo, é muito semelhante a uma situação que contem apenas oito pontos (imagine que o ponto central da Fig. 14-2 não existe) e que poderia ser facilmente “resolvida” , traçando-se quatro linhas na periferia. A emissão repetida de comportamento inadequado numa situação problema é comumente chamado disposição, usado no sentido em que dizemos que alguém está

- 3 1 5 -

OS PROBLEMAS DA JARPA DE ÁGUA (LUCHINS 1942)

Tabela 14-1

CAPACIDADES DAS JARRAS

NÚMERO DO PROBLEMA A B C QUANTIDADE REOUERIDA

1 29 3 _ 202 21 127 3 1003 14 163 25 994 18 43 10 55 9 42 6 216 20 59 4 317 23 49 3 208 15 39 3 189 28 76 3 25

10 18 48 4 2211 14 36 8 6

“ disposto a alguma coisa” . O restringir as respostas de traçar linhas à periferia da matriz dos nove pontos é um exemplo de disposição. Muitos problemas podem ser resolvidos apenas através de respostas não usuais, assim, é conveniente instruir as pessoas que solucionam os problemas de um modo que sua variabilidade de comportamento aumente. É fácil demonstrar que a disposição está sob o controle da história de reforçamento do organismo. Luchins (1942)' solicitou aos sujeitos que solucionassem uma série de problemas numéricos que requeriam a mensuração da quantidade de água através de várias jarras de medidas. A Tabela 14-1 mostra 11 desses problemas.O problema 1 foi um exemplo introdutório. Mostrou-se ao sujeito que, para obter 20 unidades de água (o valor da coluna mais à direita), ele teria que encher a jarra de 29 unidades e derramar 3 unidades, 3 vezes. O sujeito, então, trabalhava nos outros dez problemas. Note que (excluindo o exemplo introdutório) todos os problemas, exceto o número 9, estão de acordo com a regra B menos A menos 2 C: encha primeiro, a jarra maior, B; então, derrame 1 jarra A e 2 jarras C. Os problemas de 7 a 11, todavia, têm uma solução alternativa usando apenas duas jarras, o que pode ser interpretado como uma cadeia mais simples de comportamento. Contudo, sujeitos do primeiro ano primário até ao nível de pós-graduação raramente empregaram a solução das duas jarras. Sua história de reforçamento nos problemas de 2 a 6 tornaram a seqüência de três jarras forte o bastante para dominar todas as outras cadeias.

A noção de disposição aparece no célebre problemas dos dois cordões, visto na Fig. 14-3. A situação inicial, S^, consiste de dois cordões pendurados no teto de um quarto praticamente vazio. A situação reforçadora terminal, Sb , consiste das duas pontas dos dois cordões amarradas uma à outra. Todavia, a distancia entre os dois cordões é muito grande para que o sujeito alcance um deles enquanto segura a ponta do outro. Numa versão do problema, o único objeto a mais, presente na situação experimental era um relé magnético. A solução do problema é mostrada na Fig. 144.

- 3 1 6 -

O sujeito amarrou o relé ao cordão e colocou-o em movimento, como um pêndulo. Assim, ele poderia pegar o cordão em movimento, enquanto segurava o outro, e as duas pontas podiam ser facilmente amarradas. Os sujeitos que tiveram uma sessão anterior em que foram instruídos a usarem o relé

Figura 14-3. O problema dos dois cordões. Os dois cordões devem ser amarrados um ao outro, embora estejam muito afastados para se segurar um enquanto se pega o outro.

Figura 14-4. Uma solução para o problema dos cinco cordões. O Sujeito amarrou o relé a um cordão e colocou em movimento.

como um componente de um circuito elétrico mostraram-se muito deficientes na solução deste problema (Birch e Rabinowitz, 1951)- Novamente aqui, uma certa história passada (usar o componente elétrico como um componente elétrico) impediu os comportamentos necessários para a solução do problema (usar o compoennte elétrico como um peso).

Como um exemplo final, considere os problemas dos palitos de fósforo da Fig. 14-5. Os problemas dos palitos de fósforo ilustram um aspecto comum a muitos

- 317 -

(A) (B) (C) (D) (E)

L L _LLLI LULL! LU ___ULI LU LULULLUU I I I I U LU

Figura 14-5. Os problemas dos palitos de fósforo de Katona (1940). Em A - C mova três palitos e produza uma nova figura que tenha um quadrado a menos que a figura original. Em D, produza uma nova figura com apenas cinco quadrados, movendo tres palitos. Em E, mova dois palitos e produza uma figura com quatro quadrados.(Ver as soluções no apêndice deste capítulo)’

problemas, a saber, a solução a ser alcançada é especificada apenas de uma forma geral.A legenda da Fig. 14-5 diz quais as propriedades gerais que a solução deve ter mas não expecificada, em detalhes, a situação terminal, S3 . Com exceção do problema dos nove pontos, nossos problemas e quebra-cabeças anteriores especificavam a situação reforçadora exata, Sb, em vez de sua estrutura geral. O macaco solucionava o problema quando a banana estava na gaiola; 0 problema dos dois cordões era resolvido quando os cordões eram amarrados. Mas os problemas dos palitos de fósforo são solucionados apenas quando a contagem de quadrados é igual ao número requerido. Para esses problemas, existem várias soluções aceitáveis, com muitas maneiras para se chegar até elas. (Veja 0 apêndice deste capítulo).

143 ESTRATÉGIAS DE PROCURA DE HEURÍSTICAS

A nossa caracterização geral de problemas enfatizou sua natureza encadeada ou composta. Mas a análise da maioria das amostras de problemas das seções anteriores não requer um encademaento detalhado. Ampliemos portanto, o conceito de um “problema” . Consideremos o cadeado de segredo da Fig. 14-6. A maioria dos cadeados de segredo deste tipo têm 50 ou 100 posições discretas, mas 5 serão suficientes para a nossa ilustração. Pode-se dizer que um homem para quem tal cadeado barra a entrada para alguma situação reforçadora está diante de um problema se ele não tem a seqüência dc comportamentos à disposição para abrir o cadeado. Por outro lado, pode-se executar um algoritmo sistemático (ver seção 1 2 .8) para abrir o cadeado tente

Figura 14-6. Um cadeado de segredo de cinco posições.

- 3 1 8 -

cada combinação até você ser bem sucedido. Esta, provavelmente, é a noção de comportamento de tentativa e erro que Kohler e outros psicólogos atribuíram a Thorndike ao criticarem sua análise da solução de problema pela falta dos elementuspara uma solução estruturada. Contudo, Thorndike nunca relatou que os gatos seempenhavam em todos os comportamentos possíveis em todas as seqüências possíveis. De fato, os gatos restringiam sua atenção aos orifícios e partes moveis da caixa quebra-cabeça, apresentando um conjunto altamente seletivo de comportamentos. Mas um problema de um cadeado de segredo ilustra um responder mais puro por tentativa e erro. Assim, um cadeado de 50 números, que se abre quando a seqüência correta de 3 números é girada, exigirá 50^/2 (= 62,500) seqüências a serem tentadas, em média, antes de se abrir. Se cada seqüência dura 6 seg, o tempo médio para abrir este cadeado será de 4 dias de trabalho contínuo. É óbvio porque tal cadeado serve como umaproteção, mesmo embora quase todas as pessoas tenham uma cadeia algorítmicaapropriada forte que, eventualmente, poderia abrí-lo.

Uma estrutura em árvore é uma maneira conveniente de representar as seqüências de comportamento nesse tipo de problema (Fig. 14-7),. Os círculos ou nódulos numa

Situação original, SA

Sigura 14-7. Uma estrutura em árvore representando alguns dos comportamentos e situações resultantes que surgem do girar os números do cadeado da Fig. 14-6. O “ segredo” (3,5,4) é visto como linhas pontilhadas que ligam os círculos cheios. Por questão de espaço, apenas algumas das ramificações do terceiro nível (inferior) são mostradas.

estrutura em árvore representam as situações que podem ser produzidas pelas várias respostas disponíveis para o organismo. Assim, o nódulo superior é a situação original, onde nenhum número foi ainda girado. Os 5 primeiros números possíveis são vistos como nódulos no nível imediatamente inferior. Analogamente, os 25 nódulos no próximo nível representam o conjunto de situações que resulta do girar ainda um outro número. As possibilidades no nível inferior, resultantes do girar um terceiro número, são tantas (125) que podemos representar convenientemente apenas uma amostra destas no diagrama. Na árvore da Fig. 14-7, as linhas representam as respostas operantes de girar. A estrutura nos proporciona uma maneira de representar as situações possíveis que podem surgir quando todas as respostas disponíveis em um problema são especificadas e todas as suas conseqüências resultantes conhecidas. Examinando a Fig. 14-7, fica claro que um homem que deseja abrir este cadeado terá que percorrer muitas ramificações até que ocasionalmente, acerte.

- 319 -

Muitos outros problemas podem ser representados na torma de uma árvore de seqüências operantes e suas situações resultantes. Se um simples cadeado de 5 números pode levar a tantas ramificações possíveis (125), como será que um indivíduo sempre resolve problemas realmente difíceis tal como descobrir uma boa jogada no xadrez, integrar uma função, provar um teorema da lógica? As situações possíveis que resultam de apenas doze tipos distintos de respostas conduzidos a um nível de seqüência igual a 12 é 1212 Evidentemente, a tentativa e erro simplesmente não seriam suficientes para solucionar um problema de qualquer dificuldade.

Suponha que houvesse alguma maneira da pessoa que soluciona o problema limitar suas operações alternativas. Isto é, suponha que se dissesse ao indivíduo .que o primeiro número no tipo de cadeado da Fig. 14.6 comumente é 3. Em geral, os problemas que são solúveis têm associadas a eles várias regras ou heurísticas que permitem que o organismo restrinja sua topografia de resposta a certos grupos de operações. Essas heurísticas são geralmente caracterizadas como regras práticas que ajudam a limitar a seqüência de comportamento. Ao contrário de um algoritmo, seu emprego não garante uma solução, mas frequentemente ajudam a encontrá-la. Podemos supor que os gatos de Thorndike exibissem tais heurísticas quando limitavam sua atenção aos orifícios e partes móveis da caixa quebra-cabeça. No passado, estas respostas compensavam com maior freqüência do que outros comportamentos. Uma heurística possível para o problema do cadeado de segredo pode ser a observação de que, algumas vezes, as pessoas fecham um cadeado e deixam o último número da combinação na posição. Isto não é sempre verdadeiro, mas pode servir como uma heurística útil. Nos problemas complexos, é conveniente diagnosticar se está ocorrendo um retrocesso ou um progresso em direção à solução. Isto é, se se está “ ficando quente” . À medida que retrocedemos de é frequentemente possível interpretarmos as situações intermediárias (nódulos) como mais próximas ou mais distantes da situação terminal, Sg- Suponha que coloquemos um homem com os olhos vendados numa sala grande e digamos-lhe que sua tarefa é atirar um dardo na mosca çlo alvo. A localização da caixa de dardos e o alvo não lhe é conhecida. Permitimos ao nosso sujeito duas respostas, caminhar e atirar os dardos. Concordamos em avisá-lo, todavia, depois de cada passo que ele dá, se ou não está chegando mais perto da caixa de dardos. Além disso, uma vez que ele chegue até a caixa e comece a atirar os dardos, avisá-lo-emos se os seus lançamentos estão próximos ou distantes do alvo. Isto é uma versão do brinquedo de chicote-queimado (“você está ficando mais quente”) e se o nosso alvo não fôr muito pequeno, o nosso sujeito solucionará este problema rapidamente. Mas, é óbvio que um homem que não receba os S^s progressivos (“avisos”) ao longo do caminho poderá nunca solucionar o problema.

Em geral, uma análise da solução de problema tem a forma de (1) notar as heurísticas apropriadas que restringem a topografia da resposta a serem usadas e as situações que valem a pena ser exploradas; (2 ) notar as discriminações intra-problema importantes que devem ser feitas para que se possa detectar se uma resposta colocou o organismo mais perto ou mais longe da situação terminal.

Se estes são realmente os componentes críticos do comportamento de solução de problema, deve ser possível incorporá-los na estrutura de uma máquina que poderia, então, resolver problemas semelhantes. O comportamento desta máquina pode ser de interesse por várias razões. Primeiro, ela poderia verificar a suficiência do conjunto de heurísticas e discriminações que podemos supor como necessárias para qualquer con-

- 320 -

junto determinado de problemas. Segundo, variando as jcaractensticas da maquina poderemos descobrir um meio de desenvolver um solucionador de problemas mais eficiente c, então, aplicar essas descobertas à prática educacional. Devido à sua rapidez de operação (25.000 ou mais operações por seg), o computador digital é ideal para explorar esses modelos de solução de problemas. As representações das situações podem ser programadas, várias operações correspondentes às respostas do organismo podem ser simuladas e uma estratégia para transformar sucessivamente uma situação em outra pode ser construída na máquina. Newell e Simon (1963) descreveram um programa dc computador chamado General Problem Solver (GPS) para tratar com certos quebra-cabeças e problemas. O programa emprega uma variedade de estratégias de procura heurística e testes de discriminação para avaliar se as situações recém- criadas representam um progresso em direção à situação terminal, Sb -

Um dos seus problemas é o domínio da lógica simbólica. Pode-se pedir à máquina que prove que (Rl>\P). (^ .R ^ Q ) é equivalente aO; ,(^ Q.P). Dá-se à máquina a mesma informação que um universitário possui, a saber, uma dúzia de regras para transformar os símbolos através da adição de termos, supressão de termos, mudanças das conexões, dos sinais, dos grupos, e assim por diante. O programa que torna o computador um solucionador de problemas proporciona-lhe a habilidade de aplicar essas regras (responder) e discriminar as diferenças entre as situações que ela produz. E o mais importante, talvez, o programa proporciona-lhe um número de heurísticas para dirigir sua procura através da árvore do problema. Uma heurística conveniente restringe o GPS de tentar transformar uma situação (nódulo) se esta fòr mais difícil de transformar do que uma situação anterior (nódulo). O GPS constrói os seus próprios critérios de dificuldade de transformação. O GPS espera que as diferenças entre as suas situações sucessivamente geradas, Sj, S2 , S3 e a situação terminal, S[$, diminua á medida que prossegue trabalhando através de suas séries de transformações. Se isto não acontecer, o GPS volta a um nível superior (em direção à S \ ) e percorre uma nova ramificação. Outra heurística força o GPS a abandonar uma ramificação quando esta vai abaixo dc uma determinada profundidade (a diminuição vertical na Fig. 14-7) e a situação Sb ainda não apareceu. O GPS parece resolver seus problemas tão bem quanto estudantes universitários e, talvez mais importante, frequentemente incorre nos mesmos tipos de erro. Outros programas para solucionar demonstrações geométricas, jogar xadrez c damas, integrar c estabilizar linha de montagem tem sido projetados, todos empregando as idéias de estratégias de procura dc heurística.

14.4 IDENTIFICAÇÃO DO CONCEITO

Quando um indivíduo adquiriu um conjunto dc conceitos pelos métodos do Capítulo 13, a sua habilidade em induzir ou identificar qualquer conceito particular através da inspeção de apenas alguns membros S^ do conceito pode ser de interesse. Apesar de certas semelhanças dc procedimento entre a aquisição de conceitos e a identificação de conceito, o último é mais propriamente tratado no contexto da solução de problema. Na identificação de conceito, temos um sujeito que já adquiriu todos os conceitos empregados no experimento. O processo de aquisição de conceito está bem sedimentado. Suponha que mostremos a um sujeito uma figura de um pássaro, um avião e um balão e pedimos-lhe que “ identifique” (nomeie) o "conceito” (a classe de So) que eles exemplificam. O sujeito adquiriu há muito tempo atrás o

- 321 -

conceito dc fc‘objeto voador” através de uma história de discriminação com lais objetos.Agora, sua tarefa é simplesmente apresentar o comportamento verbal adquirido, dando o nome k4objeto voador” . Em geral, a tarefa do sujeito na identificação dc conceito consiste cm examinar um número de situações e induzir o conceito delas (isto ó, propor uma regra geral para a classe de S^). Ele é informado, para cada situação, se esta é ou não um caso da classe de desconhecida. Nesta tarefa, tipicamente o sujeito emprega estratégias, ou seqüências sistemãticas de respostas, que levam à identificação correta.

Bruner, (ioodnow e Austin (1956) apresentaram os 81 cartões vistos na Fig. 14-8 aos seus sujeitos. Esses cartões variavam de quatro maneiras; (1) o número de figuras (1, 2 ou 3 );(2) a cor das figuras (vermelha, verde ou preta); (3) a forma das figuras (... cru/, círculo ou quadrado ) c, (4) o número de linhas periféricas (1, 2 ou 3). Primeiro, mostrava-se ao sujeito um determinado cartão (digamos, aquele com três círculos vermelhos c duas 1 in lias periféricas, 30V2p) e dizia-se-lhe que esse era um caso positivo de um conceito que ele deveria identificar. O sujeito era, então, avisado dc que poderia escolher cartões adicionais entre os 80 restantes para obter informações. Depois dc cada escolha, ele era avisado se o cartão particular que escolhera era ou não

O O

o o o

O O

o o o

□ □

□ □ □

□

5 ± l

\j ê J

□ [o o

fc>oo] o o o >□□□ FIH • • • 1 p m aj

o I ° I D ll F I ■Ti 2 J E Ia JIo o o o □ □ i llllll

01

fp<x>l l0 0 ° l !□□□ l - l M lFigura 14-8. Um conjunto de cartões usados para estudar a identif icação de conceito. As formas variam em (1) número, (2) forma, (3) cor, e (4) número de linhas periféricas (Bruner, Goodnow e Austin, 1956).

um caso do conceito. Quando a tarefa consistia de identificar conceitos conjuntivos (círculos vermelhos, duas figuras verdes, etc.), a maioria dos sujeitos adotou uma estratégia que consistia em escolher cartões que variavam em uma e somente uma dimensão do cartão positivo inicial conhecido. Dessa maneira, cada seleção eliminava um ou mais conceitos. Um exemplo dos tipos de seqüências de éscolha usando essa estratégia seria o seguinte:

- 3 2 2 -

30V2p (+) o exemplo inicial positivo dado20V2p (+) primeira escolha: elimine “três” figuras como um

elemento relevante.3QVerde2p (—) segunda escolha: retenha o “vermelho” como um

elemento relevante.3±V2p (—) terceira escolha: retenha o “circulo” como um

elemento relevante.30Vlp (+) quarta escolha: elimine “duas linhas periféricas”

como um elemento relevante.Logo: o conceito é “círculos vermelhos” .

Bruner, Goodnow e Austin demonstraram que um número de variáveis, tal como o tipo do conceito a ser identificado, a maneira em que os 81 cartões eram expostos e o número de exemplos que se permitia aos sujeitos escolherem, afetava o tipo de estratégia sistemática empregada.14.5 A MENSURAÇÃO DE HABILIDADES PARA SOLUCIONAR PROBLEMA:

TESTES DE INTELIGÊNCIATalvez, nenhuma palavra seja tão mística em toda a psicologia quanto “inteli

gência” . É uma palavra que todos empregam mas dificilmente definem. Desde 1905, os psicólogos mantêm a curiosa “posição de preparar e defender os testes de inteligênciae, então, negar sua responsabilidade por eles, dizendo que “ninguém sabe o que a palavra realmente significa ” (Wechsler, 1958). Veremos que a solução de problema proporciona um veículo conveniente para tratar o tópico inteligência. Em todos os testes que se propõem a medir a inteligência, veremos apenas uma série de problemas proposta a um sujeito e várias medidas do seu desempenho registradas.

A idéia de um teste de inteligência, ou como preferirmos chamá-lo, um teste de solução de problçma, suigiu originalmente de considerações puramente práticas. Em 1904, o psicólogo francês Alfred Binet foi encarregado de preparar um teste que apontasse aquelas crianças cujas deficiências em solucionar problemas tornava improvável que elas pudessem tirar proveito da instrução regular da escola. O testes resultante de Binet era uma série de problemas com gravuras, blocos de madeira, tabuleiros, etc., próprios para serem administrados a uma criança de cada vez. Este foi o primeiro teste de inteligência que obteve sucesso. Durante a Primeira Guerra Mundial, surgiu uma necessidade premente nos Estados Unidos de avaliar as habilidades para solucionar problemas de vários milhões de convocados o mais rápido possível. Testes de lápis e papel que poderiam ser administrados, simultaneamente, a um grupo de recrutas foram desenvolvidos para suprir essa necessidade e foram aplicados na seleção de homens para várias tarefas. Com o tempo, estes testes de grupo passaram a ser universalmente empregados. Muitas escolas, atualmente, usam seus resultados para selecionar estudantes. Universidades e escolas de pós-graduação confiam enormemente nos seus escores para decisões sobre admissão. Nossa preocupação, todavia, não é com a aplicação prática de tais testes. Desejamos, em vez disso, averiguar certas contribuições que os testes de inteligência têm fornecido à nossa análise dos comportamentos humanos de solucionar problema.

Qual é a natureza dos problemas usados nos testes de “inteligência”? Não há melhor maneira de descrevê-los do que através de exemplo. No teste típico, aparece um número de subtestes destinados a avaliar várias habilidades para solucionar

- 3 2 3 -

2 s a/ / / / /////

Quantos blocos existem?

(“ ba (“ bhJ S_B_Qual bandeira é igual à da esquerda?

ixioiyioioixioioioi i i ii ii r n

Complete a série tie Sx e OsL

Se X vem antes de U no alfabeto, marque oA abaixo

Caso contrário, marque o B

B

Marque o grupo de letras diferente CCZO AC BC SC LC RC MA

Se quatro IáF:s « ustam 50 centavos, quantos você compraria

com 1 cruzeiro?________

□ □ f f l H B f f l

Ache o caminho da saída

INICIO h

1 i X L

L

Copie esta figura começando pelo circu'o

esta para Assim como esta para.

Figura 14-9. Amostras de itens do tipo usado nos testes grupais de lápis e papel para habilidades dc solucionar problemas (Kimble e (.arme/y, 1963 ).

proD lcm a. Uma amostra de um conjunto de itens é apresentada na Fig. 14*9. Os itens da Fig. 14-9 testam uma variedade de habilidades. Alguns problemas baseiam-se principalmente em habilidades de linguagem, outros em habilidades discriminativas e perceptivas. A maior parte procura empregar itens que testem habilidades gerais para solucionar problema e a habilidade para aplicar conceitos amplos e disposição para aprender. Esse ideal, todavia, nunca c completamente realizado.

Os escores obtidos com testes de solução de problema deste tipo nos dizem algo sobre as habilidades relativas para solucionar problema de indivíduos num determinado grupo cultural. No restante desta seção (1) examinaremos algumas cias variáveis a que os escores têm sido relacionados, e (2) faremos uma análise mais detalhada dos próprios escores.

Um dos resultados melhor documentado é a função que relaciona os escores de solução de problema à idade do sujeito. Curvas típicas que ilustram a relação básica em cinco sujeitos que foram testados e re-testados em várias idades são vistas na Fig. 14-10. Os cinco indivíduos bastante diferentes da Fig. 14-10 continuaram a progredir em suas habilidades para solucionar problemas no decorrer de um período de 25 anos. Por volta dos 25 anos, a taxa de aumento na habilidade de solucionar problema começa a diminuir para alguns sujeitos, mas não todos. A população em geral mostra uma queda aguda antes dos treze anos e apenas um ligeiro acréscimo na habilidade de solucionar problema entre os 20 e 50 anos.

Suponha que desejemos relacionar o escore de solução de problema de um indivíduo com o escore de pessoas da sua idade. Para isto, é necessário administrarmos um determinado teste para muitos indivíduos da mesma idade. Uma vez tenhamos os

- 3 2 4 -

escores do grupo, podemos comparar os escore^ de qualquer indivíduo com aqueles dos outros no grupo. Um aspecto interessante destes escores de teste é que eles se apresentam aproximadamente com uma distribuição normal.

Idade (anos)

I• igurn 14-10. Habilidade para solucionar provlcina cm tun^ão da idade( Baylcy,1955 ).

Isto é, se testarmos bastante indivíduos, as frequências relativas em que os vários escores possíveis ocorrem podem ser descritas pela curva em forma de sino da parte superior da Fig. 14-11. Nas seções 2.6 e 10.9, vimos que existe uma relação íntima entre o desvio padrão e a percentagem de medidas que caem nas várias regiões da curva normal. Fssa relação permite-nos estabelecer a escala de percentil vista logo abaixo da curva. Se, por exemplo, olharmos detalhadamente a Fig. 14-11, veremos que o ponto +2 O em relação à média corresponde ao percent il 98. Um escore no percentil 98 indica que apenas 2% dos escores são maiores do que seu valor. Similarmente, o ponto +1 c está no percentil 84, a média no percentil 50, e assim por diante.

Um método ainda mais comum de expressar a habilidade relativa de solucionar problema é encontrar um “Quociente dc Inteligência” , definida como

escore obtido na solução de problema01 - 100------------------;--------------------------------------

escore médio na solução de problema

O escore do indivíduo é o numerador deste quociente. O denominador do quociente é o escore médio na solução de problema do grupo de indivíduos da mesm* idade. (Os

escores de crianças são geralmente comparados com os de outras crianças da mesma idade; os escores de adultos são usualmente comparados com os de outros adultos sem levar em conta a idade, na suposição de que a habilidade média de solucionar problema varia muito pouco depois dos vinte anos). Se o escore de um indivíduo é o mesmo que a média do grupo, então, o numerador é = ao denominador e o QI calculado é 100. A relação entre o índice de 01 e a faixa de percentil é vista na Fig.14-11. O desvio padrão do índice de QI é cerca de 16 pontos de QJ. Assim, um indivíduo cujo QI é calculado como 1 16 está cerca de 16 acima da média do seu grupo de idade e, portanto, encontra-se no percentil 84. Apenas 16 por cento dos indivíduos do seu grupo de idade terão um escore mais alto.

Percent is (cent is)■ I.. . . I , . . . I . . . . I,... I . . .. I. . . mi n, i l i M, 111.i lni . l i i i i li

60 70 80 90 100 110 120 130 140

Quocientes de inteligência

Figura 14-1 1. Relações entre escores de solução de problema, percentis e o índice deQI (segundo Cronbaeh, 1963).

Muitos pesquisadores têm criticado a derivação, e o uso subsequente de um único número como o QI, do desempenho em problemas como aqueles da Fig. 14-9. Dois indivíduos podem obter escores de QI idênticos de 116 (digamos) apesar de suas habilidades de solucionar problemas poderem ser radicalmente diferentes. Para ilustrar, fazendo-se referência à Fig. 14-9, um sujeito pode solucionar os problemas dos blocos ocultos com um alto grau de proficiência, mas se sair muito mal nos problemas que requerem a completação da série de letras. O outro indivíduo pode apresentar um repertório inverso habilidades superiores para a série de letras combinadas com pouca habilidade para solucionar os problemas de relações espaciais. Mas, ao somar os escores de ambos os testes obtemos o mesmo total para os dois indivíduos. Uma grande parte de resistência a uma análise mais refinada do desempenho em diferentes tipos de problemas, provavelmente, é devida à noção histórica de que “ Inteligência” representa uma capacidade fixa do organismo para solucionar problemas de todos os tipos. Não há uma evidência total, mas estudos recentes indicam que a habilidade de um indivíduo para solucionar problemas é melhor representada como um grupo de habilidades de solucionar problemas. Thurstone (1945) sugeriu o que ele chama uma análise de perfil (ver Fig. 14-12). As habilidades de um indivíduo para solucionar problemas são caracterizadas como sendo constituídas das oito habilidades básicas vistas na parte superior ua Fig. 14-12. Esse perfil fornece muito mais informações sobre as habilidades de um indivíduo para solucionar problemas que qualquer escore de QI, mas a análise pode ser ainda insuficiente. Alguns pesquisadores, atualmente, sugerem que 120, em vez de 8 habilidades básicas para solucionar problemas, podem

- 3 2 6 -

Percentual Ver- Numé- Abs- Fspa- Mecá- 1 scri- Sole- Scntcn- bal rica trata ciai | nica ta tração ças

90

75

60

50

40

25

10

Percentil

Figura 14-12. Um perfil típico das habilidades de um indivíduo hipotético para solucionar problema. (Bennett, Seashore e Wesman, 1951).

ser necessárias para descrever o desempenho de um indivíduo satisfatoriamente. Com um número tão grande como 120, podemos bem indagar em que sentido a palavra “básico” pode ser aplicada.

O contexto em que os lestes de inteligência se desenvolveram raramente levou os pesquisadores a procurar maneiras de modificar os comportamentos de solucionai problema que eles iso!aram. Todavia, é bem conhecido que a “preparação” ou o treino das habilidades especiais que fazem parte dos problemas de Ql, pode aumentar os escores significativamente. Se a fig. 14-10 é examinada cuidadosamente, veremos que a idade em que o aumento na habilidade de solucionar problema começa a diminuir coincide precisamente com a época em que muitos indivíduos terminam o seu treino escolar íormal. Mas embora a educação formal contribua enormemente para o aumento na habilidade geral de solucionar problema com a idade, não se fez ainda uma tentativa ampla de “modelar” habilidades de solucionar problema do tipo avaliado nos testes de QL Parece que, se estas habilidades são básicas em qualquer sentido, um programa sistemático, iniciado na tema idade, para modelá-las através das técnicas discutidas nos capítulos anteriores seria conveniente.

14.6 CORRELAÇÃO, TESTE DL CONFIABILIDADE F VALIDADE

Em várias partes ao longo deste texto, o termo “correlação” foi empregado no sentido de “relação” . Foi dito que os reflexos de correlações entre eliciadores e

1 1 1 h■ 11111 11

17 60 «0 76 91 55 15 16

- 327 -

respondentes; que o reforçamento está correlacionado com a ocorrência de um operante especificado. 0 sentido dado ao te mio foi o de relação ou dependência. A contração pupilar está estritamente relacionada à (depende de) (lashes de luz; a liberação de alimento está estritamente relacionada ao (depende de) bicar a chave. Em geral, quando uma variável é dependente de outra, pode-se dizer que ela está correlacionada com esta; o contrário, como veremos, não é necessariamente verdadeiro. Na descrição mais completa de relações ou correlações particulares entre duas variáveis, somos, tipicamente, levados à representação gráfica. As correlações que constituem as leis do reflexo são descritas pelas funções que relacionam as propriedades do eliciador às propriedades do respondente. As correlações que constituem as leis do fortalecimento operante tomam a forma de uma curva da taxa de resposta em função do tempo.

Quando falamos de duas variáveis que são correlacionadas, é importante separar as noções de como e quanto elas estão correlacionadas. Perguntar sobre como duas variáveis estão correlacionadas é indagar sobre a forma da relação entre elas. A medida em que uma variável aumenta, a outra aumenta, diminui, ou permanece inalterada? A relação é melhor representada por uma linha reta, uma curva simples ou uma curva complexa com depressões e picos? As páginas anteriores podem ser consultadas, pois contêm amostras de uma larga variedade de formas.

Perguntar sobre o quanto duas variáveis estão correlacionadas é indagar sobre a precisão com que somos capazes de predizer o valor de uma delas sabendo o valor da outra. A resposta ao “quanto” é independente da resposta ao “como” . A forma de relação poderia ser linear, curvilínea ou qualquer outra e, mesmo assim, a variabilidade na medida poderia ser tão grande que pouco mais que uma predição grosseira poderia ser efetuada. O contraste entre uma forma altamente definida e um grau baixo de correlação eslá ilustrado nos dados hipotéticos da Fig. 14-13. Nove medidas de U aparecem para cada valor de X na Fig. 14-13. Os valores médios dos Ys estão conectados por uma linha reta. F evidente que X está diretamente relacionado a Y e a forma da relação é indiscutivelmente linear. 0 grau de correlação é, todavia, baixo. Onde o valor de X é 2, por exemplo, os valores de Y variam de menos de 1 a mais do que 3. Fm geral, a previsão de Y a partir de X, na Fig. 14-13 é deficiente. Para melhorar o grau de correlação na Fig. 14-13, os valores de Y par,, qualquer valor de X deveriam estar mais próximos. Isto ê, os valores de Y teriam que ser muito menos variáveis.

Nas várias relações gráficas, ou correlações, descritas nas páginas anteriores, a variável no eixo horizontal é tipicamente uma variável independente (medida e manipulada), enquanto a variável no eixo vertical é tipicamente uma variável dependente (medida, mas não diretamente manipulada). Ao tratar estas relações funcionais, dirigimos nossa atenção principalmente para a forma das correlações isto é, “como” as variáveis estão relacionadas. 0 grau de correlação, isto é, a habilidade preditiva ou o “ quanto” as variaveis estão relacionadas., foi considerado ser alto devido ao controle

experimental cuidadoso, dispositivos precisos de mensuração, e assim por diante.Algumas vezes, acontece que não há quaisquer manipulações experimentais dispo

níveis para se determinar como uma variável é influenciada por mudanças sistemáticas em outra. Nesse caso, podemos ser forçados a basear-nos nas relações entre duas variáveis dependentes. O grau de correlação entre as variáveis nestas relações entre duas variáveis dependentes não pode ser tomado como certo. Nenhuma das variáveis está

328

XFigura 14-1 3. Relação linear hipotética entre duas variáveis.

sob o controle experimental direto e, já que somos, frequentemente, incapazes de controlar influências que podem afetar uma ou outra de maneiras complexas, muito mais variabilidade nos dados deve ser esperada. Tivemos pouca ocasião para discutira relação entre duas variáveis dependentes neste texto, mas sua avaliação é um empreen dimento comum, frequentemente, com importância prática. Os escores que um indivíduo obtém num teste padronizado de lápis e papel de solução de problema e sua taxa de progresso como uma pessoa que está sendo treinada para uma tarefa são ambos variáveis dependentes do desempenho. Mesmo assim, se as duas variáveis são altamente correlacionadas, as predições sobre uma delas podem ser feitas conhecendo- se o valor da outra.

O grau de correlação entre duas variáveis dependentes pode variar de muito baixo - onde conhecer o valor de uma é de pouca ajuda para prever o da outra - a muito alto - onde sabendo-se o valor de uma torna possível predizer com precisão qual será o valor da outra. Entre estes extremos encontram-se todos os graus de correlações intermediárias. Por exemplo, há algum grau de correlação entre altura e peso (ambas variáveis dependentes); pessoas altas tendem a pesar mais do que pessoas baixas. Mas o grau de correlação está longe de ser perfeito, desde que se pode prever apenas aproximadamente o peso de um homem a partir de sua altura. Os estatísticos desenvolveram um índice numérico, ou coeficiente, para indicar o grau de correlação. O coeficiente vai de -1 até +1 , passando pelo zero. Mais 1 representa o caso onde duas variáveis estão diretamente relacionadas e pode-se prever perfeitamente uma delas a partir da outra. Valores altos de uma acompanham valores altos da outra, valore: intermediários acompanham valores intermediários e assim por diante. Menos 1 íe- presenta o caso onde as duas variáveis estão inversamente relacionadas e perfeitamente previsíveis. Valores altos de uma acompanham valores baixos da outra e vice-versa. Uma correlação igual a 0 representa uma relação aleatória entre duas variáveis; conhecer o valor de uma não é de ajuda alguma para predizer o valor da outra.

329

Coeficientes intermediámos representam graus intermediários de previsibilidade. A Fig.14-14 indica graficamente os tipos de íelações que estão associadas aos vários valores do coeficiente de correlação. Nosso X e Y poderiam ser quaisquer duas variáveis dependentes relacionadas: por exemplo, escore no teste de lápis e papel (X) versus realização no trabalho (Y ), ou altura (X) versus peso (Y).

Figura 14-14.

As correlações entre duas variáveis dependentes frequentemente apresentam problemas de interpretação que estão ausentes quando a variável X de uma relação c uma variável independente. Sabe-se que a habilidade de solucionar problema na criança, por exemplo, está correlacionada com o comprimento do dedão do pé. A medida que a criança cresce, sua capacidade de solucionai problemas aumenta ao mesmo tempo que seus ossos estão aumentando de comprimento e, assim, os dois mostram uma correlação significante. Isto pode ajudar o estudante a ver que, embora a correlação moslre a relação causai em alguns casos, ela não significa, necessariamente, que uma das duas coisas correlacionadas causa a outra (Hebb, 1958, p. 237). Aqui existe uma terceira variável independente, a idade do indivíduo, que é funcionalmente relacionada a ambas as variáveis, acarretando, assim, uma correlação entre elas.

Duas correlações subordinam-se ao conceito e mensuração da inteligência. ( ! ) A

habilidade relativa de um indivíduo para solucionar um tipo particular de problema numa ocasião correlaciona-se, até certo grau, com sua habilidade relativa para solucionar esse tipo de problema numa ocasião posterior. Não tosse por essa consistência intra-classe na habilidade de solucionar problema, não haveria um conceito de inteligência. (2) A partir do quão bem um indivíduo resolve os problemas a, b, c npodemos predizer como ele resolverá os problemas a \ b \ c’........ n \ Sem estaconsistência inter-classe na solução de problema não haveria uma medida da inteligência. Desde Binet, o tratamento prevalente da inteligência tem sido uma tentativa contínua de melhorar o grau de correlação inter-classe através de seleções cada vezmelhores dos problemas a, b, c....... n. Isto é, os psicólogos têm se preocupado com oestabelecimento de grupos padrões de problemas (a, b, c, n, chamados problemastestes, ou testes de Ql) cuja correlação, com outros grupos de problemas (a \ b \ c'......n \ cormimente, a realização na escola, universidade ou no trabalho, ou mesmo outros testes de 01) sein aim

A medida da intengencia, como todas as medidas, depende de dois requerimento: a mais que, por meio de análise, vê-se que envolvem correlações. O primeiro requerimento estipula que os instrumentos de medida sejam confiáveis, isto é, que o seu uso repetido proporcione resultados similares. Uma régua é confiável quando suas medidas repetidas de uma mesa fornece resultados que concordam exatamente entre si. Similarmente. se um leste de solução de problema é um instrumento de medida confiável, seu u>r repetido deve levai ao mesmo valor para a habilidade de solucionar problema

- 330 -

de um determinado indivíduo. O requisito confiabilidade é, com eteito, uma necessidade para um alto grau de correiação entre os resultados do teste em ocasiões diferentes. Dada uma única medida, devemos ser capazes de predizer a próxima: ela deverá ser aproximadamente a mesma. A confiabilidade depende, parcialmente, das condições constantes de medida e, parcialmente, do próprio ato de medir que afeta desprezívelmente o que está sendo medido. A confiabilidade de um teste de solucionar problema é geralmente mais baixa do que a de uma régua porque muitas operações podem facilmente ocorrer entre as medidas, mudando o desempenho de solução de problema do indivíduo. Por exemplo, práticas demasiadas em vários problemas afetará a concordância das medidas repetidas de 01. Além disso, o instrumento de medida afeta dc algum modo, o que está sendo medido: a aplicação repetida de testes de QI pode afetar os e s c o re s -o sujeito torna-se “versado em teste” .

Um segundo requerimento imposto às medidas é que elas sejam úteis a qualquer objetivo para o qual são feitas. A utilidade, no contexto de medida, é chamada v a lid a d e . Se temos um piano na rua e queremos estar certos, antes de carregá-lo por très lances dc escada, que ele passará através de uma certa porta, será melhor medir o seu lado mais largo. Comparando esta medida com as dimensões da porta, seremos capazes dc predizer se podemos entrar com o piano. Poderíamos fazer muitas outras medidas do piano - poderíamos determinar o seu valor na praça ou pesá-lo - mas nenhuma dessas medidas seria válida para os nossos objetivos presentes. Bias não seriam convenientes para aquilo que pretendíamos fazer, no momento, com o piano. Segue-se, portanto, que elas não, seriam medidas válidas para o “ passar atlavés da porta’1.

A validade é uma forma simulada de correlação pois, no exemplo que acabamos de descrever, a largura do piano é a variável que está mais correlacionada com a possibilidade dc passá-lo através da porta. O peso é menos correlacionado e, a menos que, nos pianos, o valor na praça e o tamanho sejam relacionados, o valor na praça, provavelmente, terá uma relação aleatória (0) com esta possibilidade.

Algumas vezes, a validade pode assumir a forma de uma estimativa do grau dc correlação entre uma dimensão da medida ( D j ) cuja utilidade já íoi bem estabelecida e uma dimensão da medida (D 2 ) diferente c pior estabelecida. Este problema surge frequentemente quando o método de medida existente envolve dificuldades práticas e um segundo método mais simples e rápido é proposto. Se desejarmos medir uma

grande área de terra, veremos que é impraticável (mas, em princípio, possível) medir o seu perímetro com uma régua. Em vez disso, adotamos um procedimento de medida totalmente diferente e mais rápido, usando equipamento ótico de medida. A justificação para este método é sua alta correlação com os resultados obtidos quando, de fato, usavam-se réguas para conferir os valores medidos.

A validade exigida de um escore de teste de inteligência é desse tipo. Certas dimensões de medida vigentes existem na forma do desempenho na escola, habilidades 110

trabalho, e assim por diante. Mas, frequentemente, é impraticável avaliar todas as habilidades de solucionar problemas numa criança, ou medir, o repertório completo de solucionai problema 110 trabalho num indivíduo. Poderíamos até desejar prever o desempenho de um homem antes de ele assumir o trabalho. O teste de QI é proposto como um dispositivo rápido de medida que procura medir os aspectos de uma dimensão complexa da solução de problema de uma maneira mais simples, através de operações de lápis e papel. O grau em que os testes de QI reaJizam isso é dado pelo grau de correlação

- 331 -

entre seus escores e o desempenho, no trabalho ou na sala de aula, pa solucionar problema. Quanto mais alto o grau de correlação, maior a validade (utilidachdo escore do lápis e papel.

APÊNDICE DO CAPITULO 14.

Figura 14-15. Solução do quebra-aibrça tios nove pontos.

(A) (B) (C) (D) (E)

LL U LLU JJJJ _IJ_ LLLL U U LI Li LI LI LI IJFigura 14-16. Soluçòes para os problemas dos palitos de lòstoro.

REFERÊNCIAS PARA O CAPÍTULO 14

Bayley, Nancy. On the growth of intelligence. Amer. Psychologist, 1955,10, 805-818.

Bennett, G. K., Seashore, H. G., and Wesman, A. G. Counseling from profile. A case book for the Differential Aptitude Tests. New York: Psychological Corp., 1951.

Birch, H. G. The relation of previous experience to insightful problem solving. J . comp. Psychol., 1945, 38, 367-383.

Birch, H. G., and Rabinowitz, H. S. The negative effect of previous experience on productive thinking. J. exp. Psychol., 1951, 41, 121 — 125.

- 332 -

Bruner, J. S., Goodnow, Jacqueline J., and Austin, G. A. A study of thinking. New York: Wiley, 1956.

Cronbach, L. J. Educational psychology. New York: Harcourt, Brace and World, 1963.

Hebb, D. O. A textbook of psychology. Philadelphia: Saunders, 1958.Katona, G. Organizing and memorizing: studies in the psychology of

learning and teaching. New York: Columbia Univer. Press, 1940.Kendler, H. H. Basic psychology. New York: Appleton-Century-Crofts,

1963.Kimble, G. A., and Garmezy, N. Principles of general psychology. (2nd

ed.) New York: Ronald, 1963.Kohler, W. The mentality of apes. New York: Harcourt, Brace, 1925.Luchins, A. S. Mechanization in problem solving: The effect of Einstel-

lung. Psychol. Monogr., 1942, 54, No. 248.Newell, A., and Simon, H. GPS, a program that simulates human thought.

In E. A. Feigenbaum and J. Feldman (E ds.), Computers and thought, New York: McGraw-Hill, 1963, pp. 279-293.

Thurstone, L. L. Testing intelligence and aptitudes. Hygeia, 1945, 53, 32-36.

Wechsler, D. The measurement and appraisal of adult intelligence, Baltimore: Williams and Wilkins, 1958.

- 3 3 3 -

QUINTA PARTE

DINÂMICA DO REFORÇAMENTO

15. MOTIVAÇÃO I

16. MOTIVAÇÃO II

17. CONTINGÊNCIAS AVERSIVAS

18. COMPORTAMENTO EMOCIONAL

Capítulo 15 MOTIVAÇÃO I

A motivação do comportamento é geralmente interpretada como o conjunto de d e t e r m i n a n t e s ou causas do c o m p o r t a m e n t o . Mas deve t e r ficado claro, nos capítulos anteriores, que a elaboração das causas do comportamento é o campo de toda a psicologia. Desde os reflexos até a solução de problemas complexos, um objetivo unificador da ciência tem sido uma elaboração experimental das causas ou “leis” do comportamento. O tópico “Motivação” , se é que devemos distingui-lo dos procedimentos e processos dos capítulos anteriores, deve compreender as causas de comportamento até aqui negligenciadas, ou deve oferecer fenômenos novos para análise. Antes de nos dedicarmos a um tratamento experimental da motivação, é útil inserir algumas notas sobre c#usa e efeito na ciência, em geral, e na psicologia, em particular.

15.1 CAUSA E EFEITO E A NOÇÃO DE LEI CIENTÍFICA

Os termos “causa” e “efeito” têm uma. longa história de uso em todas as tentativa sistemáticas para explicar a natureza tanto filosófica quanto científica. Os termos são parte de nossa linguagem cotidiana para descrever os aspectos de furacões, revoluções, epidemias, assassinatos e acidentes aiéreos, assim como eventos mais triviais do dia-a-dia nas relações humanas. Podemos, aissim, ficar surpresos em descobrir, ao voltarmo-nos para a literatura científica contemporânea, a falta evidente desses termos. Em seu lugar, podemos encontrar referência apenas a relações entre variáveis, correlação de eventos c “ leis” relacionando fenômenos. Não que o cientista tenha perdido o interesse nas causas de seus fenômeno^. É que, simplesmente, tudo o que ele encontra após executar experimentos são relaçõ-es entre eventos ou variáveis. Para ele, descobrir as causas de um fenômeno y é equivailente a descobrir quais outras variáveisu, v, w, x, e assim por diante, estão sistematica mente (funcionalmente) relacionadas a y- . .

Toda a ciência está cheia dc exemplos de relações funcionais que se propõem a ocupar o lugar de noções mais ordinárias de canisa e efeito. Considere a lei de llookc: enquanto o limite de elasticidade não é excedido, a distensão de um corpo é diretamente proporcional à força nele aplicada- A lei pode ser resumida como a relação entre duas variáveis, Força -----^ Distensão. A relação seria descrita mais

- 3 3 7 -

extensivamente por um gráfico em que as unidades de força (a variável independente) são representadas em função das unidades de distensão (a variável dependente). Podemos, se desejarmos, considerar a causa de qualquer distensão particular como sendo a força particular que atua no corpo. Mas, ao chamar a força de causa da distensão, não acrescentamos qualquer informação adicional à própria relação funcional. De fato, enquanto a lei descreve a forma exata da relação para inúmeras forças e distensões, a designação de causa é limitada à proposição lógica - se uma força, então a distensão.

Na relação

Aquecer a água até 100°C —» água ferve,

a aplicação de calor pode ser considerada como causa da ebulição. Mas se persistirmos em perguntar “ por que” a água ferve quando suficientemente aquecida, estaremos nos referindo a uma outra relação funcional entre a pressão do vapor da água e a temperatura. Exatamente a 100°, segundo nos dizem, a pressão de vapor da a'gua é igual à da atmosfera. Isto pode ou não satisfazer nossa curiosidade sobre a ebulição da água mas, em qualquer caso, a forma das respostas que obteremos para qualquer “ porque” a mais será a mesma - mais relações funcionais.

As relações são igualmente importantes para o processo explanatório na ciência biológica. O acasalamento de moscas de fruta, em que macho e fêmea têm olhos brancos, gera invariavelmente filhos de olhos brancos.

Casal de pais de olhos brancos —> prole de olhos brancos.

Existe uma relação funcional entre a cor dos olhos dos pais e a cor dos olhos dos filhos.

Todas essas relações funcionais revelam uma lógica comum. Se considerarmos a variável antecedente nessas relações como x e a conseqüente que é produzida como y sua lógica parece ser:

Se x, então y

e seu corolárioSe não y, então não x.

Assim, se uma força (x) é aplicada, então observaremos distensão (y). Mas, se nenhuma distensão foi observada (não y), então a força não deve ter sido aplicada (não x). Similarmente, se a temperatura da água sobe a 100° (x) então a água ferve (y). Além disso, se a água não está fervendo (não y), então a temperatura deve estar abaixo de 100° (não x). Finalmente, se ambos os pais têm olhos brancos (x) então todos os filhos terão olhos brancos (y). Mas, se os filhos não tem olhos brancos (não y) então os pais não poderiam ter, ambos, olhos brancos (não x).

Não devemos ficar desapontados ao aprender que as leis cientificas dão uma representação exata da natureza somente quando certas condições são alcançadas. As leis científicas se mantêm num'contexto, algumas vezes amplo, algumas vezes estreito, dependendo da generalidade da relação particular; mas nenhuma lei científica é verdadeira sob todas as condições. Além do limite de elasticidade, a lei de Hooke falha e a distensão não é mais proporcional à força aplicada. A menos que certas variáveis tais como a pressão atmosférica e a pureza da água sejam mantidas constantes, a água

- 3 3 8 -

nao ferve a 100° A irradiação da mosca de fruta complica as relações de hereditariedade.

Nas leis descritas, os termos x ey das relações funcionais são conceitos baseados em quantidades observáveis. A intimidade pela qual tais conceitos estão ligados a observáveis é a razão porque tais leis são chamadas empíricas. Podemos observar t medir eventos que são conceituados como forças e distensões de corpos, temperatura e estados da água, reprodução sexual e cor dos olhos das moscas de frutas. Os tipos de explicação proporcionados por leis empíricas devem ser contrastados com explicações pré-científicas. Antes da descoberta das leis que relacionam a atividade de microorganismos à doença, esta era frequentemente atribuída à demônios alojados no corpo. Por muito tempo, acreditou-se que o comportamento animal e humano era devido às almas e espíritos animais. Nessas explicações pré-científicas a doença e o comportamento eram relacionados a eventos hipotéticos (demônios e almas), que eram livres para assumir quase toda propriedade que o teorista lhes desejava impor. A falta de restrições sobre a natureza hipotética desses conceitos tornou possível que eles, em princípio, explicassem tudo. Mesmo assim, sua imunidade à não-confirmação por qualquer procedimento colocou-os na posição paradoxal de, na verdade, nada explicarem.

Em contraste com o vazio de tais explicações fictícias, a relação funcional da ciência possui habilidades poderosas para a predição, interpretação e controle da natureza. Quando existe uma lei funcional entre x e y , se soubermos o valor de x podemos predizer o valor de y. Tendo a lei à mão, sempre que suspeitarmos que x e y estão agindo no mundo cotidiano, estamos em condições de interpretar eventos reais fora do laboratório. Finalmente, se pudermos manipular x como desejarmos, então temos os meios de controlar y como desejarmos. No modelo da relação funcional, temos o poder e a versatilidade do empreendimento científico revelados de um modo surpreendente.

15.2 CAUSAS FICTÍCIAS DO COMPORTAMENTO

Quando examinamos as causas tradicionais do comportamento notamos que três classes principais de causas fictícias dominaram o campo.

Numa delas, o comportamento é explicado por referência a eventos observáveis que são fortuitamente correlacionados com ele, tal como a posição dos planetas no nascimento, a direção das linhas na palma da mão, a proeminência relativa de várias protuberâncias no crânio. Embora tanto o comportamento quanto o “ agente causai” sejam observáveis, qualquer relação entre eles não é sistemática e, assim, qualifica-se como “ acidental” em vez de “regular” .

Na segunda, o comportamento é frequentemente atribuído a eventos supostamente localizados no sistema nervoso central (cérebro e medula). Quando dizemos que um homem é esperto porque tem “ cérebro” , que não pode trabalhar porque seus nervos estão esgotados, ou que precisa fazer um exame da cabeça quando age estranhamente, estamos invocando eventos causais aparentemente localizados dentro da estrutura nervosa. Na prática, todavia, raramente se faz a observação real desses eventos. Nestes exemplos, o sistema nervoso existe apenas como um repositório para explicações fictícias do comportamento. As propriedades das causas hipotéticas são especificadas apenas a grosso modo e nenhuma relação específica é observada ou teorizada entre elas e o comportamento observado.

- 339 -

Na terceira, o comportamento é comumentc “explicado” por processos mentais ii*ternos hipotéticos. Diz-se que fechamos uma porta porque a “queremos” fechada, que assobiamos uma melodia porque temos um “ ímpeto” para assobiar, lemos um livro porque “ sentimos vontade” de lê-lo. Pelo fato de tais proposições parecerem tão naturais e inofensivas, é difícil notarmos que elas implicam numa forma de causa e efeito que difere marcaritemente das leis da seção 15-1. Contudo, em cada “vontade” ,

ímpeto” ou “sentimento” interno não observável está sutilmente designado o status de uma causa de algum comportamento. Aqui, novamente, estas “causas” não possuem quaisquer propriedades independentes que possam ser relacionadas ou pela teoria ou pela observação, ao comportamento real a ser explicado. O “ ímpeto” e a “vontade” são fictícios porque são inferidos inteiramente do comportamento que se propõem a explicar.

O surgimento de uma psicologia científica é, em grande parte, uma mudança de causas fictícias do comportamento para causas funcionais. Basta que examinemos os vários procedimentos e processos dos capítulos anteriores para encontrar várias dessas relações funcionais. Como um prelúdio para a análise dos fenômenos de motivação, será útil faz.cr uma revisão desses paradigmas comportamentais familiares dc modo a enfatizar como seus procedimentos constituem uma classe importante dc causas comportamentais.

15.3 HISTÓRIA PASSADA COM CONTINGÊNCIAS DE CONDICIONAMENTO E EXTINÇÃO COMO CAUSA DO COMPORTAMENTO

Na medida em que uma história passada com os vários paradigmas de condicionamento operante é uma maneira eficaz dc modificar o comportamento de um organismo, uma história particular deve ser considerada uma causa genuína do comportamento. Assim, o reforçamento anterior pode causar o aparecimento de uma cadeia comportamental e o declínio de outro comportamento na situação. Ao contrário, o não-reforçamento (extinção) do comportamento pode levar à ausência ou baixa probabilidade de algum comportamento. Combiirmdo os procedimentos de extinção c condicionamento, passamos para causas mais complexas. O controle exercido sobre o comportamento por S^s pode ser compreendido apenas com referência a uma história passada de treino operante discriminativo. O surgimento de uma nova forma de comportamento pode, quase sempre, ser explicada apenas pelas condições especiais de reforçamento estabelecidas por aproximações sucessivas. Certos padrões temporais característicos da resposta requerem uma histórica passada específica com um esquema de reforçamento intermitente.

As causas do, ou aquilo que controla o comportamento, nesses exemplos, encontram-se na maneira em que o comportamento esteve relacionado ao reforçamento, no passado. Como as causas da distensão de uma mola, ebulição da água e cor dos olhos da mosca, essas causas são melhor descritas sob a forma dc relações funcionais. Aqui, as relações são entre um determinado grupo de contingências, aplicadas anteriormente, e o aparecimento de mudanças comportamentais. As mudanças de comportamento que estão associadas a essas histórias passadas ocorrem, caracteristicamente, no tempo. Logo, as curvas que chamamos de processos comportamentais são as descrições fundame itais dessas leis.

Uma idéia prevalentc em todas essas causas c a noção de que certos efeitos

- 340 -

comp ort amen tais são condicionais a uma certa história de condicionamento e extinção. Alguns casos gerais estão resumidos na Tabela 15-1, dc modo a incluir os paradigmas operantes dos capítulos anteriores. Note que cada caso pode ser reduzido a uma combinação de apenas dois ingredientes: condicionamento e extinção. A variedade de comportamentos que podem ser adquiridos e mantidos através dessas operações, e a complexidade dos controles ambientais sobre o comportamento que a sua correlaçãc com estímulos pode induzir, atestam a potência notável dessas duas operações opostas.

Tabela 15-1

ALGUMAS CAUSAS DO COMPORTAMENTO QUE SE ENCONTRAM NA HIS TÓRIA DE REFORÇAMENTO DO ORGANISMO

CAUSA SIMBOLICAMENTE EFEITO

1. Uma resposta tem uma história de ser seguida por /eforçamento

Força alta de R

2. Uma resposta tem uma historia de extinção R+> Força baixa de R

3. Uma história passada com o procedimento de discriminação

SDR -± ,

S*R -h

SD controla a ocorrência de R, e toma-se um reforçador

4. O comportamento (R^) deve sua existência a uma história prévia de refor- ç mento de seus ancestrais relacionados

R ^ S + Ry -/->r 2-> r 2-» 5 +

ÜLn* s +

R x-bR2-b

R.,

Uma nova unidade de comportamento é adicionada aorepertório

(Estágios sucessivos no tempo -* )

R

5. Uma história passada Um padrão característicocom uma contingência pro- ' K ò de respostas no tempobabilistica particular

- 341 -

15.4 MOTIVOS E REFORÇADORES

Apesar de todo o seu poder, os procedimentos da Tabela 15-1 são inúteis a menos que as conseqüências ambientais que eles proporcionam ao comportamento sejam do tipo especial que denominamos reforçadores. Nas discussões anteriores, tomamos como seguro o poder reforçador de eventos tais como alimento e água, adiando até agora uma análise das variáveis que modulam suas propriedades reforçadoras. É a elaboração dessas variáveis que constitui o campo da motivação.

Podemos questionar, de início, o que essa definição de motivação tem em comum com as concepções mais clássicas de motivação como o estudo de necessidades, vontades, aspirações, interesses, desejos, impulsos e outras energias ou motivos do comportamento. Para o presente, notaremos apenas que estas necessidades e desejos e outros motivos parecem estar intimamente relacionados ao conceito de reforçadores. Quarido se diz que um organismo “necessita” de alimento ou água, a inferência de necessidade é usualmente feita a partir da observação de que é provável que um organismo, que tenha estado sem alimento ou água por um período, coma e beba. Diz-se que uma pessoa “ deseja” beber se ela pede água ou que, de outra forma, se empenha num comportamento que tenha anteriormente produzido água. As necessidades e desejos referem-se ao fato de que, devido a um periodo de sua ausência, alimento e água tornaram-se reforçadores.

Fazemos uma restrição à nossa análise experimental de motivação identificando como seu domínio a análise dos reforçadores primários apenas. A restrição serve para excluir aqueles reforçadores cujo poder reforçador depende de uma história passada de condicionamento, em particular, do paradigma de discriminação No linguajar comum, naturalmente, os motivos não são sutilmente distinguidos na base de se eles se referem a reforçadores primários ou secundários. De fato, um motivo pode referir-se a quase todos os “porquês” do comportamento. Uma necessidade de superar os outros, um desejo dc atenção e um desejo de possuir um automóvel caro ou status social podem todos qualificar-se como motivos legítimos. Não obstante o linguajar comum, as leis que governam tais motivos são aquelas que governam os reforçadores adquiridos. Consequentemente, tais motivos adquiridos são mais apropriadamente tratados como fenômenos de condicionamento. O dinheiro, um bom exemplo de um tal motivo, é satisfatoriamente descrito como um reforçador positivo generalizado adquirido. Sua significância reforçadora depende de sua história ou paradigma de discriminação onde sua presença estabeleceu a ocasião para Rs que, eventualmente, produziam reforçadores primários. Atenção; necessidade de poder, afiliação, realização; competição e muitos outros motivos sociais parecem se adequar ao paradigma de reforçamento secundário descrito no Capítulo 11. Logo, teremos poucas novidades para adicionar a sua análise neste capítulo.

O problema dc como estudar os motivos adquiridos foi solucionado no Capítulo1 1 , através da formulação de um conjunto de princípios para converter qualquer situação de estímulo arbitrária num reforçador condicionado. Ao estudar os reforçadores primários, preocupar-nos-emos com a elaboração de um número de variáveis que se mostram intimamente relacionadas ao aumento e diminuição no valor de tais reforçadores. Como uma ajuda para ampliar o conceito de reforçamento primário do estudante, apresentaremos, nas discussões que se seguem, uma variedade de reforçadores primários diferentes.

- 342 -

15.5 OPERAÇÕES DE IMPULSO

Uma operação fundamental que afeta o poder ou valor reforçador de todos os» reforçadores primários positivos conhecidos é o procedimento de privar o organismo do reforçador por um período de tempo. Numa primeira aproximação, digamos que o valor reforçador de um reforçador aumenta diretamente à medida que aumenta a duração da privação.

Nas discussões anteriores sobre os efeitos do condicionamento (Pavloviano e operante) partimos do princípio que as variáveis de privação foram reguladas para dar um valor reforçador moderado aos estímulos usados como reforçadores. Embora trabalhando por trás do cenário até agora, as variáveis de privação têm, de fato, um papel central em tomar possíveis os processos comportamentais que estudamos. A existência deste novo grupo de variáveis, do qual o comportamento depende tão criticamente, tem duas implicações para análise comportamental que nãopodemos ignorar.

(1) O comportamento é multi-determinado. Um cavalo pode não beber a água que lhe é apresentada porque não foi privado de água, ou porque nunca adquiriu o comportamento de beber água no cocho. Mas, se ele bebe, então deve ser porque possui o comportamento necessário e está privado de água. Nem privação, nem o condicionamento passado apenas, serão suficientes para causar padrões de comportamento.

(2) Uma operação de privação aumenta o valor reforçador de uma classe de estímulos dos quais muitas cadeias de comportamento podem depender. Quando privamos um homem de alimento, aumentamos a probabilidade de que ele coma. Mas aumentamos também a probabilidade de que ele peça alimento, caminhe para uma certa rua onde. há um restaurante, entre num mercado e assim por diante. Nas explicações tradicionais de motivação este aumento concomitante na força de muitos comportamentos é a base para se considerar a privação como uma forma de dirigir, “ impulsionar” o organismo para o reforçador. Contudo, usado deste modo, o conceito de “ impulso” tem pouco mais que um valor metafórico. Se o organismo não adquiriu o comportamento que o levará ao reforçador, a privação por si própria não resultará em reforçamentos.

E conveniente despir o termo impulso de suas conotações comuns e dar-lhe uma redefinição técnica que enfatize a habilidade de certas operações em estabelecer reforçadores. A palavra impulso é usada para indicar que, como um resultado de alguma operação efetuada no organismo (por exemplo, privação), algum S torna-se um reforçador, S+. Assim definido, impulso é uma palavra como reflexo, significando uma certa relação entre variáveis. Se concordarmos em empregar a palavra apenas neste sentido técnico, devemos ter cuidado e evitar dizer que um organismo respondeu por causa de um impulso. Sendo uma relação entre alguma operação e o comportamento, um impulso não pode causar qualquer comportamento.

Pode-se efetuar operações apropriadas de privação para cada reforçador primário. A observação casual sugere, e experimentos confirmam, que muitas outras operações têm efeitos semelhantes à privação de reforçadores. Exercício forçado, diminuição da temperatura da sala, injeção de insulina, lesões cirúrgicas numa região localizada do cérebro, estimulação de alguma região do cérebro; administração de certas drogas, oferecimento de aperitivos, introdução de um animal que está comendo junto ao primeiro todos podem tornar o alimento um reforçador e, assim, são operações de impulso.

- 3 4 3 -

Assim como existem várias operações para estabelecer e aumentar o valor dos reforçadores, também há operações de impulso para reduzir ou eliminar o valor do reforçador. Podemos chamá-las de operações de redução do reforçador. A mais universal delas é a saciação - apresentação repetida do reforçador até que ele perca o seu poder de reforçar. Certas drogas, a injeção de sangue de animais saciados, eventos que produzem emoção, lesões numa parte localizada do cérebro e estimulação numa determinada região do cérebro, reduzem o valor reforçador do alimento.

Cada reforçador primário tem suas próprias operações particulares de estabelecimento e redução do reforçador. O paradigma [15.1| esquematiza algumas operações que tornam a água um reforçador.

Privar de todos os Forçar a excreção Injetar atropina - Alimentar com sal Obstruir os dulos Estimular o cérebi

Há uma forte tendência para se dizer que essas operações de impulso tornam o organismo “sedento” e, portanto, ele bebe. Mas a “sede” é um agente causai dúbio. Tudo o que vemos é que um número de operações tem um efeito similar tornam a água um reforçador. Como conceitos explicativos, o termo “sede” e seu correlativo “ fome” dificilmente são sustentáveis, simplesmente porque eles não apontam qualquer relação empírica ou teórica entre o comportamento e outros eventos observados ou especificados. Mesmo como termos descritivos, eles podem prender em armadilhas o descuidado. Quando dizemos que um homem está “sedentô” quando o vemos beber, ou “ faminto” quando o vemos comer, estamos inferindo que água e alimento tornaram-se reforçadores por alguma operação de privação. Mas, de fato, as pessoas comem e bebem por muitas razões. Elas podem encontrar varias pressões sociais para assim o fazer, podem fazê-lo para reduzir a ansiçdade, ou podem fazè-lo tal como uma criança que bebe seu leite ou come seu espinafre para chegar a reforçadores como a sobremesa.

15.6 PERIODICIDADES NO VALOR DO REFORÇAMENTO

Considere a seguinte lista alfabética de alguns dos mais conhecidos reforçadores primários para sujeitos humanos e certos animais superiores

Água Atividade SexoAlimento Atividades maternas SonoAmor,e Afeição Calor Ar Novidade

O estudo experimental dos reforçadores primários começa com a observação de que todos os itens desta lista, algumas vezes, são reforçadores e outras não. Essa variabilidade é facilmente vista num reforçador como o alimento, cujo valor reforçador passa por ciclos medidos em horas; é menos facilmente vista no ar, cuja

líquidos

salivares o em certa região

[15.1]

- 3 4 4 -

periodicidade são ciclos pequenos de respiração dos animais, medidos em segundos ou menos. Todavia, o fato geral é claro — algumas vezes, alimento, água, ar, sexo e assim por diante são reforçadores, outras não o são. A análise experimental da motivação é uma tentativa sistemática de relacionar essa variabilidade a variáveis observáveis no ambiente presente ou passado do organismo. Em resumo, pesquisamos as leis comportamentais da motivação.

A determinação da natureza cíclica dos reforçadores primários é o primeiro passo em tal análise. Nem os homens, nem os animais comem continuamente. Quando provido com um estoque inesgotável de alimento, q rato normal come periodicamente. A natureza cíclica do comer é vista na Fig 15.1 . Cada resposta de pressão à barra

Figura 15.1. Comportamento cíclico de alimentação apresentado pelo rato (Anliker e Mayer, 1956)

emitida pelo rato produz uma pequena pelota de alimento e uma contingência de reforçamento contínuo é mantida permanentemente em efeito. Pode-se observar na Fig. 15.1 que uma “refeição” inicia-se com uma taxa de pressão constante, mantida entre 3-5 horas (portanto, comendo). Daí em diante, a taxa de pressão-comer declina, terminando usualmente numa completa cessação de pressão-comer por umas 6 horas.

Deixando-o beber água quando preferir, o rato produz ciclos característicos de beber e não beber, como indicam as curvas cumulativas do beber da Fig. 15-2. Há relativamente poucas respostas de beber entre as 6 e as 18 horas, isto é, durante o dia O beber, então, aumenta gradualmente e, em geral, atinge o seu máximo por volta de meia-noite.

- 3 4 5 -

ligura 15.2. Curvas cumulativas do beber para quatro ratos. O gráfico mostra períodos de beber e não beber água destilada que estava constantemente disponível (Young e Richey, 1952).

O sono humano é caracterizado por periodicidades que mudam nas várias idades. A Fig. 15-3 mostra graficamente como os ciclos mudam à medida queosujeito humano envelhece. O ciclo muda tanto seu período (número de “sonecas” por dia) como sua fase (quando a primeira “soneca” começa) com a idade.

15.7 PARADIGMAS DE PRIVAÇÃO E SACIAÇÃO

A descoberta de uma perioricidade regular no valor reforçador representa apenas o início de uma análise experimental da motivação. Um progiesso maior é alcançado quando se obtém o controle direto dos ciclos. A operação de privação é fortemente identificada com motivação porque a supressão de reforçadores primários é um método universal para variar o valor reforçador de todos os reforçadores primários conhecidos. Quando privamos um organismo de uma classe de reforçadores primários por um período fixo de tempo e, então, permitimos o acesso ao reforçador, podemos observar o efeito que a nossa operação de privação tem sobre o comportamento. No caso de alimento e água, o comportamento real de consumir o reforçador é quase sempre de interesse.Depois de um período de privação, um animal come e bebe uma certa quantidade de alimento e água e, então pára. Dizemos, assim, que o animal está saciado. A descrição comportamental desse processo de saciação assume,

- 3 4 6 -

Um ano

Quatro auos

Dez anos

Adulto

I18

Imeia-noite

Imeio-dia

I18

Figura 15.3. Ciclos de sono em idades diterentes (Kleitman, 1963).

convenientemente, a forma da mudança na taxa de uma resposta que produz alimento ou água em contingências de crf. Uma vez que cada resposta é reforçada, a taxa de comer é indicada pela taxa de emissão dessa resposta.

As curvas de saciação de alimento não têm todas a mesma forma, mas a forma mais comum parece ser a de uma taxa constante de comer seguida por uma cessação um tanto abrupta (Smith e Smith, 1939 ; Reese e Hogenson, 1962). Na Fig. 15-4, são vistas várias curvas de saciação da resposta de bicar uma chave de um pombo, reforçada com alimento. As curvas foram obtidas depois de vários períodos de privação de alimento, como indicado.

Por apresentarem uma diminuição na taxa, as curvas de saciação podem ter uma semelhança superficial com as curvas de extinção. A forma de uma curva de saciação é, todavia, caracterizada por uma cessação muito mais abrupta da taxa (ver Fig. 15-4). Além disso, se a cadeia de comportamento adquirido é examinada com atenção, notar-se-á que ela permanece intacta à medida que o processo prossegue. O processc de extinção, por outro lado, está associado com uma desintegração marcante da cadeia de comportamento.

O paradigma da saciação pode ser esquematizado como se segue:

DADOS: 1 - Privação de um reforçador primário (ou alguma outra operação apropriada para estabelecer o reforçador).2 — Um comportamento apropriado, previamente fortalecido por este reforçador.

PROCEDIMENTO: R ->S+

PROCESSO: Uma taxa razoavelmente constante de R, seguida por uma cessação abrupta.

RESULTADO: Cessação da taxa de R.

- 3 4 7 -

Figura 15.4. Curvas individuais de saciação de alimento. As curvas estão assinaladas com o número de horas de privação anterior de alimento. Um traço oblíquo acima de cada curva indica que o animal não comia após a resposta de bicar (Reese e Hogenson. 1962).

Note que, em geral, o resultado também difere do resultado da extinção. Enquanto a extinção volta o comportamento ao nível operante, a saciação volta-o a um nível próximo de zero que pode ser inferior ao nível operante. Saciados de todos os outros reforçadores, os organismos frequentemente vão dormir.

15.8 A MENSURAÇÃO DOS IMPULSOS

Frequentemente, referimo-nos ao fato de que um indivíduo está mais fortemente motivado algumas vezes do que outras e, de fato, inferimos um continuum de força motivacional. Podemos traduzir essa proposição numa equivalente relativa a um continuum de força do impulso. A noção de que um impulso pode variar em força, de

- 3 4 8 -

um valor muito baixo a um valor muito alto, parece referir-se, principalmente ã observação de que os reforçadores primários podem variar suas forças de valores muito baixos a muito altos. Assim dizemos que uma pessoa está fortemente motivada para alimento quando o alimento é um reforçador forte para o comportamento instrumental daquela pessoa. Similarmente, uma pessoa que está altamente motivada para o sexo empenha-se frequentemente em comportamento que produz reforçadores sexuais. Note que, nestes exemplos, apesar de falarmos em termos dc uma alta força de motivação, tudo o que realmente observamos é a capacidade de um conjunto particular de reforçadores primários fortalecer e manter o comportamento. Na medida em que se puder demonstrar que essa capacidade varia de baixa a alta, dependendo das circunstâncias, podemos indicar o seu valor por uma variável que chamamo, dc valor reforçador primário dos estímulos.

Como podemos medir o valor reforçador dos estímulos? Parece que não há uma maneira de medí-lo, salvo pela medida dos efeitos comportamentais dos estímulos quando eles são contingentes a respostas operantes. Assim, muitas das medidas comportamentais familiares citadas nos capítulos anteriores, tais como a taxa de resposta e resistência à extinção, serão úteis para avaliar a força da motivação. Segue-se uma curiosa implicação dessa versatilidade. O comportamento que o experimentador escolhe para medir não pode, sozinho e em si mesmo, determinar que fenômeno está sob estudo. A pressão à barra, ó bicar uma chave e a vocalização “estou com fome” têm significado somente quando estão associados a outros eventos. Em termos mais gerais, esta é a razão porque a própria disciplina da psicologia não pode ser definida sõ como o estudo do comportamento. Ela é considerada mais adequadamente como o estudo do comportamento na medida em que este se relaciona com o ambiente. Em capítulos anteriores, as taxas de respostas de operantes representativos foram usadas freq u en tem en te para estudar o condicionamento, extinção, discriminação, encadeamento e outros fenômenos, dependendo do procedimento particular imposto ao organismo quando o comportamento estava sendo medido. Agora, descobrimos um outro emprego para as medidas operantes. Quando os parâmetros de condicionamento são mantidos constantes e o comportamento está relacionado a operações de impulso, as propriedades do comportamento que está sendo emitido podem servir como uma medida do valor reforçador relativo (ou fprça) de reforçadores primários. Note bem como essa estratégia experimental é contrária àquela utilizada em capítulos anteriores, onde as operações de “impulso” eram sempre mantidas constantes e as contingências de reforçamento eram manipuladas. Empregando aquela metodologia a taxa de comportamento era tomada geralmente para representar a força do comportamento. Na metodologia da motivação, a taxa de comportamento será frequentemente tomadc para representar a força do reforçador. Evidentemente, o “significado” dc comportamento é derivado apenas pela consideração da variável ou variáveis às quais c comportamento está sendo relacionado. Discutiremos abaixo algumas técnicas comportamentais que têm sido usadas para medir o valor reforçador primário dos estímulos e, assim, por inferência, a motivação. Ao mesmo tempo, ilustraremos uma variedade de respostas e reforçadores primários diferentes.

1. Resistência à saciação

Nossa intuição nos diz que quanto “mais sedentos” estivermos, mais água

- 3 4 9 -

poderemos consumir c que quanto mais “ famintos” estivermos, mais alimento poderemos comer. Como podemos quantificar essas impressões? Uma forma éexaminar as propriedades do processo de saciação em relação à duração de tempo em que se tenha impedido a um indivíduo o acesso a todos os reforçadores de uma certa classe. Com efeito, examinamos curvas de saciação obtidas a vários graus de privação. Suponha que, depois de um período de privação, estabeleçamos uma contingência de modo que alguma cadeia arbitrária de comportamento possa produzir o reforçamento. Então, ou o tempo que o organismo leva para alcançar algum critério arbitrário de taxa baixa ou o número de respostas reforçadas emitidas antes de ser atingido ocritério de taxa baixa, proporcionariam uma medida da resistência à saciação. Éevidente que, se contingências de crf estão em efeito e se a quantidade de reforçamento é mantida constante, a última medida seria equivalente à quantidade de substância consumida. A resistência à saciação é calculada de modo análogo àresistência, à extinção (seção 5.5). Usando o me'todo de resistência à saciação, Siege (1947) mediu a quantidade de água bebida pelos ratos num período de 5 minutos em função de quanto tempo os animais haviam sido privados de água. A reiação obtida é vista na Fig. 15-5. De 0 até 48 horas de privação, a resistência à saciação, medida pela quantidade de água consumida, aumentou. A taxa de aumento, todavia, parece diminuir depois de 12 horas. Resultados similares podem ser obtidos para privação de alimento. Com períodos muito grandes de privação, todavia, a quantidade de alimento ingerido declinará, presumivelmente como um resultado da contração do estômago e inanição. Dentro de certos limites, entretanto, a resistência à saciação aumenta à medida que o tempo de privação aumenta.

A resistência à saciação, embora uma técnica útil, não é sempre inteiramente ‘satisfatória para medir o valor reforçador. Uma dificuldade encontra-se nas complicações fisiológicas que ocorrem com longos períodos de privação, causando,

N úm ero de horas de privação de água

Figura 15-5. Quantidade de água ingerida por ratos num pen'odo teste de 5 minutos m função do número de horas em que não tiveram acesso a qualquer líquido

(segundo Siegel, 1947).

- 3 5 0 -

algumas vezes, um consumo reduzido. Outra dificuldade surge se desejarmos saber quão forte é o reforçador em vários pontos do processo de saciação. Em qualquer nível de privação, um organismo pode comer ou beber numa taxa constante e alta até que o processo chegue a uma cessação abrupta (Fig. 15-4). Logo,é difícil avaliar a força momentânea do reforçador através da inspeção do processo dc saciação. As curvas de saciação tendem a diferir principalmente nos seus pontos terminais, c não nas suas inclinações (Fig. 15-4). Então, somos forçados a esperar até que a saciação seja alcançada para sabermos quão faminto ou sedento o animal estava no início.

2. Taxa de respostas reforçadas intermitentemente.

Uma técnica em geral mais conveniente para medir o valor reforçador é observar a taxa de resposta apresentada por um organismo quando o comportamento está sendo intermitentemente reforçado. Um esquema de intervalo, por exemplo, pode ser programado para fornecer uma taxa de reforçamento bastante baixa, de modo que o comportamento possa ser mantido sem a ocorrência de saciação por um longo período de tempo. Skinner (1938) usou essa técnica para avaliar os efeitos comportamentais de quantidades especificadas de alimento dadas aos ratos, antes do teste. Primeiro, os ratos foram privados de alimento por 23 horas e, então, durante vários dias, foram alimentados com quantidades diferentes de alimento logo antes do teste com as contingências de intervalo. Os resultados para um desses ratos aparecem na Fig. 15-6. Os números associados a cada curva referem-se à quantidade de alimento, em gramas, dado ao rato previamente. É evidente que, quanto mais o rato se alimentava imediatamente antes do trabalho, menor era a taxa de resposta no esquema.

F. C. Clark (1958) estudou os efeitos de vários graus de privação de alimento sobre as taxas de respostas “estabilizadas” , em intervalo variável (IV), em ratos.

Figura 15-6. Quatro registros diários de um rato sob contingências de intervalo, privado por 23 horas, e alimentado com diferentes quantidades de alimento imediatamente antes do teste (Skinner, 1938).

- 351 -

Vários IVs diferentes foram usados. Clark obteve as curvas da Fig. 15-7 quando representou a taxa de respostn dos ratos em função das horas de privação. O efeito do aumento de privação foi o dc aumentar a taxa de resposta sob todos os esquemas de IV. A maneira pela qual a privação e os esquemas de reforçamento interagem para determinar as taxas de resposta da Fig. 15-7 é de algum interesse. A similaridade na forma das curvas da Fig. 15-7 significa que a privação interagiu com o esquema IV de modo que, cm todos os níveis de privação, a razão entre a taxa num IV c a taxa no outro IV era uma constante. Por exemplo, com 5 horas de privação, a taxa em ÍV-3 era cerca de 4 R/min. e em IV-1 era 2,5 vezes isto, cerca de 10 R/min. Quando a privação foi aumentada para 20 horas, as duas taxas eram aproximadamente 6 e 15 respectivamente, de modo que a taxa em IV 1 era ainda 2,5 vezes maior do que a taxa em IV-3.

No experimento de Clark, o intervalo máximo de privação foi de 23 horas. Heron e Skinner (1937) pesquisaram sobre a privação alimentar prolongada, em ratos, que se estendia até a morte do animal. Eles descobriram que a taxa de resposta reforçada com alimento em IF aumentava progressivamente durante o período de inanição até atingir um máximo, depois do que declinava rapidamente e logo se seguia a morte como resultado da inanição. A taxa máxima não ocorreu no mesmo ponto para todos os ratos. No experimento de Heron e Skinner, ela ocorreu entre 4 e 12 dias. O resultado apoia as teorias que equiparam a motivação a um deficit corporal

T em po de privação (horas)Figura 15-7. Taxa média de resposta em IV em função do tempo de privação. O parâmetro é o IV médio (Clark, 1958).

- 3 5 2 -

(“necessidade” ). Embora o deticil alimentar do rato continue a aumentar através da privação, parece que o valor reforçador do alimento não aumenta. Veremos mais tarde quais outras medidas comportamentais substanciam essa conclusão.

3.Resistência à extinção.

A taxa dc resposta durante a extinção e outras medidas de resistência à extinção (seção 5.5) têm sido usadas, com freqüência, para medir os efeitos comportamentais da nrivação e outras operações similares. Crocetti (1962) treinou ratos com 7 horas de privação de alimento a pressionar uma barra, reforçando-os com alimento. Os sujeitos foram, então, distribuídos em cinco grupos e cada grupo foi extinto depois de uma duração diferente de privação. Na Fig. 15-8, é visto o número total de respostas emitidas por cada grupo, depois de 3 horas de extinção. A curva mostra o aumento usual na taxa de resposta à medida que o tempo de provação aumenta. Mas observe que a forma dessa curva difere daquelas da Fig. 15-7. Diferenças como essas levantam o problema sistemático de qual índice comportamental representa melhor o valor do reforçador. No presente, não há uma solução definida para esse problema e os teoristas são frequentemente forçados a adotar a posição de que as medidas que se correlacionam melhor entre si representam melhor a força do reforçamento.

H oras de Privação

I igura 15-8. A relação entre horas de privação e o número de respostas dc pressão à barra durante a extinção (segundo Crocetti. 1 9 ^ A

4. Aquisição

Poderíamos esperar que, com um aumento no poder do reforçador, houvesse um aumento concomitante na velocidade do processo de aquisição. Quando a aquisição envolve uma longa cadeia de respostas (por exemplo, o comportamento de percorrer uma pista) ou uma discriminação, essa predição é verificada. Broadhurst (1957) treinou ratos a percorrerem, submersos, um labirinto equivalente ao labirinto cm Y. Os ratos eram submersos na caixa de partida, aí ficando por alguns segundos permitindo-se, então, que nadassem debaixo d’agua até ao ponto de escolha. Lá.

- 3 5 3 -

era-lhes apresentada uma discriminação luz-escuro, com contingências do tipo discutido em relação ao aparelho de saltar de Lashley (seção 10.3). Se, no ponto de escolha, o rato nadasse para o lado claro, encontrava uma porta aberta que permitiria o acesso para um lugar seco. Se, todavia, nadasse para o lado incorreto, encontrava uma porta trancada e tinha de nadar de volta para o ponto de escolha e, então, dirigir-se para o outro braço do Y para sair. Todo o procedimento foi efetuado debaixo d’água. O procedimento é, esquematicamente,

onde Sa = na caixa de partida, porta fechadaSb = na caixa de partida, porta aberta Rg = nacjar para 0 ponto de escolha$D = H O RD = virar à direitaSe = Í~IB RE “ virar à esquerda.S+ = lugar seco

onde Tx é a variável independente, a privação de ar por Tx segundos. Broadhurst variou também a diferença de intensidade entre as duas partes do estímulo visual do ponto de escolha. Quanto maior essa diferença, mais fácil a tarefa discriminativa (Frick, 1948). Logo, uma grande diferença de iluminação corresponde a uma discriminação “fácil”; uma diferença pequena corresponde a uma discriminação “difícil” .

Figura 15-9. Número de escolhas discriminativas corretas em 100 tentativas de aquisição em função da privação anterior de ar. Os dados são de tres discriminações que variam em dificuldade (segundo Broadhurst, 1957).

- 354 -

Os resultados da aquisição são apresentados na Fig. 15-9. E visto o número de escolhas corretas em 100 tentativas de aquisição das duas discriminações. Para a diferença grande de iluminação (discriminação “fácil”), podemos resumir os resultados dizendo que, quanto maior o tempo de privação de ar, mais eficiente era o desempenho de aquisição. Mas quando uma pequena diferença de iluminação era usada (discriminação “difícil”), a aquisição era mais eficiente num valor médio (2 seg.) de privação de ar e menos eficiente com privações maiores e menores. Se esse resultado puder ser generalizado, parece que com tarefas difíceis é possível ter-se muito mais motivação para um desempenho ótimo. Certamente, as diferenças na forma entre as duas curvas da Fig. 15-9 indicam que o método de aquisição deve ser usado cauteiosamente como uma medida da força do reforçador. Por exemplo, um resultado bem diferente foi obtido numa situação que requeria o nadar debaixo d’agua, em linha reta, sem contingências discriminativas. Então, numa faixa de privação anterior de ar de 0 a 10 seg, os ratos nadavam tanto mais rápido quanto maior a privação anterior de ar.

5. Superar obstáculos.

Quanto mais reforçador um estímulo, é de se esperar que um organismo supere mais obstáculos, impedimentos e barreiras para produzir o reforçador. Esta é a razão da Caixa de Obstáculo de Colúmbia vista na Fig. 15-10. Um rato é colocado na caixa de partida e uma grade eletricamente carregada é interposta entre ele e o alimento, água ou um companheiro localizado na caixa objetivo (o rato foi previamente treinado a correr para a caixa objetivo sem receber qualquer choque elétrico). Se o rato atravessa a grade, ele tem um breve acesso ao reforçador e é, então, recolocado na caixa de partida para outra tentativa. O número de vezes que ele atravessa a grade eletrificada em 30 minutos fornece uma medida da força do comportamento. Warden (1931) pesquisou sobre vários reforçadores primários e procedimentos de privação com este aparelho. Ele acreditava que esta era uma maneira de comparar objetivamente as forças máximas de vários reforçadores primários. Um grupo interessante das funções de Warden aparece na Fig. 15-11.

Figura 15-10. A caixa de Obstáculo de Columbia. Há uma grade eletrificada (B) entre o compartimento do rato (A) e um reforçador colocado na caixa objetivo (C) ( segundo Warden, 1931, de Harlow, 1948 ).

- 3 5 5 -

Através dessas funções, vemos que se as operações são efetuadas por bastante tempo, o comportamento que produz o reforçador chega a uma força máxima e, então, declina. Warden supôs que as alturas relativas dos máximos poderiam ser interpretadas como significando que impulsos para água e alimento são mais fortes do que o impulso para sexo. Mas, esta conclusão é justificável? Devemos nos lembrar de que as funções comportamentais dependem de muitas variáveis além daquela particular que o experi-

Dias de privação

Figura 15-11. Número de travessias de uma grade eletrificada em função dos dias de privação do reforçador primário apropriado (segundo Warden, 1931).

mentador está pesquisando. O valor reforçador, em particular, depende de fatores tais como a qualidade e quantidade de reforçamento. A conclusão de Warden suponha que, de algum modo, esses fatores haviam sido equacionados para sexo, alimento e água, de maneira que a privação era a única variável na situação. Mas até que ponto, além do mais trivial, pode-se afirmar que (digamos) exposições de 10 segundos a um rato-femea, um recipiente de água e um pedaço de queijo são iguais? E mesmo que fosse encontrada alguma forma para igualar dois reforçadores, os processos de saciação associados a cada classe de reforçador são, quase certamente, tão diferentes que a média de travessias numa sessão de 30 min refletiria uma composição diferente de valores reforçadores para cada reforçador. Essas considerações indicam que a classificação de Warden dos impulsos para água, alimento e sexo não deve ser tomada muito seriamente. A questão de qual impulso é o mais forte pode nem mesmo ser experimentalmente significante.

6 . Técnica do Trabalho Máximo.

- 3 5 6 -

A técnica do trabalho máximo é semelhante, em linhas gerais, à caixa de obstáculo, mas evita um dos efeitos colaterais indesejáveis desta última — a contaminação dos resultados pelos efeitos emocionais do choque elétrico. A técnica do trabalho máximo está baseada na noção de que, quanto mais forte o reforçador, mais trabalho o indivíduo efetuará para obtê-lo. Hodos (1961) delineou um procedimento engenhoso no qual um organismo trabalha num esquema de reforçamento em razão, onde o valor real da razão aumenta progressivamente com cada reforçamento sucessivo. Num experimento, a sessão iniciava com uma razão 2 e cada reforçamento sucessivo aumentava à razão de mais 2, de modo que os animais deveriam emitir 2 respostas para o primeiro reforçamento, 4 para o segundo, 6 para o terceiro, e assim por diante. Eventualmente, atinge-se uma razão tão alta que o animal se recusa a continuar trabalhando. O ponto em que isto ocorre é chamado de “ponto de quebra”, definido no trabalho de Hodos como 15 minutos sem nenhuma resposta. Usando ratos como sujeitos e leite condensado para o reforçamento, Hodos manipulou o esquema de privação de seus sujeitos, alimentando-os todo dia apenas com alimento suficiente para manter o peso de seu corpo numa percentagem fixa de seu peso com alimento livre. Assim, um rato mantido a 80 por cento de seu peso normal está fortemente privado; um rato mantido a 95 por cento de seu peso normal está apenas um pouco privado. Este procedimento é comumente empregado para controlar a privação de sujeitos experimentais, e alguns acham que ele permite um controle um pouco melhor da motivação do que men tendo os sujeitos com uma duração fixa de privação, digamos 23 horas. A medida do comportamento usada por Hodos foi o número de respostas na última razão completada antes do ponto de quebra. Esta razão final é a razão máxima que o rato poderia completar sob as condições do experimento. A Fig. 15-12 mostra que, à medida que os ratos estavam mais privados, eles completavam uma razão máxima maior. Interpretamos isso como significando que com uma privação maior o rato apresentará maior quantidade total de trabalho.

7, Adulteração do reforçador.

Quando estamos ligeiramente famintos, somos muito seletivos com relação aquilo que comemos. Eventualmente, à medida que ficamos mais famintos, nossos padrões sobre aquilo que aceitaremos serão menos exigentes. Se estivermos com uma privação muito grande, comeremos qualquer coisa. Essas impressões sugerem que o impulso poderia ser medido pela quantidade de uma substância desagradável que pode ser misturada como alimento de modo a fazer o organismo parar de consumir o alimento adulterado ou de trabalhai por ele.

Os pesquisadores com interesse nas relações cérebro-comportamento tem comumente recorrido à destruição experimental (lesões) de pequenas regiões localizadas do- sistema nervoso a fim de localizar regiões específicas do cérebro associadas a comportamentos específicos. Numa região profunda do cérebro (o núcleo ventro-medial do hipo- tálamo) tal destruição experimental produz um íimal que, depois de reabilitar-se da cirurgia, come vorazmente. Num período dc dois meses, ele dobrará o seu peso se tiver acesso contínuo ao alimento. (Teitelbaum, 1955 ). Embora tais ratos “operados” comam quantidades enormes de alimento e se tornem obesos, Miller, Bailey e Stevenson (1940) mostraram anteriormente que esses ratos nao trabalham para obter alimento em esquemas de razão tanto quanto trabalhariam ratos normais.

- 357 -

120Rato SO

Rato 77

I 8 0 -X»

100 95 90 85 80Percentagem do peso com alim en to livre

Figura 15-12. Razão máxima que produz o leite e que os ratos emitirão, em funçãodo grau dc privação de alimentos (Hodos, 1961).

Essa é uma das várias descobertas a mostrar que a quantidade de alimento consumido (resistência à saciação) e o trabalho realizado pela obtenção de alimento não estão perfeitamente correlacionados. Miller, Bailey e Stevenson tomaram os dados da razão como significando que os ratos obesos não estavam tão “ famintos” quanto os ratos normais, embora, se o alimento estivesse livremente disponível, eles consumissem relativamente muito mais alimento.

Teitelbaum utilizou o método de adulterar o alimento do rato com uma pequena quantidade fixa de quinino (uma substância que sujeitos humanos acham amarga) para averiguar interpretação de Miller, Bailey e Stevenson. Ele descobriu que, durante os dois meses depois da operação, quando os ratos estavam se tomando obesos, o quinino não detinha seu consumo anormal de alimento. Em outras palavras, durante este período no qual os ratos turnavam-se muito gordos, o alimento era um reforçador forte. Mas, uma vez que os ratos tornavam-se obesos, uma quantidade de quinino muito pequena para afetar o consumo de alimento pelos ratos normais, detinha completamente o comer dos animais obesos. Parece que o alimento é menos reforçador para o rato completamente obeso do qus para o rato normal. Mesmo assim, se se dá acesso continuo a alimentação não adulterada, o animal obeso comerá muito mais— sua resistencia à saciação é maior que a do normal.

8. Preferência.

Suponha que seja possível emitir uma, mas não ambas, de duas cadeias de comportamento. Na medida em que um organismo emite o comportamento que produz um reforçador em vez de e m itir o comportamento que produz um outro, dizemos que já tem uma preferência pelo primeiro reforçador. Se a quantidade de esforço para completar ambas as cadeias é aproximadamente a mesma, tal preferência poderia ser considerada como uma expressão do valor reforçador superior do primeiro reforçador. Assim, o comportamento de preferência torna-se um método para avaliar o valor re- forcador relativo de dois ou mais reforçadores.

- 3 5 8 -

Quando as glândulas supra-renais de ratos são removidas cirurgicamente, ocorre uma mudança drástica na balança iònica de sódio e potássio. A menos que uma grande quantidade de sódio seja ingerida diariamente, o animal logo morrerá. Quando a operação é realizada, os ratos mudam sua preferência normal por água para soluções salinas (cloreto de sódio) e ingerem grandes quantidades de solução salina, conseguindo, assim manterem-se vivos e sadios. Esta mudança de comportamento é a evidência de que a operação age de modo a aumentar o valor reforçador do sal.

Descrevemos brevemente vários métodos, mostrando que vários tipos de comportamento variam de uma maneira ordenada com mudanças na privação, saciação e operações associadas. Parece existir um conjunto de medidas comportamentais que, dentro de certos limites, covaria com a privação do reforçador.Por exemplo, quando se aumenta a privação de alimento, o indivíduo trabalha mais depressa num esquema de intervalo de reforçamento alimentar, realiza um total maior de trabalho (razão progressiva), supera mais obstáculos e adulterações do reforçador ou adquire mais rapidamente uma nova habilidade. Resumimos isto no Diagrama 115.21.

A covariação sistemática em um número de medidas comportamentais independentes em relação a uma única operação (por exemplo, privação) fornece uma base para a introdução de um conceito que irá resumir e denominar essa covariação. O termo valor reforçador, para o qual, intencionalmente, adiamos uma definição formal até agora, é justamente este conceito. Pode-se dizer que o valor do reforçamento denota a covariação dos comportamentos do lado direito de [ 15.2]. Estamos agora em condições de fundir os Diagramas [15.1] e [15.2], pois o significado do lado direito de [15.1 ] é expresso mais exatamente por [15.2]. Similarmente, o lado esquerdo de [15.2] é mais adeauadamente referido em [ 15d} .

O verdadeiro conceito de impulso pode agora ser formalmente definido como a conjunção (relação) dos termos dos Diagramas [15.1] e [15.2]. Isto e\ um impulso c a relação entre uma operação de estabelecimento do reforçamento e o valor reforçador de uma classe de estímulos. Mas podemos, agora, apreciar a grande diversidade de informação que o termo “ impulso” contém. O conceito traz consigo um gr^u de complexidade que não déve ser esquecido quando usarmos a palavra impulso sozinha. Se, de fato,

Sumário.

I 15.2|

Operação de estabelecimento do reforçador

Mais trabalho é realizado Um reforçador de qualidade inferior é toleradoMaior preferência pelo reforçador.

- 3 5 9 -

compreendermos completamente o seu status como um conceito abstrato dc compilação, será pouco provável que o empreguemos metaforicamentcTio sentido de “ incitação” ou força que “dirige, impulsiona o organismo” , ou como uma causa do comportamento. Similarmente, evitamos referências à sua “ localização” (já que uma abstração não tem ’‘localização”) ou sua “ satisfação” (pois, como pode uma abstração scr satisfeita? ). Nenhuma das metáforas de uso comum é apropriadamente aplicada ao conceito de ilmpulso que explicamos. O termo mostra uma relação complexa e significa, nada mais nada menos, que Diagramas como [ 15.1 ] e 115.2].


Ànliker, J., and Mayer, J. Ôperant conditioning tèchnique for studying feeding patterns in normal and obese mice. / . appl. P h y s i o l 1956,8, 667-670.

Broadhurst, P. L. Emotionality and the Yerkes-Dodson law. / . exp. Psychol, 1957, 54, 345-352.

Clark, F. C. The effect of deprivation and frequency of reinforcement on variable interval responding. / . exp. Anal. Behav., 1958, 1, 221228.

Crocetti, C. P. Drive level and response strength in the bar-pressing apparatus. Psychol. Rep., 1962, 10, 563-575.

Frick, F. C. An analysis of an operant discrimination. / . Psychol., 1948, 2 6 ,93-123 .

Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews (E d .), Methods of psychology, New York: Wiley, 1948.

Heron, W. T., and Skinner, B. F. Changes in hunger during starvation. Psychol. Rec., 1937, 1, 51-60.

Hodos, W. Progressive ratio as a measure of reward strength. Science,1961, 134, 943-944.

Kleitman, N. Sleep and wakefulness, (rev. and enlarged ed.) Chicago: Univer. of Chicago Press, 1963.

Miller, N. E., Bailey, C. J., and Stevenson, J. A. F. Decreased “hunger" but increased food intake resulting from hypothalamic lesions. Science, 1950, 112,256-259.

Reese, T. W., and Hogenson, Marilyn J. Food satiation in the pigeon./ . exp. Anal. Behav., 1962, 5, 239—245.

Siegel, P. S. The relationship between voluntary water intake, body weight loss, and number of hours of water privation in the rat /. comp, physiol. Psychol., 1947, 40, 231-238.


Smith, Margaret F., and Smith, K. U. Thirst-motivated activity and its extinction in the cat. /. gen. Psychol., 1939, 21, 89-98.

Teitelbaum, P. Sensory control of hypothalamic hyperphagia. J. comp, physiol. Psychol., 1955, 48, 156-163.

- 3 6 0 -

Capítulo 16 MOTIVAÇÃO 11

Diz-se frequentemente que os drives (1) ativam ou dáo energia ao organismo, e (2) dirigem-no para um objetivo. Em vista de nossa definição no capítulo anterior de drive como sendo uma relação sumária entre dois grupos de observáveis (veja diagramas (15.1) e(15.2) , somos forçados a rejeitar a noção metafórica de que um drive por si sò possa ativar ou dirigir um organismo. Contudo, não devemos ser tão drásticos ao ponto de rejeitar tôdas as idéias que envolvem a ativação e direção. A partir da análise, algumas podem se referir a propriedades fundamentais do comportamento, que negligenciamos até agora em nossa discussão de motivação. *

16.1 ASPECTOS DE ATIVAÇÃO F DIRECIONAIS DA MOTÍVAÇÃO

Na terminologia presente, a ativação pode ser interpretada como um aumento na chamada atividade difusa geral do organismo. Tal atividade, no rato, compreende toilete, locomoção, fungar, mudanças dc posição, “exploração” e assim por diante. Realmente, o nível operante de respostas in condicionadas, estudado em capítulos anteriores, é uma forma desse tipo de atividade. Como nem o reforço passado nem o presente, para essas atividades, estão aparentes, os comportamentos são frequentemente mencionados como atividade espontânea. “ Espontâneo” é provavelmente um nome mal empregado desde que, como veremos, essas atividades podem ser experimentalmente controladas em alguma extensão. Referir-nos-emos a elas, daqui em diante, como atividades gerais.

Um aparelho conhecido como roda de girar (ou roda de atividade) tem sido usado, desde o início do século, para estudar a atividade geral em pequenos mamíferos (ratos, cricetos e camondongos). A roda (fig.16-1) é quase sempre ligada à gaiola-viveiro do organismo e o animal c livre para entrar na roda a qualquer hora e correr. A questão de se a motivação está relacionada à ativação é abordada de uma forma direta pelo estudo da relação de várias operações de drive à atividade de correr na roda. Um resultado representativo é a descoberta de Richter (1922), de que a atividade aumenta regularmente com a privação de alimento até o terceiro dia de privação (72 hr), depois do que: continuando a inanição, advem uma diminuição da atividade de correr.

Muito pouco trabalho foi feito para explorar os efeitos da privação de água na atividade na roda de girar, \ evidência existente sugere uma atividade aumentando progressivamente como função do aumento de privação (Hall, 1961).

- 361 -

Figura 16-1. Uma roda de atividade.

Na seção 15.6, vimos que o valor reforçador de reforçadores primários é periódico. A periodicidade que uma rata mostra na receptividade sexual está correlacionada com periodicidade na secreção de hormônio sexual e ovulaçao (chamada ciclo estrual) e é vista muito claramente na atividade de correr. Um ciclo de atividade típico de uma rata madura aparece na fig. 16-2. Pode ser visto que aproximadamente cada 4 dias a rata é extremamente ativa. Medidas fisiológicas correspondentes mostram que é precisamente durante êste período ativo que ocorre a ovuiação, colocando a fêmea maximamente susceptível à inseminação. Durante este período, diz-se que a fêmea está no “cio” e é então mais receptiva a avanços sexuais do macho. Durante as partes de baixa atividade do ciclo, todavia, a fêmea provavelmente resistirá à copulação e lutará contra avanços do macho. Então, para a rata, existe uma correlação íntima entre atividade geral e valor reforçador do sexo.

Um outro aparelho, que registra um conjunto algo diferente de atividades gerais é o estabilímetro (Fig. 16-3). O estabilímetro consiste de uma gaiola (quase sempre triangular) cujo piso é montado sobre um sistema de suspensão pneumática. Pequenos movimentos na gaiola e mudanças no equilibrio pelo animal inovem o piso ligeiramente, mudando o equilíbrio da pressão do ar. Essas mudanças são transmitidas a uma pena registradora que permite um registro permanente da atividade a ser mantida. Os movimentos registrados não são necessariamente do mesmo tipo que os movimentos de

- 3 6 2 -

4

correr na roda. e portanto não devemos tomar como um paradoxo que alguns investigadores tenham relatado que as privações de alimento e água afetam apenas ligeiramente, ou nada, as atividades registradas em estabilímetros. Em geral, os tipos de atividades medidos pela roda parecem ser alterados pela privação, enquanto os medidos em estabilímetro são muito menos afe+ados. Bolles (1963) suspeitou que essa diferença significasse que atividades específicas diferentes eram diferencialmente afetadas pela privação. Com a ajuda de vários assistentes, ele observou periodicamente as atividades de dois grupos de ratos, por um número de dias, em suas gaiolas. Uma vez por hora, os experimentadores olhavam brevemente cada rato, e clci^sificavam o que ele estava fazendo em uma de seis atividades: dormindo, descansando quietamente, de pé em um local, fazendo toilete, comendo, bebendo. Um grupo (faminto) foi alimentado com 10 g de alimento uma vez ao dia. Como resultado, esse grupo experimentou uma perda de 15 a 20 por cento em relação ao peso com livre acosso ao alimento. O outro grupo tinha acesso irrestrito ao alimento e assim foi chamado de grupo ad lib. O regime de privação de alimento resultou em desvios do padrão de atividade do ad lib. Os ratos famintos faziam mais movimentos (levantar e locomover) e descansavam mais quietamente que os ratos ad lib. A privação de alimento parece, assim, mudar o padrão de atividade, aumentando algumas atividades e diminuindo outras.

O nível operante da resposta, isto é , a atividade operante antes de fortalecida, é sensível a operações de privação. Crocetti (1962) obteve a curva vista na Fig. 16-4, quando registrou o nível operante de ratos que pressionavam uma alavanca sob cinco

- 3 6 3 -

valores diferentes de privação de alimento. A comparação da curva da fig. 16-4 com a da fig. 15-8 (ambas contendo dados dos mesmos ratos) mostra que a privação de alimento afetou o nível operante de pressão à barra na mesma maneira que afetou a resistência à extinção da resposta após o seu fortalecimento experimental.

Figura 16-3. Um estabilimetro para registrar movimentos de pequenos animaisOiarlow, 1948).

A evidência apresentada de várias fontes sugere que algumas operações de drive aumentam realmente certas atividades, mesmo que essas atividades nunca tenham sido diretamente relacionadas ao reforçador primário associado com a operação de drive utilizada. Embora esta proposição possa ser generalizada para incluir muitos reforçadores primários, não ê verdadeira para todos. Por exemplo, certas deficiências de vitamina estão associadas com uma diminuição e não com um aumento de atividade (Hall, 1961). Ao tentar compreender como as operações de privação estão relacionadas a atividades, alguns presquisadores apelam para a evolução das espécies. Na história evolutiva das espécies, pareceria que uma espécie que se torna mais ativa quando foi mais privada de substâncias vitais devia ter uma certa vantagem de sobrevivência sõbre uma espécie que não tivesse esta tendência. O tornar-se mais ativo devia levar o organismo a achar alimento ou água que um indivíduo mais inativo poderia nunca descorir.

Quando nos voltamos para a análise da chamada propriedade diretiva das operações de drive, notamos que a idéia expressa é menos experimental que de interpretação. Uma operação de drive é direcional no sentido em que age seletivamente no comportamento associado com uma dada classe de reforçadores, e não em todos os comportamentos igualmente. Assim, a privação de alimento afeta maximamente comportamentos reforçados com alimento, a privação de água afeta maximamente comportamentos reforçados com água, e assim por diante. Afetando-se seletivamente os reforçadores, certos comportamentos vêm a ter maior probabilidade de ocorrência que outros. Por exemplo, quando um chimpanzé, que tenha sido altamente privado de alimento e apenas ligeiramente privado de uma companhia, é colocado numa situação onde pode desempenhar ou uma cadeia de comportamento que leva ao alimento (digamos, pressionar uma alavanca) ou uma que leva a um companheiro (digamos, entrar em um compartimento onde seu companheiro está confinado), provavelmente fará o primeiro.

- 3 6 4 -

Figura 16-4. Nível operante da taxa de pressão à barra em relação a horas de privação de alimento ( segundo Crocetti, 1962)

Esta é a essência da direção, e realmente a direção baseia-se parcialmente na operação de drive. Mas outra condição crítica para a direção baseia-se na história passada de condicionamento. A menos que exista o comportamento para levar ao reforçador, a operação de drive não dirigirá o organismo para ele. O melhor que fará será mudar o padrão de atividade geral, ou fazer com que a aquisição ocorra mais rapidamente; por si só, a operação de drive não tem poder de dirigir.

O exemplo do chimpanzé levanta o problema interessante sòbre o que acontece se suas operações de drive são executadas simultaneamente, e as cadeias de comportamento são topograficamente incompatíveis. Isto é, consideremos um chimpanzé privado tanto de alimento quanto de sexo, e colocado em uma situação onde a execução de um comportamento que leva a um reforçador impede a obtenção do out o. Se o animal corre para seu companheiro, desliga seu de alimento. Se começa a pressionar a alavanca para o alimento, uma porta se fecha bloqueando sua passagem para o companheiro. Esta é uma das situações frequentemente descritas como um conflito de motivos. Quantas vêzes nos vemos forçados a escolher entre um reforçador e outro? Na presente terminologia, a situação revela-se semelhante ao método de preferência usado para avaliar valores relativos de reforço. Talvez o conflito seja, então, melhor descrito como um conflito entre valores de reforço.

16.2 INCENTIVO

A qualidade e quantidade de um reforçador, duas variáveis relacionadas, estão associadas de perto com o valor do reforço. Já vimos como um alimento pode ser adulterado com quinino para diminuir seu valor reforçador. A qualidade de um reforçador alimentar pode também ser adversamente afetada pela mistura com uma porção de celulose não metabolizada. Jsto constitue, com efeito, uma diluição do reforço e como tal é uma maneira de variar o valor reforçador mantendo constante o volume da substância ingerida. A diluição, naturalmente, é particularmente conveniente para manipular o valor reforçador de líquidos. Guítman (1953) reforçou a pressão à barra por

- 365 -

ratos famintos, com uma gota de solução de sacarose em um esquema IV. A medida que a concentração de sacarose na solução aumentava, a taxa de pressão à barra aumentava, alcançando um máximo quando a concentração de sacarose era de 32%. Concentrações acima dês te valor produ/iam um declínio na taxa de resposta.

Os efeitos comportamentais da quantidade de reforçador podem ser estudados de várias maneiras. Se o reforçador é alimento, e a qualidade é mantida uniforme, o volume pode ser variado. Km geral, ratos adquirem cadeias de labirinto mais rápido e estabilizam em urna assíntota mais baixa de erros por corrida, quando recebem mais alimento por sua performance. A quantidade pode também ser estudada pela variação do tempo de acesso ao reforçador. Sujeitos ratos correm mais rápido paia um companheiro se se permite que permaneçam mais tempo com ele: pombos bicam mais rápido se se permite mais tempo de acesso ao grão reforçador contingente.

Os efeitos comportamentais da variação da quantidade e qualidade de reforço primário podem ser categorizados sob o rótulo de funções de incentivo Como um substantivo, incentivo ó um sinônimo de reforço, mas, como um adjetivo, podemos usá-lo para denotar a classe de variáveis que mudam o valor reforçador através de mudanças nas propriedades do estímulo reforçador. Para um sumário e interpretação dos vários efeitos comportamentais que as variáveis de incentivo podem ter, o estudante interessado pode consul tar Cofer e Applcy (1964).

16.3 FATORES FISIOLÓGICOS NA MOTIVAÇÃO

Temos tido pouca oportunidade para mencionar as propriedades do sistema nervoso neste tratamento dos princípios comportamentais. Esta negligência não deve ser vista como uma negação de que estruturas e funções nervosas estão ligadas aos vários comportamentos que descrevemos. Em vez disso, isto advém do reconhecimento de que o imenso volume de informação que constitue a ciência comportamental deve, por necessidade, ser dividido em partes algo arbitrárias. Psicologia, Sociologiae Antropologia constituem tais divisões: assim fazem as disciplinas híbridas de genética do comportamento e psicologia fisiológica. Embora tenhamos notado em outro lugar que as leis do comportamento não podem ser subordinadas ou substituídas pelas leis de fisiologia (ou química, ou mecânica, ou física nuclear) o sistema nervoso esta intimamente envolvido em todos os fenômenos comportamentais. Um cérebro e medula intactos, funcionando, são um pré-requisito para tôdas as leis do fortalecimento operante c muitas das leis do reflexo.

Evidentemente, os fenômenos naturais transcendem as fronteiras arbitrárias de disciplinas. Assim, o comportamento envolve um complexo de eventos físicos, ‘ ioquímicos, psicológicos, fisiológicos e sociológicos. A posição que adotamos é ditada pela conveniência: a psicologia preocupa-se com relações funcionais entre meio e comportamento. Leis relacionando comportamento à função nervosa levam-nos do território estritamente psicológico para o da fisiologia. Mas sempre que o comportamento é a variável dependendo de estudos de fisiologia, êles contribuem para o nosso conhecimento de comportamento e fisiologia; daí a designação psicologia fisiológica. Em um tratamento introdutório de psicologia, todavia, a psicologia fisiológica deve ser vista como uma especialidade avançada, que não pode ser tratada com certo grau de profundidade. Resolvemos introduzir alguns de seus achados no contexto de motivação, porque o quadro que está emergindo do mecanismo fisiológico subjacente ao reforço

- 3 6 6 -

ajuda a compreender o conceito comportamental de drive. Us estudos fisiológicos prometem dar-nos o conceito de valor reforçador, com um referente físico, em várias estruturas anatômicas, e a juntar um número de operações de drive ambientalmente diversas, descobrindo seus efeitos comuns no organismo.

Mecanismo de comer e beber. Na elaboração gradual dos mecanismos corporais associados com a alimentação, encontramos um exemplo representativo da procura de eventos fisiológicos subjacentes a fenômenos comportamentais. Mais precisamente, essa procura diz respeito a certos eventos e processos internos que acompanham mudanças no poder reforçador de alimento. Desde a antiguidade até tempos recentes, pensava-se que o estado do estômago tinha um papel importante no controle do valor reforçador do alimento. O fato de as “ caimbras de fome” frequentemente acompanharem informações de grande fome em humanos levou a investigações sôbre as relações entre câimbras de fome, contrações do estômago e fome. Cannon e Washburn (1912) estudaram contrações do estômago usando uma técnica simples em que um sujeito humano engolia um pequeno balão de borracha. Uma vez no estômago, o balão era inflado, e qualquer contração estomacal que ocorresse apertava o balão. As variações resultantes de pressão do ar no balão eram por sua vez transmitidas a uma pena registradora. O sujeito pressionava uma chave telegráfica sempre que sentia câimbras de fomel. Cannon e Washburn mostraram que as contrações estavam bastante correi aciona das com o relato de câimbra de fome, e concluíram que essas contrações eram a causa da fome. A hipótese ganhou atenção imediata porque parecia oferecer um mecanismo simples e direto para comer e beber. Mas logo foi visto que pacientes que não tinham estômago comiam de maneira normal, e relatavam “ fome” embora nunca tivessem contrações de estômago. As implicações dessas observações foram ampliadas em experimentos que mostraram que ratos comiam normalmente, embora os nervos do estômago fôssem isolados cirurgicamente do cérebro. Outras observações mostraram que as contrações de fome eram abolidas pelas primeiras mastigadas de alimento, embora o alimento continuasse a ter um alto valor reforçador muito depois que as contrações cessavam. No fim, a teoria de fome de contração do estômago teve que ser abandonada, porque não explicava muitos dos fatos do comportamento de comer.

Um mecanismo mais complicado foi indicado pelos primeiros experimentos de Tschukilshew (citado em Templeton e Quigley, 1930) em que a transfusão de sangue de animais privados de alimento para animais bem alimentados aumentou a motilidade do estômago do receptor. Experimentos mais recentes mostraram que a transfusão de sangue entre ratos famintos e saciados (Fig. 16-5) afeta o consumo de alimento dêsses animais. A alimentação e o jejum parecem mudar algum aspecto do sangue, o que, por sua vez, afetaria mecanismos cerebrais, levando a uma mudança no valor reforçador do alimento. Mayer (1953) teorizou que uma variável mediadora possível é a concentração relativa de glicose arterial e venosa, e que as células no cérebro onde essa concentração pode ser “medida” situam-se em uma região restrita do hipotálamo (Figc 16-6).

1. Os tèrmos "fo m e " e "sêde" são usados no seu sentido descritivo como palavras breves para significar que alimenxo e água, respectivamente, têm alto valor reforçador.

- 3 6 7 -

Trabalho experimental independente confirmou que certas estruturas no hipotálamo estão intimamente relacionadas ao poder reforçador do alimento. Km uma subseção anterior, descrevemos efeitos comportamentais causados pelo dano experimental na região ventromedial do hipotálamo. Ratos com destruição nessa região comem demais e tornam-se obesos. A estimulação elétrica dessa região do cérebro também tem efeito no comportamento motivado por alimento.

I igura 16-5. Quando sc transfere o sangue de um rato faminto pura um bem alimentado, o consumo de alimento 6 alterado (Sanford, 1961).

Finos eletrodos podem ser implantados no cérebro em localizações bem precisas, sem lesar estruturas vizinhas. Os eletrodos são guiados no tecido nervoso através de um buraco perfurado no crânio, e então colocado um pedaço de plástico cimentado no crânio, cobrindo o buraco. Finalmente, o couro cabeludo é costurado. Depois de alguns dias de recuperação da operação, o animal operado recupera a saúde normal. O animal não parece de modo algum importunado pela adição dos eletrodos, e vive normalmente. Através dos eletrodos implantados, podem ser aplicadas correntes elétricas diminutas à estrutura do cérebro onde estão localizadas as pontas dos eletrodos. Os efeitos comportamentais de tal corrente elétrica são então medidos. Quando a região ventromedial do hipotálamo é assim estimulada, o consumo de alimento diminui. Foram encontradas outras áreas do cérebro onde a estimulação leva um animal “saciado” a começar a comer. O quadro dos mecanismos fisiológicos subjacentes á privação e alimentação ô complexo e ainda fragmentário. Nenhuma estrutura corporal única medeia o valor reforçador do alimento. O estômago, o sangue, o cérebro e provavelmente outros sistemas corporais interagem para determinar quando o alimento será reforçador.

Pode-se contar uma história experimental análoga para o mecanismo de beber, mas podemos indicá-la somente brevemente. As primeiras explicações foram centralizadas no papel da secura relativa da garganta e boca e na importância das secreções salivates. Boca e faringe secas eram igualadas a sede. Trabalhos posteriores mostraram que a salivação poderm não ser crucial desde que animais tanto bebiam como paravam de beber normalmente mesmo quando seus dutos salivares eram fechados. Ao contrário, em

- 3 6 8 -

I igura 16-6. Diagrama esquemático do cérebro humano (Rosenzwcig, 1962).

experimentos em que a água que os cachorros bebiam nunca alcançava seus estômagos, mas saía por uma fistula no pescoço (Fig. 16-7), cachorros privados de água continuaram a beber indefinidamente; embora suas gargantas e bocas fossem mantidas constantemente molhadas. A atenção experimental mudou gradualmente para o papel da água contida nas células do corpo. Um pequeno deficit de concentração normal de água nas células do corpo c sangue parece ser um fator crítico no beber (Gilman, 1937). O trabalho recente tem se dedicado à localização de centros cerebrais no hipotálamo que regulam o comportamento de beber e parar de beber.

Voltamo-nos agora à uma breve descrição de alguns métodos pelos quais os psicofisiologistas tentam descobrir a lógica da mecânica corporal interna. Suas principais técnicas são (1) estimulação do tecido nervoso por corrente elétrica ou por substâncias químicas ou drogas, (2) destruição cirúrgica ou farmacológica ou isolamento de áreas

I igura 16-7. (Segundo Rosen/woig, 1962).

consideradas cruciais, (3) registro de atividade elétrica local no cérebro, (4) modificação de aiguma estimulação encontrada na função normal, enquanto se deixa outros aspectos intatos (tal com o o experimento de beber simulado da Fig. 16-7), (5) medidas de numerosas variáveis fisiológicas em relação ao comportamento (tal com o nível de glicose no sangue c água contida nas células), (6) comparação de processos comportamentais com processos fisiológicos (por exemplo, a comparação do processo de saciação com contrações no estômago mostrou que os dois não eram paralelos, indicando que um, provavelmente, não é subjacente ao outro).

Os métodos dos psicofisiologistas podem levar a importantes descobertas comportamentais. Olds e Milner (1954) implantaram eletrodos profundamente em cérebros de ratos com o objetivo de verificar se a estimulação em uma região associada com o sono facilitaria ou dificultaria a aquisição de operantes simples. Os investigadores ficaram surpresos ao descobrir que a estimulação, por si só, tinha um efeito marcante no comportamento do rato.

No experimento teste que estávamos realizando, o animal foi colocado em uma grande caixa com os cantos rotulados A, B, C e D. Sempre que o animal ia para o canto A, era dado um choque elétrico fraco em seu cérebro pelo experimentador. Quando o teste foi realizado no animal... êste continuou voltando para o canto A. Depois de vários retornos no primeiro dia, finalmente foi para um lugar diferente e dormiu. No dia seguinte, todavia, parecia mais interessado no canto A.

Neste ponto supusemos que o estímulo devia provocar curiosidade; não pensávamos ainda nisto como recompensa. Experimentação continuada ccm o mesmo animal logo indicou, para nossa surprèsa, que essa resposta ao estímulo era mais do que curiosidade. No segundo dia, depois que o animal havia adquirido o

ligura 16-K Rdlo t.*stimulamlo-sc em uma faixa ik' Skinner (seguiuU* Okls. 1956).

- 3 7 0 -

hábito de vdtar ao canto A para ser estimulado, começamos a tentar levá-lo para o canto B, dando um choque elélrico sempre que ele tomava um passo nessa direção. Em questão de cinco minutos o animal estava no canto B. Depois disso, o animal podia ser dirigido para quase todos os pontos na caixa ao desejo do experimentador. Cada passo na direção certa era pago com um pequeno choque; com a chegada no lugar apontado, o animal recebia uma série mais longa de choques (Olds, 1956).

Evidentemente, a estimulação do cérebro estava agindo como um reforçador com o qual o comportamento operante podia ser rapidamente modelado. Depois o animal foi colocado na caixa de Skinner (Fig. 16-8) e se permitiu que ele estimulasse seu próprio cérebro em qualquer taxa que escolhesse. Altas taxas de resposta foram emitidas sob contingências crf. As similaridades entro a recompensa de estimulação do cérebro e reforçadores positivos mais convencionais tais como alimento e água são pronunciadas. Como outros reforçadores positivos, a recompensa de estimulação do cérebro mantém operantesRF, gerando alta resistência à extinção depois de contingências intermitentes, e permite poderoso controle de esquema (Pliskoff, Wright e Hawkins, 1965). Por outro lado, os ciclos de privação e saciação da recompensa de estimulação do cérebro parecem ser mensuráveis em segundos, em vez de horas ou dias.

Trabalho adicional por Olds e outros indica que não há um, mas um número de locais, no cérebro, onde a estimulação elétrica exerce efeito reforçador (Olds, 1962). Muitos desses são os mesmos lugares que parecem, de outros experimentos, estar ligados ci eficácia do alimento, sexo, atividade e outros reforçadores primários.

16.4 REFORÇADORES PRIMÁRIOS ADICIONAIS

Muitos dos princípios de comportamento elaborados nos capítulos anteriores vieram dos estudos em que os reforçadores primários consistiam de alimento para organismos privados de alimento, ou, ocasionalmente, água para indivíduos privados de água. Água e alimento são reforçadores poderosos e seguros e suas privações fornecem uma operação direta e exata para ativar sua força. Todavia, há uma quantidade de outros reforços primários que, ao contrário de água e alimento, não são essenciais para a vida do organismo. Nesta seção, consideraremos brevemente reforçadores primários tais como atividade, novidade, exploração, manipulação, afeição e contato corporal. A importância de alguns desses reforçadores primários foi reconhecida apenas recentemente. Em muitos casos, ainda temos muito o que descobrir sõbre as operações que determinam suas forças reforçadoras. Em outros casos, tais como exploração, novidade e afeição, a especificação real da classe de estímulos reforçadores está longe de ser estabelecida. Embora êsses problemas apresentem dificuldades reais para o desenvolvimento do conceito de drive nos termos desses reforçadores, êles não diminuem a importância empírica de tais reforçadores em modificar e controlar o comportamento. Muito do comportamento dc sêres humanos, que vivem em uma sociedade onde fome e privação de líquidos são raras, parece estar muito distante de drives associados com privação de alimento ou água. É provável que a análise de reforçadores primários adicionais mostre ser essencial para interpretar a complexa motivação humana.

1. Atividade. Numa seção anterior, consideramos várias técnicas para medir as chamadas propriedades de ativação da privação de alimento, sexo e água. Além dêsse controle sobre a atividade geral, parece que a privação de atividade, por si só, serve como

- 3 7 1 -

uma operaçao de drive para atividade. Por exemplo, um rato confinado em uma pequena câmara onde seus movimentos são restritos, irá, dando-se-lhe acesso a uma roda de correr, correr uma quantidade quase proporcional ao tempo em que esteve, anteriormente, confinado. A atividade é, assim, uma função que aumenta com as horas de confinamento (Hall, 1961). O valor reforçador de atividade aumentado depois de confinamento pode ser demonstrado também por um aparelho, o estabilímetro (gaiola de balanço). Quando colocados em uma gaiola de balanço depois de longos períodos de inatividade forçada, ratos movem-se muito mais que o usual. Kagan e Barkun (1954) mostraram que ratos pressionavam uma alavanca para ter acesso a uma roda em que pudessem correr. Aparentemente, a atividade pode servir como um reforçador primário para respostas operantes.

2. Exploração. Em condições normais, os organismos preferirão quase sempre colocar-se em uma situação nova. Isto é particularmente verdadeiro quando a situação nova apresenta uma oportunidade para “exploração”. É bem conhecido que um rato faminto, quando introduzido em uma situação nova que contém alimento, irá invariavelmente “explorar” a situação antes de comer. Isto sugere que o valor reforçador da exploração suplanta o do alimento, pelo menos inicialmente. Como uma demonstração experimental desse reforçador, imagine um labirinto T em que um dos braços contém um elaborado labirinto tipo “ tabuleiro” (Fig. 12-2), e outro braço contém uma caixa pequena e comum no fim. Ratos que não estão privados nem de alimento nem de água irão correr consistentemente para o lado que tem o labirinto em tabuleiro se se permite por um breve período de tempo que “explorem” o labirinto em tabuleiro quando chegam a ele.

Estímulos novos não precisam ser tão complicados como o labirinto em tabuleiro. Ratos e camondongos pressionarão uma alavanca se cada pressão produz um breve flash

operante discriminativo de empurrar um painel a/.ul (segundo Murray, 1964, baseado na descrição de Butler, 1953).

- 372 -

importante em se um rato pretere pressionar uma aJavanca qut liga uma luz, ou pressionar a outra alavanca que desliga uma luz (Lockard, 1963).

Reforçadores capazes de fortalecer o comportamento algo vagamente denominado “curiosidade” foram demonstrados por Butler (1953). Macacos novos foram colocados em uma caixa opaca em penumbra com duas janelas cobertas, uma azul e outra amarela. Empurrar a janela amarela não tinha nenhum efeito, mas o empurrar a janela azul abria-a por 30 seg, mostrando várias cenas (Fig. 16-9). Algumas cenas tais como um grande cachorro rosnador, não eram reforçadoras e levavam um pequeno empurrão. Outras cenas, como visão do laboratório e experimentador, outros macacos e objetos de brinquedo móveis tinham valor reforçador apreciável. Os macacos confinados rapidamente discriminavam a côr do painel e produziam as cenas reforçadoras frequentemente. Esse comportamento parece conter alguma relação com privação, desde que quanto mais o animal era confinado na caixa sem oportunidade de produzir uma cena, maior sua taxa de resposta quando dada a oportunidade. Butler (1957) encontrou a função vista na fig. 16-10, quando a pressão ao painel era reforçada em um esquema IV com a visão, por 12 seg; de uma colônia de macacos.

Crianças novas gastam muito tempo com “brincar” e manipular objetos. Essa manipulação parece ter propriedades reforçadoras intrínsecas e não precisa ser dependente da associação com outros reforçadores primários. Harlow (1950) demonstrou que macacos irão desmanchar quebra-cabeças mecânicos do tipo visto na Fig. 16-11, sem nenhum reforço adicional . Parece que êsses macacos resolverão os problemas meramente pelo gosto de resolvê-los. É por isto que tais reforçadores são chamados intrínsecos. Por um período de 10 hr. de observação, Harlow notou que o número de quebra-cabeças abertos diminuía progressivamente, sugerindo um processo de saciação.

3. Contato físico para organismos jovens: reforçadores de "afeição": Pode-se suspeitar que o contato físico com a mãe deve ser um reforçador para um organismo jovem. Tal reforçador teria, obviamente, utilidade biológica para manter o organismo jovem perto de sua mãe onde alimento, abrigo e proteção poderiam ser encontrados

No. de horas de privação da exploração visual.

I igura 16-10. Taxa de resposta cm IV reforçada por uma breve exposição a uma cena visual com função de horas de privação visual ( Butler,!957).

- 373 -

Pesquisa realizada por Harlow demonstrou que o contato do corpo é um reforçador muito poderoso, e além disso não depende de reforços primários adicionais de alimento, abrigo e proteção com os quais é normalmente associado. O contato, por si sô, é um reforçador primário poderoso e específico. Harlow (1960) criou macacos jovens em completo isolamento de suas mães. Das observações do reflexo de segurar, em macacos bebês (Fig. 16-12), Harlow suspeitou que poderia ser construída uma mãe “sub-rodaga” (substituta) que poderia fornecer certos aspectos do contato físico que as mães verdadeiras fornecem.

Figura 16-11. Quebra-cabeças mecânico que macacos resolverão sem qualquer reforço adicional (Harlow, 1950).

O reflexo de segurar e tocar é eliciado por um objeto cilíndrico; então, objetos do tipo na Fig. 16-13 foram colocados nas gaiolas dos bebês macacos desde o nascimento. Esses objetos cilíndricos (mães substitutas) eram idênticos em construção exceto por suas cabeças (um aspecto determinado mais tarde como irrelevante) e suas superfícies. Ambos os objetos foram construídos de arcabouços de arame, mas o arcabouço de arame de um estava coberto por uma camada grossa de tecido , enquanto o arcabouço do outro estava exposto. Harlow referiu-se ao objeto coberto de tecido macio como “mãe de pano” ; e o outro objeto ele chamou de “mãe de arame”. Os macacos criados em gaiolas contendo ambas essas mães substitutas permaneciam muito tempo de sua vida infantil em contato com a “mãe de pano” , segurando-se a “ ela” muito à maneira do reflexo de segurar da Fig. 16-12. Por outro lado, eles ignoravam virtualmente a “mãe de arame”.

Para determinar se o reforçador de contato constante fornecido pela “mãe de pano” dependia da história de associação com reforço de alimento, alguns macacos mamavam de uma mamadeira inserida no “ tórax” da macaca de arame e o restante mamava de uma mamadeira da macaca de pano. Mas a associação da mãe de arame com alimento não modificou a preferência do infante macaco por segurar-se na mãe de pano. O número de horas gastas com as duas mães para os dois grupos de macacos é visto na Fig. 16-14. Os macacos alimentados na mãe de arame passavam menos tempo nela do que os macacos alimentados na mãe de pano. Na Fig. 16-13 vemos como alguns macacos resolviam o

- 3 7 4 -

problema de alimentar-se de Uina mãe enquanto t i n h a » t a t o com a outra. Em outros experimentos, Harlow demonstrou que o valor reforçador da mãe de pano perdurava até dois anos. Essas descobertas atestam a grande durabilidade desse reforçador. As propriedades reforçadoras críticas da substituta parecem ser (1) sua forma cilíndrica e (2) sua maciez. Quando se usou uma tábua chata coberta de tecido, esta não gerou os efeitos vistos pelo cilindro coberto de pano da Fig. 16-13. O “abraço” não era possível com uso da tábua.

I igura 16-1 2. Reflexo de segurar, em macacos rhesus recém-nascidos, eliciado por um objeto cilíndrico (Harlow, 1960 ).

Harlow indicou que o privar os bebês macacos de suas mães* ou de mães substitutas apropriadas, pode interferir marcantemente com respostas emocionais e padrões de companhia, mais tarde . Evidentemente, a disponibilidade do reforçador de contato no início da vida é crítica para a ocorrência normal de certos padrões de comportamento na vida adulta. O trabalho de Harlow fornece um início impressionante neste problema muito difícil dos efeitos de experiências iniciais em comportamentos maduros posteriores. Desde Freud, os psicanalistas têm enfatizado que certas experiências iniciais críticas são de grande importância para o ajustamento de padrões emocionais de sêres humanos adultos; mas, através de experimentação controlada, a exploração dessas idéias tem sido difícil. O paradigma de Harlow pode oferecer um esquema útil para testar algumas dessas idéias.

- 3 7 5 -

1*igura 16-13. Macaco rhesus jovem mamando dc um objeto de arame cilíndrico, enquanto agarra-se a um objeto semelhante coberto com tecido (Harlow, 1960).

Idade média em dias

Figura 16-14. Horas, por dia, passadas com as mães substitutas de pano e arame em várias idades, em dias (Harlow, 1960).

16.5 DRIVES ADQUIRIDOS

No tratamento presente de motivação excluímos completamente uma discussão sôbre reforçadores adquiridos. Justificamos essa exclusão baseados em que as propriedades dos reforçadores condicionados eram bem explicadas através de uma certa história passada com contingências comportamentais de discriminação. Neste capitulo e no capítulo 15 limitamos nossa atenção a operações outras, que não aquelas na história passada de condicionamento do organismo, que afetam os reforçadores. Se, todavia, fosse possível criar um reforçador que (1) desse evidência de ser um reforçador terminal de uma cadeia de comportamento e (2) uma vez criado, fosse sensível a várias operações de estabelecimento e redução muito à maneira pela qual os reforçadores primários são, teríamos que concordar que tal reforçador alcança as condições necessárias para um drive adquirido. Ao contrário dos reforçadores condicionados do capítulo 11, esses reforçadores adquiridos não seriam dependentes de reforço primário subsequente para que sua força continuasse. Dois fenômenos comportamentais, retirados de contextos algo diferentes, parecem permitir uma consideração tentativa como drives adquiridos deste tipo.

1. Imprinting. Certos objetos em movimento, se apresentados no início da vida, podem adquirir propriedades reforçadoras para espécies cujos filhotes são capazes de se locomover logo depois do nascimento. Os primeiros relatórios descrevem o comportamento exibido por gansos, patos e pintos e outras aves, de “seguir” certos objetos em movimento. Hess (1958) descreveu as primeiras observações do zoologista austríaco Konrad Lorenz:

“Em uma fazenda perto de Viena, Lorenz dividiu um grupo de ovos postos por uma gansa em dds grupos. Um grupo foi chocado pela gansa; outro grupo foi chocado por uma incubadeira. Os gansinhos chocados pela gansa imediatamente seguiram sua mãe pela fazenda. Os outros, todavia, não viram sua mãe. A primeira coisa que eles viram foi Lorenz. E então seguiram Lorenz pela fazenda (Hess, 1958, p. 81)” .

Figura 16-15. Um aparelho usado no estudo de imprinting. Consiste de uma pista circular na qual um pato chamariz pode ser movimentado. No desenho, é visto um patinho seguindo o chamariz (Hess, 195 9).

- 3 7 7 -

Esse fenômeno, no qual uma experiência no início da vida dos gansos influenciou seu comportamento mais tarde, Lorenz chamou de “imprinting”. Logo foi estabelecido que a experiência tinha que ocorrer durante um período crítico no início da vida do organismo para ser efetivo. Trabalhes subsequentes devotados ao imprinting têm demonstrado que os tipos de objetos que podem fazer surgir tais comportamentos dc seguir são tão arbitrários como caixas de papelão ou esferas em movimento. Esses trabalhos posteriores tem tentado qualificar as condições sob as quais ocorrerá o imprinting.

Horas por dia

I-igura i 6-16. Teste positivo de resposta dc preferencia para o objeto-teste (Hess. 1959).

Têm indicado também que “seguir” é simplesmente uma manifestação de que um certo objeto tornou-se um reforçador poderoso. Qualquer comportamento instrumental que traga a ave jovem a uma maior proximidade com o objeto é fortalecido.

O aparelho utilizado por Hess (visto na Fig. 16-15) consiste de uma pista circular fechada de Plexiglass na qual um pato chamariz pode ser movido por um motor a várias velocidades. Um patinho, nascido poucas horas antes, c colocado na pista e o modelo começa a mover-se em volta da pista. Em alguns experimentos, um som sai de um alto falante de dentro do modelo. A operação de imprinting consiste de 1 hora, ou menos, de exposição ao objeto em movimento. Mais tarde, os patinhos, são testados para determinar preferência de resposta para o modelo de imprinting em comparação com outros objetos. Um achado surpreendente é que a operação de imprinting deve ocorrer durante um período de idade para ser efetiva na determinação da preferência. A fig.16-16 mostra isto graficamente. Para o caso de patinhos selvagens, uma idade de 13-16 h depois do nascimento dá o máximo de imprinting. Parece que, além de 30 h depois do nascimento, o imprinting já não é possível nesta espécie.

A fim de estabelecer que o objeto “ imprinted” age como outros reforçadores, Hoffman, Searle, Toffcy e Kozma (1966) modelaram uma resposta de bicar na chave que produzia uma iluminação breve (5 seg) do objeto “ imprinted” em movimento. Em seus

- 3 7 8 -

estudos, a arbitrariedade do objeto “imprinted” foi enfatizada. 0 ubjeto era uma mamadeira de leite sendo levada em um vagão de um trem modelo. Os patinhos recebiam uma exposição, anterior ao imprinting, à mamadeira de leite e mais tarde adquiriram as Rs de bicar a chave quando cada bicada produzia um aparecimento breve da mamadeira em movimento como reforçador. Subsequentemente, uma razão 5-1 foi mantida. Os sujeitos que não tiveram exposição anterior ao imprinting à mamadeira não bicavam a chave, mostrando que a operação de imprinting foi essencial para a criação desse tipo de reforçador.

Embora o objeto “imprinted” pareça adquirir propriedades reforçadoras, essas podem não durar indefinidamente. Hoffman, Toffey, Searle e Kozma mediram a quantidade de tempo pelo qual os patinhos “imprinted”, vivendo constantemente no aparelho, mantiveram a visão da mamadeira de leite pelo bicar da chave. Os experiment adores descobriram que, à medida que os animais cresciam, tendiam a trabalhar cada vez menos pelo objeto. Alguns resultados típicos são vistos na Fig. 16-17. Por volta de 60 dias, o valor do objeto em movimento como reforçador havia quase dissipado completamente. Um fato interessante é o de que o reforçador podia ser restabelecido temporariamente através de choque nos patinhos, ou pela apresentação de outros estímulos geradores de emoção.

Dias após a incubação

Figura 16-17. Quantidade média de tempo por dia, em que um objeto em movimento foi mantido à vista como uma função da idade dos patinhos. A operação de “ imprinting” com este objeto havia sido executada anteriormente, cada ponto representa uma média de 3 dias entre trés sujeitos (H.S. Hoffman, dados não publicados).

Os resultados dos estudos de imprinting sugerem que o procedimento de imprinting é uma operação que cria uma classe de reforçadores que se parecem com o objeto “ imprinted” . Como esse novo reforçador é um reforçador terminal de uma cadeia de comportamentos, suas propriedades se parecem mais com aquelas dos reforçadores

- 3 7 9 -

Figura 16-18. Rato viciado toma injeção de droga à vontade, pela pressão à barra. A solução de droga vem pelo tubo e então, através de uma cânula cronicamente implantada, penetra na veia jugular. Uma corrente em uma coleira impede que o tubo gire quando o animal se move na gaiola (segundo Weeks, 1964).

primários do que com as de reforçadores secundários. Ao contrário de um reforçador condicionado, não é sujeito a um procedimento de extinção, nem serve como um para uma resposta que produza um reforçador subsequente mais primário.

2. Vício Sabe-se bem que a administração repetida de certas drogas cria uma dependência em sua administração contínua. Além disso, essas drogas (tal como o ópio e seus derivados morfina, heroína e demorol) vem a adquirir propriedades reforçadoras poderosas. Os humanos que desenvolvem tais dependências, chamadas de vícios, tudo farão para obter injeções da droga. A despeito de sua prevalência na sociedade moderna, as condições que controlam o vício (suas causas e curas) rião são bem entendidas. Estudos recentes com sujeitos animais têm utilizado técnicas de resposta de operante livre para estudar o poder reforçador dessas drogas depois do vício. 0 principal objetivo desses estudos é clarificar as condições que estão relacionadas ao vício.

A operação que cria o reforçador de vício consiste da apresentação repetida (usualmente por injeção) de morfina e outros compostos em doses gradualmente maiores. Como uma conseqüência dessa série de administrações, a droga adquire poderosas propriedades reforçadoras. 0 vício experimental tem sido produzido em ratos e macacos por êsse método de aumentar gradualmente a dose da droga. As propriedades do reforçador adquirido da droga foram estudadas permitindo-se a um rato viciado os

- 3 8 0 -

meios para administrar o narcótico em si próprio (Weeks 1964). O rato viciado trabalhava numa caixa de Skinner onde cada pressão à barra inicialmente produzia injeção controlada de um narcótico selecionado. O sistema de injeção consistia de um tubo e uma cânula pela qual a droga era levada, em solução, diretamente para a veia jugular do rato (Fig. 16-18). Os resultados mostram que ratos viciados adquirem a R de pressionar a alavanca quando isso leva a várias quantidades de morfina. Curvas típicas de RF associadas com razões variando entre 10 e 400 pressões à barra para uma única injeção demonstram a natureza extremamente poderosa do reforçador morfina. Embora ocorressem periodieidades de pouca duração no vdor reforçador adquirido (efeitos de saciação), a duração a longo prazo do reforçador era indefinida. Um macaco trabalhando sob condições semelhantes a essas descritas para o rato permaneceu viciado por 21 meses (Weeks 1964). A técnica revela-se promissora em trazer resultados que podem sugerir os procedimentos a serem usados no controle das propriedades do reforço de drogas, uma vez que tenha ocorrido o vício.

O controle dos reforçadores de vício tem implicações óbvias para o controle de de vícios em humanos.

REFERÊNCIA PARA O CAPÍTULO 16

Bolles, R. C. Effect of food deprivation upon the rat’s behavior in its home cage. / . comp, physiol. Psychol., 1963, 56, 456-460.

Butler, R. A. Discrimination learning by rhesus monkeys to visual- exploratory motivation. J. comp, physiol. Psychol., 1953, 46, 95-98.

Butler, R. A. The effect of deprivation of visual incentives on visual exploration motivation in monkeys. J. comp, physiol. Psychol.,1957, 50, 177-179.

Cannon, W. B., and Washburn, A. L. An explanation of hunger. Amer.J. Psychol., 1912, 29, 441-452.

Cofer, C. N., and Appley, M. H. Motivation: theory and research. New York: Wiley, 1964.

Crocetti, C. P. Drive level and response strength in the bar-pressing apparatus. Psychol. Rep., 1962,10, 563-575.

Gilman, A. The relation between blood osmotic pressure, fluid distribution, and voluntary water intake. Amer. J. Physiol., 1937, 120, 323-328.

Guttman, N. Operant conditioning, extinction, and aperiodic reinforcement in relation to concentration of sucrose used as reinforcing agent. J. exp. Psychol., 1953, 46, 213-224.

Hall, J. F. Psychology of motivation. New York: Lippincott, 1961.Harlow, H. F. Studying animal behavior. Chap. 12 in T. G. Andrews

(E d.), Methods of psychology, New York: Wiley, 1948.Harlow, H. F. Learning and satiation of response in intrinsically moti

vated complex puzzle performance by monkeys. J. comp, physiol. Psychol., 1950, 43, 289-294.

Harlow, H. F. Primary affectional patterns in primates. Amer. J. Ortho-

- 381 -

psychiat., 1960, 30, 676-684.Hess, E. H. Imprinting in animals. Sci. Amer., 1958, 195, 81-90.Hess, E. H. Imprinting. Science, 195 9 ,130, 133-141.Hoffman, H. S., Searle, J. L., TofTey, Sharon, and Kozma, F. Behavioral

control by an imprinted stimulus. J. exp. Anal. Behav., 1966, 9, 177-189.

Kagan, J., and Berkun, M. The reward value of running activity. J. comp, physiol. Psychol., 1954, 47, 108.

Lockard, R. B. Some effects of light upon the behavior of rodents. Psychol. Bull., 1963, 60, 509-529.

Mayer, J. Glucostatic mechanism of regulation of food intake. New England J. Med., 1953, 249, 13-16.

Murray, E. J. Motivation and emotion. Englewood Cliffs: Prentice-Hall, 1964.

Olds, J. Pleasure centers in the brain. Sci. Amer., Oct. 1956, 195, 105116.

Olds, J. Hypothalamic substrates of reward. Physiol. Rev., 1962, 42, 554-604.

Olds, J., and Milner, P. Positive reinforcement produced by electrical stimulation of septal area and other regions of rat brain. J. comp, physiol. Psychol, 1954, 47, 419-427.

Pliskoff, S. S., Wright, J. E., and Hawkins, T. D. Brain stimulation as a reinforcer: intermittent schedules. J. exp. Anal Behav., 1965, 8, 75-88.

Richter, C. P. A behavioristic study of the activity of the rat. Comp. Psychol Monogr., 1922,1, No. 2.

Richter, C. P. Animal behavior and internal drives. Quart. Rev. Biol,1927,2, 307-343.

Rosenzweig, M. The mechanisms of hunger and thirst. Chap. 3 in L. Postman (E d .), Psychology in the making. New York: Knopf,1962.

Sanford, F. Psychology, a scientific study of man. Belmont, Calif.: Wadsworth, 1961.

Templeton, R. D., and Quigley, J. P. The action of insulin on the mobility of the gastro-intestinal tract. Amer. J. Physiol, 1930, 91, 467-474.

Weeks, J. R. Experimental narcotics addiction. Sci. Amer., Mar. 1964, 210, 46-52.

- 3 8 2 -

Capítulo 17 CONTINGÊNCIAS AVERSIVAS

Nossas discussões sobre o comportamento operante têm, até aqui, lidado exclusivamente com casos em que, pela manipulação da correlação entre uma classe especificada de resposta c eventos tais como alimento c água, ocorrem certas mudanças no comportamento. Aquisição, discriminação, esquemas dc reforçamento, diferenciação, aproximações sucessivas e encadeamento são as denominações dos procedimentos específicos que ditam a forma precisa da correlação resposta-reforçamento. O termo impulso agrupa as variações 110 comportamento operante que estão sob o controle dc operações que alteram o valor reforçador daqueles reforçadores. Em todos os diversos procedimentos tratados, o comportamento é mantido por reforçadores que são definidos como estímulos que têm a habilidade de aumentar a probabilidade das respostas que seguem. Volt amo-nos, neste capítulo, para uma nova classe de estímulos reforçadores que não preenchem essa definição de reforçadores positivos, embora modifiquem c mantenham o comportamento de maneira característica.

17.1 REFORÇADORES NEGATIVOS

Pouco mais do que a observação casual é necessária para se detetar que, sob circunstâncias apropriadas, a re m o çã o de certos eventos ambientais exerce efeitos comportamentais poderosos. Observamos que as aves encontram abrigo durante as tempestades, os cães dirigem-se para a sombra quando o sol do verão incide sobre eles e as pessoas fecham as janelas quando o barulho do tráfego está alto. Nesses exemplos, o comportamento emitido remove ou termina algum evento ambiental tal como chuva, calor e luz, c barulho, listas observações sugerem a existência de uma classe distinta de eventos reforçadores. Como a operação que define esses eventos como reforçadores (sua remoção) e oposta, cm caráter, àquela dos reforçadores positivos (definida por sua apresent ação), eles são conhecidos como re fo rça d o re s n eg a tivo s (S~ ). Em geral, os reforçadores negativos constituem-se daqueles eventos cu jo té rm in o (ou redução 11a intensidade) fortalecerá c manterá operantes.

Os reforçadores negativos incluem os eventos que, no linguajar comum, chamamos de “ irritantes” , “ desconfortáveis” , “dolorosos” , “ desagradáveis” , “nocivos” c assim por diante. A maioria desses termos envolve um domínio de referência não compor tame n- tal que, provavelmente, não será adequado para uma análise funcional. Com um

- 3 8 3 -

sinônimo para reforçador negativo, o termo “aversivo” é mais neutro que qualquer um desses adjetivos e tem a vantagem dc sugerir a noção apropriada de “evitar” , “mover-se para longe de ” ou “fugir de” uma situação. No laboratório, os estímulos aversivos têm, tipicamente, a forma de choques elétricos, imersão prolongada na água e certas intensidades de luz, som e temperatura,

17.2 CONDICIONAMENTO DE FUGA

Podemos verificar a qualidade aversiva de qualquer estímulo tornando sua remoção contingente a um operante até então não condicionado. Se a força deste operante aumenta, subsequentemente, diz-se que o estímulo é aversivo.

elétricoFigura 17-1. Labirinto em T para estudar o comportamento de fuga (segundo Meunzinger e Fletcher, 1936).

Um experimento de Muenzingcr c Fletcher (1936) é representativo deste procedimento de fuga. Um rato foi colocado num labirinto cm forma de T, que continha um piso de grades eletrificadas. O piso estava ligado a uma fonte de modo que, enquanto o animal permanecesse na grade, um choque contínuo era administrado cm suas patas (Fig. 17-1). Uma cobertura sobre o labirinto (não mostrada) impedia o rato de escapar do choque pulando para fora do aparelho. Mas, havia uma maneira de fugir - o animal podia se livrar do choque correndo consistcntcmentc para um determinado braço do T.

O comportamento no labirinto cm T é comumente medido cm cada tentativa pela contagem do tempo que o rato leva do início até o braço sem choque ou pela contagem do número de vezes que o animal se dirige para o braço “ incorreto”

- 3 8 4 -

(“erros” ). Nas primeiras tentativas, o virar para a esquerda ou direita são igualmente prováveis, mas à medida que a aquisição da resposta dc virar para o lado seguro prossegue, as respostas para o lado “ incorreto” diminuem. Vemos a tendcncia media de 25 ratos na Fig. 17-2. Podemos inferir a partir da diminuição do número de erros na curva da Fig. 17-2 que a resposta de virar para o lado seguro ocorreu depois de 100 tentativas de treinamento.

() processo comportamental representado na Fig. 17-2 exige que ampliemos o nosso conceito de fortalecimento operante. As respostas podem ser fortalecidas ou pela produção de reforçadores positivos ou pela terminação de reforçadores negativos (S"~ ). A última variante é

s"-R ----->S0

Blocos de dez tentativas Figura 17-2. Percentagem de respostas incorretas em 100 tentativas de treino de fuga (segundo Muenzinger, e Fletcher, 1936).

Uma resposta (R) conduz o organismo de uma situação aversiva, S para uma diferente, menos aversiva, s0 .17.3 PARÂMETROS DE S“

A Fig. 17-3 esquematiza os eventos, variáveis e relações inerentes às contingências de fuga no reforçamento negativo. As variáveis independentes de maior interesse na Fig. 17-3 são (1) a intensidade de estímulo aversivo prevalente, (2) a duração do período com estímulo ausente, (3) a quantidade em que a intensidade é reduzida depois da resposta, (4) a natureza da intermitcncir, se alguma, existente entre R e a terminação ou redução de S'", e (5) o atraso, se algum, que intervém entre uma R c- o término ou redução subsequente do estímulo.

- 3 8 5 -

intensidade

duração do período sem estímulo /

redução parcial na intensidade do estímulo

I— Icontingênciaintermitente

! atraso na ! terminação

R

j~*- tempo de reação

Figura 17-3. Variáveis nus contingcncias dc fuga.

Se uma fonte dc estimulação aversiva é adicionada â aparelhagem da caixa de Skinner, a pressão à barra torna-se conveniente para o estudo do reforçamento negativo. A caixa de Skinner tem o mérito dc deixar o animal livre para responder a qualquer momento. Em conseqüência, a taxa dc resposta torna-se disponível como uma medida dependente sensível e ampla dos efeitos comportamentais cm sujeitos individuais. Para objetivos especiais, o tempo dc reação, RT (ver Fig. 17-3) pode suplementar tais medidas dc taxa.

Um procedimento usado por Dinsmoor e Winograd (1958), serve como uma demonstração-protòtipo, assim como ilustra a ação dc alguns parâmetros dc S Ratos aprenderam a pressionar urçia barra quando este era o único comportamento que desligava choques clctricos liberados através das grades do piso do seu compartimento experimental. O choque era desligado por 2 minutos após a pressão à barra (duração do período sem estímulo), depois do que a estimulação aversiva era restabelecida. Pressões na ausência de choque não tinham conseqüências especiais. 0 procedimento é simplesmente

Quando o RT entre S e R diminuiu ate um valor assintótico baixo, uma contingência dc IV 30 seg foi adicionada ao procedimento:

As respostas eram efetivas para a fuga do choque apenas depois que o choque estivesse ligado por uma duração média de 30 seg. O procedimento gerou uma laxa moderada c constante de pressão à barra na presença do choque. O padrão do comportamento assemelha-se à resposta reforçada com alimento em IV

Dinsmoor c Winograd exploraram os efeitos da variação da intensidade dc S sobre esta linha-base de resposta dc fuga em IV. Sua técnica foi a dc iniciar a sessão com uma determinada intensidade de S—presente, digamos lOOjLiamps, obseivar a freqüência de resposta por um período de tempo suficiente para obter uma medida

- 3 8 6 -

confiável da taxa, depois dc mudar para um valor diferente dc S , digamos 400 y amps, e repetir o processo. Numa sessão de 2 horas, eles puderam obter medidas da taxa de fuga para seis valores diferentes de intensidade de S .

O comportamento de um rato durante uma parte da sessão aparece na Fig. 17-4. O registro cumulativo mostra que cada valor dc intensidade de choque controla uma única taxa de resposta de fuga. O efeito comportamental da mudança de um valor dc intensidade para outro (marcada pelos traços) c quase instantâneo: independente de sua taxa anterior, o animal muda abruptamente para uma taxa, apropriada à nova intensidade dc choque.

Quando a taxa total dc resposta é colocada cm função da intensidade dc choque, restrita a Fig. 17-5A. Essa função foi obtida do inesmo rato cuja curva cumulativa aparece na Fig. 17-4. A Fig. 17-5A indica que, na faixa estudada, à medida que a intensidade do choque aumenta a taxa de resposta dc fuga tambem aumenta continuamente.

Figura 17-4. Respostas de fuga em IV acumuladas para intensidades diferentes de choque (Dinsmoor e Winograd, 1958).

As Figs 17-5B e 17-5C documentam os resultados dc experimentos semelhantes com outros agentes aversivos. A Fig. 17-5B ilustra os efeitos do aumento da intensidade de um som sobre a taxa de pressão à barra em IV de fuga, cm gatos. Os resultados da Fig. 17-5C loram obtidos dc um grupo dc ratos que, pressionando um painel sob contingências dc IF, terminavam luzes de várias intensidades. Tanto o painel (B) como o painel (C) da Fig. 17-5 demonstram que os máximos no comportamento de fuga ocorrem quando a intensidade do estímulo aversivo c muito grande. O declínio nas respostas associado com eventos aversivos muito intensos não c bem compreendido. Pensa-se que ele seja devido a um efeito supressivo geral (cmocional) dos estímulos aversivos fortes.

- 387 -

choquc elétrico Nível do ruído luz incandescente (milliamberts)(microamperes) (millivolts) a

(A) (B) (C)Figura 17-5. Taxa de resposta de fuga em função da intensidade do estímulo aversivo. A abscissa está em unidades logarítmicas (A) Dinsmoor e Winograd,1958; (B) Barry e Harrison, 1957; (C) Kaplan 1952.

Será conveniente fazer um paralelo ocasional entre o reforçamento positivo c negativo. A que variável, no campo do reforçamento positivo, podemos perguntar, corresponde a intensidade dc um estímulo aversivo? Superficialmente, a intensidade dc um reforçado negativo parece análoga à magnitude de um reforçador positivo. A intensidade dc S e a magnitude dc S 1 são, ambas, propriedades de estímulo do reforçador e o aumento cm ambas as variáveis gera aumento nas respostas (ver seção J6.2). Mas, uma análise mais profunda do papel funcional que essas duas variáveis desempenham no reforçamento negativo e positivo, respectivamente, sugere que a analogia é apenas superficial. O principal efeito do aumento na intensidade de uma luz, um som, ou um choque, de um valor baixo para um valor alto, c que o reforçamento do comportamento lorna-se possível através do término da nova intensidade. O aumento na intensidade de um S tem, assim, a lógica de uma operação de estabelecimento dc reforçamento: torna possível o fortalecimento do comportamento. Assim, na presença de uma intensidade fraca de luz, um rato não apresentará o condicionamento de uma resposta que termine a luz. Assim, também, com um pequeno valor de privação dc alimento, uma resposta que produz alimento não será fortalecida. Por outro lado, valores altos de ambas intensidade do choquc e privação de alimento tornam possível usar a terminação do choque e apresentação de alimento como reforçadores para condicionar operantes. Se as funções das Figs. 17-5 e aquelas na seção 15.8 forem examinadas, será encontrado um paralelo na maneira em que as horas de privação e a intensidade de S controlam o comportamento. Tais considerações implicam num status conceituai interessante para os estímulos aversivos. Sua apresentação é simultaneamente uma operação de impulso e negaiivameuíe reforçadora.

Há, naturalmente, uma variável no campo do reforçamento negativo que corresponde à magnitude dc S 1. Considere a duração do tempo que decorre entre o término de um estímulo aversivo e seu restabelecimento subsequente, indicada como a duração do período sem estímulo na Fig. 17-3. Fis aqui uma variável independente que corresponde estritamente à magnitude ou duração de S*. Quanto maior a duração do período com o, estímulo aversivo ausente, maior a força da resposta de fuga. Usando uma contingência de fuga em crf e medindo o Kl da pressão à barra ao S Dinsmoor e Hughes (1956) obtiveram o gradiente de reforçamento de fuga reproduzido na Fig. 17-6. Quando as pressões à barra produziam um período longo sem cheque.

- 3 8 8 -

o rato respondia prontamente ao aparecimento do clioque. Mas, quando períodos pequenos sem choques eram a conseqüência do pressionar, os RTs ao aparecimento do choque eram longos, indicando que estes valores pequenos de duração do período sem choque proporcionavam pouco ou nenhum reforçamento. Não c necessário que um operante termine completamente um estímulo aversivo para que seja fortalecido. A

c

I

1 igura 17-6. Tempo dc reação (RT) de fuga em função dc vários valores de duração do período sem choque (segundo Dinsmoor e Hughes, 1956).

simples redução do nível de intensidade do estímulo c quase sempre suficiente para condicionar e manter o comportamento operante. Pequenas reduções na intensidade, quando contingentes à pressão à burra, formam a base dc um procedimento para medir o nível de estimulação aversiva que um organismo irá tolerar (Weiss e Latics, 1959, 1963). Neste procedimento, cada pressão à barra produz uma pequena diminuição na intensidade de um estímulo aversivo prevalcntc. Um período fixo de tempo sem uma única pressão à barra produ/ um pequeno aumento na intensidade do estímulo. As relações entre R e S éstão ilustradas esqucmulicamentc na Fig. 17-7. A primeira R emitida na Fig. 17-7 reduz a intensidade de S um pouco. Uma segunda R segue logo a primeira R e a intensidade diminui um pouco mais. 0 critério de tempo, então, decorre sem que alguma resposta ocorra e, como resultado, esse S 6 aumentado um pouco. Passa-se mais um período sem uma R e outro aumento em S ocorre. As próximas 6 Rs ocorrem com freqüência suficiente para diminuir a intensidade aversiva ao nível dc zero. Subsequentemente, a intensidade aumenta por três ve/.es na ausência de outras respostas emitidas.

S“

i i_________ i i i i

0 seg. f -Tempo i______i______i---------1--------- ‘---------1---------1---------1---------L-

F igu ra i 7-7.

- 3 8 9 -

liste procedimento age dc modo a originar um estado dc equilíbrio. O organismo conserva uma taxa de resposta que mantém a intensidade de S * dentro de uma pequena faixa de intensidades (usualmente baixa). Quando o S~ é choque elctrico, esse equilíbrio é denominado nível de tolerância ao choque. O nível real mantido varia com um número de parâmetros do procedimento e é sensível à administração de certos agentes farmacológicos, tais como analgésicos c anestésicos. A Fig. 17-8 ilustra a estabilidade comportamental típica que esse procedimento gera. Além disso, a figura mostra o resultado comportamental da administração intravenosa de uma pequena quantidade dc morfina num macaco rhesus trabalhando neste procedimento. (A Fig. 17-8 significa um registro bem detalhado e ampliado do contorno de S'” da Fig.17-7). A injeção dc morfina é seguida rapidamente por um aumento da tolerância ao choque a um novo nível de intensidade, que pcrmanccc pelos 40 minutos restantes apresentados. O efeito confirma as propriedades clínicas bem conhecidas da morfina, e sugere que o procedimento fornecc um instrumento experimental adequado para medir as propriedades analgésicas dc várias drogas.

25

20 * "3d>

2 3- , 0i f

- 5

0

Figura 17-8. Efeito da administração intravenosa de sulfato de morfina, 0,25 mg/kg, sobre o nívei de tolerância ao choque. O registro ê iido da direita para a esquerda (Weitzman, Ross, Hodos e Gaiambos, 1961).

17.4 ESTÍMULOS AVERSIVOS CONDICIONADOS

Quando fugimos de um carro que vem cm nossa direção, desviamo-nos de um murro intencional e saímos de um campo dc golfe ao ver nuvens dc tempestade, nosso comportamento toma a forma dc fuga dc estímulos que não são aversivos em si mesmos. Veículos em nossa direção, braço levantado c uma nuvem escura são eventos cujo significado deve ser adquirido de algum modo. Parece existir uma classe de estímulos aversivos adquiridos que podem ser apropriadamente chamados de reforçadores negativos secundários. Para analisar a maneira pela qual os estímulos adquirem propriedades de reforçadores negativos secundários, leremos que recorrer aos conceitos do condicionamento clássico. Acontece que uni evento ambiental originalmente neutro adquire propriedades aversivas se ele é emparelhado, de maneira Pavloviana, com eventos como choques, sons intensos e luz. Estes últimos agentes aversivos tem uma função comportamental dupla. Eles lèm tanto o status dc reforçadores negativos primários (S^), como o de eliciadores incondicionados (S2 ) do aumento na íaxa cardíaca, respiração rápida e outros respondeutes. Quando umSj é emparelhado com

- 390 -

um desses eventos S2 , S\ passa a (1) evocar uma CR semelhante a R2 pelas leis do condicionamento respondente; c (2) adquirir poder aversivo.

A maneira através da qual as propriedades dc reforçadores negativos são conferidas às situações anteriormente neutras pode ser demonstrada, no rato, com o aparelho visto na Fig. 17-9. Dois compartimentos estão separados por u m a porta que pode ser aberta, deixando uma barreira entre eles. Cada compartimento tem um piso gradeado através ao qual podem ser liberados choques. Lâmpadas e alto-falantes fornecem sinais quando desejados. Uma vez que conseqüências especiais podem ser contingentes ao pular a barreira de um compartimento para o outro, isto e, ao ir e voltar para um e outro compartimento, o aparelho é comumcntc conhecido como caixa do vai-e-vem.

Figura 17-9. Uma caixa do vai-e-vem para o estudo do controle de estímulo aversivo (segundo Miller, 1951).

- 391 -

Brown c Jacobs (1949) colocaram ratos num compartimento de uma caixa do vai-e-vcm e emparelharam um tom pulsantc h luz (S j) com 6 seg. dc choque inevitável (SJ). Vinle e dois emparelhamentos de Sj c S2 foram administrados cm um período dc dois dias. O choquc foi então permanentemente desligado e testaram-sc as propriedades aversivas de Sj. A porta entre os compartimentos foi levantada, S\ apresentado e estabelecida uma contingência tal que qualquer tentativa dc pular para o outro compartimento terminava o Sj toin-luz. 0 efeito das tentativas dc teste foi condicionar o saltar a barreira. Desde que o choquc nunca foi apresentado no teste, esse condicionamento deve ter sido a conseqüência da fuga do Sj tom-luz. E desde que os ratos normalmente não tentam escapar dos tipos de tons c luzes usados neste experimento, a operação de emparelhar os tons c luzes com o choquc deve ter sido crítica.

Ao testar o reforçamento positivo condicionado (seção 11.1), podemos lembrar, permitiu-se que um novo operante produzisse um S^, mas o reforçamento primário foi removido. O novo operante foi inicialmente fortalecido em virtude do contingente, mas, à medida que o tempo passava, o perdia o seu poder de reforçador condicionado, uma vez que não mais estabelecia a ocasião para o reforçamento primário. Esla perda apareceu como um declínio eventual na força do novo operante. Um aumento similar e uma queda na probabilidade de um novo operante ocorrcin ao se testar o podor de um estímulo aversivo condicionado. No teste da caixa do vai-e-vcm, cada vez que tom + luz é apresentado sem choque, ocorre uma tentativa dc extinção Pavloviana. Isto é, o tom + luz perde algumas das propriedades cliciadoras que lhes foraih conferidas pelos emparelhamentos prévios com o choque. Com a extinção do poder eliciador dc Sj ocorre uma redução gradual no poder de S\ reforçar negativamente uma resposta. O resultado, naturalmente, é que, cm ccrto ponto, os ratos param de pular a barreira quando Sj é apresentado. No experimento de Brown e Jacobs, o RT de pular a barreira ante o aparecimento de S\ diminui nas 20 primeiras tentativas do teste; então, nas 20 tentativas subsequentes, o RT começa a aumentar, indicando que o poder controlador do tom-luz está diminuindo. Precisamos ter essas relações dchcadas cm mente quando lidarmos com os fenômenos das seções seguintes.

17.5 CONDICIONAMENTO DE ESQUIVA

O fenômeno do comportamento de esquiva levanta um problema geral concernente ao lugar da intenção na metodologia científica. Dizemos que viramos o volante de um carro que derrapa, na direção oposta à derrapagem, para evitar uma batida; que se constrói uma ponte de um certo modo para evitar sua queda; que um veado foge a fim de evitar um lobo que o persegue. O termo “para” , ou “a fim de” , dá uma certa qualidade intencional ao comportamento. O objetivo de um determinado ato e, consequentemente, sua explicação aparente, é fornecido numa proposição das conseqüências aversivas ou indesejáveis que teriam ocorrido se não fossem evitadas pelo ato. As explicações propositais ou teológicas são geralmente rejeitadas pelos cientistas com o argumento de que tais explicações propõem que um evento futuro (e, logo, não existente) seja a causa de um evento presente (existente) e porque as explicações propositais nada adicionam aos fatos. Dizer, por exemplo, que uma pedra cai ao chão a fim de retornar a seu lugar natural de repouso, a terra, nada mais diz que a

- 3 9 2 -

proposição puramente descritiva: as pedras caem na terra. E, além disso» por parecer ser uma explicação suficiente, a proposição teleológica tende a desencorajar um exame adicional do fenômeno, pospondo assim uma análise funcional.

A explicação, na ciência, é um assunto complexo e de muitas facetas, mas alguns estudiosos acham que ela pode ser reduzida a (1) descrições extensas dos eventos em questão, incluindo suas relaçBes com outros eventos; e (2) familiaridade com estas descrições e relações. A explicação científica, de acordo com este ponto de vista, é cm grande parte um problema de fornecer relações entrelaçadas entre os fenômenos da experiência sensorial. Eventualmente, essas relações tornam-se tão familiares que parecem lógicas, ou auto-evidentes. Assim, as “ reformulações radicais” de uma geração são o “bom senso” da geração seguinte. Compare este tipo de explicação com a do tipo proposital. Embora achemos estranho, 300 anos depois de Galileu, pensar que as pedras possuem um desejo de retornar à terra, frequentemente, content am o-nos em considerar o comportamento como sendo dirigido pela vontade ou intenção. Todavia, assim como o propósito é irrelevante para “explicar” a queda das pedras, também o é para a análise do comportamento. Dizer que os organismos respondem para (a fim de) produzir reforçadores não traz mais informação do que dizer que eles respondem quando suas respostas são frequentemente seguidas por reforçadores.

Frequentemente, propõem-se explicações teleológicas para o comportamento de esquiva. Ao dizermos que nos abrigamos, quando vemos uma nuvem de tempestade para não ficarmos molhados, estamos implicitamente invocando uma explicação proposital para o nosso comportamento. Todavia, nossa proposição (ou crença) não constitui uma explicação no sentido técnico descrito (a saber, uma proposição de alguma relação funcional entre o comportamento que está sendo descrito e alguma outra variável), mas é meramente uma reproposição dos fatos — quando o céu está escuro e trovejando, movemo-nos de um certo modo. A esquiva de um evento ambiental que ainda não aconteceu (a chuva) dificilmente pode controlar o comportamento presente. Supor que isto poderia acontecer é criar o problema lógico de como explicar um evento em termos de outro evento que ainda não ocorreu. Em vez disso, procuramos uma explicação (descrição) do comportamento em termos de variáveis que (1) atuam por ocasião do comportamento, e (2) agiram, no passado, em condições similares. Ao fazer isto, baseamos nossa explicação nos conceitos introduzidos nas três seções anteriores.

Iniciamos nossa análise do comportamento de esquiva com uma demonstração experimental do fenômeno. Talvez encontremos, no exame cuidadoso dos eventos comportamentais que ocorrem na situação de esquiva, algumas relações invariantes nas quais possamos basear uma explicação mais aceitável do fenômeno.

Brogden, Lipman e Culler (1938) colocaram cobaias em rodas de atividade individuais. Um tom de 1000 cps era apresentado ao animal e, 2 seg mais tarde, um choque era administrado através do piso da gaiola. Se o animal corresse na roda, fazendo-a girar 2,5 cm ou mais quando o som se iniciava, ele poderia evitar o choque. O girar a roda através da corrida também terminava o som. Note a estrutura básica para os paradigmas de esquiva. Primeiro, ocorre algum evento ambiental de “aviso” (o tom); então, após um lapso de tempo, segue-se um segundo evento ambiental, aversivo. Enquanto isso, há uma contingência estabelecida — por um experimentador ou pela natureza - de modo que, se uma resposta especificada ocorre entre o aparecimento do primeiro estímulo e o aparecimento do estímulo aversivo, o estímulo aversivo é omitido e o primeiro estímulo é terminado.

- 3 9 3 -

- No experimento de Brogden, Lipman e Culler, as cobaias aprenderam a girar a roda, e, assim, evitar o choque em quase todas as tentativas. A Fig. 17-10 relaciona o aumento observado na percentagem das respostas de girar a roda com o número médio de dias em que cada percentagem particular foi atingida.

100

80

S' 60

I$ 40

20

ssss*

"7*-----------

/

///////ss***/s*

/yS/

s/

\\V\\\\\\\\

2 4 6 8Média do número de dias de treinamento

Figura 17-10. Aquisição do comportamento de esquiva. Dados de quatro cobaias (segundo Brogden, Lipman e Culler, 1938).

Os fatos sobre a esquiva são claros, mas sua representação é um outro problema. É evidente que o fortalecimento comportamental observado não é condicionamento operante por reforçamento positivo, desde que nenhum reforçador positivo era contingente à resposta. Parece pouco provável que o girar a roda tenha sido condicionado classicamente, uma vez que a resposta tem um caráter de emissão. Mas será conveniente considerar a possibilidade. O paradigma

Si ——> Rj[17.1]

S2 -----> R-2

onde S j = tom dc 1000 cpsS r - choque elctricoR j = não médidaR ^ = correr, pular, guinchar, etc.C = semelhante a R2 ,K

- 394 -

aparentemente, e adequado. Note, todavia, que o Diagrama [17.11 não descreve o efeito que o correr na roda (CR) tem sobre o choque (Sj). No verdadeiro condicionamento Pavloviano, a CR não impede a ocorrência de S2- Quando um cachorro passa a salivar ante um som, a salivação não evita a ocorrência de alimento.

O fato de a resposta condicionada na esquiva evitar a ocorrência de S2 pode ou não ser significante. Brogden, Lipman e Culler supuseram que se o correr que eles observaram era realmente uma CR, então a omissão do choque não deveria fazer qualquer diferença no comportamento de correr. O procedimento Pavloviano é meramente uma prescrição para emparelhar dois eliciadores. Realizou-se, então, um segundo experimento em que o tom de 1000 cps era apresentado e, 2 seg mais tarde, o choque era administrado como no primeiro experimento. No segundo experimento, todavia, as respostas de correr que ocorriam antes do choque não tinham efeito na liberação subsequente do choque. O experimento, então, proporciona um emparelhamento estrito de um S\ e S j. Se a resposta de correr é condicionada pelos princípios Pavlovianos, deveríamos esperar que o novo reflexo S\ CR (Tom-Correr) aumentasse em força.

Os resultados do experimento, vistos na Fig. 17-11, são nitidamente diferentes daqueles do primeiro experimento, vistos na Fig. 17-10. Durante o segundo experimento, a força da resposta de correr flutuou, aumentando vagarosamente até um máximo (cerca de 50 por cento das tentativas diárias no 13o. dia) e, então, declinando até um nível baixo, próximo de zero, lá pelo vigésimo d ia(5000^ tentativa), quando o experimento terminou. Contraste este resultado com o desempenho de 100 por cento dos animais no primeiro experimento (Fig. 17-10) depois de apenas 8 dias (120 tentativas). O fracasso em se condicionar o correr através de um procedimento Pavloviano elimina a possibilidade de que o condicionamento de esquiva seja um tipo de condicionamento respondente.

dias de treinamento

1- iguni 17-11. Percentagem dc respostas dc correr, quando o correr não evita S? (segundo liroirden. I ipinan c Cuiier, 193S). ~

- 3 9 5 -

O condicionamento de esquiva nem é um fortalecimento operante por reforçamento positivo nem um caso de condicionamento Pavloviano. Seria um tipo de treino de fuga? Se examinarmos com atenção os dois experimentos de Brogden, Lipman e Culler descobriremos que ambos fornecem condições necessárias para se estabelecer um reforçador negativo secundário. No primeiro experimento, o experimento de esquiva, o correr antes da apresentação do choque terminava o tom. Na seção 17.4, mostramos que esta contingência servia para fortalecer o operante, R.

s rR — > s 0

onC*e ^ = um estímulo aversivo condicionado R = um operanteSo = uma situação em que S\ não está presente,

Essas condições, afirmamos agora, são exatamente aquelas encontradas durante o condicionamento de esquiva. No primeiro experimento de Brogden, Lipman e Culler, o choque era evitável; mas (crítico para esta análise) o tom de aviso de 1000 cps era também terminado pela resposta operante. Por haver sido emparelhado com o choque em tentativas anteriores ao desenvolvimento do comportamento de esquiva, o tom adquiriu características aversivas condicionadas. Assim, era a terminação do estímulo aversivo condicionado, o tom, e não a não-ocorrência do choque que reforçava a resposta de correr. A esquiva de S2 era um subproduto da fuga do reforçador negativo secundário.

Podemos agora notar o procedimento para o condicionamento de esquiva. Ele sereduz a uma contingência de fuga em que um operante é reforçado pelo término deum reforçador negativo secundário:

s;T ----->S2-R -----> S0

Agora, podemos ver que o permanecer ao ar livre na presença de nuvens e trovões fornece estímulos que, no passado, foram correlacionados com a queda da chuva. O procurar um abrigo nos permite fugir desses estímulos de aviso, sendo a esquiva da chuva um subproduto. Similarmente, o veado que não consegue correr do lobo (S) é peg o (Sf). Se o veado ainda estiver vivo na próxima vez que um lobo aparecer, qualquer resposta do veado que remova o lobo do seu ambiente imediato é reforçada pelo término de um reforçador negativo secundário.

Uma implicação significante do comportamento de esquiva deve ser examinada. Quando a resposta que remove S\ ocorre, S - é consequentemente omitido. Quebrando-se a correlação S\ - S T dessa maneira, esperamos que S\ perca gradualmente s ias propriedades aversivas condicionadas e que, como resultado disto, a resposta de esquiva não seja mais emitida, permitindo que S2 reapareça. Através de um novo emparelhamento, S T renova o caráter aversivo de S\. Dados experimentais apoiam a

- 3 9 6 -

previsão teórica de que o comportamento de esquiva é, de fato, cíclico (Wertheim, 1965). A restauração ocasionai das propriedades aversivas de S\ significa que o emparelhamento de Sj^ SJ* é, na realidade, intermitente. A intermitência, provavelmente, mantém a força aversiva de S\ bem melhor do que se Si fosse correlacionado toda vez com SJ, pelas mesmas razões porque um estímulo intermitentemente emparelhado com alimento é um reforçador positivo secundário mais durável. À medida que prossegue o treino de esquiva, os emparelhamentos de S\ e S2 tornam-se cada vez menos freqüentes, enquanto a durabilidade aversiva de Si continua a aumentar. Em certo momento, pode se alcançar um ponto onde toda a vida restante do indivíduo não seja bastante longa para que a correlação S j, S f ocorra novamente.

Esta discussão sobre a esquiva tem se restringido aos casos em que o S\ terminado é um estímulo de aviso externo. Casos mais sutis de condicionamento de esquiva ocorrem quando o próprio comportamento do organismo adquire caráter aversivo, como no grupo de contingências conhecido por procedimento de Sidman (Sidman, 1953). Podemos fornecer, aqui, apenas um esquema do que talvez seja a variante mais simples desse procedimento. Se um estímulo aversivo breve é liberado para um organismo depois de T unidades de tempo sem o aparecimento de uma dada resposta, temos a seguinte contingência em efeito:

Em [17.2], S~ poderia ser um choque elétrico, R poderia ser a pressão à barra, Tx poderia ser qualquer valor fixo, de uns poucos segundos a vários minutos. Choques elétricos são liberados a menos que uma resposta seja emitida. O procedimento define uma contingência de esquiva que não contém um estímulo de aviso explícito (Si) anterior à ocorrência de ST. Os animais adaptam-se a esse procedimento respondendo numa taxa moderada e recebendo poucos dos possíveis choques que seriam liberados (Verhave, 1959). A Fig. 17-12 mostra registros cumulativos do comportamento gerado por este procedimento. Evidentemente, a ausência de um Sj de aviso explícito não impede a aquisição e manutenção do comportamento eficiente de esquiva.

Nossa primeira explicação do comportamento de esquiva depende tão criticamente da noção de um Sj sendo emparelhado com um SJ, que podemos, à primeira vista, perguntar como a esquiva de Sidman se coloca neste quadro. Mesmo no procedimento de Sidman, todavia, existe a possibilidade de um emparelhamento de certos eventos com S~. Considere o comportamento de um rato no início do treino, antes do desenvolvimento do comportamento eficiente de esquiva. Choques estão sendo liberados frequentemente. Ocasionalmente, uma pressão à barra em nível operante é emitida, pospondo assim, o choque. Voltemos nossa atenção para o que o rato está fazendo no momento em que recebe o choque. Ele pode estar colocando o focinho nos cantos da gaiola, investigando as paredes da caixa, descansando imóvel, e assim por diante. Embora não possamos dizer, com certeza, exatamente o que o animal estava

[17.2]

- 3 9 7 -

Figura 17-12. Registros cumulativos da resposta de esquiva — pressão à barra durante a primeira sessão de treino. Os traços verticais indicam choques. O valor de T era de 30 seg. (Verhave, 1959). X

fazendo ao receber um choque, podemos dizer, com toda certeza, o que ele não estava fazendo. Ele não estava pressionando a barra. Se estivesse, não receberia o choque. Logicamente, todo comportamento, exceto pressão à barra, pode ser emparelhado com choques da mesma maneira que dada ocorrência de S\ de aviso nas situações de esquiva convencional é primeiro emparelhada com o choque. O efeito desse emparelhamento de comportamentos com choques na situação de esquiva de Sidman é fazer com que uma grande parte do próprio comportamento do animal adquira propriedades aversivas condicionadas. Depois de um certo tempo, muito do próprio comportamento do rato, exceto sua pressão à barra, adquire o status de Si de aviso auto-administrado. Se o rato “ foge” do seu próprio comportamento aversivo, nada há que possa fazer, exceto pressionar a barra. Pressionando a barra, ele obtém o subproduto usual de eventos aversivos condicionados - isto é, a esquiva de um reforçador negativo condicionado.

17.6 PUNIÇÃO

Quando um reforçador negativo é contingente a um operante podemos falar de punição deste operante. Uma criança que toca uma chama é queimada, um homem que atravessa na frente dos carros é atropelado; ambos os organismos são punidos por agir de uma dada maneira numa dada situação. No laboratório, a contingência de punição pode ser estabelecida pelo fornecimento de um estímulo aversivo controlado seguindo a ocorrência de uma resposta. Por exemplo, pressões à barra ou bicadas na chave, previamente fortalecidas acima do nível operante pelo reforçamento positivo, podem,

- 3 9 8 -

agora, ser punidas apresentando-se cnoques na pele após sua ocorrência. A sociedade usou, e ainda usa, o procedimento de punição, numa variedade de maneiras, para desencorajar certos comportamentos dos seus membros. A palmatória não desapareceu completamente de nossas escolas; espancamos nossos filhos quando eles se comportam “mal” ; e a punição é ainda o principal instrumento da justiça. O procedimento de punição parece ser usado frequentemente não porque funcione tão bem, mas porque (1) tem um efeito imediato; e (2) sua liberação e/ou efeitos colaterais são quase sempre positivamente reforçadores para a pessoa que administra a punição. Os psicólogos clínicos e os psiquiatras referem-se aos indivíduos que são positivamente reforçados ao punir os outros, como sádicos. Adiaremos a discussão das condições que podem fazer surgir o comportamento sádico para o próximo capítulo.

Os efeitos imediatos da punição são facilmente observados. Uma criança que ri na igreja pode ser imediatamente silenciada por um beliscão; um cachorro i.ue pula nas visitas pode normalmente ser controlado por uma pancada com o jornal. Ambós, criança e cachorro, provavelmente não serão permanentemente- curados de seus comportamentos indesejáveis através da punição. No momento, todavia, o comportamento indesejável é temporariamente suprimido e essa supressão serve para proporcionar reforçamento positivo imediato para o comportamento do punidor, tornando» então, mais provável que ele puna no futuro.

A supressão temporária do comportamento produzida pela punição pode ser facilmente demonstrada no laboratório, onde suas características quantitativas podem ser apuradas. Num dos primeiros experimentos de Skinner (1938), ratos famintos foram treinados a pressionar uma barra que produzia alimento num esquema de reforçamento em IF . A pressão à barra foi então extinta, retirando-se o alimento. Alguns dos ratos foram punidos durante os 10 primeiros minutos de extinção. A punição foi na forma de um tapa forte nas patas dianteiras, liberados pela própria barra, depois de cada pressão. O tapa consistia de um movimento inverso rápido e forte da barra, provocado por um martelo que nela batia após cada pressão. O efeito desses 10 min de tapa pode ser visto, comparando-se os processos de extinção de dois

Primeiro dia Segundo diaTempo (min)

ligura 17-13. Os eleitos dc uma punição leve (tapa) no processo de extinção operante (Skin tier, 1938).

- 3 9 9 -

grupos de ratos na Fig. 17-13. Está bem claro, na Fig. 17-13, que os tapas reduzem imediatamente o responder para bem abaixo de sua taxa normal de extinção. Após os 10 min de tapas a taxa de respostas permaneceu, no primeiro dia, bem abaixo daquela dos ratos não punidos. Esta supressão de resposta é um resultado típico da punição e é uma especificação parcial dos efeitos emocionais da punição. Até agora, os resultados confirmam nossa expectativa sobre a punição — ela suprime o comportamento e tem efeito* imediato. No segundo dia de extinção, todavia, o grupo punido respondeu mais rapidamente que o grupo não punido, de modo que,no fim de dois dias, o número total de respostas de pressão à barra em extinção, para os dois grupos, era o mesmo.

Somos forçados a concluir que a punição leve, tal como um tapa nas patas durante alguns minutos, não suprime permanentemente o processo de extinção operante; simplesmente adia-o. Fosse nosso desejo eliminar a pressão à barra completamente, não poderíamos usar esse procedimento, já que seu efeito é transitório.

Devemos ser cuidadosos para não supergeneralizar com base nesta única demonstração. A punição não tem um efeito simples sobre o comportamento. Seus efeitos dependem de muitos parâmetros do estímulo aversivo - sua força e duração, por exemplo. Se um poderoso choque elétrico tivesse sido usado, em vez de um tapa leve. e/ou tivesse a contingência de punição permanecido por várias horas em vez de poucos minutos, o comportamento seria suprimido por muito mais tempo do que o foi. Além disso, o número total de respostas no processo de extinção teria sido significantemente atenuado, embora o tempo para alcançar o nível operante pudesse não ter sido afetado. A menos que a punição tenha sido extremamente intensa, todavia, uma vez que cesse, o comportamento eventualmente ressurge. Somente com estimulação aversiva extremamente forte, a punição pode reduzir permanentemente o comportamento para o nível zero (Holz e Azrin, 1963). Os diferentes efeitos que a punição pode ter sobre a resposta, dependendo da forçado estímulo aversivo, aconselham cautela ao se fazer qualquer generalização superficial sobre os efeitos da punição.

i r s

Figura 17-14. Representação do labirinto usado por Whiting e Mowrcr (1943).

- 4 0 0 -

No procedimento empregado por Skinner, apenas uma única resposta, a pressão à barra, podia produzir o reforçamento positivo. Quando várias respostas podem produzir o reforçamento positivo na mesma situação, a punição de uma resposta pode facilitar o deslocamento do comportamento e, se efetuada criteriosamente, ajudar a aquisição de novos padrões de comportamento. Num experimento de Whiting e Mowrer (1943). ratos famintos aprenderam a percorrer o labirinto visto na Fig. 17-14. Os ratos colocados na caixa de partida, rapidamente, adquiriram a cadeia de correr para a caixa objetivo através do caminho curto. O comportamento está de acordo com a Lei do Menor Esforço: dadas duas ou mais cadeias alternativas para o mesmo reforçador, o organismo escolhe aquela que requer menos trabalho. Após a aquisição, três procedimentos foram comparados em termos de sua habilidade para forçar os ratos e usarem o caminho longo. Para um grupo de ratos, A, uma barreira de vidro foi colocada no meio do caminho curto, de forma que os animais só podiam atingir a caixa-objetivo através do caminho longo. Para um segundo grupo, B, retirou-se o reforçamento para o percorrer o caminho curto e este só era dado se os ratos usassem o caminho longo. Para um terceiro grupo, C, uma placa eletricamente carregada foi colocada no meio do caminho curto, liberando um choque para os ratos que tentassem usá-lo. Contudo, se os ratos passassem pelo choque, eles encontravam alimento. Whiting e Mowrer obtiveram diferenças marcantes nas taxas de ajustamento a esses procedimentos. Os ratos punidos do grupo C passaram a usar o caminho longo depois de uma média de apenas 6 choques. O grupo da barreira foi 82 vezes à barreira antes de mudar consistentemente para o caminho longo. 0 grupo B, sob extinção simples, correu 230 vezes à caixa objetivo vazia através do caminho curto, antes de preferir o longo. Evidentemente, punir uma resposta pude ajudar bastante na aquisição de outra resposta disponível.

Esse resultado tem sido corroborado por outros experimentos. Se escolhas incorretas são punidas e escolhas corretas são positivamente reforçadas, num labirinto T, a aquisição é mais rápida do que se apenas se reforçar positivamente as respostas corretas (Warden e Aylesworth, 1927). Deve-se tomar uma precaução na interpretação de tais resultados. Embora a aquisição de comportamento possa ser acelerada pela punição de formas indesejáveis da resposta, existe pouca evidência para indicar o que acontece ao novo comportamento adquirido quando cessa a punição do comportamento indesejável. No estudo de Warden e Aylesworth, por exemplo, poderíamos perguntar se haveria um aumento temporário nos “erros” caso os choques para as respostas incorretas cessassem depois da aquisição.

Esses estudos sugerem uma conclusão prática. Se a punição é empregada na tentativa de eliminar certos comportamentos, então qualquer que seja o reforçamento que o comportamento indesejável tenha produzido, ele deve tornar-se disponível através de um comportamento mais desejável. Apenas punir as crianças por um “mau comportamento” na sala de aula pode ter pouco efeito permanente, salvo gerar uma aversão duradoura pelo estudo. Os reforçadores para o “mau comportamento” devem ser analisados e a sua obtenção deve, talvez, ser permitida através de respostas diferentes, ou em outras situações. Se não se permite oportunidade suficiente para atividade física às crianças, por exemplo, elas, provavelmente, serão superativas na sala de aula, com efeitos prejudiciais para o ensino. Recessos freqüentes, contingentes ao trabalho produtivo, em conjunção com a punição consistente da atividade indesejável, pareceria ser uma aplicação prática dos resultados de Whiting e Mowrer. Even-

- 4 0 1 -

tuaimente, a necessidade de se administrar estimuiação aversiva desapareceria, à médida que o comportamento punido desaparecesse e fosse substituído por formas de comportamento mais desejáveis. Mas, para que isso aconteça, parece importante proporcionar uma alternativa recompensadora para as respostas punidas.

Uma classe de comportamento para a qual a punição pode ter efeitos muito complicados é o comportamento que é adquirido e mantido por contingências aversivas. Qual, por exemplo, é o efeito da punição no comportamento estabelecido de esquiva do tipo descrito na Fig. 17-12? A evidência que temos no presente indica que, se o comportamento é punido com o mesmo estímulo que o animal foi previamente treinado a evitar, essa punição não reduz a força do comportamento. Em vez disso, pode aumentar sua força! Se a punição é um estímulo aversivo diferente, entretanto, ela terá seu efeito supressivo usual (Church, 1963; Solomon, 1964).

Um ponto crítico a ser retirado da presente discussão sobre punição é a complexidade de seus resultados. Os efeitos da punição dependem de muitos fatores para podermos escrever um simples paradigma de Procedimento, Processo e Resultados. Os Processos e Resultados dos Procedimentos de punição são variáveis e condicionais ao tipo de comportamento que esta sendo punido, assim como aos estados de muitas variáveis que operam no ambiente presente e passado do indivíduo punido. Até que se desenvolvam leis gerais de punição, os subprodutos emocionais que acompanham a estimulação aversiva sugerem que o seu emprego no controle prático do comportamento humano deve ser efetuado com bastante cautela.

Muito do que chamamos punição nas atividades humanas toma uma forma algo diferente da apresentação de um estímulo aversivo primário (incondicionado). Quando punimos uma criança por mentir privando-a de seu jantar, ou quando mandamos um homem para a cadeia por ter roubado, as conseqüências punitivas são na forma da remoção de reforçadores positivos (condicionados e incondicionados). Ferster (1958) estudou alguns efeitos comportamentais da remoção de um estímulo discriminativo positivo contingente a certas respostas. No treino preliminar, a pressão à barra de chimpanzés famintos era reforçada com alimento, num esquema de intervalo variável, numa situação (S^), mas nunca era reforçada numa segunda situação (S^ ), As situações eram alternadas periodicamente. Este é um procedimento padrão de discriminação, com reforçamento intermitente em S^ Quando uma discriminação estável havia sido estabelecida, o procedimento foi modificado de modo que o S^ só aparecia (o SD só terminava) seguindo taxas altas de resposta. A remoção do SD era contingente a um certo padrão de respostas de pressões à barra, isto é, taxas altas. Pela inibição das taxas altas, os chimpanzés foram capazes de evitar períodos de SA . O efeito da contingência de Ferster foi produzir taxas de resposta anormalmente baixas (inibição de taxas altas) que somente voltavam ao normal quando a contingência de “punição” era retirada. É possível que a “punição” deste tipo evite alguns dos efeitos emocionais colaterais indesejáveis dos estímulos aversivos incondicionados, merecendo mais estudo como uma técnica adequada para controlar o comportamento.

17.7 MASOQU1SMO

Diz-se que certos indivíduos procuram punição. Os psicólogos clínicos e o? psiquatras, referem-se a tais indivíduos como masoquistas. Que tipo de história de condicionamento poderia ter dotado os estímulos aversivos primários usados na

- 4 0 2 -

punição de propriedades positivamente reforçadoras? Muenzinger (1934) mostrou que tal inversão do valor de reforçamento pode ocorrer mesmo em nível infra-humano. Ele treinou ratos famintos a correrem num labirinto em T, dando-lhes choque e depois alimento, ao escolherem o braço designado. Esses ratos adquiriram a cadeia de percorrer o labirinto mais rapidamente que os ratos controle que eram alimentados mas não recebiam choque por escolherem o braço designado. Neste experimento e em outros semelhantes, o choque é usado como um para respostas que são, depois, positivamente reforçadas. Uma escolha correta no labirinto é seguida por um choque que estabelece a ocasião para continuar até o alimento. Este procedimento deve, assim, ser contrastado com aquele do choque para respostas em ou “ incorretas” . Às contingências são:

R(escolha correta) - s ~R (aproximar-se) -

Sob essas condições, mesmo choques moderadamente fortes podem adquirir o status de S^s para a aproximação ao alimento e, assim, o status de reforçadores positivos condicionados. Num paradigma convencional de discriminação S^ - S^ , Holz e Azrin (1961) liberavam choques para a resposta de bicar a chave, em pombos, reforçada com alimento em S^ mas não em S^ . Eles descobriram que o elemento de punição em S^ passou a controlar taxas apreciáveis de resposta. No teste, quando a punição era administrada durante o S^ , os animais começavam a trabalhar rapidamente, como se estivessem em S^, embora nenhum alimento fosse liberado para tal resposta em S^ . Esses animais de Muenzinger e de Holz e Azrin realmente pareciam ser masoquistas. Eles pareciam trabalhar para serem punidos. Quando apreciamos a história que transforma choques elétricos, em SDs para respostas que podem ser positivamente reforçadas, talvez estejamos em vias de compreender as causas do masoquismo humano.

REFERÊNCIAS PARA 0 CAPITULO 17

Barry, J. J., and Harrison, J. M. Relations between stimulus intensity and strength of escape responding. Psychol. Rep., 1957, 3, 3-8.

Brogden, W. J., Lipman, E. A., and Culler, E. The role of incentive in conditioning and extinction. Amer. J. Psychol., 1938, 51, 109117.

Brown, J. S., and Jacobs, A. The role of fear in the motivation and acquisition ot responses. J . exp. Psychol., 1949, 39, 747-759.

Church, R. M. The varied effects of punishment on behavior. Psychol.Rev., 1963 ,70 ,369-402 .

Dinsmoor, J. A., and Hughes, L. H. Training rats to press a bar to turn off shock. J. comp, physiol. Psychol., 1956, 49, 235-238.

Dinsmoor, J. A., and Winograd, E. Shock intensity in variable interval escape schedules. J . exp. Anal. Behav., 1958, 1, 145-148.

Ferster, C. B. Control of behavior in chimpanzees and pigeons by time out from positive reinforcement. Psychol. Monogr., 1958, 72, Whole No. 461.

- 403 -

Holz, W. C., and Azrin, N. H. Discriminative properties of punishment. J. exp. Anal. Behav., 1961, 4, 225-232.

Holz, W. C., and Azrin, N. H. A comparison of several procedures for eliminating behavior. J. exp. Anal. Behav., 1963, 6, 399-406.

Kaplan, M. The effects of noxious stimulus intensity and duration during intermittent reinforcement of escape behavior. J. comp, physiol. Psychol., 1952, 45, 538-549.

Miller, N. E. Learnable drives and rewards. Chap. 13 in S. S. Stevens (E d .), Handbook of experimental psychology. New York: Wiley, 1951.

Muenzinger, K. F. Motivation in learning: I. Electric shock for correct responses in the visual discrimination habit. J. comp. Psychol., 1934,17, 439-448.

Muenzinger, K. F., and Fletcher, F. M. Motivation in learning, VI. Escape from electric shock compared with hunger-food tension in the visual discrimination habit. J . comp. Psychol., 1936, 22, 79-91 .

Sidman, M. Two temporal parameters of the maintenance of avoidance behavior by the white rat. J. comp, physiol. Psychol., 1953, 46, 253-261.

Skinner, B. F. The behavior of organisms. New York: Appleton-Cen- tury, 1938.

Solomon, R. L. Punishment. Amer. Psychologist, 1964, 19, 239-253.Verhave, T. Avoidance responding as a function of simultaneous and

equal changes in two temporal parameters. J. exp. Anal. Behav.,1959,2, 185-190.

Warden, C. J., and Aylesworth, M. The relative value of reward and punishment in the formation of a visual discrimination habit in the white rat. J. comp. Psychol., 1927, 7, 117-127.

Weiss, B., and Laties, V. G. Titration behavior on various fractional escape programs. / . exp. Anal. Behav., 1959, 2, 227-248.

Weiss, B., and Laties, V. G. Characteristics of aversive thresholds measured by a titration schedule. J. exp. Anal. Behav., 1963, 6, 563572.

Weitzman, E. D., Ross, G. S., Hodos, W., and Galambos, R. Behavioral method for study of pain in the monkey. Science, 1961, 133, 37-38.

Wertheim, G. A. Some sequential aspects of IRTs emitted during Sidman- avoidance behavior in the white rat. J. exp. Anal. Behav., 1965, 8, 9-15.

Whiting, J. W. M., and Mowrer, O. H. Habit progression and regression — a laboratory investigation of some factors relevant to human socialization. J. comp. Psychol., 1943, 36, 229-253.

- 4 0 4 -

Capítulo 18 COMPORTAMENTO EMOCIONAL

Uma das distinções mais antigas é a classificação geral do comportamento humano em emoções e paixões, de um lado, e atos racionais e voluntários do outro. No entanto, esta dicotomia respeitável e constrangedora pouco tem feito para desenvolvei a análise experimental dos comportamentos considerados emocionais. Quase sempre, eles permanecem simplesmente como comportamentos que não podem ser explicados por causas conhecidas. A emoção tem sido, com efeito, uma categoria de comportamento do tipo “cesto de lixo” e os vários fenômenos aí depositados têm apresentado uma forte resistência à integração sistemática. Realmente, muitos psicólogos atuais, desencorajados por fracassos persistentes na formulação de um conceito positivo de comportamento emocional, gostariam de afastar o termo “emoção” do vocabulário conceituai da ciência. Eles - prefeririam interpretar os fenômenos emocionais como estados especiais de motivação ou atividade geral. Nenhuma dessas tentativas mostra-se completamente satisfatória porque, como veremos, uma dissecação conceituai cuidadosa do comportamento emocional revela certas características únicas, não incorporadas por outras rubricas comportamentais unificadoras. Na presente análise, portanto, reteremos o conceito de emoção, usando-o com referência a certas mudanças amplas no comportamento operante; que resultam da aplicação de operações ambientais bem definidas. Mas, antes de elaborar essas relações, discutiremos um número de soluções tradicionais para os problemas que têm sido atribuídos ao campo da emoção.

18.1 É A EMOÇÃO UMA CAUSA DO COMPORTAMENTO OU UM EFEITO COMPORTAMENTAL?

Antes do fim do século dezenove, pensava-se que a emoção era um estado interno do organismo que, quando induzido, causava um comportamento apropriado por parte deste organismo. Assim, do ponto de vista tradicional ou clássico, a emoção era uma causa do comportamento. Ouando, por exemplo, um veado vê um urso (S), surge o mêdo (um estado corporal) que é seguido por uma R apropriada, correr. Similarmente, um homem quando contrariado (S), torna-se zangado (estado corporal) e sua raiva torna-o agressivo, R.

Os comportamentos manifestos supostamente induzidos por estados emocionais

- 405 -

foram classificados bem cedo, e Charles Darwin escreveu um tratado clássico descrevendo sua utilidade biológica. O medo, por exemplo, induzindo à precaução, pode ter salvo a vida de muitos animais na história da evolução. Assim também a raiva pode ter sido útil para destruir certas barreiras físicas que evitavam a conclusão de uma cadeia de comportamento que levaria a um reforçador biologicamente significante. Outras emoções, tal como a alegria, Darwin supôs serem úteis para o objetivo de comunicar a outros organismos próximos que nenhuma ação agressiva viria, e que os comportamentos cooperativo, sexual e outros seriam agora seguros e reforçadores. Darwin descreveu as posturas elaboradas c os respondentes pelos quais as emoções de raiva, medo e alegria são “expressas” nos animais (Fig. 18-1). Poderiam ser identificados padrões de resposta bem definidos que eram, de alguma forma, peculiares à espécie e, mesmo assim, apresentavam elementos comuns entre as espécies. O enrijecimento dos lábios de um homem com raiva, revelando seus dentes caninos, era interpretado como um vestígio da retração da boca dos animais que preparam seus dentes afiados para atacar um agressor. Hoje, raramente mordemos quando com raiva mas esse padrão de vestígio ainda está conosco.

As explicações de Darwin enfatizam o que podemos chamar de aspectos

Figura 18-1. Hostilidade e n l'a h i í ida do cm animais. (1) Hostilidade no cão. (2) Afabilidade no cão. (3) Hostilidade no gato. (4) afabilidade no gato (de Darwin, 1872, segundo Yoimc, 1%1). " "

- 4 0 6 -

topográficos do comportamento emocional. William James, escrevendo no fim do século dezenove, estava mais interessado na seqüência de causa e efeito na emoção. Em particular, ele estava interessado em refutar a idéia de que os estados internos causassem o comportamento emocional. James propôs que as mudanças somáticas na emoção (respondentes fisiológicos) não eram a causa do comportamento manifesto, mas sim o resultado de padrões comportamentais que eram eliciados diretamente pela situação. “ 0 bom senso diz: perdemos nossa fortuna, ficamos tristes e choramos* encontramos um urso, assustamo-nos e corremos; somos insultados por um rival, ficamos com raiva e lutamos” (James, 1890). James argumentou, todavia, que a “proposição mais racional é que nos sentimos tristes porque choramos, raivosos porque lutamos, medrosos porque trememos e não que choramos, lutamos ou trememos porque estamos tristes, zangados ou com medo, como seria o caso” (James, 1890). James inverteu, assim, a seqüencia clássica dos eventos na emoção.

Na explicação de James, assim como em todas as tradicionais, o “sentimento” de emoção, fosse uma causa ou um efeito, tinha um papel crítico.

“fi quase impossível, para mim, pensar que tipo de emoção de medo restaria se não estivessem presentes o sentimento da aceleração dos batimentos cardíacos e da respiração ofegante, do.tremor dos lábios e dos membros enfraquecidos, dos arrepios e das contrações viscerais. Pode-se fingir um estado de raiva e não se apresentar uma excitação no peito, não ficar com a face vermelha, não se dilatar as narinas, não ranger os dentes, não se ter um impulso para a ação vigorosa...? E, tal como na tristeza, o que seria dela sem suas lágrimas, seus soluços, sua sufocação do coração e suas dores no peito? ” (James, 1890).

A descrição de James implicava em que os estados corporais que acompanham os comportamentos emocionais ofereciam uma base para definir as emoções.

Nas décadas de 1920 a 1930, Walter Cannon, um fisiólogo, contestou as sugestões de James de que as emoções eram distinguidas por estados corporais especiais. Cannon argumentava que ( 1 ) os estados fisiológicos para muitas emoções diferentes eram muito semelhantes e não podiam ser distinguidos; raiva e ansiedade, por exemplo, proporcionavam mudanças idênticas em muitos respondentes. (2) Os respondentes da emoção ocorriam em estados não emocionais, tais como exposição a um vento gelado, exercício pesado e febre. (3) A droga adrenalina, quando injetada em sujeitos humanos, produz os respondentes típicos de medo (dilatação dos bronquíolos, constrição dos vasos sanguíneos, liberação de açúcar do fígado, aumento nos batimentos cardíacos, cessação da função gastro-intestinal, etc.) embora os indivíduos assim injetados não relatassem emoção (Cannon, 1927).

Cannon aduziu outra evidência para provar que o “sentimento” de emoção não poderia ser apenas o resultado de mudanças respondentes que ocorrem em situações emocionais e, então, apresentou uma teoria própria. Os eventos internos que relatamos como “sentimentos” são mediados por uma região especial do cérebro, o tálamo. Sua hipótese foi baseada nos efeitos de lesões e estimulação elétrica dessa região do cérebro no comportamento emocional.

18.2 TRÊS CONCEITOS DE EMOÇÃO

Eventos internos. Apesar das diferenças entre as teorias de Darwin, James e Cannon, em todas elas eventos privados não observáveis (“sentimentos” ), acessíveis somente ao indivíduo que está experimentando, ocupam uma posição proeminente. Os

- 4 0 7 -

Diagramas da Fig. 18-2 resumem esses pontos de vista históricos. (Lê-se ->como “conduz

emociona]Figura 18-2. Representação esquemática de três teorias históricas da causação emocional.

Surge um problema metodológico na determinação de como tratar os chamados “sentimentos” de emoção, aqueles eventos tão vivamente descritos por James na p .407 Podemos concordar que tais sentimentos realmente caracterizam a emoção, mas como iremos medí-los e controlá-los? E, na ausência de uma observação direta, como podemos pelo menos estar certos de que o sentimento de medo que Smith diz que tem é o mesmo sentimento de medo que Jones diz ter? Um indivíduo adquire tais respostas verbais, como “estou com medo” , “estou triste” , “estou feliz” , através do reforçamento pelos pais e outros adultos quando, em criança, ele vocaliza essas frases na presença de certas situações, ambientais. Por exemplo, ao ver uma criança tremer e chorar na presença de um objeto não familiar, um pai pode ser inclinado a dizer “você está com medo” , e a criança, desse modo, poderia adquirir a resposta “estou com medo” . Uma história análoga prevaleceria para outras “emoções” . Mas a comunidade que modela o nosso repertório verbal de “emoção” nunca olha dentro de nós para tornar o reforçamento contingente ao responder discriminativo na presença de um estado fisiológico particular e bem definido. Quaisquer que sejam os elementos de S^s internos que estiveram presentes por ocasião do reforçamento inicial, eles são p re su m iv e lm e n te os mesmos eventos internos que estão presentes quando o adulto, mais tarde, relata seu estado emocional; mas esses eventos discriminativossão privados e permanecem para sempre privados para cada um de nós.

A inacessibilidade de nossos sentimentos ao exame de outras pessoas não os torna de todo irrelevantes. Eles permanecem inúteis como sugestão para onde e quando o cientista procurar as variáveis, relações e conceitos significantes do comportamento emocional. É como um dado científico que eles não alcançam o critério de observabilidade da ciência, já que esse critério estipula que os dados sobre os quais a ciência constrói suas leis devem ser acessíveis a todos os que desejam observá-los. Quando a emoção - como a aprendizagem, memória, motivação e outros fenômenos psicológicos tratados em capítulos anteriores — encontra uma tradução em termos comportamentais que todos podem validar, está preparado o estágio para sua análise experimental.

Clássico"---- S -----►emocional

James (1890)—SComportamento

emociona]

Eventos

Cannon (1927)- S

- 4 0 8 -

O problema dos eventos privados é particularmente enfatizado na emoção apenas porque o comportamento emocional manifesto é frequentemente acompanhado por mudanças viscerais (estômago, coração, pulmões, etc.) e glandulares intensas e amplas. Sejam ou não esses eventos mais fortes quando se diz que o comportamento e “emocional” , a metodologia para o estudo da emoção é exatamente a mesma que a de outros processos comportamentais. Os sentimentos que podem acompanhar os eventos viscerais sempre apresentam o problema de serem privados e, portanto, de exclusão científica, por mais vívidos_que possam ser para a pessoa que os está experimentando. Uma suposição razoável é a de que os eventos privados inacessíveis que chamamos de sentimentos estão correlacionados com estados fisiológicos particulares que são acessíveis à observação, dada a instrumentação necessária. É realmente recomendável dirigir-se para dentro do organismo e investigar as propriedades dos processos fisiológicos concomitantes com o comportamento manifesto e isto desempenha um papel importante no desenvolvimento de um quadro compreensivo de qualquer fenômeno comportamental. Mas tal investigação fisiológica não substitui a necessidade de uma informação sólida sobre o comportamento e seus determinantes ambientais.

Padrões reflexos. Se desviarmos nossa atenção dos eventos privados, descobrimos que o problema da seqüência de situação, sentimento e comportamento não mais nos preocupa da mesma maneira que preocupou James e Cannon. Desde que os sentimentos reais não são mensuráveis ou manipuláveis diretamente, não é de interesse crítico, para nós saber se eles ocorrem antes, depois ou ao mesmo tempo que o comportamento. J. B. Watson, o homem que tanto preparou a psicologia para a análise moderna do comportamento, parece ter sido um dos primeiros a ver isso e, em seus escritos, encarava a emoção como padrões especiais de respostas, eliciados inicialmente por estímulos incondicionados. Esses padrões, ele notou, poderiam ser ligados a estímulos previamente neutros, através de procedimentos de condicionamento Pavloviano. Partindo de estudos em recém-nascidos, Watson concluiu que havia somente tres de tais padrões que legitimamente eram qualificados como emoções padrões X, Y e Z. A Tabela 18-1 resume o esquema de Watson. Evidentemente, os três padrões emocionais primários da Tabela 18-1, X, Y e Z, são os protótipos do que mais comumente chamamos de raiva, medo e alegria. De acordo com Watson, todas as outras emoções são baseadas nessas três, como misturas ou combinações que surgem através de procedimentos complexos de condicionamento Pavloviano.

Watson preparou uma demonstração simples para mostrar como o condicionamento amplia os controles da emoção. Para uma criança Albert de 11 meses de idade, Watson mostrou um rato (Sj) nunca antes temido e emparelhou a presença do rato com umas poucas apresentações de um som alto súbito (S2), produzido pela batida de um martelo numa barra metálica. O som amedrontava a criança (síndrome Y de Watson), e servia como o eliciador incondicionado num paradigma Pavloviano. Em certo ponto, o rato (S \) passou a eliciar, em Albert, uma CR que era muito semelhante ao comportamento Y: chorar, gritar, retrair-se, etc. A forma condicionada de medo pode ou não ser exatamente idêntica ao medo incondicionado. Para enfatizar esse ponto, a CR baseada nos reflexos de medo incondicionado é geralmente referida como ansiedade. Em experimentos posteriores, Watson mostrou que essa ansiedade condicionada podia ser lentamente extinta pelo método usual — apresentação de S\ (o rato) sem o S2 (o som alto).

Uma das vantagens importantes do tratamento das emoções feito por Watson com

- 4 0 9 -

relação ao de seus predecessores é que ele formulou a pergunta: quais são as causas externas do comportamento emocional? Como o próprio Watson frisou, “nunca ocorreu a James ou a algum dos seus seguidores neste aspecto, especular, e muito menos experimentar, sobre a gênese das formas emocionais de resposta” (Watson, 1930, p. 142). A demonstração de Watson de que as emoções estavam ligadas aos princípios do condicionamento Pavloviano foi um primeiro passo para a sua análise experimental. Realmente, o capítulo presente pode ser chamado de Alguns efeitos complexos do condicionamento Pavloviano, mas nós seguimos a tradição discutindo esses efeitos como “emoções” .

TABELA 18-1

A DEFINIÇÃO WATSONIANA DAS EMOÇÕES DA CRIANÇA COMO PADRÕES REFLEXOS (Compilada por Tolman, 1923)

ELICIADORES RESPONDENTES

RAIVA (X)

Impedir os movimentos da criança segu- Chorar, gritar, endurecer o corpo. Movi-rando sua face ou cabeça; ou segurar mentos coordenados de golpear e baterseus braços fortemente junto ao corpo. das mãos e braços. Levantar e abaixar

pés e pernas. Prender a respiração.

MEDO (Y)

Remover subitamente todos os meios de Retenção súbita da respiração. Segurar -sustentação (deixar cair das mãos para se (reflexos de segurar). Piscar os olhos,ser segura por um assistente). Som alto. Franzir os lábios. Chorar.Empurrar de repente ou balançar levemente (logo que começar a dormir ou logo que acordar). Puxar de repente o cobertor (quando está adormecendo).

ALEGRIA (Z)

Acariciar ou manipular uma zona eró- Se a criança está chorando, ela para degena. Fazer cócegas, balançar, embalar chorar. Aparece um sorriso. Ela emitesuavemente. Dar tapinhas leves. Colocar sons.em decúbito ventral no joelho do assistente.

Operantes interrompidos. Outro passo conceituai deve ser dado para simplificar a análise experimental de fenômenos emocionais. Watson endossou o ponto de vista (como fez Darwin) de que as emoções primárias eram padrões complexos de resposta in condicionada e tomou três de tais padrões como “fundamentais”. Mas qual a justificativa que ele possuia para limitar-se justamente a esses três em particular? Um som alto — por exemplo, um tiro de pistola à queima-roupa — produzirá o padrão de

- 4 1 0 -

susto (Fig. 18-3) c uma imensidão de outros respondentes. O padrão é completado em cerca de 1/2 scg, e contém muitos dos aspectos de um breve ataque de emoção. Mas, por que não c chamado de uma emoção? Assim, também a tosse, o soluço, o espirro, o lacrimejar dos olhos por causa de uma partícula de poeira, os sintomas da alergia chamada febre do feno, a palpitação e o enrubescimento depois de exercícios pesados, e a indigestão depois de comer muito, todos envolvem padrões complexos de respondentes. Contudo, poucos os chamariam de emoções. O que há de especial com as reações X, Y, Z que elas, e não esses outros padrões, devem receber um status especial e ser denominadas “emoções”? Nenhuma resposta satisfatória foi dada, ainda, a esta questão. Não foram encontrados critérios adequados que possam distinguir os reflexos emocionais dos reflexos não-emocionais. Na sua ausência, podemos supor que a definição de emoção encontra-se em outro lugar que não nas características especiais de certos padrões reflexos.

Um aspecto primordial de todas as emoções é a ruptura, distúrbio, intensificação ou mudança geral que ocorre em qualquer de uma variedade de comportamentos arbitrários nos quais um indivíduo possa estar empenhado no momento em que ocorre o que nòs chamamos de uma situação emocional. Realmente, um homem amedrontado é mais facilmente identificado pela depressão marcante de todas as suas atividades usuais

l iguni 1R-3. Resposta dc susto a uni tiro dc pistola (Lands c Hunt, 1939).

do que por mudanças cardíacas, respiratórias ou digestivas especiais. Um homem com raiva é o epitome de um homem com o comportamento interrompido. E improvável que um indivíduo muito zangado prossiga o que estava fazendo antes de tornar-se zangado. Agora ele se volta a novos comportamentos; o mais provável é que ele estrague coisas à sua volta, faça réplicas verbais fortes e emita operantes com força não usual. Prometa a uma criança uma atividade especialmente atrativa e ela poderá, literalmente, pular dc alegria. Muitos dos comportamentos presentes da criança são temporariamente interrompidos e outros podem ser intensificados. E o caráter especial

- rr* -

dessas mudanças amplas, e rião dos padrões reflexos ou dos estados corporais, que se mostrará o esquema mais conveniente para estudar as emoções.

As operações que fazem aparecer essas mudanças amplas consistem de dois tipos principais: ( 1) a apresentação ou término de reforçadores primários poderosos, e (2) a apresentação de estímulos que foram previamente associados com tais reforçadores poderosos através do condicionamento Pavloviano. As mudanças amplas em muitos comportamentos operantes associadas com essas operações poderiam ser interpretadas como mudanças simultâneas no valor reforçador de praticamente todos os reforçadores primários do organismo. A destruição e o estrago adquirem tal valor reforçador para o indivíduo zangado que, momentaneamente, nada mais é importante. O homem que está amedrontado ou desgostoso perde o apetite e o desejo sexual. As pessoas enamoradas estão frequentemente tão envolvidas com os seus reforçadores recém-encontrados que elas “vivem dc amor” exclusivamente, por um período de tempo, negligenciando o alimento e não se empenhando em outras atividades de rotina. Pareceria que a emoção, como a motivação, classifica um grupo de operações que modulam o valor reforçador de reforçadores primários e mudam a atividade geral do organismo. Assim, não devemos nos surpreender em saber que muitas autoridades, atualmente, tratam os dois tópicos como uma área unificada. De qualquer forma, há diferenças nas espécies de operações historicamente atribuídas aos dois campos. As operações universais antecedentes associadas à motivação são privação e saciação. Na enioção, as operações antecedentes são mudanças abruptas de estímulo. Além disso, o medo, a raiva e a alegria implicam em mudanças difusas, não específicas, no valor de todos os reforçadores; fome e sede implicam em mudanças algo mais específicas num grupo mais restrito de reforçadores.

18.3 0 PARADIGMA DA ANSIEDADE

Uma parte significante da análise da emoção como uma quebra das atividades operantes rotineiras de um indivíduo surge dos estudos de um fenômeno de laboratório conhecido como ansiedade experimental. A ansiedade é produzida por uma variante da variação de Watson do condicionamento Pavloviano: um estímulo originalmente não aversivo (S l) é emparelhado com um estímulo aversivo (SJ). A ansiedade é medida observando-se os efeitos que o emparelhamento tem sobre quaisquer atividades operantes em que o organismo possa estar empenhado. Desde que somos limitados na faixa de estímulos aversivos que poderíamos desejar apresentar para um organismo humano, geralmente podemos escolher entre macacos, ratos c pombos para serem sujeitos. Para manter esses animais em atividades operantes por períodos substanciais, podemos privá-los de alimento ou água e, então, treiná-los a pressionar uma barra ou bicar uma chave com reforçadores positivo intermitente. Uma vez completado esse treino, temos um organismo que manterá uma taxa moderada de comportamento operante por um longo período de tempo, uma preparação a partir da qual podemos administrar procedimentos de condicionamento Pavloviano

Um experimento clássico de ansiedade condicionada, é o de W. K. Estes e B. F. Skinner (1941) usando um procedimento Pavloviano superposto a um operante reforçado intermitentemente, como salientamos. Certos refinamentos dc procedimento foram introduzidos por Hunt c Brady (1951, 1955) e e sua técnica experimental que descreveremos. Eles treinaram ratos privados dc líquidos a pressionar uma barra poi

- 4 1 2 -

água ò, então, coíocaram o comportamento sob um esquema IV de reforçamento com água. Quando o comportamento em IV se tornou estável, foram feitos jmparelhamen- tos Pavlovianos, periodicamente, com um clique (Sj) soando por 5 min, seguido por um choque elétrico breve (S2 ) nos pés do rato.

(A) Resultado típico durante um período de 15 min.

(B)Primeira tentativa de condicionamento.

(C) Resposta emocional condicionada

Tempo

Legenda Clique introduzido em C, terminado pelo choque

em S após 5 min.

I'igura lfl-4. A resposta cie ansiedade condicionada ((’AR) no rato, como aparece tipicamente no comportamento operante de pressionar a barra positiva e intermitentemente reforçado (Hunt e Bradv, 1951).

- 4 1 3 -

Algumas das mudanças comportamentais típicas que se seguiram podem ser vistas nas curvas cumulativas de pressão à barra da Fig. 18-4. Estas curvas descrevem distúrbios no operante reforçado por água que estava ocorrendo, distúrbios estes que surgiram devido ao emparelhamento Pavloviano de S\ comS2 . Na Fig. 18-4A, o rato estava trabalhando estavelmente na barra. Os reforçamentos com água não são vistos, mas vários foram fornecidos durante o período visto em (A). A primeira tentativa de condicionamento Pavloviano (Si, S2 )é vista em (B). Note que, neste estágio, o clique, S i, não tinha efeito perceptível na pressão à barra. O choque, todavia, quando apareceu, resultou numa breve diminuição da taxa, mas logo o rato estava novamente trabalhando com estabilidade. O procedimento de emparelhamento foi repetido em intervalos. Depois de alguns emparelhamentos, ocorreu uma mudança que pode ser vista na parte central, à esquerda, na Fig. 18-4. O rato começou a responder irregularmente e com taxa reduzida durante o clique. Enquanto isto, a resposta original ao choque começou a se adaptar (seção 18.9), de modo que o choque, em si, afetava cada vez menos a pressão à barra. Depois de um número de emparelhamentos (em baixo, à direita, na Fig. 18-4), ocorre uma cessação quase completa de pressão à barra no período de clique. O comportamento operante em processo foi quase completamente interrompido pelos emparelhamentos; havia se desenvolvido a ansiedade condicionada, na forma de uma supressão condicionada da pressão à barra positivamente reforçada. A observação do rato durante o período de clique, revelou os reflexos característicos do medo: retração, tremor, palpitação, imobilidade, defecação e micção.

A ansiedade condicionada tem sido verificada em um número de espécies e com um número de esquemas de linha-base de reforçamento positivo. O resultado geral é uma supressão do responder desenvolvido durante o estímulo de aviso. A supressão é duradoura; pombos mantiveram-na após um período de 2 anos de descanso (Hoffman. Fleshier, e Jensen, 1963). Logicamente, então, os efeitos do procedimento de ansiedade são consistentes e duráveis. Mas há alguma razão para se acreditar que o que estamos estudando em animais no laboratório tem alguma coisa a ver com a ansiedade como a conhecemos no homem?

Resta ver se o que é chamado ansiedade pelo pesquisador no laboratório é relevante para as especulações sobre ansiedade no homem. Certamente não compreendemos, do ponto de vista clínico, precisamente o que é a ansiedade no homem, enquanto que o pesquisador no laboratório pode especificar um significado. Tomar emprestada a palavra ansiedade para os nossos experimentos reflete o julgamento de que os experimentos contêm os aspectos básicos do que acreditamos, embora sem prova adequada ainda, de estar envolvido na ansiedade humana” (Schoenfeld, p. 75).

Voltemo-nos para alguns aspectos adicionais da ansiedade condicionada. É fácil verificar que a supressão condicionada ocorre no seu máximo para o estímulo de aviso particular (Si) que foi usado no emparelhamento Pavloviano. Mas também ocorre alguma supressão para estímulos semelhantes a S j , mesmo que esses nunca tenham sido previamente emparelhados com choque. Pode-se demonstrar um gradiente de generalização para a supressão condicionada, testando-se a extensão de supressão ante estímulos relacionados com o S\ real usado no treino, embora diferentes. Hoffman e Fleshier, (1961) estudaram essa generalização da supressão condicio-

- 414 —

300 450 670 1000 1500 2250 3400F reqüência (ciclos por segundo)

Figura 18-5. Gradientes de generalização de supressão. O índice de supressão usado tem as seguintes propriedades: quando o índice é igual a 1.0, a supressão em Si é total; quando é 0, não há distúrbio durante S\; e quando é menor que 0, há intensificação da taxa em IV durante S\. Os números à esquerda de cada gradiente indicam as sessões incluídas.

nada em pombos cuja resposta de bicar era mantida por um esquema de reforçamento com alimento em IV 2 min. Um tom de 1000 ciclos foi usado como Si e um choque elétrico no corpo do animal como S2 - Após repetidos emparelhamentos de Si e S2 , o bicar a chave foi suprimido em Si. Então, o choque foi permanentemente interrompido, tons de várias freqüências foram apresentados no decorrer de 25 sessões-teste e qualquer supressão a eles foi medida. A Fig. 18-5, de um animal típico, mostra que no decorrer das sessões 1-5 (a curva superior acima), ocorreu, quase completa supressão a uma faixa ampla de tons; o gradiente é achatado. Nas sessões subsequentes o gradiente tornou-se gradualmente mais inclinado, à medida que o animal restringia o bicar a chave, bicando na presença daqueles tons mais remotos do S\ dc treino. Mas, mesmo depois de 25 sessões sem choques, ainda ocorria uma supressão quase perfeita para o Sj original do treinamento. Esses gradientes de generalização indicam, primeiro, que a ansiedade pode se espalhar para condições muito diferentes daquelas que originalmente a produziram e, segundo, que a ansiedade condicionada, uma vez produzida, pode ser extremamente resistente à extinção.

Podemos resumir a informação apresentada sobre ansiedade experimental em seu paradigma.

DADOS: Um operante, previamente fortalecido com reforçamento positivo, um eliciador aversivo incondicionado, um estímulo‘‘neutro”

PROCEDIMENTO: (1) um operante é mantido num esquema intermitente de reforçamento positivo, por exemplo R - ü > S'h (2) Enquanto as contingências de reforçamento positivo permanecem em vigor, S\ é ocasionalmente emparelhado com

S2 •- 4 1 5 -

PROCESSO: Ocorre uma supressão gradual da taxa de R sempre que S\ é apresentado.

RESULTADO: R é suprimida em alguma extensão mensurável durante S] e outros Ss relacionados.

Nossa avaliação do paradigma de ansiedade experimental revela que o emparelhamento de um estímulo previamente neutro com um estímulo aversivo, enquanto o organismo está empenhado em outras atividades, produz certos efeitos drásticos, e duráveis naquelas atividades. Geralmente, as “outras atividades” têm se restringido ao comportamento mantido por esquemas dc reforçamento intermitente. Um perfil mais completo dos efeitos emocionais incluiria informações sobre discriminação, diferenciação, encadeamento, solução dc problema, esquiva e outras linhas-base comportamentais. Existem razões para se esperar efeitos característicos em cada um desses casos. Frequentmente, diz-se que a ansiedade moderada facilita a solução de problema, enquanto que a ansiedade forte a dificulta. Os procedimentos de ansiedade condicionada permitem testes objetivos dessas e de outras afirmações. Os efeitos dos procedimentos de ansiedade condicionada são seguramente mais complexos do que qualquer proposição simples de “supressão” . Já se sabe que o procedimento de emparelhar S j , S J > quando superposto a uma linha-base dc esquiva, pode gerar facilitação da resposta, em vez de supressão. (Sidman, 1960).

A ansiedade experimental, na forma dc supressão da resposta intermitentemente reforçada, tem se mostrado um instrumento de utilidade prática para o estudo de diversas variáveis experimentais. Brady e Hunt (1955) descobriram que podiam eliminar temporariamente a ansiedade experimental liberando corrente suficiente, no cérebro do rato, para produzir convulsões (um procedimento chamado de ECC o “choque cletroconvulsivo” , comum na prátioa psiquiátrica). A supressão condicionada é previsivelmente afetada por tranqüilizantes que controlam os sintomas da ansiedade humana. Outros pesquisadores têm estudado os efeitos de várias lesões cerebrais na supressão condicionada, na busca de estruturas do sistema nervoso central que são críticas para o comportamento emocional (Brady, 1961, 1962).

18.4 RAIVA

A ansiedade diz respeito à apresentação de reforçadores negativos. Uma forma bem diferente de distúrbio comportamental ocorre quando reforçadores positivos são removidos. Já tivemos ocasião de fazer referência (seção 5.1) ao breve aumento que ocorre na taxa de resposta quando uma cadeia de comportamento operante é abruptamente quebrada pela extinção. No rato, esse aumento na taxa da resposta fortalecida é acompanhado por uma variedade dc outros comportamentos cujas características morder o manipulandum da resposta, agitação extrema, excitamento violento implicam como emocionais.

Essas observações têm seus corolários nos comportamentos agressivos apresentados por sujeitos humanos com raiva. Gates (1926) entrevistou estudantes universitárias e lhes pediu para fazerem uma lista das circunstâncias que tipicamente as tornavam iradas. As moças citaram recusas de convites, atraso de amigos aos encontros, discar um número errado no telefone, falhas na operação de relógios, canetas c máquinas de escrever, atraso de ônibus ou elevadores ou perda de dinheiro, como os precipitadores mais comuns. Cada uma dessas situações produzia tendência fortes para retorquir

- 4 1 6 -

verbalmente, causar danos físicos a alguém, quebrar objetos, retirar-se vigorosamente da situação, gritar e xingar. Cada uma das causas citadas implica numa extinção súbita de um comportamento previamente reforçado, a interrupção abrupta de uma cadeia de comportamento.

Azrin, Hutchinson e Hake (1966) planejaram uma técnica para medir experimentalmente a duração e frequência de comportamentos agressivos que resultam da interrupção de uma cadeia dc comportamento. Nesta técnica, um pombo faminto foi treinado a bicar uma chave por alimento. Quando o pombo experimental havia adquirido o comportamento de bicar a chave, um segundo pombo “alvo” , imobilizado numa caixa especialmente construída, foi introduzido no compartimento experimental (Fig. 18-6). À caixa que continha o pombo-alvo foi montada de maneira que um interruptor, colocado sob a caixa, desligava, sempre que esta era sacudida vigorosamente. A montagem foi cuidadosamente equilibrada, de modo que os movimentos normais espontâneos do pombo-alvo eram insuficientes para acionar o micro-interruptor, ao passo que, quaisquer ataques vigorosos que o pombo experimental dirigisse ao corpo exposto do pombo-alvo seriam registrados. Os ataques ocorreram dentro da previsão. Sempre que as contingências de reforçamento eram mudadas abruptamente de crf para extinção, o pombo experimental, invariavelmente, atacava, o alvo. Os ataques eram viciosos e agressivos, durando ate 10 minutos.

Os resultados paralelos da interrupção de uma cadeia de comportamento reforçado, tanto em animais como em homens, confirmam a generalidade do paradigma de frustração. Seu procedimento é, simplesmente, uma extinção abrupta de um operante após reforçamento contínuo. Seus resultados são mudanças amplas na topografia do comportamento, acompanhadas por mudanças no valor reforçador da destruição, estrago e outros atos agressivos.

São esses comportamentos de raiva condicionados da mesma maneira que o medo foi condicionado na seção anterior? Num estudo relevante Leitenberg, (1966) treinou

Proteção

Ajuste Moi a de compressãoda força

1 igura 18-6. Representação csquemática da aparelhagem para medir o a taque (Azrin, Hutchinson e Hake, 1966).

- 417 -

ratos, a pressionarem uma barra com relorçamento positivo num esquema IV . Durante a sessão, foi apresentado um ‘‘estímulo de aviso” (Si), seguido poucos minutos mais tarde por um segundo estímulo (S^2),que indicava que um período de extinção para a pressão à barra havia entrado em efeito. O procedimento é análogo ao procedimento de ansiedade condicionada, mas um estímulo correlacionado com extinção (S 4 ) substitui, aqui, o choquc (SA). Depois de poucos emparelhamentos, os ratos de Leitenberg, aumentaram suas respostas no estímulo de “ aviso” , embora tal aumento na taxa não produzisse mais reforçamento. _

Podemos especular que essa facilitação da taxa de resposta representa uma “resposta condicionada dc raiva” , mas o procedimento de Leitenberg, é apenas sugestivo. Muitos aspectos do comportamento não foram medidos para que possamos estar certos de que, durante o estímulo de aviso, a probabilidade de comportamentos agressivos tais como o ataque ou o responder anormalmente intenso pode também ter sido aumentada.

18.5 ELAÇÃO

Medo e raiva são aproximadamente descritos como emoções negativas, já que dependem da apresentação de reforçadores negativos ou remoção dc reforçadores positivos. Mas o comportamento emocional não se limita puramente aos exemplos negativos. Watson identificou “a síndrome Z” como um padrão reflexo incondicionado resultante da estimulação dc zonas erógenas ou associadas com alimentação (lactente) Na conversa casual, identificamos os comportamentos como alegres, excitados, agradáveis e assim por diante. Nosso objetivo, aqui, será mostrar que essas termos implicam na existência de um outro grupo de distúrbios operantes que, como a ansiedade, estão estritamente associados com certos procedimentos dc condicionamento Pavloviano.

Todos já viram uma criança encantada pela promessa da chegada de coisas boas. Mesmo o adulto pode “vibrar” com boas notícias. O eão tem um mecanismo típico, o balançar a cauda, para indicar seu entusiasmo quando acolhe seu dono ou quando está perto de ser alimentado ou acariciado. Tais observações sugerem que os efeitos do reforçamento positivo não se limitam ao fortalecimento e manutenção do comportamento (-perante. Um S+ ou um estimulo que precede S+ 5 parece gerar algum distúrbio comportamental que pode ser chamado de “alegria” ou “elação” . Podemos imaginar facilmente+um procedimento de elação condicionada no qual um S\ é emparelhado com um S2 enquanto o organismo está trabalhando numa atividade operante. É mais difícil predizer os efeitos desta operação. Um homem de negócios trabalhando diligentemente 11a sua agenda diária quando sabe que acertou na bolsa dc valores e a dona de casa, no meio dos afazeres domésticos, assando uni bolo, quando fica sabendo cjue ganhou uma passagem de graça para o Havaí, provavelmente terão suas atividades interrompidas. Contudo, é uma questão experimental saber como esta interrupção difere daquelas chamadas de ansiedade c raiva. A questão implica num programa sistemático de pesquisa envolvendo numerosas linhas-base c, talvez, muitos procedimentos diferentes dc emparelhamento de S i,S 9 . No presente, temos a oferecer apenas uma informação experimental restrita acercada realidade da elação condicionada.

Herrnstein e Morse (1957) treinaram pombos a bicar uma chave por alimento e, então, estabilizaram a resposta na chave num procedimento que gerava uma taxa muito baixa dc bicar. Lies reforçavam apenas aquelas respostas espaçadas de pelo

- 418 -

menos 5 min (drl 5 min, ver seção 8 . 6). Quando a taxa de resposta parecia estável, um paradigma Pavloviano foi superposto às contingênicas operantes. S\ era uma mudança na cor da chave seguida depois de algum tempo por S2 , uma apresentação “livre” de alimento, idêntica ao reforçamento usado para manter a linha-base, exceto , que a apresentação “livre” de alimento não era contingente a uma bicada na chave. O procedimento de Herrstein e Morse produziu uma mudança dramática na taxa de bicar a chave durante S]. Antes do procedimento Pavloviano, uma taxa muito baixa e razoavelmente constante de bicar havia sido mantida Depois do procedimento Pavloviano estar em efeito por algumas sessões, todavia, taxas altas de bicar desenvolveram-se durante S\. A Fig. 18-7 mostra os registros cumulativos da sessão 11 para seis sujeitos. Em a, o S\ era apresentado, (f indica a apresentação de , alimento). Neste experimento, S\ era prolongado por 1 min além dc s j e terminava em b embora, aqui, nos preocupemos somente com os efeitos da taxa de a a f. A Fig. 18-7 indica que a maioria dos animais mostra um aumento da taxa a (S \) que dura,pelo menos, até f (S9 ). 0 aparecimento rápido do efeito parece anular a possibilidade de que o aumento da taxa seja devido a qualquer relação supersticiosa do bicar com 0 reforçamento livre.

I 8-7. Segmentos de uma hora de “elação” condicionada (Herrstein c Morse,

- 4 1 9 -

Experimentos semelhantes usando uma linha-base reforçada em IV com alimento e estimulação cerebral positivamente reforçadora (ver seção 16.3) como também demonstram uma facilitação condicionada (Fig. 18-8) durante um estímulo que consisten temente precede a estimulação cerebral (Brady, 1961).

Um efeito ainda mais sutil desse tipo geral foi observado por Pliskoff (1963). 0 comportamento pode ser mantido sob vários esquemas IV. alternados diferentes, sendo que cada IV fica em efeito por um tempo limitado e cada IV é correlacionado com um estímulo especial. Sc um estímulo de aviso (Sj) é apresentado antes da mudança (S2) de um IV com um intervalo médio maior entre as oportunidades de reforçamento para um comum intervalo médio menor (digamos IV 2 min para IV 1/2 min), podem ocorrer certas mudanças no responder durante o estímulo de aviso. Quando a mudança é de um intervalo médio longo para um pequeno, como acabamos de descrever, o organismo está, na verdade, mudando de um esquema menos favorável para um mais favorável. O procedimento de Pliskoff produziu uma supressão moderada na taxa dc resposta durante o estímulo de aviso, sugerindo que uma operação dc “elação” pode nem sempre aumentar as atividades operantes.

I igura 18-8. 1 acilitação condicionada numa linha-basc cm IVm reforçada com alimento resultante do emparelhamento de S| com um choque cerebral positivamente reforçador. (Brady, 1 961)O estabelecimento das condições gerais que produzem supressão e daquelas que

produzem facilitação esperam por mais trabalho experimental sobre os efeitos emocionais gerais dc $3 c do emparelhamento de Sjs com S+s em outras linhas-base comportamentais. Os poucos estudos descritos indicam como as emoções positivas podem ser encaradas como mudanças condicionávcis no comportamento operante em processo.

Esta seção c as duas precedentes completam nossa análise dos efeitos comportamentais dc três categorias de operações produtoras de emoção. As operações são reflexas, os comportamentos operantes. Mesmo assim, ao contrário dos fenômenos operantes comuns, esses que denominamos “emocionais” referem-se a mudanças em operantes que não são produzidas diretamente pela alteração de suas conseqüências de reforçamento. Nenhum dos efeitos da ansiedade, raiva ou elação torna o reforçamento

- 420 -

positivo mais provável ou o reforçamento negativo menos provável. O rato “ansioso” na Fig. 18-4 recebe choquc caso haja ou não supressão. O pombo “com raiva” que bica seu companheiro vigorosamente não restabelece, através disso, o reforçamento. O rato “alegre” dc Brady (Fig. 18-8) não acelera a ocorrência da estimulação cerebral por responder rapidamente. Assim, embora as mudanças medidas no comportamento sejam mudanças nas taxas de operantes, elas não são controladas diretamente pelas contingências de reforçamento dc nenhum dos operantes afetados.

Dizer que um efeito emocional não é útil, aqui e agora no ambiente de laboratório do animal, ou no ambiente do homem civilizado, para influenciar a probabilidade dc reforçamento, não significa que ele não possa ter sido alguma vez útil para influenciar a probabilidade de reforçamento e que não possa ser útil cm outros ambientes. Fm particular, o comportamento emocional pode ter sido extremamente útil para os ancestrais do indivíduo cujo comportamento emocional estamos agora testemunhando. As sugestões de Darwin a respeito da utilidade biológica dc comportamentos emocionais no ambiente natural já foram salientadas (p. 406). Tais especulações estão de acordo com os fatos conhecidos dc que os rcspondent.es emocionais são mediados por partes do sistema nervoso que, na maioria, são filogcncticamcntc mais velhas que as partes desse sistema que controlam as capacidades para adquirir comportamentos operantes complexos. Os comportamentos emocionais parecem estar entre aqueles comportamentos primitivos cujas potencialidades estão estabelecidas c, como outros reflexos, eles estão sob o controle de princíoios Pavlovianos cm vez de operantes.

18.6 UM MODFLO PARA RFPRFSFNTAR H INTKRRIiLm^ juinak FLNOMFNOS HMOCIONAIS

Descrevemos três padrões dc distúrbios nos comportamentos operantes estritamente ligados a remoção ou à apresentação de reforçadores, embora, cm muitos casos, estejam intimamente relacionados a procedimentos Pavlovianos. Uma vez que os efeitos comportamentais produzidos parcccm lembrar, dc certo modo, os comportamentos que em nós mesmos chamamos de ansiedade, raiva c elação, mantivemos esses termos para denominar esses três paradigmas. Nossa intuição nos diz, todavia, que, mesmo que esses três paradigmas correspondam realmente aos fenômenos humanos, eles não chegam a comcçar a esgotar o campo da emoção. Palavras como tristeza, humilhação, desapontamento, vergonha, culpa, penúria, embaraço, piedade, amor, ternura, contentamento e euforia sugerem que há muitas variantes emocionais sutis não consideradas na nossa classificação geral de medo, raiva c elação.

Uma variedade de considerações diferentes tem sido fornecida por filósofos c psicólogos para esquematizar e representar vários fenômenos emocionais (Plutchik, 1962). O esquema teórico a ser elaborado aqui 6 tirado de duas idéias históricas: (1) que certas emoções diferem entre si apenas em intensidade, e (2 ) que certas emoções podem ser consideradas como compostas dc outras, mais fundamentais. A primeira idéia é clara. Raiva, cólera c aborrecimento, por exemplo, são palavras que parecem denotar diferentes intensidades de um distúrbio de tipo semelhante. A segunda noção, misturar emoções “ puras” para formar outras, c mais sutil. Há três séculos, Descartes argumentava que todas as emoções eram derivadas dc seis paixões básicas: amor, ódio, desejo, alegria, tristeza e admiração, embora ele não tenha dado nenhuma justificativa para a escolha dessas seis, em particular, como básicas. Outros autores fornecem outras

- 4 2 1 -

istas cujo tamanho varia dc três a várias dúzias dc emoções básicas. Nenhum critério satisfatório para selecionar as emoções primárias ou fundamentais foi ainda encontrado, nem foram analisados detalhadamente os métodos de composição.

Nossa consideração começa com a afirmação dc que os três padrões citados por Watson (Tabela 18-1) e descritos como mudanças operantes nas três seções precedentes constituem os três padrões emocionais fundamentais. Seu status fundamental deriva-se do fato de que ( 1) em sua forma incondicionada, seus procedimentos exaurem as possibilidades de apresentação c remoção dc reforçadores primários positivos e negativos, e (2 ) em sua forma condicionada, seus procedimentos exaurem as possibilidades de paradigmas Pavlovianos simples. A Tabela 18-2 resume as operações Pavlovianas c alguns dos seus efeitos comportamentais conhecidos. Na Tabela 18-2, um traço diagonal em S c uma abreviação da notação que indica o término do evento estímulo reforçador. Pode-se observar que a coluna à esquerda da tabela exaure as combinações possíveis dc um S\ com a apresentação ou termino de S+ ou S . Existem quatro possibilidades lógicas, mas agrupamos duas delas na premissa dc que os efeitos comportamentais de se terminar um reforçador negativo ou apresentar um reforçador positivo sejam bastante semelhantes para permitir um tratamento conceituai semelhante. Uma segunda suposição que simplifica é feita ao se negligenciar as diferenças entre reforçadores particulares positivos ou negativos. Assim, a “elação” produzida pelo emparelhamento de um S\ com um reforçador sexual não é distinguida. no esquema da Tabela 18-2 da elação produzida pelo emparelhamento de um S\ com um reforçador alimentar. Essas suposições constituem trabalhos hipotéticos cuja utilidade somente a experimentação futura poderá determinar.

Tendo estabelecido três emoções “ primárias” , podemos nos voltar para o problema de representar outras emoções. Na Fig. 18-9, as três emoções primárias aparecem como vetores de um modelo geométrico.

AS OPERAÇÕES EMOCIONAIS PRIMÁRIAS E ALGUNS DE SEUS EFEITOSCOMPORTAMENTAIS

Tabela 18-2

OPERAÇÃO DEEMPARELHAMENTOPAVLOVIANO

NOME COMUM DA

“EMOÇÃO”

EFEITOS SOBRE A ATIVIDADE OPERANTE

AnsiedadeSupressão de operantes positivamente reforçados, Facilitação de operantes negativamente reforçados.

Elação Facilitação dc alguns operantes. Pouca informação disponível.

Raiva Aumentos na magnitude de alguns operantes. Valor reforçador de ataque e destruição àumentado.

- 4 2 2 -

S-

I igura 18-9. o sistema de coordenada emocional. Um modelo para representar diferenças dc intensidade nas operações emocionais fundamentais.

Este quadro de referência nos permite representar a noção de que algumas emoçõe:>, aparentemente, diferentes, podem ser consideradas como correspondentes a diferenças nv intensidade do reforçador positivo ou negativo em que estão baseadas. As emoções retratadas nos extremos de cada vetor são baseadas nos valores mais fortes dos reforçadores incondicionados relevantes e os termos usados para descrever os comportamentos são escolhidos apropriadamente. À medida que nos movemos em direção à origem, a intensidade diminui. Seguimos Plutchik (1962), ao supor que, à medida que a intensidade diminui, os efeitos comportamentais tendem a desaparecer e ser menos claramente distinguíveis. Isto é indicado pela escolha de um sistema que converge em direção a um ponto (a origem) onde as três emoções se encontram. Deve ficar claro que um grande número de termos da linguagem comum de emoção poderia ser colocado em algum ponto nessa estrutura, da qual são vistos apenas três níveis (alto, médio e baixo).

Muitos fenômenos comportamentais aos quais aplicamos o termo emoção não encontram um lugar na Fig. 18-9, qualquer que seja o nível de intensidade que escolhermos. Esses, sugerimos, podem ser considerados como casos de emoções primárias misturadas. Como as emoções primárias se misturam? De duas formas principais: (1) um determ inado S \ é emparelhado sucessivamente com duas ou três primárias, esquematicamente (por exemplo)

S„S+;S1,S“ ;S„S“ ;S1,S+; . . .

(2) Um determinado S\ c emparelhado com um S2 que compreende dois ou mais reforçadores primários d i f e r e n t e esqucmaticamente (por exemplo)

S lJS ± \ S l9S ± \ S l9S ± \ S u S ± \ . . .

- 423 -

Como uin exemplo 0a primeira mistura, consideremos o efeito que ocorre quando uma criança rouba um doce. O doce na mão é um S| para o S+ doce na boca; mas c lambém um S] para punição (S ), que lem uma alta probabilidade de ocorrer. Kssa combinação particular (um S\ emparelhado primeiro com um S"1 e depois com um S") ocorre muito frequentemente na natureza para que seus efeitos tenham um único nome, culpa. A análise de Plutchik sugere que, de uma maneira análoga, o orgulho deve ser uma mistura de raiva e alegria. Logicamente, casos mais complicados podem ocorrer com outras misturas das três emoções primárias. Hm alguns casos, os efeitos não se fundem e falamos de emoções mistas Variando independentemente as probabilidades dc ocorrência de cada um dos S2S, podem ser adquiridas outras sutilezas nos padrões de comportamento emocional. Assim como o quúnico atualmente prepara compostos que não existem na natureza, emoções experimentais que não surgem comumente no mundo natural podem ser geradas por várias operações compostas de condicionamento.

O caso cm que S2 6 composto de elementos tantos positivos, como negativos (S^) ilustra um tipo de situação psicológica de conflito. Se uma dada situação incluc elementos tanto positivos quanto negativos, os comportamentos dc aproximação c esquiva podem existir, ambos, com uma alta força e diz-se que há um confltio entre Juas cadeias incompatíveis de comportamento: aproximar-se versus afastar-se. Uma criança que ordinariamente evita ou foge de espinafre pode ser colocada numa situação de conflito se se lhe diz que a sobremesa depende de ela comer o espinafre. O tonar o espinafre-no-estômago um S^ para respostas que produzem sobremesas dá ao espinafre um certo valor de reforçador positivo que pode ou não superar a aversão original. Um exemplo de um confltio ainda mais forte aparece num experimento dc um psiquatra, Julcs Masscrman (1946). Gatos famintos foram colocados numa caixa contendo alimento no seu extremo. Os gatos logo passaram a se aproximar c comer o alimento sempre que colocados na caixa, lím tentativas posteriores, colocou-se um tubo para conduzir ar comprimido perto do alimento, de tal modo que-, assim que o gato estivesse quase pegando o alimento para comer, uma violenta corrente dc ar era dirigida para a sua cabeça. Masserman descreve o efeito comportamental deste emparelhamento do comportamento de aproximação reforçado positivamente com um estímulo aversivo, como “pânico” . No dia seguinte, c subsequente, esses gatos recusaram-se a se aproximar do alimento. A corrente dc ar foi, então, removida permanentemente (extinção Pavloviana), mas muitos gatos nunca mais se aproximaram do alimento, preferindo a fome. Masserman caracterizou estes gatos como “neuróticos” e sugeriu que um procedimento dc conflito deste tipo deve ser o fator subjacente dc muitas neuroses humanas. Uma interessante observação colateral foi feita. Antes do início do experimento, as preferências alcoólicas dos gatos foram testadas, ofcrcccndo-sc-lhcs leite puro numa tigela c leite misturado com álcool cm outra. Antes dc experimentar o procedimento de conflito, os gatos invariavelmente preferiam leite puro, mas depois de experimentar o procedimento de conflito os gatos de Messerman apresentaram uma preferencia marcante pelo leite “ alcoolizado” .

Misturas ou compostos emocionais podem ser produzidos por procedimentos Pavlovianos ainda mais complicados. Certos padrões emocionais, aparentemente, dependem de operações dc condicionamento bem complexas, muitas das quais não são possíveis sem outras histórias anteriores de condicionamento, ainda mais complicadas. Considere o caso da remoção não apenas dc um único S+, mas de um reforçador generalizado (seção 11.4). Removendo tal reforçador, removemos efetivamente uma

- 424 -

variedade de reforçadores positivos. Mas sem a his Uri a que primeiro torna um S um reforçador generalizado, os efeitos emocionais particulares dc sua remoção não são possíveis. O caso cm pauta, acreditamos, tem uma relação estreita com o fenômeno que chamamos de “ tristeza” . A morte dc um amigo, a perda de um bom emprego c eventos semelhantes provocam a tristeza porque, dc uma só vez, uma variedade de reforçadores c perdida, parccc razoável que esse padrão raramente seja visto cm animais, porque os reforçadores generalizados são mais comumentc criados nas sociedades humanas. Mas todos conhcccm o cão que, com a morte do seu dono, apresenta comportamentos bastante parecidos com nosso próprio comportamento dc tristeza. Na medida em que as operações sejam plausíveis, pode ser possível gerar esses ou comportamentos similares em outras espccics. As emoções que usualmente supomos serem características do homem podem ser peculiares para nós, não porque os animais sejam incapazes de possuí-las, mas porque suas condições geradoras raramente, ou nunca, surgem fora das sociedades humanas.

18.7 MEDICINA PSICOSSOMÁTICA

Definimos emoção como a associação entre certas mudanças amplas nos comportamentos operantes cm processo e a apresentação ou remoção dc reforçadores. Como uma relação abstrata entre eventos, a “emoção” , tal como o impulso, não pode causar nada — sentimentos, comportamentos ou mudanças fisiológicas. No entanto, as operações que dão origem a certos comportamentos emocionais, podem, se efetuadas frequentemente, provocar mudanças corporais patológicas agudas. Assim, uma emoção forte e prolongada pode ser correlacionada com hipertensão, bronquite asmática, úlcera gastrointestinal, dores de cabeça c outras doenças. Tem sido reconhecido, há algum tempo, que certas doenças tem suas origens cm situações dc tensão; isto c, situações cm que figuram estímulos aversivos fortes e/ou prolongados que fazem surgir comportamento emocional forte e prolongado. Os executivos são propensos a úlceras e certas doenças cardio-vasculare?. 0 surgimento da asma, c', algumas vezes, associado a um evento amedrontador na infância c pode ser subsequentemente instigado por cicunstân- cias moderadamente amedrontadoras. Em geral, a ansiedade crônica c quase sempre correlacionada com um número dc sintomas somáticos patológicos, desde a acne até o distúrbio gastrointestinal grave.

A medicina psicossomática se especializa no diagnóstico c tratamento de doenças que parecem resultar dos mesmos procedimentos que produzem certos comportamentos emocionais condicionados. A realidade das doenças psicossomáticas pode ser demonstrada de forma dramática em animais no laboratório, onde podem ser produzidas situações emocionais aversivas cujos efeitos são letais para o sujeito. Nos experimentos dc Brady, Porter, Conrad e Mason (1958), macacos foram treinados a evitar choques elétricos, através da pressão dc uma barra, emprcgando-sc um procedimento semelhante ao da esquiva dc Sidman visto no Diagrama 17.2. Os choques eram programados a cada 20 seg. e os macacos eram expostos ao procedimento por 6 horas consecutivas, após o que havia 6 h. dc descanso c, então, 6 h. de esquiva c assim por dainte, indefinidamente, dia após dia. Uma luz vermelha era correlacionada com as 6 h. do período dc esquiva.

O comportamento de esquiva típico gerado por esse procedimento é visto na Fig. 18-10. Note que poucos choques foram realmente administrados no período dc 6 h

- 4 2 5 -

Uma hora

1 igura 18-10. Uma porção da curva acumulada dc pressão à barra, mostrando o comportamento dc esquiva na 18a. sessão experimental consecutiva do procedimento de esquiva repetitiva com 6 h. dc* esquiva e 6 h. de descanso, üs choques são indicados por pequenos tiacos verticais nos rceislros (Bradv, Porter, Conrad, e Mason, 1958). ' *

de esquiva. Depois de poucas semanas, a morte inesperada de muitos dos sujeitos deu ao experimento uma parada abrupta. A autópsia revelou que os .animais haviam sucumbido por úlceras duodenais perfuradas. Quando esses resultados foram obtidos, eles sugeriam que o procedimento de esquiva poderia ter sido o agente causai na produção da úlcera e morte dos macacos. Mas outra possibilidade era de que a úlcera fosse um resultado dos efeitos dos choques elétricos recebidos, dia após dia, e que a contingência de esquiva fosse supérflua.

‘‘Para testar essa possibilidade, preparamos um experimento controlado , usando dois macacos em “cadeiras conjugadas'’; nas quais ambos os macacos recebiam choques mas somente um podia evitá-los. () macaco “executivo’' ou experimental poderia evitar os choques para si mesmo c para o outro através da pressão à barra. A barra do macaco dc controle era ineficaz. Assim, ambos os animais estavam sujeitos a mesma tensão ÍTsicci (i.c; ambos recebiam o mesmo número de choques ao mesmo tempo), mas apenas o macaco “executivo" estava sob a tensão psicológica de ter que pressionar a barra” (Brady, 1958).

— 426 —

Uma figura do aparelho err. que os dois animais ficavam por várias semanas durante o teste de esquiva é mostrada na ilustração da Parte Cinco ( p.335), o animal executivo emitia uma taxa alta dc resposta de esquiva durante os períodos de 6 h. dc esquiva c respondia pouco durante o período de 6h. de descanso. O macaco de controle, por outro lado, raramente pressionava a barra durante o período de esquiva ou de “descanso” , já que sua barra estava associada com a contingência nula. No experimento de controle conjugado, todavia, somente o animal executivo sucumbiu de úlceras.Os macacos dc controle, sacrificados no dia da morte dc seus pares “executivos”, não apresentaram qualquer produção dc úlcera, sugerindo assim que o fator letal eram realmente as contingências dc esquiva prolongada, e não o choquc em si. Estudos subsequentes indicaram que um fator crítico para a produção dc úlceras por esse método é a escolha de um ciclo dc 6 h de esquiva — descanso. Outros ciclos não produziram ulceração (Brady, 1958).

Do ponto de vista da presente análise do comportamento emocional, notamos que o animal executivo é o único dos dois que recebe um emparelhamento Pavloviano consistente. Apenas para ele, a não ocorrência de uma pressão à barra cm 20 seg (R20”) é suficiente para proporcionar uma situação (Sj) que c consistentcmcnte emparelhada com choques. Seu parceiro de controle, todavia, recebe choques ocasionais, mas esses nunca são consistcntcmentc emparelhados corn qualquer situação determinada (Sj) no seu ambiento. Portanto, o paradigma de ansiedade condicionada é preenchido apenas pelo macaco executivo.

18. 8 O SISTEMA NERVOSO AUTÔNOMO

Sir Charles Sherrington comentou que, das áreas onde a psicologia c a fisiologia se encontram, uma c a emoção. Ccrlamenle, nenhuma análise da emoção seria completa sem alguma descrição das grandes mudanças fisiológicas que ocorrem sob paradigmas Pavlovianos de emoção. Alguns psicólogos endossam o ponto de vista de que o território psicológico dos fenômenos emocionais e exaurido pela análise dos padrões reflexos c perturbações dc operantes que são produzidos pelos procedimentos que descrevemos nas seções anteriores. Tal ponto de visla pode ser tecnicamente correto, dependendo da definição pessoal de psicologia, mas impõe limites disciplinares arbitrários que não correspondem aos fenômenos naturais em si mesmos. Notamos em algum ponto, neste texto, que os limites entre as disciplinas científicas são quase sempre traçados de forma muito arbitrária e é óbvio que um cientista interessado nos fenômenos emocionais pode utilizar-se da análise comportamental, da fisiologia do reflexo, da endocrinologia, da neurofisiologia, assim como de outras disciplinas relacionadas. Numa abordagem introdutória à psicologia, nossa obrigação c descrever os principais efeitos comportamentais das várias mudanças ambientais. Mas não nos aprofundamos muito no assunto, notando apenas brevemente alguns dados ncuiotisio- lógicos que ajudam a pintar um quadro mais completo do fenômeno em discussão.

A noção de que cada emoção está associada a um padrão único dc respondentes autônomos aparece na passagem de William James citada anteriormente (p.407). Todavia, esses vários padrões podem frequentemente ser muito semelhantes e uma medida bem detalhada de muitos respondentes pode ser necessária para discernir suas diferenças (Ax, 1953). Em nossa discussão introdutória sobre os reflexos e o condicionamento Pavloviano simples, salientamos que os procedimentos Pavlovianos

- 427 -

OlhoGlândula lacrimalMembrana mucosa do nariz e palato

Glândula sub-maxilar Glândula sublingual Membrana mucosa da boca Glândula parótida

tsôtago

Lstômago

Vasos sanguíneos abdominais

Fígado

Pancreas

Intestino Delgado

' Intestino grosso

/ Reto

Glândula suprarenal

Rim

Bexiga

MedulaÓrgãos sexuais Genitália externa

I igura 18-11. O lado direito do sistema nervoso autonomo humano ( Kimblc e (iarmezy, 1963)

- 4 2 8 -

parecem mais apucavcis aqueles respondentes internos que são mediados por uma parte do sistema nervoso chamada sistema nervoso autônomo (“auto-regulador”) (SNA), representado diagramaticamcntc na Fig. 18-11. O SNA conduz impulsos elétricos do cérebro e medula para os órgãos viscerais, nunca ao contrário. O SNA se divide funcionalmente em duas partes. Uma é chamda o sistema simpático e é vista em linhas pontilhadas na Fig. 18-11. A outra, o parassimpático (para significa paralelo a), encontra-se anatomicamente acima c abaixo do simpático c é visto cm linhas cheias na Fig. 18-11.

Os fatos que se seguem são dc importância. Primeiro, os órgãos servidos pelo SNA são precisamente aqueles que, como já indicamos, produzem respondentes,condicionados c incondicionados. O respondeu te respirat ório, o respondents salivar e a taxa cardíaca são velhos amigos do condicionamento Pavloviano. Nos últimos cinqüenta anos, os pesquisadores russos mostraram meticulosamente que o funcionamento de quase todos os órgãos neste diagrama é suscetível aos procedimentos de condicionamento clássico. O SNA é tão iiHimamcnte ligado ao condicionamento Pavloviano que se poderia encará-lo como o aparelho anatômico para o condicionamento deste tipo.

Um segundo ponto de interesse é a diferença dc tunção servida pelas duas partes do SNA. Note que as fibras em linhas cheias (parassimpáticas) vem tipicamente dc origens únicas e vão diretamente para seus órgãos sem interconcxão ou interação. Hsse fato anatômico é refletido no fato fisiológico dc que partes diferentes do sistema parassimpático operam individualmente. As fibras simpáticas (pontilhadas), todavia, vão primeiro para uma cadeia de junção comum (a estrutura vertical longa, vista parlalcla ao lado direito da medula na Fig. 18-11), onde interagem antes de chegar até seus órgãos. F,stc fato anatômico é refletido por uma unidade do sistema simpático, tal que suas fibras afetam todos os órgãos dc uma vez.

Finalmente, podemos observar que cada órgão individual na Fig. 18-1 1 tem fibras tanto pontilhadas quanto cheias que chegam até ele e é assim sujeito a influências dc ambas as partes: simpática e parassimpática. Mas os efeitos dessas duas partes em cada órgão não são os mesmos. De fato, eles são tipicamente opostos. Isto se dá cm parte porque as duas partes liberam produtos químicos diferentes nos seus pontos terminais no órgão. O sistema simpático libera uma substância muito parecida com a adrenalina, enquanto os nervos parassimpáticos liberam uma substância diferente,chamada acctilco- lina. A Tabela 18-3 resume alguns efeitos principais das duas divisões do sistema autônomo.

Fm certa época, pensou-se que a ansiedade e medo eram eicitos principalmente simpáticos, enquanto a raiva era um efeito principalmente parassimpático. Acredita-se, agora, que o quadro é muito mais complexo e que o resultado de Iodas as operações emocionais c a produção de efeitos simpáticos e parassimpáticos. Quaisquer diferenças fisiológicas existentes entre as emoções devem ser devidas a padrões diicrentes de respondentes; isto e, a diferenças sutis na ação simpática e parassimpática. Fsses padrões de respondentes autônomos associados com o comportamento emocional constituem aquilo que é algumas vozes chamado de substrato autônomo das emoções.

- 4 2 9 -

Tabela 18-3

AÇÃO RESPONDENTE AUTÔNOMA (Segundo P. T. Young, 1961)

NERVOS ESTRUTURAS NERVOSSIMPÁTICOS SOMÁTICAS PARASSIMPÁTICOS

Dilata a pupila I ris Contrai a pupilaInibe a secreção (ilandulas salivares Facilita a secreçãoReflexo pilomotor CabeloAumenta a secreção Glândulas sudoríp irasContrai Artérias superficiaisAcelera Coração InibeDilata bronquíolos Pulmão Contrai bronquíolosSecreta glicose Fígado

Facilita a secreçãoInibe a secreção gástrica Estômagoe peristal tis mo gástrica e peristatismoContrai expelindo BaçoeritrócitosSecreta adrenalina Medula da suprarenalInibe a atividade Intestino delgado Facilita a atividadede músculos lisos dc músculos lisosContrai Artérias visceraisRelaxa músculos lisos Bexiga Contrai músculos lisos

para expelir

Relaxa músculos lisos Colo c Reto Contrai músculos lisos para expelir

Contrai, neutralizando Artérias dos órgãos Dilata, causando ereçãoa ereção sexuais externosContrai no orgasmo Vasos deferentesContrai no orgasmo Vesículas seminaisContrai no orgasmo Útero

Deve ser mencionado que um número de demonstrações mostra que a indução artificial do substrato respondente da emoção não produz tipicamente as outras propriedades comportamentais da emoção. Por exemplo, a injeção da droga adrenalina (que atua imitando a ativação simpática) em animais não dá origem às interrupções operantes características da ansiedade, cólera c alegria. Sujeitos humanos que recebem injeção dc adrenalina relatam uma emoção simulada: eles se sentem “como se” estivessem com raiva, “como se” estivessem alegres, “ como se” estivessem com medo, e assim sucessivamente. Uma demonstração realizada por Schactcr c Singer (1962) indica que esta indução artificial do substrato respondente do comportamento emocional influencia a sensibilidade do indivíduo a situações emocionais. Assim, estudantes universitários injetados com adrenalina apresentaram comportamentos mais fortes de raiva numa situação geradora de raiva,. mas também mostraram comportamentos mais eufóricos numa situação de alegria do que estudantes não injetados. Parece que a indução dc respondentes da emoção pode sensibilizar o organismo para as operações de emoção.

- 4 3 0 -

18 9 CONTROLE EMOCIONAL, MATURIDADE EMOCIONAL E COMPORTAMENTO EMOCIONAI PATOLÓGICO ____

Sc as cmoçocs envolvem comportamentos cliciados, então que lipo do autocontrole pode ser exercido sobre eles? Como nossos operantes estão sob o controle dr suas conseqüências c porque somos capa/es dc observar esse fato, somos inclinados a tradu/ir isto como um controle que “ nós'’ temos sobre eles Mas os respondentes não estão sob o controle dc suas conseqüências. Já notamos como os efeitos dc supressão c facilitação dos procedimentos emocionais frequentemente não se relacionam às conseqüências reforçadoras de tal forma que parecem não-adaptativos e inúteis. Mas os reflexos emocionais dc uma pessoa são frequentemente aversivos para outros indivíduos e para ela mesma e a sociedade civilizada exige algum controle sobre o comportamento emocional. A mudança usual nos padrões emocionais, da infância ate a fase adulta, c caracterizada por um aumento maior no controle do comportamento emocional, frequentemente, chamado dc maturidade emocional. Como ela c conseguida? Aparentemente, existem pelo menos três maneiras principais de se chegar a tal controlo.

Quando uma situação que produz comportamento emocional c repetidamente apresentada, a magnitude da resposta diminui com tempo. Este c o fenômeno conhecido‘como adaptação ou habituação, citado cm nossas discussões iniciais sobre o condicionamento operante. A introdução de um organismo numa situação nova frequentemente produz comportamento de medo: retrair-sc, imobilizar-sc, dcfecar, urinar, etc. Mas a introdução repetida do organismo nessa mesma situação resulta numa diminuição gradual dos efeitos. Diz-se que o indivíduo sc adaptou, ou se habituou à situação.

Na sociedade, um método importante de modificar o comportamento emocional é o de adaptá-lo. Um organismo sujeito ao procedimento dc extinção depois de um esquema de reforçamento intermitente não mostra a taxa dc resposta aumentada ou outras mudanças que chamamos de raiva. Depois que tal organismo tiver tido uma história de extinção após reforçamento intermitente, seu comportamento de raiva está ausente porque ele sc adaptou há muito tempo e, agora, dizemos que ele tem uma “alta tolerância à frustração” . Vemos efeitos análogos na conduta humana. As crianças choram c gritam quando seus brinquedos são removidos. Os adultos (usualmente) mostram reações mais moderadas. O adulto típico já teve uma longa história de perder coisas: teve alguns anos dc adaptação f*.s asperezas da extinção c reage correspondentemente menos. Frequentemente, falamos na superação de nossos medos, indicando que a sua habituação ocorrc no tempo ccrto. A adaptação não ó limitada a eventos aversivos, entretanto. Mesmo coisas boas da vida podem perder sua atração se nos tornamos “acostumados” a elas.

Uma segunda forma de controle ocorre quando disfarçamos nossos respondentes encobrindo-os com operantes opostos. Assim, diz-se a uma criança não deve chorar e lamuriar, embora ela possa “sentir” . Na sociedade ocidental, o homem deve reter as lágrimas, mas a mulher pode chorar. Comportamentos manifestos de medo são frequentemente repreendidos c somos induzidos a apresentar operantes que ocultem nossos medos. Sempre que somos advertidos para aguentar firmes, somos encorajados a contra-atacar, com um operante oposto, o respondente reflexo de csmorecimcnto que ocorre na “ fossa” . A facc “ inexpressiva” c uma habilidade necessária para o bom jogador de pôquer, mas não é provável que ocorra uma habituação suficiente para abolir completamente o substrato respondente inobservado gerado por uma seqüência

- 431 -

real de cinco cartas. Bssa sobrevivência de respondentes autônomos na ausência dc outros comportamentos (tal como a expressão facial) características da emoção é a base do detetor de mentiras que, na relidadc, c um detetor dc respondentes autônomos. Esse dispositivo consiste de um aparelho para medir a taxa cardíaca, a respiração, resistência da pele, tensão muscular c outros respondentes. Quando são feitas perguntas para um suspeito, suas respostas podem consistir dc operantes que mascaram qualquer reação emocional externa. Mas a mensuração de seus respondentes autônomos pode desmascará-lo se ele estiver “mentindo” , já que um homem que cometeu recentemente um crime, provavelmente, apresentará efeitos seletivos dc ansiedade para as palavras que descrevam as ccnas c os eventos do crime.

Uma terceira forma de controle sobre a emoção consiste da esquiva, de um lado, ou produção, dc outro, de situações que evocam o comportamento emocional. Quando evitamos um inimigo que provavelmente nos fará raiva, ou paramos de jogar golfe porque jogamos mal continuamente, ou quando vamos a um restaurante onde frequentemente temos uma boa refeição, evitamos ou produzimos certos reforçadores. Mas, como um subproduto, podemos tambem escapar dc, ou produzir alguns dos nossos próprios comportamentos emocionais. Nesse sentido, pode-se dizer que exercemos controle sobre nossas emoções.

H evidente, com esta consideração breve desses três métodos de controle emocional, que o nosso controle sobre os nossos respondentes emocionais carccc do grau de controle que temos sobre nossos braços, pernas ou cordas vocais. Talvez seja útil apreciar essa diferença na nossa educação das crianças c no nosso tratamento com outras pessoas.

A sociedade está repleta de situações geradoras de raiva e ansiedade. Desde a infância , encontramos proibições e conflitos, ameaças e frustrações. Algumas são caprichosas; outras parecem necessárias para a ocorrência ordenada das atividades humanas. A maioria dos indivíduos consegue sair dessa história com um repertório de habilidades para evitar eventos aversivos c produzir reforçadores positivos, o que c suficiente para manter a raiva e a ansiedade em níveis toleráveis. Mas alguns indivíduos, talvez porque suas histórias contenham uma quantidade incomum dc controle aversivo, ou talvez porque, geneticamente, são mais sensíveis a operações geradoras dc raiva ou ansiedade, não adquirem as habilidades suficientes para um ajustamento satisfatório às contingências da sociedade. Já discutimos os casos que caem no terreno da medicina psicossomática. Muitos outros indivíduos humanos demonstram efeitos drásticos dc operações de raiva c ansiedade prolongadas que não podem ser chamadas de doença no mesmo sentido que úlceras, hipertensão c asma. Uma ausência prolongada de situações geradoras dc elação pode tambem tet efeitos adversos, especialmente se o empobrecimento ocorre cedo na vida. As crianças que são criadas, desde o nascimento, cm instituições quase sempre recebem comida c cuidado suficientes para sua saúde geral, mas podem não receber a estimulação afetiva e o carinho que as outras crianças obtêm dos pais. Se falta esta estimulação afetiva durante os seis primeiros meses dc vida. esses bebês frequentemente se tornam crianças c adultos extremamente apáticos (Spitz, 1957). As crianças tornam-se abatidas, desinteressadas, mostram estupor, falta de apetite c desenvolvimento físico rctardado.Tais crianças parecem não ter a intensidade usual de comportamento de alegria, bem como dc medo e raiva. L:m resumo, todos os seus comportamentos emocionais parecem estar altamente atenuados. Algumas delas

- 4 3 2 -

nunca desenvolvem níveis normais dc reforçadores positivos e, assim, tem que ser mantidas cm instituições por toda a vida.

Existem vários outros estados comportamentais patológicos aos quais os homens são propensos c cujas causas são mais sutis e pobremente compreendidas. As pessoas que apresentam efeitos comportamentais dc ansiedade por longos períodos dc tempo nas situações complexas que surgem na sua vida cotidiana, são quase sempre chamadas “neuróticas” . O comportamento emocional prolongado do tipo denominado ansiedade constitui uma interferência marcante nos outros operantes e pode-se dizer que um neurótico é “desajustado” simplesmente porque, cm vez de se empenhar cm operantes que podem produzir reforçadores positivos, ele apresenta as supressões características da ansiedade. Se as supressões persistem por longos períodos, a eficiência do indivíduo nas atividades normais pode ser bastante reduzida. Outros indivíduos desenvolvem padrões de comportamento que são tão patológicos ou perigosos para a sociedade cm geral que essas pessoas tem que ser institucionalizadas, para sua própria segurança ou a da sociedade. Numa ampla classe de patologia do comportamento conhecido como psicose, os reforçadores positivos normais podem perder o seu valor ou inexistir de todo. Alguns psicóticos têm que ser mimados, outros não têm qualquer “interesse” em alguma coisa, outro relatam o aparecimento de situações que não estão de fato presentes (alucinações), outros mostram uma generalização de ansiedade para quase todas as situações, outros ainda apresentam em alta força comportamentos como assassinatos e violação, que estão ausentes no repertório civilizado típico. A reabilitação e cura de indivíduos que apresentam patologias de comportamento dessa magnitude são problemas sociais graves, embora as causas precisas da maioria de tais comportamentos permaneçam obscuras.

Durante a idade média, os comportamentos bizarros eram atribuidos a influencias do diabo e as pessoas que apresentavam tais comportamnetos eram queimadas como bruxas, encarceradas c sujeitas a outras brutalidades destinadas a exorcizar o diabo. A crueldade do homem para com seu semelhante é agora mais lúcida do que na história inicial do tratamento de indivíduos perturbados. Durante o século dezenove, surgiu uma atitude mais esclarecida. Os indivíduos que apresentavam patologias de comportamento passaram a ser encarados como “doentes” em vez de possessos. Em vez de presos, eles eram enviados a hospitais.

Os hospitais são um avanço significante em relação as prisões. Mas uma implicação significante pode ser retirada da psicologia moderna: as causas e curas dos comportamentos patologicos diferem muito das doenças organicas. Só muito recentemente, as patologias do comportamento passaram a ser encaradas como produtos de histórias incomuns de condicionamento. Como tal, suas curas exigem um tratamento comportamental e não médico. Foi o psiquiatra de Viena Sigmund Freud que reconheceu que as causas de certos comportamentos patológicos encontram-se na história passada remota do indivíduo. Alem disso Freud salientou que frequentemente, o indivíduo é incapaz de descrever os eventos críticos do passado que levam à patologia. Um aspecto importante do método psicoanalítico de Freud, assim, envolvia o fornecimento de SDs verbais para aumentar a probabilidade de o paciente relatar incidentes de seu passado que poderiam ter uma relação com o distúrbio atual. Para Freud, parecia óbvio que o tratamento consistisse parcialmente em fazer o próprio paciente saber qual era a sua história relevante. Tal ponto de vista tem relação com o que conhecemos sobre a extinção e adaptação de efeitos emocionais.

- 433 -

Não podemos pretender que tenhamos chegado a uma compreensão clara (le exatamente quais tipos de histórias levam a patologias diferentes e quais tipos de ação devem ser efetuadas para reeducar os indivíduos em padrões de vida mais reforçadores. Contudo, os princípios comportamentais básicos do tipo descrito neste livro serão seguramente úteis para ajudar a formar uma base experimental sólida para a psicologia clínica e a psiquatria. Isto porque, tal como a prática da medicina orgânica deriva-se das descobertas de processos químicos, bioquímicos e fisiológicos, fundamentais, assim também a prática da psicoterapia deriva-se das descobertas de processos comportamentais fundamentais.

18.10 UM INDICK DE MUDANÇA EMOCIONAL

Apresentamos, aqui, um método simples para medir a supressão ou facilitação da taxa de resposta operante devido ao emparelhamento de um S\ com um S+ ou S . 0 método consiste em se observar a taxa de resposta no período imediatamente antes de S\ ser ap resen tado e, en tão , com parar essa taxa com a taxa de resposta durante S\. Por exemplo, seSj dura 5 min, poderíamos medir convenientemente a taxa durante os 5 min imediatamente precedentes a Sj e comparar esta com a taxa durante o próprio Sj. Na Fig. 18-12, isto seria feito, comparando-se a taxa de a a b. com a taxa de b a c. Um índice adequado de interrupção comportamental durante Sj é

j _____ c — b______e (c — b) + {b — a)

onde Ie é definido como o índice de mudança emocional. Deve ficar claro que c-b é o número de repostas durante S\ e b-a o número de respostas num período de controle imediatamente antes de S\ e de duração igual a S j. Quando o responder durante S\ e o período de controle é igual (nenhum efeito de Si), então Ie - 0,5. Quando c-b < b-a, ocorreu supressão e o Ie encontra-se entre 0 e 0,5, dependendo de quão completa foi a supressão. No caso onde ocorre facilitação em Sj, c-b > b-a, então 1,0 < Ie >0,5. Evidentemente, Ie varia de 0 (supressão completa) a 1,0 (facilitação completa: inexistência de resposta no período de controle, todas as respostas em S]).

Tempo (minutos)Figura 18-12. O cálculo dc um índice de supressão.

- 4 3 4 -

Porque é dificil uma emoção como um padrão de comportamento particular?

EXERCÍCIO 11Discuta as similaridades e ediferenças entre motivação e emoção.

EXERCÍCIO 12Faça a notação do procedimento atribuído a Pliskoff na seção 18.5

REFERÊNCIAS PARA O CAPÍTULO 18Ax, A. F. The physiological differentiation between fear and anger in

humans. Psychosom. Med., 1953, 15, 433-442.Azrin, N. H., Hutchinson, R. R., and Hake, D. F. Extinction-induced

aggression. J. exp. Anal. Behav., 1966, 9, 191-204.Brady, J. V. Ulcers in executive monkeys. Sci. Amer., 1958, 199, 95

100.Brady, J. V. Motivation-emotional factors and intracranial self-stimula

tion. Chap. 30 in D. E. Sheer (E d .), Electrical stimulation of the brain. Austin: Univer. of Texas Press, 1961.

Brady, J. V. Psychophysiology of emotional behavior. Chap. 10 in A. J. Bachrach (E d .), Experimental foundations of clinical psychology. New York: Basic Books, 1962.

Brady, J. V., and Hunt, H. F. An experimental approach to the analysis of emotional behavior. J. Psychol., 1955, 40, 313-324.

Brady, J. V., Porter, R. W., Conrad, D. G., and Mason, J. W. Avoidance behavior and the development of gastroduodenal ulcers. J. exp. Anal. Behav., 1958, 1 ,69 -72 .

Cannon, W. B. The James-Lange theory of emotions: a critical examination and an alternative theory. Amer. J. Psychol., 1927, 39, 106124.

Darwin, C. The expression of the emotions in man and animals. London: Murray, 1872.

Estes, W. K., and Skinner, B. F. Some quantitative properties of anxiety.J. exp. Psychol., 1941, 29, 390-400.

Gates, G. S. An observational study of anger. J. exp. Psychol., 1926, 9, 325-336.

Herrnstein, R. J., and Morse, W. H. Some effects of response-independent positive reinforcement on maintained operant behavior. J. comp, physiol. Psychol., 1957, 50, 461-467.

Hoffman, H. S., and Fleshier, M. Stimulus factors in aversive controls: the generalization of conditioned suppression. J. exp. Anal. Behav., 1961 ,4 ,371-378.

EXERCÍCIO 10.

- 4 3 5 -

Hoffman, H. S., Fleshier, M., and Jensen, P. K. Stimulus aspects of aversive controls: the retention of conditioned suppression. J. exp. Anal. Behav., 1963, 6, 575-583.

Hunt, H. F., and Brady, J. V. Some effects of electro-convulsive shock on a conditioned emotional response (“anxiety” ). J. comp, physiol. Psychol., 1951, 44, 88-98.

James, W. Principles of psychology. Vol. II. New York: Holt, 1890.Kimble, G. A., and Garmezy, N. Principles of general psychology. (2nd

ed.) New York: Ronald, 1963.Landis, C., and Hunt, W. A. The startle pattern. New York: Farrar and

Rinehart, 1939.Leitenberg, H. Conditioned acceleration and conditioned suppression in

pigeons. J. exp. Anal. Behav., 1966, 9, 205-212.Masserman, J. Principles of dynamic psychiatry. Philadelphia: Saunders,

1946.Pliskoff, S. S. Rate change effects with equal potential reinforcements

during the “warning” stimulus. J. exp. Anal. Behav., 1963, 6, 557-562.

Plutchik, R. The emotions: facts, theories, and a new model. New York: Random House, 1962.

Schacter, S., and Singer, J. E. Cognitive, social, and physiological determinants of emotional state. Psychol. Rev., 1962, 69, 379-399.

Schoenfeld, W. N. An experimental approach to anxiety, escape, and avoidance behavior. Chap. 5 in P. Hoch and J. Zubin (E ds.), Anxiety. New York: Grune and Stratton, 1950.

Sidman, M. Normal sources of pathological behavior. Science, 1960, 132 ,61-68.

Spitz, R. A. No and yes. New York: International Univer. Press, 1957.Tolman, E. C. A behavioristic account of the emotions. Psychol. Rev.,

1923 ,30 ,217-227.Watson, J. B. Behaviorism, (rev. ed.) Chicago: Univer. of Chicago

Press, 1930.Young, P. T. Motivation and emotion. New York: Wiley, 1961.

- 4 3 6 -

T A B E L A DE P A R A D I G M A S C O M P O R T A M E N T A I S

T A B E L A DE P A R A D I G M A S C O M P O R T A M E N T A I S

Capítulo e Nome Dado Procedimento Processo Resultado

v2) Adaptação do reflexo

Um eliciador, S2 Apresentar S2 repetidamente R2, a resposta eliciada, diminui em magnitude, aumenta em latência, etc.

A força do reflexo é diminuida temporariamente

(3) Condicionamento Pavloviano

Dois eliciadores, Sj e S2

Emparelhar repetidamente S\ com S2

S\ passa a controlar uma nova resposta (CR) semelhante a Rj

Sj evoca seguramente a CR

(4) Fortalecimento operante

1. Um operante R com freqüência v 0

2. Um reforçador adequado

R S+ 1. Aumento na taxa de R para um novo valor estável2. R incorpora-se a um eio de comportamento3. A variabilidade topográfica de R diminui

(5) Extinção Operante

Uma R anteriormente fortalecida

R --------- /------------------- 1. Diminuição de R2. Desintegração da cadeia de

comportamento3. Aumento na variabilidade

da forma e magnitude de R

Os processos comportamentais aproximam-se do estado de nível operante

(8) Diferenciação Uma classe de comportamento com força v 0

0 reforçamento é aplicado para um conjunto de variantes dentro da classe, 0 resto é submetido à extinção

1. Fortalecimento das variantes reforçadas

2. Enfraquecimento daquelas variantes que passaram por extinção

As variantes reforçadas apresentam-se com uma força alta

(10) Discriminação 1. Uma classe de resposta

2. Duas condições de estímulo

Reforçar a R numa das condições de estímulo (S^) e extinguir a R na outra condição de estímulo (S)

A força da resposta em e S gradualmente se diferencia, ocorrendo um processo de extinção prolongada em S

0 organismo passa a responder em e não em S

(13) Disposição para aprender

Contingências de discriminação adequadas

Apresentar uma série de problemas relacionados de discriminação

Os processos de discriminação do indivíduo mudam gradualmente de lentos e graduais para súbitos e abruptos

Discriminações novas, mas relacionadas, são resolvidas com eficiência máxima

T A B E L A DE P A R A D I G M A S C O M P O R T A M E N T A I S - CONTINUAÇÃO

Capítulo e Nome Dado Procedimento Processo Resultado

(15) Saciação 1. Uma R previamente fortalecida

2. Organismo privado de uma classe de reforçadores

R S+ Taxa constante de R seguida por uma cessação abrupta do responder

0 reforçador perde temporariamente o seu valor reforçador

(17) Condicionamento de tuga

Um estímulo aversivo, S”

Permitir que uma R termines -

A força de R aumenta S” controla a ocorrência de R

(18) Frustração Uma contingência de reforçamento contínuo

Extinção abrupta Aumento no valor reforçador da destruição e dano.A probabilidade de comportamento agressivo aumenta.

Adaptação, ao choque elétrico, 414 de emoções, 431, 432

Adquiridos, drives, 377—381 Adquiridos, reforçadores, 227

força de, 256 Adrenalina, na emoção, 430 Adulteração de alimento com quinino, 358 Agressão, 417, 418Alegria; 410 ver também Elação, Paradigma de,Algoritmo, 267 ,318—319Alimento, privação de atividade geral, 361Alma, 2 4 -2 5 , 26Alucinações, 433Ambiente, 126Animais em experimentos de psicologia, 201—202

habilidades para formar conceitos, 284—288,299 Animais, espíritos, 24 Ansiedade, paradigma de, 412—416

superposto ao comportamento de esquiva, 415, 416 Antropomorfismo, 27 Aparelhagem, balão para o estômago, 367

barra de deslocamento de resposta, 167caixa de obstáculo de Columbia, 355caixa quebra-cabeça, 28caixa de Skinner com barra, 32, 78caixa do vai-e-vem, 391câmara para pombo, 110,121de desenhar com espelho, 175estabilímetro, 362 -364para o estudo do vício, 380Labirinto, 251Labirinto em T para o estudo de fuga, 284máquina de ensinar, 300pista de correr, 154plataforma de saltar, 211de puxar o cordão, para macacos, 213roda de atividade, 178, 362Wisconsin general test, 274

Aproximação-esquiva, conflito de, 424—425

Aproximação sucessiva, 169,170no treinamento discriminativo, 248 do comportamento de razão fixa, 171

Aritmético, solução de problema, 265—267 Assíntota, de uma função, definida, 69

do processo de discriminação, 209 Atenção, como comportamento de observação encoberto, 237

como reforçador condicionado, 342 como reforçador generalizado, 235

Atividade geral, 361,364 ciclos sexuais e, 363 espontânea, 361—365 no estabilímetro, 362—363 nível operante de, 361, 363—365 padrão e privação de alimento, 364 privação de alimento sobre, 361 roda de, 362

para estudo de esquiva, 393 Auto-estimulação do cérebro, 371 Aversivos, estímulos, 383, 384

condicionados, 390-398 incondicionados, 384

Beber, periodicidades no, 345, 346 Brincar como reforçador, 373 Cadeias de comportamento

adição de membros resposta,a, 248, 250 e o andar, 257-259desempenho de passagens musicais como, 259e desenvolvimento de sentença, 262elementos de, 245elocução gramatical como, 263encoberta, 267—269extinção seletiva aplicada às, 252 -254heterogêneas (definidas), 252homogêneas (definidas), 255em labirintos, 251—252ligações (definidas), 245linguagem, 260—263membros (definidos), 245processos no desenvolvimento de, 247-248

ramificadas, 263 resolução em, 245—247 de respostas vocais, 250, 260—263 rompimento devido a S^s atrasados, 261 e saciação, 347na solução de problema, 312—321

Caixa do vai-e-vem, 341 Causa do comportamento, 23

anedótica, 27 nos casos patológicos, 433 concepções medievais de, 24 emoção como, 405—407, 424 extinção como, 114 fictícia, 339 futuro como, 392histórias de condicionamento passado, 340—341, 433 motivos, 342 variáveis de privação, 343

Causa e efeito, na Ciência, 337, 338 seqüência de, na emoção, 407

Cerebrais, lesões,e impulso para alimento, 358 e supressão condicionada, 414, 416

Cérebro (diagrama). 360 Choque elétrico

intensidade e taxa de fuga, 386-388 redução parcial de, 388—390 S" no treinamento de fuga, 384

Choque eletroconvulsivo, 416 Coeficiente de correlação, 330Comer, mecanismos fisiológicos no, 367 periodicidade no, 345 Comportamento

agressivo, 416—418 categorias de Aristóteles, 24 emocional, 405 encoberto, 237 instrumental, 28operante de observação, 148 —449 predição e controle do, 31 reflexo, 25

supressão de, 358-400 , 434 topografia de, 86—87

Comportamento de esperar, 176—178 Comportamento de esquiva,

aquisição de, 392-398 efeitos do paradigma de ansiedade sobre, 416 de respondentes emocionais, 431 sem estímulo de aviso, 396—298 e ulceração, 425-427

Comportamento instrumental, 27—29, 77 Comportamento de observação, 148-149 Comportamento proposital, 75—77 Comportamento respondente,

definição genérica de, 160 eliciação de, 41—42

Comportamento social, 239—242 Compreensão; ver Significado Conceito

aquisição de, 273e aquisição de discriminação, 282—283 conjuntivo, 292como controle por relações de estímulo, 281 disjuntivo, 288—291 de força do reforçador, 359 impulso, 343—344, 358 de pessoa, 288de propriedades conjuntivas, 292-293 relacionai, 279de rotação anti-horária, 287,288 estrutura hierárquica de, 295

Conceito, formação de; ver Conceito, aquisição de Conceitos

ensinados nas escolas, 301 de impulso, 359 interdisciplinares, 366—367 nas leis científicas, 39, 43 simples vs. compostos, 297 de transformação, 306

Condicionamentocomparação entre o Pavloviano e o operante, 97 fuga, 384-388

Pavloviano, das emoçòes, 410na ansiedade experimental, 4 12 -414 nas emoções mistas, 424 tempo, 63—64 usando S", 390 -392

Condicionamento clássico; ver Condicionamento Pavloviano Condicionamento retroativo, 64 Condicionamento Pavloviano, 53—59

na ansiedade experimental, 412—416 das emoções, 65—66 nas emoções mistas, 410—411 intefvalo S\ — S2 ótimo no, 63 procedimentos de emparelhamento no, 62—64 relações temporais no, 62—64 substituição de estímulo no, 57, 64—66 no treinamento de reforçamento secundário, 238

Condicionamento respondente; ver Condicionamento Pavloviano Condicionamento de retardo, 64 Condicionamento salivar, 53—56 Condicionamento temporal, 63—64

Condicionamento de traço, 63 Condicionamento verbal, 92—94 Conflito

de aproximação-esquiva, 424—425 de motivos, 365

Constâncias perceptivas, 305—308 Constructo hipotético

força do reflexo, 42—43 Contingências comportamentais, 127 ver também Esquemas de

Reforçamento agrupadas, 141 — 142 na aquisição de significado, 295 -296 aversivas na sociedade, 432 em cadeias, 245como causas do comportamento, 342discriminação, 139, 210na disposição para aprender, 274duração de, 133-134escolha de acordo com o modelo, 286filogenéticas, 307-308 , 364, 406, 420—421

fuga, 385funcionais, 140—141 imitativas, 240—241 múltiplas, 130-132 negativas, 137—138 nulas, 132probabilísticas, 138-139 punição, 398—402 ramificadas, 263—267 repetitivas, 135—136

Contingência de reforçamento contínuo (crf), 79 supersticiosa, 94

Continuidade de comportamento, 159,178 Contrações no estômago, papel no comer, 367 Contraste de brilho, 187—188 Controlado, experimento, 66 -68 Controle do ambiente

por estímulos não relacionados, 291 sobre operantes, 185

Controle do comportamento; ver Causas do Comportamento;Controle do Ambiente

Controle, das emoções, 431—434 experimental, 66

SD ; ver Discriminação Correlação

coeficiente de, 330 grau vs. forma de, 327—328

Covariância, de medidas motivacionais, 359 Culpa, 424Curiosidade, comportamento de, 372 Curva Normal, 51—52 Curvas de respostas acumuladas

construção de, 80 empilhadas, 145

Definição, como uma estrutura de significado, 296—297 Deixas Verbais, 259 Delineamento de grupo, 104—106 Detetor de mentira, 431 Desvio padrão, 223

Diferenças individuais, 247na solução de problema humano, 324-325

Diferenciação, 164-180da força do responder, 164-165, 169 progressiva; ver Aproximação sucessiva

Discriminação, baseada em reforçadores intrínsecos, 355 baseada no reforçamento condicionado, 234 classificada por complexidade, 206 contingências de, 210 de formas, 286 índice de, 208luz-escuro, sob a água, 353-355de odor, 209 -210como uma operação de teste, 265processo de na formação da, 274—278sem erro, 217-219social, 241

Discriminativo, operante, 220Discriminativo, tempo de reação, 219-220Dispersão de medidas; ver Variabilidade nas medidasDisposição para aprender; - L - SET 274—278

relação com experimentos de formação de conceitos emsujeitos humanos, 282singularidade, 279variáveis que afetam a aquisição de, 278

Distribuição de freqüência relativa, cálculo de, 4 8 -52 Drive ver Impulso e o paradigma de elação, 418—420 Drogas, e comportamento emocional, 430—431

efeitos sobre o comportamento, 156 e nível de tolerância ao choque, 390 vício, 380-381

Dualismo, 24Durabilidade de reforçadores condicionados, 229-233 Elação, 418—421 Hiciador, 37 Emoções, 405

mistas, 422-425 primárias, 422

Emparelhamento simultâneo de estímulo, 62 Enfraquecimento do comportamento; ver Extinção

Escolha de acordo com o modelo, 286—288 Escolha de matiz, em animais, 287 Esquecimento, 1Q8—112 Esquemas encadeados, 255—257 Esquemas de reforçamento,

condicionado, 233 descrição teórica dos, 180 encadeados, 255—257 intervalo fixo (IF), 144—147 intervalo randômico (IR), 147 intervalo variável (IV) 149

como linha-base para o estudo da emoção, 412—413 com S“, 286probabilidade uniforme, 149-151

no estabelecimento de reforçadores condicionados poderosos, 230-231 de operantes RF, 172-173 razão fixa (RF); ver Operante de Razão fixa no treinamento de discriminação, 206-207 e variabilidade da resposta, 155

Esquiva condicionada, 392—398 Estabilímetro, 362—363Estados estáveis; 155-157 ver também Linhas-base

de intensidade do choque, 390—392 Estados fisiológicos

da emoção, 407 Estampagem, 377—380Estimulação cerebral como reforçador, 370—371 Estimulação intracraniana, 370—371, 420 Estímulo, 185

aversivo, 383condicionado, 390-398 incondicionado, 383—384

concepção de Descartes, 24 controle, nos conceitos, 282—283 definição de, 126 dimensões, 185-190 discriminativo, 205

habilidade para reforçar, 228—229 privado, 407—409

eliciador, 40-41 generalização, 190—201gradiente; ver também Generalização da Extinção

gradiente, 192-196; intensidade, nas emoções, 421—423 luminoso, 185—188 neutro, 59novo, como reforçador, 372—373 redescoberta de Whytt, 25 redundância, 239reforçador; ver Reforçadores; Reforçamento similaridade, 190, 199—201 sonoro, 189—190 substituição, 57—58

Estímulos sonoros, 189—190 Estratégias de procura de herursticaExperiência anterior, 374—376 sobre o desenvolvimento emocional posterior, 432 Experimental, método, 66—70 Experimento, definido, 69 Experimento conjugado, 427 Experimento do macaco executivo , 335 ,425—427 Explicação, ver também Causas do comportamento

causai, 41—42 concepção de Pavlov, 26 proposital, 392—393 teleológica, 392—393 vazia, 41

Expressão das emoções, 406 Extinção, 149

aplicada a elementos de cadeias, 252—255 como uma causa do comportamento, 340—341 do choro da criança, 112—114 definição de, 112 efeitos emocionais na, 99 e esquecimento, 100—112 generalização de, 197—198 latencia, 254—255mudanças na taxa de resposta durante, 100 mudanças topográficas em, 101 — 102 processo de, 99

punição durante, 398—400 recuperação espontânea da, 106 resistência à, 102-106, 116-119

esforço da resposta e, 104 quantidade de reforçamento e, 104

de respostas emocionais patológicas, 433 numa tentativa, 107ao testar a generalização de estímulo, 192

ao testar o poder de estímulos aversivos condicionados, 392 nos testes de reforçamento secundário, 228—229 variabilidade do comportamento na, 101—102

Extinção latente, 254—255 Fatores fisiológicos,

no beber, 369 no comer, 367—369

Feedback, 261Feedback auditivo com atraso, 261Fome, 344Fonema, 90, 96—97Força do comportamento, 115Freqüência, distribuição de, 48—52Freqüência, polígono de, 49—50Frustração

adaptação à, 431 paradigma de, 416

Fuga, de S" condicionado, 396—397 treinamento, 384-389

General Problem Solver, 320-321 Generalização; ver também Estímulo, generalização de

de extinção, 197—199 gradiente de, 190—196, 218 da supressão condicionada, 321—323

Habliidades; na solução de problemas,Habituação; ver AdaptaçãoHipótálamo, papel do, no comportamento de comer, 368 Histograma, 4 9 -5 0

de taxas de resposta em S^ e S, 222 Ilusão de Müller-Lyer, 187-188 Imitação, 240-241Implantação de elétrodo no cérebro, 368

Impulsosadquiridos, 377—381 para atividade, 371 comparação das forças de, 355—356 conceito de, 343-344 , 359 como direcionador do comportamento, 364—365 como energia, 361—365 e fatores fisiológicos, 366-371 mensuração de, 248—360

Inanição em ratos, 351—352 Incentivo, 365—366 índice

do desempenho discriminativo, 208 do rompimento emocional, 434

índice de supressão, 434 Indução; ver Resposta, indução de Informação

fornecida por estímulos discriminativos, 324-327 na identificação de conceito, 321

Insight, na solução de problema, 314 Instrução programada, 80—83t., 298—305

máquinas de ensinar, 300 quadros na, 300como um veículo para o ensino de conceitos, 302—305

Inteligência, 323-327 , 330-331 e idade, 324-325 mensuração de, 331 quociente de, 325 -326

L-set. ver Disposição para aprender Labirinto

comportamento de fuga em 384 reforçadores exploratórios em, 372

Latênciade respondentes, 38, 40 de respostas condicionadas, 61

Lei do condicionamento, de Pavlov, 25 Lei do efeito, 28, 33, 88 Lei do limiar, 40 Lei do menor esforço, 169, 401

Leisconceitos nas, 39 do estímulo-respostas, 25 generalidade científicas das, 39 limitações científicas, das, 342 do reflexo, 40como relações funcionais, 337—339 uso científico, 337-338

Lesõse; ver Cerebrais, lesões Limiar, 210

de respondentes, 38,40 Linguagem

como cadeias, 261 —263 nas interrelações de conceito, 296 problemas gerais para a psicologia e, 260

Linha-base; ver também Estados estáveis Para o estudo da emoção, 412 Linhas-base comportamentais, 156—157 Líquido •

privação de e resistência à saciação, 349-351 Luz como um estímulo aversivo, 387 Luz, reforçamento com, 373 Mãe substituta, 374 Masoquismo, 402Média, de uma distribuição de freqüência, 49 Mediana de uma distribuição de freqüência, 49 Medicina psicossomática, 425—427 Medidas

confiabilidade de, 331 de impulso, 349 -360 de supressão comportamental, 434 validade de, 331-332

Medo, 410t., 429, 331-332 Medo condicionado, 412—416 Moda de uma distribuição de freqüência, 49 Modelo, dos fenômenos emocionais, 421

hidráulico de Descartes, 24 Morfina, efeito sobre o nível de tolerância ao choque, 390

vício experimental de, 380—381

Motivação, 337distinguida da emoção, 412 fatores fisiológicos na, 366-371

Motivos de comportamento, 342 Necessidade, 352—353 Neurose, 433Nível operante, mensuração do, 79 Notação diagramática de fluxo, 265—266 Notação diagramática de fluxo de computador, 265—266 Olho, comparado a uma câmara, 186, 187, 188 Opção, para produzir estímulos discriminativos, 236 Operações de impulso, adrenalectomia, 358—359

pré-alimentação, 351-352 privação, 343—344

de alimento, 352, 356 de água, 341 de ar, 354e reforçadores líquidos, 344 saciação, 344

Operante; ver também Resposta comportamento, 77condicionamento; 95—96 ver também fortalecimento operante controle de estímulo, 220—221 definição genérica de, 162—163 fortalecimento, 75—98

como causa do comportamento, 340—341 com S', 385estereotipia do comportamento; ver também mudanças de variabilidade leis do, 87mudanças de variabilidade no, 86—87 paradigma, 89 processo, 90por reforçamento condicionado, 229

métodos para criar, 170de ordem superior, 170-173, 177de pequena escala, 173—175razão fixa (RF), 170-173, 177, 230-232relação com operações de computador, 265rompimento na emoção, 410

Parâmetros, definidos, 118—119do reforçamento negativo, 385

Patológicos, fenômenos emocionais, 433 Pausa após o reforçamento, IF, 144—147

RF, 171, 172Pensamento, como solução de problema encoberta, 267—269 Perceptivas, constâncias, 305—308

cor neutra, 306 forma, 305—306 tamanho, 306—308

Periodicidades no valor do reforçamento, 344—346 Pista de correr, 154Potencial muscular na imaginação, 267—269Pré-alimentação, como uma operação de impulso, 351—352Preferência, experimento de, 358—359Privação, operações de, 343—344Privação de exploração visual, 373Probabilidade de reforçamento, 70—72Problema, como um conjunto de contingências de discriminação, 274

definição de, 285, 311—312 Problemas de singularidade, 279 Procedimento de razão progressiva, 357 Procedimento de titulação; ver Choque elétrico Processos comportamentais, 56

definição de, 70 Processo de ensino, como interação social, 242 Processos mentais, 3 0 -3 2 Propriedades ondulatórias da luz, 186 Proprioceptores, 189

no encadeamento, 275 Psicofísica, 30 Psicologia, definição de, 37 Psicologia fisiológica, 366

e o estudo da emoção, 427 técnicas em, 368-371

Psicose, 433 Psicoterapia, 433 -434 Punição, 398—402

como um auxílio para a aquisição de compostamentos alternativos, 401 nas instituições educacionais, 401 como um SD, 403

Quantidade de reforçamento comparada com o período sem choque, 389Quebra-cabeça, caixa de, 27—29Quebra-cabeças, 315—318Como reforçadores para macacos, 318Raiva, 416—418Raiva condicionada, 418Rastreamento, 215-217Receptores, 185Recompensas token, 233—234Recuperação espontânea da extinção, 106Reflexo condicionado, 25—26, 55

comparado com o reflexo incondicionado, 6 0 -6 2 como um princípio explicativo, 37 de segunda ordem, 61—62

contribuição de Pavlov, 25 fadiga do, 41 incondicionado, 3 7 -4 5

comparado com o condicionado, 60—62 padrões, na emoção, 409—410 de segurar, 375 relações, 38

Reforçadores adquiridos, 227água, e estados da boca, 369

e centros hipotalâmicos, 369 e fatores celulares, 369

alimento, e contrações do estômago, 367 e centros hipotalâmicos, 367 e glicose no sangue, 367

atividade, 371 ausência de normais, 433 condicionados, 227

negativos, 237—239 contato corporal, 432 contato físico, 373—376 definição de, 88 estimulação cerebral, 370 exploração, 372 força de, 341-342 , 348 -360

na emoção, 412 sexuais e atividade geral, 363 periodicidades na, 344—346

generalizados, 234—235, 342 incondicionados, 227 intrínsecos, 371-375 luz e escuro, 372 morfina, 380—381 negativos, 383

terminação de, 422 t. como eliciadores, 390

por objeto estampado, 377—380 primários, 227, 342, 344—345 qualidade e quantidade, 365—366 secundários, 227 terminação de, 422 t. valor; ver Reforçador, força de

Reforçadores exploratórios, 372 Reforçadores generalizados, 234—235 Reforçador negativo condicionado, 390—392 Reforçadores negativos, 383

terminação de, 422 Reforçamento; ver também Diferenciação

circularidade do, 88—89 de comportamento contínuo, 178—179 condicionado e choque elétrico, 403 contingência; ver Contingência comportamental crf, 143, 149-150 definição de, 488 -489 generalização de, 199 intermitente, 143 não contingente, 418—419 de taxas de resposta, 152, 176—178, 418—419 social, 239—242de sons humanos e animais, 90—92

Reforçamento diferencial de taxas altas (drh) 178 Reforçamento diferencial de taxas baixas (drl), 176,178 Reforçamento seletivo; ver Diferenciação Registrador cumulativo, 80—83 Relações funcionais, 337 -339 Repertório, comportamental, inicial, 312-313

como habilidades na solução de problema, 264—265

Repertório comportamental, de respostas de linguagem, 298 Representação gráfica tridimensional, 117 Resistência à extinção de operantes RF, 173

após reforçamento de probabilidade uniforme, 155 após IV, 153

Resistência à saciação, 349—351 Respondentes autônomos, 407—427

na emoção, 406—407 ocultos por operantes, 431—432

Resposta, classe*, definição de, 159—164 condicionada, 56—58 denominação de cor, 186 diferenciação, 164—180 dimensões, 160—162 emitida, 79força, 206, 255-256 , 350 indução, 175 de observação, 235—237 operante, 33, 87 ,124—126 probabilidade, 33, 114—116 reflexa, 25 respondente, 37 taxas de, 33

mudanças na relativa, 84—85 variabilidade, após um esquema IV, 155

após um esquema de probabilidade unif orme, 156 variantes, distribuição de reforçadas, 167

Respostas de observaççao, 235—237 Retenção, de comportamentos verbais ver Esquecimento

de supressão condicionada, 414 Ruído, como um estímulo aversivo, 387 Ruído branco, 189 Saciação, 344

curvas de, 348de reforçadores intrínsecos, 373 resistência à, 349—351

Sadismo, 398 SD, 206 SA ,2 0 6Secreções psíquicas; ver Condicionamento salivar

Sede, 344, 368-369Sensibilização de respostas emocionais, 431 Sentenças, como cadeias de comportamento, 262 Sentimentos, como eventos internos, 407—409 Sidman, procedimento de, 397—398 Significado, como comportamento interconceitual, 291—298

de taxas de resposta, 348-349 Significância estatística, 225 Sílabas sem sentido, 109—111 Similaridade; ver Estímulo, similaridadeSimulação de computador na solução de problemas humanos, 320—321Sistema de coordenada retangular, 66—67Sistema nervoso autônomo, 65, 427—430Sistema parassimpático do SNA, 429Sistema simpático do SNA, 429Solução de problema, como cadeias ramificadas, 263—267

definição de soluções em 317—318 testes de, 323—324

Solução salina, como reforçador para o rato adrenalectomizado, 359 Somação temporal, 42 Sono, efeito sobre o esquecimento, 111

periodicidades no, 346 Sucessivos, extinção e recondicionamento, 107—108 Superstição, 94—95Supressão condicionada, retenção da, 414, 415,416 Tempo de reação, assintótico, 219—220

para o aparecimento de reforçadores negativos, 385 em experimentos de labirinto, 251—252 na pista de correr, 154

Tentativa e erro, responder por, 312—314 Teoria dos conjuntos, 163-164, 180-183, 292 Teoria da evolução, 27 Teorias, da emoção, 405—407Testes estatísticos, de diferenças entre duas médias, 221—225 Texto programado, 301 Time-out, de estimulação aversiva, 388—389

como punição, 402 Tonalidade, 198Topografia do comportamento, 161

Transformações de conceitos disjuntivos, 290 Valor de reforçamento; ver Reforçador, força de Variabilidade nas medidas, 45—52

após o fortalecimento operante, 86—87 na extinção, 102

Variável composta, 209 Variável dependente, definição de, 66—67

taxa de resposta como, 33 Variável independente, definição de, 66—67 Variáveis intervenientes; ver Variável composta Vício, 380-381Wisconsin general test apparatus, 214, 274 Zeitgeist, 29—30

5) millenson, j. r. (1967). princípios de análise do comportamento [pag 23-35]

Documents