temario completo a pec3b1alva

102
PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA. 1 ESQUEMAS DE LA ASIGNATURA “PSICOLOGÍA DEL APRENDIZAJE”. CURSO 1º DEL GRADO DE PSICOLOGÍA DE LA UNED. AUTORA: ALICIA PEÑALVA VÉLEZ. PROFESORA TUTORA DEL CENTRO ASOCIADO DE LA UNED EN TUDELA (NAVARRA). NOTA IMPORTANTE: Estos esquemas han sido realizados por la profesora en base a la información presentada en el libro de texto de la asignatura. Son resúmenes que sirven de orientación al alumnado para el estudio de la asignatura. En ningún caso sustituyen a los temas desarrollados en el libro. Para su elaboración se ha consultado así mismo los resúmenes de la asignatura que se pueden encontrar en el link: psicologiauned.com

Upload: albamia

Post on 22-Oct-2015

34 views

Category:

Documents


1 download

TRANSCRIPT

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

1

ESQUEMAS DE LA ASIGNATURA

“PSICOLOGÍA DEL APRENDIZAJE”.

CURSO 1º DEL GRADO DE PSICOLOGÍA DE LA UNED.

AUTORA:

ALICIA PEÑALVA VÉLEZ.

PROFESORA TUTORA DEL CENTRO ASOCIADO DE LA

UNED EN TUDELA (NAVARRA).

NOTA IMPORTANTE:

Estos esquemas han sido realizados por la profesora en base a la información presentada

en el libro de texto de la asignatura. Son resúmenes que sirven de orientación al

alumnado para el estudio de la asignatura. En ningún caso sustituyen a los temas

desarrollados en el libro. Para su elaboración se ha consultado así mismo los resúmenes

de la asignatura que se pueden encontrar en el link: psicologiauned.com

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

2

CAPÍTULO 1.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

3

PSICOLOGÍA DEL APRENDIZAJE.

CAPÍTULO 1: INTRODUCCIÓN.

INTRODUCCIÓN.

Las personas siempre se han interesado por entender la conducta, ya sea la propia o

la de los demás.

Cualquier esfuerzo sistemático para entender la conducta debe tomar en

consideración qué aprendemos y cómo lo aprendemos.

El aprendizaje es uno de los procesos biológicos que facilitan la adaptación al

ambiente.

Normalmente, pensamos que el aprendizaje conlleva la adquisición de nuevas

conductas. Pero el aprendizaje también puede consistir en la disminución o pérdida

de una respuesta.

Aprender a no ejecutar determinadas respuestas es tan importante como aprender a

realizar respuestas, o quizá más.

Cuando consideramos el aprendizaje, tenemos tendencia a pensar en formas de

aprendizaje que requieren un entrenamiento especial. Sin embargo, también

aprendemos todo tipo de cosas en el curso de nueStra interacción rutinaria con

nuestro ambiente social y físico sin un profesor experto o un entrenador.

Gran parte de la investigación descrita en este libro pertenece a la tradición

conductista, que trata de analizar e! comportamiento en términos de estímulos

antecedentes y consecuentes.

La reflexión y el razonamiento conscientes quedan deliberadamente fuera del

análisis conductual. Se da mayor importancia al aprendizaje procedimental de

carácter automático, que no requiere conciencia, que al aprendizaje de tipo

declarativo, más accesible a la conciencia.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

4

1. ANTECEDENTES HISTÓRICOS.

Las aproximaciones teóricas al estudio del aprendizaje tienen sus raíces en la

filosofía de René Descartes. Antes de Descartes, se pensaba que e! comportamiento

humano estaba enteramente determinado por la intención consciente y por el libre

albedrío.

No se consideraba que las acciones de las personas pudieran estar controladas por

estímulos externos o por las leyes naturales. Se suponía que lo que una persona

hacía era el resultado de su voluntad o de su intención deliberada.

Descartes fue la excepción a esta interpretación de la naturaleza humana, ya que

reconoció que muchas de las cosas que hacen las personas son respuestas

automáticas a estímulos externos.

Sin embargo, no estaba preparado para abandonar por completo la idea del libre

albedrío y del control consciente. Por tanto, formuló una visión dualista del

comportamiento humano conocida como dualismo cartesiano.

De acuerdo con el dualismo cartesiano, existen dos tipos de conducra humana:

voluntaria e involuntaria.

Descartes propuso que la conducta involuntaria consiste en respuestas automáticas a

los estímulos externos y está mediada por un mecanismo especial denominado

reflejo.

La conducta voluntaria, por el contrario, no requiere de la intervención de estímulos

externos, sino que se debe a la voluntad consciente de actuar de una determinada

forma.

El dualismo mente-cuerpo introducido por Descartes dio lugar a dos tradiciones

intelectuales: una, el mentalismo, se ocupaba de los contenidos y funcionamiento de

la mente; la otra, la refIexología, del mecanismo de la conducta involuntaria.

Estas dos tradiciones intelectuales constituyen la base del estudio del aprendizaje

moderno.

1.1 DESARROLLO HISTÓRICO DEL ESTUDIO DE LA MENTE.

NATIVISMO. (contenido de la mente) Concepción de la mente según la cual nacemos

con ideas innatas acerca de ciertas cosas. DESCARTES. (funcionamiento de la

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

5

mente) la mente no funciona de forma predecible y ordenada, de acuerdo con reglas

estrictas o leyes que se puedan identificar. Descartes distingue entre conductas

voluntarias e involuntarias, y afirma que la conducta voluntaria está controlada por

la mente.

EMPIRISMO. (contenido de la mente) LOCKE: todas las ideas de las personas son

aprendidas directa o indirectamente a través de experiencias posteriores al

nacimiento. El ser humano nace sin ninguna idea preconcebida acerca del mundo.

(funcionamiento de la mente) HOBBES: al contrario que Descartes cree que la

mente al igual que los reflejos, opera de forma predecible y conforme a leyes.

propone que la conducta voluntaria está gobernada por el principio del

HEDONISMO (las personas tratan de lograr el placer y evitar el dolor; la conducta

está controlada por las consecuencias positivas y negativas). EL CONCEPTO DE

ASOCIACIÓN, es otro aspecto importante del funcionamiento de la mente, ya que

se asume que todas las ideas tienen su origen en experiencias sensoriales.

1.2 DESARROLLO HISTÓRICO DEL ESTUDIO DE LOS REFLEJOS.

Al formular el concepto de reflejo, Descartes hizo una contribución significativa a

la comprensión de la conducta. La idea básica de que la conducta puede ser el

reflejo de un estímulo desencadenante permanece como un importante pilar de la

teoría del comportamiento.

Sin embargo, Descartes se equivocaba en sus ideas acerca de los detalles del acto

reflejo. Creía que los mensajes sensoriales que iban de los órganos de los sentidos al

LEYES DE LA ASOCIACIÓN.

LEYES PRIMARIAS: contigüidad, similitud y

contraste.

LEYES SECUNDARIAS: intensidad, frecuencia y

recencia.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

6

cerebro y los mensajes motores que iban del cerebro a los músculos viajaban por

los mismos nervios.

Descartes y la mayor parte de los filósofos posteriores asumieron que los reflejos

eran responsables únicamente de reacciones sencillas a estímulos externos.

En el siglo XIX los procesos fisiológicos responsables de los reflejos se

comprendieron mejor y el reflejo pasó a aplicarse a la explicación de un mayor

rango de componamienros. Dos fisiólogos rusos, Sechenov (1829-1905) y Pavlov

(1849-1936), fueron los principales responsables de esros avances.

De acuerdo con Sechenov, la conducta volumaria y los pensamientos están en

realidad elicitados por estímulos débiles y apenas visibles. Las ideas de Sechenov

acerca de la conducta voluntaria extendieron enormemente el uso de mecanismos

reflejos para dar cuenta de una gran variedad de aspectos del comportamiento.

Sechenov no tomó en consideración que la conducta de los organismos no permanecía fija e invariable a lo largo de su vida, sino que podía verse alterada por

la experiencia.

Pavlov demostró experimentalmente que no todos los reflejos son innatos. Mediante

mecanismos asociativos se pueden establecer nuevos reflejos para los estímulos.

Gran parte de la teoría moderna de la conducta se ha construido sobre el concepto

de reflejo estímulo-respuesta, o unidad E-R, y el concepto de asociación.

Las unidades E-R y las asociaciones continúan teniendo una función destacada en la

teoría conductual contemporánea.

2. EL AMANECER DE UNA NUEVA ERA.

Los estudios experimentales sobre los principios básicos de aprendizaje se realizan

frecuentemente con animales no humanos y dentro de la tradición reflexológica. La

investigación del aprendizaje animal comenzó a tomar vigor hace algo más de 100

años. Esta investigación recibió su impulso principalmente de tres fuentes.

(1) el interés por la cognición comparada y la evolución de la mente. (2) el interés

por el funcionamiento del sistema nervioso (neurología funcional). (3) el interés por

desarrollar modelos animales de la conducta humana.

La cognición comparada, la neurología funcional y los modelos animales de la

conducta humana continúan dominando la investigación actual en aprendizaje.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

7

2.1 LA COGNICIÓN COMPARADA Y LA EVOLUCIÓN DE LA

INTELIGENCIA.

El interés por la cognición comparada y por la evolución de la mente surgió como

consecuencia de los escritos de Charles Darwin, que llevó las ideas de Descartes

sobre la naturaleza humana un pasó más allá.

Descartes había empezado a socavar la antigua idea según la cual los seres humanos

ocupaban un lugar único y privilegiado en el reino animal, proponiendo que al

menos algunos aspectos del comportamiento humano (los reflejos) eran similares a

los de los animales. Sin embargo, Descartes había mantenido ciertos privilegios a

los seres humanos al asumir que los humanos (y sólo los humanos) poseían mente.

2.2 NEUROLOGÍA FUNCIONAL.

La nueva era en el estudio de los procesos de aprendizaje fue también en gran

medida producto de los esfuerzos por utilizar los estudios de aprendizaje animal

como medio para estudiar el funcionamiento del sistema nervioso.

Esta línea de investigación fue iniciada por el fisiólogo ruso Ivan Pavlov, con cierta

independencia de los trabajos de Darwin, Romanes y otros estudiosos de la

cognición comparada.

Siendo estudiante de medicina, Pavlov se comprometió con el principio del

nervismo. De acuerdo con el nervismo, las principales funciones fisiológicas están

gobernadas por el sistema nervioso.

2.3 MODELOS ANIMALES DE LA CONDUCTA HUMANA.

La tercera fuente de esta nueva era en el estudio del ;1prendizaje animal fue la

creencia según la cual la investigación con animales podría proporcionar

información útil para la comprensión del comportamiento humano. Los modelos

animales de conducta humana tienen un origen más reciente que la cognición

comparada o la neurología funcional.

2.4 MODELOS ANIMALES Y ROBÓTICA.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

8

3. DEFINICIÓN DE APRENDIZAJE.

El aprendizaje es una experiencia humana tan común que las personas rara vez

reflexionan sobre lo que realmente significa decir que se ha aprendido algo. No

existe una definición de aprendizaje universalmente aceptada.

El aprendizaje es un cambio duradero en los mecanismos de conducta que implica

estímulos y/o respuestas específicas y que es resultado de la experiencia previa con

esos estímulos y respuestas con otros similares.

3.1 LA DISTINCIÓN ENTRE APRENDIZAJE Y EJECUCIÓN.

¿Cuál es la razón para definir el aprendizaje partiendo de un cambio en los

mecanismos de la conducta? La principal razón es que el comportamiento está

determinado por muchos otros factores distintos del aprendizaje.

La ejecución se refiere a las acciones de un organismo en un momento concreto. La

ejecución está determinada por la oportunidad, la motivación y las capacidades

sensoriales y motoras, además del aprendizaje. Esto significa por lo tanto, que un

cambio en la actuación no puede ser automáticamente considerado como una

manifestación de aprendizaje.

3.2 EL APRENDIZAJE Y OTRAS FUENTES DE CAMBIO CONDUCTUAL.

Existen varios mecanismos que dan lugar a cambios en la conducta que son

excesivamente breves como para ser considerados como ejemplos de aprendizaje.

La fatiga, cambios en las condiciones estimulares, alteraciones del estado

fisiológico o motivacional del organismo, la maduración…

3.3 DIFERENTES TIPOS DE MECANISMOS CAUSALES.

Al discutir los mecanismos causales, es importante tener en mente qué tipo de causa

nos concierne. Killeen (2001) ha alentado a los psicólogos del aprendizaje a pensar

en función de los cuatro tipos de causas descritos por Aristóteles: causa eficiente,

causa material, causa formal y causa final.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

9

4. ASPECTOS METODOLÓGICOS DEL ESTUDIO DEL APRENDIZAJE.

La investigación sobre los procesos de aprendizaje se caracteriza por dos rasgos

metodológicos principales.

(1) Uno de estos es una consecuencia directa de la definición de aprendizaje y

requiere el uso de métodos de investigación experimentales, en lugar de métodos

observacionales. Los fenómenos del aprendizaje no pueden investigarse sin una

metodología experimental.

(2) El segundo rasgo metodológico -la confianza en una perspectiva de proceso

general- es más una cuestión de preferencia que de necesidad.

4.1 EL APRENDIZAJE COMO CIENCIA EXPERIMENTAL.

Los estudios sobre el aprendizaje hacen hincapié en identificar los factores causales

responsables de los cambios persistentes en la conducta que resultan de la

experiencia previa.

De los cuatro tipos de causas, los investigadores del aprendizaje han centrado su

atención en las causas eficientes, materiales y formales.

Independientemente del tipo de causa, este énfasis prescribe que las investigaciones

de aprendizaje utilicen una metodología experimental. Las causas no pueden

observarse directamente. Tan solo pueden ser inferidas a partir de los resultados de

las manipulaciones experimentales.

4.2 LA PERSPECTIVA DE PROCESO GENERAL EN EL ESTUDIO DEL

APRENDIZAJE.

El segundo rasgo metodológico destacable de los estudios de aprendizaje es una

perspectiva basada en procesos generales. Ésta es más una cuestión de preferencia

que de necesidad. Sin embargo, al adoptar una perspectiva de proceso general, los

investigadores del aprendizaje animal siguen una antigua tradición científica.

A. ELEMENTOS DE LA PERSPECTIVA DEL PROCESO GENERAL.

Un presupuesto fundamental de la perspectiva de proceso general es que los

fenómenos estudiados son el resultado de procesos más elementales. Además, se

asume que esos procesos elementales operan de forma similar independientemente

de dónde se encuentren.

Los investigadores del condicionamiento y el aprendizaje se han adherido a la

perspectiva de proceso general desde los comienzos de esta área de estudio en

psicología. Se han centrado en los aspectos comunes de los diversos tipos de

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

10

aprendizaje y han asumido que los fenómenos de aprendizaje son producto de

procesos elementales que operan de forma similar en diversas situaciones de

aprendizaje.

B. IMPLICACIONES METODOLÓGICAS DE LA PERSPECTIVA DEL

PROCESO GENERAL.

Si asumimos que existen principios universales de aprendizaje, entonces

deberíamos ser capaces de descubrir esos principios en cualquier situación en la que

el aprendizaje tenga lugar. Por tanto, una importante implicación metodológica de

la perspectiva de proceso general es que se pueden descubrir los principios del

aprendizaje estudiando cualquier especie o sistema de respuesta que muestre

aprendizaje.

C. DEMOSTRACIÓN DE LA GENERALIDAD DE LOS FENÓMENOS DE

APRENDIZAJE.

La verificación empírica de la existencia de tales mecanismos comunes en diversas

situaciones sigue siendo necesaria para construir una explicación verdaderamente

general del aprendizaje.

Una teoría general del aprendizaje no puede verificarse empíricamente utilizando

sólo unos pocos paradigmas experimentales estandarizados. La generalidad del

aprendizaje debe probarse realizando estudios en distintas especies y situaciones.

5. USO DE ANIMALES NO HUMANOS EN LA INVESTIGACIÓN SOBRE

APRENDIZAJE.

5.1 RAZONES DEL USO DE ANIMALES NO HUMANOS EN LA

INVESTIGACIÓN SOBRE APRENDIZAJE.

5.2 LOS ANIMALES DE LABORATORIO Y LA CONDUCTA NORMAL.

5.3 EL DEBATE PÚBLICO SOBRE LA INVESTIGACIÓN CON ANIMALES

NO HUMANOS.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

11

CAPÍTULO 2

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

1

PSICOLOGÍA DEL APRENDIZAJE.

CAPÍTULO 2: CONDUCTA ELICITADA, HABITUACIÓN

Y SENSIBILIZACIÓN.

IDEAS CLAVE

Gran parte de la conducta tiene lugar como respuesta a los estímulos; es decir,

ocurre de forma elicitada.

La forma más sencilla de conducta elicitada es la conducta refleja.

Un reflejo conlleva dos elementos íntimamente relacionados, un estímulo elicitante

y su correspondiente respuesta.

En los vertebrados (incluidos los seres humanos) los reflejos simples suelen estar

mediados por tres neuronas:

- una neurona sensorial (también llamada neurona aferente) que transmite el

mensaje sensorial a la médula espinal.

- El impulso neuronal que se transmite a la neurona motora (también llamada

neurona eferente) que activa el músculo involucrado en la respuesta refleja.

- Las neuronas sensorial y motora rara vez se comunican directamente. Los

impulsos que se dirigen de una a otra pasan al menos por una interneurona.

El conjunto formado por la neurona aferente, la interneurona y la neurona eferente

constituye el arco reflejo.

En los vertebrados, el arco reflejo representa el número mínimo de conexiones

neuronales necesarias para que tenga lugar el acto reflejo.

A las secuencias de respuestas típicas de especies particulares, se las denomina

pautas de acción modal o PAMs

El estímulo responsable de una pauta de acción modal puede ser más difícil de

aislar si la respuesta tiene lugar en el curso de interacciones sociales complejas.

Los rasgos específicos que se requieren para elicitar la conducta de picoteo reciben

colectivamente el nombre de estímulo señal o estímulo desencadenante.

Toda conducta motivada, o dirigida a metas, ya sea buscar comida, defender el

territorio o alimentar a los vástagos, involucra secuencias de acciones

sistemáticameme organizadas. Los etólogos denominaron conducta apetitiva a los

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

2

primeros componentes de la secuencia de comportamiento y conducta consumatoria

a los últimos.

En general, las respuestas consumatorias son altamente estereotipadas, conductas

específicas de cada especie que tienen estímulos e1icitantes o desencadenantes

específicos.

Las conductas apetitivas son menos estereotipadas y pueden tomar formas muy

diversas, dependiendo de la situación.

Las respuestas consumatorias tienden a ser pautas de acción modal específicas de la

especie. Las conductas apetitivas, por el contrario, son más variables dependiendo

del entorno.

Las disminuciones de la tendencia a responder producidas por la estimulación

repetida reciben el nombre técnico de efecto de habituación. Los incrementos de la

tendencia a responder se llaman efecto de sensibilización.

Los efectos de habituación y sensibilización son dos tipos básicos de cambios

conductuales que resultan de la experiencia previa.

Habituación: La principal característica del efecto de habituación es una

disminución en la respuesta inicialmente elicitada por un estímulo.

En un reflejo existen tres componentes: un estímulo que activa un órgano sensorial,

la transmisión de los mensajes sensoriales a los nervios motores, los impulsos

nerviosos que activan los músculos dando lugar a la respuesta observable. Según

esto hay varias razones por las que una respuesta elicitada puede no ocurrir:

- Adaptación sensorial: pérdida temporal de la sensibilidad de los órganos

sensoriales, disminución de la sensibilidad (no es habituación).

- Fatiga: incapacidad de los músculos involucrados para realizar la conducta o

respuesta al estímulo.

La adaptación sensorial y la fatiga impiden la respuesta a nivel de los órganos

sensoriales y de los músculos, sin la intervención del sistema nervioso. Por tanto,

pueden distinguirse de la habituación.

Las características de la habituación y la sensibilización no son uniformes en todas

las especies, pero hay muchos aspectos comunes:

- El curso temporal: de la sensibilización y de la habituación (recuperación

espontánea).

- La especificidad del estímulo: en la habituación (generalización del estímulo de

la habituación) y en la sensibilización.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

3

- El efecto de un estímulo externo intenso (deshabituación).

Los estímulos también pueden provocar emociones complejas, por lo que los

conceptos de habituación y sensibilización también se aplican a cambios en

emociones más complejas, y a varios tipos de conducta motivada.

La teoría del proceso oponente de la motivación se diseñó para explicar los tres

rasgos característicos de las emociones:

- Las reacciones emocionales son bifásicas.

- La reacción primaria se debilita con la estimulación repetida.

- El debilitamiento de la reacción primaria va acompañado por un fortalecimiento

del postefecto.

1. LA NATURALEZA DE LA CONDUCTA ELICITADA.

1.1 EL CONCEPTO DE REFLEJO.

Un reflejo conlleva dos elementos íntimamente relacionados, un estímulo elicitante

y su correspondiente respuesta. La presentación del estímulo va seguida de la

respuesta, y la respuesta rara vez tiene lugar en ausencia del estímulo.

La especificidad de la relación entre un estímulo y su respuesta refleja es una

consecuencia de la organización del sistema nervioso. En los vertebrados (incluidos

los seres humanos) los reflejos simples suelen estar mediados por tres neuronas:

(1) El estímulo ambiental de un reflejo activa una neurona sensorial (también

llamada neurona aferente) que transmite el mensaje sensorial a la médula espinal.

(2) Allí el impulso neuronal se transmite a la neurona motora (también llamada

neurona eferente) que activa el músculo involucrado en la respuesta refleja. (3) Sin

embargo las neuronas sensorial y motora rara vez se comunican directamente. Los

impulsos que se dirigen de una a otra pasan al menos por una interneurona.

El conjunto formado por la neurona aferente, la interneurona y la neurona eferente

constituye el arco reflejo.

En los vertebrados el arco reflejo representa el número mínimo de conexiones

neuronales necesarias para que tenga lugar el acto reflejo, pero pueden verse

involucradas estructuras neuronales adicionales.

1.2 PAUTAS DE ACCIÓN MODAL.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

4

Las respuestas reflejas simples, tales como la contracción de la pupila ante una luz

brillante o la respuesta de sobresalto ante un sonido fuerte y repentino, pueden verse

en muchas especies. Por el contrario, otras formas de conducta elicitada tienen lugar

únicamente en una especie o en un grupo reducido de especies relacionadas.

A las secuencias de respuestas típicas de especies particulares, tales como las que

aparecen en la alimentación de las crías, se las denomina pautas de acción modal o

PAMs (Baerends, 1988).

Se han identificado pautas de acción modal específicas de cada especie en muchos

aspectos de la conducta animal, incluidos el comportamiento sexual, la defensa del

territorio, la agresión y la captura de presas.

Una característica importante de la pautas de acción modal es que el umbral de

estimulación necesario para que éstas se pongan en marcha varía en función de las

circunstancias

1.3 ESTIMULOS ELICITANTES DE LAS PAUTAS DE ACCIÓN MODAL

Los estímulos elicitantes pueden identificarse fácilmente cuando se trata de reflejos

simples, como la respuesta de sobresalto ante un ruido fuerte. El estímulo

responsable de una pauta de acción modal puede ser más difícil de aislar si la

respuesta tiene lugar en el curso de interacciones sociales complejas.

Los rasgos específicos que se requieren por ejemplo para e1icitar la conducta de

picoteo reciben colectivamente el nombre de estímulo señal o estímulo

desencadenante.

Un estimulo señalo desencadenante es suficiente para elicitar una pauta de acción

modal. Sin embargo, una determinada pauta de acción puede estar controlada por

varios rasgos de! Estímulo de forma aditiva.

Además, el estímulo que elicita con mayor efectividad la pauta de acción no tiene

por qué ser el que ocurra con mayor probabilidad en condiciones naturales.

1.4 LA ORGANIZACIÓN SECUENCIAL DE LA CONDUCTA

Las respuestas no tienen lugar aisladas unas de otras. Más bien, las acciones

individuales se organizan en secuencias de comportamiento funcionalmente

efectivas.

Toda conducta motivada, dirigida a metas, ya sea buscar comida, encontrar una

pareja potencial, defender el territorio alimentar a los vástagos, involucra secuencias

de acciones sistemáticamente organizadas. Los etólogos denominaron conducta

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

5

apetitiva a los primeros componentes de la secuencia de comportamiento y

conducta consumatoria a los últimos.

las respuestas consumatorias son acciones que concluyen una secuencia de

respuestas típica de una especie. Por el contrario, las respuestas apetitivas tienen

lugar en las primeras fases de la secuencia de conducta y sirven para poner al

organismo en contacto con los estímulos que desencadenan la conducta

consumatoria.

Las respuestas consumatorias tienden a ser pautas de acción modal específicas de la

especie. Las conductas apetitivas, por el contrario, son más variables dependiendo

del entorno.

La organización secuencial de las conductas que tienen lugar en condiciones

naturales es muy importante para los científicos interesados en entender cómo el

comportamiento se ve alterado por el aprendizaje, ya que los fenómenos de

aprendizaje dependen a menudo de qué componente de la secuencia de conducta se

ve modificado.

2. EFECTOS DE LA ESTIMULACIÓN REPETIDA.

Un supuesto común es que una respuesta elicitada -en concreto, una respuesta

refleja simple- ocurre automáticamente de la misma forma siempre que se presenta

el estímulo elicitante. Esto es exactamente lo que pensaba Descartes.

Pero contrariamente a los presupuestos de Descartes, la conducta elicitada no es

inmutable. Uno de los rasgos más característicos de la conducta elicitada es su

plasticidad.

2.1 ATENCIÓN VISUAL EN LOS BEBÉS HUMANOS.

Los bebés humanos tienen que aprender muchas cosas sobre el mundo, y una forma

de obtener información es observar las cosas del enromo. Las claves visuales

elicitan una respuesta de observación, que puede medirse por el tiempo que los

bebés mantienen sus ojos en un objeto antes de mirar a otra parte.

2.2 SALIVACIÓN Y EVALUACIÓN DEL SABOR EN HUMANOS.

El sabor de la comida e1icita la salivación como respuesta refleja. Esto puede

observarse tan claramente en las personas como en los perros de Pavlov.

2.3 RESPUESTA DE SOBRESALTO EN RATAS.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

6

La respuesta de sobresalto es una respuesta defensiva que aparece en muchas

especies incluida la humana. Si alguien hace sonar una bocina a nuestra espalda, es

probable que mostremos una respuesta de sobresalto. Consiste en un salto repentino

y una contracción de los músculos de la parte superior del cuerpo, con frecuencia

acompañado de una elevación de los hombros.

3. LOS CONCEPTOS DE HABITUACIÓN Y SENSIBILIZACIÓN.

Los estudios descritos en la sección previa muestran que la presentación repetida de

un estímulo elicitante puede provocar tamo disminuciones como incrementos en la

respuesta.

Las disminuciones de la tendencia a responder producidas por la estimulación

repetida reciben el nombre técnico de efecto de habituación. Los incrementos de la

tendencia a responder se llaman efecto de sensibilización.

Los efectos de habituación y sensibilización son dos tipos básicos de cambios

conductuales que resultan de la experiencia previa. Son rasgos tan fundamentales

del ajuste de los organismos al entorno que tienen lugar en todas las especies y en

todos los sistemas de respuesta.

Los efectos de habituación y sensibilización pueden ocurrir en cualquier situación

que conlleve la exposición repetida a un estímulo.

3.1 ADAPTABILIDAD Y GENERALIDAD DE LA HABITUACIÓN Y LA

SENSIBILIZACIÓN.

Los fenómenos de habituación y sensibilización son el producto final de procesos

que ayudan a organizar y focalizar la conducta en el caótico mundo de estimulos en

el que los organismos viven.

3.2 DIFERENCIAS ENTRE HABITUACIÓN, ADAPTACIÓN SENSORIAL Y

FATIGA.

La principal característica del efecto de habituación es una disminución en la

respuesta inicialmente elicitada por un estímulo.

La habituación no es el único efecto que da lugar a una disminución en la respuesta.

Para entender otras fuentes alternativas de disminuciones en la respuesta, volvamos

al concepto de reflejo. Un reflejo consta de tres componentes. Primero, un estímulo

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

7

activa uno de los órganos sensoriales, como los ojos o los oídos. Esto genera

impulsos neuronales que se envían al sistema nervioso central (médula espinal y

cerebro). El segundo componente es la transmisión de los mensajes sensoriales a los

nervios motores a través de las interneuronas. Tercero, los impulsos nerviosos de

los nervios motores activan los músculos dando lugar a la respuesta observable.

Dados estos tres componentes de un reflejo, existen varias razones por las cuales

una respuesta elicitada puede no ocurrir.

(1) Las disminuciones en la sensibilidad reciben el nombre de adaptación sensorial,

que es distinta de la habituación. (2) La respuesta tampoco tendrá lugar si los

músculos involucrados quedan incapacitados por la fatiga. La adaptación sensorial

y la fatiga impiden la respuesta a nivel de los órganos sensoriales y de los músculos,

sin la intervención del sistema nervioso. Por tanto, pueden distinguirse de la

habituación.

Se asume que la habituación y la sensibilización conllevan cambios

neurofisiológicos que dificultan o facilitan la transmisión de los impulsos

neuronales desde las neuronas sensoriales a las motoras.

En los estudios sobre habituación, la adaptación sensorial puede descartarse ya que

existe evidencia de que la habituación es específica de la respuesta. La fatiga

también puede descartarse como causa de la habituación por medio de evidencia

que muestra que la habituación es específica del estímulo. Una respuesta habituada

se recupera rápidamente cuando se introduce un estímulo novedoso.

3.3 TEORÍA DEL PROCESO DUAL DE LA HABITUACIÓN Y LA

SENSIBILIZACIÓN.

Los efectos de habituación y sensibilización son cambios en la conducta o en la

ejecución. Se trata de la manifestación o el resultado conductual observable de la

presentación de los estímulos. ¿Cuáles son los factores responsables de tales

cambios?

La teoría del proceso dual propuesta por Groves yThompson (1970) continúa siendo

la principal teoría sobre la habituación y la sensibilización.

La teoría del proceso dual presupone que los incrementos y disminuciones en la

tendencia a responder a un estímulo son producto de procesos neurales diferentes.

Uno de estos procesos neurales el proceso de habituación, provoca una disminución

en la tendencia a responder. Otro, el proceso de sensibilización, produce un

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

8

incremento en la tendencia a responder. Estos procesos no son mutuamente

excluyentes. Ambos pueden estar activos al mismo tiempo. El resultado conductual

de estos procesos subyacentes depende de qué proceso sea más fuerte.

4. CARACTERÍSTICAS DE LA HABITUACIÓN Y LA SENSIBILIZACIÓN.

Aunque las características de la habituación y la sensibilización no son

perfectamente uniformes en todas las especies y sistemas de respuesta, hay muchos

aspectos comunes.

4.1 CURSO TEMPORAL.

CURSO TEMPORAL DE LA SENSIBILIZACIÓN. El incremento en la tendencia

a responder tiene normalmente una vida corta. En todos los sistemas de respuesta la

duración de los efectos de sensibilización está determinada por la intensidad del

estímulo. Los estímulos más intensos producen mayores incrementos en la

tendencia a responder y una sensibilización más persistente.

CURSO TEMPORAL DE LA HABITUACIÓN. La persistencia de la habituación

también es variable. Hay dos tipos de efecto de habituación cualitativamente

distintos: la habituación a corto plazo se parece a la mayoría de los casos de

sensibilización en que se disipa relativamente rápido -en segundos o minutos-; ek

otro tipo, la habituación a largo plazo persiste durante muchos días.

4.2 ESPECIFICIDAD DEL ESTÍMULO.

ESPECIFICIDAD DEL ESTÍMULO EN LA HABITUACIÓN. La habituación es

específica del estímulo que ha sido presentado repetidamente (Thompson y

Spencer, 1966). Una respuesta a un estímulo previamente habituada puede

manifestarse plenamente alterando alguna característica importante del estímulo.

ESPECIFICIDAD DEL ESTÍMULO EN LA SENSIBILIZACIÓN. A diferencia de

la habituación, la sensibilización no es muy específica del estímulo. Si un animal se

activa o sensibiliza por alguna razón, su reactividad se incrementará para toda una

variedad de estímulos.

4.3 EFECTO DE UN ESTÍMULO EXTERNO INTENSO

Como ya se ha señalado, un cambio en la naturaleza del estímulo elicitante puede

dar lugar a la recuperación de una respuesta habituada. Sin embargo, ésta no es la

única forma de restablecer rápidamente la respuesta tras la habituación.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

9

La respuesta habituada también puede restablecerse sensibilizando al organismo

con la exposición a un estímulo externo. Este fenómeno recibe el nombre de

deshabituación.

Es importante tener presente que la deshabituación hace referencia a la recuperación

de la respuesta al estímulo previamente habituado.

5. APLICACIÓN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA.

La exposición de los cambios producidos por la repetición de un estímulo elicitante

se ha limitado hasta ahora a respuestas relativamente sencillas. Los estimulas

también pueden provocar emociones complejas, tales como amor, miedo, euforia,

terror o satisfacción.

Ya hemos descrito la habituación de una respuesta emocional debida a la

presentación repetida de un sabor (Figura 2.8), pero los conceptos de habituación y

sensibilización también se han aplicado a cambios en emociones más complejas

(Hoffman y Solomon, 1974; Solomon y Corbit, 1974) y a varios tipos de conducta

motivada, como la alimentación, la ingestión de líquido, la exploración,

la agresión, el cortejo y la conducta sexual (McSweeney y Swindell, 1999), así

como a la adicción a las drogas

5.1 REACCIONES EMOCIONALES Y SUS EFECTOS POSTERIORES.

En su revisión de ejemplos de respuestas emocionales a varios estímulos,

incluyendo drogas, Solomon y Corbit (1974) destacaron dos rasgos llamativos:

(1) Primero, las reacciones emocionales intensas a menudo constan de dos fases.

Una emoción tiene lugar durante la presentación del estímulo elicitante, y la opuesta

se observa cuando el estímulo desaparece. (2) Otra característica común de las

reacciones emocionales es que cambian con la experiencia. La reacción primaria se

hace más débil y su post efecto se hace más fuerte.

5.2 LA TEORÍA DEL PROCESO OPONENTE.

Los ejemplos anteriores ilustran tres características comunes de las reacciones

emocionales:

(1) Las reacciones emocionales son bifásicas; a una reacción primaria sigue un post

efecto opuesto. (2) La reacción primaria se debilita con la estimulación repetida. (3)

El debilitamiento de la reacción primaria va acompañado por un fortalecimiento del

post efecto.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

10

La teoría del Proceso oponente de la motivacidn (Solomon y Corbit, 1973, 1974) se

diseñó para explicar estos tres rasgos característicos de las emociones.

La teoría del proceso oponente asume que los mecanismos neurofisiológicos

involucrados en la conducta emocional tratan de mantener la estabilidad emocional.

Así pues, la teoría del proceso oponente es una teoría homeostática. Se basa en la

premisa de que una función importante de los mecanismos que controlan la

conducta emocional es minimizar las desviaciones con respecto a la neutralidad o

estabilidad emocional.

La teoría del proceso oponente asume que la presentación de un estímulo emocional

activador elicita inicialmente lo que se denomina el proceso primario, o proceso a,

que es el responsable de la naturaleza del estado emocional (por ejemplo, felicidad)

que tiene lugar en presencia del estímulo. El proceso primario o a elicita a su vez un

proceso oponente, o proceso b, que genera la reacción emocional opuesta.

Los procesos primario y oponente son mecanismos internos cuyos efectos son los

cambios emocionales observados.

Un presupuesto adicional básico para la teoría del proceso oponente es que el

proceso oponente es ligeramente ineficiente. Al principio permanece a la zaga de la

alteración emocional primaria y, por tanto, no es lo suficientemente fuerte para

compensar por completo la emoción primaria. Sin embargo, el proceso oponente se

hace más rápido y potente con la práctica o con la experiencia repetida con el

estímulo que activa la emoción.

MECANISMOS OPONENTES DURANTE LA EXPOSICIÓN INICIAL AL

ESTÍMULO. Cuando el estímulo se presenta por primera vez, el proceso a tiene

lugar sin la oposición del proceso b. Esto permite que la reacción emocional

primaria alcance su nivel más alto. Después se activa el proceso b y comienza a

oponerse al proceso a.

MECANISMOS OPONENTES TRAS LA EXPOSICIÓN PROLONGADA AL

ESTÍMULO. Un estímulo familiar no elicita reacciones emocionales fuertes, pero el

post efecto afectivo tiende a ser más fuerte cuando termina un estímulo familiar. La

teoría del proceso oponente explica este resultado asumiendo que el proceso b se

fortalece con la exposición prolongada al estímulo.

MOTIVACIÓN Y POSTEFECTO OPONENTE. Hay dos formas de reducir los

post efectos oponentes aversivos de las drogas. Una de ellas es esperar el tiempo

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

11

necesario para que se disipen -lo que se conoce como "pasar el mono"-. Para los

consumidores habituales de droga, el "mono" puede durar mucho tiempo y puede

ser muy duro. El post efecto oponente puede reducirse mucho más rápidamente

tomando de nuevo la droga. Esto reactivará el proceso primario y acabará con la

agonía de la abstinencia.

5.3 VARIACIONES EN LA CONDUCTA DIRIGIDA A METAS.

Responder para escapar de la molestia producida por la retirada de un estímulo es

sólo uno de los tipos de conducta motivada o dirigida a metas. Un objeto meta

gratificante recibe el nombre técnico de reforzador.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

12

CAPÍTULO 3.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

13

ESQUEMA-RESUMEN TEMA 3. ESQUEMA BÁSICO DEL CONDICIONAMIENTO CLÁSICO

ESTÍMULO CONDICIONAL (E.C)

Sonido de campana

ESTÍMULO INCONDICIONAL (E.I)

Comida

RESPUESTA CONDICIONAL (R.C)

Salivación asociada al sonido

RESPUESTA INCONDICIONAL (R.I)

salivación

Estímulos y respuestas cuyas propiedades

aparecen sólo tras el entrenamiento.

Estímulos y respuestas cuyas propiedades

no dependen de ningún entrenamiento

previo.

PROCESO DE CONDICIONAMIENTO:

1. E.I R.I

2. ENTRENAMIENTO E.C+E.I+R.I

3. ASOCIACIÓN E.C (no E.I) R.C

ALGUNOS CONCEPTOS QUE HAY QUE CONOCER:

Respuesta emocional condicionada o supresión condicionada Razón de supresión Ensayo de condicionamiento Sesión de entrenamiento Intervalo entre ensayos Intervalo entre estímulos o intervalo EC-EI Intervalo de huella Ensayo de prueba Procedimiento de control pseudocondicionamiento

En este caso el estímulo (sonido de campana) no provoca salivación hasta que por entrenamiento sucesivo se asocia con

algo que sí provocaba esta salivación desde el primer momento (comida).

En este caso el estímulo provoca la salivación con su sola presencia y

desde el primer momento.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

14

1. SITUACIONES EXPERIMENTALES PARA EL ESTUDIO DEL CONDICIONAMIENTO CLÁSICO.

1. CONDICIONAMIENTO DEL MIEDO: condicionamiento de las reacciones

emocionales. Procedimientos para ampliar el rango de estímulos que pueden

despertar una emoción. Se trata de elicitar una reacción emocional de miedo

ante un estímulo que en principio no la elicitaba.

2. CONDICIONAMIENTO DEL PARPADEO: sirve para demostrar aspectos

importantes del aprendizaje, como que el condicionamiento clásico implica

emparejar EC y EI. Y que el aprendizaje inicial puede no ser directamente

observable.

3. SEGUIMIENTO DEL SIGNO: o automoldeamiento. Paradigma que

contribuye a la nueva concepción actual del condicionamiento pavloviano. Es

una herramienta útil para el estudio del aprendizaje asociativo. La paloma

aprende a considerar la tecla iluminada como un “signo” de la comida (de ahí

el nombre de la técnica), y desarrolla una RC hacia ella que es similar a la RI

de comer.

4. APRENDIZAJE DE AVERSIÓN AL SABOR: es el resultado del

emparejamiento de un EC con un EI y sigue las mismas leyes de aprendizaje

que el condicionamiento clásico. Pero tiene dos características especiales:

un aprendizaje tan rápido es poco común, puede tener lugar de forma

demorada.

2. PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO

EXCITATORIO. - En el condicionamiento excitatorio los organismos aprenden una asociación

entre los estímulos condicionado e incondicionado.

- Como resultado de esta asociación la presentación del EC activa la actividad

conductual y neuronal relacionada con el EI, sin la presentación real del EI.

- En todos estos casos el EC adquiere la capacidad de activar la conducta

relacionada con el EI asociado.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

15

2.1 PROCEDIMIENTOS TÍPICOS DE CONDICIONAMIENTO PAVLOVIANO

- Uno de los factores críticos que determinan cómo se desarrolla el

condicionamiento clásico es la ordenación temporal del EC y del EI.

- En la mayoría de situaciones variaciones pequeñas en la forma de emparejar

EC y EI puede tener importantes efectos en la intensidad de la RC.

- Cada configuración del EC y del EI representa un único ensayo de

condicionamiento.

- Un procedimiento típico de condicionamiento clásico implica que a lo largo

de una sesión de entrenamiento se repiten varios episodios de

emparejamiento del EC-EI.

- Dentro de cada entrenamiento, el tiempo entre el final de un ensayo y el

comienzo de otro se llama intervalo entre ensayos.

- Dentro de cada ensayo, el tiempo entre el comienzo del EC y el comienzo del

EI se llama intervalo entre estímulos o intervalo EC-EI

- Para que se desarrolle la respuesta condicionada el intervalo entre

estímulos debe ser mucho más corto que el intervalo entre ensayos.

1. CONDICIONAMIENTO DE DEMORA CORTA: en cada ensayo se va

retrasando ligeramente el comienzo del EI tras el EC. Comienza siempre

antes de que termine el EC, y con una separación de 1 minuto.

2. CONDICIONAMIENTO DE HUELLA: se presenta primero el EC y luego el

EI (como en el anterior), pero con un intervalo de huella. Este intervalo es el

espacio que se deja tras el fin del EC y el inicio del EI.

3. CONDICIONAMIENTO DE DEMORA LARGA: se presenta primero el EC y

luego el EI. Pero el EI tarda no sólo un minuto en aparecer, sino entre 5 y

10. Pero no hay intervalo, puesto que aparece siempre antes de terminar el

EC.

4. CONDICIONAMIENTO SIMULTÁNEO: ambos estímulos se presentan a la

vez.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

16

5. CONDICIONAMIENTO HACIA ATRÁS: el EI ocurre un poco antes, y no

después del EC.

2.2 CÓMO MEDIR LAS RESPUESTAS CONDICIONADAS

- De qué modo el condicionamiento de un EC depende de la relación temporal

entre EC y EI.

- La forma de medir es mediante un ensayo de prueba, que consiste en la

presentación del EC aislado, es decir, sin el EI. Así se puede observar la

repuesta que provoca el EC sin la interferencia de las respuestas provocadas

por el EI.

- La respuesta que tiene lugar durante el EC se puede cuantificar de varias

maneras: la magnitud (o cantidad de respuesta que se da), la probabilidad (o

fuerza de la respuesta), la latencia (o cantidad de tiempo entre el principio

del EC y la aparición de la RC).

2.3 PROCEDIMIENTOS DE CONTROL EN EL CONDICIONAMIENTO CLÁSICO.

No es suficiente realizar un ensayo de prueba válido, para tener evidencia de que

se haya producido condicionamiento clásico. Para estar seguros de que un proceso

de condicionamiento es la causa de cambios en la conducta, se deben comparar

estos cambios con los efectos sobre un procedimiento de control.

Cómo realizar un procedimiento de control:

- una asociación entre un EC y un EI implica que los dos eventos han quedado

conectados de alguna forma.

- Después de establecida la asociación el EC tiene capacidad para activar

procesos relacionados con el EI

- Una asociación implica más que la mera familiaridad con el EC y el EI.

Dependerá de que los dos estímulos se hayan experimentado con alguna

conexión entre ellos

- Para concluir que se ha establecido una asociación hay que asegurarse de

que el cambio conductual observado no podría haberse producido por la

mera presentación del EC o del EI por separado

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

17

Los casos en los que la simple exposición al EI da lugar a respuestas similares a la

respuesta condicionada reciben el nombre de pseudocondicionamiento.

- para determinar si las respuestas que se dan ante el EC representan una

asociación en entre el EC y el EI, y no un efecto de sensibilización, se

requieren procedimientos de control.

- Un procedimiento de control debería tener el mismo número y distribución

de presentaciones del EC y del EI que el procedimiento experimental, y

disponer el EC y el EI sin que queden asociados.

- Para no asociarlos se pueden presentar de forma aleatoria durante una

sesión experimental, mediante un procedimiento de control aleatorio.

- Otra forma de presentarlos es mediante el procedimiento de control

desemparejado explícito, en el que EC y EI se presentan lo suficientemente

separados como para que no se asocien.

3. CONDICIONAMIENTO PAVLOVIANO INHIBITORIO (INHIBIR: impedir o reprimir, suspender transitoriamente una función o actividad

del organismo mediante la acción de un estímulo adecuado).

- Hasta ahora se ha estudiado el condicionamiento pavloviano en términos de

aprendizaje, para predecir cuándo va a aparecer un evento significativo o EI.

- Existe otro tipo de condicionamiento, en el que los participantes aprenden a

predecir la ausencia del EI.

- El condicionamiento inhibitorio es aquel en el que se logra que la

presentación de un EC inhiba una respuesta. Para ello, durante la fase de

adquisición se implanta una contingencia negativa: cada vez que aparece EC, va

seguido de un periodo de ausencia de EI.

- La inhibición resulta especialmente difícil de estudiar, ya que en muchos

casos no hay una medida directa. Y entonces resulta complicado distinguir si

el organismo se ha condicionado inhibitoriamente o, por el contrario,

simplemente no ha aprendido nada.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

18

- En el condicionamiento excitatorio el EC sirve para predecir el EI. EC se

asocia a EI porque siempre le precede.

- En el condicionamiento inhibitorio el EC sirve para predecir la ausencia de

EI. EC se asocia con ausencia de EI porque éste EI aparece en cualquier

momento, excepto en los casos en los que se presenta el EC.

- Para que se produzca el condicionamiento inhibitorio se necesita una

contingencia negativa entre el EC y el EI. La contingencia negativa implica que

cuando el EC está presente nunca sucede EI. Si sucede el EI es porque el EC

no está presente.

ESTÍMULO CONDICIONAL (E.C)

Profesor/a

ESTÍMULO INCONDICIONAL (E.I)

Actitud de acoso por parte de alguien

hacia mí

RESPUESTA CONDICIONAL (R.C)

RESPUESTA INCONDICIONAL (R.I)

CONTINGENCIA NEGATIVA: presencia del EC para que no se de el

EI.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

19

CAPÍTULO 4.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

20

PSICOLOGÍA DEL APRENDIZAJE.

CAPÍTULO 4: CONDICIONAMIENTO CLÁSICO: MECANISMOS.

1. A QUÉ DEBEN SU EFICACIA LOS ESTÍMULOS CONDICIONADOS E INCONDICIONADOS? 1.1 RESPUESTA INICIALES A LOS ESTÍMULOS

Pavlov hizo hincapié en los criterios de eficacia de los estímulos condicionados e

incondicionados al definir los términos condicionado e incondicionado.

De acuerdo con estas definiciones, el estímulo condicionado (EC) inicialmente no

provoca la respuesta condicionada, pero adquiere la capacidad de hacerlo como

resultado del desarrollo de una asociación con el estímulo incondicionado (El).

Por el contrario, el EI elicita eficazmente la respuesta en cuestión desde el principio,

sin ningún entrenamiento especial. Las definiciones de Pavlov estaban formuladas

en términos de elicitación de una respuesta particular -aquella que se trataba de

condicionar-.

Debido a esto, la identificación de ECs y EIs potenciales requiere que se comparen

las respuestas provocadas por cada uno de ellos antes del condicionamiento.

Tal comparación hace que la identificación de los ECs y de los EIs sea relativa. Un

evento particular puede servir de EC respecto a un estímulo y de El respecto a otro

(sacarina en aversión al sabor como EC y en seguimiento del signo como EI).

1.2 LA NOVEDAD DE LOS ESTÍMULOS CONDICIONADOS E INCONDICIONADO

El efecto conductual de un estímulo depende de su novedad.

Los estímulos familiares no suscitan reacciones tan intensas como los estímulos

novedosos. El aprendizaje se desarrolla con mayor lentitud que si el EC y el El son

novedosos.

La familiarización inicial con un estímulo presentado aisladamente suele retrasar el

condicionamiento posterior de dicho estímulo. Este fenómeno se denomina efecto

de preex:posición al EC o efecto de inhibición latente.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

21

La función del efecto de preexposición al EC es similar a la función de la

habituación. Ambos fenómenos sirven para limitar la cantidad de procesamiento y

atención a los estímulos que se sabe carecen de consecencias.

La habituación sirve para sesgar la conducta elicitada a favor de los estímulos

novedosos. La inhibición latente sirve para sesgar el aprendizaje en favor de los

estímulos novedosos.

Los sujetos familiarizados con un EI antes de su emparejamiento con un EC

desarrollan la respuesta condicionada al EC más lentamente que los participantes

para los cuales el EI es novedoso durante los emparejamientos EC-EI. Este resultado

se denomina efecto de preexposición al EI.

De momento no hay ninguna teoría que haya sabido explicar satisfactoriamente

todos los datos relativos a los mecanismos de los efectos de preexposición al EC y al

EI: (1) una posición es que son varios los mecanismos involucrados. Uno de los

mecanismos conllevaría cierta interferencia asociativa (que implica que las

preexposiciones al EC o al EI disminuyen la capacidad de estos estímulos para

participar en nuevas asociaciones). (2) otra explicación de los efectos de

preexposición es la interferencia de memoria. De acuerdo con esta perspectiva la

respuesta condicionada resulta alterada debido a que los participantes recuerdan lo

sucedido en ambas fases del experimento.

1.3 INTENSIDAD Y SALIENCIA DEL E.C Y DEL E.I

Otra variable importante para el condicionamiento clásico es la intensidad de los EC

y EI. La mayor parte de los efectos biológicos y fisiológicos de la estimulación se

relacionan con la intensidad del estímulo.

Es decir, la respuesta condicionada es más fuerte cuando se utilizan estímulos

condicionados e incondicionados más intensos.

La intensidad del estímulo es uno de los factores que contribuyen al concepto más

general de saliencia del estímulo.

El concepto de saliencia no tiene una definición clara, pero sí se puede decir que

viene a significar “significación” o “perceptibilidad”. Es decir, las teorías del

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

22

aprendizaje suelen asumir que el apendizaje tendrá lugar de forma más rápida si se

utilizan estímulos más salientes.

Un estímulo puede adquirir saliencia o significación aumentando su intensidad, lo

que hace que despierte mayor atención.

Otra forma de incrementar la saliencia de un EC es hacer que el EC del laboratorio

se parezca más al tipo de estímulos que el animal puede encontrar en su ambiente

natural.

1.4 RELEVANCIA O PERTINENCIA EC-EI

Otra variable que afecta al ritmo de desarrollo del condicionamiento clásico es el

grado en que el EC es relevante o pertinente con respecto al EI.

(Experimento de García y Koelling). Ilustra el principio de la relevancia o

pertinencia del EC-EI. El aprendizaje dependía de la relevancia o adecuación del EC

con respecto al EI que se administraba. El aprendizaje tiene lugar rápidamente sólo

si el EC se combina con el EI apropiado (El “Efecto García” (García y Koelling,

1966): Grupos de ratas sometidos a varios ECs (sabor, sonido y luz) y a varios EI:

rayos X, cloruro de litio inyectado (que producen RIs de nauseas y trastornos

viscerales), y descargas eléctricas. Se comprueba que los animales que han recibido

descargas dan RCs a la luz y al sonido, mientras los animales "intoxicados" dan

RCs al sabor. Interpretación: los organismos tienen una predisposición innata a

aprender relaciones entre ciertas clases de estímulos, y no entre otras clases. Así,

un organismo asocia fácilmente un sabor con un malestar interno, o un sonido con

un dolor externo (descarga), pero a la inversa la asociación es mucho más difícil).

1.5 EL CONCEPTO DE FUERZA BIOLÓGICA

Pavlov sugirió que para que un estímulo se condicionara debía tener una fuerza

biológica menor que la del estímulo incondicionado con el que se emparejaba.

El concepto de “menor fuerza biológica” se refería a que inicialmente el EC debía

elicitar menos respuestas y más débiles que el EI.

CONDICIONAMIENTO DE ORDEN SUPERIOR. Una implicación del criterio

pavloviano de fuerza biológica es que un estímulo puede hacer de EI tras haber sido

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

23

fuertemente condicionado. (un tono emparejado de forma repetida con comida

terminará elicitando la salivación y fuertes respuestas de seguimiento del signo. En

este momento el tono debería ser efectivo a la hora de codicionar la salivación a una

luz, estímulo novedoso que no elicita en principio respuestas intensas).

Los emparejamientos del tono previamente condicionado con la luz deberían

dar como resultado un progresivo condicionamiento de la salivación ante la

luz. Este efecto se observa con frecuencia y recibe el nombre de

condicionamiento de orden superior.

Al denominarse de orden superior se considera el condicionamiento como si

operase en diferentes niveles.

En el ejemplo, el emparejamiento del tono con la comida se considera

condicionamiento de primer orden. El emparejamiento de la luz con el tono

previamente condicionado se considera condicionamiento de segundo orden.

Si tras estar condicionada la luz se usara para condicionar otro estímulo se

trataría de condicionamiento de tercer orden.

CONTRACONDICIONAMIENTO. En el contracondicionamiento dos estímulos

pueden quedar asociados el uno con el otro aunque ambos eliciten inicialmente

respuestas intensas. (como técnica de modificación de la conducta consiste en

presentar el objeto que provoca una conducta que queremos eliminar, de tal modo

que el sujeto lo experimente como poco amenazante y junto con un estímulo muy

positivo, como puede ser la comida).

Según la definición convencional el EC es un estímulo neutro en el sentido de

que no provoca una respuesta potente y definida, ni posee un especial

significado motivacional. Sin embargo es posible utilizar estímulos que no

son neutros como ECs.

El contracondicionamiento es cualquier procedimiento de condicionamiento

clásico en el que se emplea como EC un estímulo que previamente tiene para

el organismo un signo motivacional opuesto. Es decir, se trata de usar un EC

asociado a una respuesta apetitiva como EC en una nueva adquisición en la

que se asocia a un EI aversivo, o a la inversa.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

24

PRECONDICIONAMIENTO SENSORIAL. También pueden aprenderse

asociaciones entre dos estímulos que tan sólo elicitan una débil respuesta de

orientación antes del condicionamiento.

En términos operativos el procedimiento consiste en emparejar dos estímulos

neutros (A y B) en una situación que sería idéntica a una fase de adquisición

normal, salvo porque no hay ningún EI propiamente dicho. Después el EC

(A) se empareja con el EI y adquiere la capacidad de elicitar la respuesta

condicionada (RC). En una sesión de prueba posterior se encuentra que el EC

(B) también elicita el RC a pesar de que el EC (B) nunca se ha emparejado

con el EI.

2. ¿QUÉ DETERMINA LA NATURALEZA DE LA RESPUESTA

CONDICIONADA? 2.1 EL MODO DE SUSTITUCION DEL ESTÍMULO

La primera y más duradera explicación acerca de la naturaleza de la respuesta

condicionada (RC) es el modelo de sustitución del estímulo de Pavlov. De acuerdo

con este modelo, el EC adquiere la capacidad de funcionar de forma similar a como

el El lo hacía previamente. Se asume que el EC activa los circuitos neuronales que

previamente activaba sólo el EI y elicita respuestas similares a las del El.

Pavlov sugirió que el condicionamiento da lugar al establecimiento de nuevos

enlaces neuronales. En el curso de los emparejamientos repetidos de los estímulos

condicionado e incondicionado, se desarrolla una nueva conexión entre los circuitos

que previamente activaba el EC y los circuitos que previamente activaba sólo el EI.

Una vez que esta nueva conexión se ha establecido, la presentación del EC da lugar

a la activación de los circuitos del El, que a su vez generan la respuesta

incondicionada.

Por lo tamo, de acuerdo con e! modelo de Pavlov, el condicionamiento permite al

EC e1icitar la respuesta incondicionada. El EC se convierte en un sustituto del EI.

EL E.I COMO FACTOR DETERMINANTE DE LA RC. Estímulos

incondicionados diferentes elicitan repuestas condicionadas diferentes. La

comida elicita salivación y aproximación, las descargas elicitan aversión y

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

25

alejamiento. Si el condicionamiento convierte el EC en un sustituto del EI,

entonces los ECs condicionados con diferentes EIs deberían provocar

diferentes tipos de respuesta condicionada.

2.2 APRENDIZAJE Y HOMEOSTASIS: UN CASO ESPECIAL DE SUSTITUCION DEL ESTÍMULO

Walter Cannon introdujo el concepto de homeostasis para referirse a los

mecanismos fisiológicos que mantienen los aspectos críticos del cuerpo dentro de

los límites aceptables.

¿Cómo se logra y se mantiene el nivel homeostático ideal? Para lograr la

homeostasis se requiere que cualquier amenaza al nivel homeostático ponga en

marcha una reacción compensatoria que neutralice la alteración (ejemplo de

descenso de temperatura corporal en animales de sangre caliente. La exposición al

frío acciona de forma refleja reacciones compensatorias que ayudan a conservar e

incrementar la temperatura. Estas reacciones incluyen la vasoconstricción periférica

y los escalofríos).

Los mecanismos homeostáticos, tal y como los concebía Cannon, funcionaban por

procesos de retroalimentación negativa que servían para contrarrestar las

alteraciones una vez que éstas ya habían provocado una desviación con respecto al

nivel homeostático. Esto puede resultar ineficiente, especialmente si el proceso de

corrección o compensación tarda en activarse. Dwokin (1993) señaló que las

alteraciones en la homeostasis pueden compensarse más efectivamente si pueden

anticiparse. El condicionamiento pavloviano proporciona los medios necesarios para

tal anticipación.

En el caso del frío los procesos de retroalimentación necesitan que haya una

disminución de la temperatura corporal antes de que se pongan en marcha las

reacciones compensatorias. Pero si los sujetos pueden aprender qué claves señalan

cuándo va a tener frío, pueden realizar ajustes compensatorios que se anticipan al

frío, evitando sufrir una disminución de la temperatura corporal.

De acuerdo con esta perspectiva, la respuesta condicionada a una alteración

fisiológica es igual que la respuesta compensatoria a dicha alteración. Por tanto, la

respuesta condicionada es la misma que la respuesta incondicionada, sólo que esta

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

26

vez la respuesta incondicionada es una reacción compensatoria a una alteración

fisiológica.

Las RESPUESTAS HOMEOSTÁTICAS CONDICIONADAS se han examinado

con más detenimiento en los estudios sobre la forma en que los organismos

responden a la administración de drogas psicoactivas. Las drogas suelen provocar

alteraciones fisiológicas de la homeostasis que activan reacciones compensatorias

condicionadas. Las claves que se asocian con la alteración fisiológica inducida por

la droga pueden llegar a elicitar estas reacciones compensatorias como respuestas

condicionadas anticipatorias.

Por ejemplo, la ansiedad por consumir droga que suelen mostrar los consumidores

habituales de droga es una manifestación de estas respuestas condicionadas

anticipatorias. La cafeína por ejemplo es una droga de consumo habitual cuyos

efectos farmacológicos van normalmente precedidos por el sabor y el olor del café.

Por lo tanto éstos pueden funcionar como estímulos condicionados que predicen los

efectos fisiológicos de la cafeína.

EL MODELO DE CONDICIONAMIENTO DE TOLERANCIA A LAS

DROGAS.

Quizá sea en lo referente al desarrollo de la tolerancia a las drogas donde más

extensamente se ha estudiado el papel del condicionamiento pavloviano. Se

considera que se ha desarrollado tolerancia a la droga cuando las administraciones

repetidas de la misma tienen un efecto cada vez menor. Se requieren dosis cada vez

mayores para producir el mismo efecto. Tradicionalmente se ha considerado que la

tolerancia a la droga se debía a procesos farmacológicos. En contraste con esta

visión tradicional, Shepard Siegel ha propuesto un modelo de tolerancia a la droga

basado en el condicionamiento clásico.

El modelo de condicionamiento utiliza el concepto de homeostasis aprendida. De

acuerdo con este concepto, la administración de una droga psicoactiva provoca

cambios fisiológicos que afectan a la homeostasis. Esos cambios fisiológicos

constituyen el estímulo incondicionado que a su vez pone en marcha ajustes

compensatorios incondicionados para contrarrestar la alteración.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

27

Estos ajustes compensatorios reflejos son la respuesta incondicionada a las drogas.

Mediante el condicionamiento pavloviano, los estímulos que acompañan a la

administración de la droga se asocian con el EI Estos estímulos condicionados

pueden ser la hora del día, las sensaciones involucradas en la preparación de la

jeringuilla o el lugar donde la droga se consume habitualmente.

Debido a que las respuestas condicionadas contrarrestan los efectos de la droga, la

reacción que ésta produciría en condiciones normales se reduce, dando lugar a la

tolerancia a la droga.

El modelo de condicionamiento de la tolerancia a las drogas atribuye la tolerancia a

las respuestas compensatorias condicionadas a los estímulos del entorno que se

emparejan con la administración de la droga. Una importante predicción del modelo

es que la tolerancia a la droga se verá atenuada si los sujetos reciben la droga en

condiciones novedosas o en ausencia de las claves que normalmente predicen su

consumo.

El modelo también predice que varios factores que atenúan el desarrollo de las

respuestas condicionadas (como la preexposición al EC) también deberían atenuar el

desarrollo de la tolerancia a la droga.

2.3 EL E.C COMO DETERMINANTE DE LA FORMA DE LA R.C

Hasta el momento hemos considerado cómo la forma de la respuesta condicionada

está determinada por el estímulo incondicionado. Sin embargo el El no es el único

factor importante. La forma de la RC también está influida por la naturaleza del EC.

Este aspecto pudo contemplarse por vez primera en un experimento poco común

realizado por Timberlake y Grane.

Los autores estudiaron el condicionamiento clásico en ratas utilizando comida como

EI. En vez de la luz o el tono habituales, el EC fue la presentación de otra rata justo

antes de la administración de la comida. Tras el procedimiento usado se establece a

través del MODELO DE SUSTITUCIÓN DEL ESTÍMULO que éste va a predecir

que los emparejamientos EC-EI harán que las respuestas producidas por el EC sean

similares a las respuestas elicitadas por la comida (roer y morder).

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

28

Contrariamente a esta predicción el EC no provocó las conductas de roer y morder

que sí provocaba la comida. En vez de eso, a medida que la rata que servía de EC se

iba emparejando repetidamente con la comida, se vio que elicitaba respuestas de

orientación, aproximación y olfateo, así como contactos de tipo social. Estas

respuestas sin embargo no se daban si la rata que servía de EC no se emparejaba con

comida o se presentaba sin guardar relación alguna con la comida.

El resultado de este experimento no apoya a ningún modelo que explique la forma

de la respuesta condicionada únicamente en términos del estímulo incondicionado

utilizado. El patrón de respuestas condicionadas, particularmente la conducta social

elicitada por la rata EC, estuvo sin duda determinado por la naturaleza del EC.

2.4 CONDUCTA CONDICIONADA Y SISTEMA DE CONDUCTA

Las perspectivas sobre la forma de la respuesta condicionada discutidas hasta el

momento tienen sus raíces en el método empleado por Pavlov pata el estudio de!

aprendizaje. En este método, se aíslan una o dos respuestas y se utilizan como índice

del aprendizaje asociativo. Este método continúa proporcionando aportaciones al

conocimiento, pero cada vez está más claro que se requiere una perspectiva más

amplia para comprender completamente la naturaleza de la respuesta condicionada.

Holland (1984), por ejemplo, ha comentado que la comprensión de la conducta

condicionada requerirá un mayor conocimiento "de las funciones normales de los

sistemas de conducta activados por diferentes ECs, de la organización natural de

dichos sistemas independientemente del aprendizaje y de su desarrollo

ontogenético".

Los diversos sistemas de conducta han evolucionado para permitir a los animales

llevar a cabo varias tareas críticas, como obtener y comer alimento, defender su

territorio…. Cada sistema de conducta consiste en una serie de modos de respuesta,

cada uno de ellos con sus propios estímulos y respuestas relevantes, dispuestos con

determinado orden espacial y/o secuencial.

La TEORÍA DE LOS SISTEMAS DE CONDUCTA asume que la presentación del

EI en un procedimiento de condicionamiento pavloviano activa el sistema de

conducta relevante para ese EI (los EI relacionados con la comida activan los

sistemas de búsqueda y alimentación). Los procedimientos de condicionamiento

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

29

clásico superponen una relación EC-EI sobre el sistema conductual activado por el

EI.

Cuando un EC se asocia con el EI, se integra en su sistema conductual y adquiere la

capacidad de elicitar las respuestas que forman parte de dicho sistema. Por tanto, los

estímulos condicionados con comida elicitan componentes del sistema de

alimentación y los estímulos condicionados sexualmente elicitan componentes del

sistema de conducta sexual.

Una predicción provocadora de la teoría de los sistemas de conducta es que la forma

de la RC dependerá del intervalo EC-EI que se utilice. La razón es que este intervalo

determina el lugar en el que se va a incorporar el EC dentro de la secuencia

“ordinaria” de respuestas del sistema de conducta.

Ejemplo de superposición de un procedimiento de condicionamiento

pavloviano sobre el sistema de conducta sexual. El EI es el acceso a la

hembra, y activa RI de cortejo y copulación que son el final de la secuencia

de la conducta sexual. Si el intervalo EC-EI es corto, el EC (por ejemplo una

luza) ocurrirá poco antes del acceso a la hembra. Si el EC se incorpora al

sistema de conducta de búsqueda de la hembra en ese momento, debería

elicitar una conducta de búsqueda focalizada (mediada por el EC), el macho

debería aproximarse y permanecer cerca del EC.

Si el intervalo EC-EI es largo, la RC debería ser diferente. En este caso el EC

se incorporaría en una fase previa del sistema de conducta y debería elicitar

una conducta de búsqueda general, no focalizada (o mediada por el EC). La

conducta de búsqueda general se mostraría en forma de un aumento en la

conducta motora pero sin una dirección precisa.

Estos resultados son los que predicen la TEORÍA DE LOS SISTEMAS DE

CONDUCTA. De acuerdo con ella el EC no sustituye ni compensa al EI. En vez de

eso sustituye a un estímulo en un punto del sistema de conducta que está

determinado por el intervalo que se dé entre EC-EI.

La teoría es compatible con el hecho de que la forma de la respuesta

condicionada está determinada (1) por la naturaleza del EI, porque diferentes

EIs activan diferentes sistemas de conducta. (2) por la naturaleza del EC, ya

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

30

que ciertos tipos de estímulos son más efectivos que otros a la hora de elicitar

un componente particular del sistema de conducta.

Es decir, se espera que la naturaleza del EC determine cómo se incorpora el

EC al sistema de conducta. Y finalmente, la teoría hace predicciones únicas

acerca de las diferencia en la conducta condicionada en función del intervalo

EC-EI.

2.5 APRENDIZAJE E-R FRENTE A APRENDIZAJE E-E

¿EN QUE FORMA EL EC PRODUCE UNA RESPUESTA?

Históricamente, la conducta condicionada se veía como una respuesta elicitada

directamente por el EC. De acuerdo con la perspectiva del aprendizaje E-R, el

condicionamiento establece una nueva conexión estímulo-respuesta o E-R entre el

EC y la RC.

Una visión alternativa más moderna es que los sujetos aprenden una asociación

estímulo-estímulo o E-E entre el EC y el EI. De acuerdo con la perspectiva del

aprendizaje E-E los sujetos responden al EC, no porque éste elicite directamente la

RC, sino porque el EC activa una representación del EI. En cieno sentido, la

presentación del EC hace que el sujeto "piense en" el EI, Y estos pensamientos son

los causantes de la conducta condicionada. Desde esta perspectiva se asume que la

conducta condicionada refleja el estado de la representación del El activada por el

EC.

En resúmen:

APRENDIZAJE E-R: establece una nueva conexión entre el EC y la RC

APRENDIZAJE E-E: visión más moderna. Los sujetos aprenden una

asociación entre el EC y el EI. Responden al EC no porque elicite

directamente la RC sino porque el EC piense en el EI.

Un investigador decide entre ambas interpretaciones mediante la TECNICA

DE LA DEVALUACIÓN DEL E.I: consiste en la reducción del atractivo de

un EI, normalmente obtenida a través de la aversión o la saciedad.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

31

3. ¿CÓMO SE ASOCIAN LOS ESTÍMULOS CONDICIONADO E INCONDICIONADO?

El tema de cómo se asocian los estímulos condicionado e incondicionado es crítico.

¿Cuáles son los mecanismos del aprendizaje de asociaciones -los procesos

subyacentes que activan los procedimientos de condicionamiento y que producen el

aprendizaje? Esta cuestión ha sido objeto de un intenso trabajo académico. La

evolución de las teorías sobre el condicionamiento clásico continúa en nuestros días,

ya que los investigadores se esfuerzan por formular explicaciones de los

mecanismos del aprendizaje asociativo que puedan abarcar toda la diversidad de

resultados obtenidos en la investigación.

3.1 EL EFECTO DE BLOQUEO

La era moderna de las teorías del condicionamiento pavloviano comenzó hace

aproximadamente 35 años con el descubrimiento de varios fenómenos provocadores

que estimularon la aplicación de ideas sobre el procesamiento de la información al

análisis del condicionamiento clásico. Uno de los fenómenos más destacados fue el

EFECTO DE BLOQUEO.

Ejemplo: Luisa siempre come pastel de arroz y le sienta mal. No puede dejar de

comerlo y adquiere aversión hacia él. Cuando lo come en compañía de pastas, a

pesar de que se siente mal a causa del pastel de arroz, no asocia que el malestar se

deba a las pastas, sino a lo ya conocido, el pastel de arroz.

El EFECTO DE BLOQUEO sigue una secuencia de eventos similar. Primero se

establece una asociación entre un EC (A) y el EI. Una vez que el EC (A) está bien

condicionado, se añade un segundo EC (B) al EC (A) y se presentan los dos juntos

en los ensayos de condicionamiento.

El HALLAZGO básico es que el condicionamiento previo de A interfiere o bloquea

el desarrollo de la RC al estímulo añadido B.

Desde los tiempos de Aristóteles, se consideraba que la contigüidad temporal era el

medio principal por el cual se asociaban los estímulos. El efecto de bloqueo se ha

convertido en un fenómeno clave del condicionamiento clásico debido a que puso en

duda el presupuesto de que la contigüidad temporal es suficiente para el aprendizaje.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

32

El efecto de bloqueo muestra claramente que no es suficiente emparejar un EC con

un El para que se desarrolle la respuesta condicionada.

3.2 EL MODELO DE RESCORLA Y WAGNER

PDF ADJUNTO.

APARTADOS A TENER EN CUENTA: (1) aplicación al efecto de bloqueo, (2)

pérdida de valor asociativo a pesar de los emparejamientos con el EI, (3) inhibición

condicionada, (4) extinción de la excitación y la inhibición, (5) problemas del

modelo.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

33

CAPÍTULO 5.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

34

PSICOLOGÍA DEL APRENDIZAJE.

CAPÍTULO 5: CONDICIONAMIENTO INSTRUMENTAL: FUNDAMENTOS.

4. PRIMERAS INVESTIGACIONES SOBRE EL CONDICIONAMIENTO INSTRUMENTAL. 4.1 RESPUESTA INICIALES A LOS ESTÍMULOS

En el capítulo se aborda el análisis del condicionamiento instrumental y la

conducta dirigida a una meta. Es un tipo de condicionamiento en el que las

presentaciones de los estímulos dependen de la ocurrencia previa de

respuestas específicas.

Los análisis teóricos y de laboratorio del condicionamiento instrumental

comenzaron formalmente con el trabajo de Thorndike. La intención original

de Thorndike era estudiar la inteligencia animal.

La teoría de la evolución de Darwin estimuló a la gente a especular acerca de

qué capacidades intelectuales humanas estaban presentes en los animales.

Thorndike estudió esta cuestión mediante investigación empírica. Inventó una

serie de cajas problema para sus experimentos. Su procedimiento de

entrenamiento consistía en situar un gato hambriento (o un perro o un pollo)

en la caja problema con algo de comida fuera a la vista del animal. La tarea

del gato era aprender cómo salir de la caja y obtener la comida. Las diferentes

cajas problema requerían diferentes respuestas para salir, y algunas eran más

fáciles que otras.

La cuidadosa aproximación empírica de Thorndike fue un avance

significativo en el estudio de la "inteligencia animal". Otra contribución

importante fue la estricta evitación de interpretaciones antropomórficas de la

conducta observada. Aunque Thorndike tituló su tratado "Inteligencia

animal", pensaba que muchos aspectos de la conducta de sus sujetos parecían

no ser inteligentes. No consideraba que los sujetos fuesen más rápidos en

escapar de una caja problema debido a que adquiriesen una comprensión de la

tarea o a que se imaginasen cómo estaba diseñado el mecanismo de

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

35

liberación. En lugar de ello, Thorndike interpretó los resultados de sus

estudios como el reflejo del aprendizaje de una asociación E-R.

Thorndike interpretó los resultados de sus estudios como el reflejo del

aprendizaje de una asociación E-R. Cuando un gato se situaba inicialmente en

una caja, desplegaba una variedad de respuestas típicas de un animal

confinado. Algunas de estas respuestas eventualmente daban como resultado

la apertura de la puerta. Thorndike creía que estos escapes con éxito

conducían al aprendizaje de una asociación entre los estímulos del interior de

la caja problema y la respuesta de escape. A medida que la asociación entre

las claves de la caja y la respuesta con éxito se hacía más fuerte, el gato

llegaba a realizar esta respuesta de forma más rápida. La consecuencia de la

respuesta exitosa, escapar de la caja, fortalecía la asociación entre los

estímulos de la caja y la respuesta.

Sobre la base de esta investigación el autor formula la LEY DEL EFECTO.

En ella se establece que si una respuesta en presencia de un estímulo es

seguida por un suceso satisfactorio, la asociación entre el estímulo (E) y la

respuesta (R) se fortalece. Si la respuesta es seguida por un suceso molesto, la

asociación E-R se debilita.

Es importante destacar que la consecuencia de la respuesta no es un elemento

que forme parte de la asociación. La consecuencia satisfactoria o molesta sólo

sirve para fortalecer o debilitar la asociación entre la respuesta y el estímulo

(o situación estimular). ES DECIR, LA LEY DEL EFECTO IMPLICA UN

APRENDIZAJE E-R.

5. APROXIMACIONES MODERNAS AL ESTUDIO DEL

CONDICIONAMIENTO INSTRUMENTAL 5.1 PROCEDIMIENTOS DE ENSAYO DISCRETO

Los procedimientos de ensayo discreto son similares al método que

Thorndike utilizó, en el que cada ensayo de entrenamiento acaba con la

retirada del animal del aparato, y la respuesta instrumental se realiza sólo una

vez durante cada ensayo. Las investigaciones de ensayo discreto de la

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

36

conducta instrumental a menudo se han llevado a cabo en algún tipo de

laberinto.

La conducta en el laberinto puede cuantificarse midiendo la VELOCIDAD

DE LA CARRERA, o rapidez con que se desplaza el animal desde la caja de

salida hasta la caja de meta. La velocidad de la carrera normalmente aumenta

con ensayos de entrenamiento repetidos.

Otra medida común de la conducta en laberintos en las LATENCIA, o tiempo

que tarda el animal en abandonar la caja de salida y empezar a desplazarse

por el pasadizo. Las latencias suelen ser más cortas a medida que progresa el

entrenamiento.

5.2 PROCEDIMIENTOS DE OPERANTE LIBRE

Estos procedimientos permiten al animal que, dentro del laberinto, repita la

respuesta instrumental una y otra vez sin restricciones. En los laberintos T

después de alcanzar la caja de meta el animal es retirado del aparato un

momento antes de ser devuelto a la caja de salida para el próximo ensayo; es

decir, tiene oportunidades limitadas para responder y además están

programadas por el experimentador.

El método de operante libre fue ideado por Skinner, interesado por analizar en

el laboratorio una forma de conducta que fuese representativa de toda la

actividad en curso que ocurría de forma natural. Reconoció que antes de que

la conducta pueda ser analizada experimentalmente, debe definirse una

unidad de conducta medible.

Propone el CONCEPTO DE OPERANTE como forma de dividir la conducta

en unidades de medida con significado, ya que de forma natural no se puede

dividir nítidamente en unidades, sino que forma un continuo.

En los procedimientos de operante libre hay otro concepto importante, el de

RESPUESTA OPERANTE. En sus experimentos ponía una caja con una

palanca y una rata dentro, para así estudiar la conducta de operante libre que

mostraban. La palanca se puede empujar hacia abajo repetidamente, y tiene

un mecanismo que puede dar un reforzador como comida o agua. El

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

37

experimento más simple es que una rata hambrienta se coloque en la cámara y

apriete la palanca hacia abajo, haciendo que caiga automáticamente una bolita

de comida.

La RESPUESTA OPERANTE en este caso es presionar la palanca, y se

define a partir del efecto que produce en el ambiente. Las actividades que

provocan el mismo efecto ambiental se consideran ejemplos de la misma

respuesta operante. El elemento fundamental no son los músculos que

permiten la conducta (presión de la palanca), sino la forma en que la conducta

opera en el ambiente. Puede haber diferentes formas de presionar la palanca,

pero siempre que tengan el mismo efecto en el medio (sale la comida), son

funcionalmente equivalentes.

ENTRENAMIENTO Y MOLDEAMIENTO AL COMEDERO.

Es una fase preliminar de condicionamiento, necesario para que las ratas

sepan que para obtener la comida deben presionar la palanca con frecuencia.

Esto es normal, puesto que una rata puesta en una caja, debe aprender que la

palanca que ahí se encuentra sirve para obtener comida, pero también debe

aprender qué tiene que hacer con la palanca para lograr que salga la comida.

Todos estos aprendizajes se adquieren a través de un proceso de

condicionamiento clásico como el que ya conocemos: el sonido del

dispensador de comida se asocia repetidamente con la entrega de la bolita de

comida. Tras varias asociaciones se elicita una respuesta de seguimiento del

signo, ya que tras oir el sonido el animal corre a buscar la comida.

Después del entrenamiento al comedero el organismo está preparado para

aprender la respuesta instrumental requerida. Esto sucede así porque si la

respuesta no es algo que el animal haga ocasionalmente, nunca sucederá por

sí misma la respuesta que produce el reforzador (la comida).

Para facilitar la adquisición de una nueva respuesta operante se emplea una

estrategia: al principio se entrega la comida si el animal hace cualquier cosa

remotamente relacionada con la respuesta deseada (levantarse sobre las patas

traseras). Una vez establecida una pauta de comportamiento se “perfecciona”,

dejando de reforzarla a no ser que esté acompañada de detalles más

trabajados (levantarse sobre las patas al lado de la palanca, no en cualquier

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

38

lado de la cámara). Por último se va más al detalle y sólo se refuerza la

conducta buscada: levantarse sobre las patas al lado de la palanca y

presionarla. Esta secuencia de pasos de entrenamiento se denomina

MOLDEAMIENTO, e incluye dos tácticas complementarias: el

reforzamiento de aproximaciones sucesivas a la respuesta requerida, y el no

reforzamiento de las formas de respuesta más tempranas.

MOLDEAMIENTO Y NUEVA CONDUCTA.

Los procesos de moldeamiento son utilizados a menudo para generar una

nueva conducta, pero hay que plantearse hasta qué punto son nuevas las

respuestas que se derivan de esta nueva conducta.

En el caso de la rata presionando la palanca, toda la secuencia de

movimientos que usa para poder acabar ejerciendo presión, seguramente son,

por separado, movimientos que realiza de forma normal (explorando la jaula,

interaccionando con otra rata, manipulando trozos de comida…). Esto quiere

decir que cuando el investigador enseña a la rata a presionar la barra no le

enseña nuevos componentes de respuesta, sólo le muestra cómo combinar de

una determinada manera respuestas que le son familiares, con el objetivo de

lograr realizar una nueva actividad.

Esto significa que el condicionamiento instrumental incluye a menudo la

construcción o síntesis de una nueva unidad conductual a partir de

componentes de respuesta preexistentes que ya se encuentran en el repertorio

del sujeto. Pero también puede emplearse para producir nuevas respuestas que

no se parecen en nada a lo que el individuo es probable que haga sin

entrenamiento (aprender a tocar un instrumento musical, o a practicar un

deporte).

LA TASA DE RESPUESTA COMO MEDIDA DE LA CONDUCTA

OPERANTE.

Frente a las técnicas de ensayo discreto los métodos de operante libre

permiten una observación continuada durante largos períodos de tiempo. Al

tener una oportunidad continua de respuesta el organismo (no tanto el

experimentador), determina la frecuencia de su respuesta instrumental.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

39

Es decir, las técnicas de operante libre dan una ocasión buena para observar

cambios en la probabilidad de la conducta a lo largo del tiempo.

Pero las medidas de la latencia de respuesta y de la velocidad que se emplean

normalmente en procedimientos de ensayo discreto no permiten que se repita

la respuesta. Por eso Skinner propuso la TASA DE OCURRENCIA de una

conducta operante (por ejemplo con qué frecuencia ocurre la respuesta en un

minuto) se usase como una medida de probabilidad de la respuesta. En

consecuencia: las respuesta más probables ocurren con frecuencia y muestran

una tasa alta. Las respuesta improbables ocurren esporádicamente y muestran

una tasa baja.

6. PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL

En todas las situaciones de condicionamiento instrumental, el sujeto realiza

una respuesta y por tanto produce una consecuencia. Pagar al chico de la

puerta de al lado por cortar el césped cerrar una ventana para evitar que entre

la lluvia, y quitarle las llaves de! coche a un joven por llegar tarde a casa son

formas de condicionamiento instrumental. Algunas veces las consecuencias

son sucesos placenteros, pero otras veces las consecuencias incluyen

estímulos molestos.

Una consecuencia placentera se denomina técnicamente estímulo apetitivo.

Una consecuencia molesta se denomina técnicamente estímulo aversivo. La

respuesta instrumental puede proporcionar el estímulo, como cuando al chico

de la puerta de al lado se le paga por cortar el césped. En este caso se dice que

surte efecto una contingencia positiva entre la respuesta y su estímulo

consecuente.

De forma alternativa, la respuesta instrumental puede retirar o eliminar un

estímulo, como cuando se cierra una ventana para evitar la entrada de la

lluvia. En ese caso se dice que existe un efecto de contingencia negativa entre

la respuesta y su consecuencia.

Que el resultado de un procedimiento de condicionamiento sea un aumento o

una disminución en la tasa de respuesta depende tanto de la contingencia

respuesta-consecuencia como de la naturaleza de la consecuencia.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

40

TABLA. Procedimiento comunes de condicionamiento instrumental (en

función de qué tipo de estímulo es controlado por la respuesta instrumental –

el apetitivo o el aversivo- y en función de si la respuesta produce o elimina el

estímulo.

NOMBRE DEL

PROCEDIMIENTO.

CONTINGENCIA

RESPUESTA-

CONSECUENCIA

RESULTADO

REFORZAMIENTO

POSITIVO

POSITIVO: la respuesta produce

un estímulo apetitivo

REFORZAMIENTO O

INCREMENTO EN LA TASA

DE RESPUESTA

CASTIGO (CASTIGO

POSITIVO)

POSITIVO: la respuesta produce

un estímulo aversivo

SUPRESIÓN O

DISMINUCIÓN EN LA TASA

DE RESPUESTA

REFORZAMIENTO

NEGATIVO (ESCAPE O

EVITACIÓN)

NEGATIVO: la respuesta

elimina o previene la ocurrencia

de un estímulo aversivo

REFORZAMIENTO O

INCREMENTO EN LA TASA

DE RESPUESTA

ENTRENAMIENTO DE

OMISIÓN

NEGATIVO: la respuesta

elimina o previene la ocurrencia

de un estímulo apetitivo

SUPRESIÓN O

DISMINUCIÓN EN LA TASA

DE RESPUESTA

Reforzamiento positivo. Un padre da a su hija una galleta cuando

recoge sus juguetes; un profesor felicita a un estudiante cuando éste

entrega un buen trabajo; un empleado recibe un cheque extra cuando

realiza bien su trabajo. Todos éstos son ejemplos de reforzamiento

positivo. El reforzamiento positivo es un procedimiento en que la

respuesta instrumental aproxima o produce un estímulo apetitivo. Si

se da la respuesta, el estímulo apetitivo se presenta; si no se da la

respuesta, e! estímulo apetitivo no se presenta. Por tanto, existe una

contingencia positiva entre la respuesta instrumental y el estímulo

positivo. El reforzamiento positivo produce un incremento en la tasa

de respuesta. Dar a una rata hambrienta una bolita de comida siempre

y cuando presione una palanca de respuesta, pero no cuando no

presione la palanca, es un ejemplo Común de reforzamiento positivo

en el laboratorio.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

41

Castigo. Una madre da una reprimenda a su hijo por cruzar la calle;

su jefe le critica por llegar tarde a una reunión; el profesor le

suspende por contestar de forma incorrecta demasiadas preguntas de

un examen. Éstos son ejemplos de castigo. En un procedimiento de

castigo, la respuesta instrumental produce o aproxima un estímulo

molesto o aversivo. Hay una contingencia positiva entre la respuesta

instrumental y el estímulo consecuente, pero el resultado es un

estímulo aversivo. Los procedimientos de castigo producen una

disminución en la respuesta instrumental.

Reforzamiento negativo. Tamo el reforzamiento positivo como el

castigo incluyen una contingencia positiva entre la respuesta

instrumental y el estímulo resultante. En una contingencia negativa,

la respuesta retira o previene la presentación de un suceso ambiental.

Un procedimiento en el que la respuesta instrumental finaliza o

previene la entrega de un estímulo aversivo se denomina

reforzamiento negativo. Hay dos tipos de procedimientos de

reforzamiento negativo: escape y evitación. En el escape, el

estímulo aversivo se presenta pero puede ser eliminado por la

respuesta instrumental. Se puede escapar del sonido molesto de una

radio apagándola. La gente puede abandonar una obra de teatro para

"escapar" de presenciar una mala representación. En todos estos

casos, la presencia de un estímulo aversivo establece la ocasión para

la ocurrencia de la respuesta instrumental. La respuesta instrumental

entonces es reforzada por la terminación del estímulo aversivo. La

evitación implica la programación de un estímulo aversivo para ser

presentado en algún momento del futuro. En este caso la respuesta

instrumental previene la entrega del estímulo aversivo. La gente hace

muchas cosas para prevenir la ocurrencia de algo malo. Los alumnos

estudian antes de un examen para evitar recibir una mala calificación;

los trabajadores de una fábrica pueden evitar un accidente si

responden a una alarma de incendio; la gente pone a punto

regularmente su coche para evitar averías inesperadas.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

42

Entrenamiento de omisión. Otro tipo de procedimiento que incluye

una contingencia negativa entre la respuesta instrumental y un suceso

ambiental se denomina entrenamiento de omisión. En este caso, la

respuesta instrumental previene la presentación de un estímulo

apetitivo o placentero. El entrenamiento de omisión a menudo es el

método preferido para disuadir la conducta humana debido a que, al

contrario que el castigo, no implica la presentación de un estímulo

aversivo. Se está utilizando entrenamiento de omisión cuando se le

dice a un niño que se vaya a su habitación después de haber hecho

algo malo. El niño no recibe un estímulo aversivo cuando se le dice

que se vaya a su habitación. No hay nada aversivo en relación con la

habitación del niño. En su lugar, enviando al niño a la habitación, el

padre está retirando fuentes de reforzamiento positivo, como jugar

con los amigos o ver la televisión. Los procedimientos de

entrenamiento de omisión se denominan en ocasiones

reforzamiento diferencial de otras conductas, o RDO. Este

término refleja el hecho de que el individuo recibe un estímulo

apetitivo periódicamente a condición de que se dedique a realizar otra

conducta diferente de la respuesta especificada por el procedimiento.

La realización de la respuesta crítica deviene en la omisión de la

recompensa que podría haber sido obtenida si el individuo hubiese

llevado a cabo alguna "otra" conducta. Por tanto, el entrenamiento de

omisión implica el reforzamiento de "otras" conductas.

Los términos utilizados para describir los procedimientos de

condicionamiento instrumental son algo confusos. Por ejemplo, la gente

tiende a confundir el reforzamiento negativo y el castigo. A pesar de que se

utiliza un estímulo aversivo en ambos procedimientos, la relación de la

respuesta instrumental con el estímulo aversivo en cada caso es

completamente distinta.

En lo que comúnmente se denomina castigo, existe una contingencia

positiva entre la respuesta instrumental y el estímulo aversivo. (La

respuesta da como resultado la administración de un estímulo

aversivo).

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

43

Por el contrario, en el reforzamiento negativo hay una contingencia

negativa respuesta-consecuencia. (La respuesta finaliza o previene la

administración de un estímulo aversivo).

Esta diferencia en las contingencias produce resultados muy

diferentes. La respuesta instrumental disminuye por el castigo y

aumenta por el reforzamiento negativo.

7. ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO INSTRUMENTAL. 7.1 LA RESPUESTA INSTRUMENTAL

El resultado de los procedimientos de condicionamiento instrumental depende

en parte de la naturaleza de la respuesta que se esté condicionando. El cómo

sea la respuesta, su naturaleza, determina los resultados de los procedimientos

de reforzamiento, ya que algunas respuestas son más fácilmente modificables

que otras.

VARIABILIAD CONDUCTUAL VERSUS ESTEREOTIPIA.

Thorndike describió la conducta instrumental como incluyendo el "sellado"

de una asociación E-R. Skinner escribió acerca de la conducta como

reforzada o fortalecida. Ambos pioneros enfatizaron que el reforzamienro

incrementa la probabilidad de que la respuesta instrumental se repita en el

futuro. Este énfasis alentó la creencia de que los procedimientos de

condicionamiento instrumental producían repeticiones de la misma respuesta

(que producían uniformidad o estereotipia en la conducta).

Esto no significa que el condicionamiento instrumental no pueda también

verse involucrado en la producción de respuestas creativas o variables.

Estamos acostumbrados a pensar que la respuesta requerida para el

reforzamiento ha de ser una acción observable, corno un movimiento de la

pierna de un individuo, el torso o una mano. No obstante, los criterios para el

reforzamiento pueden también definirse en términos de dimensiones de la

conducta más abstractas, como su variabilidad.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

44

Por ejemplo, los organismos pueden aprender a obtener reforzamiento en una

situación donde se requiere hacer algo nuevo, algo distinto de lo que hicieron

en los cuatro o cinco ensayos precedentes.

La VARIABILIDAD DE LA RESPUESTA puede ser la base para el

reforzamiento instrumental.

(Estudio sobre picotazos de palomas sin frecuencia establecida) Es un estudio

que muestra dos hechos interesantes sobre el condicionamiento instrumental:

(1) la variabilidad de la respuesta puede mantenerse e incrementarse

por reforzamiento. Por lo tanto, la variabilidad de la respuesta puede

establecerse como una operante.

(2) en ausencia de un reforzamiento explícito de la variabilidad, la

respuesta llegar a ser más estereotipada con un condicionamiento

instrumental continuado. Es decir, el resultado típico del

reforzamiento instrumental es una disminución de la variabilidad de

la respuesta.

RELEVANCIA O PERTINENCIA DEL CONDICIONAMIENTO INSTRUMENTAL.

El condicionamiento instrumental puede actuar sobre componentes

manifiestos de la respuesta o sobre dimensiones abstractas de la conducta

(como la variabilidad). ¿Hasta qué punto se extienden estos principios? ¿Hay

límites en los tipos de nuevas unidades conductuales o dimensiones de la

respuesta que pueden ser modificados por condicionamiento instrumental?

Evidencias reciemes indican que hay importantes limitaciones.

En el Capítulo 4 se describió cómo el condicionamiento clásico se daba a

diferentes tasas dependiendo de la combinación del EC y el EI que se utilice.

Para que el condicionamiento ocurra rápidamente, el EC tiene que "competer"

al EI, o ser "relevante" para el EI. En el condicionamiento instrumental tienen

lugar relaciones análogas de pertinencia o relevancia.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

45

Thorndike fue el primero en observar diferencias en la facilidad de

condicionamiento de varias respuestas.

Thorndike propuso el concepto de pertinencia para explicar los fallos

en el entrenamiento del rascado y el bostezo. De acuerdo con este

concepto, ciertas respuestas "se correspondían" de forma natural con

el reforzador debido a la historia evolutiva del animal.

Manipular un picaporte y empujar un anillo son respuestas

manipulativas que están relacionadas de forma natural con escapar

del confinamiento.

Por contra, rascar y bostezar no ayudan normalmente a los animales a

escapar del confinamiento y, en consecuencia, no "se corresponden"

con escapar de una caja problema.

Presumiblemente, ésta es la razón por la que el rascado y el bostezo

no persisten como respuestas instrumentales vigorosas en sentido

estricto cuando se refuerzan con la salida de la caja.

Breland y Breland (1961) observaron varias limitaciones en el

condicionamiento instrumental al intentar condicionar respuestas

instrumentales con reforzamiento de comida en varias especies. Su meta era

entrenar a los animales para realizar cadenas de respuesta entretenidas como

para ser exhibidos como entretenimiento en parques y zoos. Durante el

desarrollo de este trabajo, observaron cambios notables de la conducta que no

eran consecuentes con los procedimientos de reforzamiento que estaban

empleando. Por ejemplo, describieron un mapache que fue reforzado por

coger una moneda y depositarla en una hucha.

Los Breland llamaron DERIVA INSTINTIVA al desarrollo de respuestas

como la de hozar en los cerdos y frotar las monedas en los mapaches. Como

el término implica, las respuestas extras que desarrollaban en estas

situaciones de reforzamiento con comida eran actividades que los animales

realizaban instintivamente cuando obtenían comida. Los cerdos hozan por el

suelo en conexión con la alimentación, y los mapaches frotan y lavan objetos

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

46

relacionados con la comida. Estas respuestas naturales relacionadas con la

comida eran aparentemente muy fuertes y competían con las respuestas

requeridas por el experimentador. Los Breland pusieron de relieve que estas

tendencias de respuesta instintivas debían tenerse en cuenta en el análisis del

comportamiento.

SISTEMAS DE CONDUCTA Y LIMITACIONES EN EL CONDICIONAMIENTO INSTRUMENTAL.

Las limitaciones de respuesta en el condicionamiento instrumental que se han

descrito son consecuentes con la teoría de los sistemas de conducta, que se

describió en el Capítulo 4, en relación con la naturaleza de la respuesta

condicionada.

De acuerdo con la teoría de los sistemas de conducta, cuando un animal está

privado de comida y se encuentra en una situación donde podría encontrarla,

su sistema de alimentación se activa, y se dedica al forrajeo y otras

actividades relacionadas con la comida. Sobre este sistema de conducta se

superpone un procedimiento de condicionamiento instrumental. La

efectividad del procedimiento para el incremento de una respuesta

instrumental dependerá de la compatibilidad de esa respuesta con la

organización preexistente del sistema de alimentación.

Es más, la naturaleza de otras respuestas que emergen durame el curso del

entrenamiento (o deriva instintiva) depende de los componentes conductuales

del sistema de alimentación que se activen debido al procedimiento de

condicionamiento instrumental.

De acuerdo con la aproximación de los sistemas de conducta, deberíamos ser

capaces de predecir qué respuestas se incrementarán con un reforzamiento de

comida mediante el estudio de lo que los animales hacen cuando su sistema

de alimentación está activado en ausencia de condicionamiento instrumental.

Ante estos hallazgos, la teoría de los sistemas de conducta predice que el

reforzamiento de comida podría producir incrementos en actividades como

cavar, escarbar y erguirse, pero no en actividades corno lavarse la cara y

rascarse.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

47

Este patrón de resultados es precisamente el que se ha observado en estudios

de condicionamiento instrumental. Por tamo, la susceptibilidad de varias

respuestas al reforzamiento con comida puede predecirse observando cómo se

alteran esas respuestas con la privación de comida, lo que presumiblemente

refleja su compatibilidad con el sistema de alimentación.

7.2 EL REFORZADOR INSTRUMENTAL CANTIDAD Y NATURALEZA DEL REFORZADOR

Aunque la cantidad y la naturaleza del reforzador son lógicamente

características diferentes, a veces es difícil separarlas experimentalmente. Un

cambio en la cantidad del reforzador puede también hacer al reforzador

cualitativamente distinto.

Los incrementos en la calidad o la cantidad del reforzador produjeron

mayores tasas de respuesta.

En situaciones de operante libre, no obstante, los efectos de la magnitud del

reforzador son más complejos y dependen del programa de reforzamiento

utilizado y de otros factores.

CAMBIOS EN LA NATURALEZA Y LA CANTIDAD DEL REFORZADOR

En el estudio de Hun (1954), un grupo dado de ratas recibió sólo una cantidad

y tipo paticular de comida líquida a lo largo del experimento. ¿Qué pasaría si

la cantidad o la naturaleza del reforzador modificaran su valor para el mismo

individuo? Esta pregunta resulta interesante porque plantea la posibilidad de

que la efectividad de un reforzador dependa no sólo de sus propiedades sino

también de cómo ese reforzador se compara con otros que el individuo ha

experimentado.

En el Capítulo 4 se resaltó que la efectividad de un estímulo incondicionado

en el condicionamiento clásico depende de cómo se compare el EI con las

expectativas del individuo basadas en la experiencia previa, Esta idea sirve

como fundamentación del modelo de Rescorla-Wagner.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

48

Si el EI es mayor (o más intenso) de lo esperado, producirá condicionamiento

excitatorio. Por el contrario, si el EI es menor (o más débil) de lo esperado,

producirá condicionamiento inhibitorio. ¿Hay efectos análogos en el

condicionamiento instrumental? La experiencia común sugiere

definitivamente que sí.

Numerosos estudios han mostrado que los efectos de una cantidad y tipo de

reforzador particular dependen de la cantidad y naturaleza de los reforzadores

que el individuo ha experimentado previamente. Dicho vagamente, una

recompensa favorable se trata como especialmente buena tras el

reforzamiento con una recompensa mala, y una recompensa desfavorable se

trata como especialmente mala después de una buena recompensa.

El contraste positivo se refiere a una elevada respuesta por una recompensa

favorable resultado de una experiencia anterior con una consecuencia menos

atractiva. De un modo más informal, la recompensa favorable les parece

especialmente buena a los individuos que experimentaron previamente una

consecuencia peor.

El contraste negativo se refiere a una respuesta disminuida por una

recompensa desfavorable debido a una experiencia anterior con una

consecuencia mejor. En este caso, la recompensa desfavorable les parece

especialmente mala a los individuos que han experimentado previamente una

recompensa mejor.

Los efectos de contraste también se dan si las condiciones de recompensa se

modifican una y otra vez, con una clave diferente señalando cada condición

de recompensa. Estos efectos son ejemplos de contraste conductual

simultáneo.

Los diferentes efectos de contraste están mediados por diferentes

mecanismos. Sin embargo, todos los efectos de contraste ilustran que la

efectividad de un reforzador en una situación está determinada en parte por

las experiencias del organismo con reforzadores en otras situaciones.

7.3 LA RELACIÓN RESPUESTA-REFORZADOR.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

49

La conducta instrumental produce y es controlada por sus consecuencias. En

algunos casos, hay una fuerte relación entre lo que una persona hace y la

consecuencia que sigue.

La relación entre la conducta y sus consecuencias puede ser también

probabilística.

Un organismo debe organizar su conducta para enfrentarse con varios retos, y

debe hacerlo de manera que lleve a cabo el mejor uso de su tiempo y energía.

Es inútil esforzarse para hacer que el sol salga cada mañana, porque ocurrirá

de cualquier modo. Tiene más sentido dedicar la energía a preparar el

desayuno o trabajar para conseguir un cheque (cosas que no están disponibles

sin esfuerzo). Para ser eficiente, se tiene que saber cuando se debe hacer algo

para obtener un reforzador y cuándo el reforzador es probable que sea

entregado independientemente de cualquier acción.

La conducta instrumental eficiente requiere sensibilidad a la relación

respuesta-reforzador.

Existen dos tipos de relaciones entre una respuesta y un reforzador:

Una es la relación temporal, que se refiere al tiempo que transcurre

entre la respuesta y el reforzador. Un tipo especial de relación

temporal es la contigüidad temporal, la cual se refiere a la entrega del

reforzador inmediatamente después de la respuesta.

El segundo tipo de relación entre una respuesta y el reforzador es la

re/ación causal o la contingencia respuesta-reforzador. La

contingencia respuesta-reforzador se refiere al hecho de que la

respuesta instrumental es necesaria y suficiente para la ocurrencia del

reforzador.

Los factores temporales y causales son independientes unos de otros. Una

relación temporal fuerte no requiere una relación causal fuerte, y viceversa.

EFECTOS DE LA CONTIGÜIDAD TEMPORAL

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

50

Tanto la sabiduría popular como la evidencia experimental nos dice que el

reforzamiento inmediato es preferible al demorado. Además, desde el trabajo

pionero de Grice (1948), los psicólogos del aprendizaje han resaltado que el

condicionamiento instrumental requiere proporcionar el reforzador

inmediatamente después de la ocurrencia de la respuesta insrrumental. Grice

informó de que el aprendizaje instrumental puede deteriorarse con demoras

tan cortas como 0,5 segundos. La investigación más reciente indica que el

condicionamiento instrumental es posible con demoras de hasta 30 segundos.

El hecho recurrente es que el aprendizaje instrumental se altera demorando el

reforzador tras la ocurrencia de la respuesta instrumental.

¿Por qué es el condicionamiento instrumental tan sensible a la demora del

reforzamiento? Hay varios factores que pueden contribuir. Uno se resiste al

hecho de que una demora haga difícil imaginarse qué respuesta merece la

oportunidad de que el reforzador se entregue. Como se apuntó con

anterioridad, la conducta consiste en un flujo continuo de actividades. Cuando

el reforzamiento es demorado tras la realización de una respuesta específica,

Rl, el organismo no para de hacer cosas. Tras la realización de R1, el

organismo puede realizar R2, R3, R4, y así sucesivamente. Si el reforzador se

establece en R1 pero no se entrega hasta algún tiempo después, el reforzador

puede ocurrir inmediatamente después de alguna otra respuesta, por ejemplo,

R6. Para asociar Rl con el reforzador, el organismo tiene que poder distinguir

de alguna forma R1de otras respuestas que realiza durante el intervalo de

demora.

Hay dos formas de resolver este problema. La primera técnica, utilizada

durante siglos por entrenadores de animales y adiestradores, es proporcionar

un reforzador secundario o condicionado inmediatamente después de la

respuesta instrumental, incluso si el reforzador primario no puede ocurrir

hasta algún tiempo después. Un reforzador condicionado o secundario es un

estímulo condicionado que ha sido previamente asociado con el reforzador.

Las confirmaciones verbales en el adiestramiento, como "bueno" y "eso es",

son reforzadores condicionados que pueden proporcionar reforzamiento

inmediato para la conducta adecuada. Los buenos adiestradores proporcionan

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

51

constantemente retroalimentación verbal inmediata o reforzamiento

condicionado.

Otra técnica que facilita el aprendizaje con reforzamiento demorado es

marcar la respuesta instrumental criterio de alguna manera para hacerla

distinguible de otras actividades del organismo. Esto se conoce como un

procedimiento de marcado.

Tanto el reforzamiento secundario como los procedimientos de marcado se

centran en conectar mejor la respuesta instrumental crítica con el reforzador

demorado. Otra forma de abordar este tema es considerar que cuando el

reforzamiento es demorado, el reforzador sucede independientemente de la

conducta. Cuando se presenta un reforzador independientemente de la

conducta, el sujeto no puede fácilmente decir cuándo será reforzado.

Otra consecuencia del reforzamiento independiente de la respuesta es el

condicionamiento de claves contextuales. Si hay una demora entre la

respuesta crítica y la entrega del reforzador, el reforzador ocurrirá en el

contexto experimental sin ser señalado por la respuesta. Esto permitirá

condicionar las claves contextuales.

LA CONTINGENCIA RESPUESTA-REFORZADOR

La contingencia respuesta-reforzador se refiere al hecho de que la entrega del

reforzador es dependiente de la ocurrencia previa de la respuesta

instrumental.

La contigüidad respuesta-reforzador más que la contingencia era el factor

crítico que producía el aprendizaje instrumental. No obstante, esta visión ha

resultado injustificada por la investigación posterior. La contingencia

respuesta-reforzador es también importante.

EL EFECTO DE SUPERSTICIÓN DE SKINNER

La explicación de Skinner de la conducta supersticiosa descansa en la idea de

reforzamiento accidental, o adventicio. El reforzamiento adventicio se refiere

al emparejamiento accidental de una respuesta con la entrega del reforzador.

Los animales siempre están haciendo algo, incluso si no se requieren

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

52

respuestas particulares para obtener comida. Skinner sugirió que cualquier

respuesta que un sujeto realizase por casualidad justo antes de conseguir la

comida llegaría a fortalecerse y posteriormente incrementaría su frecuencia

debido al reforzamiento adventicio.

Un emparejamiento accidental de una respuesta con la comida incrementa la

oportunidad de que la misma respuesta ocurra justo antes de la próxima

entrega de comida. Un segundo emparejamiento accidental respuesta-

reforzador aumenta aún más la probabilidad de la respuesta. De esta forma,

cada emparejamiento accidental ayuda a "estampar" una respuesta particular.

Después de un tiempo, la respuesta ocurrirá frecuentemente, de forma

suficiente para ser identificada como conducta supersticiosa.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

53

CAPÍTULO 6.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

54

PSICOLOGÍA DEL APRENDIZAJE.

CAPÍTULO 6: PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIÓN.

INDICE DEL CAPÍTULO.

8. PROGRAMAS DE REFORZAMIENTO INTERMITENTE

8.1 PROGRAMAS DE RAZÓN

8.2 PROGRAMAS DE INTERVALO

8.3 COMPARACIÓN DE LOS PROGRAMAS DE RAZÓN Y DE INTERVALO

8.4 PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA

9. CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES

9.1 MEDIDAS DE LA CONDUCTA DE ELECCIÓN

9.2 LA LEY DE LA IGUALACION

9.3 MECANISMOS DE LA LEY DE LA IGUALACIÓN

10. ELECCIÓN CON COMPROMISO

10.1 PROGRAMAS CONCURRENTES ENCADENADOS

10.2 ESTUDIOS DE “AUTOCONTROL”

INTRODUCCIÓN GENERAL AL CAPÍTULO.

Un PROGRAMA DE REFORZAMIENTO es un programa o regla que

determina la forma en que se relacionan las presentaciones del reforzador con

las ocurrencias de la respuesta instrumental.

La importancia de los programas de reforzamiento reside en que determinan

la tasa y el patrón de las respuestas instrumentales.

ATENCIÓN: es importante tener en cuenta que un procedimiento de

condicionamiento instrumental no implica que cada respuesta instrumental

lleve asociada la entrega de un reforzador, no existe normalmente esa

contingencia perfecta (no siempre está el autobús cuando llegamos a la

parada).

Esto nos lleva constatar que normalmente la relación entre las respuestas

instrumentales y el reforzamiento posterior es bastante compleja, razón por la

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

55

que los programas de reforzamiento se han llevado al estudio en el

laboratorio. Esto ayuda a analizar y constatar cómo las diferentes relaciones

respuestas instrumentales-reforzador, controlan la ocurrencia o no de

respuestas instrumentales.

Es decir, un programa de reforzamiento se puede establecer de muchas

formas, en base a que es un programa (o regla) que determina cómo y cuándo

un reforzador apoyará una respuesta instrumental concreta.

Es bastante manejable catalogar y registrar los efectos conductuales que

pueden llegar a producir los distintos programas de reforzamiento, debido

sobre todo a que el patrón de resultados en un programa y otro puede ser

bastante predecible, si se establecen (en los distintos programas) relaciones

similares entre los estímulos, las respuestas y los reforzadores. Las relaciones

similares entre estos elementos producen patrones de conducta similares.

Un programa de reforzamiento influye en la forma de aprender una respuesta

instrumental y en la forma en que se mantiene esa respuesta por el

reforzamiento. La investigación se suele centrar en los factores que hacen que

se mantengan las respuestas instrumentales adquiridas, y en cómo se pueden

realizar de manera continuada. Sin embargo no ha habido tanto interés es

cómo esa conducta instrumental se adquiere.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

56

PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE.

PROGRAMAS DE RAZÓN:

- el reforzamiento depende sólo del número de respuestas que el organismo realiza.

- Sólo requiere contar el número de respuestas que han ocurrido y entregar el reforzador cada vez que se alcance el número requerido.

- Técnicamente se denominan PROGRAMAS DE REFORZAMIENTO CONTINUO (RFC)

- El reforzamiento continuo no suele suceder nunca fuera del laboratorio, y suele darse de forma ocasional. Las situaciones en las que la

respuestas se refuerza sólo alguna vez incluyen un REFORZAMIENTO PARCIAL O INTERMITENTE.

PROGRAMAS DE RAZÓN FIJA (RF).

- Es necesario un número fijo de respuestas para conseguir el reforzamiento.

- Los programas de reforzamiento continuo son también programas de razón

fija.

- El patrón típico de los programas de razón fija es: una tasa constante de

respuestas una vez que se ha iniciado la conducta, aunque se puede tardar

un tiempo hasta que se consigue el número fijo de respuestas que se

necesitan para obtener el reforzador.

- Estas características de la respuesta se ven con claridad en un registro

acumulativo de la conducta, que es el instrumento para representar la forma

PROGRAMAS DE RAZÓN VARIABLE (RV).

- Procedimiento en el que se necesita un número de respuestas

distinto para la entrega de cada recompensa.

- Las pausas predecibles en la tasa de respuesta son menos

probables con los programas de RV que con los programas de

RF, ya que el número de respuestas necesario para conseguir el

reforzamiento no es predecible.

1 Si el requerimiento de la razón se incrementa un poco, de 120 picotazos a 150 picotazos para conseguir un refuerzo por ejemplo, la tasa de respuesta puede permanecer igual durante la carrera de la razón. Con mayores requerimientos de tasa tienden a ocurrir pausas de reforzamiento más largas.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

57

de repetirse una respuesta a lo largo del tiempo.

- El registro muestra el número total de respuestas que han ocurrido hasta un

momento determinado en el tiempo. Da una imagen visual de cuándo y con

qué frecuencia responde el sujeto durante la sesión.

- PAUSA POSREFORZAMIENTO: tasa cero de respuesta que se observa

justo después del reforzamiento.

- CARRERA DE LA RAZÓN: tasa de respuesta alta y estable que completa

cada requerimiento de la razón1.

- TENSIÓN DE LA RAZÓN: efecto que se produce si el requerimiento de la

razón sufre un incremento súbito y significativo, es probable que el animal

realice una pausa periódica cada vez que complete la razón requerida.

PROGRAMAS DE INTERVALO:

- las respuestas son reforzadas sólo si ocurren cuando ha transcurrido cierta cantidad de tiempo. En los programas de razón el reforzamiento

dependía sólo del número de respuestas que el organismo ha realizado.

- En un programa simple de intervalo una respuesta se refuerza sólo si se da después de que haya transcurrido un tiempo desde la última

entrega del reforzador.

- PROGRAMAS DE INTERVALO Y ESPERA LIMITADA: en los programas de intervalo simples, una vez que está disponible el

reforzador, permanece disponible hasta que se realiza la respuesta requerida, no importa cuánto tiempo cueste. Cuando se hace lo mismo

fuera de laboratorio, lo común es que los reforzadores estén disponibles sólo durante periodos de tiempo limitados. Esta restricción en el

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

58

tiempo durante el que permanece disponible el reforzador, se denomina ESPERA LIMITADA.

- Las restricciones que se pueden añadir a través de la espera limitada se pueden aplicar tanto a los programas de intervalo fijo como a los

programas de intervalo variable.

PROGRAMAS DE INTERVALO FIJO (IF).

- el tiempo establecido para la entrega del reforzador no varía de una ocasión

a la siguiente.

- Se dan en situaciones en las que se necesita una cantidad fija de tiempo

para dispensar el reforzador.

- Las respuestas se refuerzan sólo si ocurren después de que haya

transcurrido una cantidad fija de tiempo desde la administración del

reforzador previo, o desde el comienzo del programa.

- FESTÓN DE INTERVALO FIJO: es el patrón de respuesta que se

desarrolla con los programas de reforzamiento de IF.

- Es importante tener en cuenta que un programa de IF no garantiza que el

reforzador se dará en algún momento a lo largo del intervalo de tiempo. Se

necesitan respuestas instrumentales para conseguir el reforzador.

- El intervalo determina cuándo el reforzador está disponible, no cuándo se

entrega, eso vendrá determinado por la ocurrencia de la respuesta

instrumental.

PROGRAMAS DE INTERVALO VARIABLE (IV).

- las respuestas se refuerzan si se dan tras haber transcurrido un

intervalo variable desde la administración del reforzador previo,

o desde el comienzo del programa.

- El sujeto tiene que realizar la respuesta instrumental para

obtener el reforzador. Los reforzadores se dan sólo si el

organismo responde tras un intervalo variable.

- Son programas que mantienen tasas de respuesta constantes y

estables sin pausas regulares.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

59

COMPARACIÓN PROGRAMAS DE RAZÓN Y PROGRAMAS DE INTERVALO

- RAZÓN FIJA E INTERVALO FIJO: producen una pausa posreforzamiento después de la administración de cada reforzador.

- RAZÓN FIJA E INTERVALO FIJO: producen tasas altas de respuesta justo antes de la administración del siguiente reforzador.

- RAZÓN VARIABLE E INTERVALO VARIABLE: mantienen tasas estables de respuesta, sin pausas predecibles.

- INTERVALO Y RAZÓN: activan diferentes cambios neuroquímicos en el cerebro.

- INTERVALO: la conducta que mantienen está mediada por el sentido temporal del organismo.

- RAZÓN: la actuación que provocan no contiene influencia de los mecanismos temporales.

PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA.

- Necesitan de forma específica que el organismo responda a una tasa particular para obtener el reforzador.

- Los programas de razón producen tasas de respuesta mayores que los programas de intervalo, pero ni el uno ni el otro requieren una tasa

específica de respuesta para conseguir el reforzamiento.

- En Tasas de respuesta el reforzamiento de una respuesta particular depende de cuánto de pronto ocurre la respuesta precedente. Es un

procedimiento que fomenta tasas altas de respuesta y se denomina REFORZAMIENTO DIFERENCIAL DE TASAS ALTAS (RDA).

- En los RDA una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente.

Se consigue el resultado opuesto si se refuerza una respuesta sólo si ocurre después de que haya transcurrido cierta cantidad de tiempo

desde la respuesta previa. Este procedimiento se denomina REFORZAMIENTO DIFERENCIAL DE TASAS BAJAS (RDB), y fomenta

que los sujetos respondan lentamente.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

60

2. CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES.

- Son programas que al contrario que los anteriores incluyen más de una única

respuesta reforzable.

- Los psicólogos realizan investigaciones experimentales sobre los mecanismos

de elección mediante el estudio de situaciones de elección simples. La

situación más simple consta de dos respuestas alternativas, cada una de ellas

seguida por un reforzador de acuerdo con su propio programa de

reforzamiento.

- Implica que los dos programas de reforzamiento funcionen al mismo tiempo

o concurrentemente, y el sujeto es libre de cambiar de alternativa cada vez. Es

un procedimiento que se llama PROGRAMA CONCURRENTE. Permite una

medición continua de la elección porque el organismo es libre de cambiar

entre una y otra opción de respuesta en cualquier momento.

2.1 MEDIDAS DE LA CONDUCTA DE ELECCIÓN:

- TASA RELATIVA DE RESPUESTA DE CADA ALTERNATIVA: se

calcula dividiendo la tasa de respuesta a la alternativa correspondiente, entre

la tasa total de respuestas en ambas alternativas.

- TASA RELATIVA DE REFORZAMIENTO conseguido para cada

alternativa de respuesta: se calcula dividiendo la tasa de reforzamiento de la

alternativa correspondiente, entre la tasa total de reforzamiento de ambas

alternativas.

2.2 LA LEY DE LA IGUALACIÓN:

- ley de la conducta establecida por Hernstein, que establece el principio básico

de que las tasas relativas de respuesta se igualan con las tasas relativas de

reforzamiento.

- Indica que las elecciones no se hacen de forma caprichosa, sino que son una

función ordenada de las tasas de reforzamiento.

- INFRAIGUALACIÓN, SUPRAIGUALACIÓN Y SESGO DE

RESPUESTA: A pesar del éxito de la Ley de la Igualación, se comprueba

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

61

que las tasas relativas de respuesta no siempre se igualan con las tasas

relativas de reforzamiento.

- INFRAIGUALACIÓN: un tipo de desviación de la igualación perfecta,

incluye una sensibilidad reducida de la conducta de elección a las tasas

relativas de reforzamiento.

- SUPRAIGUALACIÓN: la tasa relativa de respuestas es más sensible a

la tasa relativa de reforzamiento de lo que se predice para una igualación

perfecta.

- SESGO DE RESPUESTA: influyen en la elección cuando las

alternativas de respuesta son diferentes, o cuando el reforzador

proporcionado para las dos respuestas es diferente.

- LEY DE IGUALACIÓN Y VALOR DEL REFORZADOR: las

características de un reforzador como su cantidad o palatabilidad y demora,

pueden considerarse aspectos de su valor general.

- LEY DE IGUALACIÓN Y PROGRAMAS SIMPLES DE

REFORZAMIENTO: incluso las situaciones de respuesta única pueden

conllevar una elección, entre realizar la respuesta especificada u ocuparse de

otras posibles actividades. En un programa simple el sujeto recibe no sólo

reforzamiento explícito por realizar una respuesta operante específica, sino

también recompensas intrínsecas de las otras actividades que pueda realizar.

2.3 MECANISMOS DE LA LEY DE LA IGUALACIÓN:

- MAXIMIZACIÓN MOLECULAR: los organismos siempre eligen

cualquier alternativa de respuesta con mejores probabilidades de que sea

reforzada en ese momento.

- MAXIMIZACIÓN MOLAR: el organismo distribuye sus respuestas entre

las varias alternativas a fin de maximizar la cantidad de reforzamiento que

consiguen a la larga.

- MEJORAMIENTO: no es ni un mecanismo molar ni uno molecular. Opera

en una escala temporal que está entre la escala temporal de las teorías molar y

molecular. Muchos aspectos de la conducta no son óptimos a largo plazo, en

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

62

algún momento de la conducta se determinan con nuestras elecciones

situaciones futuras. Son elecciones inocentes que trata de caracterizar el

mejoramiento.

3. ELECCIÓN CON COMPROMISO.

- El AUTOCONTROL influye en las elecciones importantes de la vida, que

implican a veces un beneficio pequeño a corto plazo, frente a un beneficio

más demorado, más a largo plazo, pero mayor. Este es el problema

fundamental del autocontrol.

- PROGRAMAS CONCURRENTES ENCADENADOS: a nivel de

investigación experimental en laboratorio es complicado plantear

experimentos que impliquen directamente elecciones importantes (decidir

seguir estudiando o dejarlo y empezar a trabajar). La técnica básica en esta

área de investigación es el PROGRAMA CONCURRENTE ENCADENADO

DE REFORZAMIENTO. Involucra al menos dos fases o eslabones, el de

elección y el terminal. Implican una elección con compromiso.

 

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

63

CAPÍTULO 7.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

64

PSICOLOGÍA DEL APRENDIZAJE.

CAPÍTULO 7: CONDICIONAMIENTO INSTRUMENTAL. MECANISMOS MOTIVACIONALES.

11. LA ESTRUCTURA ASOCIATIVA DEL CONDICIONAMIENTO

INSTRUMENTAL

- Thorndike: el condicionamiento instrumental incluye algo más que una respuesta

y un reforzador. La respuesta instrumental se da en presencia de estímulos

particulares.

- En un análisis del condicionamiento instrumental se deben tener en cuenta tres

sucesos: el contexto estimular (E), la respuesta instrumental (R) y la

consecuencia de la respuestas o reforzador (C)

- Para Skinner también se localizan tres sucesos, y el condicionamiento

instrumental lo describe como una contingencia de tres términos que incluía E,

R y C.

11.1 LA ASOCIACIÓN E-R Y LA LEY DEL EFECTO

- La estructura básica de un procedimiento de condicionamiento instrumental

permite el desarrollo de varios tipos diferentes de asociaciones. El primero de

ellos es una asociación entre los estímulos contextuales E y la respuestas

instrumental R. Es decir, una asociación E-R.

- Para Thorndike esta asociación es la clave del aprendizaje instrumental en su

Ley del Efecto. De acuerdo con esta ley el papel del reforzador (la consecuencia

de la respuesta) es establecer una asociación entre las claves contextuales E y la

respuesta instrumental R. Según el autor una vez establecida la asociación ella

sería la única responsable de la ocurrencia de la respuesta instrumental.

- Una implicación importante es que el condicionamiento instrumental no incluye

el aprendizaje acerca del reforzador, o relación entre la respuesta y la

consecuencia reforzante. La ley asume que el único papel del reforzador es crear

una asociación E-R, y que no es un parte de la asociación.

11.2 EXPECTATIVA DE RECOMPENSA Y LA ASOCIACIÓN E-C

- La clave es cómo captar la noción de que los sujetos aprenden a esperar el

reforzador durante el curso del condicionamiento instrumental.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

65

- Una de las explicaciones más influyentes del papel del condicionamiento clásico

en la conducta instrumental fue propuesta por Hull. Asume que durante el curso

del condicionamiento instrumental la respuesta instrumental llega a ser motivada

por dos factores. El primero: la presencia de E evoca la respuesta instrumental

directamente por asociación con R mediante la asociación E-R. El segundo: la

actividad instrumental llega a realizarse en respuesta a la expectativa de

recompensa debido al establecimiento de una asociación R-C (la forma concreta

en que esta asociación llega a motivar la conducta instrumental ha sido tema de

debate e investigación).

LA TEORÍA MODERNA DE LOS DOS PROCESOS.

- Asume que hay dos tipos de aprendizaje distintos: el condicionamiento

pavloviano y el instrumental.

- Asume además que estos dos procesos están relacionados de una forma especial:

durante el curso del condicionamiento instrumental los estímulos E se cree que

llegan a asociarse con la consecuencia de la respuesta C a través del

condicionamiento pavloviano para establecer una asociación E-C. A través de

ella el estímulo E llega a motiva la conducta instrumental mediante la activación

de un Estado Emocional Central. Su naturaleza dependerá de la naturaleza del

reforzador.

- RESULTADOS CONSECUENTES CON LA TEORÍA MODERNA DE

LOS DOS PROCESOS: los estudios que evalúan la teoría utilizan para ello un

diseño experimental que se llama Experimento de Transferencia de Control, que

consta de tres fases. La primera incluye un condicionamiento instrumental de

una respuesta operante utilizando algún programa de reforzamiento positivo o

negativo. En la fase 2 se entrena a los participantes con un condicionamiento

clásico en el que se asocia un EC explícito con la presencia o ausencia de un

estímulo incondicionado. La fase 3 es la de transferencia crítica, y en ella se

permite a los participantes que realicen la respuesta instrumental y se presenta

periódicamente el EC de la fase 2 para observar su efecto en la tasa de conducta

instrumental.

- INTERACCIONES DE RESPUESTA EN LOS EXPERIMENTOS DE

TRANSFERENCIA DE CONTROL: los estímulos condicionados

clásicamente elicitan no solo estados emocionales, sino también respuestas

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

66

abiertas. Es decir, un estímulo clásicamente condicionado puede influir sobre la

conducta instrumental a través de las respuestas abiertas que elicita.

- ¿ESTADOS EMOCIONALES CENTRALES CONDICIONADOS E

EXPECTATIVAS ESPECÍFICAS DE RECOMPENSA?: la teoría moderna

de los dos procesos asume que el condicionamiento clásico media la conducta

instrumental a través del condicionamiento de estados emocionales centrales

como la esperanza. Los animales también adquieren expectativas específicas de

recompensa en lugar de estados emocionales centrales más generales durante el

condicionamiento instrumental y clásico. Las asociaciones E-C parecen ser

fundamentales para la motivación de la conducta instrumental.

11.3 RELACIÓN R-C Y E(R-C) EN EL CONDICIONAMIENTO

INSTRUMENTAL

- Se ha visto que hay dos asociaciones que pueden motivar la conducta

instrumental: la asociación de Thorndike E-R y la asociación E-C que activa una

expectativa específica de recompensa o un estado emocional. No se puede

explicar toda la motivación de la conducta instrumental en términos de estas dos

asociaciones.

- Primero por que ninguna incluye una conexión directa entre la respuesta R y el

reforzador o consecuencia de la respuesta C. A pesar de que las explicaciones

informales de la conducta instrumental enfatizan las asociaciones R-C estas no

existen en los modelos de los dos procesos.

- Segundo, la estructura asociativa del condicionamiento instrumental asumida por

las teorías de los dos procesos es que E se supone que llega a estar asociado

directamente con C en la idea de que el emparejamiento de E con C es suficiente

para la ocurrencia de condicionamiento clásico. Sin embargo los

emparejamientos EC-EI no son suficientes para el desarrollo de asociaciones

pavlovianas.

- EVIDENCIA DE ASOCIACIONES R-C. Algunas investigaciones indican

que el condicionamiento instrumental lleva al aprendizaje de asociaciones

respuesta-consecuencia, y se han obtenido evidencias que apoyan esta

posibilidad. Una técnica común incluye devaluar el reforzador después del

condicionamiento para ver si esto disminuye la respuesta instrumental. Es una

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

67

estrategia análoga a la estrategia de la devaluación del EI en los estudios de

condicionamiento pavloviano.

- EVIDENCIA DEL APRENDIZAJE DE UNA RELACIÓN JERÁRQUICA

E-(R-C): la evidencia anterior muestra de forma clara que los organismos

aprenden a asociar la respuesta instrumental con su consecuencia. Sin embargo

las asociaciones R-C no pueden actuar aisladamente para producir la conducta

instrumental. El hecho de que la respuesta instrumental active una expectativa

del reforzador no es suficiente para clarificar lo que produce la respuesta. Se

necesita un factor adicional para activar la asociación R-C. Una posibilidad es

que la asociación R-C sea activada por los estímulos E que están presentes

cuando la respuesta es reforzada. De acuerdo con esto E no activa R

directamente, sino que activa la asociación R-C.

12. REGULACIÓN CONDUCTUAL

12.1 ANTECEDENTES DE LA REGULACIÓN CONDUCTUAL

- Los reforzadores eran inicialmente considerados como tipos especiales de

estímulos. Los teóricos estaban de acuerdo en que los reforzadores eran

estímulos especiales que fortalecían la conducta instrumental.

- LA TEORÍA DE LA RESPUESTA CONSUMATORIA: la idea básica es que

los reforzadores son estímulos. Muchos reforzadores elicitan respuestas

incondicionadas propias de la especie. La teoría de la respuesta consumatoria

atribuye el reforzamiento a estas conductas típicas de la especie. Se establece

que las respuestas consumatorias típicas de la especie son en sí mismas el rasgo

crítico de los reforzadores.

- EL PRINCIPIO DE PREMACK: el autor indicó que las respuestas incluidas

en los reforzadores normalmente utilizados eran actividades que es muy

probable que realicen los animales. Por el contrario las respuestas instrumentales

son actividades que normalmente ocurren a una baja probabilidad. Este principio

se centra en la diferencia de la probabilidad de las respuestas instrumental y

reforzadora, por eso se llama también PRINCIPIO DE LA PROBABILIDAD

DIFERENCIAL. El principio de Premack fue un avance importante ya que

promovió la consideración de los reforzadores como respuestas más que como

estímulos, y amplió mucho el rango de cosas que se empezaron a utilizar como

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

68

reforzadores. Cualquier actividad podía servir como un reforzadote siempre y

cuando fuera más probable que la respuesta instrumental.

- LA HIPÓTESIS DE LA PRIVACIÓN DE RESPUESTA: da un nuevo

principio para predecir lo que servirá como reforzador efectivo. También da un

nuevo procedimiento para crear reforzadores, restringir el acceso a la respuesta

reforzadora. Esta hipótesis defiende que la restricción del acceso a una respuesta

por debajo de su línea base de ocurrencia es suficiente para hacer que la

oportunidad de ejecutar esa respuesta actúe como un reforzador positivo

efectivo.

12.2 REGULACIÓN CONDUCTUAL Y EL PUNTO DE DELEITE

CONDUCTUAL

- los organismos tienen una distribución de actividades preferida u óptima que

luchan por mantener frente a los cambios o interrupciones. Las teorías de la

regulación conductual se centran en el grado en que la contingencia instrumental

respuesta-reforzador rompe la estabilidad conductual y empuja al individuo

fuera de su distribución de actividades preferida u óptima.

- EL PUNTO DE DELEITE CONDUCTUAL: cada situación da varias

oportunidades de respuesta. La teoría de la regulación conductual asume que si

los organismos son libres para distribuir sus respuestas entre las alternativas

posibles, lo harán de la forma en que sea más cómodo o en algún sentido óptimo

para ellos. Esta distribución de respuesta define el punto de deleite conductual.

Esta distribución variará de una situación a otra. El punto de deleite conductual

puede identificarse mediante la frecuencia relativa de ocurrencia de todas las

respuestas de un organismo en una situación sin restricciones.

- IMPOSICIÓN DE UNA CONTINGENCIA INSTRUMENTAL: cómo

afectaría la introducción de una contingencia instrumental entre estudiar y ver la

televisión al deleite conductual del estudiante, dependerá de la naturaleza de la

contingencia, programa mediante el que se pide al estudiante que estudie la

misma cantidad de tiempo que dedica a ver la televisión. Una contingencia

instrumental no permite volver al punto de deleite. Standon propuso un

MODELO DE DESVIACIÓN MÍNIMA que indica que la introducción de

una contingencia respuesta-reforzador provoca que los organismos redistribuyan

sus conductas entre las respuestas instrumentales y contingentes de manera que

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

69

se minimice la desviación total de las dos respuestas con respecto al punto

óptimo o de deleite.

- EXPLICACIÓN DE LOS EFECTOS DEL REFORZAMIENTO: el efecto

de reforzamiento se identifica por un incremento en la ocurrencia de una

respuesta instrumental sobre el nivel de esa conducta en ausencia de la

contingencia respusta-reforzador.

- UNA VISIÓN SOBRE LAS CONTINGENCIAS DE REFORZAMIENTO

EN UN CONTEXTO CONDUCTUAL MÁS AMPLIO: el contexto influye

en el sentido de que las contingencias instrumentales no suceden en vacío sino

en un entorno en el que se pueden dar una variedad amplia de respuestas y

reforzadores.

PROBLEMAS CON LAS APROXIMACIONES DE REGULACIÓN

CONDUCTUAL.

- el punto de deleite es una característica molar de la conducta. Se basa en una

medida de cada respuesta acumulada a lo largo de un bloque temporal amplio.

- Otro problema es que las respuestas durante un periodo de línea de base libre no

siempre tienen el mismo valor como respuestas que ocurren como parte de una

contingencia instrumental impuesta.

- La regulación conductual no estudia los procesos conductuales moleculares, por

lo tanto no dice nada acerca de cómo los organismos defienden una combinación

preferida de bienes o actividades.

CONTRIBUCIONES DE LA REGULACIÓN CONDUCTUAL:

1. La regulación conductual y el principio de Premack nos alejó de la consideración

de los reforzadores como tipos especiales de estímulos o como tipos especiales de

respuestas.

2. Los procedimientos de condicionamiento instrumental ya no se considera que

“estampan” o “fortalecen” la conducta instrumental, en su lugar es visto como una

nueva distribución de respuestas.

3. No existe una distinción fundamental entre las respuestas instrumentales y las

reforzadoras. Se distinguen únicamente por los papeles asignados a ellas mediante

un procedimiento de condicionamiento instrumental.

4. La regulación conductual y la economía conductual aceptan la idea de que los

organismos responden para maximizar sus beneficios.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

70

5. La regulación conductual y la economía conductual han proporcionado caminos

nuevos para describir las restricciones que imponen varios procedimientos de

condicionamiento instrumental en el repertorio de conducta de un organismo.

12.3 CONCEPTOS ECONÓMICOS Y DISTRIBUCIÓN DE RESPUESTAS

- Economía: La economía es el estudio de la distribución de la conducta dentro de

un sistema de restricciones. Las restricciones de la conducta se imponen por los

ingresos de un individuo y el precio de los bienes que se quiere obtener.

- Psicología: En las situaciones de condicionamiento instrumental, las

restricciones están proporcionadas por el número de respuestas que un

organismo es capaz de realizar y el número de respuestas requerido para obtener

el reforzador.

- Demanda del consumidor: Es fundamental la relación entre el precio de una

comodidad y cuánto se obtiene, esto se denomina curva de la demanda.

- Elasticidad de la demanda: Grado en el cual el precio influye en el consumo.

La demanda de caramelos es muy elástica, quiere decir que conforme más suba

el precio de los caramelos más descenderá su compra.

- Esto se relaciona con el condicionamiento instrumental mediante el

establecimiento de analogías.

a. El número de respuestas (o tiempo dedicado a responder) es el dinero.

b. El “precio” de un reforzador es el tiempo o número de respuestas requeridas

para obtener (adquirir) el reforzador.

- La meta es comprender cómo la conducta instrumental (gasto) está controlada

por las contingencias instrumentales (precios).

- Determinantes de la elasticidad de la demanda: Existen 3 factores que

influyen en cómo las restricciones de un programa moldean la redistribución de

la conducta:

1. Disponibilidad de sustitutos: El grado en que los aumentos en el precio de un

artículo producen una disminución en el consumo depende de la disponibilidad

(y precio) de otros bienes que puedan utilizarse en sustitución del artículo

original. La disponibilidad de sustitutos aumenta la sensibilidad del artículo

original a los precios altos.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

71

2. Rango de precios: Un aumento en el precio tiene menos efecto en precios

bajos que en precios altos. En un rango de precios bajos, la demanda de comida

no es elástica.

3. Nivel de ingresos: Cuanto más salario, menos se desanimará un consumidor

con los incrementos del precio. Extrapolando esto a los programas de

reforzamiento, el número de respuestas o el tiempo disponible para responder

corresponde a los ingresos, por lo tanto cuantas más respuestas o tiempo tengan

disponibles los animales, menos estará su conducta influida por los aumentos en

el coste del reforzador.

12.4 PROBLEMAS CON LAS APROXIMACIONES DE REGULACIÓN

CONDUCTUAL

- Están basadas en la asunción de que los individuos buscan la defensa de una

combinación de actividades “óptima” o preferida, o punto de deleite

(redistribución de las conductas entre las respuestas instrumentales y

reforzadores u optando por sustituir los reforzadores)punto de vista molar.

Una adecuada caracterización del punto del “deleite conductual” requiere

información sobre las pautas de elección moleculares.

- Hacer algo cuando no hay requerimientos expuestos externamente (correr por

placer por ejemplo) parece ser diferente de hacer lo mismo cuando se requiere

por una contingencia instrumental impuesta (correr en la clase de E. Física).

- Proporcionan una aproximación para entender los intercambios que hacen los

animales entre conjuntos alternativos de bienes, pero no trata sobre los procesos

que están involucrados en hacer esos intercambios.

12.5 CONTRIBUCIÓN DE LA REGULACIÓN CONDUCTUAL

- Los reforzamientos dependen de las preferencias en la línea base. No considera

que los reforzadores que son eficaces en una situación lo van a ser en otras

(teoría de la reducción del impulso).

- El condicionamiento instrumental no “estampa” una conducta instrumental, sino

que crea una nueva distribución o reparto de las respuestas.

- No hace distinción entre respuestas instrumentales y reforzadoras (se distinguen

solo por los papeles que les son asignados por una contingencia instrumental).

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

72

- Concibe los efectos del reforzamiento como una manifestación de la forma en

que los animales se esfuerzan por distribuir sus respuestas entre las alternativas

para alcanzar la posibilidad mejor (adaptación del organismo a su ambiente).

- Todas las opciones de respuesta del organismo que se dan en un momento dado

deben ser consideradas como un sistema. Los cambios en una parte del sistema

influyen en otras partes.

 

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

73

CAPÍTULO 8.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

74

PSICOLOGÍA DEL APRENDIZAJE.

CAPÍTULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO.

13. IDENTIFICACIÓN Y MEDIDA DEL CONTROL POR EL ESTÍMULO

13.1 RESPUESTA DIFERENCIAL Y DISCRIMINACIÓN DE ESTÍMULOS

- Se dice que un organismo muestra discriminación de estímulos si responde de

forma diferente a dos o más estímulos. La discriminación de estímulos y el

control por el estímulo constituyen dos maneras de considerar el mismo

fenómeno: una no existe sin la otra. Si un organismo no discrimina entre dos

estímulos, su conducta no está bajo el control de esas claves.

- En ausencia de procedimientos especiales (que se describen más adelante en este

capítulo), los investigadores no siempre pueden predecir cuál de varios

estímulos de aquellos que un organismo experimenta adquirirá control sobre su

conducta instrumental.

13.2 GENERALIZACIÓN DE ESTÍMULOS

- Un organismo muestra generalización de estímulos si responde de forma similar

a dos o más estímulos. En el caso de Pavlov se muestra al comprobar cómo

variantes del EC pueden elicitar una respuesta condicionada igual que el EC

inicial.

13.3 LOS GRADIENTES DE GENERALIZACIÓN DEL ESTÍMULO

COMO MEDIDAS DE CONTROL POR EL ESTÍMULO

- Los gradientes dan información sobre el grado de sensibilidad de una conducta

antes de la variación de un aspecto particular del ambiente. Esto ayuda a los

investigadores a determinar de manera exacta el grado en que tiene que

modificarse el estímulo para producir un cambio en la conducta.

- Unido a la cuestión anterior de generalización del estímulo, el gradiente es el

intervalo (de onda, de color, de sonido, de intensidad….) donde se generalizan

las respuestas.

- Si un gradiente es muy plano el rasgo que se varía en la conducta instrumental

en dependencia de este gradiente no controla la conducta instrumental; sin

embargo, si el gradiente es muy acusado, el organismo responde en mayor

medida a algunos estímulos de prueba que a otros. LO ACUSADO DEL

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

75

GRADIENTE DE GENERALIZACIÓN DE UN ESTÍMULO PROPORCIONA

UNA MEDIDA PRECISA DEL GRADO DE CONTROL DEL ESTÍMULO.

14. FACTORES DEL ESTÍMULO Y LA RESPUESTA EN EL CONTROL POR EL

ESTÍMULO

- ¿Qué es lo que determina que una de las muchas características de una situación

estimular adquiera control sobre la conducta instrumental?

14.1 CAPACIDAD SENSORIAL Y ORIENTACIÓN

- La capacidad sensorial y de orientación determinan qué estímulos se incluyen en

el mundo sensorial de un organismo. Lo que esté fuera de su rango sensorial no

existe para un él (los seres humanos no podemos oir los ultrasonidos, sin

embargo los perros sí).

14.2 FACILIDAD RELATIVA DEL CONDICIONAMIENTO DE VARIOS

ESTÍMULOS

- Además de tener la capacidad sensorial, la intensidad con que los organismos

aprenden sobre un estímulo determinado depende de la facilidad relativa de

condicionamiento de otras claves presentes en la situación. Esto se conoce como

ENSOMBRECIMIENTO (un niño aprende a leer viendo los dibujos y sin hacer

caso a las frases. Cuando describa los dibujos parecerá que lee, aunque no sea

así).

- Cuanto más intenso sea el estímulo más rápido se condicionará y ensombrecerá

el aprendizaje del estímulo más débil.

14.3 TIPO DE REFORZAMIENTO

- Para una misma combinación de estímulos se pueden dar respuestas diferentes

dependiendo del tipo de condicionamiento usado, debido al sistema de conducta

que se activa en cada caso. Esto se puede explicar por los sistemas de conducta

que se estén activando: para la alimentación son más dominantes las claves

visuales, y para la evitación del peligro los tonos.

- Las palomas reforzadas de forma positiva con comida responden más a una luz

roja que a un tono. Reforzadas de forma negativa con una descarga responden

más al tono que a la luz roja.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

76

14.4 TIPO DE RESPUESTA INSTRUMENTAL

- Otro factor importante es el tipo de respuesta que se esté requiriendo para el

reforzamiento. En respuestas de localización (levantar pata derecha o izquierda)

el control se encuentra en la localización de la clave auditiva; en respuestas de

acción (hacer o no hacer algo) el control se encuentra en el tipo de clave

auditiva. ESTO ES EL EFECTO DE LA NATURALEZA-LOCALIZACIÓN.

- Este efecto es un ejemplo de asociación selectiva, como pueden serlo las claves

relacionadas con el sabor y asociadas a la enfermedad, y las claves audiovisuales

asociadas con la descarga eléctrica (p.226-228).

14.5 ELEMENTOS DEL ESTÍMULO FRENTE A CLAVES

CONFIGURACIONALES EN LOS ESTÍMULOS COMPUESTOS

- APROXIMACIÓN ELEMENTAL DEL ESTÍMULO: los distintos elementos

que forman un estímulo (localización, color, sonido…) son tratados por el

organismo como rasgos distintivos y separados del ambiente.

- APROXIMACIÓN DE LA CLAVE CONFIGURACIONAL: los estímulos son

percibidos como un todo integral y no se dividen en partes más pequeñas..

15. FACTORES DE APRENDIZAJE EN EL CONTROL POR EL ESTÍMULO

- El hecho de que ciertos estímulos puedan percibirse no asegura que llegarán a

controlar la conducta. Para que lo hagan, el organismo debe haber aprendido de

ellos. Según Pavlov, la generalización del estímulo se da porque el aprendizaje

sobre el EC llega a transferirse a otros estímulos. Lashley y Wade afirman sin

embargo que la generalización del estímulo ocurre si los organismos no han

aprendido a distinguir las diferencias entre estímulos. Es decir, la generalización

del estímulo para ellos refleja ausencia de aprendizaje.

15.1 ENTRENAMIENTO EN DISCRIMINACIÓN DE ESTÍMULOS

- Los participantes se exponen a dos estímulos diferentes (luz roja y otra verde)

pero solo se les refuerza en uno de los dos colores. Figura 8.7 p. 231: la luz roja

señala la disponibilidad de reforzamiento para la respuesta. La luz verde señala

que la respuesta no será reforzada.

- El estímulo que señala disponibilidad de reforzamiento se denomina E+ o ED (e

de) El estímulo que señala la falta de reforzamiento se denomina E- o EΔ (e

delta)

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

77

- A medida que progresa el entrenamiento, la respuesta de los organismos en

presencia de E+ aumenta mientras que la respuesta en presencia de E- declina.

Cuando tanto E+ como E- han adquirido control sobre la conducta del

organismo, se llaman estímulos discriminativos.

- PROGRAMA MÚLTIPLE DE REFORZAMIENTO: en un programa múltiple

funcionan diferentes programas de reforzamiento en presencia de diferentes

estímulos.

15.2 EFECTOS DEL ENTRENAMIENTO EN DISCRIMINACIÓN

SOBRE EL CONTROL POR EL ESTÍMULO

- Para poder hacernos una idea de la precisión de control que el E+ adquiere sobre

la conducta instrumental no basta con solamente observar la respuesta

diferencial ante E+ y E-. Se debe también determinar lo acusado del gradiente de

generalización.

15.3 RANGO DE POSIBLES ESTÍMULOS DISCRIMINATIVOS

- Los procedimientos de discriminación pueden ser utilizados para situar la

conducta instrumental de un organismo bajo el control de una amplia variedad

de estímulos. Estos procedimientos se utilizan a menudo para evaluar la

capacidad sensorial de los animales.

- También se realizaron experimentos inyectando cocaína a Palomas para ver si

podían distinguir las sensaciones internas que les provocaba esa droga. La

conclusión fue que efectivamente el entrenamiento en discriminación sí que

aumentó el control de la conducta por las sensaciones internas creadas por la

cocaína.

15.4 ¿QUÉ SE APRENDE EN EL ENTRENAMIENTO DE

DISCRIMINACIÓN?

- Tenemos un E+ (luz roja) y un E- (tono intenso). Un organismo puede aprender

3 cosas diferentes con prácticamente los mismos resultados:

Responder sólo ante la presencia de E+ y no aprender nada acerca de E-

Aprender a suprimir la respuesta durante E- pero no aprender nada acerca

del E+

Aprender el significado tanto de E+ como de E

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

78

- TEORÍA DE SPENCE DEL APRENDIZAJE DE DISCRIMINACIÓN (se basa

en la tercera opción):

La mera observación de que los organismos responden más al E+ que al

E- no es suficiente para probar que han aprendido algo acerca de ambos

estímulos. Se harán experimentos donde se utilicen los gradientes de

generalización del estímulo.

Gradiente de generalización del estímulo excitatorio: si se condiciona una

tendencia excitatoria al E+, debe observarse un gradiente de generalización

acusado con la mayor cantidad de respuesta ante el E+.

Gradiente de generalización del estímulo inhibitorio: si se condiciona una

tendencia inhibitoria al E-, entonces los estímulos que difieran

progresivamente del E- deberían ser cada vez menos efectivos en inhibir la

respuesta instrumental.

Algunos experimentos relacionados con esto muestran que el

entrenamiento en discriminación puede producir tanto condicionamiento

excitatorio al E+ como condicionamiento inhibitorio al E-.

15.5 INTERACCIONES ENTRE EL E+ Y EL E-: DESPLAZAMIENTO

DEL MÁXIMO

- Lo que se aprende el sujeto sobre el E+ puede influir en la respuesta al E- y

viceversa, sobre todo si ambos se encuentran relacionados de alguna manera.

- Discriminación intradimensional: se produce cuando el E+ y el E- son

semejantes excepto por un rasgo o atributo. La discriminación intradimensional

es una forma de ejecución experta. (cuando dos cosas son muy parecidas, hace

falta ser un experto para poder captar las diferencias sutiles)

- Explicación de Spence del desplazamiento del máximo: considera que,

independientemente de los estímulos que se presenten en la prueba de

generalización, es posible calcular el valor del rasgo del estímulo hacia el que va

a desplazarse el máximo de respuestas atendiendo exclusivamente a los valores

netos de los E+ y E- originales.

15.6 ENTRENAMIENTO DE EQUIVALENCIA DE ESTÍMULOS

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

79

- De la misma forma que el entrenamiento en discriminación potencia la respuesta

diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada

o equivalencia de estímulos.

- El emparejamiento de estímulos diferentes con la misma consecuencia crea

equivalencia funcional entre esos estímulos con la consecuencia de que una

respuesta condicionada a uno de ellos se generalizará a los otros.

16. CLAVES CONTEXTUALES Y RELACIONALES CONDICIONALES

- El estímulo discreto es el que se presenta durante un breve período de tiempo y

tiene un comienzo y un final claros.

16.1 CONTROL POR CLAVES CONDUCTUALES

- Las claves contextuales (sin reforzador) pueden llegar a controlar la conducta de

varias formas. El control conductual por el estímulo puede ocurrir sin que un

contexto esté más fuertemente asociado con el reforzamiento que otro.

16.2 CONTROL POR LAS RELACIONES CONDICIONALES

- Las relaciones entre dos eventos (EC-EI, o una respuesta con un reforzador) son

RELACIONES BINARIAS. En ciertas circunstancias la naturaleza de una

relación binaria está determinada por un tercer suceso, denominado

MODULADOR. La relación de un modulador con la relación binaria que señala

se denomina una RELACIÓN CONDICIONAL.

 

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

80

CAPÍTULO 9.

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

81

PSICOLOGÍA DEL APRENDIZAJE.

CAPÍTULO 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA.

17. INTRODUCCIÓN

- Hasta ahora, las descripciones del condicionamiento clásico e instrumental se

han centrado en varios aspectos de la adquisición y mantenimiento de

asociaciones y respuestas nuevas. Los mecanismos de aprendizaje son

importantes porque proporcionan la flexibilidad necesaria a la forma en que los

organismos interactúan con su entorno.

- Los mecanismos de aprendizaje resultan más útiles que los procesos de respuesta

incondicionada porque la plasticidad conductual que proporcionan promueve los

ajustes necesarios al ambiente cambiante.

- Pero si la conducta aprendida es una adaptación al ambiente cambiante, la

pérdida de la conducta condicionada debería ser tan relevante como su

adquisición.

- La adquisición de la conducta condicionada implica procedimeintos en los que

se presenta una consecuencia reforzante. En el condicionamiento pavloviano, la

consecuencia reforzante o estímulo incondicionado se presenta como

consecuencia de un estímulo condicionado. En el condicionamiento

instrumental, la consecuencia reforzante se presenta como una consecuencia de

la respuesta instrumental.

- La extinción implica la omisión del El o reforzador. Por tanto, la extinción en el

condicionamiento clásico incluye presentaciones repetidas del estímulo

condicionado por sí solo. La extinción en el condicionamiento instrumental

implica no volver a presentar el reforzador como una consecuencia de la

respuesta instrumental.

- El resultado típico es que la respuesta condicionada, sea clásica o instrumental,

disminuye. Por tanto, el cambio conductual que se da en la extinción es el

opuesto al que se observaba en la adquisición.

- Debido a que este cambio conductual opuesto se produce mediante la omisión

del reforzador o EI que motivaba el aprendizaje original, la extinción parece ser

lo contrario de la adquisición. Es importante puntualizar que la pérdida de la

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

82

respuesta condicionada que sucede como resultado de la extinción no es lo

mismo que la pérdida de conducta que puede suceder debido al olvido.

- La extinción se produce por la omisión del EI que sigue a las presentaciones del

EC o la omisión de! reforzador que sigue a la respuesta instrumental. El olvido,

por el contrario, es una disminución de la respuesta condicionada que se da

simplemente con el paso del tiempo.

- La extinción sucede como una consecuencia de las presentaciones repetidas del

EC por sí solo o por la ocurrencia repetida de la respuesta instrumental por sí

sola. El olvido se da con la ausencia prolongada de experiencia con el estímulo

condicionado o con la respuesta instrumental.

18. EFECTOS DE LOS PROCEDIMIENTOS DE EXTINCIÓN

- ¿Qué haría si de forma inesperada no puede abrir la puerta de su apartamento

con la llave? Probablemente no desistiría desde el primer momento, sino que lo

intentaría varias veces, tal vez introduciendo la llave de varias maneras. Pero, si

ninguna de esas variaciones de respuesta funciona, terminaría desistiendo. Esto

ilustra dos efectos conductuales de la extinción. El efecto conductual más obvio

es que la respuesta disminuye cuando no vuelve a producir reforzamiento.

- Éste es el efecto principal de la extinción, al que los científicos han prestado

mayor atención. Las investigaciones sobre la extinción se han centrado en la tasa

o la probabilidad de la respuesta instrumental durante el curso de la extinción y

se han interesado en la rapidez con que disminuye esta respuesta. Si la llave de

su apartamento no vuelve a abrir la puerta, cesará en el intento. Pero antes de

desistir por completo, es probable que introduzca la llave de varias formas en un

esfuerzo por hacerla funcionar. Esto ejemplifica el segundo efecto conductual

básico de la extinción, a saber, que aumenta la variabilidad de la respuesta.

- En un estudio reciente de Neuringer y col., participaron dos grupos de ratas.

Durante la primera fase, ambos grupos fueron reforzados por la realización de

respuestas instrumentales, pero sólo se requirió que un grupo variase su

conducta instrumental. Entonces se observó a los dos grupos en la extinción,

para ver cómo se alteraría la tasa y la variabilidad de sus respuestas por la

ausencia de reforzamiento.

- La cámara experimental tenía dos palancas de respuesta en una de las paredes y

una tecla redonda de respuesta en la de enfrente. Durante la fase de

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

83

reforzamiento, las ratas tenían que realizar tres respuestas consecutivas para

obtener una bolita de comida. El Grupo 1 tenía que variar sus secuencias de

respuesta para obtener reforzamiento. Cada sujeto del Grupo 2 estaba acoplado a

un sujeto del grupo de variabilidad (Grupo 1), y recibió reforzamiento en un

ensayo particular sólo si su compañero acoplado obtenía reforzamiento. Los

sujetos del grupo acoplado también tenían que realizar tres respuestas para

conseguir reforzamiento, pero el hecho de que obtuviesen una bolita de comida

no dependía de la variabilidad de sus secuencias de respuesta. Después de que se

estableciese la conducta mediante las contingencias de reforzamiento, ambos

grupos pasaron a la fase de extinción.

- La extinción produjo una disminución en la tasa de respuesta en ambos grupos.

Esta disminución en la respuesta se dio frente a un aumento en la variabilidad de

las secuencias de respuesta que los sujetos ejecutaban. Ambos grupos mostraron

un incremento significativo en la variabilidad de las secuencias de respuesta que

ejecutaron durante la extinción. EI aumento en la variabilidad de la respuesta fue

evidente durante la primera sesión de extinción y se incrementó durante las

sesiones siguientes.

- el incremento en la variabilidad de la respuesta que hubo durante la extinción no

se dio porque los sujetos repitiesen las secuencias que habían realizado durante

la fase de reforzamiento. Este último resultado confirma que la estructura básica

de la conducta instrumental se altera muy poco por el hecho de introducir la

extinción. La extinción disminuye la tasa de respuesta e incrementa la

variabilidad de la respuesta, pero no altera de otro modo la estructura de la

conducta.

19. EXTINCIÓN Y APRENDIZAJE ORIGINAL

- Aunque la extinción produce importantes efectos conductuales y emocionales,

no revierte los efectos de la adquisición. La evidencia de que la extinción no

elimina lo que se aprendió originalmente se ha obtenido a través de estudios

sobre la recuperación espontánea, la renovación, el restablecimiento y los

efectos de la devaluación del reforzador.

- La extinción en el condicionamiento clásico implica que cuando el EC aparece

reiteradamente pero no le sigue el EI la RC desaparece. Disminuye la fuerza o

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

84

frecuencia de una respuesta adquirida porque no se continúa asociando con el EI

y con el EC.

- La extinción en el condicionamiento operante implica que disminuye la fuerza o

frecuencia de una respuesta porque no sigue produciéndose el reforzamiento de

la conducta. La extinción se debe a la retención del refuerzo. La disminución no

siempre es inmediata.

19.1 RECUPERACIÓN ESPONTÁNEA

- TRAS EL CONDICIONAMIENTO PAVLOVIANO. El retorno de la respuesta

condicionada tras un periodo de descanso, o lo que es lo mismo, un intervalo de

tiempo en el que no se presenta ningún estímulo. La extinción se disipa con el

tiempo. Es decir, la RC original vuelve a presentarse si el sujeto se pone a

prueba tras una demora que siga al procedimiento de extinción. Pavlov

descubrió que tras extinguir la RC debido a la presentación única del EC, si se

dejaba pasar un tiempo sin presentar el EC, cuando lo volvía a presentar también

se daba la RC. Esto es la recuperación espontánea. Finalmente Pavlov concluye

que la extinción reprime la RC pero no la elimina.

- TRAS EL CONDICIONAMIENTO INSTRUMENTAL. La extinción aquí

tampoco suprime la respuesta para siempre. Una respuesta (e.j. presión de

palanca) primero serefuerza con la presentación de un estímulo apetitivo o

reforzador (e.j. entrega de una bolita de comida). Cuando la respuesta ya no va

seguida por el reforzador deja de emitirse, es decir, se extingue al no presentar el

reforzador como consecuencia de la respuesta. En esta situación, el paso del

tiempo después de la extinción, también promueve una recuperación espontánea

de la respuesta a la palanca.

19.2 RENOVACIÓN DEL CONDICIONAMIENTO EXCITATORIO

ORIGINAL

- La renovación se refiere a la recuperación de la ejecución propia de la

adquisición que se da cuando se cambian las claves contextuales que estaban

presentes durante la extinción.

- El cambio puede consistir en una vuelta al contexto de la adquisición original o

en un cambio a un contexto “neutral”. La renovación es especialmente

problemática para la terapia de conducta porque significa que los miedos

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

85

irracionales que se extinguieron en el contexto de la consulta de un terapeuta

pueden retornar con facilidad cuando los sujetos se trasladan a un contexto

diferente.

- EI efecto de renovación tiene importantes, (y problemáticas) implicaciones para

la terapia de conducta. Se sugiere que, aunque un procedimiento terapéutico sea

efectivo extinguiendo un miedo patológico o fobia en la seguridad relativa de la

consulta del terapeuta, el miedo condicionado puede volver a presentarse fá-

cilmente cuando el cliente se enfrente con un EC de miedo en un contexto

diferente. Igualmente problemático resulta el hecho de que los efectos del

condicionamiento excitatorio se suelen generalizar de un contexto a otro. Por

tanto, si se adquiere un miedo patológico en una situación dada, es probable que

se sufra en otros contextos. Pero si se supera el miedo en un contexto concreto,

no será tan fácil que esto se generalice a otras situaciones. EI efecto de

renovación sugiere que los problemas creados por el condicionamiento tendrán

efectos mucho más amplios que las soluciones o remedios para esos problemas.

19.3 RESTAURACIÓN DE LA EJECUCIÓN DE LA EXTINCIÓN

- EI efecto de renovación implica la reactivación de la memoria del

condicionamiento excitatorio original mediante la retirada del sujeto de las

claves contextuales presentes durante la extinción. Esto implica reactivar una

conducta aprendida previamente mediante el cambio del contexto a condiciones

más aproximadas a las presentes cuando la conducta se adquirió con

anterioridad. La estrategia puede aplicarse a la extinción; es decir, la ejecución

propia de la extinción puede restaurarse introduciendo claves contextuales que

reactiven la memoria de la extinción. Esto se ha investigado dentro del marco

del fenómeno de la recuperación espontánea.

- La recuperación espontánea implica la recuperación de la conducta condicionada

originalmente que sigue a la extinción si transcurre un período suficiente de

tiempo tras la fase de extinción. La conducta propia de la extinción puede

restaurarse (contrarrestando, por tanto, la recuperación espontánea) presentando

las claves que estaban presentes durante la fase de extinción.

19.4 RESTABLECIMIENTO DE LA EXCITACIÓN CONDICIONADA

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

86

- Otro procedimiento que sirve para restaurar la respuesta a un estímulo

condicionado extinguido recibe el nombre de restablecimiento. EI

restablecimiento se refiere a la recuperación de la respuesta excitatoria a un

estímulo extinguido producida por exposiciones al estímulo incondicionado.

- Como sucedía con la renovación, el restablecimiento constituye un fenómeno

problemático para la terapia de conducta. La terapia de conducta a menudo

implica intentar que los clientes dejen de hacer cosas que les resultan

problemáticas. Debido al restablecimiento, las respuestas que se extinguen con

éxito durante el curso de la intervención terapéutica pueden recuperarse si el in-

dividuo se enfrenta de nuevo con el estímulo incondicionado. EI miedo y la

ansiedad que se adquieren durante el curso de una relación con malos tratos o de

una vida con un padre maltratador pueden reaparecer incluso tras años de terapia

si el individuo se enfrenta a formas semejantes de maltrato en otro momento de

su vida.

- Al igual que ocurría con el efecto de renovación, es importante considerar si el

efecto del restablecimiento puede ser un resultado del condicionamiento

contextual. El condicionamiento contextual es un posible factor contribuyente

debido a que las presentaciones del EI que se dan durante la fase de

restablecimiento pueden producir un condicionamiento de las claves

contextuales de la situación experimental.

- Diversos estudios han demostrado que el papel del contexto en estos casos es

suprimir la ambigüedad de significado de un estímulo que tiene una historia

mezclada de condicionamiento y extinción. El contexto tiene un efecto pequeño

en los estímulos que tienen una historia sólo de condicionamiento.

- En realidad se considera el restablecimiento como una forma de renovación: las

claves contextuales condicionadas proporcionan algunas de las claves

contextuales para la respuesta excitatoria en circunstancias normales. Estas

claves contextuales se extinguen cuando se presenta el EC por sí solo durante la

extinción.

19.5 SENSIBILIDAD A LA DEVALUACIÓN DEL REFORZADOR

- La persistencia del aprendizaje original a pesar de la extinción puede también

investigarse analizando los efectos de la devaluación del reforzador. La deva-

luación del reforzador o EI en el condicionamiento pavloviano altera la

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

87

ejecución de la respuesta condicionada si ésta era el producto de un aprendizaje

E-E más que de un aprendizaje E-R. Rescorla ha utilizado la técnica de

devaluación del EI para determinar si la asociación EC-EI establecida a través de

condicionamiento pavloviano persiste a lo largo de la extinción. Si la extinción

no deteriora la asociación EC-EI, entonces la devaluación del EI alterará la

respuesta a un EC extinguido, como lo hace con la respuesta a un EC que no ha

sido sometido a extinción.

- En una contingencia operante (instrumental), el procedimiento de devaluación

de un reforzador consiste en asociar de forma pavloviana el estímulo que se está

usando para reforzar una conducta (comida, por ejemplo) con algún otro

estímulo de naturaleza inversa, es decir, aversivo (cloruro de litio, por ejemplo).

El efecto resultante es una disminución de la respuesta operante que ha sido

reforzada con el reforzador devaluado aunque esta respuesta nunca haya sido

contingente con el estímulo aversivo, ni siquiera con el reforzador tras el

proceso de devaluación.

- En una contingencia clásica (pavloviana, respondiente), el procedimiento es muy

similar y consiste en asociar el EI (con el que se estaba condicionando el EC)

con otro EI de naturaleza inversa. De nuevo, el efecto encontrado es una

disminución de la RC ante el EC, aunque el EC nunca se haya relacionado

directamente con el EI aversivo.

- Lo relevante para el capítulo que nos ocupa (Extinción de la conducta

condicionada) es que este efecto (el de la devaluación del reforzador) se observa

también en estímulos (en el caso del condicionamiento clásico) y respuestas (en

el caso del condicionamiento operante) que han sido sometidas a procedimientos

de extinción. Es decir, que después de extinguir un EC, por ejemplo, si

devaluamos el EI con el que se condicionó, la RC ante ese EC será todavía

menor que si simplemente lo hubiésemos extinguido.

- Este fenómeno se usa como evidencia para defender que los procesos de

extinción no eliminan las asociaciones realizadas durante el condicionamiento.

Es decir, que las asociaciones establecidas (EC-EI o R-Er) durante el aprendizaje

no desaparecen durante la extinción, aunque el sujeto no emita la RC o la R.

20. ¿QUÉ SE APRENDE EN LA EXTINCIÓN?

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

88

- La extinción no implica “desaprendizaje” y deja las asociaciones R-C y E-C en

gran medida intactas. ¿Por qué disminuye la respuesta en los procedimientos de

extinción? Al tratar sobre el condicionamiento pavloviano, se revisó la evidencia

que indicaba que las asociaciones E-E o el aprendizaje E-E son más importantes

que el aprendizaje E-R. En el condicionamiento instrumental, se comentó la

evidencia que indicaba que las asociaciones E-C y R-C son más importantes que

la asociación E-R destacada por Thorndike. Estas discusiones reflejan el

abandono de los mecanismos E-R que ha ocurrido en la teoría contemporánea

del aprendizaje durante el último cuarto del siglo XX. Pero la importancia

otorgada al papel de las asociaciones E-E y R-C constituye un reto para las

teorías de la extinción.

20.1 ASOCIACIONES E-R INHIBITORIAS

- La falta de reforzamiento produce una asociación E-R inhibitoria.

- En realidad la extinción implica un tipo especial de ausencia de reforzamiento,

es decir, se trata de ausencia de reforzamiento tras una historia de reforzamiento.

La ausencia de reforzamiento sin esta historia previa no es extinción, sino más

bien habituación. La ausencia de reforzamiento resulta aversiva sólo después de

darse una historia de reforzamiento. Por lo tanto los efectos emocionales de la

ausencia de reforzamiento dependen de forma crítica de la historia previa del

sujeto.

- Los efectos de la extinción son tanto conductuales como emocionales. Los

efectos emocionales se originan en la frustración que se desencadena cuando un

reforzador esperado no llega. Se supone que la ausencia de reforzamiento

cuando se espera recompensa desencadena una reacción frustrante aversiva

incondicionada. Esta emoción aversiva sirve para que se deje de responder

durante el curso de la extinción mediante el establecimiento de una asociación

E-R inhibitoria.

20.2 EFECTOS “PARADÓJICOS” DE LA RECOMPENSA

- Cuanto más entrenamiento con reforzamiento se proporciona, más fuerte será la

expectativa de recompensa, y en consecuencia más fuerte será la frustración que

se da cuando se introduce la extinción.

- Efecto de sobreentrenamiento en la extinción: Si la disminución en la

respuesta se debe a los efectos frustrantes de la ausencia de recompensa, un

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

89

entrenamiento más extenso debería producir una extinción más rápida. Es

paradójico ya que el sentido común nos diría que un entrenamiento más extenso

debería crear una respuesta más fuerte y más resistente a la extinción, pero

sucede lo contrario.

- Efecto de la magnitud del reforzamiento en la extinción: La respuesta

disminuye más rápido durante la extinción que sigue a un reforzamiento con un

reforzador mayor. La ausencia de reforzamiento resulta más frustrante si el

individuo espera una gran recompensa que si espera una pequeña.

- Efecto del reforzamiento parcial en la extinción (ERPE): (es el efecto más

estudiado). Los efectos de la extinción serán diferentes dependiendo del

programa de reforzamiento usado. La extinción es más lenta y produce menos

reacciones de frustración si había un programa de reforzamiento parcial (o

intermitente) en lugar de uno continuo.

20.3 MECANISMOS DEL EFECTO DEL REFORZAMIENTO PARCIAL DE

LA EXTINCIÓN

- Tal vez la explicación más evidente del ERPE es que la introducción de la

extinción es más fácil de detectar tras el reforzamiento continuo que tras el

reforzamiento parcial. Si no se recibe el reforzador tras cada respuesta durante el

entrenamiento, puede no notarse inmediatamente cuándo los reforzadores se

omiten por completo. La ausencia de reforzamiento es mucho más fácil de

detectar tras el reforzamiento continuo. Esta explicación del efecto del

reforzamiento parcial en la extinción se denomina hipótesis de la discriminación.

- Hay dos teorías a través de las que se puede explicar qué aprenden los sujetos

durante el reforzamiento parcial que les hace más persistentes al enfrentarse a

una racha de mala suerte o fracasos: la TEORÍA DE LA FRUSTRACIÓN (los

sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa

durante el entrenamiento de reforzamiento parcial). La TEORÍA

SECUENCIAL (los sujetos aprenden sobre la memoria de la ausencia de

recompensa).

- Teoría de la frustración. Fue desarrollada por Abram Amsel. Según este

planteamiento, la persistencia en la extinción es resultado del aprendizaje de

algo paradójico, es decir, continuar respondiendo cuando se espera no ser

reforzado o ser frustrado. La teoría de la frustración asume que el reforzamiento

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

90

intermitente da como resultado aprender a responder a pesar de esperar la

ausencia de reforzamiento. Sin embargo, este aprendizaje requiere considerable

experiencia con reforzamiento intermitente.

- La teoría de la frustración caracteriza el aprendizaje que se produce durante el

curso del reforzamiento intermitente en términos de estadios. El reforzamiento

intermitente incluye ensayos reforzados y no reforzados. Los ensayos

recompensados animan a los individuos a espera reforzamiento, y los ensayos no

recompensados les llevan a esperar la ausencia de recompensa. En consecuencia,

el reforzamiento intermitente produce el aprendizaje de expectativas tanto de

recompensa como de no recompensa. Al principio, la expectativa de recompensa

alienta a los sujetos a responder, y la anticipación de la ausencia de

reforzamiento desalienta la respuesta. Por tanto, al principio del entrenamiento,

los sujetos entrenados con reforzamiento intermitente están en conflicto con lo

que se ha de hacer. Sus expectativas motivan tendencias de respuesta opuestas.

Sin embargo, a medida que el entrenamiento continúa, el conflicto se resuelve a

favor de responder.

- Teoría secuencial. La teoría secuencial fue propuesta por Capaldi y está

formulada en términos de conceptos de memoria. Asume que los sujetos pueden

recordar si fueron reforzados por realizar la respuesta instrumental en el pasado

reciente. Recuerdan los ensayos recientes tanto recompensados como no

recompensados. Se asume además que durante el entrenamiento en

reforzamiento intermitente, la memoria de la ausencia de recompensa llega a ser

una clave para la realización de la respuesta instrumental. De acuerdo con la

teoría secuencial, esto produce persistencia en la extinción. La forma exacta en

que esto ocurre depende en gran medida de la secuencia de ensayos

recompensados (R) y no recompensados (N) que se administran en el programa

de reforzamiento intermitente. Por esta razón la teoría está etiquetada como

“secuencial”.

21. RESISTENCIA A LA EXTINCIÓN Y MOMENTO CONDUCTUAL

- Momento conductual: Este concepto se basa en el concepto de momento de la

física newtoniana. El momento de un objeto físico es el producto de su peso (o

masa) por su velocidad. Esta hipótesis dice que la conducta que posee un

PSICOLOGÍA DEL APRENDIZAJE (UNED-CURSO 11-12) ALICIA PEÑALVA VELEZ-CENTRO ASOCIADO DE TUDELA.

91

momento elevado también será difícil de “parar” o interrumpir por las

manipulaciones.

- La investigación sobre el momento conductual se ha llevado a cabo utilizando

programas múltiples de reforzamiento ya que capacitan a los investigadores para

comparar la susceptibilidad de la conducta a la interrupción bajo dos

condiciones diferentes en la misma sesión.