temario aprendizaje

Outros

Marina Vega Canella

en 30/9/2025

Contenido elegido para ti

16 pag.

PARCIAL DE APRENDIZAJE PSICOLOGIA APUNTES

UCV

166 pag.

Compendio de Condicionamiento Operante G S Reynolds

ESTÁCIO

18 pag.

Bases conceptuales del condicionamiento clasico(1)

15 pag.

CONDUCTA PROVOCADA HABITUACIÓN Y SENSIBILIZACIÓN

ULA

Material

¡Estudia con miles de materiales!

Contenido elegido para ti

16 pag.

PARCIAL DE APRENDIZAJE PSICOLOGIA APUNTES

UCV

166 pag.

Compendio de Condicionamiento Operante G S Reynolds

ESTÁCIO

18 pag.

Bases conceptuales del condicionamiento clasico(1)

15 pag.

CONDUCTA PROVOCADA HABITUACIÓN Y SENSIBILIZACIÓN

ULA

Vista previa del material en texto

CONDICIONAMIENTO Y APRENDIZAJE

Conceptos Clave

Ciencia: Conjunto de conocimientos procedentes de la observación y la experimentación, que
nos llevan al desarrollo de leyes científicas generales
Aprendizaje: proceso psicológico que nos permite adquirir conocimiento a partir de la
experiencia. El aprendizaje es un elemento adaptativo básico. Conjunto de leyes científicas
que describen las interacciones especificas entre el individuo y el ambiente que influyen en su
conducta y su funcionamiento cognitivo.
Ejemplo: A la hora de comer, antes de llegar a casa ya empezamos a salivar (ocurre porque
estamos preparando el organismo para la ingesta)
Conductas aprendidas: reflejo del conocimiento adquirido.
Conocimiento: Es la información codificada y almacenada en la memoria sobre el mundo:
-Declarativo/explícito: Se puede expresar y requiere experiencia consciente del
sujeto. (Qué hacer)
-Procedimental/implícito: Conocimiento reflejado habitualmente de forma
inconsciente. (Cómo hacer)
Niveles de estudio: conductual (cómo la experiencia produce cambios en la conducta),
cognitivo (cómo se representan las experiencias en la memoria) y neural (las bases cerebrales
de los procesos de aprendizaje).
Diferencias entre aprendizaje y ejecución: El aprendizaje es un proceso psicológico inferido
a partir de la conducta (es un conocimiento almacenado que de vez en cuando se expresa en
las conductas aprendidas) mientras que el concepto de ejecución se reduce a “la expresión del
aprendizaje”.

TEMA 1: LA CIENCIA DEL APRENDIZAJE
*Lecturas Recomendadas:
- Domjan, M. (2008). Principios de aprendizaje y conducta. Madrid: Thompson
Cap 1(antecedentes históricos y concepto de aprendizaje)
- Tarpy, R.M. (2000) Aprendizaje: Teoría e investigación contemporáneas. Madrid:
Macgraw. Capítulos 1 y 2
- Maldonado, A. (1998) Aprendizaje, cognición y comportamiento humano. Madrid:
Biblioteca Nueva. Cap. 1
*Lecturas opcionales:
- Boakes. R.A (1989). Historia de la psicología animal. De Darwin al conductismo.
Madrid: Alianza Psicológica. Capítulos 1,3,6.
- Francisco Mora (2001). El reloj de la sabiduría. Tiempos y espacios en el cerebro
humano. Madrid: Alianza Editorial.
Desarrollo histórico del estudio del aprendizaje
1. FILOSOFIA DE LA MENTE : arco, reflejo, leyes de asociación…
- Descartes (1596 -1650) y el dualismo:

Nos proporciona una visión dualista del ser humano (con la intención de no rechazar
por completo la Tª sobre el propósito y libre albedrío como determinantes de la
conducta humana. Esta visión recibe el nombre de Dualismo cartesiano:
-Cuerpo: produce respuestas reflejas (involuntarias) a estímulos externos. Los
órganos sensoriales captan los estímulos y envían la información a través de los
nervios. Allí se produce la transformación: estímulo/entrada >>> respuesta/salida.
-Mente: Libre albedrío y acciones voluntarias y conscientes (propias de los
humanos y que les atribuían superioridad). La mente, externa al cuerpo se conectaba
con éste a través de glándula pineal, cercana al cerebro. De esta forma se podría ser
consciente de la conducta involuntaria y a su vez iniciar acciones voluntarias (posibles
en ausencia de estimulación externa).
Cree que el contenido de la mente procede de la experiencia sensorial y que
había ciertos contenidos presentes en todos los seres humanos de forma innata (idea
de Dios, sí mismo...). Esta corriente se denomina innatismo.
Hacía distinción de dos tipos de conducta: Voluntaria (pensamiento, ideas...
Propia de la mente y únicamente presente en los humanos) e Involuntaria
(respuestas de los sentidos, propias del cuerpo, presentes en animales).
El mecanismo de la conducta refleja sería el llamado “arco reflejo”
(Estímulo>>>Neurona sensitiva (aferente)>>>interneurona>>>neurona motora
(aferente)>>>Respuesta):

– Empirismo británico: contenidos de la mente: Las leyes de asociación
Se oponen a Descartes, J. Locke opina que todas las ideas son adquiridas de
forma directa o indirecta a partir de la experiencia posterior al nacimiento (metáfora
de la tábula rasa). Consideran la asociación de ideas como concepto clave en el
funcionamiento mental. La fuente de conocimiento para ellos la componían las
experiencias de los sentidos, las sensaciones, a partir de las cuales se formaban
combinaciones más complejas por medio de la asociación.
Aceptan dos conjuntos de leyes de asociación:
-Primarias (establecidas por Aristóteles): contigüidad (hechos próximos),
semejanza y contraste (aspectos semejantes o características que contrasten)
-Secundarias (establecidas por los filósofos empiristas): recogen ciertos
factores que influyen en la formación de asociaciones (intensidad, duración,
frecuencia, reciente aparición...)

- William James y la asociación.
William James (1841-1910) se preocupa por explicar cómo se producen los
hábitos. Defendía un empirismo radical. Dice que para que una respuesta se
convierta en hábito requiere de una experiencia repetida, no consciente y la
adquisición de una conducta. Basaba este mecanismo de adquisición de hábitos en
la conexión estímulo respuesta (E-R) por medio de la experiencia y las asociaciones
(las asociaciones mentales se vinculan con conexiones físicas en el cerebro).
Principios de la psicología (1970)
“La prueba de toda verdad reside, sencillamente, en su eficacia”
2. EVOLUCION Y SELECCIÓN NATURAL
-Evolución de la inteligencia. Charles Darwin (1809-1882) y la psicología comparada:
Darwin defiende que sobreviven aquellos individuos cuyas destrezas se adaptan mejor
a los desafíos naturales y son transmitibles a su descendencia. Por lo tanto los individuos
estaban cada vez más adaptados (evolución mediante selección natural). Apoyándose
sobre el principio de continuidad de la vida sostienen que los seres humanos
compartimos características con los animales, la mente humana es por tanto un producto
de la Evolución.
A partir de aquí se desarrolla la psicología comparada que realiza experimentos con
sujetos animales con la intención de estudiar la conducta animal y aplicar el conocimiento a
la conducta humana y defiende que todas las especies animales son inteligentes en mayor
o menor medida (humano=animal). Nuestra conducta no está únicamente determinada por
los estímulos que afectan al sujeto, si no también por las tendencias conductuales
heredadas.
> Morgan, Romanes: No hicieron experimentos. Decían que una especie era más
inteligente en mayor medida según resolvía problemas mecánicos
Morgan: Canon de Morgan: Ensayo error. Canon de Morgan y la ley de la
parsimonia: “una acción no se debe interpretar como resultado del ejercicio de una
facultad psíquica superior si puede interpretarse como el resultado del ejercicio de una
actividad psíquica inferior en la escala psicológica”.
G. Romanes (1848-1894): Criterio para la inteligencia: “si aprende a hacer nuevos
ajustes o modificar los antiguos de acuerdo con los resultados de su propia
experiencia”. Inteligencia: Capacidad para aprender

*Ejemplo: Clever Hans (el caballo que podía sumar, multiplicar…) Era una
muestra de inteligencia para ellos.

3. PSICOLOGIA EXPERIMENTAL
3.1. Hermann Ebbinghaus(1859-1909) y la memoria humana
Hizo experimentos con él mismo. Memorizaba palabras sin sentido y luego
comprobaba en determinados intervalos de tiempo la cantidad de palabras que
recordaba. Es el estudio de la memoria humana (mediante este experimento
comprobaba que al momento recordaba el 100%, a los 20 minutos el 60%, a la hora el
40%...) y representó sus resultados a través de la curva de olvido.
Añade que existen ciertas leyes de asociación que influyen en los resultados:
Contigüidad, repetición, duración de la lista...

3.2. Ivan Pavlov y los reflejos condicionados (Neurologíaalucinaciones, delirios, anhedonia (ausencia de
placer), pensamientos desordenados, ansiedad, etc. Se caracteriza también por una fuerte
disfunción de la atención selectiva (atender a aquellos estímulos que son adecuados).
Stroop task (Stroop, 1935). Desarrollo de un método para observar este fenómeno:
-Pide nombrar el color de la palabra V E R D E R O J O
El rasgo relevante sería el color de la palabra pero se produce una distracción por
atender a una dimensión irrelevante (significado de la palabra).
2. Aprendizaje selectivo y sus mecanismos
A partir de los años 60' comienza a estudiarse en los laboratorios el proceso de
aprendizaje selectivo (determinación de qué estímulo es el adecuado).
Si por ejemplo a un sujeto sometido a un experimento en el que se le presentará un EI
precedido por dos EC (EC1 y EC2) simultáneos, se le pide que identifique cuál de los dos es la
causa del EI presentará distintas respuestas en función de variós mecanismos de
condicionamiento (los dos estímulos no se codifican de la misma manera):
-Intensidad (saliencia) del estímulo. (Fenómeno de ensombrecimiento)
-Validez relativa del estímulo. (Fenómeno de bloqueo)
-Relevancia biológica del estímulo.
Condicionamiento Estímulos Compuestos
-Ensombrecimiento: Se presenta a un sujeto un EI (descarga) precedido de dos
estímulos EC (EC1: luz y EC2: tono). Se realizan ensayos hasta alcanzar el máximo
condicionamiento. ¿Qué EC sería para el sujeto la causa del EI? Si se produce el
condicionamiento de los dos EC por separado con la descarga y se alcanza el mismo nivel de
marina vega canella
aprendizaje, diremos que son igualmente intensos y al realizar el condicionamiento conjunto
ambos serían identificados como causa del EI sin realizar distinción entre ellos. Sin embargo
en este caso concreto, el tono (EC2) tiene una mayor saliencia que el EC1 (luz). De este modo
cuando se presentan por separado tras el condicionamiento conjunto el EC1 no produce una
RC mientras que el EC2 sí.

Este fenómeno recibe el nombre de ensombrecimiento. El estímulo más débil resulta
dificultado por el estímulo más sobresaliente a pesar e haberse presentado las mismas veces
simultaneamente. Cuanto mayor sea la diferencia relativa entre ambos, mayor será la
diferencia en la magnitud de la RC realizada tras su presentación por separado.
En el condicionamiento no solo influye la contigüidad temporal, también la saliencia de
los estímulos.
-Bloqueo: Este experimento se realiza con la técnica de supresión condicionada,
computando la RS. Tenemos un grupo de sujetos de control a los que se les presenta una luz y
un tono simultáneos (ECa y ECb) seguidos de una descarga eléctrica (EI). No cabe pensar que
uno ensombrezaca al otro pues ambos tienen la misma saliencia. Ambos estímulos son
entonces captados como causa de la descarga y al presentarse por separado producen por
igual la supresión de la conducta.
Otro grupo, que recibe el nombre de bloqueo, realiza la misma experiencia con la salvedad de
que previa a esta fase se les expone a una repetición reiterada del ECa en solitario seguido de
la descarga hasta alcanzar el máximo condicionamiento. Tras la segunda fase, presentamos
en solitario el estímulo ECb y obtenemos una RS muy próxima a 0,5 (ausencia del
condicionamiento. En este caso ECb no nos aporta ninguna información nueva, ya que ECa
marina vega canella
tienen distinta validez relativa
marina vega canella
Conclusion de estos tres metodos :
No es suficiente la contiguidad

fue previamente asociado como causa de la descarga. Se condicionan en diferente grado
porque aportan diferente grado de información.
Este fenómeno recibe el nombre de bloqueo. El condicionamiento previo de un EC
impide el condicionamiento posterior de otro EC. En este caso el fenómeno depende de la
experiencia previa del sujeto.

Sin embargo si smetemos un tercer grupo a la experimentación, en la que hay el previo
condicionamiento de ECa y el la fase de condicionamiento de ECa y ECb con la descarga,
presentamos una descarga de mayor intensidad que el primer EI condicionado, en la tercera
fase de presentación de B observaríamos condicionamiento, cuyo nivel dependerá de la
diferencia de intensidad del EI1 y EI2, debido al cambio de información al someter al sujeto a
los dos estímulos conjuntos. Este fenómeno recibe el nombre de desbloqueo.

Relevancia biológica: este mecanismo depende de las características evolutivas del
sujeto.
BLOQUEO DEL CONDICIONAMIENTO
0
0,1
0,2
0,3
0,4
0,5
1 2 3 4 5
Ensayos
R
a
z
ó
n
d
e
s
u
p
re
s
ió
n
BLOQUEO
CONTROL
DESBLOQUEO
0
0,1
0,2
0,3
0,4
0,5
1 2 3 4 5
Sesiones
R
a
z
ó
n
d
e
s
u
p
re
s
ió
n
DESBLOQUE
O
CONTROL
BLOQUEO
marina vega canella
Valor informativo
marina vega canella
AQUI B SI QUE TIENE VALOR INFORMATIVO
marina vega canella
La contiguidad
marina vega canella
QUE ES MAS INFORMACION : UN ESTIMULO QUE INFORMA SBRE LA APARICION DE UN EI O QUE INFORMA SOBRE SU OMISION
Depende de la experiencia del sujeto
L+.+ LT+. L- , T-
- LT++. L- ,,T-
En el caso A EL TONO TIENE UN VALOR INFORMATIVO AUNQUE ES MENOR QUE EN EL B
Jhon García estudió el proceso de condicionamiento sometido a este mecanismo por
medio de la aversión al sabor en ratas. Estaba conmocionado por la reacción delos soldados al
venir de la guerra que a parte de síntomas propios del conflicto bélico, presentaban vómitos y
náuseas. Así fue que comenzó sus estudios con ratas dando lugar a un trabajo seminal del que
se extraerían numerosas conclusiones.
Seleccionó un amplio grupo de ratas sedientas y les dió de beber una solución con
sacarina, y a la vez que accionaban el mecanismo de bebida, se cerraba un circuito eléctrico
que producía un click y hacía que se encendiera una luz. En este caso se presenta un EC con
un componente gustativo (sacarina) y un componente estereoceptivo (luz y click).
Dividió a los sujetos en dos grupos:
-el primer grupo al beber sufría una inyección de una sustancia que les
provocaba malestar e indisposición.
-el segundo grupo era sometido a una descarga electrica.
A la hora de estudiar la relevancia causal de los dos estímulos en los distintos grupos
obtuvo los sorprendentes resultados de que: el primer grupo rechazaba el agua edulcorada
pero era capaz de beber en presencia de la luz y el click. El segundo grupo bebía el agua con
sacarina pero se abstenía de beber en presencia de la luz y el click. Esto fue provocado por las
disposiciones evolutivas de las ratas, que para determinar si un alimento está en mal estado o
no utilizan una serie de claves olfativas (sistema de defensa interno relacionado con el mal
estar interno) y para detectar peligras externos utiliza un sistema defensivo estereoceptivo
(relacionado con la descarga electríca). Por eso la asociación de los distintos estímulos a las
diferentes consecuencias.
En este fenómeno influyen las características derivadas de la evolución biológica.
3. Inhibición condicionada
La inhibición se corresponde con una relación de contingencia negativa a partir de la
cual el sujeto deja de responder a un EC porque no causa un EI.
-Procedimientos (métodos): Se experimenta con una paloma metida en una caja de
condicionamiento. Tiene tres luces. En el centro se enciende una luz verde que indica la
presencia de comida (la paloma produce una RC de picoteo sobre la luz)(EC+). La luz roja a un
lado significa que no hay comida, discrimina este EC por tratarse de un estímulo inhibitorio
(EC-).
Según la inhibición condicionada pavloviana en la que el EC+ es la luz verde, si se
presentan la luz verde (EC+) con la luz roja (EC-), el sujeto esperará comida. Si no la recibe
asumira que la luz roja es un inhibidor de la comida y cuando se presente en solitario no habrá
respuesta. Se trata de un tipo de aprendizaje silencioso(o latente) porque en el caso de
presentar un estímulo novedoso (una luz azul) la conducta sería la misma: ninguna. Entonces
¿Cómo es posible determinar si hay o no aprendizaje?
-Métodos indirectos de medida de condicionamiento inhibitorio: La no elicitación
de una conducta no puede medirse directamente. Por eso se han desarrollado métodos de
medida indirecta para el condicionamiento inhibitorio.
Prueba de retraso
Para saber si un estímulo condicionado ha adquirido características inhibitorias y
diferenciarlo de un estímulo novedoso (que tampoco elicita una respuesta) es necesario
comparar dos grupos:
-grupo de control: sin ningún tipo de experiencia propia se condiciona un EC
con un EI (para medir la velocidad de aprendizaje).
-grupo experimental: se realiza la misma tarea pero previamente se condiciona
el mismo EC de forma inhibitoria con el EI. El EC tendrá que pasar de un significado inhibitorio
a excitatorio.

PRUEBA DE RETRASO
0
20
40
60
80
100
1 2 3 4 5 6 7 8 9 10
Sesiones
M
a
g
n
it
u
d
d
e
l
a

re
s
p
u
e
s
ta
CONTROL
EXPERIMENTAL

Se supone un aprendizaje latente en el grupo experimental debido al retraso en el
tiempo de adquisición del máximo nivel de aprendizaje. Cuantos más ensayos necesitemos
para alcanzar el máximo nivel de condicionamiento EC-EI, mayor sera el grado de
condicionamiento inhibitorio previo.
Prueba de sumación
Para esta medición necesitamos dos grupos de sujetos:
-grupo de control: se condiciona una luz (EC) a la comida (EI). Al presentar la
luz en la siguiente fase acompañada de un tono, la fuerza excitatoria de la luz no varía
y se produce la misma RC porque el tono carece de relevancia, no aporta ningún tipo
de información.
-grupo experimental: se realiza la misma prueba pero en una primera fase se le
atribuyen al tono unas características inhibitorias del EI. En la tercera fase al presentar
conjuntamente luz y tono, puede que el EC- (tono) inhiba las capacidades excitatorias de la luz,
o las disminuya, entonces decimos que ha habido condicionamiento inhibitorio.

0
20
40
60
80
100
LUZ TONO LUZ + TONO

4. Aprendizaje con estímulos neutros
Si intentamos condicionar dos estímulos neutros (sin características motivacionales
para el sujeto), cabe pensar que no se producirá condicionamiento (no habrá una RC porque
tampoco hay un EI que previamente provoque una RI). Sin embargo, se produce un
aprendizaje latente o silencioso (la información aprendida no se elicita por medio de una
respuesta).
Existen dos prcesos para condicionar estímulos neutros.
Precondicionamiento sensorial
Se introducen unas ratas en una caja de condicionamiento. En una primera fase se le
presentan una luz y un click juntas, con la intención de que las asocie. Tras un gran número de
ensayos se comprueba que al presentarlos por separado no se produce ninguna respuesta (si
hay aprendizaje estará implicito de forma latente). Pasamos a la segunda fase. Se presenta la
luz (estímulo B) seguida de comida, hasta alcanzar el máximo nivel de aprendizaje. El estímulo
B produce entonces al presentarlo en solitario una RC. En la fase de prueba se presenta en
solitario el estímulo A (si condicionamiento previo con la comida) y se obtienen los
sorprendentes resultados de que se elicita la RC que provocaba el estímulo B. Esto es debido
a la relación previa establecida entre A y B en la fase 1. El sujeto hace una inferencia lógica:
A>B, B>EI, entonces A>EI.

Condicionamiento de segundo orden
Se trata de un proceso similar al anterior, con un grupo de ratas en una caja de
condicionamiento. En la fase 1 se produce un condicionamiento de carácter estándar: un click
(B) con comida (EI). Finalmente se comprueba que el estímulo B produce la RC. En la fase 2
se prsenta el click con otro estímulo neutro (en este caso una luz) sin ir seguidos de comida.
En la fase de prueba se presenta únicamente el estímulo A (luz) y se observa que se produce
la RC.
marina vega canella
Reforzadores primarios y secundarios

Pavlov diferencia dos tipos de estímulos:
-De primer orden: Condicionados con un EI
-De segundo orden: Condicionados con otro estímulo condicionado previamente.
En este último caso la luz adquiere el carácter de causa de la comida (la RC es
resultado de una propiedad motivadora que le transfiere el estímulo B al A al asociarse
mutuamente).

CSO y reforzadores condicionados
Un reforzador secundario o condicionado es un estímulo neutro que adquiere las
propiedades de un reforzador primario, como comida o agua, al emparejarse de forma
sistemática con el mismo.
Prueba de reforzamiento secundario:
Una rata se encuentra en una caja de condicionamiento. Se le presentan dos
estímulos neutros A y B. Tras A siempre recibe comida, pero de forma intercalada se le
presenta B, tras el cual no recibe comida (el sujeto aprende a discriminar B mientras que A se
condiciona). A funciona como EC pero también como reforzador condicionado que servirá
como reforzador positivo de otras conductas.
Posteriormente se le enseña al sujeto una conducta instrumental (al accionar una
palanca recibe comida) hasta el alcance de la asíntota del aprendizaje. Si se retirara la comida
la conducta se extinguiría, pero si en lugar de simplemente retirar la comida, además
presentamos el estímulo A, el estímulo funcionará como reforzador y será capaz de matener la
conducta en cierta medida (adquiere capacidades reforzantes).
La presentación de B no evita la extinción de la conducta.
marina vega canella
??????????? Teoria de la sustitución condicionada
5. Condicionamiento contextual
El contexto se define como ambiente o conjunto de claves que configuran un entorno.
Si se presenta un EC en un contexto determinado seguido de un EI hasta alcanzar el el
máximo condicionamiento. En caso de sustituir el EC por el contexto en el que se había
presentado se observa que también se produce la RC.
Wagner comparó los efectos del entorno sobre las conductas pero desde el ámbito de
la habituación. Aquí lo estudiaremos en el campo del condicionamiento clásico.
Implicaciones prácticas: Náuseas y vómitos anticipatorios (NVAs)
Los pacientes de cáncer se someten a tratamientos de quimioterapia en un ambiente
hospitalario con determinadas características. Durante el tratamiento se les inyecta una
solución fitotóxica (EI) que les produce náuseas y vómitos, que reciben el nombre de
inmediatos o incondicionados (RI).
Entonces se han desarrollado unos fármacos capaces de suprimir las náuseas y
vómitos inmediatos.
Sin embargo tras varias sesiones de quimioterapia el propio contexto hospitalario y sus
características determinadas (olor, color, médicos...) adquieren características propias de un
EC y comienzan a presentarse los efectos secundarios de la quimio al entrar en el hospital. En
este caso las náuseas y los vómitos reciven el nombre dde anticipatorios y no son suprimibles
con los fármacos desarrollados.

6 Bases cerebrales: aprendizaje y emoción.
Aprendizaje de repuestas de miedo: Se asocia por medio de condicionamiento clásico
un estímulo aversivo (golpe muy estridente) con el peluche de una rata. La presencia del EC
(peluche) produce una respuesta emocional de miedo que conlleva paralización, cambios a
nivel hormonal, cambios en la tasa cardiaca. El miedo es una emoción que nos permite
reaccionar en situaciones de peligro.
El cerebro se emociona: Los daños cerebrales pueden alterar la expresión o
interpretacion de las emociones (la amigdala por ejemplo está relacionada con estas
funciones). Estudios revelan que en síndromes como el síndrome Klüiver-Bucy o el de Urbach
Whiete impiden a los individuos interpretar las emociones ajenas a través del rostro además de
Ausencia reacciones asociadas a la ira y al miedo, déficits perceptivos y de expresión de
reacciones emocionales.Sistemas cerebrales
En este esquema el tríangulo representa la amigdala. Se reproduce como funciona el proceso
de realización de una respuesta de miedo en la que el Tálamo tiene la función de procesar las
situaciones y el Hipotálamo es la vía responsable de las respuestas motoras.
Método de condicionamiento clásico: Puede estudiarse desde la perspectiva de que la
amigdala es el centro de tanto del miedo como de la felicidad. Se selecciónan dos grupos de
sujetos uno de Control y otro Experimental. En ambos casos se condiciona una luz al
recibimiento del alimento. Al grupo experimental, tras el condicionamiento se le da la comida
sin ir precedida del EC (luz) y se le inyecta una solución de litio que le produce indisposición y
consecuentemente le produce una devaluación del valor afectivo de la comida.
En una fase posterior se presenta la luz sin ir seguida de la comida, el grupo control
realiza la respuesta de aproximáción, pero el grupo que ha sufrido la devaluación de la comida
no la da con tanta frecuencia.
Este fenómeno nos indica que el condicionamiento clásico no depende solo de la
anticipación de un hecho, sino también del valor hedónico de ese hecho (en este caso la
comida).

Ante la suposición de que el valor hedónico del EI dependía de la amigdala se realizó
un posterior estudio con dos grupos. Uno de control en el que no se lesionaba la amigdala y
otro experimental en el que sí. Se repitió el experimento anterior con la distinción de que en
este caso a ambos se les producía el efecto devaluador de la comida.
En la fase de comprobación al presentar el EC sin ir seguido del EI, el grupo sin lesión
presentó una rápida extinción de la respuesta. Sin embargo no fue así en el grupo con la lesión
en la amígdala.
Extraemos del experimento que la lesión de la amígdala interviene en la convergencia
de la información sensorial y la codificación del valor afectivo.

Otro experimento similar se realizó con tres grupos de ratas: SHAM (abiertos pero no
lesionados, para determinar si la conducta no era por lesiones periféricas), BLA (lesión de la
zona de la amígdala relacionada con los atributos sensoriales) y CA (lesión de una zona de la
amígdala relacionada con los atributos afectivos).
Técnica de enmascaramiento: (aprendizaje implícito y explícito). Hay un tiempo mínimo
de presentación de un estímulo a partir del cual es sujeto codifica perfectamente dicho
estímulo. Sin embargo, si se presenta un estímulo por debajo de este tiempo solo se
procesarán parte de las características de este estímulo (estas características forman parte del
aprendizaje ímplicito y pueden relacionarse con las consecuencias de la presentación del
estímulo).
Por ejemplo en experimentos de enmascaramiento se presenta una imagen durante un
período de tiempo relativamente largo, y luego un rostro un una expresión de temor por debajo
del tiempo mínimo de presentación necesario para su completo procesamiento. Seguido a esta
segunda estimulación se somete al sujeto a una descarga eléctrica.
En el proceso pavloviano (sometiendo a los sujetos a la experiencia) se observa que
los sujetos a los que se presenta el rostro con dicha expresión de forma desemascarada
presentan un aumento de la resistencia en la conductancia electrica de la piel (respuesta de
miedo a la descarga). Sin embargo, a los que se les presenta el estímulo de forma
enmascarada presentan una menor magnitud de esta respuesta emocional (poco aumento de
la resistencia de la conductancia de la piel) pero aún así, simboliza un aprendizaje, eso sí,
menor que en el anterior.
En un proceso observacional (el sujeto observa a otros sujetos en esa situación, antes
de presentarle el estímulo) se obtienen resultados similares pero de menor magnitud.
-Procesamiento de expresiones faciales: Se utiliza una técnica de condicionamiento de
segundo orden. Se condiciona un rostro con determinada expresión a un estímulo aversivo y
luego se condiciona ese rostro con otro de carácter neutro.
A nivel cerebral se observan cambios en la actividad a la hora de observar el estímulo
neutro, con características de la observación de aquél aversivo.

-Monitorización de la actividad de la amígdala: Nos desvela que no solo procesamos
información sensorial, sino también del valor afectivo de los estímulos.

TEMA 5: PROCESOS DEL CONDICIONAMIENTO
INSTRUMENTAL
APRENDIZAJE INSTRUMENTAL: Hace referencia a situaciones en las que un
organismo realiza una acción, con el fin de conseguir una meta o incentivo. Además de la RI y
el reforzador, también se encuentra el estímulo discriminativo.
Una respuesta instrumental es toda aquella conducta con la que se pretende obtener
un reforzador de carácter motivacional positivo. Los estímulos determinativos son aquellos
conjuntos de claves del ambiente que indican al sujeto la disponibilidad o retirada de un
reforzador. Los Ed's en ocasiones son capaces de instigar las conductas (adquieren las
características del reforzador).

▪ Entrenamiento recompensa: tiene una contingencia positiva, dando lugar a un
aumento en la tasa de respuesta (instrumental), el reforzador tiene un carácter
motivacional positivo. Es más eficaz un reforzador demorado y de gran cantidad.

▪ Castigo: contigencia positiva con un reforzador de carácter motivacional negativo, lo
que hace que disminuya la tasa de respuesta instrumenntal.

▪ Entrenamiento omisión: se trata de una contingencia negativa entre la realización de
la respuesta y la obtención de un reforzador positivo. Produce la disminución de la
respuesta hasta su extinción.

▪ Escape/ evitación: contingencia negativa entre una respuesta y un reforzador negativo
que produce aumento de la respuesta. Escape: el sujeto está sometido al R- y la
respuesta supone su interrupción. Evitación: la respuesta evita la aparición del R-.

Programas de reforzamiento.
Un programa de reforzamiento es el conjunto de reglas y criterios que se establecen en la
suministración de recompensas al sujeto en el condicionamiento clásico y que suponen un
incremento de la respuesta instrumental.
En la técnica de moldeamiento (hacer que el sujeto realice la conducta deseada) nos
interesa obtener una tasa alta de respuesta y que sea constante. Para medir estas dos variables,
Skinner diseñó una caja conectada a un registrador acumulativo (parecido a un sismógrafo) que
dibujaba escalones en un papel enrollado a medida que el sujeto realizaba una respuesta,
representando así su distribución en el tiempo. Además había una aguja que hacía una marca
en diagonal sobre aquellos escalones en los que se suministraba una recompensa al sujeto. De
esta forma se pueden establecer relaciones entre respuesta y reforzamiento y calcular valores
como: la tasa de respuesta, la tasa de reforzamiento y la frecuencia de la respuesta.

A partir de aquí se desarrollan los distintos tipos de programas de reforzamiento:
Programa reforzamiento continuo (cada aparición de la respuesta instrumental da lugar al
reforzador)
Programa de reforzamiento intermitente o parcial (las respuestas solo se refuerzan algunas
veces) Veremos los programas que usan reglas simples para determinar qué respuestas se
van a reforzar:
Programa de razón (son aquellos en los que la presentación de reforzamiento
depende solo del número de respuestas que dé el sujeto) Pueden ser de razón fija o de
razón variable.
Razón Fija Continua> cada respuesta obtiene refuerzo. Genera un patrón de
respuesta de tasa estable y moderada. Pausas breves e impredecibles por saciedad,
por fatiga…
Razón Fija Parcial > solo se obtiene el refuerzo cada “n” respuestas. Tasa
estable y alta de respuestas en la “carrera de razón”.
Razón variable > Se precisa un número de respuestas que varía cada vez (entorno a un valor promedio). Tiene una tasa de respuesta muy alta y muy estable (es el
más resistente a la extinción). No hay pausa postreforzamiento, no es predecible el
número de respuestas que se necesitan.

Programas de intervalo: (son aquellos a los que la presentación del reforzador
depende de parámetros temporales, esto es, del tiempo que haya transcurrido desde la
última presentación del reforzador) Pueden ser de intervalo fijo o intervalo variable.
Intervalo Fijo> la cantidad de tiempo es constante de una ocasión a la
siguiente. Genera un patrón de respuesta característico que se denomina “festón de
intervalo fijo”. Consiste en un aumento de la tasa de respuesta a lo largo del intervalo
(una curva positivamente acelerada) Esto se debe a que los animales aprenden que no
es probable que reciban un reforzador en los instantes posteriores a la presentación del
anterior y esperan a dar la respuesta al momento en que predicen que se aproxima el fin
del intervalo.
Intervalo Variable> La cantidad de tiempo entre la disponibilidad de un
reforzador y el siguiente no es fija, sino que oscila en torno a un valor promedio de
intervalo. Mantienen tasas de respuesta continuas y estables, sin pausas. Con respecto
a la disponibilidad, cabe señalar que en los programas de intervalo cuando hablamos de
“intervalo entre reforzadores” , no queremos decir que pasado un tiempo “x” el reforzador
se presente sin más, independientemente del sujeto. En realidad hablamos del momento
en que el reforzador está disponible para ser presentado y que esto solo ocurrirá si el
sujeto emite la respuesta instrumental requerida. Además, suele existir una restricción
del tiempo en que esté disponible, es decir, que hay un intervalo máximo de tiempo en
que se presenta el reforzador si se emite la respuesta. Se llama duración limitada.
Generalmente los programas de reforzamiento parcial producen un aumento en la tasa
de respuesta y en la resistencia a la extinción de la misma en ausencia del reforzador.
Programas de reforzamiento continuo VS programas de reforzamiento parcial.
La extinción es mucho más lenta y provoca menos reacciones de frustración si los
sujetos han experimentado previamente un reforzador parcial que si han experimentado
previamente un reforzamiento continuo.
¿Por qué el reforzamiento parcial consigue una persistencia notable en las respuestas?
(no entra en el examen, solo leer)
▪ Hipótesis de la discriminación (lo que ocurre es simplemente que en el caso del
reforzamiento continuo la retirada de la recompensa es mucho más fácil de detectar que
en el reforzamiento intermitente).

▪ Hipótesis del aprendizaje (no es tan sencillo, los organismos aprenden algo durante
el programa de reforzamiento parcial que les hace responder más a menudo cuando ya
no están disponibles las recompensas)

✓ Teoría de la frustración (en el reforzamiento parcial el sujeto aprende a dar la
respuesta instrumental sin expectativa de recompensa mientras que en el
reforzamiento continuo no existe nada que enseñe al animal a responder cuando
no espera ser reforzado y se frustra (Amsel)

✓ Teoría secuencial (aquí se enfatiza en la memoria + en el reforzamiento parcial.
El sujeto aprende que será reforzado por responder cuando su memoria le indique
que no fue premiado en los ensayos anteriores, un reforzamiento continuo no
permite que los animales aprendan esa persistencia (Capaldi)
En este experimento aparecen representadas en rojo las ratas sometidas a un
programa de reforzamiento continuo y en azul a un programa de reforzamiento parcial.
Magnitud de la recompensa:
La resistencia a la extinción es baja tras el reforzamiento continua (durante la
adquisición), pero alta tras el reforzamiento parcial.
Número de ensayos durante el entrenamiento
La resistencia a la extinción aumenta con un número mayor de ensayos de
reforzamiento parcial.

Conducta de elección:
Hasta ahora hemos estado estudiando situaciones en las que solo se mide la aparición
de una respuesta concreta en función del patrón de reforzamiento de esa respuesta. Esto no
nos proporciona una comprensión total de la conducta. Los organismos cada vez que emiten
una respuesta están haciendo una elección entre un conjunto de respuestas disponibles en
ese momento. Vamos a estudiar la situación de elección más simple, en la que el sujeto tiene
solo dos alternativas de respuesta.
Una rata en una caja de condicionamiento tiene dos palancas separadas (Ra y Rb). Si
realiza la respuesta instrumental en Ra se someterá a un programa de reforzamiento parcial de
intevalo variable de 1 minuto (recibirá 60 reforzadores en una hora). Si realiza la respuesta en
Rb el programa de reforzamiento también sera de intervalo variable, pero esta vez de 2
minutos (obtendrá 30 reforzadores en una hora).
El sujeto ralizará aquella respuesta que le cueste menos esfuerzo y le traiga mejores
resultados (criterio de optimización). Lo más óptimo sería obtener los 90 reforzadores
disponibles en una hora mediante la combinación de ambas respuestas (repartidads en
proporción).

Pero como un sujeto realiza este reparto de proporciones, nos lo explica la Ley de igualación:
un individuo en situaciones de elección distribuye la respuesta proporcionalmente a la cantidad
de reforzamiento.
Entonces para calcular la distribución de las respuestas es necesario calcular las tasas
de reforzamiento, que corresponderan con la proporción de cada tipo de respuesta:
=
Programa A IV 1: 60 reforzadores
Programa B IV 2: 30 reforzadores

La “M” hace referencia a la magnitud de la recompensa, por ejemplo: el número de bolitas de
comida.
Programa A IV 1: 60/60+30 = 0,67 Debe reunir las dos acciones en una sola.
Programa B IV 2: 30/60+30 = 0,33

Según la ley de igualación esta rata realizará el 67% de las respuestas en Ra y el 33% en
Rb.

Control de la conducta por el estímulo
¿Qué función cumple el estímulo discriminativo en el condicionamiento operante? Hace
de clave indicadora que informa al sujeto de que si en su presencia realiza una determinada
respuesta instrumental, recibirá un determinado reforzamiento.

a) Si la contingencia R > reforz (Ed+)
b) Si la contingencia R > no reforz (Ed-)

¿En que se diferencia del EC pauloviano? En que el EC del condicionamiento clásico anuncia la
aparición del EI (haga lo que haga el sujeto), mientras que el Ed del condicionamiento
instrumental no anuncia la aparición del EI directo, lo que anuncia es que está disponible y
aparecerá solo si el sujeto emite una conducta específica. Cuando nos referimos a Ed (o a EC)
no estamos hablando necesariamente de un estímulo discreto y puntual, puede tratarse de
estímulos ambientales en general (contextuales) Pues bien, decimos que los estímulos
ambientales pueden llegar a controlar la ejecución de una respuesta instrumental, pero ¿Qué
aprenden los sujetos acerca de los estímulos para que esto pueda suceder? ¿como pueden los
estímulos controlar la conducta?

Los procesos de generalización y discriminación son procesos adaptativos que se derivan
de esta cualidad del Ed. Un sujeto a través de ellos no necesita aprender lo mismo con cada
estímulo según sea parecido o no al Ed inicial.

Gradiente de generalización: representación gráfica del nivel de respuesta que se produce ante
un reforzador. Pero esto sucede cuando hay una clave, que es lo que se denomina estímulo
discriminativo:

Cuando el estimulo discriminativo sufre pequeñas variaciones, es decir, cuando en el caso de la
luz las variaciones de longitud de onda son muy pequeñas, el nivel de respuesta sigue siendo
elevado.

Un proceso inverso a esta generalización seria la discriminación, que se produce cuando antes
estímulos similares no se realiza la respuesta porque se ha aprendidoque estímulos ligeramente
diferentes al estímulo discriminativo condicionado instrumentalmente.

 Grupo 1: presentamos una luz pero en unos casos tiene una raya y en otros no. De tal
forma, que cuando la paloma picotee la luz con raya obtendrá comida, y con la otra nada.
 Grupo 2: presentamos de nuevo la luz con y sin raya. Pero en este caso, cuando se
enciende la que no tiene raya se obtiene comida, y en el otro caso no.
Pero cuando rotamos esta línea de la luz, ¿hay generalización?
En el grupo uno si que hay generalización (estímulos similares), pero en el grupo 2 la tendencia
a responder se inhibe.
Los Ed indican qué consecuencias se derivan de la conducta (controla la ejecución de
la respuesta) A los sujetos se les enseña a presionar una tecla cuando está presente una luz.
En cada prueba ese estímulo produce el nivel máximo de respuesta. También se observa que
si en la prueba se presentan otros estímulos también provocan en mayor o menor medida la
respuesta. Si se parecen al estímulo la respuesta es alta, si no se parecen al estímulo será en
menor medida. A esto se le conoce como gradiente de generalización que relaciona la
semejanza física de los estímulos. El proceso inverso a la generalización es la discriminación.

➢ Factores que contribuyen a una mayor generalización

o Semejanza física
o Grado de experiencia previa

• GRADIENTES DE GENERALIZACIÓN

Existe generalización del estímulo siempre que el sujeto no responde de forma diferencial a
estímulos distintos; se observa el mismo nivel de conducta ante estímulos diferentes. En el
experimento de Guttman y Kalish (1956) sobre el gradiente de generalización, reforzaron a
palomas en un programa de IV para que aprendieran a picotear una tecla iluminada con una
luz naranja-amarillenta (longitud de onda de 580 nm). Una vez adiestradas, se repitieron los
ensayos pero variando la longitud de onda de la luz. La tasa de respuesta que se registró con
cada valor fue la que se indica en el dibujo.

Este tipo de resultado se conoce como gradiente de generalización y depende de dos factores:

o La semejanza de los estímulos del ensayo con el estímulo que fue condicionado
o La experiencia previa que haya tenido el sujeto con dicho estímulo

La pendiente del gradiente de generalización puede utilizarse como medida del punto hasta el
cual la característica del estímulo que estamos variando controla la conducta de los sujetos.
Volviendo al experimento anterior, imaginemos como sería el gradiente de generalización si las
palomas fuesen daltónicas (la característica longitud de onda no controla la conducta de
ningún modo).

• DISCRMINACIÓN. ENTRENAMIENTO PREVIO

Existe discriminación cuando el sujeto reacciona de forma diferencial a estímulos parecidos.
Como ya hemos dicho, no solo las diferencias físicas entre los estímulos posibilitan la
discriminación si no también la experiencia previa que haya tenido el sujeto con el estímulo en
el pasado. Por ejemplo los músicos son capaces de detectar cuando una nota está desafinada
aún cuando la desviación sea mínima. La experiencia repetida con los sonidos desde
pequeños genera cambios a nivel cerebral que les permite percibirlos y discriminarlos
finísimamente. Por ejemplo los esquimales tienen 30 palabras que significan blanco, nosotros
no distinguimos tantos matices.

▪ El efecto de la discriminación sobre el control por el estímulo experiencia repetida
con estímulos en laboratorio que consigue generar una respuesta diferencial a un
estímulo (E+) y un estímulo (E-) En el experimento de Jenkis y Harrison investigaron la
forma en que estímulos auditivos de diferentes frecuencias controlaban la conducta de
picoteo de palomas reforzadas con comida. Hay dos tipos de procedimientos de
adiestramiento.

Se hallo el gradiente de generalización:

El grupo 1 tiene un gradiente menos empinado. El grupo 2 tiene un gradiente más
empinado (más discriminación, control por el estímulo más intenso)

▪ ¿Qué se aprende en el entrenamiento de discriminación? Caben tres posibilidades:

➢ Que solo aprenda algo sobre E+ (“responde cuando se presente E+”) y
nada sobre el E- (no sería relevante)

➢ Que solo aprenda algo sobre el E- y nada sobre el E+ (“no respondas
cuando esté el E-“)

➢ Que aprenda algo sobre los dos estímulos “responde con el E+ y no
respondas con el E-“

La teoría de la excitación-inhibición sobre el aprendizaje de la discriminación de
Spencer aboga por esta tercera posibilidad. La respuesta diferencial al E+ y al E-
refleja la excitación y la inhibición que se han condicionado al E+ y al E-
respectivamente. El experimento de Honing, Boncau & PennyPacker (1963) sobre la
evaluación experimental de esta teoría fue un entrenamiento diferencial con dos grupos
de palomas:

El sujeto tiene que tocar una tecla que es una luz (Ed) En dos grupos se produce la misma
experiencia. Los estímulos en los dos grupos son los mismos pero desempeñan distinta
función informativa de lo que pasará tras realizar la conducta (consecuencia) En el grupo 1, si
picotean cuando sale la luz con rayita hay comida y si la luz sin rayita no hay comida. En el
grupo 2 es al revés:

Una vez que han aprendido, se varía la orientación de la línea en distintos grados ¿Qué efecto
vemos? En el grupo 1 el nivel máximo de respuesta es el que estuvo presente en el
entrenamiento. Al modificarse el estímulo se modifica gradualmente el grado de respuesta. Es
de tipo excitatorio (generaliza la tendencia a responder) Depende de la semejanza de los
estímulos. En el grupo 2 generaliza la tendencia a no responder, es de tipo inhibitorio.
Encontramos dos tipos de resultados:

o Gradiente de generalización del estímulo excitatorio (verde) (curva empinada
que presenta la cantidad de respuesta más alta en E+ aprende) Generalizar
a responder.

o Gradiente de generalización del estímulo inhibitorio (amarillo) (los estímulos
difieren cada vez más del E-, son progresivamente menos eficaces que él para
inhibir la respuesta instrumental) Generalizar a no responder.

Con lo cual, este tipo de entrenamiento sirve para aprender acerca de los dos estímulos

• DESPLAZAMIENTO DEL VÉRTICE (no examen, solo leer) El fenómeno que vamos a
estudiar es el resultado del entrenamiento de discriminación, intradimensional, es decir, el
E+ y el E- son estímulos del mismo tipo (auditivos, visuales, táctiles…) y que solo difieren
en una característica estimular (frecuencia, longitud de onda, grados de temperatura…) El
experimento de Hanson (1959) investigaba hasta que punto los distintos colores
controlaban la respuesta de picoteo en las palomas.

Al hallar los gradientes de generalización hallo algo muy particular, encontró que
cuanto más parecido era el E-al E+, los sujetos mostraban un desplazamiento del
máximo de las respuestas respecto al E+ original. Este fenómeno se llama
desplazamiento del vértice.

Aprendizaje de escape/evitación

Paradigma para estudiar la conducta motivada aversivamente (nos impulsan a realizar
ciertos actos) por ejemplo cuando estamos encerrados en el ascensor nos instiga a realizar
ciertas conductas. Otro ejemplo sería irte de clase porque te aburre, discutir con alguien y
antes de que llegue a mayores la discusión marcharte…Esto tiene que ver con conductas de
escape provocadas o motivadas por situaciones aversivas. Una caja de evitación es un aparato
de condicionamiento dividido en dos partes por una compuerta. Tenemos a la rata en una parte
y se le puede dar un estímulo aversivo. La avisamos de que le vamos a dar una descarga
mediante un tono o una luz. La luz por ejemplo tiene una duración de 30 segundos y nada más
terminar le damos la descarga. Una respuesta natural en el miedo es la de huir, por lo que
puede saltar al otro compartimento.La respuesta del sujeto de interrumpir el estímulo aversivo
(interrumpir la descarga) se conoce como escape (se evita un estímulo que ya se recibió en
parte) en el caso de que ya tuviese asociada la luz con la descarga y supiese que después de
uno viene lo otro, puede anticiparla. En este caso la respuesta no interrumpe el estímulo
aversivo sino que lo evita. No son hechos distintos sino dos fases. Para evitar primero tenemos
que tener experiencia (por ejemplo el hospital para evitarlo has tenido que experimentarlo
previamente) Es el tipo de aprendizaje derivado de una experiencia de castigo positivo.

• Aprendizaje de Escape (interrumpir) El sujeto aprende que realizando una
respuesta determinada es capaz de interrumpir la estimulación aversiva. Por ejemplo
cuando nos quemamos la piel, sabemos que si nos echamos “aftersun” nos calma el
dolor. El sujeto interrumpe un estímulo aversivo que ya se está produciendo.

• Aprendizaje de Evitación (antes de que aparezca) El sujeto anticipa que se va a
presentar una estimulación aversiva y realiza una respuesta que la impida (por ejemplo
echa crema solar para no quemarse) El sujeto anticipa una respuesta, eludiendo la
presentación del estímulo aversivo. Para que haya evitación es necesario que haya
experiencia previamente (es necesario que haya antes escape) Así, no son dos tipos
independientes de aprendizaje sino dos fases de un único proceso de aprendizaje. Son
dos fases de un mecanismo común.

o Evitación discriminada (se presenta un estímulo concreto, por ejemplo la
luz, que anticipa la estimulación aversiva) En este tipo de evitación, el
estímulo adquiere propiedades motivacionales.

o Evitación no discriminada (no hay ningún tipo de estimulo concreto que
anticipe la estimulación aversiva, lo que ocurre es que puede emplear
claves ambientales o temporales propias. Por ejemplo la rata aprende
que la descarga aparece cada 10 segundos. Al aprendizaje de claves
temporales sobre el ambiente se le llama “timing”

• Estudio del aprendizaje de escape/evitación

Para estudiar las respuestas de escape evitación se emplea la caja de Sidman o caja
lanzadera. Tiene dos compartimentos adyacentes separados por una tablilla. Si se
administra una descarga en un compartimento el sujeto puede escapar/evitarla
saltando al otro compartimento. Para medir la eficacia de este aprendizaje se registra
la latencia de respuesta.

• Factores que determinan la eficacia del aprendizaje de escape/evitación
 Intensidad de la descarga
 Demora de la recompensa (la recompensa aquí sería la reducción de la estimulación
aversiva)
 Dificultad de la tarea (si la respuesta de escape o evitación es demasiado compleja,
por ejemplo saltar una valla de 3m, es previsible que el sujeto no lo aprenderá)
 Controlabilidad (capacidad percibida por el sujeto para librarse de la estimulación
aversiva mediante alguna respuesta)
¿Qué factores contribuyen a que sea más eficaz? La intensidad y que los hechos sean de
forma inmediata o demorada. A más latencia aprende más rápidamente.

Teoría bifactorial de Mowner (1956): teoría biprocesal del aprendizaje de escape. Cree
que el aprendizaje de escape/evitación está compuesto por dos factores o procesos

o Proceso de condicionamiento instrumental (aprende a utilizar respuestas presentes en
un repertorio conductual para evitar o interrumpir la estimulación, por ejemplo saltar. El
refuerzo aquí es la reducción del miedo (luz respuesta no descarga) La luz es un
Ed

o Proceso de condicionamiento clásico (El sujeto asocia ciertos estímulos ambientales o
concretos con la inminente aparición de un estímulo aversivo. Esos estímulos se
convierten en estímulos condicionados por condicionamiento clásico excitatorio, por
eso motivan al sujeto a realizar la conducta. El condicionamiento clásico no es un
proceso simple de aprendizaje por contigüidad, el sujeto aprende a dar respuestas,
que las claves del ambiente dan lugar a que haga respuestas….

3) Motivación de incentivo (estímulos del ambiente se asocian con estímulos que de
forma refleja suscitan una conducta, anticipación de consecuencias positivas)

4) Incentivo condicionado (inicialmente estímulo neutro que adquiere valor motivacional)
(luz - descarga)

Para Hull el condicionamiento excitatorio, la fuerza de respuesta (la magnitud o intensidad de
una respuesta) depende de muchos factores y uno de ellos es la habituación. La K, viene por K
Spence (incentivo) Hull y estos autores decían que además se producían dos procesos de
aprendizaje al mismo tiempo: con su acción aluden a un hecho aversivo y producen un CC
pauloviano (los estímulos que preceden a la conducta se asocian con un hecho aversivo) el
sujeto recibe la descarga alguna vez por lo que se relaciona la luz con el estímulo aversivo
(CC) ¿Cómo llamamos a ese CC? Excitatorio, el miedo desempeña un proceso de motivación
para desempeñar la conducta aprendida.
Indefensión aprendida
Selligman, Overmeier y Maier (1967) investigaron los efectos de la exposición a una
estimulación aversiva incontrolable sobre el posterior aprendizaje de escape/evitación. El
hallazgo común fue que la exposición a una experiencia de incontrolabilidad interfiere sobre el
posterior aprendizaje de respuestas instrumentales.
EXPERIMENTO DE LA INDEFENSIÓN APRENDIDA (Selligman & Maier)

En escape el sujeto logra controlar el acceso a situaciones aversivas. Sin embargo en muchas
situaciones no logramos controlarlos. Es más, a veces independientemente de la conducta las
consecuencias negativas aparecen igual. Hay ocasiones en las que el sujeto no consigue
realizar conductas para evitar el estímulo aversivo (por ejemplo cuando se le dan descargas
haga lo que haga) Si cuando está en el compartimento A se le da la descarga y cuando está en
B no se le da la descarga hablamos de escape o evitación. Sin embargo, si cuando está en A
hay descarga y cuando esta en B también el sujeto sabe que no puede escapar a la descarga
por lo que hablamos de indefensión aprendida. El sujeto no logra aprender a evitar estos
estímulos negativos. Esto está relacionado con estados de ánimo negativos como por ejemplo
la depresión.
Se lleva a cabo un experimento de dos fases con 3 grupos de ratas en “cajas lanzadera”.

• FASE I (cada grupo tiene una experiencia previa distinta con la descarga eléctrica
ninguna/controlabilidad/incontrolabilidad)

• FASE II (entrenamiento de aprendizaje de respuesta de escape/evitación)

✓ Un grupo control donde se conoce de antemano lo que va a ocurrir. Al
sujeto se le enseña a controlar por su conducta un hecho aversivo (puede
cambiar al B y evitarlo) Cuando se mide la respuesta de escape tienen un
número elevado.

✓ Otros antes de aprender a escapar (grupo 2) han recibido descargas
inescapables (perros sujetos en un arnés). Ahora tienen debajo del hocico
una tecla para poder escapar. Estos sujetos tienen esta experiencia en un
tiempo y podían interrumpirla con la conducta (controlan el hecho
aversivo)

✓ El otro grupo al realizar la conducta seguía recibiendo descargas (no
pueden controlar el hecho aversivo)

Los resultaros fueron:

Los animales del grupo 2 mostraban una tasa mayor, sin embargo el otro grupo (el 3º) tenía un
déficit conductual importante. No realizaba la conducta de escape (no tenían motivación,
quedaban parados) a este efecto se le conoce como indefensión aprendida. Los perros de
Selligman tenían marcadas deficiencias motivacionales. Algunos síntomas de la depresión
tienen semejanzas (escasa motivación, aislamiento social, percepciones negativas,
culpabilidad…) Esto guarda relación con un fenómeno de condicionamiento clásico llamado
irrelevancia aprendida.

Encontraron pues que la exposición a una estimulación aversiva incontrolada durante la fase I
produceun déficit más grave en el aprendizaje de escape-evitación que la exposición a
descargas de idéntica intensidad y duración, pero de las cuales se puede escapar. ¿Por qué
ocurre esto? Algunos teóricos defendieron que no había aquí ningún tipo de aprendizaje, que el
déficit conductual de los sujetos (G2) en la fase II se debía simplemente al efecto físico que
causaba tanta descarga eléctrica (entumecimiento de los músculos para responder) Sin
embargo, lo que realmente sucede es que lo que defendían Selligman, Overmaier y Maier en
su hipótesis de indefensión aprendida es que durante la exposición a descargas incontroladas,
los animales aprenden que las descargas son independientes de su conducta y que no hay
nada que ellos puedan hacer para evitar recibir descargas. Durante el entrenamiento
instrumental siguiente, esta expectativa adquirida de una contingencia cero entre las
respuestas y la descarga interfiere con el aprendizaje de que la conducta puede controlar las
presentaciones de un reforzador.

Los efectos se manifestaron el diferentes ámbitos del comportamiento. Se producen
deficiencias para realizar nuevos aprendizajes, deficiencias motivacionales, alteraciones
emocionales, deficiencias cognitivas, deficiencias conductuales, estrés… modelo de depresión
animal. Para que la alteración de los del grupo de escape fuese menos severa les
enseñaríamos a controlar estímulos aversivos, y esto se transfiere a los demás ámbitos.

La indefensión aprendida se emplea tradicionalmente como modelo animal de los fenómenos
que subyacen a la depresión en humanos. Un historial de falta de control sobre los
reforzadores puede desorganizar gravemente la conducta instrumental, generar déficits
motivacionales, cognitivos, afectivos… La falta de control puede ser objetiva (real) o subjetiva;
es decir; debido a las atribuciones causales que el sujeto hace de hechos aversivos. Si tiende
a hacer interpretaciones:

▪ Globales (“siempre ocurre así”)
▪ Internas (“ es que soy un inútil, es mi culpa”)
▪ Estables (“haga lo que haga no va a cambiar”)

…de los fracasos o experiencias aversivas, tienden a reprimir la conducta instrumental de
escape o evitación. Por ejemplo la experiencia con los exámenes.

Aprendizaje incentivo
Consiste en aquel aprendizaje acerca del valor incentivo (reforzante) del reforzador.
Experiencia con el reforzador en el estado de motivación relevante.
Tolman entre los mecanismos de aprendizaje hablaba de aprendizaje cathexis. Decía que el
aprendizaje del valor incentivo del reforzador estaba era resultante del condicionamiento
biológico. Para Tolman además toda conducta tiene un fin, refleja una meta.
Thondrike dice que se adquieren nuevos hábitos a través de la relación estímulo-respuesta y
niega la existencia del aprendizaje instrumental.
El aprendizaje, la emoción y la motivación están muy relacionados.
Análisis teórico del aprendizaje
-Motivación primera: Según Hulk una fuente de motivación es cualquier necesidad
básica, pues da lugar a una conducta en busca de una recompensa que satisfaga esa
necesidad. Dice que la fuerza con la que un sistema realiza un aprendizaje dependerá de una
serie de factores, como el reforzamiento previo, el valor incentivo de este reforzador...
Expresa este enunciado de forma matemática: La ralización de una respuesta será de
mayor vigor si tiene un impulso motivador más elevado y por lo tanto también una mayor K que
hace referncia al valor de incentivo que tiene el reforzador (el valor de incentivo de un
reforzador dependerá de la experiencia previa del sujeto con ese reforzador y de sus
condiciones biológicas).
En este caso, como hemos visto, la K no hace referencia a una constante como es
habitual, se elige esta letra en honor a Kendel, nombre de pila de un gran teórico. El estudio
del apendizaje de incentivo se debe a Viennot Spence.
-Contraste conductual: hace referencia al fenómeno que sucede en sujetos que reciben
un mismo reforzamiento pero realizan ejecuciones distintas de la respuesta. Se debe al valor
de incentivo del reforzador para unos y otros. El contraste conductual puede ser positivo
(mismo reforzador supone una mayor ejecución en un grupo o grupos de sujetos) y negativo
(el mismo reforzamiento supone una reducción en la realización de la respuesta). El contraste
conductual influye y determina el aprendizaje instrumental.
-Otras fuentes de reforzamiento: Son estímulos que provocan un valor estímulante en el
sujeto por medio de estimulación sensorial.
Estimulación eléctrica intracraneal: Odd y Milner cuestionaron el concepto
de Hulk sobre la reducción de las necesidades básicas y estudiaron el condicionamiento
instrumental sin reducir dichas necesidades por medio de este preocedimiento.
El estudio que se verá más adelante fue llevado a cabo para probar la Teoría de la
Sensibilización de Kennet Berridge que decía que la exposición repetida a drogas
potencialmente adictivas es capaz, en sujetos susceptibles y bajo determinadas circunstancias,
de alterar de forma persistente células y circuitos cerebralesnormalmente destinados a la
normal regulación de la atribución de la saliencia a los estímulos, un proceso que se encuentra
dentro del comportamiento motivado.La naturaleza de estas neuroadaptaciones es lograr la
hipersensibilización (sensibilización) de estos circuitos, de forma que resulta en una atribución
patológica de los niveles de saliencia de incentivo a la droga y los estímulos asociados con
ella. El estudio estaba orientado a conocer como se activaban determinadas áreas del cerebro
cuando aumentaba el valor incentivo del reforzador.
Experimento:
A una rata en una caja se le inyecta anfetamina, que funciona como reforzador.
En una fase de entrenamiento previa a la inyección se le presentaron dos estímulos, y
tras un click se le inyecta la droga (condicionamiento clásico).
Luego pasaron a medir la frecuencia con la que realiza una respuesta
instrumental y los resultados obtenidos demostraron que en el caso de la rata a la que
se inyectó la anfetamina, tras el click la tasa de respuesta era más alta.

Más adelante David Premack descubrió que hay más efectos provocados por el valor
motivacional del reforzador, como por ejemplo efectos sobre la probabilidad de producirse una
determinada respuesta.
Dadas dos respuestas A (actividad de beber, con gran frecuencia de aparición) y B
(correr, baja frecuencia), se dice que B>A (B refuerza A, la de menor frecuencia provoca la de
mayor).
La frecuencia o probabilidad de una respuesta se calcula de la siguiente manera:
Probabilidad de una respuesta = Tº invertido en la Rª/ Tº total
Llamamos reforzantes no a los estímulos neutros, sino a la estimulación de
actividades y a la fuente de reforzadores.

Teoría de la expectativa del condicionamiento (Dickinson)
La ejecución instrumental depende de la interacción de dos procesos:
-Conocimiento contingencia instrumental previo : aprendizaje respuesta-
consecuencia
-Aprendizaje de incentivo: propiedades de incentivo del reforzador.
La fuerza de una respuesta instrumental depende de la experiencia previa del sujeto
con el reforzador y sus consecuencias, el aprendizaje del valor incentivo del reforzaor (se
aprende en condiciones motivacionales adecuadas y se llama aprendizaje motivacional de
incentivo llamado por Dickinsonn aprendizaje Cathexis).

Experimento:
Dos grupos de sujetos (ratas) que se condicionan instrumentalmente a
accionar una palanca para obtener dulce de sacarosa. En una siguiente fase a un
grupo (dev) se le inyecta una sustancia (litio) que lo hace sentir indispuesto después de
la toma de la sacarosa. Al otro grupo se le inyecta también está sunstancia pero sin
relacionarla con la sacarosa.
Finalmente en una tecera fase de prueba se mide la tasa de respuestas al
presentar losestímulos que anuncia que la sacarosa está disponible para ambos
grupos. Pretenden comprobar si el grupo Dev recuerda las consecuencias de su
conducta.

El tipo de aprendizaje que se produce en este caso fue denominado por
Dickinson aprendizaje de incentivo (a cerca del valor motivacional de un evento).

TEMA 6: CONDICIONAMIENTO DEL APRENDIZAJE
Se puede pensar que no es necesario que dos estímulos se encuentren próximos en el
tiempo para que se establezcan asociaciones entre uno y otro.
AB
R.A Rescorte decía que para que se produjera el condicionamiento no bastaba con que
se presentase a un sujeto el EC-EI vrias veces. Tiene que inferir el nexo causal entre los
estímulos, y el sujeto luego decide si A es la causa de B.
El EI puede ir precedido de dos o más claves (EC1, EC2...):
No se condicionan por igual los estímulos. El sujeto decide cual es el estímulo
que infiere la respuesta o no. A veces a este proceso selectivo se le da valor de
información, adquirida en la experiencia previa.

Buscar sobreexpectativa: la contigüidad no es una condición suficiente para el
aprendizaje.
Noción de contingencia (consistencia EC-EI)
En este caso existe una contigüidad positiva espacio-temporal. Si se presenta un
estímulo las mismas veces que otro que lo sigue inmediatamente tienen la misma contingencia
espacio-temporal. El sujeto identifica la causa social de los elementos.
Teoria de la contingencia de Rescorla
La teoría de la contingencia dice que la contigüidad temporal del EC– EI no garantizan que se
produzca el condicionamiento, sino que hay consistencia entre los estímulos.
La contingencia depende de dos probabilidades:
P1= Pr (EI/EC) > idea de contigüidad clásica. EC > EI (siempre).
Condicionamiento excitatorio.

P0 = Pr (EI / no EC)
En 1966 Rescorla llevó a cabo el siguiente experimento en una caja con dos
compartimentos. En uno de ellos se suministra una descarga al sujeto que para evitarla debe
saltar al otro compartimento.
En una primera fase se condiciona a todos los grupos a saltar al otro compartimento para evitar
la descarga (R>no descarga). En una segunda fase se presenta un tono de distinta manera
para los tres grupos (fase de condicionamiento clásico):
-Positiva (la probabilidad de que el tono vaya seguido de la descarga es mayor de la de
que el tono no vaya seguido de la descarga)
-Cero (ambas probabilidades son iguales)
-Negativa (la probabilidad de que el tono vaya seguido de la descarga es menor de la
de que el tono no vaya seguido de la descarga)

En una última fase se presenta únicamente el tono y se mide la tasa de respuestas de
evitación de cada grupo. La tasa de las respuesta de evitación en cada grupo depende
entonces de la capacidad del EC para producir la descarga.
Grado de contingencia positiva
P1 = P(EI/EC) (proporción entre las veces que aparece el EI y el EC)
P0 = P(EI/noEC) (proporción entre las veces que aparece el EI sin el EC)
El grado de contingencia se calcula restando P1-P0. Cuando el resultado es 0 se alcanza un
estado de irrelevancia aprendida (puntos sobre la diagonal). En el cuadrante rosa se
corresponde a los puntos en los que P1>P0, se trata de condicionamiento excitatorio. El
cuadrante azul se trata de los puntos en los que P1 P1-P0 = 0
Segundo grupo: en cada sesión se le presentaba un estímulo sonoro 10 veces y de tres
minutos de duración y se le da el EI 2 veces. P1 = 0 P0= 0,2 > P1-P0 = -0,2
Los demás grupos se condicionaron de forma que en el grupo tres P1-P0= - 0,4 y en el grupo
cuatro P1-P0= -0,8
A medida que aumenta el P1 – P0, la capacidad inhibitoria del sonido hacia la RC que provoca
la luz aumenta. Se trata entonces de una contingencia negativa (inhibitoria).
Contingencia en el aprendizaje instrumental
La contingencia en el aprendizaje intrumental se da por medio de aprendizaje asociativo, un
estímulo puede dar lugar a una postura o eludirla.
Juicios de contingencia
Por ejemplo surgen de tareas como el diagnóstico médico en el cual el doctor a partir
de nuestro mal estar debe generar un juicio de contingencia para aportarnos eltratamiento
adecuado.
Tareas conductuales
Intentan formular un juicio de contingencia entre las probabilidades de las
consecuencias y las de las respuestas.
Experimento: A unas ratas se les refueza intermitentemente con sacarosa la
hora de realizar determinada respuesta. Despues en una fase posterrior a unas ratas
no se les refuerza en ausencia de las respuestas y a las otras se les da el reforzador
sin necesidad de que realicen la respuesta.

En aquellas ratas a las que solo se les reforzó en presencia de las respuestas
(Pr =1) se obrservó una alta tasa de respuesta, sin embargo en las que fueron
reforzadas en ausencia de la respuesta (Pr>1) la tasa de respuesta cayó. En el ámbito
de la contingencia positiva entre Ed y consecuencias de la respuesta la tasa de
respuesta disminuye a medida que aumenta la aparición del reforzador en ausencia de
la respuesta.

Como conclusión de la Teoría de la Contingencia podríamos decir que el
condicionamiento es el proceso psicológico básico que nos permite identificar estímulos del
entorno.

TEMA 7: REPRESENTACIÓN DEL CONOCIMIENTO
Representación: Naturaleza. Información almacenada y codificada en la memoria.
La exposición a estímulos del ambiente produce patrones de actuación sensorial que a
su vez causan cambios neuronales.
Tipos de conocimiento:
-Declarativo
-Procedimental
Incluso las experiencias más simples pueden dar lugar a estos dos tipos de
conocimiento. Existen distintos tipos de asociación: el sujeto realiza asociaciones a medida que
en los procedimientos de condicionamiento se hacen inferencias con estímulos del entorno.
Las condiciones se corresponden a las circunstancias en las que se produce un
fenómeno (cuándo) del aprendizaje e implican conocimientos a nivel de memoria.
El contenido o lo qué se aprende hace referencia a la naturaleza asociativa del
aprendizaje.
En cuanto a los mecanismos nos referimos a la expresión conductual a través de los
mecanismos del aprendizaje. Por ejemplo en el condicionamiento clásico, una asociación de
estímulos (EC-EI) nos confiere una asociación de respuestas (conductual) (RC-RI).

Representación del conocimiento: Se realiza a nivel interno y puede ser:
-Declarativo: Conocimientos generales del mundo, históricos, etc.
-Procdimental: Conocimiento a cerca de cómo actuar ante un estímulo o que
hacer frente a determinada situación.

Ejemplo:
¿Qué puede haber aprendido el sujeto en este ejemplo?
De forma declarativa: Cuándo
De forma procedimental: Acercarse a la comida o prepararse para
ella.

Estose debe a que en la memoria esta presente la relación entre los estímulos y el
concepto de los mismos. La asociación entre estímulos forma parte del conocimiento
declarativo (consciente) y es en la asociación estímulo-respuesta cuando hablamos de
conocimiento procedimental.
En un experimento realizado por Bechlezer, este examinó el condicionamiento
aversivo en perros. Se les presentaba un sonido seguido de una descarga en una pata,
lo que les producía una respuesta refleja de contracción de esa pata. Tras varias
pruebas iguales la presentación del solo sonido producía esa respuesta de contracción
de la pata (RC).
Esta respuesta en los perros era debido a que en su memoria el sonido se
codificaba como causa del EI y ese recuerdo es el que provocaba la respuesta. Para
llegar a esta conclusión el investigador realizó el mismo experimento inyectando a la
vez que la descarga una sustancia que provocaba una parálisis (curane). Asi fue que
en las sesiones de condicionamiento al producirse la descarga e inyectarse el curane,
no se producía la respuesta refleja por la parálisis producida por la sustancia. Sin
embargo en la fase de prueba en la que solo se presentó el sonido, los perros
realizaron la respuesta de contracción de la pata. Esto indica que el sonido activaba
información sobre el elemento asociado (descarga) pero en el momento del
condicionamiento no fue posible su expresión porque estaba bajo los efectos de la
sustancia.
Otros experimentos a cerca de esto
Técnica de devaluación del EI
Mediante una técnica de condicionamiento clásico condicionamos a un sujeto
hasta que salive en presencia de un EC (sonido) por la anticipación de un EI apetitivo
(comida) > emisión de RC.
Una vez alcanzado este objetivo se procede a la devaluación de EI provocando
un malestar al sujeto al ingerir la comida. Este proceso se realiza en ausencia del EC.
Posteriormente se le presenta al sujeto el EC. Se pueden producir dos sucesos
que el sujeto presente la RC de salivación (la relación EC-EI > EC-RC etá aún en la
memoria del sujeto y provoca la respuesta a pesar del valor que se tenga ahora de esa
relación) o que el sujeto no presente la respuesta (se produce una relación E-E, y no
se presentará la respuesta de salivación ni en presencia del EI porque el recuerdo esta
almacenado en la codificación que se tiene de ese estímulo). La relación E-R no
implica aprendizaje alguno sobre la asociación comida-malestar.
Experimento de Holland and Straub (1979). Devaluación del EI.
Realizaron el experimento anterior con dos grupos de ratas. A ambos grupos
se les condicionó de manera que salivaran ante la presencia de un sonido (EC)por la
anticipación de la comida (EI). Posteriormente dividieron a los sujetos en dos grupos
uno EXPERIMENTAL en el que el EI fue devaluado por medio de una inyección de litio
que les provocó malestar gástrico y un grupo de CONTROL al que se le inyectó una
sustancia que no provocó consecuencias. Luego se midió la respuesta de
aproximación al comedero en presencia del sonido y el grupo experimental mostró una
clara deficiencia en la realización de dicha respuesta.
Experimento del conocimiento declarativo. Holland 1990.
A una serie de ratas sedientas les presentaba dos sonidos distintos en todas
las sesiones cada 10 segundos. Cada sonido se asoociaba a un sabor determinado,
eran estímulos distintos.
Después de que en la fase de condicionamiento se consiguiera que las ratas
realizaran la respuesta de salivación frente a ambos estímulos en la mayor tasa posible
se procedió a la segunda fase, la de devaluación del sabor 2 sin ir prescedido de
ninguna clave. Así fue que en la fase de prueba en la que se presentaron ambos
estímulos, el tono asociado al sabor no devaluado aumentó su tasa de respuesta
mientras que el tono asociado al sabor devaluado la redujo. El condicionamiento
clásico niega entonces que se adquiera conocimiento procedimental, lo fundamental en
el aprendizaje es el recuerdo de las consecuencias que produce un estímulo.
Representación atributos sensoriales y hedónicos.
Teniendo en cuenta los distintos atributos del EI ¿cómo podemos examinar las
valoraciones afectivas de un estímulo? A través de sus reacciones reflejas, pues expresan
el valor hedónico y podemos calcular su índice conductual.
Emoción y valoración afectiva
Sabemos que tanto en ratas, como en monos y niños se dan unos patrocnes
de movimientos de laboca que reflejan los valores hedónicos de los estímulos que se
les presentan. Los sabores hedónicos provocan movimientos de la lengua, de las patas
en las ratas... Los sabores aversivos por su parte provocan que se escupa la sustancia,
arcadas, respuesta de limpieza bucal...
Holland estudió la valoración afectiva en 1990.
Presentó a los sujetos de manera alterna dos tonos T1 y T2 y mediante una
cánula se les inyectaba una sustancia agradable para producir la máxima respuesta
condicionada en ambos casos. En la fase 2, se devalua el sabor 2 por medio de una
inyección de litio. En la fase de prueba comprueba que ante el estimula T2 disminuye
la respuesta de ingesta (salivación) y aumentan las respuestas de carácter aversivo
debido a que el sabor le recuerda el malestar y se ha vuelto desagradable. Es decir las
ratas conocían las consecuencias que se derivaban de cada proceso (conocimiento
declarativo).
Holland: Efecto de la lesión de la amígdala.
Se realizó con un grupo de ratas en el que se les provocó la devaluación de la
comida. Sin embargo se repartieron en dos grupos: EXPERIMENTAL (antes de la
devaluación se les lesionó el área de la amígdala) y CONTROL (sin lesión). El grupo
experimental no cambiaba la valoración hedónica de la comida debido a la lesión
producida, la comida les resultaba apetecible a pesar de que les produjera malestar
gástrico.

En la representación la zona de naranja (d) muestra la actividad de las distintas zonas
cerebrales de aquellos sujetos que se han sometido a una devaluación. La azul simplemente la
de aquellos que se han presentado al sabor tal cual, sin ser devaluado.
Saciedad sensorial explícita: como se devalua un reforzador (figura d)

Aprendizaje instrumental
Distintos tipos de asociaciones:
Asociación E-R, (estímulo respuesta) según Thorndrike el aumento de la intensidad de la
asociación E-R crea un hábito. Tipo de conocimiento procedimental, el sujeto aprende que
tiene que hacer ante una determinada estimulación.
Asociación R-O (Respuesta – reforzador/consecuencias), para Tolman las respuestas tienen
una intencionalidad dependiendo del resultado que va a obtener el sujeto. Tipo de
conocimiento declarativo. Representa o recuerda los atributos del reforzador.
Asociación E-E (estímulo – reforzador/consecuencias). Si obviamos la respuesta intermedia,
en el cond. Instrumental se puede producir una asociación entre el estímulo y sus
consecuencias.

Dickinson ante este debate distinguió dos tipos de respuestas: aquellas en las que la
ejecución depende del establecimiento de un hábito y aquellas en las que la ejecución
depende de la anticipación de un reforzador (acción).
E>>>>R (hábito) Se forman a partir de la relación estímulo-respuesta.
E>>>>Ref (acción) son denominados actos instintivos, y dependen de las
conseciencias que se desprenden de la acción.
Este estudio fue realizado por Dickinson. Se condicionó a unas ratas a realizar una
respuesta para obtener un reforzador determinado (apetitivo). Posteriormente se procede a la
devaluación del reforzador. Tras estas dos fases decidió realizar una tercera fase de extinción
de la respuesta para ver si era muy rápida (valor aversivo del ref) o lenta (no valor aversivo del
ref).
Si las ratas adquirieran un hábito E-R mecánico, no tendrían recuerdos de los atributos
delreforzador en la fase 2 y en la fase de extinción realizarían muchas veces la respuesta.
Si las ratas aprendieran a cerca del valor del reforzador (R-Ref), lo reconocerían en la
fase 1 como algo positivo y a partir de la 2 como algo negativo. Por lo que en la fase de
extinción disminuiría su respuesta por las consecuencias que se esperarian de ella.
Las ratas NO realizaron la respuesta debido a que recordaban el atributo del reforzador
y la ejecución quedó mediada por las consecuencias de la conducta en el condicionamiento
instrumental.
Adams (1982)
Propuso y realizó un experimento en el que comparaba, la extinción de la respuesta en
dos grupos que variaban en la cantidad de entrenamiento que habían recibido. DEV-100 (4
fases de entrenamiento, 100 reforzadores) y DEV-500 (más sesiones y 500 reforzadores). En
ambos casos se devaluó el reforzador. Luego se estudió la extinción de la respuesta.
En el grupo de entrenamiento limitado, mayo velocidad de extinción, menos respuesta
instrumental (Asociación R-Ref, acto instintivo)
En el grupo con mayor entrenamiento se produce una reducción menor de la
respuesta, una extinción más larga (asociación E-R, hábito.
Con mayor cantidad de entrenamiento un acto instintivo puede conertirse en un hábito
rutinario debido a la mayor asociación E-R.
Esto puede observarse en el consumo de drogas, que las primeras veces se realiza en
busca de unas consecuencias (efecto reforzante) y tras repetidas consumiciones se convierte
en un acto rutinario independiente de sus consecuencias.

Regulación emocional de la conducta:
¿Qué pasaría se impedimos que se se procese la información afectiva de los estímulos
a nivel cerebral? Hatfield con procesos de devaluación lo comprobó tras comparar dos grupos
de ratas, uno de ellos con una lesión en la amigdala (relacionada con el procesamiento del
valor afectivo) y otro de control. Si el valor afectivo del reforzador era en la fase de extinción
aversivo, cabía esperar una rápida extinción de la respuesta.

En el grupo de control los sujetos en los que se produjo la devaluación, redujeron
considerablemente su respuesta frente al estímulo.
Los sujetos con la lesión previa en la amigdala se comportaron de forma indistinta.
Sin embargo otras estructuras interfieren en el valor afectivo de los reforzadores
(corteza gustativa en aversión al sabor) y este fenómeno fue sometido a estudio también.
En el grupo de control los sujetos no sometidos a la devaluación presentaron una
extinción lenta y los sometidos a la devaluación, casi desde el primer momento, dejaron de dar
respuesta. El grupo con la lesión en la amígdala y el cortex gustativo se comportaron
aparentamente igual.
Elección de la respuesta (experimento realizado en humanos)
Se colocaba a los sujetos frente a un proyector en el que se le presentaban una serie
de láminas con dos estímulos cada uno. Dos estímulos eran invariables, uno se asociaba con
la ingesta de un vaso de tomate y el otro con la ingesta de un vaso de zumo de tomate. Previo
a este condicionamiento se pedia a los sujetos que valoraran de -10 a 10 ambos sabores.
Posteriormente al entrenamiento se procedía a devaluar el chocolate en unos sujetos y el
tomate en otros. Luego se les dejaba elegir entre dos diapositivas cual era su preferida.
En los últimas pruebas la preferencia de las diapositivas del sabor devaluado caía en
picado. Se registró también un incremento en la actividad de la amígdala cuando se veían
estímulos que preveen consecuencias negativas.

Función de los estímulos
Parte del comportamiento refleja el conocimiento previo sobre las consecuencias de la
conducta (declarativo) pero si los actos no se desprenden de las consecuencias son
conocimientos pocedimentales.
Si obviamos la respuesta en el condicionamiento instrumental observamos que existe
contingencia temporal entre el estímulo y las consecuencias.
Existen unos factores que contribuyen al establecimiento de una conducta aprendida.
Factores biológicos
Factores adquiridos (motivación de icentivo) aprendizaje sobre el carácter
fectivo del reforzador. Encamina la conducta del sujeto a la cnsecución del reforzador.
Funcion asociativa entre el estímulo y las consecuencias y función moduladora que
que produce una respuesta en presencia del estimulo que en el pasado estaba encaminada a
la consecución del reforzador.
Un ejemplo de esto se demuestra en la Tª bifactorial, el Ed indica la relación entre la
respuesta y sus consecuencias.
Consta de una fase de condicionamiento clásico (Luz – Descarga) y condicionamiento
instrumental (Luz – Respuesta – No descarga). La latencia de la respuesta en presencia y
ausencia de la luz varía por la asociación establecida E-E.
Asociación jerarquica
En presencia del estímulo (determinadas situaciones) la respuesta traerá unas consecuencias.

En presencia de una luz la R1 produce la obtención de un Ref1 y en presencia de un
sonido una R2 produce la otención de un Ref2.
En esta prueba frecuencia de la respuesta no está determinada por la cantidad de
reforadores sino por el estímulo que se presenta.
La función moduladora de los estímulos influye en la frecuencia con la que se realiza
una respuesta en presencia de un estímulo.
Acción, hábito y drogas de abuso.
En resumen sabemos que hay varios tipos de asociación posibles:
Condicionamiento clásico: E-E y E-R
Condicionamiento instrumental: E-R (hábito) y E-Ref (actos instintivos)
Dickinson desarrollo en el ámbito del Condicionamiento instrumental la Tª sobre la
expectativa del condicionamiento en la que los actos intintivos eran producidos por las
consecuencias que traería la respuesta y los hábitos se producirían por una asociaciónde los
estímulos con la propia respuesta.

Ámbitos de aplicación
¿Pueden los mecanismos del aprendizaje asociativo dar respuestas a interrogantes sobre la
adicción a las drogas?
Tipos de asociaciones intrumentales:
En la asociación E-E (estímulo reforzador) podemos encontrar el mecanismo que produce que
los estímulos asociados al consumo de las drogas puedan motivar su búsqueda.
Existen tres criterios de la adicción:
1º Búsqueda compulsiva de la droga en su ausencia. Un adicto es incapaz de refrenar
los impulsos de búsqueda de la droga.
2º Las personas adictas están dispuestas a realizar un mayor esfuerzo conductual para
obterner la droga.
3º Menor sensibilidad a efectos adversos (anticipación de consecuenccias negativas de
las drogas).
1º Criterio:
En una caja de condicionamiento a unas ratas se les presentan dos estímulos. Un Ed+
(luz verde) que indica la disponibilidad de la droga y un Ed- (luz roja) que indica la ausencia de
droga. La respuesta que deben realizar las ratas en presencia del Ed+ es la de pulsión de una
tecla para que se les inyecte la droga.
Por un lado tenemos una rata no adicta, que realiza la respuesta únicamente en
presencia del Ed+ (luz verde). Por lo tanto su conducta queda ligada a los estímulos del
ambiente.
Sin embargo tenemos una rata que ha tenido una experiencia prolongada previa con la
droga, es adicta. Esta rata realiza la respuesta incluso en presencia del Ed-, su conducta
escapa de su propio control, su impulso de búsqueda de la droga es irrefrenable.
2º Criterio
En este caso se utiliza un prograa de reforzamiento de razón progresiva (el sujeto debe
realizar cada vez más respuestas para la obtención de la droga).
En primer lugar una rata no adicta realiza la respuesta hasta determinado punto
(PUNTO DE CORTE: nmáximo nº de respuestas que un sujeto está dispuesto a realizar para
obtener una droga).
Sin embargo la rata adicta continúa realizando la conducta mucho más allá del punto
de corte de la no adicta. Esta dispuesta a realizar un mayor esfuerzo para conseguir la misma
cantidad de droga.
3º Criterio
En este casofuncional)
I.P. Pavlov (1949-1936) es el padre del condicionamiento clásico. Interesado
en la fisiología y recibió el Nobel en 1904.

Descubrió que tras la repetición de hacer sonar una campanilla, precediendo a la
ración de comida, los perros salivaban (presentaban una respuesta fisiológica). Dicho
aprendizaje podía medirse midiendo la cantidad de saliva producida (intensidad de la
respuesta). Se llama reflejo condicionado a la presentación de una respuesta
fisiológica frente a un estímulo arbitrario.
Define condicionamiento como un proceso de aprendizaje que reporta ventajas
adaptativas ya que permite anticipar los hechos relevantes de nuestro entorno
(prepararnos para la comida, por ej.) Su experimento supone una demostración
experimental de que no todos los reflejos son innatos y pueden ser creados por
asociación (todo aprendizaje se reduce a la formación de hábitos por asociación de
elementos). Desarrolla la Teoría de la sustitución del estímulo: EC (sonido de la
camapanilla) sustituye al EI (presencia de comida).

4. REINADO DEL CONDUCTISMO
4.1. Thorndike (1874-1949) El conductismo americano.
Aporta procedimientos y problemas para el estudio del aprendizaje instrumental.
Desarrollo métodos para estudiar cómo se adquieren ciertas pautas de conducta:
-“Caja Problema”: Cogía un gato y lo metía dentro. Había un pedal que al
pulsarlo abría la puerta. El gato tenía que aprender a apretar el pedal para poder salir
de la caja y llegar a un plato de comida que había fuera. Tomaba notas del tiempo que
tardaba en abrir la puerta a medida que se repetía la experiencia.
Para él el desarrollo de los hábitos consistía en establecer relaciones entre los
estímulos y las respuestas (E-R, la respuesta correcta a un estímulo determinado daba
lugar al hábito como resultado de la experiencia). Propuso una serie de leyes o
principios para explicar este fenómeno:
-Ejercicio o Práctica: el numero de ensayos favorece la conexión E-R
-Ley del Efecto: si una respuesta en presencia de un estímulo va seguida de
un suceso satisfactorio, la asociación entre el estímulo y la respuesta se
fortalece (reforzamiento positivo) Más tarde fue llamado principio del
reforzamiento) .
Establece que la función de la consecuencia obtenida tras una respuesta es
fortalecer o debilitar la relación E-R dependiendo de la naturaleza de dicha
consecuencia (positivo o negativo).
*Para él no hay intención, la consecuencia del aprendizaje es un hábito.

4.2. John Watson (1878-1958)
Es el padre del conductismo americano. En 1913 publica “El Manifiesto Conductista”.
El objeto de la psicología es la conducta observable y manifiesta (psicología
experimental).
Estudió la influencia del ambiente sobre los hábitos, concretamente se fijó en los
estadios del miedo (emoción que provoca ciertas respuestas).

Su experimento:
Hizo que un niño pequeño cogiera miedo a un peluche de una rata. El niño al
principio no le tenía miedo, lo cogía, lo acariciaba… pero Watson empezó a dar un
golpe muy fuerte con una barra de hierro para que el niño asociara el susto por el
estruendo, al ratón. Al cabo de un tiempo el niño había hecho una asociación por la
que al final tenía miedo al ratón. Se llama miedo condicionado o adquirido
(condicionamiento clásico).
4.3. Tolman: Conducta, cognición y propósito.
Para Tolman el aprendizaje implica adquisición de conocimientos y la conducta
no es más que una expresión del aprendizaje. Por lo tanto el aprendizaje no refleja
necesariamente un resultado conductual (aprendizaje latente: el que se obtiene sin
ser consciente de ello y no se presenta hasta que en un contexto determinado se
expresa un cambio conductual)
Tolman dice que el aprendizaje no puede considerarse solo como un movimiento
mecánico causado por la contigüidad, sino que requiere un conocimiento (la conducta
requiere propósito y el propósito cognición: no mecánica). Introdujo así el término de
conducta propositiva (ejecuciones requieren de propósito y conocimiento). Distingue
por lo tanto entre aprendizaje y ejecución, y establece la diferencia entre conocimiento
declarativo y procedimental.
Utilizó métodos más complejos de investigación (laberintos). A partir de sus
experimentos con ratas dedujo que el animal no adquiere un hábito, si no que es su
propósito el que lo mueve.
En un laberinto con determinado recorrido una rata aprendía el camino para
obtener comida, pero cuando se situaba a la rata en un laberinto radial, en lugar de
usar el brazo por el que accedía a la comida en el laberinto anterior, usaba aquél que
acortaría el recorrido hacia la comida. Desarrollo así la Tª de los mapas cognitivos,
que consistían en una forma de aprendizaje latente (almacenamiento de conocimiento
geográfico en la memoria que no se reflejaba hasta el cambio de laberinto). Así probó
que el propósito era más fuerte que el hábito.

4.4. C. Hull y la motivación de la conducta (1874-1949).
“Los organismos sufren privación, la privación crea necesidades, las necesidades
activan pulsiones; el comportamiento es dirigido a metas y alcanzar metas tiene valor
de sobrevivencia”.
Incluyó la motivación como factor de la conducta. Creó una fórmula para explicar este
fenómeno: R = HE-R x D x K
R (respuesta) HE-R (Hábito) D (Pulsión) K (incentivo/esfuerzo)
Para él la fuerza, intensidad y grado de aprendizaje depende de: la intensidad del
hábito y la motivación (2 fuentes de motivación: motivación biológica del organismo
-por ejemplo si se tiene hambre- y el valor que tiene el incentivo para el sujeto)
Incorpora los procesos de índole motivacional

4.5. El conductismo radical de Skinner (1904-1990)
Realiza un Análisis experimental de la conducta: El pensamiento (emociones,
motivación, sentimientos) es conducta encubierta y responde a las mismas leyes y
mecanismos que lo que conocemos como conducta manifiesta.
Tomó elementos de Thorndike: La caja de Skinner (similar a las cajas problema), la Ley
del efecto: la conducta está mantenida por reforzamiento externo y los programas de
refuerzo.
1. El aprendizaje como ciencia experimental
-Ciencia: conjunto sistemático de principios y conocimientos procedentes de la observación y
la experimentación que muestran la operación de leyes científicas generales.
-Psicología del Aprendizaje: cuerpo de conocimientos científicos que describen cómo cambia
el comportamiento en función de la experiencia.
Aprendizaje
Conductual
(Adquisición de respuestas)
Cognitivo-Funcional
(Adquisición de
conocimiento)
Neuronal
(Plasticidad nerviosa)
Conducta manifiesta Representación de
información
Mecanismos neuronales
Aprendizaje como ciencia experimental: Se expone al individuo a cierta experiencia y se
observa cómo esa experiencia cambia su conducta.
La tendencia actual es aunar estos tres enfoques en el estudio del aprendizaje.
Definición de aprendizaje:
-Nivel conductual:
“Cambio duradero en la conducta que se produce como resultado de la experiencia o la
práctica” (Kimble, 1961).
-Adquisición de respuestas (aprendizaje = ejecución)
-Se da si hay cambios en la conducta manifiesta
-Existen fuentes de cambio en la conducta que no suponen aprendizaje: fatiga,
alteraciones fisiológicas...
-Nivel cognitivo funcional:
““Mecanismos responsables del procesamiento de la información (codificación y
retención), de la adquisición de conocimiento y otras habilidades” (Norman, 1982).
-Adquisición de representaciones de la realidad
-Diferencia entre aprendizaje y ejecución (manifestación conductual
observable de lo adquirido).
-Conocimiento: Declarativo: adquisición y evocación CONSCIENTE (Tolman).
Procedimental: adquisición y evocación INCONSCIENTE (Hull).
-Bandura: Aprendemos respuestas por observación de modelos que quedan
representados cognitivamente y no tienen por quéhay dos estímulos que indican la disponibilidad de la droga uno verde
(droga en solitario) y uno azul (la realización de la respuesta supone una inyección de la droga
y una descarga).
La rata no adicta al asociar el estímulo azul a la descarga deja de realizar la respuesta
en su presencia por sus consecuencias aversivas.
La rata adicta por su parte, continúa realizando la respuesta a pesar de la descarga
(está dispuesta a soportar situaciones aversivas).

Fenómeno de la recaída
Incluso tras la recuperación de la adicción en determinados sujetos persiste el desei de
consumirla y tras un tiempo sin hacerlo, en determinadas ciscunstancias (estrés, contexto de
adquisición de la adicción...) pueden volver a caer en la tentación. Las ratas representadas en
nego presentan este fenómeno (rápido aumento de la tasa de respuesta).
Tª explicativas de la adicción
Hay un marco general de diferentes autores en el que se sugiere que las conductas
adictivas se producen por el efecto reforzante que provoca su consumo: HIPÓTESIS
HEDÓNICAS:
-Placer-dolor
-Reforzador positivo – Reforzador negativo: En la adicción se da la influencia del
reforzamiento positivo (presencia de un reforzador apetitivo tras la respuesta) y el
reforzamiento negativo (la rspuesta supone la retirada de un reforzador aversivo). La
droga produce placer tras su consumo y su no concumición produce displacer, se
vuelve a consumir para evitar ese displacer.
-Procesos oponentes
APRENDIZAJE E-R (consumo como hábito rutinario).
HIPÓTESIS DOPAMINERGICA: Guarda relación con los efectos de la droga a nivel general en
los circuitos cerebrales de recompensa. Estas estructuras están conectadas entre sí y usan
como neurotransmisor la dopamina.
Al consumir una droga se incrementa la respuesta de este circuito, se sensibiliza, hay
una mayor respuesta del cerebro ante la droga. Así es que la droga adquiere un mayor valor de
incentivo. (INCENTIVO: evento con determinadas propiedades que en un organismo tiene un
valor determinado e instiga una conducta). Según la Tª de la sensibilización los estímulos del
ambiente también adquieren esa capacidad de incentivo y provocan una actividad cerebral un
poco inferior a la de la droga (motivación de incentivo de los esttímulos).
La Tª de la sensibilización incentiva dice que la experiencia repetida con drgas hace que estas
adquieran un mayor valor de incentivo y aumenta por lo tanto el valor de la recompensa que
conlleva su consumo. Los estímulos también adquieren vaor incentivo.
Estudio de Wyrell y Berridge
A un grupo de control se le suministró una solución incocua en el núcleo acumbuo.
Leugo se procedió a una fase de condicionamiento de una respuesta a la obtención de
anfetamina (no sacarosa como dice en la imagen). Luego en la Fase 2 se les asocia un Tono a
la inyeccion de la anfetamina y un click a ningún tipo de evento. En la fase de Prueba se
presentan el tono y el click por separado y se mide la tasa de respuesta.
A otro grupo de ratas se les realiza el mismo procedimiento a diferencia de que en
primer lugar se les inyecta la anfetamina, provocandoles una sensibilización frente a la droga
(mayor valor de incentivo).
Los resultados arrojados por el estudio fueron los siguientes:
En el grupo de control el tono provocó un poco más de respuesta por la previa
asociación del mismo a la droga, pero la tasa de respuesta es comparable a la casi inexistente
frente a la presentación del click.
En el grupo de las ratas sensibilizadas el tono produce un incremento más que
significativo de la respuesta, frente al click que produce una fuerte caída de la tasa de
respuesta.
En conclusión extraemos que los estímulos del ambiente provocan respuestas
encaminadas a la obtención de la droga en aquellos sujetos sensibilizados a la misma.

TEMA 8: MODELOS TEÓRICOS
Perspectiva teórica del condicionamiento

En una situcaión estándar del condicionamiento clásico se presenta un EC seguido de
un EI y estos elementos se convierten en cualidades del entorno. Antes de que se produzca el
condicionamiento el sujeto almacena en su memoria información sobre los hechos, de tal
forma que almacena información sobre el EC y el EI y sus atributos (sensoriales,
motivacionales, hedónicos. Forma en su memoria representaciones dde los mismos con el
mismo contenido del EC y del EI.
Tras el condicionamiento, cuya naturaleza es asociativa, en la experiencia conjunta con
un determinado EC y EI, se forman relaciones (asociaciones) a nivel de la memoria entre las
representaciones de ambos.

Existen dos formas posibles de asociar los elementos de una situación estándar de
condicionamiento clásico:
1º Teorías E→ R: se trata de una asociación directa entre la representación del EC y la
de la respuesta producida por el EI. De esta forma al presentar un EC se produce una
respuesta homóloga a la producida por el EI , la RC. En este tipo de asociación no
participa la representación del EI. Se trata de un tipo de conocimiento procedimental.
2º Teorías E→E: En el curso del condicionamiento al presentar conjuntamente EC y EI
sus representaciones se asocian. Más tarde, en la prueba al presentar el EC no se
activa la representación de una respuesta, sino que se activa la representación del EI
asociado y este fenómeno es que produce la RC.

Modedelos asociativos
Explican las asociaciones formadas a nivel interno. Los modelos posteriores (de
atención, de memoria, centrados en la ejecución...) no cuestionan la asociación pero
incorporan otros mecanismos.
Modelo de Rescorla y Wagner (1972)
Se trata de un modelo matemático formal que tiene el objetivo de explicar asociaciones
entre los estímulos y la producción de las respuestas condicionadas. Se basa en las teorás
asociativas E-E. Indica que para que la presencia de un EC provoque la activación de la
representación de un EI a nivel de la memoria deben darse unas determinadas circuntancias:
-Deben formarse asociaciones E-E:
La asociación puede tener una determinada fuerza asociativa (VA ) que se fortalecerá
en el curso de la experiencia. Además la fuerza asociativa determinará la magnitud de
la respuesta.

El resultado de VA es el resultado de la suma de la magnitud del incremento de todos
los ensayos.
VA = ΔVA 1 + ΔVA 2 + ΔVA 3 +ΔVA 4 …
-La magnitud de la asociación depende de la capacidad asociativa del EI:
-La saliencia del EC también afecta a dicha magnitud (grado en que destaca del
entorno):
-El componente motivacional del EI:
Se representa por β y hace referncia al impacto motivacional del EI, que instiga
determinadas conductas.
A partir de estos supuestos se desarrollo la ecuación del modelo:
Donde se presupone que α, λ y β son valores constates en el condicionamiento. α varía entre
0 y uno, siendo 0 = ausencia del EC. VT hace referencia a VAn-1

Entonces podríamos calcular VA5 = ΔVA 1 + ΔVA 2 + ΔVA 3 +ΔVA 4+ΔVA 5 a través de la
fórmula anterior.
VA5 = 50 + 25 + 12,5 + 6,3 + 3,1 + 1,5 = 98,4

Bloqueo según el modelo de Rescorla y Wagner.

Fase 1 Fase 2 Bloqueo
Condicionamiento:
LUZ > EI > R
Finalmente:
LUZ > R
Condicionamiento:
LUZ y TONO > EI
Prueba:
TONO > No R
(el tono no resulta relevante
en la fase 2)
α, λ y β VA5 = ΔVA 1 + ΔVA 2
Asignamos los siguientes valores:
VLUZ
n
= 100 (fuerza asociativa alcanzada en la fase 1)
λ = 100
αLUZ = 0,5 αTONO = 0,5
β = 1
Calculamos los incrementos en la Fase 2, para intentar explicar la ausencia de
condicionamiento del TONO:
ΔVLUZ1 = α · β (λ- VT) = 0,5 · 1 (100 – 100) = 0
ΔVTONO1 = α · β (λ- VT) = 0,5 · 1 (100 – 100)= 0
Como vemos se comprueba. El valor de VT) es en ambos casos 100, porque es el total
de fuerza asocioativa (sumatorio) alcanzado en la fase anterior por ambos estímulos. La
capacidad asociativadebe repartirse entre ambos estímulos.
Ensombrecimiento según el modelo de Rescorla y Wagner
Se presenta un estímulo complejo formado por una “luz” (poco saliente) y un RUIDO
(muy intenso).
FASE 1 PRUEBA
Luz, RUIDO > EI Dos asociaciones distintas:
Luz > EI
RUIDO > EI
VRUIDO
n > VLUZ
n
Damos unos determinados valores:
λ = 100
αLUZ = 0,2 αRUIDO = 0,4
β = 1
Supongamos que la fase 1, consistió en 3 ensayos, calculemos VRUIDO
n y VLUZ
n.
ΔVRUIDO1 = 0,4 · 1 (100 – 0) = 40
ΔVLUZ1 = 0,2 · 1 (100 – 0) = 20
ΔVRUIDO2 = 0,4 · 1 (100 – 60) = 16
ΔVLUZ2 = 0,2 · 1 (100 – 60) = 8
ΔVRUIDO3 = 0,4 · 1 (100 – 84) = 6,4
ΔVLUZ3 = 0,2 · 1 (100 – 84) = 3,2
VRUIDO
n = 0 + 40 + 16 + 6,4 = 62,4
VLUZ
n = 0 + 20 + 8 + 3,2 = 31,2
La fuerza asociativa del estímulo de mayor saliencia es efectivamente más alta. Se
comprueba también este efecto.
Inhibición latente. Limitaciones del modelo de Rescorla y Wagner.
GRUPOS FASE 1 FASE 2
IL 4 x LUZ > nada 4x LUZ > EI
CONTROL ----------- 4x LUZ > EI
Sabemos que en el fenómeno de inhibición latente en la fase 2, el EC tiene dificutades
para asociarse al EI. Pero según el modelo de rescorla y Wagner, para el grupo IL el
condicionamiento sería el siguiente (con unos valores de λ = 100, αLUZ = 0,5 y β = 1):
FASE 1
ΔVLUZ1 = 0,5 · 1 (0 – 0) = 0 (no está presente el EI ni sus atributos) Lo mismo ocurre en ΔVLUZ2
ΔVLUZ3 y ΔVLUZ4.

FASE 2
ΔVLUZ5 = 0,5 · 1 (100 – 0) = 50
ΔVLUZ6 = 0,5 · 1 (100 – 50) = 25
ΔVLUZ7 = 0,5 · 1 (100 – 75) = 12,5
ΔVLUZ8 = 0,5 · 1 (100 – 87,5) = 6,75
VLUZ= 93,25 >>>> ESTO ES INCORRECTO. NO PUEDE PRODUCIRSE EL MISMO
CONDICIONAMIENTO QUE EN EL GRUPO DE CONTROL (SIN PREEXPOSICIÓN AL EC).
Algunos teóricos a partir de esta comprobación cuestionan la supuesta onstancia de la
saliencia del EC (α) y plantean que esta varía con el trancurso del condicionamiento.
Inhibición condicionada según el modelo Rescorla y Wagner
En un experimento de inhibición latente, se asocia en la Fase 1 un Tono a un
determinado EI hasta que alcanza una fuerza asociativa de 80. en la segunda fase se
presentan conjuntamente una Luz y el Tono sin presencia del EI (fase de inhibición).
Fase 1 Fase 2
TONO > EI LUZ + TONO > No EI
λ = 100
αLUZ = 0,2 αRUIDO = 0,2
β = 1 VTONO
n = 80
¿Qué tipo de propiedades condicionales adquiere cada EC?
TONO: excitatorio apetitivo
LUZ: Innhibitorio apetitivo (inhibidor condicionado)
Se desarrollan dos asociaciones:
TONO > EI
LUZ > EI
ΔVTONO1 = 0,2 · 1 (0 – 80) = -16
ΔVLUZ1 = 0,2 · 1 (0 – 80) = -16

VTONO = 80 + (-16) = 64
VLUZ1 = 0 + (-16) = -16
La explicación de Rescorla y Wagner a este fenómeno fue que existen dos polos
asociativos. El polo positivo hace referencia al condicionamiento excitatorio y el negativo al
condicionamiento inhibitorio.
Teoría atencionales
Surgen en respuesta a las limitaciones del modelo de Rescorla y Wagner a la hora de
explicar fenómenos como la inhibición latente. Dicen que en el curso del condicionamiento al
presentar juntos EC y EI se asume que aumenta la fuerza asociativa entre ambos (al igual que
en modelo R y W). Es decir: VA tiende a λ y el EC produce una respuesta proporcional a VA.
Discrepan con Rescora y Wagner en que α no varíe a lo largo del proceso de
condicionamiento. A medida qu el condicionamiento avanza, la codificación que el sujeto
realiza sobre el EC varía. Para ellos la habituación representa un fenómeno de disminución de
la atención al EC.
Para Perace y Hall la α (codificación del EC) depende de λ menos VA. Por esta teoría
α = λ - VA. Y por lo tanto al final de condicionamiento α = 0.
Teoricamente se apoya sobre la hipótesis de que l”las señales de las cuales ya
conocemos sus consecuencias previamente, no necesitan ser codificadas al mismo nivel que
las nuevas”

Estudio de Kaye y Pearce
Realizaron un estudio con ratas en el que la asociación consistiría en un Tono que
rpoduciría la aparición de comida. Observaban el aumento de la actividad entre las ratas al
presentar el estímulo como RC. Se establecieron 3 grupos:
G0 = se les presentaba el sonido y nunca iba seguido de la aparición de la comida. (no es de
esperar que realice respuesta de aumento de la actividad)
G50= en el 505 de las presentaciones del EC se les daba la comida.
G100= en el 100% de los casos la presentación del EC iba seguida de la comida.
La respuesta de activación alcanzaba una VA superior en el grupo G100, media en el
grupo G50 y muy baja o casi nula en G0. Entonces decidieron estudiar la atención que
prestaba cada grupo al EC en curso del condicionamiento, para ello observaron las respuestas
de orientación hacia la fuente de emisión del TONO por parte de los sujetos.
El G0 y G100 dejan progresivamente de prestar atención al estímulo porque conocen sus
consecuencias. Sin embargo, el G50 no puede predecir con exactitud lo que va a ocurrir por lo
que su atención al EC es constante. A medida que la diferencia entre landa y la fuerza
asociativa disminuye, también disminuye la atención prestada al EC.
Modelos de memoria
Modelo SOP de Wagner
Incluye los mecanismos memoriales. Por ejemplo los efectos de la habituación a corto
o largo plazo dependerán de si esta info se codifica en la MCP o MLP. Dice que cuando
presentamos conjuntamente un EC y un EI no solo se forman asociaciones entre ellos, sino
que también entre sus atributos.

Para Wagner cada uno de esos nodos representa un evento o estímulo (A y B). Ambos
contienen info sobre los atributos sensoriales de cada evento (A1:dulce, A2: apetitivo... por
ejemplo).
Presupongamos que A es un EC y B un EI. Para ambos el sujeto codifica la
información sobre sus atributos y luego establece relaciones entre estas discriminaciones (no
son conexiones entre estímulos, sino entre atributos de estímulos).
Para que se preduzca una asociación entre A y B es necesario que ambos nodos esten
activos en la MCP al mismo tiempo. La asociación será mayor cuanto mayor sea la fuerza de
activación del nodo A y del nodo B. El estado de máxima activación de un nodo (lo
denominaremos A1) se produce cuando el estímulo al que representa ese nodo está presente.
Esta activación del nodo se produce a nivel de la MCP pero al desaparecer el estímulo, la
activación del nodo en este nivel memorial se reduce a un estado de menor activación > A2.
Cuando presentamos un Ec se produce por lo tanto la máxima activación de su nodo.
Si presentamos un EI (activando al máximo su nodo) justo después del EC (que pasara al
estado A) se producirá una asociación entre ambos. Esto explica porqué cuando disminuye el
intervalo entre EC y EI aumenta su asociación.
Condicionamiento inhibitorio
Un estímulo alcanza la máxima fuerza inhibitoria cuando sus atributos están en estado
A1 y el EI en estado A2 o posterior (ha desaparecido el nodo a nivel de la MCP).
Activación al máximo nivel > Presentación del estímulo = Activación autogenerada
Activación de un estímulo por la presentación de un evento relacionado = Activación
generada por asociación.

Especificidad contextual
Los aprendizajes en general se asocian a los contextos. La RC no se condiciona a los
estímulos, se condiciona a las características del entorno.

Modelos de ejecución de la respuesta condicionada
Asumen que en las condiciones adecuadas siempre se va a producir aprendizaje (se
van a asociar los estímulos). Este aprendizaje no siempre se va a mostrar en la ejecución de
Bloqueouna respuesta (por fallo en la ejecución o interferencia).
Bloqueo
Según la hipótesis del comparador si se produce una asociación entre el Tono y la Luz
y de estos con el EI. LA respuesta es el parpadeo y el EI es una descarga eléctrica. La
respuesta se mide frente a la presentación de la LUZ.

Segun R y W en el Grupo1: La fuerza asociativa del tono es igual a landa y por lo tanto la
fuerzaasociativa de la luz es igual a 0 (bloqueo).
En el Grupo 2 la fuerza asociativa del tono y de la luz son equivalentes y tanto el tono
como la luz producirán la misma respuesta.
Es incpaz de explicar lo ocurrido en Grupo3.
Según la hipótesis del comparador dice que la respuesta a la luz se produce porque
en la Fase 2 se produce una asociación entre esta y el EI. Tanto la Luz y el Tono se asocian
con la descarga. Estas asociaciones tienen distintas magnitudes que varían a lo largo del
condicionamiento. En el momento de la prueba lo que hace el sujeto es comparar todos los
eventos del condicionamiento (presentes y ausentes) y decide cual es mejor predictor del EI y
según su presencia o ausencia realizará la respuesta o no.
Por lo tanto en el G1 la asociación del Tono a la descarga es superior a la de la Luz a
la misma. Responde únicamente al tono.
En el G2 la asociación es igual. Responde a los dos estímulos por igual.
En el G3 la asociación del Tono a la descarga es superior hasta la Fase 2, en la Fase 3
esta disminuye y por eso la asociación de la Luz a la descarga, aunque fuera muy pequeña,
resulta superior a la del Tono a la descarga. La luz produce respuesta.
Marc y Bouton dicen que los fallos en la ejecución se producen por la interferencia de ciertas
informaciones en la recuperación de la memoria. En experimentos de varias fases el sujeto
almacena información sobre las distintas fases . Forma representaciones de las asociaciones y
en la fase de prueba las compara.
Algo similar a lo anterior sucede en el ensombrecimiento.

TEMA 9: Condicionamiento humano y aprendizaje causal
Determinados aspectos del aprendizaje son exclusivamente humanos.
En 1974 Se publicó un articulo de gran influencia en el condicionamiento humano: Dice
que no existe evidencia de que exista el condicionamiento clásico ni operante en el ser
humano. Al contrario que en los animales no se puede producie condicionamiento en sentido
literal (en el sentido automático o mecánico). Esto es debido a la presencia de la consciencia:
el ser humano debe de ser consciente de la relación establecida para ser capaz de dar la
respuesta.
Conceptos:
Razran acuña el término “niveles de aprendizaje”: no hay un solo tipo de aprendizaje
posible, existe una jerarquía (de los más básicos a los más complejos).
También existen distintos niveles de procesamiento: fruto de los estudios conductistas
que creen que la psicología se basa en el procesamiento de información).
Aun estudiando el nivel de aprendizaje asociativo, la respuesta no se produce a menos
que intervengan procesos de aprendizaje simbólico (jerarquía).
Operación en paralelo: se pueden realizar simultaneamente
Operación en serie: tienen que realizarse por separado. Requieren más recursos atencionales.
Aquellas respuestas que no sean de carácter autónomo (como conductancia de la piel o tasa
cardiaca que si lo son) requieren consciencia para su adquisiscion y consciencia de la relación
establecida (ser capaz a expresarla verbalmente).
Aspectos metodológicos: Tratan de diferenciar si el procesamiento es automático o
controlado.
Emparejamiento informado: Se avisa de una falsa contingencia entre EC y EI, las
respuestas autonmas se realizan igualmente (no requieren conscienca en su ejecución, pero sí
en la relación EC-EI).
Condicionamiento instruido: Se realiza determinada respuesta pedida en presencia de
un EC.
Enmascaramiento: Es similar al ensombrecimiento y es más fiable que los anteriores
porque no intervienen las expectativas del sujeto.

En la tarea primaria: se presentan dos Ecs. Un EC+ y un EC- (luces distintas). El EI
es una descarga electrica por lo que la presencia de EC+ provoca una respuesta de cambio en
la conductancia de la piel.
Luego se pide al sujeto que realice una tarea secundaria: “Cuando percibas un tono,
presiona una tecla (R)”.
Al presentar el Tono en presencia de los Ecs se obseerva que se produce un cambio en la tasa
de respuesta en la Tarea secundaria cuando está presente el EC+.
Escucha dicotómica

Estos estudios se caracterizan porque la escucha de ambos oídos se realiza por
separado (es dicotómica). Se pone al sujeto unos cascos y se establece un canal atendido (se
le presenta información a procesar) y un canal no atendido (se presenta una información no
relevante para latarea pero se puede procesar en menor medida).

En este experimento, en una primera fase al presentar a un sujeto determinadas
palabras (ciudades) se le propicia una descarga. De modo que aquellos sujetos que sean
conscientes e la relación: ciudades-descargas, al oír una palabra de esta categoría semántica
realizarán la respuesta de cambio de conductancia de la piel.
Luego en una segunda fase de prueba se le pide que atienda por un canal a un
mensaje en prosa que ha de repetir posteriormente. A este canas dedicará casi la totalidad de
su atención.
Sin embargo por el canal no atendido se presentan una serie de palabras de control y
de la categoría semántica condicionadad previamente. Cabe esperar que el sujeto no sea
consciente de la rlacion “ciudades-descarga” porque está atendiendo al otro canal. Sin
embargo los resultados obtenidos arrojan una tasa de respuesta de cambio de la conductancia
de la piel alta cuando aparecían las “ciudades”. Esto se debe a que el procesamient del canal
no atendid es en menor medida y la ejecución de respuestas autónomas (cambio de
conductancia) no requiere de consciencia en su ejecución (sí en su asociación).
Es importante subrayar: para que el condicionamiento se produzca el sujeto debe identificar
el EC correctamente (para que pueda interpretar la relación). En este caso en la fase de
condicionamiento debe interpretar que la categoría semántica de las palabras que provocan la
descarga era el nombre de “ciudades”.

Ejecución de la RC: Una vez adquirida la respuesta ya no se necesita de la atención al EC, la
mera exposición a este provoca la realización de la respuesta. Es un ejemplo de
procesamiento automático.

Tarea de enmascaramiento
Estas tareas se caracterizan por la presentación de un estímulo diana (de relevancia
para el sujeto, por debajo del tiempo necesario para su correcto procesamiento) y un estímulo
máscara (posterior al estímulo diana, durante más tiempo, su procesamiento impide el
procesamiento del estímulo diana).
Tratan de averiguar si la presencia del estímulo diana refleja el condicionamiento
previo de este EC a un determinado EI (en una fase previa) a pesar de que su procesamiento
no es consciente (es automático).
Ejemplo

En este experimento se hacía una fase previa de condicionamiento a los sujetos. Un
EC+ compuesto por la imagen de una cara triste (denota emociones negativas) predecía una
descarga eléctrica. Por otra parte un EC- compuesto por la imagen de una cara feliz (denota
emociones positivas) no tenía ningún tipo de consecuencias.

En la fase de prueba se les presentaba a los sujetos:
-Por un lado el EC+ como estímulo diana seguido de un estímulo máscara (rostro
neutro).
-El EC- como estímulo diana seguido del mismo estímulo máscara.
Se obtuvieron unos resultados que demuestran que en presencia del EC+ hay una
gran respuesta de aumento de la conductancia de la piel a pesar de que su procesamiento no
sea cnsciente (si le predimos que exprese verbalmente lo que ha ocurrido no es capaz de
hacerlo, no sabe que ha pasado ni que ha visto exactamente). Realiza un procesamiento
automático del EC+.
Extinción de la RC
Se aplica al proceso de extinción de una respuesta condicionada los distintos diseños
de disociación y se juega con las expectativas del sujeto (haciendo creer al sujeto que el EI
no seguirá al EC se provoca un descenso en la magnitud de la RC incluso cuando el EC se
presenta enmascarado). (Extinción instruida)Aprendizaje evaluativo
El estudio del aprendizaje humano nos desvela que está más próximo al
condicionamiento clásico y condicionamiento instrumental animal de lo que pensabamos en un
principio. La mayor diferencia entre ambos es que el aprendizaje en humanos puede ser
regulado por creencias y procesos mentales superiores.
Hasta hace poco se creía que los animales no tenían emociones y se hacía la siguiente
distinción entre apreendizajes:
-Aprendizaje de señal (Cond. Clásico tradicional): Consiste en aprender a
usar señales del entorno para predecir consecuencias relevantes (es un tipo de
aprendizaje causal). Un EC anticipa un EI y esta relación se manifiesta a través de una
RC.
-Aprendizaje evaluativo: Se creía que era exclusivamente humano y de
carácter no asociativo. Consiste en la transferencia del valor hedónico del EI a los
estímulos que le preceden (EC). Este valos hedónico recibe el nombre de valencia,
puede ser positiva o negativa. Hoy en día sabemos que no es un aprendizaje
exclusivamente humano, hay evidencias de que se produce en animales: experimentos
de devaluación y observación de respuestas faciales.
Modulación: reacciones afectivas y faciales.
En este experimento se daba a los tres sujetos el mismo zumo y se les mandaba beber
determinados vasos espaciados en el tiempo. Mientras transcurría el tiempo se les dejaba ver
una película con distinta carga emocional. En el caso de a) era una película de carácter
horripilante. En el caso de b) la película no tenía ningún tipo de carga emocional. En el caso de
c) era una película romántica.
Diseño de aprendizaje evaluativo
Estos experimentos presentaban tres imagenes con carga afectiva distinta: uno
aversivo, uno neutro y otro agradable.
Después de la valoración por parte de los sujetos se presentaba uno de los estímulos
con carga afectiva (aversivo o agradable) como estímulo diana y luego se presentaba el
estímulo de carácter neutro como estímulo máscara.
Había tres grupos de suetos: Pavloviano (expuestos a la experiencia), observatión
(antes de que se le presentaran los estímulos observaban el proceso en otros) y instrucción
(se les daban instrucciones sobre lo que iban a ver y sentir).

Se observaron que en los tres grupos la conductancia de la piel variaba frente a la
presencia de un EC+ (anticipaba una descarga) en los tres grupos, estuviera o no
enmascarado.
Aprendizaje implícito y valoración afectiva.
Primming o preactivación: Proceso de facilitación del procesamiento de un estímulo.
Se produce cuando este estímulo a procesar va precedido de otro estímulo distintivo que
guarde cierta relación con él.
Por ejemplo pedimos a un sujeto que identifique las imágenes pertenecientes a la
categoría semántica “arbol” (abedules cerezo, roble...). Antes de la aparición de la imagen de
uno de esos árboles se presenta un estímulo diana enmascarado formado por un evento
perteneciente al árbol (hojas, tronco, ramas...) El procesamiento de este estímulo previoes
inconsciente pero facilita la identificación del siguiente. (se observan menores tiempos de
reacción en aquellos estímulos precedidos por eventos distintivos).

En este experimento de valoración afectiva se presentan dos tipos de Estimulos: uno
de valoración afectiva positiva (Pikachu) y otro de valoración afectiva negativa (Haunter). Estos
estímulos se enmascaraban y acto seguido procedía la presentación de una palabra de
determinada carga hedónica (independientemente del valor del estimulo enmascarado). Los
sujetos debían identificar el valor de esa palabra lo más rápido posible. Por lo tanto los
emparejamientos podían ser congruentes (positivo-positivo o negativo-negativo) o
incongruentes (positivo-negativo o negativo-positivo).
Los resultados arrojan que en casos de incongruencia (tanto positiva como negativa) la
latencia de la respuesta aumenta considerablemente en comparación a los casos congruentes
(se facilita el procesamiento de la palabra).
Condicionamiento instrumental:
En el condicionamiento clasico en humanos sabemos que para adquirir una respuesta
dada es necesaria la consciencia de la relación entre EI-EC (saber expresarla verbalmente).
En modelos animales, no podemos probar esta “consciencia” porque no hablan, entonces lo
inferimos a través de la realización de la RC.
En cuanto al conicionamiento instrumental en humanos sabemos que hasta los 5
años (etapa en la que se desarrolla la capacidad del lenguaje) los programas de reforzamiento
afectan a la ejecución de las respuestas en igual medida que lo hacen con los modelos
animales. A partir de esta edad en los seres humanos comienzan a influenciar las creencias y
expectativas y los programas de reforzamiento en el condicionamiento instrumental ya no
marcan las pautas de ejecución de una respuesta (las repuestas se ajustan a lo que el sujeto
cree, no al programa de reforzamiento.
De vez en cuando los seres humanos apoyamos nuestra conducta sobre creencias
supersticiosas (se cree que existen unas contingencias que no son reales y regimos nuestra
conducta en función de ellas). Según Skinner las supersticiones surgen en ocasiones en que
dos sucesos aparecen emparejados muy habitualmente (sin que exista verdadera
contingencia) dando lugar a altas probabilidades en la memoria del sujeto.
Juicios de contingencia
Son valoraciones de las relaciones entre la acción y sus consecuencias. Es decir, la
percepción subjetiva que tiene el sujeto sobre el grado de relación entre su conducta y las
consecuencias de esta.
Metodología
Existen dos métodos para medir el Cond. Inst en humanos:
-Tareas conductuales: Consiste en reproducir tareas análogas a las de los
animales y medir la tasa, latencia... de la respuesta. Además se puede pedir una valoración al
sujeto sobre lla relación entre sus conductas y sus consecuencias (estos juicios suelen
ajustarse a lo real).
-Tareas de juicios o diagnótico médico: Simulan el proceso realizado por
médicos (a partir de unos síntomas infieren una enfermedad). El sujeto a partir de determinada
información debe inferir unas consecuencias.
En este ejemplo donde C (causa: medicamiento) y E (efecto: cura) tienen distintas
relaciones. En el caso de que a, b, c y d fueran equiprobables (25%), diríamos que el
medicamento no es eficaz (da igual tomarlo que no, la propabilidad de curarnos sería la misma
en ambos casos).
Si la pobabilidad de a fuera 85% y todas las demás fueran 5%, diriamos que si es
eficaz. Se relaciona la causa con el efecto (R con Consecuencias). Algo similar se produciría
en el condicionamiento instrumental con animales según Rescorla:
Para Rescorla los cambios en la ejecución de una respuesta no dependen solo de la
estimulación (y sus características fisicas) ni de la contigüidad entre estímulos. Sino que
también depende de la frecuencia de la aparición de las consecuencias sin el EC o la R
(dependiendo si es condicionamiento clásico o instrumental).
Contingencia (positiva P1>P0) (Negativa P1 Consecuencia (derribar)).
Se establecieron 3 grupos en los que P(E/C) era = 0,875:
G1: P(E/NoC)=0,125 > Δp = 0,875-0,125= 0,750
G2: P(E/No C)=0,125 > Δp = 0,875-0,500=0,375
G3: P(E/No C)=0,125 > Δp = 0,875-0,875=0
Los resultados obtenidos desvelan que al igual que en los animales, el valor de Δp
influye diractamente sobre el nivel de respuesta. Por lo que inferimos que la contingencia
interpretada por los sujetos se ve afectada por el numero de veces que aparecen determinadas
consecuencias sin su supuesta causa. Al pedir juicios de valoración en el grupo G1 todos
identificaron como causa el disparo, en el G2 no lo sabían a ciencia cierta, pero en ocasiones
lo atribuían al disparo. El grupo G3 no tenia idea de porque se derrumbaba el ovni.
Al comparar modelos animales (ejecución de una respuesta por parte de unas ratas) y
modelos humanos (juicios de contingencia) se encontraron grandes similitudes.
Terapias conductuales
Los conocimientos extraidos de estos estudios son apliclabes a las terapias
conductuales, influyendo en la conducta del sujeto (potenciando o disminuyendo conductas de
interés).
Se presenta el estímulo fóbico a un sujeto incapaz de evitarlo pero bajo condiciones
controladas.
En técnicas de desensibilización es importante establecer una jerarquía de las fobias
(estímulos relacionados con la fobia según su grado de miedo). Se le presentan
sistemáticamente, de menor a mayor grado y de forma progresiva (hasta que no se supere el
anterior no se presenta el siguiente).
Se sutenta sobre:
La extinción: no sería suficiente porque sería posible la recuperación espontánea.
Contracondicionamiento: A la vez que se produce la estimulación gradual se ascian estos
estímulos con consecuencias de carácter contrario al miedo (control de respiración, ritmo
cardiaco, relajación muscular...)
Inhibición recíproca: entre ambas respuesta.
Fases:
• Entrenamiento de relajación: muscular y respiratorio.
• Elaboración de la jerarquía de ansiedad: asociar de forma gradual las
situaciones que provocande menos a mas miedo.
• Afrontamiento progresivo: bien por exposición al objeto o opor la
imaginación de dichas situaciones, en caso de que no sea posible.
A veces aunque se aplique correctamente este procedimiento, el miedo no llega a
afrontarse porque en situaciones normales se refuerzan positivamente respuestas de escape o
evitación (miedo a ir en avión: ir en barco o en coche).

Técnicas aversivas
Se emplea en conductas adictivas con el fin de reducir los consumos.
Se basa en procesos de aversión al sabor: Se asocia un estímulo relacionado con la
conducta adictiva (cajetilla de tabaco) con imágenes o consecuencias desagradables. El valor
hedónico de estas nuevas consecuencias se transfieren al estímulo.

Aplicaciones médicas:
• Supresión condicionada del sistema inmunitario: El fin es la consecución de la
reducción del sistema inmunitario. Se realiza mediante la aplicación de fármacos y su
asociación a otras sutancias hedónicamente apetitivas (sacarina). Se mide el número
de muertes y si la sacarina es capaz de adquirir el valor de supresor inmunologico del
fármaco al que acompaña.
• Quimioterapia: Los síntomas inmediatos se pueden refrenar con la aplicación de
fármacos, sin embargo el contexto también se asocia a los síntomas y produce
síntomas anticipatorios. Se estudia la posibilidad de un fármaco inhibidor de estos
segundos sintomas o un método de asociación previo del contexto a situaciones
agradables.

Aplicaciones del condicionamiento instrumental.

Psicología comparada: investigación que trata de descubrir si compartimos nuestro proceso
cognitivo con otros aspectos animales.

Sistemas y procesos de memoria

Sabemos que el conocimiento puede ser declarativo o procedimental. Gracias a
estudios con ratas (las cuales pueden tener memoria episódica) sobre la memoria animal,
podemos definir esta según dos criterios: a largo plazo y a corto plazo.
La estructura de la memoria conforma un sistema multialmacén en el que
encontramos información cotidiana almacenada de diferentes maneras porque ha sido captada
por diferentes receptores.

En cuanto al sistema de memoria a corto plazo o memoria activa podemos decir
que no permite grancantidad de información y que esta decae con el paso del tiempo. Es un
sistema formado a nivel estructural. Esta información se puede almacenar de manera ilimitada
manteniendo la memoria a corto plazo activa durante mucho tiempo por medio de repasos.
Teorías generales:
Teorías del almacenamiento
Con el tiempo se forma una huella de la información de la memoria que decae con el
paso del tiempo. El olvido obedece a que no se ha codificado o almacenado bien esa
información en la memoria.
-Decaimiento de la huella de memoria y olvido
-Codificación retrospectiva (algo nos hace recordar) y prospectiva (recuerdos
involuntarios)

Teorías de las interferencias
En ocasiones se produce una interferencia entre los sistemas de memoria. Una
determinada información es interferida por otra a la hora de la memorización impidiendola.
-memorias formadas durante el intervalo de retención
-interferencia pro-activa (información que previamente se aprendió, que interfiere con
el recuerdo de materiales más recientes ) y retroactiva (Ocurre cuando la información
aprendida dificulta la retención de la información reciente ).

Teorías de la recuperación
El olvido se produce por fallos en el proceso de recuperación de la información. Se
producen por los efectos del cambio de contexto y del paso del tiempo.
Segun Rescorla y Wagner se produce porque no se asocian los estímulos con la memoria (no se
produce una RC por lo tanto).
Sin embargo otras investigaciones sugieren que la información si ha sido codificada pero se
produce un fallo en la recuperación de esta codificación.
Fases de la memoria
1º Decae la huella de la información con el paso del tiempo
2º Fallo en la recuperación de la información

Técnicas y métodos de estudio
Técnica de igualación demorada a la muestra
“animal mind”: se emplea en palomas, simios, niños... etc. A través de un panel central
se le presenta al sujeto determinada información que queremos que retenga para utilizarla más
adelante. Tras un tiempo determinado este estímulo desaparece.
Posteriormente tras un tiempo de demora el sujeto debe elegir entre dos estímulos que
se le presentan cual es igual al que se presentó en el primer ensayo (debe recordarlo).
También se utilizan tareas de orientación espacial (laberintos en T y radiales)

Retención a corto plazo (MCP)
Depende de:
• La duración y la demora: del estímuo de muestra y de la aparición de los estímulos tras
el intervalo de demora.
• Codificación prospectiva (que respuestas debe realizar) y retrospectiva (recordar las
características del estímulo).
• Repaso: mantener activa la información expuesta al sujeto. Sino la huella decae con el
tiempo.
• Olvido dirigido.
• Análisis teórico.
Roberts and Grant estudiaron este fenómeno con palomas, variando en función de los
grupos el tiempo de exposición a la muestra. La retención de la información se medía en el
porcentaje de respuestas correctas dadas tras el mismo intervalo de demora.

Grant estudio los efectos de la demora (manipulando el intervalo de demora) en
laberintos en forma de T para ratas. Quería medir la posible persistencia o decaímiento de la
información en la memoria. La fase de retención de la información se realizaba en el mismo
recinto. Estableció dos grupos de ratas, el grupo 2 al cual impediría repasar “el espacio”
apagando la luz del recinto y el grupo 1 el cual podría ver el recinto durante el intervalo de
demora.
Así fue que obtuvo unos resultados sorprendentes: las ratas del grupo 1, a mayores
intervalos de demora, recordaban peor (a pesar de poder repasar visualmente) y las ratas del
grupo 2 cometían menoserrores en intervalos más largos. Este fenómeno puede explicarse en
términos de le interferencia de información.
La retención a corto plazo también se estudió en laberintos radiales, combinando los
ensayos forzados con los ensayos libres. Primero se obliga al animal a ir a determinados brazos
y tras varios ensayos se le deja entrar en cualquiera de ellos. Se consideran respuestas
correctas cuando el sujeto evita ir a aquellos brazos donde ya obtuvo comida con anterioridad,
pues recuerda donde la ha consumido ya.

Posteriormente se estudian los efectos de la variación del intervalo de demora entre los
ensayos forzados y libres para ver cual es su alcance sobre las respuestas correctas. Se obtuvo
que a mayor intervalo de demora aumentan las respuestas incorrectas por el decaímiento de la
huella de la información en la memoria provocado por el paso del tiempo.
Teorías de la codificación de la información
Un punto importante en la memoria es la forma en la que se codifica la información.
Hay dos tipos de codificación:
En técnicas de igualación a la muestra la codificación retrosprectiva consiste en el
repaso de las características a recordar, en función de las cuales se realizara la acción y la
codificación prospectiva se corresponde con una antelación que realiza el sujeto de la acción
que va a realizar. La ejecución es mucho mejor cuando las características a recordar son iguales
a las del estímulo que se presentará mas adelante (color y color o lineas y lineas).
Condicionamiento operante: el término fue utilizado por primera vez por Skinner para
descibrir aquellas respuestas que operaban sobre las conductas de los individuos para
conseguir un fin.
Condicionamiento instrumental: Término acuñado por Marcur para referirse a
situaciones en las que el individuo se tiene que mover para realizar una acción o escapar de
una consecuencia.

Algunas cuestiones sobre la MCP en animales surgen en torno a si en ellos el repaso
tiene carácter atutomático o deliberado. En humanos sabemos que el repaso es consciente ,
pero ¿puede controlarse externamente? Sí, la mécanica con la que se produce puede
interrumpirse en cualquier momento.
En humanos, por técnicas de igualación a la señal podemos favorecer el repaso dando
una pista previa al comienzo del experimento: recuerda el estímulo señal porque te servirá más
adelante. (Clave recuerdo)
sin embargo también existen las claves de olvido que logran el resultado contrario: Se
le hace pensar al sujeto que la señal no será de utilidad en el futuro (no la recordará). Por
ejemplo tras la fase de entrenamiento: se enseña al sujeto a recordar la señal con normalidad,
se vienen unos ensayos análogos con la diferencia de que ahora el repaso de la señal es
interrumpido por la clave de olvido y el sujeto tiene dificultades para retener la información.
Se procedió despues a variar otro factor dentro de este paradigma, dando con lo que
llamamos olvido dirigido. Se establecieron tre grupos de sujetos:
1: la clave de olvido se presentaba solapada con la muestra
2: la clave de olvido se prsentaba 2 seg despues de la finalización de la muestra
3: la clave de olvido se prsentaba 3,5 seg despues de la finalización de la muestra

Los resultados obtenidos para cada grupo fueron:
1: gran diferencia entre los grupos con claves de olvido y recuerdo. Los de recuerdo casi
lograron la totalidad de respuestas correctas.
2: Las elecciones mejoraron para los de la clave de olvido pero seguían con grandes dferencias
respecto a los de recuerdo.
3: a penas hay diferencias entre los grupos.
Esto refleja el efecto variable dependiente de cuando se produce la clave de olvido.
Retención a largo plazo
Un tipo de información retenida a largo plazo es la memoria episódica. Los estudios de
la memoria a largo plazo se han realizado en animales y tiene gran importancia S. Sheffleworth
(etóloga que simulaba el hábitat de los animales).
En un determinado experimento se presentaba a los animales una serie de manchas de
tinta negra y al cabo de un tiempo se repetía el ensayo. El 60/70% de los animales respondían
correctamente. Es decir reconocen cuales son los estímulos positivos y cuales negativos y que
parejas han sido reforzadas. Desmuestran entonces que se puede almacenar información a lo
largo de mucho tiempo.
Los estudios realizados con la rana africana con pies de garra para comprobar el
alcance de la MLP eran en la línea de la evitación. Se sometía a ranas a entrenamientos de
evitación de una descarga.

Tras determinados ensayos en una caja de evitación aprendieron que en el compartimento
oscuro recibirían una descarga y aprendieron a saltar al otro para evitar diche situación
aversiva.
Se realizó el mismo experimento con renacuajos de la misma rana y se les volvió a someter al
ensayo de adultos. Las ranas evitaron igualmente el compartimento oscuro. A pesar de la
enorme transformación física que habían sufrido la codificación de la información y su retención
era la misma.

Tomás y Lopez realizaron un experimento en el que el entrenamiento consistia en que
si la paloma picoteaba una en presencia de una luz obtendría un reforzador. Esta luz tendría
500 nm. Se midió cual era la generalización de la luz hecha por las palomas según el paso del
tiempo.
Se dieron cuenta que a medida que pasaba el tiempo la respuesta se generalizaba más y más.
Estimación del tiempo
Los animales estiman el tiempo al igual que nosostros, de modo que en tareas de
condicionamiento instrumental con programas de reforzamiento de intervalo, las respuestas
tras varios ensayos se ciñen a los intervalos de reforzamiento en función de los estimulos del
ambiente.
En el expreimento, una rata debe responder a los 30 s de la presentación de una luz
con unas características sensoriales determinadas. En los primeros ensayos responde durante
todo el intervalo. Pero a medida que avanza en el condicionamiento se reduce la respuesta que
se ciñe a los 30 segundos.
Existe también una modalidad de condicionamiento que recibe el nombre de
condicionamiento temporal (el refuerzo llega cada cierto interalo de tiempo, sin la presencia
de estímulos específicos). La frecuencia de la RC coincide con el intervalo del reforzamiento.
En este gradiente de generalización de la respuesta, el pico se corresponde con el
momento de máxima respuesta que coincide con la duración del intervalo de reforzamiento (30
seg).
Modelo de medida del tiempo
La tarea de dmedición del tiempo la realizan tanto animales como humanos. El Reloj
biológico funciona como mecanismo que es producto de impulsos que se acumulan en el
acumulador. En cada ensayo que el sujeto es expuesto al mismo estímulo, esta información es
procesada por la memoria a corto plazo. Luego las respuestas dadas y sus consecuencias son
definidas en la memoria a largo plazo. El tercer mecanismo es el comparador, donde si los
estímulos recibidos son los mismos que los codificados se expresará la respuesta almacenada
en la MLP (clara diferenciación entre MCP -estímulo presente que hace recordar lo asimilado por
la MLP- y la MLP -codificación de la relación: E-R-)
Se entregará la recompensa a los 50 segundos, pero antes de ello se presenta una luz
durante 10 segundos. Durante los 10 segundos de presentación del estímulo el reloj se detiene
por lo que en realidad el intervalo es de 60 segundos. El animal se da cuenta de la relación E-R
cuando el estimulo está presente. (la grafica tiene los ejes girados).
Aprendizaje de conceptos naturales y abstractos
En este tipo de tareas al sujeto se le expone a una pruebad de condicionamiento
instrumental, con una palanca y determinadas imágenes de diferentes categorías. Se le
presentan pares de estímulos E+ y E-. Por ejemplo el E+ siempre se corresponde a la categoría
de roble y la E- a otra distinto (por ejemplo una ramade olivo silvestre). En el segundo ensayo
se le presentan distintas imágenes de hojas y si la elección de la imagen corresponde con la
categoría de roble (anteriormente definida como E+) se recoge como respuesta correcta.
Los sujetos clasifican los estímulos y y categorizan en función del estímulo que se les
presentó al principio como positivo.
Teorías de categorizaciónemitirse.

-Nivel Neuronal:
“Tipo particular de plasticidad cerebral, un cambio en la eficacia de las conexiones
entre neuronas debido a la experiencia” ENFOQUE DE LAS NEUROCIENCIAS
(Kolb, 1995)
“Modificación del peso de las conexiones excitatorias y/o inhibitorias según ciertas
reglas o algoritmos” ENFOQUE CONEXIONISTA (Rumelhart, 1992)
-Aprendizaje como cambio en las conexiones neuronales.
- Eric Kandel (1929) recibió el premio nobel por sus estudios de los fenómenos
asociativos y no asociativos a nivel neural: Sensibilización y
habituación.
-La presentación repetida de un estímulo puede provocar tanto disminuciones
como incrementos en la respuesta:
-Las disminuciones de la tendencia a responder producidas por la
estimulación repetida reciben el nombre de efecto de
HABITUACIÓN.
-Los incrementos de la tendencia a responder se llaman efecto de
SENSIBILIZACIÓN.
2. Teoría actual del aprendizaje asociativo
Procesos de Condicionamiento:
“Mecanismos para la detección e inferencia de las relaciones estructurales del
ambiente, mayoritariamente causales, que determinan la conducta adaptativa“
-Dickinson 1980
Aprendizaje: Mecanismo de adaptación biológica
Para alimentarse, eludir los depredadores o reproducirse los animales están
equipados con mecanismos fisiológicos y motores que satisfacen dichas
funciones; sin embargo, no son suficientes en sí mismos para sobrevivir; es
necesario localizar los alimentos, saber dónde acechan los depredadores o cómo
atraer a una pareja sexual. Estas funciones se pueden promover mediante los
procesos de condicionamiento y aprendizaje.
La realización de conductas adaptativas y la anticipación de hechos biológicamente
relevantes (comida, por ej.) del entorno requiere la capacidad de aprendizaje. Estas
adaptaciones al ambiente son tan esenciales para la supervivencia del individuo como
lo son los procesos fisiológicos de la respiración o la digestión.
Michael Domjan , 1999
Los procesos adaptativos se pueden promover a partir de procesos de
condicionamiento y aprendizaje.
Variedades y tipos de aprendizaje:
Naturaleza de los eventos:
Aprendizaje de estímulos: Condicionamiento clásico
Aprendizaje de respuestas: Condicionamiento instrumental

Aprendizaje conductual y cognitivo:
Conductual: cambios en la conducta manifiesta
Cognitivo: adquisición y almacenamiento de información en la memoria
Tipos de asociaciones:
Naturaleza de los eventos:
Aprendizaje de estímulos: Condicionamiento clásico (Pavlov)
Aprendizaje de respuestas: Condicionamiento instrumental (Skinner)
Naturaleza de la asociación:
Independencia: E1 / E2
Contingencia negativa: E1 - no E2 (relación causal negativa)
Contingencia positiva: E1 – E2 ( relación causal positiva)

TEMA 2: LA CIENCIA DEL APRENDIZAJE
1. Conductas refleja y sus propiedades
Conducta refleja: Expresión de un conocimiento instintivo. Un reflejo implica dos hechos: un
estímulo elícitante y una respuesta específica (estrechamente relacionados).
Adaptación biológica y selección natural.
Dos especies de ratones de campo presentan conductas instintivas diferentes. Aquellos
que viven en áreas abiertas, donde es fácil para un depredador vislumbrarlos, construyen
madrigueras con muchas salidas y túneles para en caso de ser perseguidos tener más
posibilidades de escapar del depredador. Sin embargo, los que viven en áreas boscosas dónde
es más difícil para los depredadores identificarlos, construyen madrigueras más simples, de un
solo túnel. Si se cruzan ambas especies tendrás descendencia que sólo haga de un tipo
determinado de madriguera, pero si se cruza uno de los ratones de la 2ª generación con uno de
la 1ª, la descendencia de éstos realizará el mismo tipo de madrigueras que realiza el progenitor
de la 1ª generación.
Fuentes de conducta adaptativa:
-Reflejos y conducta adaptativa: Filogenia.
-Maduración y experiencia: Ontogenia.

2. Aprendizaje no asociativo
La estimulación repetida provoca cambios en las respuestas reflejas.
-Habituación: Debilitación de la intensidad de la respuesta.
-Sensibilización: Aumento en la intensidad de la respuesta.
Aprendizaje y adaptación biológica
Neofobia y aversión adquirida al sabor
La neofobia hace relación a la fobia a lo nuevo (en situaciones nuevas se presentan
mayormente respuestas de rechazo), y esta relacionada con la aversión al sabor, porque la
primera vez que cualquier animal toma un alimento nuevo, prueba muy poco o lo rechaza.
Ejemplo:a una rata sedienta le ofrecemos dos soluciones, una dulce (con sacarina) y
agua. Como la solución dulce se trata de un sabor nuevo preferirá agua, dicha
respuesta es adaptativa (prefiere lo habitual). Si solo probara la solución dulce y no
tuviera consecuencias negativas se reduciría la neofobia (respuesta de rechazo).
Territorialidad y reproducción
Hace referencia a la conducta de defensa del territorio (como vemos en peces y mamíferos)
como mecanismo de supervivencia.
Ejemplo: el macho que mejor defienda el territorio será el que conquiste a la hembra,
por ello está relacionado con la reproducción.
La reproducción es una conducta refleja que puede variar con la experiencia.

3.Mecanismos reflejos:
Adaptación conductual básica: bacterias, protozoos, plantas...
geotropismos (movimiento de un organismo como respuesta un estímulo de la
gravedad -crecimiento de las raíces de las plantas-), fototropismos (respuesta de un
vegetal al estímulo lumínico), heliotropismos (orientación del tallo, flor y hojas hacia la
luz del sol)
taxias (directos, movimiento direccionado de un ser vivo hacia un estímulo), kinesias
(indirectos, cambios en la velocidad del movimiento por motivo de un estímulo)
sueño de las hojas (por las noches las mimosas se cierran)
Respuesta refleja: Aquella de carácter involuntario e instintivo. Es producida por un conjunto
de estímulos determinados que estimulan a nuestras neuronas sensitivas, que envían la
información al cerebro y posteriormente las neuronas motoras producen una respuesta. Una
estimulación repetida de las neuronas sensoriales produce un cambio en la plasticidad del
espacio interneuronal que debilita el efecto de la respuesta (habituación).
Clases de reflejos (fácil identificación del estímulo):
reflejos motores: postural, palpebral, sobresalto, succión, oclusión respiratoria
reflejos sensoriales: pérdida equilibrio, contracción pupila
reflejos digestivos: salivación, náuseas
regulación térmica: sudoración, aumento térmico
reflejos del sistema inmune: liberación histamina, inmunosupresión
Conducta instintiva: Patrones de respuestas reflejas con estímulos más difíciles de identificar.
Las características esenciales para la aparición de la respuesta son difíciles de identificar.
Patrones de acción modal (pautas de acción fija)
Ejemplo: si a un ganso le ponemos un huevo fuera de su nido, esto provoca una
conducta instintiva que consiste en que el ganso estira el cuello y coge el huevo para
llevarlo al nido.
A los estímulos que desencadenan respuestas instintivas, se les llama estímulos señal o
desencadenantes.
Estas forma de conducta es susceptible al cambio, debido a la frecuencia, intensidad…
El estudio del aprendizaje no asociativo estudia las modificaciones de la conducta refleja por
la experiencia repetida.
Tras un experimento que estudiaba la expresión de la respuesta de sobresalto en una
rata frente a un estímulo sonoro se determino que cuántos más experimentos se realizaban, más
se reducía la intensidad de esa respuesta. (Habituación)
La sensibilización por su parte correspondería al aumento en la disposición de un
organismo a ofrecer una respuesta a medida que se repite la experiencia.
Los mecanismos de sensibilizacióny habituación ayudan a canalizar la conducta dando
respuesta sólo a los estímulos relevantes.

A veces previo a la habituación se aprecia un proceso de sensibilización, como en el caso
anterior.
4.Factores:
Existen una serie de factores que afectan al cambio en la intensidad de ofrecimiento de
una respuesta por parte del sujeto.
-La intensidad de los estímulos: provoca una mayor o menor velocidad en la
habituación a los estímulos.

-La duración de la estimulación: afecta de forma parecida.
-La frecuencia de presentación del estímulo: Si es a largo plazo la habituacion será
más lenta, pero estará presente por más tiempo (memoria a largo plazo). Si es en
intervalos muy pequeños de tiempo la habituación será más rápida pero estará
presente por menos tiempo (memoria a corto plazo).
Si tras un proceso de habituación y dejando lugar a un espacio prolongado de tiempo
antes de volver a repetir la experiencia, se volverá a producir la respuesta. Este fenómeno
recibe el nombre de recuperación espontánea.
Procesos de deshabituación
Estímulo extraño: Si se realiza una experiencia hasta el punto de habituar al sujeto a
un estímulo y después se presenta el estímulo precedido de otro extraño, se
recuperará la respuesta.
Especificidad contextual: Si la habituación se produce en un contexto determinado,
al cambiar de contexto (estímulos contextuales diferentes) y repetir la experiencia,
reaparece la respuesta. (El contexto permite recuperar mejor la información aprendida).
Frecuencia de la estimulación: Si se repite la experiencia de forma masiva (alta
frecuencia), tras un intervalo de no exposición, al repetir la experiencia el sujeto
presenta la respuesta con una alta intensidad (mayor recuperación espontánea). El
sujeto tarda menos en habitçuarse pero esta habituación permanece menos tiempo
(memoria a corto plazo). En cambio si repetimos la experiencia de forma espaciada
(baja frecuencia), tras el mismo intervalo de no exposición al estimulo, cuando
repetimos la experiencia el sujeto muestra una respuesta de menor intensidad (menor
recuperación espontánea). En este caso la habituación permanece más pero el sujeto
tarda más en habituarse.
Análisis teórico:
Se proponen una serie de posibles causas que contradicen a la habituación como
proceso de aprendizaje no asociativo. Uno de ellos sugiere que la deshabituación puede
producirse, bien por fatiga motora o adaptación sensorial al estímulo (pero ambas hipótesis
fueron desechadas con la prueba de la especificidad contextual y del estímulo, si el sujeto se
encontrara verdaderamente cansado no presentaría la recuperación espontánea en ninguno de
los dos casos).
-Adaptación sensorial: disminución de la sensibilidad de los órganos de los sentidos
frente a la estimulación.
-Fatiga motora: agotamiento muscular que impide la presentación de una respuesta.
-Habituación: mecanismo por el que se deja de emitir una respuesta a pesar de ser
capaz a realizarla por detectar el estímulo como irrelevante.
La Tª del doble proceso de Grooves y Thompson dicta que las sensaciones
responden a una situación de estado y por lo tanto la habituación obedece al intento de hacer
eficaz la respuesta.
El modelo de los procesos oponentes de Salomon y Corbit, dice que en el
aprendizaje no asociativo, lo que se memoriza son las emociones y todo aquello de carga
afectiva. Pero durante la experiencia repetida, el estímulo cambia de significado emocional y
eso varía la expresión de la respuesta. Desarrollaron un patrón de dinámica afectiva que tiene
aplicaciones en la comprensión de conductas adictivas y se basaba en que los estímulos
evocan una serie de emociones (reacción afectiva primaria positiva/negativa, estado A) y
dependiendo de la naturaleza e intensidad del estímulo provocará, despues de la estimulación
una reacción afectiva opuesta (reacción afectiva secundaria negativa/positiva). Si la respuesta
presentada por el sujeto varía en magnitud, su reacción afectiva primaria también lo hace.

Primera exposición

Varias exposiciones
Cuando presento un estímulo muchas veces disminuye esa reacción primaria o estado “A” del
que hablamos, y por el contrario aumenta la reacción secundaria en amplitud y duración.

Respuestas condicionadas Compensatorias (Siegel)

Si a un sujeto le suministramos morfina, esta sustancia le provocará un efecto
analgésico, pero después que se termine este efecto el organismo dará lugar a una respuesta
compensatoria (como en la Tª de Salomon y Corbit) con el objetivo de contrarrestar la acción
de la morfina, la hiperalgesia
La hiperalgesia es una respuesta compensatoria condicionada, porque el sujeto, la
experimentará estando en ese contexto, al asociarlo con la inyección de morfina.
Cualquier droga (considerada como estímulo) produce unos efectos psicológicos (a
modo de respuesta compensatoria) que se relacionará con el contexto habitual de
consumición. Es decir, la tolerancia, se desarrolla por lo tanto en un contexto determinado. Por
eso, la muerte por sobredosis es común entre personas que se suministran cantidades de
drogas incluso inferiores a la consumida habitualmente en contextos distintos al normal.
Este experimento, mide la mortalidad porcentual de tres grupos de ratas a las que el décimo
día se les inyecta una cantidad mortal de heroína. El grupo IGUAL se desarrolla en el mismo
contexto, con nueve días previos de consumición de la droga. El grupo DIFERENTE replica el
experimento con la salvedad de que el décimo día se cambia el contexto físico de las ratas. El
grupo CONTROL cuenta con 9 días de no consumición, previos a la inyección.
5. Habituación como aprendizaje asociativo
Modelo SOP (Sometimes opposite proccess) de Wagner (1974)
Sabiendo que tras un proceso de habituación que presenta una frecuencia masiva de
la estimulación, retenemos la información en la memoria a corto plazo y al contrario en uno
de frecuencia espaciada lo hacemos en la memoria a largo plazo, vamos a definir ambos
términos:
Memoria a corto plazo (o de trabajo): retenemos información el tiempo justo para su uso.
Memoria a largo plazo: retención de información de forma prolongada.
Wagner alude a la idea de que la retención en la memoria de la información depende
del proceso de esta información en la memoria a corto o largo plazo.

El registro sensorial procesa la información en la MCP o memoria activa, mientras es
necesaria para su uso (si queremos acordarnos durante unos minutos de un número de
teléfono, ponemos en marcha la memoria a corto plazo y lo repetimos una y otra vez hasta que
encontramos el móvil y lo marcamos), si se repite la experiencia y es varias veces requerida,
se procesará en la MLP o memoria inactiva o latente. Sin embargo, para evocar esta
información almacenada en la MLP hay que llevarla a la MCP (puesto que, la información de la
memoria a largo plazo, es aquella que se encuentra de forma latente y no está en uso
constante).
Activar la información que contenemos en la MLP, se consigue mediante la repetición, el
repaso…
Después del análisis sensorial, el comparador filtra la información que se quiere utilizar. Este
filtro tiene una función muy importante, puesto que, no sería útil procesar toda la información si
es que no la vamos a emplear.
El mecanismo de activación de la memoria funciona de dos maneras: por la exposición al
mismo estímulo que permite evocar la información (activación autogenerada relacionada
con la habituación a corto plazo) o por la presentación de un elemento relacionado con lo
almacenado (representación generada asociativamente relacionada con la habituación a
largo plazo).
Es decir, para activar la memoria a largo plazo hay que recurrir a la asociación.
La Tª de Wagner interpreta la asociación contexto-estímulo, se aprede sobre las
característicasfísicas de un estímulo (si es lumínico, sonoro...), las consecuencias que
prooduce (si es irrelevante no tengo por qué reaccionar), conocimiento porcedimental del
estímulo (como reaccionar). La memoria a largo plazo por lo tanto está relacionada con el
contexto, si se cambia de contexto no se recupera la información, se interpretará la
estimulación como un proceso novedoso, si es el mismo contexto, si se recuperará.
Aprendizaje no asociativo y plasticidad nerviosa
El Profesor Eric R. Kandel trabajó con un invertebrado llamado “Aplysia California”. Lo eligió
porque quería estudiar el circuito neuronal de la forma más simplificada posible.
La Aplysia, tiene 36 ganglios, de tal manera, que podían rastrear qué sucede desde que
se presenta un estímulo novedoso hasta que se habitúa a este.
Cuando le presentamos un estímulo (pincharle en la cola o la cabeza) hay una retracción
de la branquia (respuesta refleja), y por ello, es observable como se habitúa a dicho estímulo.
Los factores que intervienen en la retracción de la misma son:
-Intensidad.
-Frecuencia...
Además la experiencia, no solamente cambia la funcionalidad de las neuronas (la
conducta), sino que también las cambia estructuralmente.
La branquia está controlada por una serie de neuronas motoras. Cuando se estimulan
las neuronas sensoriales se activan estas neuronas motoras, a través de las interneuronas. Pues
bien, cuando se estimulan muchas veces, hay un cambio en la eficacia de la transmisión química,
es decir, en los neurotransmisores.
Hay una fuerte correspondencia, por tanto, entre el cambio conductual y el cambio de la actividad
eléctrica.
Kandel afirma, que el proceso de la disminución gradual de respuesta, obedece a una
disminución de la transmisión sináptica. Tras una estimulación repetidase produce una depresión
de la transmisión sináptica entre neuronas sensoriales y motoras (menos liberación de glutamato
en las neuronas presinápticas). La estimulación repetida de las neuronas sensoriales provoca
una reducción del potencial de acción de las neuronas motoras.

En la habituación: hay menos neurotransmisores, lo que provoca menor actividad de las
neuronas motoras y esto genera una menor respuesta.
En la sensibilización: se producen el llamado potencial excitatorio, es decir, un incremento en
la liberación de neurotransmisores (facilitación presináptica).
Proceso dual de la sensibilización y habituación
Supone que existen procesos neuronales subyacentes responsables de los aumentos
y disminuciones de la disposición de un individuo para responder a un estímulo.
Un tipo de cambio en el sistema nervioso produce una disminución de la capacidad del
estímulo para producir una respuesta. Sería el proceso de habituación. Groves y Thompson
suponen que el proceso de habituación tiene lugar por modificaciones en lo que llamaron el
sistema E-R 8puede considerarse igual que el arco reflejo). Este sistema se activa cada vez
que un estímulo produce una respuesta porque es el sistema que conduce los impulsos
nerviosos sensoriales hasta las neuronas motoras.
Por otro lado el segundo tipo de cambio provocaría un aumento de la disponibilidad del
sujeto a responder al estímulo (proceso de sensibilización) y sería provocado por cambios en
el llamado sistema de estado, que determina a nivel general el grado de sensibilidad del
organismo. El sistema de estado interviene solo en situaciones especiales como un estímulo
extraño o relativamente novedoso, con la aparición repetida de un mismo estímulo de gran
intensidad (se sensibiliza)...
El resultado de la conducta en neto, sería el resultado de la suma de las dos curvas
que dibujaría la influencia del estímulo sobre el sistema E-R y el de estado. Sufriendo mayor
influencia de aquella que se vea más afectada.

TEMA 3: FUNDAMENTOS DEL CONDICIONAMIENTO
Este tema es una introducción general a dos temas que veremos después: el
condicionamiento clásico (tema 5) y el condicionamiento instrumental (tema 6). Ambas
novedades del condicionamiento son variedades del aprendizaje asociativo, por lo que
comparten propiedades: método de estudio, dimensiones conductuales… Los dos son
aprendizajes asociativos, la diferencia es en cuanto a qué elementos participan en esas
asociaciones (elementos que se asocian). Este tema no alude al condicionamiento clásico o al
instrumental, es general (común a todas las variedades de condicionamiento). Procedimientos
apetititos/aversivos dependiendo de la naturaleza del EI. El condicionamiento detecta en el
ambiente estímulos que puedan ser causas potenciales (detectar causas-efectos).
1. Condicionamiento clásico
Pavlov y los reflejos condicionados
El condicionamiento clásico es un mecanismo de aprendizaje que nos permite predecir
hechos biológicamente relevantes en nuestro entorno (comida, un peligro inminente) y
anticiparnos a su aparición mediante la realización de respuestas adaptativas de carácter
reflejo.
Pavlov estaba investigando los procesos de digestión (pretendía analizar la salivación
de los perros cuando se les proporcionaba comida). Descubrió que los perros, una vez
acostumbrados a la situación experimental, no esperaban a salivar cuando tenían la comida en
la boca sino que el proceso de salivación comenzaba en cuanto se les exponía a estímulos
propios de la situación experimental (como verle a él). Así, supo detectar un fenómeno mucho
más interesante que analizar y cambió el rumbo de su investigación. De hecho, dedicó el resto
de su trayectoria investigadora al estado de lo que se conoce como aprendizaje por
condicionamiento. El condicionamiento clásico es el método por el cual al presentar un
estímulo previamente neutro en contigüidad espaciotemporal con otro estímulo capaz de
suscitar una respuesta a de manera innata (respuesta refleja), el primer estímulo queda
asociado con el segundo de tal forma que acaba siendo capaz de suscitar por si solo dicha
respuesta.
Pavlov proporcionaba comida a sus perros hambrientos, lo que producía una respuesta
refleja de salivación (respuesta fisiológica). Luego el primer elemento consustancial son los
estímulos del ambiente que producen sin experiencia la reacción del organismos (estímulo
incondicionado, sin mediar experiencia). Estos estímulos producen una reacción refleja de tipo
nervioso acorde con el acontecimiento. La respuesta refleja de salivación frente a estos
estímulos es respuesta incondicionada. Pavlov constata que la respuesta refleja comienza a
producirse también ante estímulos del ambiente que preceden a la comida. Esos estímulos
(luz, tono…) son estímulos neutros o arbitrarios porque no median en la salivación. Estos
estímulos que adquieren propiedad condicionada son estímulos condicionados.
La condición es que el estímulo condicionado (EC) y el estímulo incondicinado (EI)
estén ligados temporalmente. Lo que constata es que los estímulos condicionados (EC)
adquieren por la experiencia repetida también, una capacidad de respuesta análoga a la
respuesta incondicionada (RI). Llamó a esto conexión nerviosa temporal.
Elementos del paradigma de condicionamiento clásico
• EI> estímulo incondicionado (cualquier acontecimiento capaz de provocar una
respuesta refleja específica en el organismo).
• EC> estímulo condicionado (estímulo que por asociación con un EI es capaz de provocar
una respuesta que antes del entrenamiento no provocaba).
• RI> respuesta incondicionada (respuesta que se emite de forma automática ante la
presencia de un determinado EI).
• RC> respuesta condicionada (respuesta provocada por el EC tras la asociación. En
ocasiones RC y RI son distintas.
Cuando se asocia un EI con un EC, la presentación del EC provocará una respuesta
análoga a la RI, llamada RC. La RC no siempre va en la misma dirección que la RI, a veces, vaen la dirección contraria (por ejemplo la respuesta condicionada compensatoria).
Métodos de estudio del condicionamiento clásico

a)Salivación > En el ejemplo de la salivación del perro: condicionamiento de la
respuesta de salivación (de tipo apetitivo porque evoca una respuesta relacionada con la
comida)
b)Automoldeamiento> En el otro ejemplo, observamos el fenómeno de
automoldeamiento. Hay dos estímulos. Aparece la luz de colir rojo y recibe comida (se
condiciona este EC al EI). El estímulo provoca la respuesta condicionada. El otro estímulo (luz
gris) no da comida. ¿Cuál es la respuesta refleja que provoca en un animal hambriento?
Conducta de aproximación. Después de hacer varias veces esto, observamos que tras
presentar la luz roja se acerca y coge la comida pero también se da la respuesta condicionada
que es picotear la luz roja (RC). Este es el otro ejemplo de paradigma apetitivo que se llama
automoldeamiento. El efecto principal de la experiencia es que un estímulo neutro que antes
no daba respuesta, ahora provoca un aumento de respuesta.
Justo antes de la presentación del EI (comida) se encendía un disco luminoso (EC).
Así, el EC adquiría la propiedad de informar sobre la disponibilidad de la comida (la comida era
proporcionada independientemente de las respuestas de la paloma) Se observó un fenómeno
curioso: en vez de acercarse directamente al plato cuando veían la luz, las palomas
comenzaron a picotear primero el disco cuando este se encendía (incluso bajo el riesgo de no
llegar a tiempo a por la comida) Esta es una prueba de la atracción que ejercen las señales
condicionadas clásicamente cuando el premio es la comida. Los acontecimientos que predicen
un suceso relevante estimulan una conducta de seguimiento debido a su significación
informativa. Esto también ocurre en humanos (por ejemplo cuando estamos en un ascensor y
vamos siguiendo los botones que se iluminan indicando el piso por el que pasamos a pesar de
que el hecho de que miremos fijamente no hará que lleguemos antes a donde queremos.

c)Condicionamiento de la respuesta palpebral> Los estímulos desagradables
producen huída, evitación. El experimento arriba ilustrado se lleva a cabo con un conejo.
Siguiendo el sonido se le aplica una descarga eléctrica o una corriente de aire frío (carácter
aversivo). Se produce una reacción refleja de parpadeo. El conejo tiene varios párpados
(membrana nictitante). Tras el condicionamiento del sonido y la descarga o corriente, si se
presenta solo el sonido, el conejo parpadea. El EI sería el soplo de aire en la superficie del ojo
o la breve descarga en el párpado inferior. La RI sería el parpadeo (parecida a la RC) y el EC
será el tono que le indica que habrá una descarga.

Siguiendo un ejemplos los parámetros podrían ser:
-Duración (EC breve, por ejemplo 500 msegundos)
-Latencia de R (muy breve ( ¿Qué son los estímulos fóbicos? Los que provocan
miedo o ansiedad. El miedo es una conducta o respuesta (emoción) con distintos componentes
para escapar de los estímulos fóbicos y así sobrevivir. El miedo se mide observando los
efectos que tiene sobre el condicionamiento intrumental. Los procedimientos apetitivos
provocan aumento de la respuesta. Los aversivos no necesariamente provocan reducción de la
respuesta (más bien aumento) en el ejemplo del conejo, el parpadeo no se elimina sino que se
incrementa. Tanto en condicionamiento aversivo como apetitivo puede haber disminución o
aumento de la respuesta dependiendo de la situación. En el miedo hablamos de la supresión
condicionada de la respuesta instrumental, que estima como afecta al miedo a la realización de
tareas cotidianas (respuestas instrumentales). Previamente se produce un condicionamiento
instrumental, se le enseña a una rata a accionar una palanca para obtener comida. Se asocia
posteriormente por condicionamiento clásico un EC (luz o tono) a un EI aversivo (descarga
eléctrica). La RI será la respuesta de miedo, huida o evitación y el EC es la luz o tono que le
indica la sucesiva descarga. Lo que nos interesa aquí es ¿Cómo medimos el grado en que
hemos conseguido condicionar la respuesta de miedo ante el EC (luz, tono)? Utilizamos un
método indirecto llamado supresión condicionada de la respuesta instrumental. La supresión
condicionada es un índice que nos informa sobre el grado en que un estímulo condicionado al
miedo altera la actividad que esta llevando a cabo el animal.
Es un proceso que mide los efectos del miedo sobre el condicionamiento instrumental y
la presentación de la respuesta instrumental. Para ello se comparan el Nº de veces que se
presenta la respuesta en presencia del EC (asociación aversiva) con las veces que se presenta
la respuesta instrumental cuando no esta presente el EC (ambos períodos de tiempo deben ser
iguales).

Ejemplos:
RS: 6/12= 0,5 (Ausencia de condicionamiento/ de supresión de la respuesta instr.)
RS: 0/6= 0 (Máximo miedo, aprendizaje, condicionamiento)
El máximo de miedo será el valor 0 (máximo condicionamiento) y la ausencia de
miedo el valor 0,5. La razón de supresión mide el C.C. aversivo aunque se mide a través de RI.
Elimina la variabilidad entre sujetos porque incluye en número de respuestas en ausencia del
EC.
“La técnica de supresión condicionada de la respuesta instrumental se emplea para
medir...”
a) Condicionamiento clásico
b)Condicionamiento instrumental
c)Ambos
d)Ninguno

e)Aprendizaje de aversión al sabor> En un animal al que le damos sacarina y se
siente mal por haber consumido mucho se da una devaluación afectiva de ese alimento. Hay
una respuesta de rechazo por parte de la rata. Si le volvemos a dar, ella lo rechaza (esta es la
manifestación conductual que aprendió).
Tras ingerir una sustancia, inducimos en los animales un sentimiento de malestar por
inyección de algo tóxico (LiCl). Debido a que asociación del sabor de esa sustancia (EC) con
una experiencia de malestar (EI) adquieren una aversión (RC) a dicho sabor. Antes se pensaba
que esta reacción no podía responder al paradigma del condicionamiento clásico al igual que la
respuesta palpebral o la salivación porque tenía dos peculiaridades: basta un solo
emparejamiento para adquirir la aversión al sabor y porque la demora aunque sea muy larga (y
pasen horas entre el sabor-malestar) se produce condicionamiento. Sin embargo, esto
responde a la importancia biológica que tiene para los animales saber que sustancias les
resultan dañinas, por eso es un aprendizaje tan eficaz.
2 Variedades de condicionamiento clásico

Clasificación atendiendo a dos criterios: el valor motivacional y la relación EC-EI
(dos factores, dos variables con dos niveles). Desde el punto de vista motivacional pueden ser
positivos o negativos, desde la relación EC-EI pueden ser excitatorios o inhibitorios. Por
ejemplo la salivación o el automoldeamiento serían apetitivos y el condicionamiento palpebral
sería aversivo. ¿Cuándo decimos que hay relación causal entre dos estímulos del ambiente?
Cuando siempre que sucede uno, necesariamente aparece el otro (relación causal).

En función del valor motivacional del EI
Apetitivo Aversivo

Contingenciapositiva
El cond.
Excit. se
puede medir
(cambio de
Condicionamiento
apetitivo excitatorio
El sujeto piensa que el EC
es la causa del EI. Por lo
tanto el EC provoca una RC
de naturaleza similar a la de
la RI (excita una respuesta)
Condicionamiento excitatorio
negativo
El sujeto piensa que el EC es la
causa del EI. Por lo tanto el EC
provoca una RC de naturaleza
similar a la de la RI (excita una

Relación
causal o de
contingencia
entre el EC-EI
magnitud de
respuesta)
EC>EI = Aumento de la
respuesta

respuesta, en este caso de
evitación)
EC>EI = Aumento de la
respuesta de evitación
Contingencia
negativa
El cond.
Inhib. no se
puede medir.
Condicionamiento
inhibitorio apetitivo
El sujeto interpreta que el
EC supone la posible
retirada del EI. No presenta
la respuesta (aprendizaje
latente)
EC x EI = Disminución de
la respuesta
Condicionamiento inhibitorio
aversivo
El sujeto interpreta que el EC
supone la posible retirada del
EI. No presenta la respuesta de
evitación (aprendizaje latente)
EC x EI = Disminución de la
respuesta de evitación
El condicionamiento clásico permite aprender o detectar relaciones causales entre
estímulos del ambiente. ¿Cuántos tipos de relación puede haber?
Uno que de lugar a otro (relación causal positiva o contingencia positiva) E1 > E2, para
referirse a situaciones en las que tras un estímulo aparece necesariamente el otro (un
acontecimiento predice el otro). Por ejemplo, cuando se da una relación causal positiva
decimos que el condicionamiento resultante es excitatorio porque provoca necesidad de
respuesta en el organismo (que será distinta según el valor del EI). El que aparece en primer
lugar se percibe como causante del otro. Excitatorio que será aversivo o apetitivo según la
naturaleza (según el valor motivacional del EI). Cuidado, porque con los procedimientos
aversivos no disminuye necesariamente la respuesta (por ejemplo con el parpadeo aumenta).
La RC en condicionamiento apetitivo sería acercamiento y la RC en condicionamiento aversivo
sería de escape.
¿Cuál es la semejanza en métodos del estímulo excitatorio apetitivo y aversivo? En
ambos casos aumenta la respuesta, siempre hay estímulo que precede al otro.

3 Procesos generales

La curva de adquisición representa el aumento del aprendizaje en el condicionamiento clásico.
Primero el aprendizaje de la respuesta aumenta considerablemente para luego estabilizarse a
medida que se acerca a su nivel máximo (asíntota del aprendizaje).
Por ejemplo en el primer ensayo de la curva arriba representada se alcanza casi el
50% del aprendizaje, en el segundo hay un aumento pero menor que el anterior y en los
posteriores menos aún (nunca se superará el valos máximo de la asíntota). La línea crece de
forma negativamente acelerada (siempre crece pero cada vez un poco menos). En cualquier
proceso de condicionamiento se sigue esta línea.
Extinción> Si después de alcanzar la asíntota (el máximo crítico) presentamos el EC
solo, sin el EI tiende a desaparecer (extinción), la respuesta RC ante el EC va disminuyendo
hasta que desaparece (extinción de la respuesta condicionada, algo que es distinto al olvido
por el paso del tiempo porque hay un aprendizaje inhibitorio por una contingencia negativa). Si
tras un periodo de tiempo se deja de presentar el EI después del EC y una vez extinguida la
respuesta se vuelve a presentar el EI reaparece la RC (recuperación espontánea) pero con
menor fuerza que en el momento asintótico. Con lo cual no es un olvido permanente del
aprendizaje y no es una vuelta al estado original. Presentaciones repetidas del EC sin el EI
hacen disminuir la magnitud de la respuesta. La recuperación no es el máximo, es más pobre.

Recuperación espontánea> Dependerá del proceso de condicionamiento y del
carácter del estímulo incondicionado.
Generalización> El sujeto no responde de forma diferenciada a ECs distintos. La
ventaja es que economizamos en aprendizaje. ¿De que depende? Del parecido físico-químico
entre estímulos y de la experiencia previa con los estímulos. Lo que se aprende de un estímulo
se puede transferir a otro, por lo que dos estímulos parecidos provocan la misma respuesta.
Depende básicamente del parecido o la proximidad (cuanto más parecido, más provoca la
respuesta).
Guttman y Kausch (1956) condicionaron una paloma con un EC (luz) de 180 nm. Le hicieron
una prueba con luces de 570 y 590, observando que también había respuesta aunque menos.

La escala donde comparan las respuestas obtenidas ante estímulos semejantes se
denomina gradiente de generalización (grado en que la tasa de RC varía al variar el parecido
entre los estímulos y el EC original).
Discriminación> A la vez que generalizamos, también aprendemos a discriminar
(responder de forma distinta a dos estímulos muy parecidos). Se logra no asociando los
mismos EI (se llama aprendizaje perceptivo) a EC parecidos. Si nos asocian un árbol con
comida, si ahora damos otro estímulo que comparta características con él, sin haber sido
asociado con la comida, da la respuesta de igual manera por su pasado (en el campo de la
generalización). Esta situación se soluciona si aprendemos a diferenciar (discriminar), proceso
opuesto a la generalización. Aprendemos a discriminar mediante rasgos distintivos. Se produce
cuando intercalamos el EC1 con un EC2 parecido que no va seguido del EI. Es un aprendizaje
perceptual porque se perciben las diferencias.

La adquisición de condicionamiento depende del tiempo de comienzo del EI tras el EC
y del sistema de respuesta (intervalo óptimo para cada sistema) y la relación de causalidad. El
mejor método para alcanzar el condicionamiento más rápido es el demorado, el EI aparece
inmediatamente después del cese de EC (relación de causalidad).
-Condicionamiento Simultáneo: EC y EI empiezan y acaban a la vez. No es eficaz.
Solo funciona en el condicionamiento del miedo y no es lo mejor.
-Demorado: El EI se presenta cuando termina el EC (antes de que este acabe) Es el
mejor para un condicionamiento, el más eficaz (se hace mejor la relación causa-efecto).
-Demorado (demora larga): la duración del EC es más duradera . El EI se presenta
cuando ya llega un rato el EC (antes de que acabe) Al principio es muy efic, luego el animal
aprende que no le hace falta prepararse hasta un rato después del EI. A esta retención Paulov
lo llamó inhibición de demora.
-Huella: Una vez terminado el EC, transcurre un tiempo antes de la introducción del EI,
es decir, el EI se presenta cuando ya ha terminado el EC (la memoria copia del estímulo que
deja una huella en la memoria con el paso del tiempo) A veces enseña más a inhibir la
respuesta o a retenerla que a ejecutarla.
-Hacia atrás: Hay otro que es hacia atrás (se presenta el EI y luego el EC poco
después, tiene resultados ambiguos).

Intervalo óptimo

Aquel que favorece el condicionamiento, el que consigue el máximo condicionamiento.
Muy breve en respuestas esqueléticas o motoras pero en las que impliquen el SNA (tasa
cardiaca…) suelen ser un poco mayores. Si el intervalo entre el EC y el EI es mayor que el
intervalo óptimo, el condicionamiento va a ser muy pobre. En la respuesta de parpadeo el
intervalo óptimo ha de ser muy bajo.
Intensidad del EC

Si es alta la asíntota será mayor, si es baja la asíntota será menor. Observamos de
modo general que en la curva del condicionamiento se alcanza más rápido la asíntota cuanto
más intenso es el estímulo. Relación directa entre la magnitud del EC y el resultado. Se
alcanza antes la asíntota cuando el EC es más intenso. Cuando hablamos de la intensidad de
un E nos referimos a algún parámetro físico de ese estímulo.

Intensidad del EI

Mismas características que el anterior.
Naturaleza de los estímulos
Se relacionan ciertoshechos con ciertas consecuencias en función de los sistemas de
defensa interno (alimentos) o externos (animales amenazantes). Si un estímulo (mal estar) es
interno se asociará con la comida, mientras que uno externo con otro externo (descarga con
una luz).
4 Paradigma instrumental
Condicionamiento instrumental> actividad que utiliza el sujeto para obtener algo,
siendo los Ed los que más o menos indican las consecuencias de su conducta.
El condicionamiento instrumental y el condicionamiento clásico son dos variedades de
un proceso común de asociación. En el condicionamiento clásico el sujeto es pasivo, la
aparición de los dos estímulos (EI y EC) no dependen de lo que el sujeto haga, no es
necesario que el sujeto realice la respuesta tras el EC para que aparezca el EI. Este aparece
independientemente de lo que el sujeto haga, es el experimentador el que decide. La
respuesta que realiza el individuo es consecuencia del condicionamiento.
En el condicionamiento instrumental depende del sujeto. Si el gato de la caja de
Thorndike no da a la palanca, no recibe comida. Debe realizar la conducta para recibir la
consecuencia (reforzador). El sujeto realiza la conducta instrumental en presencia de unos
estímulos determinados llamados discriminativos que dan lugar a la obtención de varias
consecuencias o reforzadores. Thorndike quiso estudiar la inteligencia animal. Para ello metía
un gato hambriento en una caja problema y ponía comida fuera. La tarea del gato consistía en
aprender a escapar de la caja para obtener la comida. Comprobó que a medida que
avanzaban los ensayos, los gatos tardaban menos en salir. Interpretó que esa mejora era
resultado del aprendizaje, de una asociación entre su conducta y el estímulo antecedente.
Formuló entonces la ley del efecto que dice que si una respuesta ejecutada en presencia de
un estímulo, va seguida de un hecho satisfactorio, la asociación entre el hecho y la respuesta
se fortalece. Si el hecho es molesto, la asociación se debilita.
Estos resultados despertaron el interés de los científicos, que diseñaron nuevas
situaciones experimentales:
Ensayos libres (Small 1900, laberintos) Solo pueden realizar la respuesta instrumental
una vez por ensayo. Corredor (laberinto recto) y laberinto en forma de T.

Operante libre (El sujeto puede repetir la respuesta instrumental una y otra vez) B. F
Skinner (1938) quería analizar en laboratorio una forma de conducta que fuera
representativa de toda la actividad que se produce continuamente. En la caja de
Skinner medimos la latencia de respuesta, magnitud… pero sobre todo la tasa de
respuesta. Previamente hay que definir una unidad mediable de conducta. Definimos
unidades de conducta en función de su funcionalidad.
Elementos del paradigma instrumental
-Estímulos discriminativos: En su presencia la realización de una conducta
conllevará unas consecuencias (reforzador positivo o negativo).
-Respuesta instrumental: Acto intencional o propositivo que el sujeto realiza para
obtener un reforzador en un contexto específico.
-Reforzador: Consecuencia encaminada a fortalecer la relación Ed Rins.
¿Un Ec es lo mismo que un Ed? No son lo mismo. Los Ed son estímulos presentes
en el condicionamiento instrumental que indican al individuo la relación entre la acción y sus
consecuencias. Cuando el EC se presenta, va seguido por el EI y se presentan con
independencia de lo que el sujeto haga. En cambio el Ed no indica que va a recibir el EI, es
una señal que indica que puede realizar la conducta tras la cual va a recibir el reforzador. El
reforzador es lo mismo que el EI, solo que utilizamos terminología diferente para cada
paradigma. Un EC entonces es una señal que advierte al sujeto que de modo inmediato se va
a producir el EI (el sujeto no tiene que hacer nada). El Ed es una señal que indica al sujeto que
en esas condiciones se debe realizar una acción para obtener determinados estímulos
(reforzadores) En términos físicos pueden ser idénticos pero su significado es distinto para el
sujeto.
Hay estímulos discriminativos positivos y negativos

Positivos> Indican al sujeto la relación de contingencia positiva entre la respuesta y
las consecuencias. Un Ed es positivo porque se dice que de la acción se derivan sus
consecuencias (sean las que sean). No tiene que ver con el valor motivacional, aquí también
habría contingencia positiva (contingencia = relación entre la conducta y sus consecuencias,
sean estas agradables o desagradables para el sujeto). También sería contingencia positiva si
hubiese relación pero el reforzador fuese negativo (por ejemplo descarga). Contingencia
positiva entre la acción y el reforzador.

Negativos> Señal del ambiente que indica que hay una relación de contingencia
negativa entre la acción y sus consecuencias (no hay reforzador presente). Indica que de la
acción no se deriva una consecuencia (no tiene que ver con el valor motivacional).
Los reforzadores también se clasifican en función de su valor motivacional:
Reforzador positivo> aquellos que tienen valor motivacional apetitivo. Incrementan la
respuesta. Pueden ser primarios (comida, bebida...) o secundarios (dinero).
Reforzador negativo> estímulos reforzantes que tienen cualidades desagradables
(aversivos). Si existiera una contingencia negativa entre la respuesta y un reforzdor
negativo se produciría un incremento de la respuesta (reforzamiento negativo).

Valor motivacional del reforzador
Positivo Negativo
Relación de
contingencia
Respuesta >
Reforzador
Positiva Recompensa
Entrenamiento de
recompensa: La respuesta
conlleva un reforzador
positivo.
(Incremento de la
respuesta)
Castigo
La respuesta conlleva un
reforzador negativo.
(Disminución de la
respuesta)
Negativa Entrenamiento de
omisión o Castigo
negativo
Escape o Evitación
La respuesta conlleva la
retirada de un reforzador de
carácter negativo.
La respuesta conlleva la
retirada de un reforzador
positivo.
(disminuye la respuesta)
(Aumenta la respuesta)

➢ RECOMPENSA > “entrenamiento o aprendizaje de recuperación” Aumento de la
respuesta. Contingencia positiva y un reforzador apetitivo (reforzador positivo por lo
que aumenta la respuesta). Por ejemplo salario y trabajo realizado, estudiar y aprobar.

➢ CASTIGO POSITIVO> un sujeto presiona la palanca y recibe una descarga eléctrica.
Si no realiza la acción, no la recibe. Contingencia positiva, porque hay relación y
reforzador aversivo. Disminución de la respuesta (“castigo positivo”, el nombre no tiene
que ver con el valor motivacional).
¿Semejanzas o diferencias entre ambos? En ambos casos hay contingencia positiva
entre una acción y una consecuencia. Lo que las diferencia es el valor motivacional del
reforzador (en la recompensa una conducta lleva a conseguir algo positivo, en el castigo
positivo una conducta te lleva a conseguir algo que no tiene para ti valor motivacional alto).
➢ CASTIGO NEGATIVO (aprendizaje de omisión): Hacer las tareas o respuestas tienen
como consecuencia no recibir el reforzador. Contingencia negativa (omisión de algo
positivo, el reforzador retirado es positivo o apetecible). Ocasiona que algo que
esperas recibir, finalmente no se reciba. Disminuye entonces la frecuencia de la
respuesta porque esa acción lleva a omitir algo positivo. Impide algo positivo. Los
efectos conductuales son parecidos a los del castigo negativo. Por ejemplo tengo 8
puntos en el carnet, si me salto el semáforo me retiran puntos: Mi conducta
instrumental es inapropiada y conlleva que me quiten puntos, algo que yo tenía.

➢ EVITACIÓN O ESCAPE > La conducta o respuesta interrumpe o impide algo aversivo,
algo negativo, pone fin a algo desagradable (evitación). El reforzador retirado es de tipo
aversivo por lo que aumenta la respuesta. Contingencia negativa. Usa sus actospara eludir
hechos aversivos ¿Qué puedo hacer para eludirlo? La respuesta interrumpe exponerse a la
estimulación aversiva. Escape es para eludir un hecho que ya has experimentado en parte, y
evitación es para eludir un hecho que aun no has experimentado ¿y si es algo bueno lo que
esperas? Por ejemplo no quiero ir a la cena de nochebuena porque no aguanto a la familia,
por tanto digo que tengo que ir a una cena del trabajo a la que no puedo faltar para evitar ir a la
cena de familia (evitar). Otro ejemplo, el rey se marchó porque Chavez no se callaba (escape).
Es positiva (la consecuencia) porque eludes consecuencias o situaciones negativas. Evitación
es cuando la conducta se da antes de que se presente el estímulo aversivo.

EQUIVALENCIAS O SEMEJANZAS ENTRE C.CLÁSICO Y C. INTRUMENTAL
➢ Entrenamiento recompensa (CI) y excitatorio apetitivo (CC)

▪ Semejanzas: aumenta la respuesta, contingencia positiva, valor motivacional
apetitivo (EI y reforzador positivo)

▪ Diferencias: En el C.C el sujeto no tiene que hacer nada para recibir la
consecuencia, en el CI sí que hay que realizar una R para obtener el
reforzador.

➢ Castigo positivo (CI) y excitatorio aversivo (CC)

▪ Semejanzas: contingencia positiva (EI y reforzador negativo)

▪ Diferencias: en el excitatorio aversivo aumenta la respuesta y en el castigo es
más baja (disminuye) por lo que hay distintos efectos conductuales

➢ Entrenamiento omisión (CI) e inhibición apetitiva (CC)

▪ Semejanzas: disminuye la respuesta (mismos efectos conductuales) y
contingencia negativa (los reforzadores retirados son positivos)

▪ Diferencias: En el C.C el sujeto no tiene que hacer nada para recibir la
consecuencia, en el CI sí.

➢ Evitación o escape (CI) e inhibición aversiva (CC)

▪ Semejanzas: contingencia negativa (El EI y el reforzador retirados son
negativos)

▪ Diferencias: en el escape aumenta la respuesta, en la inhibitoria apetitiva baja (efectos
conductuales distintos)

Variables que influyen en la adquisición de condicionamiento instrumental
-Magnitud de la recompensa: A mayor magnitu, mayor adquisición de aprendizaje
(también influye el valor motivacional de la recompensa para el sujeto).

Se introducen dos sujetos en un laberinto lineal en cuya meta se encuentra una caja
con comida. El tiempo de realización de la conducta disminuye a medida que aumentan los
ensayos. Mientras el primer sujeto recibe 6 bolitas de comida el segundo tan solo recibe 1. El
que aprende más rápido es el que recibe las 6 bolitas, debido a la mayor magnitud de su
recompensa. Cuando ambos sujetos han alcanzado la asíntota del aprendizaje, se comienza a
dar 6 bolitas también al segundo sujeto, de manera que este reduce aún más el tiempo de
realización de la conducta (mayor valoración del reforzador). Se trata de un ejemplo de
aprendizaje incentivo (en función de la historia previa con estos acontecimientos).

-Demora del reforzamiento: Cuando mayor sea la demora más difícil es que se
produzca el Cond. Ins, por ejemplo saltarse un semáforo en rojo y la multa se produce un año
después. La eficacia del reforzamiento es mayor cuando es inmediato. Cuanto más rápido se
da el reforzamiento menos latencia de la respuesta.

-Características del Ed:

Se generaliza el condicionamiento a estímulos parecidos.
Ed > R > Ref (E2 y E3 son parecidos al Ed aunque no estuvieron presentes durante el
entrenamiento también controlan parte de la respuesta cuanto más parecidos sean
físicamente. Ejemplo El Ed es de 600 nm y los E2 y E3 también son luces pero de más o
menos nm. Cuanto más parecidos a 600, mayor respuesta.

Generaliza la respuesta aprendida a otros estímulos parecidos. El proceso inverso de la
generalización es la discriminación.
Discriminación: Saber exactamente ante que estimulo responder para que haya
recompensa. Consiste en responder de manera diferenciada hacia estímulos similares. Hay
dos mecanismos. ¿Cómo aprendemos a discriminar por ejemplo entre una luz de 600 mm y
una de 650?

Al principio el individuo responde por igual pero tras unos entrenamientos aprende a distinguir,
a ver que tras uno hay reforzamiento y tras otro no.
FORMAS DE REFORZAMIENTO
Lo más importante de todo lo dicho es el modo en como se administren los reforzadores.
1) Continuo> cada vez que se realiza la respuesta o conducta se obtiene el
reforzamiento. Siempre se da reforzamiento.

2) Intermitente> a veces se refuerza y otras no (no siempre que el sujeto realiza la
conducta recibirá el reforzamiento). Es el más eficaz. A veces se da reforzamiento y a
veces no. Se consigue una tasa de respuesta muy alta.

➢ Intervalo: la obtención de la recompensa depende del tiempo desde la ultima acción
realizada y reforzada. La obtención del reforzamiento depende de la ultima vez que
la conducta fue reforzada.

o IF (intervalo fijado, por ejemplo 30 segundos) Depende del tiempo
transcurrido desde la última vez que el sujeto recibió la recompensa.

o IV (intervalo variable): El tiempo varía (a veces una semana, otras un mes…).

➢ Razón: la obtención de la recompensa depende del número de acciones que realiza
el sujeto). Para obtener la recompensa hay que realizar la conducta un número
determinado de veces que puede ser fijo (RF) o variable (RV)

o RF (razón fija) El sujeto recibe la recompensa tras hacer un determinado
número de respuestas (por ejemplo tras dar 50 veces a la palanca).

o RV (razón variable)Cuando el número de veces cambia o se mantiene en
torno a intervalo.
Cada programa tiene su pauta típica de respuesta. En general, el reforzamiento intermitente
(efecto del reforzamiento parcial) genera tasas de respuesta más alta. Por ejemplo, máquinas
tragaperras.

TEMA 4: PROCESO DE CONDICIONAMIENTO CLÁSICO
1. Novedad del estímulo y experiencia anterior
Fenómenos de pre-exposición: La experiencia con los estímulos antes del
condicionamiento retarda la adquisición de la respuesta condicionada. Se puede dar un déficit
de condicionamiento a pesar de que se den las condiciones óptimas para su adquisición
porque el sujeto no presta suficiente atención a los estímulos ya que previamente han
adquirido un significado de irrelevantes. Esta situación puede venir provocada por la
preexposición a los estímulos (EI o EC) en solitario, de manera que no se establezcan
relaciones entre uno y otro. Son situaciones particulares pero nos permiten extraer
mecanismos de este aprendizaje. Influye el aprendizaje perceptivo (nos ayuda a discriminar
ciertos estímulos). Algunos de estos fenómenos son:
-Inhibición latente: Se produce por una preexposición al EC (sin ser seguido del EI).
Por ello posteriormente es más díficil que el EC adquiera el significado de “causa” del EI y se
produzca el condicionamiento. El EC tiene un significado previo de “no causa del EI”. Sería
más fácil establecer esta relación frente a un EC novedoso.

-Preexposición al EI: Si se presenta el EI en solitario como antes se mencionó, luego
será más complicado que este se relacione con un EC previo debido a que el aprendizaje
perceptivo, ha establecido previamente una caracterización del EI en la que no se contaba con
la presencia previa de ningún EC.
-Irrelevancia aprendida: Se produce cuando se presentan EC y EI de manera
acontingente, es decir, de forma separada, de tal manera que no se establezca una relación de
ningún tipo entre ellos. Cuando se trate de producir un condicionamiento presentándolos
seguidos se producirá un retraso (mayor que los anteriores) en el aprendizaje porque ambos
tiene un significado previo en el que no se relacionan entre sí.
Inhibición latente y esquizofrenia
La esquizofrenia se trata de un desorden neuro-psiquiátrico de etiología poco conocida. Entre
algunos de sus síntomas se encuentran las

temario aprendizaje

Outros

Herramientas de estudio

Contenido elegido para ti

PARCIAL DE APRENDIZAJE PSICOLOGIA APUNTES

Compendio de Condicionamiento Operante G S Reynolds

Bases conceptuales del condicionamiento clasico(1)

CONDUCTA PROVOCADA HABITUACIÓN Y SENSIBILIZACIÓN

Contenido elegido para ti

PARCIAL DE APRENDIZAJE PSICOLOGIA APUNTES

Compendio de Condicionamiento Operante G S Reynolds

Bases conceptuales del condicionamiento clasico(1)

CONDUCTA PROVOCADA HABITUACIÓN Y SENSIBILIZACIÓN

Más contenidos de este tema