Logo Passei Direto
Material
¡Estudia con miles de materiales!

Vista previa del material en texto

CONDICIONAMIENTO Y APRENDIZAJE 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Conceptos Clave 
 
Ciencia: Conjunto de conocimientos procedentes de la observación y la experimentación, que 
nos llevan al desarrollo de leyes científicas generales 
Aprendizaje: proceso psicológico que nos permite adquirir conocimiento a partir de la 
experiencia. El aprendizaje es un elemento adaptativo básico. Conjunto de leyes científicas 
que describen las interacciones especificas entre el individuo y el ambiente que influyen en su 
conducta y su funcionamiento cognitivo. 
Ejemplo: A la hora de comer, antes de llegar a casa ya empezamos a salivar (ocurre porque 
estamos preparando el organismo para la ingesta) 
Conductas aprendidas: reflejo del conocimiento adquirido. 
Conocimiento: Es la información codificada y almacenada en la memoria sobre el mundo: 
 -Declarativo/explícito: Se puede expresar y requiere experiencia consciente del 
sujeto. (Qué hacer) 
 -Procedimental/implícito: Conocimiento reflejado habitualmente de forma 
 inconsciente. (Cómo hacer) 
Niveles de estudio: conductual (cómo la experiencia produce cambios en la conducta), 
cognitivo (cómo se representan las experiencias en la memoria) y neural (las bases cerebrales 
de los procesos de aprendizaje). 
Diferencias entre aprendizaje y ejecución: El aprendizaje es un proceso psicológico inferido 
a partir de la conducta (es un conocimiento almacenado que de vez en cuando se expresa en 
las conductas aprendidas) mientras que el concepto de ejecución se reduce a “la expresión del 
aprendizaje”. 
 
 
 
 
 
 
 
 
 
 
 
TEMA 1: LA CIENCIA DEL APRENDIZAJE 
*Lecturas Recomendadas: 
- Domjan, M. (2008). Principios de aprendizaje y conducta. Madrid: Thompson 
 Cap 1(antecedentes históricos y concepto de aprendizaje) 
- Tarpy, R.M. (2000) Aprendizaje: Teoría e investigación contemporáneas. Madrid: 
Macgraw. Capítulos 1 y 2 
- Maldonado, A. (1998) Aprendizaje, cognición y comportamiento humano. Madrid: 
Biblioteca Nueva. Cap. 1 
*Lecturas opcionales: 
- Boakes. R.A (1989). Historia de la psicología animal. De Darwin al conductismo. 
Madrid: Alianza Psicológica. Capítulos 1,3,6. 
- Francisco Mora (2001). El reloj de la sabiduría. Tiempos y espacios en el cerebro 
humano. Madrid: Alianza Editorial. 
Desarrollo histórico del estudio del aprendizaje 
1. FILOSOFIA DE LA MENTE : arco, reflejo, leyes de asociación… 
- Descartes (1596 -1650) y el dualismo: 
 
Nos proporciona una visión dualista del ser humano (con la intención de no rechazar 
por completo la Tª sobre el propósito y libre albedrío como determinantes de la 
conducta humana. Esta visión recibe el nombre de Dualismo cartesiano: 
 -Cuerpo: produce respuestas reflejas (involuntarias) a estímulos externos. Los 
órganos sensoriales captan los estímulos y envían la información a través de los 
nervios. Allí se produce la transformación: estímulo/entrada >>> respuesta/salida. 
 -Mente: Libre albedrío y acciones voluntarias y conscientes (propias de los 
humanos y que les atribuían superioridad). La mente, externa al cuerpo se conectaba 
con éste a través de glándula pineal, cercana al cerebro. De esta forma se podría ser 
consciente de la conducta involuntaria y a su vez iniciar acciones voluntarias (posibles 
en ausencia de estimulación externa). 
 Cree que el contenido de la mente procede de la experiencia sensorial y que 
había ciertos contenidos presentes en todos los seres humanos de forma innata (idea 
de Dios, sí mismo...). Esta corriente se denomina innatismo. 
 Hacía distinción de dos tipos de conducta: Voluntaria (pensamiento, ideas... 
Propia de la mente y únicamente presente en los humanos) e Involuntaria 
(respuestas de los sentidos, propias del cuerpo, presentes en animales). 
 El mecanismo de la conducta refleja sería el llamado “arco reflejo” 
(Estímulo>>>Neurona sensitiva (aferente)>>>interneurona>>>neurona motora 
(aferente)>>>Respuesta): 
 
– Empirismo británico: contenidos de la mente: Las leyes de asociación 
 Se oponen a Descartes, J. Locke opina que todas las ideas son adquiridas de 
forma directa o indirecta a partir de la experiencia posterior al nacimiento (metáfora 
de la tábula rasa). Consideran la asociación de ideas como concepto clave en el 
funcionamiento mental. La fuente de conocimiento para ellos la componían las 
experiencias de los sentidos, las sensaciones, a partir de las cuales se formaban 
combinaciones más complejas por medio de la asociación. 
 Aceptan dos conjuntos de leyes de asociación: 
-Primarias (establecidas por Aristóteles): contigüidad (hechos próximos), 
semejanza y contraste (aspectos semejantes o características que contrasten) 
-Secundarias (establecidas por los filósofos empiristas): recogen ciertos 
factores que influyen en la formación de asociaciones (intensidad, duración, 
frecuencia, reciente aparición...) 
 
- William James y la asociación. 
 William James (1841-1910) se preocupa por explicar cómo se producen los 
hábitos. Defendía un empirismo radical. Dice que para que una respuesta se 
convierta en hábito requiere de una experiencia repetida, no consciente y la 
adquisición de una conducta. Basaba este mecanismo de adquisición de hábitos en 
la conexión estímulo respuesta (E-R) por medio de la experiencia y las asociaciones 
(las asociaciones mentales se vinculan con conexiones físicas en el cerebro). 
Principios de la psicología (1970) 
“La prueba de toda verdad reside, sencillamente, en su eficacia” 
2. EVOLUCION Y SELECCIÓN NATURAL 
-Evolución de la inteligencia. Charles Darwin (1809-1882) y la psicología comparada: 
 Darwin defiende que sobreviven aquellos individuos cuyas destrezas se adaptan mejor 
a los desafíos naturales y son transmitibles a su descendencia. Por lo tanto los individuos 
estaban cada vez más adaptados (evolución mediante selección natural). Apoyándose 
sobre el principio de continuidad de la vida sostienen que los seres humanos 
compartimos características con los animales, la mente humana es por tanto un producto 
de la Evolución. 
A partir de aquí se desarrolla la psicología comparada que realiza experimentos con 
sujetos animales con la intención de estudiar la conducta animal y aplicar el conocimiento a 
la conducta humana y defiende que todas las especies animales son inteligentes en mayor 
o menor medida (humano=animal). Nuestra conducta no está únicamente determinada por 
los estímulos que afectan al sujeto, si no también por las tendencias conductuales 
heredadas. 
> Morgan, Romanes: No hicieron experimentos. Decían que una especie era más 
inteligente en mayor medida según resolvía problemas mecánicos 
Morgan: Canon de Morgan: Ensayo error. Canon de Morgan y la ley de la 
parsimonia: “una acción no se debe interpretar como resultado del ejercicio de una 
facultad psíquica superior si puede interpretarse como el resultado del ejercicio de una 
actividad psíquica inferior en la escala psicológica”. 
G. Romanes (1848-1894): Criterio para la inteligencia: “si aprende a hacer nuevos 
ajustes o modificar los antiguos de acuerdo con los resultados de su propia 
experiencia”. Inteligencia: Capacidad para aprender 
 
 *Ejemplo: Clever Hans (el caballo que podía sumar, multiplicar…) Era una 
muestra de inteligencia para ellos. 
 
3. PSICOLOGIA EXPERIMENTAL 
3.1. Hermann Ebbinghaus(1859-1909) y la memoria humana 
Hizo experimentos con él mismo. Memorizaba palabras sin sentido y luego 
comprobaba en determinados intervalos de tiempo la cantidad de palabras que 
recordaba. Es el estudio de la memoria humana (mediante este experimento 
comprobaba que al momento recordaba el 100%, a los 20 minutos el 60%, a la hora el 
40%...) y representó sus resultados a través de la curva de olvido. 
Añade que existen ciertas leyes de asociación que influyen en los resultados: 
Contigüidad, repetición, duración de la lista... 
 
3.2. Ivan Pavlov y los reflejos condicionados (Neurologíaalucinaciones, delirios, anhedonia (ausencia de 
placer), pensamientos desordenados, ansiedad, etc. Se caracteriza también por una fuerte 
disfunción de la atención selectiva (atender a aquellos estímulos que son adecuados). 
Stroop task (Stroop, 1935). Desarrollo de un método para observar este fenómeno: 
 -Pide nombrar el color de la palabra V E R D E R O J O 
 El rasgo relevante sería el color de la palabra pero se produce una distracción por 
atender a una dimensión irrelevante (significado de la palabra). 
2. Aprendizaje selectivo y sus mecanismos 
 A partir de los años 60' comienza a estudiarse en los laboratorios el proceso de 
aprendizaje selectivo (determinación de qué estímulo es el adecuado). 
 Si por ejemplo a un sujeto sometido a un experimento en el que se le presentará un EI 
precedido por dos EC (EC1 y EC2) simultáneos, se le pide que identifique cuál de los dos es la 
causa del EI presentará distintas respuestas en función de variós mecanismos de 
condicionamiento (los dos estímulos no se codifican de la misma manera): 
 -Intensidad (saliencia) del estímulo. (Fenómeno de ensombrecimiento) 
 -Validez relativa del estímulo. (Fenómeno de bloqueo) 
 -Relevancia biológica del estímulo. 
Condicionamiento Estímulos Compuestos 
 -Ensombrecimiento: Se presenta a un sujeto un EI (descarga) precedido de dos 
estímulos EC (EC1: luz y EC2: tono). Se realizan ensayos hasta alcanzar el máximo 
condicionamiento. ¿Qué EC sería para el sujeto la causa del EI? Si se produce el 
condicionamiento de los dos EC por separado con la descarga y se alcanza el mismo nivel de 
marina vega canella
aprendizaje, diremos que son igualmente intensos y al realizar el condicionamiento conjunto 
ambos serían identificados como causa del EI sin realizar distinción entre ellos. Sin embargo 
en este caso concreto, el tono (EC2) tiene una mayor saliencia que el EC1 (luz). De este modo 
cuando se presentan por separado tras el condicionamiento conjunto el EC1 no produce una 
RC mientras que el EC2 sí. 
 
 Este fenómeno recibe el nombre de ensombrecimiento. El estímulo más débil resulta 
dificultado por el estímulo más sobresaliente a pesar e haberse presentado las mismas veces 
simultaneamente. Cuanto mayor sea la diferencia relativa entre ambos, mayor será la 
diferencia en la magnitud de la RC realizada tras su presentación por separado. 
 En el condicionamiento no solo influye la contigüidad temporal, también la saliencia de 
los estímulos. 
 -Bloqueo: Este experimento se realiza con la técnica de supresión condicionada, 
computando la RS. Tenemos un grupo de sujetos de control a los que se les presenta una luz y 
un tono simultáneos (ECa y ECb) seguidos de una descarga eléctrica (EI). No cabe pensar que 
uno ensombrezaca al otro pues ambos tienen la misma saliencia. Ambos estímulos son 
entonces captados como causa de la descarga y al presentarse por separado producen por 
igual la supresión de la conducta. 
Otro grupo, que recibe el nombre de bloqueo, realiza la misma experiencia con la salvedad de 
que previa a esta fase se les expone a una repetición reiterada del ECa en solitario seguido de 
la descarga hasta alcanzar el máximo condicionamiento. Tras la segunda fase, presentamos 
en solitario el estímulo ECb y obtenemos una RS muy próxima a 0,5 (ausencia del 
condicionamiento. En este caso ECb no nos aporta ninguna información nueva, ya que ECa 
marina vega canella
tienen distinta validez relativa 
marina vega canella
Conclusion de estos tres metodos : 
No es suficiente la contiguidad 
												
fue previamente asociado como causa de la descarga. Se condicionan en diferente grado 
porque aportan diferente grado de información. 
 Este fenómeno recibe el nombre de bloqueo. El condicionamiento previo de un EC 
impide el condicionamiento posterior de otro EC. En este caso el fenómeno depende de la 
experiencia previa del sujeto. 
 
 
 
 
 
 
 Sin embargo si smetemos un tercer grupo a la experimentación, en la que hay el previo 
condicionamiento de ECa y el la fase de condicionamiento de ECa y ECb con la descarga, 
presentamos una descarga de mayor intensidad que el primer EI condicionado, en la tercera 
fase de presentación de B observaríamos condicionamiento, cuyo nivel dependerá de la 
diferencia de intensidad del EI1 y EI2, debido al cambio de información al someter al sujeto a 
los dos estímulos conjuntos. Este fenómeno recibe el nombre de desbloqueo. 
 
 
 
 Relevancia biológica: este mecanismo depende de las características evolutivas del 
sujeto. 
BLOQUEO DEL CONDICIONAMIENTO
0
0,1
0,2
0,3
0,4
0,5
1 2 3 4 5
Ensayos
R
a
z
ó
n
 d
e
 s
u
p
re
s
ió
n
BLOQUEO
CONTROL
DESBLOQUEO
0
0,1
0,2
0,3
0,4
0,5
1 2 3 4 5
Sesiones
R
a
z
ó
n
 d
e
 s
u
p
re
s
ió
n
DESBLOQUE
O
CONTROL
BLOQUEO
marina vega canella
Valor informativo
marina vega canella
AQUI B SI QUE TIENE VALOR INFORMATIVO 
marina vega canella
La contiguidad 
marina vega canella
QUE ES MAS INFORMACION : UN ESTIMULO QUE INFORMA SBRE LA APARICION DE UN EI O QUE INFORMA SOBRE SU OMISION 
Depende de la experiencia del sujeto 
L+.+ LT+. L- , T- 
- LT++. L- ,,T-
En el caso A EL TONO TIENE UN VALOR INFORMATIVO AUNQUE ES MENOR QUE EN EL B 
 Jhon García estudió el proceso de condicionamiento sometido a este mecanismo por 
medio de la aversión al sabor en ratas. Estaba conmocionado por la reacción delos soldados al 
venir de la guerra que a parte de síntomas propios del conflicto bélico, presentaban vómitos y 
náuseas. Así fue que comenzó sus estudios con ratas dando lugar a un trabajo seminal del que 
se extraerían numerosas conclusiones. 
 Seleccionó un amplio grupo de ratas sedientas y les dió de beber una solución con 
sacarina, y a la vez que accionaban el mecanismo de bebida, se cerraba un circuito eléctrico 
que producía un click y hacía que se encendiera una luz. En este caso se presenta un EC con 
un componente gustativo (sacarina) y un componente estereoceptivo (luz y click). 
 Dividió a los sujetos en dos grupos: 
 -el primer grupo al beber sufría una inyección de una sustancia que les 
 provocaba malestar e indisposición. 
 -el segundo grupo era sometido a una descarga electrica. 
 A la hora de estudiar la relevancia causal de los dos estímulos en los distintos grupos 
obtuvo los sorprendentes resultados de que: el primer grupo rechazaba el agua edulcorada 
pero era capaz de beber en presencia de la luz y el click. El segundo grupo bebía el agua con 
sacarina pero se abstenía de beber en presencia de la luz y el click. Esto fue provocado por las 
disposiciones evolutivas de las ratas, que para determinar si un alimento está en mal estado o 
no utilizan una serie de claves olfativas (sistema de defensa interno relacionado con el mal 
estar interno) y para detectar peligras externos utiliza un sistema defensivo estereoceptivo 
(relacionado con la descarga electríca). Por eso la asociación de los distintos estímulos a las 
diferentes consecuencias. 
 En este fenómeno influyen las características derivadas de la evolución biológica. 
3. Inhibición condicionada 
 La inhibición se corresponde con una relación de contingencia negativa a partir de la 
cual el sujeto deja de responder a un EC porque no causa un EI. 
 -Procedimientos (métodos): Se experimenta con una paloma metida en una caja de 
condicionamiento. Tiene tres luces. En el centro se enciende una luz verde que indica la 
presencia de comida (la paloma produce una RC de picoteo sobre la luz)(EC+). La luz roja a un 
lado significa que no hay comida, discrimina este EC por tratarse de un estímulo inhibitorio 
(EC-). 
 Según la inhibición condicionada pavloviana en la que el EC+ es la luz verde, si se 
presentan la luz verde (EC+) con la luz roja (EC-), el sujeto esperará comida. Si no la recibe 
asumira que la luz roja es un inhibidor de la comida y cuando se presente en solitario no habrá 
respuesta. Se trata de un tipo de aprendizaje silencioso(o latente) porque en el caso de 
presentar un estímulo novedoso (una luz azul) la conducta sería la misma: ninguna. Entonces 
¿Cómo es posible determinar si hay o no aprendizaje? 
 -Métodos indirectos de medida de condicionamiento inhibitorio: La no elicitación 
de una conducta no puede medirse directamente. Por eso se han desarrollado métodos de 
medida indirecta para el condicionamiento inhibitorio. 
Prueba de retraso 
 Para saber si un estímulo condicionado ha adquirido características inhibitorias y 
diferenciarlo de un estímulo novedoso (que tampoco elicita una respuesta) es necesario 
comparar dos grupos: 
 -grupo de control: sin ningún tipo de experiencia propia se condiciona un EC 
 con un EI (para medir la velocidad de aprendizaje). 
 -grupo experimental: se realiza la misma tarea pero previamente se condiciona 
el mismo EC de forma inhibitoria con el EI. El EC tendrá que pasar de un significado inhibitorio 
a excitatorio. 
 
 
PRUEBA DE RETRASO
0
20
40
60
80
100
1 2 3 4 5 6 7 8 9 10
Sesiones
M
a
g
n
it
u
d
 d
e
 l
a
 
re
s
p
u
e
s
ta
CONTROL
EXPERIMENTAL
 
 Se supone un aprendizaje latente en el grupo experimental debido al retraso en el 
tiempo de adquisición del máximo nivel de aprendizaje. Cuantos más ensayos necesitemos 
para alcanzar el máximo nivel de condicionamiento EC-EI, mayor sera el grado de 
condicionamiento inhibitorio previo. 
Prueba de sumación 
 Para esta medición necesitamos dos grupos de sujetos: 
 -grupo de control: se condiciona una luz (EC) a la comida (EI). Al presentar la 
 luz en la siguiente fase acompañada de un tono, la fuerza excitatoria de la luz no varía 
 y se produce la misma RC porque el tono carece de relevancia, no aporta ningún tipo 
 de información. 
 -grupo experimental: se realiza la misma prueba pero en una primera fase se le 
atribuyen al tono unas características inhibitorias del EI. En la tercera fase al presentar 
conjuntamente luz y tono, puede que el EC- (tono) inhiba las capacidades excitatorias de la luz, 
o las disminuya, entonces decimos que ha habido condicionamiento inhibitorio. 
 
0
20
40
60
80
100
LUZ TONO LUZ + TONO
 
4. Aprendizaje con estímulos neutros 
 Si intentamos condicionar dos estímulos neutros (sin características motivacionales 
para el sujeto), cabe pensar que no se producirá condicionamiento (no habrá una RC porque 
tampoco hay un EI que previamente provoque una RI). Sin embargo, se produce un 
aprendizaje latente o silencioso (la información aprendida no se elicita por medio de una 
respuesta). 
Existen dos prcesos para condicionar estímulos neutros. 
Precondicionamiento sensorial 
 Se introducen unas ratas en una caja de condicionamiento. En una primera fase se le 
presentan una luz y un click juntas, con la intención de que las asocie. Tras un gran número de 
ensayos se comprueba que al presentarlos por separado no se produce ninguna respuesta (si 
hay aprendizaje estará implicito de forma latente). Pasamos a la segunda fase. Se presenta la 
luz (estímulo B) seguida de comida, hasta alcanzar el máximo nivel de aprendizaje. El estímulo 
B produce entonces al presentarlo en solitario una RC. En la fase de prueba se presenta en 
solitario el estímulo A (si condicionamiento previo con la comida) y se obtienen los 
sorprendentes resultados de que se elicita la RC que provocaba el estímulo B. Esto es debido 
a la relación previa establecida entre A y B en la fase 1. El sujeto hace una inferencia lógica: 
A>B, B>EI, entonces A>EI. 
 
Condicionamiento de segundo orden 
 Se trata de un proceso similar al anterior, con un grupo de ratas en una caja de 
condicionamiento. En la fase 1 se produce un condicionamiento de carácter estándar: un click 
(B) con comida (EI). Finalmente se comprueba que el estímulo B produce la RC. En la fase 2 
se prsenta el click con otro estímulo neutro (en este caso una luz) sin ir seguidos de comida. 
En la fase de prueba se presenta únicamente el estímulo A (luz) y se observa que se produce 
la RC. 
marina vega canella
Reforzadores primarios y secundarios
 
Pavlov diferencia dos tipos de estímulos: 
 -De primer orden: Condicionados con un EI 
 -De segundo orden: Condicionados con otro estímulo condicionado previamente. 
 En este último caso la luz adquiere el carácter de causa de la comida (la RC es 
resultado de una propiedad motivadora que le transfiere el estímulo B al A al asociarse 
mutuamente). 
 
CSO y reforzadores condicionados 
 Un reforzador secundario o condicionado es un estímulo neutro que adquiere las 
propiedades de un reforzador primario, como comida o agua, al emparejarse de forma 
sistemática con el mismo. 
 Prueba de reforzamiento secundario: 
 Una rata se encuentra en una caja de condicionamiento. Se le presentan dos 
estímulos neutros A y B. Tras A siempre recibe comida, pero de forma intercalada se le 
presenta B, tras el cual no recibe comida (el sujeto aprende a discriminar B mientras que A se 
condiciona). A funciona como EC pero también como reforzador condicionado que servirá 
como reforzador positivo de otras conductas. 
 Posteriormente se le enseña al sujeto una conducta instrumental (al accionar una 
palanca recibe comida) hasta el alcance de la asíntota del aprendizaje. Si se retirara la comida 
la conducta se extinguiría, pero si en lugar de simplemente retirar la comida, además 
presentamos el estímulo A, el estímulo funcionará como reforzador y será capaz de matener la 
conducta en cierta medida (adquiere capacidades reforzantes). 
 La presentación de B no evita la extinción de la conducta. 
marina vega canella
??????????? Teoria de la sustitución condicionada 
5. Condicionamiento contextual 
 El contexto se define como ambiente o conjunto de claves que configuran un entorno. 
 Si se presenta un EC en un contexto determinado seguido de un EI hasta alcanzar el el 
máximo condicionamiento. En caso de sustituir el EC por el contexto en el que se había 
presentado se observa que también se produce la RC. 
 Wagner comparó los efectos del entorno sobre las conductas pero desde el ámbito de 
la habituación. Aquí lo estudiaremos en el campo del condicionamiento clásico. 
Implicaciones prácticas: Náuseas y vómitos anticipatorios (NVAs) 
 Los pacientes de cáncer se someten a tratamientos de quimioterapia en un ambiente 
hospitalario con determinadas características. Durante el tratamiento se les inyecta una 
solución fitotóxica (EI) que les produce náuseas y vómitos, que reciben el nombre de 
inmediatos o incondicionados (RI). 
 Entonces se han desarrollado unos fármacos capaces de suprimir las náuseas y 
vómitos inmediatos. 
 Sin embargo tras varias sesiones de quimioterapia el propio contexto hospitalario y sus 
características determinadas (olor, color, médicos...) adquieren características propias de un 
EC y comienzan a presentarse los efectos secundarios de la quimio al entrar en el hospital. En 
este caso las náuseas y los vómitos reciven el nombre dde anticipatorios y no son suprimibles 
con los fármacos desarrollados. 
 
6 Bases cerebrales: aprendizaje y emoción. 
 Aprendizaje de repuestas de miedo: Se asocia por medio de condicionamiento clásico 
un estímulo aversivo (golpe muy estridente) con el peluche de una rata. La presencia del EC 
(peluche) produce una respuesta emocional de miedo que conlleva paralización, cambios a 
nivel hormonal, cambios en la tasa cardiaca. El miedo es una emoción que nos permite 
reaccionar en situaciones de peligro. 
 El cerebro se emociona: Los daños cerebrales pueden alterar la expresión o 
interpretacion de las emociones (la amigdala por ejemplo está relacionada con estas 
funciones). Estudios revelan que en síndromes como el síndrome Klüiver-Bucy o el de Urbach 
Whiete impiden a los individuos interpretar las emociones ajenas a través del rostro además de 
Ausencia reacciones asociadas a la ira y al miedo, déficits perceptivos y de expresión de 
reacciones emocionales.Sistemas cerebrales 
En este esquema el tríangulo representa la amigdala. Se reproduce como funciona el proceso 
de realización de una respuesta de miedo en la que el Tálamo tiene la función de procesar las 
situaciones y el Hipotálamo es la vía responsable de las respuestas motoras. 
 Método de condicionamiento clásico: Puede estudiarse desde la perspectiva de que la 
amigdala es el centro de tanto del miedo como de la felicidad. Se selecciónan dos grupos de 
sujetos uno de Control y otro Experimental. En ambos casos se condiciona una luz al 
recibimiento del alimento. Al grupo experimental, tras el condicionamiento se le da la comida 
sin ir precedida del EC (luz) y se le inyecta una solución de litio que le produce indisposición y 
consecuentemente le produce una devaluación del valor afectivo de la comida. 
 En una fase posterior se presenta la luz sin ir seguida de la comida, el grupo control 
realiza la respuesta de aproximáción, pero el grupo que ha sufrido la devaluación de la comida 
no la da con tanta frecuencia. 
 Este fenómeno nos indica que el condicionamiento clásico no depende solo de la 
anticipación de un hecho, sino también del valor hedónico de ese hecho (en este caso la 
comida). 
 
 
 
 
 Ante la suposición de que el valor hedónico del EI dependía de la amigdala se realizó 
un posterior estudio con dos grupos. Uno de control en el que no se lesionaba la amigdala y 
otro experimental en el que sí. Se repitió el experimento anterior con la distinción de que en 
este caso a ambos se les producía el efecto devaluador de la comida. 
 En la fase de comprobación al presentar el EC sin ir seguido del EI, el grupo sin lesión 
presentó una rápida extinción de la respuesta. Sin embargo no fue así en el grupo con la lesión 
en la amígdala. 
 Extraemos del experimento que la lesión de la amígdala interviene en la convergencia 
de la información sensorial y la codificación del valor afectivo. 
 
 
 
 Otro experimento similar se realizó con tres grupos de ratas: SHAM (abiertos pero no 
lesionados, para determinar si la conducta no era por lesiones periféricas), BLA (lesión de la 
zona de la amígdala relacionada con los atributos sensoriales) y CA (lesión de una zona de la 
amígdala relacionada con los atributos afectivos). 
 Técnica de enmascaramiento: (aprendizaje implícito y explícito). Hay un tiempo mínimo 
de presentación de un estímulo a partir del cual es sujeto codifica perfectamente dicho 
estímulo. Sin embargo, si se presenta un estímulo por debajo de este tiempo solo se 
procesarán parte de las características de este estímulo (estas características forman parte del 
aprendizaje ímplicito y pueden relacionarse con las consecuencias de la presentación del 
estímulo). 
 Por ejemplo en experimentos de enmascaramiento se presenta una imagen durante un 
período de tiempo relativamente largo, y luego un rostro un una expresión de temor por debajo 
del tiempo mínimo de presentación necesario para su completo procesamiento. Seguido a esta 
segunda estimulación se somete al sujeto a una descarga eléctrica. 
 En el proceso pavloviano (sometiendo a los sujetos a la experiencia) se observa que 
los sujetos a los que se presenta el rostro con dicha expresión de forma desemascarada 
presentan un aumento de la resistencia en la conductancia electrica de la piel (respuesta de 
miedo a la descarga). Sin embargo, a los que se les presenta el estímulo de forma 
enmascarada presentan una menor magnitud de esta respuesta emocional (poco aumento de 
la resistencia de la conductancia de la piel) pero aún así, simboliza un aprendizaje, eso sí, 
menor que en el anterior. 
 En un proceso observacional (el sujeto observa a otros sujetos en esa situación, antes 
de presentarle el estímulo) se obtienen resultados similares pero de menor magnitud. 
 -Procesamiento de expresiones faciales: Se utiliza una técnica de condicionamiento de 
segundo orden. Se condiciona un rostro con determinada expresión a un estímulo aversivo y 
luego se condiciona ese rostro con otro de carácter neutro. 
 A nivel cerebral se observan cambios en la actividad a la hora de observar el estímulo 
neutro, con características de la observación de aquél aversivo. 
 
 -Monitorización de la actividad de la amígdala: Nos desvela que no solo procesamos 
información sensorial, sino también del valor afectivo de los estímulos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
TEMA 5: PROCESOS DEL CONDICIONAMIENTO 
INSTRUMENTAL 
 APRENDIZAJE INSTRUMENTAL: Hace referencia a situaciones en las que un 
organismo realiza una acción, con el fin de conseguir una meta o incentivo. Además de la RI y 
el reforzador, también se encuentra el estímulo discriminativo. 
 Una respuesta instrumental es toda aquella conducta con la que se pretende obtener 
un reforzador de carácter motivacional positivo. Los estímulos determinativos son aquellos 
conjuntos de claves del ambiente que indican al sujeto la disponibilidad o retirada de un 
reforzador. Los Ed's en ocasiones son capaces de instigar las conductas (adquieren las 
características del reforzador). 
 
▪ Entrenamiento recompensa: tiene una contingencia positiva, dando lugar a un 
aumento en la tasa de respuesta (instrumental), el reforzador tiene un carácter 
motivacional positivo. Es más eficaz un reforzador demorado y de gran cantidad. 
 
▪ Castigo: contigencia positiva con un reforzador de carácter motivacional negativo, lo 
que hace que disminuya la tasa de respuesta instrumenntal. 
 
▪ Entrenamiento omisión: se trata de una contingencia negativa entre la realización de 
la respuesta y la obtención de un reforzador positivo. Produce la disminución de la 
respuesta hasta su extinción. 
 
▪ Escape/ evitación: contingencia negativa entre una respuesta y un reforzador negativo 
que produce aumento de la respuesta. Escape: el sujeto está sometido al R- y la 
respuesta supone su interrupción. Evitación: la respuesta evita la aparición del R-. 
 
 
Programas de reforzamiento. 
 Un programa de reforzamiento es el conjunto de reglas y criterios que se establecen en la 
suministración de recompensas al sujeto en el condicionamiento clásico y que suponen un 
incremento de la respuesta instrumental. 
 En la técnica de moldeamiento (hacer que el sujeto realice la conducta deseada) nos 
interesa obtener una tasa alta de respuesta y que sea constante. Para medir estas dos variables, 
Skinner diseñó una caja conectada a un registrador acumulativo (parecido a un sismógrafo) que 
dibujaba escalones en un papel enrollado a medida que el sujeto realizaba una respuesta, 
representando así su distribución en el tiempo. Además había una aguja que hacía una marca 
en diagonal sobre aquellos escalones en los que se suministraba una recompensa al sujeto. De 
esta forma se pueden establecer relaciones entre respuesta y reforzamiento y calcular valores 
como: la tasa de respuesta, la tasa de reforzamiento y la frecuencia de la respuesta. 
 
 A partir de aquí se desarrollan los distintos tipos de programas de reforzamiento: 
Programa reforzamiento continuo (cada aparición de la respuesta instrumental da lugar al 
reforzador) 
Programa de reforzamiento intermitente o parcial (las respuestas solo se refuerzan algunas 
veces) Veremos los programas que usan reglas simples para determinar qué respuestas se 
van a reforzar: 
 Programa de razón (son aquellos en los que la presentación de reforzamiento 
 depende solo del número de respuestas que dé el sujeto) Pueden ser de razón fija o de 
 razón variable. 
 Razón Fija Continua> cada respuesta obtiene refuerzo. Genera un patrón de 
 respuesta de tasa estable y moderada. Pausas breves e impredecibles por saciedad, 
 por fatiga… 
 Razón Fija Parcial > solo se obtiene el refuerzo cada “n” respuestas. Tasa 
 estable y alta de respuestas en la “carrera de razón”. 
 Razón variable > Se precisa un número de respuestas que varía cada vez (entorno a un valor promedio). Tiene una tasa de respuesta muy alta y muy estable (es el 
 más resistente a la extinción). No hay pausa postreforzamiento, no es predecible el 
 número de respuestas que se necesitan. 
 
 
 Programas de intervalo: (son aquellos a los que la presentación del reforzador 
 depende de parámetros temporales, esto es, del tiempo que haya transcurrido desde la 
 última presentación del reforzador) Pueden ser de intervalo fijo o intervalo variable. 
 Intervalo Fijo> la cantidad de tiempo es constante de una ocasión a la 
 siguiente. Genera un patrón de respuesta característico que se denomina “festón de 
 intervalo fijo”. Consiste en un aumento de la tasa de respuesta a lo largo del intervalo 
 (una curva positivamente acelerada) Esto se debe a que los animales aprenden que no 
 es probable que reciban un reforzador en los instantes posteriores a la presentación del 
 anterior y esperan a dar la respuesta al momento en que predicen que se aproxima el fin 
 del intervalo. 
 Intervalo Variable> La cantidad de tiempo entre la disponibilidad de un 
 reforzador y el siguiente no es fija, sino que oscila en torno a un valor promedio de 
 intervalo. Mantienen tasas de respuesta continuas y estables, sin pausas. Con respecto 
 a la disponibilidad, cabe señalar que en los programas de intervalo cuando hablamos de 
 “intervalo entre reforzadores” , no queremos decir que pasado un tiempo “x” el reforzador 
 se presente sin más, independientemente del sujeto. En realidad hablamos del momento 
 en que el reforzador está disponible para ser presentado y que esto solo ocurrirá si el 
 sujeto emite la respuesta instrumental requerida. Además, suele existir una restricción 
 del tiempo en que esté disponible, es decir, que hay un intervalo máximo de tiempo en 
 que se presenta el reforzador si se emite la respuesta. Se llama duración limitada. 
 Generalmente los programas de reforzamiento parcial producen un aumento en la tasa 
de respuesta y en la resistencia a la extinción de la misma en ausencia del reforzador. 
Programas de reforzamiento continuo VS programas de reforzamiento parcial. 
 La extinción es mucho más lenta y provoca menos reacciones de frustración si los 
sujetos han experimentado previamente un reforzador parcial que si han experimentado 
previamente un reforzamiento continuo. 
 ¿Por qué el reforzamiento parcial consigue una persistencia notable en las respuestas? 
(no entra en el examen, solo leer) 
▪ Hipótesis de la discriminación (lo que ocurre es simplemente que en el caso del 
reforzamiento continuo la retirada de la recompensa es mucho más fácil de detectar que 
en el reforzamiento intermitente). 
 
▪ Hipótesis del aprendizaje (no es tan sencillo, los organismos aprenden algo durante 
el programa de reforzamiento parcial que les hace responder más a menudo cuando ya 
no están disponibles las recompensas) 
 
✓ Teoría de la frustración (en el reforzamiento parcial el sujeto aprende a dar la 
respuesta instrumental sin expectativa de recompensa mientras que en el 
reforzamiento continuo no existe nada que enseñe al animal a responder cuando 
no espera ser reforzado y se frustra (Amsel) 
 
✓ Teoría secuencial (aquí se enfatiza en la memoria + en el reforzamiento parcial. 
El sujeto aprende que será reforzado por responder cuando su memoria le indique 
que no fue premiado en los ensayos anteriores, un reforzamiento continuo no 
permite que los animales aprendan esa persistencia (Capaldi) 
 En este experimento aparecen representadas en rojo las ratas sometidas a un 
programa de reforzamiento continuo y en azul a un programa de reforzamiento parcial. 
 Magnitud de la recompensa: 
 La resistencia a la extinción es baja tras el reforzamiento continua (durante la 
adquisición), pero alta tras el reforzamiento parcial. 
 Número de ensayos durante el entrenamiento 
 La resistencia a la extinción aumenta con un número mayor de ensayos de 
reforzamiento parcial. 
 
 
 
Conducta de elección: 
 Hasta ahora hemos estado estudiando situaciones en las que solo se mide la aparición 
de una respuesta concreta en función del patrón de reforzamiento de esa respuesta. Esto no 
nos proporciona una comprensión total de la conducta. Los organismos cada vez que emiten 
una respuesta están haciendo una elección entre un conjunto de respuestas disponibles en 
ese momento. Vamos a estudiar la situación de elección más simple, en la que el sujeto tiene 
solo dos alternativas de respuesta. 
 Una rata en una caja de condicionamiento tiene dos palancas separadas (Ra y Rb). Si 
realiza la respuesta instrumental en Ra se someterá a un programa de reforzamiento parcial de 
intevalo variable de 1 minuto (recibirá 60 reforzadores en una hora). Si realiza la respuesta en 
Rb el programa de reforzamiento también sera de intervalo variable, pero esta vez de 2 
minutos (obtendrá 30 reforzadores en una hora). 
 El sujeto ralizará aquella respuesta que le cueste menos esfuerzo y le traiga mejores 
resultados (criterio de optimización). Lo más óptimo sería obtener los 90 reforzadores 
disponibles en una hora mediante la combinación de ambas respuestas (repartidads en 
proporción). 
 
Pero como un sujeto realiza este reparto de proporciones, nos lo explica la Ley de igualación: 
un individuo en situaciones de elección distribuye la respuesta proporcionalmente a la cantidad 
de reforzamiento. 
 Entonces para calcular la distribución de las respuestas es necesario calcular las tasas 
de reforzamiento, que corresponderan con la proporción de cada tipo de respuesta: 
= 
Programa A IV 1: 60 reforzadores 
Programa B IV 2: 30 reforzadores 
 
 
La “M” hace referencia a la magnitud de la recompensa, por ejemplo: el número de bolitas de 
comida. 
Programa A IV 1: 60/60+30 = 0,67 Debe reunir las dos acciones en una sola. 
Programa B IV 2: 30/60+30 = 0,33 
 
 Según la ley de igualación esta rata realizará el 67% de las respuestas en Ra y el 33% en 
Rb. 
 
Control de la conducta por el estímulo 
 ¿Qué función cumple el estímulo discriminativo en el condicionamiento operante? Hace 
de clave indicadora que informa al sujeto de que si en su presencia realiza una determinada 
respuesta instrumental, recibirá un determinado reforzamiento. 
 
a) Si la contingencia R > reforz (Ed+) 
b) Si la contingencia R > no reforz (Ed-) 
 
¿En que se diferencia del EC pauloviano? En que el EC del condicionamiento clásico anuncia la 
aparición del EI (haga lo que haga el sujeto), mientras que el Ed del condicionamiento 
instrumental no anuncia la aparición del EI directo, lo que anuncia es que está disponible y 
aparecerá solo si el sujeto emite una conducta específica. Cuando nos referimos a Ed (o a EC) 
no estamos hablando necesariamente de un estímulo discreto y puntual, puede tratarse de 
estímulos ambientales en general (contextuales) Pues bien, decimos que los estímulos 
ambientales pueden llegar a controlar la ejecución de una respuesta instrumental, pero ¿Qué 
aprenden los sujetos acerca de los estímulos para que esto pueda suceder? ¿como pueden los 
estímulos controlar la conducta? 
 
 Los procesos de generalización y discriminación son procesos adaptativos que se derivan 
de esta cualidad del Ed. Un sujeto a través de ellos no necesita aprender lo mismo con cada 
estímulo según sea parecido o no al Ed inicial. 
 
Gradiente de generalización: representación gráfica del nivel de respuesta que se produce ante 
un reforzador. Pero esto sucede cuando hay una clave, que es lo que se denomina estímulo 
discriminativo: 
 
 
 
 
 
 
 
 
Cuando el estimulo discriminativo sufre pequeñas variaciones, es decir, cuando en el caso de la 
luz las variaciones de longitud de onda son muy pequeñas, el nivel de respuesta sigue siendo 
elevado. 
 
Un proceso inverso a esta generalización seria la discriminación, que se produce cuando antes 
estímulos similares no se realiza la respuesta porque se ha aprendidoque estímulos ligeramente 
diferentes al estímulo discriminativo condicionado instrumentalmente. 
 
 
 Grupo 1: presentamos una luz pero en unos casos tiene una raya y en otros no. De tal 
forma, que cuando la paloma picotee la luz con raya obtendrá comida, y con la otra nada. 
 Grupo 2: presentamos de nuevo la luz con y sin raya. Pero en este caso, cuando se 
enciende la que no tiene raya se obtiene comida, y en el otro caso no. 
Pero cuando rotamos esta línea de la luz, ¿hay generalización? 
En el grupo uno si que hay generalización (estímulos similares), pero en el grupo 2 la tendencia 
a responder se inhibe. 
 Los Ed indican qué consecuencias se derivan de la conducta (controla la ejecución de 
la respuesta) A los sujetos se les enseña a presionar una tecla cuando está presente una luz. 
En cada prueba ese estímulo produce el nivel máximo de respuesta. También se observa que 
si en la prueba se presentan otros estímulos también provocan en mayor o menor medida la 
respuesta. Si se parecen al estímulo la respuesta es alta, si no se parecen al estímulo será en 
menor medida. A esto se le conoce como gradiente de generalización que relaciona la 
semejanza física de los estímulos. El proceso inverso a la generalización es la discriminación. 
 
➢ Factores que contribuyen a una mayor generalización 
 
o Semejanza física 
o Grado de experiencia previa 
 
• GRADIENTES DE GENERALIZACIÓN 
 
 
 
Existe generalización del estímulo siempre que el sujeto no responde de forma diferencial a 
estímulos distintos; se observa el mismo nivel de conducta ante estímulos diferentes. En el 
experimento de Guttman y Kalish (1956) sobre el gradiente de generalización, reforzaron a 
palomas en un programa de IV para que aprendieran a picotear una tecla iluminada con una 
luz naranja-amarillenta (longitud de onda de 580 nm). Una vez adiestradas, se repitieron los 
ensayos pero variando la longitud de onda de la luz. La tasa de respuesta que se registró con 
cada valor fue la que se indica en el dibujo. 
 
Este tipo de resultado se conoce como gradiente de generalización y depende de dos factores: 
 
o La semejanza de los estímulos del ensayo con el estímulo que fue condicionado 
o La experiencia previa que haya tenido el sujeto con dicho estímulo 
 
La pendiente del gradiente de generalización puede utilizarse como medida del punto hasta el 
cual la característica del estímulo que estamos variando controla la conducta de los sujetos. 
Volviendo al experimento anterior, imaginemos como sería el gradiente de generalización si las 
palomas fuesen daltónicas (la característica longitud de onda no controla la conducta de 
ningún modo). 
 
• DISCRMINACIÓN. ENTRENAMIENTO PREVIO 
 
Existe discriminación cuando el sujeto reacciona de forma diferencial a estímulos parecidos. 
Como ya hemos dicho, no solo las diferencias físicas entre los estímulos posibilitan la 
discriminación si no también la experiencia previa que haya tenido el sujeto con el estímulo en 
el pasado. Por ejemplo los músicos son capaces de detectar cuando una nota está desafinada 
aún cuando la desviación sea mínima. La experiencia repetida con los sonidos desde 
pequeños genera cambios a nivel cerebral que les permite percibirlos y discriminarlos 
finísimamente. Por ejemplo los esquimales tienen 30 palabras que significan blanco, nosotros 
no distinguimos tantos matices. 
 
▪ El efecto de la discriminación sobre el control por el estímulo experiencia repetida 
con estímulos en laboratorio que consigue generar una respuesta diferencial a un 
estímulo (E+) y un estímulo (E-) En el experimento de Jenkis y Harrison investigaron la 
forma en que estímulos auditivos de diferentes frecuencias controlaban la conducta de 
picoteo de palomas reforzadas con comida. Hay dos tipos de procedimientos de 
adiestramiento. 
 
 
 
Se hallo el gradiente de generalización: 
 
El grupo 1 tiene un gradiente menos empinado. El grupo 2 tiene un gradiente más 
empinado (más discriminación, control por el estímulo más intenso) 
 
▪ ¿Qué se aprende en el entrenamiento de discriminación? Caben tres posibilidades: 
 
➢ Que solo aprenda algo sobre E+ (“responde cuando se presente E+”) y 
nada sobre el E- (no sería relevante) 
 
➢ Que solo aprenda algo sobre el E- y nada sobre el E+ (“no respondas 
cuando esté el E-“) 
 
➢ Que aprenda algo sobre los dos estímulos “responde con el E+ y no 
respondas con el E-“ 
 
La teoría de la excitación-inhibición sobre el aprendizaje de la discriminación de 
Spencer aboga por esta tercera posibilidad. La respuesta diferencial al E+ y al E- 
refleja la excitación y la inhibición que se han condicionado al E+ y al E- 
respectivamente. El experimento de Honing, Boncau & PennyPacker (1963) sobre la 
evaluación experimental de esta teoría fue un entrenamiento diferencial con dos grupos 
de palomas: 
 
 
 
 
 
El sujeto tiene que tocar una tecla que es una luz (Ed) En dos grupos se produce la misma 
experiencia. Los estímulos en los dos grupos son los mismos pero desempeñan distinta 
función informativa de lo que pasará tras realizar la conducta (consecuencia) En el grupo 1, si 
picotean cuando sale la luz con rayita hay comida y si la luz sin rayita no hay comida. En el 
grupo 2 es al revés: 
 
 
Una vez que han aprendido, se varía la orientación de la línea en distintos grados ¿Qué efecto 
vemos? En el grupo 1 el nivel máximo de respuesta es el que estuvo presente en el 
entrenamiento. Al modificarse el estímulo se modifica gradualmente el grado de respuesta. Es 
de tipo excitatorio (generaliza la tendencia a responder) Depende de la semejanza de los 
estímulos. En el grupo 2 generaliza la tendencia a no responder, es de tipo inhibitorio. 
Encontramos dos tipos de resultados: 
 
o Gradiente de generalización del estímulo excitatorio (verde) (curva empinada 
que presenta la cantidad de respuesta más alta en E+ aprende) Generalizar 
a responder. 
 
o Gradiente de generalización del estímulo inhibitorio (amarillo) (los estímulos 
difieren cada vez más del E-, son progresivamente menos eficaces que él para 
inhibir la respuesta instrumental) Generalizar a no responder. 
 
Con lo cual, este tipo de entrenamiento sirve para aprender acerca de los dos estímulos 
 
 
 
 
 
• DESPLAZAMIENTO DEL VÉRTICE (no examen, solo leer) El fenómeno que vamos a 
estudiar es el resultado del entrenamiento de discriminación, intradimensional, es decir, el 
E+ y el E- son estímulos del mismo tipo (auditivos, visuales, táctiles…) y que solo difieren 
en una característica estimular (frecuencia, longitud de onda, grados de temperatura…) El 
experimento de Hanson (1959) investigaba hasta que punto los distintos colores 
controlaban la respuesta de picoteo en las palomas. 
 
 
 
Al hallar los gradientes de generalización hallo algo muy particular, encontró que 
cuanto más parecido era el E-al E+, los sujetos mostraban un desplazamiento del 
máximo de las respuestas respecto al E+ original. Este fenómeno se llama 
desplazamiento del vértice. 
 
 
 
Aprendizaje de escape/evitación 
 
 Paradigma para estudiar la conducta motivada aversivamente (nos impulsan a realizar 
ciertos actos) por ejemplo cuando estamos encerrados en el ascensor nos instiga a realizar 
ciertas conductas. Otro ejemplo sería irte de clase porque te aburre, discutir con alguien y 
antes de que llegue a mayores la discusión marcharte…Esto tiene que ver con conductas de 
escape provocadas o motivadas por situaciones aversivas. Una caja de evitación es un aparato 
de condicionamiento dividido en dos partes por una compuerta. Tenemos a la rata en una parte 
y se le puede dar un estímulo aversivo. La avisamos de que le vamos a dar una descarga 
mediante un tono o una luz. La luz por ejemplo tiene una duración de 30 segundos y nada más 
terminar le damos la descarga. Una respuesta natural en el miedo es la de huir, por lo que 
puede saltar al otro compartimento.La respuesta del sujeto de interrumpir el estímulo aversivo 
(interrumpir la descarga) se conoce como escape (se evita un estímulo que ya se recibió en 
parte) en el caso de que ya tuviese asociada la luz con la descarga y supiese que después de 
uno viene lo otro, puede anticiparla. En este caso la respuesta no interrumpe el estímulo 
aversivo sino que lo evita. No son hechos distintos sino dos fases. Para evitar primero tenemos 
que tener experiencia (por ejemplo el hospital para evitarlo has tenido que experimentarlo 
previamente) Es el tipo de aprendizaje derivado de una experiencia de castigo positivo. 
 
• Aprendizaje de Escape (interrumpir) El sujeto aprende que realizando una 
respuesta determinada es capaz de interrumpir la estimulación aversiva. Por ejemplo 
cuando nos quemamos la piel, sabemos que si nos echamos “aftersun” nos calma el 
dolor. El sujeto interrumpe un estímulo aversivo que ya se está produciendo. 
 
• Aprendizaje de Evitación (antes de que aparezca) El sujeto anticipa que se va a 
presentar una estimulación aversiva y realiza una respuesta que la impida (por ejemplo 
echa crema solar para no quemarse) El sujeto anticipa una respuesta, eludiendo la 
presentación del estímulo aversivo. Para que haya evitación es necesario que haya 
experiencia previamente (es necesario que haya antes escape) Así, no son dos tipos 
independientes de aprendizaje sino dos fases de un único proceso de aprendizaje. Son 
dos fases de un mecanismo común. 
 
o Evitación discriminada (se presenta un estímulo concreto, por ejemplo la 
luz, que anticipa la estimulación aversiva) En este tipo de evitación, el 
estímulo adquiere propiedades motivacionales. 
 
o Evitación no discriminada (no hay ningún tipo de estimulo concreto que 
anticipe la estimulación aversiva, lo que ocurre es que puede emplear 
claves ambientales o temporales propias. Por ejemplo la rata aprende 
que la descarga aparece cada 10 segundos. Al aprendizaje de claves 
temporales sobre el ambiente se le llama “timing” 
 
• Estudio del aprendizaje de escape/evitación 
 
Para estudiar las respuestas de escape evitación se emplea la caja de Sidman o caja 
lanzadera. Tiene dos compartimentos adyacentes separados por una tablilla. Si se 
administra una descarga en un compartimento el sujeto puede escapar/evitarla 
saltando al otro compartimento. Para medir la eficacia de este aprendizaje se registra 
la latencia de respuesta. 
 
• Factores que determinan la eficacia del aprendizaje de escape/evitación 
 Intensidad de la descarga 
 Demora de la recompensa (la recompensa aquí sería la reducción de la estimulación 
aversiva) 
 Dificultad de la tarea (si la respuesta de escape o evitación es demasiado compleja, 
por ejemplo saltar una valla de 3m, es previsible que el sujeto no lo aprenderá) 
 Controlabilidad (capacidad percibida por el sujeto para librarse de la estimulación 
aversiva mediante alguna respuesta) 
¿Qué factores contribuyen a que sea más eficaz? La intensidad y que los hechos sean de 
forma inmediata o demorada. A más latencia aprende más rápidamente. 
 
Teoría bifactorial de Mowner (1956): teoría biprocesal del aprendizaje de escape. Cree 
que el aprendizaje de escape/evitación está compuesto por dos factores o procesos 
 
o Proceso de condicionamiento instrumental (aprende a utilizar respuestas presentes en 
un repertorio conductual para evitar o interrumpir la estimulación, por ejemplo saltar. El 
refuerzo aquí es la reducción del miedo (luz respuesta no descarga) La luz es un 
Ed 
 
o Proceso de condicionamiento clásico (El sujeto asocia ciertos estímulos ambientales o 
concretos con la inminente aparición de un estímulo aversivo. Esos estímulos se 
convierten en estímulos condicionados por condicionamiento clásico excitatorio, por 
eso motivan al sujeto a realizar la conducta. El condicionamiento clásico no es un 
proceso simple de aprendizaje por contigüidad, el sujeto aprende a dar respuestas, 
que las claves del ambiente dan lugar a que haga respuestas…. 
 
3) Motivación de incentivo (estímulos del ambiente se asocian con estímulos que de 
forma refleja suscitan una conducta, anticipación de consecuencias positivas) 
 
4) Incentivo condicionado (inicialmente estímulo neutro que adquiere valor motivacional) 
(luz - descarga) 
 
 
 
 
 
Para Hull el condicionamiento excitatorio, la fuerza de respuesta (la magnitud o intensidad de 
una respuesta) depende de muchos factores y uno de ellos es la habituación. La K, viene por K 
Spence (incentivo) Hull y estos autores decían que además se producían dos procesos de 
aprendizaje al mismo tiempo: con su acción aluden a un hecho aversivo y producen un CC 
pauloviano (los estímulos que preceden a la conducta se asocian con un hecho aversivo) el 
sujeto recibe la descarga alguna vez por lo que se relaciona la luz con el estímulo aversivo 
(CC) ¿Cómo llamamos a ese CC? Excitatorio, el miedo desempeña un proceso de motivación 
para desempeñar la conducta aprendida. 
Indefensión aprendida 
Selligman, Overmeier y Maier (1967) investigaron los efectos de la exposición a una 
estimulación aversiva incontrolable sobre el posterior aprendizaje de escape/evitación. El 
hallazgo común fue que la exposición a una experiencia de incontrolabilidad interfiere sobre el 
posterior aprendizaje de respuestas instrumentales. 
EXPERIMENTO DE LA INDEFENSIÓN APRENDIDA (Selligman & Maier) 
 
 
En escape el sujeto logra controlar el acceso a situaciones aversivas. Sin embargo en muchas 
situaciones no logramos controlarlos. Es más, a veces independientemente de la conducta las 
consecuencias negativas aparecen igual. Hay ocasiones en las que el sujeto no consigue 
realizar conductas para evitar el estímulo aversivo (por ejemplo cuando se le dan descargas 
haga lo que haga) Si cuando está en el compartimento A se le da la descarga y cuando está en 
B no se le da la descarga hablamos de escape o evitación. Sin embargo, si cuando está en A 
hay descarga y cuando esta en B también el sujeto sabe que no puede escapar a la descarga 
por lo que hablamos de indefensión aprendida. El sujeto no logra aprender a evitar estos 
estímulos negativos. Esto está relacionado con estados de ánimo negativos como por ejemplo 
la depresión. 
Se lleva a cabo un experimento de dos fases con 3 grupos de ratas en “cajas lanzadera”. 
 
 
• FASE I (cada grupo tiene una experiencia previa distinta con la descarga eléctrica 
ninguna/controlabilidad/incontrolabilidad) 
 
• FASE II (entrenamiento de aprendizaje de respuesta de escape/evitación) 
 
 
✓ Un grupo control donde se conoce de antemano lo que va a ocurrir. Al 
sujeto se le enseña a controlar por su conducta un hecho aversivo (puede 
cambiar al B y evitarlo) Cuando se mide la respuesta de escape tienen un 
número elevado. 
 
✓ Otros antes de aprender a escapar (grupo 2) han recibido descargas 
inescapables (perros sujetos en un arnés). Ahora tienen debajo del hocico 
una tecla para poder escapar. Estos sujetos tienen esta experiencia en un 
tiempo y podían interrumpirla con la conducta (controlan el hecho 
aversivo) 
 
✓ El otro grupo al realizar la conducta seguía recibiendo descargas (no 
pueden controlar el hecho aversivo) 
 
 
 
 
 
Los resultaros fueron: 
 
 
 
Los animales del grupo 2 mostraban una tasa mayor, sin embargo el otro grupo (el 3º) tenía un 
déficit conductual importante. No realizaba la conducta de escape (no tenían motivación, 
quedaban parados) a este efecto se le conoce como indefensión aprendida. Los perros de 
Selligman tenían marcadas deficiencias motivacionales. Algunos síntomas de la depresión 
tienen semejanzas (escasa motivación, aislamiento social, percepciones negativas, 
culpabilidad…) Esto guarda relación con un fenómeno de condicionamiento clásico llamado 
irrelevancia aprendida. 
 
Encontraron pues que la exposición a una estimulación aversiva incontrolada durante la fase I 
produceun déficit más grave en el aprendizaje de escape-evitación que la exposición a 
descargas de idéntica intensidad y duración, pero de las cuales se puede escapar. ¿Por qué 
ocurre esto? Algunos teóricos defendieron que no había aquí ningún tipo de aprendizaje, que el 
déficit conductual de los sujetos (G2) en la fase II se debía simplemente al efecto físico que 
causaba tanta descarga eléctrica (entumecimiento de los músculos para responder) Sin 
embargo, lo que realmente sucede es que lo que defendían Selligman, Overmaier y Maier en 
su hipótesis de indefensión aprendida es que durante la exposición a descargas incontroladas, 
los animales aprenden que las descargas son independientes de su conducta y que no hay 
nada que ellos puedan hacer para evitar recibir descargas. Durante el entrenamiento 
instrumental siguiente, esta expectativa adquirida de una contingencia cero entre las 
respuestas y la descarga interfiere con el aprendizaje de que la conducta puede controlar las 
presentaciones de un reforzador. 
 
Los efectos se manifestaron el diferentes ámbitos del comportamiento. Se producen 
deficiencias para realizar nuevos aprendizajes, deficiencias motivacionales, alteraciones 
emocionales, deficiencias cognitivas, deficiencias conductuales, estrés… modelo de depresión 
animal. Para que la alteración de los del grupo de escape fuese menos severa les 
enseñaríamos a controlar estímulos aversivos, y esto se transfiere a los demás ámbitos. 
 
 
 
 
La indefensión aprendida se emplea tradicionalmente como modelo animal de los fenómenos 
que subyacen a la depresión en humanos. Un historial de falta de control sobre los 
reforzadores puede desorganizar gravemente la conducta instrumental, generar déficits 
motivacionales, cognitivos, afectivos… La falta de control puede ser objetiva (real) o subjetiva; 
es decir; debido a las atribuciones causales que el sujeto hace de hechos aversivos. Si tiende 
a hacer interpretaciones: 
 
▪ Globales (“siempre ocurre así”) 
▪ Internas (“ es que soy un inútil, es mi culpa”) 
▪ Estables (“haga lo que haga no va a cambiar”) 
 
…de los fracasos o experiencias aversivas, tienden a reprimir la conducta instrumental de 
escape o evitación. Por ejemplo la experiencia con los exámenes. 
 
Aprendizaje incentivo 
 Consiste en aquel aprendizaje acerca del valor incentivo (reforzante) del reforzador. 
Experiencia con el reforzador en el estado de motivación relevante. 
Tolman entre los mecanismos de aprendizaje hablaba de aprendizaje cathexis. Decía que el 
aprendizaje del valor incentivo del reforzador estaba era resultante del condicionamiento 
biológico. Para Tolman además toda conducta tiene un fin, refleja una meta. 
Thondrike dice que se adquieren nuevos hábitos a través de la relación estímulo-respuesta y 
niega la existencia del aprendizaje instrumental. 
El aprendizaje, la emoción y la motivación están muy relacionados. 
Análisis teórico del aprendizaje 
 -Motivación primera: Según Hulk una fuente de motivación es cualquier necesidad 
básica, pues da lugar a una conducta en busca de una recompensa que satisfaga esa 
necesidad. Dice que la fuerza con la que un sistema realiza un aprendizaje dependerá de una 
serie de factores, como el reforzamiento previo, el valor incentivo de este reforzador... 
 Expresa este enunciado de forma matemática: La ralización de una respuesta será de 
mayor vigor si tiene un impulso motivador más elevado y por lo tanto también una mayor K que 
hace referncia al valor de incentivo que tiene el reforzador (el valor de incentivo de un 
reforzador dependerá de la experiencia previa del sujeto con ese reforzador y de sus 
condiciones biológicas). 
 En este caso, como hemos visto, la K no hace referencia a una constante como es 
habitual, se elige esta letra en honor a Kendel, nombre de pila de un gran teórico. El estudio 
del apendizaje de incentivo se debe a Viennot Spence. 
 -Contraste conductual: hace referencia al fenómeno que sucede en sujetos que reciben 
un mismo reforzamiento pero realizan ejecuciones distintas de la respuesta. Se debe al valor 
de incentivo del reforzador para unos y otros. El contraste conductual puede ser positivo 
(mismo reforzador supone una mayor ejecución en un grupo o grupos de sujetos) y negativo 
(el mismo reforzamiento supone una reducción en la realización de la respuesta). El contraste 
conductual influye y determina el aprendizaje instrumental. 
 -Otras fuentes de reforzamiento: Son estímulos que provocan un valor estímulante en el 
sujeto por medio de estimulación sensorial. 
 Estimulación eléctrica intracraneal: Odd y Milner cuestionaron el concepto 
 de Hulk sobre la reducción de las necesidades básicas y estudiaron el condicionamiento 
 instrumental sin reducir dichas necesidades por medio de este preocedimiento. 
 El estudio que se verá más adelante fue llevado a cabo para probar la Teoría de la 
Sensibilización de Kennet Berridge que decía que la exposición repetida a drogas 
potencialmente adictivas es capaz, en sujetos susceptibles y bajo determinadas circunstancias, 
de alterar de forma persistente células y circuitos cerebralesnormalmente destinados a la 
normal regulación de la atribución de la saliencia a los estímulos, un proceso que se encuentra 
dentro del comportamiento motivado.La naturaleza de estas neuroadaptaciones es lograr la 
hipersensibilización (sensibilización) de estos circuitos, de forma que resulta en una atribución 
patológica de los niveles de saliencia de incentivo a la droga y los estímulos asociados con 
ella. El estudio estaba orientado a conocer como se activaban determinadas áreas del cerebro 
cuando aumentaba el valor incentivo del reforzador. 
 Experimento: 
 A una rata en una caja se le inyecta anfetamina, que funciona como reforzador. 
 En una fase de entrenamiento previa a la inyección se le presentaron dos estímulos, y 
 tras un click se le inyecta la droga (condicionamiento clásico). 
 Luego pasaron a medir la frecuencia con la que realiza una respuesta 
 instrumental y los resultados obtenidos demostraron que en el caso de la rata a la que 
 se inyectó la anfetamina, tras el click la tasa de respuesta era más alta. 
 
Más adelante David Premack descubrió que hay más efectos provocados por el valor 
motivacional del reforzador, como por ejemplo efectos sobre la probabilidad de producirse una 
determinada respuesta. 
 Dadas dos respuestas A (actividad de beber, con gran frecuencia de aparición) y B 
(correr, baja frecuencia), se dice que B>A (B refuerza A, la de menor frecuencia provoca la de 
mayor). 
La frecuencia o probabilidad de una respuesta se calcula de la siguiente manera: 
Probabilidad de una respuesta = Tº invertido en la Rª/ Tº total 
 Llamamos reforzantes no a los estímulos neutros, sino a la estimulación de 
actividades y a la fuente de reforzadores. 
 
 
Teoría de la expectativa del condicionamiento (Dickinson) 
 La ejecución instrumental depende de la interacción de dos procesos: 
 -Conocimiento contingencia instrumental previo : aprendizaje respuesta-
 consecuencia 
 -Aprendizaje de incentivo: propiedades de incentivo del reforzador. 
 La fuerza de una respuesta instrumental depende de la experiencia previa del sujeto 
con el reforzador y sus consecuencias, el aprendizaje del valor incentivo del reforzaor (se 
aprende en condiciones motivacionales adecuadas y se llama aprendizaje motivacional de 
incentivo llamado por Dickinsonn aprendizaje Cathexis). 
 
 Experimento: 
 Dos grupos de sujetos (ratas) que se condicionan instrumentalmente a 
 accionar una palanca para obtener dulce de sacarosa. En una siguiente fase a un 
 grupo (dev) se le inyecta una sustancia (litio) que lo hace sentir indispuesto después de 
 la toma de la sacarosa. Al otro grupo se le inyecta también está sunstancia pero sin 
 relacionarla con la sacarosa. 
 Finalmente en una tecera fase de prueba se mide la tasa de respuestas al 
 presentar losestímulos que anuncia que la sacarosa está disponible para ambos 
 grupos. Pretenden comprobar si el grupo Dev recuerda las consecuencias de su 
 conducta. 
 
 El tipo de aprendizaje que se produce en este caso fue denominado por 
 Dickinson aprendizaje de incentivo (a cerca del valor motivacional de un evento). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
TEMA 6: CONDICIONAMIENTO DEL APRENDIZAJE 
 Se puede pensar que no es necesario que dos estímulos se encuentren próximos en el 
tiempo para que se establezcan asociaciones entre uno y otro. 
AB 
 R.A Rescorte decía que para que se produjera el condicionamiento no bastaba con que 
se presentase a un sujeto el EC-EI vrias veces. Tiene que inferir el nexo causal entre los 
estímulos, y el sujeto luego decide si A es la causa de B. 
 El EI puede ir precedido de dos o más claves (EC1, EC2...): 
 No se condicionan por igual los estímulos. El sujeto decide cual es el estímulo 
 que infiere la respuesta o no. A veces a este proceso selectivo se le da valor de 
 información, adquirida en la experiencia previa. 
 
 Buscar sobreexpectativa: la contigüidad no es una condición suficiente para el 
aprendizaje. 
Noción de contingencia (consistencia EC-EI) 
 En este caso existe una contigüidad positiva espacio-temporal. Si se presenta un 
estímulo las mismas veces que otro que lo sigue inmediatamente tienen la misma contingencia 
espacio-temporal. El sujeto identifica la causa social de los elementos. 
Teoria de la contingencia de Rescorla 
La teoría de la contingencia dice que la contigüidad temporal del EC– EI no garantizan que se 
produzca el condicionamiento, sino que hay consistencia entre los estímulos. 
La contingencia depende de dos probabilidades: 
 P1= Pr (EI/EC) > idea de contigüidad clásica. EC > EI (siempre). 
 Condicionamiento excitatorio. 
 
 P0 = Pr (EI / no EC) 
 En 1966 Rescorla llevó a cabo el siguiente experimento en una caja con dos 
compartimentos. En uno de ellos se suministra una descarga al sujeto que para evitarla debe 
saltar al otro compartimento. 
En una primera fase se condiciona a todos los grupos a saltar al otro compartimento para evitar 
la descarga (R>no descarga). En una segunda fase se presenta un tono de distinta manera 
para los tres grupos (fase de condicionamiento clásico): 
 -Positiva (la probabilidad de que el tono vaya seguido de la descarga es mayor de la de 
 que el tono no vaya seguido de la descarga) 
 -Cero (ambas probabilidades son iguales) 
 -Negativa (la probabilidad de que el tono vaya seguido de la descarga es menor de la 
 de que el tono no vaya seguido de la descarga) 
 
 En una última fase se presenta únicamente el tono y se mide la tasa de respuestas de 
evitación de cada grupo. La tasa de las respuesta de evitación en cada grupo depende 
entonces de la capacidad del EC para producir la descarga. 
Grado de contingencia positiva 
 P1 = P(EI/EC) (proporción entre las veces que aparece el EI y el EC) 
 P0 = P(EI/noEC) (proporción entre las veces que aparece el EI sin el EC) 
El grado de contingencia se calcula restando P1-P0. Cuando el resultado es 0 se alcanza un 
estado de irrelevancia aprendida (puntos sobre la diagonal). En el cuadrante rosa se 
corresponde a los puntos en los que P1>P0, se trata de condicionamiento excitatorio. El 
cuadrante azul se trata de los puntos en los que P1 P1-P0 = 0 
Segundo grupo: en cada sesión se le presentaba un estímulo sonoro 10 veces y de tres 
minutos de duración y se le da el EI 2 veces. P1 = 0 P0= 0,2 > P1-P0 = -0,2 
Los demás grupos se condicionaron de forma que en el grupo tres P1-P0= - 0,4 y en el grupo 
cuatro P1-P0= -0,8 
A medida que aumenta el P1 – P0, la capacidad inhibitoria del sonido hacia la RC que provoca 
la luz aumenta. Se trata entonces de una contingencia negativa (inhibitoria). 
Contingencia en el aprendizaje instrumental 
La contingencia en el aprendizaje intrumental se da por medio de aprendizaje asociativo, un 
estímulo puede dar lugar a una postura o eludirla. 
Juicios de contingencia 
 Por ejemplo surgen de tareas como el diagnóstico médico en el cual el doctor a partir 
de nuestro mal estar debe generar un juicio de contingencia para aportarnos eltratamiento 
adecuado. 
Tareas conductuales 
 Intentan formular un juicio de contingencia entre las probabilidades de las 
consecuencias y las de las respuestas. 
 Experimento: A unas ratas se les refueza intermitentemente con sacarosa la 
 hora de realizar determinada respuesta. Despues en una fase posterrior a unas ratas 
 no se les refuerza en ausencia de las respuestas y a las otras se les da el reforzador 
 sin necesidad de que realicen la respuesta. 
 
 En aquellas ratas a las que solo se les reforzó en presencia de las respuestas 
 (Pr =1) se obrservó una alta tasa de respuesta, sin embargo en las que fueron 
 reforzadas en ausencia de la respuesta (Pr>1) la tasa de respuesta cayó. En el ámbito 
 de la contingencia positiva entre Ed y consecuencias de la respuesta la tasa de 
 respuesta disminuye a medida que aumenta la aparición del reforzador en ausencia de 
 la respuesta. 
 
 Como conclusión de la Teoría de la Contingencia podríamos decir que el 
condicionamiento es el proceso psicológico básico que nos permite identificar estímulos del 
entorno. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
TEMA 7: REPRESENTACIÓN DEL CONOCIMIENTO 
 Representación: Naturaleza. Información almacenada y codificada en la memoria. 
 La exposición a estímulos del ambiente produce patrones de actuación sensorial que a 
su vez causan cambios neuronales. 
 Tipos de conocimiento: 
 -Declarativo 
 -Procedimental 
 Incluso las experiencias más simples pueden dar lugar a estos dos tipos de 
conocimiento. Existen distintos tipos de asociación: el sujeto realiza asociaciones a medida que 
en los procedimientos de condicionamiento se hacen inferencias con estímulos del entorno. 
 Las condiciones se corresponden a las circunstancias en las que se produce un 
fenómeno (cuándo) del aprendizaje e implican conocimientos a nivel de memoria. 
 El contenido o lo qué se aprende hace referencia a la naturaleza asociativa del 
aprendizaje. 
 En cuanto a los mecanismos nos referimos a la expresión conductual a través de los 
mecanismos del aprendizaje. Por ejemplo en el condicionamiento clásico, una asociación de 
estímulos (EC-EI) nos confiere una asociación de respuestas (conductual) (RC-RI). 
 
 Representación del conocimiento: Se realiza a nivel interno y puede ser: 
 -Declarativo: Conocimientos generales del mundo, históricos, etc. 
 -Procdimental: Conocimiento a cerca de cómo actuar ante un estímulo o que 
 hacer frente a determinada situación. 
 
 Ejemplo: 
 ¿Qué puede haber aprendido el sujeto en este ejemplo? 
 De forma declarativa: Cuándo 
 De forma procedimental: Acercarse a la comida o prepararse para 
 ella. 
 
 Estose debe a que en la memoria esta presente la relación entre los estímulos y el 
concepto de los mismos. La asociación entre estímulos forma parte del conocimiento 
declarativo (consciente) y es en la asociación estímulo-respuesta cuando hablamos de 
conocimiento procedimental. 
 En un experimento realizado por Bechlezer, este examinó el condicionamiento 
 aversivo en perros. Se les presentaba un sonido seguido de una descarga en una pata, 
 lo que les producía una respuesta refleja de contracción de esa pata. Tras varias 
 pruebas iguales la presentación del solo sonido producía esa respuesta de contracción 
 de la pata (RC). 
 Esta respuesta en los perros era debido a que en su memoria el sonido se 
 codificaba como causa del EI y ese recuerdo es el que provocaba la respuesta. Para 
 llegar a esta conclusión el investigador realizó el mismo experimento inyectando a la 
 vez que la descarga una sustancia que provocaba una parálisis (curane). Asi fue que 
 en las sesiones de condicionamiento al producirse la descarga e inyectarse el curane, 
 no se producía la respuesta refleja por la parálisis producida por la sustancia. Sin 
 embargo en la fase de prueba en la que solo se presentó el sonido, los perros 
 realizaron la respuesta de contracción de la pata. Esto indica que el sonido activaba 
 información sobre el elemento asociado (descarga) pero en el momento del 
 condicionamiento no fue posible su expresión porque estaba bajo los efectos de la 
 sustancia. 
 Otros experimentos a cerca de esto 
 Técnica de devaluación del EI 
 Mediante una técnica de condicionamiento clásico condicionamos a un sujeto 
 hasta que salive en presencia de un EC (sonido) por la anticipación de un EI apetitivo 
 (comida) > emisión de RC. 
 Una vez alcanzado este objetivo se procede a la devaluación de EI provocando 
 un malestar al sujeto al ingerir la comida. Este proceso se realiza en ausencia del EC. 
 Posteriormente se le presenta al sujeto el EC. Se pueden producir dos sucesos 
 que el sujeto presente la RC de salivación (la relación EC-EI > EC-RC etá aún en la 
 memoria del sujeto y provoca la respuesta a pesar del valor que se tenga ahora de esa 
 relación) o que el sujeto no presente la respuesta (se produce una relación E-E, y no 
 se presentará la respuesta de salivación ni en presencia del EI porque el recuerdo esta 
 almacenado en la codificación que se tiene de ese estímulo). La relación E-R no 
 implica aprendizaje alguno sobre la asociación comida-malestar. 
 Experimento de Holland and Straub (1979). Devaluación del EI. 
 Realizaron el experimento anterior con dos grupos de ratas. A ambos grupos 
 se les condicionó de manera que salivaran ante la presencia de un sonido (EC)por la 
 anticipación de la comida (EI). Posteriormente dividieron a los sujetos en dos grupos 
 uno EXPERIMENTAL en el que el EI fue devaluado por medio de una inyección de litio 
 que les provocó malestar gástrico y un grupo de CONTROL al que se le inyectó una 
 sustancia que no provocó consecuencias. Luego se midió la respuesta de 
 aproximación al comedero en presencia del sonido y el grupo experimental mostró una 
 clara deficiencia en la realización de dicha respuesta. 
 Experimento del conocimiento declarativo. Holland 1990. 
 A una serie de ratas sedientas les presentaba dos sonidos distintos en todas 
 las sesiones cada 10 segundos. Cada sonido se asoociaba a un sabor determinado, 
 eran estímulos distintos. 
 Después de que en la fase de condicionamiento se consiguiera que las ratas 
 realizaran la respuesta de salivación frente a ambos estímulos en la mayor tasa posible 
 se procedió a la segunda fase, la de devaluación del sabor 2 sin ir prescedido de 
 ninguna clave. Así fue que en la fase de prueba en la que se presentaron ambos 
 estímulos, el tono asociado al sabor no devaluado aumentó su tasa de respuesta 
 mientras que el tono asociado al sabor devaluado la redujo. El condicionamiento 
 clásico niega entonces que se adquiera conocimiento procedimental, lo fundamental en 
 el aprendizaje es el recuerdo de las consecuencias que produce un estímulo. 
Representación atributos sensoriales y hedónicos. 
 Teniendo en cuenta los distintos atributos del EI ¿cómo podemos examinar las 
valoraciones afectivas de un estímulo? A través de sus reacciones reflejas, pues expresan 
el valor hedónico y podemos calcular su índice conductual. 
 Emoción y valoración afectiva 
 Sabemos que tanto en ratas, como en monos y niños se dan unos patrocnes 
 de movimientos de laboca que reflejan los valores hedónicos de los estímulos que se 
 les presentan. Los sabores hedónicos provocan movimientos de la lengua, de las patas 
 en las ratas... Los sabores aversivos por su parte provocan que se escupa la sustancia, 
 arcadas, respuesta de limpieza bucal... 
 Holland estudió la valoración afectiva en 1990. 
 Presentó a los sujetos de manera alterna dos tonos T1 y T2 y mediante una 
 cánula se les inyectaba una sustancia agradable para producir la máxima respuesta 
 condicionada en ambos casos. En la fase 2, se devalua el sabor 2 por medio de una 
 inyección de litio. En la fase de prueba comprueba que ante el estimula T2 disminuye 
 la respuesta de ingesta (salivación) y aumentan las respuestas de carácter aversivo 
 debido a que el sabor le recuerda el malestar y se ha vuelto desagradable. Es decir las 
 ratas conocían las consecuencias que se derivaban de cada proceso (conocimiento 
 declarativo). 
 Holland: Efecto de la lesión de la amígdala. 
 Se realizó con un grupo de ratas en el que se les provocó la devaluación de la 
 comida. Sin embargo se repartieron en dos grupos: EXPERIMENTAL (antes de la 
 devaluación se les lesionó el área de la amígdala) y CONTROL (sin lesión). El grupo 
 experimental no cambiaba la valoración hedónica de la comida debido a la lesión 
 producida, la comida les resultaba apetecible a pesar de que les produjera malestar 
 gástrico. 
 
 En la representación la zona de naranja (d) muestra la actividad de las distintas zonas 
cerebrales de aquellos sujetos que se han sometido a una devaluación. La azul simplemente la 
de aquellos que se han presentado al sabor tal cual, sin ser devaluado. 
 Saciedad sensorial explícita: como se devalua un reforzador (figura d) 
 
 
 
 
 
Aprendizaje instrumental 
 Distintos tipos de asociaciones: 
Asociación E-R, (estímulo respuesta) según Thorndrike el aumento de la intensidad de la 
asociación E-R crea un hábito. Tipo de conocimiento procedimental, el sujeto aprende que 
tiene que hacer ante una determinada estimulación. 
Asociación R-O (Respuesta – reforzador/consecuencias), para Tolman las respuestas tienen 
una intencionalidad dependiendo del resultado que va a obtener el sujeto. Tipo de 
conocimiento declarativo. Representa o recuerda los atributos del reforzador. 
Asociación E-E (estímulo – reforzador/consecuencias). Si obviamos la respuesta intermedia, 
en el cond. Instrumental se puede producir una asociación entre el estímulo y sus 
consecuencias. 
 
 Dickinson ante este debate distinguió dos tipos de respuestas: aquellas en las que la 
ejecución depende del establecimiento de un hábito y aquellas en las que la ejecución 
depende de la anticipación de un reforzador (acción). 
 E>>>>R (hábito) Se forman a partir de la relación estímulo-respuesta. 
 E>>>>Ref (acción) son denominados actos instintivos, y dependen de las 
 conseciencias que se desprenden de la acción. 
 Este estudio fue realizado por Dickinson. Se condicionó a unas ratas a realizar una 
respuesta para obtener un reforzador determinado (apetitivo). Posteriormente se procede a la 
devaluación del reforzador. Tras estas dos fases decidió realizar una tercera fase de extinción 
de la respuesta para ver si era muy rápida (valor aversivo del ref) o lenta (no valor aversivo del 
ref). 
 Si las ratas adquirieran un hábito E-R mecánico, no tendrían recuerdos de los atributos 
delreforzador en la fase 2 y en la fase de extinción realizarían muchas veces la respuesta. 
 Si las ratas aprendieran a cerca del valor del reforzador (R-Ref), lo reconocerían en la 
fase 1 como algo positivo y a partir de la 2 como algo negativo. Por lo que en la fase de 
extinción disminuiría su respuesta por las consecuencias que se esperarian de ella. 
 Las ratas NO realizaron la respuesta debido a que recordaban el atributo del reforzador 
y la ejecución quedó mediada por las consecuencias de la conducta en el condicionamiento 
instrumental. 
Adams (1982) 
 Propuso y realizó un experimento en el que comparaba, la extinción de la respuesta en 
dos grupos que variaban en la cantidad de entrenamiento que habían recibido. DEV-100 (4 
fases de entrenamiento, 100 reforzadores) y DEV-500 (más sesiones y 500 reforzadores). En 
ambos casos se devaluó el reforzador. Luego se estudió la extinción de la respuesta. 
 En el grupo de entrenamiento limitado, mayo velocidad de extinción, menos respuesta 
instrumental (Asociación R-Ref, acto instintivo) 
 En el grupo con mayor entrenamiento se produce una reducción menor de la 
respuesta, una extinción más larga (asociación E-R, hábito. 
 Con mayor cantidad de entrenamiento un acto instintivo puede conertirse en un hábito 
rutinario debido a la mayor asociación E-R. 
 Esto puede observarse en el consumo de drogas, que las primeras veces se realiza en 
busca de unas consecuencias (efecto reforzante) y tras repetidas consumiciones se convierte 
en un acto rutinario independiente de sus consecuencias. 
 
Regulación emocional de la conducta: 
 ¿Qué pasaría se impedimos que se se procese la información afectiva de los estímulos 
a nivel cerebral? Hatfield con procesos de devaluación lo comprobó tras comparar dos grupos 
de ratas, uno de ellos con una lesión en la amigdala (relacionada con el procesamiento del 
valor afectivo) y otro de control. Si el valor afectivo del reforzador era en la fase de extinción 
aversivo, cabía esperar una rápida extinción de la respuesta. 
 
 En el grupo de control los sujetos en los que se produjo la devaluación, redujeron 
considerablemente su respuesta frente al estímulo. 
 Los sujetos con la lesión previa en la amigdala se comportaron de forma indistinta. 
 Sin embargo otras estructuras interfieren en el valor afectivo de los reforzadores 
(corteza gustativa en aversión al sabor) y este fenómeno fue sometido a estudio también. 
 En el grupo de control los sujetos no sometidos a la devaluación presentaron una 
extinción lenta y los sometidos a la devaluación, casi desde el primer momento, dejaron de dar 
respuesta. El grupo con la lesión en la amígdala y el cortex gustativo se comportaron 
aparentamente igual. 
Elección de la respuesta (experimento realizado en humanos) 
 Se colocaba a los sujetos frente a un proyector en el que se le presentaban una serie 
de láminas con dos estímulos cada uno. Dos estímulos eran invariables, uno se asociaba con 
la ingesta de un vaso de tomate y el otro con la ingesta de un vaso de zumo de tomate. Previo 
a este condicionamiento se pedia a los sujetos que valoraran de -10 a 10 ambos sabores. 
Posteriormente al entrenamiento se procedía a devaluar el chocolate en unos sujetos y el 
tomate en otros. Luego se les dejaba elegir entre dos diapositivas cual era su preferida. 
 En los últimas pruebas la preferencia de las diapositivas del sabor devaluado caía en 
picado. Se registró también un incremento en la actividad de la amígdala cuando se veían 
estímulos que preveen consecuencias negativas. 
 
Función de los estímulos 
 Parte del comportamiento refleja el conocimiento previo sobre las consecuencias de la 
conducta (declarativo) pero si los actos no se desprenden de las consecuencias son 
conocimientos pocedimentales. 
 Si obviamos la respuesta en el condicionamiento instrumental observamos que existe 
contingencia temporal entre el estímulo y las consecuencias. 
 Existen unos factores que contribuyen al establecimiento de una conducta aprendida. 
 Factores biológicos 
 Factores adquiridos (motivación de icentivo) aprendizaje sobre el carácter 
fectivo del reforzador. Encamina la conducta del sujeto a la cnsecución del reforzador. 
 Funcion asociativa entre el estímulo y las consecuencias y función moduladora que 
que produce una respuesta en presencia del estimulo que en el pasado estaba encaminada a 
la consecución del reforzador. 
 Un ejemplo de esto se demuestra en la Tª bifactorial, el Ed indica la relación entre la 
respuesta y sus consecuencias. 
Consta de una fase de condicionamiento clásico (Luz – Descarga) y condicionamiento 
instrumental (Luz – Respuesta – No descarga). La latencia de la respuesta en presencia y 
ausencia de la luz varía por la asociación establecida E-E. 
Asociación jerarquica 
En presencia del estímulo (determinadas situaciones) la respuesta traerá unas consecuencias. 
 
 
 
 En presencia de una luz la R1 produce la obtención de un Ref1 y en presencia de un 
sonido una R2 produce la otención de un Ref2. 
 En esta prueba frecuencia de la respuesta no está determinada por la cantidad de 
reforadores sino por el estímulo que se presenta. 
 La función moduladora de los estímulos influye en la frecuencia con la que se realiza 
una respuesta en presencia de un estímulo. 
Acción, hábito y drogas de abuso. 
 En resumen sabemos que hay varios tipos de asociación posibles: 
 Condicionamiento clásico: E-E y E-R 
 Condicionamiento instrumental: E-R (hábito) y E-Ref (actos instintivos) 
 Dickinson desarrollo en el ámbito del Condicionamiento instrumental la Tª sobre la 
expectativa del condicionamiento en la que los actos intintivos eran producidos por las 
consecuencias que traería la respuesta y los hábitos se producirían por una asociaciónde los 
estímulos con la propia respuesta. 
 
 
 
Ámbitos de aplicación 
¿Pueden los mecanismos del aprendizaje asociativo dar respuestas a interrogantes sobre la 
adicción a las drogas? 
Tipos de asociaciones intrumentales: 
En la asociación E-E (estímulo reforzador) podemos encontrar el mecanismo que produce que 
los estímulos asociados al consumo de las drogas puedan motivar su búsqueda. 
Existen tres criterios de la adicción: 
 1º Búsqueda compulsiva de la droga en su ausencia. Un adicto es incapaz de refrenar 
los impulsos de búsqueda de la droga. 
 2º Las personas adictas están dispuestas a realizar un mayor esfuerzo conductual para 
obterner la droga. 
 3º Menor sensibilidad a efectos adversos (anticipación de consecuenccias negativas de 
las drogas). 
1º Criterio: 
 En una caja de condicionamiento a unas ratas se les presentan dos estímulos. Un Ed+ 
(luz verde) que indica la disponibilidad de la droga y un Ed- (luz roja) que indica la ausencia de 
droga. La respuesta que deben realizar las ratas en presencia del Ed+ es la de pulsión de una 
tecla para que se les inyecte la droga. 
 Por un lado tenemos una rata no adicta, que realiza la respuesta únicamente en 
presencia del Ed+ (luz verde). Por lo tanto su conducta queda ligada a los estímulos del 
ambiente. 
 Sin embargo tenemos una rata que ha tenido una experiencia prolongada previa con la 
droga, es adicta. Esta rata realiza la respuesta incluso en presencia del Ed-, su conducta 
escapa de su propio control, su impulso de búsqueda de la droga es irrefrenable. 
2º Criterio 
 En este caso se utiliza un prograa de reforzamiento de razón progresiva (el sujeto debe 
realizar cada vez más respuestas para la obtención de la droga). 
 En primer lugar una rata no adicta realiza la respuesta hasta determinado punto 
(PUNTO DE CORTE: nmáximo nº de respuestas que un sujeto está dispuesto a realizar para 
obtener una droga). 
 Sin embargo la rata adicta continúa realizando la conducta mucho más allá del punto 
de corte de la no adicta. Esta dispuesta a realizar un mayor esfuerzo para conseguir la misma 
cantidad de droga. 
3º Criterio 
 En este casofuncional) 
 I.P. Pavlov (1949-1936) es el padre del condicionamiento clásico. Interesado 
en la fisiología y recibió el Nobel en 1904. 
 
 
Descubrió que tras la repetición de hacer sonar una campanilla, precediendo a la 
ración de comida, los perros salivaban (presentaban una respuesta fisiológica). Dicho 
aprendizaje podía medirse midiendo la cantidad de saliva producida (intensidad de la 
respuesta). Se llama reflejo condicionado a la presentación de una respuesta 
fisiológica frente a un estímulo arbitrario. 
Define condicionamiento como un proceso de aprendizaje que reporta ventajas 
adaptativas ya que permite anticipar los hechos relevantes de nuestro entorno 
(prepararnos para la comida, por ej.) Su experimento supone una demostración 
experimental de que no todos los reflejos son innatos y pueden ser creados por 
asociación (todo aprendizaje se reduce a la formación de hábitos por asociación de 
elementos). Desarrolla la Teoría de la sustitución del estímulo: EC (sonido de la 
camapanilla) sustituye al EI (presencia de comida). 
 
4. REINADO DEL CONDUCTISMO 
4.1. Thorndike (1874-1949) El conductismo americano. 
Aporta procedimientos y problemas para el estudio del aprendizaje instrumental. 
Desarrollo métodos para estudiar cómo se adquieren ciertas pautas de conducta: 
 -“Caja Problema”: Cogía un gato y lo metía dentro. Había un pedal que al 
pulsarlo abría la puerta. El gato tenía que aprender a apretar el pedal para poder salir 
de la caja y llegar a un plato de comida que había fuera. Tomaba notas del tiempo que 
tardaba en abrir la puerta a medida que se repetía la experiencia. 
Para él el desarrollo de los hábitos consistía en establecer relaciones entre los 
estímulos y las respuestas (E-R, la respuesta correcta a un estímulo determinado daba 
lugar al hábito como resultado de la experiencia). Propuso una serie de leyes o 
principios para explicar este fenómeno: 
 -Ejercicio o Práctica: el numero de ensayos favorece la conexión E-R 
 -Ley del Efecto: si una respuesta en presencia de un estímulo va seguida de 
 un suceso satisfactorio, la asociación entre el estímulo y la respuesta se 
 fortalece (reforzamiento positivo) Más tarde fue llamado principio del 
 reforzamiento) . 
 Establece que la función de la consecuencia obtenida tras una respuesta es 
fortalecer o debilitar la relación E-R dependiendo de la naturaleza de dicha 
consecuencia (positivo o negativo). 
*Para él no hay intención, la consecuencia del aprendizaje es un hábito. 
 
4.2. John Watson (1878-1958) 
Es el padre del conductismo americano. En 1913 publica “El Manifiesto Conductista”. 
El objeto de la psicología es la conducta observable y manifiesta (psicología 
experimental). 
Estudió la influencia del ambiente sobre los hábitos, concretamente se fijó en los 
estadios del miedo (emoción que provoca ciertas respuestas). 
 
Su experimento: 
 Hizo que un niño pequeño cogiera miedo a un peluche de una rata. El niño al 
principio no le tenía miedo, lo cogía, lo acariciaba… pero Watson empezó a dar un 
golpe muy fuerte con una barra de hierro para que el niño asociara el susto por el 
estruendo, al ratón. Al cabo de un tiempo el niño había hecho una asociación por la 
que al final tenía miedo al ratón. Se llama miedo condicionado o adquirido 
(condicionamiento clásico). 
4.3. Tolman: Conducta, cognición y propósito. 
 Para Tolman el aprendizaje implica adquisición de conocimientos y la conducta 
no es más que una expresión del aprendizaje. Por lo tanto el aprendizaje no refleja 
necesariamente un resultado conductual (aprendizaje latente: el que se obtiene sin 
ser consciente de ello y no se presenta hasta que en un contexto determinado se 
expresa un cambio conductual) 
Tolman dice que el aprendizaje no puede considerarse solo como un movimiento 
mecánico causado por la contigüidad, sino que requiere un conocimiento (la conducta 
requiere propósito y el propósito cognición: no mecánica). Introdujo así el término de 
conducta propositiva (ejecuciones requieren de propósito y conocimiento). Distingue 
por lo tanto entre aprendizaje y ejecución, y establece la diferencia entre conocimiento 
declarativo y procedimental. 
Utilizó métodos más complejos de investigación (laberintos). A partir de sus 
experimentos con ratas dedujo que el animal no adquiere un hábito, si no que es su 
propósito el que lo mueve. 
 En un laberinto con determinado recorrido una rata aprendía el camino para 
obtener comida, pero cuando se situaba a la rata en un laberinto radial, en lugar de 
usar el brazo por el que accedía a la comida en el laberinto anterior, usaba aquél que 
acortaría el recorrido hacia la comida. Desarrollo así la Tª de los mapas cognitivos, 
que consistían en una forma de aprendizaje latente (almacenamiento de conocimiento 
geográfico en la memoria que no se reflejaba hasta el cambio de laberinto). Así probó 
que el propósito era más fuerte que el hábito. 
 
4.4. C. Hull y la motivación de la conducta (1874-1949). 
“Los organismos sufren privación, la privación crea necesidades, las necesidades 
activan pulsiones; el comportamiento es dirigido a metas y alcanzar metas tiene valor 
de sobrevivencia”. 
Incluyó la motivación como factor de la conducta. Creó una fórmula para explicar este 
fenómeno: R = HE-R x D x K 
R (respuesta) HE-R (Hábito) D (Pulsión) K (incentivo/esfuerzo) 
Para él la fuerza, intensidad y grado de aprendizaje depende de: la intensidad del 
hábito y la motivación (2 fuentes de motivación: motivación biológica del organismo 
-por ejemplo si se tiene hambre- y el valor que tiene el incentivo para el sujeto) 
Incorpora los procesos de índole motivacional 
 
4.5. El conductismo radical de Skinner (1904-1990) 
 Realiza un Análisis experimental de la conducta: El pensamiento (emociones, 
 motivación, sentimientos) es conducta encubierta y responde a las mismas leyes y 
 mecanismos que lo que conocemos como conducta manifiesta. 
 Tomó elementos de Thorndike: La caja de Skinner (similar a las cajas problema), la Ley 
 del efecto: la conducta está mantenida por reforzamiento externo y los programas de 
 refuerzo. 
1. El aprendizaje como ciencia experimental 
 -Ciencia: conjunto sistemático de principios y conocimientos procedentes de la observación y 
la experimentación que muestran la operación de leyes científicas generales. 
-Psicología del Aprendizaje: cuerpo de conocimientos científicos que describen cómo cambia 
el comportamiento en función de la experiencia. 
Aprendizaje 
Conductual 
(Adquisición de respuestas) 
Cognitivo-Funcional 
(Adquisición de 
conocimiento) 
Neuronal 
(Plasticidad nerviosa) 
Conducta manifiesta Representación de 
información 
Mecanismos neuronales 
Aprendizaje como ciencia experimental: Se expone al individuo a cierta experiencia y se 
observa cómo esa experiencia cambia su conducta. 
 La tendencia actual es aunar estos tres enfoques en el estudio del aprendizaje. 
Definición de aprendizaje: 
 -Nivel conductual: 
 “Cambio duradero en la conducta que se produce como resultado de la experiencia o la 
 práctica” (Kimble, 1961). 
 -Adquisición de respuestas (aprendizaje = ejecución) 
 -Se da si hay cambios en la conducta manifiesta 
 -Existen fuentes de cambio en la conducta que no suponen aprendizaje: fatiga, 
 alteraciones fisiológicas... 
 -Nivel cognitivo funcional: 
 ““Mecanismos responsables del procesamiento de la información (codificación y 
retención), de la adquisición de conocimiento y otras habilidades” (Norman, 1982). 
-Adquisición de representaciones de la realidad 
 -Diferencia entre aprendizaje y ejecución (manifestación conductual 
 observable de lo adquirido). 
 -Conocimiento: Declarativo: adquisición y evocación CONSCIENTE (Tolman). 
 Procedimental: adquisición y evocación INCONSCIENTE (Hull). 
 -Bandura: Aprendemos respuestas por observación de modelos que quedan 
 representados cognitivamente y no tienen por quéhay dos estímulos que indican la disponibilidad de la droga uno verde 
(droga en solitario) y uno azul (la realización de la respuesta supone una inyección de la droga 
y una descarga). 
 La rata no adicta al asociar el estímulo azul a la descarga deja de realizar la respuesta 
en su presencia por sus consecuencias aversivas. 
 La rata adicta por su parte, continúa realizando la respuesta a pesar de la descarga 
(está dispuesta a soportar situaciones aversivas). 
 
 
 
Fenómeno de la recaída 
 Incluso tras la recuperación de la adicción en determinados sujetos persiste el desei de 
consumirla y tras un tiempo sin hacerlo, en determinadas ciscunstancias (estrés, contexto de 
adquisición de la adicción...) pueden volver a caer en la tentación. Las ratas representadas en 
nego presentan este fenómeno (rápido aumento de la tasa de respuesta). 
Tª explicativas de la adicción 
 Hay un marco general de diferentes autores en el que se sugiere que las conductas 
adictivas se producen por el efecto reforzante que provoca su consumo: HIPÓTESIS 
HEDÓNICAS: 
 -Placer-dolor 
 -Reforzador positivo – Reforzador negativo: En la adicción se da la influencia del 
 reforzamiento positivo (presencia de un reforzador apetitivo tras la respuesta) y el 
 reforzamiento negativo (la rspuesta supone la retirada de un reforzador aversivo). La 
 droga produce placer tras su consumo y su no concumición produce displacer, se 
 vuelve a consumir para evitar ese displacer. 
 -Procesos oponentes 
APRENDIZAJE E-R (consumo como hábito rutinario). 
HIPÓTESIS DOPAMINERGICA: Guarda relación con los efectos de la droga a nivel general en 
los circuitos cerebrales de recompensa. Estas estructuras están conectadas entre sí y usan 
como neurotransmisor la dopamina. 
 Al consumir una droga se incrementa la respuesta de este circuito, se sensibiliza, hay 
una mayor respuesta del cerebro ante la droga. Así es que la droga adquiere un mayor valor de 
incentivo. (INCENTIVO: evento con determinadas propiedades que en un organismo tiene un 
valor determinado e instiga una conducta). Según la Tª de la sensibilización los estímulos del 
ambiente también adquieren esa capacidad de incentivo y provocan una actividad cerebral un 
poco inferior a la de la droga (motivación de incentivo de los esttímulos). 
La Tª de la sensibilización incentiva dice que la experiencia repetida con drgas hace que estas 
adquieran un mayor valor de incentivo y aumenta por lo tanto el valor de la recompensa que 
conlleva su consumo. Los estímulos también adquieren vaor incentivo. 
Estudio de Wyrell y Berridge 
 A un grupo de control se le suministró una solución incocua en el núcleo acumbuo. 
Leugo se procedió a una fase de condicionamiento de una respuesta a la obtención de 
anfetamina (no sacarosa como dice en la imagen). Luego en la Fase 2 se les asocia un Tono a 
la inyeccion de la anfetamina y un click a ningún tipo de evento. En la fase de Prueba se 
presentan el tono y el click por separado y se mide la tasa de respuesta. 
 A otro grupo de ratas se les realiza el mismo procedimiento a diferencia de que en 
primer lugar se les inyecta la anfetamina, provocandoles una sensibilización frente a la droga 
(mayor valor de incentivo). 
Los resultados arrojados por el estudio fueron los siguientes: 
 En el grupo de control el tono provocó un poco más de respuesta por la previa 
asociación del mismo a la droga, pero la tasa de respuesta es comparable a la casi inexistente 
frente a la presentación del click. 
 En el grupo de las ratas sensibilizadas el tono produce un incremento más que 
significativo de la respuesta, frente al click que produce una fuerte caída de la tasa de 
respuesta. 
 En conclusión extraemos que los estímulos del ambiente provocan respuestas 
encaminadas a la obtención de la droga en aquellos sujetos sensibilizados a la misma. 
 
 
 
 
 
 
 
 
 
TEMA 8: MODELOS TEÓRICOS 
Perspectiva teórica del condicionamiento 
 
 En una situcaión estándar del condicionamiento clásico se presenta un EC seguido de 
un EI y estos elementos se convierten en cualidades del entorno. Antes de que se produzca el 
condicionamiento el sujeto almacena en su memoria información sobre los hechos, de tal 
forma que almacena información sobre el EC y el EI y sus atributos (sensoriales, 
motivacionales, hedónicos. Forma en su memoria representaciones dde los mismos con el 
mismo contenido del EC y del EI. 
 Tras el condicionamiento, cuya naturaleza es asociativa, en la experiencia conjunta con 
un determinado EC y EI, se forman relaciones (asociaciones) a nivel de la memoria entre las 
representaciones de ambos. 
 
 Existen dos formas posibles de asociar los elementos de una situación estándar de 
condicionamiento clásico: 
 1º Teorías E→ R: se trata de una asociación directa entre la representación del EC y la 
 de la respuesta producida por el EI. De esta forma al presentar un EC se produce una 
 respuesta homóloga a la producida por el EI , la RC. En este tipo de asociación no 
 participa la representación del EI. Se trata de un tipo de conocimiento procedimental. 
 2º Teorías E→E: En el curso del condicionamiento al presentar conjuntamente EC y EI 
 sus representaciones se asocian. Más tarde, en la prueba al presentar el EC no se 
 activa la representación de una respuesta, sino que se activa la representación del EI 
 asociado y este fenómeno es que produce la RC. 
 
Modedelos asociativos 
 Explican las asociaciones formadas a nivel interno. Los modelos posteriores (de 
atención, de memoria, centrados en la ejecución...) no cuestionan la asociación pero 
incorporan otros mecanismos. 
Modelo de Rescorla y Wagner (1972) 
 Se trata de un modelo matemático formal que tiene el objetivo de explicar asociaciones 
entre los estímulos y la producción de las respuestas condicionadas. Se basa en las teorás 
asociativas E-E. Indica que para que la presencia de un EC provoque la activación de la 
representación de un EI a nivel de la memoria deben darse unas determinadas circuntancias: 
 -Deben formarse asociaciones E-E: 
 La asociación puede tener una determinada fuerza asociativa (VA ) que se fortalecerá 
 en el curso de la experiencia. Además la fuerza asociativa determinará la magnitud de 
 la respuesta. 
 
 El resultado de VA es el resultado de la suma de la magnitud del incremento de todos 
 los ensayos. 
VA = ΔVA 1 + ΔVA 2 + ΔVA 3 +ΔVA 4 … 
 -La magnitud de la asociación depende de la capacidad asociativa del EI: 
 -La saliencia del EC también afecta a dicha magnitud (grado en que destaca del 
 entorno): 
 -El componente motivacional del EI: 
 Se representa por β y hace referncia al impacto motivacional del EI, que instiga 
 determinadas conductas. 
 A partir de estos supuestos se desarrollo la ecuación del modelo: 
Donde se presupone que α, λ y β son valores constates en el condicionamiento. α varía entre 
0 y uno, siendo 0 = ausencia del EC. VT hace referencia a VAn-1 
 
 
 Entonces podríamos calcular VA5 = ΔVA 1 + ΔVA 2 + ΔVA 3 +ΔVA 4+ΔVA 5 a través de la 
fórmula anterior. 
VA5 = 50 + 25 + 12,5 + 6,3 + 3,1 + 1,5 = 98,4 
 
 
 
 
Bloqueo según el modelo de Rescorla y Wagner. 
 
Fase 1 Fase 2 Bloqueo 
Condicionamiento: 
LUZ > EI > R 
Finalmente: 
LUZ > R 
Condicionamiento: 
LUZ y TONO > EI 
Prueba: 
TONO > No R 
(el tono no resulta relevante 
en la fase 2) 
α, λ y β VA5 = ΔVA 1 + ΔVA 2 
Asignamos los siguientes valores: 
VLUZ 
n
 = 100 (fuerza asociativa alcanzada en la fase 1) 
λ = 100 
αLUZ = 0,5 αTONO = 0,5 
β = 1 
Calculamos los incrementos en la Fase 2, para intentar explicar la ausencia de 
condicionamiento del TONO: 
ΔVLUZ1 = α · β (λ- VT) = 0,5 · 1 (100 – 100) = 0 
ΔVTONO1 = α · β (λ- VT) = 0,5 · 1 (100 – 100)= 0 
 Como vemos se comprueba. El valor de VT) es en ambos casos 100, porque es el total 
de fuerza asocioativa (sumatorio) alcanzado en la fase anterior por ambos estímulos. La 
capacidad asociativadebe repartirse entre ambos estímulos. 
Ensombrecimiento según el modelo de Rescorla y Wagner 
 Se presenta un estímulo complejo formado por una “luz” (poco saliente) y un RUIDO 
(muy intenso). 
FASE 1 PRUEBA 
Luz, RUIDO > EI Dos asociaciones distintas: 
Luz > EI 
RUIDO > EI 
VRUIDO 
n > VLUZ 
n 
Damos unos determinados valores: 
λ = 100 
αLUZ = 0,2 αRUIDO = 0,4 
β = 1 
Supongamos que la fase 1, consistió en 3 ensayos, calculemos VRUIDO 
n y VLUZ 
n. 
ΔVRUIDO1 = 0,4 · 1 (100 – 0) = 40 
ΔVLUZ1 = 0,2 · 1 (100 – 0) = 20 
ΔVRUIDO2 = 0,4 · 1 (100 – 60) = 16 
ΔVLUZ2 = 0,2 · 1 (100 – 60) = 8 
ΔVRUIDO3 = 0,4 · 1 (100 – 84) = 6,4 
ΔVLUZ3 = 0,2 · 1 (100 – 84) = 3,2 
VRUIDO 
n = 0 + 40 + 16 + 6,4 = 62,4 
VLUZ 
n = 0 + 20 + 8 + 3,2 = 31,2 
 La fuerza asociativa del estímulo de mayor saliencia es efectivamente más alta. Se 
comprueba también este efecto. 
Inhibición latente. Limitaciones del modelo de Rescorla y Wagner. 
GRUPOS FASE 1 FASE 2 
IL 4 x LUZ > nada 4x LUZ > EI 
CONTROL ----------- 4x LUZ > EI 
 Sabemos que en el fenómeno de inhibición latente en la fase 2, el EC tiene dificutades 
para asociarse al EI. Pero según el modelo de rescorla y Wagner, para el grupo IL el 
condicionamiento sería el siguiente (con unos valores de λ = 100, αLUZ = 0,5 y β = 1): 
FASE 1 
ΔVLUZ1 = 0,5 · 1 (0 – 0) = 0 (no está presente el EI ni sus atributos) Lo mismo ocurre en ΔVLUZ2 
ΔVLUZ3 y ΔVLUZ4. 
 
FASE 2 
ΔVLUZ5 = 0,5 · 1 (100 – 0) = 50 
ΔVLUZ6 = 0,5 · 1 (100 – 50) = 25 
ΔVLUZ7 = 0,5 · 1 (100 – 75) = 12,5 
ΔVLUZ8 = 0,5 · 1 (100 – 87,5) = 6,75 
VLUZ= 93,25 >>>> ESTO ES INCORRECTO. NO PUEDE PRODUCIRSE EL MISMO 
CONDICIONAMIENTO QUE EN EL GRUPO DE CONTROL (SIN PREEXPOSICIÓN AL EC). 
 Algunos teóricos a partir de esta comprobación cuestionan la supuesta onstancia de la 
saliencia del EC (α) y plantean que esta varía con el trancurso del condicionamiento. 
Inhibición condicionada según el modelo Rescorla y Wagner 
 En un experimento de inhibición latente, se asocia en la Fase 1 un Tono a un 
determinado EI hasta que alcanza una fuerza asociativa de 80. en la segunda fase se 
presentan conjuntamente una Luz y el Tono sin presencia del EI (fase de inhibición). 
Fase 1 Fase 2 
TONO > EI LUZ + TONO > No EI 
λ = 100 
αLUZ = 0,2 αRUIDO = 0,2 
β = 1 VTONO
n = 80 
 ¿Qué tipo de propiedades condicionales adquiere cada EC? 
TONO: excitatorio apetitivo 
LUZ: Innhibitorio apetitivo (inhibidor condicionado) 
 Se desarrollan dos asociaciones: 
 TONO > EI 
 LUZ > EI 
ΔVTONO1 = 0,2 · 1 (0 – 80) = -16 
ΔVLUZ1 = 0,2 · 1 (0 – 80) = -16 
 
VTONO = 80 + (-16) = 64 
VLUZ1 = 0 + (-16) = -16 
 La explicación de Rescorla y Wagner a este fenómeno fue que existen dos polos 
asociativos. El polo positivo hace referencia al condicionamiento excitatorio y el negativo al 
condicionamiento inhibitorio. 
Teoría atencionales 
 Surgen en respuesta a las limitaciones del modelo de Rescorla y Wagner a la hora de 
explicar fenómenos como la inhibición latente. Dicen que en el curso del condicionamiento al 
presentar juntos EC y EI se asume que aumenta la fuerza asociativa entre ambos (al igual que 
en modelo R y W). Es decir: VA tiende a λ y el EC produce una respuesta proporcional a VA. 
 Discrepan con Rescora y Wagner en que α no varíe a lo largo del proceso de 
condicionamiento. A medida qu el condicionamiento avanza, la codificación que el sujeto 
realiza sobre el EC varía. Para ellos la habituación representa un fenómeno de disminución de 
la atención al EC. 
 Para Perace y Hall la α (codificación del EC) depende de λ menos VA. Por esta teoría 
α = λ - VA. Y por lo tanto al final de condicionamiento α = 0. 
 Teoricamente se apoya sobre la hipótesis de que l”las señales de las cuales ya 
conocemos sus consecuencias previamente, no necesitan ser codificadas al mismo nivel que 
las nuevas” 
 
 
Estudio de Kaye y Pearce 
 Realizaron un estudio con ratas en el que la asociación consistiría en un Tono que 
rpoduciría la aparición de comida. Observaban el aumento de la actividad entre las ratas al 
presentar el estímulo como RC. Se establecieron 3 grupos: 
G0 = se les presentaba el sonido y nunca iba seguido de la aparición de la comida. (no es de 
esperar que realice respuesta de aumento de la actividad) 
G50= en el 505 de las presentaciones del EC se les daba la comida. 
G100= en el 100% de los casos la presentación del EC iba seguida de la comida. 
 La respuesta de activación alcanzaba una VA superior en el grupo G100, media en el 
grupo G50 y muy baja o casi nula en G0. Entonces decidieron estudiar la atención que 
prestaba cada grupo al EC en curso del condicionamiento, para ello observaron las respuestas 
de orientación hacia la fuente de emisión del TONO por parte de los sujetos. 
El G0 y G100 dejan progresivamente de prestar atención al estímulo porque conocen sus 
consecuencias. Sin embargo, el G50 no puede predecir con exactitud lo que va a ocurrir por lo 
que su atención al EC es constante. A medida que la diferencia entre landa y la fuerza 
asociativa disminuye, también disminuye la atención prestada al EC. 
Modelos de memoria 
Modelo SOP de Wagner 
 Incluye los mecanismos memoriales. Por ejemplo los efectos de la habituación a corto 
o largo plazo dependerán de si esta info se codifica en la MCP o MLP. Dice que cuando 
 presentamos conjuntamente un EC y un EI no solo se forman asociaciones entre ellos, sino 
que también entre sus atributos. 
 
 
Para Wagner cada uno de esos nodos representa un evento o estímulo (A y B). Ambos 
contienen info sobre los atributos sensoriales de cada evento (A1:dulce, A2: apetitivo... por 
ejemplo). 
 Presupongamos que A es un EC y B un EI. Para ambos el sujeto codifica la 
información sobre sus atributos y luego establece relaciones entre estas discriminaciones (no 
son conexiones entre estímulos, sino entre atributos de estímulos). 
 Para que se preduzca una asociación entre A y B es necesario que ambos nodos esten 
activos en la MCP al mismo tiempo. La asociación será mayor cuanto mayor sea la fuerza de 
activación del nodo A y del nodo B. El estado de máxima activación de un nodo (lo 
denominaremos A1) se produce cuando el estímulo al que representa ese nodo está presente. 
Esta activación del nodo se produce a nivel de la MCP pero al desaparecer el estímulo, la 
activación del nodo en este nivel memorial se reduce a un estado de menor activación > A2. 
 Cuando presentamos un Ec se produce por lo tanto la máxima activación de su nodo. 
Si presentamos un EI (activando al máximo su nodo) justo después del EC (que pasara al 
estado A) se producirá una asociación entre ambos. Esto explica porqué cuando disminuye el 
intervalo entre EC y EI aumenta su asociación. 
Condicionamiento inhibitorio 
 Un estímulo alcanza la máxima fuerza inhibitoria cuando sus atributos están en estado 
A1 y el EI en estado A2 o posterior (ha desaparecido el nodo a nivel de la MCP). 
 Activación al máximo nivel > Presentación del estímulo = Activación autogenerada 
 Activación de un estímulo por la presentación de un evento relacionado = Activación 
 generada por asociación. 
 
Especificidad contextual 
 Los aprendizajes en general se asocian a los contextos. La RC no se condiciona a los 
estímulos, se condiciona a las características del entorno. 
 
 
Modelos de ejecución de la respuesta condicionada 
 Asumen que en las condiciones adecuadas siempre se va a producir aprendizaje (se 
van a asociar los estímulos). Este aprendizaje no siempre se va a mostrar en la ejecución de 
Bloqueouna respuesta (por fallo en la ejecución o interferencia). 
Bloqueo 
 Según la hipótesis del comparador si se produce una asociación entre el Tono y la Luz 
y de estos con el EI. LA respuesta es el parpadeo y el EI es una descarga eléctrica. La 
respuesta se mide frente a la presentación de la LUZ. 
 
Segun R y W en el Grupo1: La fuerza asociativa del tono es igual a landa y por lo tanto la 
fuerzaasociativa de la luz es igual a 0 (bloqueo). 
 En el Grupo 2 la fuerza asociativa del tono y de la luz son equivalentes y tanto el tono 
como la luz producirán la misma respuesta. 
 Es incpaz de explicar lo ocurrido en Grupo3. 
 Según la hipótesis del comparador dice que la respuesta a la luz se produce porque 
en la Fase 2 se produce una asociación entre esta y el EI. Tanto la Luz y el Tono se asocian 
con la descarga. Estas asociaciones tienen distintas magnitudes que varían a lo largo del 
condicionamiento. En el momento de la prueba lo que hace el sujeto es comparar todos los 
eventos del condicionamiento (presentes y ausentes) y decide cual es mejor predictor del EI y 
según su presencia o ausencia realizará la respuesta o no. 
 Por lo tanto en el G1 la asociación del Tono a la descarga es superior a la de la Luz a 
la misma. Responde únicamente al tono. 
 En el G2 la asociación es igual. Responde a los dos estímulos por igual. 
 En el G3 la asociación del Tono a la descarga es superior hasta la Fase 2, en la Fase 3 
esta disminuye y por eso la asociación de la Luz a la descarga, aunque fuera muy pequeña, 
resulta superior a la del Tono a la descarga. La luz produce respuesta. 
Marc y Bouton dicen que los fallos en la ejecución se producen por la interferencia de ciertas 
informaciones en la recuperación de la memoria. En experimentos de varias fases el sujeto 
almacena información sobre las distintas fases . Forma representaciones de las asociaciones y 
en la fase de prueba las compara. 
Algo similar a lo anterior sucede en el ensombrecimiento. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
TEMA 9: Condicionamiento humano y aprendizaje causal 
Determinados aspectos del aprendizaje son exclusivamente humanos. 
 En 1974 Se publicó un articulo de gran influencia en el condicionamiento humano: Dice 
que no existe evidencia de que exista el condicionamiento clásico ni operante en el ser 
humano. Al contrario que en los animales no se puede producie condicionamiento en sentido 
literal (en el sentido automático o mecánico). Esto es debido a la presencia de la consciencia: 
el ser humano debe de ser consciente de la relación establecida para ser capaz de dar la 
respuesta. 
Conceptos: 
 Razran acuña el término “niveles de aprendizaje”: no hay un solo tipo de aprendizaje 
posible, existe una jerarquía (de los más básicos a los más complejos). 
 También existen distintos niveles de procesamiento: fruto de los estudios conductistas 
que creen que la psicología se basa en el procesamiento de información). 
 Aun estudiando el nivel de aprendizaje asociativo, la respuesta no se produce a menos 
que intervengan procesos de aprendizaje simbólico (jerarquía). 
Operación en paralelo: se pueden realizar simultaneamente 
Operación en serie: tienen que realizarse por separado. Requieren más recursos atencionales. 
Aquellas respuestas que no sean de carácter autónomo (como conductancia de la piel o tasa 
cardiaca que si lo son) requieren consciencia para su adquisiscion y consciencia de la relación 
establecida (ser capaz a expresarla verbalmente). 
Aspectos metodológicos: Tratan de diferenciar si el procesamiento es automático o 
controlado. 
 Emparejamiento informado: Se avisa de una falsa contingencia entre EC y EI, las 
respuestas autonmas se realizan igualmente (no requieren conscienca en su ejecución, pero sí 
en la relación EC-EI). 
 Condicionamiento instruido: Se realiza determinada respuesta pedida en presencia de 
un EC. 
 Enmascaramiento: Es similar al ensombrecimiento y es más fiable que los anteriores 
porque no intervienen las expectativas del sujeto. 
 
 En la tarea primaria: se presentan dos Ecs. Un EC+ y un EC- (luces distintas). El EI 
es una descarga electrica por lo que la presencia de EC+ provoca una respuesta de cambio en 
la conductancia de la piel. 
 Luego se pide al sujeto que realice una tarea secundaria: “Cuando percibas un tono, 
presiona una tecla (R)”. 
Al presentar el Tono en presencia de los Ecs se obseerva que se produce un cambio en la tasa 
de respuesta en la Tarea secundaria cuando está presente el EC+. 
Escucha dicotómica 
 
 Estos estudios se caracterizan porque la escucha de ambos oídos se realiza por 
separado (es dicotómica). Se pone al sujeto unos cascos y se establece un canal atendido (se 
le presenta información a procesar) y un canal no atendido (se presenta una información no 
relevante para latarea pero se puede procesar en menor medida). 
 
 En este experimento, en una primera fase al presentar a un sujeto determinadas 
palabras (ciudades) se le propicia una descarga. De modo que aquellos sujetos que sean 
conscientes e la relación: ciudades-descargas, al oír una palabra de esta categoría semántica 
realizarán la respuesta de cambio de conductancia de la piel. 
 Luego en una segunda fase de prueba se le pide que atienda por un canal a un 
mensaje en prosa que ha de repetir posteriormente. A este canas dedicará casi la totalidad de 
su atención. 
 Sin embargo por el canal no atendido se presentan una serie de palabras de control y 
de la categoría semántica condicionadad previamente. Cabe esperar que el sujeto no sea 
consciente de la rlacion “ciudades-descarga” porque está atendiendo al otro canal. Sin 
embargo los resultados obtenidos arrojan una tasa de respuesta de cambio de la conductancia 
de la piel alta cuando aparecían las “ciudades”. Esto se debe a que el procesamient del canal 
no atendid es en menor medida y la ejecución de respuestas autónomas (cambio de 
conductancia) no requiere de consciencia en su ejecución (sí en su asociación). 
Es importante subrayar: para que el condicionamiento se produzca el sujeto debe identificar 
el EC correctamente (para que pueda interpretar la relación). En este caso en la fase de 
condicionamiento debe interpretar que la categoría semántica de las palabras que provocan la 
descarga era el nombre de “ciudades”. 
 
 
Ejecución de la RC: Una vez adquirida la respuesta ya no se necesita de la atención al EC, la 
mera exposición a este provoca la realización de la respuesta. Es un ejemplo de 
procesamiento automático. 
 
Tarea de enmascaramiento 
 Estas tareas se caracterizan por la presentación de un estímulo diana (de relevancia 
para el sujeto, por debajo del tiempo necesario para su correcto procesamiento) y un estímulo 
máscara (posterior al estímulo diana, durante más tiempo, su procesamiento impide el 
procesamiento del estímulo diana). 
 Tratan de averiguar si la presencia del estímulo diana refleja el condicionamiento 
previo de este EC a un determinado EI (en una fase previa) a pesar de que su procesamiento 
no es consciente (es automático). 
Ejemplo 
 
 En este experimento se hacía una fase previa de condicionamiento a los sujetos. Un 
EC+ compuesto por la imagen de una cara triste (denota emociones negativas) predecía una 
descarga eléctrica. Por otra parte un EC- compuesto por la imagen de una cara feliz (denota 
emociones positivas) no tenía ningún tipo de consecuencias. 
 
 En la fase de prueba se les presentaba a los sujetos: 
 -Por un lado el EC+ como estímulo diana seguido de un estímulo máscara (rostro 
neutro). 
 -El EC- como estímulo diana seguido del mismo estímulo máscara. 
 Se obtuvieron unos resultados que demuestran que en presencia del EC+ hay una 
gran respuesta de aumento de la conductancia de la piel a pesar de que su procesamiento no 
sea cnsciente (si le predimos que exprese verbalmente lo que ha ocurrido no es capaz de 
hacerlo, no sabe que ha pasado ni que ha visto exactamente). Realiza un procesamiento 
automático del EC+. 
Extinción de la RC 
 Se aplica al proceso de extinción de una respuesta condicionada los distintos diseños 
de disociación y se juega con las expectativas del sujeto (haciendo creer al sujeto que el EI 
no seguirá al EC se provoca un descenso en la magnitud de la RC incluso cuando el EC se 
presenta enmascarado). (Extinción instruida)Aprendizaje evaluativo 
 El estudio del aprendizaje humano nos desvela que está más próximo al 
condicionamiento clásico y condicionamiento instrumental animal de lo que pensabamos en un 
principio. La mayor diferencia entre ambos es que el aprendizaje en humanos puede ser 
regulado por creencias y procesos mentales superiores. 
 Hasta hace poco se creía que los animales no tenían emociones y se hacía la siguiente 
distinción entre apreendizajes: 
 -Aprendizaje de señal (Cond. Clásico tradicional): Consiste en aprender a 
 usar señales del entorno para predecir consecuencias relevantes (es un tipo de 
 aprendizaje causal). Un EC anticipa un EI y esta relación se manifiesta a través de una 
 RC. 
 -Aprendizaje evaluativo: Se creía que era exclusivamente humano y de 
 carácter no asociativo. Consiste en la transferencia del valor hedónico del EI a los 
 estímulos que le preceden (EC). Este valos hedónico recibe el nombre de valencia, 
 puede ser positiva o negativa. Hoy en día sabemos que no es un aprendizaje 
 exclusivamente humano, hay evidencias de que se produce en animales: experimentos 
 de devaluación y observación de respuestas faciales. 
Modulación: reacciones afectivas y faciales. 
 En este experimento se daba a los tres sujetos el mismo zumo y se les mandaba beber 
determinados vasos espaciados en el tiempo. Mientras transcurría el tiempo se les dejaba ver 
una película con distinta carga emocional. En el caso de a) era una película de carácter 
horripilante. En el caso de b) la película no tenía ningún tipo de carga emocional. En el caso de 
c) era una película romántica. 
Diseño de aprendizaje evaluativo 
 Estos experimentos presentaban tres imagenes con carga afectiva distinta: uno 
aversivo, uno neutro y otro agradable. 
 Después de la valoración por parte de los sujetos se presentaba uno de los estímulos 
con carga afectiva (aversivo o agradable) como estímulo diana y luego se presentaba el 
estímulo de carácter neutro como estímulo máscara. 
 Había tres grupos de suetos: Pavloviano (expuestos a la experiencia), observatión 
(antes de que se le presentaran los estímulos observaban el proceso en otros) y instrucción 
(se les daban instrucciones sobre lo que iban a ver y sentir). 
 
 
 
 Se observaron que en los tres grupos la conductancia de la piel variaba frente a la 
presencia de un EC+ (anticipaba una descarga) en los tres grupos, estuviera o no 
enmascarado. 
Aprendizaje implícito y valoración afectiva. 
 Primming o preactivación: Proceso de facilitación del procesamiento de un estímulo. 
Se produce cuando este estímulo a procesar va precedido de otro estímulo distintivo que 
guarde cierta relación con él. 
 Por ejemplo pedimos a un sujeto que identifique las imágenes pertenecientes a la 
categoría semántica “arbol” (abedules cerezo, roble...). Antes de la aparición de la imagen de 
uno de esos árboles se presenta un estímulo diana enmascarado formado por un evento 
perteneciente al árbol (hojas, tronco, ramas...) El procesamiento de este estímulo previoes 
inconsciente pero facilita la identificación del siguiente. (se observan menores tiempos de 
reacción en aquellos estímulos precedidos por eventos distintivos). 
 
 En este experimento de valoración afectiva se presentan dos tipos de Estimulos: uno 
de valoración afectiva positiva (Pikachu) y otro de valoración afectiva negativa (Haunter). Estos 
estímulos se enmascaraban y acto seguido procedía la presentación de una palabra de 
determinada carga hedónica (independientemente del valor del estimulo enmascarado). Los 
sujetos debían identificar el valor de esa palabra lo más rápido posible. Por lo tanto los 
emparejamientos podían ser congruentes (positivo-positivo o negativo-negativo) o 
incongruentes (positivo-negativo o negativo-positivo). 
Los resultados arrojan que en casos de incongruencia (tanto positiva como negativa) la 
latencia de la respuesta aumenta considerablemente en comparación a los casos congruentes 
(se facilita el procesamiento de la palabra). 
Condicionamiento instrumental: 
 En el condicionamiento clasico en humanos sabemos que para adquirir una respuesta 
dada es necesaria la consciencia de la relación entre EI-EC (saber expresarla verbalmente). 
En modelos animales, no podemos probar esta “consciencia” porque no hablan, entonces lo 
inferimos a través de la realización de la RC. 
 En cuanto al conicionamiento instrumental en humanos sabemos que hasta los 5 
años (etapa en la que se desarrolla la capacidad del lenguaje) los programas de reforzamiento 
afectan a la ejecución de las respuestas en igual medida que lo hacen con los modelos 
animales. A partir de esta edad en los seres humanos comienzan a influenciar las creencias y 
expectativas y los programas de reforzamiento en el condicionamiento instrumental ya no 
marcan las pautas de ejecución de una respuesta (las repuestas se ajustan a lo que el sujeto 
cree, no al programa de reforzamiento. 
 De vez en cuando los seres humanos apoyamos nuestra conducta sobre creencias 
supersticiosas (se cree que existen unas contingencias que no son reales y regimos nuestra 
conducta en función de ellas). Según Skinner las supersticiones surgen en ocasiones en que 
dos sucesos aparecen emparejados muy habitualmente (sin que exista verdadera 
contingencia) dando lugar a altas probabilidades en la memoria del sujeto. 
 Juicios de contingencia 
 Son valoraciones de las relaciones entre la acción y sus consecuencias. Es decir, la 
percepción subjetiva que tiene el sujeto sobre el grado de relación entre su conducta y las 
consecuencias de esta. 
 Metodología 
 Existen dos métodos para medir el Cond. Inst en humanos: 
 -Tareas conductuales: Consiste en reproducir tareas análogas a las de los 
animales y medir la tasa, latencia... de la respuesta. Además se puede pedir una valoración al 
sujeto sobre lla relación entre sus conductas y sus consecuencias (estos juicios suelen 
ajustarse a lo real). 
 -Tareas de juicios o diagnótico médico: Simulan el proceso realizado por 
médicos (a partir de unos síntomas infieren una enfermedad). El sujeto a partir de determinada 
información debe inferir unas consecuencias. 
 En este ejemplo donde C (causa: medicamiento) y E (efecto: cura) tienen distintas 
relaciones. En el caso de que a, b, c y d fueran equiprobables (25%), diríamos que el 
medicamento no es eficaz (da igual tomarlo que no, la propabilidad de curarnos sería la misma 
en ambos casos). 
 Si la pobabilidad de a fuera 85% y todas las demás fueran 5%, diriamos que si es 
eficaz. Se relaciona la causa con el efecto (R con Consecuencias). Algo similar se produciría 
en el condicionamiento instrumental con animales según Rescorla: 
 Para Rescorla los cambios en la ejecución de una respuesta no dependen solo de la 
estimulación (y sus características fisicas) ni de la contigüidad entre estímulos. Sino que 
también depende de la frecuencia de la aparición de las consecuencias sin el EC o la R 
(dependiendo si es condicionamiento clásico o instrumental). 
 Contingencia (positiva P1>P0) (Negativa P1 Consecuencia (derribar)). 
 Se establecieron 3 grupos en los que P(E/C) era = 0,875: 
 G1: P(E/NoC)=0,125 > Δp = 0,875-0,125= 0,750 
 G2: P(E/No C)=0,125 > Δp = 0,875-0,500=0,375 
 G3: P(E/No C)=0,125 > Δp = 0,875-0,875=0 
 Los resultados obtenidos desvelan que al igual que en los animales, el valor de Δp 
influye diractamente sobre el nivel de respuesta. Por lo que inferimos que la contingencia 
interpretada por los sujetos se ve afectada por el numero de veces que aparecen determinadas 
consecuencias sin su supuesta causa. Al pedir juicios de valoración en el grupo G1 todos 
identificaron como causa el disparo, en el G2 no lo sabían a ciencia cierta, pero en ocasiones 
lo atribuían al disparo. El grupo G3 no tenia idea de porque se derrumbaba el ovni. 
 Al comparar modelos animales (ejecución de una respuesta por parte de unas ratas) y 
modelos humanos (juicios de contingencia) se encontraron grandes similitudes. 
Terapias conductuales 
 Los conocimientos extraidos de estos estudios son apliclabes a las terapias 
conductuales, influyendo en la conducta del sujeto (potenciando o disminuyendo conductas de 
interés). 
 Se presenta el estímulo fóbico a un sujeto incapaz de evitarlo pero bajo condiciones 
controladas. 
En técnicas de desensibilización es importante establecer una jerarquía de las fobias 
(estímulos relacionados con la fobia según su grado de miedo). Se le presentan 
sistemáticamente, de menor a mayor grado y de forma progresiva (hasta que no se supere el 
anterior no se presenta el siguiente). 
 Se sutenta sobre: 
La extinción: no sería suficiente porque sería posible la recuperación espontánea. 
Contracondicionamiento: A la vez que se produce la estimulación gradual se ascian estos 
estímulos con consecuencias de carácter contrario al miedo (control de respiración, ritmo 
cardiaco, relajación muscular...) 
Inhibición recíproca: entre ambas respuesta. 
 Fases: 
• Entrenamiento de relajación: muscular y respiratorio. 
• Elaboración de la jerarquía de ansiedad: asociar de forma gradual las 
situaciones que provocande menos a mas miedo. 
• Afrontamiento progresivo: bien por exposición al objeto o opor la 
imaginación de dichas situaciones, en caso de que no sea posible. 
 A veces aunque se aplique correctamente este procedimiento, el miedo no llega a 
afrontarse porque en situaciones normales se refuerzan positivamente respuestas de escape o 
evitación (miedo a ir en avión: ir en barco o en coche). 
 
Técnicas aversivas 
Se emplea en conductas adictivas con el fin de reducir los consumos. 
 Se basa en procesos de aversión al sabor: Se asocia un estímulo relacionado con la 
conducta adictiva (cajetilla de tabaco) con imágenes o consecuencias desagradables. El valor 
hedónico de estas nuevas consecuencias se transfieren al estímulo. 
 
Aplicaciones médicas: 
• Supresión condicionada del sistema inmunitario: El fin es la consecución de la 
reducción del sistema inmunitario. Se realiza mediante la aplicación de fármacos y su 
asociación a otras sutancias hedónicamente apetitivas (sacarina). Se mide el número 
de muertes y si la sacarina es capaz de adquirir el valor de supresor inmunologico del 
fármaco al que acompaña. 
• Quimioterapia: Los síntomas inmediatos se pueden refrenar con la aplicación de 
fármacos, sin embargo el contexto también se asocia a los síntomas y produce 
síntomas anticipatorios. Se estudia la posibilidad de un fármaco inhibidor de estos 
segundos sintomas o un método de asociación previo del contexto a situaciones 
agradables. 
 
 
 
 
 
Aplicaciones del condicionamiento instrumental. 
 
 
 
 
 
 
 
 
 
Psicología comparada: investigación que trata de descubrir si compartimos nuestro proceso 
cognitivo con otros aspectos animales. 
 
Sistemas y procesos de memoria 
 
 Sabemos que el conocimiento puede ser declarativo o procedimental. Gracias a 
estudios con ratas (las cuales pueden tener memoria episódica) sobre la memoria animal, 
podemos definir esta según dos criterios: a largo plazo y a corto plazo. 
 La estructura de la memoria conforma un sistema multialmacén en el que 
encontramos información cotidiana almacenada de diferentes maneras porque ha sido captada 
por diferentes receptores. 
 
 En cuanto al sistema de memoria a corto plazo o memoria activa podemos decir 
que no permite grancantidad de información y que esta decae con el paso del tiempo. Es un 
sistema formado a nivel estructural. Esta información se puede almacenar de manera ilimitada 
manteniendo la memoria a corto plazo activa durante mucho tiempo por medio de repasos. 
Teorías generales: 
Teorías del almacenamiento 
 Con el tiempo se forma una huella de la información de la memoria que decae con el 
paso del tiempo. El olvido obedece a que no se ha codificado o almacenado bien esa 
información en la memoria. 
 -Decaimiento de la huella de memoria y olvido 
 -Codificación retrospectiva (algo nos hace recordar) y prospectiva (recuerdos 
 involuntarios) 
 
Teorías de las interferencias 
 En ocasiones se produce una interferencia entre los sistemas de memoria. Una 
determinada información es interferida por otra a la hora de la memorización impidiendola. 
 -memorias formadas durante el intervalo de retención 
 -interferencia pro-activa (información que previamente se aprendió, que interfiere con 
 el recuerdo de materiales más recientes ) y retroactiva (Ocurre cuando la información 
 aprendida dificulta la retención de la información reciente ). 
 
Teorías de la recuperación 
 El olvido se produce por fallos en el proceso de recuperación de la información. Se 
producen por los efectos del cambio de contexto y del paso del tiempo. 
Segun Rescorla y Wagner se produce porque no se asocian los estímulos con la memoria (no se 
produce una RC por lo tanto). 
Sin embargo otras investigaciones sugieren que la información si ha sido codificada pero se 
produce un fallo en la recuperación de esta codificación. 
Fases de la memoria 
1º Decae la huella de la información con el paso del tiempo 
2º Fallo en la recuperación de la información 
 
 
Técnicas y métodos de estudio 
Técnica de igualación demorada a la muestra 
 “animal mind”: se emplea en palomas, simios, niños... etc. A través de un panel central 
se le presenta al sujeto determinada información que queremos que retenga para utilizarla más 
adelante. Tras un tiempo determinado este estímulo desaparece. 
 Posteriormente tras un tiempo de demora el sujeto debe elegir entre dos estímulos que 
se le presentan cual es igual al que se presentó en el primer ensayo (debe recordarlo). 
También se utilizan tareas de orientación espacial (laberintos en T y radiales) 
 
 
Retención a corto plazo (MCP) 
Depende de: 
• La duración y la demora: del estímuo de muestra y de la aparición de los estímulos tras 
el intervalo de demora. 
• Codificación prospectiva (que respuestas debe realizar) y retrospectiva (recordar las 
características del estímulo). 
• Repaso: mantener activa la información expuesta al sujeto. Sino la huella decae con el 
tiempo. 
• Olvido dirigido. 
• Análisis teórico. 
 Roberts and Grant estudiaron este fenómeno con palomas, variando en función de los 
grupos el tiempo de exposición a la muestra. La retención de la información se medía en el 
porcentaje de respuestas correctas dadas tras el mismo intervalo de demora. 
 
 Grant estudio los efectos de la demora (manipulando el intervalo de demora) en 
laberintos en forma de T para ratas. Quería medir la posible persistencia o decaímiento de la 
información en la memoria. La fase de retención de la información se realizaba en el mismo 
recinto. Estableció dos grupos de ratas, el grupo 2 al cual impediría repasar “el espacio” 
apagando la luz del recinto y el grupo 1 el cual podría ver el recinto durante el intervalo de 
demora. 
 Así fue que obtuvo unos resultados sorprendentes: las ratas del grupo 1, a mayores 
intervalos de demora, recordaban peor (a pesar de poder repasar visualmente) y las ratas del 
grupo 2 cometían menoserrores en intervalos más largos. Este fenómeno puede explicarse en 
términos de le interferencia de información. 
 La retención a corto plazo también se estudió en laberintos radiales, combinando los 
ensayos forzados con los ensayos libres. Primero se obliga al animal a ir a determinados brazos 
y tras varios ensayos se le deja entrar en cualquiera de ellos. Se consideran respuestas 
correctas cuando el sujeto evita ir a aquellos brazos donde ya obtuvo comida con anterioridad, 
pues recuerda donde la ha consumido ya. 
 
 Posteriormente se estudian los efectos de la variación del intervalo de demora entre los 
ensayos forzados y libres para ver cual es su alcance sobre las respuestas correctas. Se obtuvo 
que a mayor intervalo de demora aumentan las respuestas incorrectas por el decaímiento de la 
huella de la información en la memoria provocado por el paso del tiempo. 
Teorías de la codificación de la información 
 Un punto importante en la memoria es la forma en la que se codifica la información. 
Hay dos tipos de codificación: 
 En técnicas de igualación a la muestra la codificación retrosprectiva consiste en el 
repaso de las características a recordar, en función de las cuales se realizara la acción y la 
codificación prospectiva se corresponde con una antelación que realiza el sujeto de la acción 
que va a realizar. La ejecución es mucho mejor cuando las características a recordar son iguales 
a las del estímulo que se presentará mas adelante (color y color o lineas y lineas). 
 Condicionamiento operante: el término fue utilizado por primera vez por Skinner para 
descibrir aquellas respuestas que operaban sobre las conductas de los individuos para 
conseguir un fin. 
 Condicionamiento instrumental: Término acuñado por Marcur para referirse a 
situaciones en las que el individuo se tiene que mover para realizar una acción o escapar de 
una consecuencia. 
 
 Algunas cuestiones sobre la MCP en animales surgen en torno a si en ellos el repaso 
tiene carácter atutomático o deliberado. En humanos sabemos que el repaso es consciente , 
pero ¿puede controlarse externamente? Sí, la mécanica con la que se produce puede 
interrumpirse en cualquier momento. 
 En humanos, por técnicas de igualación a la señal podemos favorecer el repaso dando 
una pista previa al comienzo del experimento: recuerda el estímulo señal porque te servirá más 
adelante. (Clave recuerdo) 
 sin embargo también existen las claves de olvido que logran el resultado contrario: Se 
le hace pensar al sujeto que la señal no será de utilidad en el futuro (no la recordará). Por 
ejemplo tras la fase de entrenamiento: se enseña al sujeto a recordar la señal con normalidad, 
se vienen unos ensayos análogos con la diferencia de que ahora el repaso de la señal es 
interrumpido por la clave de olvido y el sujeto tiene dificultades para retener la información. 
 Se procedió despues a variar otro factor dentro de este paradigma, dando con lo que 
llamamos olvido dirigido. Se establecieron tre grupos de sujetos: 
1: la clave de olvido se presentaba solapada con la muestra 
2: la clave de olvido se prsentaba 2 seg despues de la finalización de la muestra 
3: la clave de olvido se prsentaba 3,5 seg despues de la finalización de la muestra 
 
 Los resultados obtenidos para cada grupo fueron: 
1: gran diferencia entre los grupos con claves de olvido y recuerdo. Los de recuerdo casi 
lograron la totalidad de respuestas correctas. 
2: Las elecciones mejoraron para los de la clave de olvido pero seguían con grandes dferencias 
respecto a los de recuerdo. 
3: a penas hay diferencias entre los grupos. 
 Esto refleja el efecto variable dependiente de cuando se produce la clave de olvido. 
Retención a largo plazo 
 Un tipo de información retenida a largo plazo es la memoria episódica. Los estudios de 
la memoria a largo plazo se han realizado en animales y tiene gran importancia S. Sheffleworth 
(etóloga que simulaba el hábitat de los animales). 
 En un determinado experimento se presentaba a los animales una serie de manchas de 
tinta negra y al cabo de un tiempo se repetía el ensayo. El 60/70% de los animales respondían 
correctamente. Es decir reconocen cuales son los estímulos positivos y cuales negativos y que 
parejas han sido reforzadas. Desmuestran entonces que se puede almacenar información a lo 
largo de mucho tiempo. 
 Los estudios realizados con la rana africana con pies de garra para comprobar el 
alcance de la MLP eran en la línea de la evitación. Se sometía a ranas a entrenamientos de 
evitación de una descarga. 
 
 
 
Tras determinados ensayos en una caja de evitación aprendieron que en el compartimento 
oscuro recibirían una descarga y aprendieron a saltar al otro para evitar diche situación 
aversiva. 
Se realizó el mismo experimento con renacuajos de la misma rana y se les volvió a someter al 
ensayo de adultos. Las ranas evitaron igualmente el compartimento oscuro. A pesar de la 
enorme transformación física que habían sufrido la codificación de la información y su retención 
era la misma. 
 
 Tomás y Lopez realizaron un experimento en el que el entrenamiento consistia en que 
si la paloma picoteaba una en presencia de una luz obtendría un reforzador. Esta luz tendría 
500 nm. Se midió cual era la generalización de la luz hecha por las palomas según el paso del 
tiempo. 
Se dieron cuenta que a medida que pasaba el tiempo la respuesta se generalizaba más y más. 
Estimación del tiempo 
 Los animales estiman el tiempo al igual que nosostros, de modo que en tareas de 
condicionamiento instrumental con programas de reforzamiento de intervalo, las respuestas 
tras varios ensayos se ciñen a los intervalos de reforzamiento en función de los estimulos del 
ambiente. 
 En el expreimento, una rata debe responder a los 30 s de la presentación de una luz 
con unas características sensoriales determinadas. En los primeros ensayos responde durante 
todo el intervalo. Pero a medida que avanza en el condicionamiento se reduce la respuesta que 
se ciñe a los 30 segundos. 
 Existe también una modalidad de condicionamiento que recibe el nombre de 
condicionamiento temporal (el refuerzo llega cada cierto interalo de tiempo, sin la presencia 
de estímulos específicos). La frecuencia de la RC coincide con el intervalo del reforzamiento. 
 En este gradiente de generalización de la respuesta, el pico se corresponde con el 
momento de máxima respuesta que coincide con la duración del intervalo de reforzamiento (30 
seg). 
Modelo de medida del tiempo 
 La tarea de dmedición del tiempo la realizan tanto animales como humanos. El Reloj 
biológico funciona como mecanismo que es producto de impulsos que se acumulan en el 
acumulador. En cada ensayo que el sujeto es expuesto al mismo estímulo, esta información es 
procesada por la memoria a corto plazo. Luego las respuestas dadas y sus consecuencias son 
definidas en la memoria a largo plazo. El tercer mecanismo es el comparador, donde si los 
estímulos recibidos son los mismos que los codificados se expresará la respuesta almacenada 
en la MLP (clara diferenciación entre MCP -estímulo presente que hace recordar lo asimilado por 
la MLP- y la MLP -codificación de la relación: E-R-) 
 Se entregará la recompensa a los 50 segundos, pero antes de ello se presenta una luz 
durante 10 segundos. Durante los 10 segundos de presentación del estímulo el reloj se detiene 
por lo que en realidad el intervalo es de 60 segundos. El animal se da cuenta de la relación E-R 
cuando el estimulo está presente. (la grafica tiene los ejes girados). 
Aprendizaje de conceptos naturales y abstractos 
 En este tipo de tareas al sujeto se le expone a una pruebad de condicionamiento 
instrumental, con una palanca y determinadas imágenes de diferentes categorías. Se le 
presentan pares de estímulos E+ y E-. Por ejemplo el E+ siempre se corresponde a la categoría 
de roble y la E- a otra distinto (por ejemplo una ramade olivo silvestre). En el segundo ensayo 
se le presentan distintas imágenes de hojas y si la elección de la imagen corresponde con la 
categoría de roble (anteriormente definida como E+) se recoge como respuesta correcta. 
 Los sujetos clasifican los estímulos y y categorizan en función del estímulo que se les 
presentó al principio como positivo. 
Teorías de categorizaciónemitirse. 
 
 -Nivel Neuronal: 
 “Tipo particular de plasticidad cerebral, un cambio en la eficacia de las conexiones 
 entre neuronas debido a la experiencia” ENFOQUE DE LAS NEUROCIENCIAS 
 (Kolb, 1995) 
 “Modificación del peso de las conexiones excitatorias y/o inhibitorias según ciertas 
 reglas o algoritmos” ENFOQUE CONEXIONISTA (Rumelhart, 1992) 
 -Aprendizaje como cambio en las conexiones neuronales. 
 - Eric Kandel (1929) recibió el premio nobel por sus estudios de los fenómenos 
 asociativos y no asociativos a nivel neural: Sensibilización y 
habituación. 
 -La presentación repetida de un estímulo puede provocar tanto disminuciones 
 como incrementos en la respuesta: 
 -Las disminuciones de la tendencia a responder producidas por la 
 estimulación repetida reciben el nombre de efecto de 
HABITUACIÓN. 
 -Los incrementos de la tendencia a responder se llaman efecto de 
 SENSIBILIZACIÓN. 
2. Teoría actual del aprendizaje asociativo 
 Procesos de Condicionamiento: 
 “Mecanismos para la detección e inferencia de las relaciones estructurales del 
 ambiente, mayoritariamente causales, que determinan la conducta adaptativa“ 
 -Dickinson 1980 
 Aprendizaje: Mecanismo de adaptación biológica 
 Para alimentarse, eludir los depredadores o reproducirse los animales están 
 equipados con mecanismos fisiológicos y motores que satisfacen dichas 
 funciones; sin embargo, no son suficientes en sí mismos para sobrevivir; es 
 necesario localizar los alimentos, saber dónde acechan los depredadores o cómo 
 atraer a una pareja sexual. Estas funciones se pueden promover mediante los 
 procesos de condicionamiento y aprendizaje. 
 La realización de conductas adaptativas y la anticipación de hechos biológicamente 
 relevantes (comida, por ej.) del entorno requiere la capacidad de aprendizaje. Estas 
 adaptaciones al ambiente son tan esenciales para la supervivencia del individuo como 
 lo son los procesos fisiológicos de la respiración o la digestión. 
 Michael Domjan , 1999 
 Los procesos adaptativos se pueden promover a partir de procesos de 
condicionamiento y aprendizaje. 
Variedades y tipos de aprendizaje: 
 Naturaleza de los eventos: 
 Aprendizaje de estímulos: Condicionamiento clásico 
 Aprendizaje de respuestas: Condicionamiento instrumental 
 
 Aprendizaje conductual y cognitivo: 
 Conductual: cambios en la conducta manifiesta 
 Cognitivo: adquisición y almacenamiento de información en la memoria 
Tipos de asociaciones: 
 Naturaleza de los eventos: 
 Aprendizaje de estímulos: Condicionamiento clásico (Pavlov) 
 Aprendizaje de respuestas: Condicionamiento instrumental (Skinner) 
 Naturaleza de la asociación: 
 Independencia: E1 / E2 
 Contingencia negativa: E1 - no E2 (relación causal negativa) 
 Contingencia positiva: E1 – E2 ( relación causal positiva) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
TEMA 2: LA CIENCIA DEL APRENDIZAJE 
1. Conductas refleja y sus propiedades 
Conducta refleja: Expresión de un conocimiento instintivo. Un reflejo implica dos hechos: un 
estímulo elícitante y una respuesta específica (estrechamente relacionados). 
Adaptación biológica y selección natural. 
 Dos especies de ratones de campo presentan conductas instintivas diferentes. Aquellos 
que viven en áreas abiertas, donde es fácil para un depredador vislumbrarlos, construyen 
madrigueras con muchas salidas y túneles para en caso de ser perseguidos tener más 
posibilidades de escapar del depredador. Sin embargo, los que viven en áreas boscosas dónde 
es más difícil para los depredadores identificarlos, construyen madrigueras más simples, de un 
solo túnel. Si se cruzan ambas especies tendrás descendencia que sólo haga de un tipo 
determinado de madriguera, pero si se cruza uno de los ratones de la 2ª generación con uno de 
la 1ª, la descendencia de éstos realizará el mismo tipo de madrigueras que realiza el progenitor 
de la 1ª generación. 
Fuentes de conducta adaptativa: 
 -Reflejos y conducta adaptativa: Filogenia. 
 -Maduración y experiencia: Ontogenia. 
 
2. Aprendizaje no asociativo 
La estimulación repetida provoca cambios en las respuestas reflejas. 
 -Habituación: Debilitación de la intensidad de la respuesta. 
 -Sensibilización: Aumento en la intensidad de la respuesta. 
Aprendizaje y adaptación biológica 
Neofobia y aversión adquirida al sabor 
La neofobia hace relación a la fobia a lo nuevo (en situaciones nuevas se presentan 
mayormente respuestas de rechazo), y esta relacionada con la aversión al sabor, porque la 
primera vez que cualquier animal toma un alimento nuevo, prueba muy poco o lo rechaza. 
 Ejemplo:a una rata sedienta le ofrecemos dos soluciones, una dulce (con sacarina) y 
 agua. Como la solución dulce se trata de un sabor nuevo preferirá agua, dicha 
 respuesta es adaptativa (prefiere lo habitual). Si solo probara la solución dulce y no 
 tuviera consecuencias negativas se reduciría la neofobia (respuesta de rechazo). 
Territorialidad y reproducción 
Hace referencia a la conducta de defensa del territorio (como vemos en peces y mamíferos) 
como mecanismo de supervivencia. 
 Ejemplo: el macho que mejor defienda el territorio será el que conquiste a la hembra, 
 por ello está relacionado con la reproducción. 
La reproducción es una conducta refleja que puede variar con la experiencia. 
 
3.Mecanismos reflejos: 
Adaptación conductual básica: bacterias, protozoos, plantas... 
 geotropismos (movimiento de un organismo como respuesta un estímulo de la 
 gravedad -crecimiento de las raíces de las plantas-), fototropismos (respuesta de un 
 vegetal al estímulo lumínico), heliotropismos (orientación del tallo, flor y hojas hacia la 
 luz del sol) 
 taxias (directos, movimiento direccionado de un ser vivo hacia un estímulo), kinesias 
 (indirectos, cambios en la velocidad del movimiento por motivo de un estímulo) 
 sueño de las hojas (por las noches las mimosas se cierran) 
Respuesta refleja: Aquella de carácter involuntario e instintivo. Es producida por un conjunto 
de estímulos determinados que estimulan a nuestras neuronas sensitivas, que envían la 
información al cerebro y posteriormente las neuronas motoras producen una respuesta. Una 
estimulación repetida de las neuronas sensoriales produce un cambio en la plasticidad del 
espacio interneuronal que debilita el efecto de la respuesta (habituación). 
Clases de reflejos (fácil identificación del estímulo): 
 reflejos motores: postural, palpebral, sobresalto, succión, oclusión respiratoria 
 reflejos sensoriales: pérdida equilibrio, contracción pupila 
 reflejos digestivos: salivación, náuseas 
 regulación térmica: sudoración, aumento térmico 
 reflejos del sistema inmune: liberación histamina, inmunosupresión 
Conducta instintiva: Patrones de respuestas reflejas con estímulos más difíciles de identificar. 
Las características esenciales para la aparición de la respuesta son difíciles de identificar. 
Patrones de acción modal (pautas de acción fija) 
 Ejemplo: si a un ganso le ponemos un huevo fuera de su nido, esto provoca una 
 conducta instintiva que consiste en que el ganso estira el cuello y coge el huevo para 
 llevarlo al nido. 
A los estímulos que desencadenan respuestas instintivas, se les llama estímulos señal o 
desencadenantes. 
Estas forma de conducta es susceptible al cambio, debido a la frecuencia, intensidad… 
El estudio del aprendizaje no asociativo estudia las modificaciones de la conducta refleja por 
la experiencia repetida. 
 Tras un experimento que estudiaba la expresión de la respuesta de sobresalto en una 
rata frente a un estímulo sonoro se determino que cuántos más experimentos se realizaban, más 
se reducía la intensidad de esa respuesta. (Habituación) 
 La sensibilización por su parte correspondería al aumento en la disposición de un 
organismo a ofrecer una respuesta a medida que se repite la experiencia. 
 Los mecanismos de sensibilizacióny habituación ayudan a canalizar la conducta dando 
respuesta sólo a los estímulos relevantes. 
 
 
 
A veces previo a la habituación se aprecia un proceso de sensibilización, como en el caso 
anterior. 
4.Factores: 
 Existen una serie de factores que afectan al cambio en la intensidad de ofrecimiento de 
una respuesta por parte del sujeto. 
 -La intensidad de los estímulos: provoca una mayor o menor velocidad en la 
 habituación a los estímulos. 
 
 -La duración de la estimulación: afecta de forma parecida. 
 -La frecuencia de presentación del estímulo: Si es a largo plazo la habituacion será 
 más lenta, pero estará presente por más tiempo (memoria a largo plazo). Si es en 
 intervalos muy pequeños de tiempo la habituación será más rápida pero estará 
 presente por menos tiempo (memoria a corto plazo). 
 Si tras un proceso de habituación y dejando lugar a un espacio prolongado de tiempo 
antes de volver a repetir la experiencia, se volverá a producir la respuesta. Este fenómeno 
recibe el nombre de recuperación espontánea. 
Procesos de deshabituación 
 Estímulo extraño: Si se realiza una experiencia hasta el punto de habituar al sujeto a 
 un estímulo y después se presenta el estímulo precedido de otro extraño, se 
 recuperará la respuesta. 
 Especificidad contextual: Si la habituación se produce en un contexto determinado, 
al cambiar de contexto (estímulos contextuales diferentes) y repetir la experiencia, 
 reaparece la respuesta. (El contexto permite recuperar mejor la información aprendida). 
 Frecuencia de la estimulación: Si se repite la experiencia de forma masiva (alta 
 frecuencia), tras un intervalo de no exposición, al repetir la experiencia el sujeto 
 presenta la respuesta con una alta intensidad (mayor recuperación espontánea). El 
 sujeto tarda menos en habitçuarse pero esta habituación permanece menos tiempo 
 (memoria a corto plazo). En cambio si repetimos la experiencia de forma espaciada 
 (baja frecuencia), tras el mismo intervalo de no exposición al estimulo, cuando 
 repetimos la experiencia el sujeto muestra una respuesta de menor intensidad (menor 
 recuperación espontánea). En este caso la habituación permanece más pero el sujeto 
 tarda más en habituarse. 
Análisis teórico: 
 Se proponen una serie de posibles causas que contradicen a la habituación como 
proceso de aprendizaje no asociativo. Uno de ellos sugiere que la deshabituación puede 
producirse, bien por fatiga motora o adaptación sensorial al estímulo (pero ambas hipótesis 
fueron desechadas con la prueba de la especificidad contextual y del estímulo, si el sujeto se 
encontrara verdaderamente cansado no presentaría la recuperación espontánea en ninguno de 
los dos casos). 
 -Adaptación sensorial: disminución de la sensibilidad de los órganos de los sentidos 
 frente a la estimulación. 
 -Fatiga motora: agotamiento muscular que impide la presentación de una respuesta. 
 -Habituación: mecanismo por el que se deja de emitir una respuesta a pesar de ser 
 capaz a realizarla por detectar el estímulo como irrelevante. 
 La Tª del doble proceso de Grooves y Thompson dicta que las sensaciones 
responden a una situación de estado y por lo tanto la habituación obedece al intento de hacer 
eficaz la respuesta. 
 El modelo de los procesos oponentes de Salomon y Corbit, dice que en el 
aprendizaje no asociativo, lo que se memoriza son las emociones y todo aquello de carga 
afectiva. Pero durante la experiencia repetida, el estímulo cambia de significado emocional y 
eso varía la expresión de la respuesta. Desarrollaron un patrón de dinámica afectiva que tiene 
aplicaciones en la comprensión de conductas adictivas y se basaba en que los estímulos 
evocan una serie de emociones (reacción afectiva primaria positiva/negativa, estado A) y 
dependiendo de la naturaleza e intensidad del estímulo provocará, despues de la estimulación 
una reacción afectiva opuesta (reacción afectiva secundaria negativa/positiva). Si la respuesta 
presentada por el sujeto varía en magnitud, su reacción afectiva primaria también lo hace. 
 
 
 
 
 
 
Primera exposición 
 
Varias exposiciones 
Cuando presento un estímulo muchas veces disminuye esa reacción primaria o estado “A” del 
que hablamos, y por el contrario aumenta la reacción secundaria en amplitud y duración. 
 
Respuestas condicionadas Compensatorias (Siegel)
 
 Si a un sujeto le suministramos morfina, esta sustancia le provocará un efecto 
analgésico, pero después que se termine este efecto el organismo dará lugar a una respuesta 
compensatoria (como en la Tª de Salomon y Corbit) con el objetivo de contrarrestar la acción 
de la morfina, la hiperalgesia 
 La hiperalgesia es una respuesta compensatoria condicionada, porque el sujeto, la 
experimentará estando en ese contexto, al asociarlo con la inyección de morfina. 
 Cualquier droga (considerada como estímulo) produce unos efectos psicológicos (a 
modo de respuesta compensatoria) que se relacionará con el contexto habitual de 
consumición. Es decir, la tolerancia, se desarrolla por lo tanto en un contexto determinado. Por 
eso, la muerte por sobredosis es común entre personas que se suministran cantidades de 
drogas incluso inferiores a la consumida habitualmente en contextos distintos al normal. 
Este experimento, mide la mortalidad porcentual de tres grupos de ratas a las que el décimo 
día se les inyecta una cantidad mortal de heroína. El grupo IGUAL se desarrolla en el mismo 
contexto, con nueve días previos de consumición de la droga. El grupo DIFERENTE replica el 
experimento con la salvedad de que el décimo día se cambia el contexto físico de las ratas. El 
grupo CONTROL cuenta con 9 días de no consumición, previos a la inyección. 
5. Habituación como aprendizaje asociativo 
Modelo SOP (Sometimes opposite proccess) de Wagner (1974) 
 Sabiendo que tras un proceso de habituación que presenta una frecuencia masiva de 
la estimulación, retenemos la información en la memoria a corto plazo y al contrario en uno 
de frecuencia espaciada lo hacemos en la memoria a largo plazo, vamos a definir ambos 
términos: 
Memoria a corto plazo (o de trabajo): retenemos información el tiempo justo para su uso. 
Memoria a largo plazo: retención de información de forma prolongada. 
 Wagner alude a la idea de que la retención en la memoria de la información depende 
del proceso de esta información en la memoria a corto o largo plazo. 
 
 El registro sensorial procesa la información en la MCP o memoria activa, mientras es 
necesaria para su uso (si queremos acordarnos durante unos minutos de un número de 
teléfono, ponemos en marcha la memoria a corto plazo y lo repetimos una y otra vez hasta que 
encontramos el móvil y lo marcamos), si se repite la experiencia y es varias veces requerida, 
se procesará en la MLP o memoria inactiva o latente. Sin embargo, para evocar esta 
información almacenada en la MLP hay que llevarla a la MCP (puesto que, la información de la 
memoria a largo plazo, es aquella que se encuentra de forma latente y no está en uso 
constante). 
Activar la información que contenemos en la MLP, se consigue mediante la repetición, el 
repaso… 
Después del análisis sensorial, el comparador filtra la información que se quiere utilizar. Este 
filtro tiene una función muy importante, puesto que, no sería útil procesar toda la información si 
es que no la vamos a emplear. 
El mecanismo de activación de la memoria funciona de dos maneras: por la exposición al 
mismo estímulo que permite evocar la información (activación autogenerada relacionada 
con la habituación a corto plazo) o por la presentación de un elemento relacionado con lo 
almacenado (representación generada asociativamente relacionada con la habituación a 
largo plazo). 
 Es decir, para activar la memoria a largo plazo hay que recurrir a la asociación. 
 La Tª de Wagner interpreta la asociación contexto-estímulo, se aprede sobre las 
característicasfísicas de un estímulo (si es lumínico, sonoro...), las consecuencias que 
prooduce (si es irrelevante no tengo por qué reaccionar), conocimiento porcedimental del 
estímulo (como reaccionar). La memoria a largo plazo por lo tanto está relacionada con el 
contexto, si se cambia de contexto no se recupera la información, se interpretará la 
estimulación como un proceso novedoso, si es el mismo contexto, si se recuperará. 
Aprendizaje no asociativo y plasticidad nerviosa 
El Profesor Eric R. Kandel trabajó con un invertebrado llamado “Aplysia California”. Lo eligió 
porque quería estudiar el circuito neuronal de la forma más simplificada posible. 
 La Aplysia, tiene 36 ganglios, de tal manera, que podían rastrear qué sucede desde que 
se presenta un estímulo novedoso hasta que se habitúa a este. 
 Cuando le presentamos un estímulo (pincharle en la cola o la cabeza) hay una retracción 
de la branquia (respuesta refleja), y por ello, es observable como se habitúa a dicho estímulo. 
Los factores que intervienen en la retracción de la misma son: 
-Intensidad. 
-Frecuencia... 
 Además la experiencia, no solamente cambia la funcionalidad de las neuronas (la 
conducta), sino que también las cambia estructuralmente. 
 La branquia está controlada por una serie de neuronas motoras. Cuando se estimulan 
las neuronas sensoriales se activan estas neuronas motoras, a través de las interneuronas. Pues 
bien, cuando se estimulan muchas veces, hay un cambio en la eficacia de la transmisión química, 
es decir, en los neurotransmisores. 
Hay una fuerte correspondencia, por tanto, entre el cambio conductual y el cambio de la actividad 
eléctrica. 
Kandel afirma, que el proceso de la disminución gradual de respuesta, obedece a una 
disminución de la transmisión sináptica. Tras una estimulación repetidase produce una depresión 
de la transmisión sináptica entre neuronas sensoriales y motoras (menos liberación de glutamato 
en las neuronas presinápticas). La estimulación repetida de las neuronas sensoriales provoca 
una reducción del potencial de acción de las neuronas motoras. 
 
En la habituación: hay menos neurotransmisores, lo que provoca menor actividad de las 
neuronas motoras y esto genera una menor respuesta. 
En la sensibilización: se producen el llamado potencial excitatorio, es decir, un incremento en 
la liberación de neurotransmisores (facilitación presináptica). 
Proceso dual de la sensibilización y habituación 
 Supone que existen procesos neuronales subyacentes responsables de los aumentos 
y disminuciones de la disposición de un individuo para responder a un estímulo. 
 Un tipo de cambio en el sistema nervioso produce una disminución de la capacidad del 
estímulo para producir una respuesta. Sería el proceso de habituación. Groves y Thompson 
suponen que el proceso de habituación tiene lugar por modificaciones en lo que llamaron el 
sistema E-R 8puede considerarse igual que el arco reflejo). Este sistema se activa cada vez 
que un estímulo produce una respuesta porque es el sistema que conduce los impulsos 
nerviosos sensoriales hasta las neuronas motoras. 
 Por otro lado el segundo tipo de cambio provocaría un aumento de la disponibilidad del 
sujeto a responder al estímulo (proceso de sensibilización) y sería provocado por cambios en 
el llamado sistema de estado, que determina a nivel general el grado de sensibilidad del 
organismo. El sistema de estado interviene solo en situaciones especiales como un estímulo 
extraño o relativamente novedoso, con la aparición repetida de un mismo estímulo de gran 
intensidad (se sensibiliza)... 
 El resultado de la conducta en neto, sería el resultado de la suma de las dos curvas 
que dibujaría la influencia del estímulo sobre el sistema E-R y el de estado. Sufriendo mayor 
influencia de aquella que se vea más afectada. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
TEMA 3: FUNDAMENTOS DEL CONDICIONAMIENTO 
 Este tema es una introducción general a dos temas que veremos después: el 
condicionamiento clásico (tema 5) y el condicionamiento instrumental (tema 6). Ambas 
novedades del condicionamiento son variedades del aprendizaje asociativo, por lo que 
comparten propiedades: método de estudio, dimensiones conductuales… Los dos son 
aprendizajes asociativos, la diferencia es en cuanto a qué elementos participan en esas 
asociaciones (elementos que se asocian). Este tema no alude al condicionamiento clásico o al 
instrumental, es general (común a todas las variedades de condicionamiento). Procedimientos 
apetititos/aversivos dependiendo de la naturaleza del EI. El condicionamiento detecta en el 
ambiente estímulos que puedan ser causas potenciales (detectar causas-efectos). 
1. Condicionamiento clásico 
 Pavlov y los reflejos condicionados 
 El condicionamiento clásico es un mecanismo de aprendizaje que nos permite predecir 
hechos biológicamente relevantes en nuestro entorno (comida, un peligro inminente) y 
anticiparnos a su aparición mediante la realización de respuestas adaptativas de carácter 
reflejo. 
 Pavlov estaba investigando los procesos de digestión (pretendía analizar la salivación 
de los perros cuando se les proporcionaba comida). Descubrió que los perros, una vez 
acostumbrados a la situación experimental, no esperaban a salivar cuando tenían la comida en 
la boca sino que el proceso de salivación comenzaba en cuanto se les exponía a estímulos 
propios de la situación experimental (como verle a él). Así, supo detectar un fenómeno mucho 
más interesante que analizar y cambió el rumbo de su investigación. De hecho, dedicó el resto 
de su trayectoria investigadora al estado de lo que se conoce como aprendizaje por 
condicionamiento. El condicionamiento clásico es el método por el cual al presentar un 
estímulo previamente neutro en contigüidad espaciotemporal con otro estímulo capaz de 
suscitar una respuesta a de manera innata (respuesta refleja), el primer estímulo queda 
asociado con el segundo de tal forma que acaba siendo capaz de suscitar por si solo dicha 
respuesta. 
 Pavlov proporcionaba comida a sus perros hambrientos, lo que producía una respuesta 
refleja de salivación (respuesta fisiológica). Luego el primer elemento consustancial son los 
estímulos del ambiente que producen sin experiencia la reacción del organismos (estímulo 
incondicionado, sin mediar experiencia). Estos estímulos producen una reacción refleja de tipo 
nervioso acorde con el acontecimiento. La respuesta refleja de salivación frente a estos 
estímulos es respuesta incondicionada. Pavlov constata que la respuesta refleja comienza a 
producirse también ante estímulos del ambiente que preceden a la comida. Esos estímulos 
(luz, tono…) son estímulos neutros o arbitrarios porque no median en la salivación. Estos 
estímulos que adquieren propiedad condicionada son estímulos condicionados. 
 La condición es que el estímulo condicionado (EC) y el estímulo incondicinado (EI) 
estén ligados temporalmente. Lo que constata es que los estímulos condicionados (EC) 
adquieren por la experiencia repetida también, una capacidad de respuesta análoga a la 
respuesta incondicionada (RI). Llamó a esto conexión nerviosa temporal. 
 Elementos del paradigma de condicionamiento clásico 
• EI> estímulo incondicionado (cualquier acontecimiento capaz de provocar una 
respuesta refleja específica en el organismo). 
• EC> estímulo condicionado (estímulo que por asociación con un EI es capaz de provocar 
una respuesta que antes del entrenamiento no provocaba). 
• RI> respuesta incondicionada (respuesta que se emite de forma automática ante la 
presencia de un determinado EI). 
• RC> respuesta condicionada (respuesta provocada por el EC tras la asociación. En 
ocasiones RC y RI son distintas. 
 Cuando se asocia un EI con un EC, la presentación del EC provocará una respuesta 
análoga a la RI, llamada RC. La RC no siempre va en la misma dirección que la RI, a veces, vaen la dirección contraria (por ejemplo la respuesta condicionada compensatoria). 
 Métodos de estudio del condicionamiento clásico 
 
 a)Salivación > En el ejemplo de la salivación del perro: condicionamiento de la 
respuesta de salivación (de tipo apetitivo porque evoca una respuesta relacionada con la 
comida) 
 b)Automoldeamiento> En el otro ejemplo, observamos el fenómeno de 
automoldeamiento. Hay dos estímulos. Aparece la luz de colir rojo y recibe comida (se 
condiciona este EC al EI). El estímulo provoca la respuesta condicionada. El otro estímulo (luz 
gris) no da comida. ¿Cuál es la respuesta refleja que provoca en un animal hambriento? 
Conducta de aproximación. Después de hacer varias veces esto, observamos que tras 
presentar la luz roja se acerca y coge la comida pero también se da la respuesta condicionada 
que es picotear la luz roja (RC). Este es el otro ejemplo de paradigma apetitivo que se llama 
automoldeamiento. El efecto principal de la experiencia es que un estímulo neutro que antes 
no daba respuesta, ahora provoca un aumento de respuesta. 
 Justo antes de la presentación del EI (comida) se encendía un disco luminoso (EC). 
Así, el EC adquiría la propiedad de informar sobre la disponibilidad de la comida (la comida era 
proporcionada independientemente de las respuestas de la paloma) Se observó un fenómeno 
curioso: en vez de acercarse directamente al plato cuando veían la luz, las palomas 
comenzaron a picotear primero el disco cuando este se encendía (incluso bajo el riesgo de no 
llegar a tiempo a por la comida) Esta es una prueba de la atracción que ejercen las señales 
condicionadas clásicamente cuando el premio es la comida. Los acontecimientos que predicen 
un suceso relevante estimulan una conducta de seguimiento debido a su significación 
informativa. Esto también ocurre en humanos (por ejemplo cuando estamos en un ascensor y 
vamos siguiendo los botones que se iluminan indicando el piso por el que pasamos a pesar de 
que el hecho de que miremos fijamente no hará que lleguemos antes a donde queremos. 
 
 c)Condicionamiento de la respuesta palpebral> Los estímulos desagradables 
producen huída, evitación. El experimento arriba ilustrado se lleva a cabo con un conejo. 
Siguiendo el sonido se le aplica una descarga eléctrica o una corriente de aire frío (carácter 
aversivo). Se produce una reacción refleja de parpadeo. El conejo tiene varios párpados 
(membrana nictitante). Tras el condicionamiento del sonido y la descarga o corriente, si se 
presenta solo el sonido, el conejo parpadea. El EI sería el soplo de aire en la superficie del ojo 
o la breve descarga en el párpado inferior. La RI sería el parpadeo (parecida a la RC) y el EC 
será el tono que le indica que habrá una descarga. 
 
Siguiendo un ejemplos los parámetros podrían ser: 
 -Duración (EC breve, por ejemplo 500 msegundos) 
 -Latencia de R (muy breve ( ¿Qué son los estímulos fóbicos? Los que provocan 
miedo o ansiedad. El miedo es una conducta o respuesta (emoción) con distintos componentes 
para escapar de los estímulos fóbicos y así sobrevivir. El miedo se mide observando los 
efectos que tiene sobre el condicionamiento intrumental. Los procedimientos apetitivos 
provocan aumento de la respuesta. Los aversivos no necesariamente provocan reducción de la 
respuesta (más bien aumento) en el ejemplo del conejo, el parpadeo no se elimina sino que se 
incrementa. Tanto en condicionamiento aversivo como apetitivo puede haber disminución o 
aumento de la respuesta dependiendo de la situación. En el miedo hablamos de la supresión 
condicionada de la respuesta instrumental, que estima como afecta al miedo a la realización de 
tareas cotidianas (respuestas instrumentales). Previamente se produce un condicionamiento 
instrumental, se le enseña a una rata a accionar una palanca para obtener comida. Se asocia 
posteriormente por condicionamiento clásico un EC (luz o tono) a un EI aversivo (descarga 
eléctrica). La RI será la respuesta de miedo, huida o evitación y el EC es la luz o tono que le 
indica la sucesiva descarga. Lo que nos interesa aquí es ¿Cómo medimos el grado en que 
hemos conseguido condicionar la respuesta de miedo ante el EC (luz, tono)? Utilizamos un 
método indirecto llamado supresión condicionada de la respuesta instrumental. La supresión 
condicionada es un índice que nos informa sobre el grado en que un estímulo condicionado al 
miedo altera la actividad que esta llevando a cabo el animal. 
 Es un proceso que mide los efectos del miedo sobre el condicionamiento instrumental y 
la presentación de la respuesta instrumental. Para ello se comparan el Nº de veces que se 
presenta la respuesta en presencia del EC (asociación aversiva) con las veces que se presenta 
la respuesta instrumental cuando no esta presente el EC (ambos períodos de tiempo deben ser 
iguales). 
 
 Ejemplos: 
 RS: 6/12= 0,5 (Ausencia de condicionamiento/ de supresión de la respuesta instr.) 
 RS: 0/6= 0 (Máximo miedo, aprendizaje, condicionamiento) 
 El máximo de miedo será el valor 0 (máximo condicionamiento) y la ausencia de 
miedo el valor 0,5. La razón de supresión mide el C.C. aversivo aunque se mide a través de RI. 
Elimina la variabilidad entre sujetos porque incluye en número de respuestas en ausencia del 
EC. 
“La técnica de supresión condicionada de la respuesta instrumental se emplea para 
medir...” 
 a) Condicionamiento clásico 
 b)Condicionamiento instrumental 
 c)Ambos 
 d)Ninguno 
 
 
 e)Aprendizaje de aversión al sabor> En un animal al que le damos sacarina y se 
siente mal por haber consumido mucho se da una devaluación afectiva de ese alimento. Hay 
una respuesta de rechazo por parte de la rata. Si le volvemos a dar, ella lo rechaza (esta es la 
manifestación conductual que aprendió). 
 Tras ingerir una sustancia, inducimos en los animales un sentimiento de malestar por 
inyección de algo tóxico (LiCl). Debido a que asociación del sabor de esa sustancia (EC) con 
una experiencia de malestar (EI) adquieren una aversión (RC) a dicho sabor. Antes se pensaba 
que esta reacción no podía responder al paradigma del condicionamiento clásico al igual que la 
respuesta palpebral o la salivación porque tenía dos peculiaridades: basta un solo 
emparejamiento para adquirir la aversión al sabor y porque la demora aunque sea muy larga (y 
pasen horas entre el sabor-malestar) se produce condicionamiento. Sin embargo, esto 
responde a la importancia biológica que tiene para los animales saber que sustancias les 
resultan dañinas, por eso es un aprendizaje tan eficaz. 
2 Variedades de condicionamiento clásico 
 
 Clasificación atendiendo a dos criterios: el valor motivacional y la relación EC-EI 
(dos factores, dos variables con dos niveles). Desde el punto de vista motivacional pueden ser 
positivos o negativos, desde la relación EC-EI pueden ser excitatorios o inhibitorios. Por 
ejemplo la salivación o el automoldeamiento serían apetitivos y el condicionamiento palpebral 
sería aversivo. ¿Cuándo decimos que hay relación causal entre dos estímulos del ambiente? 
Cuando siempre que sucede uno, necesariamente aparece el otro (relación causal). 
 
 
 
 
 
 En función del valor motivacional del EI 
 Apetitivo Aversivo 
 
 
 
 
Contingenciapositiva 
El cond. 
Excit. se 
puede medir 
(cambio de 
Condicionamiento 
apetitivo excitatorio 
El sujeto piensa que el EC 
es la causa del EI. Por lo 
tanto el EC provoca una RC 
de naturaleza similar a la de 
la RI (excita una respuesta) 
Condicionamiento excitatorio 
negativo 
El sujeto piensa que el EC es la 
causa del EI. Por lo tanto el EC 
provoca una RC de naturaleza 
similar a la de la RI (excita una 
 
 
Relación 
causal o de 
contingencia 
entre el EC-EI 
magnitud de 
respuesta) 
EC>EI = Aumento de la 
respuesta 
 
respuesta, en este caso de 
evitación) 
EC>EI = Aumento de la 
respuesta de evitación 
Contingencia 
negativa 
El cond. 
Inhib. no se 
puede medir. 
Condicionamiento 
inhibitorio apetitivo 
El sujeto interpreta que el 
EC supone la posible 
retirada del EI. No presenta 
la respuesta (aprendizaje 
latente) 
EC x EI = Disminución de 
la respuesta 
Condicionamiento inhibitorio 
aversivo 
El sujeto interpreta que el EC 
supone la posible retirada del 
EI. No presenta la respuesta de 
evitación (aprendizaje latente) 
EC x EI = Disminución de la 
respuesta de evitación 
 El condicionamiento clásico permite aprender o detectar relaciones causales entre 
estímulos del ambiente. ¿Cuántos tipos de relación puede haber? 
 Uno que de lugar a otro (relación causal positiva o contingencia positiva) E1 > E2, para 
referirse a situaciones en las que tras un estímulo aparece necesariamente el otro (un 
acontecimiento predice el otro). Por ejemplo, cuando se da una relación causal positiva 
decimos que el condicionamiento resultante es excitatorio porque provoca necesidad de 
respuesta en el organismo (que será distinta según el valor del EI). El que aparece en primer 
lugar se percibe como causante del otro. Excitatorio que será aversivo o apetitivo según la 
naturaleza (según el valor motivacional del EI). Cuidado, porque con los procedimientos 
aversivos no disminuye necesariamente la respuesta (por ejemplo con el parpadeo aumenta). 
La RC en condicionamiento apetitivo sería acercamiento y la RC en condicionamiento aversivo 
sería de escape. 
 ¿Cuál es la semejanza en métodos del estímulo excitatorio apetitivo y aversivo? En 
ambos casos aumenta la respuesta, siempre hay estímulo que precede al otro. 
 
3 Procesos generales 
 
La curva de adquisición representa el aumento del aprendizaje en el condicionamiento clásico. 
Primero el aprendizaje de la respuesta aumenta considerablemente para luego estabilizarse a 
medida que se acerca a su nivel máximo (asíntota del aprendizaje). 
 Por ejemplo en el primer ensayo de la curva arriba representada se alcanza casi el 
50% del aprendizaje, en el segundo hay un aumento pero menor que el anterior y en los 
posteriores menos aún (nunca se superará el valos máximo de la asíntota). La línea crece de 
forma negativamente acelerada (siempre crece pero cada vez un poco menos). En cualquier 
proceso de condicionamiento se sigue esta línea. 
 Extinción> Si después de alcanzar la asíntota (el máximo crítico) presentamos el EC 
solo, sin el EI tiende a desaparecer (extinción), la respuesta RC ante el EC va disminuyendo 
hasta que desaparece (extinción de la respuesta condicionada, algo que es distinto al olvido 
por el paso del tiempo porque hay un aprendizaje inhibitorio por una contingencia negativa). Si 
tras un periodo de tiempo se deja de presentar el EI después del EC y una vez extinguida la 
respuesta se vuelve a presentar el EI reaparece la RC (recuperación espontánea) pero con 
menor fuerza que en el momento asintótico. Con lo cual no es un olvido permanente del 
aprendizaje y no es una vuelta al estado original. Presentaciones repetidas del EC sin el EI 
hacen disminuir la magnitud de la respuesta. La recuperación no es el máximo, es más pobre. 
 
 Recuperación espontánea> Dependerá del proceso de condicionamiento y del 
carácter del estímulo incondicionado. 
 Generalización> El sujeto no responde de forma diferenciada a ECs distintos. La 
ventaja es que economizamos en aprendizaje. ¿De que depende? Del parecido físico-químico 
entre estímulos y de la experiencia previa con los estímulos. Lo que se aprende de un estímulo 
se puede transferir a otro, por lo que dos estímulos parecidos provocan la misma respuesta. 
Depende básicamente del parecido o la proximidad (cuanto más parecido, más provoca la 
respuesta). 
Guttman y Kausch (1956) condicionaron una paloma con un EC (luz) de 180 nm. Le hicieron 
una prueba con luces de 570 y 590, observando que también había respuesta aunque menos. 
 
 La escala donde comparan las respuestas obtenidas ante estímulos semejantes se 
denomina gradiente de generalización (grado en que la tasa de RC varía al variar el parecido 
entre los estímulos y el EC original). 
 Discriminación> A la vez que generalizamos, también aprendemos a discriminar 
(responder de forma distinta a dos estímulos muy parecidos). Se logra no asociando los 
mismos EI (se llama aprendizaje perceptivo) a EC parecidos. Si nos asocian un árbol con 
comida, si ahora damos otro estímulo que comparta características con él, sin haber sido 
asociado con la comida, da la respuesta de igual manera por su pasado (en el campo de la 
generalización). Esta situación se soluciona si aprendemos a diferenciar (discriminar), proceso 
opuesto a la generalización. Aprendemos a discriminar mediante rasgos distintivos. Se produce 
cuando intercalamos el EC1 con un EC2 parecido que no va seguido del EI. Es un aprendizaje 
perceptual porque se perciben las diferencias. 
 
 La adquisición de condicionamiento depende del tiempo de comienzo del EI tras el EC 
y del sistema de respuesta (intervalo óptimo para cada sistema) y la relación de causalidad. El 
mejor método para alcanzar el condicionamiento más rápido es el demorado, el EI aparece 
inmediatamente después del cese de EC (relación de causalidad). 
 -Condicionamiento Simultáneo: EC y EI empiezan y acaban a la vez. No es eficaz. 
Solo funciona en el condicionamiento del miedo y no es lo mejor. 
 -Demorado: El EI se presenta cuando termina el EC (antes de que este acabe) Es el 
mejor para un condicionamiento, el más eficaz (se hace mejor la relación causa-efecto). 
 -Demorado (demora larga): la duración del EC es más duradera . El EI se presenta 
cuando ya llega un rato el EC (antes de que acabe) Al principio es muy efic, luego el animal 
aprende que no le hace falta prepararse hasta un rato después del EI. A esta retención Paulov 
lo llamó inhibición de demora. 
 -Huella: Una vez terminado el EC, transcurre un tiempo antes de la introducción del EI, 
es decir, el EI se presenta cuando ya ha terminado el EC (la memoria copia del estímulo que 
deja una huella en la memoria con el paso del tiempo) A veces enseña más a inhibir la 
respuesta o a retenerla que a ejecutarla. 
 -Hacia atrás: Hay otro que es hacia atrás (se presenta el EI y luego el EC poco 
después, tiene resultados ambiguos). 
 
 
 
Intervalo óptimo 
 
 Aquel que favorece el condicionamiento, el que consigue el máximo condicionamiento. 
Muy breve en respuestas esqueléticas o motoras pero en las que impliquen el SNA (tasa 
cardiaca…) suelen ser un poco mayores. Si el intervalo entre el EC y el EI es mayor que el 
intervalo óptimo, el condicionamiento va a ser muy pobre. En la respuesta de parpadeo el 
intervalo óptimo ha de ser muy bajo. 
Intensidad del EC 
 
 Si es alta la asíntota será mayor, si es baja la asíntota será menor. Observamos de 
modo general que en la curva del condicionamiento se alcanza más rápido la asíntota cuanto 
más intenso es el estímulo. Relación directa entre la magnitud del EC y el resultado. Se 
alcanza antes la asíntota cuando el EC es más intenso. Cuando hablamos de la intensidad de 
un E nos referimos a algún parámetro físico de ese estímulo. 
 
 
 
Intensidad del EI 
 
 Mismas características que el anterior. 
Naturaleza de los estímulos 
 Se relacionan ciertoshechos con ciertas consecuencias en función de los sistemas de 
defensa interno (alimentos) o externos (animales amenazantes). Si un estímulo (mal estar) es 
interno se asociará con la comida, mientras que uno externo con otro externo (descarga con 
una luz). 
4 Paradigma instrumental 
 Condicionamiento instrumental> actividad que utiliza el sujeto para obtener algo, 
 siendo los Ed los que más o menos indican las consecuencias de su conducta. 
 El condicionamiento instrumental y el condicionamiento clásico son dos variedades de 
un proceso común de asociación. En el condicionamiento clásico el sujeto es pasivo, la 
aparición de los dos estímulos (EI y EC) no dependen de lo que el sujeto haga, no es 
necesario que el sujeto realice la respuesta tras el EC para que aparezca el EI. Este aparece 
independientemente de lo que el sujeto haga, es el experimentador el que decide. La 
respuesta que realiza el individuo es consecuencia del condicionamiento. 
 En el condicionamiento instrumental depende del sujeto. Si el gato de la caja de 
Thorndike no da a la palanca, no recibe comida. Debe realizar la conducta para recibir la 
consecuencia (reforzador). El sujeto realiza la conducta instrumental en presencia de unos 
estímulos determinados llamados discriminativos que dan lugar a la obtención de varias 
consecuencias o reforzadores. Thorndike quiso estudiar la inteligencia animal. Para ello metía 
un gato hambriento en una caja problema y ponía comida fuera. La tarea del gato consistía en 
aprender a escapar de la caja para obtener la comida. Comprobó que a medida que 
avanzaban los ensayos, los gatos tardaban menos en salir. Interpretó que esa mejora era 
resultado del aprendizaje, de una asociación entre su conducta y el estímulo antecedente. 
Formuló entonces la ley del efecto que dice que si una respuesta ejecutada en presencia de 
un estímulo, va seguida de un hecho satisfactorio, la asociación entre el hecho y la respuesta 
se fortalece. Si el hecho es molesto, la asociación se debilita. 
 Estos resultados despertaron el interés de los científicos, que diseñaron nuevas 
situaciones experimentales: 
Ensayos libres (Small 1900, laberintos) Solo pueden realizar la respuesta instrumental 
una vez por ensayo. Corredor (laberinto recto) y laberinto en forma de T. 
 
 Operante libre (El sujeto puede repetir la respuesta instrumental una y otra vez) B. F 
 Skinner (1938) quería analizar en laboratorio una forma de conducta que fuera 
 representativa de toda la actividad que se produce continuamente. En la caja de 
 Skinner medimos la latencia de respuesta, magnitud… pero sobre todo la tasa de 
 respuesta. Previamente hay que definir una unidad mediable de conducta. Definimos 
 unidades de conducta en función de su funcionalidad. 
 Elementos del paradigma instrumental 
 -Estímulos discriminativos: En su presencia la realización de una conducta 
conllevará unas consecuencias (reforzador positivo o negativo). 
 -Respuesta instrumental: Acto intencional o propositivo que el sujeto realiza para 
obtener un reforzador en un contexto específico. 
 -Reforzador: Consecuencia encaminada a fortalecer la relación Ed Rins. 
 ¿Un Ec es lo mismo que un Ed? No son lo mismo. Los Ed son estímulos presentes 
en el condicionamiento instrumental que indican al individuo la relación entre la acción y sus 
consecuencias. Cuando el EC se presenta, va seguido por el EI y se presentan con 
independencia de lo que el sujeto haga. En cambio el Ed no indica que va a recibir el EI, es 
una señal que indica que puede realizar la conducta tras la cual va a recibir el reforzador. El 
reforzador es lo mismo que el EI, solo que utilizamos terminología diferente para cada 
paradigma. Un EC entonces es una señal que advierte al sujeto que de modo inmediato se va 
a producir el EI (el sujeto no tiene que hacer nada). El Ed es una señal que indica al sujeto que 
en esas condiciones se debe realizar una acción para obtener determinados estímulos 
(reforzadores) En términos físicos pueden ser idénticos pero su significado es distinto para el 
sujeto. 
Hay estímulos discriminativos positivos y negativos 
 
 Positivos> Indican al sujeto la relación de contingencia positiva entre la respuesta y 
las consecuencias. Un Ed es positivo porque se dice que de la acción se derivan sus 
consecuencias (sean las que sean). No tiene que ver con el valor motivacional, aquí también 
habría contingencia positiva (contingencia = relación entre la conducta y sus consecuencias, 
sean estas agradables o desagradables para el sujeto). También sería contingencia positiva si 
hubiese relación pero el reforzador fuese negativo (por ejemplo descarga). Contingencia 
positiva entre la acción y el reforzador. 
 
 Negativos> Señal del ambiente que indica que hay una relación de contingencia 
negativa entre la acción y sus consecuencias (no hay reforzador presente). Indica que de la 
acción no se deriva una consecuencia (no tiene que ver con el valor motivacional). 
Los reforzadores también se clasifican en función de su valor motivacional: 
 Reforzador positivo> aquellos que tienen valor motivacional apetitivo. Incrementan la 
 respuesta. Pueden ser primarios (comida, bebida...) o secundarios (dinero). 
 Reforzador negativo> estímulos reforzantes que tienen cualidades desagradables 
 (aversivos). Si existiera una contingencia negativa entre la respuesta y un reforzdor 
 negativo se produciría un incremento de la respuesta (reforzamiento negativo). 
 
 
 
 
 
 Valor motivacional del reforzador 
 Positivo Negativo 
Relación de 
contingencia 
Respuesta > 
Reforzador 
Positiva Recompensa 
Entrenamiento de 
recompensa: La respuesta 
conlleva un reforzador 
positivo. 
(Incremento de la 
respuesta) 
Castigo 
La respuesta conlleva un 
reforzador negativo. 
(Disminución de la 
respuesta) 
Negativa Entrenamiento de 
omisión o Castigo 
negativo 
Escape o Evitación 
La respuesta conlleva la 
retirada de un reforzador de 
carácter negativo. 
La respuesta conlleva la 
retirada de un reforzador 
positivo. 
(disminuye la respuesta) 
(Aumenta la respuesta) 
 
➢ RECOMPENSA > “entrenamiento o aprendizaje de recuperación” Aumento de la 
respuesta. Contingencia positiva y un reforzador apetitivo (reforzador positivo por lo 
que aumenta la respuesta). Por ejemplo salario y trabajo realizado, estudiar y aprobar. 
 
➢ CASTIGO POSITIVO> un sujeto presiona la palanca y recibe una descarga eléctrica. 
Si no realiza la acción, no la recibe. Contingencia positiva, porque hay relación y 
reforzador aversivo. Disminución de la respuesta (“castigo positivo”, el nombre no tiene 
que ver con el valor motivacional). 
 ¿Semejanzas o diferencias entre ambos? En ambos casos hay contingencia positiva 
entre una acción y una consecuencia. Lo que las diferencia es el valor motivacional del 
reforzador (en la recompensa una conducta lleva a conseguir algo positivo, en el castigo 
positivo una conducta te lleva a conseguir algo que no tiene para ti valor motivacional alto). 
➢ CASTIGO NEGATIVO (aprendizaje de omisión): Hacer las tareas o respuestas tienen 
como consecuencia no recibir el reforzador. Contingencia negativa (omisión de algo 
positivo, el reforzador retirado es positivo o apetecible). Ocasiona que algo que 
esperas recibir, finalmente no se reciba. Disminuye entonces la frecuencia de la 
respuesta porque esa acción lleva a omitir algo positivo. Impide algo positivo. Los 
efectos conductuales son parecidos a los del castigo negativo. Por ejemplo tengo 8 
puntos en el carnet, si me salto el semáforo me retiran puntos: Mi conducta 
instrumental es inapropiada y conlleva que me quiten puntos, algo que yo tenía. 
 
➢ EVITACIÓN O ESCAPE > La conducta o respuesta interrumpe o impide algo aversivo, 
algo negativo, pone fin a algo desagradable (evitación). El reforzador retirado es de tipo 
aversivo por lo que aumenta la respuesta. Contingencia negativa. Usa sus actospara eludir 
hechos aversivos ¿Qué puedo hacer para eludirlo? La respuesta interrumpe exponerse a la 
estimulación aversiva. Escape es para eludir un hecho que ya has experimentado en parte, y 
evitación es para eludir un hecho que aun no has experimentado ¿y si es algo bueno lo que 
esperas? Por ejemplo no quiero ir a la cena de nochebuena porque no aguanto a la familia, 
por tanto digo que tengo que ir a una cena del trabajo a la que no puedo faltar para evitar ir a la 
cena de familia (evitar). Otro ejemplo, el rey se marchó porque Chavez no se callaba (escape). 
Es positiva (la consecuencia) porque eludes consecuencias o situaciones negativas. Evitación 
es cuando la conducta se da antes de que se presente el estímulo aversivo. 
 
 
 
 
 
EQUIVALENCIAS O SEMEJANZAS ENTRE C.CLÁSICO Y C. INTRUMENTAL 
➢ Entrenamiento recompensa (CI) y excitatorio apetitivo (CC) 
 
▪ Semejanzas: aumenta la respuesta, contingencia positiva, valor motivacional 
apetitivo (EI y reforzador positivo) 
 
▪ Diferencias: En el C.C el sujeto no tiene que hacer nada para recibir la 
consecuencia, en el CI sí que hay que realizar una R para obtener el 
reforzador. 
 
➢ Castigo positivo (CI) y excitatorio aversivo (CC) 
 
▪ Semejanzas: contingencia positiva (EI y reforzador negativo) 
 
▪ Diferencias: en el excitatorio aversivo aumenta la respuesta y en el castigo es 
más baja (disminuye) por lo que hay distintos efectos conductuales 
 
➢ Entrenamiento omisión (CI) e inhibición apetitiva (CC) 
 
▪ Semejanzas: disminuye la respuesta (mismos efectos conductuales) y 
contingencia negativa (los reforzadores retirados son positivos) 
 
▪ Diferencias: En el C.C el sujeto no tiene que hacer nada para recibir la 
consecuencia, en el CI sí. 
 
➢ Evitación o escape (CI) e inhibición aversiva (CC) 
 
▪ Semejanzas: contingencia negativa (El EI y el reforzador retirados son 
negativos) 
 
▪ Diferencias: en el escape aumenta la respuesta, en la inhibitoria apetitiva baja (efectos 
conductuales distintos) 
 
 
 
 
 
 
 
 
 
Variables que influyen en la adquisición de condicionamiento instrumental 
 -Magnitud de la recompensa: A mayor magnitu, mayor adquisición de aprendizaje 
(también influye el valor motivacional de la recompensa para el sujeto). 
 
 Se introducen dos sujetos en un laberinto lineal en cuya meta se encuentra una caja 
con comida. El tiempo de realización de la conducta disminuye a medida que aumentan los 
ensayos. Mientras el primer sujeto recibe 6 bolitas de comida el segundo tan solo recibe 1. El 
que aprende más rápido es el que recibe las 6 bolitas, debido a la mayor magnitud de su 
recompensa. Cuando ambos sujetos han alcanzado la asíntota del aprendizaje, se comienza a 
dar 6 bolitas también al segundo sujeto, de manera que este reduce aún más el tiempo de 
realización de la conducta (mayor valoración del reforzador). Se trata de un ejemplo de 
aprendizaje incentivo (en función de la historia previa con estos acontecimientos). 
 
 
 
 
 -Demora del reforzamiento: Cuando mayor sea la demora más difícil es que se 
produzca el Cond. Ins, por ejemplo saltarse un semáforo en rojo y la multa se produce un año 
después. La eficacia del reforzamiento es mayor cuando es inmediato. Cuanto más rápido se 
da el reforzamiento menos latencia de la respuesta. 
 
 -Características del Ed: 
 
 Se generaliza el condicionamiento a estímulos parecidos. 
Ed > R > Ref (E2 y E3 son parecidos al Ed aunque no estuvieron presentes durante el 
entrenamiento también controlan parte de la respuesta cuanto más parecidos sean 
físicamente. Ejemplo El Ed es de 600 nm y los E2 y E3 también son luces pero de más o 
menos nm. Cuanto más parecidos a 600, mayor respuesta. 
 
Generaliza la respuesta aprendida a otros estímulos parecidos. El proceso inverso de la 
generalización es la discriminación. 
Discriminación: Saber exactamente ante que estimulo responder para que haya 
recompensa. Consiste en responder de manera diferenciada hacia estímulos similares. Hay 
dos mecanismos. ¿Cómo aprendemos a discriminar por ejemplo entre una luz de 600 mm y 
una de 650? 
 
Al principio el individuo responde por igual pero tras unos entrenamientos aprende a distinguir, 
a ver que tras uno hay reforzamiento y tras otro no. 
FORMAS DE REFORZAMIENTO 
Lo más importante de todo lo dicho es el modo en como se administren los reforzadores. 
1) Continuo> cada vez que se realiza la respuesta o conducta se obtiene el 
reforzamiento. Siempre se da reforzamiento. 
 
2) Intermitente> a veces se refuerza y otras no (no siempre que el sujeto realiza la 
conducta recibirá el reforzamiento). Es el más eficaz. A veces se da reforzamiento y a 
veces no. Se consigue una tasa de respuesta muy alta. 
 
 
➢ Intervalo: la obtención de la recompensa depende del tiempo desde la ultima acción 
realizada y reforzada. La obtención del reforzamiento depende de la ultima vez que 
la conducta fue reforzada. 
 
o IF (intervalo fijado, por ejemplo 30 segundos) Depende del tiempo 
transcurrido desde la última vez que el sujeto recibió la recompensa. 
 
o IV (intervalo variable): El tiempo varía (a veces una semana, otras un mes…). 
 
➢ Razón: la obtención de la recompensa depende del número de acciones que realiza 
el sujeto). Para obtener la recompensa hay que realizar la conducta un número 
determinado de veces que puede ser fijo (RF) o variable (RV) 
 
o RF (razón fija) El sujeto recibe la recompensa tras hacer un determinado 
número de respuestas (por ejemplo tras dar 50 veces a la palanca). 
 
o RV (razón variable)Cuando el número de veces cambia o se mantiene en 
torno a intervalo. 
Cada programa tiene su pauta típica de respuesta. En general, el reforzamiento intermitente 
(efecto del reforzamiento parcial) genera tasas de respuesta más alta. Por ejemplo, máquinas 
tragaperras. 
 
 
TEMA 4: PROCESO DE CONDICIONAMIENTO CLÁSICO 
1. Novedad del estímulo y experiencia anterior 
 Fenómenos de pre-exposición: La experiencia con los estímulos antes del 
condicionamiento retarda la adquisición de la respuesta condicionada. Se puede dar un déficit 
de condicionamiento a pesar de que se den las condiciones óptimas para su adquisición 
porque el sujeto no presta suficiente atención a los estímulos ya que previamente han 
adquirido un significado de irrelevantes. Esta situación puede venir provocada por la 
preexposición a los estímulos (EI o EC) en solitario, de manera que no se establezcan 
relaciones entre uno y otro. Son situaciones particulares pero nos permiten extraer 
mecanismos de este aprendizaje. Influye el aprendizaje perceptivo (nos ayuda a discriminar 
ciertos estímulos). Algunos de estos fenómenos son: 
 -Inhibición latente: Se produce por una preexposición al EC (sin ser seguido del EI). 
Por ello posteriormente es más díficil que el EC adquiera el significado de “causa” del EI y se 
produzca el condicionamiento. El EC tiene un significado previo de “no causa del EI”. Sería 
más fácil establecer esta relación frente a un EC novedoso. 
 
 -Preexposición al EI: Si se presenta el EI en solitario como antes se mencionó, luego 
será más complicado que este se relacione con un EC previo debido a que el aprendizaje 
perceptivo, ha establecido previamente una caracterización del EI en la que no se contaba con 
la presencia previa de ningún EC. 
 -Irrelevancia aprendida: Se produce cuando se presentan EC y EI de manera 
acontingente, es decir, de forma separada, de tal manera que no se establezca una relación de 
ningún tipo entre ellos. Cuando se trate de producir un condicionamiento presentándolos 
seguidos se producirá un retraso (mayor que los anteriores) en el aprendizaje porque ambos 
tiene un significado previo en el que no se relacionan entre sí. 
Inhibición latente y esquizofrenia 
La esquizofrenia se trata de un desorden neuro-psiquiátrico de etiología poco conocida. Entre 
algunos de sus síntomas se encuentran las