Vista previa del material en texto
CONDICIONAMIENTO Y APRENDIZAJE Conceptos Clave Ciencia: Conjunto de conocimientos procedentes de la observación y la experimentación, que nos llevan al desarrollo de leyes científicas generales Aprendizaje: proceso psicológico que nos permite adquirir conocimiento a partir de la experiencia. El aprendizaje es un elemento adaptativo básico. Conjunto de leyes científicas que describen las interacciones especificas entre el individuo y el ambiente que influyen en su conducta y su funcionamiento cognitivo. Ejemplo: A la hora de comer, antes de llegar a casa ya empezamos a salivar (ocurre porque estamos preparando el organismo para la ingesta) Conductas aprendidas: reflejo del conocimiento adquirido. Conocimiento: Es la información codificada y almacenada en la memoria sobre el mundo: -Declarativo/explícito: Se puede expresar y requiere experiencia consciente del sujeto. (Qué hacer) -Procedimental/implícito: Conocimiento reflejado habitualmente de forma inconsciente. (Cómo hacer) Niveles de estudio: conductual (cómo la experiencia produce cambios en la conducta), cognitivo (cómo se representan las experiencias en la memoria) y neural (las bases cerebrales de los procesos de aprendizaje). Diferencias entre aprendizaje y ejecución: El aprendizaje es un proceso psicológico inferido a partir de la conducta (es un conocimiento almacenado que de vez en cuando se expresa en las conductas aprendidas) mientras que el concepto de ejecución se reduce a “la expresión del aprendizaje”. TEMA 1: LA CIENCIA DEL APRENDIZAJE *Lecturas Recomendadas: - Domjan, M. (2008). Principios de aprendizaje y conducta. Madrid: Thompson Cap 1(antecedentes históricos y concepto de aprendizaje) - Tarpy, R.M. (2000) Aprendizaje: Teoría e investigación contemporáneas. Madrid: Macgraw. Capítulos 1 y 2 - Maldonado, A. (1998) Aprendizaje, cognición y comportamiento humano. Madrid: Biblioteca Nueva. Cap. 1 *Lecturas opcionales: - Boakes. R.A (1989). Historia de la psicología animal. De Darwin al conductismo. Madrid: Alianza Psicológica. Capítulos 1,3,6. - Francisco Mora (2001). El reloj de la sabiduría. Tiempos y espacios en el cerebro humano. Madrid: Alianza Editorial. Desarrollo histórico del estudio del aprendizaje 1. FILOSOFIA DE LA MENTE : arco, reflejo, leyes de asociación… - Descartes (1596 -1650) y el dualismo: Nos proporciona una visión dualista del ser humano (con la intención de no rechazar por completo la Tª sobre el propósito y libre albedrío como determinantes de la conducta humana. Esta visión recibe el nombre de Dualismo cartesiano: -Cuerpo: produce respuestas reflejas (involuntarias) a estímulos externos. Los órganos sensoriales captan los estímulos y envían la información a través de los nervios. Allí se produce la transformación: estímulo/entrada >>> respuesta/salida. -Mente: Libre albedrío y acciones voluntarias y conscientes (propias de los humanos y que les atribuían superioridad). La mente, externa al cuerpo se conectaba con éste a través de glándula pineal, cercana al cerebro. De esta forma se podría ser consciente de la conducta involuntaria y a su vez iniciar acciones voluntarias (posibles en ausencia de estimulación externa). Cree que el contenido de la mente procede de la experiencia sensorial y que había ciertos contenidos presentes en todos los seres humanos de forma innata (idea de Dios, sí mismo...). Esta corriente se denomina innatismo. Hacía distinción de dos tipos de conducta: Voluntaria (pensamiento, ideas... Propia de la mente y únicamente presente en los humanos) e Involuntaria (respuestas de los sentidos, propias del cuerpo, presentes en animales). El mecanismo de la conducta refleja sería el llamado “arco reflejo” (Estímulo>>>Neurona sensitiva (aferente)>>>interneurona>>>neurona motora (aferente)>>>Respuesta): – Empirismo británico: contenidos de la mente: Las leyes de asociación Se oponen a Descartes, J. Locke opina que todas las ideas son adquiridas de forma directa o indirecta a partir de la experiencia posterior al nacimiento (metáfora de la tábula rasa). Consideran la asociación de ideas como concepto clave en el funcionamiento mental. La fuente de conocimiento para ellos la componían las experiencias de los sentidos, las sensaciones, a partir de las cuales se formaban combinaciones más complejas por medio de la asociación. Aceptan dos conjuntos de leyes de asociación: -Primarias (establecidas por Aristóteles): contigüidad (hechos próximos), semejanza y contraste (aspectos semejantes o características que contrasten) -Secundarias (establecidas por los filósofos empiristas): recogen ciertos factores que influyen en la formación de asociaciones (intensidad, duración, frecuencia, reciente aparición...) - William James y la asociación. William James (1841-1910) se preocupa por explicar cómo se producen los hábitos. Defendía un empirismo radical. Dice que para que una respuesta se convierta en hábito requiere de una experiencia repetida, no consciente y la adquisición de una conducta. Basaba este mecanismo de adquisición de hábitos en la conexión estímulo respuesta (E-R) por medio de la experiencia y las asociaciones (las asociaciones mentales se vinculan con conexiones físicas en el cerebro). Principios de la psicología (1970) “La prueba de toda verdad reside, sencillamente, en su eficacia” 2. EVOLUCION Y SELECCIÓN NATURAL -Evolución de la inteligencia. Charles Darwin (1809-1882) y la psicología comparada: Darwin defiende que sobreviven aquellos individuos cuyas destrezas se adaptan mejor a los desafíos naturales y son transmitibles a su descendencia. Por lo tanto los individuos estaban cada vez más adaptados (evolución mediante selección natural). Apoyándose sobre el principio de continuidad de la vida sostienen que los seres humanos compartimos características con los animales, la mente humana es por tanto un producto de la Evolución. A partir de aquí se desarrolla la psicología comparada que realiza experimentos con sujetos animales con la intención de estudiar la conducta animal y aplicar el conocimiento a la conducta humana y defiende que todas las especies animales son inteligentes en mayor o menor medida (humano=animal). Nuestra conducta no está únicamente determinada por los estímulos que afectan al sujeto, si no también por las tendencias conductuales heredadas. > Morgan, Romanes: No hicieron experimentos. Decían que una especie era más inteligente en mayor medida según resolvía problemas mecánicos Morgan: Canon de Morgan: Ensayo error. Canon de Morgan y la ley de la parsimonia: “una acción no se debe interpretar como resultado del ejercicio de una facultad psíquica superior si puede interpretarse como el resultado del ejercicio de una actividad psíquica inferior en la escala psicológica”. G. Romanes (1848-1894): Criterio para la inteligencia: “si aprende a hacer nuevos ajustes o modificar los antiguos de acuerdo con los resultados de su propia experiencia”. Inteligencia: Capacidad para aprender *Ejemplo: Clever Hans (el caballo que podía sumar, multiplicar…) Era una muestra de inteligencia para ellos. 3. PSICOLOGIA EXPERIMENTAL 3.1. Hermann Ebbinghaus(1859-1909) y la memoria humana Hizo experimentos con él mismo. Memorizaba palabras sin sentido y luego comprobaba en determinados intervalos de tiempo la cantidad de palabras que recordaba. Es el estudio de la memoria humana (mediante este experimento comprobaba que al momento recordaba el 100%, a los 20 minutos el 60%, a la hora el 40%...) y representó sus resultados a través de la curva de olvido. Añade que existen ciertas leyes de asociación que influyen en los resultados: Contigüidad, repetición, duración de la lista... 3.2. Ivan Pavlov y los reflejos condicionados (Neurologíaalucinaciones, delirios, anhedonia (ausencia de placer), pensamientos desordenados, ansiedad, etc. Se caracteriza también por una fuerte disfunción de la atención selectiva (atender a aquellos estímulos que son adecuados). Stroop task (Stroop, 1935). Desarrollo de un método para observar este fenómeno: -Pide nombrar el color de la palabra V E R D E R O J O El rasgo relevante sería el color de la palabra pero se produce una distracción por atender a una dimensión irrelevante (significado de la palabra). 2. Aprendizaje selectivo y sus mecanismos A partir de los años 60' comienza a estudiarse en los laboratorios el proceso de aprendizaje selectivo (determinación de qué estímulo es el adecuado). Si por ejemplo a un sujeto sometido a un experimento en el que se le presentará un EI precedido por dos EC (EC1 y EC2) simultáneos, se le pide que identifique cuál de los dos es la causa del EI presentará distintas respuestas en función de variós mecanismos de condicionamiento (los dos estímulos no se codifican de la misma manera): -Intensidad (saliencia) del estímulo. (Fenómeno de ensombrecimiento) -Validez relativa del estímulo. (Fenómeno de bloqueo) -Relevancia biológica del estímulo. Condicionamiento Estímulos Compuestos -Ensombrecimiento: Se presenta a un sujeto un EI (descarga) precedido de dos estímulos EC (EC1: luz y EC2: tono). Se realizan ensayos hasta alcanzar el máximo condicionamiento. ¿Qué EC sería para el sujeto la causa del EI? Si se produce el condicionamiento de los dos EC por separado con la descarga y se alcanza el mismo nivel de marina vega canella aprendizaje, diremos que son igualmente intensos y al realizar el condicionamiento conjunto ambos serían identificados como causa del EI sin realizar distinción entre ellos. Sin embargo en este caso concreto, el tono (EC2) tiene una mayor saliencia que el EC1 (luz). De este modo cuando se presentan por separado tras el condicionamiento conjunto el EC1 no produce una RC mientras que el EC2 sí. Este fenómeno recibe el nombre de ensombrecimiento. El estímulo más débil resulta dificultado por el estímulo más sobresaliente a pesar e haberse presentado las mismas veces simultaneamente. Cuanto mayor sea la diferencia relativa entre ambos, mayor será la diferencia en la magnitud de la RC realizada tras su presentación por separado. En el condicionamiento no solo influye la contigüidad temporal, también la saliencia de los estímulos. -Bloqueo: Este experimento se realiza con la técnica de supresión condicionada, computando la RS. Tenemos un grupo de sujetos de control a los que se les presenta una luz y un tono simultáneos (ECa y ECb) seguidos de una descarga eléctrica (EI). No cabe pensar que uno ensombrezaca al otro pues ambos tienen la misma saliencia. Ambos estímulos son entonces captados como causa de la descarga y al presentarse por separado producen por igual la supresión de la conducta. Otro grupo, que recibe el nombre de bloqueo, realiza la misma experiencia con la salvedad de que previa a esta fase se les expone a una repetición reiterada del ECa en solitario seguido de la descarga hasta alcanzar el máximo condicionamiento. Tras la segunda fase, presentamos en solitario el estímulo ECb y obtenemos una RS muy próxima a 0,5 (ausencia del condicionamiento. En este caso ECb no nos aporta ninguna información nueva, ya que ECa marina vega canella tienen distinta validez relativa marina vega canella Conclusion de estos tres metodos : No es suficiente la contiguidad fue previamente asociado como causa de la descarga. Se condicionan en diferente grado porque aportan diferente grado de información. Este fenómeno recibe el nombre de bloqueo. El condicionamiento previo de un EC impide el condicionamiento posterior de otro EC. En este caso el fenómeno depende de la experiencia previa del sujeto. Sin embargo si smetemos un tercer grupo a la experimentación, en la que hay el previo condicionamiento de ECa y el la fase de condicionamiento de ECa y ECb con la descarga, presentamos una descarga de mayor intensidad que el primer EI condicionado, en la tercera fase de presentación de B observaríamos condicionamiento, cuyo nivel dependerá de la diferencia de intensidad del EI1 y EI2, debido al cambio de información al someter al sujeto a los dos estímulos conjuntos. Este fenómeno recibe el nombre de desbloqueo. Relevancia biológica: este mecanismo depende de las características evolutivas del sujeto. BLOQUEO DEL CONDICIONAMIENTO 0 0,1 0,2 0,3 0,4 0,5 1 2 3 4 5 Ensayos R a z ó n d e s u p re s ió n BLOQUEO CONTROL DESBLOQUEO 0 0,1 0,2 0,3 0,4 0,5 1 2 3 4 5 Sesiones R a z ó n d e s u p re s ió n DESBLOQUE O CONTROL BLOQUEO marina vega canella Valor informativo marina vega canella AQUI B SI QUE TIENE VALOR INFORMATIVO marina vega canella La contiguidad marina vega canella QUE ES MAS INFORMACION : UN ESTIMULO QUE INFORMA SBRE LA APARICION DE UN EI O QUE INFORMA SOBRE SU OMISION Depende de la experiencia del sujeto L+.+ LT+. L- , T- - LT++. L- ,,T- En el caso A EL TONO TIENE UN VALOR INFORMATIVO AUNQUE ES MENOR QUE EN EL B Jhon García estudió el proceso de condicionamiento sometido a este mecanismo por medio de la aversión al sabor en ratas. Estaba conmocionado por la reacción delos soldados al venir de la guerra que a parte de síntomas propios del conflicto bélico, presentaban vómitos y náuseas. Así fue que comenzó sus estudios con ratas dando lugar a un trabajo seminal del que se extraerían numerosas conclusiones. Seleccionó un amplio grupo de ratas sedientas y les dió de beber una solución con sacarina, y a la vez que accionaban el mecanismo de bebida, se cerraba un circuito eléctrico que producía un click y hacía que se encendiera una luz. En este caso se presenta un EC con un componente gustativo (sacarina) y un componente estereoceptivo (luz y click). Dividió a los sujetos en dos grupos: -el primer grupo al beber sufría una inyección de una sustancia que les provocaba malestar e indisposición. -el segundo grupo era sometido a una descarga electrica. A la hora de estudiar la relevancia causal de los dos estímulos en los distintos grupos obtuvo los sorprendentes resultados de que: el primer grupo rechazaba el agua edulcorada pero era capaz de beber en presencia de la luz y el click. El segundo grupo bebía el agua con sacarina pero se abstenía de beber en presencia de la luz y el click. Esto fue provocado por las disposiciones evolutivas de las ratas, que para determinar si un alimento está en mal estado o no utilizan una serie de claves olfativas (sistema de defensa interno relacionado con el mal estar interno) y para detectar peligras externos utiliza un sistema defensivo estereoceptivo (relacionado con la descarga electríca). Por eso la asociación de los distintos estímulos a las diferentes consecuencias. En este fenómeno influyen las características derivadas de la evolución biológica. 3. Inhibición condicionada La inhibición se corresponde con una relación de contingencia negativa a partir de la cual el sujeto deja de responder a un EC porque no causa un EI. -Procedimientos (métodos): Se experimenta con una paloma metida en una caja de condicionamiento. Tiene tres luces. En el centro se enciende una luz verde que indica la presencia de comida (la paloma produce una RC de picoteo sobre la luz)(EC+). La luz roja a un lado significa que no hay comida, discrimina este EC por tratarse de un estímulo inhibitorio (EC-). Según la inhibición condicionada pavloviana en la que el EC+ es la luz verde, si se presentan la luz verde (EC+) con la luz roja (EC-), el sujeto esperará comida. Si no la recibe asumira que la luz roja es un inhibidor de la comida y cuando se presente en solitario no habrá respuesta. Se trata de un tipo de aprendizaje silencioso(o latente) porque en el caso de presentar un estímulo novedoso (una luz azul) la conducta sería la misma: ninguna. Entonces ¿Cómo es posible determinar si hay o no aprendizaje? -Métodos indirectos de medida de condicionamiento inhibitorio: La no elicitación de una conducta no puede medirse directamente. Por eso se han desarrollado métodos de medida indirecta para el condicionamiento inhibitorio. Prueba de retraso Para saber si un estímulo condicionado ha adquirido características inhibitorias y diferenciarlo de un estímulo novedoso (que tampoco elicita una respuesta) es necesario comparar dos grupos: -grupo de control: sin ningún tipo de experiencia propia se condiciona un EC con un EI (para medir la velocidad de aprendizaje). -grupo experimental: se realiza la misma tarea pero previamente se condiciona el mismo EC de forma inhibitoria con el EI. El EC tendrá que pasar de un significado inhibitorio a excitatorio. PRUEBA DE RETRASO 0 20 40 60 80 100 1 2 3 4 5 6 7 8 9 10 Sesiones M a g n it u d d e l a re s p u e s ta CONTROL EXPERIMENTAL Se supone un aprendizaje latente en el grupo experimental debido al retraso en el tiempo de adquisición del máximo nivel de aprendizaje. Cuantos más ensayos necesitemos para alcanzar el máximo nivel de condicionamiento EC-EI, mayor sera el grado de condicionamiento inhibitorio previo. Prueba de sumación Para esta medición necesitamos dos grupos de sujetos: -grupo de control: se condiciona una luz (EC) a la comida (EI). Al presentar la luz en la siguiente fase acompañada de un tono, la fuerza excitatoria de la luz no varía y se produce la misma RC porque el tono carece de relevancia, no aporta ningún tipo de información. -grupo experimental: se realiza la misma prueba pero en una primera fase se le atribuyen al tono unas características inhibitorias del EI. En la tercera fase al presentar conjuntamente luz y tono, puede que el EC- (tono) inhiba las capacidades excitatorias de la luz, o las disminuya, entonces decimos que ha habido condicionamiento inhibitorio. 0 20 40 60 80 100 LUZ TONO LUZ + TONO 4. Aprendizaje con estímulos neutros Si intentamos condicionar dos estímulos neutros (sin características motivacionales para el sujeto), cabe pensar que no se producirá condicionamiento (no habrá una RC porque tampoco hay un EI que previamente provoque una RI). Sin embargo, se produce un aprendizaje latente o silencioso (la información aprendida no se elicita por medio de una respuesta). Existen dos prcesos para condicionar estímulos neutros. Precondicionamiento sensorial Se introducen unas ratas en una caja de condicionamiento. En una primera fase se le presentan una luz y un click juntas, con la intención de que las asocie. Tras un gran número de ensayos se comprueba que al presentarlos por separado no se produce ninguna respuesta (si hay aprendizaje estará implicito de forma latente). Pasamos a la segunda fase. Se presenta la luz (estímulo B) seguida de comida, hasta alcanzar el máximo nivel de aprendizaje. El estímulo B produce entonces al presentarlo en solitario una RC. En la fase de prueba se presenta en solitario el estímulo A (si condicionamiento previo con la comida) y se obtienen los sorprendentes resultados de que se elicita la RC que provocaba el estímulo B. Esto es debido a la relación previa establecida entre A y B en la fase 1. El sujeto hace una inferencia lógica: A>B, B>EI, entonces A>EI. Condicionamiento de segundo orden Se trata de un proceso similar al anterior, con un grupo de ratas en una caja de condicionamiento. En la fase 1 se produce un condicionamiento de carácter estándar: un click (B) con comida (EI). Finalmente se comprueba que el estímulo B produce la RC. En la fase 2 se prsenta el click con otro estímulo neutro (en este caso una luz) sin ir seguidos de comida. En la fase de prueba se presenta únicamente el estímulo A (luz) y se observa que se produce la RC. marina vega canella Reforzadores primarios y secundarios Pavlov diferencia dos tipos de estímulos: -De primer orden: Condicionados con un EI -De segundo orden: Condicionados con otro estímulo condicionado previamente. En este último caso la luz adquiere el carácter de causa de la comida (la RC es resultado de una propiedad motivadora que le transfiere el estímulo B al A al asociarse mutuamente). CSO y reforzadores condicionados Un reforzador secundario o condicionado es un estímulo neutro que adquiere las propiedades de un reforzador primario, como comida o agua, al emparejarse de forma sistemática con el mismo. Prueba de reforzamiento secundario: Una rata se encuentra en una caja de condicionamiento. Se le presentan dos estímulos neutros A y B. Tras A siempre recibe comida, pero de forma intercalada se le presenta B, tras el cual no recibe comida (el sujeto aprende a discriminar B mientras que A se condiciona). A funciona como EC pero también como reforzador condicionado que servirá como reforzador positivo de otras conductas. Posteriormente se le enseña al sujeto una conducta instrumental (al accionar una palanca recibe comida) hasta el alcance de la asíntota del aprendizaje. Si se retirara la comida la conducta se extinguiría, pero si en lugar de simplemente retirar la comida, además presentamos el estímulo A, el estímulo funcionará como reforzador y será capaz de matener la conducta en cierta medida (adquiere capacidades reforzantes). La presentación de B no evita la extinción de la conducta. marina vega canella ??????????? Teoria de la sustitución condicionada 5. Condicionamiento contextual El contexto se define como ambiente o conjunto de claves que configuran un entorno. Si se presenta un EC en un contexto determinado seguido de un EI hasta alcanzar el el máximo condicionamiento. En caso de sustituir el EC por el contexto en el que se había presentado se observa que también se produce la RC. Wagner comparó los efectos del entorno sobre las conductas pero desde el ámbito de la habituación. Aquí lo estudiaremos en el campo del condicionamiento clásico. Implicaciones prácticas: Náuseas y vómitos anticipatorios (NVAs) Los pacientes de cáncer se someten a tratamientos de quimioterapia en un ambiente hospitalario con determinadas características. Durante el tratamiento se les inyecta una solución fitotóxica (EI) que les produce náuseas y vómitos, que reciben el nombre de inmediatos o incondicionados (RI). Entonces se han desarrollado unos fármacos capaces de suprimir las náuseas y vómitos inmediatos. Sin embargo tras varias sesiones de quimioterapia el propio contexto hospitalario y sus características determinadas (olor, color, médicos...) adquieren características propias de un EC y comienzan a presentarse los efectos secundarios de la quimio al entrar en el hospital. En este caso las náuseas y los vómitos reciven el nombre dde anticipatorios y no son suprimibles con los fármacos desarrollados. 6 Bases cerebrales: aprendizaje y emoción. Aprendizaje de repuestas de miedo: Se asocia por medio de condicionamiento clásico un estímulo aversivo (golpe muy estridente) con el peluche de una rata. La presencia del EC (peluche) produce una respuesta emocional de miedo que conlleva paralización, cambios a nivel hormonal, cambios en la tasa cardiaca. El miedo es una emoción que nos permite reaccionar en situaciones de peligro. El cerebro se emociona: Los daños cerebrales pueden alterar la expresión o interpretacion de las emociones (la amigdala por ejemplo está relacionada con estas funciones). Estudios revelan que en síndromes como el síndrome Klüiver-Bucy o el de Urbach Whiete impiden a los individuos interpretar las emociones ajenas a través del rostro además de Ausencia reacciones asociadas a la ira y al miedo, déficits perceptivos y de expresión de reacciones emocionales.Sistemas cerebrales En este esquema el tríangulo representa la amigdala. Se reproduce como funciona el proceso de realización de una respuesta de miedo en la que el Tálamo tiene la función de procesar las situaciones y el Hipotálamo es la vía responsable de las respuestas motoras. Método de condicionamiento clásico: Puede estudiarse desde la perspectiva de que la amigdala es el centro de tanto del miedo como de la felicidad. Se selecciónan dos grupos de sujetos uno de Control y otro Experimental. En ambos casos se condiciona una luz al recibimiento del alimento. Al grupo experimental, tras el condicionamiento se le da la comida sin ir precedida del EC (luz) y se le inyecta una solución de litio que le produce indisposición y consecuentemente le produce una devaluación del valor afectivo de la comida. En una fase posterior se presenta la luz sin ir seguida de la comida, el grupo control realiza la respuesta de aproximáción, pero el grupo que ha sufrido la devaluación de la comida no la da con tanta frecuencia. Este fenómeno nos indica que el condicionamiento clásico no depende solo de la anticipación de un hecho, sino también del valor hedónico de ese hecho (en este caso la comida). Ante la suposición de que el valor hedónico del EI dependía de la amigdala se realizó un posterior estudio con dos grupos. Uno de control en el que no se lesionaba la amigdala y otro experimental en el que sí. Se repitió el experimento anterior con la distinción de que en este caso a ambos se les producía el efecto devaluador de la comida. En la fase de comprobación al presentar el EC sin ir seguido del EI, el grupo sin lesión presentó una rápida extinción de la respuesta. Sin embargo no fue así en el grupo con la lesión en la amígdala. Extraemos del experimento que la lesión de la amígdala interviene en la convergencia de la información sensorial y la codificación del valor afectivo. Otro experimento similar se realizó con tres grupos de ratas: SHAM (abiertos pero no lesionados, para determinar si la conducta no era por lesiones periféricas), BLA (lesión de la zona de la amígdala relacionada con los atributos sensoriales) y CA (lesión de una zona de la amígdala relacionada con los atributos afectivos). Técnica de enmascaramiento: (aprendizaje implícito y explícito). Hay un tiempo mínimo de presentación de un estímulo a partir del cual es sujeto codifica perfectamente dicho estímulo. Sin embargo, si se presenta un estímulo por debajo de este tiempo solo se procesarán parte de las características de este estímulo (estas características forman parte del aprendizaje ímplicito y pueden relacionarse con las consecuencias de la presentación del estímulo). Por ejemplo en experimentos de enmascaramiento se presenta una imagen durante un período de tiempo relativamente largo, y luego un rostro un una expresión de temor por debajo del tiempo mínimo de presentación necesario para su completo procesamiento. Seguido a esta segunda estimulación se somete al sujeto a una descarga eléctrica. En el proceso pavloviano (sometiendo a los sujetos a la experiencia) se observa que los sujetos a los que se presenta el rostro con dicha expresión de forma desemascarada presentan un aumento de la resistencia en la conductancia electrica de la piel (respuesta de miedo a la descarga). Sin embargo, a los que se les presenta el estímulo de forma enmascarada presentan una menor magnitud de esta respuesta emocional (poco aumento de la resistencia de la conductancia de la piel) pero aún así, simboliza un aprendizaje, eso sí, menor que en el anterior. En un proceso observacional (el sujeto observa a otros sujetos en esa situación, antes de presentarle el estímulo) se obtienen resultados similares pero de menor magnitud. -Procesamiento de expresiones faciales: Se utiliza una técnica de condicionamiento de segundo orden. Se condiciona un rostro con determinada expresión a un estímulo aversivo y luego se condiciona ese rostro con otro de carácter neutro. A nivel cerebral se observan cambios en la actividad a la hora de observar el estímulo neutro, con características de la observación de aquél aversivo. -Monitorización de la actividad de la amígdala: Nos desvela que no solo procesamos información sensorial, sino también del valor afectivo de los estímulos. TEMA 5: PROCESOS DEL CONDICIONAMIENTO INSTRUMENTAL APRENDIZAJE INSTRUMENTAL: Hace referencia a situaciones en las que un organismo realiza una acción, con el fin de conseguir una meta o incentivo. Además de la RI y el reforzador, también se encuentra el estímulo discriminativo. Una respuesta instrumental es toda aquella conducta con la que se pretende obtener un reforzador de carácter motivacional positivo. Los estímulos determinativos son aquellos conjuntos de claves del ambiente que indican al sujeto la disponibilidad o retirada de un reforzador. Los Ed's en ocasiones son capaces de instigar las conductas (adquieren las características del reforzador). ▪ Entrenamiento recompensa: tiene una contingencia positiva, dando lugar a un aumento en la tasa de respuesta (instrumental), el reforzador tiene un carácter motivacional positivo. Es más eficaz un reforzador demorado y de gran cantidad. ▪ Castigo: contigencia positiva con un reforzador de carácter motivacional negativo, lo que hace que disminuya la tasa de respuesta instrumenntal. ▪ Entrenamiento omisión: se trata de una contingencia negativa entre la realización de la respuesta y la obtención de un reforzador positivo. Produce la disminución de la respuesta hasta su extinción. ▪ Escape/ evitación: contingencia negativa entre una respuesta y un reforzador negativo que produce aumento de la respuesta. Escape: el sujeto está sometido al R- y la respuesta supone su interrupción. Evitación: la respuesta evita la aparición del R-. Programas de reforzamiento. Un programa de reforzamiento es el conjunto de reglas y criterios que se establecen en la suministración de recompensas al sujeto en el condicionamiento clásico y que suponen un incremento de la respuesta instrumental. En la técnica de moldeamiento (hacer que el sujeto realice la conducta deseada) nos interesa obtener una tasa alta de respuesta y que sea constante. Para medir estas dos variables, Skinner diseñó una caja conectada a un registrador acumulativo (parecido a un sismógrafo) que dibujaba escalones en un papel enrollado a medida que el sujeto realizaba una respuesta, representando así su distribución en el tiempo. Además había una aguja que hacía una marca en diagonal sobre aquellos escalones en los que se suministraba una recompensa al sujeto. De esta forma se pueden establecer relaciones entre respuesta y reforzamiento y calcular valores como: la tasa de respuesta, la tasa de reforzamiento y la frecuencia de la respuesta. A partir de aquí se desarrollan los distintos tipos de programas de reforzamiento: Programa reforzamiento continuo (cada aparición de la respuesta instrumental da lugar al reforzador) Programa de reforzamiento intermitente o parcial (las respuestas solo se refuerzan algunas veces) Veremos los programas que usan reglas simples para determinar qué respuestas se van a reforzar: Programa de razón (son aquellos en los que la presentación de reforzamiento depende solo del número de respuestas que dé el sujeto) Pueden ser de razón fija o de razón variable. Razón Fija Continua> cada respuesta obtiene refuerzo. Genera un patrón de respuesta de tasa estable y moderada. Pausas breves e impredecibles por saciedad, por fatiga… Razón Fija Parcial > solo se obtiene el refuerzo cada “n” respuestas. Tasa estable y alta de respuestas en la “carrera de razón”. Razón variable > Se precisa un número de respuestas que varía cada vez (entorno a un valor promedio). Tiene una tasa de respuesta muy alta y muy estable (es el más resistente a la extinción). No hay pausa postreforzamiento, no es predecible el número de respuestas que se necesitan. Programas de intervalo: (son aquellos a los que la presentación del reforzador depende de parámetros temporales, esto es, del tiempo que haya transcurrido desde la última presentación del reforzador) Pueden ser de intervalo fijo o intervalo variable. Intervalo Fijo> la cantidad de tiempo es constante de una ocasión a la siguiente. Genera un patrón de respuesta característico que se denomina “festón de intervalo fijo”. Consiste en un aumento de la tasa de respuesta a lo largo del intervalo (una curva positivamente acelerada) Esto se debe a que los animales aprenden que no es probable que reciban un reforzador en los instantes posteriores a la presentación del anterior y esperan a dar la respuesta al momento en que predicen que se aproxima el fin del intervalo. Intervalo Variable> La cantidad de tiempo entre la disponibilidad de un reforzador y el siguiente no es fija, sino que oscila en torno a un valor promedio de intervalo. Mantienen tasas de respuesta continuas y estables, sin pausas. Con respecto a la disponibilidad, cabe señalar que en los programas de intervalo cuando hablamos de “intervalo entre reforzadores” , no queremos decir que pasado un tiempo “x” el reforzador se presente sin más, independientemente del sujeto. En realidad hablamos del momento en que el reforzador está disponible para ser presentado y que esto solo ocurrirá si el sujeto emite la respuesta instrumental requerida. Además, suele existir una restricción del tiempo en que esté disponible, es decir, que hay un intervalo máximo de tiempo en que se presenta el reforzador si se emite la respuesta. Se llama duración limitada. Generalmente los programas de reforzamiento parcial producen un aumento en la tasa de respuesta y en la resistencia a la extinción de la misma en ausencia del reforzador. Programas de reforzamiento continuo VS programas de reforzamiento parcial. La extinción es mucho más lenta y provoca menos reacciones de frustración si los sujetos han experimentado previamente un reforzador parcial que si han experimentado previamente un reforzamiento continuo. ¿Por qué el reforzamiento parcial consigue una persistencia notable en las respuestas? (no entra en el examen, solo leer) ▪ Hipótesis de la discriminación (lo que ocurre es simplemente que en el caso del reforzamiento continuo la retirada de la recompensa es mucho más fácil de detectar que en el reforzamiento intermitente). ▪ Hipótesis del aprendizaje (no es tan sencillo, los organismos aprenden algo durante el programa de reforzamiento parcial que les hace responder más a menudo cuando ya no están disponibles las recompensas) ✓ Teoría de la frustración (en el reforzamiento parcial el sujeto aprende a dar la respuesta instrumental sin expectativa de recompensa mientras que en el reforzamiento continuo no existe nada que enseñe al animal a responder cuando no espera ser reforzado y se frustra (Amsel) ✓ Teoría secuencial (aquí se enfatiza en la memoria + en el reforzamiento parcial. El sujeto aprende que será reforzado por responder cuando su memoria le indique que no fue premiado en los ensayos anteriores, un reforzamiento continuo no permite que los animales aprendan esa persistencia (Capaldi) En este experimento aparecen representadas en rojo las ratas sometidas a un programa de reforzamiento continuo y en azul a un programa de reforzamiento parcial. Magnitud de la recompensa: La resistencia a la extinción es baja tras el reforzamiento continua (durante la adquisición), pero alta tras el reforzamiento parcial. Número de ensayos durante el entrenamiento La resistencia a la extinción aumenta con un número mayor de ensayos de reforzamiento parcial. Conducta de elección: Hasta ahora hemos estado estudiando situaciones en las que solo se mide la aparición de una respuesta concreta en función del patrón de reforzamiento de esa respuesta. Esto no nos proporciona una comprensión total de la conducta. Los organismos cada vez que emiten una respuesta están haciendo una elección entre un conjunto de respuestas disponibles en ese momento. Vamos a estudiar la situación de elección más simple, en la que el sujeto tiene solo dos alternativas de respuesta. Una rata en una caja de condicionamiento tiene dos palancas separadas (Ra y Rb). Si realiza la respuesta instrumental en Ra se someterá a un programa de reforzamiento parcial de intevalo variable de 1 minuto (recibirá 60 reforzadores en una hora). Si realiza la respuesta en Rb el programa de reforzamiento también sera de intervalo variable, pero esta vez de 2 minutos (obtendrá 30 reforzadores en una hora). El sujeto ralizará aquella respuesta que le cueste menos esfuerzo y le traiga mejores resultados (criterio de optimización). Lo más óptimo sería obtener los 90 reforzadores disponibles en una hora mediante la combinación de ambas respuestas (repartidads en proporción). Pero como un sujeto realiza este reparto de proporciones, nos lo explica la Ley de igualación: un individuo en situaciones de elección distribuye la respuesta proporcionalmente a la cantidad de reforzamiento. Entonces para calcular la distribución de las respuestas es necesario calcular las tasas de reforzamiento, que corresponderan con la proporción de cada tipo de respuesta: = Programa A IV 1: 60 reforzadores Programa B IV 2: 30 reforzadores La “M” hace referencia a la magnitud de la recompensa, por ejemplo: el número de bolitas de comida. Programa A IV 1: 60/60+30 = 0,67 Debe reunir las dos acciones en una sola. Programa B IV 2: 30/60+30 = 0,33 Según la ley de igualación esta rata realizará el 67% de las respuestas en Ra y el 33% en Rb. Control de la conducta por el estímulo ¿Qué función cumple el estímulo discriminativo en el condicionamiento operante? Hace de clave indicadora que informa al sujeto de que si en su presencia realiza una determinada respuesta instrumental, recibirá un determinado reforzamiento. a) Si la contingencia R > reforz (Ed+) b) Si la contingencia R > no reforz (Ed-) ¿En que se diferencia del EC pauloviano? En que el EC del condicionamiento clásico anuncia la aparición del EI (haga lo que haga el sujeto), mientras que el Ed del condicionamiento instrumental no anuncia la aparición del EI directo, lo que anuncia es que está disponible y aparecerá solo si el sujeto emite una conducta específica. Cuando nos referimos a Ed (o a EC) no estamos hablando necesariamente de un estímulo discreto y puntual, puede tratarse de estímulos ambientales en general (contextuales) Pues bien, decimos que los estímulos ambientales pueden llegar a controlar la ejecución de una respuesta instrumental, pero ¿Qué aprenden los sujetos acerca de los estímulos para que esto pueda suceder? ¿como pueden los estímulos controlar la conducta? Los procesos de generalización y discriminación son procesos adaptativos que se derivan de esta cualidad del Ed. Un sujeto a través de ellos no necesita aprender lo mismo con cada estímulo según sea parecido o no al Ed inicial. Gradiente de generalización: representación gráfica del nivel de respuesta que se produce ante un reforzador. Pero esto sucede cuando hay una clave, que es lo que se denomina estímulo discriminativo: Cuando el estimulo discriminativo sufre pequeñas variaciones, es decir, cuando en el caso de la luz las variaciones de longitud de onda son muy pequeñas, el nivel de respuesta sigue siendo elevado. Un proceso inverso a esta generalización seria la discriminación, que se produce cuando antes estímulos similares no se realiza la respuesta porque se ha aprendidoque estímulos ligeramente diferentes al estímulo discriminativo condicionado instrumentalmente. Grupo 1: presentamos una luz pero en unos casos tiene una raya y en otros no. De tal forma, que cuando la paloma picotee la luz con raya obtendrá comida, y con la otra nada. Grupo 2: presentamos de nuevo la luz con y sin raya. Pero en este caso, cuando se enciende la que no tiene raya se obtiene comida, y en el otro caso no. Pero cuando rotamos esta línea de la luz, ¿hay generalización? En el grupo uno si que hay generalización (estímulos similares), pero en el grupo 2 la tendencia a responder se inhibe. Los Ed indican qué consecuencias se derivan de la conducta (controla la ejecución de la respuesta) A los sujetos se les enseña a presionar una tecla cuando está presente una luz. En cada prueba ese estímulo produce el nivel máximo de respuesta. También se observa que si en la prueba se presentan otros estímulos también provocan en mayor o menor medida la respuesta. Si se parecen al estímulo la respuesta es alta, si no se parecen al estímulo será en menor medida. A esto se le conoce como gradiente de generalización que relaciona la semejanza física de los estímulos. El proceso inverso a la generalización es la discriminación. ➢ Factores que contribuyen a una mayor generalización o Semejanza física o Grado de experiencia previa • GRADIENTES DE GENERALIZACIÓN Existe generalización del estímulo siempre que el sujeto no responde de forma diferencial a estímulos distintos; se observa el mismo nivel de conducta ante estímulos diferentes. En el experimento de Guttman y Kalish (1956) sobre el gradiente de generalización, reforzaron a palomas en un programa de IV para que aprendieran a picotear una tecla iluminada con una luz naranja-amarillenta (longitud de onda de 580 nm). Una vez adiestradas, se repitieron los ensayos pero variando la longitud de onda de la luz. La tasa de respuesta que se registró con cada valor fue la que se indica en el dibujo. Este tipo de resultado se conoce como gradiente de generalización y depende de dos factores: o La semejanza de los estímulos del ensayo con el estímulo que fue condicionado o La experiencia previa que haya tenido el sujeto con dicho estímulo La pendiente del gradiente de generalización puede utilizarse como medida del punto hasta el cual la característica del estímulo que estamos variando controla la conducta de los sujetos. Volviendo al experimento anterior, imaginemos como sería el gradiente de generalización si las palomas fuesen daltónicas (la característica longitud de onda no controla la conducta de ningún modo). • DISCRMINACIÓN. ENTRENAMIENTO PREVIO Existe discriminación cuando el sujeto reacciona de forma diferencial a estímulos parecidos. Como ya hemos dicho, no solo las diferencias físicas entre los estímulos posibilitan la discriminación si no también la experiencia previa que haya tenido el sujeto con el estímulo en el pasado. Por ejemplo los músicos son capaces de detectar cuando una nota está desafinada aún cuando la desviación sea mínima. La experiencia repetida con los sonidos desde pequeños genera cambios a nivel cerebral que les permite percibirlos y discriminarlos finísimamente. Por ejemplo los esquimales tienen 30 palabras que significan blanco, nosotros no distinguimos tantos matices. ▪ El efecto de la discriminación sobre el control por el estímulo experiencia repetida con estímulos en laboratorio que consigue generar una respuesta diferencial a un estímulo (E+) y un estímulo (E-) En el experimento de Jenkis y Harrison investigaron la forma en que estímulos auditivos de diferentes frecuencias controlaban la conducta de picoteo de palomas reforzadas con comida. Hay dos tipos de procedimientos de adiestramiento. Se hallo el gradiente de generalización: El grupo 1 tiene un gradiente menos empinado. El grupo 2 tiene un gradiente más empinado (más discriminación, control por el estímulo más intenso) ▪ ¿Qué se aprende en el entrenamiento de discriminación? Caben tres posibilidades: ➢ Que solo aprenda algo sobre E+ (“responde cuando se presente E+”) y nada sobre el E- (no sería relevante) ➢ Que solo aprenda algo sobre el E- y nada sobre el E+ (“no respondas cuando esté el E-“) ➢ Que aprenda algo sobre los dos estímulos “responde con el E+ y no respondas con el E-“ La teoría de la excitación-inhibición sobre el aprendizaje de la discriminación de Spencer aboga por esta tercera posibilidad. La respuesta diferencial al E+ y al E- refleja la excitación y la inhibición que se han condicionado al E+ y al E- respectivamente. El experimento de Honing, Boncau & PennyPacker (1963) sobre la evaluación experimental de esta teoría fue un entrenamiento diferencial con dos grupos de palomas: El sujeto tiene que tocar una tecla que es una luz (Ed) En dos grupos se produce la misma experiencia. Los estímulos en los dos grupos son los mismos pero desempeñan distinta función informativa de lo que pasará tras realizar la conducta (consecuencia) En el grupo 1, si picotean cuando sale la luz con rayita hay comida y si la luz sin rayita no hay comida. En el grupo 2 es al revés: Una vez que han aprendido, se varía la orientación de la línea en distintos grados ¿Qué efecto vemos? En el grupo 1 el nivel máximo de respuesta es el que estuvo presente en el entrenamiento. Al modificarse el estímulo se modifica gradualmente el grado de respuesta. Es de tipo excitatorio (generaliza la tendencia a responder) Depende de la semejanza de los estímulos. En el grupo 2 generaliza la tendencia a no responder, es de tipo inhibitorio. Encontramos dos tipos de resultados: o Gradiente de generalización del estímulo excitatorio (verde) (curva empinada que presenta la cantidad de respuesta más alta en E+ aprende) Generalizar a responder. o Gradiente de generalización del estímulo inhibitorio (amarillo) (los estímulos difieren cada vez más del E-, son progresivamente menos eficaces que él para inhibir la respuesta instrumental) Generalizar a no responder. Con lo cual, este tipo de entrenamiento sirve para aprender acerca de los dos estímulos • DESPLAZAMIENTO DEL VÉRTICE (no examen, solo leer) El fenómeno que vamos a estudiar es el resultado del entrenamiento de discriminación, intradimensional, es decir, el E+ y el E- son estímulos del mismo tipo (auditivos, visuales, táctiles…) y que solo difieren en una característica estimular (frecuencia, longitud de onda, grados de temperatura…) El experimento de Hanson (1959) investigaba hasta que punto los distintos colores controlaban la respuesta de picoteo en las palomas. Al hallar los gradientes de generalización hallo algo muy particular, encontró que cuanto más parecido era el E-al E+, los sujetos mostraban un desplazamiento del máximo de las respuestas respecto al E+ original. Este fenómeno se llama desplazamiento del vértice. Aprendizaje de escape/evitación Paradigma para estudiar la conducta motivada aversivamente (nos impulsan a realizar ciertos actos) por ejemplo cuando estamos encerrados en el ascensor nos instiga a realizar ciertas conductas. Otro ejemplo sería irte de clase porque te aburre, discutir con alguien y antes de que llegue a mayores la discusión marcharte…Esto tiene que ver con conductas de escape provocadas o motivadas por situaciones aversivas. Una caja de evitación es un aparato de condicionamiento dividido en dos partes por una compuerta. Tenemos a la rata en una parte y se le puede dar un estímulo aversivo. La avisamos de que le vamos a dar una descarga mediante un tono o una luz. La luz por ejemplo tiene una duración de 30 segundos y nada más terminar le damos la descarga. Una respuesta natural en el miedo es la de huir, por lo que puede saltar al otro compartimento.La respuesta del sujeto de interrumpir el estímulo aversivo (interrumpir la descarga) se conoce como escape (se evita un estímulo que ya se recibió en parte) en el caso de que ya tuviese asociada la luz con la descarga y supiese que después de uno viene lo otro, puede anticiparla. En este caso la respuesta no interrumpe el estímulo aversivo sino que lo evita. No son hechos distintos sino dos fases. Para evitar primero tenemos que tener experiencia (por ejemplo el hospital para evitarlo has tenido que experimentarlo previamente) Es el tipo de aprendizaje derivado de una experiencia de castigo positivo. • Aprendizaje de Escape (interrumpir) El sujeto aprende que realizando una respuesta determinada es capaz de interrumpir la estimulación aversiva. Por ejemplo cuando nos quemamos la piel, sabemos que si nos echamos “aftersun” nos calma el dolor. El sujeto interrumpe un estímulo aversivo que ya se está produciendo. • Aprendizaje de Evitación (antes de que aparezca) El sujeto anticipa que se va a presentar una estimulación aversiva y realiza una respuesta que la impida (por ejemplo echa crema solar para no quemarse) El sujeto anticipa una respuesta, eludiendo la presentación del estímulo aversivo. Para que haya evitación es necesario que haya experiencia previamente (es necesario que haya antes escape) Así, no son dos tipos independientes de aprendizaje sino dos fases de un único proceso de aprendizaje. Son dos fases de un mecanismo común. o Evitación discriminada (se presenta un estímulo concreto, por ejemplo la luz, que anticipa la estimulación aversiva) En este tipo de evitación, el estímulo adquiere propiedades motivacionales. o Evitación no discriminada (no hay ningún tipo de estimulo concreto que anticipe la estimulación aversiva, lo que ocurre es que puede emplear claves ambientales o temporales propias. Por ejemplo la rata aprende que la descarga aparece cada 10 segundos. Al aprendizaje de claves temporales sobre el ambiente se le llama “timing” • Estudio del aprendizaje de escape/evitación Para estudiar las respuestas de escape evitación se emplea la caja de Sidman o caja lanzadera. Tiene dos compartimentos adyacentes separados por una tablilla. Si se administra una descarga en un compartimento el sujeto puede escapar/evitarla saltando al otro compartimento. Para medir la eficacia de este aprendizaje se registra la latencia de respuesta. • Factores que determinan la eficacia del aprendizaje de escape/evitación Intensidad de la descarga Demora de la recompensa (la recompensa aquí sería la reducción de la estimulación aversiva) Dificultad de la tarea (si la respuesta de escape o evitación es demasiado compleja, por ejemplo saltar una valla de 3m, es previsible que el sujeto no lo aprenderá) Controlabilidad (capacidad percibida por el sujeto para librarse de la estimulación aversiva mediante alguna respuesta) ¿Qué factores contribuyen a que sea más eficaz? La intensidad y que los hechos sean de forma inmediata o demorada. A más latencia aprende más rápidamente. Teoría bifactorial de Mowner (1956): teoría biprocesal del aprendizaje de escape. Cree que el aprendizaje de escape/evitación está compuesto por dos factores o procesos o Proceso de condicionamiento instrumental (aprende a utilizar respuestas presentes en un repertorio conductual para evitar o interrumpir la estimulación, por ejemplo saltar. El refuerzo aquí es la reducción del miedo (luz respuesta no descarga) La luz es un Ed o Proceso de condicionamiento clásico (El sujeto asocia ciertos estímulos ambientales o concretos con la inminente aparición de un estímulo aversivo. Esos estímulos se convierten en estímulos condicionados por condicionamiento clásico excitatorio, por eso motivan al sujeto a realizar la conducta. El condicionamiento clásico no es un proceso simple de aprendizaje por contigüidad, el sujeto aprende a dar respuestas, que las claves del ambiente dan lugar a que haga respuestas…. 3) Motivación de incentivo (estímulos del ambiente se asocian con estímulos que de forma refleja suscitan una conducta, anticipación de consecuencias positivas) 4) Incentivo condicionado (inicialmente estímulo neutro que adquiere valor motivacional) (luz - descarga) Para Hull el condicionamiento excitatorio, la fuerza de respuesta (la magnitud o intensidad de una respuesta) depende de muchos factores y uno de ellos es la habituación. La K, viene por K Spence (incentivo) Hull y estos autores decían que además se producían dos procesos de aprendizaje al mismo tiempo: con su acción aluden a un hecho aversivo y producen un CC pauloviano (los estímulos que preceden a la conducta se asocian con un hecho aversivo) el sujeto recibe la descarga alguna vez por lo que se relaciona la luz con el estímulo aversivo (CC) ¿Cómo llamamos a ese CC? Excitatorio, el miedo desempeña un proceso de motivación para desempeñar la conducta aprendida. Indefensión aprendida Selligman, Overmeier y Maier (1967) investigaron los efectos de la exposición a una estimulación aversiva incontrolable sobre el posterior aprendizaje de escape/evitación. El hallazgo común fue que la exposición a una experiencia de incontrolabilidad interfiere sobre el posterior aprendizaje de respuestas instrumentales. EXPERIMENTO DE LA INDEFENSIÓN APRENDIDA (Selligman & Maier) En escape el sujeto logra controlar el acceso a situaciones aversivas. Sin embargo en muchas situaciones no logramos controlarlos. Es más, a veces independientemente de la conducta las consecuencias negativas aparecen igual. Hay ocasiones en las que el sujeto no consigue realizar conductas para evitar el estímulo aversivo (por ejemplo cuando se le dan descargas haga lo que haga) Si cuando está en el compartimento A se le da la descarga y cuando está en B no se le da la descarga hablamos de escape o evitación. Sin embargo, si cuando está en A hay descarga y cuando esta en B también el sujeto sabe que no puede escapar a la descarga por lo que hablamos de indefensión aprendida. El sujeto no logra aprender a evitar estos estímulos negativos. Esto está relacionado con estados de ánimo negativos como por ejemplo la depresión. Se lleva a cabo un experimento de dos fases con 3 grupos de ratas en “cajas lanzadera”. • FASE I (cada grupo tiene una experiencia previa distinta con la descarga eléctrica ninguna/controlabilidad/incontrolabilidad) • FASE II (entrenamiento de aprendizaje de respuesta de escape/evitación) ✓ Un grupo control donde se conoce de antemano lo que va a ocurrir. Al sujeto se le enseña a controlar por su conducta un hecho aversivo (puede cambiar al B y evitarlo) Cuando se mide la respuesta de escape tienen un número elevado. ✓ Otros antes de aprender a escapar (grupo 2) han recibido descargas inescapables (perros sujetos en un arnés). Ahora tienen debajo del hocico una tecla para poder escapar. Estos sujetos tienen esta experiencia en un tiempo y podían interrumpirla con la conducta (controlan el hecho aversivo) ✓ El otro grupo al realizar la conducta seguía recibiendo descargas (no pueden controlar el hecho aversivo) Los resultaros fueron: Los animales del grupo 2 mostraban una tasa mayor, sin embargo el otro grupo (el 3º) tenía un déficit conductual importante. No realizaba la conducta de escape (no tenían motivación, quedaban parados) a este efecto se le conoce como indefensión aprendida. Los perros de Selligman tenían marcadas deficiencias motivacionales. Algunos síntomas de la depresión tienen semejanzas (escasa motivación, aislamiento social, percepciones negativas, culpabilidad…) Esto guarda relación con un fenómeno de condicionamiento clásico llamado irrelevancia aprendida. Encontraron pues que la exposición a una estimulación aversiva incontrolada durante la fase I produceun déficit más grave en el aprendizaje de escape-evitación que la exposición a descargas de idéntica intensidad y duración, pero de las cuales se puede escapar. ¿Por qué ocurre esto? Algunos teóricos defendieron que no había aquí ningún tipo de aprendizaje, que el déficit conductual de los sujetos (G2) en la fase II se debía simplemente al efecto físico que causaba tanta descarga eléctrica (entumecimiento de los músculos para responder) Sin embargo, lo que realmente sucede es que lo que defendían Selligman, Overmaier y Maier en su hipótesis de indefensión aprendida es que durante la exposición a descargas incontroladas, los animales aprenden que las descargas son independientes de su conducta y que no hay nada que ellos puedan hacer para evitar recibir descargas. Durante el entrenamiento instrumental siguiente, esta expectativa adquirida de una contingencia cero entre las respuestas y la descarga interfiere con el aprendizaje de que la conducta puede controlar las presentaciones de un reforzador. Los efectos se manifestaron el diferentes ámbitos del comportamiento. Se producen deficiencias para realizar nuevos aprendizajes, deficiencias motivacionales, alteraciones emocionales, deficiencias cognitivas, deficiencias conductuales, estrés… modelo de depresión animal. Para que la alteración de los del grupo de escape fuese menos severa les enseñaríamos a controlar estímulos aversivos, y esto se transfiere a los demás ámbitos. La indefensión aprendida se emplea tradicionalmente como modelo animal de los fenómenos que subyacen a la depresión en humanos. Un historial de falta de control sobre los reforzadores puede desorganizar gravemente la conducta instrumental, generar déficits motivacionales, cognitivos, afectivos… La falta de control puede ser objetiva (real) o subjetiva; es decir; debido a las atribuciones causales que el sujeto hace de hechos aversivos. Si tiende a hacer interpretaciones: ▪ Globales (“siempre ocurre así”) ▪ Internas (“ es que soy un inútil, es mi culpa”) ▪ Estables (“haga lo que haga no va a cambiar”) …de los fracasos o experiencias aversivas, tienden a reprimir la conducta instrumental de escape o evitación. Por ejemplo la experiencia con los exámenes. Aprendizaje incentivo Consiste en aquel aprendizaje acerca del valor incentivo (reforzante) del reforzador. Experiencia con el reforzador en el estado de motivación relevante. Tolman entre los mecanismos de aprendizaje hablaba de aprendizaje cathexis. Decía que el aprendizaje del valor incentivo del reforzador estaba era resultante del condicionamiento biológico. Para Tolman además toda conducta tiene un fin, refleja una meta. Thondrike dice que se adquieren nuevos hábitos a través de la relación estímulo-respuesta y niega la existencia del aprendizaje instrumental. El aprendizaje, la emoción y la motivación están muy relacionados. Análisis teórico del aprendizaje -Motivación primera: Según Hulk una fuente de motivación es cualquier necesidad básica, pues da lugar a una conducta en busca de una recompensa que satisfaga esa necesidad. Dice que la fuerza con la que un sistema realiza un aprendizaje dependerá de una serie de factores, como el reforzamiento previo, el valor incentivo de este reforzador... Expresa este enunciado de forma matemática: La ralización de una respuesta será de mayor vigor si tiene un impulso motivador más elevado y por lo tanto también una mayor K que hace referncia al valor de incentivo que tiene el reforzador (el valor de incentivo de un reforzador dependerá de la experiencia previa del sujeto con ese reforzador y de sus condiciones biológicas). En este caso, como hemos visto, la K no hace referencia a una constante como es habitual, se elige esta letra en honor a Kendel, nombre de pila de un gran teórico. El estudio del apendizaje de incentivo se debe a Viennot Spence. -Contraste conductual: hace referencia al fenómeno que sucede en sujetos que reciben un mismo reforzamiento pero realizan ejecuciones distintas de la respuesta. Se debe al valor de incentivo del reforzador para unos y otros. El contraste conductual puede ser positivo (mismo reforzador supone una mayor ejecución en un grupo o grupos de sujetos) y negativo (el mismo reforzamiento supone una reducción en la realización de la respuesta). El contraste conductual influye y determina el aprendizaje instrumental. -Otras fuentes de reforzamiento: Son estímulos que provocan un valor estímulante en el sujeto por medio de estimulación sensorial. Estimulación eléctrica intracraneal: Odd y Milner cuestionaron el concepto de Hulk sobre la reducción de las necesidades básicas y estudiaron el condicionamiento instrumental sin reducir dichas necesidades por medio de este preocedimiento. El estudio que se verá más adelante fue llevado a cabo para probar la Teoría de la Sensibilización de Kennet Berridge que decía que la exposición repetida a drogas potencialmente adictivas es capaz, en sujetos susceptibles y bajo determinadas circunstancias, de alterar de forma persistente células y circuitos cerebralesnormalmente destinados a la normal regulación de la atribución de la saliencia a los estímulos, un proceso que se encuentra dentro del comportamiento motivado.La naturaleza de estas neuroadaptaciones es lograr la hipersensibilización (sensibilización) de estos circuitos, de forma que resulta en una atribución patológica de los niveles de saliencia de incentivo a la droga y los estímulos asociados con ella. El estudio estaba orientado a conocer como se activaban determinadas áreas del cerebro cuando aumentaba el valor incentivo del reforzador. Experimento: A una rata en una caja se le inyecta anfetamina, que funciona como reforzador. En una fase de entrenamiento previa a la inyección se le presentaron dos estímulos, y tras un click se le inyecta la droga (condicionamiento clásico). Luego pasaron a medir la frecuencia con la que realiza una respuesta instrumental y los resultados obtenidos demostraron que en el caso de la rata a la que se inyectó la anfetamina, tras el click la tasa de respuesta era más alta. Más adelante David Premack descubrió que hay más efectos provocados por el valor motivacional del reforzador, como por ejemplo efectos sobre la probabilidad de producirse una determinada respuesta. Dadas dos respuestas A (actividad de beber, con gran frecuencia de aparición) y B (correr, baja frecuencia), se dice que B>A (B refuerza A, la de menor frecuencia provoca la de mayor). La frecuencia o probabilidad de una respuesta se calcula de la siguiente manera: Probabilidad de una respuesta = Tº invertido en la Rª/ Tº total Llamamos reforzantes no a los estímulos neutros, sino a la estimulación de actividades y a la fuente de reforzadores. Teoría de la expectativa del condicionamiento (Dickinson) La ejecución instrumental depende de la interacción de dos procesos: -Conocimiento contingencia instrumental previo : aprendizaje respuesta- consecuencia -Aprendizaje de incentivo: propiedades de incentivo del reforzador. La fuerza de una respuesta instrumental depende de la experiencia previa del sujeto con el reforzador y sus consecuencias, el aprendizaje del valor incentivo del reforzaor (se aprende en condiciones motivacionales adecuadas y se llama aprendizaje motivacional de incentivo llamado por Dickinsonn aprendizaje Cathexis). Experimento: Dos grupos de sujetos (ratas) que se condicionan instrumentalmente a accionar una palanca para obtener dulce de sacarosa. En una siguiente fase a un grupo (dev) se le inyecta una sustancia (litio) que lo hace sentir indispuesto después de la toma de la sacarosa. Al otro grupo se le inyecta también está sunstancia pero sin relacionarla con la sacarosa. Finalmente en una tecera fase de prueba se mide la tasa de respuestas al presentar losestímulos que anuncia que la sacarosa está disponible para ambos grupos. Pretenden comprobar si el grupo Dev recuerda las consecuencias de su conducta. El tipo de aprendizaje que se produce en este caso fue denominado por Dickinson aprendizaje de incentivo (a cerca del valor motivacional de un evento). TEMA 6: CONDICIONAMIENTO DEL APRENDIZAJE Se puede pensar que no es necesario que dos estímulos se encuentren próximos en el tiempo para que se establezcan asociaciones entre uno y otro. AB R.A Rescorte decía que para que se produjera el condicionamiento no bastaba con que se presentase a un sujeto el EC-EI vrias veces. Tiene que inferir el nexo causal entre los estímulos, y el sujeto luego decide si A es la causa de B. El EI puede ir precedido de dos o más claves (EC1, EC2...): No se condicionan por igual los estímulos. El sujeto decide cual es el estímulo que infiere la respuesta o no. A veces a este proceso selectivo se le da valor de información, adquirida en la experiencia previa. Buscar sobreexpectativa: la contigüidad no es una condición suficiente para el aprendizaje. Noción de contingencia (consistencia EC-EI) En este caso existe una contigüidad positiva espacio-temporal. Si se presenta un estímulo las mismas veces que otro que lo sigue inmediatamente tienen la misma contingencia espacio-temporal. El sujeto identifica la causa social de los elementos. Teoria de la contingencia de Rescorla La teoría de la contingencia dice que la contigüidad temporal del EC– EI no garantizan que se produzca el condicionamiento, sino que hay consistencia entre los estímulos. La contingencia depende de dos probabilidades: P1= Pr (EI/EC) > idea de contigüidad clásica. EC > EI (siempre). Condicionamiento excitatorio. P0 = Pr (EI / no EC) En 1966 Rescorla llevó a cabo el siguiente experimento en una caja con dos compartimentos. En uno de ellos se suministra una descarga al sujeto que para evitarla debe saltar al otro compartimento. En una primera fase se condiciona a todos los grupos a saltar al otro compartimento para evitar la descarga (R>no descarga). En una segunda fase se presenta un tono de distinta manera para los tres grupos (fase de condicionamiento clásico): -Positiva (la probabilidad de que el tono vaya seguido de la descarga es mayor de la de que el tono no vaya seguido de la descarga) -Cero (ambas probabilidades son iguales) -Negativa (la probabilidad de que el tono vaya seguido de la descarga es menor de la de que el tono no vaya seguido de la descarga) En una última fase se presenta únicamente el tono y se mide la tasa de respuestas de evitación de cada grupo. La tasa de las respuesta de evitación en cada grupo depende entonces de la capacidad del EC para producir la descarga. Grado de contingencia positiva P1 = P(EI/EC) (proporción entre las veces que aparece el EI y el EC) P0 = P(EI/noEC) (proporción entre las veces que aparece el EI sin el EC) El grado de contingencia se calcula restando P1-P0. Cuando el resultado es 0 se alcanza un estado de irrelevancia aprendida (puntos sobre la diagonal). En el cuadrante rosa se corresponde a los puntos en los que P1>P0, se trata de condicionamiento excitatorio. El cuadrante azul se trata de los puntos en los que P1 P1-P0 = 0 Segundo grupo: en cada sesión se le presentaba un estímulo sonoro 10 veces y de tres minutos de duración y se le da el EI 2 veces. P1 = 0 P0= 0,2 > P1-P0 = -0,2 Los demás grupos se condicionaron de forma que en el grupo tres P1-P0= - 0,4 y en el grupo cuatro P1-P0= -0,8 A medida que aumenta el P1 – P0, la capacidad inhibitoria del sonido hacia la RC que provoca la luz aumenta. Se trata entonces de una contingencia negativa (inhibitoria). Contingencia en el aprendizaje instrumental La contingencia en el aprendizaje intrumental se da por medio de aprendizaje asociativo, un estímulo puede dar lugar a una postura o eludirla. Juicios de contingencia Por ejemplo surgen de tareas como el diagnóstico médico en el cual el doctor a partir de nuestro mal estar debe generar un juicio de contingencia para aportarnos eltratamiento adecuado. Tareas conductuales Intentan formular un juicio de contingencia entre las probabilidades de las consecuencias y las de las respuestas. Experimento: A unas ratas se les refueza intermitentemente con sacarosa la hora de realizar determinada respuesta. Despues en una fase posterrior a unas ratas no se les refuerza en ausencia de las respuestas y a las otras se les da el reforzador sin necesidad de que realicen la respuesta. En aquellas ratas a las que solo se les reforzó en presencia de las respuestas (Pr =1) se obrservó una alta tasa de respuesta, sin embargo en las que fueron reforzadas en ausencia de la respuesta (Pr>1) la tasa de respuesta cayó. En el ámbito de la contingencia positiva entre Ed y consecuencias de la respuesta la tasa de respuesta disminuye a medida que aumenta la aparición del reforzador en ausencia de la respuesta. Como conclusión de la Teoría de la Contingencia podríamos decir que el condicionamiento es el proceso psicológico básico que nos permite identificar estímulos del entorno. TEMA 7: REPRESENTACIÓN DEL CONOCIMIENTO Representación: Naturaleza. Información almacenada y codificada en la memoria. La exposición a estímulos del ambiente produce patrones de actuación sensorial que a su vez causan cambios neuronales. Tipos de conocimiento: -Declarativo -Procedimental Incluso las experiencias más simples pueden dar lugar a estos dos tipos de conocimiento. Existen distintos tipos de asociación: el sujeto realiza asociaciones a medida que en los procedimientos de condicionamiento se hacen inferencias con estímulos del entorno. Las condiciones se corresponden a las circunstancias en las que se produce un fenómeno (cuándo) del aprendizaje e implican conocimientos a nivel de memoria. El contenido o lo qué se aprende hace referencia a la naturaleza asociativa del aprendizaje. En cuanto a los mecanismos nos referimos a la expresión conductual a través de los mecanismos del aprendizaje. Por ejemplo en el condicionamiento clásico, una asociación de estímulos (EC-EI) nos confiere una asociación de respuestas (conductual) (RC-RI). Representación del conocimiento: Se realiza a nivel interno y puede ser: -Declarativo: Conocimientos generales del mundo, históricos, etc. -Procdimental: Conocimiento a cerca de cómo actuar ante un estímulo o que hacer frente a determinada situación. Ejemplo: ¿Qué puede haber aprendido el sujeto en este ejemplo? De forma declarativa: Cuándo De forma procedimental: Acercarse a la comida o prepararse para ella. Estose debe a que en la memoria esta presente la relación entre los estímulos y el concepto de los mismos. La asociación entre estímulos forma parte del conocimiento declarativo (consciente) y es en la asociación estímulo-respuesta cuando hablamos de conocimiento procedimental. En un experimento realizado por Bechlezer, este examinó el condicionamiento aversivo en perros. Se les presentaba un sonido seguido de una descarga en una pata, lo que les producía una respuesta refleja de contracción de esa pata. Tras varias pruebas iguales la presentación del solo sonido producía esa respuesta de contracción de la pata (RC). Esta respuesta en los perros era debido a que en su memoria el sonido se codificaba como causa del EI y ese recuerdo es el que provocaba la respuesta. Para llegar a esta conclusión el investigador realizó el mismo experimento inyectando a la vez que la descarga una sustancia que provocaba una parálisis (curane). Asi fue que en las sesiones de condicionamiento al producirse la descarga e inyectarse el curane, no se producía la respuesta refleja por la parálisis producida por la sustancia. Sin embargo en la fase de prueba en la que solo se presentó el sonido, los perros realizaron la respuesta de contracción de la pata. Esto indica que el sonido activaba información sobre el elemento asociado (descarga) pero en el momento del condicionamiento no fue posible su expresión porque estaba bajo los efectos de la sustancia. Otros experimentos a cerca de esto Técnica de devaluación del EI Mediante una técnica de condicionamiento clásico condicionamos a un sujeto hasta que salive en presencia de un EC (sonido) por la anticipación de un EI apetitivo (comida) > emisión de RC. Una vez alcanzado este objetivo se procede a la devaluación de EI provocando un malestar al sujeto al ingerir la comida. Este proceso se realiza en ausencia del EC. Posteriormente se le presenta al sujeto el EC. Se pueden producir dos sucesos que el sujeto presente la RC de salivación (la relación EC-EI > EC-RC etá aún en la memoria del sujeto y provoca la respuesta a pesar del valor que se tenga ahora de esa relación) o que el sujeto no presente la respuesta (se produce una relación E-E, y no se presentará la respuesta de salivación ni en presencia del EI porque el recuerdo esta almacenado en la codificación que se tiene de ese estímulo). La relación E-R no implica aprendizaje alguno sobre la asociación comida-malestar. Experimento de Holland and Straub (1979). Devaluación del EI. Realizaron el experimento anterior con dos grupos de ratas. A ambos grupos se les condicionó de manera que salivaran ante la presencia de un sonido (EC)por la anticipación de la comida (EI). Posteriormente dividieron a los sujetos en dos grupos uno EXPERIMENTAL en el que el EI fue devaluado por medio de una inyección de litio que les provocó malestar gástrico y un grupo de CONTROL al que se le inyectó una sustancia que no provocó consecuencias. Luego se midió la respuesta de aproximación al comedero en presencia del sonido y el grupo experimental mostró una clara deficiencia en la realización de dicha respuesta. Experimento del conocimiento declarativo. Holland 1990. A una serie de ratas sedientas les presentaba dos sonidos distintos en todas las sesiones cada 10 segundos. Cada sonido se asoociaba a un sabor determinado, eran estímulos distintos. Después de que en la fase de condicionamiento se consiguiera que las ratas realizaran la respuesta de salivación frente a ambos estímulos en la mayor tasa posible se procedió a la segunda fase, la de devaluación del sabor 2 sin ir prescedido de ninguna clave. Así fue que en la fase de prueba en la que se presentaron ambos estímulos, el tono asociado al sabor no devaluado aumentó su tasa de respuesta mientras que el tono asociado al sabor devaluado la redujo. El condicionamiento clásico niega entonces que se adquiera conocimiento procedimental, lo fundamental en el aprendizaje es el recuerdo de las consecuencias que produce un estímulo. Representación atributos sensoriales y hedónicos. Teniendo en cuenta los distintos atributos del EI ¿cómo podemos examinar las valoraciones afectivas de un estímulo? A través de sus reacciones reflejas, pues expresan el valor hedónico y podemos calcular su índice conductual. Emoción y valoración afectiva Sabemos que tanto en ratas, como en monos y niños se dan unos patrocnes de movimientos de laboca que reflejan los valores hedónicos de los estímulos que se les presentan. Los sabores hedónicos provocan movimientos de la lengua, de las patas en las ratas... Los sabores aversivos por su parte provocan que se escupa la sustancia, arcadas, respuesta de limpieza bucal... Holland estudió la valoración afectiva en 1990. Presentó a los sujetos de manera alterna dos tonos T1 y T2 y mediante una cánula se les inyectaba una sustancia agradable para producir la máxima respuesta condicionada en ambos casos. En la fase 2, se devalua el sabor 2 por medio de una inyección de litio. En la fase de prueba comprueba que ante el estimula T2 disminuye la respuesta de ingesta (salivación) y aumentan las respuestas de carácter aversivo debido a que el sabor le recuerda el malestar y se ha vuelto desagradable. Es decir las ratas conocían las consecuencias que se derivaban de cada proceso (conocimiento declarativo). Holland: Efecto de la lesión de la amígdala. Se realizó con un grupo de ratas en el que se les provocó la devaluación de la comida. Sin embargo se repartieron en dos grupos: EXPERIMENTAL (antes de la devaluación se les lesionó el área de la amígdala) y CONTROL (sin lesión). El grupo experimental no cambiaba la valoración hedónica de la comida debido a la lesión producida, la comida les resultaba apetecible a pesar de que les produjera malestar gástrico. En la representación la zona de naranja (d) muestra la actividad de las distintas zonas cerebrales de aquellos sujetos que se han sometido a una devaluación. La azul simplemente la de aquellos que se han presentado al sabor tal cual, sin ser devaluado. Saciedad sensorial explícita: como se devalua un reforzador (figura d) Aprendizaje instrumental Distintos tipos de asociaciones: Asociación E-R, (estímulo respuesta) según Thorndrike el aumento de la intensidad de la asociación E-R crea un hábito. Tipo de conocimiento procedimental, el sujeto aprende que tiene que hacer ante una determinada estimulación. Asociación R-O (Respuesta – reforzador/consecuencias), para Tolman las respuestas tienen una intencionalidad dependiendo del resultado que va a obtener el sujeto. Tipo de conocimiento declarativo. Representa o recuerda los atributos del reforzador. Asociación E-E (estímulo – reforzador/consecuencias). Si obviamos la respuesta intermedia, en el cond. Instrumental se puede producir una asociación entre el estímulo y sus consecuencias. Dickinson ante este debate distinguió dos tipos de respuestas: aquellas en las que la ejecución depende del establecimiento de un hábito y aquellas en las que la ejecución depende de la anticipación de un reforzador (acción). E>>>>R (hábito) Se forman a partir de la relación estímulo-respuesta. E>>>>Ref (acción) son denominados actos instintivos, y dependen de las conseciencias que se desprenden de la acción. Este estudio fue realizado por Dickinson. Se condicionó a unas ratas a realizar una respuesta para obtener un reforzador determinado (apetitivo). Posteriormente se procede a la devaluación del reforzador. Tras estas dos fases decidió realizar una tercera fase de extinción de la respuesta para ver si era muy rápida (valor aversivo del ref) o lenta (no valor aversivo del ref). Si las ratas adquirieran un hábito E-R mecánico, no tendrían recuerdos de los atributos delreforzador en la fase 2 y en la fase de extinción realizarían muchas veces la respuesta. Si las ratas aprendieran a cerca del valor del reforzador (R-Ref), lo reconocerían en la fase 1 como algo positivo y a partir de la 2 como algo negativo. Por lo que en la fase de extinción disminuiría su respuesta por las consecuencias que se esperarian de ella. Las ratas NO realizaron la respuesta debido a que recordaban el atributo del reforzador y la ejecución quedó mediada por las consecuencias de la conducta en el condicionamiento instrumental. Adams (1982) Propuso y realizó un experimento en el que comparaba, la extinción de la respuesta en dos grupos que variaban en la cantidad de entrenamiento que habían recibido. DEV-100 (4 fases de entrenamiento, 100 reforzadores) y DEV-500 (más sesiones y 500 reforzadores). En ambos casos se devaluó el reforzador. Luego se estudió la extinción de la respuesta. En el grupo de entrenamiento limitado, mayo velocidad de extinción, menos respuesta instrumental (Asociación R-Ref, acto instintivo) En el grupo con mayor entrenamiento se produce una reducción menor de la respuesta, una extinción más larga (asociación E-R, hábito. Con mayor cantidad de entrenamiento un acto instintivo puede conertirse en un hábito rutinario debido a la mayor asociación E-R. Esto puede observarse en el consumo de drogas, que las primeras veces se realiza en busca de unas consecuencias (efecto reforzante) y tras repetidas consumiciones se convierte en un acto rutinario independiente de sus consecuencias. Regulación emocional de la conducta: ¿Qué pasaría se impedimos que se se procese la información afectiva de los estímulos a nivel cerebral? Hatfield con procesos de devaluación lo comprobó tras comparar dos grupos de ratas, uno de ellos con una lesión en la amigdala (relacionada con el procesamiento del valor afectivo) y otro de control. Si el valor afectivo del reforzador era en la fase de extinción aversivo, cabía esperar una rápida extinción de la respuesta. En el grupo de control los sujetos en los que se produjo la devaluación, redujeron considerablemente su respuesta frente al estímulo. Los sujetos con la lesión previa en la amigdala se comportaron de forma indistinta. Sin embargo otras estructuras interfieren en el valor afectivo de los reforzadores (corteza gustativa en aversión al sabor) y este fenómeno fue sometido a estudio también. En el grupo de control los sujetos no sometidos a la devaluación presentaron una extinción lenta y los sometidos a la devaluación, casi desde el primer momento, dejaron de dar respuesta. El grupo con la lesión en la amígdala y el cortex gustativo se comportaron aparentamente igual. Elección de la respuesta (experimento realizado en humanos) Se colocaba a los sujetos frente a un proyector en el que se le presentaban una serie de láminas con dos estímulos cada uno. Dos estímulos eran invariables, uno se asociaba con la ingesta de un vaso de tomate y el otro con la ingesta de un vaso de zumo de tomate. Previo a este condicionamiento se pedia a los sujetos que valoraran de -10 a 10 ambos sabores. Posteriormente al entrenamiento se procedía a devaluar el chocolate en unos sujetos y el tomate en otros. Luego se les dejaba elegir entre dos diapositivas cual era su preferida. En los últimas pruebas la preferencia de las diapositivas del sabor devaluado caía en picado. Se registró también un incremento en la actividad de la amígdala cuando se veían estímulos que preveen consecuencias negativas. Función de los estímulos Parte del comportamiento refleja el conocimiento previo sobre las consecuencias de la conducta (declarativo) pero si los actos no se desprenden de las consecuencias son conocimientos pocedimentales. Si obviamos la respuesta en el condicionamiento instrumental observamos que existe contingencia temporal entre el estímulo y las consecuencias. Existen unos factores que contribuyen al establecimiento de una conducta aprendida. Factores biológicos Factores adquiridos (motivación de icentivo) aprendizaje sobre el carácter fectivo del reforzador. Encamina la conducta del sujeto a la cnsecución del reforzador. Funcion asociativa entre el estímulo y las consecuencias y función moduladora que que produce una respuesta en presencia del estimulo que en el pasado estaba encaminada a la consecución del reforzador. Un ejemplo de esto se demuestra en la Tª bifactorial, el Ed indica la relación entre la respuesta y sus consecuencias. Consta de una fase de condicionamiento clásico (Luz – Descarga) y condicionamiento instrumental (Luz – Respuesta – No descarga). La latencia de la respuesta en presencia y ausencia de la luz varía por la asociación establecida E-E. Asociación jerarquica En presencia del estímulo (determinadas situaciones) la respuesta traerá unas consecuencias. En presencia de una luz la R1 produce la obtención de un Ref1 y en presencia de un sonido una R2 produce la otención de un Ref2. En esta prueba frecuencia de la respuesta no está determinada por la cantidad de reforadores sino por el estímulo que se presenta. La función moduladora de los estímulos influye en la frecuencia con la que se realiza una respuesta en presencia de un estímulo. Acción, hábito y drogas de abuso. En resumen sabemos que hay varios tipos de asociación posibles: Condicionamiento clásico: E-E y E-R Condicionamiento instrumental: E-R (hábito) y E-Ref (actos instintivos) Dickinson desarrollo en el ámbito del Condicionamiento instrumental la Tª sobre la expectativa del condicionamiento en la que los actos intintivos eran producidos por las consecuencias que traería la respuesta y los hábitos se producirían por una asociaciónde los estímulos con la propia respuesta. Ámbitos de aplicación ¿Pueden los mecanismos del aprendizaje asociativo dar respuestas a interrogantes sobre la adicción a las drogas? Tipos de asociaciones intrumentales: En la asociación E-E (estímulo reforzador) podemos encontrar el mecanismo que produce que los estímulos asociados al consumo de las drogas puedan motivar su búsqueda. Existen tres criterios de la adicción: 1º Búsqueda compulsiva de la droga en su ausencia. Un adicto es incapaz de refrenar los impulsos de búsqueda de la droga. 2º Las personas adictas están dispuestas a realizar un mayor esfuerzo conductual para obterner la droga. 3º Menor sensibilidad a efectos adversos (anticipación de consecuenccias negativas de las drogas). 1º Criterio: En una caja de condicionamiento a unas ratas se les presentan dos estímulos. Un Ed+ (luz verde) que indica la disponibilidad de la droga y un Ed- (luz roja) que indica la ausencia de droga. La respuesta que deben realizar las ratas en presencia del Ed+ es la de pulsión de una tecla para que se les inyecte la droga. Por un lado tenemos una rata no adicta, que realiza la respuesta únicamente en presencia del Ed+ (luz verde). Por lo tanto su conducta queda ligada a los estímulos del ambiente. Sin embargo tenemos una rata que ha tenido una experiencia prolongada previa con la droga, es adicta. Esta rata realiza la respuesta incluso en presencia del Ed-, su conducta escapa de su propio control, su impulso de búsqueda de la droga es irrefrenable. 2º Criterio En este caso se utiliza un prograa de reforzamiento de razón progresiva (el sujeto debe realizar cada vez más respuestas para la obtención de la droga). En primer lugar una rata no adicta realiza la respuesta hasta determinado punto (PUNTO DE CORTE: nmáximo nº de respuestas que un sujeto está dispuesto a realizar para obtener una droga). Sin embargo la rata adicta continúa realizando la conducta mucho más allá del punto de corte de la no adicta. Esta dispuesta a realizar un mayor esfuerzo para conseguir la misma cantidad de droga. 3º Criterio En este casofuncional) I.P. Pavlov (1949-1936) es el padre del condicionamiento clásico. Interesado en la fisiología y recibió el Nobel en 1904. Descubrió que tras la repetición de hacer sonar una campanilla, precediendo a la ración de comida, los perros salivaban (presentaban una respuesta fisiológica). Dicho aprendizaje podía medirse midiendo la cantidad de saliva producida (intensidad de la respuesta). Se llama reflejo condicionado a la presentación de una respuesta fisiológica frente a un estímulo arbitrario. Define condicionamiento como un proceso de aprendizaje que reporta ventajas adaptativas ya que permite anticipar los hechos relevantes de nuestro entorno (prepararnos para la comida, por ej.) Su experimento supone una demostración experimental de que no todos los reflejos son innatos y pueden ser creados por asociación (todo aprendizaje se reduce a la formación de hábitos por asociación de elementos). Desarrolla la Teoría de la sustitución del estímulo: EC (sonido de la camapanilla) sustituye al EI (presencia de comida). 4. REINADO DEL CONDUCTISMO 4.1. Thorndike (1874-1949) El conductismo americano. Aporta procedimientos y problemas para el estudio del aprendizaje instrumental. Desarrollo métodos para estudiar cómo se adquieren ciertas pautas de conducta: -“Caja Problema”: Cogía un gato y lo metía dentro. Había un pedal que al pulsarlo abría la puerta. El gato tenía que aprender a apretar el pedal para poder salir de la caja y llegar a un plato de comida que había fuera. Tomaba notas del tiempo que tardaba en abrir la puerta a medida que se repetía la experiencia. Para él el desarrollo de los hábitos consistía en establecer relaciones entre los estímulos y las respuestas (E-R, la respuesta correcta a un estímulo determinado daba lugar al hábito como resultado de la experiencia). Propuso una serie de leyes o principios para explicar este fenómeno: -Ejercicio o Práctica: el numero de ensayos favorece la conexión E-R -Ley del Efecto: si una respuesta en presencia de un estímulo va seguida de un suceso satisfactorio, la asociación entre el estímulo y la respuesta se fortalece (reforzamiento positivo) Más tarde fue llamado principio del reforzamiento) . Establece que la función de la consecuencia obtenida tras una respuesta es fortalecer o debilitar la relación E-R dependiendo de la naturaleza de dicha consecuencia (positivo o negativo). *Para él no hay intención, la consecuencia del aprendizaje es un hábito. 4.2. John Watson (1878-1958) Es el padre del conductismo americano. En 1913 publica “El Manifiesto Conductista”. El objeto de la psicología es la conducta observable y manifiesta (psicología experimental). Estudió la influencia del ambiente sobre los hábitos, concretamente se fijó en los estadios del miedo (emoción que provoca ciertas respuestas). Su experimento: Hizo que un niño pequeño cogiera miedo a un peluche de una rata. El niño al principio no le tenía miedo, lo cogía, lo acariciaba… pero Watson empezó a dar un golpe muy fuerte con una barra de hierro para que el niño asociara el susto por el estruendo, al ratón. Al cabo de un tiempo el niño había hecho una asociación por la que al final tenía miedo al ratón. Se llama miedo condicionado o adquirido (condicionamiento clásico). 4.3. Tolman: Conducta, cognición y propósito. Para Tolman el aprendizaje implica adquisición de conocimientos y la conducta no es más que una expresión del aprendizaje. Por lo tanto el aprendizaje no refleja necesariamente un resultado conductual (aprendizaje latente: el que se obtiene sin ser consciente de ello y no se presenta hasta que en un contexto determinado se expresa un cambio conductual) Tolman dice que el aprendizaje no puede considerarse solo como un movimiento mecánico causado por la contigüidad, sino que requiere un conocimiento (la conducta requiere propósito y el propósito cognición: no mecánica). Introdujo así el término de conducta propositiva (ejecuciones requieren de propósito y conocimiento). Distingue por lo tanto entre aprendizaje y ejecución, y establece la diferencia entre conocimiento declarativo y procedimental. Utilizó métodos más complejos de investigación (laberintos). A partir de sus experimentos con ratas dedujo que el animal no adquiere un hábito, si no que es su propósito el que lo mueve. En un laberinto con determinado recorrido una rata aprendía el camino para obtener comida, pero cuando se situaba a la rata en un laberinto radial, en lugar de usar el brazo por el que accedía a la comida en el laberinto anterior, usaba aquél que acortaría el recorrido hacia la comida. Desarrollo así la Tª de los mapas cognitivos, que consistían en una forma de aprendizaje latente (almacenamiento de conocimiento geográfico en la memoria que no se reflejaba hasta el cambio de laberinto). Así probó que el propósito era más fuerte que el hábito. 4.4. C. Hull y la motivación de la conducta (1874-1949). “Los organismos sufren privación, la privación crea necesidades, las necesidades activan pulsiones; el comportamiento es dirigido a metas y alcanzar metas tiene valor de sobrevivencia”. Incluyó la motivación como factor de la conducta. Creó una fórmula para explicar este fenómeno: R = HE-R x D x K R (respuesta) HE-R (Hábito) D (Pulsión) K (incentivo/esfuerzo) Para él la fuerza, intensidad y grado de aprendizaje depende de: la intensidad del hábito y la motivación (2 fuentes de motivación: motivación biológica del organismo -por ejemplo si se tiene hambre- y el valor que tiene el incentivo para el sujeto) Incorpora los procesos de índole motivacional 4.5. El conductismo radical de Skinner (1904-1990) Realiza un Análisis experimental de la conducta: El pensamiento (emociones, motivación, sentimientos) es conducta encubierta y responde a las mismas leyes y mecanismos que lo que conocemos como conducta manifiesta. Tomó elementos de Thorndike: La caja de Skinner (similar a las cajas problema), la Ley del efecto: la conducta está mantenida por reforzamiento externo y los programas de refuerzo. 1. El aprendizaje como ciencia experimental -Ciencia: conjunto sistemático de principios y conocimientos procedentes de la observación y la experimentación que muestran la operación de leyes científicas generales. -Psicología del Aprendizaje: cuerpo de conocimientos científicos que describen cómo cambia el comportamiento en función de la experiencia. Aprendizaje Conductual (Adquisición de respuestas) Cognitivo-Funcional (Adquisición de conocimiento) Neuronal (Plasticidad nerviosa) Conducta manifiesta Representación de información Mecanismos neuronales Aprendizaje como ciencia experimental: Se expone al individuo a cierta experiencia y se observa cómo esa experiencia cambia su conducta. La tendencia actual es aunar estos tres enfoques en el estudio del aprendizaje. Definición de aprendizaje: -Nivel conductual: “Cambio duradero en la conducta que se produce como resultado de la experiencia o la práctica” (Kimble, 1961). -Adquisición de respuestas (aprendizaje = ejecución) -Se da si hay cambios en la conducta manifiesta -Existen fuentes de cambio en la conducta que no suponen aprendizaje: fatiga, alteraciones fisiológicas... -Nivel cognitivo funcional: ““Mecanismos responsables del procesamiento de la información (codificación y retención), de la adquisición de conocimiento y otras habilidades” (Norman, 1982). -Adquisición de representaciones de la realidad -Diferencia entre aprendizaje y ejecución (manifestación conductual observable de lo adquirido). -Conocimiento: Declarativo: adquisición y evocación CONSCIENTE (Tolman). Procedimental: adquisición y evocación INCONSCIENTE (Hull). -Bandura: Aprendemos respuestas por observación de modelos que quedan representados cognitivamente y no tienen por quéhay dos estímulos que indican la disponibilidad de la droga uno verde (droga en solitario) y uno azul (la realización de la respuesta supone una inyección de la droga y una descarga). La rata no adicta al asociar el estímulo azul a la descarga deja de realizar la respuesta en su presencia por sus consecuencias aversivas. La rata adicta por su parte, continúa realizando la respuesta a pesar de la descarga (está dispuesta a soportar situaciones aversivas). Fenómeno de la recaída Incluso tras la recuperación de la adicción en determinados sujetos persiste el desei de consumirla y tras un tiempo sin hacerlo, en determinadas ciscunstancias (estrés, contexto de adquisición de la adicción...) pueden volver a caer en la tentación. Las ratas representadas en nego presentan este fenómeno (rápido aumento de la tasa de respuesta). Tª explicativas de la adicción Hay un marco general de diferentes autores en el que se sugiere que las conductas adictivas se producen por el efecto reforzante que provoca su consumo: HIPÓTESIS HEDÓNICAS: -Placer-dolor -Reforzador positivo – Reforzador negativo: En la adicción se da la influencia del reforzamiento positivo (presencia de un reforzador apetitivo tras la respuesta) y el reforzamiento negativo (la rspuesta supone la retirada de un reforzador aversivo). La droga produce placer tras su consumo y su no concumición produce displacer, se vuelve a consumir para evitar ese displacer. -Procesos oponentes APRENDIZAJE E-R (consumo como hábito rutinario). HIPÓTESIS DOPAMINERGICA: Guarda relación con los efectos de la droga a nivel general en los circuitos cerebrales de recompensa. Estas estructuras están conectadas entre sí y usan como neurotransmisor la dopamina. Al consumir una droga se incrementa la respuesta de este circuito, se sensibiliza, hay una mayor respuesta del cerebro ante la droga. Así es que la droga adquiere un mayor valor de incentivo. (INCENTIVO: evento con determinadas propiedades que en un organismo tiene un valor determinado e instiga una conducta). Según la Tª de la sensibilización los estímulos del ambiente también adquieren esa capacidad de incentivo y provocan una actividad cerebral un poco inferior a la de la droga (motivación de incentivo de los esttímulos). La Tª de la sensibilización incentiva dice que la experiencia repetida con drgas hace que estas adquieran un mayor valor de incentivo y aumenta por lo tanto el valor de la recompensa que conlleva su consumo. Los estímulos también adquieren vaor incentivo. Estudio de Wyrell y Berridge A un grupo de control se le suministró una solución incocua en el núcleo acumbuo. Leugo se procedió a una fase de condicionamiento de una respuesta a la obtención de anfetamina (no sacarosa como dice en la imagen). Luego en la Fase 2 se les asocia un Tono a la inyeccion de la anfetamina y un click a ningún tipo de evento. En la fase de Prueba se presentan el tono y el click por separado y se mide la tasa de respuesta. A otro grupo de ratas se les realiza el mismo procedimiento a diferencia de que en primer lugar se les inyecta la anfetamina, provocandoles una sensibilización frente a la droga (mayor valor de incentivo). Los resultados arrojados por el estudio fueron los siguientes: En el grupo de control el tono provocó un poco más de respuesta por la previa asociación del mismo a la droga, pero la tasa de respuesta es comparable a la casi inexistente frente a la presentación del click. En el grupo de las ratas sensibilizadas el tono produce un incremento más que significativo de la respuesta, frente al click que produce una fuerte caída de la tasa de respuesta. En conclusión extraemos que los estímulos del ambiente provocan respuestas encaminadas a la obtención de la droga en aquellos sujetos sensibilizados a la misma. TEMA 8: MODELOS TEÓRICOS Perspectiva teórica del condicionamiento En una situcaión estándar del condicionamiento clásico se presenta un EC seguido de un EI y estos elementos se convierten en cualidades del entorno. Antes de que se produzca el condicionamiento el sujeto almacena en su memoria información sobre los hechos, de tal forma que almacena información sobre el EC y el EI y sus atributos (sensoriales, motivacionales, hedónicos. Forma en su memoria representaciones dde los mismos con el mismo contenido del EC y del EI. Tras el condicionamiento, cuya naturaleza es asociativa, en la experiencia conjunta con un determinado EC y EI, se forman relaciones (asociaciones) a nivel de la memoria entre las representaciones de ambos. Existen dos formas posibles de asociar los elementos de una situación estándar de condicionamiento clásico: 1º Teorías E→ R: se trata de una asociación directa entre la representación del EC y la de la respuesta producida por el EI. De esta forma al presentar un EC se produce una respuesta homóloga a la producida por el EI , la RC. En este tipo de asociación no participa la representación del EI. Se trata de un tipo de conocimiento procedimental. 2º Teorías E→E: En el curso del condicionamiento al presentar conjuntamente EC y EI sus representaciones se asocian. Más tarde, en la prueba al presentar el EC no se activa la representación de una respuesta, sino que se activa la representación del EI asociado y este fenómeno es que produce la RC. Modedelos asociativos Explican las asociaciones formadas a nivel interno. Los modelos posteriores (de atención, de memoria, centrados en la ejecución...) no cuestionan la asociación pero incorporan otros mecanismos. Modelo de Rescorla y Wagner (1972) Se trata de un modelo matemático formal que tiene el objetivo de explicar asociaciones entre los estímulos y la producción de las respuestas condicionadas. Se basa en las teorás asociativas E-E. Indica que para que la presencia de un EC provoque la activación de la representación de un EI a nivel de la memoria deben darse unas determinadas circuntancias: -Deben formarse asociaciones E-E: La asociación puede tener una determinada fuerza asociativa (VA ) que se fortalecerá en el curso de la experiencia. Además la fuerza asociativa determinará la magnitud de la respuesta. El resultado de VA es el resultado de la suma de la magnitud del incremento de todos los ensayos. VA = ΔVA 1 + ΔVA 2 + ΔVA 3 +ΔVA 4 … -La magnitud de la asociación depende de la capacidad asociativa del EI: -La saliencia del EC también afecta a dicha magnitud (grado en que destaca del entorno): -El componente motivacional del EI: Se representa por β y hace referncia al impacto motivacional del EI, que instiga determinadas conductas. A partir de estos supuestos se desarrollo la ecuación del modelo: Donde se presupone que α, λ y β son valores constates en el condicionamiento. α varía entre 0 y uno, siendo 0 = ausencia del EC. VT hace referencia a VAn-1 Entonces podríamos calcular VA5 = ΔVA 1 + ΔVA 2 + ΔVA 3 +ΔVA 4+ΔVA 5 a través de la fórmula anterior. VA5 = 50 + 25 + 12,5 + 6,3 + 3,1 + 1,5 = 98,4 Bloqueo según el modelo de Rescorla y Wagner. Fase 1 Fase 2 Bloqueo Condicionamiento: LUZ > EI > R Finalmente: LUZ > R Condicionamiento: LUZ y TONO > EI Prueba: TONO > No R (el tono no resulta relevante en la fase 2) α, λ y β VA5 = ΔVA 1 + ΔVA 2 Asignamos los siguientes valores: VLUZ n = 100 (fuerza asociativa alcanzada en la fase 1) λ = 100 αLUZ = 0,5 αTONO = 0,5 β = 1 Calculamos los incrementos en la Fase 2, para intentar explicar la ausencia de condicionamiento del TONO: ΔVLUZ1 = α · β (λ- VT) = 0,5 · 1 (100 – 100) = 0 ΔVTONO1 = α · β (λ- VT) = 0,5 · 1 (100 – 100)= 0 Como vemos se comprueba. El valor de VT) es en ambos casos 100, porque es el total de fuerza asocioativa (sumatorio) alcanzado en la fase anterior por ambos estímulos. La capacidad asociativadebe repartirse entre ambos estímulos. Ensombrecimiento según el modelo de Rescorla y Wagner Se presenta un estímulo complejo formado por una “luz” (poco saliente) y un RUIDO (muy intenso). FASE 1 PRUEBA Luz, RUIDO > EI Dos asociaciones distintas: Luz > EI RUIDO > EI VRUIDO n > VLUZ n Damos unos determinados valores: λ = 100 αLUZ = 0,2 αRUIDO = 0,4 β = 1 Supongamos que la fase 1, consistió en 3 ensayos, calculemos VRUIDO n y VLUZ n. ΔVRUIDO1 = 0,4 · 1 (100 – 0) = 40 ΔVLUZ1 = 0,2 · 1 (100 – 0) = 20 ΔVRUIDO2 = 0,4 · 1 (100 – 60) = 16 ΔVLUZ2 = 0,2 · 1 (100 – 60) = 8 ΔVRUIDO3 = 0,4 · 1 (100 – 84) = 6,4 ΔVLUZ3 = 0,2 · 1 (100 – 84) = 3,2 VRUIDO n = 0 + 40 + 16 + 6,4 = 62,4 VLUZ n = 0 + 20 + 8 + 3,2 = 31,2 La fuerza asociativa del estímulo de mayor saliencia es efectivamente más alta. Se comprueba también este efecto. Inhibición latente. Limitaciones del modelo de Rescorla y Wagner. GRUPOS FASE 1 FASE 2 IL 4 x LUZ > nada 4x LUZ > EI CONTROL ----------- 4x LUZ > EI Sabemos que en el fenómeno de inhibición latente en la fase 2, el EC tiene dificutades para asociarse al EI. Pero según el modelo de rescorla y Wagner, para el grupo IL el condicionamiento sería el siguiente (con unos valores de λ = 100, αLUZ = 0,5 y β = 1): FASE 1 ΔVLUZ1 = 0,5 · 1 (0 – 0) = 0 (no está presente el EI ni sus atributos) Lo mismo ocurre en ΔVLUZ2 ΔVLUZ3 y ΔVLUZ4. FASE 2 ΔVLUZ5 = 0,5 · 1 (100 – 0) = 50 ΔVLUZ6 = 0,5 · 1 (100 – 50) = 25 ΔVLUZ7 = 0,5 · 1 (100 – 75) = 12,5 ΔVLUZ8 = 0,5 · 1 (100 – 87,5) = 6,75 VLUZ= 93,25 >>>> ESTO ES INCORRECTO. NO PUEDE PRODUCIRSE EL MISMO CONDICIONAMIENTO QUE EN EL GRUPO DE CONTROL (SIN PREEXPOSICIÓN AL EC). Algunos teóricos a partir de esta comprobación cuestionan la supuesta onstancia de la saliencia del EC (α) y plantean que esta varía con el trancurso del condicionamiento. Inhibición condicionada según el modelo Rescorla y Wagner En un experimento de inhibición latente, se asocia en la Fase 1 un Tono a un determinado EI hasta que alcanza una fuerza asociativa de 80. en la segunda fase se presentan conjuntamente una Luz y el Tono sin presencia del EI (fase de inhibición). Fase 1 Fase 2 TONO > EI LUZ + TONO > No EI λ = 100 αLUZ = 0,2 αRUIDO = 0,2 β = 1 VTONO n = 80 ¿Qué tipo de propiedades condicionales adquiere cada EC? TONO: excitatorio apetitivo LUZ: Innhibitorio apetitivo (inhibidor condicionado) Se desarrollan dos asociaciones: TONO > EI LUZ > EI ΔVTONO1 = 0,2 · 1 (0 – 80) = -16 ΔVLUZ1 = 0,2 · 1 (0 – 80) = -16 VTONO = 80 + (-16) = 64 VLUZ1 = 0 + (-16) = -16 La explicación de Rescorla y Wagner a este fenómeno fue que existen dos polos asociativos. El polo positivo hace referencia al condicionamiento excitatorio y el negativo al condicionamiento inhibitorio. Teoría atencionales Surgen en respuesta a las limitaciones del modelo de Rescorla y Wagner a la hora de explicar fenómenos como la inhibición latente. Dicen que en el curso del condicionamiento al presentar juntos EC y EI se asume que aumenta la fuerza asociativa entre ambos (al igual que en modelo R y W). Es decir: VA tiende a λ y el EC produce una respuesta proporcional a VA. Discrepan con Rescora y Wagner en que α no varíe a lo largo del proceso de condicionamiento. A medida qu el condicionamiento avanza, la codificación que el sujeto realiza sobre el EC varía. Para ellos la habituación representa un fenómeno de disminución de la atención al EC. Para Perace y Hall la α (codificación del EC) depende de λ menos VA. Por esta teoría α = λ - VA. Y por lo tanto al final de condicionamiento α = 0. Teoricamente se apoya sobre la hipótesis de que l”las señales de las cuales ya conocemos sus consecuencias previamente, no necesitan ser codificadas al mismo nivel que las nuevas” Estudio de Kaye y Pearce Realizaron un estudio con ratas en el que la asociación consistiría en un Tono que rpoduciría la aparición de comida. Observaban el aumento de la actividad entre las ratas al presentar el estímulo como RC. Se establecieron 3 grupos: G0 = se les presentaba el sonido y nunca iba seguido de la aparición de la comida. (no es de esperar que realice respuesta de aumento de la actividad) G50= en el 505 de las presentaciones del EC se les daba la comida. G100= en el 100% de los casos la presentación del EC iba seguida de la comida. La respuesta de activación alcanzaba una VA superior en el grupo G100, media en el grupo G50 y muy baja o casi nula en G0. Entonces decidieron estudiar la atención que prestaba cada grupo al EC en curso del condicionamiento, para ello observaron las respuestas de orientación hacia la fuente de emisión del TONO por parte de los sujetos. El G0 y G100 dejan progresivamente de prestar atención al estímulo porque conocen sus consecuencias. Sin embargo, el G50 no puede predecir con exactitud lo que va a ocurrir por lo que su atención al EC es constante. A medida que la diferencia entre landa y la fuerza asociativa disminuye, también disminuye la atención prestada al EC. Modelos de memoria Modelo SOP de Wagner Incluye los mecanismos memoriales. Por ejemplo los efectos de la habituación a corto o largo plazo dependerán de si esta info se codifica en la MCP o MLP. Dice que cuando presentamos conjuntamente un EC y un EI no solo se forman asociaciones entre ellos, sino que también entre sus atributos. Para Wagner cada uno de esos nodos representa un evento o estímulo (A y B). Ambos contienen info sobre los atributos sensoriales de cada evento (A1:dulce, A2: apetitivo... por ejemplo). Presupongamos que A es un EC y B un EI. Para ambos el sujeto codifica la información sobre sus atributos y luego establece relaciones entre estas discriminaciones (no son conexiones entre estímulos, sino entre atributos de estímulos). Para que se preduzca una asociación entre A y B es necesario que ambos nodos esten activos en la MCP al mismo tiempo. La asociación será mayor cuanto mayor sea la fuerza de activación del nodo A y del nodo B. El estado de máxima activación de un nodo (lo denominaremos A1) se produce cuando el estímulo al que representa ese nodo está presente. Esta activación del nodo se produce a nivel de la MCP pero al desaparecer el estímulo, la activación del nodo en este nivel memorial se reduce a un estado de menor activación > A2. Cuando presentamos un Ec se produce por lo tanto la máxima activación de su nodo. Si presentamos un EI (activando al máximo su nodo) justo después del EC (que pasara al estado A) se producirá una asociación entre ambos. Esto explica porqué cuando disminuye el intervalo entre EC y EI aumenta su asociación. Condicionamiento inhibitorio Un estímulo alcanza la máxima fuerza inhibitoria cuando sus atributos están en estado A1 y el EI en estado A2 o posterior (ha desaparecido el nodo a nivel de la MCP). Activación al máximo nivel > Presentación del estímulo = Activación autogenerada Activación de un estímulo por la presentación de un evento relacionado = Activación generada por asociación. Especificidad contextual Los aprendizajes en general se asocian a los contextos. La RC no se condiciona a los estímulos, se condiciona a las características del entorno. Modelos de ejecución de la respuesta condicionada Asumen que en las condiciones adecuadas siempre se va a producir aprendizaje (se van a asociar los estímulos). Este aprendizaje no siempre se va a mostrar en la ejecución de Bloqueouna respuesta (por fallo en la ejecución o interferencia). Bloqueo Según la hipótesis del comparador si se produce una asociación entre el Tono y la Luz y de estos con el EI. LA respuesta es el parpadeo y el EI es una descarga eléctrica. La respuesta se mide frente a la presentación de la LUZ. Segun R y W en el Grupo1: La fuerza asociativa del tono es igual a landa y por lo tanto la fuerzaasociativa de la luz es igual a 0 (bloqueo). En el Grupo 2 la fuerza asociativa del tono y de la luz son equivalentes y tanto el tono como la luz producirán la misma respuesta. Es incpaz de explicar lo ocurrido en Grupo3. Según la hipótesis del comparador dice que la respuesta a la luz se produce porque en la Fase 2 se produce una asociación entre esta y el EI. Tanto la Luz y el Tono se asocian con la descarga. Estas asociaciones tienen distintas magnitudes que varían a lo largo del condicionamiento. En el momento de la prueba lo que hace el sujeto es comparar todos los eventos del condicionamiento (presentes y ausentes) y decide cual es mejor predictor del EI y según su presencia o ausencia realizará la respuesta o no. Por lo tanto en el G1 la asociación del Tono a la descarga es superior a la de la Luz a la misma. Responde únicamente al tono. En el G2 la asociación es igual. Responde a los dos estímulos por igual. En el G3 la asociación del Tono a la descarga es superior hasta la Fase 2, en la Fase 3 esta disminuye y por eso la asociación de la Luz a la descarga, aunque fuera muy pequeña, resulta superior a la del Tono a la descarga. La luz produce respuesta. Marc y Bouton dicen que los fallos en la ejecución se producen por la interferencia de ciertas informaciones en la recuperación de la memoria. En experimentos de varias fases el sujeto almacena información sobre las distintas fases . Forma representaciones de las asociaciones y en la fase de prueba las compara. Algo similar a lo anterior sucede en el ensombrecimiento. TEMA 9: Condicionamiento humano y aprendizaje causal Determinados aspectos del aprendizaje son exclusivamente humanos. En 1974 Se publicó un articulo de gran influencia en el condicionamiento humano: Dice que no existe evidencia de que exista el condicionamiento clásico ni operante en el ser humano. Al contrario que en los animales no se puede producie condicionamiento en sentido literal (en el sentido automático o mecánico). Esto es debido a la presencia de la consciencia: el ser humano debe de ser consciente de la relación establecida para ser capaz de dar la respuesta. Conceptos: Razran acuña el término “niveles de aprendizaje”: no hay un solo tipo de aprendizaje posible, existe una jerarquía (de los más básicos a los más complejos). También existen distintos niveles de procesamiento: fruto de los estudios conductistas que creen que la psicología se basa en el procesamiento de información). Aun estudiando el nivel de aprendizaje asociativo, la respuesta no se produce a menos que intervengan procesos de aprendizaje simbólico (jerarquía). Operación en paralelo: se pueden realizar simultaneamente Operación en serie: tienen que realizarse por separado. Requieren más recursos atencionales. Aquellas respuestas que no sean de carácter autónomo (como conductancia de la piel o tasa cardiaca que si lo son) requieren consciencia para su adquisiscion y consciencia de la relación establecida (ser capaz a expresarla verbalmente). Aspectos metodológicos: Tratan de diferenciar si el procesamiento es automático o controlado. Emparejamiento informado: Se avisa de una falsa contingencia entre EC y EI, las respuestas autonmas se realizan igualmente (no requieren conscienca en su ejecución, pero sí en la relación EC-EI). Condicionamiento instruido: Se realiza determinada respuesta pedida en presencia de un EC. Enmascaramiento: Es similar al ensombrecimiento y es más fiable que los anteriores porque no intervienen las expectativas del sujeto. En la tarea primaria: se presentan dos Ecs. Un EC+ y un EC- (luces distintas). El EI es una descarga electrica por lo que la presencia de EC+ provoca una respuesta de cambio en la conductancia de la piel. Luego se pide al sujeto que realice una tarea secundaria: “Cuando percibas un tono, presiona una tecla (R)”. Al presentar el Tono en presencia de los Ecs se obseerva que se produce un cambio en la tasa de respuesta en la Tarea secundaria cuando está presente el EC+. Escucha dicotómica Estos estudios se caracterizan porque la escucha de ambos oídos se realiza por separado (es dicotómica). Se pone al sujeto unos cascos y se establece un canal atendido (se le presenta información a procesar) y un canal no atendido (se presenta una información no relevante para latarea pero se puede procesar en menor medida). En este experimento, en una primera fase al presentar a un sujeto determinadas palabras (ciudades) se le propicia una descarga. De modo que aquellos sujetos que sean conscientes e la relación: ciudades-descargas, al oír una palabra de esta categoría semántica realizarán la respuesta de cambio de conductancia de la piel. Luego en una segunda fase de prueba se le pide que atienda por un canal a un mensaje en prosa que ha de repetir posteriormente. A este canas dedicará casi la totalidad de su atención. Sin embargo por el canal no atendido se presentan una serie de palabras de control y de la categoría semántica condicionadad previamente. Cabe esperar que el sujeto no sea consciente de la rlacion “ciudades-descarga” porque está atendiendo al otro canal. Sin embargo los resultados obtenidos arrojan una tasa de respuesta de cambio de la conductancia de la piel alta cuando aparecían las “ciudades”. Esto se debe a que el procesamient del canal no atendid es en menor medida y la ejecución de respuestas autónomas (cambio de conductancia) no requiere de consciencia en su ejecución (sí en su asociación). Es importante subrayar: para que el condicionamiento se produzca el sujeto debe identificar el EC correctamente (para que pueda interpretar la relación). En este caso en la fase de condicionamiento debe interpretar que la categoría semántica de las palabras que provocan la descarga era el nombre de “ciudades”. Ejecución de la RC: Una vez adquirida la respuesta ya no se necesita de la atención al EC, la mera exposición a este provoca la realización de la respuesta. Es un ejemplo de procesamiento automático. Tarea de enmascaramiento Estas tareas se caracterizan por la presentación de un estímulo diana (de relevancia para el sujeto, por debajo del tiempo necesario para su correcto procesamiento) y un estímulo máscara (posterior al estímulo diana, durante más tiempo, su procesamiento impide el procesamiento del estímulo diana). Tratan de averiguar si la presencia del estímulo diana refleja el condicionamiento previo de este EC a un determinado EI (en una fase previa) a pesar de que su procesamiento no es consciente (es automático). Ejemplo En este experimento se hacía una fase previa de condicionamiento a los sujetos. Un EC+ compuesto por la imagen de una cara triste (denota emociones negativas) predecía una descarga eléctrica. Por otra parte un EC- compuesto por la imagen de una cara feliz (denota emociones positivas) no tenía ningún tipo de consecuencias. En la fase de prueba se les presentaba a los sujetos: -Por un lado el EC+ como estímulo diana seguido de un estímulo máscara (rostro neutro). -El EC- como estímulo diana seguido del mismo estímulo máscara. Se obtuvieron unos resultados que demuestran que en presencia del EC+ hay una gran respuesta de aumento de la conductancia de la piel a pesar de que su procesamiento no sea cnsciente (si le predimos que exprese verbalmente lo que ha ocurrido no es capaz de hacerlo, no sabe que ha pasado ni que ha visto exactamente). Realiza un procesamiento automático del EC+. Extinción de la RC Se aplica al proceso de extinción de una respuesta condicionada los distintos diseños de disociación y se juega con las expectativas del sujeto (haciendo creer al sujeto que el EI no seguirá al EC se provoca un descenso en la magnitud de la RC incluso cuando el EC se presenta enmascarado). (Extinción instruida)Aprendizaje evaluativo El estudio del aprendizaje humano nos desvela que está más próximo al condicionamiento clásico y condicionamiento instrumental animal de lo que pensabamos en un principio. La mayor diferencia entre ambos es que el aprendizaje en humanos puede ser regulado por creencias y procesos mentales superiores. Hasta hace poco se creía que los animales no tenían emociones y se hacía la siguiente distinción entre apreendizajes: -Aprendizaje de señal (Cond. Clásico tradicional): Consiste en aprender a usar señales del entorno para predecir consecuencias relevantes (es un tipo de aprendizaje causal). Un EC anticipa un EI y esta relación se manifiesta a través de una RC. -Aprendizaje evaluativo: Se creía que era exclusivamente humano y de carácter no asociativo. Consiste en la transferencia del valor hedónico del EI a los estímulos que le preceden (EC). Este valos hedónico recibe el nombre de valencia, puede ser positiva o negativa. Hoy en día sabemos que no es un aprendizaje exclusivamente humano, hay evidencias de que se produce en animales: experimentos de devaluación y observación de respuestas faciales. Modulación: reacciones afectivas y faciales. En este experimento se daba a los tres sujetos el mismo zumo y se les mandaba beber determinados vasos espaciados en el tiempo. Mientras transcurría el tiempo se les dejaba ver una película con distinta carga emocional. En el caso de a) era una película de carácter horripilante. En el caso de b) la película no tenía ningún tipo de carga emocional. En el caso de c) era una película romántica. Diseño de aprendizaje evaluativo Estos experimentos presentaban tres imagenes con carga afectiva distinta: uno aversivo, uno neutro y otro agradable. Después de la valoración por parte de los sujetos se presentaba uno de los estímulos con carga afectiva (aversivo o agradable) como estímulo diana y luego se presentaba el estímulo de carácter neutro como estímulo máscara. Había tres grupos de suetos: Pavloviano (expuestos a la experiencia), observatión (antes de que se le presentaran los estímulos observaban el proceso en otros) y instrucción (se les daban instrucciones sobre lo que iban a ver y sentir). Se observaron que en los tres grupos la conductancia de la piel variaba frente a la presencia de un EC+ (anticipaba una descarga) en los tres grupos, estuviera o no enmascarado. Aprendizaje implícito y valoración afectiva. Primming o preactivación: Proceso de facilitación del procesamiento de un estímulo. Se produce cuando este estímulo a procesar va precedido de otro estímulo distintivo que guarde cierta relación con él. Por ejemplo pedimos a un sujeto que identifique las imágenes pertenecientes a la categoría semántica “arbol” (abedules cerezo, roble...). Antes de la aparición de la imagen de uno de esos árboles se presenta un estímulo diana enmascarado formado por un evento perteneciente al árbol (hojas, tronco, ramas...) El procesamiento de este estímulo previoes inconsciente pero facilita la identificación del siguiente. (se observan menores tiempos de reacción en aquellos estímulos precedidos por eventos distintivos). En este experimento de valoración afectiva se presentan dos tipos de Estimulos: uno de valoración afectiva positiva (Pikachu) y otro de valoración afectiva negativa (Haunter). Estos estímulos se enmascaraban y acto seguido procedía la presentación de una palabra de determinada carga hedónica (independientemente del valor del estimulo enmascarado). Los sujetos debían identificar el valor de esa palabra lo más rápido posible. Por lo tanto los emparejamientos podían ser congruentes (positivo-positivo o negativo-negativo) o incongruentes (positivo-negativo o negativo-positivo). Los resultados arrojan que en casos de incongruencia (tanto positiva como negativa) la latencia de la respuesta aumenta considerablemente en comparación a los casos congruentes (se facilita el procesamiento de la palabra). Condicionamiento instrumental: En el condicionamiento clasico en humanos sabemos que para adquirir una respuesta dada es necesaria la consciencia de la relación entre EI-EC (saber expresarla verbalmente). En modelos animales, no podemos probar esta “consciencia” porque no hablan, entonces lo inferimos a través de la realización de la RC. En cuanto al conicionamiento instrumental en humanos sabemos que hasta los 5 años (etapa en la que se desarrolla la capacidad del lenguaje) los programas de reforzamiento afectan a la ejecución de las respuestas en igual medida que lo hacen con los modelos animales. A partir de esta edad en los seres humanos comienzan a influenciar las creencias y expectativas y los programas de reforzamiento en el condicionamiento instrumental ya no marcan las pautas de ejecución de una respuesta (las repuestas se ajustan a lo que el sujeto cree, no al programa de reforzamiento. De vez en cuando los seres humanos apoyamos nuestra conducta sobre creencias supersticiosas (se cree que existen unas contingencias que no son reales y regimos nuestra conducta en función de ellas). Según Skinner las supersticiones surgen en ocasiones en que dos sucesos aparecen emparejados muy habitualmente (sin que exista verdadera contingencia) dando lugar a altas probabilidades en la memoria del sujeto. Juicios de contingencia Son valoraciones de las relaciones entre la acción y sus consecuencias. Es decir, la percepción subjetiva que tiene el sujeto sobre el grado de relación entre su conducta y las consecuencias de esta. Metodología Existen dos métodos para medir el Cond. Inst en humanos: -Tareas conductuales: Consiste en reproducir tareas análogas a las de los animales y medir la tasa, latencia... de la respuesta. Además se puede pedir una valoración al sujeto sobre lla relación entre sus conductas y sus consecuencias (estos juicios suelen ajustarse a lo real). -Tareas de juicios o diagnótico médico: Simulan el proceso realizado por médicos (a partir de unos síntomas infieren una enfermedad). El sujeto a partir de determinada información debe inferir unas consecuencias. En este ejemplo donde C (causa: medicamiento) y E (efecto: cura) tienen distintas relaciones. En el caso de que a, b, c y d fueran equiprobables (25%), diríamos que el medicamento no es eficaz (da igual tomarlo que no, la propabilidad de curarnos sería la misma en ambos casos). Si la pobabilidad de a fuera 85% y todas las demás fueran 5%, diriamos que si es eficaz. Se relaciona la causa con el efecto (R con Consecuencias). Algo similar se produciría en el condicionamiento instrumental con animales según Rescorla: Para Rescorla los cambios en la ejecución de una respuesta no dependen solo de la estimulación (y sus características fisicas) ni de la contigüidad entre estímulos. Sino que también depende de la frecuencia de la aparición de las consecuencias sin el EC o la R (dependiendo si es condicionamiento clásico o instrumental). Contingencia (positiva P1>P0) (Negativa P1 Consecuencia (derribar)). Se establecieron 3 grupos en los que P(E/C) era = 0,875: G1: P(E/NoC)=0,125 > Δp = 0,875-0,125= 0,750 G2: P(E/No C)=0,125 > Δp = 0,875-0,500=0,375 G3: P(E/No C)=0,125 > Δp = 0,875-0,875=0 Los resultados obtenidos desvelan que al igual que en los animales, el valor de Δp influye diractamente sobre el nivel de respuesta. Por lo que inferimos que la contingencia interpretada por los sujetos se ve afectada por el numero de veces que aparecen determinadas consecuencias sin su supuesta causa. Al pedir juicios de valoración en el grupo G1 todos identificaron como causa el disparo, en el G2 no lo sabían a ciencia cierta, pero en ocasiones lo atribuían al disparo. El grupo G3 no tenia idea de porque se derrumbaba el ovni. Al comparar modelos animales (ejecución de una respuesta por parte de unas ratas) y modelos humanos (juicios de contingencia) se encontraron grandes similitudes. Terapias conductuales Los conocimientos extraidos de estos estudios son apliclabes a las terapias conductuales, influyendo en la conducta del sujeto (potenciando o disminuyendo conductas de interés). Se presenta el estímulo fóbico a un sujeto incapaz de evitarlo pero bajo condiciones controladas. En técnicas de desensibilización es importante establecer una jerarquía de las fobias (estímulos relacionados con la fobia según su grado de miedo). Se le presentan sistemáticamente, de menor a mayor grado y de forma progresiva (hasta que no se supere el anterior no se presenta el siguiente). Se sutenta sobre: La extinción: no sería suficiente porque sería posible la recuperación espontánea. Contracondicionamiento: A la vez que se produce la estimulación gradual se ascian estos estímulos con consecuencias de carácter contrario al miedo (control de respiración, ritmo cardiaco, relajación muscular...) Inhibición recíproca: entre ambas respuesta. Fases: • Entrenamiento de relajación: muscular y respiratorio. • Elaboración de la jerarquía de ansiedad: asociar de forma gradual las situaciones que provocande menos a mas miedo. • Afrontamiento progresivo: bien por exposición al objeto o opor la imaginación de dichas situaciones, en caso de que no sea posible. A veces aunque se aplique correctamente este procedimiento, el miedo no llega a afrontarse porque en situaciones normales se refuerzan positivamente respuestas de escape o evitación (miedo a ir en avión: ir en barco o en coche). Técnicas aversivas Se emplea en conductas adictivas con el fin de reducir los consumos. Se basa en procesos de aversión al sabor: Se asocia un estímulo relacionado con la conducta adictiva (cajetilla de tabaco) con imágenes o consecuencias desagradables. El valor hedónico de estas nuevas consecuencias se transfieren al estímulo. Aplicaciones médicas: • Supresión condicionada del sistema inmunitario: El fin es la consecución de la reducción del sistema inmunitario. Se realiza mediante la aplicación de fármacos y su asociación a otras sutancias hedónicamente apetitivas (sacarina). Se mide el número de muertes y si la sacarina es capaz de adquirir el valor de supresor inmunologico del fármaco al que acompaña. • Quimioterapia: Los síntomas inmediatos se pueden refrenar con la aplicación de fármacos, sin embargo el contexto también se asocia a los síntomas y produce síntomas anticipatorios. Se estudia la posibilidad de un fármaco inhibidor de estos segundos sintomas o un método de asociación previo del contexto a situaciones agradables. Aplicaciones del condicionamiento instrumental. Psicología comparada: investigación que trata de descubrir si compartimos nuestro proceso cognitivo con otros aspectos animales. Sistemas y procesos de memoria Sabemos que el conocimiento puede ser declarativo o procedimental. Gracias a estudios con ratas (las cuales pueden tener memoria episódica) sobre la memoria animal, podemos definir esta según dos criterios: a largo plazo y a corto plazo. La estructura de la memoria conforma un sistema multialmacén en el que encontramos información cotidiana almacenada de diferentes maneras porque ha sido captada por diferentes receptores. En cuanto al sistema de memoria a corto plazo o memoria activa podemos decir que no permite grancantidad de información y que esta decae con el paso del tiempo. Es un sistema formado a nivel estructural. Esta información se puede almacenar de manera ilimitada manteniendo la memoria a corto plazo activa durante mucho tiempo por medio de repasos. Teorías generales: Teorías del almacenamiento Con el tiempo se forma una huella de la información de la memoria que decae con el paso del tiempo. El olvido obedece a que no se ha codificado o almacenado bien esa información en la memoria. -Decaimiento de la huella de memoria y olvido -Codificación retrospectiva (algo nos hace recordar) y prospectiva (recuerdos involuntarios) Teorías de las interferencias En ocasiones se produce una interferencia entre los sistemas de memoria. Una determinada información es interferida por otra a la hora de la memorización impidiendola. -memorias formadas durante el intervalo de retención -interferencia pro-activa (información que previamente se aprendió, que interfiere con el recuerdo de materiales más recientes ) y retroactiva (Ocurre cuando la información aprendida dificulta la retención de la información reciente ). Teorías de la recuperación El olvido se produce por fallos en el proceso de recuperación de la información. Se producen por los efectos del cambio de contexto y del paso del tiempo. Segun Rescorla y Wagner se produce porque no se asocian los estímulos con la memoria (no se produce una RC por lo tanto). Sin embargo otras investigaciones sugieren que la información si ha sido codificada pero se produce un fallo en la recuperación de esta codificación. Fases de la memoria 1º Decae la huella de la información con el paso del tiempo 2º Fallo en la recuperación de la información Técnicas y métodos de estudio Técnica de igualación demorada a la muestra “animal mind”: se emplea en palomas, simios, niños... etc. A través de un panel central se le presenta al sujeto determinada información que queremos que retenga para utilizarla más adelante. Tras un tiempo determinado este estímulo desaparece. Posteriormente tras un tiempo de demora el sujeto debe elegir entre dos estímulos que se le presentan cual es igual al que se presentó en el primer ensayo (debe recordarlo). También se utilizan tareas de orientación espacial (laberintos en T y radiales) Retención a corto plazo (MCP) Depende de: • La duración y la demora: del estímuo de muestra y de la aparición de los estímulos tras el intervalo de demora. • Codificación prospectiva (que respuestas debe realizar) y retrospectiva (recordar las características del estímulo). • Repaso: mantener activa la información expuesta al sujeto. Sino la huella decae con el tiempo. • Olvido dirigido. • Análisis teórico. Roberts and Grant estudiaron este fenómeno con palomas, variando en función de los grupos el tiempo de exposición a la muestra. La retención de la información se medía en el porcentaje de respuestas correctas dadas tras el mismo intervalo de demora. Grant estudio los efectos de la demora (manipulando el intervalo de demora) en laberintos en forma de T para ratas. Quería medir la posible persistencia o decaímiento de la información en la memoria. La fase de retención de la información se realizaba en el mismo recinto. Estableció dos grupos de ratas, el grupo 2 al cual impediría repasar “el espacio” apagando la luz del recinto y el grupo 1 el cual podría ver el recinto durante el intervalo de demora. Así fue que obtuvo unos resultados sorprendentes: las ratas del grupo 1, a mayores intervalos de demora, recordaban peor (a pesar de poder repasar visualmente) y las ratas del grupo 2 cometían menoserrores en intervalos más largos. Este fenómeno puede explicarse en términos de le interferencia de información. La retención a corto plazo también se estudió en laberintos radiales, combinando los ensayos forzados con los ensayos libres. Primero se obliga al animal a ir a determinados brazos y tras varios ensayos se le deja entrar en cualquiera de ellos. Se consideran respuestas correctas cuando el sujeto evita ir a aquellos brazos donde ya obtuvo comida con anterioridad, pues recuerda donde la ha consumido ya. Posteriormente se estudian los efectos de la variación del intervalo de demora entre los ensayos forzados y libres para ver cual es su alcance sobre las respuestas correctas. Se obtuvo que a mayor intervalo de demora aumentan las respuestas incorrectas por el decaímiento de la huella de la información en la memoria provocado por el paso del tiempo. Teorías de la codificación de la información Un punto importante en la memoria es la forma en la que se codifica la información. Hay dos tipos de codificación: En técnicas de igualación a la muestra la codificación retrosprectiva consiste en el repaso de las características a recordar, en función de las cuales se realizara la acción y la codificación prospectiva se corresponde con una antelación que realiza el sujeto de la acción que va a realizar. La ejecución es mucho mejor cuando las características a recordar son iguales a las del estímulo que se presentará mas adelante (color y color o lineas y lineas). Condicionamiento operante: el término fue utilizado por primera vez por Skinner para descibrir aquellas respuestas que operaban sobre las conductas de los individuos para conseguir un fin. Condicionamiento instrumental: Término acuñado por Marcur para referirse a situaciones en las que el individuo se tiene que mover para realizar una acción o escapar de una consecuencia. Algunas cuestiones sobre la MCP en animales surgen en torno a si en ellos el repaso tiene carácter atutomático o deliberado. En humanos sabemos que el repaso es consciente , pero ¿puede controlarse externamente? Sí, la mécanica con la que se produce puede interrumpirse en cualquier momento. En humanos, por técnicas de igualación a la señal podemos favorecer el repaso dando una pista previa al comienzo del experimento: recuerda el estímulo señal porque te servirá más adelante. (Clave recuerdo) sin embargo también existen las claves de olvido que logran el resultado contrario: Se le hace pensar al sujeto que la señal no será de utilidad en el futuro (no la recordará). Por ejemplo tras la fase de entrenamiento: se enseña al sujeto a recordar la señal con normalidad, se vienen unos ensayos análogos con la diferencia de que ahora el repaso de la señal es interrumpido por la clave de olvido y el sujeto tiene dificultades para retener la información. Se procedió despues a variar otro factor dentro de este paradigma, dando con lo que llamamos olvido dirigido. Se establecieron tre grupos de sujetos: 1: la clave de olvido se presentaba solapada con la muestra 2: la clave de olvido se prsentaba 2 seg despues de la finalización de la muestra 3: la clave de olvido se prsentaba 3,5 seg despues de la finalización de la muestra Los resultados obtenidos para cada grupo fueron: 1: gran diferencia entre los grupos con claves de olvido y recuerdo. Los de recuerdo casi lograron la totalidad de respuestas correctas. 2: Las elecciones mejoraron para los de la clave de olvido pero seguían con grandes dferencias respecto a los de recuerdo. 3: a penas hay diferencias entre los grupos. Esto refleja el efecto variable dependiente de cuando se produce la clave de olvido. Retención a largo plazo Un tipo de información retenida a largo plazo es la memoria episódica. Los estudios de la memoria a largo plazo se han realizado en animales y tiene gran importancia S. Sheffleworth (etóloga que simulaba el hábitat de los animales). En un determinado experimento se presentaba a los animales una serie de manchas de tinta negra y al cabo de un tiempo se repetía el ensayo. El 60/70% de los animales respondían correctamente. Es decir reconocen cuales son los estímulos positivos y cuales negativos y que parejas han sido reforzadas. Desmuestran entonces que se puede almacenar información a lo largo de mucho tiempo. Los estudios realizados con la rana africana con pies de garra para comprobar el alcance de la MLP eran en la línea de la evitación. Se sometía a ranas a entrenamientos de evitación de una descarga. Tras determinados ensayos en una caja de evitación aprendieron que en el compartimento oscuro recibirían una descarga y aprendieron a saltar al otro para evitar diche situación aversiva. Se realizó el mismo experimento con renacuajos de la misma rana y se les volvió a someter al ensayo de adultos. Las ranas evitaron igualmente el compartimento oscuro. A pesar de la enorme transformación física que habían sufrido la codificación de la información y su retención era la misma. Tomás y Lopez realizaron un experimento en el que el entrenamiento consistia en que si la paloma picoteaba una en presencia de una luz obtendría un reforzador. Esta luz tendría 500 nm. Se midió cual era la generalización de la luz hecha por las palomas según el paso del tiempo. Se dieron cuenta que a medida que pasaba el tiempo la respuesta se generalizaba más y más. Estimación del tiempo Los animales estiman el tiempo al igual que nosostros, de modo que en tareas de condicionamiento instrumental con programas de reforzamiento de intervalo, las respuestas tras varios ensayos se ciñen a los intervalos de reforzamiento en función de los estimulos del ambiente. En el expreimento, una rata debe responder a los 30 s de la presentación de una luz con unas características sensoriales determinadas. En los primeros ensayos responde durante todo el intervalo. Pero a medida que avanza en el condicionamiento se reduce la respuesta que se ciñe a los 30 segundos. Existe también una modalidad de condicionamiento que recibe el nombre de condicionamiento temporal (el refuerzo llega cada cierto interalo de tiempo, sin la presencia de estímulos específicos). La frecuencia de la RC coincide con el intervalo del reforzamiento. En este gradiente de generalización de la respuesta, el pico se corresponde con el momento de máxima respuesta que coincide con la duración del intervalo de reforzamiento (30 seg). Modelo de medida del tiempo La tarea de dmedición del tiempo la realizan tanto animales como humanos. El Reloj biológico funciona como mecanismo que es producto de impulsos que se acumulan en el acumulador. En cada ensayo que el sujeto es expuesto al mismo estímulo, esta información es procesada por la memoria a corto plazo. Luego las respuestas dadas y sus consecuencias son definidas en la memoria a largo plazo. El tercer mecanismo es el comparador, donde si los estímulos recibidos son los mismos que los codificados se expresará la respuesta almacenada en la MLP (clara diferenciación entre MCP -estímulo presente que hace recordar lo asimilado por la MLP- y la MLP -codificación de la relación: E-R-) Se entregará la recompensa a los 50 segundos, pero antes de ello se presenta una luz durante 10 segundos. Durante los 10 segundos de presentación del estímulo el reloj se detiene por lo que en realidad el intervalo es de 60 segundos. El animal se da cuenta de la relación E-R cuando el estimulo está presente. (la grafica tiene los ejes girados). Aprendizaje de conceptos naturales y abstractos En este tipo de tareas al sujeto se le expone a una pruebad de condicionamiento instrumental, con una palanca y determinadas imágenes de diferentes categorías. Se le presentan pares de estímulos E+ y E-. Por ejemplo el E+ siempre se corresponde a la categoría de roble y la E- a otra distinto (por ejemplo una ramade olivo silvestre). En el segundo ensayo se le presentan distintas imágenes de hojas y si la elección de la imagen corresponde con la categoría de roble (anteriormente definida como E+) se recoge como respuesta correcta. Los sujetos clasifican los estímulos y y categorizan en función del estímulo que se les presentó al principio como positivo. Teorías de categorizaciónemitirse. -Nivel Neuronal: “Tipo particular de plasticidad cerebral, un cambio en la eficacia de las conexiones entre neuronas debido a la experiencia” ENFOQUE DE LAS NEUROCIENCIAS (Kolb, 1995) “Modificación del peso de las conexiones excitatorias y/o inhibitorias según ciertas reglas o algoritmos” ENFOQUE CONEXIONISTA (Rumelhart, 1992) -Aprendizaje como cambio en las conexiones neuronales. - Eric Kandel (1929) recibió el premio nobel por sus estudios de los fenómenos asociativos y no asociativos a nivel neural: Sensibilización y habituación. -La presentación repetida de un estímulo puede provocar tanto disminuciones como incrementos en la respuesta: -Las disminuciones de la tendencia a responder producidas por la estimulación repetida reciben el nombre de efecto de HABITUACIÓN. -Los incrementos de la tendencia a responder se llaman efecto de SENSIBILIZACIÓN. 2. Teoría actual del aprendizaje asociativo Procesos de Condicionamiento: “Mecanismos para la detección e inferencia de las relaciones estructurales del ambiente, mayoritariamente causales, que determinan la conducta adaptativa“ -Dickinson 1980 Aprendizaje: Mecanismo de adaptación biológica Para alimentarse, eludir los depredadores o reproducirse los animales están equipados con mecanismos fisiológicos y motores que satisfacen dichas funciones; sin embargo, no son suficientes en sí mismos para sobrevivir; es necesario localizar los alimentos, saber dónde acechan los depredadores o cómo atraer a una pareja sexual. Estas funciones se pueden promover mediante los procesos de condicionamiento y aprendizaje. La realización de conductas adaptativas y la anticipación de hechos biológicamente relevantes (comida, por ej.) del entorno requiere la capacidad de aprendizaje. Estas adaptaciones al ambiente son tan esenciales para la supervivencia del individuo como lo son los procesos fisiológicos de la respiración o la digestión. Michael Domjan , 1999 Los procesos adaptativos se pueden promover a partir de procesos de condicionamiento y aprendizaje. Variedades y tipos de aprendizaje: Naturaleza de los eventos: Aprendizaje de estímulos: Condicionamiento clásico Aprendizaje de respuestas: Condicionamiento instrumental Aprendizaje conductual y cognitivo: Conductual: cambios en la conducta manifiesta Cognitivo: adquisición y almacenamiento de información en la memoria Tipos de asociaciones: Naturaleza de los eventos: Aprendizaje de estímulos: Condicionamiento clásico (Pavlov) Aprendizaje de respuestas: Condicionamiento instrumental (Skinner) Naturaleza de la asociación: Independencia: E1 / E2 Contingencia negativa: E1 - no E2 (relación causal negativa) Contingencia positiva: E1 – E2 ( relación causal positiva) TEMA 2: LA CIENCIA DEL APRENDIZAJE 1. Conductas refleja y sus propiedades Conducta refleja: Expresión de un conocimiento instintivo. Un reflejo implica dos hechos: un estímulo elícitante y una respuesta específica (estrechamente relacionados). Adaptación biológica y selección natural. Dos especies de ratones de campo presentan conductas instintivas diferentes. Aquellos que viven en áreas abiertas, donde es fácil para un depredador vislumbrarlos, construyen madrigueras con muchas salidas y túneles para en caso de ser perseguidos tener más posibilidades de escapar del depredador. Sin embargo, los que viven en áreas boscosas dónde es más difícil para los depredadores identificarlos, construyen madrigueras más simples, de un solo túnel. Si se cruzan ambas especies tendrás descendencia que sólo haga de un tipo determinado de madriguera, pero si se cruza uno de los ratones de la 2ª generación con uno de la 1ª, la descendencia de éstos realizará el mismo tipo de madrigueras que realiza el progenitor de la 1ª generación. Fuentes de conducta adaptativa: -Reflejos y conducta adaptativa: Filogenia. -Maduración y experiencia: Ontogenia. 2. Aprendizaje no asociativo La estimulación repetida provoca cambios en las respuestas reflejas. -Habituación: Debilitación de la intensidad de la respuesta. -Sensibilización: Aumento en la intensidad de la respuesta. Aprendizaje y adaptación biológica Neofobia y aversión adquirida al sabor La neofobia hace relación a la fobia a lo nuevo (en situaciones nuevas se presentan mayormente respuestas de rechazo), y esta relacionada con la aversión al sabor, porque la primera vez que cualquier animal toma un alimento nuevo, prueba muy poco o lo rechaza. Ejemplo:a una rata sedienta le ofrecemos dos soluciones, una dulce (con sacarina) y agua. Como la solución dulce se trata de un sabor nuevo preferirá agua, dicha respuesta es adaptativa (prefiere lo habitual). Si solo probara la solución dulce y no tuviera consecuencias negativas se reduciría la neofobia (respuesta de rechazo). Territorialidad y reproducción Hace referencia a la conducta de defensa del territorio (como vemos en peces y mamíferos) como mecanismo de supervivencia. Ejemplo: el macho que mejor defienda el territorio será el que conquiste a la hembra, por ello está relacionado con la reproducción. La reproducción es una conducta refleja que puede variar con la experiencia. 3.Mecanismos reflejos: Adaptación conductual básica: bacterias, protozoos, plantas... geotropismos (movimiento de un organismo como respuesta un estímulo de la gravedad -crecimiento de las raíces de las plantas-), fototropismos (respuesta de un vegetal al estímulo lumínico), heliotropismos (orientación del tallo, flor y hojas hacia la luz del sol) taxias (directos, movimiento direccionado de un ser vivo hacia un estímulo), kinesias (indirectos, cambios en la velocidad del movimiento por motivo de un estímulo) sueño de las hojas (por las noches las mimosas se cierran) Respuesta refleja: Aquella de carácter involuntario e instintivo. Es producida por un conjunto de estímulos determinados que estimulan a nuestras neuronas sensitivas, que envían la información al cerebro y posteriormente las neuronas motoras producen una respuesta. Una estimulación repetida de las neuronas sensoriales produce un cambio en la plasticidad del espacio interneuronal que debilita el efecto de la respuesta (habituación). Clases de reflejos (fácil identificación del estímulo): reflejos motores: postural, palpebral, sobresalto, succión, oclusión respiratoria reflejos sensoriales: pérdida equilibrio, contracción pupila reflejos digestivos: salivación, náuseas regulación térmica: sudoración, aumento térmico reflejos del sistema inmune: liberación histamina, inmunosupresión Conducta instintiva: Patrones de respuestas reflejas con estímulos más difíciles de identificar. Las características esenciales para la aparición de la respuesta son difíciles de identificar. Patrones de acción modal (pautas de acción fija) Ejemplo: si a un ganso le ponemos un huevo fuera de su nido, esto provoca una conducta instintiva que consiste en que el ganso estira el cuello y coge el huevo para llevarlo al nido. A los estímulos que desencadenan respuestas instintivas, se les llama estímulos señal o desencadenantes. Estas forma de conducta es susceptible al cambio, debido a la frecuencia, intensidad… El estudio del aprendizaje no asociativo estudia las modificaciones de la conducta refleja por la experiencia repetida. Tras un experimento que estudiaba la expresión de la respuesta de sobresalto en una rata frente a un estímulo sonoro se determino que cuántos más experimentos se realizaban, más se reducía la intensidad de esa respuesta. (Habituación) La sensibilización por su parte correspondería al aumento en la disposición de un organismo a ofrecer una respuesta a medida que se repite la experiencia. Los mecanismos de sensibilizacióny habituación ayudan a canalizar la conducta dando respuesta sólo a los estímulos relevantes. A veces previo a la habituación se aprecia un proceso de sensibilización, como en el caso anterior. 4.Factores: Existen una serie de factores que afectan al cambio en la intensidad de ofrecimiento de una respuesta por parte del sujeto. -La intensidad de los estímulos: provoca una mayor o menor velocidad en la habituación a los estímulos. -La duración de la estimulación: afecta de forma parecida. -La frecuencia de presentación del estímulo: Si es a largo plazo la habituacion será más lenta, pero estará presente por más tiempo (memoria a largo plazo). Si es en intervalos muy pequeños de tiempo la habituación será más rápida pero estará presente por menos tiempo (memoria a corto plazo). Si tras un proceso de habituación y dejando lugar a un espacio prolongado de tiempo antes de volver a repetir la experiencia, se volverá a producir la respuesta. Este fenómeno recibe el nombre de recuperación espontánea. Procesos de deshabituación Estímulo extraño: Si se realiza una experiencia hasta el punto de habituar al sujeto a un estímulo y después se presenta el estímulo precedido de otro extraño, se recuperará la respuesta. Especificidad contextual: Si la habituación se produce en un contexto determinado, al cambiar de contexto (estímulos contextuales diferentes) y repetir la experiencia, reaparece la respuesta. (El contexto permite recuperar mejor la información aprendida). Frecuencia de la estimulación: Si se repite la experiencia de forma masiva (alta frecuencia), tras un intervalo de no exposición, al repetir la experiencia el sujeto presenta la respuesta con una alta intensidad (mayor recuperación espontánea). El sujeto tarda menos en habitçuarse pero esta habituación permanece menos tiempo (memoria a corto plazo). En cambio si repetimos la experiencia de forma espaciada (baja frecuencia), tras el mismo intervalo de no exposición al estimulo, cuando repetimos la experiencia el sujeto muestra una respuesta de menor intensidad (menor recuperación espontánea). En este caso la habituación permanece más pero el sujeto tarda más en habituarse. Análisis teórico: Se proponen una serie de posibles causas que contradicen a la habituación como proceso de aprendizaje no asociativo. Uno de ellos sugiere que la deshabituación puede producirse, bien por fatiga motora o adaptación sensorial al estímulo (pero ambas hipótesis fueron desechadas con la prueba de la especificidad contextual y del estímulo, si el sujeto se encontrara verdaderamente cansado no presentaría la recuperación espontánea en ninguno de los dos casos). -Adaptación sensorial: disminución de la sensibilidad de los órganos de los sentidos frente a la estimulación. -Fatiga motora: agotamiento muscular que impide la presentación de una respuesta. -Habituación: mecanismo por el que se deja de emitir una respuesta a pesar de ser capaz a realizarla por detectar el estímulo como irrelevante. La Tª del doble proceso de Grooves y Thompson dicta que las sensaciones responden a una situación de estado y por lo tanto la habituación obedece al intento de hacer eficaz la respuesta. El modelo de los procesos oponentes de Salomon y Corbit, dice que en el aprendizaje no asociativo, lo que se memoriza son las emociones y todo aquello de carga afectiva. Pero durante la experiencia repetida, el estímulo cambia de significado emocional y eso varía la expresión de la respuesta. Desarrollaron un patrón de dinámica afectiva que tiene aplicaciones en la comprensión de conductas adictivas y se basaba en que los estímulos evocan una serie de emociones (reacción afectiva primaria positiva/negativa, estado A) y dependiendo de la naturaleza e intensidad del estímulo provocará, despues de la estimulación una reacción afectiva opuesta (reacción afectiva secundaria negativa/positiva). Si la respuesta presentada por el sujeto varía en magnitud, su reacción afectiva primaria también lo hace. Primera exposición Varias exposiciones Cuando presento un estímulo muchas veces disminuye esa reacción primaria o estado “A” del que hablamos, y por el contrario aumenta la reacción secundaria en amplitud y duración. Respuestas condicionadas Compensatorias (Siegel) Si a un sujeto le suministramos morfina, esta sustancia le provocará un efecto analgésico, pero después que se termine este efecto el organismo dará lugar a una respuesta compensatoria (como en la Tª de Salomon y Corbit) con el objetivo de contrarrestar la acción de la morfina, la hiperalgesia La hiperalgesia es una respuesta compensatoria condicionada, porque el sujeto, la experimentará estando en ese contexto, al asociarlo con la inyección de morfina. Cualquier droga (considerada como estímulo) produce unos efectos psicológicos (a modo de respuesta compensatoria) que se relacionará con el contexto habitual de consumición. Es decir, la tolerancia, se desarrolla por lo tanto en un contexto determinado. Por eso, la muerte por sobredosis es común entre personas que se suministran cantidades de drogas incluso inferiores a la consumida habitualmente en contextos distintos al normal. Este experimento, mide la mortalidad porcentual de tres grupos de ratas a las que el décimo día se les inyecta una cantidad mortal de heroína. El grupo IGUAL se desarrolla en el mismo contexto, con nueve días previos de consumición de la droga. El grupo DIFERENTE replica el experimento con la salvedad de que el décimo día se cambia el contexto físico de las ratas. El grupo CONTROL cuenta con 9 días de no consumición, previos a la inyección. 5. Habituación como aprendizaje asociativo Modelo SOP (Sometimes opposite proccess) de Wagner (1974) Sabiendo que tras un proceso de habituación que presenta una frecuencia masiva de la estimulación, retenemos la información en la memoria a corto plazo y al contrario en uno de frecuencia espaciada lo hacemos en la memoria a largo plazo, vamos a definir ambos términos: Memoria a corto plazo (o de trabajo): retenemos información el tiempo justo para su uso. Memoria a largo plazo: retención de información de forma prolongada. Wagner alude a la idea de que la retención en la memoria de la información depende del proceso de esta información en la memoria a corto o largo plazo. El registro sensorial procesa la información en la MCP o memoria activa, mientras es necesaria para su uso (si queremos acordarnos durante unos minutos de un número de teléfono, ponemos en marcha la memoria a corto plazo y lo repetimos una y otra vez hasta que encontramos el móvil y lo marcamos), si se repite la experiencia y es varias veces requerida, se procesará en la MLP o memoria inactiva o latente. Sin embargo, para evocar esta información almacenada en la MLP hay que llevarla a la MCP (puesto que, la información de la memoria a largo plazo, es aquella que se encuentra de forma latente y no está en uso constante). Activar la información que contenemos en la MLP, se consigue mediante la repetición, el repaso… Después del análisis sensorial, el comparador filtra la información que se quiere utilizar. Este filtro tiene una función muy importante, puesto que, no sería útil procesar toda la información si es que no la vamos a emplear. El mecanismo de activación de la memoria funciona de dos maneras: por la exposición al mismo estímulo que permite evocar la información (activación autogenerada relacionada con la habituación a corto plazo) o por la presentación de un elemento relacionado con lo almacenado (representación generada asociativamente relacionada con la habituación a largo plazo). Es decir, para activar la memoria a largo plazo hay que recurrir a la asociación. La Tª de Wagner interpreta la asociación contexto-estímulo, se aprede sobre las característicasfísicas de un estímulo (si es lumínico, sonoro...), las consecuencias que prooduce (si es irrelevante no tengo por qué reaccionar), conocimiento porcedimental del estímulo (como reaccionar). La memoria a largo plazo por lo tanto está relacionada con el contexto, si se cambia de contexto no se recupera la información, se interpretará la estimulación como un proceso novedoso, si es el mismo contexto, si se recuperará. Aprendizaje no asociativo y plasticidad nerviosa El Profesor Eric R. Kandel trabajó con un invertebrado llamado “Aplysia California”. Lo eligió porque quería estudiar el circuito neuronal de la forma más simplificada posible. La Aplysia, tiene 36 ganglios, de tal manera, que podían rastrear qué sucede desde que se presenta un estímulo novedoso hasta que se habitúa a este. Cuando le presentamos un estímulo (pincharle en la cola o la cabeza) hay una retracción de la branquia (respuesta refleja), y por ello, es observable como se habitúa a dicho estímulo. Los factores que intervienen en la retracción de la misma son: -Intensidad. -Frecuencia... Además la experiencia, no solamente cambia la funcionalidad de las neuronas (la conducta), sino que también las cambia estructuralmente. La branquia está controlada por una serie de neuronas motoras. Cuando se estimulan las neuronas sensoriales se activan estas neuronas motoras, a través de las interneuronas. Pues bien, cuando se estimulan muchas veces, hay un cambio en la eficacia de la transmisión química, es decir, en los neurotransmisores. Hay una fuerte correspondencia, por tanto, entre el cambio conductual y el cambio de la actividad eléctrica. Kandel afirma, que el proceso de la disminución gradual de respuesta, obedece a una disminución de la transmisión sináptica. Tras una estimulación repetidase produce una depresión de la transmisión sináptica entre neuronas sensoriales y motoras (menos liberación de glutamato en las neuronas presinápticas). La estimulación repetida de las neuronas sensoriales provoca una reducción del potencial de acción de las neuronas motoras. En la habituación: hay menos neurotransmisores, lo que provoca menor actividad de las neuronas motoras y esto genera una menor respuesta. En la sensibilización: se producen el llamado potencial excitatorio, es decir, un incremento en la liberación de neurotransmisores (facilitación presináptica). Proceso dual de la sensibilización y habituación Supone que existen procesos neuronales subyacentes responsables de los aumentos y disminuciones de la disposición de un individuo para responder a un estímulo. Un tipo de cambio en el sistema nervioso produce una disminución de la capacidad del estímulo para producir una respuesta. Sería el proceso de habituación. Groves y Thompson suponen que el proceso de habituación tiene lugar por modificaciones en lo que llamaron el sistema E-R 8puede considerarse igual que el arco reflejo). Este sistema se activa cada vez que un estímulo produce una respuesta porque es el sistema que conduce los impulsos nerviosos sensoriales hasta las neuronas motoras. Por otro lado el segundo tipo de cambio provocaría un aumento de la disponibilidad del sujeto a responder al estímulo (proceso de sensibilización) y sería provocado por cambios en el llamado sistema de estado, que determina a nivel general el grado de sensibilidad del organismo. El sistema de estado interviene solo en situaciones especiales como un estímulo extraño o relativamente novedoso, con la aparición repetida de un mismo estímulo de gran intensidad (se sensibiliza)... El resultado de la conducta en neto, sería el resultado de la suma de las dos curvas que dibujaría la influencia del estímulo sobre el sistema E-R y el de estado. Sufriendo mayor influencia de aquella que se vea más afectada. TEMA 3: FUNDAMENTOS DEL CONDICIONAMIENTO Este tema es una introducción general a dos temas que veremos después: el condicionamiento clásico (tema 5) y el condicionamiento instrumental (tema 6). Ambas novedades del condicionamiento son variedades del aprendizaje asociativo, por lo que comparten propiedades: método de estudio, dimensiones conductuales… Los dos son aprendizajes asociativos, la diferencia es en cuanto a qué elementos participan en esas asociaciones (elementos que se asocian). Este tema no alude al condicionamiento clásico o al instrumental, es general (común a todas las variedades de condicionamiento). Procedimientos apetititos/aversivos dependiendo de la naturaleza del EI. El condicionamiento detecta en el ambiente estímulos que puedan ser causas potenciales (detectar causas-efectos). 1. Condicionamiento clásico Pavlov y los reflejos condicionados El condicionamiento clásico es un mecanismo de aprendizaje que nos permite predecir hechos biológicamente relevantes en nuestro entorno (comida, un peligro inminente) y anticiparnos a su aparición mediante la realización de respuestas adaptativas de carácter reflejo. Pavlov estaba investigando los procesos de digestión (pretendía analizar la salivación de los perros cuando se les proporcionaba comida). Descubrió que los perros, una vez acostumbrados a la situación experimental, no esperaban a salivar cuando tenían la comida en la boca sino que el proceso de salivación comenzaba en cuanto se les exponía a estímulos propios de la situación experimental (como verle a él). Así, supo detectar un fenómeno mucho más interesante que analizar y cambió el rumbo de su investigación. De hecho, dedicó el resto de su trayectoria investigadora al estado de lo que se conoce como aprendizaje por condicionamiento. El condicionamiento clásico es el método por el cual al presentar un estímulo previamente neutro en contigüidad espaciotemporal con otro estímulo capaz de suscitar una respuesta a de manera innata (respuesta refleja), el primer estímulo queda asociado con el segundo de tal forma que acaba siendo capaz de suscitar por si solo dicha respuesta. Pavlov proporcionaba comida a sus perros hambrientos, lo que producía una respuesta refleja de salivación (respuesta fisiológica). Luego el primer elemento consustancial son los estímulos del ambiente que producen sin experiencia la reacción del organismos (estímulo incondicionado, sin mediar experiencia). Estos estímulos producen una reacción refleja de tipo nervioso acorde con el acontecimiento. La respuesta refleja de salivación frente a estos estímulos es respuesta incondicionada. Pavlov constata que la respuesta refleja comienza a producirse también ante estímulos del ambiente que preceden a la comida. Esos estímulos (luz, tono…) son estímulos neutros o arbitrarios porque no median en la salivación. Estos estímulos que adquieren propiedad condicionada son estímulos condicionados. La condición es que el estímulo condicionado (EC) y el estímulo incondicinado (EI) estén ligados temporalmente. Lo que constata es que los estímulos condicionados (EC) adquieren por la experiencia repetida también, una capacidad de respuesta análoga a la respuesta incondicionada (RI). Llamó a esto conexión nerviosa temporal. Elementos del paradigma de condicionamiento clásico • EI> estímulo incondicionado (cualquier acontecimiento capaz de provocar una respuesta refleja específica en el organismo). • EC> estímulo condicionado (estímulo que por asociación con un EI es capaz de provocar una respuesta que antes del entrenamiento no provocaba). • RI> respuesta incondicionada (respuesta que se emite de forma automática ante la presencia de un determinado EI). • RC> respuesta condicionada (respuesta provocada por el EC tras la asociación. En ocasiones RC y RI son distintas. Cuando se asocia un EI con un EC, la presentación del EC provocará una respuesta análoga a la RI, llamada RC. La RC no siempre va en la misma dirección que la RI, a veces, vaen la dirección contraria (por ejemplo la respuesta condicionada compensatoria). Métodos de estudio del condicionamiento clásico a)Salivación > En el ejemplo de la salivación del perro: condicionamiento de la respuesta de salivación (de tipo apetitivo porque evoca una respuesta relacionada con la comida) b)Automoldeamiento> En el otro ejemplo, observamos el fenómeno de automoldeamiento. Hay dos estímulos. Aparece la luz de colir rojo y recibe comida (se condiciona este EC al EI). El estímulo provoca la respuesta condicionada. El otro estímulo (luz gris) no da comida. ¿Cuál es la respuesta refleja que provoca en un animal hambriento? Conducta de aproximación. Después de hacer varias veces esto, observamos que tras presentar la luz roja se acerca y coge la comida pero también se da la respuesta condicionada que es picotear la luz roja (RC). Este es el otro ejemplo de paradigma apetitivo que se llama automoldeamiento. El efecto principal de la experiencia es que un estímulo neutro que antes no daba respuesta, ahora provoca un aumento de respuesta. Justo antes de la presentación del EI (comida) se encendía un disco luminoso (EC). Así, el EC adquiría la propiedad de informar sobre la disponibilidad de la comida (la comida era proporcionada independientemente de las respuestas de la paloma) Se observó un fenómeno curioso: en vez de acercarse directamente al plato cuando veían la luz, las palomas comenzaron a picotear primero el disco cuando este se encendía (incluso bajo el riesgo de no llegar a tiempo a por la comida) Esta es una prueba de la atracción que ejercen las señales condicionadas clásicamente cuando el premio es la comida. Los acontecimientos que predicen un suceso relevante estimulan una conducta de seguimiento debido a su significación informativa. Esto también ocurre en humanos (por ejemplo cuando estamos en un ascensor y vamos siguiendo los botones que se iluminan indicando el piso por el que pasamos a pesar de que el hecho de que miremos fijamente no hará que lleguemos antes a donde queremos. c)Condicionamiento de la respuesta palpebral> Los estímulos desagradables producen huída, evitación. El experimento arriba ilustrado se lleva a cabo con un conejo. Siguiendo el sonido se le aplica una descarga eléctrica o una corriente de aire frío (carácter aversivo). Se produce una reacción refleja de parpadeo. El conejo tiene varios párpados (membrana nictitante). Tras el condicionamiento del sonido y la descarga o corriente, si se presenta solo el sonido, el conejo parpadea. El EI sería el soplo de aire en la superficie del ojo o la breve descarga en el párpado inferior. La RI sería el parpadeo (parecida a la RC) y el EC será el tono que le indica que habrá una descarga. Siguiendo un ejemplos los parámetros podrían ser: -Duración (EC breve, por ejemplo 500 msegundos) -Latencia de R (muy breve ( ¿Qué son los estímulos fóbicos? Los que provocan miedo o ansiedad. El miedo es una conducta o respuesta (emoción) con distintos componentes para escapar de los estímulos fóbicos y así sobrevivir. El miedo se mide observando los efectos que tiene sobre el condicionamiento intrumental. Los procedimientos apetitivos provocan aumento de la respuesta. Los aversivos no necesariamente provocan reducción de la respuesta (más bien aumento) en el ejemplo del conejo, el parpadeo no se elimina sino que se incrementa. Tanto en condicionamiento aversivo como apetitivo puede haber disminución o aumento de la respuesta dependiendo de la situación. En el miedo hablamos de la supresión condicionada de la respuesta instrumental, que estima como afecta al miedo a la realización de tareas cotidianas (respuestas instrumentales). Previamente se produce un condicionamiento instrumental, se le enseña a una rata a accionar una palanca para obtener comida. Se asocia posteriormente por condicionamiento clásico un EC (luz o tono) a un EI aversivo (descarga eléctrica). La RI será la respuesta de miedo, huida o evitación y el EC es la luz o tono que le indica la sucesiva descarga. Lo que nos interesa aquí es ¿Cómo medimos el grado en que hemos conseguido condicionar la respuesta de miedo ante el EC (luz, tono)? Utilizamos un método indirecto llamado supresión condicionada de la respuesta instrumental. La supresión condicionada es un índice que nos informa sobre el grado en que un estímulo condicionado al miedo altera la actividad que esta llevando a cabo el animal. Es un proceso que mide los efectos del miedo sobre el condicionamiento instrumental y la presentación de la respuesta instrumental. Para ello se comparan el Nº de veces que se presenta la respuesta en presencia del EC (asociación aversiva) con las veces que se presenta la respuesta instrumental cuando no esta presente el EC (ambos períodos de tiempo deben ser iguales). Ejemplos: RS: 6/12= 0,5 (Ausencia de condicionamiento/ de supresión de la respuesta instr.) RS: 0/6= 0 (Máximo miedo, aprendizaje, condicionamiento) El máximo de miedo será el valor 0 (máximo condicionamiento) y la ausencia de miedo el valor 0,5. La razón de supresión mide el C.C. aversivo aunque se mide a través de RI. Elimina la variabilidad entre sujetos porque incluye en número de respuestas en ausencia del EC. “La técnica de supresión condicionada de la respuesta instrumental se emplea para medir...” a) Condicionamiento clásico b)Condicionamiento instrumental c)Ambos d)Ninguno e)Aprendizaje de aversión al sabor> En un animal al que le damos sacarina y se siente mal por haber consumido mucho se da una devaluación afectiva de ese alimento. Hay una respuesta de rechazo por parte de la rata. Si le volvemos a dar, ella lo rechaza (esta es la manifestación conductual que aprendió). Tras ingerir una sustancia, inducimos en los animales un sentimiento de malestar por inyección de algo tóxico (LiCl). Debido a que asociación del sabor de esa sustancia (EC) con una experiencia de malestar (EI) adquieren una aversión (RC) a dicho sabor. Antes se pensaba que esta reacción no podía responder al paradigma del condicionamiento clásico al igual que la respuesta palpebral o la salivación porque tenía dos peculiaridades: basta un solo emparejamiento para adquirir la aversión al sabor y porque la demora aunque sea muy larga (y pasen horas entre el sabor-malestar) se produce condicionamiento. Sin embargo, esto responde a la importancia biológica que tiene para los animales saber que sustancias les resultan dañinas, por eso es un aprendizaje tan eficaz. 2 Variedades de condicionamiento clásico Clasificación atendiendo a dos criterios: el valor motivacional y la relación EC-EI (dos factores, dos variables con dos niveles). Desde el punto de vista motivacional pueden ser positivos o negativos, desde la relación EC-EI pueden ser excitatorios o inhibitorios. Por ejemplo la salivación o el automoldeamiento serían apetitivos y el condicionamiento palpebral sería aversivo. ¿Cuándo decimos que hay relación causal entre dos estímulos del ambiente? Cuando siempre que sucede uno, necesariamente aparece el otro (relación causal). En función del valor motivacional del EI Apetitivo Aversivo Contingenciapositiva El cond. Excit. se puede medir (cambio de Condicionamiento apetitivo excitatorio El sujeto piensa que el EC es la causa del EI. Por lo tanto el EC provoca una RC de naturaleza similar a la de la RI (excita una respuesta) Condicionamiento excitatorio negativo El sujeto piensa que el EC es la causa del EI. Por lo tanto el EC provoca una RC de naturaleza similar a la de la RI (excita una Relación causal o de contingencia entre el EC-EI magnitud de respuesta) EC>EI = Aumento de la respuesta respuesta, en este caso de evitación) EC>EI = Aumento de la respuesta de evitación Contingencia negativa El cond. Inhib. no se puede medir. Condicionamiento inhibitorio apetitivo El sujeto interpreta que el EC supone la posible retirada del EI. No presenta la respuesta (aprendizaje latente) EC x EI = Disminución de la respuesta Condicionamiento inhibitorio aversivo El sujeto interpreta que el EC supone la posible retirada del EI. No presenta la respuesta de evitación (aprendizaje latente) EC x EI = Disminución de la respuesta de evitación El condicionamiento clásico permite aprender o detectar relaciones causales entre estímulos del ambiente. ¿Cuántos tipos de relación puede haber? Uno que de lugar a otro (relación causal positiva o contingencia positiva) E1 > E2, para referirse a situaciones en las que tras un estímulo aparece necesariamente el otro (un acontecimiento predice el otro). Por ejemplo, cuando se da una relación causal positiva decimos que el condicionamiento resultante es excitatorio porque provoca necesidad de respuesta en el organismo (que será distinta según el valor del EI). El que aparece en primer lugar se percibe como causante del otro. Excitatorio que será aversivo o apetitivo según la naturaleza (según el valor motivacional del EI). Cuidado, porque con los procedimientos aversivos no disminuye necesariamente la respuesta (por ejemplo con el parpadeo aumenta). La RC en condicionamiento apetitivo sería acercamiento y la RC en condicionamiento aversivo sería de escape. ¿Cuál es la semejanza en métodos del estímulo excitatorio apetitivo y aversivo? En ambos casos aumenta la respuesta, siempre hay estímulo que precede al otro. 3 Procesos generales La curva de adquisición representa el aumento del aprendizaje en el condicionamiento clásico. Primero el aprendizaje de la respuesta aumenta considerablemente para luego estabilizarse a medida que se acerca a su nivel máximo (asíntota del aprendizaje). Por ejemplo en el primer ensayo de la curva arriba representada se alcanza casi el 50% del aprendizaje, en el segundo hay un aumento pero menor que el anterior y en los posteriores menos aún (nunca se superará el valos máximo de la asíntota). La línea crece de forma negativamente acelerada (siempre crece pero cada vez un poco menos). En cualquier proceso de condicionamiento se sigue esta línea. Extinción> Si después de alcanzar la asíntota (el máximo crítico) presentamos el EC solo, sin el EI tiende a desaparecer (extinción), la respuesta RC ante el EC va disminuyendo hasta que desaparece (extinción de la respuesta condicionada, algo que es distinto al olvido por el paso del tiempo porque hay un aprendizaje inhibitorio por una contingencia negativa). Si tras un periodo de tiempo se deja de presentar el EI después del EC y una vez extinguida la respuesta se vuelve a presentar el EI reaparece la RC (recuperación espontánea) pero con menor fuerza que en el momento asintótico. Con lo cual no es un olvido permanente del aprendizaje y no es una vuelta al estado original. Presentaciones repetidas del EC sin el EI hacen disminuir la magnitud de la respuesta. La recuperación no es el máximo, es más pobre. Recuperación espontánea> Dependerá del proceso de condicionamiento y del carácter del estímulo incondicionado. Generalización> El sujeto no responde de forma diferenciada a ECs distintos. La ventaja es que economizamos en aprendizaje. ¿De que depende? Del parecido físico-químico entre estímulos y de la experiencia previa con los estímulos. Lo que se aprende de un estímulo se puede transferir a otro, por lo que dos estímulos parecidos provocan la misma respuesta. Depende básicamente del parecido o la proximidad (cuanto más parecido, más provoca la respuesta). Guttman y Kausch (1956) condicionaron una paloma con un EC (luz) de 180 nm. Le hicieron una prueba con luces de 570 y 590, observando que también había respuesta aunque menos. La escala donde comparan las respuestas obtenidas ante estímulos semejantes se denomina gradiente de generalización (grado en que la tasa de RC varía al variar el parecido entre los estímulos y el EC original). Discriminación> A la vez que generalizamos, también aprendemos a discriminar (responder de forma distinta a dos estímulos muy parecidos). Se logra no asociando los mismos EI (se llama aprendizaje perceptivo) a EC parecidos. Si nos asocian un árbol con comida, si ahora damos otro estímulo que comparta características con él, sin haber sido asociado con la comida, da la respuesta de igual manera por su pasado (en el campo de la generalización). Esta situación se soluciona si aprendemos a diferenciar (discriminar), proceso opuesto a la generalización. Aprendemos a discriminar mediante rasgos distintivos. Se produce cuando intercalamos el EC1 con un EC2 parecido que no va seguido del EI. Es un aprendizaje perceptual porque se perciben las diferencias. La adquisición de condicionamiento depende del tiempo de comienzo del EI tras el EC y del sistema de respuesta (intervalo óptimo para cada sistema) y la relación de causalidad. El mejor método para alcanzar el condicionamiento más rápido es el demorado, el EI aparece inmediatamente después del cese de EC (relación de causalidad). -Condicionamiento Simultáneo: EC y EI empiezan y acaban a la vez. No es eficaz. Solo funciona en el condicionamiento del miedo y no es lo mejor. -Demorado: El EI se presenta cuando termina el EC (antes de que este acabe) Es el mejor para un condicionamiento, el más eficaz (se hace mejor la relación causa-efecto). -Demorado (demora larga): la duración del EC es más duradera . El EI se presenta cuando ya llega un rato el EC (antes de que acabe) Al principio es muy efic, luego el animal aprende que no le hace falta prepararse hasta un rato después del EI. A esta retención Paulov lo llamó inhibición de demora. -Huella: Una vez terminado el EC, transcurre un tiempo antes de la introducción del EI, es decir, el EI se presenta cuando ya ha terminado el EC (la memoria copia del estímulo que deja una huella en la memoria con el paso del tiempo) A veces enseña más a inhibir la respuesta o a retenerla que a ejecutarla. -Hacia atrás: Hay otro que es hacia atrás (se presenta el EI y luego el EC poco después, tiene resultados ambiguos). Intervalo óptimo Aquel que favorece el condicionamiento, el que consigue el máximo condicionamiento. Muy breve en respuestas esqueléticas o motoras pero en las que impliquen el SNA (tasa cardiaca…) suelen ser un poco mayores. Si el intervalo entre el EC y el EI es mayor que el intervalo óptimo, el condicionamiento va a ser muy pobre. En la respuesta de parpadeo el intervalo óptimo ha de ser muy bajo. Intensidad del EC Si es alta la asíntota será mayor, si es baja la asíntota será menor. Observamos de modo general que en la curva del condicionamiento se alcanza más rápido la asíntota cuanto más intenso es el estímulo. Relación directa entre la magnitud del EC y el resultado. Se alcanza antes la asíntota cuando el EC es más intenso. Cuando hablamos de la intensidad de un E nos referimos a algún parámetro físico de ese estímulo. Intensidad del EI Mismas características que el anterior. Naturaleza de los estímulos Se relacionan ciertoshechos con ciertas consecuencias en función de los sistemas de defensa interno (alimentos) o externos (animales amenazantes). Si un estímulo (mal estar) es interno se asociará con la comida, mientras que uno externo con otro externo (descarga con una luz). 4 Paradigma instrumental Condicionamiento instrumental> actividad que utiliza el sujeto para obtener algo, siendo los Ed los que más o menos indican las consecuencias de su conducta. El condicionamiento instrumental y el condicionamiento clásico son dos variedades de un proceso común de asociación. En el condicionamiento clásico el sujeto es pasivo, la aparición de los dos estímulos (EI y EC) no dependen de lo que el sujeto haga, no es necesario que el sujeto realice la respuesta tras el EC para que aparezca el EI. Este aparece independientemente de lo que el sujeto haga, es el experimentador el que decide. La respuesta que realiza el individuo es consecuencia del condicionamiento. En el condicionamiento instrumental depende del sujeto. Si el gato de la caja de Thorndike no da a la palanca, no recibe comida. Debe realizar la conducta para recibir la consecuencia (reforzador). El sujeto realiza la conducta instrumental en presencia de unos estímulos determinados llamados discriminativos que dan lugar a la obtención de varias consecuencias o reforzadores. Thorndike quiso estudiar la inteligencia animal. Para ello metía un gato hambriento en una caja problema y ponía comida fuera. La tarea del gato consistía en aprender a escapar de la caja para obtener la comida. Comprobó que a medida que avanzaban los ensayos, los gatos tardaban menos en salir. Interpretó que esa mejora era resultado del aprendizaje, de una asociación entre su conducta y el estímulo antecedente. Formuló entonces la ley del efecto que dice que si una respuesta ejecutada en presencia de un estímulo, va seguida de un hecho satisfactorio, la asociación entre el hecho y la respuesta se fortalece. Si el hecho es molesto, la asociación se debilita. Estos resultados despertaron el interés de los científicos, que diseñaron nuevas situaciones experimentales: Ensayos libres (Small 1900, laberintos) Solo pueden realizar la respuesta instrumental una vez por ensayo. Corredor (laberinto recto) y laberinto en forma de T. Operante libre (El sujeto puede repetir la respuesta instrumental una y otra vez) B. F Skinner (1938) quería analizar en laboratorio una forma de conducta que fuera representativa de toda la actividad que se produce continuamente. En la caja de Skinner medimos la latencia de respuesta, magnitud… pero sobre todo la tasa de respuesta. Previamente hay que definir una unidad mediable de conducta. Definimos unidades de conducta en función de su funcionalidad. Elementos del paradigma instrumental -Estímulos discriminativos: En su presencia la realización de una conducta conllevará unas consecuencias (reforzador positivo o negativo). -Respuesta instrumental: Acto intencional o propositivo que el sujeto realiza para obtener un reforzador en un contexto específico. -Reforzador: Consecuencia encaminada a fortalecer la relación Ed Rins. ¿Un Ec es lo mismo que un Ed? No son lo mismo. Los Ed son estímulos presentes en el condicionamiento instrumental que indican al individuo la relación entre la acción y sus consecuencias. Cuando el EC se presenta, va seguido por el EI y se presentan con independencia de lo que el sujeto haga. En cambio el Ed no indica que va a recibir el EI, es una señal que indica que puede realizar la conducta tras la cual va a recibir el reforzador. El reforzador es lo mismo que el EI, solo que utilizamos terminología diferente para cada paradigma. Un EC entonces es una señal que advierte al sujeto que de modo inmediato se va a producir el EI (el sujeto no tiene que hacer nada). El Ed es una señal que indica al sujeto que en esas condiciones se debe realizar una acción para obtener determinados estímulos (reforzadores) En términos físicos pueden ser idénticos pero su significado es distinto para el sujeto. Hay estímulos discriminativos positivos y negativos Positivos> Indican al sujeto la relación de contingencia positiva entre la respuesta y las consecuencias. Un Ed es positivo porque se dice que de la acción se derivan sus consecuencias (sean las que sean). No tiene que ver con el valor motivacional, aquí también habría contingencia positiva (contingencia = relación entre la conducta y sus consecuencias, sean estas agradables o desagradables para el sujeto). También sería contingencia positiva si hubiese relación pero el reforzador fuese negativo (por ejemplo descarga). Contingencia positiva entre la acción y el reforzador. Negativos> Señal del ambiente que indica que hay una relación de contingencia negativa entre la acción y sus consecuencias (no hay reforzador presente). Indica que de la acción no se deriva una consecuencia (no tiene que ver con el valor motivacional). Los reforzadores también se clasifican en función de su valor motivacional: Reforzador positivo> aquellos que tienen valor motivacional apetitivo. Incrementan la respuesta. Pueden ser primarios (comida, bebida...) o secundarios (dinero). Reforzador negativo> estímulos reforzantes que tienen cualidades desagradables (aversivos). Si existiera una contingencia negativa entre la respuesta y un reforzdor negativo se produciría un incremento de la respuesta (reforzamiento negativo). Valor motivacional del reforzador Positivo Negativo Relación de contingencia Respuesta > Reforzador Positiva Recompensa Entrenamiento de recompensa: La respuesta conlleva un reforzador positivo. (Incremento de la respuesta) Castigo La respuesta conlleva un reforzador negativo. (Disminución de la respuesta) Negativa Entrenamiento de omisión o Castigo negativo Escape o Evitación La respuesta conlleva la retirada de un reforzador de carácter negativo. La respuesta conlleva la retirada de un reforzador positivo. (disminuye la respuesta) (Aumenta la respuesta) ➢ RECOMPENSA > “entrenamiento o aprendizaje de recuperación” Aumento de la respuesta. Contingencia positiva y un reforzador apetitivo (reforzador positivo por lo que aumenta la respuesta). Por ejemplo salario y trabajo realizado, estudiar y aprobar. ➢ CASTIGO POSITIVO> un sujeto presiona la palanca y recibe una descarga eléctrica. Si no realiza la acción, no la recibe. Contingencia positiva, porque hay relación y reforzador aversivo. Disminución de la respuesta (“castigo positivo”, el nombre no tiene que ver con el valor motivacional). ¿Semejanzas o diferencias entre ambos? En ambos casos hay contingencia positiva entre una acción y una consecuencia. Lo que las diferencia es el valor motivacional del reforzador (en la recompensa una conducta lleva a conseguir algo positivo, en el castigo positivo una conducta te lleva a conseguir algo que no tiene para ti valor motivacional alto). ➢ CASTIGO NEGATIVO (aprendizaje de omisión): Hacer las tareas o respuestas tienen como consecuencia no recibir el reforzador. Contingencia negativa (omisión de algo positivo, el reforzador retirado es positivo o apetecible). Ocasiona que algo que esperas recibir, finalmente no se reciba. Disminuye entonces la frecuencia de la respuesta porque esa acción lleva a omitir algo positivo. Impide algo positivo. Los efectos conductuales son parecidos a los del castigo negativo. Por ejemplo tengo 8 puntos en el carnet, si me salto el semáforo me retiran puntos: Mi conducta instrumental es inapropiada y conlleva que me quiten puntos, algo que yo tenía. ➢ EVITACIÓN O ESCAPE > La conducta o respuesta interrumpe o impide algo aversivo, algo negativo, pone fin a algo desagradable (evitación). El reforzador retirado es de tipo aversivo por lo que aumenta la respuesta. Contingencia negativa. Usa sus actospara eludir hechos aversivos ¿Qué puedo hacer para eludirlo? La respuesta interrumpe exponerse a la estimulación aversiva. Escape es para eludir un hecho que ya has experimentado en parte, y evitación es para eludir un hecho que aun no has experimentado ¿y si es algo bueno lo que esperas? Por ejemplo no quiero ir a la cena de nochebuena porque no aguanto a la familia, por tanto digo que tengo que ir a una cena del trabajo a la que no puedo faltar para evitar ir a la cena de familia (evitar). Otro ejemplo, el rey se marchó porque Chavez no se callaba (escape). Es positiva (la consecuencia) porque eludes consecuencias o situaciones negativas. Evitación es cuando la conducta se da antes de que se presente el estímulo aversivo. EQUIVALENCIAS O SEMEJANZAS ENTRE C.CLÁSICO Y C. INTRUMENTAL ➢ Entrenamiento recompensa (CI) y excitatorio apetitivo (CC) ▪ Semejanzas: aumenta la respuesta, contingencia positiva, valor motivacional apetitivo (EI y reforzador positivo) ▪ Diferencias: En el C.C el sujeto no tiene que hacer nada para recibir la consecuencia, en el CI sí que hay que realizar una R para obtener el reforzador. ➢ Castigo positivo (CI) y excitatorio aversivo (CC) ▪ Semejanzas: contingencia positiva (EI y reforzador negativo) ▪ Diferencias: en el excitatorio aversivo aumenta la respuesta y en el castigo es más baja (disminuye) por lo que hay distintos efectos conductuales ➢ Entrenamiento omisión (CI) e inhibición apetitiva (CC) ▪ Semejanzas: disminuye la respuesta (mismos efectos conductuales) y contingencia negativa (los reforzadores retirados son positivos) ▪ Diferencias: En el C.C el sujeto no tiene que hacer nada para recibir la consecuencia, en el CI sí. ➢ Evitación o escape (CI) e inhibición aversiva (CC) ▪ Semejanzas: contingencia negativa (El EI y el reforzador retirados son negativos) ▪ Diferencias: en el escape aumenta la respuesta, en la inhibitoria apetitiva baja (efectos conductuales distintos) Variables que influyen en la adquisición de condicionamiento instrumental -Magnitud de la recompensa: A mayor magnitu, mayor adquisición de aprendizaje (también influye el valor motivacional de la recompensa para el sujeto). Se introducen dos sujetos en un laberinto lineal en cuya meta se encuentra una caja con comida. El tiempo de realización de la conducta disminuye a medida que aumentan los ensayos. Mientras el primer sujeto recibe 6 bolitas de comida el segundo tan solo recibe 1. El que aprende más rápido es el que recibe las 6 bolitas, debido a la mayor magnitud de su recompensa. Cuando ambos sujetos han alcanzado la asíntota del aprendizaje, se comienza a dar 6 bolitas también al segundo sujeto, de manera que este reduce aún más el tiempo de realización de la conducta (mayor valoración del reforzador). Se trata de un ejemplo de aprendizaje incentivo (en función de la historia previa con estos acontecimientos). -Demora del reforzamiento: Cuando mayor sea la demora más difícil es que se produzca el Cond. Ins, por ejemplo saltarse un semáforo en rojo y la multa se produce un año después. La eficacia del reforzamiento es mayor cuando es inmediato. Cuanto más rápido se da el reforzamiento menos latencia de la respuesta. -Características del Ed: Se generaliza el condicionamiento a estímulos parecidos. Ed > R > Ref (E2 y E3 son parecidos al Ed aunque no estuvieron presentes durante el entrenamiento también controlan parte de la respuesta cuanto más parecidos sean físicamente. Ejemplo El Ed es de 600 nm y los E2 y E3 también son luces pero de más o menos nm. Cuanto más parecidos a 600, mayor respuesta. Generaliza la respuesta aprendida a otros estímulos parecidos. El proceso inverso de la generalización es la discriminación. Discriminación: Saber exactamente ante que estimulo responder para que haya recompensa. Consiste en responder de manera diferenciada hacia estímulos similares. Hay dos mecanismos. ¿Cómo aprendemos a discriminar por ejemplo entre una luz de 600 mm y una de 650? Al principio el individuo responde por igual pero tras unos entrenamientos aprende a distinguir, a ver que tras uno hay reforzamiento y tras otro no. FORMAS DE REFORZAMIENTO Lo más importante de todo lo dicho es el modo en como se administren los reforzadores. 1) Continuo> cada vez que se realiza la respuesta o conducta se obtiene el reforzamiento. Siempre se da reforzamiento. 2) Intermitente> a veces se refuerza y otras no (no siempre que el sujeto realiza la conducta recibirá el reforzamiento). Es el más eficaz. A veces se da reforzamiento y a veces no. Se consigue una tasa de respuesta muy alta. ➢ Intervalo: la obtención de la recompensa depende del tiempo desde la ultima acción realizada y reforzada. La obtención del reforzamiento depende de la ultima vez que la conducta fue reforzada. o IF (intervalo fijado, por ejemplo 30 segundos) Depende del tiempo transcurrido desde la última vez que el sujeto recibió la recompensa. o IV (intervalo variable): El tiempo varía (a veces una semana, otras un mes…). ➢ Razón: la obtención de la recompensa depende del número de acciones que realiza el sujeto). Para obtener la recompensa hay que realizar la conducta un número determinado de veces que puede ser fijo (RF) o variable (RV) o RF (razón fija) El sujeto recibe la recompensa tras hacer un determinado número de respuestas (por ejemplo tras dar 50 veces a la palanca). o RV (razón variable)Cuando el número de veces cambia o se mantiene en torno a intervalo. Cada programa tiene su pauta típica de respuesta. En general, el reforzamiento intermitente (efecto del reforzamiento parcial) genera tasas de respuesta más alta. Por ejemplo, máquinas tragaperras. TEMA 4: PROCESO DE CONDICIONAMIENTO CLÁSICO 1. Novedad del estímulo y experiencia anterior Fenómenos de pre-exposición: La experiencia con los estímulos antes del condicionamiento retarda la adquisición de la respuesta condicionada. Se puede dar un déficit de condicionamiento a pesar de que se den las condiciones óptimas para su adquisición porque el sujeto no presta suficiente atención a los estímulos ya que previamente han adquirido un significado de irrelevantes. Esta situación puede venir provocada por la preexposición a los estímulos (EI o EC) en solitario, de manera que no se establezcan relaciones entre uno y otro. Son situaciones particulares pero nos permiten extraer mecanismos de este aprendizaje. Influye el aprendizaje perceptivo (nos ayuda a discriminar ciertos estímulos). Algunos de estos fenómenos son: -Inhibición latente: Se produce por una preexposición al EC (sin ser seguido del EI). Por ello posteriormente es más díficil que el EC adquiera el significado de “causa” del EI y se produzca el condicionamiento. El EC tiene un significado previo de “no causa del EI”. Sería más fácil establecer esta relación frente a un EC novedoso. -Preexposición al EI: Si se presenta el EI en solitario como antes se mencionó, luego será más complicado que este se relacione con un EC previo debido a que el aprendizaje perceptivo, ha establecido previamente una caracterización del EI en la que no se contaba con la presencia previa de ningún EC. -Irrelevancia aprendida: Se produce cuando se presentan EC y EI de manera acontingente, es decir, de forma separada, de tal manera que no se establezca una relación de ningún tipo entre ellos. Cuando se trate de producir un condicionamiento presentándolos seguidos se producirá un retraso (mayor que los anteriores) en el aprendizaje porque ambos tiene un significado previo en el que no se relacionan entre sí. Inhibición latente y esquizofrenia La esquizofrenia se trata de un desorden neuro-psiquiátrico de etiología poco conocida. Entre algunos de sus síntomas se encuentran las