Buscar

Aprendizagem e recompensa

Prévia do material em texto

Aprendizagem e recompensa
A aprendizagem é uma mudança relativamente duradoura de comportamento resultante da experiência. Ela ocorre quando os organismos se beneficiam da experiência para que seus futuros comportamentos sejam bem mais adaptados ao ambiente.
Como se desenvolveu o estudo comportamental da aprendizagem?
Watson fundou a escola do behaviorismo, que se baseava na crença de que os animais e os humanos nascem com o potencial de aprender qualquer coisa.
O behaviorismo afirmava que o ambiente e seus efeitos associados sobre o organismo eram os únicos determinantes da aprendizagem.
“Dê-me uma dúzia de bebes sadios, bem formados e o meu próprio mundo especificado para cria-los, e eu garanto que poderei tornar qualquer um deles, aleatoriamente, e treiná-lo para se tornar um especialista em algo que eu escolher – médico, advogado, artista, comerciante, e sim, inclusive um mendigo pedinte ou um ladrão, independente de seus talentos, inclinações, tendências, capacidades, vocação, e raça de seus ancestrais.” (Watson, 1924, p. 82)
Experimentos de Pavlov
Condicionamento clássico: Um tipo de resposta aprendida que ocorre quando um objeto neutro passa a eliciar uma resposta reflexa ao ser associado a um estimulo que já produz essa resposta.
Resposta incondicionada (RI): uma resposta que não precisa ser aprendida, tal como um reflexo.
Estimulo incondicionado (EI): um estimulo que elicia uma resposta, tal como um reflexo, sem qualquer aprendizagem anterior.
Estimulo condicionado (EC): um estimulo que só elicia uma resposta depois de ter ocorrido a aprendizagem.
Resposta condicionado (RC): uma resposta que foi aprendida.
Aquisição: A formação gradual de uma associação entre os estímulos condicionados e incondicionados. 
Exemplo: toda vez que chove, uma planta deliciosa e nutritiva floresce. O animal que aprende essa associação procurará essa planta sempre que chover.
Extinção: um processo em que a resposta condicionada é enfraquecida quando o estimulo condicionado é repetido sem o estimulo incondicionado.
Recuperação espontânea: um processo em que uma resposta previamente extinta ressurge após a apresentação do estimulo condicionado.
 Generalização do estímulo:
Ocorre quando estímulos semelhantes, mas não idênticos ao estímulo condicionado produzem a resposta condicionada. 
Discriminação do estímulo: uma tendência aprendida de diferenciar entre dois estímulos semelhantes se um estiver consistentemente associado ao estímulo incondicionado e outro não. 
AS FOBIAS E ADICÇÕES TEM COMPONENTES APRENDIDOS
As fobias são medos adquiridos desproporcionais a ameaça real.
As fobias se desenvolvem pela generalização de uma experiência de medo, tal como quando a pessoa é picada por uma abelha e passa a ter medo de todos os insetos.
Soldados estadunidenses que lutaram no Vietnã, às vezes desenvolvem fobias a objetos e eventos associados à batalha, tal como a visão de uniformes de uniformes, sons de batalha e até da língua vietnamita. Pavlov referiu-se a essas fobias aprendidas como respostas emocionais condicionadas.
Técnicas de condicionamento clássico foram valiosas para a criação de terapias comportamentais para tratar fobias. Por exemplo, expor a pessoa a pequenas doses do estímulo temido ao mesmo tempo em que ela é envolvida em uma tarefa agradável, o contra condicionamento, pode ajudá-la a superar seu medo.
ADICÇÃO A DROGAS
Quando ex-adictos à heroína são expostos a deixas ambientais associadas ao uso da droga, eles geralmente experienciam fissura e sensações fisiológicas semelhantes as que experienciavam durante a abstinência. Assim, os adictos que deixam de usar drogas em centros de tratamento muitas vezes tem recaídas quando retornam ao seu antigo ambiente.
Os soldados americanos que lutaram no Vietnã usavam drogas com frequência para lidar com as condições infernais da guerra. Eles as utilizavam para lidar com o medo, a depressão, a saudade de casa, o tédio, e a repressividade dos regulamentos do exército. E isso era praticamente ignorado, visto como algo que aliviava a pressão que eles sofriam.
Dada a ideia prevalente de que a adicção era um transtorno biológico com uma baixa taxa de recuperação, esses achados indicavam que dezenas de milhares de adicctos de heroína logo estariam inundando as cidades dos EUA. Mas isso não aconteceu.
Aproximadamente 95% dos adictos já não usavam drogas alguns meses após seu retorno. 
Para os soldados adictos, todas as deixas para o uso de drogas estavam relacionadas ao Vietnã e seu ambiente militar associado. Quando eles voltaram para casa, nenhuma dessas deixam estavam por perto, e consequentemente, os soldados não experienciaram efeitos condicionados de abstinência. 
Prontidão biológica: a ideia de que os animais estão biologicamente programados para aprender a temes objetos específicos. 
CONDICIONAMENTO OPERANTE
Nossos comportamentos geralmente representam um meio para um fim.
Muitas das nossas ações são estruturais são realizadas com um propósito. Nós aprendemos a nos comportar de certas maneiras para sermos recompensados, e evitamos nos comportar de certas maneiras para não sermos punidos: isso se chama condicionamento instrumental ou condicionamento operante.
O condicionamento operante é o processo de aprendizagem em que as consequências de uma ação determinam a probabilidade de ela ser realizada novamente. 
Lei do efeito: a teoria geral de aprendizagem de Thorndike, que afirma que qualquer comportamento que leve a um "estado de coisas satisfatório" tem maior probabilidade de ocorrer novamente e que aqueles que levam a um "estado de coisas incômodo" tem menor probabilidade de ocorrer de novo.
Reforço: um estímulo que se segue a uma resposta e aumenta e aumenta a probabilidade de essa resposta acontecer de novo.
Modelagem: um processo de condicionamento operante que envolve reforçar comportamentos cada vez mais semelhantes ao comportamento desejado.
A modelagem é um procedimento poderoso, capaz de condicionar animais a realizarem façanhas surpreendentes: pombos jogam pingue-pongue, cachorros tocam piano e etc. 
Pais e educadores utilizam frequentemente formas sutis de modelagem para incentivar comportamento apropriados nas crianças com dificuldades psicológicas. 
Reforços primários: reforços que são inatamente reforçadores, tais como aqueles que satisfazem necessidades biológicas (como alimento e água).
Reforços secundários: eventos ou objetos que servem como reforço, mas não satisfazem necessidades biológicas (dinheiro, nota boa na prova, abraço de um amigo)
TANTO O REFORÇO COMO A PUNIÇÃO PODEM SER NEGATIVOS E POSITIVOS
Punição: um estímulo que se segue a uma resposta e diminui a probabilidade de a resposta ser repetida.
Punição positiva: a punição que ocorre quando se administra um estímulo que diminui a probabilidade de um comportamento acontecer novamente.
Punição negativa: a punição que ocorre quando se remove um estímulo que diminui a probabilidade de um comportamento acontecer novamente.
Reforço positivo: o aumento na probabilidade de um comportamento ser repetido após a administração de um estímulo agradável, referido como recompensa. 
Reforço negativo: o aumento na probabilidade de um comportamento ser repetido pela remoção de um estímulo aversivo.
Efetividade da punição parental:
Para que a punição seja efetiva ela deve ser aplicada logo após o comportamento indesejado e só deve ser aplicada a comportamentos indesejados
Erro dos pais: punir quando o filho conta a verdade. 
Punição também pode causar emoções negativas: o filho pode começar a ter medo dos pais ao invés de parar com o comportamento indesejado.
Ocasiões em que a punição é necessária: quando uma criança pequena está fazendo algo perigoso e precisa ser parada imediatamente, por exemplo.
O CONDICIONAMENTO OPERANTE É INFLUENCIADO POR ESQUEMAS DE REFORÇO 
Reforço contínuo: um tipo de aprendizagem em que o comportamento desejado é reforçado sempre que ocorre.Reforço parcial: um tipo de aprendizagem em que o comportamento é reforçado intermitentemente.
Esquema de razão: o reforço é baseado no número de vezes que o comportamento ocorre. 
Esquema de intervalo: o reforço é baseado em uma unidade de tempo específica. 
Esquema fixo: o reforço é oferecido consistentemente sempre que o reforço ocorre.
Esquema variável: o reforço é aplicado em índices diferentes ou em momentos diferentes.
Efeito da extinção do reforço parcial: a maior persistência do comportamento sob reforço parcial do que sob reforço contínuo. 
LIMITAÇÕES BIOLÓGICAS:
Os animais têm dificuldades de aprender comportamentos que se opõem a sua capacidade evolutiva.
Os animais têm reações inatas de defesa a estímulos ameaçadores. O condicionamento é mais efetivo quando a associação entre a resposta comportamental e o reforço é semelhante às predisposições inatas do animal.
APRENDIZAGEM POR OBSERVAÇÃO 
Aprendizagem observacional: a aprendizagem que ocorre quando comportamentos são adquiridos ou modificados após a exposição a outras pessoas que estão realizando o comportamento.
Aprendizagem observacional do medo
Os animais e os humanos imitam prontamente as ações dos outros.
A imitação do comportamento observado geralmente é referida como modelação: no sentido em que os humanos ou animais reproduzem os comportamentos de modelos - aqueles que estão sendo observados. Em geral, é mais provável que imitemos as ações de modelos atraentes, com status elevado e um tanto parecidos conosco.
Aprendizagem vicária: a aprendizagem que ocorre quando as pessoas aprendem as consequências de uma ação ao observar outros sendo recompensados ou punidos por executar uma ação. 
Neurônios espelho: neurônios do córtex pré-motor que são ativados quando se observa outro executar uma ação. 
Os neurônios espelho nos ajudam a explicar e predizer o comportamento dos outros. Em outras palavras, eles nos ajudam a nos colocarmos no lugar das pessoas que observamos para compreender melhor suas ações. 
Sistema mesolímbico de dopamina: 
Esse sistema é o mecanismo cerebral mais importante por trás da recompensa. Ele conecta a área tegmentar ventral ao núcleo accumbens.
Lesões nessa área interferem em comportamentos naturalmente motivados, como comer, beber e copular.
A dependência física tem componentes aprendidos e biológicos
Os problemas sociais do uso de drogas são bem conhecidos. Mas porque as pessoas se arriscam a morrer ou sofrer prejuízos para obter um prazer momentâneo?
As pessoas tomam drogas para esquecer seus problemas ou lidar com estresse, e isso também envolve reforço negativo.
O uso de drogas também é positivamente reforçado. As pessoas usam drogas para se sentirem bem. Por exemplo, a heroína entra no cérebro mais facilmente do que a morfina; assim, embora a heroína e a morfina tenham efeitos idênticos, a maior velocidade da heroína a torna mais aditiva do que a morfina.
O sistema mesolímbico de dopamina é o sistema cerebral mais importante envolvido no reforço positivo do uso de drogas. A maioria das drogas aditivas estão associadas à maior liberação de dopamina ao núcleo accumbens. As drogas aumentam a liberação da dopamina ou impedem a terminação normal de seu sinal neural. A maioria dos pesquisadores concluiu que a liberação de dopamina é uma condição necessária para o reforço e para a dependência.

Continue navegando