Buscar

Revisando o condicionamento clássico e operante

Prévia do material em texto

Revisando o condicionamento clássico e operante
Efeito não intencional de reforçamento 
Aprendizagem superticosa: um determinado com comportamento é reforçado apenas acidentalmente, porque por coincidêncoa ele é seguido de um incidente reforçador. 
Skinner chamou de supertição.
Ex. Se por acaso você estiver vestindo uma camisa estampada com o rosto do Albert Einstein quando tirar sua primeira nota alta em uma prova, você poderá passar a acreditar que o motivo disso foi vestir a camiseta. 
Embora a conexão seja pura coincidência, você poderá continuar a vestir sua “camiseta da sorte” sempre que estiver uma prova ára fazer. 
Alguns efeitos da punição
Para que a punição seja eficaz, deve ser imposta de modo apropriado. 
Primeiramente, deve ser rápida. Se demorar, não funciona tão bem. Mandar uma criança mal comportada imediatamente para o castigo (mesmo quando não é conveniente fazê-lo) é mais eficaz que esperar uma “hora melhor” para puni-la. 
A punição também deve ser suficiente, sem ser cruel. Se um pai repreende brevemente um filho por bater em outras crianças, o efeito disso provavelmente será menos pronunciado do que se a criança ficasse de castigo no quarto durante um dia inteiro. 
Ao mesmo tempo, a punição precisa ser consistente. 
Deve ser imposta para todos os casos de infração a uma regra, e não apenas para alguns.
Se os pais permitirem que alguns atos agressivos fiquem impunes, é provável que seus filhos continuem a maltratar outras crianças. 
A punição é particurlamente útil em situações nas quais um comportamento é perigoso e deve ser mudado rapidamente. 
Crianças que gostam de enfiar coisas nas tomadas elétricas devem ser impedidas de fazê-lo imediatamente, e por isso a punição será a melhor ação recomendada. 
Mas, mesmo em situações como essas, a punição tem desvantagens (Skinner, 1953). 
Em primeiro lugar, ela apenas suprime o comportamento indesejado; não ajuda a desaprender o comportamento nem ensina outro, mais desejável. 
Se a ameaça de punição for removida, é provável que o comportamento negativo se repita. 
A punição raramente funciona quando se deseja alterações duradouras de comportamento. 
A punição em geral provoca sentimentos negativos (frustração, ressentimento, dúvida), os quais podem impedir a aprendizagem de comportamentos novos e desejáveis. 
Ex. Se uma criança que está aprendendo a ler é repreendida a cada palavra mal pronunciada, poderá se sentir muito frustrada e mostrar se hesitante. 
A frustração e a dúvida quanto à sua capacidade podem fazer com que ela pronuncie cada vez mais palavras de modo errado, o que levará mais repreensões. Com o tempo, os ressentimentos negativos provocados pela punição podem se tornar tão desagradáveis que a criança evitará a leitura. 
A punição severa pode encorajar a pessoa punida a reproduzir o mesmo comportamento severo e agressivo em relação a outras pessoas. 
Em estudos de laboratório, macacos severamente punidos tenderam a atacar outros macacos – o mesmo aconteceu com pombos e assim por diante. 
Além disso, em geral a punição faz com que as pessoas fiquem nervosas e, consequentemente, mais agressivas e hostis. 
Às vezes, após a punição ter sido empregada algumas vezes, não é necessário dar continuidade a ela, porque a mera ameaça é suficiente para induzir ao comportamento desejado.
Os psicólogos chamam isso de treinamento esquiva porque a pessoa está aprendendo a evitar a possibilidade de uma consequência punitiva. 
O treinamento de esquiva é responsável por muito de nossos comportamentos diários. 
É ele que faz com que você carregue uma sombrinha quando parece que vai chover, a fim de vitar o “castigo” de ficar molhado; também faz com que você mantenha sua mão distante de um ferro de passar, para não correr o risco de uma queimadura. 
Entretanto, o treinamento de esquiva nem sempre funciona a nosso favor. 
Ex. Uma criança que tenha sido repetidamente criticada por suas notas baixas em matemática poderá aprender a evitar problemas matemáticos difíceis para afastar a possibilidade de ser punida. 
Infelizmente, em razão dessa atitude de esquiva, a criança deixa de desenvolver habilidades matemáticas e, portanto, não consegue melhorar algumas de suas capacidades inatas; assim, um círculo vicioso se instala. 
Nesse caso, a atitude de esquiva deve ser desaprendida por meio de algumas experiências positivas com matemática para que esse círculo seja quebrado. 
Desamparo aprendido
Por meio de treinamento de esquiva as pessoas tentam evitar que sejam punidas, mas o que acontece quando não é possível, por alguma razão, evitar a punição? 
Geralmente, a resposta é uma desistência, que pode se generalizar a outras situações. Essa reação é chamada de desamparo aprendido.
 
Martin Seligman e seus colegas estudaram pela primeira vez o desamparo aprendido em experimentos realizados com cães. 
Eles colocaram dois grupos de cães em câmaras que davam uma série de choques elétricos nas patas dos animais a intervalos aleatórios. 
Os cães do grupo de controle podiam desligar os choques (escapar deles) ao pressionar o painel com o focinho. 
Os cães do grupo experimental não podiam desligar os choques – eram, de fato, impotentes. Em seguida, ambos os grupos foram colocados em situações diferentes: poderiam escapar dos choques saltando sobre um anteparo móvel. 
Os choques eram administrados a cada 50 segundos e uma luz de advertência se acendia sempre dez segundos antes de cada choque. 
Os cães do grupo de controle rapidamente aprederam a saltar sobre o anteparo assim que a luz piscava, mas os cães do grupo experimental, não. 
Esses cães, que antes levaram choques que não conseguiam evitar, não saltaram sobre o anteparo nem mesmo depois que os choques começaram a ocorrer.
Eles apenas se deitavam e aceitavam a dor. Além disso, muitos desses cães ficaram apáticos, perderam apetite e passaram a apresentar outros sintomas associados à depressão. 
Muitos estudos subsequentes mostraram que o desamparo aprendido pode ocorrer tanto com animais quanto em seres humanos (Maier e Seligman, 1976). 
Uma vez estabelecido, ele se generaliza para novas situações e pode se tornar bastante persistente, mesmo quando é evidente que as circunstâncias desagradável pode ser evitada. 
Ex. Quando depara por uma série de problemas insolúveis, um poderá, em algum momento, desistir de tentar resolvê-los e fazer apenas esforços pouco entusiasmados de solucionar novos problemas, mesmo quando os novos problemas tenham solução. 
Além do mais, o êxito na resolução de novos problemas surtirá pouco efeito sobre o comportamento da pessoa. Ela continuará a fazer apenas tentativas desinteressadas, como se nunca tivesse obtido êxito em nada do que fizesse.
De maneira semelhante, crianças educadas em uma família violenta, em que a punição não está relacionada ao comportamento, em geral desenvolvem a sensação de desamparo.
Até mesmo em contextos relativamente normais e externos às suas famílias, é comum que elas se sintam apáticas, passivas e indiferentes. 
Elas fazem poucas tentativas para buscar recompensas ou evitar incômodos. 
Alguns fatores comuns ao condicionamento clássico e ao condicionamento operante
Ambas são feitas por associação. 
No condicionamento clássico, a associação ocorre entre dois estímulos (a comida e a campanhia, por exemplo), ao passo que no condicionamento operante aprende se a associação entre uma ação e uma consequência. 
As respostas geradas tanto pelo condicoonamento clássico quanto pelo operante estarão sob o controle dos estímulos do ambiente. 
Acima de tudo, em ambos os casos as respostas aprendidas com uma pista podem se generalizar diante de estímulos semelhantes a essa pista. 
Nenhum dos dois tipos de respostas condicionadas (clássico ou operante) durará para sempre se não for renovado periodicamente. 
Contudo, isso não significa necessariamente que tais respostas sejam totalmente esquecidas.Mesmo quando você pensa que elas já desapareceram há muito tempo, qualquer uma delas poderá reaparecer de repente no momento oportuno. 
Em ambos os tipos de aprendizagem (clássico e operante) novos comportamentos podem ser construídos a partir dos previamente existentes. 
Extinção e recuperação expontânea. 
Outro fator comum entre condicionamento clássico e operante é que as respostas aprendidas às vezes enfraquecem, podendo até mesmo desaparecer. 
Por exemplo, se um EC e um ENC nunca mais forem emparelhados, ou se uma consequência sempre deixa de seguir-se a determinado comportamento, a associação aprendida começará a desaparecer gradualmente até que, em algum momento, os efeitos da aprendizagem não serão mais visto. 
Extinção e recuperação espontânea no condicionamento clássico: o cães de Pavlov, que tinham aprendido a salivar sempre que escutavam soar uma campanhia.
O que você acha que aconteceu ao longo do tempo quando os cães escutavam o sino tocar (EC), mas a comida não era mais servida (ENC)? 
A resposta condicionada à campainha – a salivação – se tornou cada vez menos frequente até desaparecer por completo. 
Os cães não salivavam mais quando escutavam o som. 
A resposta havia se extinguido. 
Se as músicas de suspense dos filmes (EC) não forem mais emparelhadas com a mostra de eventos amedrontadores na tela (ENC), você provavelmente irá parar de ficar tendo e ansioso (RC) toda vez que escutar esse tipo de música. Sua resposta condicionada à música será extinta. 
Quando esse tipo de resposta é extinto, será que o que foi aprendido se perdeu para sempre? 
Pavlov treinou seus cães para que salivassem ao escutar a campanhia e depois extinguiu essa resposta condicionada. 
Poucos dias depois, os animais foram expostos ao sino novamente no ambiente de laboratório. 
Assim, que o escutaram, ficaram com água na boca. A resposta que havia sido aprendida e depois extinta reapareceu por si só, sem necessidade de treinamento.Esse fenônemo é chamado de recuperação espontânea. 
A resposta dos cães, no entanto, apresentava apenas metade da intensidade que tinha antes da extinção, e seria muito fácil extingui-la mais uma vez.
Apesar disso, o simples fato de que a resposta tinha ocorrido indicava que a aprendizagem original não havia sido completamente esquecida. 
De maneira semelhante, se você parar de ir ao cinema durante algum tempo, descobrirá que, da próxima vez que for, aquela música de suspense voltará a fazer com que você se sinta tenso e ansioso. 
Uma resposta que havia sido extinta retorna espontaneamente com o passar do tempo.
Extinção e recuperação espontânea no condicionamento operante: no condicionamento operante a extinção acontece como resultado da suspensão do reforço.
Em geral, o efeito não é imediato. Na verdade, quando o reforço é descontinuado, é comum que ocorra um breve aumento de intensidade ou frequência da resposta antes de ela parar de ocorrer. 
Ex. Se você inserir moedas em uma máquina de vendas automáticas e ela falhar em entregar-lhe os produtos, é possível que você mova a alavanca com mais força por várias vezes seguidas antes de finalmente desistir. 
Assim como ocorre no condicionamento clássico, a extinção no condicionamento operante não elimina por completo o que foi aprendido. 
Mesmo que se passe muito tempo desde a última vez que um comportamento foi recompensado e tal comportamento pareça extinto, ele poderá reaparecer subitamente. 
A extinção de uma resposta condicionada de modo operante pode ser mais ou menos difícil, segundo uma série de fatores. 
Um deles é a intensidade da aprendizagem original. 
Quanto mais intensa ela tiver sido, mais tempo demorará para que a resposta seja extinta. 
Um comportamento complexo também é muito mais difícil de ser extinto que um comportamento simples. 
O comportamento complexo consiste de muitas ações postas em conjunto, e cada uma delas precisa ser eliminadas para que o todo se extinga.
Por fim, comportamentos aprendidos por meio de punição em vez de reforço são especialmente difíceis de ser extintos. 
A fim de acelerar o processo de extinção de uma resposta condicionada de modo operante, pode se colocar o sujeito em uma situação diferente daquela em que a reação foi originalmente aprendida. 
É provável que a resposta seja mais fraca nesse novo contexto e, portanto, se extinga mais rapidamente. 
É claro que, quando o sujeito retorna ao contexto original de aprendizagem depois de a extinção ter ocorrido em outro contexto, a resposta poderá ser recuperada espontaneamente. 
Mesmo assim, a resposta deverá ser menos intensa que é e será relativamente fácil extingui-la de uma vez por todas. 
Você talvez tenha passado por isso caso tenha voltado para a casa da sua família após ter vivido algum tempo sozinho.
Um hábito do qual você pensava ter se livrado na escola pode reaparecer subitamente. 
O ambiente familiar funciona como um “estímulo-lembrete”, que promove a ocorrência da resposta. Entretanto, pelo fato de você já ter extinguindo o hábito em um contexto diferente, não será difícil fazê-lo novamente. 
Controle, generalização e discriminação do estímulo
O fato de o ambiente familiar agir como um “estímulo-lembrete” é apenas um exemplo que mostra como as respostas condicionadas são influenciadas pelo que está no ambiente à nossa volta. 
Isso é chamado de controle do estímulo e acontece tanto no condicionamento clássico quanto no operante
No condicionamento clássico, a resposta condicionada (RC) está sob o controle do estímulo condicionado (EC), que dá início a ela. 
Além disso, tanto no condicionamento clássico quanto no operante o sujeito deverá responder a sinais que são apenas similares (mas não idênticos) àqueles que prevaleceram durante a aprendizagem original. Essa tendência de reagir a sinais similares é conhecida pelo nome de generalização de estímulo.
Generalização e discriminação no condicionamento clássico: existem muitos exemplos de generalização do estímulo no condicionamento clássico. 
Um deles é o caso do pequeno Albert, condicionado a sentir medo de ratos brancos. 
Mais tarde, quando os pesquisadores lhe mostraram um coelho branco, ele chorou e tentou engatinhar para longe – apesar de não ter sido ensinado a temer coelhos. 
Ele também demonstrou sentir medo de outros objetos brancos e felpudos – bolas de algodão, um casaco de pele e até memso uma máscara de Papai Noel com barba. 
De modo parecido, uma pessoa que tenha aprendido a se sentir ansiosa em relação à matemática na escola primária pode vir a ficar ansiosa quanto a qualquer tarefa relacionada a números, até memso para conferir o talão de cheques. 
Entrentanto, a generalização de um estímulo não é inevitável. 
Por meio de um processo chamado discriminação do estímulo, os sujeitos podem ser treinados para manifestar uma resposta condicionada apenas diante de um tipo específico de estímulo, sem que ocorra generalização. 
Esse processo consiste em apresentar diversos estímulos semelhantes, mas associar o estímulo não condicionado a apenas um deles. 
Ex. Poderiam ter sido apresentados ao pequeno Albert um rato, um coelho, bolas de algodão e outros objetos brancos e felpudos, mas apenas o rato seria acompanhado por um ruído estridente (ENC). 
Por meio desse procedimento, o menino teria aprendido a diferenciar o rato de outros objetos, e a resposta de medo não teria se generalizado conforme ocorreu. 
Aprender e perceber diferenças é essencial na vida diária. Preferimos lidar com crianças que não têm medo de qualquer ruído estridente, de todos os insetos, de todos os cachorros e assim por diante, mas apenas daqueles que são potencialmente perigosos. 
Por meio da discriminação do estímulo, o comportamento fica mais ajustado às demandas do ambiente. 
Generalização e discriminação no condicionamento operante: a generalização do estímulo também ocorre no condicionamento operante. 
Um bebê que é abraçado e beijado quando diz“mamãe” ao ver sua mãe poderá começar a chamar todas as pessoas de “mamãe” – homens e mulheres. 
Embora a pessoa que o bebê vê – o estímulo - seja diferente, ele reage pronunciando a mesma palavra. 
A discriminação é tão útil no condicionamento operante quanto o é no condicionamento clássico. 
O treinamento de discriminação no condicionamento operante consiste no reforço apenas uma resposta específica e desejada, a qual deverá ocorrer apenas na presença de um estímulo específico. 
Por meio desse procedimento, pombos foram treinados para dar uma bicada em um disco vermelho, e não em um verde. 
Primeiramentem eles são ensinados a dar uma bicada em um disco. Em seguida, dois discos lhes são mostrados: um vermelho e outro verde. 
Eles ganham comida quando bicam o disco vermelho, mas não ganham nada quando bicam o disco verde. 
Em determinado momento, eles aprenderão a diferenciar as duas cores e darão bicadas apenas nos discos vermelhos. 
Aprendizagem por observação
Existem inúmeras coisas que aprendemos a fazer apenas observando outras pessoas e ouvindo o que elas dizem. 
Esse processo se chama aprendizagem por observação ou aprendizagem vicária, porque, embora estejamos aprendendo, não precisamos executar logo de início o comportamento aprendido; nós apenas observamos ou escutamos.
A aprendizagem por observação é uma forma de “aprendizagem social” porque consiste na interação com outras pessoas. 
Os psicólogos que a estuda, são conhecidas como teóricos da aprendizagem social. 
A aprendizagem por observação é muito comum. Ao observarmos outras pessoas que servem de modelo para novos comportamentos, somos capazes de aprender coisas como, por exemplo, ligar um cortador de grama ou serrar madeira. 
Também aprendemos como demonstrar amor, respeito ou preocupação, bem como hostilidade e agressão. Podemos até mesmo aprender maus hábitos, como o de fumar. 
É claro que não imitamos tudo o que as outras pessoas fazem.
Por que razão somos seletivos com relação ao que imitamos? Existem várias razões (Bandura, 1977, 1986). 
Primeiramente, não somos capazes de prestar atenção a tudo o que acontece à nossa volta. 
Os comportamentos que temos a maior probabilidade de imitar são aqueles formulados por alguém que chama nossa atenção (como fazem, por exemplo, pessoas famosas, atarentes ou especialistas em um assunto). 
Em segundo lugar, devemos nos lembrar daquilo que o modelo faz para que então possamos imitá lo. Se um comportamento não for memorável, não será aprendido. 
Em terceiro lugar, devemos nos esforçar a fim de transformar aquilo aquilo que vemos em ação. Se não tivermos nenhuma motivação para desempenhar um comportamento observado, provavelmente não demonstraremos o que aprendemos. 
Essa é uma das diferenças entre aprendizagem e desempenho, crucial para os teóricos de aprendizagem social: somos capazes de aprender sem que haja mudanças no nosso comportamento visível que demonstrem o que aprendemos.
Agir ou não vai depender da motivação que tivermos. 
Uma importante motivação para a ação são as consequências associadas a um comportamento observado – as recompensas ou punições que ele parece acarretar. 
Essas consequências não precisam necessariamente acontecer com o observador. Podem, simplesmente, acontecer com pessoas observadas por ele. Isso recebe o nome de reforço vicário ou punição vicária, porque as consequências não são sentidas diretamente pela pessoa que aprende e, sim, por meio de outras pessoas. 
Se um jovem adolescente vir adultos bebendo e lhe parecer que essas pessoas estão se divertindo muito, ele estará sob efeito do reforço vicário da bebida e terá mais chances de imitar esse comportamento. 
O principal propositor da teoria da aprendizagem social é Albert Bandura, que se refere a sua perspectiva como Teoria Cognitiva Social (Bandura, 1986). 
Em um clássico experimento, o cientista (1965) demonstrou que as pessoas são capazes de aprender um comportamento sem que sejam diretamente reforçados por ele. 
A ênfase que a teoria da aprendizagem social dá é que: os seres humanos empregam sua capacidade de observação e pensamento para interpretar suas próprias experiências, bem como as de outras pessoas, ao decidir seu modo de agir (Bandura, 1962).
Essa importante perspectiva pode ser aplicada à aprendizagem de muitas coisas diferentes, desde habilidades e tendência comportamentais até atitudes, valores e idéias.

Continue navegando