Prévia do material em texto
TEORIAS COMPORTAMENTAIS E SOCIAIS DA APRENDIZAGEM INTRODUÇÃO A professora Julia Eller, do segundo ano do Ensino Fundamental, está tentando ensinar a seus alunos um comportamento adequado em sala de aula. “Crianças”, diz ela um dia, “estamos tendo um problema nesta aula que gostaria de discutir com vocês. Sempre que faço uma pergunta, muitos de vocês gritam suas respostas em vez de levantar a mão e esperar serem chamados. Alguém pode me dizer o que você deve fazer quando eu fizer uma pergunta à classe?”. A mão de Rebeca dispara para o ar. "Eu sei, eu sei!" ela diz. “Levante a mão e espere em silêncio!”. A professora suspira para si mesma. Ela tenta ignorar Rebeca, que está fazendo exatamente o que lhe disseram para não fazer, mas Rebeca é a única aluna com a mão levantada, e quanto mais ela espera, mais freneticamente Rebeca acena com a mão e grita sua resposta. “Tudo bem, Rebeca. O que você pretende fazer?". “Devemos levantar as mãos e esperar em silêncio que você nos chame.”. “Se você conhece a regra, por que estava gritando sua resposta antes de eu chamar para você?”. "Acho que esqueci". "Tudo bem. Alguém pode lembrar a classe de nossa regra sobre falar fora de hora?”. Quatro crianças levantam as mãos e gritam juntas: "um por vez!"; "uma de cada vez!". “Não falar quando outra pessoa estiver falando!”. A professora pede ordem. “Vocês, crianças, vão me deixar louca!”. “Não acabamos de conversar sobre como levantar as mãos e esperar que eu chame por vocês?”. “Mas professora Eller”, diz Estevão, sem nem mesmo levantar a mão. "Você chamou a Rebeca e ela não estava quieta!". Pensamento crítico e criativo: reflita sobre o que a professora Eller poderia fazer de diferente nessa situação para atingir seu objetivo. Aprendizado cooperativo: discuta com outro acadêmico o que deu errado aqui. Discuta também maneiras semelhantes pelas quais você viu o comportamento inadequado ser reforçado no passado. Compartilhe algumas dessas histórias com a classe. As crianças são excelentes aprendizes. O que elas aprendem, no entanto, nem sempre é o que pretendemos ensinar. A professora Eller está tentando ensinar os alunos como se comportar em sala de aula, mas ao prestar atenção à explosão de Rebeca, ela está realmente ensinando a eles o oposto do que pretende. Rebeca anseia pela atenção de sua professora, então ser chamada (mesmo em um tom de voz exasperado) a recompensa por gritar sua resposta. Não apenas a resposta da professora Eller aumenta as chances de Rebeca dar respostas novamente, mas também Rebeca agora serve como um modelo para as próprias convocações de seus colegas. O que a professora Eller diz é menos importante do que a resposta real que ela dá aos comportamentos de seus alunos. O objetivo deste tópico é definir a aprendizagem e, em seguida, apresentar teorias de aprendizagem comportamentais e sociais, explicações para a aprendizagem que enfatizam comportamentos observáveis. Veremos que as teorias de aprendizagem comportamental enfocam as maneiras como as consequências agradáveis ou desagradáveis do comportamento mudam o comportamento dos indivíduos ao longo do tempo e as maneiras como os indivíduos modelam seu comportamento no comportamento de outras pessoas. A seguir, exploraremos as teorias de aprendizagem social, elas enfocam os efeitos do pensamento sobre a ação e da ação sobre o pensamento. O próximo tópico desta unidade apresentará as teorias de aprendizagem cognitiva, que enfatizam processos mentais não observáveis que as pessoas usam para aprender e lembrar novas informações ou habilidades. Nos últimos anos, entretanto, as fronteiras entre as teorias de aprendizagem comportamental e cognitiva tornaram-se cada vez mais indistintas, à medida que cada escola de pensamento incorporou as descobertas da outra. O QUE É A APRENDIZAGEM? O que é aprendizagem? Esta parece uma pergunta simples até que você comece a pensar a respeito. Considere os quatro exemplos a seguir. São exemplos de aprendizagem? 1. Uma criança dá seus primeiros passos. 2. Um adolescente do sexo masculino sente uma forte atração por certas mulheres. 3. A criança fica ansiosa quando vê o médico chegando com uma agulha. 4. Muito depois de aprender a multiplicar, uma menina percebe por si mesma que outra maneira de multiplicar por 5 é dividir por 2 e multiplicar por 10 (por exemplo, 428 × 5 pode ser calculado da seguinte forma: 428/2 = 214 × 10 = 2.140). A aprendizagem é geralmente definida como uma mudança em um indivíduo causada pela experiência. Mayer, define aprendizagem como "mudança duradoura no conhecimento do aluno como resultado das experiências do aluno". Mudanças causadas pelo desenvolvimento (como ficar mais alto) não são exemplos de aprendizagem. Nem são as características dos indivíduos que estão presentes no nascimento (como reflexos e respostas à fome ou dor). No entanto, os humanos aprendem tanto desde o dia de seu nascimento (e alguns dizem antes) que aprendizagem e desenvolvimento estão inseparavelmente ligados. Aprender a andar (Exemplo 1) é principalmente uma progressão do desenvolvimento, mas também depende da experiência com engatinhar e outras atividades. O impulso sexual do adolescente (Exemplo 2) não é aprendido, mas a aprendizagem molda as escolhas dos indivíduos de parceiros desejáveis. A ansiedade de uma criança ao ver um médico com uma agulha (Exemplo 3) é definitivamente um comportamento aprendido. A criança aprendeu a associar a agulha à dor e seu corpo reage emocionalmente ao vê-la. Essa reação pode ser inconsciente ou involuntária, mas é aprendida mesmo assim. No Exemplo 4, o insight da menina sobre o atalho de multiplicação é uma instância de aprendizagem gerada internamente, mais conhecida como pensamento. Alguns teóricos não chamariam isso de aprendizagem, porque não foi causado diretamente pelo ambiente. Pode ser considerado um caso de aprendizagem retardada, no qual a instrução deliberada na multiplicação mais anos de experiência com números mais esforço mental por parte da menina produziu um insight. A aprendizagem ocorre de várias maneiras. Às vezes, é intencional, como quando os alunos adquirem informações apresentadas em uma sala de aula ou quando procuram algo na internet. Às vezes, não é intencional, como no caso da reação da criança à agulha. Todos os tipos de aprendizagem estão acontecendo o tempo todo. Ao ler este tópico, você está aprendendo algo sobre aprendizagem. No entanto, você também está aprendendo que a psicologia educacional é interessante ou enfadonha, útil ou inútil. Sem saber, você provavelmente está aprendendo sobre onde certas informações podem ser encontradas nas páginas do livro. Você pode estar aprendendo a associar o conteúdo deste tópico a aspectos sem importância de seu entorno à medida que o lê, como o cheiro dos livros em uma biblioteca ou a temperatura da sala em que está lendo. O conteúdo deste tópico, a colocação de palavras na página e os cheiros, sons e temperatura do ambiente são todos estímulos. Seus sentidos estão geralmente abertos a todos os tipos de estímulos, ou eventos ou condições ambientais, mas você está consciente de apenas uma fração deles por vez. O problema que você enfrenta como professor não é como fazer os alunos aprenderem, os alunos já estão empenhados em aprender a cada momento. Em vez disso, é como ajudá-los a aprender informações, habilidades e conceitos específicos que serão úteis em suas vidas. Como apresentamos aos alunos os estímulos corretos nos quais concentrar sua atenção e esforço mental para que adquiram habilidades importantes? Esse é o desafio central do ensino. O QUE SÃO AS TEORIAS DA APRENDIZAGEM DO COMPORTAMENTO? O estudo sistemático da aprendizagem é relativamente novo. Somente no final do século XIX a aprendizagem foi estudada de maneira científica. Usando técnicas emprestadas das ciências físicas, os pesquisadores começaram a conduzirexperimentos para entender como as pessoas e os animais aprendem. Um dos primeiros e mais importantes pesquisadores foi Ivan Pavlov. Entre os pesquisadores posteriores, Skinner foi importante para seus estudos sobre relação entre comportamento e consequências. Pavlov: condicionamento clássico No final dos anos 1800 e no início dos anos 1900, o cientista russo Ivan Pavlov e seus colegas estudaram o processo digestivo em cães. Durante a pesquisa, os cientistas notaram mudanças no tempo e na taxa de salivação desses animais. Pavlov, observou que se a carne fosse colocada na boca ou perto da boca de um cão faminto, o cão salivaria. Como a carne provocou essa resposta automaticamente, sem nenhum treinamento ou condicionamento prévio, a carne é chamada de estímulo não condicionado ou estímulo incondicionado. Da mesma forma, como a salivação ocorria automaticamente na presença de carne, também sem a necessidade de nenhum treinamento ou experiência, essa resposta de salivar é chamada de resposta não condicionada ou resposta incondicionada. Embora a carne produza salivação sem qualquer experiência ou treinamento prévio, outros estímulos, como o toque de um sino, não produzem salivação. Como esses estímulos não têm efeito sobre a resposta em questão, eles são chamados de estímulos neutros. Os experimentos de Pavlov mostraram que, se um estímulo previamente neutro for apresentado ao mesmo tempo que um estímulo não condicionado, o estímulo neutro se torna um estímulo condicionado e ganha o poder de solicitar uma resposta semelhante à produzida pelo estímulo não condicionado. Em outras palavras, depois que o sino e a carne são apresentados juntos várias vezes, só o toque do sino faz o cachorro salivar. Esse processo é conhecido como condicionamento clássico. Um diagrama da teoria de Pavlov é mostrado na Figura 1 (no condicionamento clássico, um estímulo neutro, como um sino, que a princípio não indica nenhuma resposta, torna-se pareado com um estímulo incondicionado, como carne, e ganha o poder desse estímulo para causar uma resposta, como a salivação). Em experimentos como esses, Pavlov e seus colegas mostraram como o aprendizado pode afetar o que antes se pensava ser comportamentos reflexos involuntários, como salivar. FIGURA 1 – CONDICIONAMENTO CLÁSSICO Skinner: condicionamento operante Alguns comportamentos humanos são claramente estimulados por estímulos específicos. Assim como os cães de Pavlov, salivamos quando estamos com fome e vemos comida apetitosa. No entanto, Skinner propôs que o comportamento reflexivo é responsável por apenas uma pequena proporção de todas as ações. Ele propôs outra classe de comportamento, que rotulou de comportamentos operantes, pois operam no ambiente na aparente ausência de qualquer estímulo não condicionado, como comida. O trabalho de Skinner focou na relação entre o comportamento e suas consequências. Por exemplo, se o comportamento de um indivíduo é imediatamente seguido por consequências prazerosas, o indivíduo se envolverá nesse comportamento com mais frequência. O uso de consequências agradáveis e desagradáveis para mudar o comportamento é frequentemente referido como condicionamento operante. O trabalho de Skinner focou em colocar os sujeitos em situações controladas e observar as mudanças em seu comportamento produzidas por mudanças sistemáticas nas consequências de seu comportamento. Skinner é famoso por seu desenvolvimento e uso da caixa de Skinner, um dispositivo que contém um aparato muito simples para estudar o comportamento de animais, geralmente ratos e pombos. Uma caixa Skinner para ratos consiste em uma barra que é fácil para o rato apertar, um distribuidor de comida que pode dar ao rato uma bolinha de comida e um distribuidor de água. O rato não pode ver ou ouvir nada fora da caixa, então todos os estímulos são controlados pelo experimentador. Em alguns dos primeiros experimentos envolvendo caixas de Skinner, o aparelho foi primeiro configurado de forma que se o rato pressionasse a barra receberia uma bolinha de comida. Depois de algumas pressões acidentais na barra, o rato começava a pressionar a barra com frequência, recebendo uma bolinha a cada vez. A recompensa da comida condicionou o comportamento do rato, fortalecendo a pressão na barra e enfraquecendo todos os outros comportamentos (como vagar pela caixa). Nesse ponto, o experimentador pode fazer qualquer uma de várias coisas. O distribuidor de alimentos pode ser configurado das seguintes formas: • da forma que várias pressões sobre a barra sejam necessárias para obter comida; • da forma que algumas pressões sobre a barra possam produzir a comida, mas outras não; • da forma que as pressões sobre a barra não possam produzir mais comida. Em cada caso, o comportamento do rato seria registrado eletronicamente. Uma vantagem importante da caixa de Skinner é que ela permite um estudo científico cuidadoso do comportamento em um ambiente controlado. Qualquer pessoa com o mesmo equipamento pode repetir os experimentos de Skinner. QUAIS SÃO ALGUNS PRINCÍPIOS DA APRENDIZAGEM COMPORTAMENTAL? A teoria da aprendizagem comportamental tem sua própria linguagem para descrever como as consequências do comportamento moldam o comportamento posterior. Vamos agora ver alguns dos princípios da aprendizagem comportamental. O papel das consequências O trabalho pioneiro de Skinner com ratos e pombos estabeleceu um conjunto de princípios de comportamento que foram apoiados em centenas de estudos envolvendo humanos e animais. Talvez o princípio mais importante das teorias de aprendizagem comportamental seja que o comportamento muda de acordo com suas consequências imediatas. Consequências prazerosas fortalecem o comportamento; consequências desagradáveis enfraquecem-no. Em outras palavras, as consequências agradáveis aumentam a frequência com que um indivíduo se envolve em um comportamento, enquanto as consequências desagradáveis reduzem a frequência de um comportamento. Se os alunos gostam de ler livros, provavelmente lerão com mais frequência. Se acharem as histórias chatas ou não conseguirem se concentrar, podem ler com menos frequência, optando por outras atividades. Consequências prazerosas são chamadas de reforçadores; consequências desagradáveis são chamadas de punidores. Reforçadores Um reforçador é qualquer consequência que fortalece (ou seja, aumenta a frequência de) um comportamento. Observe que a eficácia do reforçador deve ser demonstrada. Não podemos presumir que uma determinada consequência seja um reforçador até que tenhamos evidências de que ela fortalece o comportamento de um determinado indivíduo. Por exemplo, doces podem geralmente ser considerados um reforçador para crianças pequenas, mas depois de uma grande refeição, uma criança pode não achar os doces agradáveis e algumas crianças não gostam de doces. Um professor que diz: “eu o reforcei com elogios por permanecer em seu lugar durante o período de matemática, mas não funcionou”, pode estar usando mal o termo reforço se não houver evidência de que o elogio seja de fato um reforçador para esse aluno em particular. Nenhuma recompensa pode ser considerada um reforço para todos em todas as condições. Os reforçadores se enquadram em duas categorias amplas: primários e secundários. Os reforçadores primários satisfazem as necessidades humanas básicas. Alguns exemplos são: comida, água, segurança, calor e sexo. Os reforçadores secundários são reforçadores que adquirem seu valor por estarem associados a reforçadores primários ou outros reforçadores secundários bem estabelecidos. Por exemplo, o dinheiro não tem valor para uma criança pequena até que ela aprenda que o dinheiro pode ser usado para comprar coisas que são em si reforçadores primários ou secundários. As notas têm pouco valor para os alunos, a menos que suas famílias percebam e valorizem as boas notas, e o elogio dasfamílias tem valor porque está associado ao amor, cordialidade, segurança e outros reforços. Existem três categorias básicas de reforçadores secundários. Um são os reforçadores sociais, como elogios, sorrisos, abraços ou atenção. Quando a professora Eller reconheceu o comportamento da Rebeca, ela estava inadvertidamente dando à Rebecca um reforço social: sua própria atenção. Outros tipos de reforçadores secundários são reforçadores de atividade (como acesso a brinquedos, jogos ou atividades divertidas) e reforçadores simbólicos (como dinheiro, notas, estrelas ou pontos que os indivíduos podem trocar por outros reforçadores). Na maioria das vezes, os reforçadores usados nas escolas são reforçadores positivos que incluem elogios, notas e estrelas. No entanto, um comportamento também é fortalecido se sua consequência for uma fuga de uma situação desagradável ou uma forma de evitar que algo desagradável ocorra. Por exemplo, um pai pode dispensar um filho de lavar a louça para fazer o dever de casa. Se lavar a louça é visto como uma tarefa desagradável, libertar-se disso será reforçador. As fugas de situações desagradáveis são chamadas de reforçadores negativos. O termo reforçador negativo é, muitas vezes, mal interpretado como punição, como em: "reforcei-o negativamente por estar atrasado fazendo com que ele ficasse em sala durante o recreio". Uma maneira de evitar esse erro na terminologia é lembrar que os reforçadores (sejam positivos ou negativos) fortalecem o comportamento, enquanto a punição é projetada para desencorajar ou enfraquecer o comportamento (Quadro 1). QUADRO 1 – CONSEQUÊNCIAS NA APRENDIZAGEM COMPORTAMENTAL FORTALECE O COMPORTAMENTO DESENCORAJA O COMPORTAMENTO Reforço positivo Sem reforço Exemplo: recompensa ou elogio Exemplo: Ignorando Reforço Negativo Punição de Remoção Exemplo: desculpar-se de uma tarefa ou situação indesejável Exemplo: Proibindo uma tarefa ou situação desejável Punição de Apresentação Exemplo: imposição de uma tarefa ou situação indesejável Um importante princípio de comportamento é que podemos promover comportamentos tornando o acesso a algo desejável dependente de fazer algo menos desejável. Por exemplo, um professor pode dizer: “assim que terminar sua tarefa, você pode ir lá fora” ou “finalize seu projeto de arte e então eu lerei uma história para você”. Esses são exemplos do clássico Princípio de Premack, às vezes, chamado de "Regra da Vovó" a partir da antiga declaração "Coma seus vegetais e depois pode brincar". Você pode usar o Princípio de Premack alternando atividades mais agradáveis com as menos agradáveis e fazendo com que a participação em atividades divertidas dependa da conclusão bem-sucedida das menos agradáveis. Por exemplo, no Ensino Fundamental, pode ser uma boa ideia programar música, que a maioria dos alunos considera uma atividade agradável, depois de uma matéria difícil, para que os alunos saibam que não devem brincar durante a matéria difícil e correr o risco de perder parte do tempo musical desejado. Usos de reforço em sala de aula O princípio de aprendizagem comportamental mais útil para a prática em sala de aula é também o mais simples: reforce os comportamentos que deseja ver repetidos. Esse princípio pode parecer óbvio, mas na prática não é tão fácil quanto parece. Por exemplo, alguns professores assumem a atitude de que o reforço é desnecessário, raciocinando: “por que devo reforçá-los? Eles estão apenas fazendo o que deveriam fazer!". Vamos ver algumas diretrizes para o uso de reforço para aumentar o comportamento desejado na sala de aula: 1. Decida quais comportamentos você deseja dos alunos e reforce esses comportamentos quando eles ocorrerem. Por exemplo, elogie ou recompense um bom trabalho. Não elogie ou recompense o trabalho que não está à altura das capacidades dos alunos. Conforme os alunos começam uma nova tarefa, eles precisam ser reforçados a cada passo ao longo do caminho. Aproximações mais próximas do que você espera realizar como produto final devem receber feedback positivo. Divida os novos comportamentos (atribuições de sala de aula) em partes menores e forneça recompensas adequadas ao longo do caminho. 2. Diga aos alunos quais comportamentos você deseja; quando eles exibirem os comportamentos desejados e você os reforçar, diga-lhes o porquê. Apresente aos alunos uma rubrica (um instrumento de avaliação apresentado na forma de tabela, construída e modificada com base nos critérios específicos, relacionados a uma atividade ou qualquer outra tarefa que se deseja avaliar) que descreva os critérios que você usará ao avaliar seu trabalho e inclua a pontuação de cada critério. Os alunos, então, serão capazes de discriminar seus próprios pontos fortes e fracos a partir do feedback que recebem de você. 3. Reforce o comportamento apropriado o mais rápido possível após sua ocorrência. O reforço atrasado é menos eficaz do que o reforço imediato. Ao avaliar uma tarefa, apresente feedback aos alunos o mais rápido possível. É importante que eles saibam como estão se saindo nas aulas, portanto, não perca tempo em fornecer suas notas. Ao elaborar uma tarefa, você deve sempre considerar o esquema de notas que usará e quanto tempo levará para fornecer o feedback pretendido. Frequentemente, o reforçador mais importante que mantém o comportamento é o prazer inerente ao envolvimento no comportamento. Por exemplo, a maioria das pessoas tem um hobby no qual trabalham por longos períodos sem qualquer recompensa. As pessoas gostam de desenhar, ler, cantar, jogar, caminhar ou nadar sem nenhum motivo além da diversão. Os reforçadores desse tipo são chamados de reforçadores intrínsecos e as pessoas podem ser descritas como sendo intrinsecamente motivadas para se engajar em uma determinada atividade. Os reforçadores intrínsecos são contrastados com reforçadores extrínsecos, elogios ou recompensas oferecidas para motivar as pessoas a se envolverem em um comportamento que elas não teriam sem tais reforçadores. Há evidências de que reforçar as crianças por certos comportamentos que elas teriam feito de qualquer maneira pode minar a motivação intrínseca de longo prazo. Pesquisas sobre este tópico descobriram que o efeito destruidor de reforçadores extrínsecos ocorre apenas em um conjunto limitado de circunstâncias, em que recompensas são fornecidas às crianças por se envolverem em uma atividade sem qualquer padrão de desempenho e somente se a atividade for aquela que as crianças teriam feito por conta própria sem qualquer recompensa. Elogios verbais e outros tipos de feedback são reforçadores extrínsecos que aumentam, não diminuem, o interesse intrínseco. O que pesquisas sugerem para a prática é que você deve ser cauteloso ao dar reforçadores às atividades que elas fariam por conta própria. No entanto, para a maioria das tarefas escolares, que a maioria dos alunos não teria feito por conta própria, não há nenhuma base para a preocupação de que o uso de reforçadores extrínsecos prejudique a motivação intrínseca, especialmente se esses reforçadores forem sociais e comunicarem o reconhecimento do domínio e da independência crescentes dos alunos. Na verdade, argumentou-se que deixar de usar o reforço positivo quando ele teria sido eficaz para aumentar os comportamentos positivos é antiético. Por exemplo, considere um aluno que corre o risco de ser expulso devido a uma briga. Se um programa de reforço positivo para evitar brigas pudesse ter eliminado a briga do aluno, os educadores seriam eticamente obrigados a tentar tal plano (ou outros) antes de considerar um passo tão sério como a expulsão. Reforçadores práticos Qualquer coisa de que as crianças gostem pode ser um reforço eficaz, mas existem limitações práticas óbvias sobre o que deve ser usado nas salas de aula. Um princípio geral de reforço positivo é que é melhor usar o reforçador menos elaboradoou tangível que funcione. Em outras palavras, se o elogio, o autorreforço ou o feedback sobre o progresso funcionam, não use certificados. Se os certificados funcionam, não use brinquedos pequenos. Se os brinquedos pequenos funcionam, não use comida. Uma forma de descobrir quais reforços usar é perguntar aos próprios alunos quem são mais propensos a trabalhar para um reforçador que eles selecionaram. No entanto, não hesite em usar qualquer reforço prático necessário para motivar as crianças a realizar tarefas importantes. Em particular, tente todas as estratégias de reforço possíveis antes mesmo de pensar em punição (descrito a seguir). Algumas categorias de reforçadores e exemplos de cada um aparecem aqui. Eles são organizados do menos para o mais tangível. Autorreforço. Os alunos podem ser ensinados a elogiar a si mesmos, dar-se um tapinha nas costas mental, verificar o progresso em um formulário, fazer uma pequena pausa ou de outra forma se reforçar para completar uma tarefa ou permanecer na tarefa. Elogio. Frases como "Bom trabalho", "Muito bem", "Eu sabia que você conseguiria" e outros elogios verbais podem ser eficazes, mas a mesma mensagem pode, muitas vezes, ser entregue com um sorriso, uma piscadela, ou um sinal como o polegar para cima ou um tapinha nas costas. Na aprendizagem cooperativa e na tutoria entre pares, os alunos podem ser encorajados a elogiar uns aos outros pelo comportamento apropriado. Atenção. A atenção de um adulto ou colega valorizado pode ser um reforço muito eficaz para muitas crianças. Ouvir, balançar a cabeça ou aproximar-se pode dar à criança a atenção positiva que ela está procurando. Para desempenho excepcional ou para cumprir metas por um longo período, os alunos podem ter um momento especial para visitar o zelador, ajudar no escritório ou dar um passeio com o diretor. Notas e reconhecimento. Boas notas e outras honras (por exemplo, certificados de realização) podem ser eficazes para dar aos alunos um feedback positivo sobre seus esforços e para comunicar o progresso às famílias, que provavelmente reforçarão eles próprios os bons relatórios. Exibições públicas de um bom trabalho, notas do diretor e outros elogios podem ter o mesmo efeito. As pontuações dos questionários, avaliações de comportamento e outros feedbacks fornecidos com frequência podem ser mais eficazes do que as notas do boletim cobrindo meses de trabalho. Ligar para casa. Ligar ou enviar um bilhete para os cuidadores de uma criança para reconhecer o sucesso pode ser um reforçador poderoso. Reforço domiciliar. As famílias podem ser parceiras eficazes em um sistema de reforço. Os professores podem chegar a um acordo com as famílias em que as crianças recebam privilégios especiais em casa quando atendem a padrões bem especificados de comportamento ou desempenho. Privilégios. As crianças podem ter tempo livre, acesso a equipamentos especiais (como bolas ou jogos de futebol) ou funções especiais (como fazer recados ou distribuir materiais). Crianças ou grupos que se comportaram bem podem simplesmente ser autorizados a se alinhar primeiro para o recesso ou desfrutar de outros pequenos privilégios. Reforçadores de atividade. Depois de atingir os padrões pré-estabelecidos, os alunos podem ganhar vídeos, jogos ou acesso a outras atividades divertidas. Os reforçadores de atividade se prestam particularmente bem a contingências de grupo, nas quais uma classe inteira pode ganhar tempo livre ou atividades especiais se os alunos coletivamente atingirem um padrão. Reforçadores tangíveis. As crianças podem ser recompensadas por realizações ou bom comportamento com pontos que podem trocar por pequenos brinquedos, borrachas, lápis, bolas de gude, gibis, adesivos e assim por diante. Os reforçadores tangíveis geralmente funcionam melhor quando as crianças podem escolher entre várias opções. Alimentos. Uvas, maçãs, cenouras, iogurte ou outros lanches saudáveis podem ser usados como reforçadores. Punidores As consequências que enfraquecem o comportamento são chamadas de punidores. Observe que há o mesmo problema na definição de punição e na definição de reforço: se uma consequência aparentemente desagradável não reduz a frequência do comportamento que segue, não é necessariamente um punidor. Por exemplo, alguns alunos gostam de ser mandados para a sala do diretor ou para o corredor porque isso os libera da sala de aula, o que eles veem como uma situação desagradável. Alguns alunos gostam de ser repreendidos porque isso lhes chama a atenção e talvez aprimore seu status entre os colegas. Como acontece com os reforçadores, a eficácia de um punidor não pode ser presumida, mas deve ser demonstrada. A punição pode assumir duas formas principais. O uso de consequências desagradáveis ou estímulos aversivos, caracteriza a punição de apresentação, como quando um aluno é repreendido. A retirada de uma consequência agradável descreve a punição de remoção. Os exemplos incluem a perda de um privilégio, ter que ficar em sala durante o recreio e receber detenção depois da escola. Outro exemplo, chamado de custo de resposta, envolve a cobrança de um custo aos alunos que estão se comportando de maneira inadequada, como um minuto de detenção depois da escola para cada minuto fora da tarefa. Uma forma frequentemente usada de punição de remoção em salas de aula é o time-out, técnica comportamental que tem por objetivo ajudar a criança a controlar-se internamente e a refletir nas suas ações, consiste em retirar a criança do local onde ocorreu o comportamento e levá-la para outro sítio, onde ficará sozinha durante alguns minutos, sem distrações. O aluno que se comporta mal é obrigado a sentar-se no canto ou no corredor por vários minutos. Os professores costumam usar o time-out quando acreditam que a atenção de outros alunos está servindo para reforçar o mau comportamento; o time-out priva o aluno que se comportou mal desse reforçador. O uso do time-out como consequência para mau comportamento geralmente reduz o mau comportamento. Em um estudo clássico, White e Bailey, avaliaram o uso de uma consequência de sentar-se e observar nas aulas de Educação Física. As crianças que se comportaram mal foram informadas do que haviam feito de errado, receberam um cronômetro de areia de três minutos e foram então solicitadas a sentar e observar até que a areia acabasse. O programa foi testado pela primeira vez em uma classe alternativa para alunos do quinto e sexto ano escolar com sérios problemas de comportamento. Depois que uma linha de base de até 343 comportamentos perturbadores em dez minutos foi observada, um programa de lista de verificação comportamental foi testado, no qual os professores avaliaram o comportamento de cada criança e enviaram crianças com mau comportamento para a sala do orientador ou as privaram de um período livre. Isso reduziu o mau comportamento, mas não o eliminou. No entanto, quando o procedimento se sentar e observar foi introduzido, o mau comportamento praticamente desapareceu. O mesmo método de sentar-se e observar foi usado em uma aula regular de Educação Física do quinto ano e os resultados foram semelhantes. A questão de saber se quando e como punir tem sido uma fonte de considerável controvérsia entre os teóricos da aprendizagem comportamental. Alguns alegaram que os efeitos da punição, especialmente a punição de apresentação (aversiva), são apenas temporários, que a punição produz agressão e que faz com que os indivíduos evitem os ambientes em que é usada. Mesmo os teóricos da aprendizagem comportamental que apoiam o uso da punição concordam que ela deve ser usada apenas quando o reforço para o comportamento apropriado foi tentado e falhou; que quando a punição é necessária, ela deve assumir a forma mais branda possível; e que a punição deve sempre ser usada como parte de um plano cuidadoso, nunca de forma inconsistente ou por frustração. O castigofísico nas escolas (como palmadas) é ilegal na maioria dos lugares, e é universalmente contestado por teóricos da aprendizagem comportamental em bases éticas e científicas. Imediatismo das consequências Um princípio muito importante das teorias de aprendizagem comportamental é que as consequências que seguem os comportamentos de perto no tempo afetam o comportamento muito mais do que as consequências atrasadas. Elogiar um aluno imediatamente pode ser mais eficaz do que conceder-lhe um privilégio significativo mais tarde. Um reforçador menor que é dado imediatamente, geralmente tem um efeito muito maior do que um reforçador grande dado mais tarde. Esse conceito explica muito sobre o comportamento humano. Sugere, por exemplo, a razão pela qual as pessoas acham tão difícil parar de fumar ou de comer demais. Mesmo que os benefícios de parar de fumar ou de perder peso sejam substanciais e bem conhecidos, o pequeno, mas imediato, reforço de apenas um cigarro ou uma sobremesa geralmente supera o efeito comportamental dos grandes reforçadores, porém retardados. Na sala de aula, o princípio do imediatismo das consequências também é muito importante. Aproximar-se de um aluno que está se comportando mal, tocar seu ombro ou fazer um gesto (por exemplo, dedo nos lábios para pedir silêncio) pode ser muito mais eficaz do que uma repreensão ou advertência dada no final da aula. O feedback imediato serve para, pelo menos, dois propósitos. Primeiro, torna clara a conexão entre comportamento e consequência. Em segundo lugar, aumenta o valor informativo do feedback. Ao lidar com o mau comportamento, você pode aplicar o princípio do imediatismo das consequências, respondendo imediata e positivamente quando os alunos não estão se comportando mal – na verdade, pegando-os no ato de serem bons! Modelagem O imediatismo do reforço é importante para o ensino, mas também é importante à decisão sobre o que reforçar. Um professor da Educação Infantil deve reter o reforço até que uma criança conheça os sons de todas as 26 letras? Certamente não. Seria melhor elogiar as crianças por reconhecerem uma letra, depois por reconhecerem várias e, finalmente, por aprenderem os sons de todas as 26 letras. Um professor de música deve reter o reforço até que um jovem aluno tenha tocado uma peça de piano na perfeição? Ou o professor deve elogiar a primeira tentativa hesitante? A maioria dos alunos precisa de reforço ao longo do caminho. Quando você orienta os alunos em direção às metas reforçando as muitas etapas que levam ao sucesso, você está usando uma técnica chamada modelagem. O termo modelagem é usado em teorias de aprendizagem comportamental para se referir ao ensino de novas habilidades ou comportamentos, reforçando os alunos para se aproximarem do comportamento final desejado. Por exemplo, ao ensinar as crianças a amarrar o cadarço, não deveríamos simplesmente mostrar-lhes como isso é feito e depois esperar para reforçá-las até que façam o trabalho sozinhas. Em vez disso, primeiro os reforçaríamos para dar o primeiro nó, depois para fazer os laços e assim por diante, até que eles possam fazer a tarefa inteira. Dessa forma, estaríamos moldando o comportamento das crianças, reforçando todos os passos que levam ao objetivo final. A modelagem é uma ferramenta importante na instrução em sala de aula. Digamos que queremos que os alunos sejam capazes de escrever parágrafos com um tópico frasal, três detalhes de apoio e uma frase de conclusão. Essa tarefa tem muitas partes: ser capaz de reconhecer e, em seguida, produzir um tópico frasal, detalhes de apoio e frases finais; ser capaz de escrever frases completas usando letras maiúsculas, pontuação e gramática corretamente; e ser capaz de soletrar. Se você desse uma aula sobre todas essas habilidades e depois pedisse aos alunos que escrevessem parágrafos, pontuando-os no conteúdo, gramática, pontuação e ortografia, a maioria dos alunos reprovaria e, provavelmente, aprenderia pouco com o exercício. Em vez disso, você pode ensinar as habilidades passo a passo, moldando gradualmente a habilidade final. Os alunos podem ser ensinados a escrever os primeiros tópicos frasal, depois os detalhes de apoio e, por fim, as frases finais. No início, eles podem ser responsabilizados apenas pelo conteúdo do parágrafo. Posteriormente, o requisito de reforço pode ser aumentado para incluir gramática e pontuação. Finalmente, a ortografia pode ser adicionada como um critério de sucesso. Em cada estágio, os alunos teriam uma boa chance de serem reforçados porque o critério de reforço estaria ao seu alcance. O princípio aqui é que eles devem ser reforçados por comportamentos que estão dentro de suas capacidades atuais, mas que também os levam a novas habilidades (lembre-se do Tópico 2 da Unidade 1, em que Vygotsky, expressou a mesma ideia sobre ensinar na zona proximal de desenvolvimento). Extinção Por definição, os reforçadores fortalecem o comportamento. O que acontece quando os reforçadores são retirados? Eventualmente, o comportamento será enfraquecido e, por fim, desaparecerá. Esse processo é denominado extinção de um comportamento previamente aprendido. A extinção raramente é um processo tranquilo. Quando os reforçadores são retirados, os indivíduos frequentemente aumentam sua taxa de comportamento por um tempo. Por exemplo, pense em uma porta que você usou como um atalho para algum lugar que você vai com frequência. Imagine que um dia a porta não abrirá. Você pode empurrar ainda mais forte por um tempo, sacudir a porta, girar a maçaneta para os dois lados, talvez até chutar a porta. Você provavelmente se sentirá frustrado e com raiva, porém, depois de um curto período, você perceberá que a porta está trancada e irá embora. Se a porta estiver trancada permanentemente (sem que você saiba), você pode tentar algumas vezes nos próximos dias e, talvez, uma vez após um mês; apenas eventualmente você desistirá disso. Seu comportamento quando confrontado com a porta trancada ilustra um padrão clássico de extinção. O comportamento se intensifica quando o reforçador é retirado pela primeira vez e, em seguida, enfraquece rapidamente até que o comportamento desapareça. Ainda assim, o comportamento pode retornar depois de muito tempo. Por exemplo, você pode tentar abrir a porta novamente um ano depois para ver se ela ainda está trancada. Se estiver, provavelmente você a deixará lá por mais tempo, mas talvez não para sempre. O jorro de extinção (extinction burst) característico, o aumento dos níveis de um comportamento nos estágios iniciais de extinção, tem consequências importantes para a gestão da sala de aula. Por exemplo, imagine que você decidiu extinguir o grito impróprio de uma criança em busca de respostas (em vez de levantar a mão para ser reconhecida), ignorando-a até que ela levante a mão silenciosamente. No início, ignorar a criança provavelmente aumentará seu comportamento de gritar, um clássico jorro de extinção. Você pode, então, erroneamente concluir que ignorar não está funcionando, quando na verdade continuar a ignorar chamadas inadequadas é exatamente a estratégia certa se você continuar. Pior, você pode finalmente decidir ceder e reconhecer a criança após a terceira ou quarta chamada. Isso ensinaria a pior mensagem possível: que gritar funciona eventualmente se você continuar fazendo isso. Isso provavelmente resultaria em um aumento no próprio comportamento que você estava tentando reduzir, à medida que a criança aprende que “se a princípio você não conseguir, tente, tente novamente”. É o caso apresentado no início deste tópico. A professora Eller a princípio ignora os gritos de Rebecca, então, ela grita ainda mais alto. A professora chama Rebeca e, sem querer, comunica a ela que apenas gritos altos e persistentes serão reforçados. A extinção de um comportamento previamente aprendido pode ser acelerada quando algum estímuloou pista informa ao indivíduo que os comportamentos que antes eram encorajados não serão mais reforçados. No caso da porta trancada, uma placa dizendo: “porta permanentemente trancada – use outra entrada” teria reduzido muito o número de vezes que você tentou abrir a porta antes de desistir dela. Os gritos de atenção teriam sido reduzidos muito mais rapidamente se a professora Eller dissesse à classe: “não vou mais responder às crianças, a menos que elas fiquem em silêncio e levantem a mão”, e, então, ignorasse todas as outras tentativas de chamar sua atenção. Esquemas de reforçamento Os efeitos do reforço no comportamento dependem de muitos fatores, um dos mais importantes dos quais é o esquema de reforçamento. Esse termo se refere à frequência com que os reforçadores são dados, a quantidade de tempo que decorre entre as oportunidades de reforço e a previsibilidade do reforço. Um esquema de reforçamento comum é o esquema de Razão Fixa (RF), em que um reforçador é dado após um número fixo de comportamentos. Por exemplo, você pode dizer: “assim que terminar dez problemas, você pode ir lá fora.”. Independentemente do tempo que demore, os alunos são reforçados assim que concluem dez problemas. Esse é um exemplo de esquema RF10 (dez comportamentos para um reforçador). Uma forma comum de esquema de razão fixa fornece reforço para cada comportamento. Isso é chamado de esquema de Reforçamento Contínuo (RFC) ou RF1. Colocar dinheiro em uma máquina de refrigerante é (normalmente) um exemplo de reforçamento contínuo porque um comportamento (inserir dinheiro) resulta em um reforço (um refrigerante). Dar respostas corretas em sala de aula também costuma ser continuamente reforçado. O aluno dá uma boa resposta e você diz: “certo! Boa resposta!” Um processo importante na instrução é aumentar gradualmente a razão de reforçamento. No início de uma sequência de aulas, pode ser necessário reforçar aos alunos todas as respostas corretas, como responder a todos os problemas de matemática bem-sucedidos. No entanto, isso é ineficiente no longo prazo. Assim que os alunos estiverem respondendo aos problemas de matemática corretamente, pode ser possível reforçar a cada cinco problemas (RF5), a cada dez (RF10) e assim por diante. Diluir o esquema de reforçamento desta forma aumenta a capacidade dos alunos de trabalhar de forma independente sem reforço e torna o comportamento mais resistente à extinção. Em última análise, os alunos podem ser solicitados a fazer projetos inteiros por conta própria, sem receber nenhum reforço até que os projetos sejam concluídos. Os esquemas de razão fixa são eficazes para motivar os indivíduos a fazerem uma grande quantidade de trabalho – especialmente se a razão fixa começar com reforçamento contínuo (RF1) para fazer o indivíduo prosseguir e então passar a requisitos mais elevados para o reforçamento. Uma razão pela qual altos requisitos de reforçamento produzem níveis mais elevados de comportamento do que requisitos baixos é que o reforçamento com muita frequência pode fazer o valor do reforço se desgastar. Os alunos que são elogiados por todos os problemas de matemática logo se cansarão de serem elogiados e o reforçador pode perder seu valor. Um esquema de reforçamento de Razão Variável (RV) é aquele em que o número de comportamentos necessários para o reforço é imprevisível, embora seja certo que os comportamentos acabarão por ser reforçados. Por exemplo, uma máquina caça-níqueis é um reforçamento de razão variável. Pode valer a pena após uma puxada uma vez e após 200 puxadas na próxima vez, e não há como prever qual puxada vencerá. Na sala de aula, os professores costumam usar um esquema de razão variável quando os alunos levantam a mão para responder a perguntas. Embora nunca saibam quando serão reforçados por serem capazes de dar a resposta correta, os alunos podem esperar ser chamados cerca de uma em 20 vezes em uma classe de 20 alunos (um esquema RV20) porque, em média, 20 comportamentos são necessários para um reforçador. Os esquemas de razão variável tendem a produzir taxas de comportamento altas e estáveis. Na verdade, quase todos os jogos de azar envolvem esquemas de RV, então, podem ser literalmente viciantes. Da mesma forma, o uso de verificações aleatórias frequentes do trabalho do aluno pode ajudar a motivar um trabalho constante e cuidadoso. Os esquemas de razão variável são altamente resistentes à extinção. Mesmo depois que os comportamentos não são mais reforçados, as pessoas podem não desistir de trabalhar por muito tempo. Por terem aprendido que pode exigir muito trabalho para serem recompensados, eles continuam trabalhando na crença errônea de que o próximo esforço pode valer a pena. Em esquemas de reforçamento de Intervalo Fixo (IF), o reforçamento está disponível apenas em determinados horários periódicos. O exame final é um exemplo clássico. Os planejamentos de intervalo fixo criam um padrão interessante de comportamento. O indivíduo pode fazer muito pouco até um pouco antes do reforço estar disponível e, então, despender um jorro de esforço conforme o tempo para o reforço se aproxima. Esse padrão pode ser demonstrado com ratos e pombos em esquemas de intervalo fixo, mas é ainda mais aparente em alunos que estudam no último minuto antes de um teste ou que escrevem seus relatórios mensais de livros na noite anterior à data prevista. Essas características de esquemas de intervalo fixo sugerem que questionários curtos e frequentes podem ser melhores do que exames importantes infrequentes para incentivar os alunos a fazerem o seu melhor o tempo todo, em vez de passar a noite toda antes dos exames. Em um esquema de reforçamento de Intervalo Variável (IV), o reforço está disponível em alguns momentos, mas não em outros, e não temos ideia de quando um comportamento será reforçado. Um exemplo disso é fazer verificações pontuais de alunos que estão fazendo as tarefas em sala de aula. Os alunos são reforçados se estiverem trabalhando bem no momento específico em que você aparece. Como eles não podem prever quando você os verificará, os alunos devem estar fazendo um bom trabalho o tempo todo. As pessoas podem obedecer às leis de trânsito em respeito à lei e à responsabilidade cívica, mas também ajuda que a polícia verifique aleatoriamente o cumprimento da lei por parte dos motoristas. Os policiais que usam câmeras de velocidade geralmente se escondem em viadutos ou atrás de colinas para que possam obter uma amostra aleatória do comportamento dos motoristas. Se estivessem sempre à vista, sua presença seria um sinal para dirigir com cuidado, de modo que a necessidade de dirigir com cuidado em outros momentos seria reduzida. Como os esquemas de razão variável, os esquemas de intervalo variável são muito eficazes para manter uma alta taxa de comportamento enquanto são altamente resistentes à extinção. Por exemplo, digamos que você tenha uma política de fazer com que os alunos entreguem suas tarefas todos os dias. Em vez de verificar cada tarefa, você pega três tarefas ao acaso e dá a esses alunos um crédito extra se o trabalho na carteira for bem- feito. Essa programação de intervalo variável provavelmente motivaria os alunos a fazerem seu trabalho com cuidado. Se você secretamente parou de checar no meio do ano, os alunos podem nunca saber disso, percebendo que seu próprio trabalho simplesmente não foi selecionado para ser verificado em vez de perceber que o reforço não estava mais disponível para ninguém. O Quadro 2 define e dá exemplos adicionais de esquemas de reforçamento. Os padrões de resposta específicos durante o reforço e a extinção caracterizam cada um dos quatro tipos de esquemas. QUADRO 2 – ESQUEMAS DE REFORÇAMENTO PADRÕES DE RESPOSTA ESQUEMA DEFINIÇÃO DURANTE O REFORÇAMENTO DURANTE A EXTINÇÃO Razão Fixa Número constante de comportamentos necessários para o reforçoTaxa de resposta constante; pausa após reforço Queda rápida na taxa de resposta após o número necessário de respostas passar sem reforço Razão Variável Número variável de comportamentos necessários para o reforço Taxa desigual, com rápida aceleração ao final de cada intervalo Queda rápida na taxa de resposta após o intervalo passar sem reforço Intervalo Variável Quantidade variável de tempo passa antes que o reforço esteja disponível Taxa de resposta alta e constante Diminuição lenta na taxa de resposta Manutenção O princípio da extinção afirma que, quando o reforço para um comportamento previamente aprendido é retirado, o comportamento desaparece. Isso significa que os professores devem reforçar os comportamentos dos alunos para sempre? Não necessariamente. Para ratos em uma caixa de Skinner, a retirada do reforço para prensagem da barra levará inevitavelmente à extinção da prensagem da barra. No entanto, os humanos vivem em um mundo muito mais complexo, cheio de reforçadores naturais para a maioria das habilidades e comportamentos que aprendemos na escola. Por exemplo, os alunos podem inicialmente exigir reforço frequente para comportamentos que levam à leitura. No entanto, uma vez que conseguem ler, eles têm uma habilidade que abre todo o mundo da linguagem escrita, um mundo que é altamente reforçador para a maioria dos alunos. A partir de certo ponto, o reforço para a leitura pode não ser mais necessário, pois o próprio conteúdo do material de leitura mantém o comportamento. Da mesma forma, alunos malcomportados podem precisar de reforço cuidadoso e sistemático para fazer os trabalhos escolares. Depois de um tempo, porém, eles descobrirão que fazer as tarefas escolares compensa nas notas, na aprovação da família, na capacidade de entender o que está acontecendo na aula e no conhecimento. Esses reforçadores naturais para fazer as tarefas escolares estavam sempre disponíveis, mas os alunos não podiam experimentá-los até que suas tarefas fossem aprimoradas por meios mais sistemáticos. O conceito de resistência à extinção, discutido anteriormente (na parte sobre esquemas de reforçamento), é central para uma compreensão da manutenção do comportamento aprendido. Como foi observado, quando novos comportamentos estão sendo introduzidos, o reforço para respostas corretas deve ser frequente e previsível. No entanto, uma vez que os comportamentos são estabelecidos, o reforço para respostas corretas deve se tornar menos frequente e menos previsível. A razão para isso é que esquemas variáveis de reforço e esquemas que requerem muitos comportamentos antes que o reforço seja dado são muito mais resistentes à extinção do que esquemas fixos ou fáceis. Por exemplo, se você elogiar um aluno toda vez que ele resolver um problema de matemática, mas depois parar de elogiar, o aluno pode parar de resolver os problemas de matemática. Em contraste, se você aumentar gradualmente o número de problemas de matemática que um aluno deve fazer para ser elogiado e elogiar o aluno em intervalos aleatórios (uma programação de razão variável), então o aluno provavelmente continuará a fazer problemas de matemática por um longo tempo com pouco ou nenhum reforço. O papel dos antecedentes Vimos que as consequências do comportamento influenciam fortemente o comportamento. No entanto, não é apenas o que segue um comportamento que tem influência. Os estímulos que precedem um comportamento também desempenham um papel importante. Estímulos antecedentes, eventos que precedem um comportamento, também são conhecidos como pistas porque nos informam quais comportamentos serão reforçados e quais serão ignorados ou punidos. As pistas vêm em muitas formas e nos dão dicas sobre quando devemos mudar nosso comportamento e quando não devemos. Por exemplo, durante a aula de música, um professor pode pedir aos alunos que cantem mais alto. Em uma atividade na biblioteca, as expectativas são obviamente diferentes. A capacidade de se comportar de uma maneira na presença de um estímulo – "Cante mais alto" – e de uma maneira diferente na presença de outro estímulo – "Você está na biblioteca, fale baixinho" – é conhecida como discriminação de estímulo. Qual é a melhor hora para pedir um aumento ao seu chefe? Quando a empresa está indo bem, o chefe parece feliz e você acaba de fazer algo especialmente bom? Ou quando a empresa acaba de obter um relatório de lucros insatisfatório, o chefe está carrancudo e você acaba de cometer um erro? Obviamente, a primeira situação tem mais probabilidade de levar ao sucesso. Você sabe disso porque aprendeu a distinguir entre os momentos bons e os ruins para pedir ao seu chefe que faça algo por você. Discriminação é o uso de pistas, sinais ou informações para determinar quando é provável que o comportamento seja reforçado. A condição financeira da empresa, o humor do chefe e seu desempenho recente são estímulos discriminativos com relação às chances de que seu pedido de aumento seja bem-sucedido. Por exemplo, se você disser "Responda em uma frase completa", você está estabelecendo um estímulo discriminativo: "frases completas com a resposta certa serão reforçadas, outras respostas não". Para que os alunos aprendam a discriminar, eles devem receber feedback sobre a correção ou incorreção de suas respostas. Estudos de aprendizagem de discriminação geralmente descobriram que os alunos precisam saber quando suas respostas estão incorretas, bem como quando estão corretas. Aprender é, em grande parte, uma questão de dominar discriminações cada vez mais complexas. Por exemplo, todas as letras, números, palavras e símbolos matemáticos são estímulos discriminativos. Uma criança aprende a discriminar entre as letras b e d. Um aluno mais velho aprende a distinção entre as palavras eficaz e eficiente. Um acadêmico de psicologia educacional aprende a discriminar reforço negativo de punição. Um professor aprende a discriminar entre pistas faciais e verbais que indicam que os alunos estão entediados ou fascinados por uma aula ou algo entre as duas. Aplicar o conceito de estímulos discriminativos à instrução e gestão em sala de aula é fácil: você deve dizer aos alunos quais comportamentos serão reforçados. Em teoria, você poderia esperar até que eles fizessem algo que valesse a pena e, então, reforçá-lo, mas isso seria incrivelmente ineficiente. Em vez disso, você deve dar aos alunos mensagens que digam, na verdade, "para ser reforçado (por exemplo, com elogios, notas ou estrelas), essas são as coisas que você deve fazer". Dessa forma, você pode evitar que os alunos despendam tempo e esforço em atividades erradas. Quando os alunos sabem que o que estão fazendo valerá a pena, eles geralmente trabalharão com muito esforço. Se os alunos aprenderem a permanecer sentados e a fazer um trabalho cuidadoso na aula de matemática, seu comportamento também melhorará na aula de ciências? Se os alunos podem subtrair 3 maçãs de 7 maçãs, eles também podem subtrair 3 laranjas de 7 laranjas? Se os alunos podem interpretar o simbolismo usado por Shakespeare, eles também podem interpretar o simbolismo usado nos contos populares africanos? Todas essas são questões de generalização ou transferência de comportamentos aprendidos sob um conjunto de condições para outras situações. A generalização não pode ser tomada como certa. Por exemplo, quando um programa de gerenciamento de sala de aula é introduzido com sucesso em um ambiente, o comportamento dos alunos não melhora automaticamente em outros ambientes. Em vez disso, os alunos aprendem a discriminar as configurações. Até mesmo as crianças pequenas aprendem prontamente o que é encorajado e o que é proibido no jardim de infância, em sua casa e na casa de vários amigos. Seu comportamento pode ser bastante diferente em cada ambiente, de acordo com as diferentes regras e expectativas. Paraque a generalização ocorra, geralmente deve ser planejado. Um programa de gerenciamento de sala de aula bem-sucedido usado em aulas de estudos sociais pode ser transferido para a aula de inglês para garantir a generalização para esse ambiente. Os alunos podem precisar estudar o uso do simbolismo por muitos autores em muitas culturas antes de adquirirem a habilidade de interpretar o simbolismo em geral. Obviamente, é mais provável que a generalização ocorra em ambientes ou conceitos semelhantes. É mais provável que um novo comportamento se generalize da aula de leitura para a aula de estudos sociais do que para o recreio ou ambiente doméstico. No entanto, mesmo nas configurações de aparência mais semelhante, as generalizações podem não ocorrer. Por exemplo, muitos alunos podem demonstrar domínio completo da ortografia ou mecânica da linguagem, mas não conseguem aplicar esse conhecimento as suas próprias composições. Você não deve presumir que, como os alunos podem ter um desempenho eficaz sob um conjunto de circunstâncias, eles também podem fazê-lo sob um conjunto diferente de circunstâncias. Existem muitas técnicas para aumentar as chances de que um comportamento aprendido em um ambiente, como em uma determinada sala de aula, generalize-se para outros ambientes, como em outras salas de aula ou, mais importante, aplicados na vida fora da escola. Algumas dessas estratégias envolvem o ensino de uma forma que torna a generalização mais fácil. Por exemplo, aulas de aritmética envolvendo dinheiro provavelmente serão transferidas melhor para a vida real se envolverem a manipulação de moedas e notas reais ou simuladas do que se envolverem apenas problemas no papel. Outra estratégia de ensino conhecida por contribuir para a generalização é o uso de muitos exemplos de diferentes contextos. Por exemplo, os alunos são mais propensos a generalizar o conceito de oferta e demanda para novas áreas se aprenderem exemplos relacionados a preços de mantimentos, preços de recursos naturais, valores de itens colecionáveis (como cartões de beisebol) e salários para habilidades comuns e raras do que se eles aprendessem apenas sobre preços de alimentos. Uma estratégia óbvia para aumentar a generalização é o “treinamento no trabalho”: ensinar uma determinada habilidade no ambiente real em que será usada ou em uma simulação de tal ambiente. Após a instrução inicial, há muitas maneiras de aumentar a generalização. Uma é repetir a instrução em uma variedade de ambientes. Por exemplo, depois de ensinar os alunos a usar uma determinada estratégia de fazer o teste em matemática, como "pule os problemas difíceis e volte para eles depois de responder os mais fáceis", você pode dar aos alunos a oportunidade de usar essa mesma estratégia em um teste de ciências, um teste de gramática e um teste de geografia. Outra técnica pós-ensino é ajudar os alunos a fazer a ligação entre uma nova habilidade e reforçadores naturais no ambiente, de modo a manter essa habilidade. Por exemplo, quando as crianças estão aprendendo a ler, elas podem receber uma tarefa regular de dever de casa para ler livros ou revistas de grande interesse para elas, mesmo que esses materiais não sejam "boa literatura". Inicialmente, as novas habilidades de leitura podem ser mais bem mantidas pelos quadrinhos do que pelos clássicos da literatura, porque para algumas crianças os quadrinhos vinculam sua nova habilidade mais imediatamente ao prazer de ler, tornando mais provável a generalização para ambientes não escolares. Finalmente, você pode aumentar a generalização reforçando diretamente a generalização – por exemplo, elogiando um aluno que conecta uma nova ideia a um contexto diferente ou usa uma habilidade em uma nova aplicação. COMO A TEORIA DA APRENDIZAGEM SOCIAL CONTRIBUIU PARA A NOSSA COMPREENSÃO DA APRENDIZAGEM HUMANA? A teoria da aprendizagem social é uma consequência importante da tradição da teoria da aprendizagem comportamental. Desenvolvida por Albert Bandura, a teoria da aprendizagem social aceita a maioria dos princípios das teorias comportamentais, mas se concentra em um grau muito maior nos efeitos das pistas sobre o comportamento e nos processos mentais internos, enfatizando os efeitos do pensamento sobre a ação e os efeitos da ação sobre o pensamento. BANDURA: MODELAGEM E APRENDIZAGEM OBSERVACIONAL Bandura, observou que a ênfase skinneriana, nos efeitos das consequências do comportamento ignorou amplamente os fenômenos de modelagem – a imitação do comportamento dos outros – e da experiência vicária – aprender com os sucessos ou fracassos dos outros. Ele sentiu que muito da aprendizagem humana não é moldada por suas consequências, mas é aprendida com mais eficiência diretamente de um modelo. O professor de Educação Física demonstra polichinelos e os alunos imitam. Bandura, chamou isso de aprendizagem sem treino porque os alunos não precisam passar por um processo de modelagem, mas podem reproduzir a resposta correta imediatamente. A análise de Bandura, da aprendizagem observacional envolve quatro fases: atenção, retenção, reprodução e motivacional. Fase de atenção – A primeira fase da aprendizagem observacional é prestar atenção a um modelo. Em geral, os alunos prestam atenção aos modelos que são atraentes, bem-sucedidos, interessantes e populares. É por isso que tantos alunos copiam as roupas, o penteado e os maneirismos das estrelas da cultura pop. Na sala de aula, você chama a atenção dos alunos ao apresentar pistas claras e interessantes, ao usar novidades ou surpresas e motivar os alunos. Fase de retenção – Depois que os professores têm a atenção dos alunos, é hora de modelar o comportamento que eles querem que os alunos imitem e, em seguida, dar aos alunos a chance de praticar ou ensaiar. Por exemplo, você pode mostrar como escrever a letra A. Em seguida, os alunos imitariam o seu modelo tentando escrever vários As para si próprios. Fase da reprodução – Durante a fase de reprodução, os alunos tentam combinar seu comportamento com o do modelo. Na sala de aula, a avaliação da aprendizagem do aluno ocorre durante esta fase. Por exemplo, depois de ver a letra A modelada e praticá-la várias vezes, o aluno consegue reproduzir a letra de forma que se pareça com o seu modelo? Fase motivacional – A fase final do processo de aprendizagem observacional é a motivação. Os alunos imitarão um modelo porque acreditam que isso aumentará suas chances de serem reforçados. Na sala de aula, a fase motivacional da aprendizagem observacional frequentemente envolve elogios ou notas dadas por corresponder ao seu modelo. Os alunos prestam atenção no modelo, praticando e reproduzindo-o porque aprenderam que é disso que você gosta e querem agradá-lo. Quando a criança faz um A reconhecível, você diz: "bom trabalho!" Embora a maior parte da aprendizagem observacional seja motivada por uma expectativa de que imitar corretamente o modelo levará ao reforço, também é importante notar que as pessoas aprendem ao ver os outros serem reforçados ou punidos por se envolverem em certos comportamentos, ou seja, por aprendizagem vicária. É por isso que os anunciantes sempre incluem vencedores felizes em seus anúncios para induzir as pessoas a entrar em concursos promocionais. Podemos saber conscientemente que nossas chances de vencer são de uma em vários milhões, mas ver os outros tão bem reforçados nos faz querer imitar seu comportamento de entrar em competições. Os professores de sala de aula usam o princípio da aprendizagem vicária o tempo todo. Quando um aluno está brincando, os professores geralmente destacam outros que estão trabalhando bem e os reforçam por fazer um bom trabalho. O aluno que se comporta mal vê que o trabalho é reforçado e (espera-se) volta a trabalhar. Essa técnica foi sistematicamente examinada em um estudo clássico de Broden. Dois turbulentos alunos da segunda série, Edwin e Greg,sentaram-se um ao lado do outro. Depois de um período de linha de base, o professor começou a notar e elogiar Edwin sempre que ele estava prestando atenção e fazendo suas aulas. O comportamento de Edwin melhorou significativamente sob essa condição. De maior interesse, no entanto, é que o comportamento de Greg também melhorou, embora nenhum reforço específico para o comportamento apropriado tenha sido direcionado a ele. Aparentemente, Greg aprendeu com a experiência de Edwin. No caso da professora Eller e da aluna Rebeca na abertura deste tópico, outros alunos viram Rebeca chamar a atenção da professora gritando respostas, então eles modelaram seu comportamento no de Rebeca. Um dos experimentos clássicos da teoria da aprendizagem social é um estudo feito por Bandura, no qual crianças assistiam a um de três filmes. Em todos os três, um adulto modelou um comportamento agressivo. Em um filme, a modelo foi severamente punida. Em outro, a modelo foi elogiada e recebeu guloseimas. Em um terceiro, a modelo não teve consequências. Após assistir a um dos filmes, as crianças foram observadas brincando com brinquedos. As crianças que viram a modelo ser punida se envolveram em, significativamente, menos atos agressivos em suas próprias brincadeiras do que as crianças que viram a modelo ser recompensada ou assistiram ao filme sem consequências. Aprendizagem por observação Você já tentou ensinar alguém a amarrar os sapatos? Imagine explicar essa tarefa a alguém sem o uso de um modelo ou imitação! Aprender a amarrar os sapatos é um exemplo de como funciona a aprendizagem por observação. Adquirir novas habilidades observando o comportamento de outras pessoas é uma parte comum da vida cotidiana. Em muitas situações, as crianças observam os outros falando e agindo e testemunham as consequências dessas atividades. Essas observações fornecem modelos que ensinam às crianças estratégias para usar em outros momentos e lugares. Embora o foco principal da pesquisa sobre aprendizagem observacional tenha sido em comportamentos específicos, estudos mostraram que as atitudes também podem ser adquiridas por meio da observação. Tanto professores como pais estão preocupados com os modelos emulados pelas crianças. O valor desses modelos vai além das habilidades específicas que possuem e inclui as atitudes que representam. Na sala de aula, você deve ter a certeza de exemplificar um padrão de comportamento consistente com as expectativas que você tem para os alunos. Por exemplo, se a atenção e a ser bem-educado são características que você deseja estimular nos alunos, certifique-se de ser atento e educado. Outro conceito importante na teoria da aprendizagem social é a autorregulação. Bandura, levantou a hipótese de que as pessoas observam seu próprio comportamento, julgam-no de acordo com seus próprios padrões e se reforçam ou se punem. Todos nós tivemos a experiência de saber que fizemos um bom trabalho e de nos dar tapinhas nas costas mentalmente, independentemente do que os outros tenham dito. Da mesma forma, todos nós sabemos quando fizemos menos do que o nosso melhor. Para fazer esses julgamentos, precisamos ter expectativas para nosso próprio desempenho. Um aluno pode ficar encantado em acertar 90% em um teste, enquanto outro pode ficar bastante desapontado. Os alunos podem ser ensinados a usar estratégias de autorregulação e podem ser lembrados a fazê-lo em uma variedade de contextos para que a autorregulação se torne um hábito. Por exemplo, pode-se pedir aos alunos que estabeleçam metas para a quantidade de tempo que esperam estudar todas as noites e registrem se cumprem suas metas. Crianças que estão estudando fatos da multiplicação podem ser solicitados a cronometrar a rapidez e a precisão com que podem completar um teste de fatos de 50 itens e, em seguida, tentar bater seu próprio recorde. Os alunos podem ser solicitados a avaliar suas próprias redações em termos de conteúdo, mecânica e organização, e para ver se eles podem corresponder as suas avaliações. Gureasko-Moore, DuPaul e White, pediram a quatro meninos de 12 anos que frequentemente se atrasavam e esqueciam materiais e deveres de casa para manter um registro diário desses comportamentos. Eles se encontravam diariamente, definiam em conjunto metas para o grupo e, aos poucos, todos começaram a chegar às aulas na hora certa e preparados. Cada uma dessas estratégias coloca os alunos no controle de seus próprios objetivos de aprendizagem, e cada uma provavelmente construirá uma estratégia geral de definição e cumprimento de metas e padrões pessoais. Como acontece com qualquer habilidade, as habilidades de aprendizagem autorregulada provavelmente permanecerão limitadas a uma situação ou contexto, a menos que sejam aplicadas em muitos contextos. Por exemplo, crianças que aprendem a estabelecer metas de estudo para si mesmas quando trabalham sozinhas podem não transferir essas habilidades para situações em que estão trabalhando em grupos ou na sua presença como docente, embora possam aprender prontamente a fazer essas generalizações se elas são ensinadas ou lembradas de fazê-lo. Da mesma forma, as crianças não podem transferir estratégias de aprendizagem autorreguladas do português para a matemática, ou mesmo dos cálculos para a resolução de problemas. Por esse motivo, os alunos precisam de muitas oportunidades para usar estratégias de definição de metas e de autoavaliação em uma variedade de contextos; monitorar e comemorar seu progresso; e entender como, quando e por que eles devem se autorregular. MODELO DE APRENDIZAGEM AUTORREGULADA DE MEICHENBAUM Os alunos podem ser ensinados a monitorar e regular seu próprio comportamento. Estratégias de aprendizagem autorreguladas desse tipo são frequentemente chamadas de modificação cognitiva do comportamento. Por exemplo, Meichenbaum, desenvolveu uma estratégia na qual os alunos são treinados para dizer a si mesmos: “qual é o meu problema? Qual é o meu plano? Estou usando meu plano? Como eu me saí?” Essa estratégia tem sido usada para reduzir o comportamento perturbador dos alunos em muitos níveis de ensino. Manning, ensinou autoafirmações para alunos do terceiro ano para ajudá-los a lembrar o comportamento apropriado e reforçá-lo para si mesmos. Por exemplo, para levantar as mãos de maneira apropriada, os alunos foram ensinados a dizer a si mesmos enquanto levantavam as mãos: “se eu gritar a resposta, os outros ficarão perturbados. Vou levantar minha mão e esperar minha vez. Bom para mim. Veja, eu posso esperar!”. Estratégias semelhantes foram aplicadas com sucesso para ajudar os alunos a monitorar suas próprias realizações. Por exemplo, leitores fracos foram ensinados a fazer perguntas a si mesmos enquanto leem e a resumir parágrafos para ter certeza de que compreenderam o texto. As etapas envolvidas na autoaprendizagem são descritas por Meichenbaum, da seguinte forma: • Um modelo adulto executa uma tarefa enquanto fala consigo mesmo em voz alta (modelagem cognitiva). • A criança realiza a mesma tarefa sob a direção das instruções do modelo (orientação aberta e externa). • A criança realiza a tarefa enquanto se autoinstrui em voz alta (auto-orientação aberta). • A criança sussurra as instruções para si mesma à medida que realiza a tarefa (auto-orientação aberta). • A criança executa a tarefa enquanto orienta seu desempenho por meio de fala privada (autoinstrução encoberta). O incentivo à aprendizagem autorregulada é um meio de ensinar os alunos a pensar sobre seu próprio pensamento. As estratégias de aprendizagem autorregulada não apenas melhoram o desempenho nas tarefas ensinadas aos alunos, mas também generalizam para outras tarefas. Um exemplo de uma forma de ajudar as crianças a se engajarem na aprendizagem autorregulada é fornecer aos alunos, quando são designados a uma tarefa longa ou complexa, um formulário para monitorar seu progresso.A ideia por trás desse formulário é que dividir uma tarefa complexa em partes menores incentiva os alunos a sentir que estão fazendo progresso em direção a seu objetivo maior. Marcar cada passo permite que eles se de em um tapinha mental nas costas que reforça seus esforços. Depois de ver muitas listas de verificação desse tipo, os alunos podem ser solicitados a fazer as suas próprias para aprender como mapear seu progresso em direção a uma meta. Por exemplo, Reid e Lienemann, ensinaram um grupo de alunos com transtornos de déficit de atenção a listar todas as tarefas necessárias para completar uma tarefa escrita e, em seguida, marcar essas tarefas à medida que as concluíam. Isso aumentou a duração e a qualidade de sua escrita. Seguindo linhas semelhantes, Trammel, Schloss e Alper, descobriram que o fato de crianças com dificuldades de aprendizagem manterem registros e fazerem gráficos de sua conclusão de dever de casa aumentava significativamente a quantidade de lição de casa que elas faziam. Uma revisão feita por Robinson, Robinson e Katayama, descobriu que as estratégias de modificação cognitiva do comportamento podem ter um impacto substancial, especialmente na redução de comportamentos hiperativos, impulsivos e agressivos. Vários estudos revisados descobriram que esses efeitos são duradouros. PONTOS FORTES E LIMITAÇÕES DAS TEORIAS DE APRENDIZAGEM COMPORTAMENTAL Os princípios básicos das teorias de aprendizagem comportamental estão tão firmemente estabelecidos quanto qualquer outro na psicologia e foram demonstrados em muitas condições diferentes. Esses princípios são úteis para explicar muito do comportamento humano; eles são ainda mais úteis para mudar o comportamento na sala de aula. Autossuficiência No século XXI, o sucesso em empregos bem remunerados depende cada vez mais da capacidade de trabalhar independentemente ou com outras pessoas por longos períodos sem um superior monitorando de perto o trabalho. Mais do que nunca, os alunos precisam aprender como dividir as tarefas em pedaços pequenos e monitorar (e reforçar) suas próprias realizações. Os alunos que aprendem a se motivar têm uma habilidade que os ajudará a ter sucesso em qualquer desafio que a escola ou a vida traga. Por esse motivo, as avaliações tendem a enfatizar tarefas maiores (em vez de questões de múltipla escolha curtas) para garantir que os alunos possam organizar um conteúdo complexo. Os alunos que se sentem confiantes em sua capacidade de usar comportamentos metacognitivos e automotivadores tendem a ter alta autoeficácia – a crença de que os próprios esforços (ao invés da sorte ou de outras pessoas ou outros fatores externos ou incontroláveis) determinam o sucesso ou fracasso de alguém. As crenças de autoeficácia são talvez o fator mais importante (depois da habilidade) na determinação do sucesso dos alunos na escola. É importante reconhecer, entretanto, que as teorias de aprendizagem comportamental são limitadas em escopo. Com exceção dos teóricos da aprendizagem social, os teóricos da aprendizagem comportamental focam quase que exclusivamente no comportamento observável. Esse é um dos motivos pelos quais tantos dos exemplos apresentados neste tópico envolvem o gerenciamento do comportamento. Processos de aprendizagem menos visíveis, como formação de conceitos, aprendizagem de texto, resolução de problemas e pensamento, são difíceis de observar diretamente e, portanto, têm sido estudados com menos frequência pelos teóricos da aprendizagem comportamental. Esses processos se enquadram mais no domínio da aprendizagem cognitiva. A teoria da aprendizagem social, que é uma consequência direta das teorias de aprendizagem comportamentais, ajuda a preencher a lacuna entre as perspectivas comportamentais e cognitivas. As teorias comportamentais e cognitivas de aprendizagem são frequentemente apresentadas como modelos opostos concorrentes. De fato, existem áreas específicas nas quais essas teorias assumem posições contraditórias. No entanto, é mais preciso vê-las como complementares do que concorrentes, ou seja, como lidando com problemas diferentes. Usando princípios da teoria de aprendizagem comportamental e social para melhorar o ensino e a aprendizagem Os professores intencionais estão cientes dos princípios de aprendizagem comportamental e social e os usam de forma flexível para ajudar os alunos a se tornarem aprendizes produtivos e capazes. • Comunicam claramente aos seus alunos quais comportamentos são esperados e quais devem ser evitados. • Reforçam aos alunos a se envolverem em comportamentos que levam ao sucesso do aprendizado. • Moldam comportamentos dividindo tarefas complexas em tarefas menores e reforçam o progresso em direção ao objetivo complexo. • Evitam punição sempre que possível, nunca usam punição física e evitam usar modificação de comportamento para controlar excessivamente os alunos. • Reforçam o progresso dos alunos com frequência nos estágios iniciais de aprendizagem de uma nova habilidade e com menos frequência e menos previsíveis conforme novas habilidades são estabelecidas. • Usam muitos exemplos e simulações da vida real para ajudar os alunos a generalizar de uma situação para outra e da escola para a aplicação prática. • Ensinam os alunos a monitorar e reforçar seus próprios comportamentos, com a intenção de se tornarem alunos automotivados e autorregulados. • Envolvem os alunos na definição de seus próprios padrões e na elaboração de como organizar seu trabalho e dividir tarefas complexas para atender a esses padrões. RESUMO DO TÓPICO Neste tópico, você aprendeu que: A aprendizagem envolve a aquisição de habilidades que não são inatas. A aprendizagem depende da experiência, incluindo feedback do ambiente. As primeiras pesquisas sobre aprendizagem estudaram os efeitos dos estímulos nos comportamentos reflexivos. Ivan Pavlov contribuiu com a ideia do condicionamento clássico, no qual estímulos neutros podem adquirir a capacidade de evocar respostas comportamentais por meio de sua associação com estímulos não condicionados que desencadeiam reflexos. Skinner continuou o estudo da relação entre comportamento e consequências. Ele descreveu o condicionamento operante, no qual reforçadores e punidores moldam o comportamento. Os reforçadores aumentam a frequência de um comportamento e os punidores diminuem sua frequência. O reforço pode ser primário ou secundário, positivo ou negativo. Os reforçadores intrínsecos são recompensas inerentes ao próprio comportamento. Os reforçadores extrínsecos são elogios ou recompensas concedidas por outras pessoas. A punição envolve o enfraquecimento do comportamento pela introdução de consequências aversivas ou pela remoção de reforços. O Princípio Premack, afirma que uma maneira de aumentar as atividades menos apreciadas é vinculá-las a atividades mais apreciadas. Moldar por meio de feedback oportuno em cada etapa de uma tarefa é uma prática de ensino eficaz com base na teoria de aprendizagem comportamental. Extinção é o enfraquecimento e o desaparecimento gradual do comportamento à medida que o reforço é retirado. Os esquemas de reforçamento são usados para aumentar a probabilidade, frequência ou persistência do comportamento desejado. Os esquemas de reforçamento podem ser baseados em razões ou intervalos e podem ser fixos ou variáveis. Os estímulos precedentes servem como pistas que indicam quais comportamentos serão reforçados ou punidos. A discriminação envolve o uso de pistas para detectar diferenças entre as situações de estímulo, enquanto a generalização envolve responder às semelhanças entre os estímulos. A generalização envolve a transferência de comportamentos aprendidos sob um conjunto de condições para outras situações. A teoria da aprendizagem social é baseada no reconhecimento da importância da aprendizagem observacional e da aprendizagem autorregulada. Bandura,