Buscar

Apostila - Reforço_d14e17f2bfbd3b2f85e349307835c3f3

Prévia do material em texto

1 
 CBI of Miami 
 
 
2 
 CBI of Miami 
 
DIREITOS AUTORAIS 
 
Esse material está protegido por leis de direitos autorais. Todos os direitos 
sobre o mesmo estão reservados. 
Você não tem permissão para vender, distribuir gratuitamente, ou copiar 
e reproduzir integral ou parcialmente esse conteúdo em sites, blogs, jornais ou 
quaisquer veículos de distribuição e mídia. 
 
Qualquer tipo de violação dos direitos autorais estará sujeito a ações 
legais. 
 
3 
 CBI of Miami 
 
Reforço 
Lucelmo Lacerda 
 
 
 Já falamos bastante sobre contingência, o conceito fundamental da 
Análise do Comportamento. A contingência é composta pelo estímulo 
ambiental S, pela ação propriamente dita do sujeito, a resposta R e pela 
consequência C. Se o comportamento está presente no repertório do sujeito, 
isto é, se está entre as coisas que a pessoa faz, então podemos dizer com 
certeza que esta consequência é, muitas vezes, de um tipo específico a que 
chamamos de “reforçadora”. 
 Mas quando dizemos que uma consequência é reforçadora, não estamos 
falando se ela é boa ou ruim, se ela é bonita ou feia. Ou seja, quando falamos 
que um certo estímulo é reforçador, não estamos falando sobre como ele parece, 
sua forma, ou, como dizemos em Análise do Comportamento, sua 
TOPOGRAFIA. Quando afirmamos que um certo estímulo é reforçador, é uma 
afirmativa matemática, é porque ele teve um efeito de aumentar a probabilidade 
de uma resposta. 
 Imagine uma criança que limpa sua casa uma vez por semana. Então um 
belo dia sua mãe decide fazer o seguinte, quando ele limpa a casa ela fica 
conversando com ele por uma hora, mesmo que ela não fale nada sobre a casa, 
só conversa sobre coisas interessantes. Ela não faz isso só desta fez, mas torna 
isso uma constante. Este menino então passa a limpar sua casa não uma, mas 
três vezes por semana. Então podemos dizer que a resposta de limpar a casa 
aumentou de probabilidade de ocorrência quando passou a ser consequenciado 
com a conversa da mãe. Então podemos dizer que a conversa com a mãe foi 
um estímulo reforçador para o comportamento do menino de limpar a casa. 
 Por outro lado, vamos imaginar que o comportamento do menino não 
tivesse se alterado, então a conversa, mesmo bonita, mesmo bacana, mesmo 
que ele relatasse que amasse a conversa, não poderia ser considerada como 
reforçadora e sim neutra. E ainda se o comportamento tivesse diminuído para 
somente uma limpeza a cada 2 semanas, então poderíamos dizer que a 
consequência teria sido punitiva. 
 
4 
 CBI of Miami 
 
 Então reforçamento não é algo bom, não é recompensa, é uma 
consequência que aumenta a probabilidade da resposta. Qual a diferença 
de uma recompensa? Em todos os casos exemplificados acima, a mãe pode 
caracterizar como recompensa a seu filho. No entanto, em 2 das 3 hipóteses 
apresentadas esta “recompensa” não aumentou a probabilidade da resposta, 
portanto, não poderia ser considerada como “reforçadora”. 
 Este princípio foi bem demonstrado, primeiramente, em laboratório, 
aumento a probabilidade de animais como pombos e ratos, de emitirem certos 
comportamentos que, sem estímulos como comida logo após as respostas 
selecionadas, jamais emitiriam estes comportamentos como ratos jogando 
basquete e pombos jogando tênis. 
 O reforço é, portanto, o aumento de probabilidade de uma resposta 
através de uma consequência. O estímulo que, quando consequencia uma 
resposta, produz este reforço pode ser chamado de “reforçador”. O estímulo, no 
entanto, ocorre sempre após uma certa resposta e, claro, não pode alterar a 
resposta que já passou e sim a probabilidade de sua ocorrência no futuro. 
 Assim, é sempre fundamental o conhecimento da história de interação de 
uma pessoa, pois são as consequências do comportamento que determinam 
sua ocorrência no futuro. O organismo se comporta, portanto, a partir das 
relações estabelecidas entre si (como organismo particular) e o ambiente 
individual de interação do sujeito e a cultura em que ele se insere. 
 
O Reforçamento Positivo 
 Um comportamento é a contingência entre três partes, você já viu isso. O 
primeiro termo é o Estímulo Antecedente, o ambiente em que o comportamento 
ocorre, em que, em geral, um estímulo específico do ambiente sinaliza que a 
consequência está disponível, chamamos isso de Estímulo Discriminativa (Sd), 
por exemplo, você clicou no meio do vídeo para assistí-lo, se não estivesse 
vendo uma imagem do vídeo, não iria clicar, mas a imagem (Sd) sinalizou que 
se você emitisse o comportamento de clicar no meio, seria liberada a 
consequência (vídeo). 
 
 
5 
 CBI of Miami 
 
 Agora o que importa neste módulo. Se o vídeo for legalzinho para você e 
te ajudar, muito provavelmente você vai continuar fazendo o curso, 
continuar assistindo os vídeos, então eu poderei dizer que seu comportamento 
de dar play no vídeo foi reforçado pelo vídeo. Então isso é o reforçamento, é 
quando uma ação, um ato, que é o que chamamos de Resposta (R), aumenta 
de frequência porque passou a ser seguida de uma certa consequência. 
 Antes de você clicar na imagem, o vídeo não estava presente no 
ambiente, e então você emitiu a resposta e “Tcharam!!” o vídeo foi adicionado 
ao ambiente. Se estivéssemos em uma aula de matemática e eu estivesse 
contando estímulos eu representaria a operação assim: +1. Considerando que 
tem um sinalzinho de mais aí, posso dizer que a operação é positiva. 
 Atenção a este ponto, este reforço é positivo, não porque é muito bacana, 
bom, ou nada assim, mas porque ele se dá por meio da adição de um estímulo 
no ambiente que não estava presente e passou a estar. Então o “positivo” não 
tem caráter valorativo, mas simplesmente matemático. 
 Suponhamos que uma criança está na sala de aula e começa a falar bem 
alto com o colega, a professora se vira para este aluno e diz “Mais uma vez, 
Lucas, de novo você? Você não aprende? Assim vai ficar um burro pra vida 
inteira e eu quero ver onde esta burrice vai te levar” e digamos que o Lucas 
continua fazendo a mesma coisa, cerca de duas vezes por semana, levando 
sempre uma esculhambação semelhante. 
 Neste caso, muito claramente, ocorreu um Reforço Positivo, porque uma 
certa consequência (C), adicionou um estímulo ao ambiente (um xingamento 
barra pesada da professora) contingente a uma certa Resposta (R=falar bem 
alto). Embora esta consequência seja muito ruim e mesmo abusiva, ainda 
assim foi um reforço porque aumentou a frequência da resposta e foi positivo 
porque se deu adicionando um estímulo ao ambiente. 
 
Reforço negativo 
 Prepare-se para levar um belo susto, provavelmente Reforço Negativo é 
algo bem diferente do que você pensa que seja. Não, não é reforçar um 
comportamento muito ruim, muito feito, tão feio que eu possa dizer que é um 
 
6 
 CBI of Miami 
comportamento negativo. E tem mais, também não é reforçar o comportamento 
por meio de uma consequência valorativamente negativa, tal como dar uma 
reguada na cabeça, um pedala Robinho, nada disso. Eu sinceramente diria para 
ler só este parágrafo umas 77 vezes 7 vezes (mas acho que não vai ser muito 
reforçador), porque a maior parte das pessoas erra justamente ao considerar o 
Reforço Negativo alguma das coisas acima. 
 Vamos voltar ao caso do Lucas, aquele que levava uma bela 
esculhambação da professora e mesmo assim continuava a emitir o mesmo 
comportamento. Pois bem, naquela ocasião, a professora adicionava um 
estímulo ao ambiente toda vez que ele fala alto (R), na sala, durante a aula (S). 
Ela o xingava (C) e o comportamento era reforçado, sabemos isso porque ele o 
repetia. 
 Mas vamos inverter um pouco as coisas (acho quevocê vai reconhecer 
alguma coisa semelhante). Um estudante com autismo está na sala de aula e de 
repente (na verdade não é de repente, normalmente é justamente quando o 
professor passa uma lição) (S), ele começa a ter um comportamento disruptivo, 
como levantar, gritar, chorar, se sacudir (R) e o professor então, normalmente 
preocupado com a aprendizagem dos demais alunos, com o bem-estar do 
estudante com TEA e com o incômodo da situação, pede para a mediadora sair 
da sala com ele e “dar uma voltinha” (C). Dali para a frente, toda vez que o 
professor passa uma lição um pouco mais complicada, o aluno então começa a 
chorar, gemer, andar e outros e o professor, mais que depressa, manda dar a 
velha e eficaz “voltinha”. 
 Como o comportamento do aluno aumentou de frequência, já sei que algo 
reforçou este comportamento. Mas acontece que ele não ganhou uma coisa, 
logo, não posso fazer aquele sinal +1. Pelo contrário, não houve um estímulo 
adicionado ao ambiente, mas um estímulo (lição), retirada do ambiente da 
criança, de modo que a melhor forma de eu representar o que ocorreu, em uma 
relação matemática é: -1. Ops, chegamos no ponto chave que desejamos, você 
reparou no sinal negativo? É isso mesmo, ele não é negativo porque chorar ou 
perambular seja negativo, nem porque o comportamento do professor não foi 
dos melhores, mas porque o reforçamento, nesta operação, não adiciona um 
estímulo no ambiente, mas retira um estímulo do ambiente, então o reforço é ao 
 
7 
 CBI of Miami 
contrário, é negativo. 
 Mas vamos um pouco mais além, o aluno continuou a se comportar de 
forma disruptiva em sala de aula, mas o professor também continuou exibindo 
um mesmo comportamento nesta sequência relatada, ele continuou a tirar o 
aluno de sala de aula e se o comportamento do professor voltou a acontecer, 
então também podemos dizer que ele foi reforçado. Talvez você tenha pensado 
que com ele é diferente, pois ele pensa de maneira clara, que essas regras são 
para pessoas com autismo. Ledo engano, os princípios do reforçamento são 
válidos para os organismos vivos, e o professor é um organismo vivo (ou assim 
se espera). Então estas mesmas regras se aplicam ao comportamento do 
professor. Ele está no meio de sua aula, com um estudante que dá o maior show 
quando ele passa a lição, aquela é uma situação aversiva, ruim, desagradável e 
então ele emite um comportamento super simples, que o livra rapidamente de 
toda a aversividade da situação, simplesmente dá aquilo que a criança está se 
comportando para ter acesso, fugir da lição. Assim, o comportamento do 
professor é reforçado pela retirada de um estímulo do ambiente (o aluno em 
disrupção) e volta a ocorrer continuamente. 
 Vamos a outros exemplos, diante de uma lanchonete, com fome (S), 
compro uma coxinha e a como (R) e assim consigo afastar o estímulo aversivo 
que chamamos de fome (C), de modo que da próxima vez que passar nesta 
mesma lanchonete, também com fome, tenho alta probabilidade de novamente 
comer uma coxinha. Estou com uma pedra no sapato (S) e a retiro (R) e meu 
pé fica mais confortável (C). Em uma situação de dívida, devendo meio mundo 
(S), pago com o primeiro dinheirinho que entra (R) a empresa do cobrador mais 
chato, que para de me encher a paciência. Operação -1 (ou “menos um chato 
em minha vida”), e isso faz meu comportamento aumentar. 
 
Reforço Diferencial 
 
 Vamos lá, precisamos nos lembrar que o comportamento não é 
simplesmente a ação do sujeito, mas sim a conjunção de 3 coisas 
fundamentais, o ambiente em que ele ocorre (S), a ação do sujeito (R) e a 
consequência que mantém esta ação ocorrendo (C), o reforçador. 
 Ocorre, no entanto, que esta resposta emitida pelo sujeito pode não ser 
 
8 
 CBI of Miami 
adaptativa e nós podemos, de maneira planejada ou não, passar a não reforçar 
mais esta mesma resposta e sim uma outra, diferente. A isso chamamos de 
reforço diferencial, que é a base da maior parte dos esquemas de manejo de 
comportamento que vocês irão aprender mais a frente em uma disciplina 
específica. Mas agora cabe simplesmente apontarmos que processo é esse. 
 Você pode chegar em sua casa, todos os dias e apertar o interruptor da 
luz da sala suavemente e ela acender, o que reforça seu comportamento de 
apertar o interruptor suavemente. Ocorre que pode acontecer de o interruptor 
quebrar e agora só ligar quando você dá um belo apertão nele, de modo que a 
resposta que você sempre emitiu, que era de apertar suavemente o interruptor, 
não mais é reforçada, você precisa agora emitir uma outra resposta, diferente, 
para ter acesso ao mesmo reforçador. 
 Este exemplo de reforço diferencial é de uma situação não planejada, 
mas também pode ser feito deliberadamente, selecionando novas respostas 
para o acesso ao reforçador. Não entraremos em detalhes agora, mas se a 
nova resposta selecionada for fisicamente impossível de ser realizada ao 
mesmo tempo que a resposta antiga, então estaremos falando em um Reforço 
Diferencial de Resposta Incompatível - DRI, se elas forem fisicamente possíveis 
de ocorrer simultaneamente, então será um Reforço Diferencial de Resposta 
Alternativa - DRA, caso o selecionado é um tempo sem a emissão da resposta- 
alvo, então será um Reforço Diferencial de Outras Respostas - DRO e caso o 
reforçamento só ocorra em tempos pré-determinados, com alargamento 
planejado, então será um Reforço Diferencial de Taxas Baixas – DRL. 
 Mas o que importa neste momento é compreendermos, do ponto de 
vista conceitual, o que seja o tal reforço diferencial. Trata-se da alteração de 
uma contingência com a mudança da resposta que dá acesso ao reforçador. 
Portanto, estamos falando no mesmo S e o mesmo C, mas com uma seleção de 
resposta para que seja mais adequada. 
 É preciso lembrar que para operar uma intervenção de reforço diferencial, 
é imprescindível o conhecimento da contingência em que se está atuando, isto 
é, é necessário conhecer bem os 3 termos que a compõe, pois é necessário 
conhecer a função do comportamento. Daí que a utilização de quaisquer 
estratégias de reforço diferencial necessite de uma Análise Funcional ou uma 
 
9 
 CBI of Miami 
Avaliação Funcional. 
 Imaginemos o seguinte exemplo de uma estratégia de reforço diferencial 
programada e bastante utilizada em intervenções comportamentais na escola. 
Uma menina que bate no próprio rosto e grita, periodicamente, em sala de aula. 
Em uma avaliação funcional, elabora-se a hipótese de que seu comportamento 
tenha a função de sair da sala, já que o professor sempre a retira, nestas 
circunstâncias, “é melhor para ela”, ele diz. 
S – sala de aula 
R – bater no próprio rosto e gritar 
C – sair da sala 
 Como bater no próprio rosto são respostas que nossa sociedade considera 
como inadequadas, podemos ensinar a esta moça uma resposta diferente, mais 
adequada, para sair da sala. Se assim fizermos, este comportamento de se bater 
e gritar não mais deve dar acesso ao reforço (o professor não deve deixa-la sair 
por conta disso) e sim esta nova resposta (reforço diferencial), que pode ser, por 
exemplo, entregar uma ficha com a foto do lado de fora da escola. 
 
Esquemas de Reforçamento 
 
 Este é um daqueles conceitos fundamentais para uma boa intervenção 
baseada em ABA, sem o qual não se compreenderá vários procedimentos 
utilizados e qual sua função, isto porque trata-se de um conhecimento 
totalmente anti- intuitivo, se opondo ao que poderíamos imaginar em um 
primeiro olhar, não científico. 
 Quando nos comportamos, nosso comportamento é seguido de estímulos 
reforçadores. Mas a depender do tipo de comportamento e da circunstância em 
que isso ocorre, o reforço pode não ocorrer todas as vezes em que nos 
comportamos, ele pode ocorrer à vezes e se assim o for, esse “às vezes”pode 
também variar enormemente e essas variações constituem diferentes esquemas 
de reforçamento e produzem diferentes formas dos sujeitos se comportarem. 
Vamos começar pelo mais básicos dos esquemas de reforçamento, chamado de 
Reforço Contínuo, isto quer dizer que todas as vezes que a resposta ocorre, ela 
é seguida de reforçamento. Raramente isso ocorre na vida real. Em nosso 
cotidiano, quase todos os comportamentos às vezes recebem reforço, às vezes 
 
10 
 CBI of Miami 
não, mas o reforço contínuo é uma importante estratégia no processo de 
aquisição do comportamento. Assim, quando estamos ensinando uma pessoa 
com TEA uma habilidade nova, normalmente utilizamos o reforço contínuo. 
 Mas, se o reforço não ocorre todas as vezes em que a resposta é emitida, 
ele deixa de ser contínuo, e entramos então em um esquema de Reforço 
Intermitente. Este tipo de reforçamento, pasme, é muito mais poderoso do que o 
reforço contínuo. O que isto quer dizer? Que o comportamento fica mais forte, 
se você privar o sujeito de reforçador, o comportamento demora muito mais para 
acabar, isto é, fica mais resistente à extinção. É justamente a implementação de 
esquemas de reforço intermitente que gera o comportamento a que rotulamos, 
geralmente, de “persistente”. 
 Por isso é que, muitas vezes, ensinamos um comportamento utilizando 
reforço contínuo e quando ele está bem estabelecido, utilizamos algum 
esquema de reforço intermitente para fortalecer o comportamento e deixa-lo 
resistente à extinção. 
 Existem muitas formas de estabelecermos diferentes esquemas de 
reforçamento e eles produzem diferentes padrões comportamentais, com certa 
previsibilidade. Lembrando que isto não é decorrência de nenhum achismo, mas 
o resultado de uma enorme quantidade de estudos experimentais. 
 Os esquemas fundamentais de reforçamento são os de razão e os de 
intervalo. Ambos os tipos podem ser realizados de maneira fixa ou variável e 
cada uma dessas possibilidades produz diferentes padrões comportamentais. 
 O esquema de razão faz com que o reforço seja liberado a cada certa 
quantidade de respostas e pode ser um número fixo, por exemplo, uma criança 
fazendo um pareamento de cor e recebendo um elogio a cada 10 vezes que 
acerta. Mas também pode ser em razão variável, então pode ser elogiado a 
cada 10 vezes em média, então poderia ser, por exemplo, na 12ª vez, depois 
na 8ª, depois na 11ª, após na 9ª e assim por diante, mantendo sempre a razão 
10 como média. 
 O esquema de razão produz alta taxa de resposta e em seu esquema 
variável, ainda mais, produz-se uma altíssima taxa de resposta, desde que 
ele seja aumentado progressivamente. Também tem uma forte resistência à 
extinção. É este, por exemplo, o esquema utilizado por máquinas de caça-
 
11 
 CBI of Miami 
níquel. 
 Outro esquema fundamental é o de intervalo, assim, a resposta será 
reforçada sempre que ocorrer após certo intervalo que pode ser fixo, por 
exemplo, a cada 10 minutos, então não depende da quantidade de respostas, 
mas do tempo entre elas. Este esquema também pode ter um tempo variável, 
que também torna o comportamento mais resistente à extinção. Assim, poderia 
se estabelecer como média de 10 minutos, que poderia variar para mais ou 
para menos.

Continue navegando