Prévia do material em texto
ANOTAÇÕES CAP. 7 – ESQUEMAS DE REFORÇAMENTO - PCPS BÁSICOS DE
ANÁLISE DO COMPORTAMENTO
GLOSSÁRIO TERMINOLÓGICO
Autocontrole: Definido como a maior frequência de escolhas por
alternativas de reforçamento cujas consequências são de maior magnitude,
mesmo que atrasadas, em detrimento daquelas com consequências
imediatas, mas de menor magnitude (impulsividade).
Comportamento supersticioso: Comportamentos mantidos por uma
simples coincidência ou contiguidade temporal entre a resposta e o estímulo
reforçador, sem que exista uma relação real de produção (contingência)
entre eles.
Contenção limitada (Limited hold - LH): O tempo limitado estipulado para
que um estímulo reforçador permaneça disponível após ter sido liberado por
um esquema de reforçamento intermitente.
Esquema de reforçamento contínuo (CRF): Esquema no qual toda resposta
emitida é obrigatoriamente seguida pela apresentação de um estímulo
reforçador. É considerado o esquema mais eficaz para a modelagem e o
estabelecimento inicial de novos comportamentos.
Esquemas de reforçamento intermitente: Esquemas que estabelecem que
apenas algumas das respostas emitidas serão seguidas de consequências
reforçadoras. São ideais para manter comportamentos e aumentar a sua
resistência à extinção. Dividem-se em dois tipos principais:
• Esquemas de intervalo: O reforçamento depende da passagem de um
período de tempo desde o reforçamento da última resposta, bastando
a ocorrência de uma única resposta após esse tempo. Podem ser de
Intervalo Fixo (FI), onde a passagem de tempo exigida é sempre igual e
constante; ou de Intervalo Variável (VI), onde os intervalos de tempo
variam a cada nova apresentação.
• Esquemas de razão: O critério principal para a liberação do reforçador
é o número de respostas que o organismo emite. Podem ser de Razão
Fixa (FR), que exigem um número específico e inalterado de respostas;
ou de Razão Variável (VR), onde o número de respostas exigidas se
modifica a cada reforçamento.
Esquemas de tempo (Não contingentes): Esquemas em que o estímulo
potencialmente reforçador é apresentado independentemente da emissão
de qualquer resposta, baseando-se exclusivamente na passagem do tempo.
Dividem-se em Tempo Fixo (FT), com liberações em intervalos regulares, e
Tempo Variável (VT), com liberações em intervalos irregulares.
Esquemas compostos: Envolvem a combinação de mais de um esquema
simples de reforçamento para simular no laboratório as situações complexas
encontradas no cotidiano. Incluem:
• Esquemas concorrentes: Duas ou mais alternativas de esquemas
operam simultaneamente, permitindo que o organismo distribua suas
respostas entre elas. São utilizados para investigar o comportamento
de escolha.
• Esquemas encadeados: Cadeias de esquemas (elos) que ocorrem
sempre na mesma ordem, onde a ocorrência de um reforçador
condicionado serve como estímulo discriminativo para o elo seguinte,
até que o reforçador primário seja liberado no último elo.
• Esquemas mistos: Apresentam a alternância de esquemas simples em
vigor, mas sem o uso de estímulos discriminativos que sinalizem ao
organismo qual componente está operando.
• Esquemas múltiplos: Alternância temporária de esquemas simples de
reforçamento, onde cada componente é claramente sinalizado por um
estímulo discriminativo antecedente diferente.
• Esquemas tandem: Semelhantes aos esquemas encadeados, mas
realizados sem o uso de estímulos discriminativos para separar cada
elo.
Intervalo entre respostas (IRT): O tempo decorrido entre a ocorrência de
uma resposta e o início da próxima resposta.
Lei da igualação: Regra que prevê que, em esquemas concorrentes
temporais, a distribuição (proporção) de respostas emitidas pelo organismo
entre as alternativas tende a se igualar à distribuição dos estímulos
reforçadores obtidos em cada uma delas.
Pausa pós-reforçamento: O período em que o organismo cessa a emissão
de respostas, medido pelo tempo decorrido entre a apresentação do
estímulo reforçador e o reinício do comportamento.
Reforçamento acidental: Processo de fortalecimento de um
comportamento que ocorre unicamente devido à proximidade temporal
(contiguidade) entre uma resposta e a apresentação de um estímulo,
característico da formação de superstições.
Resistência à extinção: O número de respostas emitidas (ou tempo
decorrido) sem o recebimento de reforçamento até que a frequência do
comportamento diminua e retorne ao seu nível operante original.
Scallop: Aumento rápido e positivamente acelerado na taxa de respostas
(demonstrado por uma inclinação curva em gráficos) que ocorre logo após a
pausa pós-reforçamento em esquemas de intervalo fixo, conforme o
momento do reforço se aproxima.
Siglas DR (Esquemas de Reforçamento Diferencial):
• DRA (Differential Reinforcement of Alternative behavior): Variante
para redução de comportamentos problemáticos onde a liberação do
reforçador é contingente à emissão de comportamentos de outras
classes, que não o comportamento-alvo a ser reduzido.
• DRH (Differential Reinforcement of High rates): Exige que as respostas
sejam emitidas de forma rápida (altas taxas), estipulando um limite
máximo de tempo para a ocorrência de um certo número de respostas
ou exigindo IRTs muito curtos
• DRL (Differential Reinforcement of Low rates): Reforça o
comportamento apenas se as respostas forem espaçadas por um
tempo mínimo exigido. Caso a resposta ocorra antes do prazo, o
cronômetro é reiniciado.
• DRO (Differential Reinforcement of Other behavior): Consiste na
apresentação do estímulo reforçador quando o organismo passa um
determinado período de tempo sem emitir o comportamento-alvo que
se deseja reduzir.
PRINCIPAIS TÓPICOS
1. Esquemas de Reforçamento
Esquemas de Reforçamento (Visão Geral)
Explicação científica: São os critérios ou arranjos de contingências que
definem quais respostas de um organismo serão reforçadas.
Tradução (Para iniciantes): Pense nisso como a "regra do jogo". É a regra
que a natureza ou a sociedade estipula para dizer quando o seu
comportamento vai, de fato, gerar uma consequência positiva ou
recompensa.
Exemplo didático: Quando você usa um computador, a regra do sistema
exige que você clique duas vezes seguidas em um ícone para que o aplicativo
abra. Se clicar uma vez só, não há recompensa. Os dois cliques são o
esquema que libera o reforçador "aplicativo aberto".
2. Esquema de Reforçamento Contínuo (CRF)
Esquema de Reforçamento Contínuo (Continuous Reinforcement - CRF)
Explicação científica: Configuração onde toda resposta emitida é
obrigatoriamente seguida da apresentação de um estímulo reforçador. É o
esquema mais eficaz para a modelagem e a manutenção inicial de novos
comportamentos.
Tradução (Para iniciantes): Toda vez que você faz a ação, você ganha o
prêmio. É a melhor forma de ensinar um comportamento novo para alguém
(ou para um animal), pois a pessoa entende rapidamente o que se espera
dela.
Exemplo didático: Quando você vira a chave de um carro zero com o tanque
cheio: todas as vezes que você gira a chave, o motor liga.
3. Esquema de Reforçamento Intermitente
Esquema de Reforçamento Intermitente
Explicação científica: Esquemas que estabelecem que apenas uma parte das
respostas emitidas será reforçada. São fundamentais para a manutenção do
comportamento e aumentam consideravelmente a sua resistência à
extinção.
Tradução (Para iniciantes): Às vezes você ganha, às vezes não. A vida real
funciona quase toda assim. O mais incrível é que, por não recebermos a
recompensa o tempo todo, nós ficamos "viciados" em tentar, fazendo o
comportamento durar muito mais tempo.
Exemplo didático: Quando você liga para a sua operadora de celular para
resolver um problema. Nem sempre que você liga o problema é resolvido,
mas por ter sido reforçado ocasionalmente no passado, você continua
tentando.
4. Esquemade Razão Fixa (FR)
Esquema de Razão Fixa (Fixed Ratio - FR)
Explicação científica: O requisito para a liberação da consequência
reforçadora é a emissão de um número específico e constante de respostas.
Produz um padrão comportamental de curtas pausas pós-reforçamento
seguidas de uma alta taxa de respostas.
Tradução (Para iniciantes): É o pagamento por produtividade estrita. Você
precisa fazer a ação um número "x" de vezes para ganhar. Isso faz com que
você aja muito rápido, mas dê uma "respirada" (pausa) logo após conseguir
o prêmio, antes de recomeçar.
Exemplo didático: Uma fábrica de sapatos onde o artesão ganha R$ 10,00 a
cada 5 pares produzidos (FR 5). Ele trabalha rápido para fechar o lote de 5,
descansa brevemente ao receber o dinheiro, e volta ao trabalho.
5. Esquema de Razão Variável (VR)
Esquema de Razão Variável (Variable Ratio - VR)
Explicação científica: O número de respostas necessárias para a
apresentação do estímulo reforçador modifica-se a cada nova apresentação,
operando em torno de uma média. Gera as mais altas taxas de respostas,
com ausência ou irregularidade de pausas pós-reforçamento.
Tradução (Para iniciantes): É o fator "surpresa". Você sabe que a
recompensa virá pelo seu esforço, mas não sabe de quantas tentativas vai
precisar. Como pode ser na próxima tentativa, você não para de tentar e não
faz pausas.
Exemplo didático: Uma máquina caça-níqueis. A pessoa puxa a alavanca 117
vezes e ganha. Depois, puxa 62 vezes e ganha novamente. Ou um garoto que
telefona para a ex-namorada: ela atende após 5 ligações num dia, após 12
no outro... Ele continua ligando loucamente.
6. Esquema de Intervalo Fixo (FI)
Esquema de Intervalo Fixo (Fixed Interval - FI)
Explicação científica: A primeira resposta emitida após a passagem de um
período específico e invariável de tempo é reforçada. Produz baixas taxas de
respostas, com longas pausas pós-reforçamento e um aumento
positivamente acelerado na taxa de respostas (chamado de scallop) à
medida que o momento do reforçamento se aproxima.
Tradução (Para iniciantes): O prêmio só fica liberado depois que o relógio
marcar um tempo exato. Tentar antes do tempo é inútil. Por isso, a pessoa
"enrola" bastante logo depois que ganha e só começa a agir depressa
quando o prazo está acabando.
Exemplo didático: Um adolescente que sabe que os pais só dão
mesada/dinheiro a cada 5 dias (FI 5 dias). Pedir dinheiro no 2º dia não
adianta. A frequência de pedidos vai aumentar muito (scallop) quando
chegar o 4º ou 5º dia.
7. Esquema de Intervalo Variável (VI)
Esquema de Intervalo Variável (Variable Interval - VI)
Explicação científica: Semelhante ao intervalo fixo, mas os intervalos de
tempo exigidos entre os reforçamentos são irregulares e operam através de
uma média. O padrão gerado é de taxas moderadas e constantes de
respostas, sem pausas pós-reforçamento.
Tradução (Para iniciantes): O tempo até o prêmio ser liberado fica mudando,
não dá para prever. Como você não sabe que horas a oportunidade vai se
abrir, você mantém um ritmo de checagem ou de esforço calmo e constante,
sem pausas e sem desespero.
Exemplo didático: Ficar atualizando sua caixa de e-mails para ver se
chegaram mensagens novas. Você não sabe a que horas alguém vai te
escrever, então checa constantemente num ritmo moderado.
8. Resistência à Extinção
Resistência à Extinção
Explicação científica: O número de respostas emitidas ou o tempo decorrido
sem reforçamento até que a frequência do comportamento diminua e
retorne ao seu nível operante original. Esquemas variáveis produzem
comportamentos muito mais resistentes à extinção.
Tradução (Para iniciantes): É o grau de "teimosia" de um comportamento.
Representa o quanto você insiste em fazer algo que parou de dar certo. Se
no passado a coisa funcionava só de vez em quando (intermitente), você
demora muito mais para desistir.
Exemplo didático: Um controle remoto com mau contato que antes
funcionava só se apertado várias vezes. Quando a pilha acaba de vez, a
pessoa aperta o botão dezenas de vezes antes de desistir, devido à alta
resistência.
9. Contenção Limitada
Contenção Limitada (Limited Hold - LH)
Explicação científica: Trata-se do tempo máximo e limitado no qual um
estímulo reforçador, liberado por um esquema de reforçamento
intermitente, permanecerá disponível para o organismo caso a resposta seja
emitida.
Tradução (Para iniciantes): Uma "janela de oportunidade". A regra diz que a
recompensa chegou, mas ela vem com um cronômetro. Se você não pegar
logo, ela some.
Exemplo didático: Seu programa de TV favorito, que só passa uma vez por
semana (FI 1 semana). Se ele dura apenas 30 minutos, esses 30 minutos são
a contenção limitada (LH 30 min). Se você ligar a TV fora dessa "janela",
perdeu a chance.
10. Esquemas Não Contingentes (FT e VT)
Esquemas de Reforçamento Não Contingente (Tempo Fixo - FT e Tempo
Variável - VT)
Explicação científica: Esquemas onde o estímulo reforçador é apresentado
independentemente da ocorrência de qualquer resposta específica. Podem
ser administrados em intervalos de tempo regulares (FT) ou irregulares (VT).
Tradução (Para iniciantes): "Cair do céu". Você ganha a recompensa
simplesmente porque o tempo passou. Você não precisa fazer
absolutamente nada para recebê-la.
Exemplo didático: Se um adolescente ganha a mesada todo sábado apenas
por existir, não importando como ele se comportou na semana, isso é um
esquema de Tempo Fixo (FT 1 semana).
11. Comportamento Supersticioso
Nome do tópico: Comportamento Supersticioso e Reforçamento Acidental
Explicação científica: Fortalecimento de um comportamento que ocorre
devido apenas à sua contiguidade temporal (proximidade no tempo) com a
apresentação do reforçador, em esquemas não contingentes, onde não
existe relação real de contingência (produção).
Tradução (Para iniciantes): É o "falso positivo" do nosso cérebro. Você faz
uma ação qualquer, e por coincidência, algo muito bom acontece logo em
seguida. Seu cérebro acha que você causou aquilo, criando uma superstição.
Exemplo didático: Você veste sua "cueca da sorte" e seu time ganha. Ou
você está torcendo forte, e o seu time, lá longe no campo, faz um gol bem
na hora do seu grito. A proximidade de eventos enganou o cérebro.
12. Esquemas Reguladores de Taxa: DRH e DRL
Reforçamento Diferencial de Altas Taxas (DRH) e Baixas Taxas (DRL)
Explicação científica: São esquemas que selecionam (reforçam) Intervalos
Entre Respostas (IRTs) específicos. O DRH estipula um limite máximo de
tempo para a ocorrência de um número de respostas (IRT curto), reforçando
o responder rápido. O DRL estipula um espaçamento mínimo de tempo entre
as respostas (IRT longo), zerando o cronômetro caso ocorram
antecipadamente.
Tradução (Para iniciantes): O DRH é como uma bomba-relógio onde você
tem que fazer tudo muito rápido, bater a meta contra o tempo. O DRL treina
a sua paciência: se você se afobar e agir antes do tempo mínimo exigido,
você perde a tentativa e começa a esperar do zero.
Exemplo didático:
• DRH: Fazer prova de concurso de digitação, exigindo alta velocidade
para passar.
• DRL: Ensinar uma criança autista a não se engasgar, só permitindo
(reforçando) que ela leve outra colher de comida à boca se esperar no
mínimo um minuto da colherada anterior.
13. DRO e DRA (Redução de comportamentos problemáticos)
Reforçamento Diferencial de Outro Comportamento (DRO) e de
Comportamento Alternativo (DRA)
Explicação científica: No DRO, o reforço é contingente ao organismo não
emitir um comportamento-alvo durante um período. No DRA, o reforço é
contingente à emissão de comportamentos de classes diferentes do alvo
(respostas alternativas). São preferíveis à punição ou extinção pura para
diminuir comportamentos problemáticos.
Tradução (Para iniciantes): Ao invés de brigar com a pessoa por fazer a coisaerrada, você a recompensa. O DRO recompensa "ficar X tempo sem fazer o
erro". O DRA recompensa a pessoa por "fazer uma coisa legal/adequada no
lugar do erro".
Exemplo didático:
• DRO: Uma criança tem crise de agressão a cada 5 minutos. Você passa
a recompensá-la cada vez que ela fica consistentes 5 minutos sem bater
em ninguém.
• DRA: Você quer que o rato pare de bater na barra, então toda vez que
ele fareja ou coça o focinho (outro comportamento), você lhe dá água.
14. Esquemas Compostos: Múltiplos e Mistos
Esquemas Compostos - Múltiplos e Mistos
Explicação científica: A alternância sucessiva de mais de um esquema
simples de reforçamento em vigor. No esquema Múltiplo, cada componente
é sinalizado por um estímulo discriminativo diferente antecedente. No
esquema Misto, não há estímulos sinalizadores, devendo o organismo
discriminar pela própria contingência.
Tradução (Para iniciantes): A vida é cheia de regras misturadas. No Múltiplo,
há placas claras dizendo qual "fase" você está ("com o pai a regra é X, com a
mãe a regra é Y"). No Misto, o jogo muda sem avisar, e você tem que
perceber a nova regra prestando atenção aos resultados.
Exemplo didático: Múltiplo: A criança pede doces para a mãe (que quase
nunca dá - sinal A - esquema VI) e para o pai que só vê nos finais de semana
(que dá sempre - sinal B - CRF). As figuras dos pais funcionam como os
estímulos que sinalizam a regra atual.
15. Esquemas Encadeados e Tandem
Esquemas Compostos - Encadeados e Tandem
Explicação científica: Esquemas que ocorrem em uma ordem rígida (cadeias
de respostas). O término das exigências de um elo é reforçado por produzir
as condições (o início) do próximo elo. No esquema Encadeado há presença
de estímulos discriminativos para cada elo; no Tandem, eles não são
sinalizados.
Tradução (Para iniciantes): Pense numa linha de produção ou fases de
videogame. Você não ganha o troféu final ao acabar a fase 1; você ganha o
direito de entrar na fase 2. O esquema Encadeado avisa claramente que você
passou de fase. O Tandem não dá nenhum sinal visual/sonoro.
Exemplo didático: Um rato bate na barra direita 10 vezes (FR 10). Ao fazer
isso, uma luz se acende (sinal / próximo elo). A partir daí, se ele esperar 20
segundos (FI 20") e bater na barra esquerda, ganha água. Um passo leva ao
outro obrigatoriamente.
16. Escolha e a Lei da Igualação (Esquemas Concorrentes)
Esquemas Concorrentes e a Lei da Igualação
Explicação científica: Em esquemas concorrentes, duas ou mais
contingências operam simultaneamente. Herrstein (1961) postulou a Lei da
Igualação, indicando que, na escolha em esquemas concorrentes temporais
(VI, FI), a distribuição da frequência e do tempo de respostas entre
alternativas tenderá a se igualar, em proporção, à distribuição dos estímulos
reforçadores (ou magnitudes e atrasos) obtidos nelas.
Tradução (Para iniciantes): Quando você tem várias coisas que pode fazer
ao mesmo tempo para se dar bem, a ciência mostra que o nosso esforço é
calculista: a energia e o tempo que dedicamos a cada opção serão
matematicamente proporcionais ao tamanho da recompensa de cada uma.
Exemplo didático: Jogadores de basquete que avaliam na hora da partida se
arremessam de 2 ou 3 pontos. Os atletas mais eficientes dividem (igualam)
seus tipos de arremesso na exata proporção dos pontos (retorno) que
costumam obter em cada situação.
17. Autocontrole e Impulsividade (Concorrentes Encadeados)
Esquemas Concorrentes Encadeados: Autocontrole e Impulsividade
Explicação científica: Para Rachlin e Green (1972), autocontrole não é
"determinação interna", mas sim a emissão mais frequente de respostas
escolhidas sob alternativas de reforçamento cujas consequências são de
maior magnitude, ainda que atrasadas, em detrimento de escolhas de
menor magnitude e imediatas (impulsividade). Usa-se frequentemente uma
"resposta de compromisso" prévia para evitar o contato iminente com a
alternativa impulsiva.
Tradução (Para iniciantes): Ser autocontrolado na visão comportamental
não é ter "força de vontade mágica". É saber modificar o ambiente para que
as recompensas maiores, porém distantes, vençam as tentações fraquinhas
que estão bem na sua cara no momento. Assumir um compromisso
antecipado tranca você no bom caminho.
Exemplo didático: Se o salário cai na conta corrente disponível, você pode
acabar comprando roupas impulsivamente no shopping e ficar sem dinheiro
(recompensa imediata de menor magnitude). Ao escolher programar um
depósito automático numa previdência privada (compromisso), você "trava"
o dinheiro, impedindo-se de gastar hoje para usufruir de uma velhice
confortável no futuro (recompensa atrasada de grande magnitude).