Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

ANOTAÇÕES CAP. 7 – ESQUEMAS DE REFORÇAMENTO - PCPS BÁSICOS DE 
ANÁLISE DO COMPORTAMENTO 
GLOSSÁRIO TERMINOLÓGICO 
Autocontrole: Definido como a maior frequência de escolhas por 
alternativas de reforçamento cujas consequências são de maior magnitude, 
mesmo que atrasadas, em detrimento daquelas com consequências 
imediatas, mas de menor magnitude (impulsividade). 
Comportamento supersticioso: Comportamentos mantidos por uma 
simples coincidência ou contiguidade temporal entre a resposta e o estímulo 
reforçador, sem que exista uma relação real de produção (contingência) 
entre eles. 
Contenção limitada (Limited hold - LH): O tempo limitado estipulado para 
que um estímulo reforçador permaneça disponível após ter sido liberado por 
um esquema de reforçamento intermitente. 
Esquema de reforçamento contínuo (CRF): Esquema no qual toda resposta 
emitida é obrigatoriamente seguida pela apresentação de um estímulo 
reforçador. É considerado o esquema mais eficaz para a modelagem e o 
estabelecimento inicial de novos comportamentos. 
Esquemas de reforçamento intermitente: Esquemas que estabelecem que 
apenas algumas das respostas emitidas serão seguidas de consequências 
reforçadoras. São ideais para manter comportamentos e aumentar a sua 
resistência à extinção. Dividem-se em dois tipos principais: 
• Esquemas de intervalo: O reforçamento depende da passagem de um 
período de tempo desde o reforçamento da última resposta, bastando 
a ocorrência de uma única resposta após esse tempo. Podem ser de 
Intervalo Fixo (FI), onde a passagem de tempo exigida é sempre igual e 
constante; ou de Intervalo Variável (VI), onde os intervalos de tempo 
variam a cada nova apresentação. 
• Esquemas de razão: O critério principal para a liberação do reforçador 
é o número de respostas que o organismo emite. Podem ser de Razão 
Fixa (FR), que exigem um número específico e inalterado de respostas; 
ou de Razão Variável (VR), onde o número de respostas exigidas se 
modifica a cada reforçamento. 
Esquemas de tempo (Não contingentes): Esquemas em que o estímulo 
potencialmente reforçador é apresentado independentemente da emissão 
de qualquer resposta, baseando-se exclusivamente na passagem do tempo. 
Dividem-se em Tempo Fixo (FT), com liberações em intervalos regulares, e 
Tempo Variável (VT), com liberações em intervalos irregulares. 
Esquemas compostos: Envolvem a combinação de mais de um esquema 
simples de reforçamento para simular no laboratório as situações complexas 
encontradas no cotidiano. Incluem: 
• Esquemas concorrentes: Duas ou mais alternativas de esquemas 
operam simultaneamente, permitindo que o organismo distribua suas 
respostas entre elas. São utilizados para investigar o comportamento 
de escolha. 
• Esquemas encadeados: Cadeias de esquemas (elos) que ocorrem 
sempre na mesma ordem, onde a ocorrência de um reforçador 
condicionado serve como estímulo discriminativo para o elo seguinte, 
até que o reforçador primário seja liberado no último elo. 
• Esquemas mistos: Apresentam a alternância de esquemas simples em 
vigor, mas sem o uso de estímulos discriminativos que sinalizem ao 
organismo qual componente está operando. 
• Esquemas múltiplos: Alternância temporária de esquemas simples de 
reforçamento, onde cada componente é claramente sinalizado por um 
estímulo discriminativo antecedente diferente. 
• Esquemas tandem: Semelhantes aos esquemas encadeados, mas 
realizados sem o uso de estímulos discriminativos para separar cada 
elo. 
Intervalo entre respostas (IRT): O tempo decorrido entre a ocorrência de 
uma resposta e o início da próxima resposta. 
Lei da igualação: Regra que prevê que, em esquemas concorrentes 
temporais, a distribuição (proporção) de respostas emitidas pelo organismo 
entre as alternativas tende a se igualar à distribuição dos estímulos 
reforçadores obtidos em cada uma delas. 
Pausa pós-reforçamento: O período em que o organismo cessa a emissão 
de respostas, medido pelo tempo decorrido entre a apresentação do 
estímulo reforçador e o reinício do comportamento. 
Reforçamento acidental: Processo de fortalecimento de um 
comportamento que ocorre unicamente devido à proximidade temporal 
(contiguidade) entre uma resposta e a apresentação de um estímulo, 
característico da formação de superstições. 
Resistência à extinção: O número de respostas emitidas (ou tempo 
decorrido) sem o recebimento de reforçamento até que a frequência do 
comportamento diminua e retorne ao seu nível operante original. 
Scallop: Aumento rápido e positivamente acelerado na taxa de respostas 
(demonstrado por uma inclinação curva em gráficos) que ocorre logo após a 
pausa pós-reforçamento em esquemas de intervalo fixo, conforme o 
momento do reforço se aproxima. 
Siglas DR (Esquemas de Reforçamento Diferencial): 
• DRA (Differential Reinforcement of Alternative behavior): Variante 
para redução de comportamentos problemáticos onde a liberação do 
reforçador é contingente à emissão de comportamentos de outras 
classes, que não o comportamento-alvo a ser reduzido. 
• DRH (Differential Reinforcement of High rates): Exige que as respostas 
sejam emitidas de forma rápida (altas taxas), estipulando um limite 
máximo de tempo para a ocorrência de um certo número de respostas 
ou exigindo IRTs muito curtos 
• DRL (Differential Reinforcement of Low rates): Reforça o 
comportamento apenas se as respostas forem espaçadas por um 
tempo mínimo exigido. Caso a resposta ocorra antes do prazo, o 
cronômetro é reiniciado. 
• DRO (Differential Reinforcement of Other behavior): Consiste na 
apresentação do estímulo reforçador quando o organismo passa um 
determinado período de tempo sem emitir o comportamento-alvo que 
se deseja reduzir. 
 
PRINCIPAIS TÓPICOS 
1. Esquemas de Reforçamento 
Esquemas de Reforçamento (Visão Geral) 
Explicação científica: São os critérios ou arranjos de contingências que 
definem quais respostas de um organismo serão reforçadas. 
Tradução (Para iniciantes): Pense nisso como a "regra do jogo". É a regra 
que a natureza ou a sociedade estipula para dizer quando o seu 
comportamento vai, de fato, gerar uma consequência positiva ou 
recompensa. 
Exemplo didático: Quando você usa um computador, a regra do sistema 
exige que você clique duas vezes seguidas em um ícone para que o aplicativo 
abra. Se clicar uma vez só, não há recompensa. Os dois cliques são o 
esquema que libera o reforçador "aplicativo aberto". 
2. Esquema de Reforçamento Contínuo (CRF) 
Esquema de Reforçamento Contínuo (Continuous Reinforcement - CRF) 
Explicação científica: Configuração onde toda resposta emitida é 
obrigatoriamente seguida da apresentação de um estímulo reforçador. É o 
esquema mais eficaz para a modelagem e a manutenção inicial de novos 
comportamentos. 
Tradução (Para iniciantes): Toda vez que você faz a ação, você ganha o 
prêmio. É a melhor forma de ensinar um comportamento novo para alguém 
(ou para um animal), pois a pessoa entende rapidamente o que se espera 
dela. 
Exemplo didático: Quando você vira a chave de um carro zero com o tanque 
cheio: todas as vezes que você gira a chave, o motor liga. 
3. Esquema de Reforçamento Intermitente 
Esquema de Reforçamento Intermitente 
Explicação científica: Esquemas que estabelecem que apenas uma parte das 
respostas emitidas será reforçada. São fundamentais para a manutenção do 
comportamento e aumentam consideravelmente a sua resistência à 
extinção. 
Tradução (Para iniciantes): Às vezes você ganha, às vezes não. A vida real 
funciona quase toda assim. O mais incrível é que, por não recebermos a 
recompensa o tempo todo, nós ficamos "viciados" em tentar, fazendo o 
comportamento durar muito mais tempo. 
Exemplo didático: Quando você liga para a sua operadora de celular para 
resolver um problema. Nem sempre que você liga o problema é resolvido, 
mas por ter sido reforçado ocasionalmente no passado, você continua 
tentando. 
4. Esquemade Razão Fixa (FR) 
Esquema de Razão Fixa (Fixed Ratio - FR) 
Explicação científica: O requisito para a liberação da consequência 
reforçadora é a emissão de um número específico e constante de respostas. 
Produz um padrão comportamental de curtas pausas pós-reforçamento 
seguidas de uma alta taxa de respostas. 
Tradução (Para iniciantes): É o pagamento por produtividade estrita. Você 
precisa fazer a ação um número "x" de vezes para ganhar. Isso faz com que 
você aja muito rápido, mas dê uma "respirada" (pausa) logo após conseguir 
o prêmio, antes de recomeçar. 
Exemplo didático: Uma fábrica de sapatos onde o artesão ganha R$ 10,00 a 
cada 5 pares produzidos (FR 5). Ele trabalha rápido para fechar o lote de 5, 
descansa brevemente ao receber o dinheiro, e volta ao trabalho. 
5. Esquema de Razão Variável (VR) 
Esquema de Razão Variável (Variable Ratio - VR) 
Explicação científica: O número de respostas necessárias para a 
apresentação do estímulo reforçador modifica-se a cada nova apresentação, 
operando em torno de uma média. Gera as mais altas taxas de respostas, 
com ausência ou irregularidade de pausas pós-reforçamento. 
Tradução (Para iniciantes): É o fator "surpresa". Você sabe que a 
recompensa virá pelo seu esforço, mas não sabe de quantas tentativas vai 
precisar. Como pode ser na próxima tentativa, você não para de tentar e não 
faz pausas. 
Exemplo didático: Uma máquina caça-níqueis. A pessoa puxa a alavanca 117 
vezes e ganha. Depois, puxa 62 vezes e ganha novamente. Ou um garoto que 
telefona para a ex-namorada: ela atende após 5 ligações num dia, após 12 
no outro... Ele continua ligando loucamente. 
6. Esquema de Intervalo Fixo (FI) 
Esquema de Intervalo Fixo (Fixed Interval - FI) 
Explicação científica: A primeira resposta emitida após a passagem de um 
período específico e invariável de tempo é reforçada. Produz baixas taxas de 
respostas, com longas pausas pós-reforçamento e um aumento 
positivamente acelerado na taxa de respostas (chamado de scallop) à 
medida que o momento do reforçamento se aproxima. 
Tradução (Para iniciantes): O prêmio só fica liberado depois que o relógio 
marcar um tempo exato. Tentar antes do tempo é inútil. Por isso, a pessoa 
"enrola" bastante logo depois que ganha e só começa a agir depressa 
quando o prazo está acabando. 
Exemplo didático: Um adolescente que sabe que os pais só dão 
mesada/dinheiro a cada 5 dias (FI 5 dias). Pedir dinheiro no 2º dia não 
adianta. A frequência de pedidos vai aumentar muito (scallop) quando 
chegar o 4º ou 5º dia. 
7. Esquema de Intervalo Variável (VI) 
Esquema de Intervalo Variável (Variable Interval - VI) 
Explicação científica: Semelhante ao intervalo fixo, mas os intervalos de 
tempo exigidos entre os reforçamentos são irregulares e operam através de 
uma média. O padrão gerado é de taxas moderadas e constantes de 
respostas, sem pausas pós-reforçamento. 
Tradução (Para iniciantes): O tempo até o prêmio ser liberado fica mudando, 
não dá para prever. Como você não sabe que horas a oportunidade vai se 
abrir, você mantém um ritmo de checagem ou de esforço calmo e constante, 
sem pausas e sem desespero. 
Exemplo didático: Ficar atualizando sua caixa de e-mails para ver se 
chegaram mensagens novas. Você não sabe a que horas alguém vai te 
escrever, então checa constantemente num ritmo moderado. 
8. Resistência à Extinção 
Resistência à Extinção 
Explicação científica: O número de respostas emitidas ou o tempo decorrido 
sem reforçamento até que a frequência do comportamento diminua e 
retorne ao seu nível operante original. Esquemas variáveis produzem 
comportamentos muito mais resistentes à extinção. 
Tradução (Para iniciantes): É o grau de "teimosia" de um comportamento. 
Representa o quanto você insiste em fazer algo que parou de dar certo. Se 
no passado a coisa funcionava só de vez em quando (intermitente), você 
demora muito mais para desistir. 
Exemplo didático: Um controle remoto com mau contato que antes 
funcionava só se apertado várias vezes. Quando a pilha acaba de vez, a 
pessoa aperta o botão dezenas de vezes antes de desistir, devido à alta 
resistência. 
9. Contenção Limitada 
Contenção Limitada (Limited Hold - LH) 
Explicação científica: Trata-se do tempo máximo e limitado no qual um 
estímulo reforçador, liberado por um esquema de reforçamento 
intermitente, permanecerá disponível para o organismo caso a resposta seja 
emitida. 
Tradução (Para iniciantes): Uma "janela de oportunidade". A regra diz que a 
recompensa chegou, mas ela vem com um cronômetro. Se você não pegar 
logo, ela some. 
Exemplo didático: Seu programa de TV favorito, que só passa uma vez por 
semana (FI 1 semana). Se ele dura apenas 30 minutos, esses 30 minutos são 
a contenção limitada (LH 30 min). Se você ligar a TV fora dessa "janela", 
perdeu a chance. 
10. Esquemas Não Contingentes (FT e VT) 
Esquemas de Reforçamento Não Contingente (Tempo Fixo - FT e Tempo 
Variável - VT) 
Explicação científica: Esquemas onde o estímulo reforçador é apresentado 
independentemente da ocorrência de qualquer resposta específica. Podem 
ser administrados em intervalos de tempo regulares (FT) ou irregulares (VT). 
Tradução (Para iniciantes): "Cair do céu". Você ganha a recompensa 
simplesmente porque o tempo passou. Você não precisa fazer 
absolutamente nada para recebê-la. 
Exemplo didático: Se um adolescente ganha a mesada todo sábado apenas 
por existir, não importando como ele se comportou na semana, isso é um 
esquema de Tempo Fixo (FT 1 semana). 
11. Comportamento Supersticioso 
Nome do tópico: Comportamento Supersticioso e Reforçamento Acidental 
Explicação científica: Fortalecimento de um comportamento que ocorre 
devido apenas à sua contiguidade temporal (proximidade no tempo) com a 
apresentação do reforçador, em esquemas não contingentes, onde não 
existe relação real de contingência (produção). 
Tradução (Para iniciantes): É o "falso positivo" do nosso cérebro. Você faz 
uma ação qualquer, e por coincidência, algo muito bom acontece logo em 
seguida. Seu cérebro acha que você causou aquilo, criando uma superstição. 
Exemplo didático: Você veste sua "cueca da sorte" e seu time ganha. Ou 
você está torcendo forte, e o seu time, lá longe no campo, faz um gol bem 
na hora do seu grito. A proximidade de eventos enganou o cérebro. 
12. Esquemas Reguladores de Taxa: DRH e DRL 
Reforçamento Diferencial de Altas Taxas (DRH) e Baixas Taxas (DRL) 
Explicação científica: São esquemas que selecionam (reforçam) Intervalos 
Entre Respostas (IRTs) específicos. O DRH estipula um limite máximo de 
tempo para a ocorrência de um número de respostas (IRT curto), reforçando 
o responder rápido. O DRL estipula um espaçamento mínimo de tempo entre 
as respostas (IRT longo), zerando o cronômetro caso ocorram 
antecipadamente. 
Tradução (Para iniciantes): O DRH é como uma bomba-relógio onde você 
tem que fazer tudo muito rápido, bater a meta contra o tempo. O DRL treina 
a sua paciência: se você se afobar e agir antes do tempo mínimo exigido, 
você perde a tentativa e começa a esperar do zero. 
Exemplo didático: 
• DRH: Fazer prova de concurso de digitação, exigindo alta velocidade 
para passar. 
• DRL: Ensinar uma criança autista a não se engasgar, só permitindo 
(reforçando) que ela leve outra colher de comida à boca se esperar no 
mínimo um minuto da colherada anterior. 
13. DRO e DRA (Redução de comportamentos problemáticos) 
Reforçamento Diferencial de Outro Comportamento (DRO) e de 
Comportamento Alternativo (DRA) 
Explicação científica: No DRO, o reforço é contingente ao organismo não 
emitir um comportamento-alvo durante um período. No DRA, o reforço é 
contingente à emissão de comportamentos de classes diferentes do alvo 
(respostas alternativas). São preferíveis à punição ou extinção pura para 
diminuir comportamentos problemáticos. 
Tradução (Para iniciantes): Ao invés de brigar com a pessoa por fazer a coisaerrada, você a recompensa. O DRO recompensa "ficar X tempo sem fazer o 
erro". O DRA recompensa a pessoa por "fazer uma coisa legal/adequada no 
lugar do erro". 
Exemplo didático: 
• DRO: Uma criança tem crise de agressão a cada 5 minutos. Você passa 
a recompensá-la cada vez que ela fica consistentes 5 minutos sem bater 
em ninguém. 
• DRA: Você quer que o rato pare de bater na barra, então toda vez que 
ele fareja ou coça o focinho (outro comportamento), você lhe dá água. 
14. Esquemas Compostos: Múltiplos e Mistos 
Esquemas Compostos - Múltiplos e Mistos 
Explicação científica: A alternância sucessiva de mais de um esquema 
simples de reforçamento em vigor. No esquema Múltiplo, cada componente 
é sinalizado por um estímulo discriminativo diferente antecedente. No 
esquema Misto, não há estímulos sinalizadores, devendo o organismo 
discriminar pela própria contingência. 
Tradução (Para iniciantes): A vida é cheia de regras misturadas. No Múltiplo, 
há placas claras dizendo qual "fase" você está ("com o pai a regra é X, com a 
mãe a regra é Y"). No Misto, o jogo muda sem avisar, e você tem que 
perceber a nova regra prestando atenção aos resultados. 
Exemplo didático: Múltiplo: A criança pede doces para a mãe (que quase 
nunca dá - sinal A - esquema VI) e para o pai que só vê nos finais de semana 
(que dá sempre - sinal B - CRF). As figuras dos pais funcionam como os 
estímulos que sinalizam a regra atual. 
15. Esquemas Encadeados e Tandem 
Esquemas Compostos - Encadeados e Tandem 
Explicação científica: Esquemas que ocorrem em uma ordem rígida (cadeias 
de respostas). O término das exigências de um elo é reforçado por produzir 
as condições (o início) do próximo elo. No esquema Encadeado há presença 
de estímulos discriminativos para cada elo; no Tandem, eles não são 
sinalizados. 
Tradução (Para iniciantes): Pense numa linha de produção ou fases de 
videogame. Você não ganha o troféu final ao acabar a fase 1; você ganha o 
direito de entrar na fase 2. O esquema Encadeado avisa claramente que você 
passou de fase. O Tandem não dá nenhum sinal visual/sonoro. 
Exemplo didático: Um rato bate na barra direita 10 vezes (FR 10). Ao fazer 
isso, uma luz se acende (sinal / próximo elo). A partir daí, se ele esperar 20 
segundos (FI 20") e bater na barra esquerda, ganha água. Um passo leva ao 
outro obrigatoriamente. 
16. Escolha e a Lei da Igualação (Esquemas Concorrentes) 
Esquemas Concorrentes e a Lei da Igualação 
Explicação científica: Em esquemas concorrentes, duas ou mais 
contingências operam simultaneamente. Herrstein (1961) postulou a Lei da 
Igualação, indicando que, na escolha em esquemas concorrentes temporais 
(VI, FI), a distribuição da frequência e do tempo de respostas entre 
alternativas tenderá a se igualar, em proporção, à distribuição dos estímulos 
reforçadores (ou magnitudes e atrasos) obtidos nelas. 
Tradução (Para iniciantes): Quando você tem várias coisas que pode fazer 
ao mesmo tempo para se dar bem, a ciência mostra que o nosso esforço é 
calculista: a energia e o tempo que dedicamos a cada opção serão 
matematicamente proporcionais ao tamanho da recompensa de cada uma. 
Exemplo didático: Jogadores de basquete que avaliam na hora da partida se 
arremessam de 2 ou 3 pontos. Os atletas mais eficientes dividem (igualam) 
seus tipos de arremesso na exata proporção dos pontos (retorno) que 
costumam obter em cada situação. 
17. Autocontrole e Impulsividade (Concorrentes Encadeados) 
Esquemas Concorrentes Encadeados: Autocontrole e Impulsividade 
Explicação científica: Para Rachlin e Green (1972), autocontrole não é 
"determinação interna", mas sim a emissão mais frequente de respostas 
escolhidas sob alternativas de reforçamento cujas consequências são de 
maior magnitude, ainda que atrasadas, em detrimento de escolhas de 
menor magnitude e imediatas (impulsividade). Usa-se frequentemente uma 
"resposta de compromisso" prévia para evitar o contato iminente com a 
alternativa impulsiva. 
Tradução (Para iniciantes): Ser autocontrolado na visão comportamental 
não é ter "força de vontade mágica". É saber modificar o ambiente para que 
as recompensas maiores, porém distantes, vençam as tentações fraquinhas 
que estão bem na sua cara no momento. Assumir um compromisso 
antecipado tranca você no bom caminho. 
Exemplo didático: Se o salário cai na conta corrente disponível, você pode 
acabar comprando roupas impulsivamente no shopping e ficar sem dinheiro 
(recompensa imediata de menor magnitude). Ao escolher programar um 
depósito automático numa previdência privada (compromisso), você "trava" 
o dinheiro, impedindo-se de gastar hoje para usufruir de uma velhice 
confortável no futuro (recompensa atrasada de grande magnitude).

Mais conteúdos dessa disciplina