Buscar

Resumo Esquemas de Reforçamento

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Esquemas de Reforçamento 
Analise Experimental do Comportamento 
Esquemas de Reforçamento Contínuo e Intermitente 
No Esquema de Reforçamento Contínuo (CRF – “continuous reinforcement”) toda resposta é 
seguida do estímulo reforçador, ele facilita a aquisição do comportamento, entretanto ele é menos 
resistente à extinção. No Reforçamento Intermitente, algumas respostas são reforçadas e outras não. 
Os Principais Esquemas de Reforçamento Intermitente 
Há quatro tipos principais de esquemas de reforçamento intermitente: 
 Esquemas de Reforçamento Intermitente de Razão: assim como na razão fixa, como na razão 
variável, o requisito para a liberação de respostas reforçadoras é o número de respostas emitidas. 
Na Razão Fixa (FR), é exigido um número de respostas fixas para que haja liberação da resposta 
reforçadora [FR5, por exemplo, significa que a cada 5 respostas fixas emitidas pelo organismo, 
ele é reforçado]. Este esquema produz uma tendência a trabalhar rápido. Na Razão Variável (VR), 
o número exigido de respostas emitidas pelo organismo se modifica a cada nova apresentação 
[VR 30, por exemplo, significa que, em média, a cada 30 respostas, uma é reforçada]. Na VR 
calcula-se a média. Na Razão Fixa, há pausas, não Razão Variável não há pausas.
 
 Esquemas de Reforçamento Intermitente de Intervalo: basta que o organismo emita a resposta 
para que ela seja reforçada dentro de um intervalo. Portanto, o tempo decorrido desde a 
apresentação do estímulo reforçador é o principal critério para que uma determinada resposta 
seja reforçada. No Intervalo Fixo (FI), a primeira resposta emitida após um intervalo fixo é 
reforçada, assim, além da passagem do tempo como critério para o reforço, é necessário também 
que haja uma resposta. Já no Intervalo Variável (VI), os intervalos entre a apresentação do 
estímulo reforçador e a apresentação novamente são variáveis.
 
Padrões Comportamentais Gerados Por Esquemas de Reforçamento Intermitente 
 Cada um desses quatro esquemas produzem um padrão comportamental em estado estável. Nos 
experimentos com esquemas de reforçamento, existem dois tipos de dados principais: 
 Dados de Transição – são aqueles observados quando o comportamento do organismo acabou de 
ser submetido a um novo esquema de reforçamento. Nesse caso, o padrão comportamental terá 
características da contingência de reforçamento anterior e da nova contingência. Portanto, diz-
se que o comportamento ainda não está adaptado ao novo esquema de reforçamento. Esses 
dados são úteis para estudar os efeitos de história de reforçamento. 
 Dados em Estado Estável – são aqueles observados quando há pouca diferença entre os padrões 
comportamentais das sessões experimentais nas quais o mesmo esquema de reforçamento é 
utilizado. Os padrões comportamentais apresentados a seguir são observados em estados estáveis: 
 Razão Fixa (FR): o padrão comportamental produzido por este esquema de reforçamento é 
caracterizado por pequenas pausas pós-reforçamento e alta taxa de respostas. A pausa pós-
reforçamento é o tempo entre a apresentação do estímulo reforçador e o reinício do 
responder. A taxa de respostas é uma medida do comportamento operante que calcula-se 
dividindo o número de respostas ocorridas pelo intervalo de tempo na qual ocorreram. 
 Razão Variável (VR): o padrão comportamental produzido por este esquema de reforçamento 
é caracterizado por altas taxas de respostas e pausas pós-reforçamento praticamente 
ausentes e/ou irregulares. 
 Intervalo Fixo (FI): o padrão comportamental produzido por este esquema de reforçamento 
é caracterizado por baixas taxas de respostas e por longas pausas pós-reforçamento. Após a 
pausa, a taxa de resposta aumenta (scallop) rapidamente e, então, se mantém estável até a 
apresentação do estímulo reforçador. Nota-se, então, que o FI é o esquema que produz as 
menores taxas de respostas. 
 Intervalo Variável (VI): o padrão comportamental produzido por este esquema é caracterizado 
por taxas moderadas de respostas e pela ausência de pausas pós-reforçamento. 
Comparação Entre Esquemas de Reforçamento Intermitente e Contínuo 
 Os Esquemas de Reforçamento Contínuo (CRFs) e Intermitente diferem quanto as condições 
para o reforçamento e também sobre os efeitos no comportamento mantido por eles. 
 Modelagem e Manutenção de um Novo Comportamento: o CRF é mais eficiente para modelar 
comportamentos do que os esquemas intermitentes. Quando é necessário que o comportamento 
passe a ser mantido por FRs, a transição é feita gradualmente, assim, os FRs intermediário 
evitam que o comportamento entre em extinção até a apresentação do estímulo reforçador. 
 Resistência à Extinção: o esquemas de reforçamento intermitente, especialmente os variáveis, 
são ideais para a manutenção do comportamento, ou seja, para aumentar sua resistência à 
extinção. 
Contenção Limitada (Limited Hold - LH) 
Quando o estímulo reforçador tem disponibilidade limitada. 
Esquemas não Contingentes e o Comportamento Supersticioso 
 Esquemas de intervalo (fixo e variável) e de razão (fixo e variável) são esquemas de reforçamento 
contingente. Isto é, o estímulo reforçador depende da ocorrência de resposta para ser apresentado. Em 
esquemas de reforçamento não contingentes, o estímulo reforçador é apresentado independentemente 
da ocorrência da resposta. 
 Nos esquemas de reforço não contingentes, denominamos o estímulo reforçador de potenciais, 
isso porque, são reforçadores potenciais, na medida em que, se fossem transformados em contingentes 
a uma resposta qualquer, provavelmente aumentaria sua ocorrência. 
 Os dois principais esquemas de reforçamento não contingentes, são: 
 Tempo Fixo (FT – Fixed Time): a apresentação do estímulo reforçador, se dá em um tempo fixo, 
mesmo que nenhuma resposta seja emitida. 
 Tempo Variável (VT – Variable Time): a apresentação do estímulo reforçador, se dá em intervalos 
irregulares de tempo, independente da ocorrência de respostas. 
O comportamento supersticioso são exemplos cotidianos de esquemas intermitentes não 
contingentes de FT e VT, pois, embora não seja necessária a ocorrência de uma resposta em esquemas 
não contingentes, o reforçador é ocasionalmente apresentado próximo a ocorrência de alguma resposta 
– é o que denomina-se contiguidade. A contiguidade entre uma resposta e um estímulo reforçador pode 
ser suficiente para fortalecer um determinado comportamento – é o que denomina-se reforçamento 
acidental. 
Esquemas Reguladores da Velocidade do Responder (Taxa de Respostas) 
Nestes esquemas são reforçados os intervalos entre respostas (IRT – interresponse time). 
 Reforçamento Diferencial de Altas Taxas de Respostas (DRH – Differential Reiforcement of 
High Rates): é um esquema que reforça apenas um responder rápido, ou seja, somente taxas 
altas de respostas. Um número de respostas deve ocorrer dentro de um tempo predeterminado 
para que o reforço seja apresentado. 
 Reforçamento Diferencial de Baixas Taxas de Respostas (DRL – Differential Reinforcemente of 
Low Rates): as respostas são reforçadas apenas após um mínimo de tempo, ou seja, o estímulo 
reforçador é apresentado apenas se houver um tempo mínimo entre uma resposta e outra. 
Reforçamento Diferencial de Outro Comportamento (DRO – Differential Reinforcement of Other 
Behavior) 
É uma alternativa comportamental para reduzir a frequência de um comportamento sem a 
utilização de punição ou de extinção somente. O DRO consiste em reforçar a não ocorrência de um 
determinado comportamento em um certo período de tempo. 
Reforçamento Diferencial de Comportamentos Alternativos (DRA – Differential Reinforcement 
of Alternative Behaviors) 
É uma variação do DRO que consiste na apresentação do estímulo reforçador quando há 
comportamentos diferentes daquele que se deseja reduzir. 
Esquemas de Reforçamento Compostos 
Esses esquemas tentam replicar, em situação controlada, com maior fidedignidade, as situações 
complexas do nosso cotidiano. São eles: 
 Esquemas Múltiplos:há alternância de mais de um esquema simples de reforçamento. Cada 
um deles permanece em vigor por um período de tempo, por um número de respostas 
ocorridas ou por um número de reforçadores apresentados. Cada um dos esquemas simples 
que o compõem, chamados de componentes do esquema múltiplo, é sinalizado por um 
estímulo discriminativo diferente. Os esquemas múltiplos são utilizados principalmente para 
estudar o controle de estímulos antecedentes sobre o comportamento operante em situações 
que envolvem discriminações sucessivas. 
 Esquemas Mistos: cada esquema componente está em vigor em um momento isoladamente, 
e, em todos os componentes a resposta e o reforço são os mesmos. Não há estímulos 
discriminativos que sinalizam qual esquema está em vigor. O organismo deve discriminar o 
esquema em vigor pelo próprio contato com a contingência do componente do esquema em 
atividade. 
 Esquemas Encadeados: usado para estudar cadeias comportamentais. O ponto crucial nessas 
cadeias é que o reforçador de um comportamento é o estímulo que serve de ocasião para o 
comportamento da contingência seguinte, assim, a ocorrência de um estímulo reforçador 
sinaliza a passagem para o próximo esquema, ou seja, se constitui em um estímulo 
discriminativo. Cada esquema ou cada elo está em vigor em um dado momento e ocorrem 
sempre na mesma ordem. 
 Esquemas Tandem: são os esquemas encadeados realizados sem a utilização de estímulos 
discriminativos associados a cada elo. 
 Esquemas Concorrentes: duas ou mais fontes de reforçamento disponíveis ao mesmo tempo, 
ou seja, dois ou mais esquemas de reforçamento disponíveis simultaneamente. São utilizados 
para investigar o comportamento de escolha, para compreender como os fatores ambientais 
interferem nas escolhas dos organismos. O comportamento de escolha é medido pela 
distribuição do número de respostas em cada uma das alternativas de reforçamento e pela 
distribuição do tempo que o organismo permanece respondendo em uma dessas alternativas 
em relação às demais. 
 Lei da Igualação: prevê que a distribuição de respostas entre duas ou mais alternativas de 
reforços tende a igualar a distribuição de reforçadores das alternativas. 
 Esquemas Concorrentes Encadeados: envolvem a apresentação de duas ou mais alternativas 
de reforçamento que se constituem em cadeia de respostas, assim, as respostas em uma das 
alternativas, quando reforçadas, resultam na entrada no elo seguinte na cadeia de respostas, 
até chegar-se ao reforçamento final. São utilizados para estudar experimentalmente respostas 
de autocontrole e impulsividade. 
Controle de Estímulos 
 Os eventos/estímulos que antecedem o comportamento também influenciam sua probabilidade. 
Há dois tipos de estímulos antecedentes: 
 Estímulo discriminativo (SD): sinaliza que se eu responder, eu vou ter reforço. Logo, essa é uma 
relação de contingência. Assim, o SD aumenta a probabilidade do comportamento operante 
acontecer. É uma tríplice contingência – SD:R – C. 
 Estímulo Delta (SΔ): sinaliza que se eu responder, eu vou ter punição ou extinção. Logo, essa 
também é uma relação de contingência. Assim, o SΔ diminui a probabilidade do comportamento 
operante acontecer. Assim, também é um tríplice contingência - SΔ:R – C. 
 PAY ATTENTION: quando se fala em comportamento inato/respondente, usamos o termo eliciar. 
Para o comportamento operante, usamos o termo evocar, o estímulo evoca a resposta e não 
elicia. 
Treino Discriminativo 
 Aprendemos a discriminar os estímulos durante a nossa vida. Discriminar é responder diferente 
a diferentes situações. 
Generalizar 
 É responder de maneira semelhante a situações diferentes. 
Referências 
Moreira, M.B. & Medeiros, C.A. (2019). Princípios Básicos da Análise do Comportamento. Rio Grande do 
Sul: ARTMED. Cap. 7

Continue navegando