Paulo Henrique Cavalcanti Mendes

Psicologia Educacional

FAFIRE

Pesquisa Matriz ACT

em 16/04/2026

Material

Prévia do material em texto

Pontifícia Universidade Católica de São Paulo - PUC-SP

Paulo Henrique Cavalcanti Mendes

Uma Análise dos Argumentos a Favor e Contra a Distinção entre os Reforçamentos Positivo e
Negativo

Mestrado em Psicologia Experimental: Análise do Comportamento

São Paulo
2025
2

Paulo Henrique Cavalcanti Mendes

Mestrado em Psicologia Experimental: Análise do Comportamento

Uma Análise dos Argumentos A Favor e Contra a Distinção Entre os Reforçamentos Positivo
e Negativo

Dissertação apresentada à Banca Examinadora
da Pontifícia Universidade Católica de São
Paulo, como exigência para obtenção do título
de MESTRE em Psicologia Experimental:
Análise do Comportamento, sob a orientação
do Prof. Dr. Emerson Ferreira da Costa Leite.

São Paulo
2025
3

Banca Examinadora:

Prof. Dr. Emerson Ferreira da Costa Leite

Prof. Dr. Amilcar Rodrigues Fonseca Júnior

Prof. Dr. Denigés Maurel Regis Neto

O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal
de Nível Superior- Brasil (CAPES) – Código de Financiamento 001
Processo n° 88887.805384/2023-00

This study was supported by the Coordenação de Aperfeiçoamento de Pessoal de Nível
Superior – Brasil (CAPES) – Finance Code 001
Process n° 88887.805384/2023-00

Agradecimentos
Em primeiro lugar, agradeço ao Prof. Dr. Emerson Ferreira da Costa Leite, meu
primeiro professor da graduação com quem tive aulas ou orientações durante todos os anos da
minha jornada acadêmica até aqui. Ele foi não só um orientador incrível, mas também uma
pessoa que soube lidar comigo da melhor maneira possível. Emerson, obrigado por ter me
ajudado tanto especialmente nessa reta final, isso nunca será esquecido. Foi muito bom
trabalhar com você.
Obrigado à minha família, aos meus amigos, aos meus professores do PEXP e a cada
funcionário e aluno da PUC-SP que contribuíram direta ou indiretamente para a construção de
um ambiente no qual eu pude me desenvolver tanto como analista do comportamento como
pessoa ao longo desses anos. O carinho que sentirei por essa comunidade será eterno.
Destaco especialmente o Prof. Dr. Amilcar Rodrigues Fonseca Júnior, cuja eletiva e
discussões dentro e fora de sala me inspiraram a estudar o tema desenvolvido nesse trabalho.
Quero agradecer tanto ele como o Prof. Dr. Denigés Meurel Regis Neto e o Prof. Thomas
Endriggo Ramos Vieira pelas inestimáveis contribuições em minha Banca de Qualificação e
por concordarem em participar também da minha Banca de Defesa. Esse trabalho
definitivamente não seria o mesmo sem os comentários de vocês.
Faço também uma humilde menção à Prof. Tuane de Oliveira Lima que chegou na
sala de aula com uma sacola cheia de livros e revistas de análise do comportamento para dar e
que incluíam os volumes originais de 2006 do debate analisado no presente trabalho. Eu
jamais imaginaria poder ter algo assim hoje.
Por fim, agradeço a pessoa mais essencial tanto para o desenvolvimento de diversas
das discussões presentes nesse trabalho quanto para a minha (relativa) estabilidade durante
todo esse processo. Giovana, eu te amo. Nada na minha vida seria tão bom sem ter você do
meu lado.
6

Resumo
Mendes, P. (2025). Uma análise dos argumentos a favor e contra a distinção entre os
reforçamentos positivo e negativo [Dissertação de mestrado, Pontifícia Universidade Católica
de São Paulo]. Biblioteca Digital Brasileira de Teses e Dissertações. https://bdtd.ibict.br

Esta dissertação teve como objetivo sistematizar, analisar e interrelacionar as falas
(argumentos, sugestões e esclarecimentos) do debate publicado na revista The Behavior
Analyst (2005-2006) sobre a distinção entre reforçamento positivo e negativo. Cada fala foi
organizada segundo suas diferentes funções e posteriormente categorizadas e organizadas em
uma planilha que permitiu a análise conjunta dos temas e interlocuções. Os resultados
indicam que a distinção baseada em adição ou subtração de estímulos é conceitualmente
ambígua e frequentemente arbitrária, o que compromete sua utilidade descritiva e didática.
Embora alguns autores apontem vantagens em sua manutenção, essas se mostraram pouco
fundamentadas ou independentes da distinção em si. Além das sugestões conceituais e
pedagógicas, os textos analisados propõem diversas linhas de investigação empírica, como:
estudos sobre a clareza das definições de reforçamento; investigações sobre os parâmetros
comuns entre reforçadores tradicionalmente classificados como positivos ou negativos;
pesquisas sobre as razões culturais e históricas para a manutenção da distinção; e análises do
comportamento de nomear reforços. Também foram discutidas variáveis possivelmente
envolvidas no controle dessa distinção, como abruptidão da mudança, mecanismos
fisiológicos e operações motivadoras. Conclui-se que a distinção poderia ser abandonada sem
prejuízo conceitual, desde que preservadas descrições precisas das condições de estímulo.
Palavras-chave: análise do comportamento; reforçamento positivo; reforçamento
negativo; análise conceitual.

https://bdtd.ibict.br/
7

Abstract
Mendes, P. (2025). An analysis of the arguments for and against the distinction between
positive and negative reinforcement [Master’s thesis, Pontifical Catholic University of São
Paulo]. Brazilian Digital Library of Theses and Dissertations. https://bdtd.ibict.br

This dissertation aimed to systematize, analyze, and interrelate the statements (arguments,
suggestions, and clarifications) from the debate published in The Behavior Analyst (2005-
2006) on the distinction between positive and negative reinforcement. Each statement was
organized according to its function and subsequently categorized and compiled into a
spreadsheet that allowed for the integrated analysis of themes and interactions among authors.
The results indicate that the distinction based on the addition or removal of stimuli is
conceptually ambiguous and often arbitrary, which compromises its descriptive and
pedagogical utility. Although some authors pointed to advantages in maintaining the
distinction, these were either weakly supported or not inherent to the distinction itself. In
addition to conceptual and educational suggestions, the analyzed texts proposed several
avenues for empirical investigation, including: studies on the clarity of reinforcement
definitions; investigations into common parameters across traditionally classified reinforcers;
research on the cultural and historical reasons for the distinction’s persistence; and analyses of
the scientific behavior of labeling reinforcers. Variables potentially involved in the control of
this distinction were also discussed, such as abruptness of environmental change,
physiological mechanisms, and motivating operations. The dissertation concludes that the
distinction could be abandoned without conceptual loss, provided that precise descriptions of
stimulus conditions are maintained.
Keywords: behavior analysis; positive reinforcement; negative reinforcement;
conceptual analysis.
https://bdtd.ibict.br/
8

Sumário

Lista de Figuras.................................................................................................................... 12
Lista de Tabelas ................................................................................................................... 13
Considerações Sobre o Processo de Produção do Presente Trabalho ................................ 14
Estrutura Geral da Introdução .......................................................................................... 15
Definição de Reforçamento .............................................................................................positivo”).
Considera-se assim que as diferenças apontadas até então sejam, individualmente,
minúcias. Entretanto, consideradas em conjunto, apontam para uma tendência em fazer
alterações e acréscimos quase que exclusivamente sobre as definições de reforçador e/ou
reforçamento negativo. Resumidamente, 1) utilizaram um termo diferente (i.e., estímulo
aversivo) no lugar de reforçador negativo (Reese, 1966/1973; Whaley & Mallot, 1971/1981;
Pierce e Epling (1995); Catania, 1992; Cameschi & Abreu-Rodrigues, 2005), 2)
41

acrescentaram como parte da definição que eles também funcionam como punidores (Keller
& Schoenfeld, 1950/1974), 3) destacaram que reduções na intensidade do estímulo podem
configurar reforçamento negativo (Millenson, 1967/1975), 4) incluíram o término da perda de
reforçadores positivos como reforçamento negativo (Whaley & Mallot, 1971/1981) e, por fim,
5) afirmaram que a prevenção de um estímulo aversivo constitui reforçamento negativo
(Catania, 1992).
Sobre cada uma das alterações/acréscimos feitas sobre os reforçadores negativos,
comenta-se: 1) o termo “estímulo apetitivo” nunca foi usado nas definições analisadas de
reforçamento positivo como um paralelo para estímulo aversivo; 2) não houve menção direta
ao fato de que a remoção de reforçadores positivos pode funcionar como punição; 3) não
incluíram, nas definições, que aumentos na intensidade de um estímulo reforçador positivo
contingentemente a uma resposta poderiam aumentar sua frequência (e.g. aumentar o brilho
de um vídeo ou volume de uma música); 4) não incluíram uma versão oposta disso que
pudesse ser chamada de reforçamento positivo; e 5) é baseado em aspectos específicos dos
experimentos realizados com reforçadores negativos e não do reforçador em si.
A presente síntese das definições mostra que a área apresenta inconsistências: 1) entre
as definições de reforçadores positivos e negativos apresentadas por um mesmo autor e 2)
entre as definições apresentadas por cada autor. Foi possível observar como algumas escolhas
específicas, tal como a própria variedade dos termos usados, pode acabar sendo prejudicial
para o entendimento de um conceito por parte de um novo leitor.
Levando em conta o objetivo de Santos e Leite (2013) de “avaliar como os conceitos
de reforçamento positivo e reforçamento negativo são abordados em livros de ensino de
análise do comportamento” (p. 9), parece ter havido limitações no procedimento usado pelos
autores. Isso porque somente alguns trechos em que a distinção positivo/negativo fora
claramente abordada (ou trechos muito próximos) foram considerados em sua análise (como
42

no caso de Whaley & Mallot, 1971/1981). Isso pode ser um problema, especialmente no que
diz respeito a livros didáticos, porque informações úteis para uma análise dessa natureza
podem ter sido apresentadas ao longo da construção didática do texto – e não somente num
trecho específico sobre a distinção. Além disso, os autores parecem ter se limitado a citações a
Michael (1975) para investigar se os autores teriam abordado problemas relacionados à
distinção positivo/negativo ou não. Isso talvez tenha impedido que falas que não citavam
Michael, mas destacavam problemas na distinção fossem incluídas, como por exemplo:
Algumas vezes é difícil dizer qual é o controle, reforçamento positivo ou negativo ou
ambos. Suponha que deixemos nosso rato de laboratório produzir alimento e apagar
uma luz brilhante quando ele apertar o botão. Se quisermos então descobrir o que é
responsável por sua atividade de apertar o botão, a produção de alimento ou a fuga da
luz brilhante, simplesmente poderemos remover essas consequências, uma de cada
vez, e ver se o animal continua a apertar o botão. As condições restritas de laboratório
permitem uma resposta direta para nossa questão. Descobrir se reforçamento positivo
ou negativo exerce controle fora do laboratório provavelmente não se mostrará tão
simples assim, mesmo que decisões importantes possam depender da resposta
(Sidman, 1989/2009, p. 57).
Sidman (1989/2009) menciona como situações em que a distinção pode ser difícil de
fazer poderiam ser resolvidas em laboratório, mas reconhece que isso talvez não seja simples
de se aplicar fora dele. Considerando esse trecho, é possível até que Sidman pudesse ter sido
incluído no grupo dos autores que abordaram a dificuldade na distinção, mas que também
manteve a definição tradicional.
Ao fim de seu artigo, Santos e Leite (2013) sugerem que novos estudos poderiam
investigar a influência das críticas de Michael (1975) em artigos. Possmoser (2015)
sistematizou os artigos (até 2014) que referenciavam Michael (1975) para avaliar sua
43

influência na área. A autora concluiu que, por mais de 30 anos, pesquisas que discutiram a
distinção entre reforçamento positivo e negativo foram escassas, até que Baron e Galizio
(2005) publicassem o artigo intitulado: “Reforçamento positivo e negativo: a distinção deve
ser preservada?”. Isso teria feito aumentar subitamente o número de publicações
referenciando Michael (1975) nos anos seguintes.
Em seu artigo, publicado na revista The Behavior Analyst, Baron e Galizio (2005) se
propuseram a rever as críticas e propostas de Michael (1975) considerando 30 anos de novas
pesquisas. Talvez o impacto mais notável de sua publicação tenha sido as oito réplicas que
recebeu nas sessões “In response” das duas edições seguintes da mesma revista em 2006
(Chase, 2006; Michael, 2006; Iwata 2006; Marr, 2006; Lattal & Lattal, 2006; Sidman, 2006;
Nakajima, 2006; Staats, 2006) – e suas subsequentes tréplicas (Baron e Galizio, 2006a,
2006b).
Possmoser (2015), na segunda parte de seu trabalho, fez uma síntese dos textos
mencionados com foco em apresentar e resumir detalhadamente os principais pontos de cada
artigo. Recomenda-se esta leitura para aqueles que se virem interessados em se apropriar mais
do debate3 em português.
Embora a distinção entre reforçamento positivo e negativo seja amplamente utilizada,
como os trabalhos apresentados até então e o próprio debate de 2005/2006 ilustram, sua
utilidade conceitual e consistência descritiva têm sido questionadas há décadas. Há artigos tão
recentes quanto 2024 que citam os problemas com a distinção (e.g., Fonseca-Júnior, 2024).
Pesquisas teóricas que abordam conceitos básicos como o próprio reforçamento são
importantes na medida em que contribuem para esclarecer os limites e implicações
_________________
3 Nos casos em que for utilizado o termo “debate” sem nenhuma outra especificação, deve-se
entender que o termo se refere ao debate de 2005/2006 publicado na revista The Behavior
Analyst;
44

conceituais da distinção, favorecendo uma definição mais precisa e funcional dos conceitos
envolvidos. O trabalho de Possmoser (2015) foi uma contribuição à discussão e compreensão
do debate acerca da manutenção ou abandono da distinção entre os reforçamentos positivo e
negativo. Ainda assim, a literatura carece de uma sistematização e análise dos argumentos
apresentados neste debate, interrelacionando-os e discutindo suas implicações para o avanço
dessa importante questão conceitual na análise do comportamento.
Foi objetivo da presente pesquisa sistematizar, analisar e interrelacionar as falas
(argumentos, sugestões e esclarecimentos) apresentadas por Baron & Galizio (2005) e todos
os autores que participaram das edições especiais da revista The Behavior Analyst de 2006
dedicada ao debate sobre a distinção entre reforçamento positivo e negativo.

Método
Seleção dos Textos
Através dos dados da pesquisa de Possmoser (2015), conjuntamente com os dados de
Mendes e Ceneviva (não publicado), identificou-se que maior concentração de textos que
citavam Michael (1975) e discutiam ativamente a manutenção ou abandono da distinção entre
reforçamento positivo e negativo correspondeao debate de 2005/2006 na revista The
Behavior Analyst. A publicação original de Baron e Galizio (2005) retomou a discussão
abordada por Michael (1975) e gerou outras 10 publicações no ano seguinte na seção “In
response” das edições de 2006 da revista.
Esse conjunto de 11 textos foi selecionado para este trabalho, por constituir um grupo
suficientemente amplo, mas, ao mesmo tempo, representar um recorte específico diante do
qual pode ser feita uma análise interrelacional dos argumentos, suas réplicas e suas tréplicas.
O texto de Michael (1975) não foi incluído na amostra de falas porque 1) esse texto
não fez parte do debate e não poderia ser interrelacionado da mesma maneira com as
respostas; 2) segundo o próprio autor (Michael, 2006), “Baron e Galizio (2005) apresentaram
uma versão precisa e muito clara dos meus argumentos” (p. 117); 3) o autor já foi incluído no
debate e pode fazer os acréscimos fundamentais se necessário; e 4) porque a amostra
provavelmente ficaria repetitiva.
Procedimento de Grifo dos Textos
Cada texto selecionado foi separado por “falas” de acordo com a função geral de cada
parte do texto. A determinação do início e final de cada “fala” foi guiado preferencialmente
pela divisão das seções ou então pela paragrafação delimitada pelo próprio autor. Entretanto,
quando uma mesma seção ou parágrafo continha trechos com funções nitidamente distintas,
esses trechos eram grifados separadamente.
46

A cada tipo de função foi atribuída uma categoria específica com uma cor de grifo
correspondente. As categorias foram criadas de forma a incluir qualquer tipo de fala
encontrada, dessa forma, ao final do procedimento de grifo, todos os textos ficaram
inteiramente grifados. Na Tabela 1 são apresentadas cada uma das categorias seguidas de suas
respectivas definições:

Tabela 1
Categorias de análise utilizadas no grifo dos textos

Categoria Definição

Vantagem da Manutenção
O autor apontou uma vantagem relacionada ao uso da
distinção entre os reforçamentos positivo e negativo.
Vantagem do Abandono
O autor apontou uma vantagem relacionada ao abandono
da distinção entre os reforçamentos positivo e negativo.
Problema da Manutenção
O autor apontou um problema relacionado ao uso da
distinção entre os reforçamentos positivo e negativo.
Sugestão para Manutenção
O autor apontou para a resolução de uma lacuna ou
problema relacionado a manutenção da distinção entre os
reforçamentos positivo e negativo.
Sugestão para Abandono
O autor apontou para a resolução de uma lacuna ou
problema relacionado ao abandono da distinção entre os
reforçamentos positivo e negativo.
Sugestão Neutra
O autor apontou para a resolução de uma lacuna ou
problema não especificamente relacionada com a
manutenção ou abandono da distinção entre os
reforçamentos positivo e negativo.
Explicação para
Manutenção
O autor apontou uma possível explicação para a
manutenção do uso da distinção entre os reforçamentos
positivo e negativo.
Explicação para Abandono
O autor apontou uma possível explicação para a adoção
do uso da distinção entre os reforçamentos positivo e
negativo.
47

Complemento
O autor trouxe novos dados que complementam um ponto
atribuído a outro autor citado.
Contra-argumento
O autor respondeu uma fala específica de outro autor
disputando o ponto por ele apresentado.
Concordância
O autor respondeu uma fala específica de outro autor
concordando com o ponto por ele apresentado, mas sem
trazer novos dados.
Esclarecimento
Baron e Galizio responderam a um aparente mal-
entendido (geral ou pontual) presente em seu texto
original. Só se aplica aos textos de resposta de Baron e
Galizio.
Outro
O autor disse algo que não tem função argumentativa,
sugestiva ou explicativa com relação a manutenção ou
abandono da distinção entre os reforçamentos positivo e
negativo. Correspondem a qualquer outro tipo de fala que
não seja contemplada pelas categorias anteriores. Essa
categoria não será tabelada.
Nota. As categorias Complemento, Contra-argumento, Concordância e Outro não estarão
presentes enquanto categorias nos Resultados.

Quando duas falas seguidas distintas faziam parte de uma mesma categoria, e,
portanto, foram grifadas com uma a mesma cor, uma linha era inserida entre elas de forma a
separá-las.
Procedimento de Tabulação dos Dados
A cada texto lido e grifado, cada fala e sua categoria (com exceção da categoria
“Outro”) atribuída foram inseridos em uma planilha no programa Microsoft Excel (recorte
ilustrativo no Apêndice). Para facilitar a visualização e compreensão de cada item da tabela,
os trechos não foram incluídos integralmente, apenas uma descrição sintetizada de cada um.
Na planilha do Excel, cada linha (ou conjunto de linhas mescladas) correspondeu a
uma fala, ordenada, a princípio, por ordem de publicação. Cada coluna correspondeu a uma
classificação ou dado correspondente àquela fala. A seguir, serão apresentadas cada uma das
colunas de classificação de falas e suas respectivas funções:
48

A. Texto: indica a referência (último nome do autor e ano de publicação) ao qual cada
conjunto de trechos pertence (e.g., “Michael (2006)”).
B. Localização: página do texto em que se encontra a fala.
C. Fala: descrição sintética de cada fala grifada no texto.
D. Dado: descrição sintética das informações que basearam sua fala.
E. Tipo de fala: classificação de cada fala dentro categorias delimitadas no
“Procedimento de Grifo dos Textos” (ver Tabela 1).
F. Ponto central: uma reformulação da síntese que leva em conta o conjunto de
argumentos já coletados, para que, em casos de argumentos semelhantes (ou
simetricamente opostos), sua descrição possa ser feita de forma mais “paralela”.
Isso tem o objetivo de favorecer a comparação e interrelação entre argumentos de
mesmo tema. Como exemplo, no caso de um autor que afirmou que a distinção
positivo/negativo “aumenta a probabilidade de um aluno compreender o conceito”,
um segundo autor que afirmou que “abandonar a distinção facilita a
compreensão”, e um terceiro afirmou que a distinção “atrapalha no aprendizado de
novos alunos”; os argumentos seriam sintetizados, respectivamente, como:
“Facilita a aprendizagem” (categoria Vantagem da Distinção), o segundo como
“Facilita a aprendizagem” (categoria Vantagem do Abandono) e o terceiro como
“Dificulta a aprendizagem” (categoria Problema da Distinção).
G. Ponto específico: título descritivo que diferencia cada fala específica em relação ao
ponto central ao qual ela foi agrupada. Dentro do central “Faltam Investigações”
um ponto específico seria “Sobre o Conceito de Reforçamento”
H. Resposta a: autores e números das linhas referentes às falas que estão sendo
respondidas pela presente fala.
49

I. Respondido por: autores e números das específica referentes às falas que
responderam a presente fala.
J. Observações: anotações pessoais a respeito de cada uma das falas, feitas tanto para
facilitar o preenchimento da tabela quanto para auxiliar na construção dos
resultados e desenvolvimento da discussão.

Resultados e Discussão
Nesta seção serão apresentados os dados de cada uma das categorias de “Tipo de Fala”
que foram grifadas e passadas para a tabela de Análise das Falas. Dentro de cada categoria, as
falas foram agrupadas com respeito aos seus “Pontos Centrais”. Além disso, falas
categorizadas como “Concordância”, “Complemento” e “Contra-argumento” foram
apresentadas após cada fala a qual estavam relacionadas.
Discussões muito pontuais, sobre falas específicas que fariam pouco sentido de serem
retomadas na discussão geral, foram feitas logo após a fala a que se dirigem. Quando uma
discussão estava relacionada a muitas falas, ela foi feita após a apresentação dos resultados
dentro dos subtópicos delimitados para sua discussão.
Muitas das falasanalisadas consistem apenas de afirmações (genéricas ou específicas)
sem um desenvolvimento aprofundado ou informações nas quais o autor se baseou para fazer
sua fala. Em alguns dos casos pode ser que as bases para tal afirmação foram discutidas em
outro tópico que já foi ou vai ser apresentado e que está em outra categoria. Um exemplo é “a
distinção pode ser útil”. Em casos como esse, não houve grande desenvolvimento do
subtópico a não ser a indicação do autor que fez a fala e um resumo, quando aplicável, dos
pontos contidos em outros argumentos que eram relevantes para essa afirmação.
As categorias que envolvem “Vantagens” e “Explicações” são semelhantes, mas
diferem quanto à forma em que o autor apresentou sua fala. A primeira categoria inclui
afirmações mais categóricas das vantagens (e.g., “a distinção é útil para tal”), enquanto a
segunda é estruturada de forma a explicar o porquê de o uso da distinção4 se manter (e.g., “a
_________________
4 Em casos em que for utilizado o termo “distinção” sem nenhuma outra especificação, deve-se
entender que o termo se refere à distinção entre os reforçamentos positivo e negativo;
51

distinção foi mantida por conta de...”) – frequentemente com esse objetivo declarado. Muitas
das subcategorias de uma classificação foram compartilhadas pela outra.
A Figura 1, a seguir, apresenta a organização hierárquica e interrelação ente os
subtópicos apresentados em Resultados e Discussão. Como é possível observar, serão
apresentados e discutidos inicialmente os problemas, vantagens, explicações e sugestões
relacionados à manutenção da distinção entre reforçamento positivo e negativo, seguindo para
as vantagens, explicações e sugestões relacionadas ao abandono desta distinção e finalmente
as sugestões neutras em relação às duas posições e alguns esclarecimentos sobre pontos
identificados no debate. Segue-se então uma discussão geral dos resultados e considerações
finais sobre o presente trabalho.
Figura 1
Organização hierárquica e interrelação entre os subtópicos da seção “Resultados e
Discussão”

Problemas da Manutenção
Falas em que os autores apontaram falhas ou desvantagens relacionadas ao uso da
distinção entre os reforçamentos positivo e negativo. Dentre os trechos classificados como
“Problemas da Manutenção”, identificou-se falas que apontavam para a distinção como sendo
confusa, ambígua, pouco fundamentada, limitada ou problemática.
A Distinção É Confusa
Confusa em seu Uso Histórico. O primeiro ponto apresentado no resgate feito por
Baron e Galizio (2005), já visto em Michael (1975) na Introdução, ilustra como a distinção
pode gerar confusão por conta de seus diferentes usos ao longo do tempo. Historicamente, o
termo “reforçamento negativo” foi inicialmente usado por Skinner (1938) da mesma forma
que hoje se usa o termo punição, e só posteriormente usado no seu sentido atual. Ainda assim,
Michael reconhece que esse problema particular foi resolvido pela terminologia moderna, já
atualizada em Skinner, que distingue tanto os reforçamentos quanto as punições entre
positivos e negativos.
Confusa para Novos Leitores. Sidman (2006), diferentemente de Michael (1975),
afirma que ainda há confusão entre os termos “reforçamento negativo” e “punição” e cita que
em sua experiência isso é especialmente comum entre pessoas que estão sendo introduzidas à
análise do comportamento. Ele acredita que o problema é gerado pela igualação do termo
“reforçamento positivo” ao termo cotidiano “recompensa” e à noção de que “negativo deve
ser oposto a positivo” e, portanto, reforçamento negativo é igualado à “punição”.
Confusa Sobre Suas Regras de Uso. Baron e Galizio (2006a) argumentam que outro
aspecto responsável pela confusão diz respeito a forma como se descrevem determinadas
alterações ambientais reforçadoras. Há situações em que existe um consenso na forma de
descrever alguns eventos, por exemplo, quando se diz que a pressão à barra foi reforçada pela
pelota de alimento ou que tomar uma aspirina foi reforçado pela eliminação da dor de cabeça
53

(exemplos dos autores). O problema, para o autor, é que no primeiro caso, a descrição feita
diz respeito à operação (adição do alimento), enquanto a segunda diz respeito ao efeito que a
operação (adição da aspirina) tem no organismo – a eliminação da dor de cabeça. Para os
autores isso indica que mais de um critério acaba sendo usado para descrever alterações
ambientais reforçadoras e que também não há clareza em quando se usar cada critério.
Uma discussão que se pode fazer sobre a este último ponto, colocado por Baron e
Galizio (2006a), é que ele talvez tivesse ficado mais evidente se tivessem usado
comportamentos mais paralelos como exemplos. Uma possibilidade é comparar “tomar uma
aspirina” com “comer um alimento” – ao invés de pressionar uma barra. Nesse caso, respostas
semelhantes em topografia estariam ambas produzindo a consequência “estímulo
[aspirina/alimento] no organismo”. Seria possível, nesse caso, argumentar que os dois
comportamentos envolvem o mesmo tipo de operação (i.e., adição). Afirmar que são mantidos
pela adição desses estímulos, entretanto, implicaria dizer que uma aspirina é consumida pela
sua própria adição e não pelo seu efeito sobre a dor de cabeça, algo que pode soar estranho no
caso da aspirina, mas que é exatamente o que se diz sobre o alimento com relação à fome (i.e.,
o alimento é consumido por sua própria adição e não pelo seu efeito sobre a fome).
É comum se dizer que “tomar a aspirina foi reforçado pela eliminação da dor de
cabeça”, mas dificilmente se ouviria de um analista do comportamento que “o consumo do
alimento é reforçado pela eliminação da fome”. A questão é que em ambos o caso parece ser
o mesmo: uma resposta está sendo reforçada por um suposto estímulo privado do organismo.
De outra forma, também se poderia afirmar que a resposta foi reforçada pela eliminação da
operação motivadora, mas, novamente, isso parece aceitável somente para reforçamento
negativo, mas não para o positivo – mesmo que a subtração (parcial ou completa) da operação
motivadora seja intrínseca aos dois.
54

De toda forma, o ponto de Baron e Galizio (2006a) é, justamente, que o critério para
se classificar as alterações ambientais, ou seja, para se fazer uma distinção entre os
reforçamentos positivo e negativo é confuso.
A Distinção É Ambígua
O segundo e mais discutido ponto (21 respostas totais) trazido por Baron e Galizio
(2005), também visto em Michael (1975), deriva do fato de que função reforçadora de um
evento advém sempre da mudança de uma condição de estímulo para outra (algo já indicado
na Introdução por Skinner, 1953 e Michael, 1975). Dentro desse parâmetro, qualquer
descrição de uma alteração ambiental num sentido também pode ser descrita em sua forma
oposta. Para demonstrar isso, os autores apresentam um exemplo em que ratos em um caixa
experimental fria pressionavam uma barra que fazia aumentar a temperatura da caixa (Weiss
& Laties, 1961). Para Baron e Galizio, tanto a descrição de que a pressão à barra era mantida
pela “adição do calor” quanto a descrição de que a pressão à barra de que era mantida pela
“subtração do frio” são possíveis e descrevem a mesma mudança. Nesse sentido, é possível
classificar o processo tanto como reforçamento positivo quanto como reforçamento negativo.
Além desse exemplo experimental, Baron e Galizio (2005) trazem os exemplos de que
a “entrega de dinheiro” implica no “término de um período de falta de dinheiro” e a “fuga de
um estímulo aversivo condicionado” sempre produz a “adição de uma situação na qual o
estímulo aversivo está ausente”. Mais adiante, afirmam que o dilema fica particularmente
aparente em exemplos cotidianos em textos didáticos. Em um, uma criança liga a televisão
para assistir um desenho. Nesse caso, ela liga a TV pela adição dodesenho ou pela subtração
do tédio? Em outro, uma pessoa com dor de cabeça toma uma aspirina. Ela o faz pela adição
da aspirina ou pela subtração da dor de cabeça? Em alguns casos os próprios autores de
alguns desses livros didáticos reconheciam que ambas as interpretações eram válidas e
destacam como isso acaba por anular o propósito dos rótulos positivo/negativo.
55

Em outras palavras, a distinção seria ambígua porque qualquer mudança ambiental
poderia ser descrita como positiva ou negativa. Nesse sentido, ela seria “mais uma questão de
procedimento do que qualquer outra coisa, e a direção da mudança [adição/subtração] não
parece oferecer uma contribuição fundamental” (Baron e Galizio, 2006a, p. 148).
Há outros dois exemplos apresentados por Baron e Galizio (2005) que serão
retomados mais adiante como contra-argumento de uma “Explicação para a Manutenção”,
mas que aparece em algumas respostas ao presente argumento. O primeiro diz respeito a
oposição entre “aumento da atenção” e “alívio da solidão”, e o segundo entre “fuga de uma
tarefa aversiva” e “acesso a uma atividade alternativa”.
Alguns autores demonstraram concordar em alguma medida com esse argumento de
Michael (1975) e Baron e Galizio (2005). Chase (2006) concorda completamente que não se
pode atribuir processos diferentes para o reforçamento positivo ou negativo, nem controle por
um e não pelo outro. Iwata (2006) concordou que, pelo menos do ponto de vista descritivo,
não há diferença entre descrever a mudança de uma forma ou de outra. Ainda assim, sugere a
mudança do termo “alívio da solidão” por “término de um período no qual atenção estava
indisponível”. Sidman (2006) alertou que para aqueles que defendem que a distinção reflete
diferenças no processo de reforçamento em si, a discussão de Baron e Galizio (2005) deve
resolver essa questão. Além disso, afirmou que há situações em que, de fato, não podem ser
classificadas apenas como reforçamento positivo ou negativo. Nos casos como o do
experimento de Weiss e Laties (1961), Sidman concorda que tanto a condição de estímulo
antecedente quanto consequente (i.e., magnitude do estímulo antes e depois da resposta)
precisam ser levadas em conta para que se possa especificar o reforçador. Por fim, Nakajima
(2006) concorda que existe uma “ambiguidade essencial” na distinção entre os reforçamentos
positivo e negativo.
56

Dentre os contra-argumentos apresentados à Baron e Galizio (2005), Chase (2006)
aponta que o experimento de Weiss e Laties (2006) é um exemplo fraco do problema porque
parece muito mais uma questão de semântica, já que “calor” e “frio” são opostos e não há
diferença em descrever uma coisa ou outra. No caso de uma criança que emite baixa taxa de
mandos e alta taxa de comportamentos auto lesivos, um cuidador poderia aumentar a atenção
contingente a mandos e ver tanto um aumento na frequência de mandos quanto uma
diminuição nos comportamentos auto lesivos; ou restringir diretamente os comportamentos
auto lesivos, o que poderia fazer aumentar o número de mandos como forma de fuga. Diante
disso, Chase afirma que:
O fato de que os componentes de reforçamento positivo e negativo de ambas as
manipulações podem ser descritos não anula o valor heurístico de perceber que tanto a
atenção quanto a contenção podem ser manipuladas para aumentar mandos
socialmente apropriados (Chase, 2006, p. 114).
Nesse sentido, o valor da distinção, para Chase (2006), se dá em poder isolar
diferentes mudanças ambientais e não em distinguir uma mesma mudança em suas duas
versões opostas. Diferentemente do exemplo de Weiss e Laties (1961) em que uma mesma
mudança pode ser descrita de duas formas (aumento do calor e diminuição do frio), Chase
afirma que as intervenções “aumento da atenção” e “restrição física” poderiam ser, cada uma,
descritas em suas versões opostas (i.e., “diminuição de períodos sem atenção” e “aumento de
períodos sem restrição física”).
Iwata (2006) argumenta que, apesar de haver casos em que a distinção é incerta (e.g.,
mudanças na temperatura ou na intensidade de um choque), muitas mudanças de estímulo
envolvem condições pré e pós-mudança diante das quais costuma ser possível determinar qual
o estímulo relevante e se ele está sendo adicionado ou subtraído. Por exemplo:
57

Dizer que o alimento é apresentado refere-se às ações do experimentador; no entanto,
dizer que a privação é reduzida refere-se à reversão de uma condição que também
deve ser atribuída às ações do experimentador (retenção de alimento). De modo
semelhante, terminar a aplicação de choque não parece envolver a apresentação de
segurança em si, mas sim a reversão de uma condição na qual um estímulo específico
(choque) estava sendo apresentado. Por fim, a entrega de dinheiro pode ou não
encerrar um período sem dinheiro, mas sempre resulta no aumento da disponibilidade
de dinheiro (Iwata, 2006, p. 122).
Iwata (2006) destaca que, mesmo que o direcionamento de Michael (1975) fosse
seguido e termos como “entrega” (“delivery’) fossem abandonados em favor descrição da
mudança em si, o contraste relevante na transição de uma “condição sem alimento” para uma
“condição com alimento” é que o alimento foi adicionado como condição subsequente.
A partir disso, vale comentar algumas inconsistências presentes na fala de Iwata
(2006). Primeiramente, ele dá a entender que a operação (adição/subtração) costuma ser
facilmente identificada pela ação do experimentador, mas não deixa explícito como identificá-
la em situações em que não há um agente mediando o reforçamento. Além disso, no trecho
citado, ele justifica que a terminação do choque consiste em um reforçamento negativo pois
trata-se da retirada do choque que fora estabelecido pelo próprio experimentador. De forma
similar, na sua frase anterior sobre o alimento, ele destaca que a privação de alimento também
foi uma condição estabelecida pelo experimentador. Se o alimento termina uma condição de
retenção de alimento estabelecida pelo experimentador, isso deveria constituir, segundo seu
próprio raciocínio, um reforçamento negativo. Mesmo assim, ao final ele destaca que a
mudança relevante nesses casos é a adição do alimento.
Um segundo contraponto ainda foi apresentado por Iwata (2006) para o argumento de
que nenhuma mudança é exclusivamente positiva ou negativa. Apesar de que mudanças de
58

estímulo que acontecem num continuum (i.e., dentro de variações paramétricas da magnitude
do estímulo) sejam mais difíceis de classificar, ainda assim é possível identificar o aumento
ou diminuição de determinada característica do estímulo, permitindo uma classificação da
operação.
Marr (2006) critica o recurso de Baron e Galizio (2005) a condições acompanhantes e
operações motivadora como forma de explicar o comportamento, afirmando que essas seriam
variáveis hipotéticas. Ele destaca que noções como a de que o “reforçadores agem pelo prazer
ou pelo alívio” e termos como “necessidade” (“need”), “impulso” (“drive”) foram
abandonadas há tempos por serem forçados ou implausíveis.
Sobre a questão de se a criança liga a TV por adicionar o desenho ou subtrair o tédio,
Marr (2006) afirma que a “busca pelo prazer” não implica uma condição prévia de dor e nem
a esquiva da dor implica a busca pelo prazer. Ele ilustra seu ponto com o exemplo de que ele
gosta de ouvir música clássica, mas que a ausência desse estímulo não implica em uma
privação ativa de músicas do século XIX. De forma similar, ele não sente prazer ativo quando
não tem uma dor de cabeça, apenas não a sente. Tomar um remédio elimina a dor de cabeça e
o faz voltar para um estado de “relativa neutralidade”. A parte relevante, para o autor,
continua sendo que a dor de cabeça foi eliminada, e “o que acontece depois parece
irrelevante” (Marr, 2006, p. 127).
Baron e Galizio (2006a) concordaram com Marr (2006) que é preferível (alémde
costumeiro) recorrer às operações como explicação do comportamento do que noções
“implausíveis” (Marr, 2006, p. 127). Entretanto, a despeito da visão que se tenha sobre esses
conceitos, o ponto feito por eles se mantém válido mesmo quando consideradas apenas
operações específicas observáveis. A própria adição da música clássica (citada por Marr),
necessariamente, implica o encerramento de um período na qual a música estava ausente. Em
59

outras palavras, poder-se-ia tanto descrever que “a música foi adicionada” quanto que “o
período em que ela estava ausente foi subtraído” e isso é necessariamente reforçador.
Baron e Galizio (2006a) também destacam que parte do problema com a distinção é,
justamente, que o foco nas operações é de alguma forma perdido. Apesar de sugerir que o
foco seja nas operações, Marr (2006) quando descreve que ao se tomar uma aspirina a
eliminação da dor de cabeça é o evento reforçador, acaba recorrendo ao efeito da operação; já
que a operação específica e observável, nesse caso, seria a adição da aspirina. A dor de cabeça
e sua eliminação são eventos hipotéticos e/ou não diretamente observáveis e seriam o efeito
da adição da aspirina. Dizer que a eliminação da dor de cabeça é o efeito reforçador seria o
mesmo que dizer que a redução da fome, e não a adição do alimento, é o evento reforçador.
Sidman (2006), por sua vez, apresenta uma série de críticas e contrapontos ao
argumento de Baron e Galizio (2005). O primeiro deles é que apesar de os autores
contestarem a noção de que o reforçamento envolve mudanças em estados
fisiológicos/emocionais, eles ainda apelam para esses estados em seu principal argumento.
Mais especificamente, Sidman menciona a fala de que a apresentação de comida envolve uma
redução de um estado de privação e que o aumento de atenção é equivalente ao alívio da
solidão.
Sobre isso, Baron e Galizio (2006a) responderam que os exemplos que eles
apresentaram que envolviam estados internos foram retirados de outras fontes para ilustrar
como tais situações costumam ser tratados, mas que o mesmo poderia ser feito sem qualquer
referência a esses processos. Ao invés de alívio da solidão pode-se dizer “término de uma
condição na qual a atenção estava ausente” (p.149) - alteração muito semelhante a sugestão de
Iwata. Ainda assim, destacam que o termo “sozinho” (“lonely”), no dicionário, não se refere a
um estado interno, mas sim ao ambiente (i.e., sem companhia). Seguindo a mesma lógica,
substituem “redução de um estado de fome” por “término de um período sem comida”.
60

Um segundo contraponto de Sidman (2006) é que, apesar de haver casos em que a
distinção não possa ser feita (e.g., experimento de Weiss e Laties, 2006), isso não torna a
distinção inutilizável e pode haver valor em fazer uso dela sempre que for possível. Esse,
segundo Sidman, é o caso de muitos outros conceitos em que, quando levados a extremos,
também se tornam confusos.
Além disso, o autor destaca que mesmo nos casos em que a distinção é confusa,
frequentemente há maneiras de se resolver o problema. Por exemplo: a resposta que elimina o
choque elétrico também produz um período em que o choque está ausente, mas Sidman
(2006) questiona se o rato trabalharia para produzir esse ambiente sem choques quando ele
não está em uma situação na qual eles estão presentes. Em outras palavras, “a interrupção do
choque vai ser reforçadora mesmo que o ambiente produzido pela resposta de fuga continue
mudando” (p. 137). Isso parece ilustrar justamente o argumento anterior de Marr (2006) de
que condições pós-mudança seriam irrelevantes no reforçamento negativo.
Outro exemplo dado por Sidman é o de uma criança que se comporta para produzir
uma sala de time-out quando está sendo requisitada a realizar uma determinada atividade.
Nesse caso é fácil identificar se a resposta é mantida pela fuga da demanda ou pela própria
sala de time-out.
A simples produção de uma aspirina bastaria para reforçar a abertura do frasco, se o
comprimido não eliminasse a dor de cabeça? Acho que sabemos o que aconteceria
com o consumo de aspirina se enchêssemos os frascos de aspirina com comprimidos
de placebo rotulados falsamente (Sidman, 2006, p. 137).
Sobre esse último exemplo, ficaria a pergunta: como se explicaria o fato de que uma
pessoa ainda se manteria tomando os placebos por um tempo antes de parar, sem classificar as
pílulas como reforçadores positivos condicionados?
61

Ainda na mesma linha, Sidman (2006) traz um outro questionamento: “uma criança
poderia ligar a televisão mesmo que isso a afastasse de um jogo favorito ou de uma sobremesa
muito desejada? Esse evento é certamente possível, e, quando ocorre, seria difícil identificar o
reforço como uma fuga do tédio” (Sidman, 2006, p. 137). Nesse exemplo Sidman parece
apontar para a noção de que ao se considerar qualquer instância de reforçamento, deve-se
considerar tanto a condição anterior quanto a nova. Ele diferencia uma situação em que uma
criança, diante de uma condição de tédio, produz o desenho e uma situação em que diante de
um jogo que gosta produz o desenho. No primeiro caso, a descrição poderia ser “eliminação
do tédio” enquanto, no segundo caso, a eliminação do videogame dificilmente estaria
controlando a resposta.
Novamente, parece ser o caso de que o uso, por Baron e Galizio (2005), de um termo
vago como “tédio” abriu margem para questionamentos que não necessariamente tem relação
com o ponto que esses autores pareceram querer fazer. A condição oposta a “programa de
TV” não é o tédio, mas sim a “ausência de um programa de TV”. O tédio poderia ser
interpretado como uma operação estabelecedora do tipo “privação de atividade”.
Seguindo o mesmo modelo da resposta anterior dos autores, o que poderia ter sido dito
seria que “a eliminação da ausência do programa de TV” foi reforçadora. Isso, simplesmente,
isso é o mesmo que dizer que o programa de TV foi adicionado. Essa outra forma de
descrição é certamente estranha e inconveniente, mas ainda assim poderia ser feita. As bases
para essa afirmação serão mais bem elaboradas nos tópicos “A Distinção É Semântica” e “A
Ausência como Estímulo”. De qualquer forma, Sidman (2006) está correto em pontuar um
uso impreciso do termo “tédio”, mas o deslize de Baron e Galizio (2005) não necessariamente
anula ambiguidade da distinção positivo/negativo. Em todos os casos, uma condição está
sendo subtraída e outra adicionada. É possível que o autor tenha ignorado que duas mudanças
62

ambientais estavam ocorrendo ao mesmo tempo (i.e., eliminação do tédio e adição do
desenho) e que cada uma podia ser descrita das duas formas - como mostrou Chase (2006).
Sidman (2006) apresenta, então, um último exemplo na mesma linha argumentativa e,
em seguida, sua conclusão:
Cônjuges geralmente buscam o divórcio independentemente de suas experiências
conjugais? Certamente não precisamos de dados experimentais para classificar muitos
- senão a maioria - dos divórcios como comportamentos de fuga. A possibilidade e a
utilidade de identificar reforçadores positivos e negativos não me parecem tão
desanimadoras quanto aparentemente parecem para Baron e Galizio (Sidman, 2006, p.
137).
Sidman (1989/2009) menciona o exemplo do divórcio ao falar sobre a utilidade de
identificar reforçadores positivos e negativos. Entretanto, essa utilidade não fica nitidamente
indicada em sua fala. Divórcios costumam ser situações complexas que envolvem cadeias
comportamentais extensas e incontáveis variáveis relevantes que tornam uma afirmação tão
abrangente quanto a de que “a maioria dos divórcios ocorrem por reforçamento negativo”
pouco relevante. Uma pergunta que deveria ser feita é: qual resposta específica nessa cadeia
comportamental extensa se está analisando? As respostas que produziram a certidão de
divórcio, uma pensão alimentícia, a atenção de amigose familiares, convites para novos
eventos, elogios, um novo amor etc., a princípio, deveriam ser classificadas como
reforçamento positivo. Outro ponto é que muitos dos comportamentos emitidos nessa situação
jamais foram emitidos ou serão emitidos novamente e foram evocados provavelmente muito
por conta de condicionamentos verbais. Sem uma análise da frequência de respostas do que
está sendo chamado de “divórcio”, a afirmação acaba tendo pouco valor.
Baron e Galizio (2006a) concordam com Sidman que a distinção ainda pode ser feita
de maneira relativamente direta em muitos casos e acrescentam o fato de que falar das
63

mudanças em suas versões opostas pode parecer “forçado” (e.g., falar “introdução de um
período em que choques estão ausentes” ao invés de “remoção de um choque”). Além disso,
concordam com Sidman e Iwata (2006) que a análise empírica dos eventos reforçadores é
valiosa. O problema é que, como já foi comentado, em muitos outros exemplos (inclusive
alguns apresentados por Sidman como o do divórcio) a distinção é muito menos nítida. Ainda
assim, o que Baron e Galizio questionam é que, mesmo que a distinção possa ser feita, no que
ela acrescenta em uma análise comportamental? Sugerem que, nesse sentido, pode haver mais
a ser ganho ao se focar no contexto total da mudança de estímulo (como sugerido por
Michael, 1975).
Em resposta ao exemplo do dinheiro apresentado por Baron e Galizio (2006), Sidman
(2006) afirma que apesar de o “término de um período sem dinheiro” ser fundamental para
estabelecer o dinheiro como reforçador em alguns casos, bilionários (mesmo sem estarem
“privados” de dinheiro) continuam “trabalhando vigorosamente para conseguir mais”. A partir
desse exemplo, Sidman (2006) conclui que “a efetividade de alguns reforçadores positivos
depende menos da sua ausência anterior do que do comportamento que eles tornam possível
no futuro” (p. 137). Esse ponto será retomado na discussão sobre “Implicações Sobre o
Conceito de Operação Motivadora”.
Novamente, parece que um mau uso de termos gerou um conflito desnecessário. Se
Baron e Galizio (2005), ao invés do termo “término de um período sem dinheiro”, tivessem
sido mais abrangentes e dito “término de um período de menos dinheiro” ou, ainda melhor,
tivessem descrito especificamente a quantidade de dinheiro pré e pós-mudança (seguindo a
recomendação de Michael, 1975) o contra-argumento de Sidman teria pouca base.
Reformulando o ponto dos autores: “um período de menor dinheiro” é sempre,
inevitavelmente, interrompido pela adição do dinheiro.
64

Nakajima (2006) também apresentou alguns argumentos contrários aos de Baron e
Galizio (2006). Primeiro, sobre a ambiguidade calor/frio ilustrada pelo experimento de Weiss
e Laties (1961), Nakajima afirma ter uma preferência pela descrição de que “calor foi
adicionado” porque, segundo ele, “calor é uma entidade física no ambiente do rato, mas
‘frieza’ é um estado hipotético do rato e um conceito secundário que significa ‘ausência de
calor’” (p. 269). Isso poderia dar a entender que, para Nakajima, o frio não seria um estímulo.
Na física, é consenso que o calor (bem como a luz) sejam fenômenos materiais e que a
frieza e o escuro não. Entretanto, comportamentalmente, essa distinção talvez tenha pouca
relevância. Enquanto um evento ambiental que afeta o comportamento, o calor é capaz de
eliciar e evocar respostas (e.g., sudorese ou abanar-se). Da mesma forma, o frio também tem a
capacidade de tanto eliciar e evocar comportamentos (e.g., tremores e arrepios ou aproximar-
se de uma lareira) e, nesse sentido, ele também deve ser considerado um estímulo.
Não seria inviável abandonar a palavra “frio” e passar apenas a falar apenas de
“calor”, “ausência de calor” e “privação de calor”. Ainda assim, nesse caso, a “ausência de
calor” teria que passar a ser tratada como um estímulo que elicia e evoca as respostas
mencionadas. Do contrário, ter-se-ia que assumir que o calor estaria de alguma forma
prevenindo essas respostas de acontecerem (o que seria inconveniente e supostivo).
Outro ponto é que, a “frieza”, como apontado por Nakajima (2006) não simplesmente
um “estado hipotético” do rato, afinal, a temperatura dele pode ser facilmente medida. De
todo modo, a “frieza do rato” sequer era a variável relevante para o experimento de Weiss e
Laties (1961), mas sim a “frieza” da caixa experimental (um estímulo público e mensurável).
De forma muito similar a Sidman (2006), Nakajima (2006) acusou Baron e Galizio
(2005) de reconhecerem o ponto de que se deve focar nas mudanças ambientais, mas que eles
negligenciam esse ponto. Mais especificamente, eles negligenciam os “critérios de julgamento
que distinguem a especulação e a identificação” (p. 269). Para o autor, quando um rato
65

pressiona uma barra para obter uma pelota de comida, a pelota de comida é quantificável e
manipulável, mas a fome seria uma construção hipotética. Similarmente, o dinheiro seria um
material concreto, mas a pobreza um conceito derivado. O desenho animado é observável,
mas o tédio não é observável e, mesmo que exista, pode ser interrompido por outros
programas de TV. Por fim, um choque é manipulável, mas os estímulos ligados a segurança
são mais difíceis de identificar com precisão.
Baron e Galizio (2006b) respondem Nakajima (2006) concordando que o desejável (e
usual) é focar em consequências diretamente observáveis, mas reafirmam que seu ponto é que
isso não é justificativa para se criar uma classificação com base no critério de início ou
término de estímulos. A ambiguidade, segundo eles, se aplica a qualquer mudança ambiental
(independentemente de ser observável ou não) porque a adição de um estímulo sempre exige
sua ausência prévia e a remoção de um estímulo sempre exige sua presença posterior. Eles
destacam também Nakajima pareceu ter ignorado o exemplo da aspirina apresentado por eles.
Segundo a lógica de Nakajima, essa situação deveria ser classificada necessariamente como
reforçamento positivo, porque a operação observável e mensurável seria a adição da aspirina,
enquanto a eliminação da dor de cabeça seria uma “consequência especulativa”.
Complementando esse ponto de Baron e Galizio (2006a), se, mais uma vez, forem
trocados os termos vagos como “fome”, “tédio” e “período de segurança” usados por eles por
“ausência do alimento”, “ausência do desenho” e “ausência de choque” seria difícil
argumentar que a ausência do estímulo não pudesse ser observada ou medida. Até mesmo o
período pelo qual os estímulos estiveram ausentes pode ser medido em segundos, horas ou
dias.
Além desse ponto, Baron e Galizio (2006b) complementam que o critério de se basear
na facilidade de um pesquisador observar ou descrever um fenômeno é limitado no sentido de
que é determinado excessivamente pelos recursos que um pesquisador específico detém
66

naquele momento específico. Para Baron e Galizio, o avanço tecnológico da ciência vai contra
essa ideia no sentido de que novas formas de se medir e observar fenômenos passam a se
tornar possíveis.
Para Baron e Galizio, as “consequências especulativas” descartadas por Nakajima
(2006) podem também representar a solução para o problema da distinção. Os valor de
reforçadores condicionados, por exemplo não dependem somente dos eventos imediatamente
contingentes a eles. Sabe-se que os reforçadores de base (ou condicionantes) são pelo menos
um dos responsáveis por determinar se estímulos condicionados serão reforçadores positivos
ou negativos. Além disso, há motivos para acreditar que os estímulos que sinalizam períodos
sem choque, por exemplo, é que reforçam o comportamento (Dinsmoor, 2001).
Staats (2006) afirma que apesar de o efeito dos dois reforçamentos sobre o
comportamento serem os mesmos, Baron e Galizio (2005) ignoraram o condicionamento
respondente e emocional envolvido e o efeito sobre outroscomportamentos além do
reforçado. Segundo o autor, quando todo o reportório (operante, respondente e emocional) é
levado em consideração, os reforçadores positivos e negativos apresentam grandes diferenças.
O autor exemplifica que, enquanto reforçadores negativos “fazem” o animal ser condicionado
a uma resposta emocional negativa em relação a uma caixa experimental, os reforçadores
positivos “fazem” o animal ser condicionado a uma resposta emocional positiva em relação à
caixa.
O autor ilustra que se os ratos fossem colocados em uma caixa inicial com a
possibilidade de se locomover para a caixa em que foram treinados, um rato que foi treinado
por reforçamento negativo ficariam na caixa inicial, enquanto um rato foi treinado sob
reforçamento negativo andaria até a caixa experimental. Da mesma forma, crianças reforçadas
por se portar bem e crianças punidas por não se portar bem poderiam ambas aprender a se
portar, mas também aprenderiam respostas emocionais diferentes que afetariam seu
67

comportamento em relação à escola. Staats (2006) cita alguns de seus trabalhos que ilustram
tais efeitos (ver Harms & Staats, 1978; Staats, 1975, 1996; Staats & Hammond, 1972; Staats
& Warren, 1974).
Sobre isso, Baron e Galizio (2006b) respondem Staats (2006) dizendo que, não há
consenso sobre o que seria a emoção ou como medi-la, e citam Rosenberg e Ekman (2000) e
um próprio trabalho de Staats e Eifert (1990) para embasar essa afirmação. Baron e Galizio
criticam a pressuposição de Staats de que seja possível separar claramente os “estados
emocionais” em uma classe positiva e outra negativa para, a partir disso, classificar também
os comportamentos operantes. Segundo eles, mesmo através de referências a estados
emocionais, o problema lógico apontando por Michael (1975) ainda não é resolvido. Seria
perfeitamente possível descrever o “estado emocional” de um rato privado de alimento como
negativo. Nesse caso, o comportamento é controlado pelo término do estado emocional
negativo, pelo início do estado emocional positivo ou por ambos?
Baron e Galizio (2006b) citam dois experimentos que ilustram como a reação entre as
dicotomias aproximação/evitação e positivo/negativo é confusa. Perone (2003) demonstrou
que um pombo pode emitir uma segunda resposta para suspender um esquema de
reforçamento positivo em razão fixa. Ao mesmo tempo, num esquema de reforçamento
negativo, Perone e Galizio (1987) demonstraram que ratos também podem passar a emitir
uma outra resposta que produza o estímulo que acompanhava o período no qual o choque
estava suspenso.
Sobre o exemplo experimental hipotético de Staats (2006), Baron e Galizio (2006b)
argumentam que o que foi explicado pelo autor em termos de respostas e condicionamentos
emocionais poderia ser facilmente explicado por condicionamento operante. Ao mesmo
tempo, num experimento que comparasse duas caixas experimentais, uma com reforçamento
68

em VI 10s e outra em VI 30s, o critério de Staats ditaria que o deslocamento da segunda caixa
para a primeira implicaria que a primeira envolveria reforçamento (e emoções) negativos.
Os próprios autores reconhecem que seu argumento é frágil porque, diferentemente do
exemplo de Staats (2006), as caixas não estão sendo comparadas com uma condição “neutra”.
Ainda assim, eles apelam para a noção de que o critério de aproximação/afastamento é
insuficiente e questionam se comparações com uma condição neutra podem responder isso.
A Distinção É Limitada
Limita-se em Casos Complexos/Humanos. Além do exemplo do experimento de
Weiss e Laties (2006) apresentado por Baron e Galizio (2005) para mostrar a dificuldade de
classificar alguns casos como reforçamento positivo ou negativo, Michael (2006) formula um
experimento hipotético para ilustrar isso em outro sentido. Um rato privado de alimento é
exposto a duas condições experimentais: na primeira condição, um tom está em vigor e há
uma maior frequência na liberação de alimento e menor frequência na liberação de choques
(Michael não menciona respostas as quais alimento e choque seriam contingentes nesse
experimento hipotético. Esse aspecto será especificamente comentado na discussão geral do
presente trabalho). Na segunda condição, sem tom, a frequência dos choques é maior e a de
alimento é menor. Diante disso, Michael supõe que a mudança de uma condição para a outra
seria reforçadora, mas esse reforçamento deveria ser classificado como reforçamento positivo
ou negativo? Inversamente, uma mudança da primeira condição para a segunda
provavelmente seria punitiva. Isso deveria ser considerado punição positiva ou negativa?
Classificar a mudança como positiva ou negativa pensando no reforçador de base (i.e.,
condicionante) seria difícil porque tanto o alimento (positivo) quanto o choque (negativo)
parecem cumprir esse papel. Ao mesmo tempo, classificar a mudança com base na
apresentação ou retirada do tom também faria pouco sentido já que a atribuição do
tom/silêncio a cada condição foi completamente arbitrária e poderia ser invertida. Logo,
69

Michael (2006) afirma que a distinção parece não se aplicar a casos complexos envolvendo
reforçadores condicionados aos dois tipos de estímulo.
Seguindo a mesma lógica, Michael (2006) complementa que, partindo da noção de
que casos complexos como o do exemplo citado são universalmente humanos, o uso da
distinção como um todo torna-se inútil. Em outras palavras, se a distinção só se aplica a casos
não-humanos, dentro de uma ciência que busca, em última análise, modificar o
comportamento humano, a distinção não serve para nada.
Baron e Galizio (2006a) apontam para a existência desse nó na área a respeito de se
deve-se focar valor do reforçador de base para determinar o valor de um estímulo
condicionado ou na sua adição/subtração. Em sua resposta, os autores oferecem outros
complementos para apoiar este ponto de Michael (2006). Primeiramente, eles citam que na
literatura sobre reforçamento luminoso/sensorial, era costumeiro que o aumento na frequência
de uma resposta causado tanto por um aumento na intensidade de uma luz quanto por sua
diminuição era classificado como reforçamento positivo. E que, por razões desconhecidas,
classificações com base na direção da mudança foram abandonadas em favor de falar da
mudança de estímulo em si como reforçadora.
Como outros exemplos do ponto de Michael (2006), Baron e Galizio (2006a) citam
Verhave (1962) que nomeou os "time-outs" de um esquema de esquiva que eram
acompanhados pela introdução de um tom como "reforçamento positivo"; e Perone e Galizio
(1987), entre outros, que nomearam os "time-outs" indicados pela interrupção de um tom
como reforçamento negativo. Segundo Michael, escolher o tom ou o silêncio como estímulos
condicionados é uma decisão arbitrária, e uma classificação em termos de positivo/negativo,
além de forçada, nada acrescentaria.
Limita-se a Operações com Início ou Término Definidos. Outro problema apontado
por Baron e Galizio (2006a) ligado à manutenção da distinção é que há operações que não
70

podem facilmente ser identificadas como “introdução” ou “término” porque se trata de
mudanças nas intensidades dos estímulos em um contínuo.
Nesse momento do texto de onde essa fala foi retirada os autores não elaboram mais o
seu ponto. Ainda assim, vale retomar que esse ponto já havia sido respondido por Iwata
(2006): “as mudanças ainda envolvem ou um aumento ou uma diminuição de alguma
característica do estímulo” (p. 122). A dificuldade de se classificar contingências de
reforçamento entre positivas ou negativas nada tem a ver com se as mudanças são totais ou
parciais. Se a remoção de um choque é reforçadora negativa, uma diminuição suficiente na
sua intensidade também será. É claro que diminuições muito pequenas na intensidade de um
choque, tal como a remoção de um choque muito leve, podem não sercapazes de manter
determinada resposta. Ainda assim, em nenhum momento faria sentido considerar que se está
falando de reforçamento positivo.
De uma forma ou de outra, apresentações e remoções também podem ser consideradas
alterações na intensidade de estímulos cuja intensidade do estímulo em uma das condições
seja zero. Millenson (1967/1975) já havia apontado para o fato de que mudanças na
intensidade de um estímulo poderiam se configurar como reforçamento – mesmo que ele
tivesse feito essa ressalva apenas para o reforçamento negativo.
A Distinção Não Tem Fundamentação Experimental Suficiente
Lattal e Lattal (2006) apresentaram uma crítica à forma como a distinção foi adotada
na análise do comportamento. Nesta área (assim como em outras ciências) assume-se a
hipótese nula: uma variável presumivelmente não tem efeito até que se prove o contrário. Essa
é a base da comparação entre a linha de base e outras condições experimentais. Nesse sentido,
sem evidências concretas que sustentassem uma distinção entre os reforçamentos positivo e
negativo, nunca dever-se-ia ter assumido que a distinção existia. Ao contrário, a hipótese nula
foi rejeitada e a distinção foi assumida sem provas empíricas.
71

Perone, Galizio e Baron (1988) destacaram diversas questões metodológicos entre
experimentos, envolvendo tanto humanos quanto animais, que tornam difícil a sua
comparação. Lattal e Lattal (2006) acreditam que esses conflitos poderiam ser extrapolados
para a comparação entre os reforçamentos positivo e negativo. Em outras palavras, as
diferenças entre os delineamentos experimentais que envolvem reforçamento negativo ou
positivo são grandes o suficiente para se atribuir qualquer resultado a diferenças na adição ou
remoção de estímulos.
Segundo Lattal e Lattal (2006), os que chegaram mais perto de comparar
empiricamente o reforçamento positivo e negativo, segundo Lattal e Lattal (2006), foram
Dinsmoor (1962) e Azrin et al. (1963) que delinearam esquemas de fuga de forma similar a
esquemas usados em experimentos que usam comida como reforçador. apresentam ainda dois
dados experimentais para embasar o seu ponto. Azrin et al. (1963) concluíram que, para
macacos-de-cheiro, que a forma pela qual as respostas são adquiridas e mantidas em um
esquema de razão fixa de fuga e em um esquema de razão fixa por alimento são similares.
Dinsmoor (1962) notou especificidades do uso de choques em esquemas de reforçamento de
intervalo variável. Entretanto, para os autores, nenhuma conclusão pode ser tirada disso, já
que não se tem como afirmar que a particularidade se dá à diferença entre os dois tipos de
reforçamento e não sobre diferenças entre os choques e reforçadores alimentares
especificamente.
Mais adiante em seu texto, Lattal e Lattal (2006) retomam que a distinção foi
assumida sem evidências suficientes que mostrem a existência de diferenças funcionais entre
os reforçamentos positivo e negativo.
Faz Perder o Foco nas Operações
Baron e Galizio (2006a) retomam o exemplo da aspirina (classificada como
reforçamento negativo apesar da adição da aspirina) para ressaltar que o problema da
72

distinção reside nos casos em que se favorece fazer a distinção a despeito das operações
envolvidas. Em outro comentário sobre a distinção, retomam o alerta de Michael (1975):
“atrapalha uma descrição mais completa das condições anteriores e posteriores à mudança”
(p. 41).
Sobre isso, vale comentar que uma pessoa pode realizar uma má descrição de uma
contingência que ela classificou como reforçamento negativo, mas nada garante que a
descrição não seria malfeita mesmo na ausência dessa classificação. Isso remete mais a uma
correlação do que a uma causalidade, já que, dado que fazer a distinção é o mais comum,
acaba que é mais comum que as imprecisões sejam acompanhadas de distinções.
Querendo ou não, na ausência de descrições mais precisas, a pessoa ter dito que se
tratava de reforçamento negativo pode sim servir como informação adicional. Por exemplo: se
a descrição fosse que a adição de uma pelota de alimento provocou um aumento da resposta
que a produziu, nenhuma informação seria acrescentado ao classificar essa mudança como
positiva. Ao mesmo tempo, se a descrição fosse que uma “atividade” funcionava como
reforçador em contingências de reforçamento negativo” poder-se-ia supor que o procedimento
envolvia a retirada da atividade, indicando que ela era aversiva (e não reforçadora) em relação
a uma outra condição.
Pode Gerar Caracterizações Prematuras ou Enganosas
Baron e Galizio (2006a) alertam que apesar da utilidade aparente da distinção, ela
pode resultar em caracterizações prematuras ou até mesmo enganosas sobre o processo de
reforçamento. Em outro trecho, comentam que se basear na distinção entre adição e subtração
pode levar a equívocos especialmente quando se fala de comportamentos complexos ou
quando decisões éticas são tomadas em nome dessa distinção.

Seu Uso Gera Contradições
Baron e Galizio (2006b) afirmam que um uso rígido da distinção aplicado a uma gama
variada de casos rapidamente fará um indivíduo se deparar com contradições. Por exemplo:
ao seguir a proposição de Nakajima (2006) de se basear nos estímulos observáveis e
mensuráveis para definir o que é reforçamento positivo ou negativo, uma pessoa deveria
classificar “tomar uma aspirina” necessariamente como reforçamento positivo. Em outro
sentido, um estímulo condicionado que indica o recebimento de dinheiro para um participante
humano poderia ser tanto uma luz acendendo quanto uma luz apagando. Com esse exemplo,
Baron e Galizio se referem a noção de que o valor de um reforçador condicionado não deveria
ser inferido pela sua apresentação ou remoção já que ele ela foi arbitrariamente estabelecida.
Inviabiliza a Recomendação de Práticas Específicas
Michael (2006) apresenta uma afirmação de Geller (2004) em que o autor admitiu ter
usado os termos “positivo” e “negativo” como sinônimos de “prazeroso” e “desprazeroso” em
Weigand e Geller (2005), mas que sabia que os termos estão ligados às noções de
“apresentação” e “remoção”. Isso foi feito em um contexto em que ele estaria incitando
analistas do comportamento a usarem intervenções comportamentais “positivas”.
Esse dado é apresentado por Michael (2006) para reiterar um ponto originalmente
feito por ele em seu texto original (Michael, 1975) de que se a distinção entre os
reforçamentos positivo e negativo não é clara, haverá dificuldades em se seguir a
recomendação de usar um ao invés do outro.
Vantagens da Manutenção
Falas em que os autores apontaram benefícios relacionados ao uso da distinção entre
os reforçamentos positivo e negativo. Dentre os trechos classificados como “Vantagens da
Manutenção”, identificou-se falas que apontavam para a distinção como tendo uma função
prática, comunicativa, cultural ou apenas sendo útil.
74

A Distinção Tem Função Prática
Ajuda no Ensino de análise do comportamento. Para Chase (2006), a distinção,
especialmente quando usada por professores de análise do comportamento em exemplos, faz
com que os alunos foquem em análises detalhadas dos tipos de variáveis que podem controlar
comportamentos. Segundo o autor, descrever que, dentre as consequências que aumentam
comportamento, algumas delas envolvem a “remoção de uma consequência” e outros a
“adição de uma consequência” ilustra: o foco nas variáveis ambientais, mudanças ao longo do
tempo, distinção entre ambiente e comportamento e distinção entre variáveis observáveis e
não observáveis. Isso, por conseguinte, ensinaria os alunos a como examinar comportamentos
como um behaviorista.
Assim como foi argumentado que a distinção positivo/negativo não necessariamente
prejudica uma descrição precisa de uma contingência, algo similar pode ser dito no sentido
contrário. Chase (2006), parece ter observado uma correlaçãoentre o ensino da análise do
comportamento e o que é aprendido. De fato, é costumeiro ensinar a distinção entre os
reforçamentos positivo e negativo e apresentar exemplos que, justamente, envolvam a
distinção. Também é verdade que pelo menos parte dos alunos aprendam a analisar
comportamentos de forma detalhada. Ainda assim, não se pode ter certeza de que a distinção
tenha alguma responsabilidade nesse efeito. É possível até que os alunos estivessem
aprendendo a analisar comportamentos apesar de a distinção estar os confundindo além do
necessário. Michael (1975), por exemplo, afirmou não ter tido problemas ao ter deixado de
usar os termos positivo/negativo no ensino dos termos.
Ajuda a Isolar Mudanças que Controlam o Comportamento. Outra vantagem da
manutenção da distinção apresentada por Chase (2006) está relacionada a um contra-
argumento já apresentado no subtópico “A Distinção É Ambígua”. O argumento é que, para
Chase, a distinção ajuda a identificar quais as mudanças nas contingências que de fato geram
75

mudanças comportamentais. Tomando como exemplo o caso da criança que emite poucos
mandos e muitos comportamentos autolesivos: o valor da distinção, nesse caso, seria o de
notar dois tipos diferentes de manutenção (i.e., aumento da atenção para mandos e da restrição
física para comportamentos autolesivos) poderiam ambos gerar um aumento na emissão de
mandos - um por reforçamento positivo e o outro por reforçamento negativo.
É claro que, saber que a resposta gera duas mudanças ambientais e saber qual das
mudanças ambientais (ou se se são as duas) que mantém o comportamento é muito
importante. Ainda assim, não fica justificado, pela fala de Chase (2006), como dar rótulos
para as mudanças ajuda nessa distinção. Simplesmente chamar uma de “positiva” e a outra de
“negativa” as tornaria mais distinguíveis? Mas como as mudanças estariam sendo nomeadas
antes de serem percebidas? Se já haviam sido percebidas, elas já estavam discriminadas, não
precisaria da classificação para isso. O mesmo se aplicaria se duas mudanças classificadas
como negativas tivessem sido notadas. Assumindo essa noção de Chase: se fossem duas
mudanças “positivas” (e.g., adição de atenção e acesso a brinquedos) a distinção não ajudaria
nesse caso? Ela atrapalharia no sentido de pensar que a adição de atenção e acesso a
brinquedos são a mesma coisa? E no caso de duas mudanças “negativas” (e.g., subtração de
uma bronca e subtração de uma demanda)? Seria difícil perceber que são coisas diferentes?
Nesse sentido a presente vantagem da distinção depende de se ela ajuda a distinguir ou
não reforçadores distintos. Sobre isso, seria possível argumentar que quem descreveu as
mudanças ambientais como “aumento da atenção” ou a “retirada das restrições físicas” já
estivesse sob controle das duas mudanças ambientais diferentes. E mesmo que a descrição
pudesse ajudasse a notar as mudanças, é difícil pensar que nomear cada uma das descrições
como positivas ou negativas acrescentaria algo a mais.
Tomando o exemplo do “aumento do calor” e da “redução do frio”. Nesse caso, achar
que “adições” e “subtrações” são coisas diferentes poderia levar alguém a pensar que duas
76

mudanças estão acontecendo, mas esse não seria o caso. Ambas as descrições representam
diferentes formas de descrever uma mesma mudança. Duas mudanças parecem ser
distinguíveis porque são mudanças diferentes, não porque uma é positiva e outra é negativa.
De todo modo, para que qualquer afirmação possa ser feita, seria necessária uma
pesquisa que comparasse o ensino de análise de contingências com a distinção e sem a
distinção que pudesse mostrar se as vantagens didáticas apontadas se verificam.
Aponta para Outras Possibilidades de Intervenção. Iwata (2006), em seu tópico
“Identificar a diferença crítica entre as condições de reforçamento pré e pós-mudança facilita
o desenvolvimento de contingências efetivas” (p. 122), segue uma direção muito parecida
com Chase (2006) em seu argumento anterior. Para tal, ele cita Osborne (1969) em um
exemplo de contingências de tempo livre, nas quais comportamentos podem ser mantidos
tanto pela eliminação de demandas como acesso a atividades específicas. No primeiro caso, o
que seria oferecido à criança durante o tempo livre não faria diferença, enquanto, no segundo,
se esperaria que a eliminação da demanda tivesse pouco efeito terapêutico.
Nesse sentido, Iwata (2006) destaca que a distinção ajuda a 1) identificar situações nas
quais a adição de um reforçador positivo específico seria ou não efetiva como reforçador, 2)
examinar efeitos do tipo oposto de mudança de estímulo, 3) identificar outras mudanças de
estímulo que teriam o mesmo efeito que a apresentação ou retirada de determinado estímulo e
4) determinar como implementar a extinção. Para exemplificar seu último tópico, Iwata
menciona que, no caso de a eliminação de uma demanda servir como reforçamento, a
extinção deve ser manter a demanda.
Baron e Galizio (2006a) respondem Iwata (2006) dizendo que mesmo quando a
operação do experimentador é de término ou adição não fica explicado porque rotular os
estímulos como positivos ou negativos pode ser útil. Os autores, então, resgatam a falta de um
critério nítido para se classificar um reforçador condicionado: se, no exemplo de Iwata, o
77

acesso ao tempo livre fosse indicado por uma luz acendendo ou apagando, dever-se-ia variar a
classificação da mudança como positiva ou negativa?
Naturalmente, as mesmas questões já levantadas para o argumento de Chase (2006)
poderiam ser feitas a Iwata (2006). De que forma rotular mudanças ambientais como positivas
ou negativas contribui para essas vantagens? Em ordem, poder-se-ia responder: 1) operações
motivadoras continuam podendo ser identificadas, 2) o efeito do tipo oposto de estímulo seria
a diminuição da resposta (direta ou indireta), 3) qualquer mudança reforçadora teria o mesmo
efeito (aumento na probabilidade) e qualquer mudança punidora teria o efeito oposto
(diminuição na probabilidade/supressão), e 4) a extinção seria implementada mantendo-se a
condição antecedente a despeito da resposta.
Um ponto a se destacar é que Iwata (2006), no início deste mesmo tópico introduz as
vantagens dizendo que “algo pode ser ganho ao identificar a natureza da mudança de
estímulo” (p. 122). Porém, ainda na mesma lista, ao citar o último ganho, ele diz: “por fim,
identificar a mudança de estímulo que serve como reforçamento pode ser útil em determinar
como melhor implementar a extinção” (p. 122). Isso pode sugerir que Iwata esteja partindo do
pressuposto que “identificar a direção da mudança reforçadora” seja equivalente a “identificar
a mudança reforçadora” – algo que também parece ficar subentendido em seu exemplo.
Isso faz retomar todos os questionamentos do tópico anterior. Por conta de como a
análise do comportamento é ensinada, fica estabelecida correlação entre o ensino e utilização
de uma classificação e a capacidade de distinguir diferentes mudanças ambientais que podem
ou não estar controlando um comportamento operante. Ainda assim, a afirmação de que a
distinção positivo/negativo ajuda a distinguir diferentes mudanças ambientais simplesmente
não pode ser feita porque isso não foi testado. Precisariam ser comparados os ensinos que
usam e não usam a distinção para verificar seus desempenhos na identificação de mudanças
ambientais.
78

De todo modo, pode-se pensar, pelo menos, que há ganhos (mencionados por Iwata,
2006) em diferenciar mudanças ambientais distintas e identificar qual (ou quais) delas estão
controlando determinado comportamento. Se o rótulo positivo ou negativo ajuda ou não nisso
precisaria ser investigado.
A Distinção Tem Função Comunicativa
Descrever Mais Facilmente a Mudança. Chase (2006) apresentou como outra
vantagem da manutenção da distinção o fato de que, por vezes,é mais fácil descrever uma
situação de uma forma do que de outra. Ele ilustra isso com os exemplos “aumentar atenção”
x “diminuir períodos de não atenção” e “receber dinheiro” ao invés de “evitar períodos sem
dinheiro”. Esse ponto não é respondido diretamente, mas no subtítulo “Esclarecimentos”, será
apresentada a posição de Baron e Galizio (2006a) quanto a isso.
A Distinção Tem Função Social
Ampliar a Aceitação da análise do comportamento. Segundo Lattal e Lattal (2006), o
ambiente cultural como um todo atribui valor moral a circunstâncias interpretadas como
positivas ou negativas. Dessa forma, apesar de concordarem que a distinção é problemática,
eles afirmam que o seu uso acaba tendo a função social de ampliar a aceitação da análise do
comportamento, em especial, ao se adotar a linguagem do reforçamento positivo. Dessa
forma, seria possível mudar vieses associados a área principalmente quanto a termos como
“coerção” e “manipulação”. Segundo eles:
Programas comportamentais baseados no que se descreve como "reforçamento
positivo" podem não ser diferentes nem mais eficazes sobre o comportamento-alvo do
que aqueles baseados em "reforçamento negativo", mas os primeiros têm mais
probabilidade de serem aceitos, implementados e mantidos (por exemplo, Daniels,
2000; Iwata & Bailey, 1974). (Lattal & Lattal, 2006, p. 132)
79

Sobre isso, Baron e Galizio (2006a) responderam a Lattal e Lattal (2006) dizendo que
se analistas do comportamento passassem a falar de forma diferente entre si e com um público
cada vez mais imerso na área, uma má impressão e acusações de cinismo poderiam surgir.
Além disso, decisões judiciais já foram tomadas para impedir intervenções que se baseassem
na retenção de bens e serviços a pacientes psiquiátricos para que pudessem ser apresentados
de forma contingente. Isso mostra, segundo eles, que enfatizar que um procedimento envolve
reforçamento positivo não basta.
A Distinção Já Gerou uma Grande Quantidade de Pesquisas
Iwata (2006) cita como uma outra vantagem da manutenção da distinção o fato de que
ela gerou uma grande quantidade de pesquisas sobre as similaridades e diferenças entre a
performance entre os dois tipos de reforçamento. O autor não desenvolve mais o seu ponto,
então não dá para ter certeza de qual seria o benefício disso para ele. Se a vantagem for que a
distinção estimulou, puramente, a realização de pesquisas, uma reposta a isso poderia ser que,
se a distinção não faz sentido, esses esforços poderiam ter sido dedicados a outras
investigações e, nesse sentido, a distinção teria sido prejudicial.
Outra possibilidade é que investigações a respeito da distinção talvez estejam sendo
úteis para revelar lacunas em outras definições como reforçamento, estímulo, operações
motivadoras etc. Nesse sentido, seria possível supor que se essa discussão não tivesse surgido,
essas lacunas não teriam sido (ou demorariam mais para serem) percebidas – o que
favoreceria o argumento de que a distinção foi vantajosa.
Como especialmente apontado nos estudos de Magoon e Critchfield (2008) e Magoon
et al. (2017), muito do que as pesquisas já consideraram em termos de performance
diferencial dos comportamentos controlados por reforçamento positivo e negativo pode ser
explicado em termos de diferenças procedimentais. O fato de os dois tipos de reforçamento
80

não serem tão comumente estudados juntos e de maneiras simétricas pode ter enviesado os
resultados das pesquisas na formulação dos conceitos e na manutenção da distinção.
Influenciadas pelo debate proposto por Michael (1975), pesquisas experimentais
buscaram estudar o reforçamento negativo, seja programando-o da mesma forma em que
reforçamento positivo costuma ser programado experimentalmente (como em Perone &
Galizio, 1987), seja tornando as contingência de reforçamento positivo e negativo estudadas o
mais simétrica possíveis (como em Magoon & Critchfield, 2008 e Magoon et al., 2017).
Explicações para a Manutenção
Falas em que os autores apresentaram motivos pelos quais a distinção entre os
reforçamentos positivo e negativo vem sendo mantida. Em sua maioria, explicações foram
apresentadas por autores contra a distinção ou incertos quanto a ela, em seções específicas
dedicadas a especular as razões pelas quais a distinção foi mantida. Dentre os trechos
classificados como “Explicações para a Manutenção”, identificou-se falas que apontavam que
apontavam distinção havia sido mantida por conta de alguma função específica (i.e., prática,
comunicativa, cultural ou social) ou então que ela estava sob controle antecedente de algum
outro elemento que não a adição/subtração.
A Distinção Pode Ser Útil
Útil no Ensino de Análise do Comportamento. Chase (2006) sugeriu que um motivo
pelo qual a distinção pode ter sido mantida é que ensinar a distinção talvez tivesse tido
alguma função útil. Para ele, um indício disso era que, Keller e Shoenfeld (1950), que
propuseram a distinção inicialmente, eram ótimos professores.
Útil como nas Operações Motivadoras. Para Iwata (2006), avanços recentes na área
de operações motivadoras sugerem que diferenças terminológicas arbitrárias possam ser úteis
de alguma forma. Iwata não elabora profundamente esse ponto, apenas usa como base o fato
de que fora sugerido o termo operações motivadoras (OM) para incluir tanto operações
81

estabelecedoras (OEs) como operações abolidoras (OAs), e que essa distinção pode ser útil tal
como a distinção positivo/negativo.
Útil para Permitir que se Navegue pela Área. Baron e Galizio (2005) apontaram
que a distinção está tão incorporada nas discussões sobre comportamento operante que é
possível que a distinção tivesse passado a ser necessária para que se pudesse navegar pela
literatura. Lattal e Lattal (2006) concordaram diretamente com essa função da distinção.
Útil para Distinguir Dois Reforçadores para uma Mesma Resposta. Baron e
Galizio (2005) citam dois exemplos de analistas do comportamento que usaram a distinção
positivo/negativo para distinguir casos em que uma resposta era mantida por diferentes
formas de reforçamento. O primeiro foi o próprio Iwata et al. (1994) que usou os termos para
distinguir comportamentos autolesivos mantidos por fuga de demanda ou acesso à atenção
etc. Sobre isso, é melhor falar da consequência como aumento da atenção ou alívio da
solidão? É melhor falar sobre fuga de uma tarefa aversiva ou acesso a uma atividade
alternativa? Para Baron e Galizio, qualquer uma das descrições parece apropriada.
Nakajima (2006) afirma discordar dessa noção apresentada por Baron e Galizio
(2005). Para ele, o alívio da solidão é uma afirmação especulativa que depende de uma
inferência sobre um estado da pessoa. A fuga de uma tarefa também não pode ser facilmente
comparada ao simples “acesso a uma atividade” se ela não for claramente identificada.
Nakajima (2006) apontou para dois problemas nos exemplos de Baron e Galizio
(2005) que levam a se considerar o quanto eles foram capazes de adotar a própria perspectiva
proposta por eles. No primeiro caso, o problema mais evidente é que para qualquer definição
de tédio que se adote, tédio e atenção dificilmente seriam considerados opostos. No segundo
caso, o problema é mais grave porque Baron e Galizio parecem não ter notado que a o
exemplo de Iwata et al. (1994) aponta justamente que duas mudanças estão sendo produzidas
pela mesma resposta - a dúvida é sobre qual dessas duas é a mudança reforçadora. Nesse
82

sentido, dizer que “remoção da tarefa” e “produção de uma atividade alternativa” são
equivalentes está errado. A resposta pode estar sendo mantida tanto por uma quanto pela outra
mudança.
Com base principalmente em seus desenvolvimentos posteriores (i.e., Baron e Galizio,
2006a, 2006b), a forma correta de descrever a ambiguidade, nesses exemplos, seria contrastar
a “produção de atenção” com a16
Reforçamentos Positivo e Negativo ................................................................................. 17
Reforçadores Positivos e Negativos ................................................................................. 18
Existe Diferença Entre os Reforçamentos Positivo e Negativo? ....................................... 20
O Impacto de Michael (1975) .......................................................................................... 26
Método ................................................................................................................................ 45
Seleção dos Textos .......................................................................................................... 45
Procedimento de Grifo dos Textos ................................................................................... 45
Procedimento de Tabulação dos Dados ............................................................................ 47
Resultados e Discussão ........................................................................................................ 50
Problemas da Manutenção ............................................................................................... 52
A Distinção É Confusa ............................................................................................. 52
A Distinção É Ambígua ............................................................................................ 54
A Distinção É Limitada ............................................................................................ 68
A Distinção Não Tem Fundamentação Experimental Suficiente ............................... 70
Faz Perder o Foco nas Operações ............................................................................. 71
9

Pode Gerar Caracterizações Prematuras ou Enganosas .............................................. 72
Seu Uso Gera Contradições ...................................................................................... 73
Inviabiliza a Recomendação de Práticas Específicas ................................................. 73
Vantagens da Manutenção ............................................................................................... 73
A Distinção Tem Função Prática .............................................................................. 74
A Distinção Tem Função Comunicativa ................................................................... 78
A Distinção Tem Função Social ............................................................................... 78
A Distinção Já Gerou uma Grande Quantidade de Pesquisas..................................... 79
Explicações para a Manutenção ....................................................................................... 80
A Distinção Pode Ser Útil ......................................................................................... 80
A Distinção Tem Função Comunicativa ................................................................... 83
A Distinção Tem Função Cultural ............................................................................ 84
A Distinção se Dá por Outro Aspecto ....................................................................... 88
Sugestões para a Manutenção .......................................................................................... 98
Rever os Termos Usados .......................................................................................... 98
Manter a Distinção com Ressalvas ............................................................................ 99
Fazer Mais Investigações ........................................................................................ 100
Vantagens do Abandono ................................................................................................ 101
Gera Menos Distorções .......................................................................................... 101
Melhora a Descrição das Mudanças ........................................................................ 101
Distinguir Dois Reforçadores para a Mesma Resposta ............................................ 102
10

Explicações para o Abandono ........................................................................................ 103
A Distinção é Mal-entendida .................................................................................. 103
A Distinção Não É Mais Útil .................................................................................. 104
Sugestões para o Abandono ........................................................................................... 104
Mudar os Termos Usados ....................................................................................... 105
Abandonar a Distinção por Completo ..................................................................... 106
Assumir Simetria Entre os Reforçamentos .............................................................. 108
Sugestões Neutras ......................................................................................................... 109
Fazer Mais Investigações ........................................................................................ 109
Focar no Que É Palpável ........................................................................................ 116
Revisar os Termos .................................................................................................. 116
Adaptar a Linguagem ............................................................................................. 116
Esclarecimentos............................................................................................................. 116
Discussões Gerais .......................................................................................................... 120
A Confusão da Distinção ........................................................................................ 120
A Distinção É Semântica ........................................................................................ 121
A Ausência como um Estímulo .............................................................................. 123
Operações e Efeitos ................................................................................................ 126
Condições Pré-mudança e Pós-mudança ................................................................. 128
Implicações Sobre o Conceito de Reforçamento ..................................................... 131
Implicações Sobre o Conceito de Reforçadores ...................................................... 132
11

Implicações para o Conceito de Reforçadores Condicionados ................................. 140
Implicações do Abandono da Distinção Sobre o Conceito de Punição..................... 146
Implicações do Conceito de Operação Motivadora para a Distinção ....................... 148
Considerações Finais.......................................................................................................... 154
Limites do Presente Estudo ............................................................................................ 157
Sugestões para Trabalhos Futuros .................................................................................. 159
Em Direção à Uma Nova Proposta de Distinção ............................................................ 162
Referências ........................................................................................................................ 167
Apêndice............................................................................................................................ 175

Lista de Figuras
Figura 1 - Organização hierárquica e interrelação entre os subtópicos da seção “Resultados e
Discussão”.................................................................................................................................51“subtração de uma condição em que a atenção estava ausente”
e “fuga de uma tarefa” com “acesso a uma condição em que a tarefa estava ausente”. Essas
descrições por mais que inconvenientes e não convencionais, ilustram essas consequências
diferentes poderiam ser descritas cada uma em sua forma oposta (ainda referindo-se a uma
mesma mudança).
A noção de que a distinção pode ajudar a distinguir mudanças ambientais que podem
estar mantendo um comportamento já foi discutida a partir das vantagens práticas apontadas
por Chase (2006) e Iwata (2006) sobre distinção. Aqui, Baron e Galizio (2005) a
apresentaram não como uma vantagem, mas como uma possibilidade explicativa para a
manutenção do comportamento. O exemplo de Iwata et al. (1994) ilustra o mesmo conflito: as
diferentes mudanças são distinguíveis por serem de categorias supostamente diferentes ou por
serem mudanças diferentes em si? Como identificar que tipo de mudança é de um tipo ou de
outro, antes de identificar sequer quais as mudanças envolvidas? O equívoco anterior de
Baron e Galizio (2005) acaba sugerindo que o abandono da distinção tampouco ajuda na
distinção entre reforçamentos para uma mesma resposta (o que vai contra a vantagem do
abandono apontada por Nakajima, 2006).
O segundo exemplo apresentado por Baron e Galizio (2005) para ilustrar a distinção
positivo/negativo, sendo usada para diferenciar duas mudanças diferentes para uma mesma
resposta, foi o de Crowley (1972) no qual o autor propôs que o uso de drogas seria,
inicialmente, mantido por reforçamento positivo, mas que, ao longo do tempo, passava a ser
83

controlado negativamente pelas condições produzidas pela abstinência da droga. Esse
exemplo acaba sendo um pouco especulativo, até porque a operação observável (adição de
droga) continua sendo a mesma em qualquer instância do uso da droga. Ainda assim, pode
existir valor em se investigar que variáveis fizeram tanto Crowley, como outros autores
(citados por Baron e Galizio, 2005) acreditarem que existe alguma diferença entre os dois
tipos de uso. Isso porque caso essas diferenças existam, as diferenças no controle do
comportamento de usar drogas em seu início e após o estabelecimento dos efeitos de
abstinência poderiam indicar diferentes variáveis sobre as quais intervir quando se trata de um
caso ou de outro.
A Distinção Tem Função Comunicativa
Lattal e Lattal (2006) citaram dois tipos diferentes de argumentação sobre a forma de
falar sobre conceitos. Por um lado, Hineline (1980), defendia descrições precisas dos
conceitos, por outro, Bailey (1991) defendia que o importante é comunicar os conceitos de
forma útil a despeito de sua precisão. Em maior consonância com Bailey, Lattal e Lattal
sugeriram que a distinção entre reforçamento positivo e negativo, embora imprecisa, persistirá
enquanto tiver uma função comunicativa – sem especificar exatamente qual seria. A seguir,
serão apresentadas algumas funções comunicativas específicas mencionadas pelos autores.
Evidenciar Que se Está Tratando de Eventos Ambientais. Baron e Galizio (2005)
apontaram para a possibilidade de que o uso da distinção talvez acabe favorecendo a noção de
que a análise do comportamento trata de eventos ambientais e não cognitivos ou fisiológicos.
Ser Entendida em Contextos Leigos. Para Lattal e Lattal (2006), mesmo que a
distinção positivo/negativo seja conceitualmente ambígua, ela deve ter sido mantida também
porque pode ser entendida facilmente em contextos fora da análise do comportamento, como
escolas, empresas e hospitais. Essa fala se contrasta com os argumento de Sidman (2006) de
que a distinção é especialmente confusa para novos alunos e leitores. Nesse sentido, seria
84

interessante ver uma pesquisa que investigasse a efetividade de um procedimento de ensino
que usa a distinção e outro que não usa.
Distinguir Estímulos Usados em Áreas Diferentes de Atuação. Outra possibilidade
apresentada por Baron e Galizio (2005) é que a distinção pode estar sendo mantida por ser útil
em oferecer uma forma simples de se referir a estímulos usados em áreas diferentes de estudo.
De um lado, os reforçadores tipicamente usados em estudos sobre esquemas de reforçamento,
escolha, controle de estímulos etc. (reforçadores positivos) e do outro os reforçadores usados
em delineamentos de fuga e esquiva (reforçadores negativos).
A Distinção Tem Função Cultural
Chase (2006) e Lattal e Lattal (2006) sugeriram que a distinção entre os reforçamentos
positivo e negativo podem estar simplesmente cumprindo alguma função cultural e
apresentaram alguns argumentos para isso, sem especificar quais seriam tais funções culturais.
Chase afirmou que a distinção, enquanto conceito, é ilógica no sentido de que o controle
jamais pode ser atribuído a um tipo de reforçamento e não ao outro. Ao mesmo tempo,
justificou que sua existência acaba sendo lógica no sentido de que seu uso segue as leis do
comportamento e é mantida por uma comunidade verbal.
Lattal e Lattal (2006), de forma similar, apontaram que a manutenção da distinção
pode ser atribuída a contingências históricas e culturais. Citam Vollmer (1999) quando diz
que práticas verbais são muito difíceis de mudar e Harris (1977) que disse que práticas
histórico-culturais persistem porque funcionam de alguma forma dentro da cultura. Além
disso, a função cultural da distinção pode se aplicar não somente à análise do comportamento,
mas à cultura ocidental de maneira geral. Isso porque os termos positivo/negativo podem ser
encontrados desde o Antigo Testamento até o princípio de Spencer-Bain, a lei do Efeito de
Thorndike e o condicionamento operante de Skinner. Outro fator que pode ter perpetuado a
85

distinção seria a sua institucionalização como critério legal a respeito de quais intervenções
podem ou não ser aplicadas.
Lattal e Lattal (2006) citam também alguns exemplos de autores que já teriam
apontado as falhas lógicas em conceitos da área, mas cujos conceitos foram mantidos em uso
apesar disso. Hearst (1975) sobre a distinção operante/respondente, Dinsmoor (1954) sobre a
lei do efeito negativa e Zeiler (1972) e Lattal e Poling (1981) que argumentaram contra a
descrição de eventos independentes da resposta como “reforçamento não contingente” (ver
Poling & Normand, 1999; Vollmer, 1999).
Baron e Galizio (2005), por sua vez, concordaram com essa e outras explicações
apresentadas por Chase (2006) como possíveis fatores responsáveis pela manutenção a
distinção. Ainda assim, defenderam que se a distinção não pode ser baseada em fundamentos
lógicos ou conceituais ela em nada está acrescentando a uma análise comportamental. Esse
ponto é ilustrado por Moore (2008) ao descrever como o comportamento verbal do cientista
pode ser controlado por múltiplas variáveis. O autor descreve uma contingência na qual uma
resposta verbal pode ser tanto controlada pelos dados experimentais produzidos e/ou
estudados, quanto por tradições sociais e culturais. Assim, a resposta verbal pode tanto
produzir um reforçador natural relacionado à melhor compreensão, predição e controle do
comportamento, como por reforçadores sociais e culturais arbitrários. Isso significa que nem
sempre uma prática verbal acerca da descrição do comportamento é selecionada por ser a
mais eficaz em descrevê-lo.
Sobre isso, se aplica o mesmo já havia sido comentado sobre o caso dos números
decimais apresentado (com base em Thomas, 1920): mesmo que a mudança de práticas
culturais pudesse ser benéfica em um sentido, o custo para de aplicar tais mudanças em
aspectos tão enraizados de uma comunidade podem ser justificativa suficiente para não a
fazer.
86

Alertar Sobre o Reforçamento Negativo. Uma explicação cultural específica para a
manutenção da distinção apresentada Baron e Galizio (2005) - resgatada de Michael (1975) -
foi a de que a distinção entre positivo/negativo poderiaajudar a alertar as pessoas sobre os
aspectos indesejáveis do reforçamento negativo.
Baron e Galizio (2005) apresentam três contrapontos de Michael (1975) a essa noção:
1) se a distinção é ambígua e difícil de ser feita, a recomendação de usar uma forma de
reforçamento em favor de outra seria difícil de ser seguida; 2) é uma questão empírica se os
procedimentos chamados de reforçamento negativo são ou não indesejáveis; e 3) faria sentido,
de qualquer forma, manter uma distinção conceitual básica por conta de possíveis implicações
sociais?
Sobre esse último ponto, vale comentar que se houver de fato implicações sociais
ligadas ao uso de reforçamento positivo e negativo, isso significaria que existem diferenças
entre os dois processos. Nesse sentido, faria sentido manter a distinção conceitual por conta
dessa diferenças nos processos.
De toda forma, Baron e Galizio (2005) demonstram concordar com os três pontos de
Michael (1975) e adicionam que mesmo efeitos indesejados provocados por estímulos
dolorosos podem ser compensados pela severidade do transtorno que se está evitando. Além
disso, citam Perone (2003) para afirmar que procedimentos nomeados como reforçamento
positivo também trazem aspectos indesejados como privação e perda de interessem em outras
atividades. Para eles (Baron e Galizio, 2006a), assim como para Michael (1975), preferir
intervenções agradáveis ao invés de desagradáveis não é o mesmo que preferir reforçamento
positivo do que negativo.
Sidman (2006) criticou a noção de Michael (1975) e Baron e Galizio (2005) de que o
que é indesejável (ou não) seja uma questão empírica. Sidman afirma que essa é, na verdade,
uma questão social e, como ciência, a análise do comportamento apenas pode oferecer para a
87

sociedade os dados produzidos. O autor criticou também o questionamento sobre se uma
ciência deveria relacionar seu conteúdo com problemas da vida cotidiana. Para ele, espaços
destinados para temas considerados importantes pela sociedade é necessário para a
sobrevivência de qualquer ciência.
Sobre isso, Baron e Galizio (2006a) ressaltaram seu ponto inicial: qualquer possível
utilidade da distinção nesse sentido será limitada pela sua falta de clareza. Isso é piorado pelo
fato de que muitos dos problemas que tornam o reforçamento negativo indesejável são
também encontrados em procedimentos convencionalmente chamados de reforçamento
positivo. Além disso, a prática de manter uma distinção numa ciência básica por conta de
possíveis implicações sociais ainda assim é uma prática arriscada e evitada por outras
ciências.
Apesar de direcionadas, as falas dos autores parecer não estar abordando as mesmas
coisas. Se o ponto de Michael (1975) era dizer que o laboratório irá apontar o que as pessoas
devem desejar ou não, a crítica de Sidman (2006) de que o que é desejável ou não é uma
questão social e não empírica é muito válida. Isso é verdade no sentido de que a análise do
comportamento descreve os processos comportamentais, mas não define quais serão os
eventos reforçadores ou não para as pessoas. Entretanto, o argumento de Michael pode abrir
espaço para outra interpretação. Supondo que o que é considerado indesejável para a
sociedade fosse a existência de efeitos colaterais, o que responderá que procedimentos
produzem ou não esses efeitos será a experimentação empírica. Sobre esse ponto, Sidman e
Michael pareceriam de acordo (mesmo que discordem sobre o que mostram os dados desses
experimentos).
Sidman (2006) também aponta que a análise do comportamento, enquanto ciência
precisa necessariamente relacionar seu conteúdo com problemas cotidianos da sociedade. Isso
é apresentado como um contraponto ao argumento de Baron e Galizio (2005) e Michael
88

(1975), mas não há por que pensar que ele se oporia a isso. Michael parece, inclusive, fazer
uma separação semelhante com a de Sidman sobre o que é definido social ou empiricamente.
Estes deveriam apenas descrever os fenômenos básicos observados, sem atribuição de valores
éticos, por exemplo. Baron e Galizio (2006a) afirmam concordar com essa afirmação de
Michael (1975).
Ampliar a Aceitação da Análise do Comportamento. Segundo Lattal e Lattal
(2006) apresentam uma função cultural específica da apesar de intervenções baseadas no que
é chamado de reforçamento positivo não serem diferentes das baseadas no que é chamado de
reforçamento negativo, as primeiras têm mais chances de serem aceitas socialmente. É
possível que, para a população geral, o termo “positivo” indique o “tom” ou “intenção” do
programa e do aplicador. Ele se aplica quando as descrições são feitas de forma “positiva”
como em “aumentar a produtividade” ou busca por “satisfação”.
A vantagem do uso da distinção, nesse caso, é acidental. Conceitualmente, os termos
“positivo” e “negativo” nada tem a ver com “bom” e “ruim”, mas o entendimento público de
que sim tornaram as intervenções “aditivas”, ou mais especificamente “descritas como
aditivas” mais propensas a serem aceitas. Sobre isso, ainda vale o alerta de Baron e Galizio
(2006a) de que se a população descobrisse que, em tese, não há qualquer relação entre as duas
coisas, isso poderia ser malvisto.
A Distinção se Dá por Outro Aspecto
Relações Temporais, Relações com Outras Variáveis ou Papel em Discriminações.
Baron e Galizio (2005) trouxeram algumas possíveis diferenças, apresentadas inicialmente
por Michael (1975), entre os reforçamentos positivo e negativo (que não relacionadas ou
adição ou subtração) que pudessem explicar o uso da distinção. A primeira delas diz respeito
a temporalidade, relações com outras variáveis ou papel em discriminações. Nem Michael
nem Baron e Galizio apresentaram explicações precisas desses três fatores ou porque eles
89

foram apresentados em conjunto. Ainda assim, apresentam os contra-argumentos de Michael
a essa noção. Segundo ele, uma distinção a partir dessas particularidades não se sustentaria
porque as propriedades das mudanças reforçadoras se diferem tanto entre tipos diferentes de
reforçamento positivo quanto tipos diferentes de reforçamento negativo. Além disso, há muito
mais semelhanças entre os chamados reforçamentos positivo e negativo do que diferenças.
Por exemplo, quando analisadas as diferenças no comportamento a partir de alterações na
magnitude, atraso ou esquemas de apresentação.
Abruptidão da Mudança. Outra possibilidade resgatada por Baron e Galizio (2005) é
a de que talvez mudanças nas condições de estímulo fossem mais abruptas no reforçamento
negativo do que no positivo. Weiss e Laties (1961) sugeriram que a mudança de temperatura
parece produzir resultados mais confiáveis do que o alimento por conta de sua imediaticidade.
Para Michael (1975), mesmo que isso fosse verdade, essa distinção continuaria não sendo
fundamental. Taxas de mudança são parâmetros de qualquer reforçamento e se Weiss e Laties
tivessem utilizado atrasos nas mudanças de temperatura os efeitos seriam similares aos do
alimento. Além disso, já é sabido que a forma de administração de uma mesma droga pode
afetar grandemente os seus efeitos reforçadores por conta da velocidade de sua ação no
organismo.
Mecanismo Fisiológico Envolvido. Em retomada à Michael (1975), Baron e Galizio
(2005) apontam que é possível que diferenças nos processos ou estruturas fisiológicas
justificassem a distinção entre os reforçamentos positivo e negativo. Os dados disponíveis na
época de Michael o fizeram concluir que a fisiologia não ajudava a elucidar a distinção. Ainda
assim, Baron e Galizio se propuseram a investigar se dados posteriores a ele poderiam ser
úteis. Segundo seus achados, estudos iniciais com fármacos sugeriram que drogas teriam
ações diferentes sobre comportamentos mantidos por reforçamento positivo ou negativo.
Entretanto, outros estudos (Keller & Morse, 1964) teriam mostrado que as diferenças entre os90

efeitos teriam muito mais a ver com as taxas de resposta do que com o tipo de reforçamento
envolvido. Sistemas dopaminérgicos já foram associadas a sistemas de recompensa do
cérebro enquanto outros como o da amígdala e hipotálamo foram associados a processos de
dor e medo. Entretanto, outros experimentos mostraram que mesmo em esquemas envolvendo
fuga/esquiva padrões dopaminérgicos semelhantes foram observados. Outro ponto é que as
relações estabelecidas por esses campos entre “centros de recompensa e punição” não
correspondem diretamente às definições usadas na análise do comportamento.
A partir disso, Baron e Galizio (2005) concluem que apesar de após 50 anos de
literatura analisando a psicofisiologia do reforçamento, nenhuma conclusão clara pode ser
tirada sobre a relação entre os tipos de reforçamento e mecanismos biológicos específicos.
Vale comentar que desde aquela época novas pesquisas continuaram sendo feitas e algumas
apontam para possíveis diferenças mecanismos subjacentes ao reforçamento positivo e
negativo (e.g., Xu et al., 2021). Eles ressaltam, entretanto, que não houve diferenças
comportamentais evidentes entre ambos. Nessa direção, pesquisas que analisem as afirmações
de Michael (1975) e Baron e Galizio (2005) frente a esses novos dados poderiam ser valiosas.
Emoções Envolvidas. Junto à sua análise anterior, Baron e Galizio (2005)
apresentaram a possibilidade de que processos emocionais específicos pareciam ser eliciados
por estímulos aversivos e apetitivos (Mowrer, 1960). Entretanto, segundo os autores, os dados
da literatura não favoreceram essa visão. Até então, nenhuma forma de identificar emoções
com base em padrões comportamentais específicos foi desenvolvida. Além do mais, estímulos
que não provocam respostas afetivas (observáveis) já foram usados eficazmente como
reforçadores.
Ainda questionando o papel das respostas emocionais no reforçamento positivo e
negativo, Baron e Galizio (2005) apresentam dados que mostram que respostas podem ser
mantidas pela produção de choques (Morse & Kelleher, 1977; Pear, 2001), mas admitem que
91

esse dado é questionável porque só teria sido demonstrado diante de condições específicas
com espécies específicas. Michael (2006), entretanto, responde a isso acrescentando outros
dados (e.g., Azrin e Holz, 1966) que mostraram que choques podem funcionar tanto como
estímulo discriminativo como reforçador positivo condicionado. Isso sustenta o argumento de
Baron e Galizio de que dificilmente pode haver uma relação clara entre a distinção entre os
reforçamentos positivo e negativo e os comportamentos respondentes eliciados pelos
estímulos envolvidos. Essas afirmações parecem se basear na noção de que as respostas
emocionais diante de um choque como reforçador negativo, um choque como punidor e um
choque como reforçador positivo sejam as mesmas. Isso pode ser verdade em partes, mas
muitos aspectos podem se diferenciar – isso é algo que precisaria de alguma fundamentação
experimental.
Sentimentos Envolvidos. Outra sugestão de Baron e Galizio (2005) foi que os
sentimentos associados com a produção ou eliminação de estímulos reforçadores poderiam ser
responsáveis pela manutenção da distinção. Enquanto Thorndike (1911) descreveu
reforçadores positivos como satisfatórios, agradáveis e prazerosos, Mowrer (1960) disse que a
retirada de estímulos aversivos era acompanhada de sentimento de alívio.
Um primeiro contraponto apresentado pelos próprios autores (Baron e Galizio, 2005) é
que basear a distinção nas diferenças entre sentimentos (respostas do organismo a eventos
ambientais) implicaria em novas dificuldades para acessar esses eventos, tendo que recorrer,
por exemplo, a relatos verbais. Isso iria na contramão de Skinner (1953/2014) que, apesar de
não ter problemas com as descrições de sentimentos em si, recorreu ao ambiente como
explicação causal para comportamentos. Basear-se em relatos verbais, além pouco confiável,
pode ser, em alguns casos, completamente inviável - em estudos com animais e crianças
pequenas, por exemplo.
O segundo contraponto é que, mesmo que fosse aceito se basear em relatos verbais,
92

as distinções continuariam não sendo claras. Segundo Baron e Galizio (2005):
De fato, a interrupção de estados de dor ou ansiedade pode evocar estados semelhantes
ao prazer (por exemplo, pessoas com enxaqueca relatam sensações eufóricas quando a
dor de cabeça é aliviada), e a cessação de incômodos leves também pode ser sentida
como prazerosa (como ao coçar uma coceira), da mesma forma que a interrupção de
estados prazerosos pode ser relatada como aversiva (Solomon, 1980; Solomon &
Corbit, 1974). (p. 94).
Esse segundo ponto pode ser questionado. Talvez fosse possível que um indivíduo
aprendesse com ajuda de sua comunidade verbal a ficar sob controle e indicar
diferencialmente os diferentes estados corporais por ele sentidos. Em outras palavras, pode ser
que os sentimentos envolvidos em diferentes contingências fossem de fato diferentes e
perfeitamente distinguíveis. Mas o que importa é que 1) como já foi indicado, se basear em
relatos verbais geraria problemas de precisão e confiabilidade, muitos deles gerados pelo fato
de que essas descrições são ensinadas por membros específicos de uma comunidade verbal
que não necessariamente estão ensinando da mesma forma; e 2) mesmo que sentimentos
pudessem ser precisamente indicados, isso não mudaria o fato de que as causas, e, portanto, os
alvos de intervenção continuariam sendo as variáveis ambientais (Skinner, 1953/2014).
Presença de Respostas Competidoras. Outra diferença apontada por Baron e Galizio
(2005) que poderia ser responsável pela manutenção é o fato de que, no reforçamento
negativo, o estímulo está presente antes da resposta e, portanto, tais estímulos podem
eliciar/evocar respostas que compitam com a resposta selecionada pelos experimentadores.
Segundo essa lógica, isso não se aplicaria ao reforçamento positivo porque não há estímulos
antecedentes que pudessem eliciar ou evocar respostas competidoras.
Essa proposta teria sido apresentada inicialmente por Catania (1973), e Hineline
(1984), que havia criticado a distinção pela adição ou pelo acréscimo, reconheceu que esse
93

argumento poderia oferecer uma base melhor para uma distinção. Pierce e Cheney (2004)
também endossaram esse argumento. Catania (1992), em retomada ao seu texto anterior,
mencionou as respostas de “tremer” ou “se encolher” critério para nomear como reforçamento
negativo o delineamento de Weiss e Laties (1961).
Baron e Galizio (2005) problematizam essa possibilidade apontando que há tanto
casos em que operações estabelecedoras de reforçadores positivos possam evocar
comportamentos competidores quanto estímulos reforçadores negativos que não evocam ou
eliciam esses comportamentos. Condições estabelecedoras de alimento como um reforçador
frequentemente evocam, por exemplo, respostas de “checar” o comedouro. Da mesma forma,
segundo Baron e Galizio (2005), comportamentos ditos mantidos por reforçamento negativo
como encher um tanque antes que acabe a gasolina ou colocar um alarme para acordar no dia
seguinte não parecem evocar respostas competidoras.
Sobre os exemplos apresentados por Baron e Galizio (2005), vale destacar que a
resposta de “checar o comedouro” pode competir com a resposta desejada, mas
diferentemente do choque, isso necessária de um condicionamento. Um sujeito que não
passou por treino ao comedouro ou por modelagem não tem essas respostas evocadas pela
privação alimentar. Já o choque eliciaria respostas competitivas desde a primeira
apresentação.
Sobre os casos em que respostas competitivas não são emitidas, pode-se considerar as
vezes em que se “enrola muito” para encher um tanque ou se que se “esquece” de colar um
alarme. Isso de alguma forma poderia muito bem ser interpretado como consequênciada ação
de respostas competidoras. Afinal, segundo Sidman (1989/2009) quaisquer respostas de fuga
ou esquiva “não programadas” poderiam ser interpretadas como um efeito indesejável quando
se usa a coerção. Outro ponto é que Baron e Galizio (2005) não explicitaram as operações
motivadoras agindo nesses casos, dificultando uma análise mais profunda.
94

Fica parecendo que mesmo que respostas competidoras possam existir em
contingências de reforçamento positivo, elas parecem diferir em alguns aspectos. Isso indica
que novas investigações poderiam investigar esse critério como uma nova forma de distinguir
reforçamentos (ou indicar outras possibilidades).
Vale retomar que entre os autores classificados na categoria de “Publicações
Posteriores a Michael (1975)” que abordavam sua crítica (Santos & Leite, 2013) estavam
tanto Pierce (em Pierce & Epling, 1995) quanto Catania (1992), e ambos haviam dado a
entender que concordavam parcialmente com a ambiguidade. Catania (1992) chegou a dizer
que "o reforçamento sempre envolve mudanças na situação do organismo e inevitavelmente
leva a diferenças na resposta antes e depois da mudança" (p. 101).
Severidade das Operações Motivadoras. É possível que a intensidade das operações
motivadoras envolvidas em um comportamento possa estar sendo usada para fazer a distinção
positivo/negativo. Como base para esse argumento, Baron e Galizio (2005) apresentam a
seguinte citação de Sidman (1989/2009):
Prisioneiros são primeiro colocados em solitária e, posteriormente, o contato social
lhes é permitido como reforçamento pela docilidade. Da mesma forma, após serem
submetidos à privação extrema de alimento, podem então obtê-lo como retribuição por
subserviência. Liberdade e alimento podem parecer reforçadores positivos, mas,
quando são contingentes à cessação de privações artificialmente impostas, sua
efetividade resulta do reforçamento negativo; eles se tornam instrumentos de coerção
(Sidman, 1989/2009, p. 61)
Nesse caso, Sidman (1989/2009) recorre à intensidade da privação de alimento ou ao
fato de que a privação foi socialmente estabelecida - e não exclusivamente a adição ou
subtração de estímulos - para classificar uma situação corresponde a reforçamento positivo ou
negativo.
95

Para Baron e Galizio (2005), a abordagem de Sidman (1989/2009) sobre as diferenças
é inovadora, mas acaba sendo limitada pelo fato de que não há formas precisas de mensurar
diferentes operações motivadoras. Além disso, qual seria o critério para determinar a partir de
qual intensidade de operação motivadora um tipo de reforçamento positivo se torna negativo
ou vice-versa?
Isso não foi apresentado por Baron e Galizio (2005), mas Skinner (1953/2014) fez
comentários parecidos a respeito de dores geradas por privações de alimento muito intensas.
Para ele, a privação de alimento que serve como “drive” para a resposta de comer é diferente
da dor gerada pela privação intensa que poderia evocar a mesma resposta.
De alguma forma, Sidman (1989/2009) e Skinner (1953/2014) parecem diferir sobre a
forma de falar sobre os reforçamentos positivo e negativo diante dessas condições.
As pontadas de fome são uma possível fonte de confusão entre privação e estimulação
aversiva. Como a fome é o impulso mais comum, tendemos a modelar nossa
formulação de todos os impulsos com base nela. Mas vimos que as pontadas não são
representativas dos impulsos em geral e que, mesmo no caso da fome, elas exigem
uma formulação separada. Na medida em que se come para reduzir as pontadas de
fome, o comportamento é aversivo. (Skinner, 1953/2014, p. 173)
Enquanto para Sidman (1989/2009) uma intensidade suficientemente alta da operação
estabelecedora parece suficiente para classificar a situação como reforçamento negativo,
Skinner (1953/2014) distingue a privação de alimento da dor por ela gerada. Isso não foi dito
diretamente, mas poder-se-ia entender que, para Skinner, nos casos em que uma privação
intensa elicia dores abdominais, a resposta de comer poderia estar sendo mantida tanto por
reforçamento positivo quanto negativo, isto é, por duas mudanças ambientais distintas ao
invés de uma só que é mais ou menos intensa.
Por outro lado, Skinner (1953/2014) também comenta:
96

A retirada de um reforçador positivo tem, por definição, o mesmo efeito que a
apresentação de um negativo. Tirar privilégios não é muito diferente de estabelecer
condições aversivas [...]. Suponha que tenhamos privado um homem da permissão
para deixar um campo militar até que uma determinada tarefa seja realizada, e suponha
que, em ocasiões anteriores, a realização de tarefas semelhantes tenha sido seguida
pela restauração desse privilégio. Teríamos gerado um estado de privação, no qual o
comportamento que foi reforçado pela devolução de privilégios estará fortalecido, ou
teríamos apresentado uma condição aversiva da qual o indivíduo só pode fugir
realizando a tarefa exigida? É possível, é claro, que tenhamos feito ambos. Na prática,
a distinção pode parecer de pouca importância, mas certos efeitos colaterais dependem
da medida em que cada um dos dois fatores está envolvido. (p. 173).
Nesse caso, Skinner (1953/2014), mesmo antes de Sidman (1989/2009) parece ter
indicado que apesar de o efeito principal (fortalecedor da resposta) ser o mesmo, a diferença
nos efeitos colaterais produzidos é diferente. Isso aponta para a necessidade investigação
específica sobre as diferenças entre efeitos colaterais como elemento chave para a distinção
entre os reforçamentos positivo e negativo (no lugar da adição e subtração).
Partindo desse princípio, para definir quando uma determinada contingência de
reforçamento seria positiva ou negativa, um novo critério de distinção para substituir o de
adição/subtração seria a presença ou não de efeitos colaterais. Nesse sentido, algumas
investigações a respeito dos efeitos colaterais (pelo menos como apontados por Sidman,
1989/2009) já foram realizadas.
Fontes e Shahan (2020) analisaram os efeitos colaterais descritos por Sidman, frente a
dados experimentais - especialmente no contexto da punição. Os autores confirmaram parte
desses efeitos, como a punição condicionada, a fuga, a esquiva e a agressão induzida, mas
também mostraram que esses efeitos são variáveis e dependem de fatores como intensidade
97

do estímulo, contexto e presença de reforçamento alternativo. Quanto ao contracontrole,
afirmaram que não há evidência experimental suficiente para tratá-lo como um conceito
particular.
Perone (2003) também criticou o “endosso abrangente” de Sidman ao reforçamento
positivo, apontando que reforçadores positivos podem gerar efeitos colaterais semelhantes aos
do controle aversivo. Ele cita exemplos em que reforçadores positivos, por dependerem de
privações intensas ou relações verbais complexas, acabam gerando queixas ou
comportamentos de fuga. Além disso, apresenta dados experimentais que mostram que
estímulos considerados aversivos podem não funcionar como reforçadores negativos, mas
como punidores, sugerindo que a função de um estímulo pode variar dependendo da
contingência em que está inserido.
Essa discussão mostra que, para que um critério baseado em efeitos colaterais pudesse
ser adotado, muito ainda precisaria ser investigado para se definir mais precisamente quais
são eles e como identificá-los.
Saliência ou Discriminabilidade. Chase (2006) sugere que a distinção pode ter sido
mantida porque talvez uma direção da mudança (positiva ou negativa) seja mais
discriminável, mensurável ou mais facilmente descrita do que a outra direção de mudança.
Vale comentar que há uma diferença grande entre ser discriminável ou mensurável e ser mais
facilmente descrita. Quando se diz que calor foi adicionado ou frio foi subtraído, pode-se
preferir uma descrição à outra. Ainda assim, o estímulo discriminativo para esse tato foia
própria mudança de temperatura (e.g., de 10 para 20 °C) - e esse também é o fenômeno
mensurável. Nesse sentido, as diferentes direções existem apenas enquanto descrições, mas o
fenômeno em si continua o mesmo.
Propriedades Particulares dos Estímulos Usados. Uma última explicação
apresentada para a manutenção da distinção foi a de Lattal e Lattal (2006) que sugeriram que
98

é possível que as diferenças comportamentais entre os reforçamentos positivo e negativo
tenha mais a ver com diferenças particulares entre os estímulos usados nesses estudos do que
com categorias mais amplas de estímulo ligados separados pelos critérios de apresentação e
remoção. Skinner (1953/2014) quando discute os efeitos de uma luz forte, um som alto ou um
choque afirma “estímulos aversivos eliciam reflexos e geram predisposições emocionais que
muitas vezes interferem no operante a ser reforçado. Assim é difícil observar o efeito do
reforçamento negativo isoladamente” (p.188).
Nesse sentido, pode ser que as diferenças até então observadas entre reforçadores
positivos e negativos possam sim, estar relacionadas aos estímulos específicos até então nos
estudos de cada tipo. Entretanto, ainda é possível que algum fatores ainda possam determinar
se esses estímulos formam ou não um grupo coeso sobre algum aspecto. Como discutido, os
estímulos eliciadores relacionados a condições antecedentes de reforçamento positivo (e.g.,
uma privação) parecem escassos, enquanto os ligados a reforçamento negativo que foram
estudados estão se fizeram bastante presentes.
Sugestões para a Manutenção
Falas em que os autores apontaram para a necessidade de se fazer algo relacionado ao
uso da distinção entre os reforçamentos positivo e negativo. Dentre os trechos classificados
como “Sugestões para a Manutenção”, identificou-se falas que sugeriam manter a distinção
com ressalvas, fazer investigações ou rever os termos usados.
Rever os Termos Usados
Sidman (2006) declara que abraçaria novos termos que lidassem com os problemas
apresentados por Baron e Galizio (2005), mas que mantivessem as noções de fuga e esquiva
como formas de reforçamento. Ele sugere que uma possibilidade de manter a distinção
lidando com a confusão gerada por ela no ensino de análise do comportamento seria substituir
99

o termo “reforçamento negativo” por algo que não gerasse a preconcepção de equivalente à
punição – mas que ele não teria conseguido pensar em um termo.
Manter a Distinção com Ressalvas
Baron e Galizio (2005) sugeriram que se a área optar por manter a distinção entre os
dois tipos de reforçamento, cautela deve ser tomada na forma como os termos serão usados. A
seguir, alguns autores apresentaram formas específicas em que essa cautela pudesse ser
mantida. Entre elas, o reconhecimento das ambiguidades, o abandono da distinção em casos
complexos, a descrição precisa das condições envolvidas e um ensino inicial da distinção.
Reconhecer a Ambiguidade. Chase (2006) propôs que, no ensino da análise do
comportamento, seria importante apontar para os alunos que todos os exemplos de um tipo de
reforçamento envolvem também o outro tipo. Na mesma direção, Lattal e Lattal (2006)
ressaltaram a importância de que estudantes e profissionais da área compreendam as
dificuldades lógicas e empíricas da distinção (tal como outras complexidades da disciplina).
Por fim, Baron e Galizio (2005) apontaram que lembrar das ambiguidades inerentes à
distinção talvez já diminua as chances de que ela seja usada como base para justificar decisões
éticas ou práticas.
Abandoná-la em Casos Complexos. Após apresentar seu exemplo hipotético já
mencionado do rato no qual dois estímulos foram condicionados por vários outros, Michael
(1975) sugeriu que, pelo menos nos casos complexos nos quais determinados estímulos foram
condicionados a vários estímulos, a distinção deveria ser abandonada. Vale lembrar que
Michael, em seguida, complementou sua fala dizendo que casos complexos desse são
universalmente humanos e, enquanto ciência dedicada aos problemas do ser humano, a
distinção tornar-se-ia inútil.
100

Descrever Precisamente as Condições. Iwata (2006) se posicionou dizendo que não
via prejuízo na manutenção da distinção positivo/negativo desde que as condições rotuladas
como positivas ou negativas fossem bem descritas.
Ensinar a Distinção Inicialmente. Nakajima (2006) sugere que uma análise a partir
de duas perspectivas pode trazer uma melhor compreensão sobre casos. Apesar disso, alunos
teriam dificuldades para aprender uma perspectiva de dois lados sem antes terem aprendido a
analisar casos a partir de um ponto de vista fixo. Dessa forma, Nakajima recomenda que uma
abordagem de perspectiva única deveria ser ensinada inicialmente.
Fazer Mais Investigações
Investigar as Definições Existentes. Sidman (2006) sugeriu que os problemas de
definição apontados por Baron e Galizio (2005) e reconhecidos por ele, deveriam levar não a
um abandono completo da distinção, mas a pesquisas que ajudem a esclarecer as definições já
existentes. O próprio artigo de Santos e Leite (2013) é um bom exemplo disso.
Abandonar um conceito de uma hora para a outra poderia deixar uma lacuna que faz
mais mal do que bem. Se problemas de definição fossem encontrados entre os conceitos de
discriminação e generalização, abandoná-los (ao invés de aprimorá-los) tornaria difícil falar
sobre controle estímulos. Talvez a questão principal com a distinção positivo/negativo, como
já comentado, não é que a forma como se fala das mudanças ambientais (e.g., adição ou
subtração) precise ser descartada. A pergunta é: o que é ganho ao se criar uma categoria
específica para descrições de um tipo ou de outra? Como já discutido, se o critério de adição e
subtração parece arbitrário, talvez outros fatores o estejam controlando a distinção.
Investigar Mudanças Paramétricas. Iwata (2006) havia argumentado contra a
dificuldade de classificação, dizendo que mesmo nos casos em que as mudanças de estímulo
ocorrem num contínuo, elas ainda envolvem aumento ou diminuição de uma característica do
estímulo. Isso parece levar a conclusão de que, mesmo nesses casos, mudanças reforçadoras
101

ainda poderiam ser classificadas como positivas ou negativas. Apesar disso, o autor
completou que “se tais mudanças paramétricas funcionam como reforçamento positivo ou
negativo requer uma análise mais aprofundada” (p. 122), destacando (em dois momentos
diferentes em seu texto) a importância dos apontamentos de Baron e Galizio (2005) para isso.
Iwata afirma que uma investigação dessa natureza seria importante não só para o estudo do
reforçamento, mas também da extinção e punição.
Vantagens do Abandono
Baron e Galizio defenderam que há benefícios em se focar mais no contexto completo
de uma mudança ambiental reforçadora do que na dicotomia adição/subtração. Além deles,
Nakajima (2006) também apresentou uma suposta vantagem do abandono que será discutida
mais adiante. Dessa forma, os pontos a seguir representam as falas em que os autores
apontaram benefícios relacionados ao abandono da manutenção entre os reforçamentos
positivo e negativo. Dentre os trechos classificados como “Vantagens do Abandono”,
identificou-se falas que apontavam que adotar uma perspectiva que não faz uso da distinção
geraria menos distorções, melhoraria a descrição das mudanças e evidenciaria as mudanças
envolvidas no reforçamento.
Gera Menos Distorções
Segundo eles (Baron e Galizio, 2006a), mesmo falando apenas em reforçamento, nada
impede que um analista do comportamento possa enfatizar ou defender o uso de determinadas
práticas com base no objetivo do tratamento. A vantagem de se abandonar a distinção estaria
no fato de que isso seria feito sem distorções ou usos indevidos dos termos.
Melhora a Descrição das Mudanças
Com base nos diversos caso já apresentados, em seu segundotexto de resposta, Baron
e Galizio (2006b) comentaram que os eventos reforçadores são “melhor descritos em termos
de uma mudança na estimulação, independentemente da direção dessa mudança” (p. 274).
102

Eles citam o exemplo do participante humano que trabalha por dinheiro. Nesse caso, não
haveria diferença se o ganho do dinheiro é indicado pelo acendimento de uma luz apagada ou
desligamento de uma luz acesa e, dada a impossibilidade ou arbitrariedade de se classificar a
mudança como positiva ou negativa, acaba sendo mais preciso descrever a mudança sem
direção específica. Vale ressaltar que o que Baron e Galizio chamaram de “direção da
mudança” refere-se a escolher descrever a mudança como adição ou subtração. Naturalmente
uma direção na mudança continua existindo: a temporal.
Distinguir Dois Reforçadores para a Mesma Resposta
Por último, Nakajima (2006) nomeia o abandono da distinção como abordagem de
“duas faces”, se referindo ao fato de que ela olha para os dois lados da mudança. A partir
disso, o autor afirma que pode existir uma vantagem nessa abordagem já que ela reconhece
que tanto o reforçamento positivo como o negativo possam estar operando num mesmo caso.
Esse é exatamente o argumento contrário ao apresentado por Chase (2006) e presente
também em Iwata (2006). Para eles, uma vantagem da manutenção seria a de que ela ajuda a
distinguir duas mudanças para uma mesma resposta. Como já discutido, não há motivos para
pensar que uma coisa dependeria da outra. Mudanças diferentes são distinguíveis porque são
eventos diferentes e não porque são ou não de tipos diferentes.
Sobre dizer que a distinção ajuda na separação de tipos diferentes de reforçamento
para uma mesma resposta, poder-se-ia dizer também que ela atrapalha na separação de tipos
iguais de operações (e.g., dois reforçadores positivos) para uma mesma resposta. E sobre dizer
que o abandono da distinção ajuda na distinção porque “olha para os dois lados”, os dois lados
olhados são, na verdade, descrições opostas de uma mesma mudança, e não duas mudanças
diferentes. Um exemplo de que o abandono não ajuda na distinção foi apresentado no
subtítulo “Explicações para a Manutenção” no subtópico “Distinguir dois Reforçadores para a
Mesma Resposta”.
103

Talvez uma sugestão a ser tirada seja que é necessário estar atento para identificar
diferentes mudanças ambientais, mas essas mudanças não necessariamente precisam diferir
em seus tipos.
Explicações para o Abandono
Apesar de o abandono da distinção não ter sido adotado amplamente na comunidade
analítico-comportamental, foram apresentados alguns possíveis motivos pelos quais alguns
autores estejam sugerindo o abandono da distinção entre os reforçamentos positivo e negativo.
Em sua maioria, explicações foram apresentadas por autores contra a distinção ou incertos em
seções específicas dedicadas a especular as razões pelas quais a distinção foi mantida. Dentre
os trechos classificados como “Explicações para o Abandono”, identificou-se falas que
apontavam para a distinção como sendo funcional em algum sentido ou controlada por outro
aspecto que não a adição/subtração.
A Distinção é Mal-entendida
Para Sidman (2006) o desconforto de Baron e Galizio (2005) com a distinção pode
originar da sensação de que a, por algum motivo, a distinção reflete diferenças no próprio
processo de reforçamento para eles. É nesse ponto que o autor deixa explícito que esse não é o
caso, e que a discussão de Baron e Galizio deveria dissuadir qualquer um que achasse isso.
Sabendo que Sidman (2006), em seu texto como um todo, busca defender a
manutenção da distinção, faltaria entender o que a distinção representa ou então o que ele quis
dizer quando disse “processo”. Se a diferença for apenas descritiva, ele estaria perfeitamente
de acordo com Baron e Galizio (2005). Isso iria, entretanto, na contramão com outras de suas
próprias afirmações nesse e em outros textos. Ao longo do texto o autor sugeriu que é possível
determinar se uma mudança se trata de uma adição ou subtração e, nos casos em que não for,
novas pesquisas deveriam focar em tornar isso possível.
104

Dito isso, outra possibilidade é que ao dizer que os processos são iguais, ele quer dizer
que o efeito (aumento na probabilidade da resposta) é o mesmo, mas que a diferença entre
adição e subtração ainda existe - e que a isso podem ser atribuídos os efeitos colaterais
gerados pelo reforçamento negativo (Sidman, 1989/2009). Ainda assim, não se pode ter
certeza do que a distinção representa exatamente para ele.
A Distinção Não É Mais Útil
Outra explicação apresentada para o abandono da distinção é simplesmente a de que o
que em determinado momento do desenvolvimento da ciência comportamental foi útil, agora
não é mais. Para Marr (2006) uma ciência, inicialmente, pode recorrer a distinções vagas
antes de atingir um maior entendimento dos seus objetos de estudo. Conforme o estudo dessa
ciência avança, pode ser que distinções que eram explícitas possam tornar-se cada vez mais
confusas e até sumirem.
Marr (2006) apresenta alguns exemplos desse fenômeno: 1) chuva e neve podem
parecer muito distintas, mas de uma perspectiva molecular elas tornam-se exatamente iguais;
2) a queda de uma maçã na Terra e a órbita da Lua funcionam a partir do mesmo mecanismo;
3) eletricidade e magnetismo antes eram tratados de forma muito separada, mas hoje sabe-se
que estão intimamente ligados.
Um ponto parecido já havia sido apresentado por Michael (1975) na Introdução.
Michael havia afirmado que talvez os conceitos de reforçamento positivo/negativo se
tivessem sido eficazes na formação de um novo conhecimento por fazerem paralelos com
outros conceitos de fora, mas que seu uso não mais era útil.
Sugestões para o Abandono
Falas em que os autores apontaram para a necessidade de se fazer algo relacionado ao
abandono do uso da distinção entre os reforçamentos positivo e negativo. Dentre os trechos
105

classificados como “Sugestões para o Abandono”, identificou-se falas que sugeriam a
mudança dos termos usados ou o abandono completo da distinção.
Mudar os Termos Usados
Falar de Cada Tipo de Reforçamento. Outra sugestão de Sidman (2006) ligada à
revisão dos termos usados na distinção é a de abandonar a distinção entre positivo e negativo
e falar de cada tipo diferente de reforçamento. Como exemplos, ele cita o reforçamento por
comida, água, sexo, fuga e esquiva. Os exemplos citados parecem contrastar com a sugestão
de abandonar a distinção porque dois dos exemplos dele (i.e., fuga e esquiva) representam
tipos de reforçamento negativo. Diferentemente dos outros exemplos, Sidman não especificou
os reforçadores envolvidos na fuga/esquiva, mas o fez para os casos tipicamente considerados
como reforçamento positivo. Faria mais sentido, por exemplo, mencionar, no lugar, choques,
tons altos e jatos de ar quente, por exemplo.
Talvez esse contraste mostre que Sidman (2006) não esteja completamente disposto a
abandonar a distinção. Como ele mesmo havia afirmado, o autor só aceitaria novos termos
que mantivessem as noções de fuga e esquiva como formas de reforçamento. De toda forma, a
possibilidade apresentada pelo autor (levando em conta as considerações feitas) talvez fosse
benéfica. Como já haviam sugerido Lattal e Lattal (2006), é muito possível que quaisquer
diferenças atribuídas aos reforçamentos positivo e negativo, na verdade, tenham mais a ver
com diferenças os reforçadores específicos tipicamente usados (e.g., alimento e choque).
Dessa forma, estudar individualmente cada tipo de reforçador e seus efeitos sobre o responder
poderia ser uma forma mais rigorosa de se falar sobre reforçamento. Ainda assim, novos
critérios sobre como tratar estímulos condicionados (em especial condicionados
generalizados) seriam necessários.
Abranger Todo o Contexto Ambiental. Para disputara noção de Staats (2006) de
usar aproximação/evitação como critérios para classificar contingências como positivas ou
106

negativas, Baron e Galizio (2006b) haviam apresentado um contraexemplo contrastando uma
condição de VI 30s e VI 10s para mostrar. Nesse caso, se o rato se deslocasse da caixa onde
foi reforçado em VI 10s, isso implicaria que a condição VI 10s seria aversiva. Para eles, essa
situação hipotética aponta para a necessidade de utilizar uma abordagem mais compreensiva
que considere as funções reforçadoras de estímulos em um contexto mais amplo que inclua
condições de reforçamento distintas (como a apresentada).
Abandonar a Distinção por Completo
Falar Apenas em Reforçamento e Punição. Baron e Galizio (2005) concluem que as
ambiguidades apresentadas mostram que não há base para a manutenção da distinção entre os
reforçamentos positivo e negativo e que nada seria perdido ao abandoná-la. Como
continuação de sua sugestão anterior, Baron e Galizio (2006b) sugerem que além de se
descrever tanto as condições pré-mudança quanto pós mudança, é importante analisar se a
mudança de uma condição para a outra mantém ou suprime comportamentos. Dessa forma,
Baron e Galizio se alinham a Michael (1975) em dizer que o que faz mais sentido é distinguir
apenas entre reforçamento e punição. Os autores (Baron e Galizio, 2005) afirmam ter chegado
na mesma conclusão de Michael de que os conceitos de reforçamento e punição dão conta da
teoria analítico-comportamental e oferecem uma forma de se referir a “prazer” e
“desconforto”.
Sidman (2006) critica essa substituição acrítica do reforçamento positivo e negativo
pelos conceitos de reforçamento e punição. O autor aponta que o conceito de punição também
contém seus problemas de definição. Sidman parte da definição de punição como uma
consequência que diminui a probabilidade de um comportamento. Diante disso, ele apresenta
alguns exemplos que ilustram a inconsistência desse conceito:
Quando a correção feita por um professor garante que a resposta errada de um aluno
nunca mais ocorra, essa resposta foi punida pelo professor? Quando um responsável
107

faz uma criança parar de comer entre as refeições ao esconder o pote de biscoitos, o
ato de comer biscoitos foi punido? Se uma criança para de se comportar mal após ser
pedida para parar, esse comportamento foi punido? Quando peço algo e a resposta é
"não", o fato de eu não repetir o pedido indica que ele foi punido? (Sidman, 2006, p.
137)
Sidman (2006) de alguma forma parece ter usado os próprios argumentos de Baron e
Galizio (2005) contra eles próprios com relação, agora, a uma outra distinção. De fato, como
distinguir se uma criança foi punida pela resposta errada, ou se condições para a emissão da
resposta certa foram apresentadas e ela se estabeleceu?
Sobre a crítica de Sidman (2006), Baron e Galizio (2006a) responderam que:
Ao longo dos anos, essa visão perdeu força, em grande parte devido à análise
convincente de Azrin e Holz (1966), que colocou a punição no mesmo patamar do
reforçamento. Segundo eles, a característica distintiva da punição é que ela enfraquece
o comportamento, tornando-a, assim, o oposto do reforçamento, que fortalece o
comportamento. (Baron e Galizio, 2006a, p. 149).
Da mesma forma que o abandono da distinção acabaria prezando por uma parcimônia
científica no sentido de diminuir o número de conceitos necessários para se explicar
fenômenos, a adoção de uma visão assimétrica de punição proposta por Skinner (1953/2014)
também caminha nesse sentido. Sidman afirma que a definição de punição sugerida por Azrin
e Holz (1966) foi adotada rapidamente pela comunidade sem discussões extensivas a seu
respeito. Nesse sentido, Sidman aponta para o mesmo problema sugerido por Lattal e Lattal
(2006) de que uma diferença entre dois conceitos teria sido assumida a priori, sem evidências
suficientes para tal. As implicação da distinção entre reforçamento positivo e negativo sobre o
conceito de punição serão discutidas mais adiante em um subtítulo dedicada.
108

Ensinar Sobre a Distinção e Abandoná-la. Michael (2006) aponta para o fato de que
por conta de a distinção ser tão difundida na área, existe uma necessidade de aprendê-la para
que se possa compreender muito do que é e já foi produzido. Nesse sentido, o autor sugere
que a distinção seja descrita da forma tradicional, depois que a sua ambiguidade seja apontada
e, no resto do tempo, se deixe de usá-la.
Assumir Simetria Entre os Reforçamentos
Marr (2006), desenvolveu uma longa discussão a respeito da simetria entre conceitos
na análise do comportamento e em outras áreas com destaque para a área de controle de
estímulos. A partir disso, o autor faz a seguinte sugestão sobre o dilema positivo/negativo:
Podemos tirar uma lição da simetria entre discriminação e generalização mencionada
anteriormente. Nesse caso, as distinções se baseiam nos procedimentos e nas
mudanças de comportamento que desejamos enfatizar. Em ambos os casos, estamos
falando de controle de estímulos. (Marr, 2006, p. 128).
Para Marr (2006), a discriminação e a generalização são “dois lados da mesma moeda
que chamamos de controle de estímulos” (pp. 125-126). A distinção entre elas não está em
uma diferença ontológica dos processos, mas no que o analista escolhe enfatizar: em um se
enfatiza semelhanças no responder frente a diferentes estímulos e, no outro, diferenças no
responder frente a diferentes estímulos. Diante disso, Marr sugere que, enquanto não houver
evidências convincentes de uma diferença funcional entre os dois supostos tipos de
reforçamento, parece ser mais útil assumir a simetria até que evidências contrárias surjam.
Nesse sentido, Marr (2006) problematiza a forma como a distinção é feita dizendo que
não existem diferenças funcionais claras ou fundamentais entre o que se convencionou
chamar de reforçamento positivo e reforçamento negativo tanto no efeito sobre o
comportamento quanto sobre como agem no organismo. Os procedimentos são sim diferentes,
mas isso não representaria, para Marr, uma diferença fundamental nos processos. O autor não
109

chega a explicitar, mas talvez nesse sentido ele mantivesse os termos como forma de enfatizar
diferentes procedimentos.
Sugestões Neutras
Falas em que os autores apontaram para a necessidade de se fazer algo não
especificamente relacionado ao uso ou desuso da distinção entre os reforçamentos positivo e
negativo. Dentre os trechos classificados como “Sugestões Neutras”, identificou-se falas que
sugeriam fazer investigações, focar no que é palpável, revisar os termos usados ou adaptar a
linguagem usada.
Fazer Mais Investigações
Investigar o Uso da Distinção em Outras Áreas. Chase (2006) sugeriu que
investigar a distinção entre os termos positivo e negativo em outras áreas do conhecimento
que fazem uso dela, poderia ajudar a determinar os motivos pelas quais a comunidade de
analistas do comportamento também o faz. Isso se relaciona com as possíveis funções
culturais da distinção já apresentadas (Chase, 2006; Lattal e Lattal; 2006).
Investigar Definições de Operações, Efeitos e Causas. Marr (2006), sugere que um
nó precisa ser resolvido a respeito da mistura entre o que seriam procedimentos (ou
operações), os efeitos desses procedimentos e as razões para os efeitos observados antes que
se possa resolver o dilema da distinção positivo/negativo. Dando como exemplo o caso da
extinção: o procedimento seria a remoção de uma consequência reforçadora que está
mantendo um comportamento, o efeito seria a diminuição da probabilidade dessa resposta e as
razões para a diminuição poderiam ser o estabelecimento de outros comportamentos no lugar
desse ou até mesmo um efeito punitivo da extinção. A partir disso, Marr afirma que o
procedimento e o efeito do reforçamento são minimamente definidos, mas as razões pelas
quais osefeitos ocorrem não.
110

Essa última afirmação é de se estranhar considerando que as explicações para o
reforçamento foram muito bem delimitadas por Skinner (1953/2014). O efeito do
reforçamento se explica pelo fato de que animais possuírem organismos aptos a, diante da
produção de reforçadores, terem a probabilidade das respostas que os produziram aumentada -
algo selecionado filogeneticamente. No mesmo sentido, os valores dos reforçadores
incondicionados foram estabelecidos filogeneticamente porque indivíduos que tinham tais
estímulos como reforçadores tiveram mais chance de sobreviver e reproduzir. Os reforçadores
condicionados adquiriram funções semelhantes às dos estímulos aos quais foram
sistematicamente pareados. fato, é possível pensar que em um reforçamento alimentar, por
exemplo, a operação seja a adição do alimento após uma resposta, o efeito seja o aumento da
probabilidade da classe de respostas que o produziu e seria difícil pensar numa “razão para o
efeito observado”. Talvez para Marr a diferença fosse que a extinção seria um processo
derivado do comportamento, enquanto as razões para o reforçamento estão na história
evolutiva das espécies.
Como Marr (2006) apontou, umas das possíveis razões para a diminuição na
frequência observada poderia ser aumento na frequência de outras respostas. Nesse sentido, o
mesmo poderia ser argumentado sobre a punição. Considerando uma punição por choque, a
operação seria a adição do choque após a resposta, o efeito observado seria diminuição da
probabilidade da classe de respostas que o produziu e a razão para o efeito observado poderia
ser, por exemplo, o reforçamento de outros comportamentos. Essa visão sugeriria que a
punição seria também um processo derivado do reforçamento (o que estaria alinhado com
uma perspectiva assimétrica de punição).
A discussão em torno da distinção entre reforçamento positivo e negativo parece
esbarrar em um problema conceitual mais fundamental: a falta de clareza e consenso sobre os
termos “operação”, “efeito” e “razão” (ou explicação) para os efeitos observados. Como
111

sugerido por Marr (2006), sem uma delimitação clara desses termos, o debate corre o risco de
se perder com cada autor enfatizando aspectos distintos do mesmo fenômeno. Enquanto uns
focam nas operações (mudanças ambientais observáveis), outros priorizam possíveis razões
que explicam alterações. Investigações teóricas sistemáticas que esclareçam essas distinções
seriam fundamentais. Elas poderiam não apenas tornar o debate sobre o reforçamento mais
produtivo, mas também oferecer maior precisão na formulação de conceitos centrais da área.
Investigar a Relação Entre Condicionamento Operante e o Emocional. Como já
tratado anteriormente, Staats (2006) argumenta que, quando o comportamento é considerado
em sua totalidade, há grandes diferenças entre os reforçadores positivos e negativos. Com
base nisso, ele propõe que a relação entre o condicionamento operante e o condicionamento
respondente (ou emocional) seja investigada de forma sistemática por meio de estudos básicos
com animais, nos quais variáveis comportamentais como privação e saciação sejam
manipuladas. O autor cita alguns estudos iniciais realizados com humanos (Harms & Staats,
1978; Staats & Hammond, 1972; Staats & Warren, 1974), bem como análises funcionais de
comportamentos humanos (Staats, 1975, 1996), mas não explicita os resultados desses
estudos. Sua sugestão se baseia na necessidade de expandir esse campo de pesquisas
experimentais com animais e humanos.
Realizar Experimentos que Abordem a Distinção. Lattal e Lattal (2006)
argumentaram que a distinção entre reforçamento positivo e negativo foi assumida sem que
houvesse evidências suficientes que a fundamentassem. Como já discutido no subtítulo “A
Distinção Não Tem Fundamentação Experimental Suficiente”, os autores apontaram que as
pesquisas realizadas até então não permitiam a formulação de conclusões sólidas, seja porque
as diferenças entre os procedimentos comparados iam além das operações envolvidas, seja
porque poderiam ser atribuídas a particularidades dos estímulos reforçadores utilizados. Ainda
assim, caso houvesse fundamentos para uma distinção formal ou estrutural entre os dois tipos
112

de reforçamento, seria necessário que suas diferenças fossem testadas diretamente por meio
de delineamentos experimentais adequados. O problema, apontado pelos próprios autores, é
que faltam estudos com esse objetivo específico.
Lattal e Lattal (2006) sugeriram que, dada as dificuldades de se comparar o responder
mantido por comida e choque, uma comparação indireta, mas sob uma condição comum
talvez seja possível. Hearst (1962), por exemplo, comparou a performance de macacos rhesus
treinados por reforçamento alimentar e esquiva de choque. A generalização de ambos foi
comparada e o gradiente de generalização da esquiva por choque era mais achatado
(indicando maior generalização). Outro exemplo foi o de Nevin (1974), que testou a
resistência à mudança de dois treinos diferentes frente a um mesmo disruptor e identificou
que esse tipo de comparação pode ser útil para investigar se há diferenças empíricas entre
respostas mantidas por condições nominalmente distintas de apresentação e remoção de
estímulos.
Muitos dados úteis podem ser tirados da comparação entre esquemas mantidos pelo
que é tipicamente chamado de reforçamento positivo ou negativo, mas os parâmetros pelos
quais isso é possível são muito limitados. Levando em conta o que já foi discutido sobre todos
os reforçadores (incluindo a sua ausência) poderem ser vistos como parte de um contínuo,
qual padrão (i.e., topografia) e intensidade de choque deveriam ser usados numa comparação
com o responder mantido por uma pelota de determinado alimento? Hearst (1962) especificou
qual o alimento usado, mas não apresentou qualquer critério para a escolha do choque
(padrão, intensidade, duração, intervalo etc.). O que garantiria, nesse caso, que as diferenças
observadas entre os gradientes de generalização tinham a ver com diferenças nos tipos de
reforçamento e não com as magnitudes dos reforçamentos providos pelos estímulos
específicos? Se conclusões não podem ser tiradas nem quanto aos estímulos específicos,
113

seguindo a lógica de Lattal e Lattal (2006), menos ainda poderia ser dito sobre as diferenças
entre reforçamento positivo e negativo.
Outro problema que poderia ser apontado no experimento, mas que não foi comentado
por nenhum autor do debate, é que o critério estabelecido por Hearst (1962) para a
comparação foi referente ao nível de discriminação entre as condições SD e SΔ para os dois
reforçadores em porcentagem. Os números brutos não foram explicitados, mas esse critério
significa que os macacos poderiam estar emitindo centenas de respostas num reforçamento e
algumas dezenas na outra. Diferenças no gradiente poderiam também ser atribuídas a isso.
Como sugeriram Lattal e Lattal (2006), quando se comparam dois estímulos
diferentes, algum fator comum deve ser estabelecido. Se a frequência de respostas for
escolhida como fator comum, dever-se-ia estabelecer, considerando um alimento específico e
uma privação específica, qual intensidade de um tipo de choque produziria uma frequência de
respostas igual. Somente assim seria possível dizer que dois reforçadores (pelo menos sob o
padrão de frequência de respostas) seriam equivalentes.
Se isso é possível ou não de ser feito, é uma questão experimental. Uma quantidade
enorme de variáveis com seus próprios padrões deveria ser levada em conta. Em pesquisas de
reforçamento positivo, por exemplo, uma operação estabelecedora que cresce ao longo do
tempo está em vigor o tempo todo, mas cada alimento produzido também funciona como
operação abolidora. Em uma situação de esquiva por choque, frequentemente, a operação
estabelecedora reflexiva/reforçadornegativo condicionado aparece e some por completo
rapidamente repetidas vezes, e a sua função aversiva sofre efeitos dinâmicos similares aos da
privação-saciação, como atesta o fenômeno do paradoxo da esquiva.
As delimitações seriam tão específicas que talvez os resultados de uma pesquisa dessa
natureza não pudessem ser generalizáveis para sequer outros tipos de choque ou alimento.
Além disso, para que se pudesse atribuir diferenças entre os reforçadores tipicamente
114

considerados positivos ou negativos, muitos reforçadores de cada tipo precisariam passar
pelos mesmos testes. Reforçadores ditos do mesmo tipo também deveriam ser comparados e,
as diferenças encontradas entre eles deveriam ser qualitativamente diferentes de alguma
diferença comum entre todos os reforçadores de cada categoria (Magoon et al., 2017).
Investigar o Reforçamento em Si. Marr (2006) sugeriu que há pouco sentido em
continuar discutindo distinções entre tipos de reforçamento se o próprio reforçamento ainda
não está bem compreendido. Além da distinção entre positivo/negativo, ele cita dois outros
exemplos de confusões: supostas distinções entre as propriedades discriminativas e
reforçadoras dos estímulos e as condições necessárias e suficientes para a aquisição e
manutenção do comportamento de esquiva.
Marr (2006) não elabora mais profundamente sobre esses pontos, então é difícil saber
a que supostas confusões nesses campos ele estava se referindo. Ainda assim, como sugerido
por diversos autores (i.e., Baron e Galizio, 2005; Chase, 2006; Iwata, 2006; Lattal e Lattal,
2006) a distinção pode ter uma função prática a respeito de como se analisam, descrevem ou
aplicam os conceitos de reforçamento que podem ser úteis.
Como já comentado, pode ser que uma vantagem da distinção seja justamente que
investigações a respeito da distinção estejam funcionando para revelar lacunas em outras
definições como reforçamento, estímulo, operações motivadoras etc. O próprio texto de Marr
e o presente trabalho são exemplos disso. A descrição das condições pré e pós-mudança foi,
inclusive, uma sugestão de Michael (1975) apresentada durante sua discussão sobre a
distinção. Talvez abandonar a discussão sobre a distinção para focar na definição de
reforçamento acabasse sendo contraprodutivo nesse sentido.
Investigar o Próprio Comportamento de Distinguir. A partir da noção de que o
comportamento dos cientistas é também governado por regras, Baron e Galizio (2006a)
115

incentivam os analistas do comportamento a revisarem as funções de seus próprios
comportamentos verbais ao falar de reforçamento e considerarem alternativas.
Sobre isso, vale comentar que regras de fato são capazes de controlar
comportamentos, mas são limitados enquanto estímulos antecedentes. No fim das contas, o
que determinará quais comportamentos serão ou não mantidos serão as consequências
produzidas por eles. A sugestão de Baron e Galizio (2006a) provavelmente assume que o que
for produzido pelo seguimento dessas regras seria mais reforçador, mas isso parece ir na
contramão do fato de que, na prática, a distinção vem sendo mantida.
Investigar os Motivos da Manutenção. Chase (2006) apontou que, apesar de a
argumentação de Baron e Galizio (2005) sobre a ambiguidade da distinção ser lógica e
precisa, faltou apresentar explicações “sólidas” sobre o porquê de a distinção ter sido mantida
desde a publicação de Michael (1975). Lattal e Lattal (2006) demonstraram ter uma opinião
parecida: “se as diferenças formais entre reforçamento positivo e negativo não são
sustentáveis e as diferenças funcionais são, no mínimo, questionáveis, resta responder por que
a distinção persiste” (pp. 130-131).
Iwata (2006) pontuou que as explicações dadas por Baron e Galizio (2005) se
resumiam aos termos estarem muito bem estabelecidos na área e uma mudança terminológica
seria muito trabalhosa, mas argumentou que nenhuma dessas explicações é suficiente para
justificar a manutenção dos termos na pesquisa e na prática.
Diante disso, Chase (2006) sugeriu que o campo fosse em busca dessa resposta, seja
na forma de uma pesquisa que analisasse textos e livros em análise do comportamento ou um
questionário com os professores da área. Na falta de uma pesquisa que possa responder essa
pergunta, Chase se propôs a oferecer algumas possíveis explicações para a manutenção.
Vale ressaltar que não é como se Baron e Galizio (2005) não tenham apresentado
possíveis explicações para a manutenção da distinção ao longo dos anos - 11 possibilidades
116

foram identificadas por eles. Parece ser o caso de que, para Chase (2006), Lattal e Lattal
(2006) e Iwata (2006), as explicações oferecidas por Baron e Galizio foram insuficientes. As
possíveis explicações oferecidas por Baron e Galizio (2005), bem como dos outros autores,
foram apresentadas no subtítulo de “Explicações para a Manutenção”.
Focar no Que É Palpável
Nakajima (2006), de forma similar a Marr (2006) e Sidman (2006), sugere que
analistas do comportamento devem focar mais na identificação explícita de variáveis
ambientais que possam ser diretamente manipuláveis do que em especulações.
Revisar os Termos
Para Baron e Galizio (2006a), os diversos exemplos interpretativos apresentados por
eles para demonstrar a fragilidade e ambiguidade da distinção, apontam para uma necessidade
de reavaliar a terminologia usada para falar de reforçamento.
Adaptar a Linguagem
Lattal e Lattal (2006) destacam que, ao se comunicar com pessoas leigas, o analista do
comportamento pode e deve adaptar sua comunicação para torná-la mais acessível e
compreensível, mas somente se ele dominar o conceito em nível técnico e científico. Dessa
forma, ele será capaz de englobar sutilezas teóricas importantes, evitando simplificações que
distorçam o conceito.
Esclarecimentos
Em determinadas falas, Baron e Galizio responderam comentários gerais ou pontuais
presentes nas falas dos outros autores de forma a esclarecer possíveis equívocos assumidos
quanto à sua proposta. Naturalmente, essas falas só poderiam ser encontradas nos textos de
resposta escritos por Baron e Galizio, dirigidos aos demais participantes do debate. Ainda
assim, as seis falas dessa categoria foram todas retiradas do primeiro texto resposta (Baron e
Galizio, 2006a). Uma explicação possível é que muito do que eles poderiam responder no
117

segundo texto já havia sido dito no primeiro, afinal, segundo eles próprios: “uma releitura de
nosso artigo original e de nossa resposta anterior aos críticos revelará que grande parte do
terreno já foi percorrido” (Baron & Galizio, 2006b).
Os pontos aqui apresentados serão entendidos como representativos do que Baron e
Galizio tentaram mostrar mesmo que tivessem falhado em fazê-lo seja por conta de más
interpretações de suas falas ou até suas próprias contradições (alguns casos desse tipo foram
discutidos até então). Os pontos apresentados a seguir devem ser considerados tendo em vista
todas as exposições em discussões já colocadas.
Em primeiro lugar, Baron e Galizio (2006a) defendem o foco em operações
específicas ao invés do foco em eventos menos acessíveis. O ponto deles é, inclusive, que este
foco vem, muitas vezes, sendo abandonado em favor da distinção positivo/negativo. Em
segundo lugar, Baron e Galizio também não defendem que descrições sejam feitas de formas
inconvenientes. De fato, é mais fácil falar de adição de dinheiro do que subtração de uma
condição sem dinheiro.
Em terceiro lugar, ao contrário do que Sidman parece ter atribuído a eles, Baron e
Galizio (2006a) não estão propondo uma nova convenção terminológica nem uma mudança
nos princípios básicos. Segundo os próprios autores, eles estavam apenas “apontando algumas
dificuldades inerentes à convenção de distinguir entre reforçadores positivos e negativos com
base no início ou término da energia de estímulo” (p.148). Em quarto lugar, ainda
respondendo à Sidman, os autores acreditam que a relevância social tem papel fundamental na
atividade científica e que o cientista, enquanto membro da sociedade deve estar atento às
implicações sociais de seu trabalho. Eles apontam que tanto eles como Michael e Sidman
estão de acordo que o uso social de estímulos aversivos como forma de controle faz com que
o cientista precise estudá-los.
118

Em último lugar, Baron e Galizio (2006a) concordam com os outros autores que há
muito a ser explorado para se falar melhor sobre as coisas “boas” ou “ruins” de uma
perspectiva analítico-comportamental, e os autores esperam que essa discussão estimule a
investigação dessas questões.
A partir dessas falas, muitos elementos confusos no texto de Baron e Galizio (2005)
devem ter sido elucidados. Baron e Galizio (2006a) defendem, portanto, o foco em operações
observáveis, manipuláveis e mensuráveis e descrições práticas e objetivas das mudanças
ambientais reforçadoras. Como eles já haviam respondido, os exemplos usados por eles que
remetiam a estados internos hipotéticos, por exemplo, haviam sido retirados da literatura
consultada como exemplos.
Baron e Galizio (2006a) argumentam que Sidman (2006) se enganou em dizer que eles
estavam “propondo uma nova convenção terminológica” ou uma “mudança nos princípios
básicos”. De fato, há alguns trechos em seu artigo original que sustentam essa fala. Ao final
de seu texto, Baron e Galizio (2005) disseram: “em resumo, se formos continuar a falar sobre
dois tipos de reforçamento, aconselhamos cautela quanto às formas de uso desses termos”.
Isso fora apresentado anteriormente como “Sugestão para Manutenção”. Em seguida, eles
afirmam que a distinção parece ter funções comunicativas úteis e já está tão presente na área
que talvez isso já fosse motivo suficiente para continuar ensinando a distinção para novos
alunos. Em outros momentos, entretanto, eles defendem que o uso dos termos positivo e
negativo são prejudiciais para análise do comportamento e sugere que eles sejam substituídos
por uma descrição das condições pré e pós mudança e se recorra somente à classificação
reforçamento e punição (ver “Sugestões para o Abandono”).
Embora eles descrevam que o objetivo era apontar problemas com a distinção e
apresentar possíveis sugestões tanto para a manutenção quanto para o abandono, indicando
algumas possíveis vantagens e desvantagens, em muitos trechos foram identificadas frases em
119

que eles se posicionam claramente a favor do abandono, por exemplo: “embora vários
argumentem que a distinção entre os reforçamentos positivo e negativo deva ser preservada,
seus argumentos não nos convenceram de que os benefícios dessa distinção superem suas
limitações” (Baron e Galizio, 2006a, p. 150). Esses fatores explicam, de certa forma, porque
Sidman (2006) teria atribuído a eles um projeto de alterar a terminologia da área.

120

Discussões Gerais
Os tópicos a seguir trarão discussões que abordam temas que estiveram presentes em
diversos dos textos, mas que faria pouco sentido serem abordados individualmente.
A Confusão da Distinção
Um argumento que acabou sendo pouco abordado no debate dado que era parte da
argumentação inicialmente trazida por Michael (1975), foi o de que a distinção é confusa.
Como mencionado, isso dizia respeito ao fato, principalmente, de que seu uso tenha mudado
ao longo do tempo. Sidman (2006) foi o único que abordou esse argumento diretamente,
demonstrando forte concordância e apontando para aspectos em sua experiência que
sustentavam essa noção. Segundo ele, novos alunos ou leitores de análise do comportamento,
após aprenderem o conceito de reforçamento tendem a assumir precocemente, que
“reforçamento negativo”, enquanto seu oposto, signifique o que se chama de punição.
Parte do problema com a má interpretação do termo “reforçamento negativo”
provavelmente advém do que se entende por “oposição”. A partir de um entendimento
abrangente do termo, poder-se-ia tanto pensar que o oposto de “um aumento na frequência de
resposta causado pela adição de um estímulo” poderia ser 1) “uma diminuição na frequência
de resposta causado pela adição de um estímulo” (o que se chama de punição positiva); 2)
“um aumento na frequência de resposta causado pela subtração de um estímulo” (o que se
chama de reforçamento negativo); ou até 3) “uma diminuição na frequência de resposta
causado pela subtração de um estímulo” (o que se chama de punição negativa). Isso porque
“reforçamento positivo” é uma dupla de termos, diante da qual qualquer um dos dois termos
(ou ambos) podem ser “invertidos” para gerar algo que seria, pelo menos no senso comum,
adequadamente chamado de oposto.
Com relação este aspecto apontado por Baron e Galizio (2005) e discutido por
Sidman (2006), seriam sugestões para estudos futuros sobre o tema que 1) a busca outros
121

termos para se referir às relações de reforçamento positivo e negativo que pudessem gerar
menos problemas (e.g., reforçamento aditivo e subtrativo, enfatizando as operações
matemáticas de adição e subtração); 2) a avaliação de diferentes estratégias utilizadas por
professores de análise do comportamento no ensino desses conceitos com o objetivo de isolar
as funções didáticas dos problemas conceituais atribuídos à distinção do reforçamento
positivo e negativo.
A Distinção É Semântica
Um ponto que foi abordado extensamente por Baron e Galizio (2005, 2006a, 2006b) é
o de que a distinção positivo/negativo está, puramente, na forma de se descrever uma
mudança. Fazer uma descrição na sua forma positiva ou negativa é uma escolha do falante. Os
autores, entretanto, não se aprofundam sobre o porquê de isso acontecer. Quando Chase
(2006) argumentou que o experimento de Weiss e Laties (1961) é um exemplo fraco porque
“calor” e “frio” são opostos, talvez não tenha ficado evidente que esse é justamente o dilema:
se qualquer mudança ambiental pode ser descrita numa direção ou na outra, a classificação
entre positivo e negativo é arbitrária. O argumento foi perfeitamente ilustrado por ele quando
pontuou que as mudanças “aumento na atenção” e “diminuição na restrição física” possuem,
cada uma, suas versões opostas: “diminuição de períodos sem atenção” e “aumento de
períodos sem restrição física”.
O ponto de Baron e Galizio (2005) não é dizer que o “aumento da atenção” e a
“diminuição da restrição física” sejam uma mudança só, mas sim dizer que cada uma dessas
mudanças não deveria ser classificada como positiva ou negativa porque descrevê-las assim (e
não em sua forma oposta) resume-se a uma escolha linguística e não a uma característica
fundamental da mudança.
O mesmo pode ser observado nas frases “eu quero ficar em casa” e “eu não quero sair
de casa” que contém duas inversões e são, portanto, equivalentes. O mesmo ocorre na
122

matemática quando se declara que uma operação de subtração de um número positivo ou a
adição do mesmo um número, só que negativo, são equivalentes (i.e., 3 - 1 = 2 e 3 + (-1) = 2).
O exemplo de Weiss e Laties (1961) não foi apresentado por Baron e Galizio (2005)
para dizer que não se sabe qual das duas mudanças é a mais relevante - até porque são uma
mudança só - mas para ilustrar como qualquer mudança poderia ser descrita tanto como
adição quanto como subtração. De fato, dizer que um comportamento aumentou de frequência
porque “dinheiro seguiu a resposta” soa melhor do que dizer que a resposta aumentou de
frequência por “eliminar um período de menos dinheiro”. Ainda assim, o fato de uma forma
de escrita ter se tornado tradicional e, portanto, outras soarem estranhas, não justifica a
pressuposição da existência de dois processos distintos.
Calor e frio, luz e escuro são pares de opostos com alta prevalência na experiência
cotidiana, o que torna esperável que qualquer comunidade13

Lista de Tabelas
Tabela 1 - Categorias de análise utilizadas no grifo dos textos...............................................46

Considerações Sobre o Processo de Produção do Presente Trabalho
Inicialmente, considero importante ressaltar alguns aspectos sobre a produção deste
trabalho e explicitar algumas variáveis que controlaram o meu próprio comportamento nesse
processo. Era uma ideia inicial deste projeto estudar os textos que serão aqui analisados
enquanto produtos dos comportamentos dos autores que os produziram – fruto das variáveis
ambientais desses autores. Além disso ter se revelado uma proposta trabalhosa, a pesquisa se
limitaria apenas a fazer um punhado suposições com base no material disponível – o que foi
entendido como um trabalho pouco frutífero. Optei, ao invés disso, por fazer uma
sistematização, análise e interrelação do conteúdo desses argumentos.
Outro ponto relevante a respeito do projeto inicial é que eu o havia escrito
inteiramente em primeira pessoa. Tanto isso quanto o interesse inicial em estudar o
comportamento de autores da análise do comportamento sugiram da vontade de manter
explícito que esta produção (assim como qualquer outra) é produto do comportamento de
pessoas específicas e de suas variáveis ambientais. As falas, as tabelas, os gráficos, as
opiniões, os acertos e os erros deveriam poder ser vistos como produtos dos comportamentos
de pessoas específicas e não dados objetivos que se revelaram num vácuo durante a
investigação.
Escrever e ler um projeto inteiro em primeira pessoa, incialmente, me gerou certa
estranheza (compartilhada por outros leitores), provavelmente advinda de um treino extenso
de leituras e escritas em uma outra forma. Conto que, ao final desse processo, esse já não era
mais um incomodo pessoal, mas entendo que esse não seria o caso para um novo leitor.
Assim, apesar de a escrita em primeira pessoa ir ao encontro das próprias diretrizes do
Manual de Publicação da American Psychological Association (APA), os autores que fazem
parte tanto da comunidade científica da análise do comportamento enquanto área de pesquisa
quanto de outros campos das ciências naturais como um todo, tipicamente escrevem seus
15

textos em terceira pessoa. Nesse sentido, optei por manter estas ressalvas em primeira pessoa,
mas seguir com o texto em terceira pessoa de forma a facilitar possíveis leituras, citações e
publicações futuras.
Estrutura Geral da Introdução
Este trabalho se aprofundará em discussões a respeito da manutenção ou abandono da
distinção entre as definições de reforçamentos positivo e negativo. Para que isso seja possível,
primeiro serão trazidas e discutidas algumas definições conceituais. Este segmento do
trabalho consistirá numa exposição inicial dos conceitos de reforçamento e reforçadores.
Em seguida, será feito um breve resumo do artigo de Santos e Leite (2013) que
analisaram diferenças entre as definições de reforçadores positivos e negativos em diversas
obras. Em seguida serão apresentadas diferentes definições para os conceitos de reforçadores
positivo e negativo, com base na revisão de literatura de Santos e Leite (2013) e em outras
obras não contempladas na revisão desses autores – com foco especial nas diferenças
identificadas entre as definições.
Após essa discussão inicial das definições e diferenças entre os conceitos de
reforçamento e reforçadores positivos e negativos, será introduzido o texto de Michael (1975)
que foi um dos primeiros a discutir a possibilidade de se abandonar a distinção
positivo/negativo e que deu origem ao debate que será analisado no presente trabalho.
Será apresentado então o trabalho de Possmoser (2015), que investigou as referências
feitas à Michael (1975) até 2014, se aprofundando nos textos envolvidos no debate de
2005/2006 sobre o tema do abandono/manutenção da distinção entre reforçamento positivo e
negativo publicado pela revista The Behavior Analyst. A fim de aprofundar o trabalho de
Possmoser, o problema de pesquisa da presente pesquisa será delineado partindo dele.

Definição de Reforçamento
Segundo Catania (1992, p. 71), o termo “reforçamento” pode ser tanto entendido como
a apresentação de consequências reforçadoras após uma resposta1 (i.e., uma operação) quanto
como um aumento na probabilidade futura do responder gerado pela apresentação dessas
consequências (i.e., um processo). Ele apresenta os seguintes exemplos de reforçamento dos
quais outros fatores importantes podem ser destacados: 1) um rato privado de água cujas
respostas de pressão à barra se tornam mais prováveis quando produzem água do que quando
não produzem; 2) um pombo privado de alimento cujas respostas de bicar se tornam mais
prováveis quando elas produzem alimento do que quando não produzem; e 3) o choro de uma
criança se torna mais provável quando produz a atenção dos pais do que quando não produz.
Nos três exemplos, Catania (1992) deixa implícita uma diferença entre dois contextos:
em um, o reforçador é produzido e, nesse contexto, a resposta aumentaria de probabilidade e,
no outro, o reforçador não é produzido e sua probabilidade seria menor. Além disso, nos
primeiros dois exemplos, Catania também menciona as variáveis motivacionais envolvidas,
que tornam certas alterações ambientais relevantes para um organismo (e.g., privação de água
ou alimento tornando esses eventos relevantes enquanto reforçadores).
Um último aspecto trazido por Catania (1992) é a distinção entre contiguidade (i.e.,
justaposição temporal ou espacial entre eventos) e contingência (i.e., relação de dependência
entre uma resposta e um estímulo). Embora essas relações possam coexistir, a contiguidade
por si só pode ser suficiente para manter uma resposta, como mostram os experimentos de
Skinner (1948) sobre comportamento supersticioso. Assim, embora a contingência possa
garantir uma contiguidade mais sistemática, é a contiguidade, e não a contingência, o fator
essencial para que o reforçamento ocorra.
_________________
1 Entender-se-á por “resposta” qualquer ação de um organismo.
17

Reforçamentos Positivo e Negativo
Uma “alteração ambiental reforçadora” (ou “consequência reforçadora” quando há
especificamente uma relação de contingência) pode ser entendida como qualquer alteração
ambiental (i.e., operação) que quando segue, sistematicamente, uma classe de respostas do
organismo, aumentará a frequência de emissão dessa classe (dadas condições motivacionais e
discriminativas semelhantes). O reforçamento, por sua vez, pode se dividir em duas categorias
a partir do tipo de consequência reforçadora envolvida.
Quando o aumento na frequência de determinada classe de respostas é causado pela
adição de um estímulo2 ao ambiente, o processo é chamado de reforçamento positivo. Quando
o aumento na frequência da classe de determinada classe de respostas é causado, ao contrário,
pela subtração de um estímulo do ambiente, o processo é chamado de reforçamento negativo
(Skinner, 1953/2014). Assim Skinner (1953/2014) define e exemplifica esses mesmos
conceitos:
Eventos que se mostram reforçadores são de dois tipos. Alguns reforçamentos
consistem na apresentação de estímulos, na adição de algo — por exemplo, comida,
água ou contato sexual — à situação. A esses chamamos de reforçadores positivos.
Outros consistem na remoção de algo — por exemplo, um ruído alto, uma luz muito
intensa, frio ou calor extremos, ou um choque elétrico — da situação. A esses
chamamos de reforçadores negativos. Em ambos os casos, o efeito do reforçamento é
o mesmo: a probabilidade da resposta é aumentada. Não podemos evitar essa distinção
argumentando que o que é reforçador, no caso negativo, é a ausência da luz intensa, do
_________________
2 Entender-se-á por “estímulo” qualquer evento do ambiente que afete o comportamento de um
organismo.verbal desenvolva termos para
ambos. Já eventos como dor de cabeça ou choque são, em geral, menos frequentes, o que faz
com que se fale mais comumente sobre sua presença do que sobre sua ausência. No entanto,
quando se tornam recorrentes — como nos casos de enxaqueca crônica ou em experimentos
com choques — surgem condições para nomear seus períodos de ausência, como “período
interictal” e “período de segurança”. Assim, tanto faz dizer que houve apresentação de um
estímulo ou remoção do seu oposto: o fenômeno de reforçamento permanece o mesmo.
A forma geral como a física, por exemplo, buscou solucionar esses conflitos gerados
pela própria linguagem tem a ver com a investigação da materialidade das coisas e com
convenções estabelecidas por eles a partir das quais determinaram que a luz e o calor seriam
chamados de coisas, mas o escuro e o frio, não (para um exemplo sobre a luz, ver Rocha et
al., 2021). A forma como a análise do comportamento trata essa questão será mais bem
discutida no subtópico seguinte.
123

Vale ressaltar que Baron e Galizio (2005, 2006a, 2006b) não sugeriram
necessariamente que se abandonem os termos “adição” e “subtração” (e seus equivalentes).
Enquanto descrições de procedimentos que podem ser entendidos e replicados, tais termos
costumam cumprir sua função (mesmo que algumas informações fiquem apenas implícitas).
O argumento central, novamente, é que a forma como se descreve um procedimento (dentre
outras possíveis formas de descrevê-lo) é uma preferência, e, com isso, as definições de
reforçamento positivo e negativo, baseadas na descrição das operações de mudança, pode
tornar-se confusa quando uma descrição incomum dos eventos for a escolhida.
Em conclusão, a ambiguidade da distinção parece ter a ver com o fato do fato de que a
comunidade verbal treina seus membros para, ao mesmo tempo, dar nomes específicos para 1)
estímulos que diferem quanto a intensidade em uma mesma propriedade (e.g., diferentes
temperaturas como calor e frio) e 2) direções diferentes de uma mudança dentro de um
mesmo contínuo (adição, subtração). Se um termo para “esfriar” não tivesse sido criado, seria
dito apenas que um objeto perdeu calor ou ganhou calor - sem nenhuma perda de sentido.
Colocado de outra forma: a ambiguidade existe porque a linguagem utilizada permite que
termos opostos possam ser usados/criados para descrever um mesmo fenômeno ambiental.
A Ausência como um Estímulo
Nakajima (2006) mencionou preferir a descrição de que “calor foi adicionado” ao
invés de que “frio foi subtraído” porque o calor seria algo físico enquanto a frieza seria um
estado hipotético do rato que significa “ausência de calor”. Entretanto, como já discutido,
assim como o calor é um estímulo capaz de eliciar e evocar respostas o frio (i.e., ausência de
calor) também é.
Quando se fala de reforçamento, necessariamente se está falando da mudança de uma
condição para outra que é contingente (ou contígua) a uma classe de respostas (Michael,
1975). Tais condições devem diferir entre si, obrigatoriamente, quanto a pelo menos um
124

aspecto: numa condição, uma propriedade de estímulo particular deve estar mais intensa e, na
outra, menos intensa, a despeito da ordem. Outras alterações concomitantes entre as condições
podem ou não afetar o efeito desse reforçamento, mas isso não muda o aspecto essencial de
ausência e presença de um estímulo.
Quando um estímulo é subtraído, o que está sendo fundamentalmente colocado em seu
lugar é sua própria ausência - ou um estímulo com uma intensidade mais baixa em uma de
suas propriedades. Considerando o caso em que uma criança emite mandos que fazem sua
mãe retirar a folha de atividades que está à sua frente (demanda): não importa o que quer que
concretamente esteja atrás daquela folha (e.g., uma mesa, uma prancheta ou uma folha em
branco), o único elemento fundamental para que seja mantida a ocorrência do mando é a
ausência da folha de atividades. É provável que fosse “ao que está atrás da folha” que Marr
(2006) se referia quando disse que “o que acontece depois parece irrelevante” (p. 127). Isso
também se aplica ao exemplo em que a criança vai para uma sala de time-out: o que mantém
o comportamento não é o que há na nova sala, mas a eliminação da condição anterior (a
presença da demanda). Em ambos os casos, tanto a condição antecedente quanto a
subsequente importam apenas nos aspectos que forem relevantes para o reforçamento - e “não
importam” nos aspectos que não forem. Dada a mudança relevante (da presença para a
ausência da demanda), pouco importam, em vias gerais, os demais elementos de ambos os
ambientes.
Se a noção de que a ausência de um estímulo possa ser um estímulo específico não
parecer convincente, vale ressaltar que Skinner (1953/2014) afirma: “quando dizemos que o
comportamento é função do ambiente, o termo ‘ambiente’ presumivelmente significa
qualquer evento do universo capaz de afetar o organismo” (p. 281). Nesse sentido, o frio, o
escuro, o silêncio, entre outras “ausências de estímulo” que tiverem funções evocativas,
eliciadoras ou até reforçadora condicionada poderão ser considerados estímulos.
125

Outro exemplo óbvio de como a “ausência de um estímulo” pode (e costuma) ser
considerada um estímulo na análise do comportamento refere-se à noção de “estímulo delta”.
Quando numa discriminação operante um rato passa a pressionar uma barra diante da
presença de uma luz e para diante da ausência dessa luz (i.e., escuro), à “ausência da luz” se
atribui a função de estímulo delta. Sem nenhum problema, as condições poderiam ser
invertidas e a “ausência da luz” se tornaria o estímulo discriminativo. A discriminação entre
um estímulo específico e sua ausência pode, em teoria, ocorrer com qualquer estímulo - sem a
necessidade de que existam palavras específicas para se referir a ambos. A presença de um
choque pode adquirir função discriminativa (Azin & Holz, 1961), enquanto a “ausência do
choque” adquire função de estímulo delta.
Vale ressaltar que, nos exemplos apresentados, o único critério de diferença entre as
duas condições de estímulo são especificamente a presença e ausência de um estímulo. Tanto
a presença quanto a ausência de um estímulo são observáveis e mensuráveis. Tocar na grade
da caixa experimental revelará a presença ou ausência do choque, bem como usar um
multímetro. Uma possibilidade para lidar com a possível estranheza gerada por dizer que “a
ausência de um estímulo é um estímulo” é pensar que, concretamente, tanto a presença como
a ausência de estímulos se manifestam enquanto intensidades distintas de propriedades
específicas de um estímulo. Sob esse parâmetro, os estímulos seriam considerados “opostos”
porque duas intensidades diferentes de uma propriedade não podem estar presentes num
mesmo estímulo. A presença ou ausência da luz por exemplo existe, concretamente, enquanto
uma lâmpada que está acesa ou apagada.
Que problemas de definição podem ser gerados por estímulos cuja intensidade varia
dentro de um contínuo é um fato que já foi reconhecido por muitos autores antes e dentro do
debate analisado neste trabalho (e.g. Catania, 1992; Sidman, 2006; Iwata, 2006; Chase, 2006).
O trabalho de Baron e Galizio (2005) mostrou, entretanto, que essas dificuldades não se
126

limitam a esse tipo de estímulo: descrições das versões opostas de estímulos sempre são
possíveis. Como já comentado anteriormente, qualquer mudança de estímulo pode ser
entendida como uma variação na intensidade de uma das propriedades do estímulo - mesmo
que uma das intensidades seja zero.
Operações e Efeitos
Um dos temas que mais surgiram ao longo do debate diz respeito à noção de
operações – termo que, segundo Catania (1992), refere-se ao procedimento aplicado. Muito
autores (i.e., Iwata, 2006; Marr, 2006; Nakajima, 2006; Sidman, 2006), em alguma medida,
criticaramBaron e Galizio (2005) por seu uso de estímulos hipotéticos, não-observáveis, não-
manipuláveis ou de difícil descrição em sua argumentação. Alguns deles argumentaram que
quando critérios de observabilidade ou manipulabilidade fossem aplicados à operação
analisada, confusões ligadas à distinção entre os reforçamentos positivo e negativo sumiriam.
Baron e Galizio (2006a) contrapuseram essa noção com o exemplo da dor de cabeça,
no qual uma pessoa toma uma aspirina “para” eliminá-la. Como eles sugeriram, a operação
observável e manipulável nesse caso seria a adição da aspirina e a eliminação da dor de
cabeça seria um efeito posterior. Considerando que o efeito do medicamento pode demorar
vários minutos, isso faz ainda mais sentido. Não há uma resposta contígua à eliminação da dor
de cabeça que estaria sendo fortalecida.
Fato é, que tanto a dor de cabeça quanto a sua eliminação são eventos não observáveis
publicamente. Uma possível descrição dessa contingência seria que diante da operação
estabelecedora “dor de cabeça”, respostas que produzirem a aspirina tenderão a aumentar de
frequência (uma descrição que pelos critérios sugeridos seria considerada reforçamento
positivo). Baron e Galizio (2006b) chegaram a apontar que Nakajima (2006), como um dos
autores que advogou pelo do critério de observabilidade e manipulabilidade, não abordou
especificamente esse exemplo da aspirina.
127

Um último adendo é sobre a recomendação focar exclusivamente nas variáveis
observáveis do ambiente. A distinção observável/não-observável refere-se, especificamente, a
capacidade de terceiros observarem uma mudança, afinal, se não todos os estímulos deveriam,
por definição, ser considerados observáveis. Embora coerente com os princípios da análise do
comportamento no sentido experimental, esse foco pode também levar a uma limitação
semelhante àquela imposta pelo behaviorismo metodológico. Como apontado por Andery et
al. (2009) estímulos não podem sofrer restrições metodológicas. O ambiente é composto tanto
por estímulos públicos quanto privados.
O foco exagerado nas operações pode acabar deixando outros fatores relevantes de
lado. Retoma-se o caso do uso de drogas que, para Crowley (1972), pode inicialmente ser
mantido por reforçamento positivo, mas depois por reforçamento negativo (i.e., por conta da
abstinência). Apesar de sempre tratar de uma mesma operação observável (adição da droga no
organismo), de fato, o uso de droga pode se dar de formas muito diferentes e importantes de
serem consideradas. O uso de drogas ligado a sensações da droga, o uso de drogas ligado à
aprovação social, o uso de droga ligado a remoção de sintomas de abstinência e o uso de
drogas ligado a “desinibição” ou “relaxamento” são todos usos muito distintos (e que podem
se misturar). Uma possibilidade é olhas para as diferentes operações motivadoras envolvidas
em cada um. Apesar de as operações (no sentido de procedimentos) serem iguais, que fatores
será que estão estabelecendo o valor da droga como reforçador? Ao excluir os eventos
privados sob o argumento de que não são passíveis de observação direta por terceiros, corre-
se o risco de descartar fenômenos relevantes apenas por não serem, no momento, acessíveis
com os recursos disponíveis. Skinner (1974) alerta que, embora o behaviorismo metodológico
tenha sido importante para afastar explicações mentalistas, ele acabou desconsiderando
aspectos do comportamento que, embora privados, são produtos legítimos das mesmas
variáveis ambientais que moldam o comportamento público. Assim, esse compromisso estrito
128

com a observação pública também pode acabar afastando a análise do comportamento de seu
objeto de estudo: os comportamentos, sejam eles públicos ou privados.
Condições Pré-mudança e Pós-mudança
Um ponto que pode não ter sido bem compreendido diz respeito à sugestão de Michael
(1975) de, ao invés de falar de estímulos adicionados ou retirados, passar a descrever
condições ambientais pré e pós-mudança. Como pode ser observador na Michael foi pouco
explícito a respeito de como fazer tais “descrições completas das condições pré e pós-
mudança”, que, segundo ele, estariam sendo negligenciadas em favor de se fazer uma
distinção positivo/negativo.
Como já indicado na Introdução, o termo “condição de estímulo” foi adotado por
Michael (1975), para se referir a um estado estático de estimulação (e.g., uma intensidade
específica de um estímulo) em oposição a uma “mudança de estímulo” que se refere à
mudança de uma condição de estímulo para outra. Nesse sentido, as “condições de estímulo
pré-mudança” e as “condições de estímulo pós-mudança” nada mais são que as condições
antecedentes e subsequentes a uma resposta reforçada. O próprio Michael admite que, pelo
menos na linguagem de Skinner (1953/2014), “condição de estímulo” e “estímulo” seriam
sinônimos. Vale ressaltar que o termo “condição” é usado por Michael, em geral, para se
referir a um único estímulo enquanto outros autores (incluindo Baron e Galizio, 2005, 2006a,
2006b) usam o termo para se referir a uma situação como um todo - como sinônimo de
“contexto antecedente”.
Na mesma linha, Baron e Galizio (2006a) sugeriram que um problema na área é que,
frequentemente, consequências que envolvem mudanças complexas de uma condição para a
outra são tratadas como eventos discretos. Os autores apresentaram diversos exemplos que
ilustravam que sempre que uma condição de estímulo estava sendo adicionada, outra estava
sendo subtraída. Esse foi o caso dos contrastes entre atenção e solidão, dinheiro e período sem
129

dinheiro, desenho animado na televisão e tédio ou entre aspirina e dor de cabeça. Quando o
primeiro evento do par é adicionado, na visão dos autores, o segundo elemento é subtraído
simultaneamente. Sobre isso, os autores foram criticados diversas vezes por terem recorrido a
muitos termos imprecisos, hipotéticos e/ou não-observáveis (e.g., solidão, tédio e fome) como
condições pré-mudança – algo que eles reconheceram em sua resposta (Baron & Galizio,
2006a). Marr (2006), particularmente, chegou a contestar Baron e Galizio (2005) pelo seu uso
de operações motivadoras porque, segundo ele, esse seria um conceito hipotético e retrógrado.
Esse comentário, a princípio, parece estranho, já que nem Michael (1975) nem Baron e
Galizio (2005) apontaram o conceito de operação motivadora como parte de sua
argumentação. Esse termo, inclusive, só aparece formalmente em Baron e Galizio (2005) em
comentários muito específicos sobre os textos de Sidman (1989/2009) e de Skinner (1976).
Michael (1975), obviamente, não fez uso do conceito porque ele só seria proposto (por ele
próprio) oito anos depois (Michael, 1982).
Baron e Galizio (2006a) argumentaram que os termos escolhidos haviam sido
retirados da literatura como exemplos do que já era dito na área, mas defenderam que seu
ponto não perdia a validade e outros termos poderiam ter sido usado no lugar. Ao invés de
alívio da solidão ele apresentaram a alternativa “término de uma condição em que atenção
estava ausente” (já sugerida por Iwata, 2006). Nessa versão reformulada do exemplo, o oposto
de “atenção” não seria a “solidão”, mas sim a própria “ausência de atenção”. Ainda assim,
pode-se notar que nem todos os pares de termos são de opostos, como seriam calor e frio. Dor
de cabeça não é o oposto de aspirina.
Dizer, por exemplo que uma criança quando liga a TV sai de uma condição de “tédio”
para uma condição de “desenho passando” acaba sendo um problema porque pode dar a
entender que duas operações ocorreram: tanto a remoção do tédio quanto a adição do desenho.
O oposto da condição “desenho animado” seria a própria “ausência do desenho animado” e
130

não “tédio”. Na melhor das hipóteses, o tédio poderia ser considerado uma tendência a
produzir estímulos específicos como brincadeiras, jogos ou até mesmoum desenho animado.
Em outras palavras, uma operação estabelecedora. Da mesma forma, o termo “fome” refere a
um estado corporal que acompanha operações motivadoras que estabelecem alimentos como
reforçadores. É possível que tenha sido com base no uso desses termos que Marr (2006) fez
sua crítica. Isso mostra exatamente como o uso de termos imprecisos como solidão, tédio e
fome dão margem para interpretações diversas.
Segundo a própria definição apresentada por Baron e Galizio (2006a), “solidão”
significa “ausência de companhia”, o que implicaria que os opostos seriam “solidão” e
“companhia”. Ao invés de dizer que a “adição de atenção” e a “subtração da solidão” são
equivalentes, uma forma mais precisa de descrição talvez fosse: diante da “solidão”, a
mudança de uma condição de “ausência de atenção” para uma condição de “presença de
atenção” seria reforçadora. Ou então, que diante do “tédio”, a mudança de uma condição de
“ausência de desenho animado” para uma condição de “presença de desenho animado” seria
reforçadora.
Os exemplos apresentados ilustram como 1) usar termos mal definidos pode ser
problemático (e.g., tédio, solidão, atenção); 2) descrições precisas das condições pré e pós
mudança podem ser difíceis de fazer; 3) descrever as operações estabelecedoras e estímulos
discriminativos é importante; 4) descrições precisas podem ser fundamentais em alguns casos
(e.g., caso da mudança de temperatura).
Diante disso, algo que poderia ser perguntado é se, para ser precisa, uma descrição
precisaria seguir esse tipo de modelo. Ou então, se todas as ocasiões exigem que descrições
tão precisas sejam feitas. Pode ser que houvesse algum ganho em se padronizar a forma como
contingências são descritas (especialmente em experimentos). Na literatura experimental, é
comum que as privações estejam indicadas na própria descrição dos sujeitos ou no
131

delineamento do procedimento (como no caso de choques, por exemplo). Os critérios
específicos para a produção da mudança costumam estar bem delimitados na descrição do
aparato. Também não costuma haver dúvidas sobre se alguma quantidade de alimento já
estava presente ou não no comedouro, ou quanto é adicionado. O mesmo vale para
experimentos com choques: intensidades, durações, se o choque é completamente eliminado
ou não, e sob quais condições isso ocorre, são geralmente descritos com clareza. Se outros
fatores relevantes forem deixados de fora, isso não necessariamente se resolveria apenas
adotando o modelo proposto por Michael (1975).
Uma pergunta complementar, que poderia ser sugerida para estudos futuros, é avaliar
se as descrições de contingências em estudos experimentais - tanto de pesquisa básica quanto
aplicada - têm incluído de forma sistemática todas as condições relevantes de pré e pós-
mudança, ou se têm se limitado a descrever consequências como eventos estáticos. Investigar
esse ponto poderia indicar em que medida as práticas descritivas da área estão alinhadas com
a complexidade funcional envolvida na definição de contingências e operações motivadoras.
Retomando o adendo de Baron e Galizio (2005, 2006a) de que não é preciso mudar
radicalmente a forma de descrever as mudanças, é possível pensar que caso as informações a
respeito do que Michael (1975) chamou de condições pré e pós-mudança já tiverem, de
alguma forma, sido bem descritas ou se simplesmente se está num contexto em que tal
descrição minuciosa não é tão relevante (e.g., contextos aplicados, leigos ou educacionais),
dizer que “calor foi adicionado” ou que “frio foi subtraído” servem ambos adequadamente
para se referir à mudança ocorrida. Nesses casos, uma noção suficiente das condições de
estímulo pré e pós-mudança pode ser facilmente inferida.
Implicações Sobre o Conceito de Reforçamento
O abandono da distinção, ou seja, falar apenas de reforçamento, sem a denominação
positivo ou negativo, tem implicação óbvia sobre o conceito de reforçamento, uma vez que
132

elimina uma das classificações dos reforçadores propostas no arcabouço teórico da análise do
comportamento. Nesse sentido, os termos “consequência reforçadora” e “alteração/mudança
ambiental reforçadora” continuam servindo definição de reforçamento para se referir aos
eventos que aumentam probabilidades de resposta. Isso não significa que os termos adição e
subtração, como já discutido, precisem ser descartados de descrições de contingências ou
procedimentos, já que descrevem, na maior parte das vezes, a alteração ambiental relevante de
forma nítida (mesmo que ela pudesse ser descrita de outra forma). O que se estaria
abandonando não são os termos em si, mas sim a proposição de classificá-los com base na
direção da alteração ambiental por conta das ambiguidades e demais desvantagens apontadas
no debate.
Uma discussão relevante é se o mesmo se aplicaria a demais classificações dos
reforçadores presentes atualmente na análise do comportamento, tais como intrínseco/natural
x extrínseco/arbitrário, e primário x condicionado x generalizado, que, por sua vez, também
apresentam desafios e complexidade apesar de sua ampla utilização para a análise dos mais
variados fenômenos humanos, da mesma forma que a classificação positivo x negativo.
Implicações Sobre o Conceito de Reforçadores
Michael, ao final de seu artigo, faz uma proposta que é adotada por Baron e Galizio:
A solução para nosso problema terminológico é chamar as coisas "boas" de reforçadores
e reforçamento, e as coisas "ruins" de punidores e punição. Um conjunto de termos
refere-se a mudanças que têm um efeito de fortalecimento sobre o comportamento
precedente; o outro, a mudanças que têm um efeito de enfraquecimento. (Michael, 1975,
pp. 43-44).
Se uma resposta é fortalecida porque produz uma certa alteração no ambiente, dizemos
que essa alteração teve função reforçadora. No entanto, se posteriormente uma resposta
diferente produzir a reversão dessa mesma alteração e for enfraquecida, essa mudança passa a
133

ser classificada como punitiva. Isso mostra que uma mesma mudança ambiental pode ter
efeitos distintos sobre o comportamento, dependendo do contexto em que ocorre e do tipo de
relação que estabelece com as respostas. A mesma consequência pode funcionar como
reforçadora em um contexto e como punitiva em outro. Essa análise mostra que uma mesma
condição (ou estímulo) será chamado de reforçador ou punidor a depender de qual o seu efeito
sobre a frequência da resposta.
Diante disso, as seguintes questões poderiam ser levantadas: como devem ser descritas
condições em relação? Uma é reforçadora e a outra punidora, uma é mais punidora e outra
menos punidora ou uma é mais reforçadora e a outra menos reforçadora? Para ilustrar que
áreas de confusão conceitual existem por toda a parte, Sidman (2006) questionou: “algo é
grande ou pequeno, rápido ou lento, alto ou baixo? Em todos esses casos, e em muitos outros,
só se pode responder “isso depende” (pp. 136-137). Nesse trecho, Sidman acabou apontando
para o fato de que em muitos casos, a classificação de um estímulo quanto a propriedades
específicas dele só pode ser feita em comparação com outros estímulos. As implicações disso
para a noção do que é ou não reforçador parecem ser de total relevância.
Os termos “mais reforçador” e “menos punidor” ou “menos reforçador” e “mais
punidor” são sinônimos porque “reforçador” e “punidor” são, na proposta de Michael (1975),
conceitos inversos. Dizer que uma condição é mais reforçadora, ressalta a aproximação a essa
condição. Dizer que uma condição é punidora (ou reforçadora negativa) ressalta o
afastamento dessa condição. Na prática, a “aproximação” e o “afastamento” (como já haviam
apontado Baron & Galizio, 2006b) parecem ser diferentes descrições sobre uma mesma
resposta – tal como adição e subtração seriam diferentes descrições de uma mesma mudança
ambiental. Nesse sentido, a distinçãoentre o que é reforçador ou punidor, grande ou pequeno,
rápido ou devagar, aditivo ou subtrativo, positivo ou negativo seria relativa entre duas
condições específicas.
134

Staats (2006) ilustra bem essa noção no experimento hipotético que formulou, no qual
um rato tem a possibilidade de ir até a sua caixa experimental ou permanecer em uma caixa
vazia. Staats postula que o que determinaria se o rato iria para sua caixa experimental ou não
depende da história de condicionamento com a caixa, isto é, se a pressão à barra foi reforçada
positiva ou negativamente enquanto esteve lá. Deixando de lado os aspectos emocionais a que
ele parece atribuir a causa dos comportamentos de se aproximar ou se afastar das caixas, sua
conclusão parece bastante plausível. Dada uma história de subtração de estímulos aversivos
na caixa experimental, estando em uma caixa vazia, o rato tenderia a se manter na caixa atual.
Ao contrário, dada uma história de produção de estímulos reforçadores positivos na caixa
experimental, estando na caixa vazia, o rato tenderia a entrar na caixa experimental.
Diante dos parâmetros estabelecidos por Staats (2006), como deveriam ser
classificadas as condições? Pela própria classificação do autor, seria chamada de reforçador
negativo (ou estímulo aversivo) e a caixa onde ele recebeu alimento de reforçador positivo – a
caixa vazia poderia ser chamada de “neutra”.
Algo importante de se destacar é que três pré-requisitos estão implícitos nesse
delineamento. Primeiro, deve haver alguma operação estabelecedora (mesmo que
condicionada) que fizesse o rato ir da caixa vazia para a caixa experimental onde produziu
alimento. Segundo a caixa inicial não pode ter alimento disponível e, terceiro, a caixa inicial
não pode estar eletrificada. Se a caixa inicial tivesse alimento disponível, o rato dificilmente
mudaria para a caixa onde alimento só pode ser produzido pela pressão de uma barra, por
exemplo. Pela mesma lógica, se a caixa inicial estivesse eletrificada, o rato provavelmente
mudaria para a caixa onde ele, no passado, pôde desligar o choque. Isso bota em perspectiva
se de fato a caixa vazia poderia ser considerada “neutra”.
Outros casos a serem considerados são o de um rato que se desloca de uma condição
de choque de intensidade 2 mA para uma condição de choque em 1 mA. Sobre isso, como
135

seriam classificados esses termos? Possivelmente tender-se-ia dizer que ambas as condições
são aversivas, mas a segunda condição é “menos aversiva”. Ao contrário (próximo do que
haviam sugerido Baron e Galizio, 2006b), se um rato se deslocasse de uma condição na qual
pode produzir alimento em FR 30 e para uma outra condição pode produzir em FR 10, poder-
se-ia dizer que as duas condições são reforçadoras, mas a segunda é “mais reforçadora”.
Afirmar que, numa situação a condição subsequente é “menos aversiva” e em outra é
“mais reforçadora” é assumir a priori que as condições “choque 1 mA” e “reforçador em FR
10” seriam, essencialmente, reforçadoras negativa e reforçadora positiva (ou punitiva e
reforçadora) respectivamente. Nenhum teste foi feito para saber se esse seria o caso.
Possivelmente, os choques de 1 mA e 2 mA possuíssem uma voltagem tão baixa que a
mudança de uma condição de 1 mA para 0 mA talvez já não fosse capaz de sequer evocar
uma resposta de fuga. Do outro lado, talvez a privação de alimento atual do rato não fosse
capaz de evocar uma resposta na condição de FR 30, apenas na de FR 10. Se as respostas que
produzem essas condições não sofrerem um aumento de frequência, só se poderia dizer que,
nesse caso, os estímulos não funcionaram como reforçadores.
Esses exemplos parecem ilustrar uma tendência a se assumir que estímulos possuam
valores pré-estabelecidos. Não no sentido de que não sejam mutáveis, mas que, após o seu
condicionamento, estímulos adquirem algum valor reforçador absoluto. Dificilmente uma
condição de choque seria descrita como reforçadora ou uma condição de alimento seria
descrita como punitiva, mas a realidade é que essas descrições, sob essas circunstâncias
poderiam ser feitas. O que parece controlar essa “arbitrariedade” para descrever os eventos de
uma forma e não de outra (de forma semelhante à distinção positivo/negativo)?
Uma possibilidade é que para dizer que uma condição é punitiva ou reforçadora se
esteja sempre assumindo como comparação uma suposta “condição neutra” (e.g., a caixa
vazia onde nem o alimento nem o choque estavam presentes). Foi a partir dessa comparação
136

que Staats (2006) caracterizou as caixas experimentais uma como reforçadora e outra como
aversiva. Nesse caso, Staats definiu, mesmo que implicitamente, o que seria sua “caixa
neutra”, mas uma condição neutra e universal não existe. Quaisquer afirmações só podem ser
feitas em relação a duas condições específicas e testadas. Bastaria comparar a condição de FR
30 (ou até mesmo a de FR 10) com uma caixa viveiro (com acesso livre a alimento) para que,
segundo a lógica de aproximação/evitação de Staats (2006), a caixa de FR passasse a ser
chamada de aversiva (lógica similar à de Baron e Galizio, 2006b). Comparações gerais com
uma caixa viveiro talvez fosse um parâmetro até mais coerente do que o da caixa vazia,
considerando que são as condições nas quais um rato de laboratório passa a maior parte do
tempo.
É possível que essa tendência em comparar estímulos ou condições de estímulo com
uma suposta “condição neutra” advenha do senso comum e, em alguma medida, de
perspectivas internalistas para explicação do comportamento. Considerando o caso de uma
pessoa que responde “sim” para uma pergunta como “você gosta de bolo?”. Se a mesma
pessoa recebesse a pergunta “você gosta de bolo quando você está enjoada de tanto bolo que
já comeu?”, ela provavelmente responderia que, nesse caso, “não”. Uma outra possibilidade é
que uma pessoa respondesse que “ainda gosta de bolo, mas que naquele momento não
comeria mais”. Uma resposta parecida talvez fosse esperada diante da pergunta “você gosta
de bolo quando você está em uma situação de perigo e precisa escapar?”: “gostar eu gosto,
mas não comeria nesse momento”.
No senso comum, parece ser assumido que o “gostar” ou “não gostar” de algo é
absoluto, e que o “gosto” é algo que se possui. Novamente, não “absoluto” no sentido de que
é imutável, mas no sentido de que existe a despeito das condições atuais como se estivesse
guardado - da mesma forma que são tratados outros constructos como “conhecimento”,
“memória” ou “personalidade”. Naturalmente, analistas do comportamento, apesar de fazerem
137

parte de um grupo bastante particular em sua forma de falar, continuam fazendo parte de uma
comunidade verbal mais geral. Não é incomum ver pessoas engajadas com a análise do
comportamento (em especial, mas não exclusivamente novos alunos) simplesmente trocarem
palavras do senso comum como “bom” por “reforçador”, “sede” por “privação de água” sem
que a base explicativa do que está sendo dito mude. Mudanças exclusivamente nas palavras
gera frases como “o rato foi reforçado” (algo que remete à produção de “prazer” no rato) ao
invés de “a resposta do rato foi reforçada” (referindo-se diretamente ao aumento na
probabilidade dela).
Quando um analista do comportamento diz que um estímulo é reforçador ele, em
muitos casos, pode estar sob controle de condições parecidas com as da pessoa que diz gostar
de bolo. Uma possibilidade é que ambos estejam considerando o contexto atual para
responder a perguntar (i.e., a motivação existe e dado um estímulo discriminativo, a resposta
seria emitida). Outra possibilidade é que mesmo que a motivação agora não exista, no
passado, esse estímulo foi produzido quase sempre que o estímulo discriminativo esteve
disponível, e seja a frequência observada da resposta sob essas circunstâncias que controle o
operante verbal “gostar”. Outra hipótese,ainda, é que uma motivação poderia existir, mas
outra operação motivadora estaria evocando outro comportamento concorrente. Nesse caso,
poder-se-ia pensar que, se ele estivesse em condições “neutras”, ele emitiria respostas que
produzissem o bolo. Uma última alternativa é que alguma motivação existe, o estímulo
discriminativo está presente, mas a resposta que produziria o reforçador seria muito “custosa”
– no sentido de que emitir aquela resposta em particular produz estímulos aversivos (e.g., um
choque, perda de dinheiro ou até estímulos ligados à fadiga). Nesse caso, poder-se-ia pensar
que essa resposta em específico não está sendo emitida, mas outras respostas que produzissem
o mesmo reforçador poderiam ser.
138

Embora se tenha a tendência de atribuir um valor absoluto a certos estímulos, seu
efeito como reforçador depende do contexto específico. Um bolo pode aumentar ou diminuir
a probabilidade de uma resposta, dependendo da situação. Por exemplo, se uma pessoa pede
torta em vez de bolo ao garçom, não se pode afirmar que o bolo é reforçador naquele
contexto. O mesmo vale para estímulos aversivos: um choque de 1 mA pode ser reforçador
diante de um de 2 mA, mas não em outras situações. Além disso, estímulos que normalmente
seriam reforçadores (como comida para um animal faminto) podem não manter respostas se a
exigência for alta demais. Isso mostra que o valor reforçador de um estímulo não é fixo, mas
relacional e dependente das condições presentes.
Se o valor de um estímulo reforçador é definido a depender da presença de outros
estímulos ambientais, nenhum estímulo possui valor intrínseco. Para se dizer que um estímulo
ou condição de estímulo são reforçadores, seria necessário indicar diante de quais condições
antecedentes (em especial as operações motivadoras) ou, pelo menos, dizer que o estímulo
tem uma tendência a ser reforçador.
A partir disso, quando um analista do comportamento recebe a pergunta “uma pelota
de alimento é um reforçador para um rato?”, ele poderia responder como Sidman (2006):
“isso depende” (pp. 136-137). Outra possibilidade, é dizer que “tende a ser” – considerando
que diante de diversas condições antecedentes, o alimento foi reforçador.
Vale notar que já é comum que analistas do comportamento tenham uma tendência a
dizer que o valor das coisas depende. Quando um professor recebe a pergunta “palmas são
reforçadoras?”, ele poderia dizer “depende da pessoa”, ou, mais especificamente, “depende da
história de reforçamento da pessoa”. Isso continua sendo verdade, mas o que está sendo
apontado aqui é que não depende só disso. O valor reforçador de um estímulo depende 1) da
história de condicionamento desse organismo com esse estímulo, 2) das condições
antecedentes presentes que evocariam ou não sua produção e 3) da resposta exigida para
139

produzi-lo. Estímulos não carregam “um valor reforçador” dentro de si tal como pessoas não
carregam seus “gostos” onde quer que vão.
Se uma resposta é fortalecida porque produz uma certa alteração no ambiente, se diz
que essa alteração teve função reforçadora. No entanto, se posteriormente uma resposta
diferente produzir a reversão dessa mesma alteração e for enfraquecida, essa mudança passa a
ser classificada como punitiva. Isso mostra que uma mesma mudança ambiental pode ter
efeitos distintos sobre o comportamento, dependendo do contexto em que ocorre e da relação
que estabelece com as respostas. O que define a função de uma consequência não é sua
natureza intrínseca, mas os efeitos que produz sobre a frequência das respostas que a
antecedem.
Vale lembrar que o que se chama de “valor” de um estímulo é também uma inferência.
Atribuir valor a um estímulo é uma forma de se referir à tendência do organismo de emitir
respostas que o produzam. Em outras palavras, diz-se que um estímulo tem mais valor que
outro no sentido de que o organismo emite mais respostas que produzam um em vez do outro
- e que um mesmo reforçador tem seu valor alterado no sentido de que a frequência de
respostas que o produzem foi alterada. Sob essa ótica, o único efeito operante diretamente
observável de uma operação motivadora seria o aumento ou diminuição na frequência de uma
resposta (efeito evocativo). Essa crítica à noção de “valor reforçador” como um efeito
separado vem sendo feita por autores como Whelan e Barnes-Holmes (2010), que
argumentam que o efeito evocativo é, na verdade, a única evidência empírica disponível de
que houve alteração no valor da consequência.
Nesse sentido, tanto dizer que um estímulo “é um reforçador” quanto que ele “é mais
reforçador que outro” são apenas formas de indicar que, em determinada condição, esse
estímulo tenderá a ser produzido. Se fosse desejável, seria possível abandonar completamente
a ideia de “valor de estímulo” e descrever apenas os efeitos sobre a frequência das respostas
140

que produzem determinada mudança ambiental. Mesmo mantendo a referência ao valor,
bastaria descrever que certas condições de estímulo são “mais reforçadoras” ou “menos
reforçadoras”. Michael (1975) já havia sugerido o abandono do termo “aversivo” em favor de
“punidor”, mas mesmo “punidor” poderia ser descartado em nome de “menos reforçador”.
Por fim, vale comentar que as diferenças entre as distinções entre reforçadores
positivos e negativos apresentadas por Santos e Leite (2013), à luz da presente discussão, não
têm base para serem mantidas. A principal distinção apresentada por eles diz respeito à adição
versus subtração de estímulos como critério para classificar um reforçamento como positivo
ou negativo. No entanto, como discutido anteriormente a partir de vários autores do debate
(Baron e Galizio, 2005, 2006a, 2006b; Michael, 1975), esse critério é arbitrário, já que toda
adição envolve a retirada de algum outro estímulo, e toda retirada implica a permanência ou
substituição por outro elemento do ambiente. Além disso, os autores também propõem outras
diferenciações conceituais, como a de que os reforçadores negativos exigiriam a presença de
estímulos aversivos, enquanto os positivos envolveriam estímulos agradáveis ou desejáveis.
Essa forma de distinção incorre em pressupostos mentalistas ou essencialistas, que não se
sustentam do ponto de vista funcional, também criticado pelos autores no debate (CITAR).
Como discutido, o que define se uma consequência é reforçadora é o efeito que ela produz
sobre a frequência das respostas e não suas supostas qualidades intrínsecas. Assim, mesmo as
demais distinções apresentadas por Santos e Leite não se apoiam em critérios observáveis e
funcionais, sendo também infundadas.
Implicações para o Conceito de Reforçadores Condicionados
No exemplo hipotético apresentado por Michael (2006) um rato era exposto a uma
condição experimental de mais alimento e menos choque na presença de um tom e outra de
mais choque e menos alimento na ausência do tom. Nessa na fase de condicionamento
(alternância entre a condição sem tom e com tom), quem quisesse aplicar a distinção
141

positivo/negativo, poderia dizer que a mudança de uma condição para a outra seria tanto
reforçadora positiva quanto negativa, porque tanto uma adição (mais alimento) quanto uma
subtração (menos choques) estariam sendo aplicadas. A pergunta de Michael, entretanto,
refere-se a uma mudança entre as condições sem tom e com tom enquanto estímulos
condicionados. Michael supôs que a mudança do estímulo condicionado “sem tom” para o
estímulo condicionado “com tom” seria reforçadora (mesmo quando o alimento e o choque
não estivessem mais sendo apresentados). A partir disso, ele colocou o seguinte
questionamento: nesse caso estaríamos falando de uma condição de reforçamento positivo ou
negativo?
O autor questionou a plausibilidade de usar a “adição de um tom” como critério para
dizer que se trata de reforçamento positivo. Isso porque a escolhade qual condição seria a
“com tom” e “sem tom” foi arbitrária. Se o condicionamento tivesse sido feito ao contrário
(i.e., condição “sem tom” com mais alimento e menos choque e condição “com tom” com
menos alimento e mais choque), o mesmo tipo de mudança teria que ser chamado
reforçamento negativo, o que faria pouco sentido.
Uma forma de abordar essa pergunta, poderia ser apelar para o valor de cada
reforçador. Será que a adição do tom serviria como reforçador positivo para alguma outra
resposta? Se a resposta fosse sim, dir-se-ia que ela é um reforçador positivo e, dessa forma, a
adição do tom seria reforçamento positivo. O problema é que, como já notado, a propriedade
reforçadora de um estímulo depende necessariamente das condições diante das quais ele será
produzido. Como separar as condições “com tom” e “sem tom” de forma que só uma delas
esteja envolvida na contingência? Não é possível porque a adição de uma condição
necessariamente implica a subtração da outra.
Esse delineamento dificulta uma análise das mudanças envolvidas porque, além de
introduzir duas variáveis experimentais ao mesmo tempo, só são feitas comparações entre
142

duas condições experimentais, sem qualquer condição controle. Algo que ainda não havia
sido pontuado é que Michael (2006) sequer havia indicado qualquer resposta a ser medida no
experimento, apenas diz que a mudança seria reforçadora.
O experimento de Jwaideh e Mulvaney (1976), citado na Introdução, havia
demonstrado como estímulo luminoso poderia se tornar aversivo quando pareado a uma
condição de menor produção de alimento em relação a outra. Esses dados fortalecem a noção
de que o valor de uma condição de estímulo é estabelecido especificamente em relação a uma
outra condição de estímulo. Se a condição de luz vermelha de VI 120s tivesse sido
condicionada em alternância com uma condição de luz verde de um VI mais alto (ou até
mesmo extinção), é possível que o resultado contrário tivesse sido observado: a luz vermelha
teria sido produzida preferencialmente sem a luz verde (algo que que não foi empiricamente
testado).
Retornando ao exemplo de Michael (1975), uma condição de menos alimento e mais
choque (sem tom) foi condicionada em alternância com uma condição de mais alimento e
menos choque (com tom). Nesse caso seria possível supor que a condição sem tom, tal como
a luz vermelha (Jwaideh & Mulvaney, 1976) se tornou um reforçador negativo condicionado
e a condição com tom, se tornou um reforçador positivo condicionado. Dessa forma,
respondendo à pergunta de Michael: “a mudança da condição deveria ser considerada
reforçadora positiva ou negativa?”. De fato, tanto faz. A depender de qual estímulo for
escolhido para ser descrito, a descrição pode ser classificada como reforçamento positivo ou
negativo. Se a descrição for “a condição com tom foi adicionada”, essa descrição seria
classificada como reforçamento positivo. Se a descrição for “a condição sem tom foi
subtraída”, essa descrição seria classificada como reforçamento negativo. Outra possibilidade
é afirmar que tanto a condição sem tom foi condicionada como reforçador negativo quanto a
condição com tom foi condicionada como reforçador positivo, então o reforçamento é
143

positivo e negativo. A partir disso, o questionamento continua sendo: qual a utilidade de se
classificar alterações ambientais como positivas ou negativas mesmo que isso seja possível?
Respostas sobre algumas particularidades do condicionamento de estímulo (ou
condições de estímulo) só poderão ser produzidas experimentalmente. Uma hipótese é que ao
adquirir uma função semelhante, o reforçador condicionado se tornaria “aversivo”, em
comparação com as condições diante das quais o reforçador de base é aversivo, e
“reforçador”, em comparação com as condições diante das quais o reforçador de base é
reforçador. Em outras palavras, a função do reforçador condicionado variaria de forma similar
à função do reforçador de base. Essa parece ser uma possível forma de descrever o
condicionamento de funções operantes levando em conta que as funções/valores de um
estímulo são relativas e, ao mesmo tempo, não recorrendo à distinção positivo/negativo. Um
experimento que poderia ser feito é seria condicionar uma luz vermelha fosse a um choque de
2 mA e uma luz verde a um choque de 1 mA e testar se, mesmo na ausência dos choques, o
rato passaria a emitir respostas que trocassem a luz vermelha para a verde (o mesmo poderia
acontecer com estímulos condicionados a esquemas de FR 30 e FR 10).
Em suma, é difícil dizer que um estímulo (ou condição de estímulo) possua uma
função por si só e tampouco que uma caixa vazia seja um “estímulo neutro”. Condições de
estímulos parecem ter ou adquirir funções operantes apenas enquanto contrapostos a uma
outra condição de estímulo. Além disso, parece ser o caso que um estímulo reforçador só é
reforçador na mesma medida em que um outro estímulo for aversivo e que, nesse sentido, as
descrições “mais reforçador” e “menos aversivo” (ou “menos punitivo”) seriam equivalentes.
Parece ser perfeitamente possível diferenciar quaisquer condições de estímulo entre menos
reforçadora e outra mais reforçadora. Nesse sentido, se o objetivo for o corte de termos, essa
análise mostrou parecer possível poder falar apenas de reforçadores, sem menção a tipos
específicos de reforçadores ou a aversivos e punidores.
144

Os estudos de Perone e Courtney (1992) mostraram que, em esquemas mistos, a
magnitude do reforçador poderia influenciar diretamente a duração das pausas seguintes entre
razões - com pausas mais longas após reforçadores de maior magnitude. Já em esquemas
múltiplos, em que estímulos discriminativos acompanharam diferentes magnitudes do
reforçador, pausas mais curtas ocorreram após estímulos discriminativos que antecederam
reforçadores de maior magnitude, e pausas mais longas ocorreram após os estímulos
discriminativos que antecederam reforçadores de menor magnitude. Além disso, houve uma
interação entre as magnitudes do reforçador previamente obtido e o controle discriminativo
relacionado a uma magnitude de reforçador diferente, sendo o efeito da magnitude do
reforçador anterior mais evidente quando o estímulo discriminativo era o que acompanhava
um reforçador seguinte de menor magnitude.
Perone (2003) indicou ter feito uma ampliação desse delineamento na qual a
introdução de uma chave de fuga revelou que, nas transições de um reforçador de maior para
menor magnitude no esquema múltiplo, a emissão de respostas de fuga que produziam um
período de timeout (luz da caixa e da chave de alimento eram apagadas) como consequência,
era mais provável do que na transições de reforçador de menor para maior magnitude e
acompanhada de pausas mais longas no responder que produzia o reforçador de baixa
magnitude. Esses resultados sustentam a interpretação de Perone & Courtney (1992) e Perone
(2003) de que pausas entre razões podem funcionar como respostas de fuga a condições
aversivas produzidas por certas transições dentro de esquemas de reforçamento positivo.
Se interpretados desta maneira, esses resultados parecem indicar uma outra forma pela
qual estímulos aversivos podem ser condicionados em esquemas que envolvem apenas
contingências de reforçamento positivo. Esses experimentos colaboram com a noção de que o
fundamental para que um estímulo seja condicionado como reforçador negativo e outro como
145

reforçador positivo é que haja duas condições contrastantes em que uma é mais reforçadora
que a outra.
Outro caso em que se identifica a ambiguidade da distinção entre reforçamento
positivo e negativo consiste na discriminação de estímulo estabelecida por reforçamento
negativo. Considere-se um pombo que é exposto a choques leves, mas duradouros,
periodicamente. Se, diante de uma luz verde, bicar um disco eliminasse o choque e, diantede
uma luz vermelha, emitir a mesma resposta não produzisse essa consequência, é esperado que
o número de bicadas diante da luz verde passasse a ser maior do que na luz vermelha. Em
outras palavras, a luz verde teria se estabelecido como estímulo discriminativo e a vermelha
como estímulo delta para bicadas que produzissem interrupção dos choques. Além disso,
também é provável que diante da luz vermelha e do choque, o pombo emita com frequência
uma outra resposta que produza a luz verde (e.g., bicar um segundo disco) permitida pelo
experimentador. Nesse sentido, pode-se dizer que a luz verde teria se tornado um estímulo
reforçador condicionado positivo para a resposta de bicar o segundo disco, ilustrando como
um reforçador positivo poderia ser criado em situações denominadas como de reforçamento
negativo.
Se interpretados na forma apresentada, esses dois exemplos têm em comum a
construção de reforçadores condicionados que poderiam ser classificados como positivos ou
negativos a partir do seu pareamento com reforçadores classificados de maneira oposta.
Findley (1958), no entanto, apresenta uma interpretação alternativa a esse tipo de
leitura. No experimento feito pelo autor, pombos foram expostos a esquemas concorrentes sob
controle de estímulos discriminativos (luz verde e luz vermelha) que foram relacionados a
diferentes razões de reforçamento. Os pombos podiam emitir uma resposta de bicar em uma
chave de mudança, que alternava o esquema em vigor e o SD relacionado. As respostas de
troca entre esquemas não foram, entretanto, interpretadas como respostas de fuga pelo autor.
146

Em vez disso, interpretou que esse padrão de troca era determinado de forma crítica pela
frequência relativa de reforçamento, sem supor uma função aversiva condicionada para a luz
relacionada pelo experimentador ao esquema de razão mais exigente.
Implicações do Abandono da Distinção Sobre o Conceito de Punição
Já foi indicado que tanto para Michael (1975) quanto para Baron e Galizio (2005) a
estratégia mais coerente para se lidar com os problemas gerados pela distinção entre o
reforçamento positivo e o negativo seria abandonar a distinção por completo e passar a
separar processos apenas entre reforçamento e punição. O conceito de punição, no entanto,
não é definido da mesma maneira entre autores.
Como se sabe, Skinner (1953/2014) e Sidman (1989/2009), definem a punição de
maneira procedimental, identificando-a como a apresentação de reforçadores negativos ou a
retirada de reforçadores positivos após a emissão de uma resposta de determinada classe. Esse
destaque se faz relevante uma vez que a definição de punição proposta por esses autores,
conhecida como assimétrica, implica na identificação prévia de reforçadores e, além disso, na
possibilidade de classificar esses reforçadores como sendo positivos ou negativos, já que a
apresentação de um reforçador positivo ou retirada de um negativo não seriam definidas
igualmente como punição. Dessa maneira, o abandono da distinção entre reforçamentos
positivo e negativo teria impactos relevantes para a definição de punição, ao menos quando
adotada a perspectiva assimétrica apresentada.
Partindo-se de uma definição simétrica, no entanto, seria possível definir punição
como um processo no qual uma determinada alteração ambiental, que sucede de forma
suficientemente contígua e sistemática as emissões de instâncias de uma mesma classe de
respostas, faz com que a probabilidade futura dessas emissões, quando diante de condições
motivacionais e discriminativas semelhantes, diminua. Com exceção de alguns detalhes que
também são raramente mencionados quando se define reforçamento (e.g., classes de resposta,
147

contiguidade, condições discriminativas e condições motivacionais), essa definição de
punição parece bastante próxima da proposta por de Azrin e Holz (1966) de que “punição é
uma redução da probabilidade futura de uma resposta específica como resultado da
apresentação imediata de um estímulo em função dessa resposta” (p. 381). Essa definição não
seria prejudicada pelo abandono da distinção entre reforçamento positivo e negativo.
Algo importante de notar é que o fato de a distinção assimétrica de punição ficar
prejudicada não implica na existência ou não de um processo punitivo que enfraqueça
respostas. A diminuição na emissão de uma resposta ainda poderia ser explicada pelo
reforçamento de outras respostas. Ainda assim, caso a distinção positivos/negativos fosse
abandonada, a definição assimétrica precisaria de uma reformulação.
Vale ressaltar que da mesma forma que o abandono da distinção entre os
reforçamentos positivo e negativo acabaria prezando por uma parcimônia científica (no
sentido de diminuir o número de conceitos necessários para se explicar fenômenos), a adoção
da visão assimétrica de punição proposta por Skinner (1953/2014) também caminha nesse
sentido. Se for possível explicar os efeitos da punição apenas recorrendo ao processo de
reforçamento isso não caminharia na direção desejada por Michael (1975) e Baron e Galizio
(2005) de abandonar nomeações desnecessárias?
Por fim, além das mencionadas acima, outra implicação do debate sobre a distinção
entre os reforçamentos positivo e negativo sobre o conceito de punição é que todas as
ambiguidades e problemas apontados a respeito da distinção entre reforçamentos positivo e
negativo também se aplicam aos tipos de punição positiva e negativa. Isso porque a crítica
central de que a distinção é uma caracterização de descrições arbitrárias se aplica igualmente
aos tipos de punição: qualquer descrição de adição de um estímulo pode ser reescrita como
subtração de seu estímulo oposto e vice-versa.

148

Implicações do Conceito de Operação Motivadora para a Distinção
Sidman (2006), ao rebater a noção de que estímulos possam ser sempre descritos em
suas versões opostas, chegou a dizer que:
É, sem dúvida, verdade que o fim de um período sem dinheiro pode ser crítico para
determinar o valor reforçador do dinheiro, mas ainda assim vemos bilionários
trabalhando arduamente para obter mais. A eficácia de alguns reforçadores positivos
depende menos de sua ausência anterior do que do que eles tornam possível em termos
de comportamento futuro. (Sidman, 2006, p.137).
Neste trecho, Sidman (2006) reconhece que “um período sem dinheiro” pode
estabelecer o valor reforçador do dinheiro. Em outras palavras, o período sem dinheiro tem
função de operação estabelecedora do dinheiro como reforçador positivo. Entretanto, ele
afirma que, em alguns casos, mesmo na ausência de um “período sem dinheiro” há pessoas
(bilionários) trabalhando para produzir mais dinheiro. A despeito do que ele quis dizer com
“arduamente” ou da própria definição de “trabalho” usada, para fins de simplicidade, o que
será entendido como “trabalhando arduamente” será apenas que comportamentos que
produzem dinheiro continuam sendo emitidos com frequência alta.
Sidman (2006) conclui dizendo que a eficácia de alguns reforçadores depende menos
de sua ausência anterior (i.e., “período sem dinheiro”) e mais do que tornam possível em
termos de comportamento futuro. Partindo do princípio básico de que o futuro não pode
controlar o passado, entender-se-á “o que possibilitam em termos de comportamento futuro”
como “o que possibilitaram no passado em elos subsequentes da mesma cadeia
comportamental”. No mesmo sentido, entendendo que não é o que será produzido no futuro
que controla a produção atual de dinheiro, quais as variáveis presentes no momento da
resposta que são responsáveis por evocá-la? Em outras palavras: como a produção de
reforçadores por elos subsequentes ao elo atual está agindo sobre a presente resposta?
149

Quando se fala de estímulos reforçadores condicionados generalizados (como o
dinheiro) é dito que eles não dependem de privações específicas que o estabeleçamcomo
reforçadores, uma vez que foram pareados a diversos reforçadores, e são efetivos sob uma
gama diversa de privações específicas. Isso não é o mesmo que dizer que nenhuma operação
motivadora os controla, mas que qualquer operações motivadora envolvida no
estabelecimento de outros reforçadores subsequentes na cadeia comportamental podem
estabelecer o dinheiro como reforçador. Numa sociedade em que quase tudo pode ser
produzido ou eliminado com dinheiro, isso incluiria incontáveis reforçadores condicionados
ou incondicionados.
Apesar de poder se argumentar a favor de uma operação motivadora condicionada que
0estabelece o valor do dinheiro, privações, se entendidas como operações motivadoras
incondicionadas, nunca se aplicam diretamente ao dinheiro. Outros estímulos condicionados e
incondicionados condicionaram seu valor. Mesmo assumindo que um bilionário tivesse dez
bilhões em dinheiro líquido para gastar (o que não costuma ser o caso porque grande parte
dessa fortuna é mantida na forma de posses) ele ainda poderia querer comprar uma empresa
avaliada em 12 bilhões, por exemplo. Pensando no comportamento de “fazer um
investimento” que aumente seu dinheiro de 10 para 12 bilhões, ainda poder-se-ia afirmar que,
mesmo se tratando de um bilionário, a situação envolveu necessariamente o “término de uma
condição anterior na qual 12 bilhões estavam ausentes”. A presença específica de 12 bilhões,
no caso, seria condição diante da qual a resposta de comprar a tal empresa poderia ser
emitida. Em outras palavras, um estímulo discriminativo para a resposta de comprar e um
reforçador condicionado para a resposta de investir.
Talvez a base do argumento de Sidman (2006) seja que nem todo comportamento
requer uma operação motivadora. Isso pareceria concordar com o que foi falado por Marr
(2006) sobre ligar um rádio não ter relação com um “sofrimento” anterior à presença da
150

música. Se certos comportamentos podem ocorrer sem a presença de operações motivadoras,
restaria explicar o que, dada a presença constante do estímulo discriminativo, faria o
indivíduo se comportar numa hora e não na outra. Ou dada a presença de dois estímulos
discriminativos, o que controlaria a emissão de cada resposta em momentos específicos. Esse
outro debate, entretanto, deverá ser tratado em outros trabalhos dedicados ao tema das
operações motivadoras.
Iwata (2006) havia sugerido que avanços recentes na área de operações motivadoras
sugeriam que distinções arbitrárias poderiam ser úteis para a área. Mais especificamente ele
estava se referindo à distinção entre operações estabelecedoras e operações abolidoras.
Enquanto o primeiro conceito descreveria o efeito das operações motivadoras de aumentar a
probabilidade de respostas específicas, o segundo descreve o efeito de diminuir a
probabilidade de respostas específicas. Iwata sugeriu que esse segundo conceito tinha sido
criado para abarcar essa “bidirecionalidade”. Nesse sentido, talvez essa distinção seja
arbitrária para Iwata por conta da inevitabilidade de que sempre que um comportamento
aumenta de probabilidade, a probabilidade de outros comportamentos diminui e, de fato, isso
se assemelharia com a noção de que toda adição implica uma subtração no caso da distinção
positivo/negativo.
Durante o debate, também foi sugerida a possibilidade de que propriedades das
operações motivadoras envolvidas talvez fossem os aspectos mais relevantes para dizer se um
reforçamento é positivo ou negativo (e.g., sua intensidade ou velocidade de introdução).
Como discutido, talvez as categorias de operações motivadoras apresentadas não ajudem a
manter ou desbancar uma distinção entre reforçamentos. Ainda assim, é bastante possível que
avanços nas discussões ou até o desenvolvimento de outros tipos de categoria auxiliem nesse
processo. O conceito de operações motivadora parece ter sido muito pouco pesquisado tanto
teórica quando experimentalmente.
151

Talvez o elemento mais relevante do conceito de operações motivadoras para o debate
sobre a distinção entre os tipos de reforçamento positivo e negativo seja a própria distinção
entre os tipos de operação motivadora. As operações motivadoras incondicionadas (OMIs)
podem ser divididas entre privação (de reforçadores primários, tais como por exemplo
alimento, água e sono), estimulação dolorosa, variações na temperatura e variáveis sexuais.
As operações motivadoras condicionadas (OMCs) podem ser divididas entre substitutas,
reflexivas e transitivas (Michael, 2004). Vale ressaltar que Michael acrescenta como OEs
como mesmo efeito que a privação de água, o sal, a transpiração e a perda de sangue.
A princípio, se considerados os reforçadores relacionados à cada OE e como
contingências de reforçamento que usam esses estímulos são tipicamente chamadas, as OEs
poderiam ser divididas, grosseiramente, em OEs relacionadas a reforçamento positivo (i.e.,
privação, variáveis sexuais, substitutas e transitivas), e OEs relacionadas a reforçamento
negativo (i.e., estimulação dolorosa e reflexiva) – as variações de temperatura, como já
discutido, não podem ser facilmente classificadas por uma definição tradicional.
Uma diferença entre a relação entre as OEs e a alteração ambiental reforçadora a qual
estão relacionadas pode ser notada: quando choque é apresentado a um rato e ele emite uma
resposta que o elimine, a mudança reforçadora é a própria eliminação do choque. Por outro
lado, uma pessoa consome muito sal e isso aumenta a probabilidade de que ela emita
respostas que no passado produziram água, ela não está eliminando o sal em si como
consequência da resposta (ainda que a ingestão hídrica auxilie na eliminação do sódio pela
urina posteriormente). Com base nisso, seria possível então basear uma distinção entre os
reforçamentos positivos e negativos com base nos tipos de operação motivadora envolvidas?
Esse poderia ser um caminho explorado por estudos futuros sobre o tema.
Outra coisa a ser testada é se, dada a capacidade de induzir uma operação
estabelecedora que estabelece o alimento como reforçador de forma intensa e abrupta (e.g.,
152

uma droga de ação rápida que deixaria o animal “faminto”), será que um organismo, dadas as
condições adequadas para tal, aprenderia a emitir respostas que interrompessem ou
prevenissem a adição dessa droga em seu organismo? Quem sabe até mesmo intensidades
mais moderadas de fome (que não provocariam dor) se fossem apresentadas subitamente,
pudessem evocar respostas mais intensas. Uma possibilidade é estudar o comportamento de
pessoas com condições como a Diabetes mellitus cuja hipoglicemia e a hiperglicemia podem
causar alterações súbitas na fome (polifagia) e sede (polidipsia) (BIREME/OPAS/OMS,
2017). Estudos como esse seriam úteis para investigar se seriam as propriedades das
operações motivadoras ligadas a cada tipo de reforçamento.
Algumas formas de dores de cabeça que aumentam em intensidade gradualmente e
poderiam ser comparadas ao aumento da privação de alimento (e frequentemente pode ter
causas semelhantes como privação de sono, alimento e água). Se um choque fosse adicionado
de forma gradual e lenta, é possível que o organismo respondesse para eliminá-lo somente
numa intensidade mais alta do que a que ele responderia se sua introdução fosse abrupta.
Naturalmente, essas dúvidas só serão respondidas de forma experimental, mas elas ilustram a
incerteza acerca de quais aspectos dos chamados reforçamentos positivo e negativo de fato
estão controlando o comportamento de assim rotulá-los.
Por fim, algo interessante de se notar é que o mesmo autor que havia proposto o
abandono da distinção entre os reforçamentos positivos anos antes, propôs e seguiu
desenvolvendo uma distinção entre operações motivadoras específicas (Michael, 1982, 2004).
A crítica feita por Lattal e Lattal (2006) sobre uma distinção ter sido assumida a prioripode
se aplicar aqui também, especialmente em uma área com baixíssima literatura experimental.
Outro ponto a ser pesquisado seria o uso prático das categorias de operações motivadoras em
relação às categorias de reforçamento. Mais especificamente, será que as contingências diante
153

das quais uma pessoa costuma dizer que uma operação motivadora é reflexiva, não são
justamente as contingências que ela já considerava reforçamento negativo?

154

Considerações Finais
A análise empregada permitiu a identificação e classificação das diversas falas dos
autores de forma a agrupá-las e articulá-las. Sobre os problemas da manutenção, conclui-se
que seus termos podem gerar confusão (em particular o termo “reforçamento negativo”) e que
uma distinção baseada em adição ou subtração de estímulos, além de ter sido assumida antes
que evidências convincentes tivessem sido produzidas, parece ser intrinsecamente ambígua.
Nesse sentido, alguns autores acreditam que a distinção acaba por gerar simplificações e
distorções conceituais, limitações de aplicação e problemas didáticos.
A ambiguidade (tal como apontada por Michael, 1975 e Baron e Galizio, 2005) parece
ser um problema intrínseco a uma distinção baseada nas operações adição ou remoção de
estímulos. Nesse sentido, a classificação de uma mudança reforçadora como positiva ou
negativa acaba sendo arbitrária e resume-se à forma como se escolhe descrever uma mudança.
Todo evento reforçador envolve uma mudança de uma condição para outra condição e
determina parâmetros específicos para ambos: em um a ausência (ou menor magnitude) de um
estímulo e no outro sua presença (ou maior magnitude de um estímulo). A linguagem usada
para descrever eventos e estímulos permite que tanto as mudanças quanto os próprios
estímulos sejam descritos em ambas as direções opostas (i.e., calor e frio, luz e escuro, choque
e ausência de choque).
Nesse sentido, abandonar a distinção poderia ser vantajoso no sentido de gerar menos
distorções e eliminar os problemas decorrentes. Vale ressaltar que abandonar a distinção e
mudar a forma de descrever contingências são duas coisas diferentes. Michael (1975) havia
sugerido que descrever as mudanças como adição e subtração de estímulos atrapalharia que
descrições detalhadas das condições envolvidas na mudança pudessem ser feitas. Entretanto,
como apontaram Baron e Galizio (2005, 2006a), esse não precisa ser o caso.
155

Como discutido, a manutenção da distinção e o uso dos termos “adição” e “subtração”
(e seus equivalentes) são coisas diferentes. Nem o uso nem o abandono desses termos
implicaria em uma descrição mais ou menos precisa dos dados. Apesar de haver casos em que
é importante descrever precisamente as condições antecedentes e subsequentes, nos casos em
que dizer que “uma condição de ausência de determinado estímulo” mudou para “uma
condição de presença desse estímulo”, o procedimento poderá ser facilmente resumido como
“adição de um estímulo” sem perda de qualquer informação. Dito isso, usar termos adição e
subtração como formas convenientes de descrever um fenômeno é diferente de dar nomes
específicos para as contingências que foram descritas assim e ainda atribuir a elas diferenças
processuais fundamentais. Parar de nomear relações como reforçamento positivo ou negativo,
não implica que não se possa dizer que calor foi adicionado ou frio foi subtraído. Ambas as
descrições funcionam para comunicar adequadamente a (mesma) informação.
Mesmo diante dos seus problemas conceituais apontados, foi argumentado que a
distinção poderia cumprir funções relevantes em diferentes contextos (categorias “Vantagens
da Manutenção” e “Explicações para a Manutenção”). A análise dessas falas revelou que
muitas dessas funções não necessariamente se restringiam ao uso da distinção, enquanto
outras pareciam se originar de momentos em que a argumentação de Baron e Galizio (2005)
foi confusa – algo que os autores abordaram em suas respostas (Baron & Galizio, 2006a,
2006b). Outro ponto é que a confusão/ambiguidade da distinção impedia que muitas dessas
possíveis funções se aplicassem. Por exemplo, como afirmou Michael (1975) “se a distinção é
difícil de ser feita em muitos casos de comportamento humano, o alerta [para se utilizar
reforçamento positivo em vez de negativo] não será fácil de seguir” (pp. 41-42).
Algumas explicações para a manutenção da distinção recorriam à noção de que seu
uso era mantido puramente por contingências de reforçamento arbitrárias e não por uma
156

vantagem intrínseca de seu uso. Em outras palavras, só é usada porque já é usada e valorizada
pela comunidade verbal de analistas do comportamento.
Em contrapartida, alguns autores sugeriram que se o critério de adição e subtração não
tem fundamento, talvez outros fatores estivessem levando analistas do comportamento a
separar contingências de reforçamento como sendo positivas ou negativas. Entre os aspectos
levantados estão a abruptidão da mudança ambiental, os mecanismos fisiológicos envolvidos,
as “emoções” ou “sentimentos” envolvidos, a severidade das operações motivadoras, a
saliência da mudança e propriedades particulares de estímulos específicos.
Duas explicações também foram oferecidas para justificar o porquê de o abandono ter
sido sugerido. Uma delas (Marr, 2006) se referia à noção de que a distinção poderia ter sido
útil em algum momento, mas agora pode ser descartada. A outra (Sidman, 2006) indicou a
possibilidade de que tenha havido uma má compreensão da distinção. Nessa situação, Sidman
afirma:
Suspeito que uma das razões para o desconforto de Baron e Galizio (2005) com a
distinção entre reforçamento positivo e negativo seja a sensação de que ela reflete
diferenças no próprio processo de reforçamento. Não tenho certeza de onde essa
sensação vem. Para qualquer um que defenda tal visão, a discussão convincente deles
deveria encerrar a questão. (Sidman, 2006, p. 137).
Nesse sentido, Sidman (2006) parece afirmar que a diferença entre os dois tipos de
reforçamento não estaria nos processos, mas não especifica qual seria essa diferença. Uma
possibilidade diz respeito à presença ou não de efeitos colaterais como indicado em Sidman
(1989/2009) - apesar de ele não mencionar essa possibilidade no debate.
Com relação às sugestões feitas pelos autores, alguns direcionamentos gerais podem
ser feitos com base na análise já realizada: 1) usar os termos adição e subtração (e seus
equivalentes) quando permitirem uma comunicação mais efetiva da operação; 2) recorrer à
157

sugestão de Michael (1975) de indicar condições de estímulo pré e pós-mudança como forma
de descrever uma mudança reforçadora; 3) ensinar os conceitos de “reforçamento positivo” e
“reforçamento negativo” aos novos alunos e leitores, de modo que possam compreender e
navegar a literatura da área; 4) é possível manter os termos “positivo” e “negativo” como
descrições operacionais, desde que não se atribuam a eles processos distintos de
reforçamento; 5) explicar por que atribuições processuais distintas a essas formas de descrição
não são viáveis, devido à ambiguidade inerente à distinção baseada em adição e subtração; 6)
ensinar os termos “reforçadores positivos”, “reforçadores negativos”, “estímulos aversivos” e
“estímulos punidores” destacando sua natureza relacional, ou seja, enfatizando que a função
de um estímulo depende da contingência em que ele está inserido; 6) considerar a substituição
de todos esses termos pelas descrições “mais reforçador” ou “menos reforçador”.
Essas sugestões buscam lidar com grande parte dos problemas apontados tanto sobre a
manutenção quanto sobre o abandono da distinção. Lattal e Lattal (2006) haviam ressaltado
que a distinção, enquanto mantiver as funções comunicativas, práticas, culturais e/ou sociais
que tem, permanecerá sendo usada a despeito de sua negação comoconceito – e o mesmo
pode ser dito sobre as noções de estímulo aversivo e estímulo punidor. Não só isso, mas os
custos associados com uma mudança completa na linguagem podem não valer a pena. De
todo modo, com base nas considerações de Baron e Galizio (2005) e outros, poder-se-ia dizer
que, se consideradas as ambiguidades inerentes à distinção e desde que condições não deixem
de ser bem descritas em nome dela, talvez não haja prejuízo em manter os termos
tradicionalmente usados.
Limites do Presente Estudo
O presente trabalho possui algumas limitações relevantes, tanto em seus
procedimentos metodológicos quanto à abordagem adotada para a análise dos dados. Sobre a
categorização dos textos, é importante reconhecer que as categorias utilizadas para classificar
158

os dados também implicam em uma ambiguidade própria. Como já indicado no método e nos
resultados, as razões pelas quais cada uma das falas foi classificada diz respeito à forma como
cada autor da fala a formulou. Particularmente quando se consideram as categorias
“Problemas” e “Vantagens”, qualquer fala pertencente a um dos dois grupos poderia ser
facilmente reescrita para fazer parte do outro, sem alteração em seu conteúdo central. Mais
especificamente, as categorias “Vantagens da Manutenção” e “Problemas do Abandono”, bem
como “Vantagens do Abandono” e “Problemas da Manutenção”, são semanticamente
equivalentes: dizer que abandonar a distinção “Gera Menos Distorções” equivale a afirmar
que mantê-la gera mais distorções. De forma análoga, dizer que a distinção “Tem uma Função
Prática” equivale a dizer que seu abandono implicaria a perda dessa função.
Um exemplo em que isso fica evidente está na ausência de uma categoria “Problemas
do Abandono”. Essa opção existia enquanto categoria na planilha, mas acabou não sendo
aplicada a nenhuma fala. Isso não quer dizer que nenhum problema com o abandono tivesse
sido indicado, mas que falas que poderiam ter sido interpretadas como “Problemas do
Abandono” foram incorporadas à outras categorias equivalentes. Entre elas, “Vantagem da
Manutenção” ou os contra-argumentos das “Vantagens do Abandono” e “Problema da
Manutenção”.
Cabe ainda um adendo: a escolha do termo “Problema” ao invés de “desvantagem” foi
motivada pelo fato de que muitos dos argumentos apontavam falhas conceituais ou lógicas na
distinção sem, necessariamente, indicar prejuízos práticos. O termo “Vantagem” foi mantido
como o antônimo funcional de “Problema” mais adequado nesse contexto, por não significar
“solução”. De toda forma, isso evidencia que a classificação das falas envolveu certo grau de
subjetividade, e que a leitura, categorização, interpretação e discussão dos dados depende,
talvez mais do que em outros tipos de pesquisa, da história pessoal do autor que a está
realizando e de seus recursos disponíveis. O que pode ser considerada uma vantagem no
159

sentido de produzir análises mais contextualizadas, articuladas e interpretativas, acaba sendo
limitado no sentido de que a análise passa a depender fortemente das compreensões e escolhas
do pesquisador, o que pode introduzir vieses, reduzir a possibilidade de replicação do método
e dificultar a concordância entre avaliadores.
Ainda que o trabalho tenha buscado interrelacionar ao máximo as falas apresentadas
tanto entre si quanto com conceitos e dados relevantes, é importante reconhecer que ele não
esgota todas as possibilidades a serem exploradas e desenvolvidas. Além disso, a
padronização da categorização das falas pode acabar excluindo detalhes importantes de falas
individuais de um texto.
Outra limitação diz respeito à amostra de textos selecionada. Embora a escolha de
restringir a análise ao debate de 2005/2006 da revista The Behavior Analyst tenha garantido
um grupo coeso e interrelacionado, isso também impõe restrições à generalização dos
resultados. Outras discussões sobre o tema, especialmente desenvolvimentos empíricos
posteriores ou novas conceitualizações não foram incorporadas à análise. Do mesmo modo, a
exclusão do texto de Michael (1975), ainda que fundamentada por critérios metodológicos,
pode ter excluído alguma fala importante que acabou não sendo incluída nos dados. Isso pode
ter sido, entretanto, mitigado pela apresentação de seu texto na introdução e inclusão direta de
algumas de suas falas ao longo da discussão.
Sugestões para Trabalhos Futuros
A ambiguidade da distinção, como apresentada por Baron e Galizio (2005), não é
puramente experimental, mas conceitual, particularmente, relacionada à forma de descrever os
eventos do mundo. A princípio, não há como se fazer uma pesquisa que gere mudanças no
fato de que “a adição de um estímulo” e “subtração da retirada desse estímulo” signifiquem
semanticamente a mesma coisa (i.e., descrevam a mesma mudança ambiental). Em outras
palavras, dados experimentais não mudariam o fato de que a linguagem usada é
160

intrinsecamente ambígua. Dito isso, há vários tipos de investigações teórico-conceituais que
poderiam ser feitas tanto que sugiram uma nova linguagem ou convenções que contornem os
problemas citados, mas também pesquisas empíricas que comparem as contingências que
ainda são chamadas de positivas ou negativas e que possam fornecer, se aplicável, novos
critérios para o que vinha sendo distinguido – ou seja, talvez elas facilitem a identificação dos
estímulos discriminativos que evocam as respostas verbais “reforçamento positivo” e
“reforçamento negativo” em analistas do comportamento.
Nesse sentido, além das sugestões conceituais e didáticas já apresentadas, os autores
do debate também sugeriram diversas linhas de investigação para aprofundar o entendimento
sobre a distinção entre reforçamento positivo e negativo ou outros pontos relevantes. Entre
elas, estão: 1) estudos que esclareçam ou aprimorem as definições atuais de reforçamento
positivo e negativo (Sidman, 2006); 2) investigações sobre como mudanças paramétricas
dentro de um contínuo deveriam ser classificadas (Iwata, 2006); 3) pesquisas que analisem as
razões pelas quais a distinção é mantida (e.g., por meio de levantamento com professores ou
análise de livros da área, Chase, 2006); 4) estudos que examinem o uso da distinção em outras
áreas do conhecimento, para entender suas possíveis funções culturais (Chase, 2006; Lattal &
Lattal, 2006); 5) pesquisas que investiguem experimentalmente os efeitos de diferentes
reforçadores tradicionalmente classificados como positivos ou negativos, buscando
parâmetros comuns para comparação (Lattal & Lattal, 2006); 6) estudos que diferenciem
melhor os conceitos de operação, efeito e explicação/razão nos processos de reforçamento e
punição (Marr, 2006); 7) investigações sobre a relação entre condicionamento operante e
condicionamento emocional, manipulando variáveis como privação e saciação (Staats, 2006);
8) estudos básicos sobre as condições necessárias e suficientes para a aquisição e manutenção
de respostas sob reforçamento e esquiva (Marr, 2006); 9) pesquisas que apontem para novas
possibilidades de termos para substituírem os atuais (Baron e Galizio, 2006a; Sidman, 2006);
161

10) pesquisas que explorem o próprio comportamento de cientistas ao distinguir
reforçamentos e os efeitos de diferentes formas de nomeação (Baron & Galizio, 2006a). Desse
modo, uma conclusão bastante contundente que se pode tirar da presente análise é que o
debate realizado por esses autores indicou de maneira profícua diversos caminhos
investigativos para que analistas do comportamento lidem com essa difícil questão conceitual.
Sobre esse último ponto, já foram mencionadas diversas possibilidades trazidas pelos
autores de fatores que poderiam controlar o comportamento de distinguir contingências entre
reforçamento positivo e negativo que não a operação envolvida entre resposta e consequência
(i.e., adição/subtração). Entre18

ruído alto etc.; pois é a ausência após a presença que é eficaz, e isso é apenas outra
forma de dizer que o estímulo foi removido. (p. 73)
Nesse sentido, para Skinner (1953/2014) aponta tanto para o efeito do reforçamento
sendo o mesmo nos dois casos, quanto o evento reforçador não é um estímulo estático, mas a
própria mudança ambiental. A ausência só é capaz de reforçar o comportamento se ela for
antecedida pela presença. Isso não é dito, mas a situação contrária também seria verdadeira
para o reforçamento positivo.
A preferência particular do autor deste trabalho pelos termos “adição” e “subtração”
ao descrever as operações envolvidas se dá porque, além de fazer uma referência mais
inequívoca a operações, esses termos têm uma conotação mais abrangente quanto ao tipo de
alteração envolvida, isto é, enquanto “acréscimo” ou “retirada” parecem implicar uma
completa ausência anterior do estímulo (de zero para um), “adição” e “subtração” podem se
referir também a alterações quantitativas mais sutis nas propriedades de um estímulo ao longo
de contínuos (magnitude, duração, probabilidade e atraso, por exemplo).
Reforçadores Positivos e Negativos
Como fora mencionado, o aumento na frequência de uma classe de respostas
(característico de qualquer reforçamento) só ocorrerá se eventos ambientais específicos
ocorrerem após uma ação do organismo. Como fica implícito pela definição de reforçamento
apresentada, nem todas as alterações ambientais provocam alterações na frequência de uma
determinada classe de respostas. Um exemplo disso é o de uma criança que continua
caminhando em direção a um carrinho de sorvete, a despeito de deixar ou não pegadas na
areia ou fazer som. O que mantém a frequência desse comportamento é que, ao caminhar, a
criança produz proximidade em relação ao carrinho de sorvete. Isso significa que os eventos
ambientais visuais e auditivos ao caminhar nesse caso não são estímulos para o caminhar –
mesmo que possam ser para outros comportamentos.
19

Ao tipo de estímulo envolvido no reforçamento positivo e cuja adição ao ambiente do
organismo tem a capacidade de gerar um aumento na frequência de respostas que
antecederam sua adição ao ambiente, se dá o nome de reforçador positivo. Ao tipo de
estímulo envolvido no reforçamento negativo e cuja subtração do ambiente do organismo tem
a capacidade de gerar um aumento na frequência de respostas antecederam sua remoção do
ambiente, se dá o nome de reforçador negativo.
Por outro lado, quando um reforçador negativo é apresentado ou quando um
reforçador positivo é retirado, se está falando de punição (Skinner, 1953/2014; Sidman,
1989/2009). Independentemente da visão acerca da punição, simétrica ou assimétrica (ver
Mayer, 2011), o efeito da punição é diminuir a frequência (pelo menos momentaneamente) de
uma classe de respostas, seja diminuindo diretamente a sua probabilidade (visão simétrica) ou
aumentando a probabilidade de comportamentos concorrentes via eliciação de reflexos
incondicionados, condicionamento reflexo e reforçamento negativo de respostas operantes
(visão assimétrica), que são incompatíveis com o responder punido.
Dito isso, aos procedimentos em que isso ocorre pela adição subsequente e sistemática
de estímulo reforçador negativo (chamado também de aversivo por alguns autores) dá-se o
nome de punição positiva. Aos procedimentos em isso ocorre por conta da subtração
subsequente e sistemática de estímulo reforçador positivo, dá-se o nome de punição negativa.
Assim, constata-se que as definições de reforçamento positivo e negativo, bem como de
reforçadores positivos e negativos, têm implicações para outros conceitos da análise do
comportamento, como os de punição positiva e negativa. Isso é especialmente importante se
considerarmos que a distinção entre reforçamento positivo e negativo tem sido questionada
por alguns autores ao longo do desenvolvimento conceitual da área. Os argumentos
envolvidos nesse questionamento e nas respostas a ele é o tema de principal interesse do
presente trabalho.
20

Existe Diferença Entre os Reforçamentos Positivo e Negativo?
Michael (1975) inicia seu texto “Positive and Negative Reinforcement, a Distinction
That Is No Longer Necessary; Or a Better Way to Talk about Bad Things [Reforçamento
positivo e negativo, uma distinção que não é mais necessária; ou uma melhor forma de falar
sobre coisas ruins]”, escrito há exatos 50 anos, enfatizando que as práticas verbais da
comunidade de analistas do comportamento, assim como de qualquer outra área da ciência,
evoluem majoritariamente guiadas pela sua eficácia. Entretanto outros fatores que ele chama
de “não-funcionais” podem afetar esse processo – tal como ocorre na evolução filogenética. O
autor cita dois exemplos de como essas práticas podem ser mantidas sem relação (pelo menos
atual) com uma vantagem na produção de conhecimento: práticas mantidas por outros tipos de
reforçamento social (e.g., elogios dados a alguém que usa palavras consideradas sofisticadas)
e por terem sido eficazes na formação inicial daquele conhecimento por fazerem paralelos
com outros conceitos, mas que agora seriam desnecessárias.
Um exemplo disso pode ser observado no campo da matemática, em que há mais de
100 anos (ver Thomas, 1920) existe uma discussão a respeito da mudança do sistema decimal
de numeração para um duodecimal (12 algarismos ao invés de dez) por conta de o número 12
ter mais divisores inteiros (1, 2, 3, 4, 6, 12) do que o dez (1, 2, 5 e 10) – algo que facilitaria
diversos tipos de cálculo. Neste exemplo, o trabalho para se mudar uma prática cultural tão
bem estabelecida poderia justificar a sua manutenção.
Michael (1975) destaca então que, apesar de que as terminologias serem determinadas
por conta da evolução de práticas culturais e não por puros “acordos sociais”, o que faz a
ciência e a filosofia é, justamente, buscar afetar esse processo evolutivo numa direção
desejada. Em seguida, o autor faz uma breve retomada dos conceitos de reforçamento positivo
e negativo ao longo dos anos, apresentando contradições, imprecisões e alterações que ele
afirma poderem ter tornado a compreensão desses conceitos confusa. Em especial, destaca-se
21

o uso anterior do termo “reforçamento negativo” no sentido do que hoje é chamado de
punição (ver Skinner, 1938) e o seu atual uso no sentido de ser um dos processos que
aumentam a frequência de resposta.
Michael atribui a mudança do significado do termo aos resultados dos experimentos
de Skinner (1938) e Estes (1944) que sugeriram que qualquer enfraquecimento de uma
resposta gerado por uma punição era, na verdade, resultado do fortalecimento de uma resposta
incompatível (visão assimétrica de punição). Se não é o estímulo “punidor” que enfraquece a
resposta, mas sim a remoção de um novo estímulo condicionado que fortalece uma resposta
incompatível, este segundo processo que é o mais relevante e deveria ser chamado
“reforçamento negativo”.
Ademais, o autor ressalta a ambiguidade gerada pelo uso ampliado do termo
“estímulo”, afirmando que no cotidiano isso pode não gerar muitos problemas, mas em
situações em que se deseja definir processos e termos específicos, isso pode ser prejudicial, já
que o termo “estímulo” é principalmente usado para descrever condições estáticas de
estimulação. Presumivelmente, Michael se referia a frases comuns como “o estímulo
reforçador fortalece a resposta” em que a alteração ambiental ocorrida fica omitida. Essa
alteração fica de alguma forma evidente em usos como “a apresentação do estímulo
reforçador fortalece a resposta” (já que se presume que se houve acréscimo, havia ausência),
mas o autor acredita que isso poderia ser mais bem explicitado pelo uso de termos como
“mudança de estímulo” (“stimulus change”), ou seja, “a mudança de estímulo fortalece a
resposta”. Tanto o reforçamento quantoelas: a abruptidão da mudança ambiental (Michael, 1975; Baron
e Galizio, 2005), os mecanismos fisiológicos envolvidos (Michael, 1975; Baron e Galizio,
2005), as “emoções” ou “sentimentos” envolvidos (Michael, 1975; Baron e Galizio, 2005;
Staats, 2006), a severidade das operações motivadoras (Sidman 1989/2009; Baron e Galizio,
2005), a saliência da mudança (Chase, 2006) ou ainda propriedades particulares dos estímulos
usualmente empregados (Lattal & Lattal, 2006). Como discutido ao longo do trabalho, outros
autores (e.g., Skinner, 1953/2014; Sidman, 1989/2009) apontam para a presença de efeitos
colaterais como uma possível variável discriminativa para a distinção, o que não foi sugerido
pelos autores do debate (inclusive pelo próprio Sidman, 2006).
Uma possibilidade seria investigar na literatura quais desses fatores (e outros) podem
ser identificados nas contingências (ou nas descrições de contingências) que parecem estar
controlando o comportamento de quem classifica essas contingências. Outra proposta
interessante seria desenvolver experimentos em que analistas do comportamento fossem
convidados a classificar diferentes contingências como exemplos de reforçamento positivo ou
negativo, variando sistematicamente os fatores envolvidos, para avaliar quais aspectos
controlam essas classificações. Isso poderia fornecer dados para se pensar em novos critérios
mais consistentes para a distinção ou o estabelecimento de novas distinções importantes.
162

Por fim, vale retomar que os dois tipos de reforçamento raramente são estudados em
conjunto e de forma simétrica (Magoon & Critchfield, 2008; Magoon et al., 2017). Como
apontado por esses mesmos autores, as diferenças de performance encontradas, até então,
entre os comportamentos mantidos pelos chamados reforçamento positivo e negativo podem,
em grande parte, ser atribuídas a diferenças procedimentais. Nesse sentido, mais pesquisas
que investiguem, de forma paralela, possíveis diferenças entre os reforçamentos positivo e
negativo, também podem apontar para novos elementos distintivos.
Em Direção à Uma Nova Proposta de Distinção
A ambiguidade da distinção reforçamento positivo/negativo, por não ser uma forma
inequívoca de distinguir práticas desejáveis e indesejáveis, acaba podendo abrir margem para
que práticas consideradas indesejáveis sejam justificadas e mantidas simplesmente por
poderem ser classificadas como reforçamento positivo. Esse risco aumenta ainda mais por
falas como a de Baron e Galizio (2005) de que “quando estímulos dolorosos são usados como
meio de modificação do comportamento, os efeitos colaterais indesejáveis podem ser
compensados pela gravidade do transtorno em tratamento” (p. 91), uma vez que validam que
até mesmo práticas já antes classificadas como aversivas possam ser usadas.
Holland (1978) criticou os procedimentos de modificação de comportamento
aplicados em instituições fechadas justamente porque, em certos programas descritos como
“baseados em reforçamento positivo”, por envolverem a adição de bens e serviços de forma
contingente à emissão de algumas respostas, era feita a retirada prévia desses recursos. O
estabelecimento dessas privações, muitas vezes severas (e.g., isolamento), torna a intervenção
como um todo muito mais aversiva. Segundo o autor:
“Um sistema de modificação de comportamento pode, ele mesmo, utilizar apenas
reforçamento positivo, mas, se os estratos superiores desejam manter a maior parte da
163

riqueza e dos privilégios, restrição e coerção precisam ser utilizadas para manter o
controlado dentro das regras do sistema.” (Holland, 1978, p. 171).
Tanto Skinner (1953/2014) quanto Sidman (1989/2009) citam as privações
socialmente estabelecidas como um caso de mau uso do reforçamento positivo. Além disso,
Skinner (1971) ainda destaca que alguns comportamentos mantidos por reforçamento positivo
podem ser prejudiciais a longo prazo (e.g., jogos de azar, drogas e comportamento sexual de
risco).
Vale ressaltar que se analistas do comportamento passassem a utilizar intervenções
indesejáveis nomeando-as como reforçamento positivo, o que poderia ter sido aceito em
primeiro momento provavelmente se converteria em recusa rapidamente. No fim das contas,
não é o nome dado, mas as características das contingências planejadas que importam. Como
Sidman havia sugerido, se as pílulas de aspirina não mais tivessem efeito, qualquer um pararia
de tomá-las.
Mesmo que a distinção, em muitos casos, esteja sendo usado de forma questionável,
pode ser que o abandono da distinção possa piorar ainda mais a situação, já que atualmente,
pelo menos, parece existir uma tentativa de caminhar na direção certa quanto a escolha de
procedimentos que evitam efeitos indesejáveis. Diante disso, Michael (1975) sugeriu - e
Baron e Galizio (2005) concordaram - que a melhor forma que se teria de falar sobre coisas
boas e ruins é, simplesmente, falar sobre reforçamento e punição.
Um problema com essa sugestão é que, como apontou Sidman (2006), os autores
assumiram uma posição sobre o conceito de punição que faz parte de um debate sobre o qual
não há consenso até os dias atuais. Outro problema seria que ela não abarca os efeitos
indesejáveis da extinção/indisponibilidade do reforçamento ou de operações motivadoras
intensas que não envolvem necessariamente a punição (i.e., ainda haveria “coisas ruins” não
abarcadas pelo termo punição).
164

No tópico “Implicações Sobre o Conceito de Reforçadores”, foi ressaltado que, para
que uma condição seja considerada reforçadora, um aumento na frequência de respostas que a
produziu precisaria ser observado. Mesmo assim, essa condição só poderia ser chamada de
reforçadora em relação àquela condição pré-mudança específica que poderia ser chamada
tanto de “menos reforçadora” como de “aversiva”. Sobre essa noção, algumas considerações
precisam ser feitas.
Quando se considera um rato que está diante de um choque e não está emitindo as
respostas que o eliminam, alguns fatores podem ser considerados: 1) existe uma resposta
disponível que elimine o choque? 2) Qual a exigência para a emissão dessa resposta? E 3) o
rato teve a oportunidade de aprender a emitir essa resposta? Essas três perguntas dizem
respeito à controlabilidade desse choque. Como colocado, a definição do que é ou não
reforçador (e por tabela o que é ou não aversivo ou punidor) exige, necessariamente a emissão
de respostas que o produza ou elimine. Nesse sentido, um indivíduo poderia ser submetido a
um determinado estímulo e, sem nenhuma, possibilidade de fuga, não se poderia dizer que ele
seria. Mesmo que uma possibilidade de fuga existisse, talvez ela fosse tão custosa (razão
muito alta) que a resposta também não fosse emitida. Também é possível que uma resposta de
fuga pouco custosa estivesse disponível, mas que o indivíduo acabasse nunca emitindo-a
porque tal variação simplesmente não ocorreu. O indivíduo submetido a esse estímulo poderia
estar demonstrando alguns sinais de algo que poderia ser chamado de “sofrimento” ou até
mesmo descrevendo exatamente isso se fosse humano, mas, a princípio, nada poderia ser dito
sobre a aversividade desse estímulo, já que fatores como respondentes eliciados, emoções,
sentimentos ou relatos verbais não fazem parte dessa categorização.
A partir disso, fica parecendo que, além da ausência de um consenso no debate sobre
reforçamento positivo x negativo e punição simétrica x assimétrica, as próprias delimitações
ligadas aos conceitos de punição e reforçamento negativo limitam a definição de controle
165

aversivo sugerida por Skinner (1953/2014) e, similarmente, a definição de coerção sugerida
por Sidman (1989/2009). A sugestão de evitar o reforçamento negativo, como apontado por
Michael (1975, 2006) não pode ser facilmente seguida porque a distinção é ambígua e a
passagem de qualquer condição para outrasugere que a anterior seja aversiva (incluindo em
contingências tipicamente classificadas como positivas). Ao mesmo tempo, a sugestão de
evitar a punição também não daria conta de instâncias em que a indisponibilidade do
reforçamento (extinção como condição aversiva) não está sendo apresentada de forma
contingente a uma resposta específica - algo que parecia ser contornado pela sugestão de
evitar o reforçamento negativo.
Diante das dificuldades já citadas de se recorrer a distinção positivo/negativo ou à
distinção reforçamento/punição para guiar as intervenções que deverão ser ou não endossadas,
uma possibilidade seria contrastar a condição de estímulo aplicada com as condições
anteriores a ela. Em outras palavras: uma condição de estímulo só deveria ser usada em uma
intervenção se ela tiver sido demonstrada como reforçadora no passado diante da condição de
estímulo presente. Talvez se o objetivo é evitar sofrimentos desnecessários ou efeitos
colaterais, dever-se-ia, no mínimo, manter sempre disponível a possibilidade de um indivíduo
voltar para a condição anterior a que está sendo apresentada. Além disso, é importante que a
resposta que possibilitaria o indivíduo de voltar deveria ser uma resposta de baixo custo que o
indivíduo já demonstrou ser capaz de emitir. Dessa forma, talvez fosse possível garantir,
dentro de alguns limites, que o alvo da intervenção pudesse se manter (na maior parte do
tempo) na condição mais reforçadora para ele, e que as mudanças de estímulo introduzidas só
pudessem caminhar numa direção que seja mais reforçadora, nunca menos.
Essa é, certamente, uma sugestão idealizada. Mudanças na direção de diminuir a
aversividade de práticas de intervenção (e do mundo como um todo) costumam ser
trabalhosas e, muitas vezes, enfrentam resistências institucionais, culturais e pessoais. Ainda
166

assim, com base no que foi discutido até então, pode-se concluir que qualquer ajuda na
direção de tornar viável que outras pessoas se comportem para produzir uma condição um
pouco mais reforçadora que a anterior já representa um ganho considerável - não apenas para
quem é diretamente afetado, mas também como passo concreto na construção de práticas mais
sensíveis, eficazes e sustentáveis a longo prazo.

167

Referências
Andery, M. A., Sério, T. M., & Micheletto, N. (Orgs.). (2009). Comportamento e
causalidade. Pontifícia Universidade Católica de São Paulo.
Azrin, N. H. (1961). Time-out from positive reinforcement. Science, 133(3450), 382-383.
https://doi.org/10.1126/science.133.3450.382
Azrin, N. H., Holz, W. C., Hake, D. F., & Ayllon, T. (1963). Fixed-ratio escape
reinforcement. Journal of the experimental analysis of behavior, 6(3), 449–456.
https://doi.org/10.1901/jeab.1963.6-449
Azrin, N. H. & Holz, W. C. (1966). Punishment. In W. K. Honig (Org.), Operant behavior:
Areas of research and application (pp. 380-447). Appleton-Century-Crofts.
Baron, A., & Galizio, M. (2005). Positive and negative reinforcement: Should the distinction
be preserved? The Behavior Analyst, 28(2), 85-98.
https://doi.org/10.1007/BF03392107
Baron, A., & Galizio, M. (2006a). Distinguishing Between Positive and Negative
Reinforcement: Responses to Nakajima (2006) and Staats (2006). The Behavior
Analyst, 29(1), 273-277. https://doi.org/10.1007/BF03392137
Baron, A., & Galizio, M. (2006b). The distinction between positive and negative
reinforcement: Use with care. The Behavior Analyst, 29(2), 141-151.
https://doi.org/10.1007/BF03392127
Baum, W. M. (1999). Compreender o behaviorismo: Ciência, comportamento e cultura (M.
T. A. Silva, M. A. Matos, G. Y. Tomanari & E. Z. Tourinho, Tradutores.). Artes
Médicas. [Obra original publicada em 1994]
Cameschi, C. E., & Abreu-Rodrigues, J. (2005). Contingências aversivas e comportamento
emocional. Em J. Abreu-Rodrigues & M. R. Ribeiro (Orgs.), Análise do
comportamento: Teoria, pesquisa e aplicação (pp. 113-137). Artmed.
https://doi.org/10.1126/science.133.3450.382
https://doi.org/10.1901/jeab.1963.6-449
https://doi.org/10.1007/BF03392107
https://doi.org/10.1007/BF03392137
https://doi.org/10.1007/BF03392127
168

Catania, A. C. (1973). The concept of the operant in the analysis of behavior. Behaviorism,
1(2), 103–116.
Catania, A. C. (1992). Learning (3rd ed.). Prentice Hall.
Chase, P. N. (2006). Teaching the distinction between positive and negative reinforcement.
The Behavior Analyst, 29(1), 113-115. https://doi.org/10.1007/BF03392121
Crowley, T. J. (1972). The reinforcers for drug abuse: Why people take drugs. Comprehensive
Psychiatry, 13, 51–62. https://doi.org/10.1016/0010-440X(72)90034-X
De Souza, D. G., De Moraes, A. B. A., & Todorov, J. C. (1984). Shock intensity and signaled
avoidance responding. Journal of the Experimental Analysis of Behavior, 42(1), 67-
74. https://doi.org/10.1901/jeab.1984.42-67
Deese, J., & Hulse, S. H. (1975). A psicologia da aprendizagem (D. M. Leite, Tradutor).
Pioneira. [Obra original publicada em 1967].
Dinsmoor, J. A. (1962). Variable-interval escape from stimuli accompanied by shocks.
Journal of the Experimental Analysis of Behavior, 5(1), 41–47.
https://doi.org/10.1901/jeab.1962.5-41
Dinsmoor, J. A. (2001). Stimuli inevitably generated by behavior that avoids electric shock
are inherently reinforcing. Journal of the Experimental Analysis of Behavior, 75(3),
311–333. https://doi.org/10.1901/jeab.2001.75-311
Findley, J. D. (1958). Preference and switching under concurrent scheduling. Journal of the
Experimental Analysis of Behavior, 1(2), 123–144.
https://doi.org/10.1901/jeab.1958.1-123
Fontes, R. M., & Shahan, T. A. (2020). Punishment and its putative fallout: A reappraisal.
Journal of Experimental Analysis of Behavior, 115(1), 185-203.
https://doi.org/10.1002/jeab.653
https://doi.org/10.1007/BF03392121
https://doi.org/10.1016/0010-440X(72)90034-X
https://doi.org/10.1901/jeab.1984.42-67
https://psycnet.apa.org/doi/10.1901/jeab.1962.5-41
https://psycnet.apa.org/doi/10.1901/jeab.2001.75-311
https://doi.org/10.1901/jeab.1958.1-123
https://doi.org/10.1002/jeab.653
169

Geller, E. S. (2004). On Making Mountains Out of Molehills: Confessions of a Behavioral
Scientist with Mentalistic Vulnerability. Journal of Organizational Behavior
Management, 24(1-2), 175–184. https://doi.org/10.1300/J075v24n01_11
Harms, J. Y., & Staats, A. W. (1978). Food deprivation and conditioned reinforcing value of
food words: Interaction of Pavlovian and instrumental conditioning. Bulletin of the
Psychonomic Society, 12(4), 294–296. https://doi.org/10.3758/BF03329687
Hearst, E. (1962). Delayed alternation in the pigeon. Journal of the Experimental Analysis of
Behavior, 5(2), 225–228. https://doi.org/10.1901/jeab.1962.5-225
Hineline, P. N. (1984). Aversive control: A separate domain? Journal of the Experimental
Analysis of Behavior, 42(1), 495-509. https://doi.org/10.1901/jeab.1984.42-495
Holland, J. G., & Skinner, B. F. (1975). A análise do Comportamento (R. Azzi & C. M. Bori,
Tradutores). Editora Pedagógica e Universitária. [Obra original publicada em 1969].
Holland, J. G. (1978). Behaviorism: Part of the problem or part of the solution? Journal of
Applied Behavior Analysis, 11(1), 163–174. https://doi.org/10.1901/jaba.1978.11-163
Iwata, B. A. (2006). On the distinction between positive and negative reinforcement. The
Behavior Analyst, 29(1), 121-123. https://doi.org/10.1007/BF03392123
Jenkins, H. M., & Harrison, R. H. (1960). Effect of discrimination training on auditory
generalization. Journal of Experimental Psychology, 59(4), 246–253.
https://doi.org/10.1037/h0041661
Jwaideh, A. R., & Mulvaney, D. E. (1976). Punishment of observing by a stimulus associated
with the lower of the two reinforcement frequencies. Journal of the Experimental
Analysis of Behavior, 25(1), 37-44. https://doi.org/10.1016/0023-9690(76)90029-1
Kelleher, R. T. (1958).Fixed-ratio schedules of conditioned reinforcement with chimpanzees.
Journal of the Experimental Analysis of Behavior, 1(3), 281-289.
https://doi.org/10.1901/jeab.1958.1-281
https://psycnet.apa.org/doi/10.1300/J075v24n01_11
https://doi.org/10.3758/BF03329687
https://doi.org/10.1901/jeab.1962.5-225
https://doi.org/10.1901/jeab.1984.42-495
https://doi.org/10.1901/jaba.1978.11-163
https://doi.org/10.1007/BF03392123
https://psycnet.apa.org/doi/10.1037/h0041661
https://doi.org/10.1016/0023-9690(76)90029-1
https://doi.org/10.1901/jeab.1958.1-281
170

Keller, F. S., & Schoenfeld, W. N. (1974). Princípios de psicologia (C. M. Bori & R. Azzi,
Tradutores). Editora Pedagógica e Universitária. [Obra original publicada em 1950].
Lattal, K. A., & Lattal, A. D. (2006). And yet…: Further comments on distinguishing positive
and negative reinforcement. The Behavior Analyst, 29(1), 129-134.
https://doi.org/10.1007/BF03392125
Lundin, R. W. (1972). Personalidade: Uma análise do comportamento (R. L. Rodrigues & L.
O. S. Queiroz, Tradutores). Herder. [Obra original publicada em 1969]
Magoon, M. A., & Critchfield, T. S. (2008). Concurrent schedules of positive and negative
reinforcement: Differential-impact and differential-outcomes hypotheses. Journal of
the Experimental Analysis of Behavior, 90(1), 1-22.
https://doi.org/10.1901/jeab.2008.90-1
Magoon, M. A., Critchfield, T. S., Merrill, D., Newland, M. C., & Schneider, W. J. (2017).
Are positive and negative reinforcement "different"? Insights from a free-operant
differential outcomes effect. Journal of the experimental analysis of behavior, 107(1),
39–64. https://doi.org/10.1002/jeab.243
Marr, M. J. (2006). Through the looking glass: Symmetry in behavioral principles? The
Behavior Analyst, 29(1), 125-128. https://doi.org/10.1007/BF03392124
Mayer, P. C. M., & Gongora, M. A. N. (2011). Duas formulações comportamentais de
punição: Definição, explicação e algumas implicações. Acta Comportamentalia, 19(1),
47–63. https://www.revistas.unam.mx/index.php/acom/article/view/36938
Michael, J. (1975). Positive and negative reinforcement: A distinction that is no longer
necessary; or a better way to talk about bad things. Behaviorism, 3(1), 33-44.
https://psycnet.apa.org/record/1976-03436-001
https://doi.org/10.1007/BF03392125
https://psycnet.apa.org/doi/10.1901/jeab.2008.90-1
https://doi.org/10.1002/jeab.243
https://doi.org/10.1007/BF03392124
https://www.revistas.unam.mx/index.php/acom/article/view/36938
https://psycnet.apa.org/record/1976-03436-001
171

Michael, J. (1982). Distinguishing between discriminative and motivational functions of
stimuli. Journal of the Experimental Analysis of Behavior, 37(1), 149-155.
https://doi.org/10.1901/jeab.1982.37-149
Michael, J. (2006). Comment on Baron and Galizio (2005). The Behavior Analyst, 29(1), 117-
119. https://doi.org/10.1007/BF03392122
Millenson, J. R. (1975). Princípios de análise do comportamento (A. A. Rosa & D. Resende,
Tradutores). Editora de Brasília. [Obra original publicada em 1967].
Moore, J. (2000). Words are not things. The Analysis of Verbal Behavior, 17, 143–160.
https://doi.org/10.1007/BF03392961
Morse, W. H., & Kelleher, R. T. (1977). Determinants of reinforcement and punishment. In
W. K. Honig & J. E. R. Staddon (Eds.), Handbook of operant behavior (pp. 174–200).
Prentice Hall.
Mowrer, O. H. (1960). Learning theory and behavior. John Wiley & Sons, Inc.
https://doi.org/10.1037/10802-000
Nakajima, S. (2006). In response: Speculation and explicit identification as judgmental
standards for positive or negative reinforcement. The Behavior Analyst, 29(1), 269-
270. https://doi.org/10.1007/BF03392135
Nevin, J. A., & Mandell, C. (2017). Comparing positive and negative reinforcement: A
fantasy experiment. Journal of the experimental analysis of behavior, 107(1), 34–38.
https://doi.org/10.1002/jeab.237
Pear, J. J. (2001). The science of learning. Psychology Press.
Perone, M. (2003). Negative effects of positive reinforcement. The Behavior Analyst, 26(1),
1-14. https://doi.org/10.1007/BF03392064
Perone, M., & Courtney, K. (1992). Fixed-ratio pausing: Joint effects of past reinforcer
magnitude and stimuli correlated with upcoming magnitude. Journal of the
https://doi.org/10.1901/jeab.1982.37-149
https://doi.org/10.1007/BF03392122
https://doi.org/10.1007/BF03392961
https://psycnet.apa.org/doi/10.1037/10802-000
https://doi.org/10.1007/BF03392135
https://doi.org/10.1002/jeab.237
https://doi.org/10.1007/BF03392064
172

experimental analysis of behavior, 57(1), 33–46. https://doi.org/10.1901/jeab.1992.57-
33
Pierce, W. D., & Cheney, C. D. (2004). Behavior analysis and learning (3rd ed.). Erlbaum.
https://doi.org/10.1007/BF03392126
Pierce, W. D., & Epling, W. F. (1995). Behavior analysis and learning. Prentice-Hall.
Lundin, R. W. (1972). Personalidade: Uma análise do comportamento (R. L. Rodrigues & L.
O. S. Queiroz, Tradutores). Herder. (Trabalho original publicado em 1969)
Pierce, W. D., & Epling, W. F. (1995). Behavior analysis and learning. Prentice-Hall.
Possmoser, T. L. (2015). A influência de Michael (1975) na literatura e a discussão da
distinção entre reforçamento positivo e negativo (Trabalho de Conclusão de Curso).
Pontifícia Universidade Católica de São Paulo.
Reese, E. P. (1973). Análise do comportamento humano (G. P. Witter, Tradutor). Livraria
José Olympio. [Obra original publicada em 1966].
Rosenberg, E. L., & Ekman, P. (2000). Emotion: Methods of study. In A. E. Kazdin (Ed.),
Encyclopedia of Psychology (Vol. 3, pp. 171–175). Oxford University Press.
Santos, E. L. N., & Leite, F. L. (2013). A distinção entre reforçamentos positivo e negativo
em livros de ensino de análise do comportamento. Revista Perspectivas, 4(1), 9-18.
https://doi.org/10.18761/perspectivas.v4i1.101
Sidman, M. (1989/2009). Coerção e suas implicações (M. A. Andery & T. M. Sério,
Tradutores). Editora Livro Pleno.
Sidman, M. (2006). The Distinction Between Positive and Negative Reinforcement: Some
Additional Considerations. The Behavior Analyst, 29(1), 135–139.
https://doi.org/10.1007/BF03392126
https://doi.org/10.1901/jeab.1992.57-33
https://doi.org/10.1901/jeab.1992.57-33
https://doi.org/10.1007/BF03392126
https://doi.org/10.18761/perspectivas.v4i1.101
https://doi.org/10.1007/BF03392126
173

Sizemore, O. J., & Maxwell, J. M. (1985). Selective punishment of interresponse times: The
roles of shock intensity and scheduling. Journal of the Experimental Analysis of
Behavior, 43(2), 207-216. https://doi.org/10.1901/jeab.1985.44-355
Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. Appleton-
Century-Crofts. ISBN 978-0874114874
Skinner, B. F. (1953/2014). Science and human behavior. The B. F. Skinner Foundation.
https://www.bfskinner.org/product/science-and-human-behavior
Skinner, B. F. (1973). Beyond freedom and dignity. Penguin Books. (Obra original publicada
em 1971)
Staats, A. W., & Hammond, O. R. (1972). Natural words as physiological conditioned stimuli:
Food-word-elicited salivation and deprivation effects. Journal of Experimental
Psychology, 96(1), 206–208. https://doi.org/10.1037/h0033508
Staats, A. W., & Warren, D. R. (1974). Motivation and three-function learning: Food
deprivation and approach-avoidance to food words. Journal of Experimental
Psychology, 103(6), 1191–1199. https://doi.org/10.1037/h0037417
Staats, A. W. (1975). Social behaviorism. Dorsey Press.
Staats, A. W., & Eifert, G. H. (1990). The paradigmatic behaviorism theory of emotions.
Clinical Psychology Review, 10(5), 539–566. https://doi.org/10.1016/0272-
7358(90)90096-S
Staats, A. W. (1996). Behavior and personality: Psychological behaviorism. Springer.
Staats, A. W. (2006). Positive and negative reinforcers: How about the second and third
functions? The Behavior Analyst, 29(2), 271–272.
https://doi.org/10.1007/BF03392136
Thomas,N. W. (1920). 14. Duodecimal Base of Numeration. Man, 20, 25–29.
https://doi.org/10.2307/2840300
https://doi.org/10.1901/jeab.1985.44-355
https://www.bfskinner.org/product/science-and-human-behavior
https://doi.org/10.1037/h0033508
https://doi.org/10.1037/h0037417
https://psycnet.apa.org/doi/10.1016/0272-7358(90)90096-S
https://psycnet.apa.org/doi/10.1016/0272-7358(90)90096-S
https://doi.org/10.1007/BF03392136
https://doi.org/10.2307/2840300
174

Weiss, B., & Laties, V. G. (1961). Behavioral thermoregulation. Science (New York, N.Y.),
133(3461), 1338–1344. https://doi.org/10.1126/science.133.3461.1338
Whaley, D. L., & Malott, R. W. (1980). Princípios elementares do comportamento (M. A.
Matos, M. L. D. Ferrara, & C. F. Santoro, Tradutores; Vol. 1, 6ª ed.). E.P.U. - Editora
Pedagógica e Universitária Ltda.
Whelan, R., & Barnes-Holmes, D. (2010). Consequence valuing as operation and process: A
parsimonious analysis of motivation. The Psychological Record, 60(2), 337–354.
https://doi.org/10.1007/BF03395711
Wiegand, D. M., & Geller, E. S. (2005). Connecting positive psychology and organizational
behavior management. Journal of Organizational Behavior Management, 24(1–2), 3–
25. https://doi.org/10.1300/j075v24n01_02
Xu, S., Sun, Y., Huang, M., Huang, Y., Han, J., Tang, X., & Ren, W. (2021). Emotional state
and feedback-related negativity induced by positive, negative, and combined
reinforcement. Frontiers in Psychology, 12, Article 647263.
https://doi.org/10.3389/fpsyg.2021.647263

https://doi.org/10.1126/science.133.3461.1338
https://doi.org/10.1007/BF03395711
https://doi.org/10.1300/j075v24n01_02
https://doi.org/10.3389/fpsyg.2021.647263
175

Apêndice
Recorte Ilustrativo da Planilha do Excel Usada como Fase Intermediária para a Construção do Texto a Partir das Falas Apresentadas.
Os números indicados nas colunas “Resposta a” e “Respondido por” correspondem ao número da linha onde estava inserido o argumento respondido
ou que o respondeu (na planilha original).
Identificação Análise das falas
Texto Localização Fala Dado Tipo de fala Ponto central Ponto específico Resposta a
Respondido
por
Baron e
Galizio
(2005)
p. 87
A função reforçadora de um
evento advém da mudança de
uma condição de estímulo para
outra. Qualquer afirmação de
que uma mudança reforçadora é
somente positiva ou negativa
pode ser contra-argumentada
com sua forma contrária.
Weiss e Laties (1961):
ratos em uma caixa
gelada pressionavam
uma alavanca e
produziam calor ao
mesmo tempo que
eliminavam o frio
Problema da
Manutenção
A distinção é
ambígua
— —
Baron e
Galizio 49
Baron e
Galizio 50
Chase 59
Chase 66
Iwata 83
Iwata 88
Iwata 90
Marr 102
Marr 103
Sidman 141
Sidman 144
Sidman 145
Sidman 148
Sidman 150
Sidman 156
Nakajima 209
Entrega de dinheiro tem
a consequência de
terminar um período de
falta de dinheiro
176

Identificação Análise das falas
Texto Localização Fala Dado Tipo de fala Ponto central Ponto específico Resposta a
Respondido
por
Fuga de um estímulo
aversivo condicionado
produz uma situação na
qual um estímulo está
ausente
Nakajima 210
Nakajima 211
Nakajima 216
Staats 221
Staats 222
Chase
(2006)
p. 115
A distinção pode ter sido
mantida porque talvez uma
direção da mudança (positiva
ou negativa) seja mais saliente
ou discriminável que outra
—
Explicação para
Manutenção
Diferem quanto a
outro aspecto
Saliência ou
discriminabilidade
—
Baron e
Galizio 181
Sidman
(2006)
p. 136
Apesar de contestarem a noção
de que o reforçamento envolve
mudanças em estados
fisiológicos ou emocionais, ele
ainda apela a esses estados em
seu principal argumento
A apresentação de
comida também é dita
como envolvendo a
redução de um estado de
privação (Baron &
Galizio, 2005, p. 87)
Contra-argumento — —
Baron e
Galizio 4
Baron e
Galizio 194
Após algumas pesquisas
sobre o assunto não se
mostrarem convincentes,
a teoria de que o
reforçamento deve
envolver redução de
impulso não está mais
em vigor (e.g., Miller &
Kessen, 1952; Miller,
Sampliner & Woodrow,
1957)
177

Identificação Análise das falas
Texto Localização Fala Dado Tipo de fala Ponto central Ponto específico Resposta a
Respondido
por
“É melhor falar da
consequência como
aumento de atenção ou
como alívio da solidão?”
(Baron & Galizio, 2005,
p. 91)a punição descrevem especificamente mudanças no
que ele chama de “condições de estímulo” (i.e., stimulus condition).
Ainda sobre o tópico de “mudanças de estímulo”, Michael (1975, p. 38) acrescenta
que além do destaque para o fato de que há sempre uma mudança e que ela é a responsável
pelas alterações no comportamento, dever-se-ia, para fins de maior precisão, fazer tanto
22

menções específicas para a condição de estímulo presente antes da alteração quanto para a
velocidade na qual se deu essa mudança. Afinal, “uma mudança consiste em nada além do
fato de que uma condição pré-mudança é substituída por uma condição pós-mudança, em uma
certa forma temporal e com certas condições intermediárias” (Michael, 1975, p. 38).
Outro fato que teria gerado confusão foi que uma grande parcela dos alunos de análise
do comportamento usava as definições de Keller e Schoenfeld (1950) de reforçamento
enquanto outra grande parcela usava as definições de Skinner (1953/2014). A principal
diferença é que a primeira focava no reforçador como um evento estático, enquanto a
segunda, segundo Michael (1975) avançou em tratar a mudança de estímulo como o evento
reforçador. A publicação de Holland e Skinner (1961) favoreceu ainda mais o uso dessa
segunda definição, o que acabou por resolver a confusão.
A partir disso, Michael (1975) apresenta como um dos pontos centrais de seu texto que
o ensino correto da distinção entre reforçamento positivo e reforçamento negativo – em
especial evitando que o termo “reforçamento negativo” seja interpretado por novos alunos
como o que chamamos hoje de punição – gera um trabalho considerável para aqueles que
ensinam análise do comportamento. O autor sugere que o uso anterior do termo
“reforçamento negativo” parece ser muito mais compatível com outras práticas verbais, como
a já estabelecida distinção entre “recompensa” e “punição” do senso comum.
Ainda assim, Michael (1975) não sugere que o significado do termo seja simplesmente
revertido, já que não se sabe quanta confusão seria gerada para um grupo de pessoas que
entenderia reforçamento negativo da forma que é falada hoje em dia, como outra forma de
processo estabelecedor de comportamento, tal como o reforçamento positivo.
Esclarecer a diferença entre reforçamento e reforçador também é complicado já que,
segundo Michael (1975), no caso do reforçamento positivo, ambos (apresentação e evento
apresentado) carregam o mesmo sentido de serem coisas “boas”, enquanto no outro caso um
23

reforçador negativo é considerado “ruim”, mas dada a sua presença, o reforçamento negativo
(sua remoção) é considerada “desejável”. Por conta dessa sutileza, é provável que o aluno
entenda que reforçamento positivo e reforçadores positivos são coisas desejáveis, e
reforçamento negativo e reforçador negativo são coisas indesejáveis – favorecendo a confusão
entre os conceitos de “reforçamento negativo” e “punição”. A relevância técnica dessas
afirmações é questionável, mas é exclusivamente ao aspecto didático que Michael está se
referindo.
Michael tampouco defende que se passe a usar o termo “estímulo aversivo” no lugar
de “reforçador negativo” já que além de ser necessário o mesmo tipo de esforço para delimitar
o seu uso, de maneira geral, o uso de sinônimos dentro de uma linguagem técnica pode gerar
desvios e distinções desnecessárias (Michael, 1975). Além disso, tal como evitou-se usar o
termo “recompensa” em favor do termo “reforçamento” em nome de se estabelecer um novo
conjunto de termos desassociado de outros conceitos (Skinner, 1938/1991), o uso dos termos
“apresentação” e “remoção” também pode gerar problemas por terem seus significados
atrelados a outros usos do senso comum. Em especial, tais termos parecem dizer respeito
principalmente ao comportamento de quem executa a alteração ambiental e não à alteração
ambiental em si (Michael, 1975). Nesse sentido, Michael sugere que as descrições deveriam
ser feitas “em termos de relações entre mudanças comportamentais e mudanças ambientais”,
sem menção às ações de um mediador real ou imaginário.
Geralmente, usa-se o termo “apresentar” referindo-se a situações nas quais a condição
pós-mudança parece a mais relevante para a mudança do comportamento e a condição pré-
mudança estaria implícita (i.e., se houve apresentação de um estímulo, ficaria implícita sua
ausência anterior). Ao contrário, a palavra “remover” é usada quando a condição pré-mudança
parece a mais relevante e a pós-mudança estaria implícita (i.e., se houve remoção de um
estímulo, ficaria implícita sua ausência posterior).
24

Para Michael (1975), entretanto, essa forma de descrição abreviada serve apenas para
descrever alguns casos de mudanças ambientais no âmbito dos estímulos incondicionados e,
mesmo nesses casos, uma inferência sempre precisaria ser feita. Adaptando um exemplo do
próprio autor, a descrição “remoção de um choque de 50 volts” só poderá ser entendida como
reforçadora se for assumido que o choque de 50 volts foi seguido da uma ausência de choque.
Se, na verdade, o organismo se encontrasse numa situação em que só pode variar entre um
choque de 50 volts e um de 100 volts, a remoção da condição de 50 volts seria,
provavelmente, punitiva.
Outro problema apontado por Michael, diz respeito à relevância e à clareza de se fazer
a distinção entre os reforçamentos positivo e negativo, especialmente no que diz respeito a
comportamentos humanos complexos. Há casos em que a distinção entre “apresentação” e
“remoção” fica cada vez mais difícil e casos em que ambas as mudanças estão envolvidas.
Uma possível saída seria apenas chamar essas mudanças de “reforçamento”.
A partir disso, o autor questiona se sequer há motivo para a distinção positivo/negativo
mesmo nas situações em que ela seria claramente possível e sugere algumas possibilidades de
explicação para a distinção estar sendo mantida. A primeira é que poderia haver outras
propriedades distinguíveis ligadas aos dois tipos de reforçamento às quais estamos
indiretamente nos referindo – diferenças temporais, maior discriminabilidade etc. Michael
(1975) reconhece que essas minúcias particulares que podem acompanhar o reforçamento são
bastante relevantes, mas afirma que essas diferenças existem mesmo entre dois ou mais
reforçadores positivos e entre dois ou mais reforçadores negativos. Esses dados adicionais
deveriam ser descritos em todos os casos e não deveriam se limitar à simples separação entre
dois grandes grupos. Segundo ele, dizer apenas que uma situação específica consistiu em
“reforçamento negativo” não acrescenta muito.
25

A segunda explicação apresentada para a continuidade do uso da distinção entre os
reforçamentos positivo e negativo diz respeito à possibilidade de que processos fisiológicos
distintos estejam envolvidos em cada um deles. Michael (1975), no entanto, afirma que a
distinção gera trabalho demais para compensar uma possível interrelação que, além de ter se
mostrado infrutífera no passado, pode estar muito distante de ser possível.
A terceira e última possibilidade levantada pelo autor diz respeito à distinção
positivo/negativo representar uma forma de separação das práticas desejáveis e indesejáveis
na área. Sobre esses casos, Michael (1975) afirma que, partindo de uma distinção que,
especialmente em casos humanos, é pouco clara, qualquer direcionamento no sentido de
aderir ou evitar certo tipo de prática será pouco efetivo. De toda forma, Michael desencoraja
que alterações em conceitos básicos de uma área sejam feitos com base em “possíveis
implicações sociais”.
Para o autor, nenhuma das explicações apresentadas é suficiente para manter uma
distinção que gera tanta confusão. Se for importante a distinção entre coisas “boas” e “ruins”,
enquanto condições estáticas, podemos pensar em reforçadores positivos e negativos. Para
mudanças “boas” ou “ruins”, oautor defende não a distinção entre positivo e negativo, mas
entre “reforçamento” e “punição”. Estas corresponderiam às mudanças que “gostamos” e
“buscamos” e “desgostamos” e “evitamos”. Vale retomar que o autor defende o reforçamento
negativo como algo “bom” no sentido de que mesmo que a apresentação de um reforçador
negativo seja punitiva, o reforçamento negativo é desejável.
Michael (1975), em seguida, adentra a discussão a respeito das visões assimétrica e
simétrica de punição, que não será aprofundada no presente momento. De forma resumida, ele
afirma que nenhuma refutação contundente foi feita a Azrin e Holz (1966) até a data de seu
texto e que a posição simétrica parece mais “atrativa” e por isso a adota na formulação da
solução para evitar os problemas da distinção positivo/negativo. A fim de evitar esses
26

problemas, Michael (1975) sugere abandoná-la por completo e passar a nomear o que é bom
como “reforçadores” e “reforçamento” e o que é ruim de “punidores” e “punição”. Ele afirma
que mesmo abandonando a distinção positivo/negativo, ainda é perfeitamente possível manter
a noção de que alterações ambientais com um determinado efeito (e.g., reforçador) terão o
efeito oposto quando invertidas (e.g., punidor). O termo “estímulo aversivo” também pode ser
descartado em favor de “punidor”.
Ao final de seu artigo, Michael (1975) traz um relato sobre a sua própria experiência
adotando as sugestões anteriores. Afirma, assim, que nos seis anos que precederam o artigo
não se deparou com os problemas gerados pelos usos anteriores e tampouco encontrou novos
problemas gerados pelo abandono dos termos “positivo” e “negativo”.
O Impacto de Michael (1975)
Embora a crítica de Michael (1975) à distinção entre reforçamentos positivo e
negativo tenha sido originalmente apresentada no plano conceitual, seu impacto não se
restringiu a discussões teóricas. Parte da produção experimental nas décadas subsequentes à
publicação do artigo refletiu, direta ou indiretamente, limites e ambiguidades da distinção. A
seguir, serão apresentados alguns desses estudos orientados por dados experimentais que
tensionam a distinção tradicionalmente feita.
Perone (2003) critica a alta adesão da literatura analítico-comportamental na defesa do
reforçamento positivo como uma forma de controle livre de problemas. Afirma, por exemplo,
que o endosso de autores como Sidman (1989/2009) ao reforçamento positivo é “abrangente
demais” e retoma Michael (1975) para afirmar que a distinção entre reforçamento positivo e
negativo sequer é clara. Ainda em Perone (2003), destaca-se o estudo de Jwaideh e Mulvaney
(1976), como exemplo de que efeitos colaterais comumente atribuídos ao controle aversivo
também podem surgir em esquemas de reforçamento positivo. No experimento, dois
estímulos (luz verde e luz vermelha) adquiriram função discriminativa para dois esquemas de
27

reforçamento distintos (VI 30s e VI 120s) para produção de alimento a partir de bicadas em
um disco (esquema múltiplo). Na segunda fase, em esquema misto, os pombos poderiam bicar
em qualquer uma de duas novas chaves introduzidas para produzir a luz correspondente ao
esquema em vigor naquele momento, sem com isso alterar o esquema (respostas de
observação) - nessa fase a luz produzida independia de qual das chaves foi bicada, apenas do
esquema em vigor e de uma bicada a alguma das chaves. Em seguida, uma das novas chaves
parou de produzir a luz vermelha quando o esquema de VI 120s estava em vigor (a luz ficava
apagada), mas seguia produzindo a luz verde quando no esquema de VI 30s (a outra chave se
continuou mostrando tanto a luz vermelha quanto a verde). Os resultados foram que os
pombos responderam igualmente nas duas novas chaves quando ambas produziam ambas as
luzes, mas passavam a responder preferencialmente na chave que só era capaz de produzir a
luz verde (independentemente da posição). Vale notar, que a duração e frequência dos
esquemas em si não muda, apenas se o pombo verá ou não verá o que seria o estímulo delta
(vermelho).
Para Perone (2003), esse é um exemplo de que um estímulo aversivo (luz vermelha)
pode ser condicionado mesmo numa condição em que apenas reforçamento positivo estaria
em vigor. Perone afirma que esses dados só seriam estranhos se considerados por teorias que
entendem reforçamento positivo como “bom” e reforçamento negativo como “ruim”
desconsiderando um contexto ambiental mais amplo.
Perone & Galizio (1987), por sua vez, conduziram um experimento com o objetivo de
investigar o reforçamento negativo em um delineamento semelhante ao empregado em
pesquisas sobre reforçamento positivo. No estudo, os sujeitos experimentais foram treinados a
responder em esquemas concorrentes nos quais a pressão em uma das barras adiaria um
choque e a pressão na outra barra poderia ocasionalmente produzir um timeout (suspensão de
dois minutos do esquema de adiamento do choque e dos estímulos relacionados). O
28

experimento foi conduzido em fases nas quais o tempo de atraso do choque variava,
permitindo avaliar como as respostas eram distribuídas nas duas barras. Foi observado que as
preferências eram sensíveis a essas alterações – os sujeitos passaram a responder mais na
barra que adiava o choque por mais tempo conforme esses aumentavam em intensidade.
Segundo os autores, esse padrão de responder era similar ao frequentemente observado em
esquema de reforçamento positivo, como a distribuição de respostas proporcional à taxa de
reforçamento produzida. Os autores concluem que o reforçamento negativo pode ser
investigado em condições metodologicamente comparáveis às utilizadas para o reforçamento
positivo, enfraquecendo a necessidade de uma distinção rígida entre os dois processos.
Alinhando-se a Michael (1975), Hineline (1984) questiona a utilidade de se tratar o
reforçamento negativo como um “domínio separado dentro da teoria comportamental” (p.
495). O autor aponta que descrições sobre o que é reforçamento positivo e o que é
reforçamento negativo baseadas na adição e subtração de estímulos são arbitrárias e não
suficientemente informativas. Sugere, em vez disso, uma abordagem funcionalmente molar,
considerando a taxa de ocorrência de eventos ao longo do tempo e a estrutura relacional das
contingências. Assim, processos normalmente atribuídos ao reforçamento negativo poderiam
ser compreendidos dentro de princípios mais amplos do controle operante.
Magoon & Critchfield (2008) exploraram o possível efeito diferencial que o
reforçamento positivo e o negativo poderiam ter sobre o repertório do indivíduo, partindo do
pressuposto de que na literatura analítico-comportamental impactos e efeitos diferentes
costumam ser descritos de acordo com cada um deles. Os autores, então, investigaram se
reforçadores positivos e negativos de valor monetário equivalente exerceriam diferentes
controles sobre o comportamento humano quando apresentados em esquemas concorrentes. O
delineamento consistia em um jogo de computador, no qual os participantes podiam clicar em
alvos para ganhar dinheiro (reforçamento positivo) ou evitar perdas monetárias (reforçamento
29

negativo), ambos em ciclo variável (VC). O delineamento incluiu comparações entre
condições homogêneas (dois esquemas de reforçamento positivo com diferentes razões de
ganho de pontos) e heterogêneas (uma opção com reforçamento positivo e outra com
reforçamento negativo, ambos com magnitudes de 1,50 ¢).
Para a interpretação dos dados, Magoon e Critchfield (2008) analisaram o desempenho
dos participantes com base na Lei da Igualação Generalizada, com especial atenção ao log b
(indicador de viés) e ao parâmetro a (indicador de sensibilidade do comportamento a taxas
relativas de reforçamento). Os resultados mostraram ausência de viés sistemático entre os
tipos de reforçamento (log b próximo a 0), sugerindo que nenhumdos tipos de reforçamento
exerceu um controle predominante do comportamento. No entanto, encontraram dados
indicando que os valores do parâmetro a foram maiores nas condições heterogêneas do que
nas homogêneas de reforçamento. Isso apontaria para o fato de que, em um procedimento de
operante livre, a heterogeneidade das contingências poderia levar a uma maior
discriminabilidade das próprias, levando a uma performance diferencial. Esse resultado foi
considerado como evidência de um possível efeito de consequências diferenciais (Different
Outcomes Effect, ou DOE) – no qual a diferença na consequência produzida é o elemento-
chave para a discriminação da contingência. Seria possível interpretar esses dados na direção
de evidenciar o controle diferencial do reforçamento positivo em relação ao reforçamento
negativo, embora os autores sugiram que mais investigações devessem ser conduzidas.
Em um artigo posterior, Magoon et al. (2017) retomam Michael (1975) e Baron e
Galizio (2005) para discutir a ambiguidade da atribuição dos reforçamentos positivos e
negativos como processos distintos, apontando para a falta de estudos empíricos que
sustentem fortemente essa diferença. Os autores apontam que mesmo dentro da longa
produção experimental da análise do comportamento, os reforçamentos positivo e negativos
foram estudados majoritariamente de forma separada, de forma que o controle diferencial que
30

pode ter sido demonstrado até o momento poderia ser, na verdade, decorrente de
procedimentos diferentes. Com o objetivo de refinar os dados produzidos por Magoon e
Critchfield (2008) referentes ao DOE, os autores realizaram uma replicação e extensão do
estudo anterior, com objetivo de examinar se os efeitos observados poderiam ser atribuídos à
natureza dos reforçadores ou a diferenças procedimentais. Nesse experimento, além da
manutenção de magnitudes monetárias idênticas, foram incluídas análises de sensibilidade e
persistência do comportamento. Os resultados reiteraram as evidências do DOE, mostrando
que o tipo de consequência (ganho de pontos ou esquiva da perda deles) influencia o
desempenho, mesmo quando outros fatores são mantidos constantes. Magoon et al. (2017)
concluíram que, apesar dos reforçamentos positivo e negativo exercerem controle similar em
certos contextos, pode haver efeitos diferenciais que não deveriam ser ignorados. Assim, mais
do que sustentar uma distinção conceitual entre os dois tipos de reforçamento, os autores
apontam para a importância de analisar a função dos estímulos em cada arranjo experimental.
Por fim, Nevin e Mandell (2017) propõem um experimento quantitativo hipotético
para questionar se os reforçamentos positivo e negativo são de fato funcionalmente diferentes.
O experimento imaginado envolveria esquemas encadeados concorrentes nos quais um rato
poderia escolher entre um terminal com reforçamento positivo (alimento) e outro com
reforçamento negativo (período sinalizado sem choque), ambos sob controle de estímulos
distintos. A partir dessa escolha, seria possível medir tanto a preferência por um tipo de
consequência quanto a resistência à mudança da resposta em cada condição. O delineamento,
embora nunca realizado devido a questões éticas e práticas, foi construído com base em
procedimentos já validados experimentalmente, como os de Perone e Galizio (1987). Ao final,
Nevin e Mandell sustentam que, se a resistência à mudança e a preferência se correlacionarem
positivamente entre os dois tipos de reforço, isso forneceria evidência de que ambos operam
segundo princípios funcionais comuns. Essa proposta, inspirada diretamente nas incertezas
31

levantadas por Baron e Galizio (2005), sintetiza o eixo condutor deste segmento: as
dificuldades em manter a distinção entre reforçamentos positivo e negativo tornam-se mais
evidentes justamente quando se tenta operacionalizá-la em arranjos experimentais rigorosos.
A partir das contribuições descritas da literatura, observa-se que as dificuldades em
manter a distinção entre reforçamentos positivo e negativo não se limitam à esfera conceitual,
mas também se evidenciam no estudo empírico do comportamento.
No campo conceitual, pelo menos dois estudos brasileiros se propuseram a investigar a
influência de Michael (1975) em publicações subsequentes dentro da análise do
comportamento. Um deles é o artigo de Santos e Leite (2013), sobre a influência do texto de
Michael nas definições de reforçamento em livros didáticos. Outro é o trabalho de Possmoser
(2015) que investigou a influência de Michael (1975) em artigos da análise do
comportamento, a partir do qual será delimitado o presente problema de pesquisa.
Santos e Leite (2013) buscaram as definições de reforçamento positivo e negativo em
13 livros de ensino de análise do comportamento e dividiram os livros em três grupos: 1.
Publicações Antes de Michael (1975) – que não criticaram a distinção tradicional (i.e., Keller
e Schoenfeld, 1950/1974; Skinner, 1953/2014; Reese, 1966/1973; Deese e Hulse, 1967/1975;
Millenson, 1967/1975; Lundin, 1969/1972; Holland & Skinner, 1969/1975), 2. Publicações
Depois de Michael (1975) que não abordaram sua crítica (i.e., Baum 1999; Sidman,
1989/2009; Whaley & Malott, 1981) e 3. Publicações Posteriores a Michael (1975) que
abordaram sua crítica (i.e., Pierce & Epling, 1995; Catania, 1992 e Cameschi & Abreu-
Rodrigues, 2005).
Sobre esta última categoria, os autores destacam que Catania (1992) reconhece as
falhas na distinção entre adição e remoção apontadas por Michael (1975) e que Cameschi &
Abreu-Rodrigues (2005) chegam a retomar o apontamento de Michael feito sobre Skinner
32

(1938) de que o conceito de reforçamento negativo correspondia, originalmente, ao conceito
atual de punição.
Pierce e Epling (1995) também salientam as críticas de Michael (1975) e resgatam
uma citação de Hineline (1984) em que o autor afirmou que há uma assimetria fundamental
entre os reforçamentos positivo e negativo já que, quando a resposta ocorre, no primeiro o
estímulo está ausente, enquanto, no segundo, o estímulo a ser removido estava presente. Isso
de nenhuma forma desafia a argumentação de Michael (1975) já que o autor tanto reconheceu
como se aprofundou na discussão sobre condições pré e pós-mudança. A partir das próprias
considerações de Michael (1975), seria possível questionar essa suposta “assimetria
fundamental” argumentando que a diferença está na ênfase dada ao que está sendo adicionado
ou removido e que, de qualquer forma, isso pouco acrescentaria numa análise comportamental
sem que outros detalhes mais relevantes fossem explicitados.
A partir da análise dos resultados encontrados, Santos e Leite (2013) concluíram que
mesmo os autores que chegaram a comentar sobre a existência de uma ambiguidade na
distinção (terceiro grupo) ainda se utilizaram dos termos “positivo” e “negativo” para referir-
se a “apresentação” e “remoção” de um estímulo respectivamente. Esses resultados indicaram
tanto que os argumentos de Michael (1975) foram pouco considerados em livros didáticos
quanto que, mesmo quando considerados, nenhum dos autores se comprometeu com uma
definição que divergisse significativamente das anteriores quanto à dicotomia
positivo/negativo.
Além de levar à constatação de que as críticas de Michael (1975) foram
insuficientemente consideradas na literatura comportamental, as definições de reforçamento
positivo e negativo analisadas por Santos e Leite (2013) também permitem ao leitor um
panorama sobre como esses termos têm sido definidos, diferenças entre as definições
33

disponíveis, bem como alguns de seus problemas correntes. Esses elementos são apresentados
nos parágrafos a seguir.
Santos e Leite (2013) identificaram que, nas definições das obras analisadas, a
diferença fundamental entre reforçador positivo e reforçador negativo é que o primeiroaumenta a frequência (fortalece) classes de resposta que o adicionarem ao ambiente, enquanto
o segundo aumenta a frequência de respostas que o subtraírem do ambiente.
Apesar dessa diferença comum a todas as definições analisadas, algumas definições
apresentaram outras diferenças sutis entre suas definições de reforçadores positivos e
reforçadores negativos, ainda que os trechos analisados pelos autores não possam ser tratados
como definições completas de cada um desses dois conceitos, mas sim excertos que
sintetizam as definições dos autores dos livros didáticos em questão. Todas as definições aqui
mencionadas estão incluídas no Apêndice do próprio artigo de Santos e Leite (2013).
Um fator relevante ao se comparar os dois conceitos é o paralelismo entre ambos. Isso
porque frases com maior paralelismo diminuem as chances de interpretações errôneas das
definições apresentadas. Quanto mais paralelas forem as definições, mais fácil será identificar
(e menos será necessário inferir) quando uma diferença entre elas representa uma diferença no
processo em si ou quando se trata apenas uma diferença na redação da frase (esse conflito
deverá ficar mais evidente quando apresentados exemplos específicos).
Em Keller e Schoenfeld (1950/1974), os autores definem reforçadores positivos
recorrendo a um efeito: “aqueles estímulos que intensificam as respostas quando presentes”,
mas definem reforçadores negativos recorrendo a dois efeitos: “aqueles que intensificam [as
respostas] quando removidos” e pelo “enfraquecimento que tem quando apresentados”. Para
os autores, aparentemente, a função punitiva da apresentação de um reforçador negativo após
uma resposta (punição positiva) seria parte definidora de reforçador negativo, enquanto a
função punidora da remoção de um reforçador positivo não seria parte definidora de um
34

reforçador positivo. Essa definição pode ser problemática por permitir a interpretação de que,
para que as respostas aumentem de frequência, basta a mera presença do reforçador e não
apresentações subsequentes e contíguas à resposta.
Skinner (1953/2014), no trecho selecionado por Santos e Leite (2013), apresentou
definições bastante paralelas, utilizando os termos “acréscimo” (“presenting”) e “remoção”
(“removing”) para se referir ao reforçamento positivo e negativo, respectivamente. Essa foi a
definição apontada por Santos e Leite (p. 11) como a “tradicional” e que foi apresentada no
subtítulo “Reforçamento Positivo e Negativo” do presente trabalho.
Deese e Hulse (1967/1975) definem um reforçador positivo como “um prêmio - que
damos ao organismo depois de ter feito alguma coisa que desejamos que aprenda a fazer” e
reforçadores negativos como “os estímulos que fortalecem uma resposta quando são afastados
se a resposta ocorrer”. Essa definição de reforçador positivo apresentada pode parecer
pressupor a dependência dos supostos desejos e intenções de quem o media, o que,
diferentemente das outras definições já expostas, dispensaria qualquer efeito no
comportamento do organismo como critério definidor e excluiria a possibilidade do
reforçamento positivo intrínseco. Essa forma de falar sobre reforçamento pode se justificar
por se tratar de um livro escrito para leitores leigos interessados em aplicação e não em um
aprofundamento teórico propriamente dito. A definição de reforçador negativo não apresenta
os mesmos problemas, mas ainda assim poderia não ficar claro para um aplicador (pelo menos
no trecho citado) o que os autores quiseram dizer com “são afastados”. Seria um afastamento
espacial, temporal ou ambos? Atenuações do estímulo estariam inclusas como alterações
ambientais?
No trecho de Millenson (1967/1975) fica claro que a distinção principal entre
reforçadores positivos e negativos diz respeito à operação (apresentação e remoção) envolvida
na relação estabelecida entre resposta e estímulo reforçador:
35

Como a operação que define esses eventos como reforçadores (sua remoção) é oposta,
em caráter, àquela dos reforçadores positivos (definidos por sua apresentação), eles
são conhecidos como reforçadores negativos. Em geral, reforçadores negativos
constituem-se daqueles eventos cujo término (ou redução na intensidade) fortalecerá e
manterá operantes (Millenson, 1967/1975, p. 383).
A diferença mais notável entre as duas definições está no trecho “ou redução na
intensidade”. O destaque feito por Millenson, exclusivamente sobre o reforçamento negativo,
poderia levar o leitor a pensar que, no caso do reforçamento positivo, um aumento em sua
intensidade não fortaleceria/manteria uma resposta.
A citação trazida por Santos e Leite (2013) retirada do livro de Holland e Skinner
(1969/1975) apresenta dois problemas. O primeiro problema é que este é um livro de
completar lacunas, e a citação trazida por Santos e Leite (2013) foi trazida com as lacunas
preenchidas inversamente (positivo no lugar de negativo e vice-versa). Um outro problema é
que o trecho escolhido se refere a um exemplo, e não uma definição. Há dois trechos que
melhor representariam as definições de reforçamento positivo e negativo de Holland e
Skinner (1969/1975): “Os reforços que consistem em apresentar estímulos (por ex.: comida)
são chamados reforços positivos. De outro lado, os reforços que consistem na supressão ou
eliminação de estímulos (p. ex.: um estímulo doloroso) são chamados reforços negativos” e “a
frequência de um operante pode ser aumentada pela apresentação de (1) reforçador positivo
ou pela supressão de (2) reforçador negativo” (p. 56).
Considerando esses trechos, as definições de reforçadores positivo e negativo de
Holland e Skinner (1968/1975) são bastante paralelas entre si, com duas exceções muito sutis:
a definição de reforçamento positivo usa uma palavra em forma verbal para falar do tipo de
alteração ambiental produzida (i.e., “apresentar”) e a definição de reforçamento negativo usa
duas palavras em forma substantiva (“supressão” e “eliminação”).
36

Entender a função do uso de duas palavras é relevante porque alguns autores utilizam
duas palavras como sinônimos intercambiáveis (e.g., Sidman, 1989/2009, que usa os termos
“subtrai”, “elimina” e “remove” ao falar de reforçamento negativo), enquanto outros
apresentam duas palavras para representar procedimentos realmente distintos (e.g., Catania,
1992, que usa os termos “termina” ou “evita” ao falar duas formas de reforçamento negativo).
Pelo fato de uma delas estar em itálico e pelo uso apenas do termo “supressão” em outros
trechos do texto, como “a frequência de um operante pode ser aumentada pela apresentação
de (1) reforçador positivo ou pela supressão de (2) reforçador negativo” (p. 56); as palavras
“supressão” e “eliminação” parecem ter sido usadas como sinônimos. Além disso, todos os
usos da palavra “supressão” nesta seção do livro poderiam, em tese, ser trocados pela palavra
“eliminação” sem alteração no sentido das frases – algo que não aconteceria com uma palavra
como “atenuação”, por exemplo. Adicionalmente, todos os exemplos de reforçamento
negativo apresentados, implicavam a presença de um estímulo reforçador negativo antes da
resposta e a sua ausência depois dela.
A segunda diferença identificada foi no uso de um verbo para falar de reforçamento
positivo e substantivos para falar de reforçamento negativo. Novamente, o trecho “os reforços
que consistem em apresentar estímulos” poderia, de forma similar à definição apresentada por
Deese e Hulse (1967/1975), dar a entender que é necessário que um agente apresente esses
estímulos. Isso é evitado em: “os reforços que consistem na supressão ou eliminação de um
estímulo”.
Com bons olhos, entender-se-ia que quem apresentaria esses estímulos seria o
“ambiente” e não um agente específico – um uso comum, mas questionável. O ambiente é,
justamente, o conjunto de estímulos que afetam o organismo e, assim sendo,não poderia ser o
agente de sua própria apresentação. Esse parece um dos casos em que as definições teriam se
beneficiado de um maior paralelismo entre si.
37

Santos e Leite (2013) afirmam que Lundin (1969/1972) distingue os dois processos
pela “apresentação” e “remoção” de um estímulo. Isso não está evidente pelo trecho
selecionado por Santos e Leite (2013) que não traz uma definição clara de reforçador
negativo. Entretanto, encontra-se o seguinte trecho no mesmo capítulo citado pelos autores:
“reforçadores negativos são aqueles estímulos ‘que fortalecem o comportamento quando
removidos’. Neste caso, a resposta é fortalecida pela remoção de algum estímulo aversivo,
como uma luz brilhante ou um choque elétrico” (Lundin, 1969/1972, p. 77). Talvez um trecho
ainda melhor para identificarmos as diferenças entre as duas definições seja: “no reforço
negativo, alguma coisa é retirada, um estímulo é removido e, por sua remoção, a resposta é
fortalecida. Ao contrário, no reforço positivo alguma coisa é acrescentada e, por sua adição, a
resposta é também fortalecida” (p. 77). A partir desses trechos, pode-se entender que a
diferença entre reforçadores positivos e negativos, para Lundin se resume, de fato, à oposição
acréscimo/remoção.
O trecho de Whaley e Malott (1971/1981) trazido por Santos e Leite (2013), foi
retirado de um capítulo sobre fuga e esquiva. Nesse sentido, ele se refere principalmente a
reforçamento negativo. No volume anterior ao livro citado (i.e., Whaley & Mallot,
1971/1980), encontra-se um trecho onde os autores definiram reforçador positivo
especificamente. Considerando ambos os trechos, “aquilo que é dado é reforçador positivo se,
e apenas se, aumentar a frequência de uma resposta ou ato comportamental ao qual se
seguiu”, enquanto é chamado de reforçamento negativo o procedimento no qual “a frequência
de uma resposta específica será aumentada se esta resposta for regularmente seguida pela
cessação da estimulação ou término da perda de reforçadores positivos”.
Mais adiante Whaley e Malott (1971/1981) ressaltam que “os dois procedimentos
diferem pelo fato de o reforçamento positivo envolver a apresentação de um evento ou
privilégio, enquanto o reforçamento negativo envolve a remoção de eventos classificados
38

usualmente como ‘aversivos’”. Além do tipo de alteração ambiental (novamente no caso do
reforçamento negativo) há algum acréscimo ausente no reforçamento positivo: além da
remoção (“cessação”) do estímulo reforçador negativo, o “término da perda de reforçadores
positivos” também pode se constituir como reforçamento negativo.
Para Sidman (1989/2009), o reforçamento positivo se caracteriza pela “adição,
produção ou aparecimento” (p. 55) de um estímulo e o reforçamento negativo, pela
“subtração, remoção ou eliminação” (p. 55) de um estímulo. Descrições bastante paralelas nas
quais fica evidente que os três termos utilizados (em ambas) servem como sinônimos
intercambiáveis. Destaca-se novamente (como feito na sessão "Reforçadores Positivos e
Negativos”) o adendo do autor de que o que é acrescentado (no reforçamento positivo),
necessariamente não estava presente antes da resposta, enquanto o que é eliminado (no
reforçamento negativo) necessariamente estava presenta antes da resposta.
No trecho selecionado por Santos e Leite (2013), Baum (1994/1999, p. 77) apresenta,
como definição de reforçamento, o fortalecimento ou manutenção de uma resposta - o que é
compatível com a visão dos autores anteriores. No entanto, diz que no reforçamento positivo,
a resposta torna o reforçador positivo “provável” e, no reforçamento negativo, a resposta torna
o reforçador negativo “menos provável”. Foge aos objetivos deste trabalho analisar a fundo a
proposta alternativa de Baum, mas, no que é relevante para este trabalho, esta parece apenas
uma forma diferente de se referir ao que tipicamente é chamado de contingência. Ainda
assim, segundo Santos e Leite (2013), esta mudança na forma de descrever não resolveria de
forma alguma a ambiguidade apontada por Michael (1975).
Catania (1992) é outro dos autores já utilizados neste trabalho ao definir reforçamento
e reforçadores positivos e negativos e ele basicamente distingue reforçamento positivo de
negativo pela “produção” e “remoção” de um estímulo respectivamente. Entretanto, algo que
não fora mencionado, é que o autor acrescenta que no reforçamento negativo uma resposta
39

“termina” (terminate) ou evita/previne (prevent) um estímulo” (p.117). Esse acréscimo é de
especial relevância porque, diferentemente de casos anteriores, seria difícil argumentar que
“terminar” e “prevenir” sejam sinônimos intercambiáveis. Isso poderia dar a entender que o
reforçamento negativo seria possível de ser definido por um critério adicional em relação a
outros autores.
Entende-se, entretanto, que este acréscimo se baseia na noção de que situações de fuga
(emissão de uma resposta que elimina ou reduz uma estimulação aversiva) podem ser
acompanhadas do que é chamado de esquiva. Segundo Skinner (1953/2014), para que uma
esquiva aconteça, é necessário que um primeiro estímulo anteceda regularmente um segundo
estímulo que seja aversivo, de forma que esse primeiro estímulo se torne um estímulo
aversivo condicionado. Se o organismo entrar em contato com o primeiro estímulo
(condicionado ao outro) e emitir respostas que o eliminem, evitando o contato com o segundo
estímulo (que o condicionou), diz-se que o organismo fugiu do primeiro estímulo e se
esquivou do segundo estímulo. Skinner acrescenta que esquiva não quebra nenhum
fundamento científico porque não é explicada pela evitação direta de um estímulo no futuro,
mas sim pela fuga do estímulo por ele condicionado.
Seguindo essa lógica, não seria possível que uma esquiva acontecesse sem que uma
fuga também acontecesse. Logo, o acréscimo de Catania (1992) de que um reforçamento
negativo pode ser caracterizado pelo término ou evitação de um estímulo aversivo torna-se 1)
redundante, a partir da perspectiva de que em toda “prevenção/evitação” já estaria implícito
um “término”, ou 2) incorreto já que “prevenções” que não incluem um término não poderiam
ser consideradas reforçamento negativo (e.g., um rato que, por acaso, pressionou uma barra
que adiou um choque sem que ele sequer tivesse tido contato prévio com o choque). É
possível que esse acréscimo tenha sido feito para englobar definições alternativas de esquiva
40

que entendam que a esquiva não dependa de um estímulo aversivo condicionado (e.g., Baum
1994/1999).
Vale lembrar que esse livro, junto com Pierce e Epling (1995) e Catania (1992)
fizeram parte do terceiro grupo do artigo de Santos e Leite (2013), ou seja, são publicações
que, de alguma forma, abordaram a crítica de Michael (1975). Cameschi e Abreu-Rodrigues
(2005), por sua vez, apenas mencionam o questionamento, enquanto Pierce e Epling (1995) e
Catania (1992) dão a entender que concordam, pelo menos parcialmente, com a dubiedade da
distinção.
Reese (1966/1973), ao descrever o reforçamento negativo, utilizou o termo “estímulo
aversivo” para se referir ao tipo de estímulo envolvido no processo. Ao mesmo tempo, ele
usou o termo “estímulo reforçador” para descrever o estímulo envolvido no processo de
reforçamento positivo. O autor parece não separar os estímulos entre reforçadores positivos e
negativos (como outros autores), mas sim entre reforçadores e aversivos (ou também
“controle positivo” e “controle negativo”).
Diversos outros autores (i.e., Whaley & Mallot, 1971/1981; Pierce & Epling, 1995;
Catania, 1992; Cameschi & Abreu-Rodrigues, 2005) também apresentaram a mesma alteração
no uso de termos ao definir reforçamento negativo (“estímulo aversivo” no lugar de
“reforçador negativo”), mas não fizeram alterações similares em suas definições de
reforçamento positivo (i.e., utilizaram o termo “reforçador

Paulo Henrique Cavalcanti Mendes

Psicologia Educacional

FAFIRE

Ferramentas de estudo

Mais conteúdos dessa disciplina