Logo Passei Direto
Buscar

Paulo Henrique Cavalcanti Mendes

Ferramentas de estudo

Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

1 
 
 
Pontifícia Universidade Católica de São Paulo - PUC-SP 
 
 
 
Paulo Henrique Cavalcanti Mendes 
 
 
 
 
Uma Análise dos Argumentos a Favor e Contra a Distinção entre os Reforçamentos Positivo e 
Negativo 
 
 
 
 
 
Mestrado em Psicologia Experimental: Análise do Comportamento 
 
 
 
 
 
 
São Paulo 
2025 
2 
 
 
Paulo Henrique Cavalcanti Mendes 
 
 
Mestrado em Psicologia Experimental: Análise do Comportamento 
 
 
Uma Análise dos Argumentos A Favor e Contra a Distinção Entre os Reforçamentos Positivo 
e Negativo 
 
 
 
Dissertação apresentada à Banca Examinadora 
da Pontifícia Universidade Católica de São 
Paulo, como exigência para obtenção do título 
de MESTRE em Psicologia Experimental: 
Análise do Comportamento, sob a orientação 
do Prof. Dr. Emerson Ferreira da Costa Leite. 
 
 
 
 
 
 
 
São Paulo 
2025 
3 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Banca Examinadora: 
 
Prof. Dr. Emerson Ferreira da Costa Leite 
 
Prof. Dr. Amilcar Rodrigues Fonseca Júnior 
 
Prof. Dr. Denigés Maurel Regis Neto 
 
 
 
 
4 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal 
de Nível Superior- Brasil (CAPES) – Código de Financiamento 001 
Processo n° 88887.805384/2023-00 
 
 
 
This study was supported by the Coordenação de Aperfeiçoamento de Pessoal de Nível 
Superior – Brasil (CAPES) – Finance Code 001 
Process n° 88887.805384/2023-00 
 
 
5 
 
 
Agradecimentos 
Em primeiro lugar, agradeço ao Prof. Dr. Emerson Ferreira da Costa Leite, meu 
primeiro professor da graduação com quem tive aulas ou orientações durante todos os anos da 
minha jornada acadêmica até aqui. Ele foi não só um orientador incrível, mas também uma 
pessoa que soube lidar comigo da melhor maneira possível. Emerson, obrigado por ter me 
ajudado tanto especialmente nessa reta final, isso nunca será esquecido. Foi muito bom 
trabalhar com você. 
Obrigado à minha família, aos meus amigos, aos meus professores do PEXP e a cada 
funcionário e aluno da PUC-SP que contribuíram direta ou indiretamente para a construção de 
um ambiente no qual eu pude me desenvolver tanto como analista do comportamento como 
pessoa ao longo desses anos. O carinho que sentirei por essa comunidade será eterno. 
Destaco especialmente o Prof. Dr. Amilcar Rodrigues Fonseca Júnior, cuja eletiva e 
discussões dentro e fora de sala me inspiraram a estudar o tema desenvolvido nesse trabalho. 
Quero agradecer tanto ele como o Prof. Dr. Denigés Meurel Regis Neto e o Prof. Thomas 
Endriggo Ramos Vieira pelas inestimáveis contribuições em minha Banca de Qualificação e 
por concordarem em participar também da minha Banca de Defesa. Esse trabalho 
definitivamente não seria o mesmo sem os comentários de vocês. 
Faço também uma humilde menção à Prof. Tuane de Oliveira Lima que chegou na 
sala de aula com uma sacola cheia de livros e revistas de análise do comportamento para dar e 
que incluíam os volumes originais de 2006 do debate analisado no presente trabalho. Eu 
jamais imaginaria poder ter algo assim hoje. 
Por fim, agradeço a pessoa mais essencial tanto para o desenvolvimento de diversas 
das discussões presentes nesse trabalho quanto para a minha (relativa) estabilidade durante 
todo esse processo. Giovana, eu te amo. Nada na minha vida seria tão bom sem ter você do 
meu lado. 
6 
 
 
Resumo 
Mendes, P. (2025). Uma análise dos argumentos a favor e contra a distinção entre os 
reforçamentos positivo e negativo [Dissertação de mestrado, Pontifícia Universidade Católica 
de São Paulo]. Biblioteca Digital Brasileira de Teses e Dissertações. https://bdtd.ibict.br 
 
Esta dissertação teve como objetivo sistematizar, analisar e interrelacionar as falas 
(argumentos, sugestões e esclarecimentos) do debate publicado na revista The Behavior 
Analyst (2005-2006) sobre a distinção entre reforçamento positivo e negativo. Cada fala foi 
organizada segundo suas diferentes funções e posteriormente categorizadas e organizadas em 
uma planilha que permitiu a análise conjunta dos temas e interlocuções. Os resultados 
indicam que a distinção baseada em adição ou subtração de estímulos é conceitualmente 
ambígua e frequentemente arbitrária, o que compromete sua utilidade descritiva e didática. 
Embora alguns autores apontem vantagens em sua manutenção, essas se mostraram pouco 
fundamentadas ou independentes da distinção em si. Além das sugestões conceituais e 
pedagógicas, os textos analisados propõem diversas linhas de investigação empírica, como: 
estudos sobre a clareza das definições de reforçamento; investigações sobre os parâmetros 
comuns entre reforçadores tradicionalmente classificados como positivos ou negativos; 
pesquisas sobre as razões culturais e históricas para a manutenção da distinção; e análises do 
comportamento de nomear reforços. Também foram discutidas variáveis possivelmente 
envolvidas no controle dessa distinção, como abruptidão da mudança, mecanismos 
fisiológicos e operações motivadoras. Conclui-se que a distinção poderia ser abandonada sem 
prejuízo conceitual, desde que preservadas descrições precisas das condições de estímulo. 
Palavras-chave: análise do comportamento; reforçamento positivo; reforçamento 
negativo; análise conceitual. 
 
https://bdtd.ibict.br/
7 
 
 
Abstract 
Mendes, P. (2025). An analysis of the arguments for and against the distinction between 
positive and negative reinforcement [Master’s thesis, Pontifical Catholic University of São 
Paulo]. Brazilian Digital Library of Theses and Dissertations. https://bdtd.ibict.br 
 
This dissertation aimed to systematize, analyze, and interrelate the statements (arguments, 
suggestions, and clarifications) from the debate published in The Behavior Analyst (2005-
2006) on the distinction between positive and negative reinforcement. Each statement was 
organized according to its function and subsequently categorized and compiled into a 
spreadsheet that allowed for the integrated analysis of themes and interactions among authors. 
The results indicate that the distinction based on the addition or removal of stimuli is 
conceptually ambiguous and often arbitrary, which compromises its descriptive and 
pedagogical utility. Although some authors pointed to advantages in maintaining the 
distinction, these were either weakly supported or not inherent to the distinction itself. In 
addition to conceptual and educational suggestions, the analyzed texts proposed several 
avenues for empirical investigation, including: studies on the clarity of reinforcement 
definitions; investigations into common parameters across traditionally classified reinforcers; 
research on the cultural and historical reasons for the distinction’s persistence; and analyses of 
the scientific behavior of labeling reinforcers. Variables potentially involved in the control of 
this distinction were also discussed, such as abruptness of environmental change, 
physiological mechanisms, and motivating operations. The dissertation concludes that the 
distinction could be abandoned without conceptual loss, provided that precise descriptions of 
stimulus conditions are maintained. 
Keywords: behavior analysis; positive reinforcement; negative reinforcement; 
conceptual analysis. 
https://bdtd.ibict.br/
8 
 
 
Sumário 
 
Lista de Figuras.................................................................................................................... 12 
Lista de Tabelas ................................................................................................................... 13 
Considerações Sobre o Processo de Produção do Presente Trabalho ................................ 14 
Estrutura Geral da Introdução .......................................................................................... 15 
Definição de Reforçamento .............................................................................................positivo”). 
Considera-se assim que as diferenças apontadas até então sejam, individualmente, 
minúcias. Entretanto, consideradas em conjunto, apontam para uma tendência em fazer 
alterações e acréscimos quase que exclusivamente sobre as definições de reforçador e/ou 
reforçamento negativo. Resumidamente, 1) utilizaram um termo diferente (i.e., estímulo 
aversivo) no lugar de reforçador negativo (Reese, 1966/1973; Whaley & Mallot, 1971/1981; 
Pierce e Epling (1995); Catania, 1992; Cameschi & Abreu-Rodrigues, 2005), 2) 
41 
 
 
acrescentaram como parte da definição que eles também funcionam como punidores (Keller 
& Schoenfeld, 1950/1974), 3) destacaram que reduções na intensidade do estímulo podem 
configurar reforçamento negativo (Millenson, 1967/1975), 4) incluíram o término da perda de 
reforçadores positivos como reforçamento negativo (Whaley & Mallot, 1971/1981) e, por fim, 
5) afirmaram que a prevenção de um estímulo aversivo constitui reforçamento negativo 
(Catania, 1992). 
Sobre cada uma das alterações/acréscimos feitas sobre os reforçadores negativos, 
comenta-se: 1) o termo “estímulo apetitivo” nunca foi usado nas definições analisadas de 
reforçamento positivo como um paralelo para estímulo aversivo; 2) não houve menção direta 
ao fato de que a remoção de reforçadores positivos pode funcionar como punição; 3) não 
incluíram, nas definições, que aumentos na intensidade de um estímulo reforçador positivo 
contingentemente a uma resposta poderiam aumentar sua frequência (e.g. aumentar o brilho 
de um vídeo ou volume de uma música); 4) não incluíram uma versão oposta disso que 
pudesse ser chamada de reforçamento positivo; e 5) é baseado em aspectos específicos dos 
experimentos realizados com reforçadores negativos e não do reforçador em si. 
A presente síntese das definições mostra que a área apresenta inconsistências: 1) entre 
as definições de reforçadores positivos e negativos apresentadas por um mesmo autor e 2) 
entre as definições apresentadas por cada autor. Foi possível observar como algumas escolhas 
específicas, tal como a própria variedade dos termos usados, pode acabar sendo prejudicial 
para o entendimento de um conceito por parte de um novo leitor. 
Levando em conta o objetivo de Santos e Leite (2013) de “avaliar como os conceitos 
de reforçamento positivo e reforçamento negativo são abordados em livros de ensino de 
análise do comportamento” (p. 9), parece ter havido limitações no procedimento usado pelos 
autores. Isso porque somente alguns trechos em que a distinção positivo/negativo fora 
claramente abordada (ou trechos muito próximos) foram considerados em sua análise (como 
42 
 
 
no caso de Whaley & Mallot, 1971/1981). Isso pode ser um problema, especialmente no que 
diz respeito a livros didáticos, porque informações úteis para uma análise dessa natureza 
podem ter sido apresentadas ao longo da construção didática do texto – e não somente num 
trecho específico sobre a distinção. Além disso, os autores parecem ter se limitado a citações a 
Michael (1975) para investigar se os autores teriam abordado problemas relacionados à 
distinção positivo/negativo ou não. Isso talvez tenha impedido que falas que não citavam 
Michael, mas destacavam problemas na distinção fossem incluídas, como por exemplo: 
Algumas vezes é difícil dizer qual é o controle, reforçamento positivo ou negativo ou 
ambos. Suponha que deixemos nosso rato de laboratório produzir alimento e apagar 
uma luz brilhante quando ele apertar o botão. Se quisermos então descobrir o que é 
responsável por sua atividade de apertar o botão, a produção de alimento ou a fuga da 
luz brilhante, simplesmente poderemos remover essas consequências, uma de cada 
vez, e ver se o animal continua a apertar o botão. As condições restritas de laboratório 
permitem uma resposta direta para nossa questão. Descobrir se reforçamento positivo 
ou negativo exerce controle fora do laboratório provavelmente não se mostrará tão 
simples assim, mesmo que decisões importantes possam depender da resposta 
(Sidman, 1989/2009, p. 57). 
Sidman (1989/2009) menciona como situações em que a distinção pode ser difícil de 
fazer poderiam ser resolvidas em laboratório, mas reconhece que isso talvez não seja simples 
de se aplicar fora dele. Considerando esse trecho, é possível até que Sidman pudesse ter sido 
incluído no grupo dos autores que abordaram a dificuldade na distinção, mas que também 
manteve a definição tradicional. 
Ao fim de seu artigo, Santos e Leite (2013) sugerem que novos estudos poderiam 
investigar a influência das críticas de Michael (1975) em artigos. Possmoser (2015) 
sistematizou os artigos (até 2014) que referenciavam Michael (1975) para avaliar sua 
43 
 
 
influência na área. A autora concluiu que, por mais de 30 anos, pesquisas que discutiram a 
distinção entre reforçamento positivo e negativo foram escassas, até que Baron e Galizio 
(2005) publicassem o artigo intitulado: “Reforçamento positivo e negativo: a distinção deve 
ser preservada?”. Isso teria feito aumentar subitamente o número de publicações 
referenciando Michael (1975) nos anos seguintes. 
Em seu artigo, publicado na revista The Behavior Analyst, Baron e Galizio (2005) se 
propuseram a rever as críticas e propostas de Michael (1975) considerando 30 anos de novas 
pesquisas. Talvez o impacto mais notável de sua publicação tenha sido as oito réplicas que 
recebeu nas sessões “In response” das duas edições seguintes da mesma revista em 2006 
(Chase, 2006; Michael, 2006; Iwata 2006; Marr, 2006; Lattal & Lattal, 2006; Sidman, 2006; 
Nakajima, 2006; Staats, 2006) – e suas subsequentes tréplicas (Baron e Galizio, 2006a, 
2006b). 
Possmoser (2015), na segunda parte de seu trabalho, fez uma síntese dos textos 
mencionados com foco em apresentar e resumir detalhadamente os principais pontos de cada 
artigo. Recomenda-se esta leitura para aqueles que se virem interessados em se apropriar mais 
do debate3 em português. 
 Embora a distinção entre reforçamento positivo e negativo seja amplamente utilizada, 
como os trabalhos apresentados até então e o próprio debate de 2005/2006 ilustram, sua 
utilidade conceitual e consistência descritiva têm sido questionadas há décadas. Há artigos tão 
recentes quanto 2024 que citam os problemas com a distinção (e.g., Fonseca-Júnior, 2024). 
Pesquisas teóricas que abordam conceitos básicos como o próprio reforçamento são 
importantes na medida em que contribuem para esclarecer os limites e implicações 
_________________ 
3 Nos casos em que for utilizado o termo “debate” sem nenhuma outra especificação, deve-se 
entender que o termo se refere ao debate de 2005/2006 publicado na revista The Behavior 
Analyst; 
44 
 
 
conceituais da distinção, favorecendo uma definição mais precisa e funcional dos conceitos 
envolvidos. O trabalho de Possmoser (2015) foi uma contribuição à discussão e compreensão 
do debate acerca da manutenção ou abandono da distinção entre os reforçamentos positivo e 
negativo. Ainda assim, a literatura carece de uma sistematização e análise dos argumentos 
apresentados neste debate, interrelacionando-os e discutindo suas implicações para o avanço 
dessa importante questão conceitual na análise do comportamento. 
Foi objetivo da presente pesquisa sistematizar, analisar e interrelacionar as falas 
(argumentos, sugestões e esclarecimentos) apresentadas por Baron & Galizio (2005) e todos 
os autores que participaram das edições especiais da revista The Behavior Analyst de 2006 
dedicada ao debate sobre a distinção entre reforçamento positivo e negativo. 
 
45 
 
 
Método 
Seleção dos Textos 
Através dos dados da pesquisa de Possmoser (2015), conjuntamente com os dados de 
Mendes e Ceneviva (não publicado), identificou-se que maior concentração de textos que 
citavam Michael (1975) e discutiam ativamente a manutenção ou abandono da distinção entre 
reforçamento positivo e negativo correspondeao debate de 2005/2006 na revista The 
Behavior Analyst. A publicação original de Baron e Galizio (2005) retomou a discussão 
abordada por Michael (1975) e gerou outras 10 publicações no ano seguinte na seção “In 
response” das edições de 2006 da revista. 
Esse conjunto de 11 textos foi selecionado para este trabalho, por constituir um grupo 
suficientemente amplo, mas, ao mesmo tempo, representar um recorte específico diante do 
qual pode ser feita uma análise interrelacional dos argumentos, suas réplicas e suas tréplicas. 
O texto de Michael (1975) não foi incluído na amostra de falas porque 1) esse texto 
não fez parte do debate e não poderia ser interrelacionado da mesma maneira com as 
respostas; 2) segundo o próprio autor (Michael, 2006), “Baron e Galizio (2005) apresentaram 
uma versão precisa e muito clara dos meus argumentos” (p. 117); 3) o autor já foi incluído no 
debate e pode fazer os acréscimos fundamentais se necessário; e 4) porque a amostra 
provavelmente ficaria repetitiva. 
Procedimento de Grifo dos Textos 
Cada texto selecionado foi separado por “falas” de acordo com a função geral de cada 
parte do texto. A determinação do início e final de cada “fala” foi guiado preferencialmente 
pela divisão das seções ou então pela paragrafação delimitada pelo próprio autor. Entretanto, 
quando uma mesma seção ou parágrafo continha trechos com funções nitidamente distintas, 
esses trechos eram grifados separadamente. 
46 
 
 
A cada tipo de função foi atribuída uma categoria específica com uma cor de grifo 
correspondente. As categorias foram criadas de forma a incluir qualquer tipo de fala 
encontrada, dessa forma, ao final do procedimento de grifo, todos os textos ficaram 
inteiramente grifados. Na Tabela 1 são apresentadas cada uma das categorias seguidas de suas 
respectivas definições: 
 
Tabela 1 
Categorias de análise utilizadas no grifo dos textos 
 
Categoria Definição 
 
Vantagem da Manutenção 
O autor apontou uma vantagem relacionada ao uso da 
distinção entre os reforçamentos positivo e negativo. 
Vantagem do Abandono 
O autor apontou uma vantagem relacionada ao abandono 
da distinção entre os reforçamentos positivo e negativo. 
Problema da Manutenção 
O autor apontou um problema relacionado ao uso da 
distinção entre os reforçamentos positivo e negativo. 
Sugestão para Manutenção 
O autor apontou para a resolução de uma lacuna ou 
problema relacionado a manutenção da distinção entre os 
reforçamentos positivo e negativo. 
Sugestão para Abandono 
O autor apontou para a resolução de uma lacuna ou 
problema relacionado ao abandono da distinção entre os 
reforçamentos positivo e negativo. 
Sugestão Neutra 
O autor apontou para a resolução de uma lacuna ou 
problema não especificamente relacionada com a 
manutenção ou abandono da distinção entre os 
reforçamentos positivo e negativo. 
Explicação para 
Manutenção 
O autor apontou uma possível explicação para a 
manutenção do uso da distinção entre os reforçamentos 
positivo e negativo. 
Explicação para Abandono 
O autor apontou uma possível explicação para a adoção 
do uso da distinção entre os reforçamentos positivo e 
negativo. 
47 
 
 
Complemento 
O autor trouxe novos dados que complementam um ponto 
atribuído a outro autor citado. 
Contra-argumento 
O autor respondeu uma fala específica de outro autor 
disputando o ponto por ele apresentado. 
Concordância 
O autor respondeu uma fala específica de outro autor 
concordando com o ponto por ele apresentado, mas sem 
trazer novos dados. 
Esclarecimento 
Baron e Galizio responderam a um aparente mal-
entendido (geral ou pontual) presente em seu texto 
original. Só se aplica aos textos de resposta de Baron e 
Galizio. 
Outro 
O autor disse algo que não tem função argumentativa, 
sugestiva ou explicativa com relação a manutenção ou 
abandono da distinção entre os reforçamentos positivo e 
negativo. Correspondem a qualquer outro tipo de fala que 
não seja contemplada pelas categorias anteriores. Essa 
categoria não será tabelada. 
Nota. As categorias Complemento, Contra-argumento, Concordância e Outro não estarão 
presentes enquanto categorias nos Resultados. 
 
Quando duas falas seguidas distintas faziam parte de uma mesma categoria, e, 
portanto, foram grifadas com uma a mesma cor, uma linha era inserida entre elas de forma a 
separá-las. 
Procedimento de Tabulação dos Dados 
A cada texto lido e grifado, cada fala e sua categoria (com exceção da categoria 
“Outro”) atribuída foram inseridos em uma planilha no programa Microsoft Excel (recorte 
ilustrativo no Apêndice). Para facilitar a visualização e compreensão de cada item da tabela, 
os trechos não foram incluídos integralmente, apenas uma descrição sintetizada de cada um. 
Na planilha do Excel, cada linha (ou conjunto de linhas mescladas) correspondeu a 
uma fala, ordenada, a princípio, por ordem de publicação. Cada coluna correspondeu a uma 
classificação ou dado correspondente àquela fala. A seguir, serão apresentadas cada uma das 
colunas de classificação de falas e suas respectivas funções: 
48 
 
 
A. Texto: indica a referência (último nome do autor e ano de publicação) ao qual cada 
conjunto de trechos pertence (e.g., “Michael (2006)”). 
B. Localização: página do texto em que se encontra a fala. 
C. Fala: descrição sintética de cada fala grifada no texto. 
D. Dado: descrição sintética das informações que basearam sua fala. 
E. Tipo de fala: classificação de cada fala dentro categorias delimitadas no 
“Procedimento de Grifo dos Textos” (ver Tabela 1). 
F. Ponto central: uma reformulação da síntese que leva em conta o conjunto de 
argumentos já coletados, para que, em casos de argumentos semelhantes (ou 
simetricamente opostos), sua descrição possa ser feita de forma mais “paralela”. 
Isso tem o objetivo de favorecer a comparação e interrelação entre argumentos de 
mesmo tema. Como exemplo, no caso de um autor que afirmou que a distinção 
positivo/negativo “aumenta a probabilidade de um aluno compreender o conceito”, 
um segundo autor que afirmou que “abandonar a distinção facilita a 
compreensão”, e um terceiro afirmou que a distinção “atrapalha no aprendizado de 
novos alunos”; os argumentos seriam sintetizados, respectivamente, como: 
“Facilita a aprendizagem” (categoria Vantagem da Distinção), o segundo como 
“Facilita a aprendizagem” (categoria Vantagem do Abandono) e o terceiro como 
“Dificulta a aprendizagem” (categoria Problema da Distinção). 
G. Ponto específico: título descritivo que diferencia cada fala específica em relação ao 
ponto central ao qual ela foi agrupada. Dentro do central “Faltam Investigações” 
um ponto específico seria “Sobre o Conceito de Reforçamento” 
H. Resposta a: autores e números das linhas referentes às falas que estão sendo 
respondidas pela presente fala. 
49 
 
 
I. Respondido por: autores e números das específica referentes às falas que 
responderam a presente fala. 
J. Observações: anotações pessoais a respeito de cada uma das falas, feitas tanto para 
facilitar o preenchimento da tabela quanto para auxiliar na construção dos 
resultados e desenvolvimento da discussão. 
 
50 
 
 
Resultados e Discussão 
Nesta seção serão apresentados os dados de cada uma das categorias de “Tipo de Fala” 
que foram grifadas e passadas para a tabela de Análise das Falas. Dentro de cada categoria, as 
falas foram agrupadas com respeito aos seus “Pontos Centrais”. Além disso, falas 
categorizadas como “Concordância”, “Complemento” e “Contra-argumento” foram 
apresentadas após cada fala a qual estavam relacionadas. 
Discussões muito pontuais, sobre falas específicas que fariam pouco sentido de serem 
retomadas na discussão geral, foram feitas logo após a fala a que se dirigem. Quando uma 
discussão estava relacionada a muitas falas, ela foi feita após a apresentação dos resultados 
dentro dos subtópicos delimitados para sua discussão. 
Muitas das falasanalisadas consistem apenas de afirmações (genéricas ou específicas) 
sem um desenvolvimento aprofundado ou informações nas quais o autor se baseou para fazer 
sua fala. Em alguns dos casos pode ser que as bases para tal afirmação foram discutidas em 
outro tópico que já foi ou vai ser apresentado e que está em outra categoria. Um exemplo é “a 
distinção pode ser útil”. Em casos como esse, não houve grande desenvolvimento do 
subtópico a não ser a indicação do autor que fez a fala e um resumo, quando aplicável, dos 
pontos contidos em outros argumentos que eram relevantes para essa afirmação. 
As categorias que envolvem “Vantagens” e “Explicações” são semelhantes, mas 
diferem quanto à forma em que o autor apresentou sua fala. A primeira categoria inclui 
afirmações mais categóricas das vantagens (e.g., “a distinção é útil para tal”), enquanto a 
segunda é estruturada de forma a explicar o porquê de o uso da distinção4 se manter (e.g., “a 
_________________ 
4 Em casos em que for utilizado o termo “distinção” sem nenhuma outra especificação, deve-se 
entender que o termo se refere à distinção entre os reforçamentos positivo e negativo; 
51 
 
 
distinção foi mantida por conta de...”) – frequentemente com esse objetivo declarado. Muitas 
das subcategorias de uma classificação foram compartilhadas pela outra. 
A Figura 1, a seguir, apresenta a organização hierárquica e interrelação ente os 
subtópicos apresentados em Resultados e Discussão. Como é possível observar, serão 
apresentados e discutidos inicialmente os problemas, vantagens, explicações e sugestões 
relacionados à manutenção da distinção entre reforçamento positivo e negativo, seguindo para 
as vantagens, explicações e sugestões relacionadas ao abandono desta distinção e finalmente 
as sugestões neutras em relação às duas posições e alguns esclarecimentos sobre pontos 
identificados no debate. Segue-se então uma discussão geral dos resultados e considerações 
finais sobre o presente trabalho. 
Figura 1 
Organização hierárquica e interrelação entre os subtópicos da seção “Resultados e 
Discussão” 
 
 
 
52 
 
 
Problemas da Manutenção 
Falas em que os autores apontaram falhas ou desvantagens relacionadas ao uso da 
distinção entre os reforçamentos positivo e negativo. Dentre os trechos classificados como 
“Problemas da Manutenção”, identificou-se falas que apontavam para a distinção como sendo 
confusa, ambígua, pouco fundamentada, limitada ou problemática. 
A Distinção É Confusa 
Confusa em seu Uso Histórico. O primeiro ponto apresentado no resgate feito por 
Baron e Galizio (2005), já visto em Michael (1975) na Introdução, ilustra como a distinção 
pode gerar confusão por conta de seus diferentes usos ao longo do tempo. Historicamente, o 
termo “reforçamento negativo” foi inicialmente usado por Skinner (1938) da mesma forma 
que hoje se usa o termo punição, e só posteriormente usado no seu sentido atual. Ainda assim, 
Michael reconhece que esse problema particular foi resolvido pela terminologia moderna, já 
atualizada em Skinner, que distingue tanto os reforçamentos quanto as punições entre 
positivos e negativos. 
Confusa para Novos Leitores. Sidman (2006), diferentemente de Michael (1975), 
afirma que ainda há confusão entre os termos “reforçamento negativo” e “punição” e cita que 
em sua experiência isso é especialmente comum entre pessoas que estão sendo introduzidas à 
análise do comportamento. Ele acredita que o problema é gerado pela igualação do termo 
“reforçamento positivo” ao termo cotidiano “recompensa” e à noção de que “negativo deve 
ser oposto a positivo” e, portanto, reforçamento negativo é igualado à “punição”. 
Confusa Sobre Suas Regras de Uso. Baron e Galizio (2006a) argumentam que outro 
aspecto responsável pela confusão diz respeito a forma como se descrevem determinadas 
alterações ambientais reforçadoras. Há situações em que existe um consenso na forma de 
descrever alguns eventos, por exemplo, quando se diz que a pressão à barra foi reforçada pela 
pelota de alimento ou que tomar uma aspirina foi reforçado pela eliminação da dor de cabeça 
53 
 
 
(exemplos dos autores). O problema, para o autor, é que no primeiro caso, a descrição feita 
diz respeito à operação (adição do alimento), enquanto a segunda diz respeito ao efeito que a 
operação (adição da aspirina) tem no organismo – a eliminação da dor de cabeça. Para os 
autores isso indica que mais de um critério acaba sendo usado para descrever alterações 
ambientais reforçadoras e que também não há clareza em quando se usar cada critério. 
Uma discussão que se pode fazer sobre a este último ponto, colocado por Baron e 
Galizio (2006a), é que ele talvez tivesse ficado mais evidente se tivessem usado 
comportamentos mais paralelos como exemplos. Uma possibilidade é comparar “tomar uma 
aspirina” com “comer um alimento” – ao invés de pressionar uma barra. Nesse caso, respostas 
semelhantes em topografia estariam ambas produzindo a consequência “estímulo 
[aspirina/alimento] no organismo”. Seria possível, nesse caso, argumentar que os dois 
comportamentos envolvem o mesmo tipo de operação (i.e., adição). Afirmar que são mantidos 
pela adição desses estímulos, entretanto, implicaria dizer que uma aspirina é consumida pela 
sua própria adição e não pelo seu efeito sobre a dor de cabeça, algo que pode soar estranho no 
caso da aspirina, mas que é exatamente o que se diz sobre o alimento com relação à fome (i.e., 
o alimento é consumido por sua própria adição e não pelo seu efeito sobre a fome). 
É comum se dizer que “tomar a aspirina foi reforçado pela eliminação da dor de 
cabeça”, mas dificilmente se ouviria de um analista do comportamento que “o consumo do 
alimento é reforçado pela eliminação da fome”. A questão é que em ambos o caso parece ser 
o mesmo: uma resposta está sendo reforçada por um suposto estímulo privado do organismo. 
De outra forma, também se poderia afirmar que a resposta foi reforçada pela eliminação da 
operação motivadora, mas, novamente, isso parece aceitável somente para reforçamento 
negativo, mas não para o positivo – mesmo que a subtração (parcial ou completa) da operação 
motivadora seja intrínseca aos dois. 
54 
 
 
De toda forma, o ponto de Baron e Galizio (2006a) é, justamente, que o critério para 
se classificar as alterações ambientais, ou seja, para se fazer uma distinção entre os 
reforçamentos positivo e negativo é confuso. 
A Distinção É Ambígua 
O segundo e mais discutido ponto (21 respostas totais) trazido por Baron e Galizio 
(2005), também visto em Michael (1975), deriva do fato de que função reforçadora de um 
evento advém sempre da mudança de uma condição de estímulo para outra (algo já indicado 
na Introdução por Skinner, 1953 e Michael, 1975). Dentro desse parâmetro, qualquer 
descrição de uma alteração ambiental num sentido também pode ser descrita em sua forma 
oposta. Para demonstrar isso, os autores apresentam um exemplo em que ratos em um caixa 
experimental fria pressionavam uma barra que fazia aumentar a temperatura da caixa (Weiss 
& Laties, 1961). Para Baron e Galizio, tanto a descrição de que a pressão à barra era mantida 
pela “adição do calor” quanto a descrição de que a pressão à barra de que era mantida pela 
“subtração do frio” são possíveis e descrevem a mesma mudança. Nesse sentido, é possível 
classificar o processo tanto como reforçamento positivo quanto como reforçamento negativo. 
Além desse exemplo experimental, Baron e Galizio (2005) trazem os exemplos de que 
a “entrega de dinheiro” implica no “término de um período de falta de dinheiro” e a “fuga de 
um estímulo aversivo condicionado” sempre produz a “adição de uma situação na qual o 
estímulo aversivo está ausente”. Mais adiante, afirmam que o dilema fica particularmente 
aparente em exemplos cotidianos em textos didáticos. Em um, uma criança liga a televisão 
para assistir um desenho. Nesse caso, ela liga a TV pela adição dodesenho ou pela subtração 
do tédio? Em outro, uma pessoa com dor de cabeça toma uma aspirina. Ela o faz pela adição 
da aspirina ou pela subtração da dor de cabeça? Em alguns casos os próprios autores de 
alguns desses livros didáticos reconheciam que ambas as interpretações eram válidas e 
destacam como isso acaba por anular o propósito dos rótulos positivo/negativo. 
55 
 
 
Em outras palavras, a distinção seria ambígua porque qualquer mudança ambiental 
poderia ser descrita como positiva ou negativa. Nesse sentido, ela seria “mais uma questão de 
procedimento do que qualquer outra coisa, e a direção da mudança [adição/subtração] não 
parece oferecer uma contribuição fundamental” (Baron e Galizio, 2006a, p. 148). 
Há outros dois exemplos apresentados por Baron e Galizio (2005) que serão 
retomados mais adiante como contra-argumento de uma “Explicação para a Manutenção”, 
mas que aparece em algumas respostas ao presente argumento. O primeiro diz respeito a 
oposição entre “aumento da atenção” e “alívio da solidão”, e o segundo entre “fuga de uma 
tarefa aversiva” e “acesso a uma atividade alternativa”. 
Alguns autores demonstraram concordar em alguma medida com esse argumento de 
Michael (1975) e Baron e Galizio (2005). Chase (2006) concorda completamente que não se 
pode atribuir processos diferentes para o reforçamento positivo ou negativo, nem controle por 
um e não pelo outro. Iwata (2006) concordou que, pelo menos do ponto de vista descritivo, 
não há diferença entre descrever a mudança de uma forma ou de outra. Ainda assim, sugere a 
mudança do termo “alívio da solidão” por “término de um período no qual atenção estava 
indisponível”. Sidman (2006) alertou que para aqueles que defendem que a distinção reflete 
diferenças no processo de reforçamento em si, a discussão de Baron e Galizio (2005) deve 
resolver essa questão. Além disso, afirmou que há situações em que, de fato, não podem ser 
classificadas apenas como reforçamento positivo ou negativo. Nos casos como o do 
experimento de Weiss e Laties (1961), Sidman concorda que tanto a condição de estímulo 
antecedente quanto consequente (i.e., magnitude do estímulo antes e depois da resposta) 
precisam ser levadas em conta para que se possa especificar o reforçador. Por fim, Nakajima 
(2006) concorda que existe uma “ambiguidade essencial” na distinção entre os reforçamentos 
positivo e negativo. 
56 
 
 
Dentre os contra-argumentos apresentados à Baron e Galizio (2005), Chase (2006) 
aponta que o experimento de Weiss e Laties (2006) é um exemplo fraco do problema porque 
parece muito mais uma questão de semântica, já que “calor” e “frio” são opostos e não há 
diferença em descrever uma coisa ou outra. No caso de uma criança que emite baixa taxa de 
mandos e alta taxa de comportamentos auto lesivos, um cuidador poderia aumentar a atenção 
contingente a mandos e ver tanto um aumento na frequência de mandos quanto uma 
diminuição nos comportamentos auto lesivos; ou restringir diretamente os comportamentos 
auto lesivos, o que poderia fazer aumentar o número de mandos como forma de fuga. Diante 
disso, Chase afirma que: 
O fato de que os componentes de reforçamento positivo e negativo de ambas as 
manipulações podem ser descritos não anula o valor heurístico de perceber que tanto a 
atenção quanto a contenção podem ser manipuladas para aumentar mandos 
socialmente apropriados (Chase, 2006, p. 114). 
Nesse sentido, o valor da distinção, para Chase (2006), se dá em poder isolar 
diferentes mudanças ambientais e não em distinguir uma mesma mudança em suas duas 
versões opostas. Diferentemente do exemplo de Weiss e Laties (1961) em que uma mesma 
mudança pode ser descrita de duas formas (aumento do calor e diminuição do frio), Chase 
afirma que as intervenções “aumento da atenção” e “restrição física” poderiam ser, cada uma, 
descritas em suas versões opostas (i.e., “diminuição de períodos sem atenção” e “aumento de 
períodos sem restrição física”). 
Iwata (2006) argumenta que, apesar de haver casos em que a distinção é incerta (e.g., 
mudanças na temperatura ou na intensidade de um choque), muitas mudanças de estímulo 
envolvem condições pré e pós-mudança diante das quais costuma ser possível determinar qual 
o estímulo relevante e se ele está sendo adicionado ou subtraído. Por exemplo: 
57 
 
 
Dizer que o alimento é apresentado refere-se às ações do experimentador; no entanto, 
dizer que a privação é reduzida refere-se à reversão de uma condição que também 
deve ser atribuída às ações do experimentador (retenção de alimento). De modo 
semelhante, terminar a aplicação de choque não parece envolver a apresentação de 
segurança em si, mas sim a reversão de uma condição na qual um estímulo específico 
(choque) estava sendo apresentado. Por fim, a entrega de dinheiro pode ou não 
encerrar um período sem dinheiro, mas sempre resulta no aumento da disponibilidade 
de dinheiro (Iwata, 2006, p. 122). 
Iwata (2006) destaca que, mesmo que o direcionamento de Michael (1975) fosse 
seguido e termos como “entrega” (“delivery’) fossem abandonados em favor descrição da 
mudança em si, o contraste relevante na transição de uma “condição sem alimento” para uma 
“condição com alimento” é que o alimento foi adicionado como condição subsequente. 
A partir disso, vale comentar algumas inconsistências presentes na fala de Iwata 
(2006). Primeiramente, ele dá a entender que a operação (adição/subtração) costuma ser 
facilmente identificada pela ação do experimentador, mas não deixa explícito como identificá-
la em situações em que não há um agente mediando o reforçamento. Além disso, no trecho 
citado, ele justifica que a terminação do choque consiste em um reforçamento negativo pois 
trata-se da retirada do choque que fora estabelecido pelo próprio experimentador. De forma 
similar, na sua frase anterior sobre o alimento, ele destaca que a privação de alimento também 
foi uma condição estabelecida pelo experimentador. Se o alimento termina uma condição de 
retenção de alimento estabelecida pelo experimentador, isso deveria constituir, segundo seu 
próprio raciocínio, um reforçamento negativo. Mesmo assim, ao final ele destaca que a 
mudança relevante nesses casos é a adição do alimento. 
Um segundo contraponto ainda foi apresentado por Iwata (2006) para o argumento de 
que nenhuma mudança é exclusivamente positiva ou negativa. Apesar de que mudanças de 
58 
 
 
estímulo que acontecem num continuum (i.e., dentro de variações paramétricas da magnitude 
do estímulo) sejam mais difíceis de classificar, ainda assim é possível identificar o aumento 
ou diminuição de determinada característica do estímulo, permitindo uma classificação da 
operação. 
Marr (2006) critica o recurso de Baron e Galizio (2005) a condições acompanhantes e 
operações motivadora como forma de explicar o comportamento, afirmando que essas seriam 
variáveis hipotéticas. Ele destaca que noções como a de que o “reforçadores agem pelo prazer 
ou pelo alívio” e termos como “necessidade” (“need”), “impulso” (“drive”) foram 
abandonadas há tempos por serem forçados ou implausíveis. 
Sobre a questão de se a criança liga a TV por adicionar o desenho ou subtrair o tédio, 
Marr (2006) afirma que a “busca pelo prazer” não implica uma condição prévia de dor e nem 
a esquiva da dor implica a busca pelo prazer. Ele ilustra seu ponto com o exemplo de que ele 
gosta de ouvir música clássica, mas que a ausência desse estímulo não implica em uma 
privação ativa de músicas do século XIX. De forma similar, ele não sente prazer ativo quando 
não tem uma dor de cabeça, apenas não a sente. Tomar um remédio elimina a dor de cabeça e 
o faz voltar para um estado de “relativa neutralidade”. A parte relevante, para o autor, 
continua sendo que a dor de cabeça foi eliminada, e “o que acontece depois parece 
irrelevante” (Marr, 2006, p. 127). 
Baron e Galizio (2006a) concordaram com Marr (2006) que é preferível (alémde 
costumeiro) recorrer às operações como explicação do comportamento do que noções 
“implausíveis” (Marr, 2006, p. 127). Entretanto, a despeito da visão que se tenha sobre esses 
conceitos, o ponto feito por eles se mantém válido mesmo quando consideradas apenas 
operações específicas observáveis. A própria adição da música clássica (citada por Marr), 
necessariamente, implica o encerramento de um período na qual a música estava ausente. Em 
59 
 
 
outras palavras, poder-se-ia tanto descrever que “a música foi adicionada” quanto que “o 
período em que ela estava ausente foi subtraído” e isso é necessariamente reforçador. 
Baron e Galizio (2006a) também destacam que parte do problema com a distinção é, 
justamente, que o foco nas operações é de alguma forma perdido. Apesar de sugerir que o 
foco seja nas operações, Marr (2006) quando descreve que ao se tomar uma aspirina a 
eliminação da dor de cabeça é o evento reforçador, acaba recorrendo ao efeito da operação; já 
que a operação específica e observável, nesse caso, seria a adição da aspirina. A dor de cabeça 
e sua eliminação são eventos hipotéticos e/ou não diretamente observáveis e seriam o efeito 
da adição da aspirina. Dizer que a eliminação da dor de cabeça é o efeito reforçador seria o 
mesmo que dizer que a redução da fome, e não a adição do alimento, é o evento reforçador. 
Sidman (2006), por sua vez, apresenta uma série de críticas e contrapontos ao 
argumento de Baron e Galizio (2005). O primeiro deles é que apesar de os autores 
contestarem a noção de que o reforçamento envolve mudanças em estados 
fisiológicos/emocionais, eles ainda apelam para esses estados em seu principal argumento. 
Mais especificamente, Sidman menciona a fala de que a apresentação de comida envolve uma 
redução de um estado de privação e que o aumento de atenção é equivalente ao alívio da 
solidão. 
Sobre isso, Baron e Galizio (2006a) responderam que os exemplos que eles 
apresentaram que envolviam estados internos foram retirados de outras fontes para ilustrar 
como tais situações costumam ser tratados, mas que o mesmo poderia ser feito sem qualquer 
referência a esses processos. Ao invés de alívio da solidão pode-se dizer “término de uma 
condição na qual a atenção estava ausente” (p.149) - alteração muito semelhante a sugestão de 
Iwata. Ainda assim, destacam que o termo “sozinho” (“lonely”), no dicionário, não se refere a 
um estado interno, mas sim ao ambiente (i.e., sem companhia). Seguindo a mesma lógica, 
substituem “redução de um estado de fome” por “término de um período sem comida”. 
60 
 
 
Um segundo contraponto de Sidman (2006) é que, apesar de haver casos em que a 
distinção não possa ser feita (e.g., experimento de Weiss e Laties, 2006), isso não torna a 
distinção inutilizável e pode haver valor em fazer uso dela sempre que for possível. Esse, 
segundo Sidman, é o caso de muitos outros conceitos em que, quando levados a extremos, 
também se tornam confusos. 
Além disso, o autor destaca que mesmo nos casos em que a distinção é confusa, 
frequentemente há maneiras de se resolver o problema. Por exemplo: a resposta que elimina o 
choque elétrico também produz um período em que o choque está ausente, mas Sidman 
(2006) questiona se o rato trabalharia para produzir esse ambiente sem choques quando ele 
não está em uma situação na qual eles estão presentes. Em outras palavras, “a interrupção do 
choque vai ser reforçadora mesmo que o ambiente produzido pela resposta de fuga continue 
mudando” (p. 137). Isso parece ilustrar justamente o argumento anterior de Marr (2006) de 
que condições pós-mudança seriam irrelevantes no reforçamento negativo. 
Outro exemplo dado por Sidman é o de uma criança que se comporta para produzir 
uma sala de time-out quando está sendo requisitada a realizar uma determinada atividade. 
Nesse caso é fácil identificar se a resposta é mantida pela fuga da demanda ou pela própria 
sala de time-out. 
A simples produção de uma aspirina bastaria para reforçar a abertura do frasco, se o 
comprimido não eliminasse a dor de cabeça? Acho que sabemos o que aconteceria 
com o consumo de aspirina se enchêssemos os frascos de aspirina com comprimidos 
de placebo rotulados falsamente (Sidman, 2006, p. 137). 
Sobre esse último exemplo, ficaria a pergunta: como se explicaria o fato de que uma 
pessoa ainda se manteria tomando os placebos por um tempo antes de parar, sem classificar as 
pílulas como reforçadores positivos condicionados? 
61 
 
 
Ainda na mesma linha, Sidman (2006) traz um outro questionamento: “uma criança 
poderia ligar a televisão mesmo que isso a afastasse de um jogo favorito ou de uma sobremesa 
muito desejada? Esse evento é certamente possível, e, quando ocorre, seria difícil identificar o 
reforço como uma fuga do tédio” (Sidman, 2006, p. 137). Nesse exemplo Sidman parece 
apontar para a noção de que ao se considerar qualquer instância de reforçamento, deve-se 
considerar tanto a condição anterior quanto a nova. Ele diferencia uma situação em que uma 
criança, diante de uma condição de tédio, produz o desenho e uma situação em que diante de 
um jogo que gosta produz o desenho. No primeiro caso, a descrição poderia ser “eliminação 
do tédio” enquanto, no segundo caso, a eliminação do videogame dificilmente estaria 
controlando a resposta. 
 Novamente, parece ser o caso de que o uso, por Baron e Galizio (2005), de um termo 
vago como “tédio” abriu margem para questionamentos que não necessariamente tem relação 
com o ponto que esses autores pareceram querer fazer. A condição oposta a “programa de 
TV” não é o tédio, mas sim a “ausência de um programa de TV”. O tédio poderia ser 
interpretado como uma operação estabelecedora do tipo “privação de atividade”. 
Seguindo o mesmo modelo da resposta anterior dos autores, o que poderia ter sido dito 
seria que “a eliminação da ausência do programa de TV” foi reforçadora. Isso, simplesmente, 
isso é o mesmo que dizer que o programa de TV foi adicionado. Essa outra forma de 
descrição é certamente estranha e inconveniente, mas ainda assim poderia ser feita. As bases 
para essa afirmação serão mais bem elaboradas nos tópicos “A Distinção É Semântica” e “A 
Ausência como Estímulo”. De qualquer forma, Sidman (2006) está correto em pontuar um 
uso impreciso do termo “tédio”, mas o deslize de Baron e Galizio (2005) não necessariamente 
anula ambiguidade da distinção positivo/negativo. Em todos os casos, uma condição está 
sendo subtraída e outra adicionada. É possível que o autor tenha ignorado que duas mudanças 
62 
 
 
ambientais estavam ocorrendo ao mesmo tempo (i.e., eliminação do tédio e adição do 
desenho) e que cada uma podia ser descrita das duas formas - como mostrou Chase (2006). 
Sidman (2006) apresenta, então, um último exemplo na mesma linha argumentativa e, 
em seguida, sua conclusão: 
Cônjuges geralmente buscam o divórcio independentemente de suas experiências 
conjugais? Certamente não precisamos de dados experimentais para classificar muitos 
- senão a maioria - dos divórcios como comportamentos de fuga. A possibilidade e a 
utilidade de identificar reforçadores positivos e negativos não me parecem tão 
desanimadoras quanto aparentemente parecem para Baron e Galizio (Sidman, 2006, p. 
137). 
Sidman (1989/2009) menciona o exemplo do divórcio ao falar sobre a utilidade de 
identificar reforçadores positivos e negativos. Entretanto, essa utilidade não fica nitidamente 
indicada em sua fala. Divórcios costumam ser situações complexas que envolvem cadeias 
comportamentais extensas e incontáveis variáveis relevantes que tornam uma afirmação tão 
abrangente quanto a de que “a maioria dos divórcios ocorrem por reforçamento negativo” 
pouco relevante. Uma pergunta que deveria ser feita é: qual resposta específica nessa cadeia 
comportamental extensa se está analisando? As respostas que produziram a certidão de 
divórcio, uma pensão alimentícia, a atenção de amigose familiares, convites para novos 
eventos, elogios, um novo amor etc., a princípio, deveriam ser classificadas como 
reforçamento positivo. Outro ponto é que muitos dos comportamentos emitidos nessa situação 
jamais foram emitidos ou serão emitidos novamente e foram evocados provavelmente muito 
por conta de condicionamentos verbais. Sem uma análise da frequência de respostas do que 
está sendo chamado de “divórcio”, a afirmação acaba tendo pouco valor. 
Baron e Galizio (2006a) concordam com Sidman que a distinção ainda pode ser feita 
de maneira relativamente direta em muitos casos e acrescentam o fato de que falar das 
63 
 
 
mudanças em suas versões opostas pode parecer “forçado” (e.g., falar “introdução de um 
período em que choques estão ausentes” ao invés de “remoção de um choque”). Além disso, 
concordam com Sidman e Iwata (2006) que a análise empírica dos eventos reforçadores é 
valiosa. O problema é que, como já foi comentado, em muitos outros exemplos (inclusive 
alguns apresentados por Sidman como o do divórcio) a distinção é muito menos nítida. Ainda 
assim, o que Baron e Galizio questionam é que, mesmo que a distinção possa ser feita, no que 
ela acrescenta em uma análise comportamental? Sugerem que, nesse sentido, pode haver mais 
a ser ganho ao se focar no contexto total da mudança de estímulo (como sugerido por 
Michael, 1975). 
Em resposta ao exemplo do dinheiro apresentado por Baron e Galizio (2006), Sidman 
(2006) afirma que apesar de o “término de um período sem dinheiro” ser fundamental para 
estabelecer o dinheiro como reforçador em alguns casos, bilionários (mesmo sem estarem 
“privados” de dinheiro) continuam “trabalhando vigorosamente para conseguir mais”. A partir 
desse exemplo, Sidman (2006) conclui que “a efetividade de alguns reforçadores positivos 
depende menos da sua ausência anterior do que do comportamento que eles tornam possível 
no futuro” (p. 137). Esse ponto será retomado na discussão sobre “Implicações Sobre o 
Conceito de Operação Motivadora”. 
Novamente, parece que um mau uso de termos gerou um conflito desnecessário. Se 
Baron e Galizio (2005), ao invés do termo “término de um período sem dinheiro”, tivessem 
sido mais abrangentes e dito “término de um período de menos dinheiro” ou, ainda melhor, 
tivessem descrito especificamente a quantidade de dinheiro pré e pós-mudança (seguindo a 
recomendação de Michael, 1975) o contra-argumento de Sidman teria pouca base. 
Reformulando o ponto dos autores: “um período de menor dinheiro” é sempre, 
inevitavelmente, interrompido pela adição do dinheiro. 
64 
 
 
Nakajima (2006) também apresentou alguns argumentos contrários aos de Baron e 
Galizio (2006). Primeiro, sobre a ambiguidade calor/frio ilustrada pelo experimento de Weiss 
e Laties (1961), Nakajima afirma ter uma preferência pela descrição de que “calor foi 
adicionado” porque, segundo ele, “calor é uma entidade física no ambiente do rato, mas 
‘frieza’ é um estado hipotético do rato e um conceito secundário que significa ‘ausência de 
calor’” (p. 269). Isso poderia dar a entender que, para Nakajima, o frio não seria um estímulo. 
Na física, é consenso que o calor (bem como a luz) sejam fenômenos materiais e que a 
frieza e o escuro não. Entretanto, comportamentalmente, essa distinção talvez tenha pouca 
relevância. Enquanto um evento ambiental que afeta o comportamento, o calor é capaz de 
eliciar e evocar respostas (e.g., sudorese ou abanar-se). Da mesma forma, o frio também tem a 
capacidade de tanto eliciar e evocar comportamentos (e.g., tremores e arrepios ou aproximar-
se de uma lareira) e, nesse sentido, ele também deve ser considerado um estímulo. 
Não seria inviável abandonar a palavra “frio” e passar apenas a falar apenas de 
“calor”, “ausência de calor” e “privação de calor”. Ainda assim, nesse caso, a “ausência de 
calor” teria que passar a ser tratada como um estímulo que elicia e evoca as respostas 
mencionadas. Do contrário, ter-se-ia que assumir que o calor estaria de alguma forma 
prevenindo essas respostas de acontecerem (o que seria inconveniente e supostivo). 
Outro ponto é que, a “frieza”, como apontado por Nakajima (2006) não simplesmente 
um “estado hipotético” do rato, afinal, a temperatura dele pode ser facilmente medida. De 
todo modo, a “frieza do rato” sequer era a variável relevante para o experimento de Weiss e 
Laties (1961), mas sim a “frieza” da caixa experimental (um estímulo público e mensurável). 
De forma muito similar a Sidman (2006), Nakajima (2006) acusou Baron e Galizio 
(2005) de reconhecerem o ponto de que se deve focar nas mudanças ambientais, mas que eles 
negligenciam esse ponto. Mais especificamente, eles negligenciam os “critérios de julgamento 
que distinguem a especulação e a identificação” (p. 269). Para o autor, quando um rato 
65 
 
 
pressiona uma barra para obter uma pelota de comida, a pelota de comida é quantificável e 
manipulável, mas a fome seria uma construção hipotética. Similarmente, o dinheiro seria um 
material concreto, mas a pobreza um conceito derivado. O desenho animado é observável, 
mas o tédio não é observável e, mesmo que exista, pode ser interrompido por outros 
programas de TV. Por fim, um choque é manipulável, mas os estímulos ligados a segurança 
são mais difíceis de identificar com precisão. 
Baron e Galizio (2006b) respondem Nakajima (2006) concordando que o desejável (e 
usual) é focar em consequências diretamente observáveis, mas reafirmam que seu ponto é que 
isso não é justificativa para se criar uma classificação com base no critério de início ou 
término de estímulos. A ambiguidade, segundo eles, se aplica a qualquer mudança ambiental 
(independentemente de ser observável ou não) porque a adição de um estímulo sempre exige 
sua ausência prévia e a remoção de um estímulo sempre exige sua presença posterior. Eles 
destacam também Nakajima pareceu ter ignorado o exemplo da aspirina apresentado por eles. 
Segundo a lógica de Nakajima, essa situação deveria ser classificada necessariamente como 
reforçamento positivo, porque a operação observável e mensurável seria a adição da aspirina, 
enquanto a eliminação da dor de cabeça seria uma “consequência especulativa”. 
Complementando esse ponto de Baron e Galizio (2006a), se, mais uma vez, forem 
trocados os termos vagos como “fome”, “tédio” e “período de segurança” usados por eles por 
“ausência do alimento”, “ausência do desenho” e “ausência de choque” seria difícil 
argumentar que a ausência do estímulo não pudesse ser observada ou medida. Até mesmo o 
período pelo qual os estímulos estiveram ausentes pode ser medido em segundos, horas ou 
dias. 
Além desse ponto, Baron e Galizio (2006b) complementam que o critério de se basear 
na facilidade de um pesquisador observar ou descrever um fenômeno é limitado no sentido de 
que é determinado excessivamente pelos recursos que um pesquisador específico detém 
66 
 
 
naquele momento específico. Para Baron e Galizio, o avanço tecnológico da ciência vai contra 
essa ideia no sentido de que novas formas de se medir e observar fenômenos passam a se 
tornar possíveis. 
Para Baron e Galizio, as “consequências especulativas” descartadas por Nakajima 
(2006) podem também representar a solução para o problema da distinção. Os valor de 
reforçadores condicionados, por exemplo não dependem somente dos eventos imediatamente 
contingentes a eles. Sabe-se que os reforçadores de base (ou condicionantes) são pelo menos 
um dos responsáveis por determinar se estímulos condicionados serão reforçadores positivos 
ou negativos. Além disso, há motivos para acreditar que os estímulos que sinalizam períodos 
sem choque, por exemplo, é que reforçam o comportamento (Dinsmoor, 2001). 
Staats (2006) afirma que apesar de o efeito dos dois reforçamentos sobre o 
comportamento serem os mesmos, Baron e Galizio (2005) ignoraram o condicionamento 
respondente e emocional envolvido e o efeito sobre outroscomportamentos além do 
reforçado. Segundo o autor, quando todo o reportório (operante, respondente e emocional) é 
levado em consideração, os reforçadores positivos e negativos apresentam grandes diferenças. 
O autor exemplifica que, enquanto reforçadores negativos “fazem” o animal ser condicionado 
a uma resposta emocional negativa em relação a uma caixa experimental, os reforçadores 
positivos “fazem” o animal ser condicionado a uma resposta emocional positiva em relação à 
caixa. 
O autor ilustra que se os ratos fossem colocados em uma caixa inicial com a 
possibilidade de se locomover para a caixa em que foram treinados, um rato que foi treinado 
por reforçamento negativo ficariam na caixa inicial, enquanto um rato foi treinado sob 
reforçamento negativo andaria até a caixa experimental. Da mesma forma, crianças reforçadas 
por se portar bem e crianças punidas por não se portar bem poderiam ambas aprender a se 
portar, mas também aprenderiam respostas emocionais diferentes que afetariam seu 
67 
 
 
comportamento em relação à escola. Staats (2006) cita alguns de seus trabalhos que ilustram 
tais efeitos (ver Harms & Staats, 1978; Staats, 1975, 1996; Staats & Hammond, 1972; Staats 
& Warren, 1974). 
Sobre isso, Baron e Galizio (2006b) respondem Staats (2006) dizendo que, não há 
consenso sobre o que seria a emoção ou como medi-la, e citam Rosenberg e Ekman (2000) e 
um próprio trabalho de Staats e Eifert (1990) para embasar essa afirmação. Baron e Galizio 
criticam a pressuposição de Staats de que seja possível separar claramente os “estados 
emocionais” em uma classe positiva e outra negativa para, a partir disso, classificar também 
os comportamentos operantes. Segundo eles, mesmo através de referências a estados 
emocionais, o problema lógico apontando por Michael (1975) ainda não é resolvido. Seria 
perfeitamente possível descrever o “estado emocional” de um rato privado de alimento como 
negativo. Nesse caso, o comportamento é controlado pelo término do estado emocional 
negativo, pelo início do estado emocional positivo ou por ambos? 
Baron e Galizio (2006b) citam dois experimentos que ilustram como a reação entre as 
dicotomias aproximação/evitação e positivo/negativo é confusa. Perone (2003) demonstrou 
que um pombo pode emitir uma segunda resposta para suspender um esquema de 
reforçamento positivo em razão fixa. Ao mesmo tempo, num esquema de reforçamento 
negativo, Perone e Galizio (1987) demonstraram que ratos também podem passar a emitir 
uma outra resposta que produza o estímulo que acompanhava o período no qual o choque 
estava suspenso. 
Sobre o exemplo experimental hipotético de Staats (2006), Baron e Galizio (2006b) 
argumentam que o que foi explicado pelo autor em termos de respostas e condicionamentos 
emocionais poderia ser facilmente explicado por condicionamento operante. Ao mesmo 
tempo, num experimento que comparasse duas caixas experimentais, uma com reforçamento 
68 
 
 
em VI 10s e outra em VI 30s, o critério de Staats ditaria que o deslocamento da segunda caixa 
para a primeira implicaria que a primeira envolveria reforçamento (e emoções) negativos. 
Os próprios autores reconhecem que seu argumento é frágil porque, diferentemente do 
exemplo de Staats (2006), as caixas não estão sendo comparadas com uma condição “neutra”. 
Ainda assim, eles apelam para a noção de que o critério de aproximação/afastamento é 
insuficiente e questionam se comparações com uma condição neutra podem responder isso. 
A Distinção É Limitada 
Limita-se em Casos Complexos/Humanos. Além do exemplo do experimento de 
Weiss e Laties (2006) apresentado por Baron e Galizio (2005) para mostrar a dificuldade de 
classificar alguns casos como reforçamento positivo ou negativo, Michael (2006) formula um 
experimento hipotético para ilustrar isso em outro sentido. Um rato privado de alimento é 
exposto a duas condições experimentais: na primeira condição, um tom está em vigor e há 
uma maior frequência na liberação de alimento e menor frequência na liberação de choques 
(Michael não menciona respostas as quais alimento e choque seriam contingentes nesse 
experimento hipotético. Esse aspecto será especificamente comentado na discussão geral do 
presente trabalho). Na segunda condição, sem tom, a frequência dos choques é maior e a de 
alimento é menor. Diante disso, Michael supõe que a mudança de uma condição para a outra 
seria reforçadora, mas esse reforçamento deveria ser classificado como reforçamento positivo 
ou negativo? Inversamente, uma mudança da primeira condição para a segunda 
provavelmente seria punitiva. Isso deveria ser considerado punição positiva ou negativa? 
Classificar a mudança como positiva ou negativa pensando no reforçador de base (i.e., 
condicionante) seria difícil porque tanto o alimento (positivo) quanto o choque (negativo) 
parecem cumprir esse papel. Ao mesmo tempo, classificar a mudança com base na 
apresentação ou retirada do tom também faria pouco sentido já que a atribuição do 
tom/silêncio a cada condição foi completamente arbitrária e poderia ser invertida. Logo, 
69 
 
 
Michael (2006) afirma que a distinção parece não se aplicar a casos complexos envolvendo 
reforçadores condicionados aos dois tipos de estímulo. 
Seguindo a mesma lógica, Michael (2006) complementa que, partindo da noção de 
que casos complexos como o do exemplo citado são universalmente humanos, o uso da 
distinção como um todo torna-se inútil. Em outras palavras, se a distinção só se aplica a casos 
não-humanos, dentro de uma ciência que busca, em última análise, modificar o 
comportamento humano, a distinção não serve para nada. 
Baron e Galizio (2006a) apontam para a existência desse nó na área a respeito de se 
deve-se focar valor do reforçador de base para determinar o valor de um estímulo 
condicionado ou na sua adição/subtração. Em sua resposta, os autores oferecem outros 
complementos para apoiar este ponto de Michael (2006). Primeiramente, eles citam que na 
literatura sobre reforçamento luminoso/sensorial, era costumeiro que o aumento na frequência 
de uma resposta causado tanto por um aumento na intensidade de uma luz quanto por sua 
diminuição era classificado como reforçamento positivo. E que, por razões desconhecidas, 
classificações com base na direção da mudança foram abandonadas em favor de falar da 
mudança de estímulo em si como reforçadora. 
Como outros exemplos do ponto de Michael (2006), Baron e Galizio (2006a) citam 
Verhave (1962) que nomeou os "time-outs" de um esquema de esquiva que eram 
acompanhados pela introdução de um tom como "reforçamento positivo"; e Perone e Galizio 
(1987), entre outros, que nomearam os "time-outs" indicados pela interrupção de um tom 
como reforçamento negativo. Segundo Michael, escolher o tom ou o silêncio como estímulos 
condicionados é uma decisão arbitrária, e uma classificação em termos de positivo/negativo, 
além de forçada, nada acrescentaria. 
Limita-se a Operações com Início ou Término Definidos. Outro problema apontado 
por Baron e Galizio (2006a) ligado à manutenção da distinção é que há operações que não 
70 
 
 
podem facilmente ser identificadas como “introdução” ou “término” porque se trata de 
mudanças nas intensidades dos estímulos em um contínuo. 
Nesse momento do texto de onde essa fala foi retirada os autores não elaboram mais o 
seu ponto. Ainda assim, vale retomar que esse ponto já havia sido respondido por Iwata 
(2006): “as mudanças ainda envolvem ou um aumento ou uma diminuição de alguma 
característica do estímulo” (p. 122). A dificuldade de se classificar contingências de 
reforçamento entre positivas ou negativas nada tem a ver com se as mudanças são totais ou 
parciais. Se a remoção de um choque é reforçadora negativa, uma diminuição suficiente na 
sua intensidade também será. É claro que diminuições muito pequenas na intensidade de um 
choque, tal como a remoção de um choque muito leve, podem não sercapazes de manter 
determinada resposta. Ainda assim, em nenhum momento faria sentido considerar que se está 
falando de reforçamento positivo. 
De uma forma ou de outra, apresentações e remoções também podem ser consideradas 
alterações na intensidade de estímulos cuja intensidade do estímulo em uma das condições 
seja zero. Millenson (1967/1975) já havia apontado para o fato de que mudanças na 
intensidade de um estímulo poderiam se configurar como reforçamento – mesmo que ele 
tivesse feito essa ressalva apenas para o reforçamento negativo. 
A Distinção Não Tem Fundamentação Experimental Suficiente 
Lattal e Lattal (2006) apresentaram uma crítica à forma como a distinção foi adotada 
na análise do comportamento. Nesta área (assim como em outras ciências) assume-se a 
hipótese nula: uma variável presumivelmente não tem efeito até que se prove o contrário. Essa 
é a base da comparação entre a linha de base e outras condições experimentais. Nesse sentido, 
sem evidências concretas que sustentassem uma distinção entre os reforçamentos positivo e 
negativo, nunca dever-se-ia ter assumido que a distinção existia. Ao contrário, a hipótese nula 
foi rejeitada e a distinção foi assumida sem provas empíricas. 
71 
 
 
Perone, Galizio e Baron (1988) destacaram diversas questões metodológicos entre 
experimentos, envolvendo tanto humanos quanto animais, que tornam difícil a sua 
comparação. Lattal e Lattal (2006) acreditam que esses conflitos poderiam ser extrapolados 
para a comparação entre os reforçamentos positivo e negativo. Em outras palavras, as 
diferenças entre os delineamentos experimentais que envolvem reforçamento negativo ou 
positivo são grandes o suficiente para se atribuir qualquer resultado a diferenças na adição ou 
remoção de estímulos. 
Segundo Lattal e Lattal (2006), os que chegaram mais perto de comparar 
empiricamente o reforçamento positivo e negativo, segundo Lattal e Lattal (2006), foram 
Dinsmoor (1962) e Azrin et al. (1963) que delinearam esquemas de fuga de forma similar a 
esquemas usados em experimentos que usam comida como reforçador. apresentam ainda dois 
dados experimentais para embasar o seu ponto. Azrin et al. (1963) concluíram que, para 
macacos-de-cheiro, que a forma pela qual as respostas são adquiridas e mantidas em um 
esquema de razão fixa de fuga e em um esquema de razão fixa por alimento são similares. 
Dinsmoor (1962) notou especificidades do uso de choques em esquemas de reforçamento de 
intervalo variável. Entretanto, para os autores, nenhuma conclusão pode ser tirada disso, já 
que não se tem como afirmar que a particularidade se dá à diferença entre os dois tipos de 
reforçamento e não sobre diferenças entre os choques e reforçadores alimentares 
especificamente. 
Mais adiante em seu texto, Lattal e Lattal (2006) retomam que a distinção foi 
assumida sem evidências suficientes que mostrem a existência de diferenças funcionais entre 
os reforçamentos positivo e negativo. 
Faz Perder o Foco nas Operações 
Baron e Galizio (2006a) retomam o exemplo da aspirina (classificada como 
reforçamento negativo apesar da adição da aspirina) para ressaltar que o problema da 
72 
 
 
distinção reside nos casos em que se favorece fazer a distinção a despeito das operações 
envolvidas. Em outro comentário sobre a distinção, retomam o alerta de Michael (1975): 
“atrapalha uma descrição mais completa das condições anteriores e posteriores à mudança” 
(p. 41). 
Sobre isso, vale comentar que uma pessoa pode realizar uma má descrição de uma 
contingência que ela classificou como reforçamento negativo, mas nada garante que a 
descrição não seria malfeita mesmo na ausência dessa classificação. Isso remete mais a uma 
correlação do que a uma causalidade, já que, dado que fazer a distinção é o mais comum, 
acaba que é mais comum que as imprecisões sejam acompanhadas de distinções. 
Querendo ou não, na ausência de descrições mais precisas, a pessoa ter dito que se 
tratava de reforçamento negativo pode sim servir como informação adicional. Por exemplo: se 
a descrição fosse que a adição de uma pelota de alimento provocou um aumento da resposta 
que a produziu, nenhuma informação seria acrescentado ao classificar essa mudança como 
positiva. Ao mesmo tempo, se a descrição fosse que uma “atividade” funcionava como 
reforçador em contingências de reforçamento negativo” poder-se-ia supor que o procedimento 
envolvia a retirada da atividade, indicando que ela era aversiva (e não reforçadora) em relação 
a uma outra condição. 
Pode Gerar Caracterizações Prematuras ou Enganosas 
Baron e Galizio (2006a) alertam que apesar da utilidade aparente da distinção, ela 
pode resultar em caracterizações prematuras ou até mesmo enganosas sobre o processo de 
reforçamento. Em outro trecho, comentam que se basear na distinção entre adição e subtração 
pode levar a equívocos especialmente quando se fala de comportamentos complexos ou 
quando decisões éticas são tomadas em nome dessa distinção. 
 
 
73 
 
 
Seu Uso Gera Contradições 
Baron e Galizio (2006b) afirmam que um uso rígido da distinção aplicado a uma gama 
variada de casos rapidamente fará um indivíduo se deparar com contradições. Por exemplo: 
ao seguir a proposição de Nakajima (2006) de se basear nos estímulos observáveis e 
mensuráveis para definir o que é reforçamento positivo ou negativo, uma pessoa deveria 
classificar “tomar uma aspirina” necessariamente como reforçamento positivo. Em outro 
sentido, um estímulo condicionado que indica o recebimento de dinheiro para um participante 
humano poderia ser tanto uma luz acendendo quanto uma luz apagando. Com esse exemplo, 
Baron e Galizio se referem a noção de que o valor de um reforçador condicionado não deveria 
ser inferido pela sua apresentação ou remoção já que ele ela foi arbitrariamente estabelecida. 
Inviabiliza a Recomendação de Práticas Específicas 
Michael (2006) apresenta uma afirmação de Geller (2004) em que o autor admitiu ter 
usado os termos “positivo” e “negativo” como sinônimos de “prazeroso” e “desprazeroso” em 
Weigand e Geller (2005), mas que sabia que os termos estão ligados às noções de 
“apresentação” e “remoção”. Isso foi feito em um contexto em que ele estaria incitando 
analistas do comportamento a usarem intervenções comportamentais “positivas”. 
Esse dado é apresentado por Michael (2006) para reiterar um ponto originalmente 
feito por ele em seu texto original (Michael, 1975) de que se a distinção entre os 
reforçamentos positivo e negativo não é clara, haverá dificuldades em se seguir a 
recomendação de usar um ao invés do outro. 
Vantagens da Manutenção 
Falas em que os autores apontaram benefícios relacionados ao uso da distinção entre 
os reforçamentos positivo e negativo. Dentre os trechos classificados como “Vantagens da 
Manutenção”, identificou-se falas que apontavam para a distinção como tendo uma função 
prática, comunicativa, cultural ou apenas sendo útil. 
74 
 
 
A Distinção Tem Função Prática 
Ajuda no Ensino de análise do comportamento. Para Chase (2006), a distinção, 
especialmente quando usada por professores de análise do comportamento em exemplos, faz 
com que os alunos foquem em análises detalhadas dos tipos de variáveis que podem controlar 
comportamentos. Segundo o autor, descrever que, dentre as consequências que aumentam 
comportamento, algumas delas envolvem a “remoção de uma consequência” e outros a 
“adição de uma consequência” ilustra: o foco nas variáveis ambientais, mudanças ao longo do 
tempo, distinção entre ambiente e comportamento e distinção entre variáveis observáveis e 
não observáveis. Isso, por conseguinte, ensinaria os alunos a como examinar comportamentos 
como um behaviorista. 
Assim como foi argumentado que a distinção positivo/negativo não necessariamente 
prejudica uma descrição precisa de uma contingência, algo similar pode ser dito no sentido 
contrário. Chase (2006), parece ter observado uma correlaçãoentre o ensino da análise do 
comportamento e o que é aprendido. De fato, é costumeiro ensinar a distinção entre os 
reforçamentos positivo e negativo e apresentar exemplos que, justamente, envolvam a 
distinção. Também é verdade que pelo menos parte dos alunos aprendam a analisar 
comportamentos de forma detalhada. Ainda assim, não se pode ter certeza de que a distinção 
tenha alguma responsabilidade nesse efeito. É possível até que os alunos estivessem 
aprendendo a analisar comportamentos apesar de a distinção estar os confundindo além do 
necessário. Michael (1975), por exemplo, afirmou não ter tido problemas ao ter deixado de 
usar os termos positivo/negativo no ensino dos termos. 
Ajuda a Isolar Mudanças que Controlam o Comportamento. Outra vantagem da 
manutenção da distinção apresentada por Chase (2006) está relacionada a um contra-
argumento já apresentado no subtópico “A Distinção É Ambígua”. O argumento é que, para 
Chase, a distinção ajuda a identificar quais as mudanças nas contingências que de fato geram 
75 
 
 
mudanças comportamentais. Tomando como exemplo o caso da criança que emite poucos 
mandos e muitos comportamentos autolesivos: o valor da distinção, nesse caso, seria o de 
notar dois tipos diferentes de manutenção (i.e., aumento da atenção para mandos e da restrição 
física para comportamentos autolesivos) poderiam ambos gerar um aumento na emissão de 
mandos - um por reforçamento positivo e o outro por reforçamento negativo. 
É claro que, saber que a resposta gera duas mudanças ambientais e saber qual das 
mudanças ambientais (ou se se são as duas) que mantém o comportamento é muito 
importante. Ainda assim, não fica justificado, pela fala de Chase (2006), como dar rótulos 
para as mudanças ajuda nessa distinção. Simplesmente chamar uma de “positiva” e a outra de 
“negativa” as tornaria mais distinguíveis? Mas como as mudanças estariam sendo nomeadas 
antes de serem percebidas? Se já haviam sido percebidas, elas já estavam discriminadas, não 
precisaria da classificação para isso. O mesmo se aplicaria se duas mudanças classificadas 
como negativas tivessem sido notadas. Assumindo essa noção de Chase: se fossem duas 
mudanças “positivas” (e.g., adição de atenção e acesso a brinquedos) a distinção não ajudaria 
nesse caso? Ela atrapalharia no sentido de pensar que a adição de atenção e acesso a 
brinquedos são a mesma coisa? E no caso de duas mudanças “negativas” (e.g., subtração de 
uma bronca e subtração de uma demanda)? Seria difícil perceber que são coisas diferentes? 
Nesse sentido a presente vantagem da distinção depende de se ela ajuda a distinguir ou 
não reforçadores distintos. Sobre isso, seria possível argumentar que quem descreveu as 
mudanças ambientais como “aumento da atenção” ou a “retirada das restrições físicas” já 
estivesse sob controle das duas mudanças ambientais diferentes. E mesmo que a descrição 
pudesse ajudasse a notar as mudanças, é difícil pensar que nomear cada uma das descrições 
como positivas ou negativas acrescentaria algo a mais. 
Tomando o exemplo do “aumento do calor” e da “redução do frio”. Nesse caso, achar 
que “adições” e “subtrações” são coisas diferentes poderia levar alguém a pensar que duas 
76 
 
 
mudanças estão acontecendo, mas esse não seria o caso. Ambas as descrições representam 
diferentes formas de descrever uma mesma mudança. Duas mudanças parecem ser 
distinguíveis porque são mudanças diferentes, não porque uma é positiva e outra é negativa. 
De todo modo, para que qualquer afirmação possa ser feita, seria necessária uma 
pesquisa que comparasse o ensino de análise de contingências com a distinção e sem a 
distinção que pudesse mostrar se as vantagens didáticas apontadas se verificam. 
Aponta para Outras Possibilidades de Intervenção. Iwata (2006), em seu tópico 
“Identificar a diferença crítica entre as condições de reforçamento pré e pós-mudança facilita 
o desenvolvimento de contingências efetivas” (p. 122), segue uma direção muito parecida 
com Chase (2006) em seu argumento anterior. Para tal, ele cita Osborne (1969) em um 
exemplo de contingências de tempo livre, nas quais comportamentos podem ser mantidos 
tanto pela eliminação de demandas como acesso a atividades específicas. No primeiro caso, o 
que seria oferecido à criança durante o tempo livre não faria diferença, enquanto, no segundo, 
se esperaria que a eliminação da demanda tivesse pouco efeito terapêutico. 
Nesse sentido, Iwata (2006) destaca que a distinção ajuda a 1) identificar situações nas 
quais a adição de um reforçador positivo específico seria ou não efetiva como reforçador, 2) 
examinar efeitos do tipo oposto de mudança de estímulo, 3) identificar outras mudanças de 
estímulo que teriam o mesmo efeito que a apresentação ou retirada de determinado estímulo e 
4) determinar como implementar a extinção. Para exemplificar seu último tópico, Iwata 
menciona que, no caso de a eliminação de uma demanda servir como reforçamento, a 
extinção deve ser manter a demanda. 
Baron e Galizio (2006a) respondem Iwata (2006) dizendo que mesmo quando a 
operação do experimentador é de término ou adição não fica explicado porque rotular os 
estímulos como positivos ou negativos pode ser útil. Os autores, então, resgatam a falta de um 
critério nítido para se classificar um reforçador condicionado: se, no exemplo de Iwata, o 
77 
 
 
acesso ao tempo livre fosse indicado por uma luz acendendo ou apagando, dever-se-ia variar a 
classificação da mudança como positiva ou negativa? 
Naturalmente, as mesmas questões já levantadas para o argumento de Chase (2006) 
poderiam ser feitas a Iwata (2006). De que forma rotular mudanças ambientais como positivas 
ou negativas contribui para essas vantagens? Em ordem, poder-se-ia responder: 1) operações 
motivadoras continuam podendo ser identificadas, 2) o efeito do tipo oposto de estímulo seria 
a diminuição da resposta (direta ou indireta), 3) qualquer mudança reforçadora teria o mesmo 
efeito (aumento na probabilidade) e qualquer mudança punidora teria o efeito oposto 
(diminuição na probabilidade/supressão), e 4) a extinção seria implementada mantendo-se a 
condição antecedente a despeito da resposta. 
Um ponto a se destacar é que Iwata (2006), no início deste mesmo tópico introduz as 
vantagens dizendo que “algo pode ser ganho ao identificar a natureza da mudança de 
estímulo” (p. 122). Porém, ainda na mesma lista, ao citar o último ganho, ele diz: “por fim, 
identificar a mudança de estímulo que serve como reforçamento pode ser útil em determinar 
como melhor implementar a extinção” (p. 122). Isso pode sugerir que Iwata esteja partindo do 
pressuposto que “identificar a direção da mudança reforçadora” seja equivalente a “identificar 
a mudança reforçadora” – algo que também parece ficar subentendido em seu exemplo. 
Isso faz retomar todos os questionamentos do tópico anterior. Por conta de como a 
análise do comportamento é ensinada, fica estabelecida correlação entre o ensino e utilização 
de uma classificação e a capacidade de distinguir diferentes mudanças ambientais que podem 
ou não estar controlando um comportamento operante. Ainda assim, a afirmação de que a 
distinção positivo/negativo ajuda a distinguir diferentes mudanças ambientais simplesmente 
não pode ser feita porque isso não foi testado. Precisariam ser comparados os ensinos que 
usam e não usam a distinção para verificar seus desempenhos na identificação de mudanças 
ambientais. 
78 
 
 
De todo modo, pode-se pensar, pelo menos, que há ganhos (mencionados por Iwata, 
2006) em diferenciar mudanças ambientais distintas e identificar qual (ou quais) delas estão 
controlando determinado comportamento. Se o rótulo positivo ou negativo ajuda ou não nisso 
precisaria ser investigado. 
A Distinção Tem Função Comunicativa 
Descrever Mais Facilmente a Mudança. Chase (2006) apresentou como outra 
vantagem da manutenção da distinção o fato de que, por vezes,é mais fácil descrever uma 
situação de uma forma do que de outra. Ele ilustra isso com os exemplos “aumentar atenção” 
x “diminuir períodos de não atenção” e “receber dinheiro” ao invés de “evitar períodos sem 
dinheiro”. Esse ponto não é respondido diretamente, mas no subtítulo “Esclarecimentos”, será 
apresentada a posição de Baron e Galizio (2006a) quanto a isso. 
A Distinção Tem Função Social 
Ampliar a Aceitação da análise do comportamento. Segundo Lattal e Lattal (2006), o 
ambiente cultural como um todo atribui valor moral a circunstâncias interpretadas como 
positivas ou negativas. Dessa forma, apesar de concordarem que a distinção é problemática, 
eles afirmam que o seu uso acaba tendo a função social de ampliar a aceitação da análise do 
comportamento, em especial, ao se adotar a linguagem do reforçamento positivo. Dessa 
forma, seria possível mudar vieses associados a área principalmente quanto a termos como 
“coerção” e “manipulação”. Segundo eles: 
Programas comportamentais baseados no que se descreve como "reforçamento 
positivo" podem não ser diferentes nem mais eficazes sobre o comportamento-alvo do 
que aqueles baseados em "reforçamento negativo", mas os primeiros têm mais 
probabilidade de serem aceitos, implementados e mantidos (por exemplo, Daniels, 
2000; Iwata & Bailey, 1974). (Lattal & Lattal, 2006, p. 132) 
79 
 
 
Sobre isso, Baron e Galizio (2006a) responderam a Lattal e Lattal (2006) dizendo que 
se analistas do comportamento passassem a falar de forma diferente entre si e com um público 
cada vez mais imerso na área, uma má impressão e acusações de cinismo poderiam surgir. 
Além disso, decisões judiciais já foram tomadas para impedir intervenções que se baseassem 
na retenção de bens e serviços a pacientes psiquiátricos para que pudessem ser apresentados 
de forma contingente. Isso mostra, segundo eles, que enfatizar que um procedimento envolve 
reforçamento positivo não basta. 
A Distinção Já Gerou uma Grande Quantidade de Pesquisas 
Iwata (2006) cita como uma outra vantagem da manutenção da distinção o fato de que 
ela gerou uma grande quantidade de pesquisas sobre as similaridades e diferenças entre a 
performance entre os dois tipos de reforçamento. O autor não desenvolve mais o seu ponto, 
então não dá para ter certeza de qual seria o benefício disso para ele. Se a vantagem for que a 
distinção estimulou, puramente, a realização de pesquisas, uma reposta a isso poderia ser que, 
se a distinção não faz sentido, esses esforços poderiam ter sido dedicados a outras 
investigações e, nesse sentido, a distinção teria sido prejudicial. 
Outra possibilidade é que investigações a respeito da distinção talvez estejam sendo 
úteis para revelar lacunas em outras definições como reforçamento, estímulo, operações 
motivadoras etc. Nesse sentido, seria possível supor que se essa discussão não tivesse surgido, 
essas lacunas não teriam sido (ou demorariam mais para serem) percebidas – o que 
favoreceria o argumento de que a distinção foi vantajosa. 
Como especialmente apontado nos estudos de Magoon e Critchfield (2008) e Magoon 
et al. (2017), muito do que as pesquisas já consideraram em termos de performance 
diferencial dos comportamentos controlados por reforçamento positivo e negativo pode ser 
explicado em termos de diferenças procedimentais. O fato de os dois tipos de reforçamento 
80 
 
 
não serem tão comumente estudados juntos e de maneiras simétricas pode ter enviesado os 
resultados das pesquisas na formulação dos conceitos e na manutenção da distinção. 
Influenciadas pelo debate proposto por Michael (1975), pesquisas experimentais 
buscaram estudar o reforçamento negativo, seja programando-o da mesma forma em que 
reforçamento positivo costuma ser programado experimentalmente (como em Perone & 
Galizio, 1987), seja tornando as contingência de reforçamento positivo e negativo estudadas o 
mais simétrica possíveis (como em Magoon & Critchfield, 2008 e Magoon et al., 2017). 
Explicações para a Manutenção 
Falas em que os autores apresentaram motivos pelos quais a distinção entre os 
reforçamentos positivo e negativo vem sendo mantida. Em sua maioria, explicações foram 
apresentadas por autores contra a distinção ou incertos quanto a ela, em seções específicas 
dedicadas a especular as razões pelas quais a distinção foi mantida. Dentre os trechos 
classificados como “Explicações para a Manutenção”, identificou-se falas que apontavam que 
apontavam distinção havia sido mantida por conta de alguma função específica (i.e., prática, 
comunicativa, cultural ou social) ou então que ela estava sob controle antecedente de algum 
outro elemento que não a adição/subtração. 
A Distinção Pode Ser Útil 
Útil no Ensino de Análise do Comportamento. Chase (2006) sugeriu que um motivo 
pelo qual a distinção pode ter sido mantida é que ensinar a distinção talvez tivesse tido 
alguma função útil. Para ele, um indício disso era que, Keller e Shoenfeld (1950), que 
propuseram a distinção inicialmente, eram ótimos professores. 
Útil como nas Operações Motivadoras. Para Iwata (2006), avanços recentes na área 
de operações motivadoras sugerem que diferenças terminológicas arbitrárias possam ser úteis 
de alguma forma. Iwata não elabora profundamente esse ponto, apenas usa como base o fato 
de que fora sugerido o termo operações motivadoras (OM) para incluir tanto operações 
81 
 
 
estabelecedoras (OEs) como operações abolidoras (OAs), e que essa distinção pode ser útil tal 
como a distinção positivo/negativo. 
Útil para Permitir que se Navegue pela Área. Baron e Galizio (2005) apontaram 
que a distinção está tão incorporada nas discussões sobre comportamento operante que é 
possível que a distinção tivesse passado a ser necessária para que se pudesse navegar pela 
literatura. Lattal e Lattal (2006) concordaram diretamente com essa função da distinção. 
Útil para Distinguir Dois Reforçadores para uma Mesma Resposta. Baron e 
Galizio (2005) citam dois exemplos de analistas do comportamento que usaram a distinção 
positivo/negativo para distinguir casos em que uma resposta era mantida por diferentes 
formas de reforçamento. O primeiro foi o próprio Iwata et al. (1994) que usou os termos para 
distinguir comportamentos autolesivos mantidos por fuga de demanda ou acesso à atenção 
etc. Sobre isso, é melhor falar da consequência como aumento da atenção ou alívio da 
solidão? É melhor falar sobre fuga de uma tarefa aversiva ou acesso a uma atividade 
alternativa? Para Baron e Galizio, qualquer uma das descrições parece apropriada. 
Nakajima (2006) afirma discordar dessa noção apresentada por Baron e Galizio 
(2005). Para ele, o alívio da solidão é uma afirmação especulativa que depende de uma 
inferência sobre um estado da pessoa. A fuga de uma tarefa também não pode ser facilmente 
comparada ao simples “acesso a uma atividade” se ela não for claramente identificada. 
Nakajima (2006) apontou para dois problemas nos exemplos de Baron e Galizio 
(2005) que levam a se considerar o quanto eles foram capazes de adotar a própria perspectiva 
proposta por eles. No primeiro caso, o problema mais evidente é que para qualquer definição 
de tédio que se adote, tédio e atenção dificilmente seriam considerados opostos. No segundo 
caso, o problema é mais grave porque Baron e Galizio parecem não ter notado que a o 
exemplo de Iwata et al. (1994) aponta justamente que duas mudanças estão sendo produzidas 
pela mesma resposta - a dúvida é sobre qual dessas duas é a mudança reforçadora. Nesse 
82 
 
 
sentido, dizer que “remoção da tarefa” e “produção de uma atividade alternativa” são 
equivalentes está errado. A resposta pode estar sendo mantida tanto por uma quanto pela outra 
mudança. 
Com base principalmente em seus desenvolvimentos posteriores (i.e., Baron e Galizio, 
2006a, 2006b), a forma correta de descrever a ambiguidade, nesses exemplos, seria contrastar 
a “produção de atenção” com a16 
Reforçamentos Positivo e Negativo ................................................................................. 17 
Reforçadores Positivos e Negativos ................................................................................. 18 
Existe Diferença Entre os Reforçamentos Positivo e Negativo? ....................................... 20 
O Impacto de Michael (1975) .......................................................................................... 26 
Método ................................................................................................................................ 45 
Seleção dos Textos .......................................................................................................... 45 
Procedimento de Grifo dos Textos ................................................................................... 45 
Procedimento de Tabulação dos Dados ............................................................................ 47 
Resultados e Discussão ........................................................................................................ 50 
Problemas da Manutenção ............................................................................................... 52 
A Distinção É Confusa ............................................................................................. 52 
A Distinção É Ambígua ............................................................................................ 54 
A Distinção É Limitada ............................................................................................ 68 
A Distinção Não Tem Fundamentação Experimental Suficiente ............................... 70 
Faz Perder o Foco nas Operações ............................................................................. 71 
9 
 
 
Pode Gerar Caracterizações Prematuras ou Enganosas .............................................. 72 
Seu Uso Gera Contradições ...................................................................................... 73 
Inviabiliza a Recomendação de Práticas Específicas ................................................. 73 
Vantagens da Manutenção ............................................................................................... 73 
A Distinção Tem Função Prática .............................................................................. 74 
A Distinção Tem Função Comunicativa ................................................................... 78 
A Distinção Tem Função Social ............................................................................... 78 
A Distinção Já Gerou uma Grande Quantidade de Pesquisas..................................... 79 
Explicações para a Manutenção ....................................................................................... 80 
A Distinção Pode Ser Útil ......................................................................................... 80 
A Distinção Tem Função Comunicativa ................................................................... 83 
A Distinção Tem Função Cultural ............................................................................ 84 
A Distinção se Dá por Outro Aspecto ....................................................................... 88 
Sugestões para a Manutenção .......................................................................................... 98 
Rever os Termos Usados .......................................................................................... 98 
Manter a Distinção com Ressalvas ............................................................................ 99 
Fazer Mais Investigações ........................................................................................ 100 
Vantagens do Abandono ................................................................................................ 101 
Gera Menos Distorções .......................................................................................... 101 
Melhora a Descrição das Mudanças ........................................................................ 101 
Distinguir Dois Reforçadores para a Mesma Resposta ............................................ 102 
10 
 
 
Explicações para o Abandono ........................................................................................ 103 
A Distinção é Mal-entendida .................................................................................. 103 
A Distinção Não É Mais Útil .................................................................................. 104 
Sugestões para o Abandono ........................................................................................... 104 
Mudar os Termos Usados ....................................................................................... 105 
Abandonar a Distinção por Completo ..................................................................... 106 
Assumir Simetria Entre os Reforçamentos .............................................................. 108 
Sugestões Neutras ......................................................................................................... 109 
Fazer Mais Investigações ........................................................................................ 109 
Focar no Que É Palpável ........................................................................................ 116 
Revisar os Termos .................................................................................................. 116 
Adaptar a Linguagem ............................................................................................. 116 
Esclarecimentos............................................................................................................. 116 
Discussões Gerais .......................................................................................................... 120 
A Confusão da Distinção ........................................................................................ 120 
A Distinção É Semântica ........................................................................................ 121 
A Ausência como um Estímulo .............................................................................. 123 
Operações e Efeitos ................................................................................................ 126 
Condições Pré-mudança e Pós-mudança ................................................................. 128 
Implicações Sobre o Conceito de Reforçamento ..................................................... 131 
Implicações Sobre o Conceito de Reforçadores ...................................................... 132 
11 
 
 
Implicações para o Conceito de Reforçadores Condicionados ................................. 140 
Implicações do Abandono da Distinção Sobre o Conceito de Punição..................... 146 
Implicações do Conceito de Operação Motivadora para a Distinção ....................... 148 
Considerações Finais.......................................................................................................... 154 
Limites do Presente Estudo ............................................................................................ 157 
Sugestões para Trabalhos Futuros .................................................................................. 159 
Em Direção à Uma Nova Proposta de Distinção ............................................................ 162 
Referências ........................................................................................................................ 167 
Apêndice............................................................................................................................ 175 
 
 
12 
 
 
Lista de Figuras 
Figura 1 - Organização hierárquica e interrelação entre os subtópicos da seção “Resultados e 
Discussão”.................................................................................................................................51“subtração de uma condição em que a atenção estava ausente” 
e “fuga de uma tarefa” com “acesso a uma condição em que a tarefa estava ausente”. Essas 
descrições por mais que inconvenientes e não convencionais, ilustram essas consequências 
diferentes poderiam ser descritas cada uma em sua forma oposta (ainda referindo-se a uma 
mesma mudança). 
A noção de que a distinção pode ajudar a distinguir mudanças ambientais que podem 
estar mantendo um comportamento já foi discutida a partir das vantagens práticas apontadas 
por Chase (2006) e Iwata (2006) sobre distinção. Aqui, Baron e Galizio (2005) a 
apresentaram não como uma vantagem, mas como uma possibilidade explicativa para a 
manutenção do comportamento. O exemplo de Iwata et al. (1994) ilustra o mesmo conflito: as 
diferentes mudanças são distinguíveis por serem de categorias supostamente diferentes ou por 
serem mudanças diferentes em si? Como identificar que tipo de mudança é de um tipo ou de 
outro, antes de identificar sequer quais as mudanças envolvidas? O equívoco anterior de 
Baron e Galizio (2005) acaba sugerindo que o abandono da distinção tampouco ajuda na 
distinção entre reforçamentos para uma mesma resposta (o que vai contra a vantagem do 
abandono apontada por Nakajima, 2006). 
O segundo exemplo apresentado por Baron e Galizio (2005) para ilustrar a distinção 
positivo/negativo, sendo usada para diferenciar duas mudanças diferentes para uma mesma 
resposta, foi o de Crowley (1972) no qual o autor propôs que o uso de drogas seria, 
inicialmente, mantido por reforçamento positivo, mas que, ao longo do tempo, passava a ser 
83 
 
 
controlado negativamente pelas condições produzidas pela abstinência da droga. Esse 
exemplo acaba sendo um pouco especulativo, até porque a operação observável (adição de 
droga) continua sendo a mesma em qualquer instância do uso da droga. Ainda assim, pode 
existir valor em se investigar que variáveis fizeram tanto Crowley, como outros autores 
(citados por Baron e Galizio, 2005) acreditarem que existe alguma diferença entre os dois 
tipos de uso. Isso porque caso essas diferenças existam, as diferenças no controle do 
comportamento de usar drogas em seu início e após o estabelecimento dos efeitos de 
abstinência poderiam indicar diferentes variáveis sobre as quais intervir quando se trata de um 
caso ou de outro. 
A Distinção Tem Função Comunicativa 
Lattal e Lattal (2006) citaram dois tipos diferentes de argumentação sobre a forma de 
falar sobre conceitos. Por um lado, Hineline (1980), defendia descrições precisas dos 
conceitos, por outro, Bailey (1991) defendia que o importante é comunicar os conceitos de 
forma útil a despeito de sua precisão. Em maior consonância com Bailey, Lattal e Lattal 
sugeriram que a distinção entre reforçamento positivo e negativo, embora imprecisa, persistirá 
enquanto tiver uma função comunicativa – sem especificar exatamente qual seria. A seguir, 
serão apresentadas algumas funções comunicativas específicas mencionadas pelos autores. 
Evidenciar Que se Está Tratando de Eventos Ambientais. Baron e Galizio (2005) 
apontaram para a possibilidade de que o uso da distinção talvez acabe favorecendo a noção de 
que a análise do comportamento trata de eventos ambientais e não cognitivos ou fisiológicos. 
Ser Entendida em Contextos Leigos. Para Lattal e Lattal (2006), mesmo que a 
distinção positivo/negativo seja conceitualmente ambígua, ela deve ter sido mantida também 
porque pode ser entendida facilmente em contextos fora da análise do comportamento, como 
escolas, empresas e hospitais. Essa fala se contrasta com os argumento de Sidman (2006) de 
que a distinção é especialmente confusa para novos alunos e leitores. Nesse sentido, seria 
84 
 
 
interessante ver uma pesquisa que investigasse a efetividade de um procedimento de ensino 
que usa a distinção e outro que não usa. 
Distinguir Estímulos Usados em Áreas Diferentes de Atuação. Outra possibilidade 
apresentada por Baron e Galizio (2005) é que a distinção pode estar sendo mantida por ser útil 
em oferecer uma forma simples de se referir a estímulos usados em áreas diferentes de estudo. 
De um lado, os reforçadores tipicamente usados em estudos sobre esquemas de reforçamento, 
escolha, controle de estímulos etc. (reforçadores positivos) e do outro os reforçadores usados 
em delineamentos de fuga e esquiva (reforçadores negativos). 
A Distinção Tem Função Cultural 
Chase (2006) e Lattal e Lattal (2006) sugeriram que a distinção entre os reforçamentos 
positivo e negativo podem estar simplesmente cumprindo alguma função cultural e 
apresentaram alguns argumentos para isso, sem especificar quais seriam tais funções culturais. 
Chase afirmou que a distinção, enquanto conceito, é ilógica no sentido de que o controle 
jamais pode ser atribuído a um tipo de reforçamento e não ao outro. Ao mesmo tempo, 
justificou que sua existência acaba sendo lógica no sentido de que seu uso segue as leis do 
comportamento e é mantida por uma comunidade verbal. 
Lattal e Lattal (2006), de forma similar, apontaram que a manutenção da distinção 
pode ser atribuída a contingências históricas e culturais. Citam Vollmer (1999) quando diz 
que práticas verbais são muito difíceis de mudar e Harris (1977) que disse que práticas 
histórico-culturais persistem porque funcionam de alguma forma dentro da cultura. Além 
disso, a função cultural da distinção pode se aplicar não somente à análise do comportamento, 
mas à cultura ocidental de maneira geral. Isso porque os termos positivo/negativo podem ser 
encontrados desde o Antigo Testamento até o princípio de Spencer-Bain, a lei do Efeito de 
Thorndike e o condicionamento operante de Skinner. Outro fator que pode ter perpetuado a 
85 
 
 
distinção seria a sua institucionalização como critério legal a respeito de quais intervenções 
podem ou não ser aplicadas. 
Lattal e Lattal (2006) citam também alguns exemplos de autores que já teriam 
apontado as falhas lógicas em conceitos da área, mas cujos conceitos foram mantidos em uso 
apesar disso. Hearst (1975) sobre a distinção operante/respondente, Dinsmoor (1954) sobre a 
lei do efeito negativa e Zeiler (1972) e Lattal e Poling (1981) que argumentaram contra a 
descrição de eventos independentes da resposta como “reforçamento não contingente” (ver 
Poling & Normand, 1999; Vollmer, 1999). 
Baron e Galizio (2005), por sua vez, concordaram com essa e outras explicações 
apresentadas por Chase (2006) como possíveis fatores responsáveis pela manutenção a 
distinção. Ainda assim, defenderam que se a distinção não pode ser baseada em fundamentos 
lógicos ou conceituais ela em nada está acrescentando a uma análise comportamental. Esse 
ponto é ilustrado por Moore (2008) ao descrever como o comportamento verbal do cientista 
pode ser controlado por múltiplas variáveis. O autor descreve uma contingência na qual uma 
resposta verbal pode ser tanto controlada pelos dados experimentais produzidos e/ou 
estudados, quanto por tradições sociais e culturais. Assim, a resposta verbal pode tanto 
produzir um reforçador natural relacionado à melhor compreensão, predição e controle do 
comportamento, como por reforçadores sociais e culturais arbitrários. Isso significa que nem 
sempre uma prática verbal acerca da descrição do comportamento é selecionada por ser a 
mais eficaz em descrevê-lo. 
Sobre isso, se aplica o mesmo já havia sido comentado sobre o caso dos números 
decimais apresentado (com base em Thomas, 1920): mesmo que a mudança de práticas 
culturais pudesse ser benéfica em um sentido, o custo para de aplicar tais mudanças em 
aspectos tão enraizados de uma comunidade podem ser justificativa suficiente para não a 
fazer. 
86 
 
 
Alertar Sobre o Reforçamento Negativo. Uma explicação cultural específica para a 
manutenção da distinção apresentada Baron e Galizio (2005) - resgatada de Michael (1975) - 
foi a de que a distinção entre positivo/negativo poderiaajudar a alertar as pessoas sobre os 
aspectos indesejáveis do reforçamento negativo. 
Baron e Galizio (2005) apresentam três contrapontos de Michael (1975) a essa noção: 
1) se a distinção é ambígua e difícil de ser feita, a recomendação de usar uma forma de 
reforçamento em favor de outra seria difícil de ser seguida; 2) é uma questão empírica se os 
procedimentos chamados de reforçamento negativo são ou não indesejáveis; e 3) faria sentido, 
de qualquer forma, manter uma distinção conceitual básica por conta de possíveis implicações 
sociais? 
Sobre esse último ponto, vale comentar que se houver de fato implicações sociais 
ligadas ao uso de reforçamento positivo e negativo, isso significaria que existem diferenças 
entre os dois processos. Nesse sentido, faria sentido manter a distinção conceitual por conta 
dessa diferenças nos processos. 
De toda forma, Baron e Galizio (2005) demonstram concordar com os três pontos de 
Michael (1975) e adicionam que mesmo efeitos indesejados provocados por estímulos 
dolorosos podem ser compensados pela severidade do transtorno que se está evitando. Além 
disso, citam Perone (2003) para afirmar que procedimentos nomeados como reforçamento 
positivo também trazem aspectos indesejados como privação e perda de interessem em outras 
atividades. Para eles (Baron e Galizio, 2006a), assim como para Michael (1975), preferir 
intervenções agradáveis ao invés de desagradáveis não é o mesmo que preferir reforçamento 
positivo do que negativo. 
Sidman (2006) criticou a noção de Michael (1975) e Baron e Galizio (2005) de que o 
que é indesejável (ou não) seja uma questão empírica. Sidman afirma que essa é, na verdade, 
uma questão social e, como ciência, a análise do comportamento apenas pode oferecer para a 
87 
 
 
sociedade os dados produzidos. O autor criticou também o questionamento sobre se uma 
ciência deveria relacionar seu conteúdo com problemas da vida cotidiana. Para ele, espaços 
destinados para temas considerados importantes pela sociedade é necessário para a 
sobrevivência de qualquer ciência. 
Sobre isso, Baron e Galizio (2006a) ressaltaram seu ponto inicial: qualquer possível 
utilidade da distinção nesse sentido será limitada pela sua falta de clareza. Isso é piorado pelo 
fato de que muitos dos problemas que tornam o reforçamento negativo indesejável são 
também encontrados em procedimentos convencionalmente chamados de reforçamento 
positivo. Além disso, a prática de manter uma distinção numa ciência básica por conta de 
possíveis implicações sociais ainda assim é uma prática arriscada e evitada por outras 
ciências. 
Apesar de direcionadas, as falas dos autores parecer não estar abordando as mesmas 
coisas. Se o ponto de Michael (1975) era dizer que o laboratório irá apontar o que as pessoas 
devem desejar ou não, a crítica de Sidman (2006) de que o que é desejável ou não é uma 
questão social e não empírica é muito válida. Isso é verdade no sentido de que a análise do 
comportamento descreve os processos comportamentais, mas não define quais serão os 
eventos reforçadores ou não para as pessoas. Entretanto, o argumento de Michael pode abrir 
espaço para outra interpretação. Supondo que o que é considerado indesejável para a 
sociedade fosse a existência de efeitos colaterais, o que responderá que procedimentos 
produzem ou não esses efeitos será a experimentação empírica. Sobre esse ponto, Sidman e 
Michael pareceriam de acordo (mesmo que discordem sobre o que mostram os dados desses 
experimentos). 
Sidman (2006) também aponta que a análise do comportamento, enquanto ciência 
precisa necessariamente relacionar seu conteúdo com problemas cotidianos da sociedade. Isso 
é apresentado como um contraponto ao argumento de Baron e Galizio (2005) e Michael 
88 
 
 
(1975), mas não há por que pensar que ele se oporia a isso. Michael parece, inclusive, fazer 
uma separação semelhante com a de Sidman sobre o que é definido social ou empiricamente. 
Estes deveriam apenas descrever os fenômenos básicos observados, sem atribuição de valores 
éticos, por exemplo. Baron e Galizio (2006a) afirmam concordar com essa afirmação de 
Michael (1975). 
Ampliar a Aceitação da Análise do Comportamento. Segundo Lattal e Lattal 
(2006) apresentam uma função cultural específica da apesar de intervenções baseadas no que 
é chamado de reforçamento positivo não serem diferentes das baseadas no que é chamado de 
reforçamento negativo, as primeiras têm mais chances de serem aceitas socialmente. É 
possível que, para a população geral, o termo “positivo” indique o “tom” ou “intenção” do 
programa e do aplicador. Ele se aplica quando as descrições são feitas de forma “positiva” 
como em “aumentar a produtividade” ou busca por “satisfação”. 
A vantagem do uso da distinção, nesse caso, é acidental. Conceitualmente, os termos 
“positivo” e “negativo” nada tem a ver com “bom” e “ruim”, mas o entendimento público de 
que sim tornaram as intervenções “aditivas”, ou mais especificamente “descritas como 
aditivas” mais propensas a serem aceitas. Sobre isso, ainda vale o alerta de Baron e Galizio 
(2006a) de que se a população descobrisse que, em tese, não há qualquer relação entre as duas 
coisas, isso poderia ser malvisto. 
A Distinção se Dá por Outro Aspecto 
Relações Temporais, Relações com Outras Variáveis ou Papel em Discriminações. 
Baron e Galizio (2005) trouxeram algumas possíveis diferenças, apresentadas inicialmente 
por Michael (1975), entre os reforçamentos positivo e negativo (que não relacionadas ou 
adição ou subtração) que pudessem explicar o uso da distinção. A primeira delas diz respeito 
a temporalidade, relações com outras variáveis ou papel em discriminações. Nem Michael 
nem Baron e Galizio apresentaram explicações precisas desses três fatores ou porque eles 
89 
 
 
foram apresentados em conjunto. Ainda assim, apresentam os contra-argumentos de Michael 
a essa noção. Segundo ele, uma distinção a partir dessas particularidades não se sustentaria 
porque as propriedades das mudanças reforçadoras se diferem tanto entre tipos diferentes de 
reforçamento positivo quanto tipos diferentes de reforçamento negativo. Além disso, há muito 
mais semelhanças entre os chamados reforçamentos positivo e negativo do que diferenças. 
Por exemplo, quando analisadas as diferenças no comportamento a partir de alterações na 
magnitude, atraso ou esquemas de apresentação. 
Abruptidão da Mudança. Outra possibilidade resgatada por Baron e Galizio (2005) é 
a de que talvez mudanças nas condições de estímulo fossem mais abruptas no reforçamento 
negativo do que no positivo. Weiss e Laties (1961) sugeriram que a mudança de temperatura 
parece produzir resultados mais confiáveis do que o alimento por conta de sua imediaticidade. 
Para Michael (1975), mesmo que isso fosse verdade, essa distinção continuaria não sendo 
fundamental. Taxas de mudança são parâmetros de qualquer reforçamento e se Weiss e Laties 
tivessem utilizado atrasos nas mudanças de temperatura os efeitos seriam similares aos do 
alimento. Além disso, já é sabido que a forma de administração de uma mesma droga pode 
afetar grandemente os seus efeitos reforçadores por conta da velocidade de sua ação no 
organismo. 
Mecanismo Fisiológico Envolvido. Em retomada à Michael (1975), Baron e Galizio 
(2005) apontam que é possível que diferenças nos processos ou estruturas fisiológicas 
justificassem a distinção entre os reforçamentos positivo e negativo. Os dados disponíveis na 
época de Michael o fizeram concluir que a fisiologia não ajudava a elucidar a distinção. Ainda 
assim, Baron e Galizio se propuseram a investigar se dados posteriores a ele poderiam ser 
úteis. Segundo seus achados, estudos iniciais com fármacos sugeriram que drogas teriam 
ações diferentes sobre comportamentos mantidos por reforçamento positivo ou negativo. 
Entretanto, outros estudos (Keller & Morse, 1964) teriam mostrado que as diferenças entre os90 
 
 
efeitos teriam muito mais a ver com as taxas de resposta do que com o tipo de reforçamento 
envolvido. Sistemas dopaminérgicos já foram associadas a sistemas de recompensa do 
cérebro enquanto outros como o da amígdala e hipotálamo foram associados a processos de 
dor e medo. Entretanto, outros experimentos mostraram que mesmo em esquemas envolvendo 
fuga/esquiva padrões dopaminérgicos semelhantes foram observados. Outro ponto é que as 
relações estabelecidas por esses campos entre “centros de recompensa e punição” não 
correspondem diretamente às definições usadas na análise do comportamento. 
A partir disso, Baron e Galizio (2005) concluem que apesar de após 50 anos de 
literatura analisando a psicofisiologia do reforçamento, nenhuma conclusão clara pode ser 
tirada sobre a relação entre os tipos de reforçamento e mecanismos biológicos específicos. 
Vale comentar que desde aquela época novas pesquisas continuaram sendo feitas e algumas 
apontam para possíveis diferenças mecanismos subjacentes ao reforçamento positivo e 
negativo (e.g., Xu et al., 2021). Eles ressaltam, entretanto, que não houve diferenças 
comportamentais evidentes entre ambos. Nessa direção, pesquisas que analisem as afirmações 
de Michael (1975) e Baron e Galizio (2005) frente a esses novos dados poderiam ser valiosas. 
Emoções Envolvidas. Junto à sua análise anterior, Baron e Galizio (2005) 
apresentaram a possibilidade de que processos emocionais específicos pareciam ser eliciados 
por estímulos aversivos e apetitivos (Mowrer, 1960). Entretanto, segundo os autores, os dados 
da literatura não favoreceram essa visão. Até então, nenhuma forma de identificar emoções 
com base em padrões comportamentais específicos foi desenvolvida. Além do mais, estímulos 
que não provocam respostas afetivas (observáveis) já foram usados eficazmente como 
reforçadores. 
Ainda questionando o papel das respostas emocionais no reforçamento positivo e 
negativo, Baron e Galizio (2005) apresentam dados que mostram que respostas podem ser 
mantidas pela produção de choques (Morse & Kelleher, 1977; Pear, 2001), mas admitem que 
91 
 
 
esse dado é questionável porque só teria sido demonstrado diante de condições específicas 
com espécies específicas. Michael (2006), entretanto, responde a isso acrescentando outros 
dados (e.g., Azrin e Holz, 1966) que mostraram que choques podem funcionar tanto como 
estímulo discriminativo como reforçador positivo condicionado. Isso sustenta o argumento de 
Baron e Galizio de que dificilmente pode haver uma relação clara entre a distinção entre os 
reforçamentos positivo e negativo e os comportamentos respondentes eliciados pelos 
estímulos envolvidos. Essas afirmações parecem se basear na noção de que as respostas 
emocionais diante de um choque como reforçador negativo, um choque como punidor e um 
choque como reforçador positivo sejam as mesmas. Isso pode ser verdade em partes, mas 
muitos aspectos podem se diferenciar – isso é algo que precisaria de alguma fundamentação 
experimental. 
Sentimentos Envolvidos. Outra sugestão de Baron e Galizio (2005) foi que os 
sentimentos associados com a produção ou eliminação de estímulos reforçadores poderiam ser 
responsáveis pela manutenção da distinção. Enquanto Thorndike (1911) descreveu 
reforçadores positivos como satisfatórios, agradáveis e prazerosos, Mowrer (1960) disse que a 
retirada de estímulos aversivos era acompanhada de sentimento de alívio. 
Um primeiro contraponto apresentado pelos próprios autores (Baron e Galizio, 2005) é 
que basear a distinção nas diferenças entre sentimentos (respostas do organismo a eventos 
ambientais) implicaria em novas dificuldades para acessar esses eventos, tendo que recorrer, 
por exemplo, a relatos verbais. Isso iria na contramão de Skinner (1953/2014) que, apesar de 
não ter problemas com as descrições de sentimentos em si, recorreu ao ambiente como 
explicação causal para comportamentos. Basear-se em relatos verbais, além pouco confiável, 
pode ser, em alguns casos, completamente inviável - em estudos com animais e crianças 
pequenas, por exemplo. 
O segundo contraponto é que, mesmo que fosse aceito se basear em relatos verbais, 
92 
 
 
as distinções continuariam não sendo claras. Segundo Baron e Galizio (2005): 
De fato, a interrupção de estados de dor ou ansiedade pode evocar estados semelhantes 
ao prazer (por exemplo, pessoas com enxaqueca relatam sensações eufóricas quando a 
dor de cabeça é aliviada), e a cessação de incômodos leves também pode ser sentida 
como prazerosa (como ao coçar uma coceira), da mesma forma que a interrupção de 
estados prazerosos pode ser relatada como aversiva (Solomon, 1980; Solomon & 
Corbit, 1974). (p. 94). 
Esse segundo ponto pode ser questionado. Talvez fosse possível que um indivíduo 
aprendesse com ajuda de sua comunidade verbal a ficar sob controle e indicar 
diferencialmente os diferentes estados corporais por ele sentidos. Em outras palavras, pode ser 
que os sentimentos envolvidos em diferentes contingências fossem de fato diferentes e 
perfeitamente distinguíveis. Mas o que importa é que 1) como já foi indicado, se basear em 
relatos verbais geraria problemas de precisão e confiabilidade, muitos deles gerados pelo fato 
de que essas descrições são ensinadas por membros específicos de uma comunidade verbal 
que não necessariamente estão ensinando da mesma forma; e 2) mesmo que sentimentos 
pudessem ser precisamente indicados, isso não mudaria o fato de que as causas, e, portanto, os 
alvos de intervenção continuariam sendo as variáveis ambientais (Skinner, 1953/2014). 
Presença de Respostas Competidoras. Outra diferença apontada por Baron e Galizio 
(2005) que poderia ser responsável pela manutenção é o fato de que, no reforçamento 
negativo, o estímulo está presente antes da resposta e, portanto, tais estímulos podem 
eliciar/evocar respostas que compitam com a resposta selecionada pelos experimentadores. 
Segundo essa lógica, isso não se aplicaria ao reforçamento positivo porque não há estímulos 
antecedentes que pudessem eliciar ou evocar respostas competidoras. 
Essa proposta teria sido apresentada inicialmente por Catania (1973), e Hineline 
(1984), que havia criticado a distinção pela adição ou pelo acréscimo, reconheceu que esse 
93 
 
 
argumento poderia oferecer uma base melhor para uma distinção. Pierce e Cheney (2004) 
também endossaram esse argumento. Catania (1992), em retomada ao seu texto anterior, 
mencionou as respostas de “tremer” ou “se encolher” critério para nomear como reforçamento 
negativo o delineamento de Weiss e Laties (1961). 
Baron e Galizio (2005) problematizam essa possibilidade apontando que há tanto 
casos em que operações estabelecedoras de reforçadores positivos possam evocar 
comportamentos competidores quanto estímulos reforçadores negativos que não evocam ou 
eliciam esses comportamentos. Condições estabelecedoras de alimento como um reforçador 
frequentemente evocam, por exemplo, respostas de “checar” o comedouro. Da mesma forma, 
segundo Baron e Galizio (2005), comportamentos ditos mantidos por reforçamento negativo 
como encher um tanque antes que acabe a gasolina ou colocar um alarme para acordar no dia 
seguinte não parecem evocar respostas competidoras. 
Sobre os exemplos apresentados por Baron e Galizio (2005), vale destacar que a 
resposta de “checar o comedouro” pode competir com a resposta desejada, mas 
diferentemente do choque, isso necessária de um condicionamento. Um sujeito que não 
passou por treino ao comedouro ou por modelagem não tem essas respostas evocadas pela 
privação alimentar. Já o choque eliciaria respostas competitivas desde a primeira 
apresentação. 
Sobre os casos em que respostas competitivas não são emitidas, pode-se considerar as 
vezes em que se “enrola muito” para encher um tanque ou se que se “esquece” de colar um 
alarme. Isso de alguma forma poderia muito bem ser interpretado como consequênciada ação 
de respostas competidoras. Afinal, segundo Sidman (1989/2009) quaisquer respostas de fuga 
ou esquiva “não programadas” poderiam ser interpretadas como um efeito indesejável quando 
se usa a coerção. Outro ponto é que Baron e Galizio (2005) não explicitaram as operações 
motivadoras agindo nesses casos, dificultando uma análise mais profunda. 
94 
 
 
Fica parecendo que mesmo que respostas competidoras possam existir em 
contingências de reforçamento positivo, elas parecem diferir em alguns aspectos. Isso indica 
que novas investigações poderiam investigar esse critério como uma nova forma de distinguir 
reforçamentos (ou indicar outras possibilidades). 
Vale retomar que entre os autores classificados na categoria de “Publicações 
Posteriores a Michael (1975)” que abordavam sua crítica (Santos & Leite, 2013) estavam 
tanto Pierce (em Pierce & Epling, 1995) quanto Catania (1992), e ambos haviam dado a 
entender que concordavam parcialmente com a ambiguidade. Catania (1992) chegou a dizer 
que "o reforçamento sempre envolve mudanças na situação do organismo e inevitavelmente 
leva a diferenças na resposta antes e depois da mudança" (p. 101). 
Severidade das Operações Motivadoras. É possível que a intensidade das operações 
motivadoras envolvidas em um comportamento possa estar sendo usada para fazer a distinção 
positivo/negativo. Como base para esse argumento, Baron e Galizio (2005) apresentam a 
seguinte citação de Sidman (1989/2009): 
Prisioneiros são primeiro colocados em solitária e, posteriormente, o contato social 
lhes é permitido como reforçamento pela docilidade. Da mesma forma, após serem 
submetidos à privação extrema de alimento, podem então obtê-lo como retribuição por 
subserviência. Liberdade e alimento podem parecer reforçadores positivos, mas, 
quando são contingentes à cessação de privações artificialmente impostas, sua 
efetividade resulta do reforçamento negativo; eles se tornam instrumentos de coerção 
(Sidman, 1989/2009, p. 61) 
Nesse caso, Sidman (1989/2009) recorre à intensidade da privação de alimento ou ao 
fato de que a privação foi socialmente estabelecida - e não exclusivamente a adição ou 
subtração de estímulos - para classificar uma situação corresponde a reforçamento positivo ou 
negativo. 
95 
 
 
Para Baron e Galizio (2005), a abordagem de Sidman (1989/2009) sobre as diferenças 
é inovadora, mas acaba sendo limitada pelo fato de que não há formas precisas de mensurar 
diferentes operações motivadoras. Além disso, qual seria o critério para determinar a partir de 
qual intensidade de operação motivadora um tipo de reforçamento positivo se torna negativo 
ou vice-versa? 
Isso não foi apresentado por Baron e Galizio (2005), mas Skinner (1953/2014) fez 
comentários parecidos a respeito de dores geradas por privações de alimento muito intensas. 
Para ele, a privação de alimento que serve como “drive” para a resposta de comer é diferente 
da dor gerada pela privação intensa que poderia evocar a mesma resposta. 
De alguma forma, Sidman (1989/2009) e Skinner (1953/2014) parecem diferir sobre a 
forma de falar sobre os reforçamentos positivo e negativo diante dessas condições. 
As pontadas de fome são uma possível fonte de confusão entre privação e estimulação 
aversiva. Como a fome é o impulso mais comum, tendemos a modelar nossa 
formulação de todos os impulsos com base nela. Mas vimos que as pontadas não são 
representativas dos impulsos em geral e que, mesmo no caso da fome, elas exigem 
uma formulação separada. Na medida em que se come para reduzir as pontadas de 
fome, o comportamento é aversivo. (Skinner, 1953/2014, p. 173) 
Enquanto para Sidman (1989/2009) uma intensidade suficientemente alta da operação 
estabelecedora parece suficiente para classificar a situação como reforçamento negativo, 
Skinner (1953/2014) distingue a privação de alimento da dor por ela gerada. Isso não foi dito 
diretamente, mas poder-se-ia entender que, para Skinner, nos casos em que uma privação 
intensa elicia dores abdominais, a resposta de comer poderia estar sendo mantida tanto por 
reforçamento positivo quanto negativo, isto é, por duas mudanças ambientais distintas ao 
invés de uma só que é mais ou menos intensa. 
Por outro lado, Skinner (1953/2014) também comenta: 
96 
 
 
A retirada de um reforçador positivo tem, por definição, o mesmo efeito que a 
apresentação de um negativo. Tirar privilégios não é muito diferente de estabelecer 
condições aversivas [...]. Suponha que tenhamos privado um homem da permissão 
para deixar um campo militar até que uma determinada tarefa seja realizada, e suponha 
que, em ocasiões anteriores, a realização de tarefas semelhantes tenha sido seguida 
pela restauração desse privilégio. Teríamos gerado um estado de privação, no qual o 
comportamento que foi reforçado pela devolução de privilégios estará fortalecido, ou 
teríamos apresentado uma condição aversiva da qual o indivíduo só pode fugir 
realizando a tarefa exigida? É possível, é claro, que tenhamos feito ambos. Na prática, 
a distinção pode parecer de pouca importância, mas certos efeitos colaterais dependem 
da medida em que cada um dos dois fatores está envolvido. (p. 173). 
Nesse caso, Skinner (1953/2014), mesmo antes de Sidman (1989/2009) parece ter 
indicado que apesar de o efeito principal (fortalecedor da resposta) ser o mesmo, a diferença 
nos efeitos colaterais produzidos é diferente. Isso aponta para a necessidade investigação 
específica sobre as diferenças entre efeitos colaterais como elemento chave para a distinção 
entre os reforçamentos positivo e negativo (no lugar da adição e subtração). 
Partindo desse princípio, para definir quando uma determinada contingência de 
reforçamento seria positiva ou negativa, um novo critério de distinção para substituir o de 
adição/subtração seria a presença ou não de efeitos colaterais. Nesse sentido, algumas 
investigações a respeito dos efeitos colaterais (pelo menos como apontados por Sidman, 
1989/2009) já foram realizadas. 
Fontes e Shahan (2020) analisaram os efeitos colaterais descritos por Sidman, frente a 
dados experimentais - especialmente no contexto da punição. Os autores confirmaram parte 
desses efeitos, como a punição condicionada, a fuga, a esquiva e a agressão induzida, mas 
também mostraram que esses efeitos são variáveis e dependem de fatores como intensidade 
97 
 
 
do estímulo, contexto e presença de reforçamento alternativo. Quanto ao contracontrole, 
afirmaram que não há evidência experimental suficiente para tratá-lo como um conceito 
particular. 
Perone (2003) também criticou o “endosso abrangente” de Sidman ao reforçamento 
positivo, apontando que reforçadores positivos podem gerar efeitos colaterais semelhantes aos 
do controle aversivo. Ele cita exemplos em que reforçadores positivos, por dependerem de 
privações intensas ou relações verbais complexas, acabam gerando queixas ou 
comportamentos de fuga. Além disso, apresenta dados experimentais que mostram que 
estímulos considerados aversivos podem não funcionar como reforçadores negativos, mas 
como punidores, sugerindo que a função de um estímulo pode variar dependendo da 
contingência em que está inserido. 
Essa discussão mostra que, para que um critério baseado em efeitos colaterais pudesse 
ser adotado, muito ainda precisaria ser investigado para se definir mais precisamente quais 
são eles e como identificá-los. 
Saliência ou Discriminabilidade. Chase (2006) sugere que a distinção pode ter sido 
mantida porque talvez uma direção da mudança (positiva ou negativa) seja mais 
discriminável, mensurável ou mais facilmente descrita do que a outra direção de mudança. 
Vale comentar que há uma diferença grande entre ser discriminável ou mensurável e ser mais 
facilmente descrita. Quando se diz que calor foi adicionado ou frio foi subtraído, pode-se 
preferir uma descrição à outra. Ainda assim, o estímulo discriminativo para esse tato foia 
própria mudança de temperatura (e.g., de 10 para 20 °C) - e esse também é o fenômeno 
mensurável. Nesse sentido, as diferentes direções existem apenas enquanto descrições, mas o 
fenômeno em si continua o mesmo. 
Propriedades Particulares dos Estímulos Usados. Uma última explicação 
apresentada para a manutenção da distinção foi a de Lattal e Lattal (2006) que sugeriram que 
98 
 
 
é possível que as diferenças comportamentais entre os reforçamentos positivo e negativo 
tenha mais a ver com diferenças particulares entre os estímulos usados nesses estudos do que 
com categorias mais amplas de estímulo ligados separados pelos critérios de apresentação e 
remoção. Skinner (1953/2014) quando discute os efeitos de uma luz forte, um som alto ou um 
choque afirma “estímulos aversivos eliciam reflexos e geram predisposições emocionais que 
muitas vezes interferem no operante a ser reforçado. Assim é difícil observar o efeito do 
reforçamento negativo isoladamente” (p.188). 
Nesse sentido, pode ser que as diferenças até então observadas entre reforçadores 
positivos e negativos possam sim, estar relacionadas aos estímulos específicos até então nos 
estudos de cada tipo. Entretanto, ainda é possível que algum fatores ainda possam determinar 
se esses estímulos formam ou não um grupo coeso sobre algum aspecto. Como discutido, os 
estímulos eliciadores relacionados a condições antecedentes de reforçamento positivo (e.g., 
uma privação) parecem escassos, enquanto os ligados a reforçamento negativo que foram 
estudados estão se fizeram bastante presentes. 
Sugestões para a Manutenção 
Falas em que os autores apontaram para a necessidade de se fazer algo relacionado ao 
uso da distinção entre os reforçamentos positivo e negativo. Dentre os trechos classificados 
como “Sugestões para a Manutenção”, identificou-se falas que sugeriam manter a distinção 
com ressalvas, fazer investigações ou rever os termos usados. 
Rever os Termos Usados 
Sidman (2006) declara que abraçaria novos termos que lidassem com os problemas 
apresentados por Baron e Galizio (2005), mas que mantivessem as noções de fuga e esquiva 
como formas de reforçamento. Ele sugere que uma possibilidade de manter a distinção 
lidando com a confusão gerada por ela no ensino de análise do comportamento seria substituir 
99 
 
 
o termo “reforçamento negativo” por algo que não gerasse a preconcepção de equivalente à 
punição – mas que ele não teria conseguido pensar em um termo. 
Manter a Distinção com Ressalvas 
Baron e Galizio (2005) sugeriram que se a área optar por manter a distinção entre os 
dois tipos de reforçamento, cautela deve ser tomada na forma como os termos serão usados. A 
seguir, alguns autores apresentaram formas específicas em que essa cautela pudesse ser 
mantida. Entre elas, o reconhecimento das ambiguidades, o abandono da distinção em casos 
complexos, a descrição precisa das condições envolvidas e um ensino inicial da distinção. 
Reconhecer a Ambiguidade. Chase (2006) propôs que, no ensino da análise do 
comportamento, seria importante apontar para os alunos que todos os exemplos de um tipo de 
reforçamento envolvem também o outro tipo. Na mesma direção, Lattal e Lattal (2006) 
ressaltaram a importância de que estudantes e profissionais da área compreendam as 
dificuldades lógicas e empíricas da distinção (tal como outras complexidades da disciplina). 
Por fim, Baron e Galizio (2005) apontaram que lembrar das ambiguidades inerentes à 
distinção talvez já diminua as chances de que ela seja usada como base para justificar decisões 
éticas ou práticas. 
Abandoná-la em Casos Complexos. Após apresentar seu exemplo hipotético já 
mencionado do rato no qual dois estímulos foram condicionados por vários outros, Michael 
(1975) sugeriu que, pelo menos nos casos complexos nos quais determinados estímulos foram 
condicionados a vários estímulos, a distinção deveria ser abandonada. Vale lembrar que 
Michael, em seguida, complementou sua fala dizendo que casos complexos desse são 
universalmente humanos e, enquanto ciência dedicada aos problemas do ser humano, a 
distinção tornar-se-ia inútil. 
100 
 
 
Descrever Precisamente as Condições. Iwata (2006) se posicionou dizendo que não 
via prejuízo na manutenção da distinção positivo/negativo desde que as condições rotuladas 
como positivas ou negativas fossem bem descritas. 
Ensinar a Distinção Inicialmente. Nakajima (2006) sugere que uma análise a partir 
de duas perspectivas pode trazer uma melhor compreensão sobre casos. Apesar disso, alunos 
teriam dificuldades para aprender uma perspectiva de dois lados sem antes terem aprendido a 
analisar casos a partir de um ponto de vista fixo. Dessa forma, Nakajima recomenda que uma 
abordagem de perspectiva única deveria ser ensinada inicialmente. 
Fazer Mais Investigações 
Investigar as Definições Existentes. Sidman (2006) sugeriu que os problemas de 
definição apontados por Baron e Galizio (2005) e reconhecidos por ele, deveriam levar não a 
um abandono completo da distinção, mas a pesquisas que ajudem a esclarecer as definições já 
existentes. O próprio artigo de Santos e Leite (2013) é um bom exemplo disso. 
Abandonar um conceito de uma hora para a outra poderia deixar uma lacuna que faz 
mais mal do que bem. Se problemas de definição fossem encontrados entre os conceitos de 
discriminação e generalização, abandoná-los (ao invés de aprimorá-los) tornaria difícil falar 
sobre controle estímulos. Talvez a questão principal com a distinção positivo/negativo, como 
já comentado, não é que a forma como se fala das mudanças ambientais (e.g., adição ou 
subtração) precise ser descartada. A pergunta é: o que é ganho ao se criar uma categoria 
específica para descrições de um tipo ou de outra? Como já discutido, se o critério de adição e 
subtração parece arbitrário, talvez outros fatores o estejam controlando a distinção. 
Investigar Mudanças Paramétricas. Iwata (2006) havia argumentado contra a 
dificuldade de classificação, dizendo que mesmo nos casos em que as mudanças de estímulo 
ocorrem num contínuo, elas ainda envolvem aumento ou diminuição de uma característica do 
estímulo. Isso parece levar a conclusão de que, mesmo nesses casos, mudanças reforçadoras 
101 
 
 
ainda poderiam ser classificadas como positivas ou negativas. Apesar disso, o autor 
completou que “se tais mudanças paramétricas funcionam como reforçamento positivo ou 
negativo requer uma análise mais aprofundada” (p. 122), destacando (em dois momentos 
diferentes em seu texto) a importância dos apontamentos de Baron e Galizio (2005) para isso. 
Iwata afirma que uma investigação dessa natureza seria importante não só para o estudo do 
reforçamento, mas também da extinção e punição. 
Vantagens do Abandono 
Baron e Galizio defenderam que há benefícios em se focar mais no contexto completo 
de uma mudança ambiental reforçadora do que na dicotomia adição/subtração. Além deles, 
Nakajima (2006) também apresentou uma suposta vantagem do abandono que será discutida 
mais adiante. Dessa forma, os pontos a seguir representam as falas em que os autores 
apontaram benefícios relacionados ao abandono da manutenção entre os reforçamentos 
positivo e negativo. Dentre os trechos classificados como “Vantagens do Abandono”, 
identificou-se falas que apontavam que adotar uma perspectiva que não faz uso da distinção 
geraria menos distorções, melhoraria a descrição das mudanças e evidenciaria as mudanças 
envolvidas no reforçamento. 
Gera Menos Distorções 
Segundo eles (Baron e Galizio, 2006a), mesmo falando apenas em reforçamento, nada 
impede que um analista do comportamento possa enfatizar ou defender o uso de determinadas 
práticas com base no objetivo do tratamento. A vantagem de se abandonar a distinção estaria 
no fato de que isso seria feito sem distorções ou usos indevidos dos termos. 
Melhora a Descrição das Mudanças 
Com base nos diversos caso já apresentados, em seu segundotexto de resposta, Baron 
e Galizio (2006b) comentaram que os eventos reforçadores são “melhor descritos em termos 
de uma mudança na estimulação, independentemente da direção dessa mudança” (p. 274). 
102 
 
 
Eles citam o exemplo do participante humano que trabalha por dinheiro. Nesse caso, não 
haveria diferença se o ganho do dinheiro é indicado pelo acendimento de uma luz apagada ou 
desligamento de uma luz acesa e, dada a impossibilidade ou arbitrariedade de se classificar a 
mudança como positiva ou negativa, acaba sendo mais preciso descrever a mudança sem 
direção específica. Vale ressaltar que o que Baron e Galizio chamaram de “direção da 
mudança” refere-se a escolher descrever a mudança como adição ou subtração. Naturalmente 
uma direção na mudança continua existindo: a temporal. 
Distinguir Dois Reforçadores para a Mesma Resposta 
Por último, Nakajima (2006) nomeia o abandono da distinção como abordagem de 
“duas faces”, se referindo ao fato de que ela olha para os dois lados da mudança. A partir 
disso, o autor afirma que pode existir uma vantagem nessa abordagem já que ela reconhece 
que tanto o reforçamento positivo como o negativo possam estar operando num mesmo caso. 
Esse é exatamente o argumento contrário ao apresentado por Chase (2006) e presente 
também em Iwata (2006). Para eles, uma vantagem da manutenção seria a de que ela ajuda a 
distinguir duas mudanças para uma mesma resposta. Como já discutido, não há motivos para 
pensar que uma coisa dependeria da outra. Mudanças diferentes são distinguíveis porque são 
eventos diferentes e não porque são ou não de tipos diferentes. 
Sobre dizer que a distinção ajuda na separação de tipos diferentes de reforçamento 
para uma mesma resposta, poder-se-ia dizer também que ela atrapalha na separação de tipos 
iguais de operações (e.g., dois reforçadores positivos) para uma mesma resposta. E sobre dizer 
que o abandono da distinção ajuda na distinção porque “olha para os dois lados”, os dois lados 
olhados são, na verdade, descrições opostas de uma mesma mudança, e não duas mudanças 
diferentes. Um exemplo de que o abandono não ajuda na distinção foi apresentado no 
subtítulo “Explicações para a Manutenção” no subtópico “Distinguir dois Reforçadores para a 
Mesma Resposta”. 
103 
 
 
Talvez uma sugestão a ser tirada seja que é necessário estar atento para identificar 
diferentes mudanças ambientais, mas essas mudanças não necessariamente precisam diferir 
em seus tipos. 
Explicações para o Abandono 
Apesar de o abandono da distinção não ter sido adotado amplamente na comunidade 
analítico-comportamental, foram apresentados alguns possíveis motivos pelos quais alguns 
autores estejam sugerindo o abandono da distinção entre os reforçamentos positivo e negativo. 
Em sua maioria, explicações foram apresentadas por autores contra a distinção ou incertos em 
seções específicas dedicadas a especular as razões pelas quais a distinção foi mantida. Dentre 
os trechos classificados como “Explicações para o Abandono”, identificou-se falas que 
apontavam para a distinção como sendo funcional em algum sentido ou controlada por outro 
aspecto que não a adição/subtração. 
A Distinção é Mal-entendida 
Para Sidman (2006) o desconforto de Baron e Galizio (2005) com a distinção pode 
originar da sensação de que a, por algum motivo, a distinção reflete diferenças no próprio 
processo de reforçamento para eles. É nesse ponto que o autor deixa explícito que esse não é o 
caso, e que a discussão de Baron e Galizio deveria dissuadir qualquer um que achasse isso. 
Sabendo que Sidman (2006), em seu texto como um todo, busca defender a 
manutenção da distinção, faltaria entender o que a distinção representa ou então o que ele quis 
dizer quando disse “processo”. Se a diferença for apenas descritiva, ele estaria perfeitamente 
de acordo com Baron e Galizio (2005). Isso iria, entretanto, na contramão com outras de suas 
próprias afirmações nesse e em outros textos. Ao longo do texto o autor sugeriu que é possível 
determinar se uma mudança se trata de uma adição ou subtração e, nos casos em que não for, 
novas pesquisas deveriam focar em tornar isso possível. 
104 
 
 
Dito isso, outra possibilidade é que ao dizer que os processos são iguais, ele quer dizer 
que o efeito (aumento na probabilidade da resposta) é o mesmo, mas que a diferença entre 
adição e subtração ainda existe - e que a isso podem ser atribuídos os efeitos colaterais 
gerados pelo reforçamento negativo (Sidman, 1989/2009). Ainda assim, não se pode ter 
certeza do que a distinção representa exatamente para ele. 
A Distinção Não É Mais Útil 
Outra explicação apresentada para o abandono da distinção é simplesmente a de que o 
que em determinado momento do desenvolvimento da ciência comportamental foi útil, agora 
não é mais. Para Marr (2006) uma ciência, inicialmente, pode recorrer a distinções vagas 
antes de atingir um maior entendimento dos seus objetos de estudo. Conforme o estudo dessa 
ciência avança, pode ser que distinções que eram explícitas possam tornar-se cada vez mais 
confusas e até sumirem. 
Marr (2006) apresenta alguns exemplos desse fenômeno: 1) chuva e neve podem 
parecer muito distintas, mas de uma perspectiva molecular elas tornam-se exatamente iguais; 
2) a queda de uma maçã na Terra e a órbita da Lua funcionam a partir do mesmo mecanismo; 
3) eletricidade e magnetismo antes eram tratados de forma muito separada, mas hoje sabe-se 
que estão intimamente ligados. 
Um ponto parecido já havia sido apresentado por Michael (1975) na Introdução. 
Michael havia afirmado que talvez os conceitos de reforçamento positivo/negativo se 
tivessem sido eficazes na formação de um novo conhecimento por fazerem paralelos com 
outros conceitos de fora, mas que seu uso não mais era útil. 
Sugestões para o Abandono 
Falas em que os autores apontaram para a necessidade de se fazer algo relacionado ao 
abandono do uso da distinção entre os reforçamentos positivo e negativo. Dentre os trechos 
105 
 
 
classificados como “Sugestões para o Abandono”, identificou-se falas que sugeriam a 
mudança dos termos usados ou o abandono completo da distinção. 
Mudar os Termos Usados 
Falar de Cada Tipo de Reforçamento. Outra sugestão de Sidman (2006) ligada à 
revisão dos termos usados na distinção é a de abandonar a distinção entre positivo e negativo 
e falar de cada tipo diferente de reforçamento. Como exemplos, ele cita o reforçamento por 
comida, água, sexo, fuga e esquiva. Os exemplos citados parecem contrastar com a sugestão 
de abandonar a distinção porque dois dos exemplos dele (i.e., fuga e esquiva) representam 
tipos de reforçamento negativo. Diferentemente dos outros exemplos, Sidman não especificou 
os reforçadores envolvidos na fuga/esquiva, mas o fez para os casos tipicamente considerados 
como reforçamento positivo. Faria mais sentido, por exemplo, mencionar, no lugar, choques, 
tons altos e jatos de ar quente, por exemplo. 
Talvez esse contraste mostre que Sidman (2006) não esteja completamente disposto a 
abandonar a distinção. Como ele mesmo havia afirmado, o autor só aceitaria novos termos 
que mantivessem as noções de fuga e esquiva como formas de reforçamento. De toda forma, a 
possibilidade apresentada pelo autor (levando em conta as considerações feitas) talvez fosse 
benéfica. Como já haviam sugerido Lattal e Lattal (2006), é muito possível que quaisquer 
diferenças atribuídas aos reforçamentos positivo e negativo, na verdade, tenham mais a ver 
com diferenças os reforçadores específicos tipicamente usados (e.g., alimento e choque). 
Dessa forma, estudar individualmente cada tipo de reforçador e seus efeitos sobre o responder 
poderia ser uma forma mais rigorosa de se falar sobre reforçamento. Ainda assim, novos 
critérios sobre como tratar estímulos condicionados (em especial condicionados 
generalizados) seriam necessários. 
Abranger Todo o Contexto Ambiental. Para disputara noção de Staats (2006) de 
usar aproximação/evitação como critérios para classificar contingências como positivas ou 
106 
 
 
negativas, Baron e Galizio (2006b) haviam apresentado um contraexemplo contrastando uma 
condição de VI 30s e VI 10s para mostrar. Nesse caso, se o rato se deslocasse da caixa onde 
foi reforçado em VI 10s, isso implicaria que a condição VI 10s seria aversiva. Para eles, essa 
situação hipotética aponta para a necessidade de utilizar uma abordagem mais compreensiva 
que considere as funções reforçadoras de estímulos em um contexto mais amplo que inclua 
condições de reforçamento distintas (como a apresentada). 
Abandonar a Distinção por Completo 
Falar Apenas em Reforçamento e Punição. Baron e Galizio (2005) concluem que as 
ambiguidades apresentadas mostram que não há base para a manutenção da distinção entre os 
reforçamentos positivo e negativo e que nada seria perdido ao abandoná-la. Como 
continuação de sua sugestão anterior, Baron e Galizio (2006b) sugerem que além de se 
descrever tanto as condições pré-mudança quanto pós mudança, é importante analisar se a 
mudança de uma condição para a outra mantém ou suprime comportamentos. Dessa forma, 
Baron e Galizio se alinham a Michael (1975) em dizer que o que faz mais sentido é distinguir 
apenas entre reforçamento e punição. Os autores (Baron e Galizio, 2005) afirmam ter chegado 
na mesma conclusão de Michael de que os conceitos de reforçamento e punição dão conta da 
teoria analítico-comportamental e oferecem uma forma de se referir a “prazer” e 
“desconforto”. 
Sidman (2006) critica essa substituição acrítica do reforçamento positivo e negativo 
pelos conceitos de reforçamento e punição. O autor aponta que o conceito de punição também 
contém seus problemas de definição. Sidman parte da definição de punição como uma 
consequência que diminui a probabilidade de um comportamento. Diante disso, ele apresenta 
alguns exemplos que ilustram a inconsistência desse conceito: 
Quando a correção feita por um professor garante que a resposta errada de um aluno 
nunca mais ocorra, essa resposta foi punida pelo professor? Quando um responsável 
107 
 
 
faz uma criança parar de comer entre as refeições ao esconder o pote de biscoitos, o 
ato de comer biscoitos foi punido? Se uma criança para de se comportar mal após ser 
pedida para parar, esse comportamento foi punido? Quando peço algo e a resposta é 
"não", o fato de eu não repetir o pedido indica que ele foi punido? (Sidman, 2006, p. 
137) 
Sidman (2006) de alguma forma parece ter usado os próprios argumentos de Baron e 
Galizio (2005) contra eles próprios com relação, agora, a uma outra distinção. De fato, como 
distinguir se uma criança foi punida pela resposta errada, ou se condições para a emissão da 
resposta certa foram apresentadas e ela se estabeleceu? 
Sobre a crítica de Sidman (2006), Baron e Galizio (2006a) responderam que: 
Ao longo dos anos, essa visão perdeu força, em grande parte devido à análise 
convincente de Azrin e Holz (1966), que colocou a punição no mesmo patamar do 
reforçamento. Segundo eles, a característica distintiva da punição é que ela enfraquece 
o comportamento, tornando-a, assim, o oposto do reforçamento, que fortalece o 
comportamento. (Baron e Galizio, 2006a, p. 149). 
Da mesma forma que o abandono da distinção acabaria prezando por uma parcimônia 
científica no sentido de diminuir o número de conceitos necessários para se explicar 
fenômenos, a adoção de uma visão assimétrica de punição proposta por Skinner (1953/2014) 
também caminha nesse sentido. Sidman afirma que a definição de punição sugerida por Azrin 
e Holz (1966) foi adotada rapidamente pela comunidade sem discussões extensivas a seu 
respeito. Nesse sentido, Sidman aponta para o mesmo problema sugerido por Lattal e Lattal 
(2006) de que uma diferença entre dois conceitos teria sido assumida a priori, sem evidências 
suficientes para tal. As implicação da distinção entre reforçamento positivo e negativo sobre o 
conceito de punição serão discutidas mais adiante em um subtítulo dedicada. 
108 
 
 
Ensinar Sobre a Distinção e Abandoná-la. Michael (2006) aponta para o fato de que 
por conta de a distinção ser tão difundida na área, existe uma necessidade de aprendê-la para 
que se possa compreender muito do que é e já foi produzido. Nesse sentido, o autor sugere 
que a distinção seja descrita da forma tradicional, depois que a sua ambiguidade seja apontada 
e, no resto do tempo, se deixe de usá-la. 
Assumir Simetria Entre os Reforçamentos 
Marr (2006), desenvolveu uma longa discussão a respeito da simetria entre conceitos 
na análise do comportamento e em outras áreas com destaque para a área de controle de 
estímulos. A partir disso, o autor faz a seguinte sugestão sobre o dilema positivo/negativo: 
Podemos tirar uma lição da simetria entre discriminação e generalização mencionada 
anteriormente. Nesse caso, as distinções se baseiam nos procedimentos e nas 
mudanças de comportamento que desejamos enfatizar. Em ambos os casos, estamos 
falando de controle de estímulos. (Marr, 2006, p. 128). 
Para Marr (2006), a discriminação e a generalização são “dois lados da mesma moeda 
que chamamos de controle de estímulos” (pp. 125-126). A distinção entre elas não está em 
uma diferença ontológica dos processos, mas no que o analista escolhe enfatizar: em um se 
enfatiza semelhanças no responder frente a diferentes estímulos e, no outro, diferenças no 
responder frente a diferentes estímulos. Diante disso, Marr sugere que, enquanto não houver 
evidências convincentes de uma diferença funcional entre os dois supostos tipos de 
reforçamento, parece ser mais útil assumir a simetria até que evidências contrárias surjam. 
Nesse sentido, Marr (2006) problematiza a forma como a distinção é feita dizendo que 
não existem diferenças funcionais claras ou fundamentais entre o que se convencionou 
chamar de reforçamento positivo e reforçamento negativo tanto no efeito sobre o 
comportamento quanto sobre como agem no organismo. Os procedimentos são sim diferentes, 
mas isso não representaria, para Marr, uma diferença fundamental nos processos. O autor não 
109 
 
 
chega a explicitar, mas talvez nesse sentido ele mantivesse os termos como forma de enfatizar 
diferentes procedimentos. 
Sugestões Neutras 
Falas em que os autores apontaram para a necessidade de se fazer algo não 
especificamente relacionado ao uso ou desuso da distinção entre os reforçamentos positivo e 
negativo. Dentre os trechos classificados como “Sugestões Neutras”, identificou-se falas que 
sugeriam fazer investigações, focar no que é palpável, revisar os termos usados ou adaptar a 
linguagem usada. 
Fazer Mais Investigações 
Investigar o Uso da Distinção em Outras Áreas. Chase (2006) sugeriu que 
investigar a distinção entre os termos positivo e negativo em outras áreas do conhecimento 
que fazem uso dela, poderia ajudar a determinar os motivos pelas quais a comunidade de 
analistas do comportamento também o faz. Isso se relaciona com as possíveis funções 
culturais da distinção já apresentadas (Chase, 2006; Lattal e Lattal; 2006). 
Investigar Definições de Operações, Efeitos e Causas. Marr (2006), sugere que um 
nó precisa ser resolvido a respeito da mistura entre o que seriam procedimentos (ou 
operações), os efeitos desses procedimentos e as razões para os efeitos observados antes que 
se possa resolver o dilema da distinção positivo/negativo. Dando como exemplo o caso da 
extinção: o procedimento seria a remoção de uma consequência reforçadora que está 
mantendo um comportamento, o efeito seria a diminuição da probabilidade dessa resposta e as 
razões para a diminuição poderiam ser o estabelecimento de outros comportamentos no lugar 
desse ou até mesmo um efeito punitivo da extinção. A partir disso, Marr afirma que o 
procedimento e o efeito do reforçamento são minimamente definidos, mas as razões pelas 
quais osefeitos ocorrem não. 
110 
 
 
Essa última afirmação é de se estranhar considerando que as explicações para o 
reforçamento foram muito bem delimitadas por Skinner (1953/2014). O efeito do 
reforçamento se explica pelo fato de que animais possuírem organismos aptos a, diante da 
produção de reforçadores, terem a probabilidade das respostas que os produziram aumentada - 
algo selecionado filogeneticamente. No mesmo sentido, os valores dos reforçadores 
incondicionados foram estabelecidos filogeneticamente porque indivíduos que tinham tais 
estímulos como reforçadores tiveram mais chance de sobreviver e reproduzir. Os reforçadores 
condicionados adquiriram funções semelhantes às dos estímulos aos quais foram 
sistematicamente pareados. fato, é possível pensar que em um reforçamento alimentar, por 
exemplo, a operação seja a adição do alimento após uma resposta, o efeito seja o aumento da 
probabilidade da classe de respostas que o produziu e seria difícil pensar numa “razão para o 
efeito observado”. Talvez para Marr a diferença fosse que a extinção seria um processo 
derivado do comportamento, enquanto as razões para o reforçamento estão na história 
evolutiva das espécies. 
Como Marr (2006) apontou, umas das possíveis razões para a diminuição na 
frequência observada poderia ser aumento na frequência de outras respostas. Nesse sentido, o 
mesmo poderia ser argumentado sobre a punição. Considerando uma punição por choque, a 
operação seria a adição do choque após a resposta, o efeito observado seria diminuição da 
probabilidade da classe de respostas que o produziu e a razão para o efeito observado poderia 
ser, por exemplo, o reforçamento de outros comportamentos. Essa visão sugeriria que a 
punição seria também um processo derivado do reforçamento (o que estaria alinhado com 
uma perspectiva assimétrica de punição). 
A discussão em torno da distinção entre reforçamento positivo e negativo parece 
esbarrar em um problema conceitual mais fundamental: a falta de clareza e consenso sobre os 
termos “operação”, “efeito” e “razão” (ou explicação) para os efeitos observados. Como 
111 
 
 
sugerido por Marr (2006), sem uma delimitação clara desses termos, o debate corre o risco de 
se perder com cada autor enfatizando aspectos distintos do mesmo fenômeno. Enquanto uns 
focam nas operações (mudanças ambientais observáveis), outros priorizam possíveis razões 
que explicam alterações. Investigações teóricas sistemáticas que esclareçam essas distinções 
seriam fundamentais. Elas poderiam não apenas tornar o debate sobre o reforçamento mais 
produtivo, mas também oferecer maior precisão na formulação de conceitos centrais da área. 
Investigar a Relação Entre Condicionamento Operante e o Emocional. Como já 
tratado anteriormente, Staats (2006) argumenta que, quando o comportamento é considerado 
em sua totalidade, há grandes diferenças entre os reforçadores positivos e negativos. Com 
base nisso, ele propõe que a relação entre o condicionamento operante e o condicionamento 
respondente (ou emocional) seja investigada de forma sistemática por meio de estudos básicos 
com animais, nos quais variáveis comportamentais como privação e saciação sejam 
manipuladas. O autor cita alguns estudos iniciais realizados com humanos (Harms & Staats, 
1978; Staats & Hammond, 1972; Staats & Warren, 1974), bem como análises funcionais de 
comportamentos humanos (Staats, 1975, 1996), mas não explicita os resultados desses 
estudos. Sua sugestão se baseia na necessidade de expandir esse campo de pesquisas 
experimentais com animais e humanos. 
Realizar Experimentos que Abordem a Distinção. Lattal e Lattal (2006) 
argumentaram que a distinção entre reforçamento positivo e negativo foi assumida sem que 
houvesse evidências suficientes que a fundamentassem. Como já discutido no subtítulo “A 
Distinção Não Tem Fundamentação Experimental Suficiente”, os autores apontaram que as 
pesquisas realizadas até então não permitiam a formulação de conclusões sólidas, seja porque 
as diferenças entre os procedimentos comparados iam além das operações envolvidas, seja 
porque poderiam ser atribuídas a particularidades dos estímulos reforçadores utilizados. Ainda 
assim, caso houvesse fundamentos para uma distinção formal ou estrutural entre os dois tipos 
112 
 
 
de reforçamento, seria necessário que suas diferenças fossem testadas diretamente por meio 
de delineamentos experimentais adequados. O problema, apontado pelos próprios autores, é 
que faltam estudos com esse objetivo específico. 
Lattal e Lattal (2006) sugeriram que, dada as dificuldades de se comparar o responder 
mantido por comida e choque, uma comparação indireta, mas sob uma condição comum 
talvez seja possível. Hearst (1962), por exemplo, comparou a performance de macacos rhesus 
treinados por reforçamento alimentar e esquiva de choque. A generalização de ambos foi 
comparada e o gradiente de generalização da esquiva por choque era mais achatado 
(indicando maior generalização). Outro exemplo foi o de Nevin (1974), que testou a 
resistência à mudança de dois treinos diferentes frente a um mesmo disruptor e identificou 
que esse tipo de comparação pode ser útil para investigar se há diferenças empíricas entre 
respostas mantidas por condições nominalmente distintas de apresentação e remoção de 
estímulos. 
Muitos dados úteis podem ser tirados da comparação entre esquemas mantidos pelo 
que é tipicamente chamado de reforçamento positivo ou negativo, mas os parâmetros pelos 
quais isso é possível são muito limitados. Levando em conta o que já foi discutido sobre todos 
os reforçadores (incluindo a sua ausência) poderem ser vistos como parte de um contínuo, 
qual padrão (i.e., topografia) e intensidade de choque deveriam ser usados numa comparação 
com o responder mantido por uma pelota de determinado alimento? Hearst (1962) especificou 
qual o alimento usado, mas não apresentou qualquer critério para a escolha do choque 
(padrão, intensidade, duração, intervalo etc.). O que garantiria, nesse caso, que as diferenças 
observadas entre os gradientes de generalização tinham a ver com diferenças nos tipos de 
reforçamento e não com as magnitudes dos reforçamentos providos pelos estímulos 
específicos? Se conclusões não podem ser tiradas nem quanto aos estímulos específicos, 
113 
 
 
seguindo a lógica de Lattal e Lattal (2006), menos ainda poderia ser dito sobre as diferenças 
entre reforçamento positivo e negativo. 
Outro problema que poderia ser apontado no experimento, mas que não foi comentado 
por nenhum autor do debate, é que o critério estabelecido por Hearst (1962) para a 
comparação foi referente ao nível de discriminação entre as condições SD e SΔ para os dois 
reforçadores em porcentagem. Os números brutos não foram explicitados, mas esse critério 
significa que os macacos poderiam estar emitindo centenas de respostas num reforçamento e 
algumas dezenas na outra. Diferenças no gradiente poderiam também ser atribuídas a isso. 
Como sugeriram Lattal e Lattal (2006), quando se comparam dois estímulos 
diferentes, algum fator comum deve ser estabelecido. Se a frequência de respostas for 
escolhida como fator comum, dever-se-ia estabelecer, considerando um alimento específico e 
uma privação específica, qual intensidade de um tipo de choque produziria uma frequência de 
respostas igual. Somente assim seria possível dizer que dois reforçadores (pelo menos sob o 
padrão de frequência de respostas) seriam equivalentes. 
Se isso é possível ou não de ser feito, é uma questão experimental. Uma quantidade 
enorme de variáveis com seus próprios padrões deveria ser levada em conta. Em pesquisas de 
reforçamento positivo, por exemplo, uma operação estabelecedora que cresce ao longo do 
tempo está em vigor o tempo todo, mas cada alimento produzido também funciona como 
operação abolidora. Em uma situação de esquiva por choque, frequentemente, a operação 
estabelecedora reflexiva/reforçadornegativo condicionado aparece e some por completo 
rapidamente repetidas vezes, e a sua função aversiva sofre efeitos dinâmicos similares aos da 
privação-saciação, como atesta o fenômeno do paradoxo da esquiva. 
As delimitações seriam tão específicas que talvez os resultados de uma pesquisa dessa 
natureza não pudessem ser generalizáveis para sequer outros tipos de choque ou alimento. 
Além disso, para que se pudesse atribuir diferenças entre os reforçadores tipicamente 
114 
 
 
considerados positivos ou negativos, muitos reforçadores de cada tipo precisariam passar 
pelos mesmos testes. Reforçadores ditos do mesmo tipo também deveriam ser comparados e, 
as diferenças encontradas entre eles deveriam ser qualitativamente diferentes de alguma 
diferença comum entre todos os reforçadores de cada categoria (Magoon et al., 2017). 
Investigar o Reforçamento em Si. Marr (2006) sugeriu que há pouco sentido em 
continuar discutindo distinções entre tipos de reforçamento se o próprio reforçamento ainda 
não está bem compreendido. Além da distinção entre positivo/negativo, ele cita dois outros 
exemplos de confusões: supostas distinções entre as propriedades discriminativas e 
reforçadoras dos estímulos e as condições necessárias e suficientes para a aquisição e 
manutenção do comportamento de esquiva. 
Marr (2006) não elabora mais profundamente sobre esses pontos, então é difícil saber 
a que supostas confusões nesses campos ele estava se referindo. Ainda assim, como sugerido 
por diversos autores (i.e., Baron e Galizio, 2005; Chase, 2006; Iwata, 2006; Lattal e Lattal, 
2006) a distinção pode ter uma função prática a respeito de como se analisam, descrevem ou 
aplicam os conceitos de reforçamento que podem ser úteis. 
Como já comentado, pode ser que uma vantagem da distinção seja justamente que 
investigações a respeito da distinção estejam funcionando para revelar lacunas em outras 
definições como reforçamento, estímulo, operações motivadoras etc. O próprio texto de Marr 
e o presente trabalho são exemplos disso. A descrição das condições pré e pós-mudança foi, 
inclusive, uma sugestão de Michael (1975) apresentada durante sua discussão sobre a 
distinção. Talvez abandonar a discussão sobre a distinção para focar na definição de 
reforçamento acabasse sendo contraprodutivo nesse sentido. 
Investigar o Próprio Comportamento de Distinguir. A partir da noção de que o 
comportamento dos cientistas é também governado por regras, Baron e Galizio (2006a) 
115 
 
 
incentivam os analistas do comportamento a revisarem as funções de seus próprios 
comportamentos verbais ao falar de reforçamento e considerarem alternativas. 
Sobre isso, vale comentar que regras de fato são capazes de controlar 
comportamentos, mas são limitados enquanto estímulos antecedentes. No fim das contas, o 
que determinará quais comportamentos serão ou não mantidos serão as consequências 
produzidas por eles. A sugestão de Baron e Galizio (2006a) provavelmente assume que o que 
for produzido pelo seguimento dessas regras seria mais reforçador, mas isso parece ir na 
contramão do fato de que, na prática, a distinção vem sendo mantida. 
Investigar os Motivos da Manutenção. Chase (2006) apontou que, apesar de a 
argumentação de Baron e Galizio (2005) sobre a ambiguidade da distinção ser lógica e 
precisa, faltou apresentar explicações “sólidas” sobre o porquê de a distinção ter sido mantida 
desde a publicação de Michael (1975). Lattal e Lattal (2006) demonstraram ter uma opinião 
parecida: “se as diferenças formais entre reforçamento positivo e negativo não são 
sustentáveis e as diferenças funcionais são, no mínimo, questionáveis, resta responder por que 
a distinção persiste” (pp. 130-131). 
Iwata (2006) pontuou que as explicações dadas por Baron e Galizio (2005) se 
resumiam aos termos estarem muito bem estabelecidos na área e uma mudança terminológica 
seria muito trabalhosa, mas argumentou que nenhuma dessas explicações é suficiente para 
justificar a manutenção dos termos na pesquisa e na prática. 
Diante disso, Chase (2006) sugeriu que o campo fosse em busca dessa resposta, seja 
na forma de uma pesquisa que analisasse textos e livros em análise do comportamento ou um 
questionário com os professores da área. Na falta de uma pesquisa que possa responder essa 
pergunta, Chase se propôs a oferecer algumas possíveis explicações para a manutenção. 
Vale ressaltar que não é como se Baron e Galizio (2005) não tenham apresentado 
possíveis explicações para a manutenção da distinção ao longo dos anos - 11 possibilidades 
116 
 
 
foram identificadas por eles. Parece ser o caso de que, para Chase (2006), Lattal e Lattal 
(2006) e Iwata (2006), as explicações oferecidas por Baron e Galizio foram insuficientes. As 
possíveis explicações oferecidas por Baron e Galizio (2005), bem como dos outros autores, 
foram apresentadas no subtítulo de “Explicações para a Manutenção”. 
Focar no Que É Palpável 
Nakajima (2006), de forma similar a Marr (2006) e Sidman (2006), sugere que 
analistas do comportamento devem focar mais na identificação explícita de variáveis 
ambientais que possam ser diretamente manipuláveis do que em especulações. 
Revisar os Termos 
Para Baron e Galizio (2006a), os diversos exemplos interpretativos apresentados por 
eles para demonstrar a fragilidade e ambiguidade da distinção, apontam para uma necessidade 
de reavaliar a terminologia usada para falar de reforçamento. 
Adaptar a Linguagem 
Lattal e Lattal (2006) destacam que, ao se comunicar com pessoas leigas, o analista do 
comportamento pode e deve adaptar sua comunicação para torná-la mais acessível e 
compreensível, mas somente se ele dominar o conceito em nível técnico e científico. Dessa 
forma, ele será capaz de englobar sutilezas teóricas importantes, evitando simplificações que 
distorçam o conceito. 
Esclarecimentos 
Em determinadas falas, Baron e Galizio responderam comentários gerais ou pontuais 
presentes nas falas dos outros autores de forma a esclarecer possíveis equívocos assumidos 
quanto à sua proposta. Naturalmente, essas falas só poderiam ser encontradas nos textos de 
resposta escritos por Baron e Galizio, dirigidos aos demais participantes do debate. Ainda 
assim, as seis falas dessa categoria foram todas retiradas do primeiro texto resposta (Baron e 
Galizio, 2006a). Uma explicação possível é que muito do que eles poderiam responder no 
117 
 
 
segundo texto já havia sido dito no primeiro, afinal, segundo eles próprios: “uma releitura de 
nosso artigo original e de nossa resposta anterior aos críticos revelará que grande parte do 
terreno já foi percorrido” (Baron & Galizio, 2006b). 
Os pontos aqui apresentados serão entendidos como representativos do que Baron e 
Galizio tentaram mostrar mesmo que tivessem falhado em fazê-lo seja por conta de más 
interpretações de suas falas ou até suas próprias contradições (alguns casos desse tipo foram 
discutidos até então). Os pontos apresentados a seguir devem ser considerados tendo em vista 
todas as exposições em discussões já colocadas. 
Em primeiro lugar, Baron e Galizio (2006a) defendem o foco em operações 
específicas ao invés do foco em eventos menos acessíveis. O ponto deles é, inclusive, que este 
foco vem, muitas vezes, sendo abandonado em favor da distinção positivo/negativo. Em 
segundo lugar, Baron e Galizio também não defendem que descrições sejam feitas de formas 
inconvenientes. De fato, é mais fácil falar de adição de dinheiro do que subtração de uma 
condição sem dinheiro. 
Em terceiro lugar, ao contrário do que Sidman parece ter atribuído a eles, Baron e 
Galizio (2006a) não estão propondo uma nova convenção terminológica nem uma mudança 
nos princípios básicos. Segundo os próprios autores, eles estavam apenas “apontando algumas 
dificuldades inerentes à convenção de distinguir entre reforçadores positivos e negativos com 
base no início ou término da energia de estímulo” (p.148). Em quarto lugar, ainda 
respondendo à Sidman, os autores acreditam que a relevância social tem papel fundamental na 
atividade científica e que o cientista, enquanto membro da sociedade deve estar atento às 
implicações sociais de seu trabalho. Eles apontam que tanto eles como Michael e Sidman 
estão de acordo que o uso social de estímulos aversivos como forma de controle faz com que 
o cientista precise estudá-los. 
118 
 
 
Em último lugar, Baron e Galizio (2006a) concordam com os outros autores que há 
muito a ser explorado para se falar melhor sobre as coisas “boas” ou “ruins” de uma 
perspectiva analítico-comportamental, e os autores esperam que essa discussão estimule a 
investigação dessas questões. 
A partir dessas falas, muitos elementos confusos no texto de Baron e Galizio (2005) 
devem ter sido elucidados. Baron e Galizio (2006a) defendem, portanto, o foco em operações 
observáveis, manipuláveis e mensuráveis e descrições práticas e objetivas das mudanças 
ambientais reforçadoras. Como eles já haviam respondido, os exemplos usados por eles que 
remetiam a estados internos hipotéticos, por exemplo, haviam sido retirados da literatura 
consultada como exemplos. 
Baron e Galizio (2006a) argumentam que Sidman (2006) se enganou em dizer que eles 
estavam “propondo uma nova convenção terminológica” ou uma “mudança nos princípios 
básicos”. De fato, há alguns trechos em seu artigo original que sustentam essa fala. Ao final 
de seu texto, Baron e Galizio (2005) disseram: “em resumo, se formos continuar a falar sobre 
dois tipos de reforçamento, aconselhamos cautela quanto às formas de uso desses termos”. 
Isso fora apresentado anteriormente como “Sugestão para Manutenção”. Em seguida, eles 
afirmam que a distinção parece ter funções comunicativas úteis e já está tão presente na área 
que talvez isso já fosse motivo suficiente para continuar ensinando a distinção para novos 
alunos. Em outros momentos, entretanto, eles defendem que o uso dos termos positivo e 
negativo são prejudiciais para análise do comportamento e sugere que eles sejam substituídos 
por uma descrição das condições pré e pós mudança e se recorra somente à classificação 
reforçamento e punição (ver “Sugestões para o Abandono”). 
Embora eles descrevam que o objetivo era apontar problemas com a distinção e 
apresentar possíveis sugestões tanto para a manutenção quanto para o abandono, indicando 
algumas possíveis vantagens e desvantagens, em muitos trechos foram identificadas frases em 
119 
 
 
que eles se posicionam claramente a favor do abandono, por exemplo: “embora vários 
argumentem que a distinção entre os reforçamentos positivo e negativo deva ser preservada, 
seus argumentos não nos convenceram de que os benefícios dessa distinção superem suas 
limitações” (Baron e Galizio, 2006a, p. 150). Esses fatores explicam, de certa forma, porque 
Sidman (2006) teria atribuído a eles um projeto de alterar a terminologia da área. 
 
120 
 
 
Discussões Gerais 
Os tópicos a seguir trarão discussões que abordam temas que estiveram presentes em 
diversos dos textos, mas que faria pouco sentido serem abordados individualmente. 
A Confusão da Distinção 
Um argumento que acabou sendo pouco abordado no debate dado que era parte da 
argumentação inicialmente trazida por Michael (1975), foi o de que a distinção é confusa. 
Como mencionado, isso dizia respeito ao fato, principalmente, de que seu uso tenha mudado 
ao longo do tempo. Sidman (2006) foi o único que abordou esse argumento diretamente, 
demonstrando forte concordância e apontando para aspectos em sua experiência que 
sustentavam essa noção. Segundo ele, novos alunos ou leitores de análise do comportamento, 
após aprenderem o conceito de reforçamento tendem a assumir precocemente, que 
“reforçamento negativo”, enquanto seu oposto, signifique o que se chama de punição. 
Parte do problema com a má interpretação do termo “reforçamento negativo” 
provavelmente advém do que se entende por “oposição”. A partir de um entendimento 
abrangente do termo, poder-se-ia tanto pensar que o oposto de “um aumento na frequência de 
resposta causado pela adição de um estímulo” poderia ser 1) “uma diminuição na frequência 
de resposta causado pela adição de um estímulo” (o que se chama de punição positiva); 2) 
“um aumento na frequência de resposta causado pela subtração de um estímulo” (o que se 
chama de reforçamento negativo); ou até 3) “uma diminuição na frequência de resposta 
causado pela subtração de um estímulo” (o que se chama de punição negativa). Isso porque 
“reforçamento positivo” é uma dupla de termos, diante da qual qualquer um dos dois termos 
(ou ambos) podem ser “invertidos” para gerar algo que seria, pelo menos no senso comum, 
adequadamente chamado de oposto. 
Com relação este aspecto apontado por Baron e Galizio (2005) e discutido por 
Sidman (2006), seriam sugestões para estudos futuros sobre o tema que 1) a busca outros 
121 
 
 
termos para se referir às relações de reforçamento positivo e negativo que pudessem gerar 
menos problemas (e.g., reforçamento aditivo e subtrativo, enfatizando as operações 
matemáticas de adição e subtração); 2) a avaliação de diferentes estratégias utilizadas por 
professores de análise do comportamento no ensino desses conceitos com o objetivo de isolar 
as funções didáticas dos problemas conceituais atribuídos à distinção do reforçamento 
positivo e negativo. 
A Distinção É Semântica 
Um ponto que foi abordado extensamente por Baron e Galizio (2005, 2006a, 2006b) é 
o de que a distinção positivo/negativo está, puramente, na forma de se descrever uma 
mudança. Fazer uma descrição na sua forma positiva ou negativa é uma escolha do falante. Os 
autores, entretanto, não se aprofundam sobre o porquê de isso acontecer. Quando Chase 
(2006) argumentou que o experimento de Weiss e Laties (1961) é um exemplo fraco porque 
“calor” e “frio” são opostos, talvez não tenha ficado evidente que esse é justamente o dilema: 
se qualquer mudança ambiental pode ser descrita numa direção ou na outra, a classificação 
entre positivo e negativo é arbitrária. O argumento foi perfeitamente ilustrado por ele quando 
pontuou que as mudanças “aumento na atenção” e “diminuição na restrição física” possuem, 
cada uma, suas versões opostas: “diminuição de períodos sem atenção” e “aumento de 
períodos sem restrição física”. 
O ponto de Baron e Galizio (2005) não é dizer que o “aumento da atenção” e a 
“diminuição da restrição física” sejam uma mudança só, mas sim dizer que cada uma dessas 
mudanças não deveria ser classificada como positiva ou negativa porque descrevê-las assim (e 
não em sua forma oposta) resume-se a uma escolha linguística e não a uma característica 
fundamental da mudança. 
O mesmo pode ser observado nas frases “eu quero ficar em casa” e “eu não quero sair 
de casa” que contém duas inversões e são, portanto, equivalentes. O mesmo ocorre na 
122 
 
 
matemática quando se declara que uma operação de subtração de um número positivo ou a 
adição do mesmo um número, só que negativo, são equivalentes (i.e., 3 - 1 = 2 e 3 + (-1) = 2). 
O exemplo de Weiss e Laties (1961) não foi apresentado por Baron e Galizio (2005) 
para dizer que não se sabe qual das duas mudanças é a mais relevante - até porque são uma 
mudança só - mas para ilustrar como qualquer mudança poderia ser descrita tanto como 
adição quanto como subtração. De fato, dizer que um comportamento aumentou de frequência 
porque “dinheiro seguiu a resposta” soa melhor do que dizer que a resposta aumentou de 
frequência por “eliminar um período de menos dinheiro”. Ainda assim, o fato de uma forma 
de escrita ter se tornado tradicional e, portanto, outras soarem estranhas, não justifica a 
pressuposição da existência de dois processos distintos. 
Calor e frio, luz e escuro são pares de opostos com alta prevalência na experiência 
cotidiana, o que torna esperável que qualquer comunidade13 
 
 
Lista de Tabelas 
Tabela 1 - Categorias de análise utilizadas no grifo dos textos...............................................46 
 
14 
 
 
Considerações Sobre o Processo de Produção do Presente Trabalho 
Inicialmente, considero importante ressaltar alguns aspectos sobre a produção deste 
trabalho e explicitar algumas variáveis que controlaram o meu próprio comportamento nesse 
processo. Era uma ideia inicial deste projeto estudar os textos que serão aqui analisados 
enquanto produtos dos comportamentos dos autores que os produziram – fruto das variáveis 
ambientais desses autores. Além disso ter se revelado uma proposta trabalhosa, a pesquisa se 
limitaria apenas a fazer um punhado suposições com base no material disponível – o que foi 
entendido como um trabalho pouco frutífero. Optei, ao invés disso, por fazer uma 
sistematização, análise e interrelação do conteúdo desses argumentos. 
Outro ponto relevante a respeito do projeto inicial é que eu o havia escrito 
inteiramente em primeira pessoa. Tanto isso quanto o interesse inicial em estudar o 
comportamento de autores da análise do comportamento sugiram da vontade de manter 
explícito que esta produção (assim como qualquer outra) é produto do comportamento de 
pessoas específicas e de suas variáveis ambientais. As falas, as tabelas, os gráficos, as 
opiniões, os acertos e os erros deveriam poder ser vistos como produtos dos comportamentos 
de pessoas específicas e não dados objetivos que se revelaram num vácuo durante a 
investigação. 
Escrever e ler um projeto inteiro em primeira pessoa, incialmente, me gerou certa 
estranheza (compartilhada por outros leitores), provavelmente advinda de um treino extenso 
de leituras e escritas em uma outra forma. Conto que, ao final desse processo, esse já não era 
mais um incomodo pessoal, mas entendo que esse não seria o caso para um novo leitor. 
Assim, apesar de a escrita em primeira pessoa ir ao encontro das próprias diretrizes do 
Manual de Publicação da American Psychological Association (APA), os autores que fazem 
parte tanto da comunidade científica da análise do comportamento enquanto área de pesquisa 
quanto de outros campos das ciências naturais como um todo, tipicamente escrevem seus 
15 
 
 
textos em terceira pessoa. Nesse sentido, optei por manter estas ressalvas em primeira pessoa, 
mas seguir com o texto em terceira pessoa de forma a facilitar possíveis leituras, citações e 
publicações futuras. 
Estrutura Geral da Introdução 
Este trabalho se aprofundará em discussões a respeito da manutenção ou abandono da 
distinção entre as definições de reforçamentos positivo e negativo. Para que isso seja possível, 
primeiro serão trazidas e discutidas algumas definições conceituais. Este segmento do 
trabalho consistirá numa exposição inicial dos conceitos de reforçamento e reforçadores. 
Em seguida, será feito um breve resumo do artigo de Santos e Leite (2013) que 
analisaram diferenças entre as definições de reforçadores positivos e negativos em diversas 
obras. Em seguida serão apresentadas diferentes definições para os conceitos de reforçadores 
positivo e negativo, com base na revisão de literatura de Santos e Leite (2013) e em outras 
obras não contempladas na revisão desses autores – com foco especial nas diferenças 
identificadas entre as definições. 
Após essa discussão inicial das definições e diferenças entre os conceitos de 
reforçamento e reforçadores positivos e negativos, será introduzido o texto de Michael (1975) 
que foi um dos primeiros a discutir a possibilidade de se abandonar a distinção 
positivo/negativo e que deu origem ao debate que será analisado no presente trabalho. 
Será apresentado então o trabalho de Possmoser (2015), que investigou as referências 
feitas à Michael (1975) até 2014, se aprofundando nos textos envolvidos no debate de 
2005/2006 sobre o tema do abandono/manutenção da distinção entre reforçamento positivo e 
negativo publicado pela revista The Behavior Analyst. A fim de aprofundar o trabalho de 
Possmoser, o problema de pesquisa da presente pesquisa será delineado partindo dele. 
 
 
16 
 
 
Definição de Reforçamento 
Segundo Catania (1992, p. 71), o termo “reforçamento” pode ser tanto entendido como 
a apresentação de consequências reforçadoras após uma resposta1 (i.e., uma operação) quanto 
como um aumento na probabilidade futura do responder gerado pela apresentação dessas 
consequências (i.e., um processo). Ele apresenta os seguintes exemplos de reforçamento dos 
quais outros fatores importantes podem ser destacados: 1) um rato privado de água cujas 
respostas de pressão à barra se tornam mais prováveis quando produzem água do que quando 
não produzem; 2) um pombo privado de alimento cujas respostas de bicar se tornam mais 
prováveis quando elas produzem alimento do que quando não produzem; e 3) o choro de uma 
criança se torna mais provável quando produz a atenção dos pais do que quando não produz. 
Nos três exemplos, Catania (1992) deixa implícita uma diferença entre dois contextos: 
em um, o reforçador é produzido e, nesse contexto, a resposta aumentaria de probabilidade e, 
no outro, o reforçador não é produzido e sua probabilidade seria menor. Além disso, nos 
primeiros dois exemplos, Catania também menciona as variáveis motivacionais envolvidas, 
que tornam certas alterações ambientais relevantes para um organismo (e.g., privação de água 
ou alimento tornando esses eventos relevantes enquanto reforçadores). 
Um último aspecto trazido por Catania (1992) é a distinção entre contiguidade (i.e., 
justaposição temporal ou espacial entre eventos) e contingência (i.e., relação de dependência 
entre uma resposta e um estímulo). Embora essas relações possam coexistir, a contiguidade 
por si só pode ser suficiente para manter uma resposta, como mostram os experimentos de 
Skinner (1948) sobre comportamento supersticioso. Assim, embora a contingência possa 
garantir uma contiguidade mais sistemática, é a contiguidade, e não a contingência, o fator 
essencial para que o reforçamento ocorra. 
_________________ 
1 Entender-se-á por “resposta” qualquer ação de um organismo. 
17 
 
 
Reforçamentos Positivo e Negativo 
Uma “alteração ambiental reforçadora” (ou “consequência reforçadora” quando há 
especificamente uma relação de contingência) pode ser entendida como qualquer alteração 
ambiental (i.e., operação) que quando segue, sistematicamente, uma classe de respostas do 
organismo, aumentará a frequência de emissão dessa classe (dadas condições motivacionais e 
discriminativas semelhantes). O reforçamento, por sua vez, pode se dividir em duas categorias 
a partir do tipo de consequência reforçadora envolvida. 
Quando o aumento na frequência de determinada classe de respostas é causado pela 
adição de um estímulo2 ao ambiente, o processo é chamado de reforçamento positivo. Quando 
o aumento na frequência da classe de determinada classe de respostas é causado, ao contrário, 
pela subtração de um estímulo do ambiente, o processo é chamado de reforçamento negativo 
(Skinner, 1953/2014). Assim Skinner (1953/2014) define e exemplifica esses mesmos 
conceitos: 
Eventos que se mostram reforçadores são de dois tipos. Alguns reforçamentos 
consistem na apresentação de estímulos, na adição de algo — por exemplo, comida, 
água ou contato sexual — à situação. A esses chamamos de reforçadores positivos. 
Outros consistem na remoção de algo — por exemplo, um ruído alto, uma luz muito 
intensa, frio ou calor extremos, ou um choque elétrico — da situação. A esses 
chamamos de reforçadores negativos. Em ambos os casos, o efeito do reforçamento é 
o mesmo: a probabilidade da resposta é aumentada. Não podemos evitar essa distinção 
argumentando que o que é reforçador, no caso negativo, é a ausência da luz intensa, do 
_________________ 
2 Entender-se-á por “estímulo” qualquer evento do ambiente que afete o comportamento de um 
organismo.verbal desenvolva termos para 
ambos. Já eventos como dor de cabeça ou choque são, em geral, menos frequentes, o que faz 
com que se fale mais comumente sobre sua presença do que sobre sua ausência. No entanto, 
quando se tornam recorrentes — como nos casos de enxaqueca crônica ou em experimentos 
com choques — surgem condições para nomear seus períodos de ausência, como “período 
interictal” e “período de segurança”. Assim, tanto faz dizer que houve apresentação de um 
estímulo ou remoção do seu oposto: o fenômeno de reforçamento permanece o mesmo. 
A forma geral como a física, por exemplo, buscou solucionar esses conflitos gerados 
pela própria linguagem tem a ver com a investigação da materialidade das coisas e com 
convenções estabelecidas por eles a partir das quais determinaram que a luz e o calor seriam 
chamados de coisas, mas o escuro e o frio, não (para um exemplo sobre a luz, ver Rocha et 
al., 2021). A forma como a análise do comportamento trata essa questão será mais bem 
discutida no subtópico seguinte. 
123 
 
 
Vale ressaltar que Baron e Galizio (2005, 2006a, 2006b) não sugeriram 
necessariamente que se abandonem os termos “adição” e “subtração” (e seus equivalentes). 
Enquanto descrições de procedimentos que podem ser entendidos e replicados, tais termos 
costumam cumprir sua função (mesmo que algumas informações fiquem apenas implícitas). 
O argumento central, novamente, é que a forma como se descreve um procedimento (dentre 
outras possíveis formas de descrevê-lo) é uma preferência, e, com isso, as definições de 
reforçamento positivo e negativo, baseadas na descrição das operações de mudança, pode 
tornar-se confusa quando uma descrição incomum dos eventos for a escolhida. 
Em conclusão, a ambiguidade da distinção parece ter a ver com o fato do fato de que a 
comunidade verbal treina seus membros para, ao mesmo tempo, dar nomes específicos para 1) 
estímulos que diferem quanto a intensidade em uma mesma propriedade (e.g., diferentes 
temperaturas como calor e frio) e 2) direções diferentes de uma mudança dentro de um 
mesmo contínuo (adição, subtração). Se um termo para “esfriar” não tivesse sido criado, seria 
dito apenas que um objeto perdeu calor ou ganhou calor - sem nenhuma perda de sentido. 
Colocado de outra forma: a ambiguidade existe porque a linguagem utilizada permite que 
termos opostos possam ser usados/criados para descrever um mesmo fenômeno ambiental. 
A Ausência como um Estímulo 
Nakajima (2006) mencionou preferir a descrição de que “calor foi adicionado” ao 
invés de que “frio foi subtraído” porque o calor seria algo físico enquanto a frieza seria um 
estado hipotético do rato que significa “ausência de calor”. Entretanto, como já discutido, 
assim como o calor é um estímulo capaz de eliciar e evocar respostas o frio (i.e., ausência de 
calor) também é. 
Quando se fala de reforçamento, necessariamente se está falando da mudança de uma 
condição para outra que é contingente (ou contígua) a uma classe de respostas (Michael, 
1975). Tais condições devem diferir entre si, obrigatoriamente, quanto a pelo menos um 
124 
 
 
aspecto: numa condição, uma propriedade de estímulo particular deve estar mais intensa e, na 
outra, menos intensa, a despeito da ordem. Outras alterações concomitantes entre as condições 
podem ou não afetar o efeito desse reforçamento, mas isso não muda o aspecto essencial de 
ausência e presença de um estímulo. 
Quando um estímulo é subtraído, o que está sendo fundamentalmente colocado em seu 
lugar é sua própria ausência - ou um estímulo com uma intensidade mais baixa em uma de 
suas propriedades. Considerando o caso em que uma criança emite mandos que fazem sua 
mãe retirar a folha de atividades que está à sua frente (demanda): não importa o que quer que 
concretamente esteja atrás daquela folha (e.g., uma mesa, uma prancheta ou uma folha em 
branco), o único elemento fundamental para que seja mantida a ocorrência do mando é a 
ausência da folha de atividades. É provável que fosse “ao que está atrás da folha” que Marr 
(2006) se referia quando disse que “o que acontece depois parece irrelevante” (p. 127). Isso 
também se aplica ao exemplo em que a criança vai para uma sala de time-out: o que mantém 
o comportamento não é o que há na nova sala, mas a eliminação da condição anterior (a 
presença da demanda). Em ambos os casos, tanto a condição antecedente quanto a 
subsequente importam apenas nos aspectos que forem relevantes para o reforçamento - e “não 
importam” nos aspectos que não forem. Dada a mudança relevante (da presença para a 
ausência da demanda), pouco importam, em vias gerais, os demais elementos de ambos os 
ambientes. 
Se a noção de que a ausência de um estímulo possa ser um estímulo específico não 
parecer convincente, vale ressaltar que Skinner (1953/2014) afirma: “quando dizemos que o 
comportamento é função do ambiente, o termo ‘ambiente’ presumivelmente significa 
qualquer evento do universo capaz de afetar o organismo” (p. 281). Nesse sentido, o frio, o 
escuro, o silêncio, entre outras “ausências de estímulo” que tiverem funções evocativas, 
eliciadoras ou até reforçadora condicionada poderão ser considerados estímulos. 
125 
 
 
Outro exemplo óbvio de como a “ausência de um estímulo” pode (e costuma) ser 
considerada um estímulo na análise do comportamento refere-se à noção de “estímulo delta”. 
Quando numa discriminação operante um rato passa a pressionar uma barra diante da 
presença de uma luz e para diante da ausência dessa luz (i.e., escuro), à “ausência da luz” se 
atribui a função de estímulo delta. Sem nenhum problema, as condições poderiam ser 
invertidas e a “ausência da luz” se tornaria o estímulo discriminativo. A discriminação entre 
um estímulo específico e sua ausência pode, em teoria, ocorrer com qualquer estímulo - sem a 
necessidade de que existam palavras específicas para se referir a ambos. A presença de um 
choque pode adquirir função discriminativa (Azin & Holz, 1961), enquanto a “ausência do 
choque” adquire função de estímulo delta. 
Vale ressaltar que, nos exemplos apresentados, o único critério de diferença entre as 
duas condições de estímulo são especificamente a presença e ausência de um estímulo. Tanto 
a presença quanto a ausência de um estímulo são observáveis e mensuráveis. Tocar na grade 
da caixa experimental revelará a presença ou ausência do choque, bem como usar um 
multímetro. Uma possibilidade para lidar com a possível estranheza gerada por dizer que “a 
ausência de um estímulo é um estímulo” é pensar que, concretamente, tanto a presença como 
a ausência de estímulos se manifestam enquanto intensidades distintas de propriedades 
específicas de um estímulo. Sob esse parâmetro, os estímulos seriam considerados “opostos” 
porque duas intensidades diferentes de uma propriedade não podem estar presentes num 
mesmo estímulo. A presença ou ausência da luz por exemplo existe, concretamente, enquanto 
uma lâmpada que está acesa ou apagada. 
Que problemas de definição podem ser gerados por estímulos cuja intensidade varia 
dentro de um contínuo é um fato que já foi reconhecido por muitos autores antes e dentro do 
debate analisado neste trabalho (e.g. Catania, 1992; Sidman, 2006; Iwata, 2006; Chase, 2006). 
O trabalho de Baron e Galizio (2005) mostrou, entretanto, que essas dificuldades não se 
126 
 
 
limitam a esse tipo de estímulo: descrições das versões opostas de estímulos sempre são 
possíveis. Como já comentado anteriormente, qualquer mudança de estímulo pode ser 
entendida como uma variação na intensidade de uma das propriedades do estímulo - mesmo 
que uma das intensidades seja zero. 
Operações e Efeitos 
Um dos temas que mais surgiram ao longo do debate diz respeito à noção de 
operações – termo que, segundo Catania (1992), refere-se ao procedimento aplicado. Muito 
autores (i.e., Iwata, 2006; Marr, 2006; Nakajima, 2006; Sidman, 2006), em alguma medida, 
criticaramBaron e Galizio (2005) por seu uso de estímulos hipotéticos, não-observáveis, não-
manipuláveis ou de difícil descrição em sua argumentação. Alguns deles argumentaram que 
quando critérios de observabilidade ou manipulabilidade fossem aplicados à operação 
analisada, confusões ligadas à distinção entre os reforçamentos positivo e negativo sumiriam. 
Baron e Galizio (2006a) contrapuseram essa noção com o exemplo da dor de cabeça, 
no qual uma pessoa toma uma aspirina “para” eliminá-la. Como eles sugeriram, a operação 
observável e manipulável nesse caso seria a adição da aspirina e a eliminação da dor de 
cabeça seria um efeito posterior. Considerando que o efeito do medicamento pode demorar 
vários minutos, isso faz ainda mais sentido. Não há uma resposta contígua à eliminação da dor 
de cabeça que estaria sendo fortalecida. 
Fato é, que tanto a dor de cabeça quanto a sua eliminação são eventos não observáveis 
publicamente. Uma possível descrição dessa contingência seria que diante da operação 
estabelecedora “dor de cabeça”, respostas que produzirem a aspirina tenderão a aumentar de 
frequência (uma descrição que pelos critérios sugeridos seria considerada reforçamento 
positivo). Baron e Galizio (2006b) chegaram a apontar que Nakajima (2006), como um dos 
autores que advogou pelo do critério de observabilidade e manipulabilidade, não abordou 
especificamente esse exemplo da aspirina. 
127 
 
 
Um último adendo é sobre a recomendação focar exclusivamente nas variáveis 
observáveis do ambiente. A distinção observável/não-observável refere-se, especificamente, a 
capacidade de terceiros observarem uma mudança, afinal, se não todos os estímulos deveriam, 
por definição, ser considerados observáveis. Embora coerente com os princípios da análise do 
comportamento no sentido experimental, esse foco pode também levar a uma limitação 
semelhante àquela imposta pelo behaviorismo metodológico. Como apontado por Andery et 
al. (2009) estímulos não podem sofrer restrições metodológicas. O ambiente é composto tanto 
por estímulos públicos quanto privados. 
O foco exagerado nas operações pode acabar deixando outros fatores relevantes de 
lado. Retoma-se o caso do uso de drogas que, para Crowley (1972), pode inicialmente ser 
mantido por reforçamento positivo, mas depois por reforçamento negativo (i.e., por conta da 
abstinência). Apesar de sempre tratar de uma mesma operação observável (adição da droga no 
organismo), de fato, o uso de droga pode se dar de formas muito diferentes e importantes de 
serem consideradas. O uso de drogas ligado a sensações da droga, o uso de drogas ligado à 
aprovação social, o uso de droga ligado a remoção de sintomas de abstinência e o uso de 
drogas ligado a “desinibição” ou “relaxamento” são todos usos muito distintos (e que podem 
se misturar). Uma possibilidade é olhas para as diferentes operações motivadoras envolvidas 
em cada um. Apesar de as operações (no sentido de procedimentos) serem iguais, que fatores 
será que estão estabelecendo o valor da droga como reforçador? Ao excluir os eventos 
privados sob o argumento de que não são passíveis de observação direta por terceiros, corre-
se o risco de descartar fenômenos relevantes apenas por não serem, no momento, acessíveis 
com os recursos disponíveis. Skinner (1974) alerta que, embora o behaviorismo metodológico 
tenha sido importante para afastar explicações mentalistas, ele acabou desconsiderando 
aspectos do comportamento que, embora privados, são produtos legítimos das mesmas 
variáveis ambientais que moldam o comportamento público. Assim, esse compromisso estrito 
128 
 
 
com a observação pública também pode acabar afastando a análise do comportamento de seu 
objeto de estudo: os comportamentos, sejam eles públicos ou privados. 
Condições Pré-mudança e Pós-mudança 
Um ponto que pode não ter sido bem compreendido diz respeito à sugestão de Michael 
(1975) de, ao invés de falar de estímulos adicionados ou retirados, passar a descrever 
condições ambientais pré e pós-mudança. Como pode ser observador na Michael foi pouco 
explícito a respeito de como fazer tais “descrições completas das condições pré e pós-
mudança”, que, segundo ele, estariam sendo negligenciadas em favor de se fazer uma 
distinção positivo/negativo. 
Como já indicado na Introdução, o termo “condição de estímulo” foi adotado por 
Michael (1975), para se referir a um estado estático de estimulação (e.g., uma intensidade 
específica de um estímulo) em oposição a uma “mudança de estímulo” que se refere à 
mudança de uma condição de estímulo para outra. Nesse sentido, as “condições de estímulo 
pré-mudança” e as “condições de estímulo pós-mudança” nada mais são que as condições 
antecedentes e subsequentes a uma resposta reforçada. O próprio Michael admite que, pelo 
menos na linguagem de Skinner (1953/2014), “condição de estímulo” e “estímulo” seriam 
sinônimos. Vale ressaltar que o termo “condição” é usado por Michael, em geral, para se 
referir a um único estímulo enquanto outros autores (incluindo Baron e Galizio, 2005, 2006a, 
2006b) usam o termo para se referir a uma situação como um todo - como sinônimo de 
“contexto antecedente”. 
Na mesma linha, Baron e Galizio (2006a) sugeriram que um problema na área é que, 
frequentemente, consequências que envolvem mudanças complexas de uma condição para a 
outra são tratadas como eventos discretos. Os autores apresentaram diversos exemplos que 
ilustravam que sempre que uma condição de estímulo estava sendo adicionada, outra estava 
sendo subtraída. Esse foi o caso dos contrastes entre atenção e solidão, dinheiro e período sem 
129 
 
 
dinheiro, desenho animado na televisão e tédio ou entre aspirina e dor de cabeça. Quando o 
primeiro evento do par é adicionado, na visão dos autores, o segundo elemento é subtraído 
simultaneamente. Sobre isso, os autores foram criticados diversas vezes por terem recorrido a 
muitos termos imprecisos, hipotéticos e/ou não-observáveis (e.g., solidão, tédio e fome) como 
condições pré-mudança – algo que eles reconheceram em sua resposta (Baron & Galizio, 
2006a). Marr (2006), particularmente, chegou a contestar Baron e Galizio (2005) pelo seu uso 
de operações motivadoras porque, segundo ele, esse seria um conceito hipotético e retrógrado. 
Esse comentário, a princípio, parece estranho, já que nem Michael (1975) nem Baron e 
Galizio (2005) apontaram o conceito de operação motivadora como parte de sua 
argumentação. Esse termo, inclusive, só aparece formalmente em Baron e Galizio (2005) em 
comentários muito específicos sobre os textos de Sidman (1989/2009) e de Skinner (1976). 
Michael (1975), obviamente, não fez uso do conceito porque ele só seria proposto (por ele 
próprio) oito anos depois (Michael, 1982). 
Baron e Galizio (2006a) argumentaram que os termos escolhidos haviam sido 
retirados da literatura como exemplos do que já era dito na área, mas defenderam que seu 
ponto não perdia a validade e outros termos poderiam ter sido usado no lugar. Ao invés de 
alívio da solidão ele apresentaram a alternativa “término de uma condição em que atenção 
estava ausente” (já sugerida por Iwata, 2006). Nessa versão reformulada do exemplo, o oposto 
de “atenção” não seria a “solidão”, mas sim a própria “ausência de atenção”. Ainda assim, 
pode-se notar que nem todos os pares de termos são de opostos, como seriam calor e frio. Dor 
de cabeça não é o oposto de aspirina. 
Dizer, por exemplo que uma criança quando liga a TV sai de uma condição de “tédio” 
para uma condição de “desenho passando” acaba sendo um problema porque pode dar a 
entender que duas operações ocorreram: tanto a remoção do tédio quanto a adição do desenho. 
O oposto da condição “desenho animado” seria a própria “ausência do desenho animado” e 
130 
 
 
não “tédio”. Na melhor das hipóteses, o tédio poderia ser considerado uma tendência a 
produzir estímulos específicos como brincadeiras, jogos ou até mesmoum desenho animado. 
Em outras palavras, uma operação estabelecedora. Da mesma forma, o termo “fome” refere a 
um estado corporal que acompanha operações motivadoras que estabelecem alimentos como 
reforçadores. É possível que tenha sido com base no uso desses termos que Marr (2006) fez 
sua crítica. Isso mostra exatamente como o uso de termos imprecisos como solidão, tédio e 
fome dão margem para interpretações diversas. 
Segundo a própria definição apresentada por Baron e Galizio (2006a), “solidão” 
significa “ausência de companhia”, o que implicaria que os opostos seriam “solidão” e 
“companhia”. Ao invés de dizer que a “adição de atenção” e a “subtração da solidão” são 
equivalentes, uma forma mais precisa de descrição talvez fosse: diante da “solidão”, a 
mudança de uma condição de “ausência de atenção” para uma condição de “presença de 
atenção” seria reforçadora. Ou então, que diante do “tédio”, a mudança de uma condição de 
“ausência de desenho animado” para uma condição de “presença de desenho animado” seria 
reforçadora. 
Os exemplos apresentados ilustram como 1) usar termos mal definidos pode ser 
problemático (e.g., tédio, solidão, atenção); 2) descrições precisas das condições pré e pós 
mudança podem ser difíceis de fazer; 3) descrever as operações estabelecedoras e estímulos 
discriminativos é importante; 4) descrições precisas podem ser fundamentais em alguns casos 
(e.g., caso da mudança de temperatura). 
Diante disso, algo que poderia ser perguntado é se, para ser precisa, uma descrição 
precisaria seguir esse tipo de modelo. Ou então, se todas as ocasiões exigem que descrições 
tão precisas sejam feitas. Pode ser que houvesse algum ganho em se padronizar a forma como 
contingências são descritas (especialmente em experimentos). Na literatura experimental, é 
comum que as privações estejam indicadas na própria descrição dos sujeitos ou no 
131 
 
 
delineamento do procedimento (como no caso de choques, por exemplo). Os critérios 
específicos para a produção da mudança costumam estar bem delimitados na descrição do 
aparato. Também não costuma haver dúvidas sobre se alguma quantidade de alimento já 
estava presente ou não no comedouro, ou quanto é adicionado. O mesmo vale para 
experimentos com choques: intensidades, durações, se o choque é completamente eliminado 
ou não, e sob quais condições isso ocorre, são geralmente descritos com clareza. Se outros 
fatores relevantes forem deixados de fora, isso não necessariamente se resolveria apenas 
adotando o modelo proposto por Michael (1975). 
Uma pergunta complementar, que poderia ser sugerida para estudos futuros, é avaliar 
se as descrições de contingências em estudos experimentais - tanto de pesquisa básica quanto 
aplicada - têm incluído de forma sistemática todas as condições relevantes de pré e pós-
mudança, ou se têm se limitado a descrever consequências como eventos estáticos. Investigar 
esse ponto poderia indicar em que medida as práticas descritivas da área estão alinhadas com 
a complexidade funcional envolvida na definição de contingências e operações motivadoras. 
Retomando o adendo de Baron e Galizio (2005, 2006a) de que não é preciso mudar 
radicalmente a forma de descrever as mudanças, é possível pensar que caso as informações a 
respeito do que Michael (1975) chamou de condições pré e pós-mudança já tiverem, de 
alguma forma, sido bem descritas ou se simplesmente se está num contexto em que tal 
descrição minuciosa não é tão relevante (e.g., contextos aplicados, leigos ou educacionais), 
dizer que “calor foi adicionado” ou que “frio foi subtraído” servem ambos adequadamente 
para se referir à mudança ocorrida. Nesses casos, uma noção suficiente das condições de 
estímulo pré e pós-mudança pode ser facilmente inferida. 
Implicações Sobre o Conceito de Reforçamento 
O abandono da distinção, ou seja, falar apenas de reforçamento, sem a denominação 
positivo ou negativo, tem implicação óbvia sobre o conceito de reforçamento, uma vez que 
132 
 
 
elimina uma das classificações dos reforçadores propostas no arcabouço teórico da análise do 
comportamento. Nesse sentido, os termos “consequência reforçadora” e “alteração/mudança 
ambiental reforçadora” continuam servindo definição de reforçamento para se referir aos 
eventos que aumentam probabilidades de resposta. Isso não significa que os termos adição e 
subtração, como já discutido, precisem ser descartados de descrições de contingências ou 
procedimentos, já que descrevem, na maior parte das vezes, a alteração ambiental relevante de 
forma nítida (mesmo que ela pudesse ser descrita de outra forma). O que se estaria 
abandonando não são os termos em si, mas sim a proposição de classificá-los com base na 
direção da alteração ambiental por conta das ambiguidades e demais desvantagens apontadas 
no debate. 
Uma discussão relevante é se o mesmo se aplicaria a demais classificações dos 
reforçadores presentes atualmente na análise do comportamento, tais como intrínseco/natural 
x extrínseco/arbitrário, e primário x condicionado x generalizado, que, por sua vez, também 
apresentam desafios e complexidade apesar de sua ampla utilização para a análise dos mais 
variados fenômenos humanos, da mesma forma que a classificação positivo x negativo. 
Implicações Sobre o Conceito de Reforçadores 
Michael, ao final de seu artigo, faz uma proposta que é adotada por Baron e Galizio: 
A solução para nosso problema terminológico é chamar as coisas "boas" de reforçadores 
e reforçamento, e as coisas "ruins" de punidores e punição. Um conjunto de termos 
refere-se a mudanças que têm um efeito de fortalecimento sobre o comportamento 
precedente; o outro, a mudanças que têm um efeito de enfraquecimento. (Michael, 1975, 
pp. 43-44). 
Se uma resposta é fortalecida porque produz uma certa alteração no ambiente, dizemos 
que essa alteração teve função reforçadora. No entanto, se posteriormente uma resposta 
diferente produzir a reversão dessa mesma alteração e for enfraquecida, essa mudança passa a 
133 
 
 
ser classificada como punitiva. Isso mostra que uma mesma mudança ambiental pode ter 
efeitos distintos sobre o comportamento, dependendo do contexto em que ocorre e do tipo de 
relação que estabelece com as respostas. A mesma consequência pode funcionar como 
reforçadora em um contexto e como punitiva em outro. Essa análise mostra que uma mesma 
condição (ou estímulo) será chamado de reforçador ou punidor a depender de qual o seu efeito 
sobre a frequência da resposta. 
Diante disso, as seguintes questões poderiam ser levantadas: como devem ser descritas 
condições em relação? Uma é reforçadora e a outra punidora, uma é mais punidora e outra 
menos punidora ou uma é mais reforçadora e a outra menos reforçadora? Para ilustrar que 
áreas de confusão conceitual existem por toda a parte, Sidman (2006) questionou: “algo é 
grande ou pequeno, rápido ou lento, alto ou baixo? Em todos esses casos, e em muitos outros, 
só se pode responder “isso depende” (pp. 136-137). Nesse trecho, Sidman acabou apontando 
para o fato de que em muitos casos, a classificação de um estímulo quanto a propriedades 
específicas dele só pode ser feita em comparação com outros estímulos. As implicações disso 
para a noção do que é ou não reforçador parecem ser de total relevância. 
Os termos “mais reforçador” e “menos punidor” ou “menos reforçador” e “mais 
punidor” são sinônimos porque “reforçador” e “punidor” são, na proposta de Michael (1975), 
conceitos inversos. Dizer que uma condição é mais reforçadora, ressalta a aproximação a essa 
condição. Dizer que uma condição é punidora (ou reforçadora negativa) ressalta o 
afastamento dessa condição. Na prática, a “aproximação” e o “afastamento” (como já haviam 
apontado Baron & Galizio, 2006b) parecem ser diferentes descrições sobre uma mesma 
resposta – tal como adição e subtração seriam diferentes descrições de uma mesma mudança 
ambiental. Nesse sentido, a distinçãoentre o que é reforçador ou punidor, grande ou pequeno, 
rápido ou devagar, aditivo ou subtrativo, positivo ou negativo seria relativa entre duas 
condições específicas. 
134 
 
 
Staats (2006) ilustra bem essa noção no experimento hipotético que formulou, no qual 
um rato tem a possibilidade de ir até a sua caixa experimental ou permanecer em uma caixa 
vazia. Staats postula que o que determinaria se o rato iria para sua caixa experimental ou não 
depende da história de condicionamento com a caixa, isto é, se a pressão à barra foi reforçada 
positiva ou negativamente enquanto esteve lá. Deixando de lado os aspectos emocionais a que 
ele parece atribuir a causa dos comportamentos de se aproximar ou se afastar das caixas, sua 
conclusão parece bastante plausível. Dada uma história de subtração de estímulos aversivos 
na caixa experimental, estando em uma caixa vazia, o rato tenderia a se manter na caixa atual. 
Ao contrário, dada uma história de produção de estímulos reforçadores positivos na caixa 
experimental, estando na caixa vazia, o rato tenderia a entrar na caixa experimental. 
Diante dos parâmetros estabelecidos por Staats (2006), como deveriam ser 
classificadas as condições? Pela própria classificação do autor, seria chamada de reforçador 
negativo (ou estímulo aversivo) e a caixa onde ele recebeu alimento de reforçador positivo – a 
caixa vazia poderia ser chamada de “neutra”. 
Algo importante de se destacar é que três pré-requisitos estão implícitos nesse 
delineamento. Primeiro, deve haver alguma operação estabelecedora (mesmo que 
condicionada) que fizesse o rato ir da caixa vazia para a caixa experimental onde produziu 
alimento. Segundo a caixa inicial não pode ter alimento disponível e, terceiro, a caixa inicial 
não pode estar eletrificada. Se a caixa inicial tivesse alimento disponível, o rato dificilmente 
mudaria para a caixa onde alimento só pode ser produzido pela pressão de uma barra, por 
exemplo. Pela mesma lógica, se a caixa inicial estivesse eletrificada, o rato provavelmente 
mudaria para a caixa onde ele, no passado, pôde desligar o choque. Isso bota em perspectiva 
se de fato a caixa vazia poderia ser considerada “neutra”. 
Outros casos a serem considerados são o de um rato que se desloca de uma condição 
de choque de intensidade 2 mA para uma condição de choque em 1 mA. Sobre isso, como 
135 
 
 
seriam classificados esses termos? Possivelmente tender-se-ia dizer que ambas as condições 
são aversivas, mas a segunda condição é “menos aversiva”. Ao contrário (próximo do que 
haviam sugerido Baron e Galizio, 2006b), se um rato se deslocasse de uma condição na qual 
pode produzir alimento em FR 30 e para uma outra condição pode produzir em FR 10, poder-
se-ia dizer que as duas condições são reforçadoras, mas a segunda é “mais reforçadora”. 
Afirmar que, numa situação a condição subsequente é “menos aversiva” e em outra é 
“mais reforçadora” é assumir a priori que as condições “choque 1 mA” e “reforçador em FR 
10” seriam, essencialmente, reforçadoras negativa e reforçadora positiva (ou punitiva e 
reforçadora) respectivamente. Nenhum teste foi feito para saber se esse seria o caso. 
Possivelmente, os choques de 1 mA e 2 mA possuíssem uma voltagem tão baixa que a 
mudança de uma condição de 1 mA para 0 mA talvez já não fosse capaz de sequer evocar 
uma resposta de fuga. Do outro lado, talvez a privação de alimento atual do rato não fosse 
capaz de evocar uma resposta na condição de FR 30, apenas na de FR 10. Se as respostas que 
produzem essas condições não sofrerem um aumento de frequência, só se poderia dizer que, 
nesse caso, os estímulos não funcionaram como reforçadores. 
Esses exemplos parecem ilustrar uma tendência a se assumir que estímulos possuam 
valores pré-estabelecidos. Não no sentido de que não sejam mutáveis, mas que, após o seu 
condicionamento, estímulos adquirem algum valor reforçador absoluto. Dificilmente uma 
condição de choque seria descrita como reforçadora ou uma condição de alimento seria 
descrita como punitiva, mas a realidade é que essas descrições, sob essas circunstâncias 
poderiam ser feitas. O que parece controlar essa “arbitrariedade” para descrever os eventos de 
uma forma e não de outra (de forma semelhante à distinção positivo/negativo)? 
Uma possibilidade é que para dizer que uma condição é punitiva ou reforçadora se 
esteja sempre assumindo como comparação uma suposta “condição neutra” (e.g., a caixa 
vazia onde nem o alimento nem o choque estavam presentes). Foi a partir dessa comparação 
136 
 
 
que Staats (2006) caracterizou as caixas experimentais uma como reforçadora e outra como 
aversiva. Nesse caso, Staats definiu, mesmo que implicitamente, o que seria sua “caixa 
neutra”, mas uma condição neutra e universal não existe. Quaisquer afirmações só podem ser 
feitas em relação a duas condições específicas e testadas. Bastaria comparar a condição de FR 
30 (ou até mesmo a de FR 10) com uma caixa viveiro (com acesso livre a alimento) para que, 
segundo a lógica de aproximação/evitação de Staats (2006), a caixa de FR passasse a ser 
chamada de aversiva (lógica similar à de Baron e Galizio, 2006b). Comparações gerais com 
uma caixa viveiro talvez fosse um parâmetro até mais coerente do que o da caixa vazia, 
considerando que são as condições nas quais um rato de laboratório passa a maior parte do 
tempo. 
É possível que essa tendência em comparar estímulos ou condições de estímulo com 
uma suposta “condição neutra” advenha do senso comum e, em alguma medida, de 
perspectivas internalistas para explicação do comportamento. Considerando o caso de uma 
pessoa que responde “sim” para uma pergunta como “você gosta de bolo?”. Se a mesma 
pessoa recebesse a pergunta “você gosta de bolo quando você está enjoada de tanto bolo que 
já comeu?”, ela provavelmente responderia que, nesse caso, “não”. Uma outra possibilidade é 
que uma pessoa respondesse que “ainda gosta de bolo, mas que naquele momento não 
comeria mais”. Uma resposta parecida talvez fosse esperada diante da pergunta “você gosta 
de bolo quando você está em uma situação de perigo e precisa escapar?”: “gostar eu gosto, 
mas não comeria nesse momento”. 
No senso comum, parece ser assumido que o “gostar” ou “não gostar” de algo é 
absoluto, e que o “gosto” é algo que se possui. Novamente, não “absoluto” no sentido de que 
é imutável, mas no sentido de que existe a despeito das condições atuais como se estivesse 
guardado - da mesma forma que são tratados outros constructos como “conhecimento”, 
“memória” ou “personalidade”. Naturalmente, analistas do comportamento, apesar de fazerem 
137 
 
 
parte de um grupo bastante particular em sua forma de falar, continuam fazendo parte de uma 
comunidade verbal mais geral. Não é incomum ver pessoas engajadas com a análise do 
comportamento (em especial, mas não exclusivamente novos alunos) simplesmente trocarem 
palavras do senso comum como “bom” por “reforçador”, “sede” por “privação de água” sem 
que a base explicativa do que está sendo dito mude. Mudanças exclusivamente nas palavras 
gera frases como “o rato foi reforçado” (algo que remete à produção de “prazer” no rato) ao 
invés de “a resposta do rato foi reforçada” (referindo-se diretamente ao aumento na 
probabilidade dela). 
Quando um analista do comportamento diz que um estímulo é reforçador ele, em 
muitos casos, pode estar sob controle de condições parecidas com as da pessoa que diz gostar 
de bolo. Uma possibilidade é que ambos estejam considerando o contexto atual para 
responder a perguntar (i.e., a motivação existe e dado um estímulo discriminativo, a resposta 
seria emitida). Outra possibilidade é que mesmo que a motivação agora não exista, no 
passado, esse estímulo foi produzido quase sempre que o estímulo discriminativo esteve 
disponível, e seja a frequência observada da resposta sob essas circunstâncias que controle o 
operante verbal “gostar”. Outra hipótese,ainda, é que uma motivação poderia existir, mas 
outra operação motivadora estaria evocando outro comportamento concorrente. Nesse caso, 
poder-se-ia pensar que, se ele estivesse em condições “neutras”, ele emitiria respostas que 
produzissem o bolo. Uma última alternativa é que alguma motivação existe, o estímulo 
discriminativo está presente, mas a resposta que produziria o reforçador seria muito “custosa” 
– no sentido de que emitir aquela resposta em particular produz estímulos aversivos (e.g., um 
choque, perda de dinheiro ou até estímulos ligados à fadiga). Nesse caso, poder-se-ia pensar 
que essa resposta em específico não está sendo emitida, mas outras respostas que produzissem 
o mesmo reforçador poderiam ser. 
138 
 
 
Embora se tenha a tendência de atribuir um valor absoluto a certos estímulos, seu 
efeito como reforçador depende do contexto específico. Um bolo pode aumentar ou diminuir 
a probabilidade de uma resposta, dependendo da situação. Por exemplo, se uma pessoa pede 
torta em vez de bolo ao garçom, não se pode afirmar que o bolo é reforçador naquele 
contexto. O mesmo vale para estímulos aversivos: um choque de 1 mA pode ser reforçador 
diante de um de 2 mA, mas não em outras situações. Além disso, estímulos que normalmente 
seriam reforçadores (como comida para um animal faminto) podem não manter respostas se a 
exigência for alta demais. Isso mostra que o valor reforçador de um estímulo não é fixo, mas 
relacional e dependente das condições presentes. 
Se o valor de um estímulo reforçador é definido a depender da presença de outros 
estímulos ambientais, nenhum estímulo possui valor intrínseco. Para se dizer que um estímulo 
ou condição de estímulo são reforçadores, seria necessário indicar diante de quais condições 
antecedentes (em especial as operações motivadoras) ou, pelo menos, dizer que o estímulo 
tem uma tendência a ser reforçador. 
A partir disso, quando um analista do comportamento recebe a pergunta “uma pelota 
de alimento é um reforçador para um rato?”, ele poderia responder como Sidman (2006): 
“isso depende” (pp. 136-137). Outra possibilidade, é dizer que “tende a ser” – considerando 
que diante de diversas condições antecedentes, o alimento foi reforçador. 
Vale notar que já é comum que analistas do comportamento tenham uma tendência a 
dizer que o valor das coisas depende. Quando um professor recebe a pergunta “palmas são 
reforçadoras?”, ele poderia dizer “depende da pessoa”, ou, mais especificamente, “depende da 
história de reforçamento da pessoa”. Isso continua sendo verdade, mas o que está sendo 
apontado aqui é que não depende só disso. O valor reforçador de um estímulo depende 1) da 
história de condicionamento desse organismo com esse estímulo, 2) das condições 
antecedentes presentes que evocariam ou não sua produção e 3) da resposta exigida para 
139 
 
 
produzi-lo. Estímulos não carregam “um valor reforçador” dentro de si tal como pessoas não 
carregam seus “gostos” onde quer que vão. 
Se uma resposta é fortalecida porque produz uma certa alteração no ambiente, se diz 
que essa alteração teve função reforçadora. No entanto, se posteriormente uma resposta 
diferente produzir a reversão dessa mesma alteração e for enfraquecida, essa mudança passa a 
ser classificada como punitiva. Isso mostra que uma mesma mudança ambiental pode ter 
efeitos distintos sobre o comportamento, dependendo do contexto em que ocorre e da relação 
que estabelece com as respostas. O que define a função de uma consequência não é sua 
natureza intrínseca, mas os efeitos que produz sobre a frequência das respostas que a 
antecedem. 
Vale lembrar que o que se chama de “valor” de um estímulo é também uma inferência. 
Atribuir valor a um estímulo é uma forma de se referir à tendência do organismo de emitir 
respostas que o produzam. Em outras palavras, diz-se que um estímulo tem mais valor que 
outro no sentido de que o organismo emite mais respostas que produzam um em vez do outro 
- e que um mesmo reforçador tem seu valor alterado no sentido de que a frequência de 
respostas que o produzem foi alterada. Sob essa ótica, o único efeito operante diretamente 
observável de uma operação motivadora seria o aumento ou diminuição na frequência de uma 
resposta (efeito evocativo). Essa crítica à noção de “valor reforçador” como um efeito 
separado vem sendo feita por autores como Whelan e Barnes-Holmes (2010), que 
argumentam que o efeito evocativo é, na verdade, a única evidência empírica disponível de 
que houve alteração no valor da consequência. 
Nesse sentido, tanto dizer que um estímulo “é um reforçador” quanto que ele “é mais 
reforçador que outro” são apenas formas de indicar que, em determinada condição, esse 
estímulo tenderá a ser produzido. Se fosse desejável, seria possível abandonar completamente 
a ideia de “valor de estímulo” e descrever apenas os efeitos sobre a frequência das respostas 
140 
 
 
que produzem determinada mudança ambiental. Mesmo mantendo a referência ao valor, 
bastaria descrever que certas condições de estímulo são “mais reforçadoras” ou “menos 
reforçadoras”. Michael (1975) já havia sugerido o abandono do termo “aversivo” em favor de 
“punidor”, mas mesmo “punidor” poderia ser descartado em nome de “menos reforçador”. 
Por fim, vale comentar que as diferenças entre as distinções entre reforçadores 
positivos e negativos apresentadas por Santos e Leite (2013), à luz da presente discussão, não 
têm base para serem mantidas. A principal distinção apresentada por eles diz respeito à adição 
versus subtração de estímulos como critério para classificar um reforçamento como positivo 
ou negativo. No entanto, como discutido anteriormente a partir de vários autores do debate 
(Baron e Galizio, 2005, 2006a, 2006b; Michael, 1975), esse critério é arbitrário, já que toda 
adição envolve a retirada de algum outro estímulo, e toda retirada implica a permanência ou 
substituição por outro elemento do ambiente. Além disso, os autores também propõem outras 
diferenciações conceituais, como a de que os reforçadores negativos exigiriam a presença de 
estímulos aversivos, enquanto os positivos envolveriam estímulos agradáveis ou desejáveis. 
Essa forma de distinção incorre em pressupostos mentalistas ou essencialistas, que não se 
sustentam do ponto de vista funcional, também criticado pelos autores no debate (CITAR). 
Como discutido, o que define se uma consequência é reforçadora é o efeito que ela produz 
sobre a frequência das respostas e não suas supostas qualidades intrínsecas. Assim, mesmo as 
demais distinções apresentadas por Santos e Leite não se apoiam em critérios observáveis e 
funcionais, sendo também infundadas. 
Implicações para o Conceito de Reforçadores Condicionados 
No exemplo hipotético apresentado por Michael (2006) um rato era exposto a uma 
condição experimental de mais alimento e menos choque na presença de um tom e outra de 
mais choque e menos alimento na ausência do tom. Nessa na fase de condicionamento 
(alternância entre a condição sem tom e com tom), quem quisesse aplicar a distinção 
141 
 
 
positivo/negativo, poderia dizer que a mudança de uma condição para a outra seria tanto 
reforçadora positiva quanto negativa, porque tanto uma adição (mais alimento) quanto uma 
subtração (menos choques) estariam sendo aplicadas. A pergunta de Michael, entretanto, 
refere-se a uma mudança entre as condições sem tom e com tom enquanto estímulos 
condicionados. Michael supôs que a mudança do estímulo condicionado “sem tom” para o 
estímulo condicionado “com tom” seria reforçadora (mesmo quando o alimento e o choque 
não estivessem mais sendo apresentados). A partir disso, ele colocou o seguinte 
questionamento: nesse caso estaríamos falando de uma condição de reforçamento positivo ou 
negativo? 
O autor questionou a plausibilidade de usar a “adição de um tom” como critério para 
dizer que se trata de reforçamento positivo. Isso porque a escolhade qual condição seria a 
“com tom” e “sem tom” foi arbitrária. Se o condicionamento tivesse sido feito ao contrário 
(i.e., condição “sem tom” com mais alimento e menos choque e condição “com tom” com 
menos alimento e mais choque), o mesmo tipo de mudança teria que ser chamado 
reforçamento negativo, o que faria pouco sentido. 
Uma forma de abordar essa pergunta, poderia ser apelar para o valor de cada 
reforçador. Será que a adição do tom serviria como reforçador positivo para alguma outra 
resposta? Se a resposta fosse sim, dir-se-ia que ela é um reforçador positivo e, dessa forma, a 
adição do tom seria reforçamento positivo. O problema é que, como já notado, a propriedade 
reforçadora de um estímulo depende necessariamente das condições diante das quais ele será 
produzido. Como separar as condições “com tom” e “sem tom” de forma que só uma delas 
esteja envolvida na contingência? Não é possível porque a adição de uma condição 
necessariamente implica a subtração da outra. 
Esse delineamento dificulta uma análise das mudanças envolvidas porque, além de 
introduzir duas variáveis experimentais ao mesmo tempo, só são feitas comparações entre 
142 
 
 
duas condições experimentais, sem qualquer condição controle. Algo que ainda não havia 
sido pontuado é que Michael (2006) sequer havia indicado qualquer resposta a ser medida no 
experimento, apenas diz que a mudança seria reforçadora. 
O experimento de Jwaideh e Mulvaney (1976), citado na Introdução, havia 
demonstrado como estímulo luminoso poderia se tornar aversivo quando pareado a uma 
condição de menor produção de alimento em relação a outra. Esses dados fortalecem a noção 
de que o valor de uma condição de estímulo é estabelecido especificamente em relação a uma 
outra condição de estímulo. Se a condição de luz vermelha de VI 120s tivesse sido 
condicionada em alternância com uma condição de luz verde de um VI mais alto (ou até 
mesmo extinção), é possível que o resultado contrário tivesse sido observado: a luz vermelha 
teria sido produzida preferencialmente sem a luz verde (algo que que não foi empiricamente 
testado). 
Retornando ao exemplo de Michael (1975), uma condição de menos alimento e mais 
choque (sem tom) foi condicionada em alternância com uma condição de mais alimento e 
menos choque (com tom). Nesse caso seria possível supor que a condição sem tom, tal como 
a luz vermelha (Jwaideh & Mulvaney, 1976) se tornou um reforçador negativo condicionado 
e a condição com tom, se tornou um reforçador positivo condicionado. Dessa forma, 
respondendo à pergunta de Michael: “a mudança da condição deveria ser considerada 
reforçadora positiva ou negativa?”. De fato, tanto faz. A depender de qual estímulo for 
escolhido para ser descrito, a descrição pode ser classificada como reforçamento positivo ou 
negativo. Se a descrição for “a condição com tom foi adicionada”, essa descrição seria 
classificada como reforçamento positivo. Se a descrição for “a condição sem tom foi 
subtraída”, essa descrição seria classificada como reforçamento negativo. Outra possibilidade 
é afirmar que tanto a condição sem tom foi condicionada como reforçador negativo quanto a 
condição com tom foi condicionada como reforçador positivo, então o reforçamento é 
143 
 
 
positivo e negativo. A partir disso, o questionamento continua sendo: qual a utilidade de se 
classificar alterações ambientais como positivas ou negativas mesmo que isso seja possível? 
Respostas sobre algumas particularidades do condicionamento de estímulo (ou 
condições de estímulo) só poderão ser produzidas experimentalmente. Uma hipótese é que ao 
adquirir uma função semelhante, o reforçador condicionado se tornaria “aversivo”, em 
comparação com as condições diante das quais o reforçador de base é aversivo, e 
“reforçador”, em comparação com as condições diante das quais o reforçador de base é 
reforçador. Em outras palavras, a função do reforçador condicionado variaria de forma similar 
à função do reforçador de base. Essa parece ser uma possível forma de descrever o 
condicionamento de funções operantes levando em conta que as funções/valores de um 
estímulo são relativas e, ao mesmo tempo, não recorrendo à distinção positivo/negativo. Um 
experimento que poderia ser feito é seria condicionar uma luz vermelha fosse a um choque de 
2 mA e uma luz verde a um choque de 1 mA e testar se, mesmo na ausência dos choques, o 
rato passaria a emitir respostas que trocassem a luz vermelha para a verde (o mesmo poderia 
acontecer com estímulos condicionados a esquemas de FR 30 e FR 10). 
Em suma, é difícil dizer que um estímulo (ou condição de estímulo) possua uma 
função por si só e tampouco que uma caixa vazia seja um “estímulo neutro”. Condições de 
estímulos parecem ter ou adquirir funções operantes apenas enquanto contrapostos a uma 
outra condição de estímulo. Além disso, parece ser o caso que um estímulo reforçador só é 
reforçador na mesma medida em que um outro estímulo for aversivo e que, nesse sentido, as 
descrições “mais reforçador” e “menos aversivo” (ou “menos punitivo”) seriam equivalentes. 
Parece ser perfeitamente possível diferenciar quaisquer condições de estímulo entre menos 
reforçadora e outra mais reforçadora. Nesse sentido, se o objetivo for o corte de termos, essa 
análise mostrou parecer possível poder falar apenas de reforçadores, sem menção a tipos 
específicos de reforçadores ou a aversivos e punidores. 
144 
 
 
Os estudos de Perone e Courtney (1992) mostraram que, em esquemas mistos, a 
magnitude do reforçador poderia influenciar diretamente a duração das pausas seguintes entre 
razões - com pausas mais longas após reforçadores de maior magnitude. Já em esquemas 
múltiplos, em que estímulos discriminativos acompanharam diferentes magnitudes do 
reforçador, pausas mais curtas ocorreram após estímulos discriminativos que antecederam 
reforçadores de maior magnitude, e pausas mais longas ocorreram após os estímulos 
discriminativos que antecederam reforçadores de menor magnitude. Além disso, houve uma 
interação entre as magnitudes do reforçador previamente obtido e o controle discriminativo 
relacionado a uma magnitude de reforçador diferente, sendo o efeito da magnitude do 
reforçador anterior mais evidente quando o estímulo discriminativo era o que acompanhava 
um reforçador seguinte de menor magnitude. 
Perone (2003) indicou ter feito uma ampliação desse delineamento na qual a 
introdução de uma chave de fuga revelou que, nas transições de um reforçador de maior para 
menor magnitude no esquema múltiplo, a emissão de respostas de fuga que produziam um 
período de timeout (luz da caixa e da chave de alimento eram apagadas) como consequência, 
era mais provável do que na transições de reforçador de menor para maior magnitude e 
acompanhada de pausas mais longas no responder que produzia o reforçador de baixa 
magnitude. Esses resultados sustentam a interpretação de Perone & Courtney (1992) e Perone 
(2003) de que pausas entre razões podem funcionar como respostas de fuga a condições 
aversivas produzidas por certas transições dentro de esquemas de reforçamento positivo. 
Se interpretados desta maneira, esses resultados parecem indicar uma outra forma pela 
qual estímulos aversivos podem ser condicionados em esquemas que envolvem apenas 
contingências de reforçamento positivo. Esses experimentos colaboram com a noção de que o 
fundamental para que um estímulo seja condicionado como reforçador negativo e outro como 
145 
 
 
reforçador positivo é que haja duas condições contrastantes em que uma é mais reforçadora 
que a outra. 
Outro caso em que se identifica a ambiguidade da distinção entre reforçamento 
positivo e negativo consiste na discriminação de estímulo estabelecida por reforçamento 
negativo. Considere-se um pombo que é exposto a choques leves, mas duradouros, 
periodicamente. Se, diante de uma luz verde, bicar um disco eliminasse o choque e, diantede 
uma luz vermelha, emitir a mesma resposta não produzisse essa consequência, é esperado que 
o número de bicadas diante da luz verde passasse a ser maior do que na luz vermelha. Em 
outras palavras, a luz verde teria se estabelecido como estímulo discriminativo e a vermelha 
como estímulo delta para bicadas que produzissem interrupção dos choques. Além disso, 
também é provável que diante da luz vermelha e do choque, o pombo emita com frequência 
uma outra resposta que produza a luz verde (e.g., bicar um segundo disco) permitida pelo 
experimentador. Nesse sentido, pode-se dizer que a luz verde teria se tornado um estímulo 
reforçador condicionado positivo para a resposta de bicar o segundo disco, ilustrando como 
um reforçador positivo poderia ser criado em situações denominadas como de reforçamento 
negativo. 
Se interpretados na forma apresentada, esses dois exemplos têm em comum a 
construção de reforçadores condicionados que poderiam ser classificados como positivos ou 
negativos a partir do seu pareamento com reforçadores classificados de maneira oposta. 
Findley (1958), no entanto, apresenta uma interpretação alternativa a esse tipo de 
leitura. No experimento feito pelo autor, pombos foram expostos a esquemas concorrentes sob 
controle de estímulos discriminativos (luz verde e luz vermelha) que foram relacionados a 
diferentes razões de reforçamento. Os pombos podiam emitir uma resposta de bicar em uma 
chave de mudança, que alternava o esquema em vigor e o SD relacionado. As respostas de 
troca entre esquemas não foram, entretanto, interpretadas como respostas de fuga pelo autor. 
146 
 
 
Em vez disso, interpretou que esse padrão de troca era determinado de forma crítica pela 
frequência relativa de reforçamento, sem supor uma função aversiva condicionada para a luz 
relacionada pelo experimentador ao esquema de razão mais exigente. 
Implicações do Abandono da Distinção Sobre o Conceito de Punição 
Já foi indicado que tanto para Michael (1975) quanto para Baron e Galizio (2005) a 
estratégia mais coerente para se lidar com os problemas gerados pela distinção entre o 
reforçamento positivo e o negativo seria abandonar a distinção por completo e passar a 
separar processos apenas entre reforçamento e punição. O conceito de punição, no entanto, 
não é definido da mesma maneira entre autores. 
Como se sabe, Skinner (1953/2014) e Sidman (1989/2009), definem a punição de 
maneira procedimental, identificando-a como a apresentação de reforçadores negativos ou a 
retirada de reforçadores positivos após a emissão de uma resposta de determinada classe. Esse 
destaque se faz relevante uma vez que a definição de punição proposta por esses autores, 
conhecida como assimétrica, implica na identificação prévia de reforçadores e, além disso, na 
possibilidade de classificar esses reforçadores como sendo positivos ou negativos, já que a 
apresentação de um reforçador positivo ou retirada de um negativo não seriam definidas 
igualmente como punição. Dessa maneira, o abandono da distinção entre reforçamentos 
positivo e negativo teria impactos relevantes para a definição de punição, ao menos quando 
adotada a perspectiva assimétrica apresentada. 
Partindo-se de uma definição simétrica, no entanto, seria possível definir punição 
como um processo no qual uma determinada alteração ambiental, que sucede de forma 
suficientemente contígua e sistemática as emissões de instâncias de uma mesma classe de 
respostas, faz com que a probabilidade futura dessas emissões, quando diante de condições 
motivacionais e discriminativas semelhantes, diminua. Com exceção de alguns detalhes que 
também são raramente mencionados quando se define reforçamento (e.g., classes de resposta, 
147 
 
 
contiguidade, condições discriminativas e condições motivacionais), essa definição de 
punição parece bastante próxima da proposta por de Azrin e Holz (1966) de que “punição é 
uma redução da probabilidade futura de uma resposta específica como resultado da 
apresentação imediata de um estímulo em função dessa resposta” (p. 381). Essa definição não 
seria prejudicada pelo abandono da distinção entre reforçamento positivo e negativo. 
Algo importante de notar é que o fato de a distinção assimétrica de punição ficar 
prejudicada não implica na existência ou não de um processo punitivo que enfraqueça 
respostas. A diminuição na emissão de uma resposta ainda poderia ser explicada pelo 
reforçamento de outras respostas. Ainda assim, caso a distinção positivos/negativos fosse 
abandonada, a definição assimétrica precisaria de uma reformulação. 
Vale ressaltar que da mesma forma que o abandono da distinção entre os 
reforçamentos positivo e negativo acabaria prezando por uma parcimônia científica (no 
sentido de diminuir o número de conceitos necessários para se explicar fenômenos), a adoção 
da visão assimétrica de punição proposta por Skinner (1953/2014) também caminha nesse 
sentido. Se for possível explicar os efeitos da punição apenas recorrendo ao processo de 
reforçamento isso não caminharia na direção desejada por Michael (1975) e Baron e Galizio 
(2005) de abandonar nomeações desnecessárias? 
Por fim, além das mencionadas acima, outra implicação do debate sobre a distinção 
entre os reforçamentos positivo e negativo sobre o conceito de punição é que todas as 
ambiguidades e problemas apontados a respeito da distinção entre reforçamentos positivo e 
negativo também se aplicam aos tipos de punição positiva e negativa. Isso porque a crítica 
central de que a distinção é uma caracterização de descrições arbitrárias se aplica igualmente 
aos tipos de punição: qualquer descrição de adição de um estímulo pode ser reescrita como 
subtração de seu estímulo oposto e vice-versa. 
 
148 
 
 
Implicações do Conceito de Operação Motivadora para a Distinção 
Sidman (2006), ao rebater a noção de que estímulos possam ser sempre descritos em 
suas versões opostas, chegou a dizer que: 
É, sem dúvida, verdade que o fim de um período sem dinheiro pode ser crítico para 
determinar o valor reforçador do dinheiro, mas ainda assim vemos bilionários 
trabalhando arduamente para obter mais. A eficácia de alguns reforçadores positivos 
depende menos de sua ausência anterior do que do que eles tornam possível em termos 
de comportamento futuro. (Sidman, 2006, p.137). 
Neste trecho, Sidman (2006) reconhece que “um período sem dinheiro” pode 
estabelecer o valor reforçador do dinheiro. Em outras palavras, o período sem dinheiro tem 
função de operação estabelecedora do dinheiro como reforçador positivo. Entretanto, ele 
afirma que, em alguns casos, mesmo na ausência de um “período sem dinheiro” há pessoas 
(bilionários) trabalhando para produzir mais dinheiro. A despeito do que ele quis dizer com 
“arduamente” ou da própria definição de “trabalho” usada, para fins de simplicidade, o que 
será entendido como “trabalhando arduamente” será apenas que comportamentos que 
produzem dinheiro continuam sendo emitidos com frequência alta. 
Sidman (2006) conclui dizendo que a eficácia de alguns reforçadores depende menos 
de sua ausência anterior (i.e., “período sem dinheiro”) e mais do que tornam possível em 
termos de comportamento futuro. Partindo do princípio básico de que o futuro não pode 
controlar o passado, entender-se-á “o que possibilitam em termos de comportamento futuro” 
como “o que possibilitaram no passado em elos subsequentes da mesma cadeia 
comportamental”. No mesmo sentido, entendendo que não é o que será produzido no futuro 
que controla a produção atual de dinheiro, quais as variáveis presentes no momento da 
resposta que são responsáveis por evocá-la? Em outras palavras: como a produção de 
reforçadores por elos subsequentes ao elo atual está agindo sobre a presente resposta? 
149 
 
 
Quando se fala de estímulos reforçadores condicionados generalizados (como o 
dinheiro) é dito que eles não dependem de privações específicas que o estabeleçamcomo 
reforçadores, uma vez que foram pareados a diversos reforçadores, e são efetivos sob uma 
gama diversa de privações específicas. Isso não é o mesmo que dizer que nenhuma operação 
motivadora os controla, mas que qualquer operações motivadora envolvida no 
estabelecimento de outros reforçadores subsequentes na cadeia comportamental podem 
estabelecer o dinheiro como reforçador. Numa sociedade em que quase tudo pode ser 
produzido ou eliminado com dinheiro, isso incluiria incontáveis reforçadores condicionados 
ou incondicionados. 
Apesar de poder se argumentar a favor de uma operação motivadora condicionada que 
0estabelece o valor do dinheiro, privações, se entendidas como operações motivadoras 
incondicionadas, nunca se aplicam diretamente ao dinheiro. Outros estímulos condicionados e 
incondicionados condicionaram seu valor. Mesmo assumindo que um bilionário tivesse dez 
bilhões em dinheiro líquido para gastar (o que não costuma ser o caso porque grande parte 
dessa fortuna é mantida na forma de posses) ele ainda poderia querer comprar uma empresa 
avaliada em 12 bilhões, por exemplo. Pensando no comportamento de “fazer um 
investimento” que aumente seu dinheiro de 10 para 12 bilhões, ainda poder-se-ia afirmar que, 
mesmo se tratando de um bilionário, a situação envolveu necessariamente o “término de uma 
condição anterior na qual 12 bilhões estavam ausentes”. A presença específica de 12 bilhões, 
no caso, seria condição diante da qual a resposta de comprar a tal empresa poderia ser 
emitida. Em outras palavras, um estímulo discriminativo para a resposta de comprar e um 
reforçador condicionado para a resposta de investir. 
Talvez a base do argumento de Sidman (2006) seja que nem todo comportamento 
requer uma operação motivadora. Isso pareceria concordar com o que foi falado por Marr 
(2006) sobre ligar um rádio não ter relação com um “sofrimento” anterior à presença da 
150 
 
 
música. Se certos comportamentos podem ocorrer sem a presença de operações motivadoras, 
restaria explicar o que, dada a presença constante do estímulo discriminativo, faria o 
indivíduo se comportar numa hora e não na outra. Ou dada a presença de dois estímulos 
discriminativos, o que controlaria a emissão de cada resposta em momentos específicos. Esse 
outro debate, entretanto, deverá ser tratado em outros trabalhos dedicados ao tema das 
operações motivadoras. 
Iwata (2006) havia sugerido que avanços recentes na área de operações motivadoras 
sugeriam que distinções arbitrárias poderiam ser úteis para a área. Mais especificamente ele 
estava se referindo à distinção entre operações estabelecedoras e operações abolidoras. 
Enquanto o primeiro conceito descreveria o efeito das operações motivadoras de aumentar a 
probabilidade de respostas específicas, o segundo descreve o efeito de diminuir a 
probabilidade de respostas específicas. Iwata sugeriu que esse segundo conceito tinha sido 
criado para abarcar essa “bidirecionalidade”. Nesse sentido, talvez essa distinção seja 
arbitrária para Iwata por conta da inevitabilidade de que sempre que um comportamento 
aumenta de probabilidade, a probabilidade de outros comportamentos diminui e, de fato, isso 
se assemelharia com a noção de que toda adição implica uma subtração no caso da distinção 
positivo/negativo. 
Durante o debate, também foi sugerida a possibilidade de que propriedades das 
operações motivadoras envolvidas talvez fossem os aspectos mais relevantes para dizer se um 
reforçamento é positivo ou negativo (e.g., sua intensidade ou velocidade de introdução). 
Como discutido, talvez as categorias de operações motivadoras apresentadas não ajudem a 
manter ou desbancar uma distinção entre reforçamentos. Ainda assim, é bastante possível que 
avanços nas discussões ou até o desenvolvimento de outros tipos de categoria auxiliem nesse 
processo. O conceito de operações motivadora parece ter sido muito pouco pesquisado tanto 
teórica quando experimentalmente. 
151 
 
 
Talvez o elemento mais relevante do conceito de operações motivadoras para o debate 
sobre a distinção entre os tipos de reforçamento positivo e negativo seja a própria distinção 
entre os tipos de operação motivadora. As operações motivadoras incondicionadas (OMIs) 
podem ser divididas entre privação (de reforçadores primários, tais como por exemplo 
alimento, água e sono), estimulação dolorosa, variações na temperatura e variáveis sexuais. 
As operações motivadoras condicionadas (OMCs) podem ser divididas entre substitutas, 
reflexivas e transitivas (Michael, 2004). Vale ressaltar que Michael acrescenta como OEs 
como mesmo efeito que a privação de água, o sal, a transpiração e a perda de sangue. 
A princípio, se considerados os reforçadores relacionados à cada OE e como 
contingências de reforçamento que usam esses estímulos são tipicamente chamadas, as OEs 
poderiam ser divididas, grosseiramente, em OEs relacionadas a reforçamento positivo (i.e., 
privação, variáveis sexuais, substitutas e transitivas), e OEs relacionadas a reforçamento 
negativo (i.e., estimulação dolorosa e reflexiva) – as variações de temperatura, como já 
discutido, não podem ser facilmente classificadas por uma definição tradicional. 
Uma diferença entre a relação entre as OEs e a alteração ambiental reforçadora a qual 
estão relacionadas pode ser notada: quando choque é apresentado a um rato e ele emite uma 
resposta que o elimine, a mudança reforçadora é a própria eliminação do choque. Por outro 
lado, uma pessoa consome muito sal e isso aumenta a probabilidade de que ela emita 
respostas que no passado produziram água, ela não está eliminando o sal em si como 
consequência da resposta (ainda que a ingestão hídrica auxilie na eliminação do sódio pela 
urina posteriormente). Com base nisso, seria possível então basear uma distinção entre os 
reforçamentos positivos e negativos com base nos tipos de operação motivadora envolvidas? 
Esse poderia ser um caminho explorado por estudos futuros sobre o tema. 
Outra coisa a ser testada é se, dada a capacidade de induzir uma operação 
estabelecedora que estabelece o alimento como reforçador de forma intensa e abrupta (e.g., 
152 
 
 
uma droga de ação rápida que deixaria o animal “faminto”), será que um organismo, dadas as 
condições adequadas para tal, aprenderia a emitir respostas que interrompessem ou 
prevenissem a adição dessa droga em seu organismo? Quem sabe até mesmo intensidades 
mais moderadas de fome (que não provocariam dor) se fossem apresentadas subitamente, 
pudessem evocar respostas mais intensas. Uma possibilidade é estudar o comportamento de 
pessoas com condições como a Diabetes mellitus cuja hipoglicemia e a hiperglicemia podem 
causar alterações súbitas na fome (polifagia) e sede (polidipsia) (BIREME/OPAS/OMS, 
2017). Estudos como esse seriam úteis para investigar se seriam as propriedades das 
operações motivadoras ligadas a cada tipo de reforçamento. 
Algumas formas de dores de cabeça que aumentam em intensidade gradualmente e 
poderiam ser comparadas ao aumento da privação de alimento (e frequentemente pode ter 
causas semelhantes como privação de sono, alimento e água). Se um choque fosse adicionado 
de forma gradual e lenta, é possível que o organismo respondesse para eliminá-lo somente 
numa intensidade mais alta do que a que ele responderia se sua introdução fosse abrupta. 
Naturalmente, essas dúvidas só serão respondidas de forma experimental, mas elas ilustram a 
incerteza acerca de quais aspectos dos chamados reforçamentos positivo e negativo de fato 
estão controlando o comportamento de assim rotulá-los. 
Por fim, algo interessante de se notar é que o mesmo autor que havia proposto o 
abandono da distinção entre os reforçamentos positivos anos antes, propôs e seguiu 
desenvolvendo uma distinção entre operações motivadoras específicas (Michael, 1982, 2004). 
A crítica feita por Lattal e Lattal (2006) sobre uma distinção ter sido assumida a prioripode 
se aplicar aqui também, especialmente em uma área com baixíssima literatura experimental. 
Outro ponto a ser pesquisado seria o uso prático das categorias de operações motivadoras em 
relação às categorias de reforçamento. Mais especificamente, será que as contingências diante 
153 
 
 
das quais uma pessoa costuma dizer que uma operação motivadora é reflexiva, não são 
justamente as contingências que ela já considerava reforçamento negativo? 
 
154 
 
 
Considerações Finais 
A análise empregada permitiu a identificação e classificação das diversas falas dos 
autores de forma a agrupá-las e articulá-las. Sobre os problemas da manutenção, conclui-se 
que seus termos podem gerar confusão (em particular o termo “reforçamento negativo”) e que 
uma distinção baseada em adição ou subtração de estímulos, além de ter sido assumida antes 
que evidências convincentes tivessem sido produzidas, parece ser intrinsecamente ambígua. 
Nesse sentido, alguns autores acreditam que a distinção acaba por gerar simplificações e 
distorções conceituais, limitações de aplicação e problemas didáticos. 
A ambiguidade (tal como apontada por Michael, 1975 e Baron e Galizio, 2005) parece 
ser um problema intrínseco a uma distinção baseada nas operações adição ou remoção de 
estímulos. Nesse sentido, a classificação de uma mudança reforçadora como positiva ou 
negativa acaba sendo arbitrária e resume-se à forma como se escolhe descrever uma mudança. 
Todo evento reforçador envolve uma mudança de uma condição para outra condição e 
determina parâmetros específicos para ambos: em um a ausência (ou menor magnitude) de um 
estímulo e no outro sua presença (ou maior magnitude de um estímulo). A linguagem usada 
para descrever eventos e estímulos permite que tanto as mudanças quanto os próprios 
estímulos sejam descritos em ambas as direções opostas (i.e., calor e frio, luz e escuro, choque 
e ausência de choque). 
Nesse sentido, abandonar a distinção poderia ser vantajoso no sentido de gerar menos 
distorções e eliminar os problemas decorrentes. Vale ressaltar que abandonar a distinção e 
mudar a forma de descrever contingências são duas coisas diferentes. Michael (1975) havia 
sugerido que descrever as mudanças como adição e subtração de estímulos atrapalharia que 
descrições detalhadas das condições envolvidas na mudança pudessem ser feitas. Entretanto, 
como apontaram Baron e Galizio (2005, 2006a), esse não precisa ser o caso. 
155 
 
 
Como discutido, a manutenção da distinção e o uso dos termos “adição” e “subtração” 
(e seus equivalentes) são coisas diferentes. Nem o uso nem o abandono desses termos 
implicaria em uma descrição mais ou menos precisa dos dados. Apesar de haver casos em que 
é importante descrever precisamente as condições antecedentes e subsequentes, nos casos em 
que dizer que “uma condição de ausência de determinado estímulo” mudou para “uma 
condição de presença desse estímulo”, o procedimento poderá ser facilmente resumido como 
“adição de um estímulo” sem perda de qualquer informação. Dito isso, usar termos adição e 
subtração como formas convenientes de descrever um fenômeno é diferente de dar nomes 
específicos para as contingências que foram descritas assim e ainda atribuir a elas diferenças 
processuais fundamentais. Parar de nomear relações como reforçamento positivo ou negativo, 
não implica que não se possa dizer que calor foi adicionado ou frio foi subtraído. Ambas as 
descrições funcionam para comunicar adequadamente a (mesma) informação. 
Mesmo diante dos seus problemas conceituais apontados, foi argumentado que a 
distinção poderia cumprir funções relevantes em diferentes contextos (categorias “Vantagens 
da Manutenção” e “Explicações para a Manutenção”). A análise dessas falas revelou que 
muitas dessas funções não necessariamente se restringiam ao uso da distinção, enquanto 
outras pareciam se originar de momentos em que a argumentação de Baron e Galizio (2005) 
foi confusa – algo que os autores abordaram em suas respostas (Baron & Galizio, 2006a, 
2006b). Outro ponto é que a confusão/ambiguidade da distinção impedia que muitas dessas 
possíveis funções se aplicassem. Por exemplo, como afirmou Michael (1975) “se a distinção é 
difícil de ser feita em muitos casos de comportamento humano, o alerta [para se utilizar 
reforçamento positivo em vez de negativo] não será fácil de seguir” (pp. 41-42). 
Algumas explicações para a manutenção da distinção recorriam à noção de que seu 
uso era mantido puramente por contingências de reforçamento arbitrárias e não por uma 
156 
 
 
vantagem intrínseca de seu uso. Em outras palavras, só é usada porque já é usada e valorizada 
pela comunidade verbal de analistas do comportamento. 
Em contrapartida, alguns autores sugeriram que se o critério de adição e subtração não 
tem fundamento, talvez outros fatores estivessem levando analistas do comportamento a 
separar contingências de reforçamento como sendo positivas ou negativas. Entre os aspectos 
levantados estão a abruptidão da mudança ambiental, os mecanismos fisiológicos envolvidos, 
as “emoções” ou “sentimentos” envolvidos, a severidade das operações motivadoras, a 
saliência da mudança e propriedades particulares de estímulos específicos. 
Duas explicações também foram oferecidas para justificar o porquê de o abandono ter 
sido sugerido. Uma delas (Marr, 2006) se referia à noção de que a distinção poderia ter sido 
útil em algum momento, mas agora pode ser descartada. A outra (Sidman, 2006) indicou a 
possibilidade de que tenha havido uma má compreensão da distinção. Nessa situação, Sidman 
afirma: 
Suspeito que uma das razões para o desconforto de Baron e Galizio (2005) com a 
distinção entre reforçamento positivo e negativo seja a sensação de que ela reflete 
diferenças no próprio processo de reforçamento. Não tenho certeza de onde essa 
sensação vem. Para qualquer um que defenda tal visão, a discussão convincente deles 
deveria encerrar a questão. (Sidman, 2006, p. 137). 
Nesse sentido, Sidman (2006) parece afirmar que a diferença entre os dois tipos de 
reforçamento não estaria nos processos, mas não especifica qual seria essa diferença. Uma 
possibilidade diz respeito à presença ou não de efeitos colaterais como indicado em Sidman 
(1989/2009) - apesar de ele não mencionar essa possibilidade no debate. 
Com relação às sugestões feitas pelos autores, alguns direcionamentos gerais podem 
ser feitos com base na análise já realizada: 1) usar os termos adição e subtração (e seus 
equivalentes) quando permitirem uma comunicação mais efetiva da operação; 2) recorrer à 
157 
 
 
sugestão de Michael (1975) de indicar condições de estímulo pré e pós-mudança como forma 
de descrever uma mudança reforçadora; 3) ensinar os conceitos de “reforçamento positivo” e 
“reforçamento negativo” aos novos alunos e leitores, de modo que possam compreender e 
navegar a literatura da área; 4) é possível manter os termos “positivo” e “negativo” como 
descrições operacionais, desde que não se atribuam a eles processos distintos de 
reforçamento; 5) explicar por que atribuições processuais distintas a essas formas de descrição 
não são viáveis, devido à ambiguidade inerente à distinção baseada em adição e subtração; 6) 
ensinar os termos “reforçadores positivos”, “reforçadores negativos”, “estímulos aversivos” e 
“estímulos punidores” destacando sua natureza relacional, ou seja, enfatizando que a função 
de um estímulo depende da contingência em que ele está inserido; 6) considerar a substituição 
de todos esses termos pelas descrições “mais reforçador” ou “menos reforçador”. 
Essas sugestões buscam lidar com grande parte dos problemas apontados tanto sobre a 
manutenção quanto sobre o abandono da distinção. Lattal e Lattal (2006) haviam ressaltado 
que a distinção, enquanto mantiver as funções comunicativas, práticas, culturais e/ou sociais 
que tem, permanecerá sendo usada a despeito de sua negação comoconceito – e o mesmo 
pode ser dito sobre as noções de estímulo aversivo e estímulo punidor. Não só isso, mas os 
custos associados com uma mudança completa na linguagem podem não valer a pena. De 
todo modo, com base nas considerações de Baron e Galizio (2005) e outros, poder-se-ia dizer 
que, se consideradas as ambiguidades inerentes à distinção e desde que condições não deixem 
de ser bem descritas em nome dela, talvez não haja prejuízo em manter os termos 
tradicionalmente usados. 
Limites do Presente Estudo 
O presente trabalho possui algumas limitações relevantes, tanto em seus 
procedimentos metodológicos quanto à abordagem adotada para a análise dos dados. Sobre a 
categorização dos textos, é importante reconhecer que as categorias utilizadas para classificar 
158 
 
 
os dados também implicam em uma ambiguidade própria. Como já indicado no método e nos 
resultados, as razões pelas quais cada uma das falas foi classificada diz respeito à forma como 
cada autor da fala a formulou. Particularmente quando se consideram as categorias 
“Problemas” e “Vantagens”, qualquer fala pertencente a um dos dois grupos poderia ser 
facilmente reescrita para fazer parte do outro, sem alteração em seu conteúdo central. Mais 
especificamente, as categorias “Vantagens da Manutenção” e “Problemas do Abandono”, bem 
como “Vantagens do Abandono” e “Problemas da Manutenção”, são semanticamente 
equivalentes: dizer que abandonar a distinção “Gera Menos Distorções” equivale a afirmar 
que mantê-la gera mais distorções. De forma análoga, dizer que a distinção “Tem uma Função 
Prática” equivale a dizer que seu abandono implicaria a perda dessa função. 
Um exemplo em que isso fica evidente está na ausência de uma categoria “Problemas 
do Abandono”. Essa opção existia enquanto categoria na planilha, mas acabou não sendo 
aplicada a nenhuma fala. Isso não quer dizer que nenhum problema com o abandono tivesse 
sido indicado, mas que falas que poderiam ter sido interpretadas como “Problemas do 
Abandono” foram incorporadas à outras categorias equivalentes. Entre elas, “Vantagem da 
Manutenção” ou os contra-argumentos das “Vantagens do Abandono” e “Problema da 
Manutenção”. 
Cabe ainda um adendo: a escolha do termo “Problema” ao invés de “desvantagem” foi 
motivada pelo fato de que muitos dos argumentos apontavam falhas conceituais ou lógicas na 
distinção sem, necessariamente, indicar prejuízos práticos. O termo “Vantagem” foi mantido 
como o antônimo funcional de “Problema” mais adequado nesse contexto, por não significar 
“solução”. De toda forma, isso evidencia que a classificação das falas envolveu certo grau de 
subjetividade, e que a leitura, categorização, interpretação e discussão dos dados depende, 
talvez mais do que em outros tipos de pesquisa, da história pessoal do autor que a está 
realizando e de seus recursos disponíveis. O que pode ser considerada uma vantagem no 
159 
 
 
sentido de produzir análises mais contextualizadas, articuladas e interpretativas, acaba sendo 
limitado no sentido de que a análise passa a depender fortemente das compreensões e escolhas 
do pesquisador, o que pode introduzir vieses, reduzir a possibilidade de replicação do método 
e dificultar a concordância entre avaliadores. 
Ainda que o trabalho tenha buscado interrelacionar ao máximo as falas apresentadas 
tanto entre si quanto com conceitos e dados relevantes, é importante reconhecer que ele não 
esgota todas as possibilidades a serem exploradas e desenvolvidas. Além disso, a 
padronização da categorização das falas pode acabar excluindo detalhes importantes de falas 
individuais de um texto. 
Outra limitação diz respeito à amostra de textos selecionada. Embora a escolha de 
restringir a análise ao debate de 2005/2006 da revista The Behavior Analyst tenha garantido 
um grupo coeso e interrelacionado, isso também impõe restrições à generalização dos 
resultados. Outras discussões sobre o tema, especialmente desenvolvimentos empíricos 
posteriores ou novas conceitualizações não foram incorporadas à análise. Do mesmo modo, a 
exclusão do texto de Michael (1975), ainda que fundamentada por critérios metodológicos, 
pode ter excluído alguma fala importante que acabou não sendo incluída nos dados. Isso pode 
ter sido, entretanto, mitigado pela apresentação de seu texto na introdução e inclusão direta de 
algumas de suas falas ao longo da discussão. 
Sugestões para Trabalhos Futuros 
A ambiguidade da distinção, como apresentada por Baron e Galizio (2005), não é 
puramente experimental, mas conceitual, particularmente, relacionada à forma de descrever os 
eventos do mundo. A princípio, não há como se fazer uma pesquisa que gere mudanças no 
fato de que “a adição de um estímulo” e “subtração da retirada desse estímulo” signifiquem 
semanticamente a mesma coisa (i.e., descrevam a mesma mudança ambiental). Em outras 
palavras, dados experimentais não mudariam o fato de que a linguagem usada é 
160 
 
 
intrinsecamente ambígua. Dito isso, há vários tipos de investigações teórico-conceituais que 
poderiam ser feitas tanto que sugiram uma nova linguagem ou convenções que contornem os 
problemas citados, mas também pesquisas empíricas que comparem as contingências que 
ainda são chamadas de positivas ou negativas e que possam fornecer, se aplicável, novos 
critérios para o que vinha sendo distinguido – ou seja, talvez elas facilitem a identificação dos 
estímulos discriminativos que evocam as respostas verbais “reforçamento positivo” e 
“reforçamento negativo” em analistas do comportamento. 
Nesse sentido, além das sugestões conceituais e didáticas já apresentadas, os autores 
do debate também sugeriram diversas linhas de investigação para aprofundar o entendimento 
sobre a distinção entre reforçamento positivo e negativo ou outros pontos relevantes. Entre 
elas, estão: 1) estudos que esclareçam ou aprimorem as definições atuais de reforçamento 
positivo e negativo (Sidman, 2006); 2) investigações sobre como mudanças paramétricas 
dentro de um contínuo deveriam ser classificadas (Iwata, 2006); 3) pesquisas que analisem as 
razões pelas quais a distinção é mantida (e.g., por meio de levantamento com professores ou 
análise de livros da área, Chase, 2006); 4) estudos que examinem o uso da distinção em outras 
áreas do conhecimento, para entender suas possíveis funções culturais (Chase, 2006; Lattal & 
Lattal, 2006); 5) pesquisas que investiguem experimentalmente os efeitos de diferentes 
reforçadores tradicionalmente classificados como positivos ou negativos, buscando 
parâmetros comuns para comparação (Lattal & Lattal, 2006); 6) estudos que diferenciem 
melhor os conceitos de operação, efeito e explicação/razão nos processos de reforçamento e 
punição (Marr, 2006); 7) investigações sobre a relação entre condicionamento operante e 
condicionamento emocional, manipulando variáveis como privação e saciação (Staats, 2006); 
8) estudos básicos sobre as condições necessárias e suficientes para a aquisição e manutenção 
de respostas sob reforçamento e esquiva (Marr, 2006); 9) pesquisas que apontem para novas 
possibilidades de termos para substituírem os atuais (Baron e Galizio, 2006a; Sidman, 2006); 
161 
 
 
10) pesquisas que explorem o próprio comportamento de cientistas ao distinguir 
reforçamentos e os efeitos de diferentes formas de nomeação (Baron & Galizio, 2006a). Desse 
modo, uma conclusão bastante contundente que se pode tirar da presente análise é que o 
debate realizado por esses autores indicou de maneira profícua diversos caminhos 
investigativos para que analistas do comportamento lidem com essa difícil questão conceitual. 
Sobre esse último ponto, já foram mencionadas diversas possibilidades trazidas pelos 
autores de fatores que poderiam controlar o comportamento de distinguir contingências entre 
reforçamento positivo e negativo que não a operação envolvida entre resposta e consequência 
(i.e., adição/subtração). Entre18 
 
 
ruído alto etc.; pois é a ausência após a presença que é eficaz, e isso é apenas outra 
forma de dizer que o estímulo foi removido. (p. 73) 
Nesse sentido, para Skinner (1953/2014) aponta tanto para o efeito do reforçamento 
sendo o mesmo nos dois casos, quanto o evento reforçador não é um estímulo estático, mas a 
própria mudança ambiental. A ausência só é capaz de reforçar o comportamento se ela for 
antecedida pela presença. Isso não é dito, mas a situação contrária também seria verdadeira 
para o reforçamento positivo. 
A preferência particular do autor deste trabalho pelos termos “adição” e “subtração” 
ao descrever as operações envolvidas se dá porque, além de fazer uma referência mais 
inequívoca a operações, esses termos têm uma conotação mais abrangente quanto ao tipo de 
alteração envolvida, isto é, enquanto “acréscimo” ou “retirada” parecem implicar uma 
completa ausência anterior do estímulo (de zero para um), “adição” e “subtração” podem se 
referir também a alterações quantitativas mais sutis nas propriedades de um estímulo ao longo 
de contínuos (magnitude, duração, probabilidade e atraso, por exemplo). 
Reforçadores Positivos e Negativos 
Como fora mencionado, o aumento na frequência de uma classe de respostas 
(característico de qualquer reforçamento) só ocorrerá se eventos ambientais específicos 
ocorrerem após uma ação do organismo. Como fica implícito pela definição de reforçamento 
apresentada, nem todas as alterações ambientais provocam alterações na frequência de uma 
determinada classe de respostas. Um exemplo disso é o de uma criança que continua 
caminhando em direção a um carrinho de sorvete, a despeito de deixar ou não pegadas na 
areia ou fazer som. O que mantém a frequência desse comportamento é que, ao caminhar, a 
criança produz proximidade em relação ao carrinho de sorvete. Isso significa que os eventos 
ambientais visuais e auditivos ao caminhar nesse caso não são estímulos para o caminhar – 
mesmo que possam ser para outros comportamentos. 
19 
 
 
Ao tipo de estímulo envolvido no reforçamento positivo e cuja adição ao ambiente do 
organismo tem a capacidade de gerar um aumento na frequência de respostas que 
antecederam sua adição ao ambiente, se dá o nome de reforçador positivo. Ao tipo de 
estímulo envolvido no reforçamento negativo e cuja subtração do ambiente do organismo tem 
a capacidade de gerar um aumento na frequência de respostas antecederam sua remoção do 
ambiente, se dá o nome de reforçador negativo. 
Por outro lado, quando um reforçador negativo é apresentado ou quando um 
reforçador positivo é retirado, se está falando de punição (Skinner, 1953/2014; Sidman, 
1989/2009). Independentemente da visão acerca da punição, simétrica ou assimétrica (ver 
Mayer, 2011), o efeito da punição é diminuir a frequência (pelo menos momentaneamente) de 
uma classe de respostas, seja diminuindo diretamente a sua probabilidade (visão simétrica) ou 
aumentando a probabilidade de comportamentos concorrentes via eliciação de reflexos 
incondicionados, condicionamento reflexo e reforçamento negativo de respostas operantes 
(visão assimétrica), que são incompatíveis com o responder punido. 
Dito isso, aos procedimentos em que isso ocorre pela adição subsequente e sistemática 
de estímulo reforçador negativo (chamado também de aversivo por alguns autores) dá-se o 
nome de punição positiva. Aos procedimentos em isso ocorre por conta da subtração 
subsequente e sistemática de estímulo reforçador positivo, dá-se o nome de punição negativa. 
Assim, constata-se que as definições de reforçamento positivo e negativo, bem como de 
reforçadores positivos e negativos, têm implicações para outros conceitos da análise do 
comportamento, como os de punição positiva e negativa. Isso é especialmente importante se 
considerarmos que a distinção entre reforçamento positivo e negativo tem sido questionada 
por alguns autores ao longo do desenvolvimento conceitual da área. Os argumentos 
envolvidos nesse questionamento e nas respostas a ele é o tema de principal interesse do 
presente trabalho. 
20 
 
 
Existe Diferença Entre os Reforçamentos Positivo e Negativo? 
Michael (1975) inicia seu texto “Positive and Negative Reinforcement, a Distinction 
That Is No Longer Necessary; Or a Better Way to Talk about Bad Things [Reforçamento 
positivo e negativo, uma distinção que não é mais necessária; ou uma melhor forma de falar 
sobre coisas ruins]”, escrito há exatos 50 anos, enfatizando que as práticas verbais da 
comunidade de analistas do comportamento, assim como de qualquer outra área da ciência, 
evoluem majoritariamente guiadas pela sua eficácia. Entretanto outros fatores que ele chama 
de “não-funcionais” podem afetar esse processo – tal como ocorre na evolução filogenética. O 
autor cita dois exemplos de como essas práticas podem ser mantidas sem relação (pelo menos 
atual) com uma vantagem na produção de conhecimento: práticas mantidas por outros tipos de 
reforçamento social (e.g., elogios dados a alguém que usa palavras consideradas sofisticadas) 
e por terem sido eficazes na formação inicial daquele conhecimento por fazerem paralelos 
com outros conceitos, mas que agora seriam desnecessárias. 
Um exemplo disso pode ser observado no campo da matemática, em que há mais de 
100 anos (ver Thomas, 1920) existe uma discussão a respeito da mudança do sistema decimal 
de numeração para um duodecimal (12 algarismos ao invés de dez) por conta de o número 12 
ter mais divisores inteiros (1, 2, 3, 4, 6, 12) do que o dez (1, 2, 5 e 10) – algo que facilitaria 
diversos tipos de cálculo. Neste exemplo, o trabalho para se mudar uma prática cultural tão 
bem estabelecida poderia justificar a sua manutenção. 
Michael (1975) destaca então que, apesar de que as terminologias serem determinadas 
por conta da evolução de práticas culturais e não por puros “acordos sociais”, o que faz a 
ciência e a filosofia é, justamente, buscar afetar esse processo evolutivo numa direção 
desejada. Em seguida, o autor faz uma breve retomada dos conceitos de reforçamento positivo 
e negativo ao longo dos anos, apresentando contradições, imprecisões e alterações que ele 
afirma poderem ter tornado a compreensão desses conceitos confusa. Em especial, destaca-se 
21 
 
 
o uso anterior do termo “reforçamento negativo” no sentido do que hoje é chamado de 
punição (ver Skinner, 1938) e o seu atual uso no sentido de ser um dos processos que 
aumentam a frequência de resposta. 
Michael atribui a mudança do significado do termo aos resultados dos experimentos 
de Skinner (1938) e Estes (1944) que sugeriram que qualquer enfraquecimento de uma 
resposta gerado por uma punição era, na verdade, resultado do fortalecimento de uma resposta 
incompatível (visão assimétrica de punição). Se não é o estímulo “punidor” que enfraquece a 
resposta, mas sim a remoção de um novo estímulo condicionado que fortalece uma resposta 
incompatível, este segundo processo que é o mais relevante e deveria ser chamado 
“reforçamento negativo”. 
Ademais, o autor ressalta a ambiguidade gerada pelo uso ampliado do termo 
“estímulo”, afirmando que no cotidiano isso pode não gerar muitos problemas, mas em 
situações em que se deseja definir processos e termos específicos, isso pode ser prejudicial, já 
que o termo “estímulo” é principalmente usado para descrever condições estáticas de 
estimulação. Presumivelmente, Michael se referia a frases comuns como “o estímulo 
reforçador fortalece a resposta” em que a alteração ambiental ocorrida fica omitida. Essa 
alteração fica de alguma forma evidente em usos como “a apresentação do estímulo 
reforçador fortalece a resposta” (já que se presume que se houve acréscimo, havia ausência), 
mas o autor acredita que isso poderia ser mais bem explicitado pelo uso de termos como 
“mudança de estímulo” (“stimulus change”), ou seja, “a mudança de estímulo fortalece a 
resposta”. Tanto o reforçamento quantoelas: a abruptidão da mudança ambiental (Michael, 1975; Baron 
e Galizio, 2005), os mecanismos fisiológicos envolvidos (Michael, 1975; Baron e Galizio, 
2005), as “emoções” ou “sentimentos” envolvidos (Michael, 1975; Baron e Galizio, 2005; 
Staats, 2006), a severidade das operações motivadoras (Sidman 1989/2009; Baron e Galizio, 
2005), a saliência da mudança (Chase, 2006) ou ainda propriedades particulares dos estímulos 
usualmente empregados (Lattal & Lattal, 2006). Como discutido ao longo do trabalho, outros 
autores (e.g., Skinner, 1953/2014; Sidman, 1989/2009) apontam para a presença de efeitos 
colaterais como uma possível variável discriminativa para a distinção, o que não foi sugerido 
pelos autores do debate (inclusive pelo próprio Sidman, 2006). 
Uma possibilidade seria investigar na literatura quais desses fatores (e outros) podem 
ser identificados nas contingências (ou nas descrições de contingências) que parecem estar 
controlando o comportamento de quem classifica essas contingências. Outra proposta 
interessante seria desenvolver experimentos em que analistas do comportamento fossem 
convidados a classificar diferentes contingências como exemplos de reforçamento positivo ou 
negativo, variando sistematicamente os fatores envolvidos, para avaliar quais aspectos 
controlam essas classificações. Isso poderia fornecer dados para se pensar em novos critérios 
mais consistentes para a distinção ou o estabelecimento de novas distinções importantes. 
162 
 
 
Por fim, vale retomar que os dois tipos de reforçamento raramente são estudados em 
conjunto e de forma simétrica (Magoon & Critchfield, 2008; Magoon et al., 2017). Como 
apontado por esses mesmos autores, as diferenças de performance encontradas, até então, 
entre os comportamentos mantidos pelos chamados reforçamento positivo e negativo podem, 
em grande parte, ser atribuídas a diferenças procedimentais. Nesse sentido, mais pesquisas 
que investiguem, de forma paralela, possíveis diferenças entre os reforçamentos positivo e 
negativo, também podem apontar para novos elementos distintivos. 
Em Direção à Uma Nova Proposta de Distinção 
A ambiguidade da distinção reforçamento positivo/negativo, por não ser uma forma 
inequívoca de distinguir práticas desejáveis e indesejáveis, acaba podendo abrir margem para 
que práticas consideradas indesejáveis sejam justificadas e mantidas simplesmente por 
poderem ser classificadas como reforçamento positivo. Esse risco aumenta ainda mais por 
falas como a de Baron e Galizio (2005) de que “quando estímulos dolorosos são usados como 
meio de modificação do comportamento, os efeitos colaterais indesejáveis podem ser 
compensados pela gravidade do transtorno em tratamento” (p. 91), uma vez que validam que 
até mesmo práticas já antes classificadas como aversivas possam ser usadas. 
Holland (1978) criticou os procedimentos de modificação de comportamento 
aplicados em instituições fechadas justamente porque, em certos programas descritos como 
“baseados em reforçamento positivo”, por envolverem a adição de bens e serviços de forma 
contingente à emissão de algumas respostas, era feita a retirada prévia desses recursos. O 
estabelecimento dessas privações, muitas vezes severas (e.g., isolamento), torna a intervenção 
como um todo muito mais aversiva. Segundo o autor: 
“Um sistema de modificação de comportamento pode, ele mesmo, utilizar apenas 
reforçamento positivo, mas, se os estratos superiores desejam manter a maior parte da 
163 
 
 
riqueza e dos privilégios, restrição e coerção precisam ser utilizadas para manter o 
controlado dentro das regras do sistema.” (Holland, 1978, p. 171). 
Tanto Skinner (1953/2014) quanto Sidman (1989/2009) citam as privações 
socialmente estabelecidas como um caso de mau uso do reforçamento positivo. Além disso, 
Skinner (1971) ainda destaca que alguns comportamentos mantidos por reforçamento positivo 
podem ser prejudiciais a longo prazo (e.g., jogos de azar, drogas e comportamento sexual de 
risco). 
Vale ressaltar que se analistas do comportamento passassem a utilizar intervenções 
indesejáveis nomeando-as como reforçamento positivo, o que poderia ter sido aceito em 
primeiro momento provavelmente se converteria em recusa rapidamente. No fim das contas, 
não é o nome dado, mas as características das contingências planejadas que importam. Como 
Sidman havia sugerido, se as pílulas de aspirina não mais tivessem efeito, qualquer um pararia 
de tomá-las. 
Mesmo que a distinção, em muitos casos, esteja sendo usado de forma questionável, 
pode ser que o abandono da distinção possa piorar ainda mais a situação, já que atualmente, 
pelo menos, parece existir uma tentativa de caminhar na direção certa quanto a escolha de 
procedimentos que evitam efeitos indesejáveis. Diante disso, Michael (1975) sugeriu - e 
Baron e Galizio (2005) concordaram - que a melhor forma que se teria de falar sobre coisas 
boas e ruins é, simplesmente, falar sobre reforçamento e punição. 
Um problema com essa sugestão é que, como apontou Sidman (2006), os autores 
assumiram uma posição sobre o conceito de punição que faz parte de um debate sobre o qual 
não há consenso até os dias atuais. Outro problema seria que ela não abarca os efeitos 
indesejáveis da extinção/indisponibilidade do reforçamento ou de operações motivadoras 
intensas que não envolvem necessariamente a punição (i.e., ainda haveria “coisas ruins” não 
abarcadas pelo termo punição). 
164 
 
 
No tópico “Implicações Sobre o Conceito de Reforçadores”, foi ressaltado que, para 
que uma condição seja considerada reforçadora, um aumento na frequência de respostas que a 
produziu precisaria ser observado. Mesmo assim, essa condição só poderia ser chamada de 
reforçadora em relação àquela condição pré-mudança específica que poderia ser chamada 
tanto de “menos reforçadora” como de “aversiva”. Sobre essa noção, algumas considerações 
precisam ser feitas. 
Quando se considera um rato que está diante de um choque e não está emitindo as 
respostas que o eliminam, alguns fatores podem ser considerados: 1) existe uma resposta 
disponível que elimine o choque? 2) Qual a exigência para a emissão dessa resposta? E 3) o 
rato teve a oportunidade de aprender a emitir essa resposta? Essas três perguntas dizem 
respeito à controlabilidade desse choque. Como colocado, a definição do que é ou não 
reforçador (e por tabela o que é ou não aversivo ou punidor) exige, necessariamente a emissão 
de respostas que o produza ou elimine. Nesse sentido, um indivíduo poderia ser submetido a 
um determinado estímulo e, sem nenhuma, possibilidade de fuga, não se poderia dizer que ele 
seria. Mesmo que uma possibilidade de fuga existisse, talvez ela fosse tão custosa (razão 
muito alta) que a resposta também não fosse emitida. Também é possível que uma resposta de 
fuga pouco custosa estivesse disponível, mas que o indivíduo acabasse nunca emitindo-a 
porque tal variação simplesmente não ocorreu. O indivíduo submetido a esse estímulo poderia 
estar demonstrando alguns sinais de algo que poderia ser chamado de “sofrimento” ou até 
mesmo descrevendo exatamente isso se fosse humano, mas, a princípio, nada poderia ser dito 
sobre a aversividade desse estímulo, já que fatores como respondentes eliciados, emoções, 
sentimentos ou relatos verbais não fazem parte dessa categorização. 
A partir disso, fica parecendo que, além da ausência de um consenso no debate sobre 
reforçamento positivo x negativo e punição simétrica x assimétrica, as próprias delimitações 
ligadas aos conceitos de punição e reforçamento negativo limitam a definição de controle 
165 
 
 
aversivo sugerida por Skinner (1953/2014) e, similarmente, a definição de coerção sugerida 
por Sidman (1989/2009). A sugestão de evitar o reforçamento negativo, como apontado por 
Michael (1975, 2006) não pode ser facilmente seguida porque a distinção é ambígua e a 
passagem de qualquer condição para outrasugere que a anterior seja aversiva (incluindo em 
contingências tipicamente classificadas como positivas). Ao mesmo tempo, a sugestão de 
evitar a punição também não daria conta de instâncias em que a indisponibilidade do 
reforçamento (extinção como condição aversiva) não está sendo apresentada de forma 
contingente a uma resposta específica - algo que parecia ser contornado pela sugestão de 
evitar o reforçamento negativo. 
Diante das dificuldades já citadas de se recorrer a distinção positivo/negativo ou à 
distinção reforçamento/punição para guiar as intervenções que deverão ser ou não endossadas, 
uma possibilidade seria contrastar a condição de estímulo aplicada com as condições 
anteriores a ela. Em outras palavras: uma condição de estímulo só deveria ser usada em uma 
intervenção se ela tiver sido demonstrada como reforçadora no passado diante da condição de 
estímulo presente. Talvez se o objetivo é evitar sofrimentos desnecessários ou efeitos 
colaterais, dever-se-ia, no mínimo, manter sempre disponível a possibilidade de um indivíduo 
voltar para a condição anterior a que está sendo apresentada. Além disso, é importante que a 
resposta que possibilitaria o indivíduo de voltar deveria ser uma resposta de baixo custo que o 
indivíduo já demonstrou ser capaz de emitir. Dessa forma, talvez fosse possível garantir, 
dentro de alguns limites, que o alvo da intervenção pudesse se manter (na maior parte do 
tempo) na condição mais reforçadora para ele, e que as mudanças de estímulo introduzidas só 
pudessem caminhar numa direção que seja mais reforçadora, nunca menos. 
Essa é, certamente, uma sugestão idealizada. Mudanças na direção de diminuir a 
aversividade de práticas de intervenção (e do mundo como um todo) costumam ser 
trabalhosas e, muitas vezes, enfrentam resistências institucionais, culturais e pessoais. Ainda 
166 
 
 
assim, com base no que foi discutido até então, pode-se concluir que qualquer ajuda na 
direção de tornar viável que outras pessoas se comportem para produzir uma condição um 
pouco mais reforçadora que a anterior já representa um ganho considerável - não apenas para 
quem é diretamente afetado, mas também como passo concreto na construção de práticas mais 
sensíveis, eficazes e sustentáveis a longo prazo. 
 
167 
 
 
Referências 
Andery, M. A., Sério, T. M., & Micheletto, N. (Orgs.). (2009). Comportamento e 
causalidade. Pontifícia Universidade Católica de São Paulo.  
Azrin, N. H. (1961). Time-out from positive reinforcement. Science, 133(3450), 382-383. 
https://doi.org/10.1126/science.133.3450.382 
Azrin, N. H., Holz, W. C., Hake, D. F., & Ayllon, T. (1963). Fixed-ratio escape 
reinforcement. Journal of the experimental analysis of behavior, 6(3), 449–456. 
https://doi.org/10.1901/jeab.1963.6-449 
Azrin, N. H. & Holz, W. C. (1966). Punishment. In W. K. Honig (Org.), Operant behavior: 
Areas of research and application (pp. 380-447). Appleton-Century-Crofts. 
Baron, A., & Galizio, M. (2005). Positive and negative reinforcement: Should the distinction 
be preserved? The Behavior Analyst, 28(2), 85-98. 
https://doi.org/10.1007/BF03392107 
Baron, A., & Galizio, M. (2006a). Distinguishing Between Positive and Negative 
Reinforcement: Responses to Nakajima (2006) and Staats (2006). The Behavior 
Analyst, 29(1), 273-277. https://doi.org/10.1007/BF03392137 
Baron, A., & Galizio, M. (2006b). The distinction between positive and negative 
reinforcement: Use with care. The Behavior Analyst, 29(2), 141-151. 
https://doi.org/10.1007/BF03392127 
Baum, W. M. (1999). Compreender o behaviorismo: Ciência, comportamento e cultura (M. 
T. A. Silva, M. A. Matos, G. Y. Tomanari & E. Z. Tourinho, Tradutores.). Artes 
Médicas. [Obra original publicada em 1994] 
Cameschi, C. E., & Abreu-Rodrigues, J. (2005). Contingências aversivas e comportamento 
emocional. Em J. Abreu-Rodrigues & M. R. Ribeiro (Orgs.), Análise do 
comportamento: Teoria, pesquisa e aplicação (pp. 113-137). Artmed. 
https://doi.org/10.1126/science.133.3450.382
https://doi.org/10.1901/jeab.1963.6-449
https://doi.org/10.1007/BF03392107
https://doi.org/10.1007/BF03392137
https://doi.org/10.1007/BF03392127
168 
 
 
Catania, A. C. (1973). The concept of the operant in the analysis of behavior. Behaviorism, 
1(2), 103–116. 
Catania, A. C. (1992). Learning (3rd ed.). Prentice Hall. 
Chase, P. N. (2006). Teaching the distinction between positive and negative reinforcement. 
The Behavior Analyst, 29(1), 113-115. https://doi.org/10.1007/BF03392121 
Crowley, T. J. (1972). The reinforcers for drug abuse: Why people take drugs. Comprehensive 
Psychiatry, 13, 51–62. https://doi.org/10.1016/0010-440X(72)90034-X 
De Souza, D. G., De Moraes, A. B. A., & Todorov, J. C. (1984). Shock intensity and signaled 
avoidance responding. Journal of the Experimental Analysis of Behavior, 42(1), 67-
74. https://doi.org/10.1901/jeab.1984.42-67 
Deese, J., & Hulse, S. H. (1975). A psicologia da aprendizagem (D. M. Leite, Tradutor). 
Pioneira. [Obra original publicada em 1967]. 
Dinsmoor, J. A. (1962). Variable-interval escape from stimuli accompanied by shocks. 
Journal of the Experimental Analysis of Behavior, 5(1), 41–47. 
https://doi.org/10.1901/jeab.1962.5-41 
Dinsmoor, J. A. (2001). Stimuli inevitably generated by behavior that avoids electric shock 
are inherently reinforcing. Journal of the Experimental Analysis of Behavior, 75(3), 
311–333. https://doi.org/10.1901/jeab.2001.75-311 
Findley, J. D. (1958). Preference and switching under concurrent scheduling. Journal of the 
Experimental Analysis of Behavior, 1(2), 123–144. 
https://doi.org/10.1901/jeab.1958.1-123 
Fontes, R. M., & Shahan, T. A. (2020). Punishment and its putative fallout: A reappraisal. 
Journal of Experimental Analysis of Behavior, 115(1), 185-203. 
https://doi.org/10.1002/jeab.653 
https://doi.org/10.1007/BF03392121
https://doi.org/10.1016/0010-440X(72)90034-X
https://doi.org/10.1901/jeab.1984.42-67
https://psycnet.apa.org/doi/10.1901/jeab.1962.5-41
https://psycnet.apa.org/doi/10.1901/jeab.2001.75-311
https://doi.org/10.1901/jeab.1958.1-123
https://doi.org/10.1002/jeab.653
169 
 
 
Geller, E. S. (2004). On Making Mountains Out of Molehills: Confessions of a Behavioral 
Scientist with Mentalistic Vulnerability. Journal of Organizational Behavior 
Management, 24(1-2), 175–184. https://doi.org/10.1300/J075v24n01_11 
Harms, J. Y., & Staats, A. W. (1978). Food deprivation and conditioned reinforcing value of 
food words: Interaction of Pavlovian and instrumental conditioning. Bulletin of the 
Psychonomic Society, 12(4), 294–296. https://doi.org/10.3758/BF03329687 
Hearst, E. (1962). Delayed alternation in the pigeon. Journal of the Experimental Analysis of 
Behavior, 5(2), 225–228. https://doi.org/10.1901/jeab.1962.5-225 
Hineline, P. N. (1984). Aversive control: A separate domain? Journal of the Experimental 
Analysis of Behavior, 42(1), 495-509. https://doi.org/10.1901/jeab.1984.42-495 
Holland, J. G., & Skinner, B. F. (1975). A análise do Comportamento (R. Azzi & C. M. Bori, 
Tradutores). Editora Pedagógica e Universitária. [Obra original publicada em 1969]. 
Holland, J. G. (1978). Behaviorism: Part of the problem or part of the solution? Journal of 
Applied Behavior Analysis, 11(1), 163–174. https://doi.org/10.1901/jaba.1978.11-163 
Iwata, B. A. (2006). On the distinction between positive and negative reinforcement. The 
Behavior Analyst, 29(1), 121-123. https://doi.org/10.1007/BF03392123 
Jenkins, H. M., & Harrison, R. H. (1960). Effect of discrimination training on auditory 
generalization. Journal of Experimental Psychology, 59(4), 246–253. 
https://doi.org/10.1037/h0041661 
Jwaideh, A. R., & Mulvaney, D. E. (1976). Punishment of observing by a stimulus associated 
with the lower of the two reinforcement frequencies. Journal of the Experimental 
Analysis of Behavior, 25(1), 37-44. https://doi.org/10.1016/0023-9690(76)90029-1 
Kelleher, R. T. (1958).Fixed-ratio schedules of conditioned reinforcement with chimpanzees. 
Journal of the Experimental Analysis of Behavior, 1(3), 281-289. 
https://doi.org/10.1901/jeab.1958.1-281 
https://psycnet.apa.org/doi/10.1300/J075v24n01_11
https://doi.org/10.3758/BF03329687
https://doi.org/10.1901/jeab.1962.5-225
https://doi.org/10.1901/jeab.1984.42-495
https://doi.org/10.1901/jaba.1978.11-163
https://doi.org/10.1007/BF03392123
https://psycnet.apa.org/doi/10.1037/h0041661
https://doi.org/10.1016/0023-9690(76)90029-1
https://doi.org/10.1901/jeab.1958.1-281
170 
 
 
Keller, F. S., & Schoenfeld, W. N. (1974). Princípios de psicologia (C. M. Bori & R. Azzi, 
Tradutores). Editora Pedagógica e Universitária. [Obra original publicada em 1950]. 
Lattal, K. A., & Lattal, A. D. (2006). And yet…: Further comments on distinguishing positive 
and negative reinforcement. The Behavior Analyst, 29(1), 129-134. 
https://doi.org/10.1007/BF03392125 
Lundin, R. W. (1972). Personalidade: Uma análise do comportamento (R. L. Rodrigues & L. 
O. S. Queiroz, Tradutores). Herder. [Obra original publicada em 1969] 
Magoon, M. A., & Critchfield, T. S. (2008). Concurrent schedules of positive and negative 
reinforcement: Differential-impact and differential-outcomes hypotheses. Journal of 
the Experimental Analysis of Behavior, 90(1), 1-22. 
https://doi.org/10.1901/jeab.2008.90-1 
Magoon, M. A., Critchfield, T. S., Merrill, D., Newland, M. C., & Schneider, W. J. (2017). 
Are positive and negative reinforcement "different"? Insights from a free-operant 
differential outcomes effect. Journal of the experimental analysis of behavior, 107(1), 
39–64. https://doi.org/10.1002/jeab.243 
Marr, M. J. (2006). Through the looking glass: Symmetry in behavioral principles? The 
Behavior Analyst, 29(1), 125-128. https://doi.org/10.1007/BF03392124 
Mayer, P. C. M., & Gongora, M. A. N. (2011). Duas formulações comportamentais de 
punição: Definição, explicação e algumas implicações. Acta Comportamentalia, 19(1), 
47–63. https://www.revistas.unam.mx/index.php/acom/article/view/36938 
Michael, J. (1975). Positive and negative reinforcement: A distinction that is no longer 
necessary; or a better way to talk about bad things. Behaviorism, 3(1), 33-44. 
https://psycnet.apa.org/record/1976-03436-001 
https://doi.org/10.1007/BF03392125
https://psycnet.apa.org/doi/10.1901/jeab.2008.90-1
https://doi.org/10.1002/jeab.243
https://doi.org/10.1007/BF03392124
https://www.revistas.unam.mx/index.php/acom/article/view/36938
https://psycnet.apa.org/record/1976-03436-001
171 
 
 
Michael, J. (1982). Distinguishing between discriminative and motivational functions of 
stimuli. Journal of the Experimental Analysis of Behavior, 37(1), 149-155. 
https://doi.org/10.1901/jeab.1982.37-149 
Michael, J. (2006). Comment on Baron and Galizio (2005). The Behavior Analyst, 29(1), 117-
119. https://doi.org/10.1007/BF03392122 
Millenson, J. R. (1975). Princípios de análise do comportamento (A. A. Rosa & D. Resende, 
Tradutores). Editora de Brasília. [Obra original publicada em 1967]. 
Moore, J. (2000). Words are not things. The Analysis of Verbal Behavior, 17, 143–160. 
https://doi.org/10.1007/BF03392961 
Morse, W. H., & Kelleher, R. T. (1977). Determinants of reinforcement and punishment. In 
W. K. Honig & J. E. R. Staddon (Eds.), Handbook of operant behavior (pp. 174–200). 
Prentice Hall. 
Mowrer, O. H. (1960). Learning theory and behavior. John Wiley & Sons, Inc. 
https://doi.org/10.1037/10802-000 
Nakajima, S. (2006). In response: Speculation and explicit identification as judgmental 
standards for positive or negative reinforcement. The Behavior Analyst, 29(1), 269-
270. https://doi.org/10.1007/BF03392135 
Nevin, J. A., & Mandell, C. (2017). Comparing positive and negative reinforcement: A 
fantasy experiment. Journal of the experimental analysis of behavior, 107(1), 34–38. 
https://doi.org/10.1002/jeab.237 
Pear, J. J. (2001). The science of learning. Psychology Press. 
Perone, M. (2003). Negative effects of positive reinforcement. The Behavior Analyst, 26(1), 
1-14. https://doi.org/10.1007/BF03392064 
Perone, M., & Courtney, K. (1992). Fixed-ratio pausing: Joint effects of past reinforcer 
magnitude and stimuli correlated with upcoming magnitude. Journal of the 
https://doi.org/10.1901/jeab.1982.37-149
https://doi.org/10.1007/BF03392122
https://doi.org/10.1007/BF03392961
https://psycnet.apa.org/doi/10.1037/10802-000
https://doi.org/10.1007/BF03392135
https://doi.org/10.1002/jeab.237
https://doi.org/10.1007/BF03392064
172 
 
 
experimental analysis of behavior, 57(1), 33–46. https://doi.org/10.1901/jeab.1992.57-
33 
Pierce, W. D., & Cheney, C. D. (2004). Behavior analysis and learning (3rd ed.). Erlbaum. 
https://doi.org/10.1007/BF03392126 
Pierce, W. D., & Epling, W. F. (1995). Behavior analysis and learning. Prentice-Hall. 
Lundin, R. W. (1972). Personalidade: Uma análise do comportamento (R. L. Rodrigues & L. 
O. S. Queiroz, Tradutores). Herder. (Trabalho original publicado em 1969) 
Pierce, W. D., & Epling, W. F. (1995). Behavior analysis and learning. Prentice-Hall. 
Possmoser, T. L. (2015). A influência de Michael (1975) na literatura e a discussão da 
distinção entre reforçamento positivo e negativo (Trabalho de Conclusão de Curso). 
Pontifícia Universidade Católica de São Paulo. 
Reese, E. P. (1973). Análise do comportamento humano (G. P. Witter, Tradutor). Livraria 
José Olympio. [Obra original publicada em 1966]. 
Rosenberg, E. L., & Ekman, P. (2000). Emotion: Methods of study. In A. E. Kazdin (Ed.), 
Encyclopedia of Psychology (Vol. 3, pp. 171–175). Oxford University Press. 
Santos, E. L. N., & Leite, F. L. (2013). A distinção entre reforçamentos positivo e negativo 
em livros de ensino de análise do comportamento. Revista Perspectivas, 4(1), 9-18. 
https://doi.org/10.18761/perspectivas.v4i1.101 
Sidman, M. (1989/2009). Coerção e suas implicações (M. A. Andery & T. M. Sério, 
Tradutores). Editora Livro Pleno. 
Sidman, M. (2006). The Distinction Between Positive and Negative Reinforcement: Some 
Additional Considerations. The Behavior Analyst, 29(1), 135–139. 
https://doi.org/10.1007/BF03392126 
https://doi.org/10.1901/jeab.1992.57-33
https://doi.org/10.1901/jeab.1992.57-33
https://doi.org/10.1007/BF03392126
https://doi.org/10.18761/perspectivas.v4i1.101
https://doi.org/10.1007/BF03392126
173 
 
 
Sizemore, O. J., & Maxwell, J. M. (1985). Selective punishment of interresponse times: The 
roles of shock intensity and scheduling. Journal of the Experimental Analysis of 
Behavior, 43(2), 207-216. https://doi.org/10.1901/jeab.1985.44-355 
Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. Appleton-
Century-Crofts. ISBN 978-0874114874 
Skinner, B. F. (1953/2014). Science and human behavior. The B. F. Skinner Foundation. 
https://www.bfskinner.org/product/science-and-human-behavior 
Skinner, B. F. (1973). Beyond freedom and dignity. Penguin Books. (Obra original publicada 
em 1971) 
Staats, A. W., & Hammond, O. R. (1972). Natural words as physiological conditioned stimuli: 
Food-word-elicited salivation and deprivation effects. Journal of Experimental 
Psychology, 96(1), 206–208. https://doi.org/10.1037/h0033508 
Staats, A. W., & Warren, D. R. (1974). Motivation and three-function learning: Food 
deprivation and approach-avoidance to food words. Journal of Experimental 
Psychology, 103(6), 1191–1199. https://doi.org/10.1037/h0037417 
Staats, A. W. (1975). Social behaviorism. Dorsey Press. 
Staats, A. W., & Eifert, G. H. (1990). The paradigmatic behaviorism theory of emotions. 
Clinical Psychology Review, 10(5), 539–566. https://doi.org/10.1016/0272-
7358(90)90096-S 
Staats, A. W. (1996). Behavior and personality: Psychological behaviorism. Springer. 
Staats, A. W. (2006). Positive and negative reinforcers: How about the second and third 
functions? The Behavior Analyst, 29(2), 271–272. 
https://doi.org/10.1007/BF03392136 
Thomas,N. W. (1920). 14. Duodecimal Base of Numeration. Man, 20, 25–29. 
https://doi.org/10.2307/2840300 
https://doi.org/10.1901/jeab.1985.44-355
https://www.bfskinner.org/product/science-and-human-behavior
https://doi.org/10.1037/h0033508
https://doi.org/10.1037/h0037417
https://psycnet.apa.org/doi/10.1016/0272-7358(90)90096-S
https://psycnet.apa.org/doi/10.1016/0272-7358(90)90096-S
https://doi.org/10.1007/BF03392136
https://doi.org/10.2307/2840300
174 
 
 
Weiss, B., & Laties, V. G. (1961). Behavioral thermoregulation. Science (New York, N.Y.), 
133(3461), 1338–1344. https://doi.org/10.1126/science.133.3461.1338 
Whaley, D. L., & Malott, R. W. (1980). Princípios elementares do comportamento (M. A. 
Matos, M. L. D. Ferrara, & C. F. Santoro, Tradutores; Vol. 1, 6ª ed.). E.P.U. - Editora 
Pedagógica e Universitária Ltda. 
Whelan, R., & Barnes-Holmes, D. (2010). Consequence valuing as operation and process: A 
parsimonious analysis of motivation. The Psychological Record, 60(2), 337–354. 
https://doi.org/10.1007/BF03395711 
Wiegand, D. M., & Geller, E. S. (2005). Connecting positive psychology and organizational 
behavior management. Journal of Organizational Behavior Management, 24(1–2), 3–
25. https://doi.org/10.1300/j075v24n01_02 
Xu, S., Sun, Y., Huang, M., Huang, Y., Han, J., Tang, X., & Ren, W. (2021). Emotional state 
and feedback-related negativity induced by positive, negative, and combined 
reinforcement. Frontiers in Psychology, 12, Article 647263. 
https://doi.org/10.3389/fpsyg.2021.647263 
 
https://doi.org/10.1126/science.133.3461.1338
https://doi.org/10.1007/BF03395711
https://doi.org/10.1300/j075v24n01_02
https://doi.org/10.3389/fpsyg.2021.647263
175 
 
 
Apêndice 
Recorte Ilustrativo da Planilha do Excel Usada como Fase Intermediária para a Construção do Texto a Partir das Falas Apresentadas. 
Os números indicados nas colunas “Resposta a” e “Respondido por” correspondem ao número da linha onde estava inserido o argumento respondido 
ou que o respondeu (na planilha original). 
Identificação Análise das falas 
Texto Localização Fala Dado Tipo de fala Ponto central Ponto específico Resposta a 
Respondido 
por 
Baron e 
Galizio 
(2005) 
p. 87 
A função reforçadora de um 
evento advém da mudança de 
uma condição de estímulo para 
outra. Qualquer afirmação de 
que uma mudança reforçadora é 
somente positiva ou negativa 
pode ser contra-argumentada 
com sua forma contrária. 
Weiss e Laties (1961): 
ratos em uma caixa 
gelada pressionavam 
uma alavanca e 
produziam calor ao 
mesmo tempo que 
eliminavam o frio 
Problema da 
Manutenção 
A distinção é 
ambígua 
— — 
Baron e 
Galizio 49 
Baron e 
Galizio 50 
Chase 59 
Chase 66 
Iwata 83 
Iwata 88 
Iwata 90 
Marr 102 
Marr 103 
Sidman 141 
Sidman 144 
Sidman 145 
Sidman 148 
Sidman 150 
Sidman 156 
Nakajima 209 
Entrega de dinheiro tem 
a consequência de 
terminar um período de 
falta de dinheiro 
176 
 
 
Identificação Análise das falas 
Texto Localização Fala Dado Tipo de fala Ponto central Ponto específico Resposta a 
Respondido 
por 
Fuga de um estímulo 
aversivo condicionado 
produz uma situação na 
qual um estímulo está 
ausente 
Nakajima 210 
Nakajima 211 
Nakajima 216 
Staats 221 
Staats 222 
Chase 
(2006) 
p. 115 
A distinção pode ter sido 
mantida porque talvez uma 
direção da mudança (positiva 
ou negativa) seja mais saliente 
ou discriminável que outra 
— 
Explicação para 
Manutenção 
Diferem quanto a 
outro aspecto 
Saliência ou 
discriminabilidade 
— 
Baron e 
Galizio 181 
Sidman 
(2006) 
p. 136 
Apesar de contestarem a noção 
de que o reforçamento envolve 
mudanças em estados 
fisiológicos ou emocionais, ele 
ainda apela a esses estados em 
seu principal argumento 
A apresentação de 
comida também é dita 
como envolvendo a 
redução de um estado de 
privação (Baron & 
Galizio, 2005, p. 87) 
Contra-argumento — — 
Baron e 
Galizio 4 
Baron e 
Galizio 194 
Após algumas pesquisas 
sobre o assunto não se 
mostrarem convincentes, 
a teoria de que o 
reforçamento deve 
envolver redução de 
impulso não está mais 
em vigor (e.g., Miller & 
Kessen, 1952; Miller, 
Sampliner & Woodrow, 
1957) 
177 
 
 
Identificação Análise das falas 
Texto Localização Fala Dado Tipo de fala Ponto central Ponto específico Resposta a 
Respondido 
por 
“É melhor falar da 
consequência como 
aumento de atenção ou 
como alívio da solidão?” 
(Baron & Galizio, 2005, 
p. 91)a punição descrevem especificamente mudanças no 
que ele chama de “condições de estímulo” (i.e., stimulus condition). 
Ainda sobre o tópico de “mudanças de estímulo”, Michael (1975, p. 38) acrescenta 
que além do destaque para o fato de que há sempre uma mudança e que ela é a responsável 
pelas alterações no comportamento, dever-se-ia, para fins de maior precisão, fazer tanto 
22 
 
 
menções específicas para a condição de estímulo presente antes da alteração quanto para a 
velocidade na qual se deu essa mudança. Afinal, “uma mudança consiste em nada além do 
fato de que uma condição pré-mudança é substituída por uma condição pós-mudança, em uma 
certa forma temporal e com certas condições intermediárias” (Michael, 1975, p. 38). 
Outro fato que teria gerado confusão foi que uma grande parcela dos alunos de análise 
do comportamento usava as definições de Keller e Schoenfeld (1950) de reforçamento 
enquanto outra grande parcela usava as definições de Skinner (1953/2014). A principal 
diferença é que a primeira focava no reforçador como um evento estático, enquanto a 
segunda, segundo Michael (1975) avançou em tratar a mudança de estímulo como o evento 
reforçador. A publicação de Holland e Skinner (1961) favoreceu ainda mais o uso dessa 
segunda definição, o que acabou por resolver a confusão. 
A partir disso, Michael (1975) apresenta como um dos pontos centrais de seu texto que 
o ensino correto da distinção entre reforçamento positivo e reforçamento negativo – em 
especial evitando que o termo “reforçamento negativo” seja interpretado por novos alunos 
como o que chamamos hoje de punição – gera um trabalho considerável para aqueles que 
ensinam análise do comportamento. O autor sugere que o uso anterior do termo 
“reforçamento negativo” parece ser muito mais compatível com outras práticas verbais, como 
a já estabelecida distinção entre “recompensa” e “punição” do senso comum. 
Ainda assim, Michael (1975) não sugere que o significado do termo seja simplesmente 
revertido, já que não se sabe quanta confusão seria gerada para um grupo de pessoas que 
entenderia reforçamento negativo da forma que é falada hoje em dia, como outra forma de 
processo estabelecedor de comportamento, tal como o reforçamento positivo. 
Esclarecer a diferença entre reforçamento e reforçador também é complicado já que, 
segundo Michael (1975), no caso do reforçamento positivo, ambos (apresentação e evento 
apresentado) carregam o mesmo sentido de serem coisas “boas”, enquanto no outro caso um 
23 
 
 
reforçador negativo é considerado “ruim”, mas dada a sua presença, o reforçamento negativo 
(sua remoção) é considerada “desejável”. Por conta dessa sutileza, é provável que o aluno 
entenda que reforçamento positivo e reforçadores positivos são coisas desejáveis, e 
reforçamento negativo e reforçador negativo são coisas indesejáveis – favorecendo a confusão 
entre os conceitos de “reforçamento negativo” e “punição”. A relevância técnica dessas 
afirmações é questionável, mas é exclusivamente ao aspecto didático que Michael está se 
referindo. 
Michael tampouco defende que se passe a usar o termo “estímulo aversivo” no lugar 
de “reforçador negativo” já que além de ser necessário o mesmo tipo de esforço para delimitar 
o seu uso, de maneira geral, o uso de sinônimos dentro de uma linguagem técnica pode gerar 
desvios e distinções desnecessárias (Michael, 1975). Além disso, tal como evitou-se usar o 
termo “recompensa” em favor do termo “reforçamento” em nome de se estabelecer um novo 
conjunto de termos desassociado de outros conceitos (Skinner, 1938/1991), o uso dos termos 
“apresentação” e “remoção” também pode gerar problemas por terem seus significados 
atrelados a outros usos do senso comum. Em especial, tais termos parecem dizer respeito 
principalmente ao comportamento de quem executa a alteração ambiental e não à alteração 
ambiental em si (Michael, 1975). Nesse sentido, Michael sugere que as descrições deveriam 
ser feitas “em termos de relações entre mudanças comportamentais e mudanças ambientais”, 
sem menção às ações de um mediador real ou imaginário. 
Geralmente, usa-se o termo “apresentar” referindo-se a situações nas quais a condição 
pós-mudança parece a mais relevante para a mudança do comportamento e a condição pré-
mudança estaria implícita (i.e., se houve apresentação de um estímulo, ficaria implícita sua 
ausência anterior). Ao contrário, a palavra “remover” é usada quando a condição pré-mudança 
parece a mais relevante e a pós-mudança estaria implícita (i.e., se houve remoção de um 
estímulo, ficaria implícita sua ausência posterior). 
24 
 
 
Para Michael (1975), entretanto, essa forma de descrição abreviada serve apenas para 
descrever alguns casos de mudanças ambientais no âmbito dos estímulos incondicionados e, 
mesmo nesses casos, uma inferência sempre precisaria ser feita. Adaptando um exemplo do 
próprio autor, a descrição “remoção de um choque de 50 volts” só poderá ser entendida como 
reforçadora se for assumido que o choque de 50 volts foi seguido da uma ausência de choque. 
Se, na verdade, o organismo se encontrasse numa situação em que só pode variar entre um 
choque de 50 volts e um de 100 volts, a remoção da condição de 50 volts seria, 
provavelmente, punitiva. 
Outro problema apontado por Michael, diz respeito à relevância e à clareza de se fazer 
a distinção entre os reforçamentos positivo e negativo, especialmente no que diz respeito a 
comportamentos humanos complexos. Há casos em que a distinção entre “apresentação” e 
“remoção” fica cada vez mais difícil e casos em que ambas as mudanças estão envolvidas. 
Uma possível saída seria apenas chamar essas mudanças de “reforçamento”. 
A partir disso, o autor questiona se sequer há motivo para a distinção positivo/negativo 
mesmo nas situações em que ela seria claramente possível e sugere algumas possibilidades de 
explicação para a distinção estar sendo mantida. A primeira é que poderia haver outras 
propriedades distinguíveis ligadas aos dois tipos de reforçamento às quais estamos 
indiretamente nos referindo – diferenças temporais, maior discriminabilidade etc. Michael 
(1975) reconhece que essas minúcias particulares que podem acompanhar o reforçamento são 
bastante relevantes, mas afirma que essas diferenças existem mesmo entre dois ou mais 
reforçadores positivos e entre dois ou mais reforçadores negativos. Esses dados adicionais 
deveriam ser descritos em todos os casos e não deveriam se limitar à simples separação entre 
dois grandes grupos. Segundo ele, dizer apenas que uma situação específica consistiu em 
“reforçamento negativo” não acrescenta muito. 
25 
 
 
A segunda explicação apresentada para a continuidade do uso da distinção entre os 
reforçamentos positivo e negativo diz respeito à possibilidade de que processos fisiológicos 
distintos estejam envolvidos em cada um deles. Michael (1975), no entanto, afirma que a 
distinção gera trabalho demais para compensar uma possível interrelação que, além de ter se 
mostrado infrutífera no passado, pode estar muito distante de ser possível. 
A terceira e última possibilidade levantada pelo autor diz respeito à distinção 
positivo/negativo representar uma forma de separação das práticas desejáveis e indesejáveis 
na área. Sobre esses casos, Michael (1975) afirma que, partindo de uma distinção que, 
especialmente em casos humanos, é pouco clara, qualquer direcionamento no sentido de 
aderir ou evitar certo tipo de prática será pouco efetivo. De toda forma, Michael desencoraja 
que alterações em conceitos básicos de uma área sejam feitos com base em “possíveis 
implicações sociais”. 
Para o autor, nenhuma das explicações apresentadas é suficiente para manter uma 
distinção que gera tanta confusão. Se for importante a distinção entre coisas “boas” e “ruins”, 
enquanto condições estáticas, podemos pensar em reforçadores positivos e negativos. Para 
mudanças “boas” ou “ruins”, oautor defende não a distinção entre positivo e negativo, mas 
entre “reforçamento” e “punição”. Estas corresponderiam às mudanças que “gostamos” e 
“buscamos” e “desgostamos” e “evitamos”. Vale retomar que o autor defende o reforçamento 
negativo como algo “bom” no sentido de que mesmo que a apresentação de um reforçador 
negativo seja punitiva, o reforçamento negativo é desejável. 
Michael (1975), em seguida, adentra a discussão a respeito das visões assimétrica e 
simétrica de punição, que não será aprofundada no presente momento. De forma resumida, ele 
afirma que nenhuma refutação contundente foi feita a Azrin e Holz (1966) até a data de seu 
texto e que a posição simétrica parece mais “atrativa” e por isso a adota na formulação da 
solução para evitar os problemas da distinção positivo/negativo. A fim de evitar esses 
26 
 
 
problemas, Michael (1975) sugere abandoná-la por completo e passar a nomear o que é bom 
como “reforçadores” e “reforçamento” e o que é ruim de “punidores” e “punição”. Ele afirma 
que mesmo abandonando a distinção positivo/negativo, ainda é perfeitamente possível manter 
a noção de que alterações ambientais com um determinado efeito (e.g., reforçador) terão o 
efeito oposto quando invertidas (e.g., punidor). O termo “estímulo aversivo” também pode ser 
descartado em favor de “punidor”. 
Ao final de seu artigo, Michael (1975) traz um relato sobre a sua própria experiência 
adotando as sugestões anteriores. Afirma, assim, que nos seis anos que precederam o artigo 
não se deparou com os problemas gerados pelos usos anteriores e tampouco encontrou novos 
problemas gerados pelo abandono dos termos “positivo” e “negativo”. 
O Impacto de Michael (1975) 
Embora a crítica de Michael (1975) à distinção entre reforçamentos positivo e 
negativo tenha sido originalmente apresentada no plano conceitual, seu impacto não se 
restringiu a discussões teóricas. Parte da produção experimental nas décadas subsequentes à 
publicação do artigo refletiu, direta ou indiretamente, limites e ambiguidades da distinção. A 
seguir, serão apresentados alguns desses estudos orientados por dados experimentais que 
tensionam a distinção tradicionalmente feita. 
Perone (2003) critica a alta adesão da literatura analítico-comportamental na defesa do 
reforçamento positivo como uma forma de controle livre de problemas. Afirma, por exemplo, 
que o endosso de autores como Sidman (1989/2009) ao reforçamento positivo é “abrangente 
demais” e retoma Michael (1975) para afirmar que a distinção entre reforçamento positivo e 
negativo sequer é clara. Ainda em Perone (2003), destaca-se o estudo de Jwaideh e Mulvaney 
(1976), como exemplo de que efeitos colaterais comumente atribuídos ao controle aversivo 
também podem surgir em esquemas de reforçamento positivo. No experimento, dois 
estímulos (luz verde e luz vermelha) adquiriram função discriminativa para dois esquemas de 
27 
 
 
reforçamento distintos (VI 30s e VI 120s) para produção de alimento a partir de bicadas em 
um disco (esquema múltiplo). Na segunda fase, em esquema misto, os pombos poderiam bicar 
em qualquer uma de duas novas chaves introduzidas para produzir a luz correspondente ao 
esquema em vigor naquele momento, sem com isso alterar o esquema (respostas de 
observação) - nessa fase a luz produzida independia de qual das chaves foi bicada, apenas do 
esquema em vigor e de uma bicada a alguma das chaves. Em seguida, uma das novas chaves 
parou de produzir a luz vermelha quando o esquema de VI 120s estava em vigor (a luz ficava 
apagada), mas seguia produzindo a luz verde quando no esquema de VI 30s (a outra chave se 
continuou mostrando tanto a luz vermelha quanto a verde). Os resultados foram que os 
pombos responderam igualmente nas duas novas chaves quando ambas produziam ambas as 
luzes, mas passavam a responder preferencialmente na chave que só era capaz de produzir a 
luz verde (independentemente da posição). Vale notar, que a duração e frequência dos 
esquemas em si não muda, apenas se o pombo verá ou não verá o que seria o estímulo delta 
(vermelho). 
Para Perone (2003), esse é um exemplo de que um estímulo aversivo (luz vermelha) 
pode ser condicionado mesmo numa condição em que apenas reforçamento positivo estaria 
em vigor. Perone afirma que esses dados só seriam estranhos se considerados por teorias que 
entendem reforçamento positivo como “bom” e reforçamento negativo como “ruim” 
desconsiderando um contexto ambiental mais amplo. 
Perone & Galizio (1987), por sua vez, conduziram um experimento com o objetivo de 
investigar o reforçamento negativo em um delineamento semelhante ao empregado em 
pesquisas sobre reforçamento positivo. No estudo, os sujeitos experimentais foram treinados a 
responder em esquemas concorrentes nos quais a pressão em uma das barras adiaria um 
choque e a pressão na outra barra poderia ocasionalmente produzir um timeout (suspensão de 
dois minutos do esquema de adiamento do choque e dos estímulos relacionados). O 
28 
 
 
experimento foi conduzido em fases nas quais o tempo de atraso do choque variava, 
permitindo avaliar como as respostas eram distribuídas nas duas barras. Foi observado que as 
preferências eram sensíveis a essas alterações – os sujeitos passaram a responder mais na 
barra que adiava o choque por mais tempo conforme esses aumentavam em intensidade. 
Segundo os autores, esse padrão de responder era similar ao frequentemente observado em 
esquema de reforçamento positivo, como a distribuição de respostas proporcional à taxa de 
reforçamento produzida. Os autores concluem que o reforçamento negativo pode ser 
investigado em condições metodologicamente comparáveis às utilizadas para o reforçamento 
positivo, enfraquecendo a necessidade de uma distinção rígida entre os dois processos. 
Alinhando-se a Michael (1975), Hineline (1984) questiona a utilidade de se tratar o 
reforçamento negativo como um “domínio separado dentro da teoria comportamental” (p. 
495). O autor aponta que descrições sobre o que é reforçamento positivo e o que é 
reforçamento negativo baseadas na adição e subtração de estímulos são arbitrárias e não 
suficientemente informativas. Sugere, em vez disso, uma abordagem funcionalmente molar, 
considerando a taxa de ocorrência de eventos ao longo do tempo e a estrutura relacional das 
contingências. Assim, processos normalmente atribuídos ao reforçamento negativo poderiam 
ser compreendidos dentro de princípios mais amplos do controle operante. 
Magoon & Critchfield (2008) exploraram o possível efeito diferencial que o 
reforçamento positivo e o negativo poderiam ter sobre o repertório do indivíduo, partindo do 
pressuposto de que na literatura analítico-comportamental impactos e efeitos diferentes 
costumam ser descritos de acordo com cada um deles. Os autores, então, investigaram se 
reforçadores positivos e negativos de valor monetário equivalente exerceriam diferentes 
controles sobre o comportamento humano quando apresentados em esquemas concorrentes. O 
delineamento consistia em um jogo de computador, no qual os participantes podiam clicar em 
alvos para ganhar dinheiro (reforçamento positivo) ou evitar perdas monetárias (reforçamento 
29 
 
 
negativo), ambos em ciclo variável (VC). O delineamento incluiu comparações entre 
condições homogêneas (dois esquemas de reforçamento positivo com diferentes razões de 
ganho de pontos) e heterogêneas (uma opção com reforçamento positivo e outra com 
reforçamento negativo, ambos com magnitudes de 1,50 ¢). 
Para a interpretação dos dados, Magoon e Critchfield (2008) analisaram o desempenho 
dos participantes com base na Lei da Igualação Generalizada, com especial atenção ao log b 
(indicador de viés) e ao parâmetro a (indicador de sensibilidade do comportamento a taxas 
relativas de reforçamento). Os resultados mostraram ausência de viés sistemático entre os 
tipos de reforçamento (log b próximo a 0), sugerindo que nenhumdos tipos de reforçamento 
exerceu um controle predominante do comportamento. No entanto, encontraram dados 
indicando que os valores do parâmetro a foram maiores nas condições heterogêneas do que 
nas homogêneas de reforçamento. Isso apontaria para o fato de que, em um procedimento de 
operante livre, a heterogeneidade das contingências poderia levar a uma maior 
discriminabilidade das próprias, levando a uma performance diferencial. Esse resultado foi 
considerado como evidência de um possível efeito de consequências diferenciais (Different 
Outcomes Effect, ou DOE) – no qual a diferença na consequência produzida é o elemento-
chave para a discriminação da contingência. Seria possível interpretar esses dados na direção 
de evidenciar o controle diferencial do reforçamento positivo em relação ao reforçamento 
negativo, embora os autores sugiram que mais investigações devessem ser conduzidas. 
Em um artigo posterior, Magoon et al. (2017) retomam Michael (1975) e Baron e 
Galizio (2005) para discutir a ambiguidade da atribuição dos reforçamentos positivos e 
negativos como processos distintos, apontando para a falta de estudos empíricos que 
sustentem fortemente essa diferença. Os autores apontam que mesmo dentro da longa 
produção experimental da análise do comportamento, os reforçamentos positivo e negativos 
foram estudados majoritariamente de forma separada, de forma que o controle diferencial que 
30 
 
 
pode ter sido demonstrado até o momento poderia ser, na verdade, decorrente de 
procedimentos diferentes. Com o objetivo de refinar os dados produzidos por Magoon e 
Critchfield (2008) referentes ao DOE, os autores realizaram uma replicação e extensão do 
estudo anterior, com objetivo de examinar se os efeitos observados poderiam ser atribuídos à 
natureza dos reforçadores ou a diferenças procedimentais. Nesse experimento, além da 
manutenção de magnitudes monetárias idênticas, foram incluídas análises de sensibilidade e 
persistência do comportamento. Os resultados reiteraram as evidências do DOE, mostrando 
que o tipo de consequência (ganho de pontos ou esquiva da perda deles) influencia o 
desempenho, mesmo quando outros fatores são mantidos constantes. Magoon et al. (2017) 
concluíram que, apesar dos reforçamentos positivo e negativo exercerem controle similar em 
certos contextos, pode haver efeitos diferenciais que não deveriam ser ignorados. Assim, mais 
do que sustentar uma distinção conceitual entre os dois tipos de reforçamento, os autores 
apontam para a importância de analisar a função dos estímulos em cada arranjo experimental. 
Por fim, Nevin e Mandell (2017) propõem um experimento quantitativo hipotético 
para questionar se os reforçamentos positivo e negativo são de fato funcionalmente diferentes. 
O experimento imaginado envolveria esquemas encadeados concorrentes nos quais um rato 
poderia escolher entre um terminal com reforçamento positivo (alimento) e outro com 
reforçamento negativo (período sinalizado sem choque), ambos sob controle de estímulos 
distintos. A partir dessa escolha, seria possível medir tanto a preferência por um tipo de 
consequência quanto a resistência à mudança da resposta em cada condição. O delineamento, 
embora nunca realizado devido a questões éticas e práticas, foi construído com base em 
procedimentos já validados experimentalmente, como os de Perone e Galizio (1987). Ao final, 
Nevin e Mandell sustentam que, se a resistência à mudança e a preferência se correlacionarem 
positivamente entre os dois tipos de reforço, isso forneceria evidência de que ambos operam 
segundo princípios funcionais comuns. Essa proposta, inspirada diretamente nas incertezas 
31 
 
 
levantadas por Baron e Galizio (2005), sintetiza o eixo condutor deste segmento: as 
dificuldades em manter a distinção entre reforçamentos positivo e negativo tornam-se mais 
evidentes justamente quando se tenta operacionalizá-la em arranjos experimentais rigorosos. 
A partir das contribuições descritas da literatura, observa-se que as dificuldades em 
manter a distinção entre reforçamentos positivo e negativo não se limitam à esfera conceitual, 
mas também se evidenciam no estudo empírico do comportamento. 
No campo conceitual, pelo menos dois estudos brasileiros se propuseram a investigar a 
influência de Michael (1975) em publicações subsequentes dentro da análise do 
comportamento. Um deles é o artigo de Santos e Leite (2013), sobre a influência do texto de 
Michael nas definições de reforçamento em livros didáticos. Outro é o trabalho de Possmoser 
(2015) que investigou a influência de Michael (1975) em artigos da análise do 
comportamento, a partir do qual será delimitado o presente problema de pesquisa. 
Santos e Leite (2013) buscaram as definições de reforçamento positivo e negativo em 
13 livros de ensino de análise do comportamento e dividiram os livros em três grupos: 1. 
Publicações Antes de Michael (1975) – que não criticaram a distinção tradicional (i.e., Keller 
e Schoenfeld, 1950/1974; Skinner, 1953/2014; Reese, 1966/1973; Deese e Hulse, 1967/1975; 
Millenson, 1967/1975; Lundin, 1969/1972; Holland & Skinner, 1969/1975), 2. Publicações 
Depois de Michael (1975) que não abordaram sua crítica (i.e., Baum 1999; Sidman, 
1989/2009; Whaley & Malott, 1981) e 3. Publicações Posteriores a Michael (1975) que 
abordaram sua crítica (i.e., Pierce & Epling, 1995; Catania, 1992 e Cameschi & Abreu-
Rodrigues, 2005). 
Sobre esta última categoria, os autores destacam que Catania (1992) reconhece as 
falhas na distinção entre adição e remoção apontadas por Michael (1975) e que Cameschi & 
Abreu-Rodrigues (2005) chegam a retomar o apontamento de Michael feito sobre Skinner 
32 
 
 
(1938) de que o conceito de reforçamento negativo correspondia, originalmente, ao conceito 
atual de punição. 
Pierce e Epling (1995) também salientam as críticas de Michael (1975) e resgatam 
uma citação de Hineline (1984) em que o autor afirmou que há uma assimetria fundamental 
entre os reforçamentos positivo e negativo já que, quando a resposta ocorre, no primeiro o 
estímulo está ausente, enquanto, no segundo, o estímulo a ser removido estava presente. Isso 
de nenhuma forma desafia a argumentação de Michael (1975) já que o autor tanto reconheceu 
como se aprofundou na discussão sobre condições pré e pós-mudança. A partir das próprias 
considerações de Michael (1975), seria possível questionar essa suposta “assimetria 
fundamental” argumentando que a diferença está na ênfase dada ao que está sendo adicionado 
ou removido e que, de qualquer forma, isso pouco acrescentaria numa análise comportamental 
sem que outros detalhes mais relevantes fossem explicitados. 
A partir da análise dos resultados encontrados, Santos e Leite (2013) concluíram que 
mesmo os autores que chegaram a comentar sobre a existência de uma ambiguidade na 
distinção (terceiro grupo) ainda se utilizaram dos termos “positivo” e “negativo” para referir-
se a “apresentação” e “remoção” de um estímulo respectivamente. Esses resultados indicaram 
tanto que os argumentos de Michael (1975) foram pouco considerados em livros didáticos 
quanto que, mesmo quando considerados, nenhum dos autores se comprometeu com uma 
definição que divergisse significativamente das anteriores quanto à dicotomia 
positivo/negativo. 
Além de levar à constatação de que as críticas de Michael (1975) foram 
insuficientemente consideradas na literatura comportamental, as definições de reforçamento 
positivo e negativo analisadas por Santos e Leite (2013) também permitem ao leitor um 
panorama sobre como esses termos têm sido definidos, diferenças entre as definições 
33 
 
 
disponíveis, bem como alguns de seus problemas correntes. Esses elementos são apresentados 
nos parágrafos a seguir. 
Santos e Leite (2013) identificaram que, nas definições das obras analisadas, a 
diferença fundamental entre reforçador positivo e reforçador negativo é que o primeiroaumenta a frequência (fortalece) classes de resposta que o adicionarem ao ambiente, enquanto 
o segundo aumenta a frequência de respostas que o subtraírem do ambiente. 
Apesar dessa diferença comum a todas as definições analisadas, algumas definições 
apresentaram outras diferenças sutis entre suas definições de reforçadores positivos e 
reforçadores negativos, ainda que os trechos analisados pelos autores não possam ser tratados 
como definições completas de cada um desses dois conceitos, mas sim excertos que 
sintetizam as definições dos autores dos livros didáticos em questão. Todas as definições aqui 
mencionadas estão incluídas no Apêndice do próprio artigo de Santos e Leite (2013). 
Um fator relevante ao se comparar os dois conceitos é o paralelismo entre ambos. Isso 
porque frases com maior paralelismo diminuem as chances de interpretações errôneas das 
definições apresentadas. Quanto mais paralelas forem as definições, mais fácil será identificar 
(e menos será necessário inferir) quando uma diferença entre elas representa uma diferença no 
processo em si ou quando se trata apenas uma diferença na redação da frase (esse conflito 
deverá ficar mais evidente quando apresentados exemplos específicos). 
Em Keller e Schoenfeld (1950/1974), os autores definem reforçadores positivos 
recorrendo a um efeito: “aqueles estímulos que intensificam as respostas quando presentes”, 
mas definem reforçadores negativos recorrendo a dois efeitos: “aqueles que intensificam [as 
respostas] quando removidos” e pelo “enfraquecimento que tem quando apresentados”. Para 
os autores, aparentemente, a função punitiva da apresentação de um reforçador negativo após 
uma resposta (punição positiva) seria parte definidora de reforçador negativo, enquanto a 
função punidora da remoção de um reforçador positivo não seria parte definidora de um 
34 
 
 
reforçador positivo. Essa definição pode ser problemática por permitir a interpretação de que, 
para que as respostas aumentem de frequência, basta a mera presença do reforçador e não 
apresentações subsequentes e contíguas à resposta. 
Skinner (1953/2014), no trecho selecionado por Santos e Leite (2013), apresentou 
definições bastante paralelas, utilizando os termos “acréscimo” (“presenting”) e “remoção” 
(“removing”) para se referir ao reforçamento positivo e negativo, respectivamente. Essa foi a 
definição apontada por Santos e Leite (p. 11) como a “tradicional” e que foi apresentada no 
subtítulo “Reforçamento Positivo e Negativo” do presente trabalho. 
Deese e Hulse (1967/1975) definem um reforçador positivo como “um prêmio - que 
damos ao organismo depois de ter feito alguma coisa que desejamos que aprenda a fazer” e 
reforçadores negativos como “os estímulos que fortalecem uma resposta quando são afastados 
se a resposta ocorrer”. Essa definição de reforçador positivo apresentada pode parecer 
pressupor a dependência dos supostos desejos e intenções de quem o media, o que, 
diferentemente das outras definições já expostas, dispensaria qualquer efeito no 
comportamento do organismo como critério definidor e excluiria a possibilidade do 
reforçamento positivo intrínseco. Essa forma de falar sobre reforçamento pode se justificar 
por se tratar de um livro escrito para leitores leigos interessados em aplicação e não em um 
aprofundamento teórico propriamente dito. A definição de reforçador negativo não apresenta 
os mesmos problemas, mas ainda assim poderia não ficar claro para um aplicador (pelo menos 
no trecho citado) o que os autores quiseram dizer com “são afastados”. Seria um afastamento 
espacial, temporal ou ambos? Atenuações do estímulo estariam inclusas como alterações 
ambientais? 
No trecho de Millenson (1967/1975) fica claro que a distinção principal entre 
reforçadores positivos e negativos diz respeito à operação (apresentação e remoção) envolvida 
na relação estabelecida entre resposta e estímulo reforçador: 
35 
 
 
Como a operação que define esses eventos como reforçadores (sua remoção) é oposta, 
em caráter, àquela dos reforçadores positivos (definidos por sua apresentação), eles 
são conhecidos como reforçadores negativos. Em geral, reforçadores negativos 
constituem-se daqueles eventos cujo término (ou redução na intensidade) fortalecerá e 
manterá operantes (Millenson, 1967/1975, p. 383). 
A diferença mais notável entre as duas definições está no trecho “ou redução na 
intensidade”. O destaque feito por Millenson, exclusivamente sobre o reforçamento negativo, 
poderia levar o leitor a pensar que, no caso do reforçamento positivo, um aumento em sua 
intensidade não fortaleceria/manteria uma resposta. 
A citação trazida por Santos e Leite (2013) retirada do livro de Holland e Skinner 
(1969/1975) apresenta dois problemas. O primeiro problema é que este é um livro de 
completar lacunas, e a citação trazida por Santos e Leite (2013) foi trazida com as lacunas 
preenchidas inversamente (positivo no lugar de negativo e vice-versa). Um outro problema é 
que o trecho escolhido se refere a um exemplo, e não uma definição. Há dois trechos que 
melhor representariam as definições de reforçamento positivo e negativo de Holland e 
Skinner (1969/1975): “Os reforços que consistem em apresentar estímulos (por ex.: comida) 
são chamados reforços positivos. De outro lado, os reforços que consistem na supressão ou 
eliminação de estímulos (p. ex.: um estímulo doloroso) são chamados reforços negativos” e “a 
frequência de um operante pode ser aumentada pela apresentação de (1) reforçador positivo 
ou pela supressão de (2) reforçador negativo” (p. 56). 
Considerando esses trechos, as definições de reforçadores positivo e negativo de 
Holland e Skinner (1968/1975) são bastante paralelas entre si, com duas exceções muito sutis: 
a definição de reforçamento positivo usa uma palavra em forma verbal para falar do tipo de 
alteração ambiental produzida (i.e., “apresentar”) e a definição de reforçamento negativo usa 
duas palavras em forma substantiva (“supressão” e “eliminação”). 
36 
 
 
Entender a função do uso de duas palavras é relevante porque alguns autores utilizam 
duas palavras como sinônimos intercambiáveis (e.g., Sidman, 1989/2009, que usa os termos 
“subtrai”, “elimina” e “remove” ao falar de reforçamento negativo), enquanto outros 
apresentam duas palavras para representar procedimentos realmente distintos (e.g., Catania, 
1992, que usa os termos “termina” ou “evita” ao falar duas formas de reforçamento negativo). 
Pelo fato de uma delas estar em itálico e pelo uso apenas do termo “supressão” em outros 
trechos do texto, como “a frequência de um operante pode ser aumentada pela apresentação 
de (1) reforçador positivo ou pela supressão de (2) reforçador negativo” (p. 56); as palavras 
“supressão” e “eliminação” parecem ter sido usadas como sinônimos. Além disso, todos os 
usos da palavra “supressão” nesta seção do livro poderiam, em tese, ser trocados pela palavra 
“eliminação” sem alteração no sentido das frases – algo que não aconteceria com uma palavra 
como “atenuação”, por exemplo. Adicionalmente, todos os exemplos de reforçamento 
negativo apresentados, implicavam a presença de um estímulo reforçador negativo antes da 
resposta e a sua ausência depois dela. 
A segunda diferença identificada foi no uso de um verbo para falar de reforçamento 
positivo e substantivos para falar de reforçamento negativo. Novamente, o trecho “os reforços 
que consistem em apresentar estímulos” poderia, de forma similar à definição apresentada por 
Deese e Hulse (1967/1975), dar a entender que é necessário que um agente apresente esses 
estímulos. Isso é evitado em: “os reforços que consistem na supressão ou eliminação de um 
estímulo”. 
Com bons olhos, entender-se-ia que quem apresentaria esses estímulos seria o 
“ambiente” e não um agente específico – um uso comum, mas questionável. O ambiente é, 
justamente, o conjunto de estímulos que afetam o organismo e, assim sendo,não poderia ser o 
agente de sua própria apresentação. Esse parece um dos casos em que as definições teriam se 
beneficiado de um maior paralelismo entre si. 
37 
 
 
Santos e Leite (2013) afirmam que Lundin (1969/1972) distingue os dois processos 
pela “apresentação” e “remoção” de um estímulo. Isso não está evidente pelo trecho 
selecionado por Santos e Leite (2013) que não traz uma definição clara de reforçador 
negativo. Entretanto, encontra-se o seguinte trecho no mesmo capítulo citado pelos autores: 
“reforçadores negativos são aqueles estímulos ‘que fortalecem o comportamento quando 
removidos’. Neste caso, a resposta é fortalecida pela remoção de algum estímulo aversivo, 
como uma luz brilhante ou um choque elétrico” (Lundin, 1969/1972, p. 77). Talvez um trecho 
ainda melhor para identificarmos as diferenças entre as duas definições seja: “no reforço 
negativo, alguma coisa é retirada, um estímulo é removido e, por sua remoção, a resposta é 
fortalecida. Ao contrário, no reforço positivo alguma coisa é acrescentada e, por sua adição, a 
resposta é também fortalecida” (p. 77). A partir desses trechos, pode-se entender que a 
diferença entre reforçadores positivos e negativos, para Lundin se resume, de fato, à oposição 
acréscimo/remoção. 
O trecho de Whaley e Malott (1971/1981) trazido por Santos e Leite (2013), foi 
retirado de um capítulo sobre fuga e esquiva. Nesse sentido, ele se refere principalmente a 
reforçamento negativo. No volume anterior ao livro citado (i.e., Whaley & Mallot, 
1971/1980), encontra-se um trecho onde os autores definiram reforçador positivo 
especificamente. Considerando ambos os trechos, “aquilo que é dado é reforçador positivo se, 
e apenas se, aumentar a frequência de uma resposta ou ato comportamental ao qual se 
seguiu”, enquanto é chamado de reforçamento negativo o procedimento no qual “a frequência 
de uma resposta específica será aumentada se esta resposta for regularmente seguida pela 
cessação da estimulação ou término da perda de reforçadores positivos”. 
Mais adiante Whaley e Malott (1971/1981) ressaltam que “os dois procedimentos 
diferem pelo fato de o reforçamento positivo envolver a apresentação de um evento ou 
privilégio, enquanto o reforçamento negativo envolve a remoção de eventos classificados 
38 
 
 
usualmente como ‘aversivos’”. Além do tipo de alteração ambiental (novamente no caso do 
reforçamento negativo) há algum acréscimo ausente no reforçamento positivo: além da 
remoção (“cessação”) do estímulo reforçador negativo, o “término da perda de reforçadores 
positivos” também pode se constituir como reforçamento negativo. 
Para Sidman (1989/2009), o reforçamento positivo se caracteriza pela “adição, 
produção ou aparecimento” (p. 55) de um estímulo e o reforçamento negativo, pela 
“subtração, remoção ou eliminação” (p. 55) de um estímulo. Descrições bastante paralelas nas 
quais fica evidente que os três termos utilizados (em ambas) servem como sinônimos 
intercambiáveis. Destaca-se novamente (como feito na sessão "Reforçadores Positivos e 
Negativos”) o adendo do autor de que o que é acrescentado (no reforçamento positivo), 
necessariamente não estava presente antes da resposta, enquanto o que é eliminado (no 
reforçamento negativo) necessariamente estava presenta antes da resposta. 
No trecho selecionado por Santos e Leite (2013), Baum (1994/1999, p. 77) apresenta, 
como definição de reforçamento, o fortalecimento ou manutenção de uma resposta - o que é 
compatível com a visão dos autores anteriores. No entanto, diz que no reforçamento positivo, 
a resposta torna o reforçador positivo “provável” e, no reforçamento negativo, a resposta torna 
o reforçador negativo “menos provável”. Foge aos objetivos deste trabalho analisar a fundo a 
proposta alternativa de Baum, mas, no que é relevante para este trabalho, esta parece apenas 
uma forma diferente de se referir ao que tipicamente é chamado de contingência. Ainda 
assim, segundo Santos e Leite (2013), esta mudança na forma de descrever não resolveria de 
forma alguma a ambiguidade apontada por Michael (1975). 
Catania (1992) é outro dos autores já utilizados neste trabalho ao definir reforçamento 
e reforçadores positivos e negativos e ele basicamente distingue reforçamento positivo de 
negativo pela “produção” e “remoção” de um estímulo respectivamente. Entretanto, algo que 
não fora mencionado, é que o autor acrescenta que no reforçamento negativo uma resposta 
39 
 
 
“termina” (terminate) ou evita/previne (prevent) um estímulo” (p.117). Esse acréscimo é de 
especial relevância porque, diferentemente de casos anteriores, seria difícil argumentar que 
“terminar” e “prevenir” sejam sinônimos intercambiáveis. Isso poderia dar a entender que o 
reforçamento negativo seria possível de ser definido por um critério adicional em relação a 
outros autores. 
Entende-se, entretanto, que este acréscimo se baseia na noção de que situações de fuga 
(emissão de uma resposta que elimina ou reduz uma estimulação aversiva) podem ser 
acompanhadas do que é chamado de esquiva. Segundo Skinner (1953/2014), para que uma 
esquiva aconteça, é necessário que um primeiro estímulo anteceda regularmente um segundo 
estímulo que seja aversivo, de forma que esse primeiro estímulo se torne um estímulo 
aversivo condicionado. Se o organismo entrar em contato com o primeiro estímulo 
(condicionado ao outro) e emitir respostas que o eliminem, evitando o contato com o segundo 
estímulo (que o condicionou), diz-se que o organismo fugiu do primeiro estímulo e se 
esquivou do segundo estímulo. Skinner acrescenta que esquiva não quebra nenhum 
fundamento científico porque não é explicada pela evitação direta de um estímulo no futuro, 
mas sim pela fuga do estímulo por ele condicionado. 
Seguindo essa lógica, não seria possível que uma esquiva acontecesse sem que uma 
fuga também acontecesse. Logo, o acréscimo de Catania (1992) de que um reforçamento 
negativo pode ser caracterizado pelo término ou evitação de um estímulo aversivo torna-se 1) 
redundante, a partir da perspectiva de que em toda “prevenção/evitação” já estaria implícito 
um “término”, ou 2) incorreto já que “prevenções” que não incluem um término não poderiam 
ser consideradas reforçamento negativo (e.g., um rato que, por acaso, pressionou uma barra 
que adiou um choque sem que ele sequer tivesse tido contato prévio com o choque). É 
possível que esse acréscimo tenha sido feito para englobar definições alternativas de esquiva 
40 
 
 
que entendam que a esquiva não dependa de um estímulo aversivo condicionado (e.g., Baum 
1994/1999). 
Vale lembrar que esse livro, junto com Pierce e Epling (1995) e Catania (1992) 
fizeram parte do terceiro grupo do artigo de Santos e Leite (2013), ou seja, são publicações 
que, de alguma forma, abordaram a crítica de Michael (1975). Cameschi e Abreu-Rodrigues 
(2005), por sua vez, apenas mencionam o questionamento, enquanto Pierce e Epling (1995) e 
Catania (1992) dão a entender que concordam, pelo menos parcialmente, com a dubiedade da 
distinção. 
Reese (1966/1973), ao descrever o reforçamento negativo, utilizou o termo “estímulo 
aversivo” para se referir ao tipo de estímulo envolvido no processo. Ao mesmo tempo, ele 
usou o termo “estímulo reforçador” para descrever o estímulo envolvido no processo de 
reforçamento positivo. O autor parece não separar os estímulos entre reforçadores positivos e 
negativos (como outros autores), mas sim entre reforçadores e aversivos (ou também 
“controle positivo” e “controle negativo”). 
Diversos outros autores (i.e., Whaley & Mallot, 1971/1981; Pierce & Epling, 1995; 
Catania, 1992; Cameschi & Abreu-Rodrigues, 2005) também apresentaram a mesma alteração 
no uso de termos ao definir reforçamento negativo (“estímulo aversivo” no lugar de 
“reforçador negativo”), mas não fizeram alterações similares em suas definições de 
reforçamento positivo (i.e., utilizaram o termo “reforçador

Mais conteúdos dessa disciplina