Prévia do material em texto
1 Pontifícia Universidade Católica de São Paulo - PUC-SP Paulo Henrique Cavalcanti Mendes Uma Análise dos Argumentos a Favor e Contra a Distinção entre os Reforçamentos Positivo e Negativo Mestrado em Psicologia Experimental: Análise do Comportamento São Paulo 2025 2 Paulo Henrique Cavalcanti Mendes Mestrado em Psicologia Experimental: Análise do Comportamento Uma Análise dos Argumentos A Favor e Contra a Distinção Entre os Reforçamentos Positivo e Negativo Dissertação apresentada à Banca Examinadora da Pontifícia Universidade Católica de São Paulo, como exigência para obtenção do título de MESTRE em Psicologia Experimental: Análise do Comportamento, sob a orientação do Prof. Dr. Emerson Ferreira da Costa Leite. São Paulo 2025 3 Banca Examinadora: Prof. Dr. Emerson Ferreira da Costa Leite Prof. Dr. Amilcar Rodrigues Fonseca Júnior Prof. Dr. Denigés Maurel Regis Neto 4 O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior- Brasil (CAPES) – Código de Financiamento 001 Processo n° 88887.805384/2023-00 This study was supported by the Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Finance Code 001 Process n° 88887.805384/2023-00 5 Agradecimentos Em primeiro lugar, agradeço ao Prof. Dr. Emerson Ferreira da Costa Leite, meu primeiro professor da graduação com quem tive aulas ou orientações durante todos os anos da minha jornada acadêmica até aqui. Ele foi não só um orientador incrível, mas também uma pessoa que soube lidar comigo da melhor maneira possível. Emerson, obrigado por ter me ajudado tanto especialmente nessa reta final, isso nunca será esquecido. Foi muito bom trabalhar com você. Obrigado à minha família, aos meus amigos, aos meus professores do PEXP e a cada funcionário e aluno da PUC-SP que contribuíram direta ou indiretamente para a construção de um ambiente no qual eu pude me desenvolver tanto como analista do comportamento como pessoa ao longo desses anos. O carinho que sentirei por essa comunidade será eterno. Destaco especialmente o Prof. Dr. Amilcar Rodrigues Fonseca Júnior, cuja eletiva e discussões dentro e fora de sala me inspiraram a estudar o tema desenvolvido nesse trabalho. Quero agradecer tanto ele como o Prof. Dr. Denigés Meurel Regis Neto e o Prof. Thomas Endriggo Ramos Vieira pelas inestimáveis contribuições em minha Banca de Qualificação e por concordarem em participar também da minha Banca de Defesa. Esse trabalho definitivamente não seria o mesmo sem os comentários de vocês. Faço também uma humilde menção à Prof. Tuane de Oliveira Lima que chegou na sala de aula com uma sacola cheia de livros e revistas de análise do comportamento para dar e que incluíam os volumes originais de 2006 do debate analisado no presente trabalho. Eu jamais imaginaria poder ter algo assim hoje. Por fim, agradeço a pessoa mais essencial tanto para o desenvolvimento de diversas das discussões presentes nesse trabalho quanto para a minha (relativa) estabilidade durante todo esse processo. Giovana, eu te amo. Nada na minha vida seria tão bom sem ter você do meu lado. 6 Resumo Mendes, P. (2025). Uma análise dos argumentos a favor e contra a distinção entre os reforçamentos positivo e negativo [Dissertação de mestrado, Pontifícia Universidade Católica de São Paulo]. Biblioteca Digital Brasileira de Teses e Dissertações. https://bdtd.ibict.br Esta dissertação teve como objetivo sistematizar, analisar e interrelacionar as falas (argumentos, sugestões e esclarecimentos) do debate publicado na revista The Behavior Analyst (2005-2006) sobre a distinção entre reforçamento positivo e negativo. Cada fala foi organizada segundo suas diferentes funções e posteriormente categorizadas e organizadas em uma planilha que permitiu a análise conjunta dos temas e interlocuções. Os resultados indicam que a distinção baseada em adição ou subtração de estímulos é conceitualmente ambígua e frequentemente arbitrária, o que compromete sua utilidade descritiva e didática. Embora alguns autores apontem vantagens em sua manutenção, essas se mostraram pouco fundamentadas ou independentes da distinção em si. Além das sugestões conceituais e pedagógicas, os textos analisados propõem diversas linhas de investigação empírica, como: estudos sobre a clareza das definições de reforçamento; investigações sobre os parâmetros comuns entre reforçadores tradicionalmente classificados como positivos ou negativos; pesquisas sobre as razões culturais e históricas para a manutenção da distinção; e análises do comportamento de nomear reforços. Também foram discutidas variáveis possivelmente envolvidas no controle dessa distinção, como abruptidão da mudança, mecanismos fisiológicos e operações motivadoras. Conclui-se que a distinção poderia ser abandonada sem prejuízo conceitual, desde que preservadas descrições precisas das condições de estímulo. Palavras-chave: análise do comportamento; reforçamento positivo; reforçamento negativo; análise conceitual. https://bdtd.ibict.br/ 7 Abstract Mendes, P. (2025). An analysis of the arguments for and against the distinction between positive and negative reinforcement [Master’s thesis, Pontifical Catholic University of São Paulo]. Brazilian Digital Library of Theses and Dissertations. https://bdtd.ibict.br This dissertation aimed to systematize, analyze, and interrelate the statements (arguments, suggestions, and clarifications) from the debate published in The Behavior Analyst (2005- 2006) on the distinction between positive and negative reinforcement. Each statement was organized according to its function and subsequently categorized and compiled into a spreadsheet that allowed for the integrated analysis of themes and interactions among authors. The results indicate that the distinction based on the addition or removal of stimuli is conceptually ambiguous and often arbitrary, which compromises its descriptive and pedagogical utility. Although some authors pointed to advantages in maintaining the distinction, these were either weakly supported or not inherent to the distinction itself. In addition to conceptual and educational suggestions, the analyzed texts proposed several avenues for empirical investigation, including: studies on the clarity of reinforcement definitions; investigations into common parameters across traditionally classified reinforcers; research on the cultural and historical reasons for the distinction’s persistence; and analyses of the scientific behavior of labeling reinforcers. Variables potentially involved in the control of this distinction were also discussed, such as abruptness of environmental change, physiological mechanisms, and motivating operations. The dissertation concludes that the distinction could be abandoned without conceptual loss, provided that precise descriptions of stimulus conditions are maintained. Keywords: behavior analysis; positive reinforcement; negative reinforcement; conceptual analysis. https://bdtd.ibict.br/ 8 Sumário Lista de Figuras.................................................................................................................... 12 Lista de Tabelas ................................................................................................................... 13 Considerações Sobre o Processo de Produção do Presente Trabalho ................................ 14 Estrutura Geral da Introdução .......................................................................................... 15 Definição de Reforçamento .............................................................................................positivo”). Considera-se assim que as diferenças apontadas até então sejam, individualmente, minúcias. Entretanto, consideradas em conjunto, apontam para uma tendência em fazer alterações e acréscimos quase que exclusivamente sobre as definições de reforçador e/ou reforçamento negativo. Resumidamente, 1) utilizaram um termo diferente (i.e., estímulo aversivo) no lugar de reforçador negativo (Reese, 1966/1973; Whaley & Mallot, 1971/1981; Pierce e Epling (1995); Catania, 1992; Cameschi & Abreu-Rodrigues, 2005), 2) 41 acrescentaram como parte da definição que eles também funcionam como punidores (Keller & Schoenfeld, 1950/1974), 3) destacaram que reduções na intensidade do estímulo podem configurar reforçamento negativo (Millenson, 1967/1975), 4) incluíram o término da perda de reforçadores positivos como reforçamento negativo (Whaley & Mallot, 1971/1981) e, por fim, 5) afirmaram que a prevenção de um estímulo aversivo constitui reforçamento negativo (Catania, 1992). Sobre cada uma das alterações/acréscimos feitas sobre os reforçadores negativos, comenta-se: 1) o termo “estímulo apetitivo” nunca foi usado nas definições analisadas de reforçamento positivo como um paralelo para estímulo aversivo; 2) não houve menção direta ao fato de que a remoção de reforçadores positivos pode funcionar como punição; 3) não incluíram, nas definições, que aumentos na intensidade de um estímulo reforçador positivo contingentemente a uma resposta poderiam aumentar sua frequência (e.g. aumentar o brilho de um vídeo ou volume de uma música); 4) não incluíram uma versão oposta disso que pudesse ser chamada de reforçamento positivo; e 5) é baseado em aspectos específicos dos experimentos realizados com reforçadores negativos e não do reforçador em si. A presente síntese das definições mostra que a área apresenta inconsistências: 1) entre as definições de reforçadores positivos e negativos apresentadas por um mesmo autor e 2) entre as definições apresentadas por cada autor. Foi possível observar como algumas escolhas específicas, tal como a própria variedade dos termos usados, pode acabar sendo prejudicial para o entendimento de um conceito por parte de um novo leitor. Levando em conta o objetivo de Santos e Leite (2013) de “avaliar como os conceitos de reforçamento positivo e reforçamento negativo são abordados em livros de ensino de análise do comportamento” (p. 9), parece ter havido limitações no procedimento usado pelos autores. Isso porque somente alguns trechos em que a distinção positivo/negativo fora claramente abordada (ou trechos muito próximos) foram considerados em sua análise (como 42 no caso de Whaley & Mallot, 1971/1981). Isso pode ser um problema, especialmente no que diz respeito a livros didáticos, porque informações úteis para uma análise dessa natureza podem ter sido apresentadas ao longo da construção didática do texto – e não somente num trecho específico sobre a distinção. Além disso, os autores parecem ter se limitado a citações a Michael (1975) para investigar se os autores teriam abordado problemas relacionados à distinção positivo/negativo ou não. Isso talvez tenha impedido que falas que não citavam Michael, mas destacavam problemas na distinção fossem incluídas, como por exemplo: Algumas vezes é difícil dizer qual é o controle, reforçamento positivo ou negativo ou ambos. Suponha que deixemos nosso rato de laboratório produzir alimento e apagar uma luz brilhante quando ele apertar o botão. Se quisermos então descobrir o que é responsável por sua atividade de apertar o botão, a produção de alimento ou a fuga da luz brilhante, simplesmente poderemos remover essas consequências, uma de cada vez, e ver se o animal continua a apertar o botão. As condições restritas de laboratório permitem uma resposta direta para nossa questão. Descobrir se reforçamento positivo ou negativo exerce controle fora do laboratório provavelmente não se mostrará tão simples assim, mesmo que decisões importantes possam depender da resposta (Sidman, 1989/2009, p. 57). Sidman (1989/2009) menciona como situações em que a distinção pode ser difícil de fazer poderiam ser resolvidas em laboratório, mas reconhece que isso talvez não seja simples de se aplicar fora dele. Considerando esse trecho, é possível até que Sidman pudesse ter sido incluído no grupo dos autores que abordaram a dificuldade na distinção, mas que também manteve a definição tradicional. Ao fim de seu artigo, Santos e Leite (2013) sugerem que novos estudos poderiam investigar a influência das críticas de Michael (1975) em artigos. Possmoser (2015) sistematizou os artigos (até 2014) que referenciavam Michael (1975) para avaliar sua 43 influência na área. A autora concluiu que, por mais de 30 anos, pesquisas que discutiram a distinção entre reforçamento positivo e negativo foram escassas, até que Baron e Galizio (2005) publicassem o artigo intitulado: “Reforçamento positivo e negativo: a distinção deve ser preservada?”. Isso teria feito aumentar subitamente o número de publicações referenciando Michael (1975) nos anos seguintes. Em seu artigo, publicado na revista The Behavior Analyst, Baron e Galizio (2005) se propuseram a rever as críticas e propostas de Michael (1975) considerando 30 anos de novas pesquisas. Talvez o impacto mais notável de sua publicação tenha sido as oito réplicas que recebeu nas sessões “In response” das duas edições seguintes da mesma revista em 2006 (Chase, 2006; Michael, 2006; Iwata 2006; Marr, 2006; Lattal & Lattal, 2006; Sidman, 2006; Nakajima, 2006; Staats, 2006) – e suas subsequentes tréplicas (Baron e Galizio, 2006a, 2006b). Possmoser (2015), na segunda parte de seu trabalho, fez uma síntese dos textos mencionados com foco em apresentar e resumir detalhadamente os principais pontos de cada artigo. Recomenda-se esta leitura para aqueles que se virem interessados em se apropriar mais do debate3 em português. Embora a distinção entre reforçamento positivo e negativo seja amplamente utilizada, como os trabalhos apresentados até então e o próprio debate de 2005/2006 ilustram, sua utilidade conceitual e consistência descritiva têm sido questionadas há décadas. Há artigos tão recentes quanto 2024 que citam os problemas com a distinção (e.g., Fonseca-Júnior, 2024). Pesquisas teóricas que abordam conceitos básicos como o próprio reforçamento são importantes na medida em que contribuem para esclarecer os limites e implicações _________________ 3 Nos casos em que for utilizado o termo “debate” sem nenhuma outra especificação, deve-se entender que o termo se refere ao debate de 2005/2006 publicado na revista The Behavior Analyst; 44 conceituais da distinção, favorecendo uma definição mais precisa e funcional dos conceitos envolvidos. O trabalho de Possmoser (2015) foi uma contribuição à discussão e compreensão do debate acerca da manutenção ou abandono da distinção entre os reforçamentos positivo e negativo. Ainda assim, a literatura carece de uma sistematização e análise dos argumentos apresentados neste debate, interrelacionando-os e discutindo suas implicações para o avanço dessa importante questão conceitual na análise do comportamento. Foi objetivo da presente pesquisa sistematizar, analisar e interrelacionar as falas (argumentos, sugestões e esclarecimentos) apresentadas por Baron & Galizio (2005) e todos os autores que participaram das edições especiais da revista The Behavior Analyst de 2006 dedicada ao debate sobre a distinção entre reforçamento positivo e negativo. 45 Método Seleção dos Textos Através dos dados da pesquisa de Possmoser (2015), conjuntamente com os dados de Mendes e Ceneviva (não publicado), identificou-se que maior concentração de textos que citavam Michael (1975) e discutiam ativamente a manutenção ou abandono da distinção entre reforçamento positivo e negativo correspondeao debate de 2005/2006 na revista The Behavior Analyst. A publicação original de Baron e Galizio (2005) retomou a discussão abordada por Michael (1975) e gerou outras 10 publicações no ano seguinte na seção “In response” das edições de 2006 da revista. Esse conjunto de 11 textos foi selecionado para este trabalho, por constituir um grupo suficientemente amplo, mas, ao mesmo tempo, representar um recorte específico diante do qual pode ser feita uma análise interrelacional dos argumentos, suas réplicas e suas tréplicas. O texto de Michael (1975) não foi incluído na amostra de falas porque 1) esse texto não fez parte do debate e não poderia ser interrelacionado da mesma maneira com as respostas; 2) segundo o próprio autor (Michael, 2006), “Baron e Galizio (2005) apresentaram uma versão precisa e muito clara dos meus argumentos” (p. 117); 3) o autor já foi incluído no debate e pode fazer os acréscimos fundamentais se necessário; e 4) porque a amostra provavelmente ficaria repetitiva. Procedimento de Grifo dos Textos Cada texto selecionado foi separado por “falas” de acordo com a função geral de cada parte do texto. A determinação do início e final de cada “fala” foi guiado preferencialmente pela divisão das seções ou então pela paragrafação delimitada pelo próprio autor. Entretanto, quando uma mesma seção ou parágrafo continha trechos com funções nitidamente distintas, esses trechos eram grifados separadamente. 46 A cada tipo de função foi atribuída uma categoria específica com uma cor de grifo correspondente. As categorias foram criadas de forma a incluir qualquer tipo de fala encontrada, dessa forma, ao final do procedimento de grifo, todos os textos ficaram inteiramente grifados. Na Tabela 1 são apresentadas cada uma das categorias seguidas de suas respectivas definições: Tabela 1 Categorias de análise utilizadas no grifo dos textos Categoria Definição Vantagem da Manutenção O autor apontou uma vantagem relacionada ao uso da distinção entre os reforçamentos positivo e negativo. Vantagem do Abandono O autor apontou uma vantagem relacionada ao abandono da distinção entre os reforçamentos positivo e negativo. Problema da Manutenção O autor apontou um problema relacionado ao uso da distinção entre os reforçamentos positivo e negativo. Sugestão para Manutenção O autor apontou para a resolução de uma lacuna ou problema relacionado a manutenção da distinção entre os reforçamentos positivo e negativo. Sugestão para Abandono O autor apontou para a resolução de uma lacuna ou problema relacionado ao abandono da distinção entre os reforçamentos positivo e negativo. Sugestão Neutra O autor apontou para a resolução de uma lacuna ou problema não especificamente relacionada com a manutenção ou abandono da distinção entre os reforçamentos positivo e negativo. Explicação para Manutenção O autor apontou uma possível explicação para a manutenção do uso da distinção entre os reforçamentos positivo e negativo. Explicação para Abandono O autor apontou uma possível explicação para a adoção do uso da distinção entre os reforçamentos positivo e negativo. 47 Complemento O autor trouxe novos dados que complementam um ponto atribuído a outro autor citado. Contra-argumento O autor respondeu uma fala específica de outro autor disputando o ponto por ele apresentado. Concordância O autor respondeu uma fala específica de outro autor concordando com o ponto por ele apresentado, mas sem trazer novos dados. Esclarecimento Baron e Galizio responderam a um aparente mal- entendido (geral ou pontual) presente em seu texto original. Só se aplica aos textos de resposta de Baron e Galizio. Outro O autor disse algo que não tem função argumentativa, sugestiva ou explicativa com relação a manutenção ou abandono da distinção entre os reforçamentos positivo e negativo. Correspondem a qualquer outro tipo de fala que não seja contemplada pelas categorias anteriores. Essa categoria não será tabelada. Nota. As categorias Complemento, Contra-argumento, Concordância e Outro não estarão presentes enquanto categorias nos Resultados. Quando duas falas seguidas distintas faziam parte de uma mesma categoria, e, portanto, foram grifadas com uma a mesma cor, uma linha era inserida entre elas de forma a separá-las. Procedimento de Tabulação dos Dados A cada texto lido e grifado, cada fala e sua categoria (com exceção da categoria “Outro”) atribuída foram inseridos em uma planilha no programa Microsoft Excel (recorte ilustrativo no Apêndice). Para facilitar a visualização e compreensão de cada item da tabela, os trechos não foram incluídos integralmente, apenas uma descrição sintetizada de cada um. Na planilha do Excel, cada linha (ou conjunto de linhas mescladas) correspondeu a uma fala, ordenada, a princípio, por ordem de publicação. Cada coluna correspondeu a uma classificação ou dado correspondente àquela fala. A seguir, serão apresentadas cada uma das colunas de classificação de falas e suas respectivas funções: 48 A. Texto: indica a referência (último nome do autor e ano de publicação) ao qual cada conjunto de trechos pertence (e.g., “Michael (2006)”). B. Localização: página do texto em que se encontra a fala. C. Fala: descrição sintética de cada fala grifada no texto. D. Dado: descrição sintética das informações que basearam sua fala. E. Tipo de fala: classificação de cada fala dentro categorias delimitadas no “Procedimento de Grifo dos Textos” (ver Tabela 1). F. Ponto central: uma reformulação da síntese que leva em conta o conjunto de argumentos já coletados, para que, em casos de argumentos semelhantes (ou simetricamente opostos), sua descrição possa ser feita de forma mais “paralela”. Isso tem o objetivo de favorecer a comparação e interrelação entre argumentos de mesmo tema. Como exemplo, no caso de um autor que afirmou que a distinção positivo/negativo “aumenta a probabilidade de um aluno compreender o conceito”, um segundo autor que afirmou que “abandonar a distinção facilita a compreensão”, e um terceiro afirmou que a distinção “atrapalha no aprendizado de novos alunos”; os argumentos seriam sintetizados, respectivamente, como: “Facilita a aprendizagem” (categoria Vantagem da Distinção), o segundo como “Facilita a aprendizagem” (categoria Vantagem do Abandono) e o terceiro como “Dificulta a aprendizagem” (categoria Problema da Distinção). G. Ponto específico: título descritivo que diferencia cada fala específica em relação ao ponto central ao qual ela foi agrupada. Dentro do central “Faltam Investigações” um ponto específico seria “Sobre o Conceito de Reforçamento” H. Resposta a: autores e números das linhas referentes às falas que estão sendo respondidas pela presente fala. 49 I. Respondido por: autores e números das específica referentes às falas que responderam a presente fala. J. Observações: anotações pessoais a respeito de cada uma das falas, feitas tanto para facilitar o preenchimento da tabela quanto para auxiliar na construção dos resultados e desenvolvimento da discussão. 50 Resultados e Discussão Nesta seção serão apresentados os dados de cada uma das categorias de “Tipo de Fala” que foram grifadas e passadas para a tabela de Análise das Falas. Dentro de cada categoria, as falas foram agrupadas com respeito aos seus “Pontos Centrais”. Além disso, falas categorizadas como “Concordância”, “Complemento” e “Contra-argumento” foram apresentadas após cada fala a qual estavam relacionadas. Discussões muito pontuais, sobre falas específicas que fariam pouco sentido de serem retomadas na discussão geral, foram feitas logo após a fala a que se dirigem. Quando uma discussão estava relacionada a muitas falas, ela foi feita após a apresentação dos resultados dentro dos subtópicos delimitados para sua discussão. Muitas das falasanalisadas consistem apenas de afirmações (genéricas ou específicas) sem um desenvolvimento aprofundado ou informações nas quais o autor se baseou para fazer sua fala. Em alguns dos casos pode ser que as bases para tal afirmação foram discutidas em outro tópico que já foi ou vai ser apresentado e que está em outra categoria. Um exemplo é “a distinção pode ser útil”. Em casos como esse, não houve grande desenvolvimento do subtópico a não ser a indicação do autor que fez a fala e um resumo, quando aplicável, dos pontos contidos em outros argumentos que eram relevantes para essa afirmação. As categorias que envolvem “Vantagens” e “Explicações” são semelhantes, mas diferem quanto à forma em que o autor apresentou sua fala. A primeira categoria inclui afirmações mais categóricas das vantagens (e.g., “a distinção é útil para tal”), enquanto a segunda é estruturada de forma a explicar o porquê de o uso da distinção4 se manter (e.g., “a _________________ 4 Em casos em que for utilizado o termo “distinção” sem nenhuma outra especificação, deve-se entender que o termo se refere à distinção entre os reforçamentos positivo e negativo; 51 distinção foi mantida por conta de...”) – frequentemente com esse objetivo declarado. Muitas das subcategorias de uma classificação foram compartilhadas pela outra. A Figura 1, a seguir, apresenta a organização hierárquica e interrelação ente os subtópicos apresentados em Resultados e Discussão. Como é possível observar, serão apresentados e discutidos inicialmente os problemas, vantagens, explicações e sugestões relacionados à manutenção da distinção entre reforçamento positivo e negativo, seguindo para as vantagens, explicações e sugestões relacionadas ao abandono desta distinção e finalmente as sugestões neutras em relação às duas posições e alguns esclarecimentos sobre pontos identificados no debate. Segue-se então uma discussão geral dos resultados e considerações finais sobre o presente trabalho. Figura 1 Organização hierárquica e interrelação entre os subtópicos da seção “Resultados e Discussão” 52 Problemas da Manutenção Falas em que os autores apontaram falhas ou desvantagens relacionadas ao uso da distinção entre os reforçamentos positivo e negativo. Dentre os trechos classificados como “Problemas da Manutenção”, identificou-se falas que apontavam para a distinção como sendo confusa, ambígua, pouco fundamentada, limitada ou problemática. A Distinção É Confusa Confusa em seu Uso Histórico. O primeiro ponto apresentado no resgate feito por Baron e Galizio (2005), já visto em Michael (1975) na Introdução, ilustra como a distinção pode gerar confusão por conta de seus diferentes usos ao longo do tempo. Historicamente, o termo “reforçamento negativo” foi inicialmente usado por Skinner (1938) da mesma forma que hoje se usa o termo punição, e só posteriormente usado no seu sentido atual. Ainda assim, Michael reconhece que esse problema particular foi resolvido pela terminologia moderna, já atualizada em Skinner, que distingue tanto os reforçamentos quanto as punições entre positivos e negativos. Confusa para Novos Leitores. Sidman (2006), diferentemente de Michael (1975), afirma que ainda há confusão entre os termos “reforçamento negativo” e “punição” e cita que em sua experiência isso é especialmente comum entre pessoas que estão sendo introduzidas à análise do comportamento. Ele acredita que o problema é gerado pela igualação do termo “reforçamento positivo” ao termo cotidiano “recompensa” e à noção de que “negativo deve ser oposto a positivo” e, portanto, reforçamento negativo é igualado à “punição”. Confusa Sobre Suas Regras de Uso. Baron e Galizio (2006a) argumentam que outro aspecto responsável pela confusão diz respeito a forma como se descrevem determinadas alterações ambientais reforçadoras. Há situações em que existe um consenso na forma de descrever alguns eventos, por exemplo, quando se diz que a pressão à barra foi reforçada pela pelota de alimento ou que tomar uma aspirina foi reforçado pela eliminação da dor de cabeça 53 (exemplos dos autores). O problema, para o autor, é que no primeiro caso, a descrição feita diz respeito à operação (adição do alimento), enquanto a segunda diz respeito ao efeito que a operação (adição da aspirina) tem no organismo – a eliminação da dor de cabeça. Para os autores isso indica que mais de um critério acaba sendo usado para descrever alterações ambientais reforçadoras e que também não há clareza em quando se usar cada critério. Uma discussão que se pode fazer sobre a este último ponto, colocado por Baron e Galizio (2006a), é que ele talvez tivesse ficado mais evidente se tivessem usado comportamentos mais paralelos como exemplos. Uma possibilidade é comparar “tomar uma aspirina” com “comer um alimento” – ao invés de pressionar uma barra. Nesse caso, respostas semelhantes em topografia estariam ambas produzindo a consequência “estímulo [aspirina/alimento] no organismo”. Seria possível, nesse caso, argumentar que os dois comportamentos envolvem o mesmo tipo de operação (i.e., adição). Afirmar que são mantidos pela adição desses estímulos, entretanto, implicaria dizer que uma aspirina é consumida pela sua própria adição e não pelo seu efeito sobre a dor de cabeça, algo que pode soar estranho no caso da aspirina, mas que é exatamente o que se diz sobre o alimento com relação à fome (i.e., o alimento é consumido por sua própria adição e não pelo seu efeito sobre a fome). É comum se dizer que “tomar a aspirina foi reforçado pela eliminação da dor de cabeça”, mas dificilmente se ouviria de um analista do comportamento que “o consumo do alimento é reforçado pela eliminação da fome”. A questão é que em ambos o caso parece ser o mesmo: uma resposta está sendo reforçada por um suposto estímulo privado do organismo. De outra forma, também se poderia afirmar que a resposta foi reforçada pela eliminação da operação motivadora, mas, novamente, isso parece aceitável somente para reforçamento negativo, mas não para o positivo – mesmo que a subtração (parcial ou completa) da operação motivadora seja intrínseca aos dois. 54 De toda forma, o ponto de Baron e Galizio (2006a) é, justamente, que o critério para se classificar as alterações ambientais, ou seja, para se fazer uma distinção entre os reforçamentos positivo e negativo é confuso. A Distinção É Ambígua O segundo e mais discutido ponto (21 respostas totais) trazido por Baron e Galizio (2005), também visto em Michael (1975), deriva do fato de que função reforçadora de um evento advém sempre da mudança de uma condição de estímulo para outra (algo já indicado na Introdução por Skinner, 1953 e Michael, 1975). Dentro desse parâmetro, qualquer descrição de uma alteração ambiental num sentido também pode ser descrita em sua forma oposta. Para demonstrar isso, os autores apresentam um exemplo em que ratos em um caixa experimental fria pressionavam uma barra que fazia aumentar a temperatura da caixa (Weiss & Laties, 1961). Para Baron e Galizio, tanto a descrição de que a pressão à barra era mantida pela “adição do calor” quanto a descrição de que a pressão à barra de que era mantida pela “subtração do frio” são possíveis e descrevem a mesma mudança. Nesse sentido, é possível classificar o processo tanto como reforçamento positivo quanto como reforçamento negativo. Além desse exemplo experimental, Baron e Galizio (2005) trazem os exemplos de que a “entrega de dinheiro” implica no “término de um período de falta de dinheiro” e a “fuga de um estímulo aversivo condicionado” sempre produz a “adição de uma situação na qual o estímulo aversivo está ausente”. Mais adiante, afirmam que o dilema fica particularmente aparente em exemplos cotidianos em textos didáticos. Em um, uma criança liga a televisão para assistir um desenho. Nesse caso, ela liga a TV pela adição dodesenho ou pela subtração do tédio? Em outro, uma pessoa com dor de cabeça toma uma aspirina. Ela o faz pela adição da aspirina ou pela subtração da dor de cabeça? Em alguns casos os próprios autores de alguns desses livros didáticos reconheciam que ambas as interpretações eram válidas e destacam como isso acaba por anular o propósito dos rótulos positivo/negativo. 55 Em outras palavras, a distinção seria ambígua porque qualquer mudança ambiental poderia ser descrita como positiva ou negativa. Nesse sentido, ela seria “mais uma questão de procedimento do que qualquer outra coisa, e a direção da mudança [adição/subtração] não parece oferecer uma contribuição fundamental” (Baron e Galizio, 2006a, p. 148). Há outros dois exemplos apresentados por Baron e Galizio (2005) que serão retomados mais adiante como contra-argumento de uma “Explicação para a Manutenção”, mas que aparece em algumas respostas ao presente argumento. O primeiro diz respeito a oposição entre “aumento da atenção” e “alívio da solidão”, e o segundo entre “fuga de uma tarefa aversiva” e “acesso a uma atividade alternativa”. Alguns autores demonstraram concordar em alguma medida com esse argumento de Michael (1975) e Baron e Galizio (2005). Chase (2006) concorda completamente que não se pode atribuir processos diferentes para o reforçamento positivo ou negativo, nem controle por um e não pelo outro. Iwata (2006) concordou que, pelo menos do ponto de vista descritivo, não há diferença entre descrever a mudança de uma forma ou de outra. Ainda assim, sugere a mudança do termo “alívio da solidão” por “término de um período no qual atenção estava indisponível”. Sidman (2006) alertou que para aqueles que defendem que a distinção reflete diferenças no processo de reforçamento em si, a discussão de Baron e Galizio (2005) deve resolver essa questão. Além disso, afirmou que há situações em que, de fato, não podem ser classificadas apenas como reforçamento positivo ou negativo. Nos casos como o do experimento de Weiss e Laties (1961), Sidman concorda que tanto a condição de estímulo antecedente quanto consequente (i.e., magnitude do estímulo antes e depois da resposta) precisam ser levadas em conta para que se possa especificar o reforçador. Por fim, Nakajima (2006) concorda que existe uma “ambiguidade essencial” na distinção entre os reforçamentos positivo e negativo. 56 Dentre os contra-argumentos apresentados à Baron e Galizio (2005), Chase (2006) aponta que o experimento de Weiss e Laties (2006) é um exemplo fraco do problema porque parece muito mais uma questão de semântica, já que “calor” e “frio” são opostos e não há diferença em descrever uma coisa ou outra. No caso de uma criança que emite baixa taxa de mandos e alta taxa de comportamentos auto lesivos, um cuidador poderia aumentar a atenção contingente a mandos e ver tanto um aumento na frequência de mandos quanto uma diminuição nos comportamentos auto lesivos; ou restringir diretamente os comportamentos auto lesivos, o que poderia fazer aumentar o número de mandos como forma de fuga. Diante disso, Chase afirma que: O fato de que os componentes de reforçamento positivo e negativo de ambas as manipulações podem ser descritos não anula o valor heurístico de perceber que tanto a atenção quanto a contenção podem ser manipuladas para aumentar mandos socialmente apropriados (Chase, 2006, p. 114). Nesse sentido, o valor da distinção, para Chase (2006), se dá em poder isolar diferentes mudanças ambientais e não em distinguir uma mesma mudança em suas duas versões opostas. Diferentemente do exemplo de Weiss e Laties (1961) em que uma mesma mudança pode ser descrita de duas formas (aumento do calor e diminuição do frio), Chase afirma que as intervenções “aumento da atenção” e “restrição física” poderiam ser, cada uma, descritas em suas versões opostas (i.e., “diminuição de períodos sem atenção” e “aumento de períodos sem restrição física”). Iwata (2006) argumenta que, apesar de haver casos em que a distinção é incerta (e.g., mudanças na temperatura ou na intensidade de um choque), muitas mudanças de estímulo envolvem condições pré e pós-mudança diante das quais costuma ser possível determinar qual o estímulo relevante e se ele está sendo adicionado ou subtraído. Por exemplo: 57 Dizer que o alimento é apresentado refere-se às ações do experimentador; no entanto, dizer que a privação é reduzida refere-se à reversão de uma condição que também deve ser atribuída às ações do experimentador (retenção de alimento). De modo semelhante, terminar a aplicação de choque não parece envolver a apresentação de segurança em si, mas sim a reversão de uma condição na qual um estímulo específico (choque) estava sendo apresentado. Por fim, a entrega de dinheiro pode ou não encerrar um período sem dinheiro, mas sempre resulta no aumento da disponibilidade de dinheiro (Iwata, 2006, p. 122). Iwata (2006) destaca que, mesmo que o direcionamento de Michael (1975) fosse seguido e termos como “entrega” (“delivery’) fossem abandonados em favor descrição da mudança em si, o contraste relevante na transição de uma “condição sem alimento” para uma “condição com alimento” é que o alimento foi adicionado como condição subsequente. A partir disso, vale comentar algumas inconsistências presentes na fala de Iwata (2006). Primeiramente, ele dá a entender que a operação (adição/subtração) costuma ser facilmente identificada pela ação do experimentador, mas não deixa explícito como identificá- la em situações em que não há um agente mediando o reforçamento. Além disso, no trecho citado, ele justifica que a terminação do choque consiste em um reforçamento negativo pois trata-se da retirada do choque que fora estabelecido pelo próprio experimentador. De forma similar, na sua frase anterior sobre o alimento, ele destaca que a privação de alimento também foi uma condição estabelecida pelo experimentador. Se o alimento termina uma condição de retenção de alimento estabelecida pelo experimentador, isso deveria constituir, segundo seu próprio raciocínio, um reforçamento negativo. Mesmo assim, ao final ele destaca que a mudança relevante nesses casos é a adição do alimento. Um segundo contraponto ainda foi apresentado por Iwata (2006) para o argumento de que nenhuma mudança é exclusivamente positiva ou negativa. Apesar de que mudanças de 58 estímulo que acontecem num continuum (i.e., dentro de variações paramétricas da magnitude do estímulo) sejam mais difíceis de classificar, ainda assim é possível identificar o aumento ou diminuição de determinada característica do estímulo, permitindo uma classificação da operação. Marr (2006) critica o recurso de Baron e Galizio (2005) a condições acompanhantes e operações motivadora como forma de explicar o comportamento, afirmando que essas seriam variáveis hipotéticas. Ele destaca que noções como a de que o “reforçadores agem pelo prazer ou pelo alívio” e termos como “necessidade” (“need”), “impulso” (“drive”) foram abandonadas há tempos por serem forçados ou implausíveis. Sobre a questão de se a criança liga a TV por adicionar o desenho ou subtrair o tédio, Marr (2006) afirma que a “busca pelo prazer” não implica uma condição prévia de dor e nem a esquiva da dor implica a busca pelo prazer. Ele ilustra seu ponto com o exemplo de que ele gosta de ouvir música clássica, mas que a ausência desse estímulo não implica em uma privação ativa de músicas do século XIX. De forma similar, ele não sente prazer ativo quando não tem uma dor de cabeça, apenas não a sente. Tomar um remédio elimina a dor de cabeça e o faz voltar para um estado de “relativa neutralidade”. A parte relevante, para o autor, continua sendo que a dor de cabeça foi eliminada, e “o que acontece depois parece irrelevante” (Marr, 2006, p. 127). Baron e Galizio (2006a) concordaram com Marr (2006) que é preferível (alémde costumeiro) recorrer às operações como explicação do comportamento do que noções “implausíveis” (Marr, 2006, p. 127). Entretanto, a despeito da visão que se tenha sobre esses conceitos, o ponto feito por eles se mantém válido mesmo quando consideradas apenas operações específicas observáveis. A própria adição da música clássica (citada por Marr), necessariamente, implica o encerramento de um período na qual a música estava ausente. Em 59 outras palavras, poder-se-ia tanto descrever que “a música foi adicionada” quanto que “o período em que ela estava ausente foi subtraído” e isso é necessariamente reforçador. Baron e Galizio (2006a) também destacam que parte do problema com a distinção é, justamente, que o foco nas operações é de alguma forma perdido. Apesar de sugerir que o foco seja nas operações, Marr (2006) quando descreve que ao se tomar uma aspirina a eliminação da dor de cabeça é o evento reforçador, acaba recorrendo ao efeito da operação; já que a operação específica e observável, nesse caso, seria a adição da aspirina. A dor de cabeça e sua eliminação são eventos hipotéticos e/ou não diretamente observáveis e seriam o efeito da adição da aspirina. Dizer que a eliminação da dor de cabeça é o efeito reforçador seria o mesmo que dizer que a redução da fome, e não a adição do alimento, é o evento reforçador. Sidman (2006), por sua vez, apresenta uma série de críticas e contrapontos ao argumento de Baron e Galizio (2005). O primeiro deles é que apesar de os autores contestarem a noção de que o reforçamento envolve mudanças em estados fisiológicos/emocionais, eles ainda apelam para esses estados em seu principal argumento. Mais especificamente, Sidman menciona a fala de que a apresentação de comida envolve uma redução de um estado de privação e que o aumento de atenção é equivalente ao alívio da solidão. Sobre isso, Baron e Galizio (2006a) responderam que os exemplos que eles apresentaram que envolviam estados internos foram retirados de outras fontes para ilustrar como tais situações costumam ser tratados, mas que o mesmo poderia ser feito sem qualquer referência a esses processos. Ao invés de alívio da solidão pode-se dizer “término de uma condição na qual a atenção estava ausente” (p.149) - alteração muito semelhante a sugestão de Iwata. Ainda assim, destacam que o termo “sozinho” (“lonely”), no dicionário, não se refere a um estado interno, mas sim ao ambiente (i.e., sem companhia). Seguindo a mesma lógica, substituem “redução de um estado de fome” por “término de um período sem comida”. 60 Um segundo contraponto de Sidman (2006) é que, apesar de haver casos em que a distinção não possa ser feita (e.g., experimento de Weiss e Laties, 2006), isso não torna a distinção inutilizável e pode haver valor em fazer uso dela sempre que for possível. Esse, segundo Sidman, é o caso de muitos outros conceitos em que, quando levados a extremos, também se tornam confusos. Além disso, o autor destaca que mesmo nos casos em que a distinção é confusa, frequentemente há maneiras de se resolver o problema. Por exemplo: a resposta que elimina o choque elétrico também produz um período em que o choque está ausente, mas Sidman (2006) questiona se o rato trabalharia para produzir esse ambiente sem choques quando ele não está em uma situação na qual eles estão presentes. Em outras palavras, “a interrupção do choque vai ser reforçadora mesmo que o ambiente produzido pela resposta de fuga continue mudando” (p. 137). Isso parece ilustrar justamente o argumento anterior de Marr (2006) de que condições pós-mudança seriam irrelevantes no reforçamento negativo. Outro exemplo dado por Sidman é o de uma criança que se comporta para produzir uma sala de time-out quando está sendo requisitada a realizar uma determinada atividade. Nesse caso é fácil identificar se a resposta é mantida pela fuga da demanda ou pela própria sala de time-out. A simples produção de uma aspirina bastaria para reforçar a abertura do frasco, se o comprimido não eliminasse a dor de cabeça? Acho que sabemos o que aconteceria com o consumo de aspirina se enchêssemos os frascos de aspirina com comprimidos de placebo rotulados falsamente (Sidman, 2006, p. 137). Sobre esse último exemplo, ficaria a pergunta: como se explicaria o fato de que uma pessoa ainda se manteria tomando os placebos por um tempo antes de parar, sem classificar as pílulas como reforçadores positivos condicionados? 61 Ainda na mesma linha, Sidman (2006) traz um outro questionamento: “uma criança poderia ligar a televisão mesmo que isso a afastasse de um jogo favorito ou de uma sobremesa muito desejada? Esse evento é certamente possível, e, quando ocorre, seria difícil identificar o reforço como uma fuga do tédio” (Sidman, 2006, p. 137). Nesse exemplo Sidman parece apontar para a noção de que ao se considerar qualquer instância de reforçamento, deve-se considerar tanto a condição anterior quanto a nova. Ele diferencia uma situação em que uma criança, diante de uma condição de tédio, produz o desenho e uma situação em que diante de um jogo que gosta produz o desenho. No primeiro caso, a descrição poderia ser “eliminação do tédio” enquanto, no segundo caso, a eliminação do videogame dificilmente estaria controlando a resposta. Novamente, parece ser o caso de que o uso, por Baron e Galizio (2005), de um termo vago como “tédio” abriu margem para questionamentos que não necessariamente tem relação com o ponto que esses autores pareceram querer fazer. A condição oposta a “programa de TV” não é o tédio, mas sim a “ausência de um programa de TV”. O tédio poderia ser interpretado como uma operação estabelecedora do tipo “privação de atividade”. Seguindo o mesmo modelo da resposta anterior dos autores, o que poderia ter sido dito seria que “a eliminação da ausência do programa de TV” foi reforçadora. Isso, simplesmente, isso é o mesmo que dizer que o programa de TV foi adicionado. Essa outra forma de descrição é certamente estranha e inconveniente, mas ainda assim poderia ser feita. As bases para essa afirmação serão mais bem elaboradas nos tópicos “A Distinção É Semântica” e “A Ausência como Estímulo”. De qualquer forma, Sidman (2006) está correto em pontuar um uso impreciso do termo “tédio”, mas o deslize de Baron e Galizio (2005) não necessariamente anula ambiguidade da distinção positivo/negativo. Em todos os casos, uma condição está sendo subtraída e outra adicionada. É possível que o autor tenha ignorado que duas mudanças 62 ambientais estavam ocorrendo ao mesmo tempo (i.e., eliminação do tédio e adição do desenho) e que cada uma podia ser descrita das duas formas - como mostrou Chase (2006). Sidman (2006) apresenta, então, um último exemplo na mesma linha argumentativa e, em seguida, sua conclusão: Cônjuges geralmente buscam o divórcio independentemente de suas experiências conjugais? Certamente não precisamos de dados experimentais para classificar muitos - senão a maioria - dos divórcios como comportamentos de fuga. A possibilidade e a utilidade de identificar reforçadores positivos e negativos não me parecem tão desanimadoras quanto aparentemente parecem para Baron e Galizio (Sidman, 2006, p. 137). Sidman (1989/2009) menciona o exemplo do divórcio ao falar sobre a utilidade de identificar reforçadores positivos e negativos. Entretanto, essa utilidade não fica nitidamente indicada em sua fala. Divórcios costumam ser situações complexas que envolvem cadeias comportamentais extensas e incontáveis variáveis relevantes que tornam uma afirmação tão abrangente quanto a de que “a maioria dos divórcios ocorrem por reforçamento negativo” pouco relevante. Uma pergunta que deveria ser feita é: qual resposta específica nessa cadeia comportamental extensa se está analisando? As respostas que produziram a certidão de divórcio, uma pensão alimentícia, a atenção de amigose familiares, convites para novos eventos, elogios, um novo amor etc., a princípio, deveriam ser classificadas como reforçamento positivo. Outro ponto é que muitos dos comportamentos emitidos nessa situação jamais foram emitidos ou serão emitidos novamente e foram evocados provavelmente muito por conta de condicionamentos verbais. Sem uma análise da frequência de respostas do que está sendo chamado de “divórcio”, a afirmação acaba tendo pouco valor. Baron e Galizio (2006a) concordam com Sidman que a distinção ainda pode ser feita de maneira relativamente direta em muitos casos e acrescentam o fato de que falar das 63 mudanças em suas versões opostas pode parecer “forçado” (e.g., falar “introdução de um período em que choques estão ausentes” ao invés de “remoção de um choque”). Além disso, concordam com Sidman e Iwata (2006) que a análise empírica dos eventos reforçadores é valiosa. O problema é que, como já foi comentado, em muitos outros exemplos (inclusive alguns apresentados por Sidman como o do divórcio) a distinção é muito menos nítida. Ainda assim, o que Baron e Galizio questionam é que, mesmo que a distinção possa ser feita, no que ela acrescenta em uma análise comportamental? Sugerem que, nesse sentido, pode haver mais a ser ganho ao se focar no contexto total da mudança de estímulo (como sugerido por Michael, 1975). Em resposta ao exemplo do dinheiro apresentado por Baron e Galizio (2006), Sidman (2006) afirma que apesar de o “término de um período sem dinheiro” ser fundamental para estabelecer o dinheiro como reforçador em alguns casos, bilionários (mesmo sem estarem “privados” de dinheiro) continuam “trabalhando vigorosamente para conseguir mais”. A partir desse exemplo, Sidman (2006) conclui que “a efetividade de alguns reforçadores positivos depende menos da sua ausência anterior do que do comportamento que eles tornam possível no futuro” (p. 137). Esse ponto será retomado na discussão sobre “Implicações Sobre o Conceito de Operação Motivadora”. Novamente, parece que um mau uso de termos gerou um conflito desnecessário. Se Baron e Galizio (2005), ao invés do termo “término de um período sem dinheiro”, tivessem sido mais abrangentes e dito “término de um período de menos dinheiro” ou, ainda melhor, tivessem descrito especificamente a quantidade de dinheiro pré e pós-mudança (seguindo a recomendação de Michael, 1975) o contra-argumento de Sidman teria pouca base. Reformulando o ponto dos autores: “um período de menor dinheiro” é sempre, inevitavelmente, interrompido pela adição do dinheiro. 64 Nakajima (2006) também apresentou alguns argumentos contrários aos de Baron e Galizio (2006). Primeiro, sobre a ambiguidade calor/frio ilustrada pelo experimento de Weiss e Laties (1961), Nakajima afirma ter uma preferência pela descrição de que “calor foi adicionado” porque, segundo ele, “calor é uma entidade física no ambiente do rato, mas ‘frieza’ é um estado hipotético do rato e um conceito secundário que significa ‘ausência de calor’” (p. 269). Isso poderia dar a entender que, para Nakajima, o frio não seria um estímulo. Na física, é consenso que o calor (bem como a luz) sejam fenômenos materiais e que a frieza e o escuro não. Entretanto, comportamentalmente, essa distinção talvez tenha pouca relevância. Enquanto um evento ambiental que afeta o comportamento, o calor é capaz de eliciar e evocar respostas (e.g., sudorese ou abanar-se). Da mesma forma, o frio também tem a capacidade de tanto eliciar e evocar comportamentos (e.g., tremores e arrepios ou aproximar- se de uma lareira) e, nesse sentido, ele também deve ser considerado um estímulo. Não seria inviável abandonar a palavra “frio” e passar apenas a falar apenas de “calor”, “ausência de calor” e “privação de calor”. Ainda assim, nesse caso, a “ausência de calor” teria que passar a ser tratada como um estímulo que elicia e evoca as respostas mencionadas. Do contrário, ter-se-ia que assumir que o calor estaria de alguma forma prevenindo essas respostas de acontecerem (o que seria inconveniente e supostivo). Outro ponto é que, a “frieza”, como apontado por Nakajima (2006) não simplesmente um “estado hipotético” do rato, afinal, a temperatura dele pode ser facilmente medida. De todo modo, a “frieza do rato” sequer era a variável relevante para o experimento de Weiss e Laties (1961), mas sim a “frieza” da caixa experimental (um estímulo público e mensurável). De forma muito similar a Sidman (2006), Nakajima (2006) acusou Baron e Galizio (2005) de reconhecerem o ponto de que se deve focar nas mudanças ambientais, mas que eles negligenciam esse ponto. Mais especificamente, eles negligenciam os “critérios de julgamento que distinguem a especulação e a identificação” (p. 269). Para o autor, quando um rato 65 pressiona uma barra para obter uma pelota de comida, a pelota de comida é quantificável e manipulável, mas a fome seria uma construção hipotética. Similarmente, o dinheiro seria um material concreto, mas a pobreza um conceito derivado. O desenho animado é observável, mas o tédio não é observável e, mesmo que exista, pode ser interrompido por outros programas de TV. Por fim, um choque é manipulável, mas os estímulos ligados a segurança são mais difíceis de identificar com precisão. Baron e Galizio (2006b) respondem Nakajima (2006) concordando que o desejável (e usual) é focar em consequências diretamente observáveis, mas reafirmam que seu ponto é que isso não é justificativa para se criar uma classificação com base no critério de início ou término de estímulos. A ambiguidade, segundo eles, se aplica a qualquer mudança ambiental (independentemente de ser observável ou não) porque a adição de um estímulo sempre exige sua ausência prévia e a remoção de um estímulo sempre exige sua presença posterior. Eles destacam também Nakajima pareceu ter ignorado o exemplo da aspirina apresentado por eles. Segundo a lógica de Nakajima, essa situação deveria ser classificada necessariamente como reforçamento positivo, porque a operação observável e mensurável seria a adição da aspirina, enquanto a eliminação da dor de cabeça seria uma “consequência especulativa”. Complementando esse ponto de Baron e Galizio (2006a), se, mais uma vez, forem trocados os termos vagos como “fome”, “tédio” e “período de segurança” usados por eles por “ausência do alimento”, “ausência do desenho” e “ausência de choque” seria difícil argumentar que a ausência do estímulo não pudesse ser observada ou medida. Até mesmo o período pelo qual os estímulos estiveram ausentes pode ser medido em segundos, horas ou dias. Além desse ponto, Baron e Galizio (2006b) complementam que o critério de se basear na facilidade de um pesquisador observar ou descrever um fenômeno é limitado no sentido de que é determinado excessivamente pelos recursos que um pesquisador específico detém 66 naquele momento específico. Para Baron e Galizio, o avanço tecnológico da ciência vai contra essa ideia no sentido de que novas formas de se medir e observar fenômenos passam a se tornar possíveis. Para Baron e Galizio, as “consequências especulativas” descartadas por Nakajima (2006) podem também representar a solução para o problema da distinção. Os valor de reforçadores condicionados, por exemplo não dependem somente dos eventos imediatamente contingentes a eles. Sabe-se que os reforçadores de base (ou condicionantes) são pelo menos um dos responsáveis por determinar se estímulos condicionados serão reforçadores positivos ou negativos. Além disso, há motivos para acreditar que os estímulos que sinalizam períodos sem choque, por exemplo, é que reforçam o comportamento (Dinsmoor, 2001). Staats (2006) afirma que apesar de o efeito dos dois reforçamentos sobre o comportamento serem os mesmos, Baron e Galizio (2005) ignoraram o condicionamento respondente e emocional envolvido e o efeito sobre outroscomportamentos além do reforçado. Segundo o autor, quando todo o reportório (operante, respondente e emocional) é levado em consideração, os reforçadores positivos e negativos apresentam grandes diferenças. O autor exemplifica que, enquanto reforçadores negativos “fazem” o animal ser condicionado a uma resposta emocional negativa em relação a uma caixa experimental, os reforçadores positivos “fazem” o animal ser condicionado a uma resposta emocional positiva em relação à caixa. O autor ilustra que se os ratos fossem colocados em uma caixa inicial com a possibilidade de se locomover para a caixa em que foram treinados, um rato que foi treinado por reforçamento negativo ficariam na caixa inicial, enquanto um rato foi treinado sob reforçamento negativo andaria até a caixa experimental. Da mesma forma, crianças reforçadas por se portar bem e crianças punidas por não se portar bem poderiam ambas aprender a se portar, mas também aprenderiam respostas emocionais diferentes que afetariam seu 67 comportamento em relação à escola. Staats (2006) cita alguns de seus trabalhos que ilustram tais efeitos (ver Harms & Staats, 1978; Staats, 1975, 1996; Staats & Hammond, 1972; Staats & Warren, 1974). Sobre isso, Baron e Galizio (2006b) respondem Staats (2006) dizendo que, não há consenso sobre o que seria a emoção ou como medi-la, e citam Rosenberg e Ekman (2000) e um próprio trabalho de Staats e Eifert (1990) para embasar essa afirmação. Baron e Galizio criticam a pressuposição de Staats de que seja possível separar claramente os “estados emocionais” em uma classe positiva e outra negativa para, a partir disso, classificar também os comportamentos operantes. Segundo eles, mesmo através de referências a estados emocionais, o problema lógico apontando por Michael (1975) ainda não é resolvido. Seria perfeitamente possível descrever o “estado emocional” de um rato privado de alimento como negativo. Nesse caso, o comportamento é controlado pelo término do estado emocional negativo, pelo início do estado emocional positivo ou por ambos? Baron e Galizio (2006b) citam dois experimentos que ilustram como a reação entre as dicotomias aproximação/evitação e positivo/negativo é confusa. Perone (2003) demonstrou que um pombo pode emitir uma segunda resposta para suspender um esquema de reforçamento positivo em razão fixa. Ao mesmo tempo, num esquema de reforçamento negativo, Perone e Galizio (1987) demonstraram que ratos também podem passar a emitir uma outra resposta que produza o estímulo que acompanhava o período no qual o choque estava suspenso. Sobre o exemplo experimental hipotético de Staats (2006), Baron e Galizio (2006b) argumentam que o que foi explicado pelo autor em termos de respostas e condicionamentos emocionais poderia ser facilmente explicado por condicionamento operante. Ao mesmo tempo, num experimento que comparasse duas caixas experimentais, uma com reforçamento 68 em VI 10s e outra em VI 30s, o critério de Staats ditaria que o deslocamento da segunda caixa para a primeira implicaria que a primeira envolveria reforçamento (e emoções) negativos. Os próprios autores reconhecem que seu argumento é frágil porque, diferentemente do exemplo de Staats (2006), as caixas não estão sendo comparadas com uma condição “neutra”. Ainda assim, eles apelam para a noção de que o critério de aproximação/afastamento é insuficiente e questionam se comparações com uma condição neutra podem responder isso. A Distinção É Limitada Limita-se em Casos Complexos/Humanos. Além do exemplo do experimento de Weiss e Laties (2006) apresentado por Baron e Galizio (2005) para mostrar a dificuldade de classificar alguns casos como reforçamento positivo ou negativo, Michael (2006) formula um experimento hipotético para ilustrar isso em outro sentido. Um rato privado de alimento é exposto a duas condições experimentais: na primeira condição, um tom está em vigor e há uma maior frequência na liberação de alimento e menor frequência na liberação de choques (Michael não menciona respostas as quais alimento e choque seriam contingentes nesse experimento hipotético. Esse aspecto será especificamente comentado na discussão geral do presente trabalho). Na segunda condição, sem tom, a frequência dos choques é maior e a de alimento é menor. Diante disso, Michael supõe que a mudança de uma condição para a outra seria reforçadora, mas esse reforçamento deveria ser classificado como reforçamento positivo ou negativo? Inversamente, uma mudança da primeira condição para a segunda provavelmente seria punitiva. Isso deveria ser considerado punição positiva ou negativa? Classificar a mudança como positiva ou negativa pensando no reforçador de base (i.e., condicionante) seria difícil porque tanto o alimento (positivo) quanto o choque (negativo) parecem cumprir esse papel. Ao mesmo tempo, classificar a mudança com base na apresentação ou retirada do tom também faria pouco sentido já que a atribuição do tom/silêncio a cada condição foi completamente arbitrária e poderia ser invertida. Logo, 69 Michael (2006) afirma que a distinção parece não se aplicar a casos complexos envolvendo reforçadores condicionados aos dois tipos de estímulo. Seguindo a mesma lógica, Michael (2006) complementa que, partindo da noção de que casos complexos como o do exemplo citado são universalmente humanos, o uso da distinção como um todo torna-se inútil. Em outras palavras, se a distinção só se aplica a casos não-humanos, dentro de uma ciência que busca, em última análise, modificar o comportamento humano, a distinção não serve para nada. Baron e Galizio (2006a) apontam para a existência desse nó na área a respeito de se deve-se focar valor do reforçador de base para determinar o valor de um estímulo condicionado ou na sua adição/subtração. Em sua resposta, os autores oferecem outros complementos para apoiar este ponto de Michael (2006). Primeiramente, eles citam que na literatura sobre reforçamento luminoso/sensorial, era costumeiro que o aumento na frequência de uma resposta causado tanto por um aumento na intensidade de uma luz quanto por sua diminuição era classificado como reforçamento positivo. E que, por razões desconhecidas, classificações com base na direção da mudança foram abandonadas em favor de falar da mudança de estímulo em si como reforçadora. Como outros exemplos do ponto de Michael (2006), Baron e Galizio (2006a) citam Verhave (1962) que nomeou os "time-outs" de um esquema de esquiva que eram acompanhados pela introdução de um tom como "reforçamento positivo"; e Perone e Galizio (1987), entre outros, que nomearam os "time-outs" indicados pela interrupção de um tom como reforçamento negativo. Segundo Michael, escolher o tom ou o silêncio como estímulos condicionados é uma decisão arbitrária, e uma classificação em termos de positivo/negativo, além de forçada, nada acrescentaria. Limita-se a Operações com Início ou Término Definidos. Outro problema apontado por Baron e Galizio (2006a) ligado à manutenção da distinção é que há operações que não 70 podem facilmente ser identificadas como “introdução” ou “término” porque se trata de mudanças nas intensidades dos estímulos em um contínuo. Nesse momento do texto de onde essa fala foi retirada os autores não elaboram mais o seu ponto. Ainda assim, vale retomar que esse ponto já havia sido respondido por Iwata (2006): “as mudanças ainda envolvem ou um aumento ou uma diminuição de alguma característica do estímulo” (p. 122). A dificuldade de se classificar contingências de reforçamento entre positivas ou negativas nada tem a ver com se as mudanças são totais ou parciais. Se a remoção de um choque é reforçadora negativa, uma diminuição suficiente na sua intensidade também será. É claro que diminuições muito pequenas na intensidade de um choque, tal como a remoção de um choque muito leve, podem não sercapazes de manter determinada resposta. Ainda assim, em nenhum momento faria sentido considerar que se está falando de reforçamento positivo. De uma forma ou de outra, apresentações e remoções também podem ser consideradas alterações na intensidade de estímulos cuja intensidade do estímulo em uma das condições seja zero. Millenson (1967/1975) já havia apontado para o fato de que mudanças na intensidade de um estímulo poderiam se configurar como reforçamento – mesmo que ele tivesse feito essa ressalva apenas para o reforçamento negativo. A Distinção Não Tem Fundamentação Experimental Suficiente Lattal e Lattal (2006) apresentaram uma crítica à forma como a distinção foi adotada na análise do comportamento. Nesta área (assim como em outras ciências) assume-se a hipótese nula: uma variável presumivelmente não tem efeito até que se prove o contrário. Essa é a base da comparação entre a linha de base e outras condições experimentais. Nesse sentido, sem evidências concretas que sustentassem uma distinção entre os reforçamentos positivo e negativo, nunca dever-se-ia ter assumido que a distinção existia. Ao contrário, a hipótese nula foi rejeitada e a distinção foi assumida sem provas empíricas. 71 Perone, Galizio e Baron (1988) destacaram diversas questões metodológicos entre experimentos, envolvendo tanto humanos quanto animais, que tornam difícil a sua comparação. Lattal e Lattal (2006) acreditam que esses conflitos poderiam ser extrapolados para a comparação entre os reforçamentos positivo e negativo. Em outras palavras, as diferenças entre os delineamentos experimentais que envolvem reforçamento negativo ou positivo são grandes o suficiente para se atribuir qualquer resultado a diferenças na adição ou remoção de estímulos. Segundo Lattal e Lattal (2006), os que chegaram mais perto de comparar empiricamente o reforçamento positivo e negativo, segundo Lattal e Lattal (2006), foram Dinsmoor (1962) e Azrin et al. (1963) que delinearam esquemas de fuga de forma similar a esquemas usados em experimentos que usam comida como reforçador. apresentam ainda dois dados experimentais para embasar o seu ponto. Azrin et al. (1963) concluíram que, para macacos-de-cheiro, que a forma pela qual as respostas são adquiridas e mantidas em um esquema de razão fixa de fuga e em um esquema de razão fixa por alimento são similares. Dinsmoor (1962) notou especificidades do uso de choques em esquemas de reforçamento de intervalo variável. Entretanto, para os autores, nenhuma conclusão pode ser tirada disso, já que não se tem como afirmar que a particularidade se dá à diferença entre os dois tipos de reforçamento e não sobre diferenças entre os choques e reforçadores alimentares especificamente. Mais adiante em seu texto, Lattal e Lattal (2006) retomam que a distinção foi assumida sem evidências suficientes que mostrem a existência de diferenças funcionais entre os reforçamentos positivo e negativo. Faz Perder o Foco nas Operações Baron e Galizio (2006a) retomam o exemplo da aspirina (classificada como reforçamento negativo apesar da adição da aspirina) para ressaltar que o problema da 72 distinção reside nos casos em que se favorece fazer a distinção a despeito das operações envolvidas. Em outro comentário sobre a distinção, retomam o alerta de Michael (1975): “atrapalha uma descrição mais completa das condições anteriores e posteriores à mudança” (p. 41). Sobre isso, vale comentar que uma pessoa pode realizar uma má descrição de uma contingência que ela classificou como reforçamento negativo, mas nada garante que a descrição não seria malfeita mesmo na ausência dessa classificação. Isso remete mais a uma correlação do que a uma causalidade, já que, dado que fazer a distinção é o mais comum, acaba que é mais comum que as imprecisões sejam acompanhadas de distinções. Querendo ou não, na ausência de descrições mais precisas, a pessoa ter dito que se tratava de reforçamento negativo pode sim servir como informação adicional. Por exemplo: se a descrição fosse que a adição de uma pelota de alimento provocou um aumento da resposta que a produziu, nenhuma informação seria acrescentado ao classificar essa mudança como positiva. Ao mesmo tempo, se a descrição fosse que uma “atividade” funcionava como reforçador em contingências de reforçamento negativo” poder-se-ia supor que o procedimento envolvia a retirada da atividade, indicando que ela era aversiva (e não reforçadora) em relação a uma outra condição. Pode Gerar Caracterizações Prematuras ou Enganosas Baron e Galizio (2006a) alertam que apesar da utilidade aparente da distinção, ela pode resultar em caracterizações prematuras ou até mesmo enganosas sobre o processo de reforçamento. Em outro trecho, comentam que se basear na distinção entre adição e subtração pode levar a equívocos especialmente quando se fala de comportamentos complexos ou quando decisões éticas são tomadas em nome dessa distinção. 73 Seu Uso Gera Contradições Baron e Galizio (2006b) afirmam que um uso rígido da distinção aplicado a uma gama variada de casos rapidamente fará um indivíduo se deparar com contradições. Por exemplo: ao seguir a proposição de Nakajima (2006) de se basear nos estímulos observáveis e mensuráveis para definir o que é reforçamento positivo ou negativo, uma pessoa deveria classificar “tomar uma aspirina” necessariamente como reforçamento positivo. Em outro sentido, um estímulo condicionado que indica o recebimento de dinheiro para um participante humano poderia ser tanto uma luz acendendo quanto uma luz apagando. Com esse exemplo, Baron e Galizio se referem a noção de que o valor de um reforçador condicionado não deveria ser inferido pela sua apresentação ou remoção já que ele ela foi arbitrariamente estabelecida. Inviabiliza a Recomendação de Práticas Específicas Michael (2006) apresenta uma afirmação de Geller (2004) em que o autor admitiu ter usado os termos “positivo” e “negativo” como sinônimos de “prazeroso” e “desprazeroso” em Weigand e Geller (2005), mas que sabia que os termos estão ligados às noções de “apresentação” e “remoção”. Isso foi feito em um contexto em que ele estaria incitando analistas do comportamento a usarem intervenções comportamentais “positivas”. Esse dado é apresentado por Michael (2006) para reiterar um ponto originalmente feito por ele em seu texto original (Michael, 1975) de que se a distinção entre os reforçamentos positivo e negativo não é clara, haverá dificuldades em se seguir a recomendação de usar um ao invés do outro. Vantagens da Manutenção Falas em que os autores apontaram benefícios relacionados ao uso da distinção entre os reforçamentos positivo e negativo. Dentre os trechos classificados como “Vantagens da Manutenção”, identificou-se falas que apontavam para a distinção como tendo uma função prática, comunicativa, cultural ou apenas sendo útil. 74 A Distinção Tem Função Prática Ajuda no Ensino de análise do comportamento. Para Chase (2006), a distinção, especialmente quando usada por professores de análise do comportamento em exemplos, faz com que os alunos foquem em análises detalhadas dos tipos de variáveis que podem controlar comportamentos. Segundo o autor, descrever que, dentre as consequências que aumentam comportamento, algumas delas envolvem a “remoção de uma consequência” e outros a “adição de uma consequência” ilustra: o foco nas variáveis ambientais, mudanças ao longo do tempo, distinção entre ambiente e comportamento e distinção entre variáveis observáveis e não observáveis. Isso, por conseguinte, ensinaria os alunos a como examinar comportamentos como um behaviorista. Assim como foi argumentado que a distinção positivo/negativo não necessariamente prejudica uma descrição precisa de uma contingência, algo similar pode ser dito no sentido contrário. Chase (2006), parece ter observado uma correlaçãoentre o ensino da análise do comportamento e o que é aprendido. De fato, é costumeiro ensinar a distinção entre os reforçamentos positivo e negativo e apresentar exemplos que, justamente, envolvam a distinção. Também é verdade que pelo menos parte dos alunos aprendam a analisar comportamentos de forma detalhada. Ainda assim, não se pode ter certeza de que a distinção tenha alguma responsabilidade nesse efeito. É possível até que os alunos estivessem aprendendo a analisar comportamentos apesar de a distinção estar os confundindo além do necessário. Michael (1975), por exemplo, afirmou não ter tido problemas ao ter deixado de usar os termos positivo/negativo no ensino dos termos. Ajuda a Isolar Mudanças que Controlam o Comportamento. Outra vantagem da manutenção da distinção apresentada por Chase (2006) está relacionada a um contra- argumento já apresentado no subtópico “A Distinção É Ambígua”. O argumento é que, para Chase, a distinção ajuda a identificar quais as mudanças nas contingências que de fato geram 75 mudanças comportamentais. Tomando como exemplo o caso da criança que emite poucos mandos e muitos comportamentos autolesivos: o valor da distinção, nesse caso, seria o de notar dois tipos diferentes de manutenção (i.e., aumento da atenção para mandos e da restrição física para comportamentos autolesivos) poderiam ambos gerar um aumento na emissão de mandos - um por reforçamento positivo e o outro por reforçamento negativo. É claro que, saber que a resposta gera duas mudanças ambientais e saber qual das mudanças ambientais (ou se se são as duas) que mantém o comportamento é muito importante. Ainda assim, não fica justificado, pela fala de Chase (2006), como dar rótulos para as mudanças ajuda nessa distinção. Simplesmente chamar uma de “positiva” e a outra de “negativa” as tornaria mais distinguíveis? Mas como as mudanças estariam sendo nomeadas antes de serem percebidas? Se já haviam sido percebidas, elas já estavam discriminadas, não precisaria da classificação para isso. O mesmo se aplicaria se duas mudanças classificadas como negativas tivessem sido notadas. Assumindo essa noção de Chase: se fossem duas mudanças “positivas” (e.g., adição de atenção e acesso a brinquedos) a distinção não ajudaria nesse caso? Ela atrapalharia no sentido de pensar que a adição de atenção e acesso a brinquedos são a mesma coisa? E no caso de duas mudanças “negativas” (e.g., subtração de uma bronca e subtração de uma demanda)? Seria difícil perceber que são coisas diferentes? Nesse sentido a presente vantagem da distinção depende de se ela ajuda a distinguir ou não reforçadores distintos. Sobre isso, seria possível argumentar que quem descreveu as mudanças ambientais como “aumento da atenção” ou a “retirada das restrições físicas” já estivesse sob controle das duas mudanças ambientais diferentes. E mesmo que a descrição pudesse ajudasse a notar as mudanças, é difícil pensar que nomear cada uma das descrições como positivas ou negativas acrescentaria algo a mais. Tomando o exemplo do “aumento do calor” e da “redução do frio”. Nesse caso, achar que “adições” e “subtrações” são coisas diferentes poderia levar alguém a pensar que duas 76 mudanças estão acontecendo, mas esse não seria o caso. Ambas as descrições representam diferentes formas de descrever uma mesma mudança. Duas mudanças parecem ser distinguíveis porque são mudanças diferentes, não porque uma é positiva e outra é negativa. De todo modo, para que qualquer afirmação possa ser feita, seria necessária uma pesquisa que comparasse o ensino de análise de contingências com a distinção e sem a distinção que pudesse mostrar se as vantagens didáticas apontadas se verificam. Aponta para Outras Possibilidades de Intervenção. Iwata (2006), em seu tópico “Identificar a diferença crítica entre as condições de reforçamento pré e pós-mudança facilita o desenvolvimento de contingências efetivas” (p. 122), segue uma direção muito parecida com Chase (2006) em seu argumento anterior. Para tal, ele cita Osborne (1969) em um exemplo de contingências de tempo livre, nas quais comportamentos podem ser mantidos tanto pela eliminação de demandas como acesso a atividades específicas. No primeiro caso, o que seria oferecido à criança durante o tempo livre não faria diferença, enquanto, no segundo, se esperaria que a eliminação da demanda tivesse pouco efeito terapêutico. Nesse sentido, Iwata (2006) destaca que a distinção ajuda a 1) identificar situações nas quais a adição de um reforçador positivo específico seria ou não efetiva como reforçador, 2) examinar efeitos do tipo oposto de mudança de estímulo, 3) identificar outras mudanças de estímulo que teriam o mesmo efeito que a apresentação ou retirada de determinado estímulo e 4) determinar como implementar a extinção. Para exemplificar seu último tópico, Iwata menciona que, no caso de a eliminação de uma demanda servir como reforçamento, a extinção deve ser manter a demanda. Baron e Galizio (2006a) respondem Iwata (2006) dizendo que mesmo quando a operação do experimentador é de término ou adição não fica explicado porque rotular os estímulos como positivos ou negativos pode ser útil. Os autores, então, resgatam a falta de um critério nítido para se classificar um reforçador condicionado: se, no exemplo de Iwata, o 77 acesso ao tempo livre fosse indicado por uma luz acendendo ou apagando, dever-se-ia variar a classificação da mudança como positiva ou negativa? Naturalmente, as mesmas questões já levantadas para o argumento de Chase (2006) poderiam ser feitas a Iwata (2006). De que forma rotular mudanças ambientais como positivas ou negativas contribui para essas vantagens? Em ordem, poder-se-ia responder: 1) operações motivadoras continuam podendo ser identificadas, 2) o efeito do tipo oposto de estímulo seria a diminuição da resposta (direta ou indireta), 3) qualquer mudança reforçadora teria o mesmo efeito (aumento na probabilidade) e qualquer mudança punidora teria o efeito oposto (diminuição na probabilidade/supressão), e 4) a extinção seria implementada mantendo-se a condição antecedente a despeito da resposta. Um ponto a se destacar é que Iwata (2006), no início deste mesmo tópico introduz as vantagens dizendo que “algo pode ser ganho ao identificar a natureza da mudança de estímulo” (p. 122). Porém, ainda na mesma lista, ao citar o último ganho, ele diz: “por fim, identificar a mudança de estímulo que serve como reforçamento pode ser útil em determinar como melhor implementar a extinção” (p. 122). Isso pode sugerir que Iwata esteja partindo do pressuposto que “identificar a direção da mudança reforçadora” seja equivalente a “identificar a mudança reforçadora” – algo que também parece ficar subentendido em seu exemplo. Isso faz retomar todos os questionamentos do tópico anterior. Por conta de como a análise do comportamento é ensinada, fica estabelecida correlação entre o ensino e utilização de uma classificação e a capacidade de distinguir diferentes mudanças ambientais que podem ou não estar controlando um comportamento operante. Ainda assim, a afirmação de que a distinção positivo/negativo ajuda a distinguir diferentes mudanças ambientais simplesmente não pode ser feita porque isso não foi testado. Precisariam ser comparados os ensinos que usam e não usam a distinção para verificar seus desempenhos na identificação de mudanças ambientais. 78 De todo modo, pode-se pensar, pelo menos, que há ganhos (mencionados por Iwata, 2006) em diferenciar mudanças ambientais distintas e identificar qual (ou quais) delas estão controlando determinado comportamento. Se o rótulo positivo ou negativo ajuda ou não nisso precisaria ser investigado. A Distinção Tem Função Comunicativa Descrever Mais Facilmente a Mudança. Chase (2006) apresentou como outra vantagem da manutenção da distinção o fato de que, por vezes,é mais fácil descrever uma situação de uma forma do que de outra. Ele ilustra isso com os exemplos “aumentar atenção” x “diminuir períodos de não atenção” e “receber dinheiro” ao invés de “evitar períodos sem dinheiro”. Esse ponto não é respondido diretamente, mas no subtítulo “Esclarecimentos”, será apresentada a posição de Baron e Galizio (2006a) quanto a isso. A Distinção Tem Função Social Ampliar a Aceitação da análise do comportamento. Segundo Lattal e Lattal (2006), o ambiente cultural como um todo atribui valor moral a circunstâncias interpretadas como positivas ou negativas. Dessa forma, apesar de concordarem que a distinção é problemática, eles afirmam que o seu uso acaba tendo a função social de ampliar a aceitação da análise do comportamento, em especial, ao se adotar a linguagem do reforçamento positivo. Dessa forma, seria possível mudar vieses associados a área principalmente quanto a termos como “coerção” e “manipulação”. Segundo eles: Programas comportamentais baseados no que se descreve como "reforçamento positivo" podem não ser diferentes nem mais eficazes sobre o comportamento-alvo do que aqueles baseados em "reforçamento negativo", mas os primeiros têm mais probabilidade de serem aceitos, implementados e mantidos (por exemplo, Daniels, 2000; Iwata & Bailey, 1974). (Lattal & Lattal, 2006, p. 132) 79 Sobre isso, Baron e Galizio (2006a) responderam a Lattal e Lattal (2006) dizendo que se analistas do comportamento passassem a falar de forma diferente entre si e com um público cada vez mais imerso na área, uma má impressão e acusações de cinismo poderiam surgir. Além disso, decisões judiciais já foram tomadas para impedir intervenções que se baseassem na retenção de bens e serviços a pacientes psiquiátricos para que pudessem ser apresentados de forma contingente. Isso mostra, segundo eles, que enfatizar que um procedimento envolve reforçamento positivo não basta. A Distinção Já Gerou uma Grande Quantidade de Pesquisas Iwata (2006) cita como uma outra vantagem da manutenção da distinção o fato de que ela gerou uma grande quantidade de pesquisas sobre as similaridades e diferenças entre a performance entre os dois tipos de reforçamento. O autor não desenvolve mais o seu ponto, então não dá para ter certeza de qual seria o benefício disso para ele. Se a vantagem for que a distinção estimulou, puramente, a realização de pesquisas, uma reposta a isso poderia ser que, se a distinção não faz sentido, esses esforços poderiam ter sido dedicados a outras investigações e, nesse sentido, a distinção teria sido prejudicial. Outra possibilidade é que investigações a respeito da distinção talvez estejam sendo úteis para revelar lacunas em outras definições como reforçamento, estímulo, operações motivadoras etc. Nesse sentido, seria possível supor que se essa discussão não tivesse surgido, essas lacunas não teriam sido (ou demorariam mais para serem) percebidas – o que favoreceria o argumento de que a distinção foi vantajosa. Como especialmente apontado nos estudos de Magoon e Critchfield (2008) e Magoon et al. (2017), muito do que as pesquisas já consideraram em termos de performance diferencial dos comportamentos controlados por reforçamento positivo e negativo pode ser explicado em termos de diferenças procedimentais. O fato de os dois tipos de reforçamento 80 não serem tão comumente estudados juntos e de maneiras simétricas pode ter enviesado os resultados das pesquisas na formulação dos conceitos e na manutenção da distinção. Influenciadas pelo debate proposto por Michael (1975), pesquisas experimentais buscaram estudar o reforçamento negativo, seja programando-o da mesma forma em que reforçamento positivo costuma ser programado experimentalmente (como em Perone & Galizio, 1987), seja tornando as contingência de reforçamento positivo e negativo estudadas o mais simétrica possíveis (como em Magoon & Critchfield, 2008 e Magoon et al., 2017). Explicações para a Manutenção Falas em que os autores apresentaram motivos pelos quais a distinção entre os reforçamentos positivo e negativo vem sendo mantida. Em sua maioria, explicações foram apresentadas por autores contra a distinção ou incertos quanto a ela, em seções específicas dedicadas a especular as razões pelas quais a distinção foi mantida. Dentre os trechos classificados como “Explicações para a Manutenção”, identificou-se falas que apontavam que apontavam distinção havia sido mantida por conta de alguma função específica (i.e., prática, comunicativa, cultural ou social) ou então que ela estava sob controle antecedente de algum outro elemento que não a adição/subtração. A Distinção Pode Ser Útil Útil no Ensino de Análise do Comportamento. Chase (2006) sugeriu que um motivo pelo qual a distinção pode ter sido mantida é que ensinar a distinção talvez tivesse tido alguma função útil. Para ele, um indício disso era que, Keller e Shoenfeld (1950), que propuseram a distinção inicialmente, eram ótimos professores. Útil como nas Operações Motivadoras. Para Iwata (2006), avanços recentes na área de operações motivadoras sugerem que diferenças terminológicas arbitrárias possam ser úteis de alguma forma. Iwata não elabora profundamente esse ponto, apenas usa como base o fato de que fora sugerido o termo operações motivadoras (OM) para incluir tanto operações 81 estabelecedoras (OEs) como operações abolidoras (OAs), e que essa distinção pode ser útil tal como a distinção positivo/negativo. Útil para Permitir que se Navegue pela Área. Baron e Galizio (2005) apontaram que a distinção está tão incorporada nas discussões sobre comportamento operante que é possível que a distinção tivesse passado a ser necessária para que se pudesse navegar pela literatura. Lattal e Lattal (2006) concordaram diretamente com essa função da distinção. Útil para Distinguir Dois Reforçadores para uma Mesma Resposta. Baron e Galizio (2005) citam dois exemplos de analistas do comportamento que usaram a distinção positivo/negativo para distinguir casos em que uma resposta era mantida por diferentes formas de reforçamento. O primeiro foi o próprio Iwata et al. (1994) que usou os termos para distinguir comportamentos autolesivos mantidos por fuga de demanda ou acesso à atenção etc. Sobre isso, é melhor falar da consequência como aumento da atenção ou alívio da solidão? É melhor falar sobre fuga de uma tarefa aversiva ou acesso a uma atividade alternativa? Para Baron e Galizio, qualquer uma das descrições parece apropriada. Nakajima (2006) afirma discordar dessa noção apresentada por Baron e Galizio (2005). Para ele, o alívio da solidão é uma afirmação especulativa que depende de uma inferência sobre um estado da pessoa. A fuga de uma tarefa também não pode ser facilmente comparada ao simples “acesso a uma atividade” se ela não for claramente identificada. Nakajima (2006) apontou para dois problemas nos exemplos de Baron e Galizio (2005) que levam a se considerar o quanto eles foram capazes de adotar a própria perspectiva proposta por eles. No primeiro caso, o problema mais evidente é que para qualquer definição de tédio que se adote, tédio e atenção dificilmente seriam considerados opostos. No segundo caso, o problema é mais grave porque Baron e Galizio parecem não ter notado que a o exemplo de Iwata et al. (1994) aponta justamente que duas mudanças estão sendo produzidas pela mesma resposta - a dúvida é sobre qual dessas duas é a mudança reforçadora. Nesse 82 sentido, dizer que “remoção da tarefa” e “produção de uma atividade alternativa” são equivalentes está errado. A resposta pode estar sendo mantida tanto por uma quanto pela outra mudança. Com base principalmente em seus desenvolvimentos posteriores (i.e., Baron e Galizio, 2006a, 2006b), a forma correta de descrever a ambiguidade, nesses exemplos, seria contrastar a “produção de atenção” com a16 Reforçamentos Positivo e Negativo ................................................................................. 17 Reforçadores Positivos e Negativos ................................................................................. 18 Existe Diferença Entre os Reforçamentos Positivo e Negativo? ....................................... 20 O Impacto de Michael (1975) .......................................................................................... 26 Método ................................................................................................................................ 45 Seleção dos Textos .......................................................................................................... 45 Procedimento de Grifo dos Textos ................................................................................... 45 Procedimento de Tabulação dos Dados ............................................................................ 47 Resultados e Discussão ........................................................................................................ 50 Problemas da Manutenção ............................................................................................... 52 A Distinção É Confusa ............................................................................................. 52 A Distinção É Ambígua ............................................................................................ 54 A Distinção É Limitada ............................................................................................ 68 A Distinção Não Tem Fundamentação Experimental Suficiente ............................... 70 Faz Perder o Foco nas Operações ............................................................................. 71 9 Pode Gerar Caracterizações Prematuras ou Enganosas .............................................. 72 Seu Uso Gera Contradições ...................................................................................... 73 Inviabiliza a Recomendação de Práticas Específicas ................................................. 73 Vantagens da Manutenção ............................................................................................... 73 A Distinção Tem Função Prática .............................................................................. 74 A Distinção Tem Função Comunicativa ................................................................... 78 A Distinção Tem Função Social ............................................................................... 78 A Distinção Já Gerou uma Grande Quantidade de Pesquisas..................................... 79 Explicações para a Manutenção ....................................................................................... 80 A Distinção Pode Ser Útil ......................................................................................... 80 A Distinção Tem Função Comunicativa ................................................................... 83 A Distinção Tem Função Cultural ............................................................................ 84 A Distinção se Dá por Outro Aspecto ....................................................................... 88 Sugestões para a Manutenção .......................................................................................... 98 Rever os Termos Usados .......................................................................................... 98 Manter a Distinção com Ressalvas ............................................................................ 99 Fazer Mais Investigações ........................................................................................ 100 Vantagens do Abandono ................................................................................................ 101 Gera Menos Distorções .......................................................................................... 101 Melhora a Descrição das Mudanças ........................................................................ 101 Distinguir Dois Reforçadores para a Mesma Resposta ............................................ 102 10 Explicações para o Abandono ........................................................................................ 103 A Distinção é Mal-entendida .................................................................................. 103 A Distinção Não É Mais Útil .................................................................................. 104 Sugestões para o Abandono ........................................................................................... 104 Mudar os Termos Usados ....................................................................................... 105 Abandonar a Distinção por Completo ..................................................................... 106 Assumir Simetria Entre os Reforçamentos .............................................................. 108 Sugestões Neutras ......................................................................................................... 109 Fazer Mais Investigações ........................................................................................ 109 Focar no Que É Palpável ........................................................................................ 116 Revisar os Termos .................................................................................................. 116 Adaptar a Linguagem ............................................................................................. 116 Esclarecimentos............................................................................................................. 116 Discussões Gerais .......................................................................................................... 120 A Confusão da Distinção ........................................................................................ 120 A Distinção É Semântica ........................................................................................ 121 A Ausência como um Estímulo .............................................................................. 123 Operações e Efeitos ................................................................................................ 126 Condições Pré-mudança e Pós-mudança ................................................................. 128 Implicações Sobre o Conceito de Reforçamento ..................................................... 131 Implicações Sobre o Conceito de Reforçadores ...................................................... 132 11 Implicações para o Conceito de Reforçadores Condicionados ................................. 140 Implicações do Abandono da Distinção Sobre o Conceito de Punição..................... 146 Implicações do Conceito de Operação Motivadora para a Distinção ....................... 148 Considerações Finais.......................................................................................................... 154 Limites do Presente Estudo ............................................................................................ 157 Sugestões para Trabalhos Futuros .................................................................................. 159 Em Direção à Uma Nova Proposta de Distinção ............................................................ 162 Referências ........................................................................................................................ 167 Apêndice............................................................................................................................ 175 12 Lista de Figuras Figura 1 - Organização hierárquica e interrelação entre os subtópicos da seção “Resultados e Discussão”.................................................................................................................................51“subtração de uma condição em que a atenção estava ausente” e “fuga de uma tarefa” com “acesso a uma condição em que a tarefa estava ausente”. Essas descrições por mais que inconvenientes e não convencionais, ilustram essas consequências diferentes poderiam ser descritas cada uma em sua forma oposta (ainda referindo-se a uma mesma mudança). A noção de que a distinção pode ajudar a distinguir mudanças ambientais que podem estar mantendo um comportamento já foi discutida a partir das vantagens práticas apontadas por Chase (2006) e Iwata (2006) sobre distinção. Aqui, Baron e Galizio (2005) a apresentaram não como uma vantagem, mas como uma possibilidade explicativa para a manutenção do comportamento. O exemplo de Iwata et al. (1994) ilustra o mesmo conflito: as diferentes mudanças são distinguíveis por serem de categorias supostamente diferentes ou por serem mudanças diferentes em si? Como identificar que tipo de mudança é de um tipo ou de outro, antes de identificar sequer quais as mudanças envolvidas? O equívoco anterior de Baron e Galizio (2005) acaba sugerindo que o abandono da distinção tampouco ajuda na distinção entre reforçamentos para uma mesma resposta (o que vai contra a vantagem do abandono apontada por Nakajima, 2006). O segundo exemplo apresentado por Baron e Galizio (2005) para ilustrar a distinção positivo/negativo, sendo usada para diferenciar duas mudanças diferentes para uma mesma resposta, foi o de Crowley (1972) no qual o autor propôs que o uso de drogas seria, inicialmente, mantido por reforçamento positivo, mas que, ao longo do tempo, passava a ser 83 controlado negativamente pelas condições produzidas pela abstinência da droga. Esse exemplo acaba sendo um pouco especulativo, até porque a operação observável (adição de droga) continua sendo a mesma em qualquer instância do uso da droga. Ainda assim, pode existir valor em se investigar que variáveis fizeram tanto Crowley, como outros autores (citados por Baron e Galizio, 2005) acreditarem que existe alguma diferença entre os dois tipos de uso. Isso porque caso essas diferenças existam, as diferenças no controle do comportamento de usar drogas em seu início e após o estabelecimento dos efeitos de abstinência poderiam indicar diferentes variáveis sobre as quais intervir quando se trata de um caso ou de outro. A Distinção Tem Função Comunicativa Lattal e Lattal (2006) citaram dois tipos diferentes de argumentação sobre a forma de falar sobre conceitos. Por um lado, Hineline (1980), defendia descrições precisas dos conceitos, por outro, Bailey (1991) defendia que o importante é comunicar os conceitos de forma útil a despeito de sua precisão. Em maior consonância com Bailey, Lattal e Lattal sugeriram que a distinção entre reforçamento positivo e negativo, embora imprecisa, persistirá enquanto tiver uma função comunicativa – sem especificar exatamente qual seria. A seguir, serão apresentadas algumas funções comunicativas específicas mencionadas pelos autores. Evidenciar Que se Está Tratando de Eventos Ambientais. Baron e Galizio (2005) apontaram para a possibilidade de que o uso da distinção talvez acabe favorecendo a noção de que a análise do comportamento trata de eventos ambientais e não cognitivos ou fisiológicos. Ser Entendida em Contextos Leigos. Para Lattal e Lattal (2006), mesmo que a distinção positivo/negativo seja conceitualmente ambígua, ela deve ter sido mantida também porque pode ser entendida facilmente em contextos fora da análise do comportamento, como escolas, empresas e hospitais. Essa fala se contrasta com os argumento de Sidman (2006) de que a distinção é especialmente confusa para novos alunos e leitores. Nesse sentido, seria 84 interessante ver uma pesquisa que investigasse a efetividade de um procedimento de ensino que usa a distinção e outro que não usa. Distinguir Estímulos Usados em Áreas Diferentes de Atuação. Outra possibilidade apresentada por Baron e Galizio (2005) é que a distinção pode estar sendo mantida por ser útil em oferecer uma forma simples de se referir a estímulos usados em áreas diferentes de estudo. De um lado, os reforçadores tipicamente usados em estudos sobre esquemas de reforçamento, escolha, controle de estímulos etc. (reforçadores positivos) e do outro os reforçadores usados em delineamentos de fuga e esquiva (reforçadores negativos). A Distinção Tem Função Cultural Chase (2006) e Lattal e Lattal (2006) sugeriram que a distinção entre os reforçamentos positivo e negativo podem estar simplesmente cumprindo alguma função cultural e apresentaram alguns argumentos para isso, sem especificar quais seriam tais funções culturais. Chase afirmou que a distinção, enquanto conceito, é ilógica no sentido de que o controle jamais pode ser atribuído a um tipo de reforçamento e não ao outro. Ao mesmo tempo, justificou que sua existência acaba sendo lógica no sentido de que seu uso segue as leis do comportamento e é mantida por uma comunidade verbal. Lattal e Lattal (2006), de forma similar, apontaram que a manutenção da distinção pode ser atribuída a contingências históricas e culturais. Citam Vollmer (1999) quando diz que práticas verbais são muito difíceis de mudar e Harris (1977) que disse que práticas histórico-culturais persistem porque funcionam de alguma forma dentro da cultura. Além disso, a função cultural da distinção pode se aplicar não somente à análise do comportamento, mas à cultura ocidental de maneira geral. Isso porque os termos positivo/negativo podem ser encontrados desde o Antigo Testamento até o princípio de Spencer-Bain, a lei do Efeito de Thorndike e o condicionamento operante de Skinner. Outro fator que pode ter perpetuado a 85 distinção seria a sua institucionalização como critério legal a respeito de quais intervenções podem ou não ser aplicadas. Lattal e Lattal (2006) citam também alguns exemplos de autores que já teriam apontado as falhas lógicas em conceitos da área, mas cujos conceitos foram mantidos em uso apesar disso. Hearst (1975) sobre a distinção operante/respondente, Dinsmoor (1954) sobre a lei do efeito negativa e Zeiler (1972) e Lattal e Poling (1981) que argumentaram contra a descrição de eventos independentes da resposta como “reforçamento não contingente” (ver Poling & Normand, 1999; Vollmer, 1999). Baron e Galizio (2005), por sua vez, concordaram com essa e outras explicações apresentadas por Chase (2006) como possíveis fatores responsáveis pela manutenção a distinção. Ainda assim, defenderam que se a distinção não pode ser baseada em fundamentos lógicos ou conceituais ela em nada está acrescentando a uma análise comportamental. Esse ponto é ilustrado por Moore (2008) ao descrever como o comportamento verbal do cientista pode ser controlado por múltiplas variáveis. O autor descreve uma contingência na qual uma resposta verbal pode ser tanto controlada pelos dados experimentais produzidos e/ou estudados, quanto por tradições sociais e culturais. Assim, a resposta verbal pode tanto produzir um reforçador natural relacionado à melhor compreensão, predição e controle do comportamento, como por reforçadores sociais e culturais arbitrários. Isso significa que nem sempre uma prática verbal acerca da descrição do comportamento é selecionada por ser a mais eficaz em descrevê-lo. Sobre isso, se aplica o mesmo já havia sido comentado sobre o caso dos números decimais apresentado (com base em Thomas, 1920): mesmo que a mudança de práticas culturais pudesse ser benéfica em um sentido, o custo para de aplicar tais mudanças em aspectos tão enraizados de uma comunidade podem ser justificativa suficiente para não a fazer. 86 Alertar Sobre o Reforçamento Negativo. Uma explicação cultural específica para a manutenção da distinção apresentada Baron e Galizio (2005) - resgatada de Michael (1975) - foi a de que a distinção entre positivo/negativo poderiaajudar a alertar as pessoas sobre os aspectos indesejáveis do reforçamento negativo. Baron e Galizio (2005) apresentam três contrapontos de Michael (1975) a essa noção: 1) se a distinção é ambígua e difícil de ser feita, a recomendação de usar uma forma de reforçamento em favor de outra seria difícil de ser seguida; 2) é uma questão empírica se os procedimentos chamados de reforçamento negativo são ou não indesejáveis; e 3) faria sentido, de qualquer forma, manter uma distinção conceitual básica por conta de possíveis implicações sociais? Sobre esse último ponto, vale comentar que se houver de fato implicações sociais ligadas ao uso de reforçamento positivo e negativo, isso significaria que existem diferenças entre os dois processos. Nesse sentido, faria sentido manter a distinção conceitual por conta dessa diferenças nos processos. De toda forma, Baron e Galizio (2005) demonstram concordar com os três pontos de Michael (1975) e adicionam que mesmo efeitos indesejados provocados por estímulos dolorosos podem ser compensados pela severidade do transtorno que se está evitando. Além disso, citam Perone (2003) para afirmar que procedimentos nomeados como reforçamento positivo também trazem aspectos indesejados como privação e perda de interessem em outras atividades. Para eles (Baron e Galizio, 2006a), assim como para Michael (1975), preferir intervenções agradáveis ao invés de desagradáveis não é o mesmo que preferir reforçamento positivo do que negativo. Sidman (2006) criticou a noção de Michael (1975) e Baron e Galizio (2005) de que o que é indesejável (ou não) seja uma questão empírica. Sidman afirma que essa é, na verdade, uma questão social e, como ciência, a análise do comportamento apenas pode oferecer para a 87 sociedade os dados produzidos. O autor criticou também o questionamento sobre se uma ciência deveria relacionar seu conteúdo com problemas da vida cotidiana. Para ele, espaços destinados para temas considerados importantes pela sociedade é necessário para a sobrevivência de qualquer ciência. Sobre isso, Baron e Galizio (2006a) ressaltaram seu ponto inicial: qualquer possível utilidade da distinção nesse sentido será limitada pela sua falta de clareza. Isso é piorado pelo fato de que muitos dos problemas que tornam o reforçamento negativo indesejável são também encontrados em procedimentos convencionalmente chamados de reforçamento positivo. Além disso, a prática de manter uma distinção numa ciência básica por conta de possíveis implicações sociais ainda assim é uma prática arriscada e evitada por outras ciências. Apesar de direcionadas, as falas dos autores parecer não estar abordando as mesmas coisas. Se o ponto de Michael (1975) era dizer que o laboratório irá apontar o que as pessoas devem desejar ou não, a crítica de Sidman (2006) de que o que é desejável ou não é uma questão social e não empírica é muito válida. Isso é verdade no sentido de que a análise do comportamento descreve os processos comportamentais, mas não define quais serão os eventos reforçadores ou não para as pessoas. Entretanto, o argumento de Michael pode abrir espaço para outra interpretação. Supondo que o que é considerado indesejável para a sociedade fosse a existência de efeitos colaterais, o que responderá que procedimentos produzem ou não esses efeitos será a experimentação empírica. Sobre esse ponto, Sidman e Michael pareceriam de acordo (mesmo que discordem sobre o que mostram os dados desses experimentos). Sidman (2006) também aponta que a análise do comportamento, enquanto ciência precisa necessariamente relacionar seu conteúdo com problemas cotidianos da sociedade. Isso é apresentado como um contraponto ao argumento de Baron e Galizio (2005) e Michael 88 (1975), mas não há por que pensar que ele se oporia a isso. Michael parece, inclusive, fazer uma separação semelhante com a de Sidman sobre o que é definido social ou empiricamente. Estes deveriam apenas descrever os fenômenos básicos observados, sem atribuição de valores éticos, por exemplo. Baron e Galizio (2006a) afirmam concordar com essa afirmação de Michael (1975). Ampliar a Aceitação da Análise do Comportamento. Segundo Lattal e Lattal (2006) apresentam uma função cultural específica da apesar de intervenções baseadas no que é chamado de reforçamento positivo não serem diferentes das baseadas no que é chamado de reforçamento negativo, as primeiras têm mais chances de serem aceitas socialmente. É possível que, para a população geral, o termo “positivo” indique o “tom” ou “intenção” do programa e do aplicador. Ele se aplica quando as descrições são feitas de forma “positiva” como em “aumentar a produtividade” ou busca por “satisfação”. A vantagem do uso da distinção, nesse caso, é acidental. Conceitualmente, os termos “positivo” e “negativo” nada tem a ver com “bom” e “ruim”, mas o entendimento público de que sim tornaram as intervenções “aditivas”, ou mais especificamente “descritas como aditivas” mais propensas a serem aceitas. Sobre isso, ainda vale o alerta de Baron e Galizio (2006a) de que se a população descobrisse que, em tese, não há qualquer relação entre as duas coisas, isso poderia ser malvisto. A Distinção se Dá por Outro Aspecto Relações Temporais, Relações com Outras Variáveis ou Papel em Discriminações. Baron e Galizio (2005) trouxeram algumas possíveis diferenças, apresentadas inicialmente por Michael (1975), entre os reforçamentos positivo e negativo (que não relacionadas ou adição ou subtração) que pudessem explicar o uso da distinção. A primeira delas diz respeito a temporalidade, relações com outras variáveis ou papel em discriminações. Nem Michael nem Baron e Galizio apresentaram explicações precisas desses três fatores ou porque eles 89 foram apresentados em conjunto. Ainda assim, apresentam os contra-argumentos de Michael a essa noção. Segundo ele, uma distinção a partir dessas particularidades não se sustentaria porque as propriedades das mudanças reforçadoras se diferem tanto entre tipos diferentes de reforçamento positivo quanto tipos diferentes de reforçamento negativo. Além disso, há muito mais semelhanças entre os chamados reforçamentos positivo e negativo do que diferenças. Por exemplo, quando analisadas as diferenças no comportamento a partir de alterações na magnitude, atraso ou esquemas de apresentação. Abruptidão da Mudança. Outra possibilidade resgatada por Baron e Galizio (2005) é a de que talvez mudanças nas condições de estímulo fossem mais abruptas no reforçamento negativo do que no positivo. Weiss e Laties (1961) sugeriram que a mudança de temperatura parece produzir resultados mais confiáveis do que o alimento por conta de sua imediaticidade. Para Michael (1975), mesmo que isso fosse verdade, essa distinção continuaria não sendo fundamental. Taxas de mudança são parâmetros de qualquer reforçamento e se Weiss e Laties tivessem utilizado atrasos nas mudanças de temperatura os efeitos seriam similares aos do alimento. Além disso, já é sabido que a forma de administração de uma mesma droga pode afetar grandemente os seus efeitos reforçadores por conta da velocidade de sua ação no organismo. Mecanismo Fisiológico Envolvido. Em retomada à Michael (1975), Baron e Galizio (2005) apontam que é possível que diferenças nos processos ou estruturas fisiológicas justificassem a distinção entre os reforçamentos positivo e negativo. Os dados disponíveis na época de Michael o fizeram concluir que a fisiologia não ajudava a elucidar a distinção. Ainda assim, Baron e Galizio se propuseram a investigar se dados posteriores a ele poderiam ser úteis. Segundo seus achados, estudos iniciais com fármacos sugeriram que drogas teriam ações diferentes sobre comportamentos mantidos por reforçamento positivo ou negativo. Entretanto, outros estudos (Keller & Morse, 1964) teriam mostrado que as diferenças entre os90 efeitos teriam muito mais a ver com as taxas de resposta do que com o tipo de reforçamento envolvido. Sistemas dopaminérgicos já foram associadas a sistemas de recompensa do cérebro enquanto outros como o da amígdala e hipotálamo foram associados a processos de dor e medo. Entretanto, outros experimentos mostraram que mesmo em esquemas envolvendo fuga/esquiva padrões dopaminérgicos semelhantes foram observados. Outro ponto é que as relações estabelecidas por esses campos entre “centros de recompensa e punição” não correspondem diretamente às definições usadas na análise do comportamento. A partir disso, Baron e Galizio (2005) concluem que apesar de após 50 anos de literatura analisando a psicofisiologia do reforçamento, nenhuma conclusão clara pode ser tirada sobre a relação entre os tipos de reforçamento e mecanismos biológicos específicos. Vale comentar que desde aquela época novas pesquisas continuaram sendo feitas e algumas apontam para possíveis diferenças mecanismos subjacentes ao reforçamento positivo e negativo (e.g., Xu et al., 2021). Eles ressaltam, entretanto, que não houve diferenças comportamentais evidentes entre ambos. Nessa direção, pesquisas que analisem as afirmações de Michael (1975) e Baron e Galizio (2005) frente a esses novos dados poderiam ser valiosas. Emoções Envolvidas. Junto à sua análise anterior, Baron e Galizio (2005) apresentaram a possibilidade de que processos emocionais específicos pareciam ser eliciados por estímulos aversivos e apetitivos (Mowrer, 1960). Entretanto, segundo os autores, os dados da literatura não favoreceram essa visão. Até então, nenhuma forma de identificar emoções com base em padrões comportamentais específicos foi desenvolvida. Além do mais, estímulos que não provocam respostas afetivas (observáveis) já foram usados eficazmente como reforçadores. Ainda questionando o papel das respostas emocionais no reforçamento positivo e negativo, Baron e Galizio (2005) apresentam dados que mostram que respostas podem ser mantidas pela produção de choques (Morse & Kelleher, 1977; Pear, 2001), mas admitem que 91 esse dado é questionável porque só teria sido demonstrado diante de condições específicas com espécies específicas. Michael (2006), entretanto, responde a isso acrescentando outros dados (e.g., Azrin e Holz, 1966) que mostraram que choques podem funcionar tanto como estímulo discriminativo como reforçador positivo condicionado. Isso sustenta o argumento de Baron e Galizio de que dificilmente pode haver uma relação clara entre a distinção entre os reforçamentos positivo e negativo e os comportamentos respondentes eliciados pelos estímulos envolvidos. Essas afirmações parecem se basear na noção de que as respostas emocionais diante de um choque como reforçador negativo, um choque como punidor e um choque como reforçador positivo sejam as mesmas. Isso pode ser verdade em partes, mas muitos aspectos podem se diferenciar – isso é algo que precisaria de alguma fundamentação experimental. Sentimentos Envolvidos. Outra sugestão de Baron e Galizio (2005) foi que os sentimentos associados com a produção ou eliminação de estímulos reforçadores poderiam ser responsáveis pela manutenção da distinção. Enquanto Thorndike (1911) descreveu reforçadores positivos como satisfatórios, agradáveis e prazerosos, Mowrer (1960) disse que a retirada de estímulos aversivos era acompanhada de sentimento de alívio. Um primeiro contraponto apresentado pelos próprios autores (Baron e Galizio, 2005) é que basear a distinção nas diferenças entre sentimentos (respostas do organismo a eventos ambientais) implicaria em novas dificuldades para acessar esses eventos, tendo que recorrer, por exemplo, a relatos verbais. Isso iria na contramão de Skinner (1953/2014) que, apesar de não ter problemas com as descrições de sentimentos em si, recorreu ao ambiente como explicação causal para comportamentos. Basear-se em relatos verbais, além pouco confiável, pode ser, em alguns casos, completamente inviável - em estudos com animais e crianças pequenas, por exemplo. O segundo contraponto é que, mesmo que fosse aceito se basear em relatos verbais, 92 as distinções continuariam não sendo claras. Segundo Baron e Galizio (2005): De fato, a interrupção de estados de dor ou ansiedade pode evocar estados semelhantes ao prazer (por exemplo, pessoas com enxaqueca relatam sensações eufóricas quando a dor de cabeça é aliviada), e a cessação de incômodos leves também pode ser sentida como prazerosa (como ao coçar uma coceira), da mesma forma que a interrupção de estados prazerosos pode ser relatada como aversiva (Solomon, 1980; Solomon & Corbit, 1974). (p. 94). Esse segundo ponto pode ser questionado. Talvez fosse possível que um indivíduo aprendesse com ajuda de sua comunidade verbal a ficar sob controle e indicar diferencialmente os diferentes estados corporais por ele sentidos. Em outras palavras, pode ser que os sentimentos envolvidos em diferentes contingências fossem de fato diferentes e perfeitamente distinguíveis. Mas o que importa é que 1) como já foi indicado, se basear em relatos verbais geraria problemas de precisão e confiabilidade, muitos deles gerados pelo fato de que essas descrições são ensinadas por membros específicos de uma comunidade verbal que não necessariamente estão ensinando da mesma forma; e 2) mesmo que sentimentos pudessem ser precisamente indicados, isso não mudaria o fato de que as causas, e, portanto, os alvos de intervenção continuariam sendo as variáveis ambientais (Skinner, 1953/2014). Presença de Respostas Competidoras. Outra diferença apontada por Baron e Galizio (2005) que poderia ser responsável pela manutenção é o fato de que, no reforçamento negativo, o estímulo está presente antes da resposta e, portanto, tais estímulos podem eliciar/evocar respostas que compitam com a resposta selecionada pelos experimentadores. Segundo essa lógica, isso não se aplicaria ao reforçamento positivo porque não há estímulos antecedentes que pudessem eliciar ou evocar respostas competidoras. Essa proposta teria sido apresentada inicialmente por Catania (1973), e Hineline (1984), que havia criticado a distinção pela adição ou pelo acréscimo, reconheceu que esse 93 argumento poderia oferecer uma base melhor para uma distinção. Pierce e Cheney (2004) também endossaram esse argumento. Catania (1992), em retomada ao seu texto anterior, mencionou as respostas de “tremer” ou “se encolher” critério para nomear como reforçamento negativo o delineamento de Weiss e Laties (1961). Baron e Galizio (2005) problematizam essa possibilidade apontando que há tanto casos em que operações estabelecedoras de reforçadores positivos possam evocar comportamentos competidores quanto estímulos reforçadores negativos que não evocam ou eliciam esses comportamentos. Condições estabelecedoras de alimento como um reforçador frequentemente evocam, por exemplo, respostas de “checar” o comedouro. Da mesma forma, segundo Baron e Galizio (2005), comportamentos ditos mantidos por reforçamento negativo como encher um tanque antes que acabe a gasolina ou colocar um alarme para acordar no dia seguinte não parecem evocar respostas competidoras. Sobre os exemplos apresentados por Baron e Galizio (2005), vale destacar que a resposta de “checar o comedouro” pode competir com a resposta desejada, mas diferentemente do choque, isso necessária de um condicionamento. Um sujeito que não passou por treino ao comedouro ou por modelagem não tem essas respostas evocadas pela privação alimentar. Já o choque eliciaria respostas competitivas desde a primeira apresentação. Sobre os casos em que respostas competitivas não são emitidas, pode-se considerar as vezes em que se “enrola muito” para encher um tanque ou se que se “esquece” de colar um alarme. Isso de alguma forma poderia muito bem ser interpretado como consequênciada ação de respostas competidoras. Afinal, segundo Sidman (1989/2009) quaisquer respostas de fuga ou esquiva “não programadas” poderiam ser interpretadas como um efeito indesejável quando se usa a coerção. Outro ponto é que Baron e Galizio (2005) não explicitaram as operações motivadoras agindo nesses casos, dificultando uma análise mais profunda. 94 Fica parecendo que mesmo que respostas competidoras possam existir em contingências de reforçamento positivo, elas parecem diferir em alguns aspectos. Isso indica que novas investigações poderiam investigar esse critério como uma nova forma de distinguir reforçamentos (ou indicar outras possibilidades). Vale retomar que entre os autores classificados na categoria de “Publicações Posteriores a Michael (1975)” que abordavam sua crítica (Santos & Leite, 2013) estavam tanto Pierce (em Pierce & Epling, 1995) quanto Catania (1992), e ambos haviam dado a entender que concordavam parcialmente com a ambiguidade. Catania (1992) chegou a dizer que "o reforçamento sempre envolve mudanças na situação do organismo e inevitavelmente leva a diferenças na resposta antes e depois da mudança" (p. 101). Severidade das Operações Motivadoras. É possível que a intensidade das operações motivadoras envolvidas em um comportamento possa estar sendo usada para fazer a distinção positivo/negativo. Como base para esse argumento, Baron e Galizio (2005) apresentam a seguinte citação de Sidman (1989/2009): Prisioneiros são primeiro colocados em solitária e, posteriormente, o contato social lhes é permitido como reforçamento pela docilidade. Da mesma forma, após serem submetidos à privação extrema de alimento, podem então obtê-lo como retribuição por subserviência. Liberdade e alimento podem parecer reforçadores positivos, mas, quando são contingentes à cessação de privações artificialmente impostas, sua efetividade resulta do reforçamento negativo; eles se tornam instrumentos de coerção (Sidman, 1989/2009, p. 61) Nesse caso, Sidman (1989/2009) recorre à intensidade da privação de alimento ou ao fato de que a privação foi socialmente estabelecida - e não exclusivamente a adição ou subtração de estímulos - para classificar uma situação corresponde a reforçamento positivo ou negativo. 95 Para Baron e Galizio (2005), a abordagem de Sidman (1989/2009) sobre as diferenças é inovadora, mas acaba sendo limitada pelo fato de que não há formas precisas de mensurar diferentes operações motivadoras. Além disso, qual seria o critério para determinar a partir de qual intensidade de operação motivadora um tipo de reforçamento positivo se torna negativo ou vice-versa? Isso não foi apresentado por Baron e Galizio (2005), mas Skinner (1953/2014) fez comentários parecidos a respeito de dores geradas por privações de alimento muito intensas. Para ele, a privação de alimento que serve como “drive” para a resposta de comer é diferente da dor gerada pela privação intensa que poderia evocar a mesma resposta. De alguma forma, Sidman (1989/2009) e Skinner (1953/2014) parecem diferir sobre a forma de falar sobre os reforçamentos positivo e negativo diante dessas condições. As pontadas de fome são uma possível fonte de confusão entre privação e estimulação aversiva. Como a fome é o impulso mais comum, tendemos a modelar nossa formulação de todos os impulsos com base nela. Mas vimos que as pontadas não são representativas dos impulsos em geral e que, mesmo no caso da fome, elas exigem uma formulação separada. Na medida em que se come para reduzir as pontadas de fome, o comportamento é aversivo. (Skinner, 1953/2014, p. 173) Enquanto para Sidman (1989/2009) uma intensidade suficientemente alta da operação estabelecedora parece suficiente para classificar a situação como reforçamento negativo, Skinner (1953/2014) distingue a privação de alimento da dor por ela gerada. Isso não foi dito diretamente, mas poder-se-ia entender que, para Skinner, nos casos em que uma privação intensa elicia dores abdominais, a resposta de comer poderia estar sendo mantida tanto por reforçamento positivo quanto negativo, isto é, por duas mudanças ambientais distintas ao invés de uma só que é mais ou menos intensa. Por outro lado, Skinner (1953/2014) também comenta: 96 A retirada de um reforçador positivo tem, por definição, o mesmo efeito que a apresentação de um negativo. Tirar privilégios não é muito diferente de estabelecer condições aversivas [...]. Suponha que tenhamos privado um homem da permissão para deixar um campo militar até que uma determinada tarefa seja realizada, e suponha que, em ocasiões anteriores, a realização de tarefas semelhantes tenha sido seguida pela restauração desse privilégio. Teríamos gerado um estado de privação, no qual o comportamento que foi reforçado pela devolução de privilégios estará fortalecido, ou teríamos apresentado uma condição aversiva da qual o indivíduo só pode fugir realizando a tarefa exigida? É possível, é claro, que tenhamos feito ambos. Na prática, a distinção pode parecer de pouca importância, mas certos efeitos colaterais dependem da medida em que cada um dos dois fatores está envolvido. (p. 173). Nesse caso, Skinner (1953/2014), mesmo antes de Sidman (1989/2009) parece ter indicado que apesar de o efeito principal (fortalecedor da resposta) ser o mesmo, a diferença nos efeitos colaterais produzidos é diferente. Isso aponta para a necessidade investigação específica sobre as diferenças entre efeitos colaterais como elemento chave para a distinção entre os reforçamentos positivo e negativo (no lugar da adição e subtração). Partindo desse princípio, para definir quando uma determinada contingência de reforçamento seria positiva ou negativa, um novo critério de distinção para substituir o de adição/subtração seria a presença ou não de efeitos colaterais. Nesse sentido, algumas investigações a respeito dos efeitos colaterais (pelo menos como apontados por Sidman, 1989/2009) já foram realizadas. Fontes e Shahan (2020) analisaram os efeitos colaterais descritos por Sidman, frente a dados experimentais - especialmente no contexto da punição. Os autores confirmaram parte desses efeitos, como a punição condicionada, a fuga, a esquiva e a agressão induzida, mas também mostraram que esses efeitos são variáveis e dependem de fatores como intensidade 97 do estímulo, contexto e presença de reforçamento alternativo. Quanto ao contracontrole, afirmaram que não há evidência experimental suficiente para tratá-lo como um conceito particular. Perone (2003) também criticou o “endosso abrangente” de Sidman ao reforçamento positivo, apontando que reforçadores positivos podem gerar efeitos colaterais semelhantes aos do controle aversivo. Ele cita exemplos em que reforçadores positivos, por dependerem de privações intensas ou relações verbais complexas, acabam gerando queixas ou comportamentos de fuga. Além disso, apresenta dados experimentais que mostram que estímulos considerados aversivos podem não funcionar como reforçadores negativos, mas como punidores, sugerindo que a função de um estímulo pode variar dependendo da contingência em que está inserido. Essa discussão mostra que, para que um critério baseado em efeitos colaterais pudesse ser adotado, muito ainda precisaria ser investigado para se definir mais precisamente quais são eles e como identificá-los. Saliência ou Discriminabilidade. Chase (2006) sugere que a distinção pode ter sido mantida porque talvez uma direção da mudança (positiva ou negativa) seja mais discriminável, mensurável ou mais facilmente descrita do que a outra direção de mudança. Vale comentar que há uma diferença grande entre ser discriminável ou mensurável e ser mais facilmente descrita. Quando se diz que calor foi adicionado ou frio foi subtraído, pode-se preferir uma descrição à outra. Ainda assim, o estímulo discriminativo para esse tato foia própria mudança de temperatura (e.g., de 10 para 20 °C) - e esse também é o fenômeno mensurável. Nesse sentido, as diferentes direções existem apenas enquanto descrições, mas o fenômeno em si continua o mesmo. Propriedades Particulares dos Estímulos Usados. Uma última explicação apresentada para a manutenção da distinção foi a de Lattal e Lattal (2006) que sugeriram que 98 é possível que as diferenças comportamentais entre os reforçamentos positivo e negativo tenha mais a ver com diferenças particulares entre os estímulos usados nesses estudos do que com categorias mais amplas de estímulo ligados separados pelos critérios de apresentação e remoção. Skinner (1953/2014) quando discute os efeitos de uma luz forte, um som alto ou um choque afirma “estímulos aversivos eliciam reflexos e geram predisposições emocionais que muitas vezes interferem no operante a ser reforçado. Assim é difícil observar o efeito do reforçamento negativo isoladamente” (p.188). Nesse sentido, pode ser que as diferenças até então observadas entre reforçadores positivos e negativos possam sim, estar relacionadas aos estímulos específicos até então nos estudos de cada tipo. Entretanto, ainda é possível que algum fatores ainda possam determinar se esses estímulos formam ou não um grupo coeso sobre algum aspecto. Como discutido, os estímulos eliciadores relacionados a condições antecedentes de reforçamento positivo (e.g., uma privação) parecem escassos, enquanto os ligados a reforçamento negativo que foram estudados estão se fizeram bastante presentes. Sugestões para a Manutenção Falas em que os autores apontaram para a necessidade de se fazer algo relacionado ao uso da distinção entre os reforçamentos positivo e negativo. Dentre os trechos classificados como “Sugestões para a Manutenção”, identificou-se falas que sugeriam manter a distinção com ressalvas, fazer investigações ou rever os termos usados. Rever os Termos Usados Sidman (2006) declara que abraçaria novos termos que lidassem com os problemas apresentados por Baron e Galizio (2005), mas que mantivessem as noções de fuga e esquiva como formas de reforçamento. Ele sugere que uma possibilidade de manter a distinção lidando com a confusão gerada por ela no ensino de análise do comportamento seria substituir 99 o termo “reforçamento negativo” por algo que não gerasse a preconcepção de equivalente à punição – mas que ele não teria conseguido pensar em um termo. Manter a Distinção com Ressalvas Baron e Galizio (2005) sugeriram que se a área optar por manter a distinção entre os dois tipos de reforçamento, cautela deve ser tomada na forma como os termos serão usados. A seguir, alguns autores apresentaram formas específicas em que essa cautela pudesse ser mantida. Entre elas, o reconhecimento das ambiguidades, o abandono da distinção em casos complexos, a descrição precisa das condições envolvidas e um ensino inicial da distinção. Reconhecer a Ambiguidade. Chase (2006) propôs que, no ensino da análise do comportamento, seria importante apontar para os alunos que todos os exemplos de um tipo de reforçamento envolvem também o outro tipo. Na mesma direção, Lattal e Lattal (2006) ressaltaram a importância de que estudantes e profissionais da área compreendam as dificuldades lógicas e empíricas da distinção (tal como outras complexidades da disciplina). Por fim, Baron e Galizio (2005) apontaram que lembrar das ambiguidades inerentes à distinção talvez já diminua as chances de que ela seja usada como base para justificar decisões éticas ou práticas. Abandoná-la em Casos Complexos. Após apresentar seu exemplo hipotético já mencionado do rato no qual dois estímulos foram condicionados por vários outros, Michael (1975) sugeriu que, pelo menos nos casos complexos nos quais determinados estímulos foram condicionados a vários estímulos, a distinção deveria ser abandonada. Vale lembrar que Michael, em seguida, complementou sua fala dizendo que casos complexos desse são universalmente humanos e, enquanto ciência dedicada aos problemas do ser humano, a distinção tornar-se-ia inútil. 100 Descrever Precisamente as Condições. Iwata (2006) se posicionou dizendo que não via prejuízo na manutenção da distinção positivo/negativo desde que as condições rotuladas como positivas ou negativas fossem bem descritas. Ensinar a Distinção Inicialmente. Nakajima (2006) sugere que uma análise a partir de duas perspectivas pode trazer uma melhor compreensão sobre casos. Apesar disso, alunos teriam dificuldades para aprender uma perspectiva de dois lados sem antes terem aprendido a analisar casos a partir de um ponto de vista fixo. Dessa forma, Nakajima recomenda que uma abordagem de perspectiva única deveria ser ensinada inicialmente. Fazer Mais Investigações Investigar as Definições Existentes. Sidman (2006) sugeriu que os problemas de definição apontados por Baron e Galizio (2005) e reconhecidos por ele, deveriam levar não a um abandono completo da distinção, mas a pesquisas que ajudem a esclarecer as definições já existentes. O próprio artigo de Santos e Leite (2013) é um bom exemplo disso. Abandonar um conceito de uma hora para a outra poderia deixar uma lacuna que faz mais mal do que bem. Se problemas de definição fossem encontrados entre os conceitos de discriminação e generalização, abandoná-los (ao invés de aprimorá-los) tornaria difícil falar sobre controle estímulos. Talvez a questão principal com a distinção positivo/negativo, como já comentado, não é que a forma como se fala das mudanças ambientais (e.g., adição ou subtração) precise ser descartada. A pergunta é: o que é ganho ao se criar uma categoria específica para descrições de um tipo ou de outra? Como já discutido, se o critério de adição e subtração parece arbitrário, talvez outros fatores o estejam controlando a distinção. Investigar Mudanças Paramétricas. Iwata (2006) havia argumentado contra a dificuldade de classificação, dizendo que mesmo nos casos em que as mudanças de estímulo ocorrem num contínuo, elas ainda envolvem aumento ou diminuição de uma característica do estímulo. Isso parece levar a conclusão de que, mesmo nesses casos, mudanças reforçadoras 101 ainda poderiam ser classificadas como positivas ou negativas. Apesar disso, o autor completou que “se tais mudanças paramétricas funcionam como reforçamento positivo ou negativo requer uma análise mais aprofundada” (p. 122), destacando (em dois momentos diferentes em seu texto) a importância dos apontamentos de Baron e Galizio (2005) para isso. Iwata afirma que uma investigação dessa natureza seria importante não só para o estudo do reforçamento, mas também da extinção e punição. Vantagens do Abandono Baron e Galizio defenderam que há benefícios em se focar mais no contexto completo de uma mudança ambiental reforçadora do que na dicotomia adição/subtração. Além deles, Nakajima (2006) também apresentou uma suposta vantagem do abandono que será discutida mais adiante. Dessa forma, os pontos a seguir representam as falas em que os autores apontaram benefícios relacionados ao abandono da manutenção entre os reforçamentos positivo e negativo. Dentre os trechos classificados como “Vantagens do Abandono”, identificou-se falas que apontavam que adotar uma perspectiva que não faz uso da distinção geraria menos distorções, melhoraria a descrição das mudanças e evidenciaria as mudanças envolvidas no reforçamento. Gera Menos Distorções Segundo eles (Baron e Galizio, 2006a), mesmo falando apenas em reforçamento, nada impede que um analista do comportamento possa enfatizar ou defender o uso de determinadas práticas com base no objetivo do tratamento. A vantagem de se abandonar a distinção estaria no fato de que isso seria feito sem distorções ou usos indevidos dos termos. Melhora a Descrição das Mudanças Com base nos diversos caso já apresentados, em seu segundotexto de resposta, Baron e Galizio (2006b) comentaram que os eventos reforçadores são “melhor descritos em termos de uma mudança na estimulação, independentemente da direção dessa mudança” (p. 274). 102 Eles citam o exemplo do participante humano que trabalha por dinheiro. Nesse caso, não haveria diferença se o ganho do dinheiro é indicado pelo acendimento de uma luz apagada ou desligamento de uma luz acesa e, dada a impossibilidade ou arbitrariedade de se classificar a mudança como positiva ou negativa, acaba sendo mais preciso descrever a mudança sem direção específica. Vale ressaltar que o que Baron e Galizio chamaram de “direção da mudança” refere-se a escolher descrever a mudança como adição ou subtração. Naturalmente uma direção na mudança continua existindo: a temporal. Distinguir Dois Reforçadores para a Mesma Resposta Por último, Nakajima (2006) nomeia o abandono da distinção como abordagem de “duas faces”, se referindo ao fato de que ela olha para os dois lados da mudança. A partir disso, o autor afirma que pode existir uma vantagem nessa abordagem já que ela reconhece que tanto o reforçamento positivo como o negativo possam estar operando num mesmo caso. Esse é exatamente o argumento contrário ao apresentado por Chase (2006) e presente também em Iwata (2006). Para eles, uma vantagem da manutenção seria a de que ela ajuda a distinguir duas mudanças para uma mesma resposta. Como já discutido, não há motivos para pensar que uma coisa dependeria da outra. Mudanças diferentes são distinguíveis porque são eventos diferentes e não porque são ou não de tipos diferentes. Sobre dizer que a distinção ajuda na separação de tipos diferentes de reforçamento para uma mesma resposta, poder-se-ia dizer também que ela atrapalha na separação de tipos iguais de operações (e.g., dois reforçadores positivos) para uma mesma resposta. E sobre dizer que o abandono da distinção ajuda na distinção porque “olha para os dois lados”, os dois lados olhados são, na verdade, descrições opostas de uma mesma mudança, e não duas mudanças diferentes. Um exemplo de que o abandono não ajuda na distinção foi apresentado no subtítulo “Explicações para a Manutenção” no subtópico “Distinguir dois Reforçadores para a Mesma Resposta”. 103 Talvez uma sugestão a ser tirada seja que é necessário estar atento para identificar diferentes mudanças ambientais, mas essas mudanças não necessariamente precisam diferir em seus tipos. Explicações para o Abandono Apesar de o abandono da distinção não ter sido adotado amplamente na comunidade analítico-comportamental, foram apresentados alguns possíveis motivos pelos quais alguns autores estejam sugerindo o abandono da distinção entre os reforçamentos positivo e negativo. Em sua maioria, explicações foram apresentadas por autores contra a distinção ou incertos em seções específicas dedicadas a especular as razões pelas quais a distinção foi mantida. Dentre os trechos classificados como “Explicações para o Abandono”, identificou-se falas que apontavam para a distinção como sendo funcional em algum sentido ou controlada por outro aspecto que não a adição/subtração. A Distinção é Mal-entendida Para Sidman (2006) o desconforto de Baron e Galizio (2005) com a distinção pode originar da sensação de que a, por algum motivo, a distinção reflete diferenças no próprio processo de reforçamento para eles. É nesse ponto que o autor deixa explícito que esse não é o caso, e que a discussão de Baron e Galizio deveria dissuadir qualquer um que achasse isso. Sabendo que Sidman (2006), em seu texto como um todo, busca defender a manutenção da distinção, faltaria entender o que a distinção representa ou então o que ele quis dizer quando disse “processo”. Se a diferença for apenas descritiva, ele estaria perfeitamente de acordo com Baron e Galizio (2005). Isso iria, entretanto, na contramão com outras de suas próprias afirmações nesse e em outros textos. Ao longo do texto o autor sugeriu que é possível determinar se uma mudança se trata de uma adição ou subtração e, nos casos em que não for, novas pesquisas deveriam focar em tornar isso possível. 104 Dito isso, outra possibilidade é que ao dizer que os processos são iguais, ele quer dizer que o efeito (aumento na probabilidade da resposta) é o mesmo, mas que a diferença entre adição e subtração ainda existe - e que a isso podem ser atribuídos os efeitos colaterais gerados pelo reforçamento negativo (Sidman, 1989/2009). Ainda assim, não se pode ter certeza do que a distinção representa exatamente para ele. A Distinção Não É Mais Útil Outra explicação apresentada para o abandono da distinção é simplesmente a de que o que em determinado momento do desenvolvimento da ciência comportamental foi útil, agora não é mais. Para Marr (2006) uma ciência, inicialmente, pode recorrer a distinções vagas antes de atingir um maior entendimento dos seus objetos de estudo. Conforme o estudo dessa ciência avança, pode ser que distinções que eram explícitas possam tornar-se cada vez mais confusas e até sumirem. Marr (2006) apresenta alguns exemplos desse fenômeno: 1) chuva e neve podem parecer muito distintas, mas de uma perspectiva molecular elas tornam-se exatamente iguais; 2) a queda de uma maçã na Terra e a órbita da Lua funcionam a partir do mesmo mecanismo; 3) eletricidade e magnetismo antes eram tratados de forma muito separada, mas hoje sabe-se que estão intimamente ligados. Um ponto parecido já havia sido apresentado por Michael (1975) na Introdução. Michael havia afirmado que talvez os conceitos de reforçamento positivo/negativo se tivessem sido eficazes na formação de um novo conhecimento por fazerem paralelos com outros conceitos de fora, mas que seu uso não mais era útil. Sugestões para o Abandono Falas em que os autores apontaram para a necessidade de se fazer algo relacionado ao abandono do uso da distinção entre os reforçamentos positivo e negativo. Dentre os trechos 105 classificados como “Sugestões para o Abandono”, identificou-se falas que sugeriam a mudança dos termos usados ou o abandono completo da distinção. Mudar os Termos Usados Falar de Cada Tipo de Reforçamento. Outra sugestão de Sidman (2006) ligada à revisão dos termos usados na distinção é a de abandonar a distinção entre positivo e negativo e falar de cada tipo diferente de reforçamento. Como exemplos, ele cita o reforçamento por comida, água, sexo, fuga e esquiva. Os exemplos citados parecem contrastar com a sugestão de abandonar a distinção porque dois dos exemplos dele (i.e., fuga e esquiva) representam tipos de reforçamento negativo. Diferentemente dos outros exemplos, Sidman não especificou os reforçadores envolvidos na fuga/esquiva, mas o fez para os casos tipicamente considerados como reforçamento positivo. Faria mais sentido, por exemplo, mencionar, no lugar, choques, tons altos e jatos de ar quente, por exemplo. Talvez esse contraste mostre que Sidman (2006) não esteja completamente disposto a abandonar a distinção. Como ele mesmo havia afirmado, o autor só aceitaria novos termos que mantivessem as noções de fuga e esquiva como formas de reforçamento. De toda forma, a possibilidade apresentada pelo autor (levando em conta as considerações feitas) talvez fosse benéfica. Como já haviam sugerido Lattal e Lattal (2006), é muito possível que quaisquer diferenças atribuídas aos reforçamentos positivo e negativo, na verdade, tenham mais a ver com diferenças os reforçadores específicos tipicamente usados (e.g., alimento e choque). Dessa forma, estudar individualmente cada tipo de reforçador e seus efeitos sobre o responder poderia ser uma forma mais rigorosa de se falar sobre reforçamento. Ainda assim, novos critérios sobre como tratar estímulos condicionados (em especial condicionados generalizados) seriam necessários. Abranger Todo o Contexto Ambiental. Para disputara noção de Staats (2006) de usar aproximação/evitação como critérios para classificar contingências como positivas ou 106 negativas, Baron e Galizio (2006b) haviam apresentado um contraexemplo contrastando uma condição de VI 30s e VI 10s para mostrar. Nesse caso, se o rato se deslocasse da caixa onde foi reforçado em VI 10s, isso implicaria que a condição VI 10s seria aversiva. Para eles, essa situação hipotética aponta para a necessidade de utilizar uma abordagem mais compreensiva que considere as funções reforçadoras de estímulos em um contexto mais amplo que inclua condições de reforçamento distintas (como a apresentada). Abandonar a Distinção por Completo Falar Apenas em Reforçamento e Punição. Baron e Galizio (2005) concluem que as ambiguidades apresentadas mostram que não há base para a manutenção da distinção entre os reforçamentos positivo e negativo e que nada seria perdido ao abandoná-la. Como continuação de sua sugestão anterior, Baron e Galizio (2006b) sugerem que além de se descrever tanto as condições pré-mudança quanto pós mudança, é importante analisar se a mudança de uma condição para a outra mantém ou suprime comportamentos. Dessa forma, Baron e Galizio se alinham a Michael (1975) em dizer que o que faz mais sentido é distinguir apenas entre reforçamento e punição. Os autores (Baron e Galizio, 2005) afirmam ter chegado na mesma conclusão de Michael de que os conceitos de reforçamento e punição dão conta da teoria analítico-comportamental e oferecem uma forma de se referir a “prazer” e “desconforto”. Sidman (2006) critica essa substituição acrítica do reforçamento positivo e negativo pelos conceitos de reforçamento e punição. O autor aponta que o conceito de punição também contém seus problemas de definição. Sidman parte da definição de punição como uma consequência que diminui a probabilidade de um comportamento. Diante disso, ele apresenta alguns exemplos que ilustram a inconsistência desse conceito: Quando a correção feita por um professor garante que a resposta errada de um aluno nunca mais ocorra, essa resposta foi punida pelo professor? Quando um responsável 107 faz uma criança parar de comer entre as refeições ao esconder o pote de biscoitos, o ato de comer biscoitos foi punido? Se uma criança para de se comportar mal após ser pedida para parar, esse comportamento foi punido? Quando peço algo e a resposta é "não", o fato de eu não repetir o pedido indica que ele foi punido? (Sidman, 2006, p. 137) Sidman (2006) de alguma forma parece ter usado os próprios argumentos de Baron e Galizio (2005) contra eles próprios com relação, agora, a uma outra distinção. De fato, como distinguir se uma criança foi punida pela resposta errada, ou se condições para a emissão da resposta certa foram apresentadas e ela se estabeleceu? Sobre a crítica de Sidman (2006), Baron e Galizio (2006a) responderam que: Ao longo dos anos, essa visão perdeu força, em grande parte devido à análise convincente de Azrin e Holz (1966), que colocou a punição no mesmo patamar do reforçamento. Segundo eles, a característica distintiva da punição é que ela enfraquece o comportamento, tornando-a, assim, o oposto do reforçamento, que fortalece o comportamento. (Baron e Galizio, 2006a, p. 149). Da mesma forma que o abandono da distinção acabaria prezando por uma parcimônia científica no sentido de diminuir o número de conceitos necessários para se explicar fenômenos, a adoção de uma visão assimétrica de punição proposta por Skinner (1953/2014) também caminha nesse sentido. Sidman afirma que a definição de punição sugerida por Azrin e Holz (1966) foi adotada rapidamente pela comunidade sem discussões extensivas a seu respeito. Nesse sentido, Sidman aponta para o mesmo problema sugerido por Lattal e Lattal (2006) de que uma diferença entre dois conceitos teria sido assumida a priori, sem evidências suficientes para tal. As implicação da distinção entre reforçamento positivo e negativo sobre o conceito de punição serão discutidas mais adiante em um subtítulo dedicada. 108 Ensinar Sobre a Distinção e Abandoná-la. Michael (2006) aponta para o fato de que por conta de a distinção ser tão difundida na área, existe uma necessidade de aprendê-la para que se possa compreender muito do que é e já foi produzido. Nesse sentido, o autor sugere que a distinção seja descrita da forma tradicional, depois que a sua ambiguidade seja apontada e, no resto do tempo, se deixe de usá-la. Assumir Simetria Entre os Reforçamentos Marr (2006), desenvolveu uma longa discussão a respeito da simetria entre conceitos na análise do comportamento e em outras áreas com destaque para a área de controle de estímulos. A partir disso, o autor faz a seguinte sugestão sobre o dilema positivo/negativo: Podemos tirar uma lição da simetria entre discriminação e generalização mencionada anteriormente. Nesse caso, as distinções se baseiam nos procedimentos e nas mudanças de comportamento que desejamos enfatizar. Em ambos os casos, estamos falando de controle de estímulos. (Marr, 2006, p. 128). Para Marr (2006), a discriminação e a generalização são “dois lados da mesma moeda que chamamos de controle de estímulos” (pp. 125-126). A distinção entre elas não está em uma diferença ontológica dos processos, mas no que o analista escolhe enfatizar: em um se enfatiza semelhanças no responder frente a diferentes estímulos e, no outro, diferenças no responder frente a diferentes estímulos. Diante disso, Marr sugere que, enquanto não houver evidências convincentes de uma diferença funcional entre os dois supostos tipos de reforçamento, parece ser mais útil assumir a simetria até que evidências contrárias surjam. Nesse sentido, Marr (2006) problematiza a forma como a distinção é feita dizendo que não existem diferenças funcionais claras ou fundamentais entre o que se convencionou chamar de reforçamento positivo e reforçamento negativo tanto no efeito sobre o comportamento quanto sobre como agem no organismo. Os procedimentos são sim diferentes, mas isso não representaria, para Marr, uma diferença fundamental nos processos. O autor não 109 chega a explicitar, mas talvez nesse sentido ele mantivesse os termos como forma de enfatizar diferentes procedimentos. Sugestões Neutras Falas em que os autores apontaram para a necessidade de se fazer algo não especificamente relacionado ao uso ou desuso da distinção entre os reforçamentos positivo e negativo. Dentre os trechos classificados como “Sugestões Neutras”, identificou-se falas que sugeriam fazer investigações, focar no que é palpável, revisar os termos usados ou adaptar a linguagem usada. Fazer Mais Investigações Investigar o Uso da Distinção em Outras Áreas. Chase (2006) sugeriu que investigar a distinção entre os termos positivo e negativo em outras áreas do conhecimento que fazem uso dela, poderia ajudar a determinar os motivos pelas quais a comunidade de analistas do comportamento também o faz. Isso se relaciona com as possíveis funções culturais da distinção já apresentadas (Chase, 2006; Lattal e Lattal; 2006). Investigar Definições de Operações, Efeitos e Causas. Marr (2006), sugere que um nó precisa ser resolvido a respeito da mistura entre o que seriam procedimentos (ou operações), os efeitos desses procedimentos e as razões para os efeitos observados antes que se possa resolver o dilema da distinção positivo/negativo. Dando como exemplo o caso da extinção: o procedimento seria a remoção de uma consequência reforçadora que está mantendo um comportamento, o efeito seria a diminuição da probabilidade dessa resposta e as razões para a diminuição poderiam ser o estabelecimento de outros comportamentos no lugar desse ou até mesmo um efeito punitivo da extinção. A partir disso, Marr afirma que o procedimento e o efeito do reforçamento são minimamente definidos, mas as razões pelas quais osefeitos ocorrem não. 110 Essa última afirmação é de se estranhar considerando que as explicações para o reforçamento foram muito bem delimitadas por Skinner (1953/2014). O efeito do reforçamento se explica pelo fato de que animais possuírem organismos aptos a, diante da produção de reforçadores, terem a probabilidade das respostas que os produziram aumentada - algo selecionado filogeneticamente. No mesmo sentido, os valores dos reforçadores incondicionados foram estabelecidos filogeneticamente porque indivíduos que tinham tais estímulos como reforçadores tiveram mais chance de sobreviver e reproduzir. Os reforçadores condicionados adquiriram funções semelhantes às dos estímulos aos quais foram sistematicamente pareados. fato, é possível pensar que em um reforçamento alimentar, por exemplo, a operação seja a adição do alimento após uma resposta, o efeito seja o aumento da probabilidade da classe de respostas que o produziu e seria difícil pensar numa “razão para o efeito observado”. Talvez para Marr a diferença fosse que a extinção seria um processo derivado do comportamento, enquanto as razões para o reforçamento estão na história evolutiva das espécies. Como Marr (2006) apontou, umas das possíveis razões para a diminuição na frequência observada poderia ser aumento na frequência de outras respostas. Nesse sentido, o mesmo poderia ser argumentado sobre a punição. Considerando uma punição por choque, a operação seria a adição do choque após a resposta, o efeito observado seria diminuição da probabilidade da classe de respostas que o produziu e a razão para o efeito observado poderia ser, por exemplo, o reforçamento de outros comportamentos. Essa visão sugeriria que a punição seria também um processo derivado do reforçamento (o que estaria alinhado com uma perspectiva assimétrica de punição). A discussão em torno da distinção entre reforçamento positivo e negativo parece esbarrar em um problema conceitual mais fundamental: a falta de clareza e consenso sobre os termos “operação”, “efeito” e “razão” (ou explicação) para os efeitos observados. Como 111 sugerido por Marr (2006), sem uma delimitação clara desses termos, o debate corre o risco de se perder com cada autor enfatizando aspectos distintos do mesmo fenômeno. Enquanto uns focam nas operações (mudanças ambientais observáveis), outros priorizam possíveis razões que explicam alterações. Investigações teóricas sistemáticas que esclareçam essas distinções seriam fundamentais. Elas poderiam não apenas tornar o debate sobre o reforçamento mais produtivo, mas também oferecer maior precisão na formulação de conceitos centrais da área. Investigar a Relação Entre Condicionamento Operante e o Emocional. Como já tratado anteriormente, Staats (2006) argumenta que, quando o comportamento é considerado em sua totalidade, há grandes diferenças entre os reforçadores positivos e negativos. Com base nisso, ele propõe que a relação entre o condicionamento operante e o condicionamento respondente (ou emocional) seja investigada de forma sistemática por meio de estudos básicos com animais, nos quais variáveis comportamentais como privação e saciação sejam manipuladas. O autor cita alguns estudos iniciais realizados com humanos (Harms & Staats, 1978; Staats & Hammond, 1972; Staats & Warren, 1974), bem como análises funcionais de comportamentos humanos (Staats, 1975, 1996), mas não explicita os resultados desses estudos. Sua sugestão se baseia na necessidade de expandir esse campo de pesquisas experimentais com animais e humanos. Realizar Experimentos que Abordem a Distinção. Lattal e Lattal (2006) argumentaram que a distinção entre reforçamento positivo e negativo foi assumida sem que houvesse evidências suficientes que a fundamentassem. Como já discutido no subtítulo “A Distinção Não Tem Fundamentação Experimental Suficiente”, os autores apontaram que as pesquisas realizadas até então não permitiam a formulação de conclusões sólidas, seja porque as diferenças entre os procedimentos comparados iam além das operações envolvidas, seja porque poderiam ser atribuídas a particularidades dos estímulos reforçadores utilizados. Ainda assim, caso houvesse fundamentos para uma distinção formal ou estrutural entre os dois tipos 112 de reforçamento, seria necessário que suas diferenças fossem testadas diretamente por meio de delineamentos experimentais adequados. O problema, apontado pelos próprios autores, é que faltam estudos com esse objetivo específico. Lattal e Lattal (2006) sugeriram que, dada as dificuldades de se comparar o responder mantido por comida e choque, uma comparação indireta, mas sob uma condição comum talvez seja possível. Hearst (1962), por exemplo, comparou a performance de macacos rhesus treinados por reforçamento alimentar e esquiva de choque. A generalização de ambos foi comparada e o gradiente de generalização da esquiva por choque era mais achatado (indicando maior generalização). Outro exemplo foi o de Nevin (1974), que testou a resistência à mudança de dois treinos diferentes frente a um mesmo disruptor e identificou que esse tipo de comparação pode ser útil para investigar se há diferenças empíricas entre respostas mantidas por condições nominalmente distintas de apresentação e remoção de estímulos. Muitos dados úteis podem ser tirados da comparação entre esquemas mantidos pelo que é tipicamente chamado de reforçamento positivo ou negativo, mas os parâmetros pelos quais isso é possível são muito limitados. Levando em conta o que já foi discutido sobre todos os reforçadores (incluindo a sua ausência) poderem ser vistos como parte de um contínuo, qual padrão (i.e., topografia) e intensidade de choque deveriam ser usados numa comparação com o responder mantido por uma pelota de determinado alimento? Hearst (1962) especificou qual o alimento usado, mas não apresentou qualquer critério para a escolha do choque (padrão, intensidade, duração, intervalo etc.). O que garantiria, nesse caso, que as diferenças observadas entre os gradientes de generalização tinham a ver com diferenças nos tipos de reforçamento e não com as magnitudes dos reforçamentos providos pelos estímulos específicos? Se conclusões não podem ser tiradas nem quanto aos estímulos específicos, 113 seguindo a lógica de Lattal e Lattal (2006), menos ainda poderia ser dito sobre as diferenças entre reforçamento positivo e negativo. Outro problema que poderia ser apontado no experimento, mas que não foi comentado por nenhum autor do debate, é que o critério estabelecido por Hearst (1962) para a comparação foi referente ao nível de discriminação entre as condições SD e SΔ para os dois reforçadores em porcentagem. Os números brutos não foram explicitados, mas esse critério significa que os macacos poderiam estar emitindo centenas de respostas num reforçamento e algumas dezenas na outra. Diferenças no gradiente poderiam também ser atribuídas a isso. Como sugeriram Lattal e Lattal (2006), quando se comparam dois estímulos diferentes, algum fator comum deve ser estabelecido. Se a frequência de respostas for escolhida como fator comum, dever-se-ia estabelecer, considerando um alimento específico e uma privação específica, qual intensidade de um tipo de choque produziria uma frequência de respostas igual. Somente assim seria possível dizer que dois reforçadores (pelo menos sob o padrão de frequência de respostas) seriam equivalentes. Se isso é possível ou não de ser feito, é uma questão experimental. Uma quantidade enorme de variáveis com seus próprios padrões deveria ser levada em conta. Em pesquisas de reforçamento positivo, por exemplo, uma operação estabelecedora que cresce ao longo do tempo está em vigor o tempo todo, mas cada alimento produzido também funciona como operação abolidora. Em uma situação de esquiva por choque, frequentemente, a operação estabelecedora reflexiva/reforçadornegativo condicionado aparece e some por completo rapidamente repetidas vezes, e a sua função aversiva sofre efeitos dinâmicos similares aos da privação-saciação, como atesta o fenômeno do paradoxo da esquiva. As delimitações seriam tão específicas que talvez os resultados de uma pesquisa dessa natureza não pudessem ser generalizáveis para sequer outros tipos de choque ou alimento. Além disso, para que se pudesse atribuir diferenças entre os reforçadores tipicamente 114 considerados positivos ou negativos, muitos reforçadores de cada tipo precisariam passar pelos mesmos testes. Reforçadores ditos do mesmo tipo também deveriam ser comparados e, as diferenças encontradas entre eles deveriam ser qualitativamente diferentes de alguma diferença comum entre todos os reforçadores de cada categoria (Magoon et al., 2017). Investigar o Reforçamento em Si. Marr (2006) sugeriu que há pouco sentido em continuar discutindo distinções entre tipos de reforçamento se o próprio reforçamento ainda não está bem compreendido. Além da distinção entre positivo/negativo, ele cita dois outros exemplos de confusões: supostas distinções entre as propriedades discriminativas e reforçadoras dos estímulos e as condições necessárias e suficientes para a aquisição e manutenção do comportamento de esquiva. Marr (2006) não elabora mais profundamente sobre esses pontos, então é difícil saber a que supostas confusões nesses campos ele estava se referindo. Ainda assim, como sugerido por diversos autores (i.e., Baron e Galizio, 2005; Chase, 2006; Iwata, 2006; Lattal e Lattal, 2006) a distinção pode ter uma função prática a respeito de como se analisam, descrevem ou aplicam os conceitos de reforçamento que podem ser úteis. Como já comentado, pode ser que uma vantagem da distinção seja justamente que investigações a respeito da distinção estejam funcionando para revelar lacunas em outras definições como reforçamento, estímulo, operações motivadoras etc. O próprio texto de Marr e o presente trabalho são exemplos disso. A descrição das condições pré e pós-mudança foi, inclusive, uma sugestão de Michael (1975) apresentada durante sua discussão sobre a distinção. Talvez abandonar a discussão sobre a distinção para focar na definição de reforçamento acabasse sendo contraprodutivo nesse sentido. Investigar o Próprio Comportamento de Distinguir. A partir da noção de que o comportamento dos cientistas é também governado por regras, Baron e Galizio (2006a) 115 incentivam os analistas do comportamento a revisarem as funções de seus próprios comportamentos verbais ao falar de reforçamento e considerarem alternativas. Sobre isso, vale comentar que regras de fato são capazes de controlar comportamentos, mas são limitados enquanto estímulos antecedentes. No fim das contas, o que determinará quais comportamentos serão ou não mantidos serão as consequências produzidas por eles. A sugestão de Baron e Galizio (2006a) provavelmente assume que o que for produzido pelo seguimento dessas regras seria mais reforçador, mas isso parece ir na contramão do fato de que, na prática, a distinção vem sendo mantida. Investigar os Motivos da Manutenção. Chase (2006) apontou que, apesar de a argumentação de Baron e Galizio (2005) sobre a ambiguidade da distinção ser lógica e precisa, faltou apresentar explicações “sólidas” sobre o porquê de a distinção ter sido mantida desde a publicação de Michael (1975). Lattal e Lattal (2006) demonstraram ter uma opinião parecida: “se as diferenças formais entre reforçamento positivo e negativo não são sustentáveis e as diferenças funcionais são, no mínimo, questionáveis, resta responder por que a distinção persiste” (pp. 130-131). Iwata (2006) pontuou que as explicações dadas por Baron e Galizio (2005) se resumiam aos termos estarem muito bem estabelecidos na área e uma mudança terminológica seria muito trabalhosa, mas argumentou que nenhuma dessas explicações é suficiente para justificar a manutenção dos termos na pesquisa e na prática. Diante disso, Chase (2006) sugeriu que o campo fosse em busca dessa resposta, seja na forma de uma pesquisa que analisasse textos e livros em análise do comportamento ou um questionário com os professores da área. Na falta de uma pesquisa que possa responder essa pergunta, Chase se propôs a oferecer algumas possíveis explicações para a manutenção. Vale ressaltar que não é como se Baron e Galizio (2005) não tenham apresentado possíveis explicações para a manutenção da distinção ao longo dos anos - 11 possibilidades 116 foram identificadas por eles. Parece ser o caso de que, para Chase (2006), Lattal e Lattal (2006) e Iwata (2006), as explicações oferecidas por Baron e Galizio foram insuficientes. As possíveis explicações oferecidas por Baron e Galizio (2005), bem como dos outros autores, foram apresentadas no subtítulo de “Explicações para a Manutenção”. Focar no Que É Palpável Nakajima (2006), de forma similar a Marr (2006) e Sidman (2006), sugere que analistas do comportamento devem focar mais na identificação explícita de variáveis ambientais que possam ser diretamente manipuláveis do que em especulações. Revisar os Termos Para Baron e Galizio (2006a), os diversos exemplos interpretativos apresentados por eles para demonstrar a fragilidade e ambiguidade da distinção, apontam para uma necessidade de reavaliar a terminologia usada para falar de reforçamento. Adaptar a Linguagem Lattal e Lattal (2006) destacam que, ao se comunicar com pessoas leigas, o analista do comportamento pode e deve adaptar sua comunicação para torná-la mais acessível e compreensível, mas somente se ele dominar o conceito em nível técnico e científico. Dessa forma, ele será capaz de englobar sutilezas teóricas importantes, evitando simplificações que distorçam o conceito. Esclarecimentos Em determinadas falas, Baron e Galizio responderam comentários gerais ou pontuais presentes nas falas dos outros autores de forma a esclarecer possíveis equívocos assumidos quanto à sua proposta. Naturalmente, essas falas só poderiam ser encontradas nos textos de resposta escritos por Baron e Galizio, dirigidos aos demais participantes do debate. Ainda assim, as seis falas dessa categoria foram todas retiradas do primeiro texto resposta (Baron e Galizio, 2006a). Uma explicação possível é que muito do que eles poderiam responder no 117 segundo texto já havia sido dito no primeiro, afinal, segundo eles próprios: “uma releitura de nosso artigo original e de nossa resposta anterior aos críticos revelará que grande parte do terreno já foi percorrido” (Baron & Galizio, 2006b). Os pontos aqui apresentados serão entendidos como representativos do que Baron e Galizio tentaram mostrar mesmo que tivessem falhado em fazê-lo seja por conta de más interpretações de suas falas ou até suas próprias contradições (alguns casos desse tipo foram discutidos até então). Os pontos apresentados a seguir devem ser considerados tendo em vista todas as exposições em discussões já colocadas. Em primeiro lugar, Baron e Galizio (2006a) defendem o foco em operações específicas ao invés do foco em eventos menos acessíveis. O ponto deles é, inclusive, que este foco vem, muitas vezes, sendo abandonado em favor da distinção positivo/negativo. Em segundo lugar, Baron e Galizio também não defendem que descrições sejam feitas de formas inconvenientes. De fato, é mais fácil falar de adição de dinheiro do que subtração de uma condição sem dinheiro. Em terceiro lugar, ao contrário do que Sidman parece ter atribuído a eles, Baron e Galizio (2006a) não estão propondo uma nova convenção terminológica nem uma mudança nos princípios básicos. Segundo os próprios autores, eles estavam apenas “apontando algumas dificuldades inerentes à convenção de distinguir entre reforçadores positivos e negativos com base no início ou término da energia de estímulo” (p.148). Em quarto lugar, ainda respondendo à Sidman, os autores acreditam que a relevância social tem papel fundamental na atividade científica e que o cientista, enquanto membro da sociedade deve estar atento às implicações sociais de seu trabalho. Eles apontam que tanto eles como Michael e Sidman estão de acordo que o uso social de estímulos aversivos como forma de controle faz com que o cientista precise estudá-los. 118 Em último lugar, Baron e Galizio (2006a) concordam com os outros autores que há muito a ser explorado para se falar melhor sobre as coisas “boas” ou “ruins” de uma perspectiva analítico-comportamental, e os autores esperam que essa discussão estimule a investigação dessas questões. A partir dessas falas, muitos elementos confusos no texto de Baron e Galizio (2005) devem ter sido elucidados. Baron e Galizio (2006a) defendem, portanto, o foco em operações observáveis, manipuláveis e mensuráveis e descrições práticas e objetivas das mudanças ambientais reforçadoras. Como eles já haviam respondido, os exemplos usados por eles que remetiam a estados internos hipotéticos, por exemplo, haviam sido retirados da literatura consultada como exemplos. Baron e Galizio (2006a) argumentam que Sidman (2006) se enganou em dizer que eles estavam “propondo uma nova convenção terminológica” ou uma “mudança nos princípios básicos”. De fato, há alguns trechos em seu artigo original que sustentam essa fala. Ao final de seu texto, Baron e Galizio (2005) disseram: “em resumo, se formos continuar a falar sobre dois tipos de reforçamento, aconselhamos cautela quanto às formas de uso desses termos”. Isso fora apresentado anteriormente como “Sugestão para Manutenção”. Em seguida, eles afirmam que a distinção parece ter funções comunicativas úteis e já está tão presente na área que talvez isso já fosse motivo suficiente para continuar ensinando a distinção para novos alunos. Em outros momentos, entretanto, eles defendem que o uso dos termos positivo e negativo são prejudiciais para análise do comportamento e sugere que eles sejam substituídos por uma descrição das condições pré e pós mudança e se recorra somente à classificação reforçamento e punição (ver “Sugestões para o Abandono”). Embora eles descrevam que o objetivo era apontar problemas com a distinção e apresentar possíveis sugestões tanto para a manutenção quanto para o abandono, indicando algumas possíveis vantagens e desvantagens, em muitos trechos foram identificadas frases em 119 que eles se posicionam claramente a favor do abandono, por exemplo: “embora vários argumentem que a distinção entre os reforçamentos positivo e negativo deva ser preservada, seus argumentos não nos convenceram de que os benefícios dessa distinção superem suas limitações” (Baron e Galizio, 2006a, p. 150). Esses fatores explicam, de certa forma, porque Sidman (2006) teria atribuído a eles um projeto de alterar a terminologia da área. 120 Discussões Gerais Os tópicos a seguir trarão discussões que abordam temas que estiveram presentes em diversos dos textos, mas que faria pouco sentido serem abordados individualmente. A Confusão da Distinção Um argumento que acabou sendo pouco abordado no debate dado que era parte da argumentação inicialmente trazida por Michael (1975), foi o de que a distinção é confusa. Como mencionado, isso dizia respeito ao fato, principalmente, de que seu uso tenha mudado ao longo do tempo. Sidman (2006) foi o único que abordou esse argumento diretamente, demonstrando forte concordância e apontando para aspectos em sua experiência que sustentavam essa noção. Segundo ele, novos alunos ou leitores de análise do comportamento, após aprenderem o conceito de reforçamento tendem a assumir precocemente, que “reforçamento negativo”, enquanto seu oposto, signifique o que se chama de punição. Parte do problema com a má interpretação do termo “reforçamento negativo” provavelmente advém do que se entende por “oposição”. A partir de um entendimento abrangente do termo, poder-se-ia tanto pensar que o oposto de “um aumento na frequência de resposta causado pela adição de um estímulo” poderia ser 1) “uma diminuição na frequência de resposta causado pela adição de um estímulo” (o que se chama de punição positiva); 2) “um aumento na frequência de resposta causado pela subtração de um estímulo” (o que se chama de reforçamento negativo); ou até 3) “uma diminuição na frequência de resposta causado pela subtração de um estímulo” (o que se chama de punição negativa). Isso porque “reforçamento positivo” é uma dupla de termos, diante da qual qualquer um dos dois termos (ou ambos) podem ser “invertidos” para gerar algo que seria, pelo menos no senso comum, adequadamente chamado de oposto. Com relação este aspecto apontado por Baron e Galizio (2005) e discutido por Sidman (2006), seriam sugestões para estudos futuros sobre o tema que 1) a busca outros 121 termos para se referir às relações de reforçamento positivo e negativo que pudessem gerar menos problemas (e.g., reforçamento aditivo e subtrativo, enfatizando as operações matemáticas de adição e subtração); 2) a avaliação de diferentes estratégias utilizadas por professores de análise do comportamento no ensino desses conceitos com o objetivo de isolar as funções didáticas dos problemas conceituais atribuídos à distinção do reforçamento positivo e negativo. A Distinção É Semântica Um ponto que foi abordado extensamente por Baron e Galizio (2005, 2006a, 2006b) é o de que a distinção positivo/negativo está, puramente, na forma de se descrever uma mudança. Fazer uma descrição na sua forma positiva ou negativa é uma escolha do falante. Os autores, entretanto, não se aprofundam sobre o porquê de isso acontecer. Quando Chase (2006) argumentou que o experimento de Weiss e Laties (1961) é um exemplo fraco porque “calor” e “frio” são opostos, talvez não tenha ficado evidente que esse é justamente o dilema: se qualquer mudança ambiental pode ser descrita numa direção ou na outra, a classificação entre positivo e negativo é arbitrária. O argumento foi perfeitamente ilustrado por ele quando pontuou que as mudanças “aumento na atenção” e “diminuição na restrição física” possuem, cada uma, suas versões opostas: “diminuição de períodos sem atenção” e “aumento de períodos sem restrição física”. O ponto de Baron e Galizio (2005) não é dizer que o “aumento da atenção” e a “diminuição da restrição física” sejam uma mudança só, mas sim dizer que cada uma dessas mudanças não deveria ser classificada como positiva ou negativa porque descrevê-las assim (e não em sua forma oposta) resume-se a uma escolha linguística e não a uma característica fundamental da mudança. O mesmo pode ser observado nas frases “eu quero ficar em casa” e “eu não quero sair de casa” que contém duas inversões e são, portanto, equivalentes. O mesmo ocorre na 122 matemática quando se declara que uma operação de subtração de um número positivo ou a adição do mesmo um número, só que negativo, são equivalentes (i.e., 3 - 1 = 2 e 3 + (-1) = 2). O exemplo de Weiss e Laties (1961) não foi apresentado por Baron e Galizio (2005) para dizer que não se sabe qual das duas mudanças é a mais relevante - até porque são uma mudança só - mas para ilustrar como qualquer mudança poderia ser descrita tanto como adição quanto como subtração. De fato, dizer que um comportamento aumentou de frequência porque “dinheiro seguiu a resposta” soa melhor do que dizer que a resposta aumentou de frequência por “eliminar um período de menos dinheiro”. Ainda assim, o fato de uma forma de escrita ter se tornado tradicional e, portanto, outras soarem estranhas, não justifica a pressuposição da existência de dois processos distintos. Calor e frio, luz e escuro são pares de opostos com alta prevalência na experiência cotidiana, o que torna esperável que qualquer comunidade13 Lista de Tabelas Tabela 1 - Categorias de análise utilizadas no grifo dos textos...............................................46 14 Considerações Sobre o Processo de Produção do Presente Trabalho Inicialmente, considero importante ressaltar alguns aspectos sobre a produção deste trabalho e explicitar algumas variáveis que controlaram o meu próprio comportamento nesse processo. Era uma ideia inicial deste projeto estudar os textos que serão aqui analisados enquanto produtos dos comportamentos dos autores que os produziram – fruto das variáveis ambientais desses autores. Além disso ter se revelado uma proposta trabalhosa, a pesquisa se limitaria apenas a fazer um punhado suposições com base no material disponível – o que foi entendido como um trabalho pouco frutífero. Optei, ao invés disso, por fazer uma sistematização, análise e interrelação do conteúdo desses argumentos. Outro ponto relevante a respeito do projeto inicial é que eu o havia escrito inteiramente em primeira pessoa. Tanto isso quanto o interesse inicial em estudar o comportamento de autores da análise do comportamento sugiram da vontade de manter explícito que esta produção (assim como qualquer outra) é produto do comportamento de pessoas específicas e de suas variáveis ambientais. As falas, as tabelas, os gráficos, as opiniões, os acertos e os erros deveriam poder ser vistos como produtos dos comportamentos de pessoas específicas e não dados objetivos que se revelaram num vácuo durante a investigação. Escrever e ler um projeto inteiro em primeira pessoa, incialmente, me gerou certa estranheza (compartilhada por outros leitores), provavelmente advinda de um treino extenso de leituras e escritas em uma outra forma. Conto que, ao final desse processo, esse já não era mais um incomodo pessoal, mas entendo que esse não seria o caso para um novo leitor. Assim, apesar de a escrita em primeira pessoa ir ao encontro das próprias diretrizes do Manual de Publicação da American Psychological Association (APA), os autores que fazem parte tanto da comunidade científica da análise do comportamento enquanto área de pesquisa quanto de outros campos das ciências naturais como um todo, tipicamente escrevem seus 15 textos em terceira pessoa. Nesse sentido, optei por manter estas ressalvas em primeira pessoa, mas seguir com o texto em terceira pessoa de forma a facilitar possíveis leituras, citações e publicações futuras. Estrutura Geral da Introdução Este trabalho se aprofundará em discussões a respeito da manutenção ou abandono da distinção entre as definições de reforçamentos positivo e negativo. Para que isso seja possível, primeiro serão trazidas e discutidas algumas definições conceituais. Este segmento do trabalho consistirá numa exposição inicial dos conceitos de reforçamento e reforçadores. Em seguida, será feito um breve resumo do artigo de Santos e Leite (2013) que analisaram diferenças entre as definições de reforçadores positivos e negativos em diversas obras. Em seguida serão apresentadas diferentes definições para os conceitos de reforçadores positivo e negativo, com base na revisão de literatura de Santos e Leite (2013) e em outras obras não contempladas na revisão desses autores – com foco especial nas diferenças identificadas entre as definições. Após essa discussão inicial das definições e diferenças entre os conceitos de reforçamento e reforçadores positivos e negativos, será introduzido o texto de Michael (1975) que foi um dos primeiros a discutir a possibilidade de se abandonar a distinção positivo/negativo e que deu origem ao debate que será analisado no presente trabalho. Será apresentado então o trabalho de Possmoser (2015), que investigou as referências feitas à Michael (1975) até 2014, se aprofundando nos textos envolvidos no debate de 2005/2006 sobre o tema do abandono/manutenção da distinção entre reforçamento positivo e negativo publicado pela revista The Behavior Analyst. A fim de aprofundar o trabalho de Possmoser, o problema de pesquisa da presente pesquisa será delineado partindo dele. 16 Definição de Reforçamento Segundo Catania (1992, p. 71), o termo “reforçamento” pode ser tanto entendido como a apresentação de consequências reforçadoras após uma resposta1 (i.e., uma operação) quanto como um aumento na probabilidade futura do responder gerado pela apresentação dessas consequências (i.e., um processo). Ele apresenta os seguintes exemplos de reforçamento dos quais outros fatores importantes podem ser destacados: 1) um rato privado de água cujas respostas de pressão à barra se tornam mais prováveis quando produzem água do que quando não produzem; 2) um pombo privado de alimento cujas respostas de bicar se tornam mais prováveis quando elas produzem alimento do que quando não produzem; e 3) o choro de uma criança se torna mais provável quando produz a atenção dos pais do que quando não produz. Nos três exemplos, Catania (1992) deixa implícita uma diferença entre dois contextos: em um, o reforçador é produzido e, nesse contexto, a resposta aumentaria de probabilidade e, no outro, o reforçador não é produzido e sua probabilidade seria menor. Além disso, nos primeiros dois exemplos, Catania também menciona as variáveis motivacionais envolvidas, que tornam certas alterações ambientais relevantes para um organismo (e.g., privação de água ou alimento tornando esses eventos relevantes enquanto reforçadores). Um último aspecto trazido por Catania (1992) é a distinção entre contiguidade (i.e., justaposição temporal ou espacial entre eventos) e contingência (i.e., relação de dependência entre uma resposta e um estímulo). Embora essas relações possam coexistir, a contiguidade por si só pode ser suficiente para manter uma resposta, como mostram os experimentos de Skinner (1948) sobre comportamento supersticioso. Assim, embora a contingência possa garantir uma contiguidade mais sistemática, é a contiguidade, e não a contingência, o fator essencial para que o reforçamento ocorra. _________________ 1 Entender-se-á por “resposta” qualquer ação de um organismo. 17 Reforçamentos Positivo e Negativo Uma “alteração ambiental reforçadora” (ou “consequência reforçadora” quando há especificamente uma relação de contingência) pode ser entendida como qualquer alteração ambiental (i.e., operação) que quando segue, sistematicamente, uma classe de respostas do organismo, aumentará a frequência de emissão dessa classe (dadas condições motivacionais e discriminativas semelhantes). O reforçamento, por sua vez, pode se dividir em duas categorias a partir do tipo de consequência reforçadora envolvida. Quando o aumento na frequência de determinada classe de respostas é causado pela adição de um estímulo2 ao ambiente, o processo é chamado de reforçamento positivo. Quando o aumento na frequência da classe de determinada classe de respostas é causado, ao contrário, pela subtração de um estímulo do ambiente, o processo é chamado de reforçamento negativo (Skinner, 1953/2014). Assim Skinner (1953/2014) define e exemplifica esses mesmos conceitos: Eventos que se mostram reforçadores são de dois tipos. Alguns reforçamentos consistem na apresentação de estímulos, na adição de algo — por exemplo, comida, água ou contato sexual — à situação. A esses chamamos de reforçadores positivos. Outros consistem na remoção de algo — por exemplo, um ruído alto, uma luz muito intensa, frio ou calor extremos, ou um choque elétrico — da situação. A esses chamamos de reforçadores negativos. Em ambos os casos, o efeito do reforçamento é o mesmo: a probabilidade da resposta é aumentada. Não podemos evitar essa distinção argumentando que o que é reforçador, no caso negativo, é a ausência da luz intensa, do _________________ 2 Entender-se-á por “estímulo” qualquer evento do ambiente que afete o comportamento de um organismo.verbal desenvolva termos para ambos. Já eventos como dor de cabeça ou choque são, em geral, menos frequentes, o que faz com que se fale mais comumente sobre sua presença do que sobre sua ausência. No entanto, quando se tornam recorrentes — como nos casos de enxaqueca crônica ou em experimentos com choques — surgem condições para nomear seus períodos de ausência, como “período interictal” e “período de segurança”. Assim, tanto faz dizer que houve apresentação de um estímulo ou remoção do seu oposto: o fenômeno de reforçamento permanece o mesmo. A forma geral como a física, por exemplo, buscou solucionar esses conflitos gerados pela própria linguagem tem a ver com a investigação da materialidade das coisas e com convenções estabelecidas por eles a partir das quais determinaram que a luz e o calor seriam chamados de coisas, mas o escuro e o frio, não (para um exemplo sobre a luz, ver Rocha et al., 2021). A forma como a análise do comportamento trata essa questão será mais bem discutida no subtópico seguinte. 123 Vale ressaltar que Baron e Galizio (2005, 2006a, 2006b) não sugeriram necessariamente que se abandonem os termos “adição” e “subtração” (e seus equivalentes). Enquanto descrições de procedimentos que podem ser entendidos e replicados, tais termos costumam cumprir sua função (mesmo que algumas informações fiquem apenas implícitas). O argumento central, novamente, é que a forma como se descreve um procedimento (dentre outras possíveis formas de descrevê-lo) é uma preferência, e, com isso, as definições de reforçamento positivo e negativo, baseadas na descrição das operações de mudança, pode tornar-se confusa quando uma descrição incomum dos eventos for a escolhida. Em conclusão, a ambiguidade da distinção parece ter a ver com o fato do fato de que a comunidade verbal treina seus membros para, ao mesmo tempo, dar nomes específicos para 1) estímulos que diferem quanto a intensidade em uma mesma propriedade (e.g., diferentes temperaturas como calor e frio) e 2) direções diferentes de uma mudança dentro de um mesmo contínuo (adição, subtração). Se um termo para “esfriar” não tivesse sido criado, seria dito apenas que um objeto perdeu calor ou ganhou calor - sem nenhuma perda de sentido. Colocado de outra forma: a ambiguidade existe porque a linguagem utilizada permite que termos opostos possam ser usados/criados para descrever um mesmo fenômeno ambiental. A Ausência como um Estímulo Nakajima (2006) mencionou preferir a descrição de que “calor foi adicionado” ao invés de que “frio foi subtraído” porque o calor seria algo físico enquanto a frieza seria um estado hipotético do rato que significa “ausência de calor”. Entretanto, como já discutido, assim como o calor é um estímulo capaz de eliciar e evocar respostas o frio (i.e., ausência de calor) também é. Quando se fala de reforçamento, necessariamente se está falando da mudança de uma condição para outra que é contingente (ou contígua) a uma classe de respostas (Michael, 1975). Tais condições devem diferir entre si, obrigatoriamente, quanto a pelo menos um 124 aspecto: numa condição, uma propriedade de estímulo particular deve estar mais intensa e, na outra, menos intensa, a despeito da ordem. Outras alterações concomitantes entre as condições podem ou não afetar o efeito desse reforçamento, mas isso não muda o aspecto essencial de ausência e presença de um estímulo. Quando um estímulo é subtraído, o que está sendo fundamentalmente colocado em seu lugar é sua própria ausência - ou um estímulo com uma intensidade mais baixa em uma de suas propriedades. Considerando o caso em que uma criança emite mandos que fazem sua mãe retirar a folha de atividades que está à sua frente (demanda): não importa o que quer que concretamente esteja atrás daquela folha (e.g., uma mesa, uma prancheta ou uma folha em branco), o único elemento fundamental para que seja mantida a ocorrência do mando é a ausência da folha de atividades. É provável que fosse “ao que está atrás da folha” que Marr (2006) se referia quando disse que “o que acontece depois parece irrelevante” (p. 127). Isso também se aplica ao exemplo em que a criança vai para uma sala de time-out: o que mantém o comportamento não é o que há na nova sala, mas a eliminação da condição anterior (a presença da demanda). Em ambos os casos, tanto a condição antecedente quanto a subsequente importam apenas nos aspectos que forem relevantes para o reforçamento - e “não importam” nos aspectos que não forem. Dada a mudança relevante (da presença para a ausência da demanda), pouco importam, em vias gerais, os demais elementos de ambos os ambientes. Se a noção de que a ausência de um estímulo possa ser um estímulo específico não parecer convincente, vale ressaltar que Skinner (1953/2014) afirma: “quando dizemos que o comportamento é função do ambiente, o termo ‘ambiente’ presumivelmente significa qualquer evento do universo capaz de afetar o organismo” (p. 281). Nesse sentido, o frio, o escuro, o silêncio, entre outras “ausências de estímulo” que tiverem funções evocativas, eliciadoras ou até reforçadora condicionada poderão ser considerados estímulos. 125 Outro exemplo óbvio de como a “ausência de um estímulo” pode (e costuma) ser considerada um estímulo na análise do comportamento refere-se à noção de “estímulo delta”. Quando numa discriminação operante um rato passa a pressionar uma barra diante da presença de uma luz e para diante da ausência dessa luz (i.e., escuro), à “ausência da luz” se atribui a função de estímulo delta. Sem nenhum problema, as condições poderiam ser invertidas e a “ausência da luz” se tornaria o estímulo discriminativo. A discriminação entre um estímulo específico e sua ausência pode, em teoria, ocorrer com qualquer estímulo - sem a necessidade de que existam palavras específicas para se referir a ambos. A presença de um choque pode adquirir função discriminativa (Azin & Holz, 1961), enquanto a “ausência do choque” adquire função de estímulo delta. Vale ressaltar que, nos exemplos apresentados, o único critério de diferença entre as duas condições de estímulo são especificamente a presença e ausência de um estímulo. Tanto a presença quanto a ausência de um estímulo são observáveis e mensuráveis. Tocar na grade da caixa experimental revelará a presença ou ausência do choque, bem como usar um multímetro. Uma possibilidade para lidar com a possível estranheza gerada por dizer que “a ausência de um estímulo é um estímulo” é pensar que, concretamente, tanto a presença como a ausência de estímulos se manifestam enquanto intensidades distintas de propriedades específicas de um estímulo. Sob esse parâmetro, os estímulos seriam considerados “opostos” porque duas intensidades diferentes de uma propriedade não podem estar presentes num mesmo estímulo. A presença ou ausência da luz por exemplo existe, concretamente, enquanto uma lâmpada que está acesa ou apagada. Que problemas de definição podem ser gerados por estímulos cuja intensidade varia dentro de um contínuo é um fato que já foi reconhecido por muitos autores antes e dentro do debate analisado neste trabalho (e.g. Catania, 1992; Sidman, 2006; Iwata, 2006; Chase, 2006). O trabalho de Baron e Galizio (2005) mostrou, entretanto, que essas dificuldades não se 126 limitam a esse tipo de estímulo: descrições das versões opostas de estímulos sempre são possíveis. Como já comentado anteriormente, qualquer mudança de estímulo pode ser entendida como uma variação na intensidade de uma das propriedades do estímulo - mesmo que uma das intensidades seja zero. Operações e Efeitos Um dos temas que mais surgiram ao longo do debate diz respeito à noção de operações – termo que, segundo Catania (1992), refere-se ao procedimento aplicado. Muito autores (i.e., Iwata, 2006; Marr, 2006; Nakajima, 2006; Sidman, 2006), em alguma medida, criticaramBaron e Galizio (2005) por seu uso de estímulos hipotéticos, não-observáveis, não- manipuláveis ou de difícil descrição em sua argumentação. Alguns deles argumentaram que quando critérios de observabilidade ou manipulabilidade fossem aplicados à operação analisada, confusões ligadas à distinção entre os reforçamentos positivo e negativo sumiriam. Baron e Galizio (2006a) contrapuseram essa noção com o exemplo da dor de cabeça, no qual uma pessoa toma uma aspirina “para” eliminá-la. Como eles sugeriram, a operação observável e manipulável nesse caso seria a adição da aspirina e a eliminação da dor de cabeça seria um efeito posterior. Considerando que o efeito do medicamento pode demorar vários minutos, isso faz ainda mais sentido. Não há uma resposta contígua à eliminação da dor de cabeça que estaria sendo fortalecida. Fato é, que tanto a dor de cabeça quanto a sua eliminação são eventos não observáveis publicamente. Uma possível descrição dessa contingência seria que diante da operação estabelecedora “dor de cabeça”, respostas que produzirem a aspirina tenderão a aumentar de frequência (uma descrição que pelos critérios sugeridos seria considerada reforçamento positivo). Baron e Galizio (2006b) chegaram a apontar que Nakajima (2006), como um dos autores que advogou pelo do critério de observabilidade e manipulabilidade, não abordou especificamente esse exemplo da aspirina. 127 Um último adendo é sobre a recomendação focar exclusivamente nas variáveis observáveis do ambiente. A distinção observável/não-observável refere-se, especificamente, a capacidade de terceiros observarem uma mudança, afinal, se não todos os estímulos deveriam, por definição, ser considerados observáveis. Embora coerente com os princípios da análise do comportamento no sentido experimental, esse foco pode também levar a uma limitação semelhante àquela imposta pelo behaviorismo metodológico. Como apontado por Andery et al. (2009) estímulos não podem sofrer restrições metodológicas. O ambiente é composto tanto por estímulos públicos quanto privados. O foco exagerado nas operações pode acabar deixando outros fatores relevantes de lado. Retoma-se o caso do uso de drogas que, para Crowley (1972), pode inicialmente ser mantido por reforçamento positivo, mas depois por reforçamento negativo (i.e., por conta da abstinência). Apesar de sempre tratar de uma mesma operação observável (adição da droga no organismo), de fato, o uso de droga pode se dar de formas muito diferentes e importantes de serem consideradas. O uso de drogas ligado a sensações da droga, o uso de drogas ligado à aprovação social, o uso de droga ligado a remoção de sintomas de abstinência e o uso de drogas ligado a “desinibição” ou “relaxamento” são todos usos muito distintos (e que podem se misturar). Uma possibilidade é olhas para as diferentes operações motivadoras envolvidas em cada um. Apesar de as operações (no sentido de procedimentos) serem iguais, que fatores será que estão estabelecendo o valor da droga como reforçador? Ao excluir os eventos privados sob o argumento de que não são passíveis de observação direta por terceiros, corre- se o risco de descartar fenômenos relevantes apenas por não serem, no momento, acessíveis com os recursos disponíveis. Skinner (1974) alerta que, embora o behaviorismo metodológico tenha sido importante para afastar explicações mentalistas, ele acabou desconsiderando aspectos do comportamento que, embora privados, são produtos legítimos das mesmas variáveis ambientais que moldam o comportamento público. Assim, esse compromisso estrito 128 com a observação pública também pode acabar afastando a análise do comportamento de seu objeto de estudo: os comportamentos, sejam eles públicos ou privados. Condições Pré-mudança e Pós-mudança Um ponto que pode não ter sido bem compreendido diz respeito à sugestão de Michael (1975) de, ao invés de falar de estímulos adicionados ou retirados, passar a descrever condições ambientais pré e pós-mudança. Como pode ser observador na Michael foi pouco explícito a respeito de como fazer tais “descrições completas das condições pré e pós- mudança”, que, segundo ele, estariam sendo negligenciadas em favor de se fazer uma distinção positivo/negativo. Como já indicado na Introdução, o termo “condição de estímulo” foi adotado por Michael (1975), para se referir a um estado estático de estimulação (e.g., uma intensidade específica de um estímulo) em oposição a uma “mudança de estímulo” que se refere à mudança de uma condição de estímulo para outra. Nesse sentido, as “condições de estímulo pré-mudança” e as “condições de estímulo pós-mudança” nada mais são que as condições antecedentes e subsequentes a uma resposta reforçada. O próprio Michael admite que, pelo menos na linguagem de Skinner (1953/2014), “condição de estímulo” e “estímulo” seriam sinônimos. Vale ressaltar que o termo “condição” é usado por Michael, em geral, para se referir a um único estímulo enquanto outros autores (incluindo Baron e Galizio, 2005, 2006a, 2006b) usam o termo para se referir a uma situação como um todo - como sinônimo de “contexto antecedente”. Na mesma linha, Baron e Galizio (2006a) sugeriram que um problema na área é que, frequentemente, consequências que envolvem mudanças complexas de uma condição para a outra são tratadas como eventos discretos. Os autores apresentaram diversos exemplos que ilustravam que sempre que uma condição de estímulo estava sendo adicionada, outra estava sendo subtraída. Esse foi o caso dos contrastes entre atenção e solidão, dinheiro e período sem 129 dinheiro, desenho animado na televisão e tédio ou entre aspirina e dor de cabeça. Quando o primeiro evento do par é adicionado, na visão dos autores, o segundo elemento é subtraído simultaneamente. Sobre isso, os autores foram criticados diversas vezes por terem recorrido a muitos termos imprecisos, hipotéticos e/ou não-observáveis (e.g., solidão, tédio e fome) como condições pré-mudança – algo que eles reconheceram em sua resposta (Baron & Galizio, 2006a). Marr (2006), particularmente, chegou a contestar Baron e Galizio (2005) pelo seu uso de operações motivadoras porque, segundo ele, esse seria um conceito hipotético e retrógrado. Esse comentário, a princípio, parece estranho, já que nem Michael (1975) nem Baron e Galizio (2005) apontaram o conceito de operação motivadora como parte de sua argumentação. Esse termo, inclusive, só aparece formalmente em Baron e Galizio (2005) em comentários muito específicos sobre os textos de Sidman (1989/2009) e de Skinner (1976). Michael (1975), obviamente, não fez uso do conceito porque ele só seria proposto (por ele próprio) oito anos depois (Michael, 1982). Baron e Galizio (2006a) argumentaram que os termos escolhidos haviam sido retirados da literatura como exemplos do que já era dito na área, mas defenderam que seu ponto não perdia a validade e outros termos poderiam ter sido usado no lugar. Ao invés de alívio da solidão ele apresentaram a alternativa “término de uma condição em que atenção estava ausente” (já sugerida por Iwata, 2006). Nessa versão reformulada do exemplo, o oposto de “atenção” não seria a “solidão”, mas sim a própria “ausência de atenção”. Ainda assim, pode-se notar que nem todos os pares de termos são de opostos, como seriam calor e frio. Dor de cabeça não é o oposto de aspirina. Dizer, por exemplo que uma criança quando liga a TV sai de uma condição de “tédio” para uma condição de “desenho passando” acaba sendo um problema porque pode dar a entender que duas operações ocorreram: tanto a remoção do tédio quanto a adição do desenho. O oposto da condição “desenho animado” seria a própria “ausência do desenho animado” e 130 não “tédio”. Na melhor das hipóteses, o tédio poderia ser considerado uma tendência a produzir estímulos específicos como brincadeiras, jogos ou até mesmoum desenho animado. Em outras palavras, uma operação estabelecedora. Da mesma forma, o termo “fome” refere a um estado corporal que acompanha operações motivadoras que estabelecem alimentos como reforçadores. É possível que tenha sido com base no uso desses termos que Marr (2006) fez sua crítica. Isso mostra exatamente como o uso de termos imprecisos como solidão, tédio e fome dão margem para interpretações diversas. Segundo a própria definição apresentada por Baron e Galizio (2006a), “solidão” significa “ausência de companhia”, o que implicaria que os opostos seriam “solidão” e “companhia”. Ao invés de dizer que a “adição de atenção” e a “subtração da solidão” são equivalentes, uma forma mais precisa de descrição talvez fosse: diante da “solidão”, a mudança de uma condição de “ausência de atenção” para uma condição de “presença de atenção” seria reforçadora. Ou então, que diante do “tédio”, a mudança de uma condição de “ausência de desenho animado” para uma condição de “presença de desenho animado” seria reforçadora. Os exemplos apresentados ilustram como 1) usar termos mal definidos pode ser problemático (e.g., tédio, solidão, atenção); 2) descrições precisas das condições pré e pós mudança podem ser difíceis de fazer; 3) descrever as operações estabelecedoras e estímulos discriminativos é importante; 4) descrições precisas podem ser fundamentais em alguns casos (e.g., caso da mudança de temperatura). Diante disso, algo que poderia ser perguntado é se, para ser precisa, uma descrição precisaria seguir esse tipo de modelo. Ou então, se todas as ocasiões exigem que descrições tão precisas sejam feitas. Pode ser que houvesse algum ganho em se padronizar a forma como contingências são descritas (especialmente em experimentos). Na literatura experimental, é comum que as privações estejam indicadas na própria descrição dos sujeitos ou no 131 delineamento do procedimento (como no caso de choques, por exemplo). Os critérios específicos para a produção da mudança costumam estar bem delimitados na descrição do aparato. Também não costuma haver dúvidas sobre se alguma quantidade de alimento já estava presente ou não no comedouro, ou quanto é adicionado. O mesmo vale para experimentos com choques: intensidades, durações, se o choque é completamente eliminado ou não, e sob quais condições isso ocorre, são geralmente descritos com clareza. Se outros fatores relevantes forem deixados de fora, isso não necessariamente se resolveria apenas adotando o modelo proposto por Michael (1975). Uma pergunta complementar, que poderia ser sugerida para estudos futuros, é avaliar se as descrições de contingências em estudos experimentais - tanto de pesquisa básica quanto aplicada - têm incluído de forma sistemática todas as condições relevantes de pré e pós- mudança, ou se têm se limitado a descrever consequências como eventos estáticos. Investigar esse ponto poderia indicar em que medida as práticas descritivas da área estão alinhadas com a complexidade funcional envolvida na definição de contingências e operações motivadoras. Retomando o adendo de Baron e Galizio (2005, 2006a) de que não é preciso mudar radicalmente a forma de descrever as mudanças, é possível pensar que caso as informações a respeito do que Michael (1975) chamou de condições pré e pós-mudança já tiverem, de alguma forma, sido bem descritas ou se simplesmente se está num contexto em que tal descrição minuciosa não é tão relevante (e.g., contextos aplicados, leigos ou educacionais), dizer que “calor foi adicionado” ou que “frio foi subtraído” servem ambos adequadamente para se referir à mudança ocorrida. Nesses casos, uma noção suficiente das condições de estímulo pré e pós-mudança pode ser facilmente inferida. Implicações Sobre o Conceito de Reforçamento O abandono da distinção, ou seja, falar apenas de reforçamento, sem a denominação positivo ou negativo, tem implicação óbvia sobre o conceito de reforçamento, uma vez que 132 elimina uma das classificações dos reforçadores propostas no arcabouço teórico da análise do comportamento. Nesse sentido, os termos “consequência reforçadora” e “alteração/mudança ambiental reforçadora” continuam servindo definição de reforçamento para se referir aos eventos que aumentam probabilidades de resposta. Isso não significa que os termos adição e subtração, como já discutido, precisem ser descartados de descrições de contingências ou procedimentos, já que descrevem, na maior parte das vezes, a alteração ambiental relevante de forma nítida (mesmo que ela pudesse ser descrita de outra forma). O que se estaria abandonando não são os termos em si, mas sim a proposição de classificá-los com base na direção da alteração ambiental por conta das ambiguidades e demais desvantagens apontadas no debate. Uma discussão relevante é se o mesmo se aplicaria a demais classificações dos reforçadores presentes atualmente na análise do comportamento, tais como intrínseco/natural x extrínseco/arbitrário, e primário x condicionado x generalizado, que, por sua vez, também apresentam desafios e complexidade apesar de sua ampla utilização para a análise dos mais variados fenômenos humanos, da mesma forma que a classificação positivo x negativo. Implicações Sobre o Conceito de Reforçadores Michael, ao final de seu artigo, faz uma proposta que é adotada por Baron e Galizio: A solução para nosso problema terminológico é chamar as coisas "boas" de reforçadores e reforçamento, e as coisas "ruins" de punidores e punição. Um conjunto de termos refere-se a mudanças que têm um efeito de fortalecimento sobre o comportamento precedente; o outro, a mudanças que têm um efeito de enfraquecimento. (Michael, 1975, pp. 43-44). Se uma resposta é fortalecida porque produz uma certa alteração no ambiente, dizemos que essa alteração teve função reforçadora. No entanto, se posteriormente uma resposta diferente produzir a reversão dessa mesma alteração e for enfraquecida, essa mudança passa a 133 ser classificada como punitiva. Isso mostra que uma mesma mudança ambiental pode ter efeitos distintos sobre o comportamento, dependendo do contexto em que ocorre e do tipo de relação que estabelece com as respostas. A mesma consequência pode funcionar como reforçadora em um contexto e como punitiva em outro. Essa análise mostra que uma mesma condição (ou estímulo) será chamado de reforçador ou punidor a depender de qual o seu efeito sobre a frequência da resposta. Diante disso, as seguintes questões poderiam ser levantadas: como devem ser descritas condições em relação? Uma é reforçadora e a outra punidora, uma é mais punidora e outra menos punidora ou uma é mais reforçadora e a outra menos reforçadora? Para ilustrar que áreas de confusão conceitual existem por toda a parte, Sidman (2006) questionou: “algo é grande ou pequeno, rápido ou lento, alto ou baixo? Em todos esses casos, e em muitos outros, só se pode responder “isso depende” (pp. 136-137). Nesse trecho, Sidman acabou apontando para o fato de que em muitos casos, a classificação de um estímulo quanto a propriedades específicas dele só pode ser feita em comparação com outros estímulos. As implicações disso para a noção do que é ou não reforçador parecem ser de total relevância. Os termos “mais reforçador” e “menos punidor” ou “menos reforçador” e “mais punidor” são sinônimos porque “reforçador” e “punidor” são, na proposta de Michael (1975), conceitos inversos. Dizer que uma condição é mais reforçadora, ressalta a aproximação a essa condição. Dizer que uma condição é punidora (ou reforçadora negativa) ressalta o afastamento dessa condição. Na prática, a “aproximação” e o “afastamento” (como já haviam apontado Baron & Galizio, 2006b) parecem ser diferentes descrições sobre uma mesma resposta – tal como adição e subtração seriam diferentes descrições de uma mesma mudança ambiental. Nesse sentido, a distinçãoentre o que é reforçador ou punidor, grande ou pequeno, rápido ou devagar, aditivo ou subtrativo, positivo ou negativo seria relativa entre duas condições específicas. 134 Staats (2006) ilustra bem essa noção no experimento hipotético que formulou, no qual um rato tem a possibilidade de ir até a sua caixa experimental ou permanecer em uma caixa vazia. Staats postula que o que determinaria se o rato iria para sua caixa experimental ou não depende da história de condicionamento com a caixa, isto é, se a pressão à barra foi reforçada positiva ou negativamente enquanto esteve lá. Deixando de lado os aspectos emocionais a que ele parece atribuir a causa dos comportamentos de se aproximar ou se afastar das caixas, sua conclusão parece bastante plausível. Dada uma história de subtração de estímulos aversivos na caixa experimental, estando em uma caixa vazia, o rato tenderia a se manter na caixa atual. Ao contrário, dada uma história de produção de estímulos reforçadores positivos na caixa experimental, estando na caixa vazia, o rato tenderia a entrar na caixa experimental. Diante dos parâmetros estabelecidos por Staats (2006), como deveriam ser classificadas as condições? Pela própria classificação do autor, seria chamada de reforçador negativo (ou estímulo aversivo) e a caixa onde ele recebeu alimento de reforçador positivo – a caixa vazia poderia ser chamada de “neutra”. Algo importante de se destacar é que três pré-requisitos estão implícitos nesse delineamento. Primeiro, deve haver alguma operação estabelecedora (mesmo que condicionada) que fizesse o rato ir da caixa vazia para a caixa experimental onde produziu alimento. Segundo a caixa inicial não pode ter alimento disponível e, terceiro, a caixa inicial não pode estar eletrificada. Se a caixa inicial tivesse alimento disponível, o rato dificilmente mudaria para a caixa onde alimento só pode ser produzido pela pressão de uma barra, por exemplo. Pela mesma lógica, se a caixa inicial estivesse eletrificada, o rato provavelmente mudaria para a caixa onde ele, no passado, pôde desligar o choque. Isso bota em perspectiva se de fato a caixa vazia poderia ser considerada “neutra”. Outros casos a serem considerados são o de um rato que se desloca de uma condição de choque de intensidade 2 mA para uma condição de choque em 1 mA. Sobre isso, como 135 seriam classificados esses termos? Possivelmente tender-se-ia dizer que ambas as condições são aversivas, mas a segunda condição é “menos aversiva”. Ao contrário (próximo do que haviam sugerido Baron e Galizio, 2006b), se um rato se deslocasse de uma condição na qual pode produzir alimento em FR 30 e para uma outra condição pode produzir em FR 10, poder- se-ia dizer que as duas condições são reforçadoras, mas a segunda é “mais reforçadora”. Afirmar que, numa situação a condição subsequente é “menos aversiva” e em outra é “mais reforçadora” é assumir a priori que as condições “choque 1 mA” e “reforçador em FR 10” seriam, essencialmente, reforçadoras negativa e reforçadora positiva (ou punitiva e reforçadora) respectivamente. Nenhum teste foi feito para saber se esse seria o caso. Possivelmente, os choques de 1 mA e 2 mA possuíssem uma voltagem tão baixa que a mudança de uma condição de 1 mA para 0 mA talvez já não fosse capaz de sequer evocar uma resposta de fuga. Do outro lado, talvez a privação de alimento atual do rato não fosse capaz de evocar uma resposta na condição de FR 30, apenas na de FR 10. Se as respostas que produzem essas condições não sofrerem um aumento de frequência, só se poderia dizer que, nesse caso, os estímulos não funcionaram como reforçadores. Esses exemplos parecem ilustrar uma tendência a se assumir que estímulos possuam valores pré-estabelecidos. Não no sentido de que não sejam mutáveis, mas que, após o seu condicionamento, estímulos adquirem algum valor reforçador absoluto. Dificilmente uma condição de choque seria descrita como reforçadora ou uma condição de alimento seria descrita como punitiva, mas a realidade é que essas descrições, sob essas circunstâncias poderiam ser feitas. O que parece controlar essa “arbitrariedade” para descrever os eventos de uma forma e não de outra (de forma semelhante à distinção positivo/negativo)? Uma possibilidade é que para dizer que uma condição é punitiva ou reforçadora se esteja sempre assumindo como comparação uma suposta “condição neutra” (e.g., a caixa vazia onde nem o alimento nem o choque estavam presentes). Foi a partir dessa comparação 136 que Staats (2006) caracterizou as caixas experimentais uma como reforçadora e outra como aversiva. Nesse caso, Staats definiu, mesmo que implicitamente, o que seria sua “caixa neutra”, mas uma condição neutra e universal não existe. Quaisquer afirmações só podem ser feitas em relação a duas condições específicas e testadas. Bastaria comparar a condição de FR 30 (ou até mesmo a de FR 10) com uma caixa viveiro (com acesso livre a alimento) para que, segundo a lógica de aproximação/evitação de Staats (2006), a caixa de FR passasse a ser chamada de aversiva (lógica similar à de Baron e Galizio, 2006b). Comparações gerais com uma caixa viveiro talvez fosse um parâmetro até mais coerente do que o da caixa vazia, considerando que são as condições nas quais um rato de laboratório passa a maior parte do tempo. É possível que essa tendência em comparar estímulos ou condições de estímulo com uma suposta “condição neutra” advenha do senso comum e, em alguma medida, de perspectivas internalistas para explicação do comportamento. Considerando o caso de uma pessoa que responde “sim” para uma pergunta como “você gosta de bolo?”. Se a mesma pessoa recebesse a pergunta “você gosta de bolo quando você está enjoada de tanto bolo que já comeu?”, ela provavelmente responderia que, nesse caso, “não”. Uma outra possibilidade é que uma pessoa respondesse que “ainda gosta de bolo, mas que naquele momento não comeria mais”. Uma resposta parecida talvez fosse esperada diante da pergunta “você gosta de bolo quando você está em uma situação de perigo e precisa escapar?”: “gostar eu gosto, mas não comeria nesse momento”. No senso comum, parece ser assumido que o “gostar” ou “não gostar” de algo é absoluto, e que o “gosto” é algo que se possui. Novamente, não “absoluto” no sentido de que é imutável, mas no sentido de que existe a despeito das condições atuais como se estivesse guardado - da mesma forma que são tratados outros constructos como “conhecimento”, “memória” ou “personalidade”. Naturalmente, analistas do comportamento, apesar de fazerem 137 parte de um grupo bastante particular em sua forma de falar, continuam fazendo parte de uma comunidade verbal mais geral. Não é incomum ver pessoas engajadas com a análise do comportamento (em especial, mas não exclusivamente novos alunos) simplesmente trocarem palavras do senso comum como “bom” por “reforçador”, “sede” por “privação de água” sem que a base explicativa do que está sendo dito mude. Mudanças exclusivamente nas palavras gera frases como “o rato foi reforçado” (algo que remete à produção de “prazer” no rato) ao invés de “a resposta do rato foi reforçada” (referindo-se diretamente ao aumento na probabilidade dela). Quando um analista do comportamento diz que um estímulo é reforçador ele, em muitos casos, pode estar sob controle de condições parecidas com as da pessoa que diz gostar de bolo. Uma possibilidade é que ambos estejam considerando o contexto atual para responder a perguntar (i.e., a motivação existe e dado um estímulo discriminativo, a resposta seria emitida). Outra possibilidade é que mesmo que a motivação agora não exista, no passado, esse estímulo foi produzido quase sempre que o estímulo discriminativo esteve disponível, e seja a frequência observada da resposta sob essas circunstâncias que controle o operante verbal “gostar”. Outra hipótese,ainda, é que uma motivação poderia existir, mas outra operação motivadora estaria evocando outro comportamento concorrente. Nesse caso, poder-se-ia pensar que, se ele estivesse em condições “neutras”, ele emitiria respostas que produzissem o bolo. Uma última alternativa é que alguma motivação existe, o estímulo discriminativo está presente, mas a resposta que produziria o reforçador seria muito “custosa” – no sentido de que emitir aquela resposta em particular produz estímulos aversivos (e.g., um choque, perda de dinheiro ou até estímulos ligados à fadiga). Nesse caso, poder-se-ia pensar que essa resposta em específico não está sendo emitida, mas outras respostas que produzissem o mesmo reforçador poderiam ser. 138 Embora se tenha a tendência de atribuir um valor absoluto a certos estímulos, seu efeito como reforçador depende do contexto específico. Um bolo pode aumentar ou diminuir a probabilidade de uma resposta, dependendo da situação. Por exemplo, se uma pessoa pede torta em vez de bolo ao garçom, não se pode afirmar que o bolo é reforçador naquele contexto. O mesmo vale para estímulos aversivos: um choque de 1 mA pode ser reforçador diante de um de 2 mA, mas não em outras situações. Além disso, estímulos que normalmente seriam reforçadores (como comida para um animal faminto) podem não manter respostas se a exigência for alta demais. Isso mostra que o valor reforçador de um estímulo não é fixo, mas relacional e dependente das condições presentes. Se o valor de um estímulo reforçador é definido a depender da presença de outros estímulos ambientais, nenhum estímulo possui valor intrínseco. Para se dizer que um estímulo ou condição de estímulo são reforçadores, seria necessário indicar diante de quais condições antecedentes (em especial as operações motivadoras) ou, pelo menos, dizer que o estímulo tem uma tendência a ser reforçador. A partir disso, quando um analista do comportamento recebe a pergunta “uma pelota de alimento é um reforçador para um rato?”, ele poderia responder como Sidman (2006): “isso depende” (pp. 136-137). Outra possibilidade, é dizer que “tende a ser” – considerando que diante de diversas condições antecedentes, o alimento foi reforçador. Vale notar que já é comum que analistas do comportamento tenham uma tendência a dizer que o valor das coisas depende. Quando um professor recebe a pergunta “palmas são reforçadoras?”, ele poderia dizer “depende da pessoa”, ou, mais especificamente, “depende da história de reforçamento da pessoa”. Isso continua sendo verdade, mas o que está sendo apontado aqui é que não depende só disso. O valor reforçador de um estímulo depende 1) da história de condicionamento desse organismo com esse estímulo, 2) das condições antecedentes presentes que evocariam ou não sua produção e 3) da resposta exigida para 139 produzi-lo. Estímulos não carregam “um valor reforçador” dentro de si tal como pessoas não carregam seus “gostos” onde quer que vão. Se uma resposta é fortalecida porque produz uma certa alteração no ambiente, se diz que essa alteração teve função reforçadora. No entanto, se posteriormente uma resposta diferente produzir a reversão dessa mesma alteração e for enfraquecida, essa mudança passa a ser classificada como punitiva. Isso mostra que uma mesma mudança ambiental pode ter efeitos distintos sobre o comportamento, dependendo do contexto em que ocorre e da relação que estabelece com as respostas. O que define a função de uma consequência não é sua natureza intrínseca, mas os efeitos que produz sobre a frequência das respostas que a antecedem. Vale lembrar que o que se chama de “valor” de um estímulo é também uma inferência. Atribuir valor a um estímulo é uma forma de se referir à tendência do organismo de emitir respostas que o produzam. Em outras palavras, diz-se que um estímulo tem mais valor que outro no sentido de que o organismo emite mais respostas que produzam um em vez do outro - e que um mesmo reforçador tem seu valor alterado no sentido de que a frequência de respostas que o produzem foi alterada. Sob essa ótica, o único efeito operante diretamente observável de uma operação motivadora seria o aumento ou diminuição na frequência de uma resposta (efeito evocativo). Essa crítica à noção de “valor reforçador” como um efeito separado vem sendo feita por autores como Whelan e Barnes-Holmes (2010), que argumentam que o efeito evocativo é, na verdade, a única evidência empírica disponível de que houve alteração no valor da consequência. Nesse sentido, tanto dizer que um estímulo “é um reforçador” quanto que ele “é mais reforçador que outro” são apenas formas de indicar que, em determinada condição, esse estímulo tenderá a ser produzido. Se fosse desejável, seria possível abandonar completamente a ideia de “valor de estímulo” e descrever apenas os efeitos sobre a frequência das respostas 140 que produzem determinada mudança ambiental. Mesmo mantendo a referência ao valor, bastaria descrever que certas condições de estímulo são “mais reforçadoras” ou “menos reforçadoras”. Michael (1975) já havia sugerido o abandono do termo “aversivo” em favor de “punidor”, mas mesmo “punidor” poderia ser descartado em nome de “menos reforçador”. Por fim, vale comentar que as diferenças entre as distinções entre reforçadores positivos e negativos apresentadas por Santos e Leite (2013), à luz da presente discussão, não têm base para serem mantidas. A principal distinção apresentada por eles diz respeito à adição versus subtração de estímulos como critério para classificar um reforçamento como positivo ou negativo. No entanto, como discutido anteriormente a partir de vários autores do debate (Baron e Galizio, 2005, 2006a, 2006b; Michael, 1975), esse critério é arbitrário, já que toda adição envolve a retirada de algum outro estímulo, e toda retirada implica a permanência ou substituição por outro elemento do ambiente. Além disso, os autores também propõem outras diferenciações conceituais, como a de que os reforçadores negativos exigiriam a presença de estímulos aversivos, enquanto os positivos envolveriam estímulos agradáveis ou desejáveis. Essa forma de distinção incorre em pressupostos mentalistas ou essencialistas, que não se sustentam do ponto de vista funcional, também criticado pelos autores no debate (CITAR). Como discutido, o que define se uma consequência é reforçadora é o efeito que ela produz sobre a frequência das respostas e não suas supostas qualidades intrínsecas. Assim, mesmo as demais distinções apresentadas por Santos e Leite não se apoiam em critérios observáveis e funcionais, sendo também infundadas. Implicações para o Conceito de Reforçadores Condicionados No exemplo hipotético apresentado por Michael (2006) um rato era exposto a uma condição experimental de mais alimento e menos choque na presença de um tom e outra de mais choque e menos alimento na ausência do tom. Nessa na fase de condicionamento (alternância entre a condição sem tom e com tom), quem quisesse aplicar a distinção 141 positivo/negativo, poderia dizer que a mudança de uma condição para a outra seria tanto reforçadora positiva quanto negativa, porque tanto uma adição (mais alimento) quanto uma subtração (menos choques) estariam sendo aplicadas. A pergunta de Michael, entretanto, refere-se a uma mudança entre as condições sem tom e com tom enquanto estímulos condicionados. Michael supôs que a mudança do estímulo condicionado “sem tom” para o estímulo condicionado “com tom” seria reforçadora (mesmo quando o alimento e o choque não estivessem mais sendo apresentados). A partir disso, ele colocou o seguinte questionamento: nesse caso estaríamos falando de uma condição de reforçamento positivo ou negativo? O autor questionou a plausibilidade de usar a “adição de um tom” como critério para dizer que se trata de reforçamento positivo. Isso porque a escolhade qual condição seria a “com tom” e “sem tom” foi arbitrária. Se o condicionamento tivesse sido feito ao contrário (i.e., condição “sem tom” com mais alimento e menos choque e condição “com tom” com menos alimento e mais choque), o mesmo tipo de mudança teria que ser chamado reforçamento negativo, o que faria pouco sentido. Uma forma de abordar essa pergunta, poderia ser apelar para o valor de cada reforçador. Será que a adição do tom serviria como reforçador positivo para alguma outra resposta? Se a resposta fosse sim, dir-se-ia que ela é um reforçador positivo e, dessa forma, a adição do tom seria reforçamento positivo. O problema é que, como já notado, a propriedade reforçadora de um estímulo depende necessariamente das condições diante das quais ele será produzido. Como separar as condições “com tom” e “sem tom” de forma que só uma delas esteja envolvida na contingência? Não é possível porque a adição de uma condição necessariamente implica a subtração da outra. Esse delineamento dificulta uma análise das mudanças envolvidas porque, além de introduzir duas variáveis experimentais ao mesmo tempo, só são feitas comparações entre 142 duas condições experimentais, sem qualquer condição controle. Algo que ainda não havia sido pontuado é que Michael (2006) sequer havia indicado qualquer resposta a ser medida no experimento, apenas diz que a mudança seria reforçadora. O experimento de Jwaideh e Mulvaney (1976), citado na Introdução, havia demonstrado como estímulo luminoso poderia se tornar aversivo quando pareado a uma condição de menor produção de alimento em relação a outra. Esses dados fortalecem a noção de que o valor de uma condição de estímulo é estabelecido especificamente em relação a uma outra condição de estímulo. Se a condição de luz vermelha de VI 120s tivesse sido condicionada em alternância com uma condição de luz verde de um VI mais alto (ou até mesmo extinção), é possível que o resultado contrário tivesse sido observado: a luz vermelha teria sido produzida preferencialmente sem a luz verde (algo que que não foi empiricamente testado). Retornando ao exemplo de Michael (1975), uma condição de menos alimento e mais choque (sem tom) foi condicionada em alternância com uma condição de mais alimento e menos choque (com tom). Nesse caso seria possível supor que a condição sem tom, tal como a luz vermelha (Jwaideh & Mulvaney, 1976) se tornou um reforçador negativo condicionado e a condição com tom, se tornou um reforçador positivo condicionado. Dessa forma, respondendo à pergunta de Michael: “a mudança da condição deveria ser considerada reforçadora positiva ou negativa?”. De fato, tanto faz. A depender de qual estímulo for escolhido para ser descrito, a descrição pode ser classificada como reforçamento positivo ou negativo. Se a descrição for “a condição com tom foi adicionada”, essa descrição seria classificada como reforçamento positivo. Se a descrição for “a condição sem tom foi subtraída”, essa descrição seria classificada como reforçamento negativo. Outra possibilidade é afirmar que tanto a condição sem tom foi condicionada como reforçador negativo quanto a condição com tom foi condicionada como reforçador positivo, então o reforçamento é 143 positivo e negativo. A partir disso, o questionamento continua sendo: qual a utilidade de se classificar alterações ambientais como positivas ou negativas mesmo que isso seja possível? Respostas sobre algumas particularidades do condicionamento de estímulo (ou condições de estímulo) só poderão ser produzidas experimentalmente. Uma hipótese é que ao adquirir uma função semelhante, o reforçador condicionado se tornaria “aversivo”, em comparação com as condições diante das quais o reforçador de base é aversivo, e “reforçador”, em comparação com as condições diante das quais o reforçador de base é reforçador. Em outras palavras, a função do reforçador condicionado variaria de forma similar à função do reforçador de base. Essa parece ser uma possível forma de descrever o condicionamento de funções operantes levando em conta que as funções/valores de um estímulo são relativas e, ao mesmo tempo, não recorrendo à distinção positivo/negativo. Um experimento que poderia ser feito é seria condicionar uma luz vermelha fosse a um choque de 2 mA e uma luz verde a um choque de 1 mA e testar se, mesmo na ausência dos choques, o rato passaria a emitir respostas que trocassem a luz vermelha para a verde (o mesmo poderia acontecer com estímulos condicionados a esquemas de FR 30 e FR 10). Em suma, é difícil dizer que um estímulo (ou condição de estímulo) possua uma função por si só e tampouco que uma caixa vazia seja um “estímulo neutro”. Condições de estímulos parecem ter ou adquirir funções operantes apenas enquanto contrapostos a uma outra condição de estímulo. Além disso, parece ser o caso que um estímulo reforçador só é reforçador na mesma medida em que um outro estímulo for aversivo e que, nesse sentido, as descrições “mais reforçador” e “menos aversivo” (ou “menos punitivo”) seriam equivalentes. Parece ser perfeitamente possível diferenciar quaisquer condições de estímulo entre menos reforçadora e outra mais reforçadora. Nesse sentido, se o objetivo for o corte de termos, essa análise mostrou parecer possível poder falar apenas de reforçadores, sem menção a tipos específicos de reforçadores ou a aversivos e punidores. 144 Os estudos de Perone e Courtney (1992) mostraram que, em esquemas mistos, a magnitude do reforçador poderia influenciar diretamente a duração das pausas seguintes entre razões - com pausas mais longas após reforçadores de maior magnitude. Já em esquemas múltiplos, em que estímulos discriminativos acompanharam diferentes magnitudes do reforçador, pausas mais curtas ocorreram após estímulos discriminativos que antecederam reforçadores de maior magnitude, e pausas mais longas ocorreram após os estímulos discriminativos que antecederam reforçadores de menor magnitude. Além disso, houve uma interação entre as magnitudes do reforçador previamente obtido e o controle discriminativo relacionado a uma magnitude de reforçador diferente, sendo o efeito da magnitude do reforçador anterior mais evidente quando o estímulo discriminativo era o que acompanhava um reforçador seguinte de menor magnitude. Perone (2003) indicou ter feito uma ampliação desse delineamento na qual a introdução de uma chave de fuga revelou que, nas transições de um reforçador de maior para menor magnitude no esquema múltiplo, a emissão de respostas de fuga que produziam um período de timeout (luz da caixa e da chave de alimento eram apagadas) como consequência, era mais provável do que na transições de reforçador de menor para maior magnitude e acompanhada de pausas mais longas no responder que produzia o reforçador de baixa magnitude. Esses resultados sustentam a interpretação de Perone & Courtney (1992) e Perone (2003) de que pausas entre razões podem funcionar como respostas de fuga a condições aversivas produzidas por certas transições dentro de esquemas de reforçamento positivo. Se interpretados desta maneira, esses resultados parecem indicar uma outra forma pela qual estímulos aversivos podem ser condicionados em esquemas que envolvem apenas contingências de reforçamento positivo. Esses experimentos colaboram com a noção de que o fundamental para que um estímulo seja condicionado como reforçador negativo e outro como 145 reforçador positivo é que haja duas condições contrastantes em que uma é mais reforçadora que a outra. Outro caso em que se identifica a ambiguidade da distinção entre reforçamento positivo e negativo consiste na discriminação de estímulo estabelecida por reforçamento negativo. Considere-se um pombo que é exposto a choques leves, mas duradouros, periodicamente. Se, diante de uma luz verde, bicar um disco eliminasse o choque e, diantede uma luz vermelha, emitir a mesma resposta não produzisse essa consequência, é esperado que o número de bicadas diante da luz verde passasse a ser maior do que na luz vermelha. Em outras palavras, a luz verde teria se estabelecido como estímulo discriminativo e a vermelha como estímulo delta para bicadas que produzissem interrupção dos choques. Além disso, também é provável que diante da luz vermelha e do choque, o pombo emita com frequência uma outra resposta que produza a luz verde (e.g., bicar um segundo disco) permitida pelo experimentador. Nesse sentido, pode-se dizer que a luz verde teria se tornado um estímulo reforçador condicionado positivo para a resposta de bicar o segundo disco, ilustrando como um reforçador positivo poderia ser criado em situações denominadas como de reforçamento negativo. Se interpretados na forma apresentada, esses dois exemplos têm em comum a construção de reforçadores condicionados que poderiam ser classificados como positivos ou negativos a partir do seu pareamento com reforçadores classificados de maneira oposta. Findley (1958), no entanto, apresenta uma interpretação alternativa a esse tipo de leitura. No experimento feito pelo autor, pombos foram expostos a esquemas concorrentes sob controle de estímulos discriminativos (luz verde e luz vermelha) que foram relacionados a diferentes razões de reforçamento. Os pombos podiam emitir uma resposta de bicar em uma chave de mudança, que alternava o esquema em vigor e o SD relacionado. As respostas de troca entre esquemas não foram, entretanto, interpretadas como respostas de fuga pelo autor. 146 Em vez disso, interpretou que esse padrão de troca era determinado de forma crítica pela frequência relativa de reforçamento, sem supor uma função aversiva condicionada para a luz relacionada pelo experimentador ao esquema de razão mais exigente. Implicações do Abandono da Distinção Sobre o Conceito de Punição Já foi indicado que tanto para Michael (1975) quanto para Baron e Galizio (2005) a estratégia mais coerente para se lidar com os problemas gerados pela distinção entre o reforçamento positivo e o negativo seria abandonar a distinção por completo e passar a separar processos apenas entre reforçamento e punição. O conceito de punição, no entanto, não é definido da mesma maneira entre autores. Como se sabe, Skinner (1953/2014) e Sidman (1989/2009), definem a punição de maneira procedimental, identificando-a como a apresentação de reforçadores negativos ou a retirada de reforçadores positivos após a emissão de uma resposta de determinada classe. Esse destaque se faz relevante uma vez que a definição de punição proposta por esses autores, conhecida como assimétrica, implica na identificação prévia de reforçadores e, além disso, na possibilidade de classificar esses reforçadores como sendo positivos ou negativos, já que a apresentação de um reforçador positivo ou retirada de um negativo não seriam definidas igualmente como punição. Dessa maneira, o abandono da distinção entre reforçamentos positivo e negativo teria impactos relevantes para a definição de punição, ao menos quando adotada a perspectiva assimétrica apresentada. Partindo-se de uma definição simétrica, no entanto, seria possível definir punição como um processo no qual uma determinada alteração ambiental, que sucede de forma suficientemente contígua e sistemática as emissões de instâncias de uma mesma classe de respostas, faz com que a probabilidade futura dessas emissões, quando diante de condições motivacionais e discriminativas semelhantes, diminua. Com exceção de alguns detalhes que também são raramente mencionados quando se define reforçamento (e.g., classes de resposta, 147 contiguidade, condições discriminativas e condições motivacionais), essa definição de punição parece bastante próxima da proposta por de Azrin e Holz (1966) de que “punição é uma redução da probabilidade futura de uma resposta específica como resultado da apresentação imediata de um estímulo em função dessa resposta” (p. 381). Essa definição não seria prejudicada pelo abandono da distinção entre reforçamento positivo e negativo. Algo importante de notar é que o fato de a distinção assimétrica de punição ficar prejudicada não implica na existência ou não de um processo punitivo que enfraqueça respostas. A diminuição na emissão de uma resposta ainda poderia ser explicada pelo reforçamento de outras respostas. Ainda assim, caso a distinção positivos/negativos fosse abandonada, a definição assimétrica precisaria de uma reformulação. Vale ressaltar que da mesma forma que o abandono da distinção entre os reforçamentos positivo e negativo acabaria prezando por uma parcimônia científica (no sentido de diminuir o número de conceitos necessários para se explicar fenômenos), a adoção da visão assimétrica de punição proposta por Skinner (1953/2014) também caminha nesse sentido. Se for possível explicar os efeitos da punição apenas recorrendo ao processo de reforçamento isso não caminharia na direção desejada por Michael (1975) e Baron e Galizio (2005) de abandonar nomeações desnecessárias? Por fim, além das mencionadas acima, outra implicação do debate sobre a distinção entre os reforçamentos positivo e negativo sobre o conceito de punição é que todas as ambiguidades e problemas apontados a respeito da distinção entre reforçamentos positivo e negativo também se aplicam aos tipos de punição positiva e negativa. Isso porque a crítica central de que a distinção é uma caracterização de descrições arbitrárias se aplica igualmente aos tipos de punição: qualquer descrição de adição de um estímulo pode ser reescrita como subtração de seu estímulo oposto e vice-versa. 148 Implicações do Conceito de Operação Motivadora para a Distinção Sidman (2006), ao rebater a noção de que estímulos possam ser sempre descritos em suas versões opostas, chegou a dizer que: É, sem dúvida, verdade que o fim de um período sem dinheiro pode ser crítico para determinar o valor reforçador do dinheiro, mas ainda assim vemos bilionários trabalhando arduamente para obter mais. A eficácia de alguns reforçadores positivos depende menos de sua ausência anterior do que do que eles tornam possível em termos de comportamento futuro. (Sidman, 2006, p.137). Neste trecho, Sidman (2006) reconhece que “um período sem dinheiro” pode estabelecer o valor reforçador do dinheiro. Em outras palavras, o período sem dinheiro tem função de operação estabelecedora do dinheiro como reforçador positivo. Entretanto, ele afirma que, em alguns casos, mesmo na ausência de um “período sem dinheiro” há pessoas (bilionários) trabalhando para produzir mais dinheiro. A despeito do que ele quis dizer com “arduamente” ou da própria definição de “trabalho” usada, para fins de simplicidade, o que será entendido como “trabalhando arduamente” será apenas que comportamentos que produzem dinheiro continuam sendo emitidos com frequência alta. Sidman (2006) conclui dizendo que a eficácia de alguns reforçadores depende menos de sua ausência anterior (i.e., “período sem dinheiro”) e mais do que tornam possível em termos de comportamento futuro. Partindo do princípio básico de que o futuro não pode controlar o passado, entender-se-á “o que possibilitam em termos de comportamento futuro” como “o que possibilitaram no passado em elos subsequentes da mesma cadeia comportamental”. No mesmo sentido, entendendo que não é o que será produzido no futuro que controla a produção atual de dinheiro, quais as variáveis presentes no momento da resposta que são responsáveis por evocá-la? Em outras palavras: como a produção de reforçadores por elos subsequentes ao elo atual está agindo sobre a presente resposta? 149 Quando se fala de estímulos reforçadores condicionados generalizados (como o dinheiro) é dito que eles não dependem de privações específicas que o estabeleçamcomo reforçadores, uma vez que foram pareados a diversos reforçadores, e são efetivos sob uma gama diversa de privações específicas. Isso não é o mesmo que dizer que nenhuma operação motivadora os controla, mas que qualquer operações motivadora envolvida no estabelecimento de outros reforçadores subsequentes na cadeia comportamental podem estabelecer o dinheiro como reforçador. Numa sociedade em que quase tudo pode ser produzido ou eliminado com dinheiro, isso incluiria incontáveis reforçadores condicionados ou incondicionados. Apesar de poder se argumentar a favor de uma operação motivadora condicionada que 0estabelece o valor do dinheiro, privações, se entendidas como operações motivadoras incondicionadas, nunca se aplicam diretamente ao dinheiro. Outros estímulos condicionados e incondicionados condicionaram seu valor. Mesmo assumindo que um bilionário tivesse dez bilhões em dinheiro líquido para gastar (o que não costuma ser o caso porque grande parte dessa fortuna é mantida na forma de posses) ele ainda poderia querer comprar uma empresa avaliada em 12 bilhões, por exemplo. Pensando no comportamento de “fazer um investimento” que aumente seu dinheiro de 10 para 12 bilhões, ainda poder-se-ia afirmar que, mesmo se tratando de um bilionário, a situação envolveu necessariamente o “término de uma condição anterior na qual 12 bilhões estavam ausentes”. A presença específica de 12 bilhões, no caso, seria condição diante da qual a resposta de comprar a tal empresa poderia ser emitida. Em outras palavras, um estímulo discriminativo para a resposta de comprar e um reforçador condicionado para a resposta de investir. Talvez a base do argumento de Sidman (2006) seja que nem todo comportamento requer uma operação motivadora. Isso pareceria concordar com o que foi falado por Marr (2006) sobre ligar um rádio não ter relação com um “sofrimento” anterior à presença da 150 música. Se certos comportamentos podem ocorrer sem a presença de operações motivadoras, restaria explicar o que, dada a presença constante do estímulo discriminativo, faria o indivíduo se comportar numa hora e não na outra. Ou dada a presença de dois estímulos discriminativos, o que controlaria a emissão de cada resposta em momentos específicos. Esse outro debate, entretanto, deverá ser tratado em outros trabalhos dedicados ao tema das operações motivadoras. Iwata (2006) havia sugerido que avanços recentes na área de operações motivadoras sugeriam que distinções arbitrárias poderiam ser úteis para a área. Mais especificamente ele estava se referindo à distinção entre operações estabelecedoras e operações abolidoras. Enquanto o primeiro conceito descreveria o efeito das operações motivadoras de aumentar a probabilidade de respostas específicas, o segundo descreve o efeito de diminuir a probabilidade de respostas específicas. Iwata sugeriu que esse segundo conceito tinha sido criado para abarcar essa “bidirecionalidade”. Nesse sentido, talvez essa distinção seja arbitrária para Iwata por conta da inevitabilidade de que sempre que um comportamento aumenta de probabilidade, a probabilidade de outros comportamentos diminui e, de fato, isso se assemelharia com a noção de que toda adição implica uma subtração no caso da distinção positivo/negativo. Durante o debate, também foi sugerida a possibilidade de que propriedades das operações motivadoras envolvidas talvez fossem os aspectos mais relevantes para dizer se um reforçamento é positivo ou negativo (e.g., sua intensidade ou velocidade de introdução). Como discutido, talvez as categorias de operações motivadoras apresentadas não ajudem a manter ou desbancar uma distinção entre reforçamentos. Ainda assim, é bastante possível que avanços nas discussões ou até o desenvolvimento de outros tipos de categoria auxiliem nesse processo. O conceito de operações motivadora parece ter sido muito pouco pesquisado tanto teórica quando experimentalmente. 151 Talvez o elemento mais relevante do conceito de operações motivadoras para o debate sobre a distinção entre os tipos de reforçamento positivo e negativo seja a própria distinção entre os tipos de operação motivadora. As operações motivadoras incondicionadas (OMIs) podem ser divididas entre privação (de reforçadores primários, tais como por exemplo alimento, água e sono), estimulação dolorosa, variações na temperatura e variáveis sexuais. As operações motivadoras condicionadas (OMCs) podem ser divididas entre substitutas, reflexivas e transitivas (Michael, 2004). Vale ressaltar que Michael acrescenta como OEs como mesmo efeito que a privação de água, o sal, a transpiração e a perda de sangue. A princípio, se considerados os reforçadores relacionados à cada OE e como contingências de reforçamento que usam esses estímulos são tipicamente chamadas, as OEs poderiam ser divididas, grosseiramente, em OEs relacionadas a reforçamento positivo (i.e., privação, variáveis sexuais, substitutas e transitivas), e OEs relacionadas a reforçamento negativo (i.e., estimulação dolorosa e reflexiva) – as variações de temperatura, como já discutido, não podem ser facilmente classificadas por uma definição tradicional. Uma diferença entre a relação entre as OEs e a alteração ambiental reforçadora a qual estão relacionadas pode ser notada: quando choque é apresentado a um rato e ele emite uma resposta que o elimine, a mudança reforçadora é a própria eliminação do choque. Por outro lado, uma pessoa consome muito sal e isso aumenta a probabilidade de que ela emita respostas que no passado produziram água, ela não está eliminando o sal em si como consequência da resposta (ainda que a ingestão hídrica auxilie na eliminação do sódio pela urina posteriormente). Com base nisso, seria possível então basear uma distinção entre os reforçamentos positivos e negativos com base nos tipos de operação motivadora envolvidas? Esse poderia ser um caminho explorado por estudos futuros sobre o tema. Outra coisa a ser testada é se, dada a capacidade de induzir uma operação estabelecedora que estabelece o alimento como reforçador de forma intensa e abrupta (e.g., 152 uma droga de ação rápida que deixaria o animal “faminto”), será que um organismo, dadas as condições adequadas para tal, aprenderia a emitir respostas que interrompessem ou prevenissem a adição dessa droga em seu organismo? Quem sabe até mesmo intensidades mais moderadas de fome (que não provocariam dor) se fossem apresentadas subitamente, pudessem evocar respostas mais intensas. Uma possibilidade é estudar o comportamento de pessoas com condições como a Diabetes mellitus cuja hipoglicemia e a hiperglicemia podem causar alterações súbitas na fome (polifagia) e sede (polidipsia) (BIREME/OPAS/OMS, 2017). Estudos como esse seriam úteis para investigar se seriam as propriedades das operações motivadoras ligadas a cada tipo de reforçamento. Algumas formas de dores de cabeça que aumentam em intensidade gradualmente e poderiam ser comparadas ao aumento da privação de alimento (e frequentemente pode ter causas semelhantes como privação de sono, alimento e água). Se um choque fosse adicionado de forma gradual e lenta, é possível que o organismo respondesse para eliminá-lo somente numa intensidade mais alta do que a que ele responderia se sua introdução fosse abrupta. Naturalmente, essas dúvidas só serão respondidas de forma experimental, mas elas ilustram a incerteza acerca de quais aspectos dos chamados reforçamentos positivo e negativo de fato estão controlando o comportamento de assim rotulá-los. Por fim, algo interessante de se notar é que o mesmo autor que havia proposto o abandono da distinção entre os reforçamentos positivos anos antes, propôs e seguiu desenvolvendo uma distinção entre operações motivadoras específicas (Michael, 1982, 2004). A crítica feita por Lattal e Lattal (2006) sobre uma distinção ter sido assumida a prioripode se aplicar aqui também, especialmente em uma área com baixíssima literatura experimental. Outro ponto a ser pesquisado seria o uso prático das categorias de operações motivadoras em relação às categorias de reforçamento. Mais especificamente, será que as contingências diante 153 das quais uma pessoa costuma dizer que uma operação motivadora é reflexiva, não são justamente as contingências que ela já considerava reforçamento negativo? 154 Considerações Finais A análise empregada permitiu a identificação e classificação das diversas falas dos autores de forma a agrupá-las e articulá-las. Sobre os problemas da manutenção, conclui-se que seus termos podem gerar confusão (em particular o termo “reforçamento negativo”) e que uma distinção baseada em adição ou subtração de estímulos, além de ter sido assumida antes que evidências convincentes tivessem sido produzidas, parece ser intrinsecamente ambígua. Nesse sentido, alguns autores acreditam que a distinção acaba por gerar simplificações e distorções conceituais, limitações de aplicação e problemas didáticos. A ambiguidade (tal como apontada por Michael, 1975 e Baron e Galizio, 2005) parece ser um problema intrínseco a uma distinção baseada nas operações adição ou remoção de estímulos. Nesse sentido, a classificação de uma mudança reforçadora como positiva ou negativa acaba sendo arbitrária e resume-se à forma como se escolhe descrever uma mudança. Todo evento reforçador envolve uma mudança de uma condição para outra condição e determina parâmetros específicos para ambos: em um a ausência (ou menor magnitude) de um estímulo e no outro sua presença (ou maior magnitude de um estímulo). A linguagem usada para descrever eventos e estímulos permite que tanto as mudanças quanto os próprios estímulos sejam descritos em ambas as direções opostas (i.e., calor e frio, luz e escuro, choque e ausência de choque). Nesse sentido, abandonar a distinção poderia ser vantajoso no sentido de gerar menos distorções e eliminar os problemas decorrentes. Vale ressaltar que abandonar a distinção e mudar a forma de descrever contingências são duas coisas diferentes. Michael (1975) havia sugerido que descrever as mudanças como adição e subtração de estímulos atrapalharia que descrições detalhadas das condições envolvidas na mudança pudessem ser feitas. Entretanto, como apontaram Baron e Galizio (2005, 2006a), esse não precisa ser o caso. 155 Como discutido, a manutenção da distinção e o uso dos termos “adição” e “subtração” (e seus equivalentes) são coisas diferentes. Nem o uso nem o abandono desses termos implicaria em uma descrição mais ou menos precisa dos dados. Apesar de haver casos em que é importante descrever precisamente as condições antecedentes e subsequentes, nos casos em que dizer que “uma condição de ausência de determinado estímulo” mudou para “uma condição de presença desse estímulo”, o procedimento poderá ser facilmente resumido como “adição de um estímulo” sem perda de qualquer informação. Dito isso, usar termos adição e subtração como formas convenientes de descrever um fenômeno é diferente de dar nomes específicos para as contingências que foram descritas assim e ainda atribuir a elas diferenças processuais fundamentais. Parar de nomear relações como reforçamento positivo ou negativo, não implica que não se possa dizer que calor foi adicionado ou frio foi subtraído. Ambas as descrições funcionam para comunicar adequadamente a (mesma) informação. Mesmo diante dos seus problemas conceituais apontados, foi argumentado que a distinção poderia cumprir funções relevantes em diferentes contextos (categorias “Vantagens da Manutenção” e “Explicações para a Manutenção”). A análise dessas falas revelou que muitas dessas funções não necessariamente se restringiam ao uso da distinção, enquanto outras pareciam se originar de momentos em que a argumentação de Baron e Galizio (2005) foi confusa – algo que os autores abordaram em suas respostas (Baron & Galizio, 2006a, 2006b). Outro ponto é que a confusão/ambiguidade da distinção impedia que muitas dessas possíveis funções se aplicassem. Por exemplo, como afirmou Michael (1975) “se a distinção é difícil de ser feita em muitos casos de comportamento humano, o alerta [para se utilizar reforçamento positivo em vez de negativo] não será fácil de seguir” (pp. 41-42). Algumas explicações para a manutenção da distinção recorriam à noção de que seu uso era mantido puramente por contingências de reforçamento arbitrárias e não por uma 156 vantagem intrínseca de seu uso. Em outras palavras, só é usada porque já é usada e valorizada pela comunidade verbal de analistas do comportamento. Em contrapartida, alguns autores sugeriram que se o critério de adição e subtração não tem fundamento, talvez outros fatores estivessem levando analistas do comportamento a separar contingências de reforçamento como sendo positivas ou negativas. Entre os aspectos levantados estão a abruptidão da mudança ambiental, os mecanismos fisiológicos envolvidos, as “emoções” ou “sentimentos” envolvidos, a severidade das operações motivadoras, a saliência da mudança e propriedades particulares de estímulos específicos. Duas explicações também foram oferecidas para justificar o porquê de o abandono ter sido sugerido. Uma delas (Marr, 2006) se referia à noção de que a distinção poderia ter sido útil em algum momento, mas agora pode ser descartada. A outra (Sidman, 2006) indicou a possibilidade de que tenha havido uma má compreensão da distinção. Nessa situação, Sidman afirma: Suspeito que uma das razões para o desconforto de Baron e Galizio (2005) com a distinção entre reforçamento positivo e negativo seja a sensação de que ela reflete diferenças no próprio processo de reforçamento. Não tenho certeza de onde essa sensação vem. Para qualquer um que defenda tal visão, a discussão convincente deles deveria encerrar a questão. (Sidman, 2006, p. 137). Nesse sentido, Sidman (2006) parece afirmar que a diferença entre os dois tipos de reforçamento não estaria nos processos, mas não especifica qual seria essa diferença. Uma possibilidade diz respeito à presença ou não de efeitos colaterais como indicado em Sidman (1989/2009) - apesar de ele não mencionar essa possibilidade no debate. Com relação às sugestões feitas pelos autores, alguns direcionamentos gerais podem ser feitos com base na análise já realizada: 1) usar os termos adição e subtração (e seus equivalentes) quando permitirem uma comunicação mais efetiva da operação; 2) recorrer à 157 sugestão de Michael (1975) de indicar condições de estímulo pré e pós-mudança como forma de descrever uma mudança reforçadora; 3) ensinar os conceitos de “reforçamento positivo” e “reforçamento negativo” aos novos alunos e leitores, de modo que possam compreender e navegar a literatura da área; 4) é possível manter os termos “positivo” e “negativo” como descrições operacionais, desde que não se atribuam a eles processos distintos de reforçamento; 5) explicar por que atribuições processuais distintas a essas formas de descrição não são viáveis, devido à ambiguidade inerente à distinção baseada em adição e subtração; 6) ensinar os termos “reforçadores positivos”, “reforçadores negativos”, “estímulos aversivos” e “estímulos punidores” destacando sua natureza relacional, ou seja, enfatizando que a função de um estímulo depende da contingência em que ele está inserido; 6) considerar a substituição de todos esses termos pelas descrições “mais reforçador” ou “menos reforçador”. Essas sugestões buscam lidar com grande parte dos problemas apontados tanto sobre a manutenção quanto sobre o abandono da distinção. Lattal e Lattal (2006) haviam ressaltado que a distinção, enquanto mantiver as funções comunicativas, práticas, culturais e/ou sociais que tem, permanecerá sendo usada a despeito de sua negação comoconceito – e o mesmo pode ser dito sobre as noções de estímulo aversivo e estímulo punidor. Não só isso, mas os custos associados com uma mudança completa na linguagem podem não valer a pena. De todo modo, com base nas considerações de Baron e Galizio (2005) e outros, poder-se-ia dizer que, se consideradas as ambiguidades inerentes à distinção e desde que condições não deixem de ser bem descritas em nome dela, talvez não haja prejuízo em manter os termos tradicionalmente usados. Limites do Presente Estudo O presente trabalho possui algumas limitações relevantes, tanto em seus procedimentos metodológicos quanto à abordagem adotada para a análise dos dados. Sobre a categorização dos textos, é importante reconhecer que as categorias utilizadas para classificar 158 os dados também implicam em uma ambiguidade própria. Como já indicado no método e nos resultados, as razões pelas quais cada uma das falas foi classificada diz respeito à forma como cada autor da fala a formulou. Particularmente quando se consideram as categorias “Problemas” e “Vantagens”, qualquer fala pertencente a um dos dois grupos poderia ser facilmente reescrita para fazer parte do outro, sem alteração em seu conteúdo central. Mais especificamente, as categorias “Vantagens da Manutenção” e “Problemas do Abandono”, bem como “Vantagens do Abandono” e “Problemas da Manutenção”, são semanticamente equivalentes: dizer que abandonar a distinção “Gera Menos Distorções” equivale a afirmar que mantê-la gera mais distorções. De forma análoga, dizer que a distinção “Tem uma Função Prática” equivale a dizer que seu abandono implicaria a perda dessa função. Um exemplo em que isso fica evidente está na ausência de uma categoria “Problemas do Abandono”. Essa opção existia enquanto categoria na planilha, mas acabou não sendo aplicada a nenhuma fala. Isso não quer dizer que nenhum problema com o abandono tivesse sido indicado, mas que falas que poderiam ter sido interpretadas como “Problemas do Abandono” foram incorporadas à outras categorias equivalentes. Entre elas, “Vantagem da Manutenção” ou os contra-argumentos das “Vantagens do Abandono” e “Problema da Manutenção”. Cabe ainda um adendo: a escolha do termo “Problema” ao invés de “desvantagem” foi motivada pelo fato de que muitos dos argumentos apontavam falhas conceituais ou lógicas na distinção sem, necessariamente, indicar prejuízos práticos. O termo “Vantagem” foi mantido como o antônimo funcional de “Problema” mais adequado nesse contexto, por não significar “solução”. De toda forma, isso evidencia que a classificação das falas envolveu certo grau de subjetividade, e que a leitura, categorização, interpretação e discussão dos dados depende, talvez mais do que em outros tipos de pesquisa, da história pessoal do autor que a está realizando e de seus recursos disponíveis. O que pode ser considerada uma vantagem no 159 sentido de produzir análises mais contextualizadas, articuladas e interpretativas, acaba sendo limitado no sentido de que a análise passa a depender fortemente das compreensões e escolhas do pesquisador, o que pode introduzir vieses, reduzir a possibilidade de replicação do método e dificultar a concordância entre avaliadores. Ainda que o trabalho tenha buscado interrelacionar ao máximo as falas apresentadas tanto entre si quanto com conceitos e dados relevantes, é importante reconhecer que ele não esgota todas as possibilidades a serem exploradas e desenvolvidas. Além disso, a padronização da categorização das falas pode acabar excluindo detalhes importantes de falas individuais de um texto. Outra limitação diz respeito à amostra de textos selecionada. Embora a escolha de restringir a análise ao debate de 2005/2006 da revista The Behavior Analyst tenha garantido um grupo coeso e interrelacionado, isso também impõe restrições à generalização dos resultados. Outras discussões sobre o tema, especialmente desenvolvimentos empíricos posteriores ou novas conceitualizações não foram incorporadas à análise. Do mesmo modo, a exclusão do texto de Michael (1975), ainda que fundamentada por critérios metodológicos, pode ter excluído alguma fala importante que acabou não sendo incluída nos dados. Isso pode ter sido, entretanto, mitigado pela apresentação de seu texto na introdução e inclusão direta de algumas de suas falas ao longo da discussão. Sugestões para Trabalhos Futuros A ambiguidade da distinção, como apresentada por Baron e Galizio (2005), não é puramente experimental, mas conceitual, particularmente, relacionada à forma de descrever os eventos do mundo. A princípio, não há como se fazer uma pesquisa que gere mudanças no fato de que “a adição de um estímulo” e “subtração da retirada desse estímulo” signifiquem semanticamente a mesma coisa (i.e., descrevam a mesma mudança ambiental). Em outras palavras, dados experimentais não mudariam o fato de que a linguagem usada é 160 intrinsecamente ambígua. Dito isso, há vários tipos de investigações teórico-conceituais que poderiam ser feitas tanto que sugiram uma nova linguagem ou convenções que contornem os problemas citados, mas também pesquisas empíricas que comparem as contingências que ainda são chamadas de positivas ou negativas e que possam fornecer, se aplicável, novos critérios para o que vinha sendo distinguido – ou seja, talvez elas facilitem a identificação dos estímulos discriminativos que evocam as respostas verbais “reforçamento positivo” e “reforçamento negativo” em analistas do comportamento. Nesse sentido, além das sugestões conceituais e didáticas já apresentadas, os autores do debate também sugeriram diversas linhas de investigação para aprofundar o entendimento sobre a distinção entre reforçamento positivo e negativo ou outros pontos relevantes. Entre elas, estão: 1) estudos que esclareçam ou aprimorem as definições atuais de reforçamento positivo e negativo (Sidman, 2006); 2) investigações sobre como mudanças paramétricas dentro de um contínuo deveriam ser classificadas (Iwata, 2006); 3) pesquisas que analisem as razões pelas quais a distinção é mantida (e.g., por meio de levantamento com professores ou análise de livros da área, Chase, 2006); 4) estudos que examinem o uso da distinção em outras áreas do conhecimento, para entender suas possíveis funções culturais (Chase, 2006; Lattal & Lattal, 2006); 5) pesquisas que investiguem experimentalmente os efeitos de diferentes reforçadores tradicionalmente classificados como positivos ou negativos, buscando parâmetros comuns para comparação (Lattal & Lattal, 2006); 6) estudos que diferenciem melhor os conceitos de operação, efeito e explicação/razão nos processos de reforçamento e punição (Marr, 2006); 7) investigações sobre a relação entre condicionamento operante e condicionamento emocional, manipulando variáveis como privação e saciação (Staats, 2006); 8) estudos básicos sobre as condições necessárias e suficientes para a aquisição e manutenção de respostas sob reforçamento e esquiva (Marr, 2006); 9) pesquisas que apontem para novas possibilidades de termos para substituírem os atuais (Baron e Galizio, 2006a; Sidman, 2006); 161 10) pesquisas que explorem o próprio comportamento de cientistas ao distinguir reforçamentos e os efeitos de diferentes formas de nomeação (Baron & Galizio, 2006a). Desse modo, uma conclusão bastante contundente que se pode tirar da presente análise é que o debate realizado por esses autores indicou de maneira profícua diversos caminhos investigativos para que analistas do comportamento lidem com essa difícil questão conceitual. Sobre esse último ponto, já foram mencionadas diversas possibilidades trazidas pelos autores de fatores que poderiam controlar o comportamento de distinguir contingências entre reforçamento positivo e negativo que não a operação envolvida entre resposta e consequência (i.e., adição/subtração). Entre18 ruído alto etc.; pois é a ausência após a presença que é eficaz, e isso é apenas outra forma de dizer que o estímulo foi removido. (p. 73) Nesse sentido, para Skinner (1953/2014) aponta tanto para o efeito do reforçamento sendo o mesmo nos dois casos, quanto o evento reforçador não é um estímulo estático, mas a própria mudança ambiental. A ausência só é capaz de reforçar o comportamento se ela for antecedida pela presença. Isso não é dito, mas a situação contrária também seria verdadeira para o reforçamento positivo. A preferência particular do autor deste trabalho pelos termos “adição” e “subtração” ao descrever as operações envolvidas se dá porque, além de fazer uma referência mais inequívoca a operações, esses termos têm uma conotação mais abrangente quanto ao tipo de alteração envolvida, isto é, enquanto “acréscimo” ou “retirada” parecem implicar uma completa ausência anterior do estímulo (de zero para um), “adição” e “subtração” podem se referir também a alterações quantitativas mais sutis nas propriedades de um estímulo ao longo de contínuos (magnitude, duração, probabilidade e atraso, por exemplo). Reforçadores Positivos e Negativos Como fora mencionado, o aumento na frequência de uma classe de respostas (característico de qualquer reforçamento) só ocorrerá se eventos ambientais específicos ocorrerem após uma ação do organismo. Como fica implícito pela definição de reforçamento apresentada, nem todas as alterações ambientais provocam alterações na frequência de uma determinada classe de respostas. Um exemplo disso é o de uma criança que continua caminhando em direção a um carrinho de sorvete, a despeito de deixar ou não pegadas na areia ou fazer som. O que mantém a frequência desse comportamento é que, ao caminhar, a criança produz proximidade em relação ao carrinho de sorvete. Isso significa que os eventos ambientais visuais e auditivos ao caminhar nesse caso não são estímulos para o caminhar – mesmo que possam ser para outros comportamentos. 19 Ao tipo de estímulo envolvido no reforçamento positivo e cuja adição ao ambiente do organismo tem a capacidade de gerar um aumento na frequência de respostas que antecederam sua adição ao ambiente, se dá o nome de reforçador positivo. Ao tipo de estímulo envolvido no reforçamento negativo e cuja subtração do ambiente do organismo tem a capacidade de gerar um aumento na frequência de respostas antecederam sua remoção do ambiente, se dá o nome de reforçador negativo. Por outro lado, quando um reforçador negativo é apresentado ou quando um reforçador positivo é retirado, se está falando de punição (Skinner, 1953/2014; Sidman, 1989/2009). Independentemente da visão acerca da punição, simétrica ou assimétrica (ver Mayer, 2011), o efeito da punição é diminuir a frequência (pelo menos momentaneamente) de uma classe de respostas, seja diminuindo diretamente a sua probabilidade (visão simétrica) ou aumentando a probabilidade de comportamentos concorrentes via eliciação de reflexos incondicionados, condicionamento reflexo e reforçamento negativo de respostas operantes (visão assimétrica), que são incompatíveis com o responder punido. Dito isso, aos procedimentos em que isso ocorre pela adição subsequente e sistemática de estímulo reforçador negativo (chamado também de aversivo por alguns autores) dá-se o nome de punição positiva. Aos procedimentos em isso ocorre por conta da subtração subsequente e sistemática de estímulo reforçador positivo, dá-se o nome de punição negativa. Assim, constata-se que as definições de reforçamento positivo e negativo, bem como de reforçadores positivos e negativos, têm implicações para outros conceitos da análise do comportamento, como os de punição positiva e negativa. Isso é especialmente importante se considerarmos que a distinção entre reforçamento positivo e negativo tem sido questionada por alguns autores ao longo do desenvolvimento conceitual da área. Os argumentos envolvidos nesse questionamento e nas respostas a ele é o tema de principal interesse do presente trabalho. 20 Existe Diferença Entre os Reforçamentos Positivo e Negativo? Michael (1975) inicia seu texto “Positive and Negative Reinforcement, a Distinction That Is No Longer Necessary; Or a Better Way to Talk about Bad Things [Reforçamento positivo e negativo, uma distinção que não é mais necessária; ou uma melhor forma de falar sobre coisas ruins]”, escrito há exatos 50 anos, enfatizando que as práticas verbais da comunidade de analistas do comportamento, assim como de qualquer outra área da ciência, evoluem majoritariamente guiadas pela sua eficácia. Entretanto outros fatores que ele chama de “não-funcionais” podem afetar esse processo – tal como ocorre na evolução filogenética. O autor cita dois exemplos de como essas práticas podem ser mantidas sem relação (pelo menos atual) com uma vantagem na produção de conhecimento: práticas mantidas por outros tipos de reforçamento social (e.g., elogios dados a alguém que usa palavras consideradas sofisticadas) e por terem sido eficazes na formação inicial daquele conhecimento por fazerem paralelos com outros conceitos, mas que agora seriam desnecessárias. Um exemplo disso pode ser observado no campo da matemática, em que há mais de 100 anos (ver Thomas, 1920) existe uma discussão a respeito da mudança do sistema decimal de numeração para um duodecimal (12 algarismos ao invés de dez) por conta de o número 12 ter mais divisores inteiros (1, 2, 3, 4, 6, 12) do que o dez (1, 2, 5 e 10) – algo que facilitaria diversos tipos de cálculo. Neste exemplo, o trabalho para se mudar uma prática cultural tão bem estabelecida poderia justificar a sua manutenção. Michael (1975) destaca então que, apesar de que as terminologias serem determinadas por conta da evolução de práticas culturais e não por puros “acordos sociais”, o que faz a ciência e a filosofia é, justamente, buscar afetar esse processo evolutivo numa direção desejada. Em seguida, o autor faz uma breve retomada dos conceitos de reforçamento positivo e negativo ao longo dos anos, apresentando contradições, imprecisões e alterações que ele afirma poderem ter tornado a compreensão desses conceitos confusa. Em especial, destaca-se 21 o uso anterior do termo “reforçamento negativo” no sentido do que hoje é chamado de punição (ver Skinner, 1938) e o seu atual uso no sentido de ser um dos processos que aumentam a frequência de resposta. Michael atribui a mudança do significado do termo aos resultados dos experimentos de Skinner (1938) e Estes (1944) que sugeriram que qualquer enfraquecimento de uma resposta gerado por uma punição era, na verdade, resultado do fortalecimento de uma resposta incompatível (visão assimétrica de punição). Se não é o estímulo “punidor” que enfraquece a resposta, mas sim a remoção de um novo estímulo condicionado que fortalece uma resposta incompatível, este segundo processo que é o mais relevante e deveria ser chamado “reforçamento negativo”. Ademais, o autor ressalta a ambiguidade gerada pelo uso ampliado do termo “estímulo”, afirmando que no cotidiano isso pode não gerar muitos problemas, mas em situações em que se deseja definir processos e termos específicos, isso pode ser prejudicial, já que o termo “estímulo” é principalmente usado para descrever condições estáticas de estimulação. Presumivelmente, Michael se referia a frases comuns como “o estímulo reforçador fortalece a resposta” em que a alteração ambiental ocorrida fica omitida. Essa alteração fica de alguma forma evidente em usos como “a apresentação do estímulo reforçador fortalece a resposta” (já que se presume que se houve acréscimo, havia ausência), mas o autor acredita que isso poderia ser mais bem explicitado pelo uso de termos como “mudança de estímulo” (“stimulus change”), ou seja, “a mudança de estímulo fortalece a resposta”. Tanto o reforçamento quantoelas: a abruptidão da mudança ambiental (Michael, 1975; Baron e Galizio, 2005), os mecanismos fisiológicos envolvidos (Michael, 1975; Baron e Galizio, 2005), as “emoções” ou “sentimentos” envolvidos (Michael, 1975; Baron e Galizio, 2005; Staats, 2006), a severidade das operações motivadoras (Sidman 1989/2009; Baron e Galizio, 2005), a saliência da mudança (Chase, 2006) ou ainda propriedades particulares dos estímulos usualmente empregados (Lattal & Lattal, 2006). Como discutido ao longo do trabalho, outros autores (e.g., Skinner, 1953/2014; Sidman, 1989/2009) apontam para a presença de efeitos colaterais como uma possível variável discriminativa para a distinção, o que não foi sugerido pelos autores do debate (inclusive pelo próprio Sidman, 2006). Uma possibilidade seria investigar na literatura quais desses fatores (e outros) podem ser identificados nas contingências (ou nas descrições de contingências) que parecem estar controlando o comportamento de quem classifica essas contingências. Outra proposta interessante seria desenvolver experimentos em que analistas do comportamento fossem convidados a classificar diferentes contingências como exemplos de reforçamento positivo ou negativo, variando sistematicamente os fatores envolvidos, para avaliar quais aspectos controlam essas classificações. Isso poderia fornecer dados para se pensar em novos critérios mais consistentes para a distinção ou o estabelecimento de novas distinções importantes. 162 Por fim, vale retomar que os dois tipos de reforçamento raramente são estudados em conjunto e de forma simétrica (Magoon & Critchfield, 2008; Magoon et al., 2017). Como apontado por esses mesmos autores, as diferenças de performance encontradas, até então, entre os comportamentos mantidos pelos chamados reforçamento positivo e negativo podem, em grande parte, ser atribuídas a diferenças procedimentais. Nesse sentido, mais pesquisas que investiguem, de forma paralela, possíveis diferenças entre os reforçamentos positivo e negativo, também podem apontar para novos elementos distintivos. Em Direção à Uma Nova Proposta de Distinção A ambiguidade da distinção reforçamento positivo/negativo, por não ser uma forma inequívoca de distinguir práticas desejáveis e indesejáveis, acaba podendo abrir margem para que práticas consideradas indesejáveis sejam justificadas e mantidas simplesmente por poderem ser classificadas como reforçamento positivo. Esse risco aumenta ainda mais por falas como a de Baron e Galizio (2005) de que “quando estímulos dolorosos são usados como meio de modificação do comportamento, os efeitos colaterais indesejáveis podem ser compensados pela gravidade do transtorno em tratamento” (p. 91), uma vez que validam que até mesmo práticas já antes classificadas como aversivas possam ser usadas. Holland (1978) criticou os procedimentos de modificação de comportamento aplicados em instituições fechadas justamente porque, em certos programas descritos como “baseados em reforçamento positivo”, por envolverem a adição de bens e serviços de forma contingente à emissão de algumas respostas, era feita a retirada prévia desses recursos. O estabelecimento dessas privações, muitas vezes severas (e.g., isolamento), torna a intervenção como um todo muito mais aversiva. Segundo o autor: “Um sistema de modificação de comportamento pode, ele mesmo, utilizar apenas reforçamento positivo, mas, se os estratos superiores desejam manter a maior parte da 163 riqueza e dos privilégios, restrição e coerção precisam ser utilizadas para manter o controlado dentro das regras do sistema.” (Holland, 1978, p. 171). Tanto Skinner (1953/2014) quanto Sidman (1989/2009) citam as privações socialmente estabelecidas como um caso de mau uso do reforçamento positivo. Além disso, Skinner (1971) ainda destaca que alguns comportamentos mantidos por reforçamento positivo podem ser prejudiciais a longo prazo (e.g., jogos de azar, drogas e comportamento sexual de risco). Vale ressaltar que se analistas do comportamento passassem a utilizar intervenções indesejáveis nomeando-as como reforçamento positivo, o que poderia ter sido aceito em primeiro momento provavelmente se converteria em recusa rapidamente. No fim das contas, não é o nome dado, mas as características das contingências planejadas que importam. Como Sidman havia sugerido, se as pílulas de aspirina não mais tivessem efeito, qualquer um pararia de tomá-las. Mesmo que a distinção, em muitos casos, esteja sendo usado de forma questionável, pode ser que o abandono da distinção possa piorar ainda mais a situação, já que atualmente, pelo menos, parece existir uma tentativa de caminhar na direção certa quanto a escolha de procedimentos que evitam efeitos indesejáveis. Diante disso, Michael (1975) sugeriu - e Baron e Galizio (2005) concordaram - que a melhor forma que se teria de falar sobre coisas boas e ruins é, simplesmente, falar sobre reforçamento e punição. Um problema com essa sugestão é que, como apontou Sidman (2006), os autores assumiram uma posição sobre o conceito de punição que faz parte de um debate sobre o qual não há consenso até os dias atuais. Outro problema seria que ela não abarca os efeitos indesejáveis da extinção/indisponibilidade do reforçamento ou de operações motivadoras intensas que não envolvem necessariamente a punição (i.e., ainda haveria “coisas ruins” não abarcadas pelo termo punição). 164 No tópico “Implicações Sobre o Conceito de Reforçadores”, foi ressaltado que, para que uma condição seja considerada reforçadora, um aumento na frequência de respostas que a produziu precisaria ser observado. Mesmo assim, essa condição só poderia ser chamada de reforçadora em relação àquela condição pré-mudança específica que poderia ser chamada tanto de “menos reforçadora” como de “aversiva”. Sobre essa noção, algumas considerações precisam ser feitas. Quando se considera um rato que está diante de um choque e não está emitindo as respostas que o eliminam, alguns fatores podem ser considerados: 1) existe uma resposta disponível que elimine o choque? 2) Qual a exigência para a emissão dessa resposta? E 3) o rato teve a oportunidade de aprender a emitir essa resposta? Essas três perguntas dizem respeito à controlabilidade desse choque. Como colocado, a definição do que é ou não reforçador (e por tabela o que é ou não aversivo ou punidor) exige, necessariamente a emissão de respostas que o produza ou elimine. Nesse sentido, um indivíduo poderia ser submetido a um determinado estímulo e, sem nenhuma, possibilidade de fuga, não se poderia dizer que ele seria. Mesmo que uma possibilidade de fuga existisse, talvez ela fosse tão custosa (razão muito alta) que a resposta também não fosse emitida. Também é possível que uma resposta de fuga pouco custosa estivesse disponível, mas que o indivíduo acabasse nunca emitindo-a porque tal variação simplesmente não ocorreu. O indivíduo submetido a esse estímulo poderia estar demonstrando alguns sinais de algo que poderia ser chamado de “sofrimento” ou até mesmo descrevendo exatamente isso se fosse humano, mas, a princípio, nada poderia ser dito sobre a aversividade desse estímulo, já que fatores como respondentes eliciados, emoções, sentimentos ou relatos verbais não fazem parte dessa categorização. A partir disso, fica parecendo que, além da ausência de um consenso no debate sobre reforçamento positivo x negativo e punição simétrica x assimétrica, as próprias delimitações ligadas aos conceitos de punição e reforçamento negativo limitam a definição de controle 165 aversivo sugerida por Skinner (1953/2014) e, similarmente, a definição de coerção sugerida por Sidman (1989/2009). A sugestão de evitar o reforçamento negativo, como apontado por Michael (1975, 2006) não pode ser facilmente seguida porque a distinção é ambígua e a passagem de qualquer condição para outrasugere que a anterior seja aversiva (incluindo em contingências tipicamente classificadas como positivas). Ao mesmo tempo, a sugestão de evitar a punição também não daria conta de instâncias em que a indisponibilidade do reforçamento (extinção como condição aversiva) não está sendo apresentada de forma contingente a uma resposta específica - algo que parecia ser contornado pela sugestão de evitar o reforçamento negativo. Diante das dificuldades já citadas de se recorrer a distinção positivo/negativo ou à distinção reforçamento/punição para guiar as intervenções que deverão ser ou não endossadas, uma possibilidade seria contrastar a condição de estímulo aplicada com as condições anteriores a ela. Em outras palavras: uma condição de estímulo só deveria ser usada em uma intervenção se ela tiver sido demonstrada como reforçadora no passado diante da condição de estímulo presente. Talvez se o objetivo é evitar sofrimentos desnecessários ou efeitos colaterais, dever-se-ia, no mínimo, manter sempre disponível a possibilidade de um indivíduo voltar para a condição anterior a que está sendo apresentada. Além disso, é importante que a resposta que possibilitaria o indivíduo de voltar deveria ser uma resposta de baixo custo que o indivíduo já demonstrou ser capaz de emitir. Dessa forma, talvez fosse possível garantir, dentro de alguns limites, que o alvo da intervenção pudesse se manter (na maior parte do tempo) na condição mais reforçadora para ele, e que as mudanças de estímulo introduzidas só pudessem caminhar numa direção que seja mais reforçadora, nunca menos. Essa é, certamente, uma sugestão idealizada. Mudanças na direção de diminuir a aversividade de práticas de intervenção (e do mundo como um todo) costumam ser trabalhosas e, muitas vezes, enfrentam resistências institucionais, culturais e pessoais. Ainda 166 assim, com base no que foi discutido até então, pode-se concluir que qualquer ajuda na direção de tornar viável que outras pessoas se comportem para produzir uma condição um pouco mais reforçadora que a anterior já representa um ganho considerável - não apenas para quem é diretamente afetado, mas também como passo concreto na construção de práticas mais sensíveis, eficazes e sustentáveis a longo prazo. 167 Referências Andery, M. A., Sério, T. M., & Micheletto, N. (Orgs.). (2009). Comportamento e causalidade. Pontifícia Universidade Católica de São Paulo.  Azrin, N. H. (1961). Time-out from positive reinforcement. Science, 133(3450), 382-383. https://doi.org/10.1126/science.133.3450.382 Azrin, N. H., Holz, W. C., Hake, D. F., & Ayllon, T. (1963). Fixed-ratio escape reinforcement. Journal of the experimental analysis of behavior, 6(3), 449–456. https://doi.org/10.1901/jeab.1963.6-449 Azrin, N. H. & Holz, W. C. (1966). Punishment. In W. K. Honig (Org.), Operant behavior: Areas of research and application (pp. 380-447). Appleton-Century-Crofts. Baron, A., & Galizio, M. (2005). Positive and negative reinforcement: Should the distinction be preserved? The Behavior Analyst, 28(2), 85-98. https://doi.org/10.1007/BF03392107 Baron, A., & Galizio, M. (2006a). Distinguishing Between Positive and Negative Reinforcement: Responses to Nakajima (2006) and Staats (2006). The Behavior Analyst, 29(1), 273-277. https://doi.org/10.1007/BF03392137 Baron, A., & Galizio, M. (2006b). The distinction between positive and negative reinforcement: Use with care. The Behavior Analyst, 29(2), 141-151. https://doi.org/10.1007/BF03392127 Baum, W. M. (1999). Compreender o behaviorismo: Ciência, comportamento e cultura (M. T. A. Silva, M. A. Matos, G. Y. Tomanari & E. Z. Tourinho, Tradutores.). Artes Médicas. [Obra original publicada em 1994] Cameschi, C. E., & Abreu-Rodrigues, J. (2005). Contingências aversivas e comportamento emocional. Em J. Abreu-Rodrigues & M. R. Ribeiro (Orgs.), Análise do comportamento: Teoria, pesquisa e aplicação (pp. 113-137). Artmed. https://doi.org/10.1126/science.133.3450.382 https://doi.org/10.1901/jeab.1963.6-449 https://doi.org/10.1007/BF03392107 https://doi.org/10.1007/BF03392137 https://doi.org/10.1007/BF03392127 168 Catania, A. C. (1973). The concept of the operant in the analysis of behavior. Behaviorism, 1(2), 103–116. Catania, A. C. (1992). Learning (3rd ed.). Prentice Hall. Chase, P. N. (2006). Teaching the distinction between positive and negative reinforcement. The Behavior Analyst, 29(1), 113-115. https://doi.org/10.1007/BF03392121 Crowley, T. J. (1972). The reinforcers for drug abuse: Why people take drugs. Comprehensive Psychiatry, 13, 51–62. https://doi.org/10.1016/0010-440X(72)90034-X De Souza, D. G., De Moraes, A. B. A., & Todorov, J. C. (1984). Shock intensity and signaled avoidance responding. Journal of the Experimental Analysis of Behavior, 42(1), 67- 74. https://doi.org/10.1901/jeab.1984.42-67 Deese, J., & Hulse, S. H. (1975). A psicologia da aprendizagem (D. M. Leite, Tradutor). Pioneira. [Obra original publicada em 1967]. Dinsmoor, J. A. (1962). Variable-interval escape from stimuli accompanied by shocks. Journal of the Experimental Analysis of Behavior, 5(1), 41–47. https://doi.org/10.1901/jeab.1962.5-41 Dinsmoor, J. A. (2001). Stimuli inevitably generated by behavior that avoids electric shock are inherently reinforcing. Journal of the Experimental Analysis of Behavior, 75(3), 311–333. https://doi.org/10.1901/jeab.2001.75-311 Findley, J. D. (1958). Preference and switching under concurrent scheduling. Journal of the Experimental Analysis of Behavior, 1(2), 123–144. https://doi.org/10.1901/jeab.1958.1-123 Fontes, R. M., & Shahan, T. A. (2020). Punishment and its putative fallout: A reappraisal. Journal of Experimental Analysis of Behavior, 115(1), 185-203. https://doi.org/10.1002/jeab.653 https://doi.org/10.1007/BF03392121 https://doi.org/10.1016/0010-440X(72)90034-X https://doi.org/10.1901/jeab.1984.42-67 https://psycnet.apa.org/doi/10.1901/jeab.1962.5-41 https://psycnet.apa.org/doi/10.1901/jeab.2001.75-311 https://doi.org/10.1901/jeab.1958.1-123 https://doi.org/10.1002/jeab.653 169 Geller, E. S. (2004). On Making Mountains Out of Molehills: Confessions of a Behavioral Scientist with Mentalistic Vulnerability. Journal of Organizational Behavior Management, 24(1-2), 175–184. https://doi.org/10.1300/J075v24n01_11 Harms, J. Y., & Staats, A. W. (1978). Food deprivation and conditioned reinforcing value of food words: Interaction of Pavlovian and instrumental conditioning. Bulletin of the Psychonomic Society, 12(4), 294–296. https://doi.org/10.3758/BF03329687 Hearst, E. (1962). Delayed alternation in the pigeon. Journal of the Experimental Analysis of Behavior, 5(2), 225–228. https://doi.org/10.1901/jeab.1962.5-225 Hineline, P. N. (1984). Aversive control: A separate domain? Journal of the Experimental Analysis of Behavior, 42(1), 495-509. https://doi.org/10.1901/jeab.1984.42-495 Holland, J. G., & Skinner, B. F. (1975). A análise do Comportamento (R. Azzi & C. M. Bori, Tradutores). Editora Pedagógica e Universitária. [Obra original publicada em 1969]. Holland, J. G. (1978). Behaviorism: Part of the problem or part of the solution? Journal of Applied Behavior Analysis, 11(1), 163–174. https://doi.org/10.1901/jaba.1978.11-163 Iwata, B. A. (2006). On the distinction between positive and negative reinforcement. The Behavior Analyst, 29(1), 121-123. https://doi.org/10.1007/BF03392123 Jenkins, H. M., & Harrison, R. H. (1960). Effect of discrimination training on auditory generalization. Journal of Experimental Psychology, 59(4), 246–253. https://doi.org/10.1037/h0041661 Jwaideh, A. R., & Mulvaney, D. E. (1976). Punishment of observing by a stimulus associated with the lower of the two reinforcement frequencies. Journal of the Experimental Analysis of Behavior, 25(1), 37-44. https://doi.org/10.1016/0023-9690(76)90029-1 Kelleher, R. T. (1958).Fixed-ratio schedules of conditioned reinforcement with chimpanzees. Journal of the Experimental Analysis of Behavior, 1(3), 281-289. https://doi.org/10.1901/jeab.1958.1-281 https://psycnet.apa.org/doi/10.1300/J075v24n01_11 https://doi.org/10.3758/BF03329687 https://doi.org/10.1901/jeab.1962.5-225 https://doi.org/10.1901/jeab.1984.42-495 https://doi.org/10.1901/jaba.1978.11-163 https://doi.org/10.1007/BF03392123 https://psycnet.apa.org/doi/10.1037/h0041661 https://doi.org/10.1016/0023-9690(76)90029-1 https://doi.org/10.1901/jeab.1958.1-281 170 Keller, F. S., & Schoenfeld, W. N. (1974). Princípios de psicologia (C. M. Bori & R. Azzi, Tradutores). Editora Pedagógica e Universitária. [Obra original publicada em 1950]. Lattal, K. A., & Lattal, A. D. (2006). And yet…: Further comments on distinguishing positive and negative reinforcement. The Behavior Analyst, 29(1), 129-134. https://doi.org/10.1007/BF03392125 Lundin, R. W. (1972). Personalidade: Uma análise do comportamento (R. L. Rodrigues & L. O. S. Queiroz, Tradutores). Herder. [Obra original publicada em 1969] Magoon, M. A., & Critchfield, T. S. (2008). Concurrent schedules of positive and negative reinforcement: Differential-impact and differential-outcomes hypotheses. Journal of the Experimental Analysis of Behavior, 90(1), 1-22. https://doi.org/10.1901/jeab.2008.90-1 Magoon, M. A., Critchfield, T. S., Merrill, D., Newland, M. C., & Schneider, W. J. (2017). Are positive and negative reinforcement "different"? Insights from a free-operant differential outcomes effect. Journal of the experimental analysis of behavior, 107(1), 39–64. https://doi.org/10.1002/jeab.243 Marr, M. J. (2006). Through the looking glass: Symmetry in behavioral principles? The Behavior Analyst, 29(1), 125-128. https://doi.org/10.1007/BF03392124 Mayer, P. C. M., & Gongora, M. A. N. (2011). Duas formulações comportamentais de punição: Definição, explicação e algumas implicações. Acta Comportamentalia, 19(1), 47–63. https://www.revistas.unam.mx/index.php/acom/article/view/36938 Michael, J. (1975). Positive and negative reinforcement: A distinction that is no longer necessary; or a better way to talk about bad things. Behaviorism, 3(1), 33-44. https://psycnet.apa.org/record/1976-03436-001 https://doi.org/10.1007/BF03392125 https://psycnet.apa.org/doi/10.1901/jeab.2008.90-1 https://doi.org/10.1002/jeab.243 https://doi.org/10.1007/BF03392124 https://www.revistas.unam.mx/index.php/acom/article/view/36938 https://psycnet.apa.org/record/1976-03436-001 171 Michael, J. (1982). Distinguishing between discriminative and motivational functions of stimuli. Journal of the Experimental Analysis of Behavior, 37(1), 149-155. https://doi.org/10.1901/jeab.1982.37-149 Michael, J. (2006). Comment on Baron and Galizio (2005). The Behavior Analyst, 29(1), 117- 119. https://doi.org/10.1007/BF03392122 Millenson, J. R. (1975). Princípios de análise do comportamento (A. A. Rosa & D. Resende, Tradutores). Editora de Brasília. [Obra original publicada em 1967]. Moore, J. (2000). Words are not things. The Analysis of Verbal Behavior, 17, 143–160. https://doi.org/10.1007/BF03392961 Morse, W. H., & Kelleher, R. T. (1977). Determinants of reinforcement and punishment. In W. K. Honig & J. E. R. Staddon (Eds.), Handbook of operant behavior (pp. 174–200). Prentice Hall. Mowrer, O. H. (1960). Learning theory and behavior. John Wiley & Sons, Inc. https://doi.org/10.1037/10802-000 Nakajima, S. (2006). In response: Speculation and explicit identification as judgmental standards for positive or negative reinforcement. The Behavior Analyst, 29(1), 269- 270. https://doi.org/10.1007/BF03392135 Nevin, J. A., & Mandell, C. (2017). Comparing positive and negative reinforcement: A fantasy experiment. Journal of the experimental analysis of behavior, 107(1), 34–38. https://doi.org/10.1002/jeab.237 Pear, J. J. (2001). The science of learning. Psychology Press. Perone, M. (2003). Negative effects of positive reinforcement. The Behavior Analyst, 26(1), 1-14. https://doi.org/10.1007/BF03392064 Perone, M., & Courtney, K. (1992). Fixed-ratio pausing: Joint effects of past reinforcer magnitude and stimuli correlated with upcoming magnitude. Journal of the https://doi.org/10.1901/jeab.1982.37-149 https://doi.org/10.1007/BF03392122 https://doi.org/10.1007/BF03392961 https://psycnet.apa.org/doi/10.1037/10802-000 https://doi.org/10.1007/BF03392135 https://doi.org/10.1002/jeab.237 https://doi.org/10.1007/BF03392064 172 experimental analysis of behavior, 57(1), 33–46. https://doi.org/10.1901/jeab.1992.57- 33 Pierce, W. D., & Cheney, C. D. (2004). Behavior analysis and learning (3rd ed.). Erlbaum. https://doi.org/10.1007/BF03392126 Pierce, W. D., & Epling, W. F. (1995). Behavior analysis and learning. Prentice-Hall. Lundin, R. W. (1972). Personalidade: Uma análise do comportamento (R. L. Rodrigues & L. O. S. Queiroz, Tradutores). Herder. (Trabalho original publicado em 1969) Pierce, W. D., & Epling, W. F. (1995). Behavior analysis and learning. Prentice-Hall. Possmoser, T. L. (2015). A influência de Michael (1975) na literatura e a discussão da distinção entre reforçamento positivo e negativo (Trabalho de Conclusão de Curso). Pontifícia Universidade Católica de São Paulo. Reese, E. P. (1973). Análise do comportamento humano (G. P. Witter, Tradutor). Livraria José Olympio. [Obra original publicada em 1966]. Rosenberg, E. L., & Ekman, P. (2000). Emotion: Methods of study. In A. E. Kazdin (Ed.), Encyclopedia of Psychology (Vol. 3, pp. 171–175). Oxford University Press. Santos, E. L. N., & Leite, F. L. (2013). A distinção entre reforçamentos positivo e negativo em livros de ensino de análise do comportamento. Revista Perspectivas, 4(1), 9-18. https://doi.org/10.18761/perspectivas.v4i1.101 Sidman, M. (1989/2009). Coerção e suas implicações (M. A. Andery & T. M. Sério, Tradutores). Editora Livro Pleno. Sidman, M. (2006). The Distinction Between Positive and Negative Reinforcement: Some Additional Considerations. The Behavior Analyst, 29(1), 135–139. https://doi.org/10.1007/BF03392126 https://doi.org/10.1901/jeab.1992.57-33 https://doi.org/10.1901/jeab.1992.57-33 https://doi.org/10.1007/BF03392126 https://doi.org/10.18761/perspectivas.v4i1.101 https://doi.org/10.1007/BF03392126 173 Sizemore, O. J., & Maxwell, J. M. (1985). Selective punishment of interresponse times: The roles of shock intensity and scheduling. Journal of the Experimental Analysis of Behavior, 43(2), 207-216. https://doi.org/10.1901/jeab.1985.44-355 Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. Appleton- Century-Crofts. ISBN 978-0874114874 Skinner, B. F. (1953/2014). Science and human behavior. The B. F. Skinner Foundation. https://www.bfskinner.org/product/science-and-human-behavior Skinner, B. F. (1973). Beyond freedom and dignity. Penguin Books. (Obra original publicada em 1971) Staats, A. W., & Hammond, O. R. (1972). Natural words as physiological conditioned stimuli: Food-word-elicited salivation and deprivation effects. Journal of Experimental Psychology, 96(1), 206–208. https://doi.org/10.1037/h0033508 Staats, A. W., & Warren, D. R. (1974). Motivation and three-function learning: Food deprivation and approach-avoidance to food words. Journal of Experimental Psychology, 103(6), 1191–1199. https://doi.org/10.1037/h0037417 Staats, A. W. (1975). Social behaviorism. Dorsey Press. Staats, A. W., & Eifert, G. H. (1990). The paradigmatic behaviorism theory of emotions. Clinical Psychology Review, 10(5), 539–566. https://doi.org/10.1016/0272- 7358(90)90096-S Staats, A. W. (1996). Behavior and personality: Psychological behaviorism. Springer. Staats, A. W. (2006). Positive and negative reinforcers: How about the second and third functions? The Behavior Analyst, 29(2), 271–272. https://doi.org/10.1007/BF03392136 Thomas,N. W. (1920). 14. Duodecimal Base of Numeration. Man, 20, 25–29. https://doi.org/10.2307/2840300 https://doi.org/10.1901/jeab.1985.44-355 https://www.bfskinner.org/product/science-and-human-behavior https://doi.org/10.1037/h0033508 https://doi.org/10.1037/h0037417 https://psycnet.apa.org/doi/10.1016/0272-7358(90)90096-S https://psycnet.apa.org/doi/10.1016/0272-7358(90)90096-S https://doi.org/10.1007/BF03392136 https://doi.org/10.2307/2840300 174 Weiss, B., & Laties, V. G. (1961). Behavioral thermoregulation. Science (New York, N.Y.), 133(3461), 1338–1344. https://doi.org/10.1126/science.133.3461.1338 Whaley, D. L., & Malott, R. W. (1980). Princípios elementares do comportamento (M. A. Matos, M. L. D. Ferrara, & C. F. Santoro, Tradutores; Vol. 1, 6ª ed.). E.P.U. - Editora Pedagógica e Universitária Ltda. Whelan, R., & Barnes-Holmes, D. (2010). Consequence valuing as operation and process: A parsimonious analysis of motivation. The Psychological Record, 60(2), 337–354. https://doi.org/10.1007/BF03395711 Wiegand, D. M., & Geller, E. S. (2005). Connecting positive psychology and organizational behavior management. Journal of Organizational Behavior Management, 24(1–2), 3– 25. https://doi.org/10.1300/j075v24n01_02 Xu, S., Sun, Y., Huang, M., Huang, Y., Han, J., Tang, X., & Ren, W. (2021). Emotional state and feedback-related negativity induced by positive, negative, and combined reinforcement. Frontiers in Psychology, 12, Article 647263. https://doi.org/10.3389/fpsyg.2021.647263 https://doi.org/10.1126/science.133.3461.1338 https://doi.org/10.1007/BF03395711 https://doi.org/10.1300/j075v24n01_02 https://doi.org/10.3389/fpsyg.2021.647263 175 Apêndice Recorte Ilustrativo da Planilha do Excel Usada como Fase Intermediária para a Construção do Texto a Partir das Falas Apresentadas. Os números indicados nas colunas “Resposta a” e “Respondido por” correspondem ao número da linha onde estava inserido o argumento respondido ou que o respondeu (na planilha original). Identificação Análise das falas Texto Localização Fala Dado Tipo de fala Ponto central Ponto específico Resposta a Respondido por Baron e Galizio (2005) p. 87 A função reforçadora de um evento advém da mudança de uma condição de estímulo para outra. Qualquer afirmação de que uma mudança reforçadora é somente positiva ou negativa pode ser contra-argumentada com sua forma contrária. Weiss e Laties (1961): ratos em uma caixa gelada pressionavam uma alavanca e produziam calor ao mesmo tempo que eliminavam o frio Problema da Manutenção A distinção é ambígua — — Baron e Galizio 49 Baron e Galizio 50 Chase 59 Chase 66 Iwata 83 Iwata 88 Iwata 90 Marr 102 Marr 103 Sidman 141 Sidman 144 Sidman 145 Sidman 148 Sidman 150 Sidman 156 Nakajima 209 Entrega de dinheiro tem a consequência de terminar um período de falta de dinheiro 176 Identificação Análise das falas Texto Localização Fala Dado Tipo de fala Ponto central Ponto específico Resposta a Respondido por Fuga de um estímulo aversivo condicionado produz uma situação na qual um estímulo está ausente Nakajima 210 Nakajima 211 Nakajima 216 Staats 221 Staats 222 Chase (2006) p. 115 A distinção pode ter sido mantida porque talvez uma direção da mudança (positiva ou negativa) seja mais saliente ou discriminável que outra — Explicação para Manutenção Diferem quanto a outro aspecto Saliência ou discriminabilidade — Baron e Galizio 181 Sidman (2006) p. 136 Apesar de contestarem a noção de que o reforçamento envolve mudanças em estados fisiológicos ou emocionais, ele ainda apela a esses estados em seu principal argumento A apresentação de comida também é dita como envolvendo a redução de um estado de privação (Baron & Galizio, 2005, p. 87) Contra-argumento — — Baron e Galizio 4 Baron e Galizio 194 Após algumas pesquisas sobre o assunto não se mostrarem convincentes, a teoria de que o reforçamento deve envolver redução de impulso não está mais em vigor (e.g., Miller & Kessen, 1952; Miller, Sampliner & Woodrow, 1957) 177 Identificação Análise das falas Texto Localização Fala Dado Tipo de fala Ponto central Ponto específico Resposta a Respondido por “É melhor falar da consequência como aumento de atenção ou como alívio da solidão?” (Baron & Galizio, 2005, p. 91)a punição descrevem especificamente mudanças no que ele chama de “condições de estímulo” (i.e., stimulus condition). Ainda sobre o tópico de “mudanças de estímulo”, Michael (1975, p. 38) acrescenta que além do destaque para o fato de que há sempre uma mudança e que ela é a responsável pelas alterações no comportamento, dever-se-ia, para fins de maior precisão, fazer tanto 22 menções específicas para a condição de estímulo presente antes da alteração quanto para a velocidade na qual se deu essa mudança. Afinal, “uma mudança consiste em nada além do fato de que uma condição pré-mudança é substituída por uma condição pós-mudança, em uma certa forma temporal e com certas condições intermediárias” (Michael, 1975, p. 38). Outro fato que teria gerado confusão foi que uma grande parcela dos alunos de análise do comportamento usava as definições de Keller e Schoenfeld (1950) de reforçamento enquanto outra grande parcela usava as definições de Skinner (1953/2014). A principal diferença é que a primeira focava no reforçador como um evento estático, enquanto a segunda, segundo Michael (1975) avançou em tratar a mudança de estímulo como o evento reforçador. A publicação de Holland e Skinner (1961) favoreceu ainda mais o uso dessa segunda definição, o que acabou por resolver a confusão. A partir disso, Michael (1975) apresenta como um dos pontos centrais de seu texto que o ensino correto da distinção entre reforçamento positivo e reforçamento negativo – em especial evitando que o termo “reforçamento negativo” seja interpretado por novos alunos como o que chamamos hoje de punição – gera um trabalho considerável para aqueles que ensinam análise do comportamento. O autor sugere que o uso anterior do termo “reforçamento negativo” parece ser muito mais compatível com outras práticas verbais, como a já estabelecida distinção entre “recompensa” e “punição” do senso comum. Ainda assim, Michael (1975) não sugere que o significado do termo seja simplesmente revertido, já que não se sabe quanta confusão seria gerada para um grupo de pessoas que entenderia reforçamento negativo da forma que é falada hoje em dia, como outra forma de processo estabelecedor de comportamento, tal como o reforçamento positivo. Esclarecer a diferença entre reforçamento e reforçador também é complicado já que, segundo Michael (1975), no caso do reforçamento positivo, ambos (apresentação e evento apresentado) carregam o mesmo sentido de serem coisas “boas”, enquanto no outro caso um 23 reforçador negativo é considerado “ruim”, mas dada a sua presença, o reforçamento negativo (sua remoção) é considerada “desejável”. Por conta dessa sutileza, é provável que o aluno entenda que reforçamento positivo e reforçadores positivos são coisas desejáveis, e reforçamento negativo e reforçador negativo são coisas indesejáveis – favorecendo a confusão entre os conceitos de “reforçamento negativo” e “punição”. A relevância técnica dessas afirmações é questionável, mas é exclusivamente ao aspecto didático que Michael está se referindo. Michael tampouco defende que se passe a usar o termo “estímulo aversivo” no lugar de “reforçador negativo” já que além de ser necessário o mesmo tipo de esforço para delimitar o seu uso, de maneira geral, o uso de sinônimos dentro de uma linguagem técnica pode gerar desvios e distinções desnecessárias (Michael, 1975). Além disso, tal como evitou-se usar o termo “recompensa” em favor do termo “reforçamento” em nome de se estabelecer um novo conjunto de termos desassociado de outros conceitos (Skinner, 1938/1991), o uso dos termos “apresentação” e “remoção” também pode gerar problemas por terem seus significados atrelados a outros usos do senso comum. Em especial, tais termos parecem dizer respeito principalmente ao comportamento de quem executa a alteração ambiental e não à alteração ambiental em si (Michael, 1975). Nesse sentido, Michael sugere que as descrições deveriam ser feitas “em termos de relações entre mudanças comportamentais e mudanças ambientais”, sem menção às ações de um mediador real ou imaginário. Geralmente, usa-se o termo “apresentar” referindo-se a situações nas quais a condição pós-mudança parece a mais relevante para a mudança do comportamento e a condição pré- mudança estaria implícita (i.e., se houve apresentação de um estímulo, ficaria implícita sua ausência anterior). Ao contrário, a palavra “remover” é usada quando a condição pré-mudança parece a mais relevante e a pós-mudança estaria implícita (i.e., se houve remoção de um estímulo, ficaria implícita sua ausência posterior). 24 Para Michael (1975), entretanto, essa forma de descrição abreviada serve apenas para descrever alguns casos de mudanças ambientais no âmbito dos estímulos incondicionados e, mesmo nesses casos, uma inferência sempre precisaria ser feita. Adaptando um exemplo do próprio autor, a descrição “remoção de um choque de 50 volts” só poderá ser entendida como reforçadora se for assumido que o choque de 50 volts foi seguido da uma ausência de choque. Se, na verdade, o organismo se encontrasse numa situação em que só pode variar entre um choque de 50 volts e um de 100 volts, a remoção da condição de 50 volts seria, provavelmente, punitiva. Outro problema apontado por Michael, diz respeito à relevância e à clareza de se fazer a distinção entre os reforçamentos positivo e negativo, especialmente no que diz respeito a comportamentos humanos complexos. Há casos em que a distinção entre “apresentação” e “remoção” fica cada vez mais difícil e casos em que ambas as mudanças estão envolvidas. Uma possível saída seria apenas chamar essas mudanças de “reforçamento”. A partir disso, o autor questiona se sequer há motivo para a distinção positivo/negativo mesmo nas situações em que ela seria claramente possível e sugere algumas possibilidades de explicação para a distinção estar sendo mantida. A primeira é que poderia haver outras propriedades distinguíveis ligadas aos dois tipos de reforçamento às quais estamos indiretamente nos referindo – diferenças temporais, maior discriminabilidade etc. Michael (1975) reconhece que essas minúcias particulares que podem acompanhar o reforçamento são bastante relevantes, mas afirma que essas diferenças existem mesmo entre dois ou mais reforçadores positivos e entre dois ou mais reforçadores negativos. Esses dados adicionais deveriam ser descritos em todos os casos e não deveriam se limitar à simples separação entre dois grandes grupos. Segundo ele, dizer apenas que uma situação específica consistiu em “reforçamento negativo” não acrescenta muito. 25 A segunda explicação apresentada para a continuidade do uso da distinção entre os reforçamentos positivo e negativo diz respeito à possibilidade de que processos fisiológicos distintos estejam envolvidos em cada um deles. Michael (1975), no entanto, afirma que a distinção gera trabalho demais para compensar uma possível interrelação que, além de ter se mostrado infrutífera no passado, pode estar muito distante de ser possível. A terceira e última possibilidade levantada pelo autor diz respeito à distinção positivo/negativo representar uma forma de separação das práticas desejáveis e indesejáveis na área. Sobre esses casos, Michael (1975) afirma que, partindo de uma distinção que, especialmente em casos humanos, é pouco clara, qualquer direcionamento no sentido de aderir ou evitar certo tipo de prática será pouco efetivo. De toda forma, Michael desencoraja que alterações em conceitos básicos de uma área sejam feitos com base em “possíveis implicações sociais”. Para o autor, nenhuma das explicações apresentadas é suficiente para manter uma distinção que gera tanta confusão. Se for importante a distinção entre coisas “boas” e “ruins”, enquanto condições estáticas, podemos pensar em reforçadores positivos e negativos. Para mudanças “boas” ou “ruins”, oautor defende não a distinção entre positivo e negativo, mas entre “reforçamento” e “punição”. Estas corresponderiam às mudanças que “gostamos” e “buscamos” e “desgostamos” e “evitamos”. Vale retomar que o autor defende o reforçamento negativo como algo “bom” no sentido de que mesmo que a apresentação de um reforçador negativo seja punitiva, o reforçamento negativo é desejável. Michael (1975), em seguida, adentra a discussão a respeito das visões assimétrica e simétrica de punição, que não será aprofundada no presente momento. De forma resumida, ele afirma que nenhuma refutação contundente foi feita a Azrin e Holz (1966) até a data de seu texto e que a posição simétrica parece mais “atrativa” e por isso a adota na formulação da solução para evitar os problemas da distinção positivo/negativo. A fim de evitar esses 26 problemas, Michael (1975) sugere abandoná-la por completo e passar a nomear o que é bom como “reforçadores” e “reforçamento” e o que é ruim de “punidores” e “punição”. Ele afirma que mesmo abandonando a distinção positivo/negativo, ainda é perfeitamente possível manter a noção de que alterações ambientais com um determinado efeito (e.g., reforçador) terão o efeito oposto quando invertidas (e.g., punidor). O termo “estímulo aversivo” também pode ser descartado em favor de “punidor”. Ao final de seu artigo, Michael (1975) traz um relato sobre a sua própria experiência adotando as sugestões anteriores. Afirma, assim, que nos seis anos que precederam o artigo não se deparou com os problemas gerados pelos usos anteriores e tampouco encontrou novos problemas gerados pelo abandono dos termos “positivo” e “negativo”. O Impacto de Michael (1975) Embora a crítica de Michael (1975) à distinção entre reforçamentos positivo e negativo tenha sido originalmente apresentada no plano conceitual, seu impacto não se restringiu a discussões teóricas. Parte da produção experimental nas décadas subsequentes à publicação do artigo refletiu, direta ou indiretamente, limites e ambiguidades da distinção. A seguir, serão apresentados alguns desses estudos orientados por dados experimentais que tensionam a distinção tradicionalmente feita. Perone (2003) critica a alta adesão da literatura analítico-comportamental na defesa do reforçamento positivo como uma forma de controle livre de problemas. Afirma, por exemplo, que o endosso de autores como Sidman (1989/2009) ao reforçamento positivo é “abrangente demais” e retoma Michael (1975) para afirmar que a distinção entre reforçamento positivo e negativo sequer é clara. Ainda em Perone (2003), destaca-se o estudo de Jwaideh e Mulvaney (1976), como exemplo de que efeitos colaterais comumente atribuídos ao controle aversivo também podem surgir em esquemas de reforçamento positivo. No experimento, dois estímulos (luz verde e luz vermelha) adquiriram função discriminativa para dois esquemas de 27 reforçamento distintos (VI 30s e VI 120s) para produção de alimento a partir de bicadas em um disco (esquema múltiplo). Na segunda fase, em esquema misto, os pombos poderiam bicar em qualquer uma de duas novas chaves introduzidas para produzir a luz correspondente ao esquema em vigor naquele momento, sem com isso alterar o esquema (respostas de observação) - nessa fase a luz produzida independia de qual das chaves foi bicada, apenas do esquema em vigor e de uma bicada a alguma das chaves. Em seguida, uma das novas chaves parou de produzir a luz vermelha quando o esquema de VI 120s estava em vigor (a luz ficava apagada), mas seguia produzindo a luz verde quando no esquema de VI 30s (a outra chave se continuou mostrando tanto a luz vermelha quanto a verde). Os resultados foram que os pombos responderam igualmente nas duas novas chaves quando ambas produziam ambas as luzes, mas passavam a responder preferencialmente na chave que só era capaz de produzir a luz verde (independentemente da posição). Vale notar, que a duração e frequência dos esquemas em si não muda, apenas se o pombo verá ou não verá o que seria o estímulo delta (vermelho). Para Perone (2003), esse é um exemplo de que um estímulo aversivo (luz vermelha) pode ser condicionado mesmo numa condição em que apenas reforçamento positivo estaria em vigor. Perone afirma que esses dados só seriam estranhos se considerados por teorias que entendem reforçamento positivo como “bom” e reforçamento negativo como “ruim” desconsiderando um contexto ambiental mais amplo. Perone & Galizio (1987), por sua vez, conduziram um experimento com o objetivo de investigar o reforçamento negativo em um delineamento semelhante ao empregado em pesquisas sobre reforçamento positivo. No estudo, os sujeitos experimentais foram treinados a responder em esquemas concorrentes nos quais a pressão em uma das barras adiaria um choque e a pressão na outra barra poderia ocasionalmente produzir um timeout (suspensão de dois minutos do esquema de adiamento do choque e dos estímulos relacionados). O 28 experimento foi conduzido em fases nas quais o tempo de atraso do choque variava, permitindo avaliar como as respostas eram distribuídas nas duas barras. Foi observado que as preferências eram sensíveis a essas alterações – os sujeitos passaram a responder mais na barra que adiava o choque por mais tempo conforme esses aumentavam em intensidade. Segundo os autores, esse padrão de responder era similar ao frequentemente observado em esquema de reforçamento positivo, como a distribuição de respostas proporcional à taxa de reforçamento produzida. Os autores concluem que o reforçamento negativo pode ser investigado em condições metodologicamente comparáveis às utilizadas para o reforçamento positivo, enfraquecendo a necessidade de uma distinção rígida entre os dois processos. Alinhando-se a Michael (1975), Hineline (1984) questiona a utilidade de se tratar o reforçamento negativo como um “domínio separado dentro da teoria comportamental” (p. 495). O autor aponta que descrições sobre o que é reforçamento positivo e o que é reforçamento negativo baseadas na adição e subtração de estímulos são arbitrárias e não suficientemente informativas. Sugere, em vez disso, uma abordagem funcionalmente molar, considerando a taxa de ocorrência de eventos ao longo do tempo e a estrutura relacional das contingências. Assim, processos normalmente atribuídos ao reforçamento negativo poderiam ser compreendidos dentro de princípios mais amplos do controle operante. Magoon & Critchfield (2008) exploraram o possível efeito diferencial que o reforçamento positivo e o negativo poderiam ter sobre o repertório do indivíduo, partindo do pressuposto de que na literatura analítico-comportamental impactos e efeitos diferentes costumam ser descritos de acordo com cada um deles. Os autores, então, investigaram se reforçadores positivos e negativos de valor monetário equivalente exerceriam diferentes controles sobre o comportamento humano quando apresentados em esquemas concorrentes. O delineamento consistia em um jogo de computador, no qual os participantes podiam clicar em alvos para ganhar dinheiro (reforçamento positivo) ou evitar perdas monetárias (reforçamento 29 negativo), ambos em ciclo variável (VC). O delineamento incluiu comparações entre condições homogêneas (dois esquemas de reforçamento positivo com diferentes razões de ganho de pontos) e heterogêneas (uma opção com reforçamento positivo e outra com reforçamento negativo, ambos com magnitudes de 1,50 ¢). Para a interpretação dos dados, Magoon e Critchfield (2008) analisaram o desempenho dos participantes com base na Lei da Igualação Generalizada, com especial atenção ao log b (indicador de viés) e ao parâmetro a (indicador de sensibilidade do comportamento a taxas relativas de reforçamento). Os resultados mostraram ausência de viés sistemático entre os tipos de reforçamento (log b próximo a 0), sugerindo que nenhumdos tipos de reforçamento exerceu um controle predominante do comportamento. No entanto, encontraram dados indicando que os valores do parâmetro a foram maiores nas condições heterogêneas do que nas homogêneas de reforçamento. Isso apontaria para o fato de que, em um procedimento de operante livre, a heterogeneidade das contingências poderia levar a uma maior discriminabilidade das próprias, levando a uma performance diferencial. Esse resultado foi considerado como evidência de um possível efeito de consequências diferenciais (Different Outcomes Effect, ou DOE) – no qual a diferença na consequência produzida é o elemento- chave para a discriminação da contingência. Seria possível interpretar esses dados na direção de evidenciar o controle diferencial do reforçamento positivo em relação ao reforçamento negativo, embora os autores sugiram que mais investigações devessem ser conduzidas. Em um artigo posterior, Magoon et al. (2017) retomam Michael (1975) e Baron e Galizio (2005) para discutir a ambiguidade da atribuição dos reforçamentos positivos e negativos como processos distintos, apontando para a falta de estudos empíricos que sustentem fortemente essa diferença. Os autores apontam que mesmo dentro da longa produção experimental da análise do comportamento, os reforçamentos positivo e negativos foram estudados majoritariamente de forma separada, de forma que o controle diferencial que 30 pode ter sido demonstrado até o momento poderia ser, na verdade, decorrente de procedimentos diferentes. Com o objetivo de refinar os dados produzidos por Magoon e Critchfield (2008) referentes ao DOE, os autores realizaram uma replicação e extensão do estudo anterior, com objetivo de examinar se os efeitos observados poderiam ser atribuídos à natureza dos reforçadores ou a diferenças procedimentais. Nesse experimento, além da manutenção de magnitudes monetárias idênticas, foram incluídas análises de sensibilidade e persistência do comportamento. Os resultados reiteraram as evidências do DOE, mostrando que o tipo de consequência (ganho de pontos ou esquiva da perda deles) influencia o desempenho, mesmo quando outros fatores são mantidos constantes. Magoon et al. (2017) concluíram que, apesar dos reforçamentos positivo e negativo exercerem controle similar em certos contextos, pode haver efeitos diferenciais que não deveriam ser ignorados. Assim, mais do que sustentar uma distinção conceitual entre os dois tipos de reforçamento, os autores apontam para a importância de analisar a função dos estímulos em cada arranjo experimental. Por fim, Nevin e Mandell (2017) propõem um experimento quantitativo hipotético para questionar se os reforçamentos positivo e negativo são de fato funcionalmente diferentes. O experimento imaginado envolveria esquemas encadeados concorrentes nos quais um rato poderia escolher entre um terminal com reforçamento positivo (alimento) e outro com reforçamento negativo (período sinalizado sem choque), ambos sob controle de estímulos distintos. A partir dessa escolha, seria possível medir tanto a preferência por um tipo de consequência quanto a resistência à mudança da resposta em cada condição. O delineamento, embora nunca realizado devido a questões éticas e práticas, foi construído com base em procedimentos já validados experimentalmente, como os de Perone e Galizio (1987). Ao final, Nevin e Mandell sustentam que, se a resistência à mudança e a preferência se correlacionarem positivamente entre os dois tipos de reforço, isso forneceria evidência de que ambos operam segundo princípios funcionais comuns. Essa proposta, inspirada diretamente nas incertezas 31 levantadas por Baron e Galizio (2005), sintetiza o eixo condutor deste segmento: as dificuldades em manter a distinção entre reforçamentos positivo e negativo tornam-se mais evidentes justamente quando se tenta operacionalizá-la em arranjos experimentais rigorosos. A partir das contribuições descritas da literatura, observa-se que as dificuldades em manter a distinção entre reforçamentos positivo e negativo não se limitam à esfera conceitual, mas também se evidenciam no estudo empírico do comportamento. No campo conceitual, pelo menos dois estudos brasileiros se propuseram a investigar a influência de Michael (1975) em publicações subsequentes dentro da análise do comportamento. Um deles é o artigo de Santos e Leite (2013), sobre a influência do texto de Michael nas definições de reforçamento em livros didáticos. Outro é o trabalho de Possmoser (2015) que investigou a influência de Michael (1975) em artigos da análise do comportamento, a partir do qual será delimitado o presente problema de pesquisa. Santos e Leite (2013) buscaram as definições de reforçamento positivo e negativo em 13 livros de ensino de análise do comportamento e dividiram os livros em três grupos: 1. Publicações Antes de Michael (1975) – que não criticaram a distinção tradicional (i.e., Keller e Schoenfeld, 1950/1974; Skinner, 1953/2014; Reese, 1966/1973; Deese e Hulse, 1967/1975; Millenson, 1967/1975; Lundin, 1969/1972; Holland & Skinner, 1969/1975), 2. Publicações Depois de Michael (1975) que não abordaram sua crítica (i.e., Baum 1999; Sidman, 1989/2009; Whaley & Malott, 1981) e 3. Publicações Posteriores a Michael (1975) que abordaram sua crítica (i.e., Pierce & Epling, 1995; Catania, 1992 e Cameschi & Abreu- Rodrigues, 2005). Sobre esta última categoria, os autores destacam que Catania (1992) reconhece as falhas na distinção entre adição e remoção apontadas por Michael (1975) e que Cameschi & Abreu-Rodrigues (2005) chegam a retomar o apontamento de Michael feito sobre Skinner 32 (1938) de que o conceito de reforçamento negativo correspondia, originalmente, ao conceito atual de punição. Pierce e Epling (1995) também salientam as críticas de Michael (1975) e resgatam uma citação de Hineline (1984) em que o autor afirmou que há uma assimetria fundamental entre os reforçamentos positivo e negativo já que, quando a resposta ocorre, no primeiro o estímulo está ausente, enquanto, no segundo, o estímulo a ser removido estava presente. Isso de nenhuma forma desafia a argumentação de Michael (1975) já que o autor tanto reconheceu como se aprofundou na discussão sobre condições pré e pós-mudança. A partir das próprias considerações de Michael (1975), seria possível questionar essa suposta “assimetria fundamental” argumentando que a diferença está na ênfase dada ao que está sendo adicionado ou removido e que, de qualquer forma, isso pouco acrescentaria numa análise comportamental sem que outros detalhes mais relevantes fossem explicitados. A partir da análise dos resultados encontrados, Santos e Leite (2013) concluíram que mesmo os autores que chegaram a comentar sobre a existência de uma ambiguidade na distinção (terceiro grupo) ainda se utilizaram dos termos “positivo” e “negativo” para referir- se a “apresentação” e “remoção” de um estímulo respectivamente. Esses resultados indicaram tanto que os argumentos de Michael (1975) foram pouco considerados em livros didáticos quanto que, mesmo quando considerados, nenhum dos autores se comprometeu com uma definição que divergisse significativamente das anteriores quanto à dicotomia positivo/negativo. Além de levar à constatação de que as críticas de Michael (1975) foram insuficientemente consideradas na literatura comportamental, as definições de reforçamento positivo e negativo analisadas por Santos e Leite (2013) também permitem ao leitor um panorama sobre como esses termos têm sido definidos, diferenças entre as definições 33 disponíveis, bem como alguns de seus problemas correntes. Esses elementos são apresentados nos parágrafos a seguir. Santos e Leite (2013) identificaram que, nas definições das obras analisadas, a diferença fundamental entre reforçador positivo e reforçador negativo é que o primeiroaumenta a frequência (fortalece) classes de resposta que o adicionarem ao ambiente, enquanto o segundo aumenta a frequência de respostas que o subtraírem do ambiente. Apesar dessa diferença comum a todas as definições analisadas, algumas definições apresentaram outras diferenças sutis entre suas definições de reforçadores positivos e reforçadores negativos, ainda que os trechos analisados pelos autores não possam ser tratados como definições completas de cada um desses dois conceitos, mas sim excertos que sintetizam as definições dos autores dos livros didáticos em questão. Todas as definições aqui mencionadas estão incluídas no Apêndice do próprio artigo de Santos e Leite (2013). Um fator relevante ao se comparar os dois conceitos é o paralelismo entre ambos. Isso porque frases com maior paralelismo diminuem as chances de interpretações errôneas das definições apresentadas. Quanto mais paralelas forem as definições, mais fácil será identificar (e menos será necessário inferir) quando uma diferença entre elas representa uma diferença no processo em si ou quando se trata apenas uma diferença na redação da frase (esse conflito deverá ficar mais evidente quando apresentados exemplos específicos). Em Keller e Schoenfeld (1950/1974), os autores definem reforçadores positivos recorrendo a um efeito: “aqueles estímulos que intensificam as respostas quando presentes”, mas definem reforçadores negativos recorrendo a dois efeitos: “aqueles que intensificam [as respostas] quando removidos” e pelo “enfraquecimento que tem quando apresentados”. Para os autores, aparentemente, a função punitiva da apresentação de um reforçador negativo após uma resposta (punição positiva) seria parte definidora de reforçador negativo, enquanto a função punidora da remoção de um reforçador positivo não seria parte definidora de um 34 reforçador positivo. Essa definição pode ser problemática por permitir a interpretação de que, para que as respostas aumentem de frequência, basta a mera presença do reforçador e não apresentações subsequentes e contíguas à resposta. Skinner (1953/2014), no trecho selecionado por Santos e Leite (2013), apresentou definições bastante paralelas, utilizando os termos “acréscimo” (“presenting”) e “remoção” (“removing”) para se referir ao reforçamento positivo e negativo, respectivamente. Essa foi a definição apontada por Santos e Leite (p. 11) como a “tradicional” e que foi apresentada no subtítulo “Reforçamento Positivo e Negativo” do presente trabalho. Deese e Hulse (1967/1975) definem um reforçador positivo como “um prêmio - que damos ao organismo depois de ter feito alguma coisa que desejamos que aprenda a fazer” e reforçadores negativos como “os estímulos que fortalecem uma resposta quando são afastados se a resposta ocorrer”. Essa definição de reforçador positivo apresentada pode parecer pressupor a dependência dos supostos desejos e intenções de quem o media, o que, diferentemente das outras definições já expostas, dispensaria qualquer efeito no comportamento do organismo como critério definidor e excluiria a possibilidade do reforçamento positivo intrínseco. Essa forma de falar sobre reforçamento pode se justificar por se tratar de um livro escrito para leitores leigos interessados em aplicação e não em um aprofundamento teórico propriamente dito. A definição de reforçador negativo não apresenta os mesmos problemas, mas ainda assim poderia não ficar claro para um aplicador (pelo menos no trecho citado) o que os autores quiseram dizer com “são afastados”. Seria um afastamento espacial, temporal ou ambos? Atenuações do estímulo estariam inclusas como alterações ambientais? No trecho de Millenson (1967/1975) fica claro que a distinção principal entre reforçadores positivos e negativos diz respeito à operação (apresentação e remoção) envolvida na relação estabelecida entre resposta e estímulo reforçador: 35 Como a operação que define esses eventos como reforçadores (sua remoção) é oposta, em caráter, àquela dos reforçadores positivos (definidos por sua apresentação), eles são conhecidos como reforçadores negativos. Em geral, reforçadores negativos constituem-se daqueles eventos cujo término (ou redução na intensidade) fortalecerá e manterá operantes (Millenson, 1967/1975, p. 383). A diferença mais notável entre as duas definições está no trecho “ou redução na intensidade”. O destaque feito por Millenson, exclusivamente sobre o reforçamento negativo, poderia levar o leitor a pensar que, no caso do reforçamento positivo, um aumento em sua intensidade não fortaleceria/manteria uma resposta. A citação trazida por Santos e Leite (2013) retirada do livro de Holland e Skinner (1969/1975) apresenta dois problemas. O primeiro problema é que este é um livro de completar lacunas, e a citação trazida por Santos e Leite (2013) foi trazida com as lacunas preenchidas inversamente (positivo no lugar de negativo e vice-versa). Um outro problema é que o trecho escolhido se refere a um exemplo, e não uma definição. Há dois trechos que melhor representariam as definições de reforçamento positivo e negativo de Holland e Skinner (1969/1975): “Os reforços que consistem em apresentar estímulos (por ex.: comida) são chamados reforços positivos. De outro lado, os reforços que consistem na supressão ou eliminação de estímulos (p. ex.: um estímulo doloroso) são chamados reforços negativos” e “a frequência de um operante pode ser aumentada pela apresentação de (1) reforçador positivo ou pela supressão de (2) reforçador negativo” (p. 56). Considerando esses trechos, as definições de reforçadores positivo e negativo de Holland e Skinner (1968/1975) são bastante paralelas entre si, com duas exceções muito sutis: a definição de reforçamento positivo usa uma palavra em forma verbal para falar do tipo de alteração ambiental produzida (i.e., “apresentar”) e a definição de reforçamento negativo usa duas palavras em forma substantiva (“supressão” e “eliminação”). 36 Entender a função do uso de duas palavras é relevante porque alguns autores utilizam duas palavras como sinônimos intercambiáveis (e.g., Sidman, 1989/2009, que usa os termos “subtrai”, “elimina” e “remove” ao falar de reforçamento negativo), enquanto outros apresentam duas palavras para representar procedimentos realmente distintos (e.g., Catania, 1992, que usa os termos “termina” ou “evita” ao falar duas formas de reforçamento negativo). Pelo fato de uma delas estar em itálico e pelo uso apenas do termo “supressão” em outros trechos do texto, como “a frequência de um operante pode ser aumentada pela apresentação de (1) reforçador positivo ou pela supressão de (2) reforçador negativo” (p. 56); as palavras “supressão” e “eliminação” parecem ter sido usadas como sinônimos. Além disso, todos os usos da palavra “supressão” nesta seção do livro poderiam, em tese, ser trocados pela palavra “eliminação” sem alteração no sentido das frases – algo que não aconteceria com uma palavra como “atenuação”, por exemplo. Adicionalmente, todos os exemplos de reforçamento negativo apresentados, implicavam a presença de um estímulo reforçador negativo antes da resposta e a sua ausência depois dela. A segunda diferença identificada foi no uso de um verbo para falar de reforçamento positivo e substantivos para falar de reforçamento negativo. Novamente, o trecho “os reforços que consistem em apresentar estímulos” poderia, de forma similar à definição apresentada por Deese e Hulse (1967/1975), dar a entender que é necessário que um agente apresente esses estímulos. Isso é evitado em: “os reforços que consistem na supressão ou eliminação de um estímulo”. Com bons olhos, entender-se-ia que quem apresentaria esses estímulos seria o “ambiente” e não um agente específico – um uso comum, mas questionável. O ambiente é, justamente, o conjunto de estímulos que afetam o organismo e, assim sendo,não poderia ser o agente de sua própria apresentação. Esse parece um dos casos em que as definições teriam se beneficiado de um maior paralelismo entre si. 37 Santos e Leite (2013) afirmam que Lundin (1969/1972) distingue os dois processos pela “apresentação” e “remoção” de um estímulo. Isso não está evidente pelo trecho selecionado por Santos e Leite (2013) que não traz uma definição clara de reforçador negativo. Entretanto, encontra-se o seguinte trecho no mesmo capítulo citado pelos autores: “reforçadores negativos são aqueles estímulos ‘que fortalecem o comportamento quando removidos’. Neste caso, a resposta é fortalecida pela remoção de algum estímulo aversivo, como uma luz brilhante ou um choque elétrico” (Lundin, 1969/1972, p. 77). Talvez um trecho ainda melhor para identificarmos as diferenças entre as duas definições seja: “no reforço negativo, alguma coisa é retirada, um estímulo é removido e, por sua remoção, a resposta é fortalecida. Ao contrário, no reforço positivo alguma coisa é acrescentada e, por sua adição, a resposta é também fortalecida” (p. 77). A partir desses trechos, pode-se entender que a diferença entre reforçadores positivos e negativos, para Lundin se resume, de fato, à oposição acréscimo/remoção. O trecho de Whaley e Malott (1971/1981) trazido por Santos e Leite (2013), foi retirado de um capítulo sobre fuga e esquiva. Nesse sentido, ele se refere principalmente a reforçamento negativo. No volume anterior ao livro citado (i.e., Whaley & Mallot, 1971/1980), encontra-se um trecho onde os autores definiram reforçador positivo especificamente. Considerando ambos os trechos, “aquilo que é dado é reforçador positivo se, e apenas se, aumentar a frequência de uma resposta ou ato comportamental ao qual se seguiu”, enquanto é chamado de reforçamento negativo o procedimento no qual “a frequência de uma resposta específica será aumentada se esta resposta for regularmente seguida pela cessação da estimulação ou término da perda de reforçadores positivos”. Mais adiante Whaley e Malott (1971/1981) ressaltam que “os dois procedimentos diferem pelo fato de o reforçamento positivo envolver a apresentação de um evento ou privilégio, enquanto o reforçamento negativo envolve a remoção de eventos classificados 38 usualmente como ‘aversivos’”. Além do tipo de alteração ambiental (novamente no caso do reforçamento negativo) há algum acréscimo ausente no reforçamento positivo: além da remoção (“cessação”) do estímulo reforçador negativo, o “término da perda de reforçadores positivos” também pode se constituir como reforçamento negativo. Para Sidman (1989/2009), o reforçamento positivo se caracteriza pela “adição, produção ou aparecimento” (p. 55) de um estímulo e o reforçamento negativo, pela “subtração, remoção ou eliminação” (p. 55) de um estímulo. Descrições bastante paralelas nas quais fica evidente que os três termos utilizados (em ambas) servem como sinônimos intercambiáveis. Destaca-se novamente (como feito na sessão "Reforçadores Positivos e Negativos”) o adendo do autor de que o que é acrescentado (no reforçamento positivo), necessariamente não estava presente antes da resposta, enquanto o que é eliminado (no reforçamento negativo) necessariamente estava presenta antes da resposta. No trecho selecionado por Santos e Leite (2013), Baum (1994/1999, p. 77) apresenta, como definição de reforçamento, o fortalecimento ou manutenção de uma resposta - o que é compatível com a visão dos autores anteriores. No entanto, diz que no reforçamento positivo, a resposta torna o reforçador positivo “provável” e, no reforçamento negativo, a resposta torna o reforçador negativo “menos provável”. Foge aos objetivos deste trabalho analisar a fundo a proposta alternativa de Baum, mas, no que é relevante para este trabalho, esta parece apenas uma forma diferente de se referir ao que tipicamente é chamado de contingência. Ainda assim, segundo Santos e Leite (2013), esta mudança na forma de descrever não resolveria de forma alguma a ambiguidade apontada por Michael (1975). Catania (1992) é outro dos autores já utilizados neste trabalho ao definir reforçamento e reforçadores positivos e negativos e ele basicamente distingue reforçamento positivo de negativo pela “produção” e “remoção” de um estímulo respectivamente. Entretanto, algo que não fora mencionado, é que o autor acrescenta que no reforçamento negativo uma resposta 39 “termina” (terminate) ou evita/previne (prevent) um estímulo” (p.117). Esse acréscimo é de especial relevância porque, diferentemente de casos anteriores, seria difícil argumentar que “terminar” e “prevenir” sejam sinônimos intercambiáveis. Isso poderia dar a entender que o reforçamento negativo seria possível de ser definido por um critério adicional em relação a outros autores. Entende-se, entretanto, que este acréscimo se baseia na noção de que situações de fuga (emissão de uma resposta que elimina ou reduz uma estimulação aversiva) podem ser acompanhadas do que é chamado de esquiva. Segundo Skinner (1953/2014), para que uma esquiva aconteça, é necessário que um primeiro estímulo anteceda regularmente um segundo estímulo que seja aversivo, de forma que esse primeiro estímulo se torne um estímulo aversivo condicionado. Se o organismo entrar em contato com o primeiro estímulo (condicionado ao outro) e emitir respostas que o eliminem, evitando o contato com o segundo estímulo (que o condicionou), diz-se que o organismo fugiu do primeiro estímulo e se esquivou do segundo estímulo. Skinner acrescenta que esquiva não quebra nenhum fundamento científico porque não é explicada pela evitação direta de um estímulo no futuro, mas sim pela fuga do estímulo por ele condicionado. Seguindo essa lógica, não seria possível que uma esquiva acontecesse sem que uma fuga também acontecesse. Logo, o acréscimo de Catania (1992) de que um reforçamento negativo pode ser caracterizado pelo término ou evitação de um estímulo aversivo torna-se 1) redundante, a partir da perspectiva de que em toda “prevenção/evitação” já estaria implícito um “término”, ou 2) incorreto já que “prevenções” que não incluem um término não poderiam ser consideradas reforçamento negativo (e.g., um rato que, por acaso, pressionou uma barra que adiou um choque sem que ele sequer tivesse tido contato prévio com o choque). É possível que esse acréscimo tenha sido feito para englobar definições alternativas de esquiva 40 que entendam que a esquiva não dependa de um estímulo aversivo condicionado (e.g., Baum 1994/1999). Vale lembrar que esse livro, junto com Pierce e Epling (1995) e Catania (1992) fizeram parte do terceiro grupo do artigo de Santos e Leite (2013), ou seja, são publicações que, de alguma forma, abordaram a crítica de Michael (1975). Cameschi e Abreu-Rodrigues (2005), por sua vez, apenas mencionam o questionamento, enquanto Pierce e Epling (1995) e Catania (1992) dão a entender que concordam, pelo menos parcialmente, com a dubiedade da distinção. Reese (1966/1973), ao descrever o reforçamento negativo, utilizou o termo “estímulo aversivo” para se referir ao tipo de estímulo envolvido no processo. Ao mesmo tempo, ele usou o termo “estímulo reforçador” para descrever o estímulo envolvido no processo de reforçamento positivo. O autor parece não separar os estímulos entre reforçadores positivos e negativos (como outros autores), mas sim entre reforçadores e aversivos (ou também “controle positivo” e “controle negativo”). Diversos outros autores (i.e., Whaley & Mallot, 1971/1981; Pierce & Epling, 1995; Catania, 1992; Cameschi & Abreu-Rodrigues, 2005) também apresentaram a mesma alteração no uso de termos ao definir reforçamento negativo (“estímulo aversivo” no lugar de “reforçador negativo”), mas não fizeram alterações similares em suas definições de reforçamento positivo (i.e., utilizaram o termo “reforçador