Baixe o app para aproveitar ainda mais
Prévia do material em texto
OS EFEITOS DA MANIPUALAÇÃO DO REFORÇO NO COMPORTAMENTO DE UM RATO Alunos/pesquisadores: Adriana Cardin Santa Rosa RA: 131021699 Rosemberg Jônatas Gomes de Sousa RA: 131021753 Universidade Estadual Paulista “Júlio de Mesquita Filho” UNESP – Curso de Psicologia Disciplina: Laboratório de análise experimental do comportamento Docente responsável: Maria Silvia Fraga de Almeida Barros Bauru/SP Novembro/2014 1 1 Introdução Existem diversas ciências do comportamento, porém a Análise do Comportamento é uma disciplina especial, na qual indivíduos têm o seu comportamento estudado em ambientes devidamente controlados, tendo como resultado a formulação das relações entre comportamento e ambiente (SKINNER, 1974/2009, p. 10). A partir dessa proposição, pode-se levantar o seguinte questionamento “Existe relação entre o que o sujeito faz e as consequências que sua ação produz no ambiente”. Em resposta a essa questão, Catânia ensina que “o comportamento tem consequências, e uma propriedade importante do comportamento é que ele pode ser afetado por suas consequências”. A despeito do ambiente natural fornecer consequências para os comportamentos dos indivíduos, “[…] podemos estudar melhor como as consequências afetam o comportamento, programando as operações consequenciais no laboratório” (1998/1999, p. 81). Esse tipo de comportamento que produz alterações no ambiente e que é por elas afetado foi cunhado por Skinner como comportamento operante, o qual engloba a maioria dos comportamentos dos organismos. Este comportamento está relacionado ao modo como aprendem-se habilidades, conhecimentos e à personalidade própria do indivíduo. A este novo tipo de aprendizagem chama-se (R → C), ou seja, a resposta (R) emitida pelo organismo produz alteração no ambiente, uma consequência (C). Comportamentos podem modificar objetos diretamente ou modificar o comportamento de outras pessoas (MOREIRA; MEDEIROS, 2007, grifos do autor). Ainda, segundo esses autores, são as consequências que determinam a ocorrência ou não de determinado comportamento no futuro, bem como seu grau de frequência; e através da melhor compreensão da interação R → C, da manipulação das consequências e da programação de modelos especiais destas para os comportamentos, os psicólogos podem modificar os comportamentos de humanos e não humanos. Consequências filogeneticamente importantes têm o poder de atuar como reforço do comportamento do sujeito, ou seja, aumentam a probabilidade da sua ocorrência; e a essa relação entre organismo e ambiente – quando as mudanças deste aumentam as chances de ocorrência de certo comportamento – denomina-se contingência de reforço. Nesses termos, Catânia (1999, p. 90) salieta que “As pressões à barra por um rato privado de água tornam-se mais prováveis quando produzem água do que quando não produzem. Quando se tem a intenção de fazer com que um organismo aprenda determinados 2 comportamentos novos a partir de seu repertório comportamental atual, utiliza-se o procedimento chamado modelagem, que consiste em reforçamos diferenciais de aproximações sucessivas de um comportamento. Aproximações sucessivas do comportamento-alvo são os outros comportamentos que se aproximam cada vez mais do comportamento alvo. Nesse sentido, reforçar respostas que obedecem a algum critério e não reforçar outras respostas similares é o procedimento chamado de reforço diferencial (MOREIRA; MEDEIROS, 2007). Sabe-se que a imediaticidade do reforço é uma característica fundamental da modelagem, na qual se usa o reforço diferencial, ou seja, as aproximações sucessivas para ensinar um novo comportamento. O esquema de reforço mais adequado para que um comportamento seja modelado é o esquema de reforço contínuo (CRF), no qual todas as respostas alvo – sem exceção – são reforçadas. Assim, acontece o fortalecimento de determinada classe de respostas desejada pelo experimentador. Nesses termos, Catânia (1999, p. 90), ensina que “O reforço não é nem o estímulo nem a resposta. Como uma operação, o reforçamento é apresentação de um reforçador quando uma resposta ocorre”, portanto o que é reforçado é a resposta e não o organismo. No entanto, os efeitos do reforço são temporários, pois retirando-o produz-se uma diminuição na frequência de um comportamento. Assim, por meio da intervenção do analista do comportamento ou do experimentador, determinadas repostas podem ser anuladas do repertório comportamental do organismo. A esse procedimento dá-se o nome de extinção operante, no qual ocorre a extinção do comportamento operante através da suspensão do reforço e o consequente retorno da frequência do comportamento ao nível operante – nível anterior ao reforçamento do comportamento, antes de qualquer intervenção experimental (MOREIRA; MEDEIROS, 2007). A esse respeito, Catânia (1999, p. 92) ressalta que A operação de suspender o reforço é camada de extinção; quando o responder retorna a seus níveis prévios como resultado dessa operação, diz que foi extinto. Esse retorno do comportamento aos seus níveis anteriores ao reforço demonstra que os efeitos de reforço são temporários. O comportamento não é alterado apenas pelas suas consequências, mas também sofre influência dos contextos onde ele ocorre. “O termo controle de estímulos refere-se à 3 influência dos estímulos antecedentes sobre o comportamento, isto é, o efeito que o contexto tem sobre o comportamento (MOREIRA; MEDEIROS, 2007, p. 97, grifos dos autores). Estímulos discriminativos (SD) é o nome dado aos estímulos que são apresentados antes do comportamento e que controlam a sua ocorrência. Com a inserção dos SD na contingência (R → C), tem-se a unidade básica da análise do comportamento, que é a contingência de três termos ( SD – R → C), onde os estímulos discriminativos oferecem as circunstâncias para as respostas do sujeito, as quais produzirão consequências, que por sua vez, também podem ser estímulos discriminativos para outros comportamentos. Assim, SD sinalizam que uma resposta será reforçada e estímulos delta (S▲) assinalam que determinada resposta não será reforçada. Apesar do fato do reforçador de comportamentos fazer com que sua frequência aumente, não é necessário que um comportamento seja reforçado todas as vezes que ele ocorre para que continue sendo emitido. Em outras palavras, “muitos dos nossos comportamentos são apenas intermitentemente reforçados” (MOREIRA; MEDEIROS, 2007, p. 117, grifo dos autores). De acordo com esses memos autores (idem, p. 118-119), Existem quatro tipos principais de esquemas intermitentes: razão fixa, razão variável, intervalo fixo e intervalo variável. Estes se organizam a) de acordo com o número de respostas para cada reforçador (isto é, esquemas de razão) ou tempo entre reforçadores (isto é, esquemas de intervalo) e b) se o número de resposta ou o tempo entre reforçadores é sempre o mesmo (isto é, razão ou intervalo fixos) ou muda de reforçador para reforçador (isto é, razão ou intervalos variáveis. Tecidas essas considerações iniciais, passam-se aos objetivos norteadores desse estudo, aos caminhos utilizados para alcançá-los, aos seus resultados principais e às conclusões obtidas por meio dessas práticas. 2 Objetivos Fazer com que os alunos-autores participem da experiência em laboratório, anotem dados importantes referentes ao comportamento do sujeito observado, fortaleçam seu conhecimento teórico e técnico, por meio da prática da análise do comportamento no laboratório didático e, por fim, que respondam às questõesorientadoras de cada prática. 4 3 Método Sujeito: rato albino, linhagem Wistar, macho, com aproximadamente 90 dias e pesando 240g, aproximadamente, no início do trabalho de laboratório. Sua privação de água foi de 36 horas. Equipamento: Caixa de condicionamento operante (ou caixa de Skinner), modelo XX, fabricada pela Insight Equipamentos Científicos, Ribeirão Preto-SP. Procedimento: No dia 04/04/2014, realizaram-se as práticas 1 e 4 pertencente à primeira sessão de 15 minutos de duração; no dia 16/04/2014, realizou-se a prática 4 referente à primeira sessão, a qual durou 15 minutos; no dia 25/04/2014, realizou-se a prática 8 referente à segunda sessão, a qual teve um período de 35 minutos; no dia 09/05/2014 realizaram-se as práticas 5, 6, 7 e 8, referentes à segunda sessão e com duração total de 40 minutos; na data 23/05/2014, realizou-se a 9ª prática, que se refere à terceira sessão e de duração de 50 minutos; no dia 10/10/2014, relizou-se a prática 11 em uma única sessão de duração de 77 minutos. Durante as sessões experimentais, tiveram-se os cuidados adequados com relação à manipulação do sujeito (transporte da gaiola e inclusão na caixa de Skinner), evitou-se fazer barulho durante os experimentos e trabalhamos com algumas luzes apagadas durante o treino de discriminação com controle de estímulos em esquema múltiplo (Prática 11). 4 Resultados De acordo com os objetivos especificados acima, puderam-se observar os seguintes resultados constantes nas figuras abaixo: Tabela 1 – Procedimentos efetuados nas práticas de laboratório Procedimento Taxa geral (Resp./min.) Data Nível Operante (NO) 13/15 = 0,87 04/04/2014 CRF I 129/15 = 8,6 16/04/2014 CRF II 188/35 = 5,37 25/04/2014 Extinção 96/20 = 4,8 09/05/2014 Reforço Condicionado 23/5 = 4,6 09/05/2014 CRF III (Recondicionamento) 99/10 = 9,9 09/05/2014 Em termos de procedimento, a diferença básica entre a fase de NO e CRF é que o procedimento de NO consiste em observar e anotar a frequência com que um organismo emite um ou mais comportamentos (no caso, há interesse na frequência com que o rato pressiona a 5 barra). Já o CRF trata de reforçar toda resposta de pressão à barra pela apresentação de uma gota de água. Em outras palavras, o reforço somente será fornecido se e toda vez que a resposta de pressão à barra for emitida. Vale lembrar que o reforço contínuo (CRF) tem como efeito imediato fortalecer a resposta de pressão à barra e com isso mantê-la em alta frequência no repertório comportamental do sujeito (MATOS; TOMANARI, 2002). Conforme verifica-se na Tabela 1, a frequência de pressão à barra durante NO foi de 0,87 respostas/minuto; durante o CRF I foi de 8,6 respostas/minuto e durante o CRF II foi de 5,37 respostas/minuto. Pode-se perceber que do NO para o nível CRF houve aumento da frequência de pressão à barra, o que denota um comportamento aprendido. Por intermédio da Tabela 1 e do Gráfico 1 (página seguinte) pode-se observar que houve variação nas taxas médias de respostas do CRF I (sessão 1) e CRF II (seção 2), sendo 8,6 respostas/minuto e 5,37 respostas/minutos, respectivamente. E ainda, o número de respostas para o último minuto daquele foram 8 e para o primeiro minuto deste foram 3 respostas, ou seja, passado período de uma semana entre as duas práticas, pode-se inferir que houve certo esquecimento do comportamento de pressionar a barra para obter o elemento reforçador (água). Contudo, pode-se afirmar que, mesmo após 1 semana entre as práticas de CRF I e CRF II, o animal ainda manteve certo nível de repertório para o comportamento de pressionar a barra. Ao longo da prática CRF I (Sessão 1), que corresponde a 15 minutos, verica-se taxas diferentes em cada terço, sendo 11,4 respostas/minuto dos minutos 1 ao 5; 8,4 respostas/minuto, dos minutos 6 à 10; e 6 respostas/minuto dos minutos 11 às 15, o que se pode concluir que, para este caso, as taxas estavam diminuindo ao longo dessa prática. Do modo similar ocorreu com a prática CRF II (Sessão 2), na qual nos primeiros 10 minutos a taxa foi de 10 respostas/minuto; do minutom 11 ao 20, foram de 5 respostas/minuto e, por fim, dos minutos 21 à 35, sua taxa correspondente foi de 2,47 respostas/minutos. Esses dados apontam que o animal já estava estabilizando o seu desempenho, e que o comportamento de interesse já constava em seu repertório. Com base nesses dados, conclui-se que existe total relação entre o que o sujeito fz e as consequências que sua ação produz no ambiente, isto é, as consequências de suas ações selecionam seu comportamento, mediante a apresentação de reforços (possível aumento das das taxas de respostas) ou punições (possível diminuição das taxas de respostas). 6 Tabela 2 - Legenda em relação ao gráfico acima Minutos Prática Treino comportamental De 1 a 4 5 CRF (treino) De 5 a 25 6 EXT De 26 a 30 7 EXTsr(ruído) De 31 a 40 8 CRF Baseando-se na análise das informações fornecidas pelo Gráfico acima, pode-se inferir que ocorreu alteração na frequência de respostas de pressão à barra durante as práticas 5 (CRF), 6 (EXT), 7 ( EXTsr) e 8 (CRF), sendo 15,75 respostas/minuto; 4,8 respostas/minuto; 4,6 respostas/minuto e 9,9 respostas/minuto, respectivamente. Nesse sentido, essas frequências sofreram alteração, tanto de aumento quanto de diminuição, o que se pode concluir que as intervenções experimentais do pesquisador, proporcionam mudanças no comportamento do sujeito estudado. Por exemplo, da prática 5 para a prática 6, houve diminuição na faixa de 10 respostas/minuto, resultado do procedimento de Extinção, no qual rompe-se a relação de contingência entre a resposta e o reforço. Ou seja, os propósitos dessa intervenção foram alcançados. A taxa terminal do CRF (treino – 5ª prática) foi de 17 respostas/minuto e a taxa inicial em EXT foi praticamente a mesma, ou seja, 18 respostas/minuto. A partir desses dados, pode- se apreender que quando se passa de CRF para EXT, a taxa de resposta se mantém, a 0 50 100 150 200 250 300 Gráfico 1 - Frequência acumulada para respostas de pressão à barra Práticas 5 à 8 Frequência acumulada de respostas Tempo (minutos) N º d e re sp os ta s (a cu m ul ad as ) 7 princípio, pois o organismo já tem o comportamento em seu repertório e o efeito da retirada do reforçamento não é imediato. No entanto, se a resposta não for reforçada, ela tende a diminuir em termos de frequência. Em outras palavaras, a resposta de pressão à barra depende de reforçamento para ser fortalecida e mantida no repertório do indivíduo, apesar de que quando se entra em EXT verifica-se, no primeiro minuto, que a taxa se mantém, mas vai diminuindo consideravelmente a partir do segundo minuto, chegando a apresentar alguns saltos de taxa de resposta durante a EXT, contudo a taxa em EXT foi de 4,8 respostas/minuto, enquanto em CRF foi de 15,75 respostas/minuto. Comparando a taxa de respostas obtida nos últimos 5 minutos de EXT, que foi de zero respostas/minuto, com a taxa de respostas nos primeiros 5 minutos de CRF secundário (EXTsr), a qual foi de 4,6 respostas/minuto, verifica-se que os estímulos associados à liberação de água (ruído) adquiriram propriedade reforçadora, pois houve um salto de 4,6 pontos na taxa de resposta. Em outras palavras, os estímulos associados à liberação de água adquiriram propriedade reforçadora, ou seja, foram suficientes para alterar a probabilidade de ocorrência de uma resposta em extinção, se apresentados contingentemente a essa resposta. Se comparadas as taxas acima – últimos 5 minutos de EXT = zero respostas/minuto com a taxa do CRF secundário (EXTsr)= 4,6 respostas/minuto – com a taxa de recondicionamento (CRF – Prática 8) = 9,9 respostas/minuto, verifica-se que o animal reaprendeu, pois houve crescimento contínuo nas taxas de resposta, primeiro pela apresentação de um estímulo reforçador secundário (ruído) e, segundo, pela apresentação do estímulo reforçador primário (água). Com base nos dados acima, pode-se afirmar que existe relação entre o que o sujeito faz e as consequências que sua ação produz no ambiente. Em outras palavras, são as consequências das ações do sujeito que selecionam seu comportamento. 4.1 Razão Fixa Tabela 3 – Reforçamento intermitente em Razão Fixa (FR) Proporção (reforço por resposta) Taxa (resposta/minuto) Taxa (reforço/minuto) 3 50/3 = 16,67 17/3 = 5,67 9 251/14 = 17,93 27/14 = 1,93 12 366/32 = 11,44 32/32 = 1 8 Comparando as taxas de respostas apresentadas na tabela acima, observa-se que aquelas que se apresentam como maior é a FR-9, e com relação à taxa de reforço, a maior é a FR-3. As proporções reforço/resposta para FR-3, FR-9 e FR-12 são, respectivamente, 0,34; 0,11; e 0,09. A partir desses dados, verifica-se que a maior proporção reforço/resposta foi para FR-3, o que se pode concluir que para uma menor razão fixa, o sujeito obterá maior número de reforços. Nesse sentido, fica demonstrado que (MATOS; TOMANARI, 2002, p. 142) […] não é necessário reforçar com água cada e todas as respostas de pressão à barra de um organismo para que ele se mantenha apresentando-as. Pelo contrário, se reforçarmos intermitentemente as respostas observadas, após um certo número de reforços, elas passarão a apresentar muito maior resistência à extinção e/ou às interferências e interrupções. Nesse experimento de Razão Fixa (FR) trabalhou-se com aumento e diminuição do valro de FR, conforme o desempenho do animal. 4.2 Controle de estímulos – discriminação O comportamento do sujeito depende das situações pré-existentes, ou seja, pode-se afirmar que o que ocorre antes do fazer é importante para esse fazer, devido às diferentes contingências existentes para cada contexto. O sujeito discriminou as contingências se ficou sob controle do estímulo do ambiente (no caso a luz), ou seja, os estímulos antecedentes também passaram a controlar a probabilidade de emissão do comportamento desse organismo (MATOS; TOMANARI, 2002) Tabela 4 – Controle de estímulos com um esquema múltiplo – Sessão 1 Taxas de respostas 1º (min. 1 a 25) 2º (min. 26 a 50) 3º (min. 51 a 77) Total da sessão FR-10 143/25 = 5,72 resp/min 228/25 = 9,12 resp/min 255/27 = 9,44 resp/min 626/77 = 8,13 resp/min EXT 157/25 = 6,28 resp/min 232/25 = 9,28 resp/min 133/27 = 4,93 resp/min 522/77 = 6,78 resp/min De acordo com os dados da Tabela 4, pode-se dizer que o animal passou a discriminar o elemento “luz” apenas a partir do minuto 51, ou seja, do último terço do tempo. Isso porque os níveis de frequência de resposta em FR-10 e EXT apresentam números bem p´roixmos até o minuto 50. 9 Tabela 5 – Controle de estímulos com um esquema múltiplo – Sessão 2 Taxas de respostas 1º (min. 1 a 20) 2º (min. 21 a 40) 3º (min. 41 a 60) Total da sessão FR-10 171/20 = 8,55 resp/min 192/20 = 9,6 resp/min 190/20 = 9,5 resp/min 553/60 = 9,22 resp/min EXT 64/20 = 3,2 resp/min 79/20 = 3,95 resp/min 1/20 = 0,05 resp/min 144/60 = 2,4 resp/min Por meio da análise dos dados apresentados na Tabela 5, pode-se inferir que o organismo (animal) já discriminava o elemento luz desde o primeiro bloco de minutos (1 a 20), chegando a apresentar, ao final, a taxa de 0,05 respostas/minutos, o que mostra o alto grau de discriminação em EXT. Ou seja, nosso sujeito passou a emitir respostas de pressão à barra apenas sob presença do elemento luz. Com isso, concorda-se com Moreira e Medeiros (2007) no que se refere ao contexto em que o comportamento ocorre e sua influência sobre este, ou seja, o que ocorre antes do comportamento também exerce controle sobre ele. Gráfico 2 – Respostas acumuladas para FR-10 e EXT no treino discriminativo (Prática 11 - sessão 2) 0 100 200 300 400 500 600 FR-10 (Resp. Acum.) EXT (Resp. Acum.) Tempo (minutos) R es po st as a cu m ul ad as (F R -1 0 e E XT ) 10 A partir da verficiação dos dados desse gráfico, conclui-se que o animal passou a associar totalmente o estímulo “falta de luz” (S delta) com a falta de reforçamento para as suas respostas de pressão à barra a partir do minuto 37 – quando se estabilizam as respostas em EXT, ao passo que o mesmo animal associou a presença de luz (S discriminativo) como um sinalizador de que suas respostas de pressão à barra seriam reforçadas, desde o início da sessão, ou seja, do minuto 1. Com base nos dados acima, sugere-se que o sujeito, a partir do treino discriminativo, foi capaz de aprender que a presença de luz seria um estímulo discriminativo para receber reforço, e a falta de luz seria estímulo delta para não receber reforço às suas respostas. Tabela 6 – Índice discriminativo (Prática 11) Primeiro 1/3 Segundo 1/3 Terceiro 1/3 Total Sessão 1 47 % 49 % 75 % 54 % Sessão 2 72 % 70 % 99 % 79 % Gráfico 3 – Índice discriminativo (Prática 11) Os dados da Tabela 6 e do Gráfico 3 indicam que o treino discriminativo atingiu seu objetivo, na medida que o animal aprendeu a discriminar luz como estímulo discriminativo para reforço das respostas de pressão à barra. O sujeito do estudo passou de 47 % de índice discrinativo no primeiro 1/3 da sessão 1 para 75 % de discriminação ao término dessa sessão. Este índice está bem próximo do que se observa no primeiro 1/3 do tempo da sessão 2, e houve apenas 1 semana de diferença entre as duas sessões. Ou seja, o animal teve o Índice Discriminativo Sessão 1 Índice Discriminativo Sessão 2 0 0,2 0,4 0,6 0,8 1 1,2 Primeiro 1/3 Segundo 1/3 Terceiro 1/3 Total 11 comportamento mantido em seu repertório, e com o passar do tempo na sessão 2, o sujeito chega ao máximo de 99 % de discriminação no final dessa prática. Assim sendo, considerando os dados apresentados neste estudo e a experiência dos pesquisadores nas práticas de laboratório, principalmente na prática 11, conclui-se que o processo de aprendizagem dá-se de modo gradual, ou seja, é com o treino gradativo que o sujeito aprenderá a emitir as respostas objetivadas pelo experimentador. 5 Discussão dos resultados A partir da execução das práticas de laboratório, infere-se que os objetivos traçados para esse estudo foram alcançados, na medida que os pesquisadores puderam responder às questões orientadores propostas em cada prática, por meio da análise dos dados dispostos neste estudo em forma de tabelas e gráficos. Dessa feita, depreende-se que as práticas de laboratório com sujeitos não-humanos, ou seja, ratos, podem servir de práticas pedagógicas para o enriquecimento da formação do psicólogo, visto que, como analista do comportamento, ele precisará conhecer o processo de aprendizagem e entender como consequências das atividades selecionam o comportamento, assim como o contexto no qual este ocorre. Referências CATÂNIA, A. C. Aprendizagem: comportamento, linguagem e cognição. Tradução Deisy das Graças de Souza et al. 4. ed. Porto Alegre: Artes Médicas Sul, 1999. MATOS, M. A.; TOMANARI, G. Y. A análise do comportamento no laboratório didático. São Paulo: Manole, 2002. MOREIRA, M. B.; MEDEIROS, C. A. Princípios básicos de análise do comportamento. Porto Alegre: Artmed, 2007. SKINNER, B. F. Sobre o Behaviorismo. São Paulo: Cultrix, 1974/2009. p. 07-22.
Compartilhar