Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aprendizagem: Linguagem Comportamento e Cognição De A. Charles Catania Um resumo de Tiago Martins Speckart Referência: Aprendizagem: Comportamento, Linguagem e Cognição de A. Charles Catania. Trad. Deisy das Graças de Souza (et. al.). 4a ed - Porto Alegre: Artes Médicas Sul, 1999. Título original: Learning Índice Parte 1 - Introdução Capítulo 1 – Aprendizagem e Comportamento Página 4 Capítulo 2 – Uma taxonomia do Comportamento Página 7 Parte 2 – Comportamento sem Aprendizagem Capítulo 3 – Evolução e Comporamento Página 9 Capítulo 4 – Comportamento Eliciado e Comprtamento Emitido Página 11 Parte 3 – Aprendizagem sem Palavras Capítulo 5 – As Consequências do Responder: Reforço Página 15 Capítulo 6 – As Consequências do Responder: Controle Aversivo Página 21 Capítulo 7 – Operantes: A Seleção do Comportamento Página 28 Capítulo 8 – Operantes Discriminados: Controle de Estímulo Página 32 Capítulo 9 – Discriminação Condicional e Classes de Ordem Superior Página 38 Capítulo 10 – Esquemas de Reforço Página 44 Capítulo 11 – Combiações de Esquemas: Síntese Comportamental Página 48 Capítulo 12 – Comportamento Respondente: Condicionamento Página 53 2 Capítulo 13 – Aprendizagem Social Página 59 Parte 4 – Aprendizagem com Palavras Capítulo 14 – Comportameto Verbal: A Função da Linguagem Página 63 Capítulo 15 – Comportamento Verbal e Comportamento Não-Verbal Página 72 Capítulo 16 – Psicolinguística: A Estrutura da Linguagem Página 79 Capítulo 17 – Aprendizagem Verbal e Transferência Página 85 Capítulo 18 – As Funções do Lembrar Página 87 Capítulo 19 – A Estrutura do Lembrar Página 91 Capítulo 20 – Cognição e Resolução de Problemas Página 93 Parte 5 – Conclusão Capítulo 21 – Estrutura e Função na Aprendizagem Página 95 3 Parte I - Introdução 1 - Aprendizagem e Comportamento Quais as propostas do livro? Tentar responder as questões: (a) qual a natureza dos eventos a que nos referimos como aprendizagem? (b) qual a melhor forma de falar deles? O que é comportamento? “Tudo que um organismo faz” Não sei o porque de o autor não ter utilizado uma definição mais conteporânea de comportamento, já que tal definição “tudo que um organismo faz” é pouco esclarecedora, e o autor posteriormente participou na elaboração de um conceito mais útil para o que é o comportamento. Eu utilizarei como definição de comportamento uma mais atualizada, e que inclui os vários fenômenos abordados ao longo do livro. Tal definição é a que se segue: Comportamento é um sistema1 de interações2 entre valores3 de variáveis de estímulos antecedentes4 que pertencem à uma mesma classe5, valores de variáveis de respostas de um organismo que pertencem à uma mesma classe e valores de variáveis de estímulos consequentes4 que pertencem à uma mesma classe. 1: Sistema aqui é entendido como um conjunto de conjuntos. Neste caso, um conjunto de conjuntos de interações. Isto fica melhor representado na figura abaixo. 4 2: Interação nesta definição serve para mostrar que as mudanças não são unidirecionais, mas que o que modifica também é modificado, e vice-versa. 3: Valores de variáveis. Variável neste caso vem à substituir a palavra propriedade, muito utilizada neste texto. Propriedade não está errado, o que acontece é que a noção de variável mostra claramente que não estamos lidando com propriedades constantes, mas sim com variáveis que variam (pode parecer redundante, mas é um conceito fundamental para mostrar a dinamicidade das interações comportamentais). 4: Antecedentes/Consequentes nesta definição serve para especificar melhor o “meio” em que a resposta está inserida. Há um “meio” antes da resposta e um “meio” após a resposta. Assim fica claro que a resposta modifica o meio, e é modificado pelo meio. 5: Respostas/Estímulos pertencentes à uma mesma classe é diferente de falarmos de classes de respostas/estímulos. O problema consiste que as interações comportamentais não ocorrem entre “classes”: são antes de mais nada com os (valores de) estímulos e (valores de) respostas, que podem pertencer ou não a uma classe. Uma classe é um conjunto, e as interações não são entre os conjuntos, mas sim entre o que está contido (estímulos e respostas) nos conjuntos (classes). 5 O que é aprendizagem? “Usualmente, é o processo no qual um comportamento é adicionado ao repertório do organismo. Aprendizagem não tem uma definição satisfatória. Se estuda como os organismos se comportam de maneiras diferentes. Aprendizagem significa coisas diferentes em diferentes momentos para diferentes pessoas.” O autor tenta não definir restritamente a definição de aprendizagem para tentar ser o mais inclusivo possível. O que ocorre, como pode ser visto no final do resumo, é que os fenômenos da aprendizagem e os procedimentos em que eles ocorrem não são abarcados pela palavra aprendizagem. Faríamos melhor, ao nos referirmos a um fenômeno de aprendizagem, realizar uma descrição exaustiva do fenômeno e o procedimento que o faz possível de acontecer. Olhar página 95 do resumo. Quais são as diferenças entre a linguagem comportamental e da linguagem cognitiva? São dois modos diferentes de se falar de eventos psicológicos. A linguagem Comportamental, por exemplo, nega explicações internas, como a mente. A linguagem Cognitiva aceita explicações internas. As duas lidam com questões diferentes: a primeira com a função, a segunda com a estrutura. Estrutura: aspectos do estímulo. Função: a grosso modo, interações entre estímulos antecedentes, respostas e estímulos consequentes. (ver o que é comportamento) Estímulos são eventos no mundo, que assumem alguma função para alguma resposta. Respostas são instâncias (uma parte) do comportamento. A resposta é definida por seu efeito no ambiente. 6 2 - Uma Taxonomia do Comportamento O que é taxonomia do comportamento? Taxonomia é um sistema de classificação. Taxonomia Comportamental é um vocabulário que permite organizar os vários procedimentos e fenômenos do comportamento. O que é e quais são procedimentos comportamentais? Procedimento comportamental é uma operação experimental; uma intervenção (alteração de variáveis ambientais). Operações comportamentais (a) Observação do comportamento. (b) Operação de apresentação de estímulo. (c) Operação consequencial. (d) Operação sinalizadora ou de controle de estímulos: superposta à apresentação de estímulo. (e) Operação sinalizadora ou de controle de estímulo: superposta às consequências. (f) Operação estabelecedora. Descrição das operações (a) Nenhuma intervenção (b) O estímulo A é apresentado (c) A resposta B tem a consequência C (p.e. um estímulo é produzido ou é terminado) (d) O estímulo D sinaliza a apresentação do estímulo E. (e) O estímulo F sinaliza que a resposta B terá a consequência H. (f) É estabelecida a efetividade de uma consequência I como um reforçador ou como um punidor. No que implica observar o comportamento? A observação por si só raramente identifica as fontes do comportamento e raramente resolve questões. Em qualquer estudo comportamental, apresentar variáveis é inevitável, logo não há observação “pura”. É necessário levar em consideração o efeito da observação no controle do comportamento do sujeito ao observá-lo. Qual a função de Estímulos e Consequências numa operação comportamental? Deve-se manipular estímulos para identificar quais são os mais determinantes. Também deve- se alterar as consequências para avaliar se houve aprendizado. 7 O que é processo de sinalização? Que relações ela pode ter? Operações sinalizadoras = operações de controle de estímulos. Estímulos podem sinalizar tanto outros estímulos quantoconsequências. Sinalização de estímulos: reflexos condicionados. Sinalização de consequências: treino discriminativo. (a) quando um estímulo é o determinante fundamental de uma resposta, dizemos que o estímulo elicia a resposta ou que a resposta é eliciada. (b) quando uma resposta ocorre em presença de um estímulo, porque o estímulo sinaliza alguma consequência do responder, dizemos que o estímulo ocasiona a resposta e que a resposta é emitida. Uma discriminação onde há (ou não) apenas um estímulo discriminativo se chama sucessiva ou vai-não-vai Aquela em que dois ou mais Sd estão presentes e em que cada um está correlacionado a uma R diferente é denominada discriminação simultânea. O que são Operações Estabelecedoras? Operações estabelecedoras alteram o valor das consequências. O comportamento decorrente de uma OE se chama evocado. OEs aumentam ou diminuem a probabilidade de resposta. Deve-se ter cuidado para analisar o que é OE e o que é Sd. O responder evocado por tais operações ocorre em um ambiente relativamente constante. Sd evoca R OE ocasiona R R ocasionados e/ou evocados são emitidos. OEs não fornecem aprendizagens, mas contextos para que esta possa acontecer. Exemplo de diferença entre Sd e OE: João está com sede, aumentando a probabilidade de que comportamentos que comportamentos que levem a saciação sejam ocasionados. Ao avistar uma máquina de refrigerante (Sd para o saciar a sede) o valor reforçador de achar uma moeda é elevado (o comportamento de achar uma moeda é portanto ocasionado). 8 Parte II - Comportamento Sem Aprendizagem 3 - Evolução e Comportamento Contextualização de evolução. Todos os organismos hoje são parentes sobreviventes. Evolução não é uma teoria, é um nome para certos tipos de mudanças que ocorrem com populações biológicas a que denominamos espécie. A seleção natural decorre de variação e seleção. As teorias paralelas à seleção natural foram o (a) lamarckismo, a (b) ortogênese preformacionista e a (c) combinação genética mendeliana com mutação genética. Descrição das teorias: (a) características aprendidas na ontogênese passariam adiante (o que não acontecia, como exemplo mutilações que não eram transmitidas). Porém com o conhecimento provido pela epigenética é possível que algumas alterações ontogenéticas podem afetar em algum grau DNA e ser transmitido a descendentes. (b) evolução ditada por forças internas, sem relação com o ambiente. (c) o modelo mendeliano não explica a variação genética, por isso a junção com a teoria da mutação, mas este modelo de mutação era muito radical. O que é receita e fotocópia? O que isso tem a ver com evolução? Uma receita é uma sequência de procedimentos ou instruções. Ela descreve como criar o produto, mas não incorpora, necessariamente, uma descrição do produto. É pouco provável que contenha informação sobre sua origem. Uma fotocópia geralmente não mostra como construir a estrutura que ela mostra. É uma representação ou cópia, mas a receita não o é. As explicações (a) e (b) tratavam o material genético mais como fotocópias do que como receitas. A biologia moderna encara genes como receitas para o desenvolvimento. São receitas para formação de proteínas, e contém pouca informação sobre seu passado. (c) contribuiu com a seleção natural pela teoria da mutação, que contribui com a variabilidade necessária para as mudanças. Porém hoje sabe-se que mutações ocorrem numa escala bem menor e em maiores períodos de tempo (entretanto mudanças drásticas em um ambiente podem selecionar mutações mais drásticas). Seleção, variação e evolução. Seleção filogenética Variação de comportamentos abaixo ou acima da média são selecionados pela probabilidade de tal aspecto aumentar a probabilidade de sobrevivência da espécie. A seleção é feita pelo 9 ambiente, e ela cria e mantém características (órgãos, sistemas, partes) do organismo. A evolução pode ocorrer gradualmente em relação à uma media da população ou após eventos pontuais que produziram grandes mudanças ambientais. A seleção não substitui mecanismos existentes com outros que realizariam a mesma função. Sistemas de respostas se desenvolveram antes de sistemas sensoriais. Responder diferencialmente foi a base para a seleção de sistemas sensoriais (em ambientes estáveis). Mas nem todos os ambientes são estáveis. Deve ter sido um passo evolutivo importante quando tais padrões de comportamento tornaram-se modificáveis (em outras palavras, tornaram-se capazes de aprender). Contingências evolucionárias selecionaram diferentes tipos de aprendizagem. Algumas permanentes, outras reversíveis; outras somente em situações específicas, outras em situações diversas; algumas possíveis apenas em certos momentos da vida do organismo, outras possíveis ao longo de sua vida. Seleção ontogenética (explorada mais tarde) Sinônimo de seleção por consequências (do organismo). Respostas são selecionadas pelo ambiente, de acordo com as consequências. Seleção cultural (explorada mais tarde) Práticas são passadas para outros sujeitos (por imitação, verbalmente, etc.). Os comportamentos sobrevivem os indivíduos. O comportamento é em que medida filogenético e ontogenético? Em que medida o comportamento advém da filogenia ou da ontogenia (aprendizagem)? Ele é produto de ambas, agora o quanto cada nível de seleção determina o comportamento é outro problema. Temos sempre que considerar as bases filogenéticas do comportamento. O comportamento já começa no embrião. 10 4 - Comportamento Eliciado e Comportamento Emitido. O que é Reflexo? Um tipo de relação entre evento ambiental (estímulo) e uma mudança resultante no comportamento (resposta). Arco reflexo: rota fisiológica do reflexo (receptores, sistema nervoso central, respostas glandulares, musculares, etc.) Diz-se que um estímulo elicia uma resposta. O estímulo assim é chamado de estímulo eliciador e a resposta de resposta eliciada. A relação entre estímulo e resposta neste caso é chamado de reflexo. Reflexo é um subconjunto de relações possíveis no comportamento (neste caso, entre estímulos antecedentes e respostas). Quais as características do comportamento eliciado? Estímulos precisam atingir um limiar para eliciar a resposta. O limiar é estabelecido por certos valores particulares do estímulo. O tempo transcorrido entre o estímulo e a resposta se chama latência de resposta. Respostas ocorrem com alguma magnitude e tem alguma duração. Como estas três variáveis podem covariar elas têm recebido, as vezes, o nome de força do reflexo. Força fraca = limiar alto, latência alta, magnitude baixa e duração baixa. Força forte = limiar baixo, latência baixa, magnitude alta e duração alta. No reflexo, S forte = força de R forte e S fraco = força de R fraca. O que são probabilidades ou frequências relativas e probabilidades condicionais? Probabilidade ou frequência relativa As relações S-R podem ser expressas em probabilidade ou frequências relativas. Então é possível definir os efeitos do estímulo comparando a probabilidade de uma resposta quando o estímulo está presente ou quando o estímulo está ausente. Uma probabilidade ou frequência relativa é uma proporção ou razão: o número de vezes em que o evento ocorre, comparado com o número de vezes em que ele poderia ter ocorrido. p(R1)=1,0 -> 100% de emissão de R ao apresentar S p(R2)=0,6 -> 60% p(R3)=0,0 -> 0% Probabilidade Condicional Como medir o reflexo quando a resposta ocorre com alta frequência (sem a presença do estímulo a ser estudado?) exemplo: piscar o olho (resposta) com e sem presença de um sopro 11 no olho (com ou sem estímulo). Deve-se então comparar probabilidades de respostacom o estímulo e sem o estímulo. p(R/S)=1,0 p(R/nãoS)=0,6 Probabilidade Condicional é a probabilidade em que seu valor é especificado em termos de presença ou ausência de um evento. p(A/B)=probabilidade de A, dado B; ou a probabilidade de A a condição que B esteja presente. Quais os tipos de relações estímulo - resposta? Uma resposta que ocorra sem ser eliciada é emitida. Se uma resposta segue um estímulo, deve-se saber se um estímulo determinou de fato a resposta. As classes de relações (a) S-R. S aumenta a probabilidade de R. p(R/S)=0,75 e p(R/nãoS)=0,5 (b) R emitido, sem relação com S. p(R/S)=0,25 e p(R/nãoS)=0,25 (c) S-R. S diminui a probabilidade de R. p(R/S)=0,1 e p(R/nãoS)=0,9 (d) S-R chamado de reflexo. p(R/S)=1,0 e p(R/nãoS)=0,1. Em termos de probabilidades o que é e o que não é reflexo torna-se mais arbitrário. Excitação de Resposta: Estímulo aumenta p da resposta Inibição de Resposta: Estímulo diminui p de resposta Sistemas explicativos baseados somente somente no reflexo são portanto incompletos. R emitidas eram chamadas de Comportamento Instrumental ou Operante, pois eram instrumentos para mudar o ambiente ou como operavam no ambiente. R eliciado era denominado Comportamento Reflexo. Voluntário ou Involuntário? Comportamento Operante e Comportamento Reflexo tem ambos exemplos de serem voluntários e involuntários e tal distinção não é útil. Nem é útil diferenciar a resposta pela fisiologia da resposta (se é R esquelético-operante ou se é R autônomo-reflexo). O que ocorre após eliciações sucessivas? Duas apresentações diferentes de um mesmo estímulo podem ter efeitos diferentes. O responder eliciado frequentemente depende do número de apresentações do estímulo e de seu espaçamento no tempo. 12 Habituação ou Adaptação É um decréscimo no responder pela repetição constante de estímulo. É uma característica do responder eliciado, podendo ser produzida por uma variedade de estímulos. Pode ser um componente importante no comportamento emocional. Potenciação ou Facilitação É um acréscimo no responder com estimulações repetidas. É mais provável com estímulos aversivos do que com neutros e reforçadores. Não confundir com sensibilização, onde os efeitos eliciadores de um estímulo aumentam como resultado de apresentação de algum outro estímulo (um S aumenta o efeito eliciador de S’). O método de apresentação de S pode determinar se ocorrerá habituação ou potenciação. Efeitos do Tempo desde o último S Eliciador Se o estímulo deixa de ser apresentado por um tempo depois da habituação ou potenciação, a probabilidade de o responder ser eliciado poderá retornar a valores prévios. As mudanças no responder, chamadas de adaptação ou potenciação, não são permanentes* e, à medida que o tempo passa, ocorre um retorno para níveis prévios. *Porém pode ser que casos de potenciação permanente explicariam um responder violento, por parte do sistema imunológico, nas chamadas alergias. O que é padrão temporal do comportamento? A apresentação de um estímulo pode determinar a sequência de respostas que ocorrem ao longo de um período extenso de tempo. O responder que depende de outro responder é chamado de comportamento adjuntivo. Uma resposta acompanha de modo regular outra resposta. Exemplo: após comer, o rato regularmente bebe se possível. Qual o papel do exercício? Antes de se saber sobre o efeito do efeito das consequências sobre o responder, acreditava-se que a repetição do responder mantinha o comportamento, mesmo na ausência do estímulo eliciador. Baseado nisso, pode-se concluir que a eliciação repetida de uma resposta aumenta a probabilidade de que a resposta seja emitida. O papel da lei do exercício na Psicologia da Aprendizagem foi deixado de lado com a escassez de dados, e com o advento das operações cosequenciadoras. O responder pelas consequêcias fica mais forte assim que o responder se torna independente de estímulos eliciadores. Esta seria uma interpretação possível da lei do exercício. 13 Como funciona a estampagem? Estampagem é relação resultante de apresentações de estímulos. Na estampagem, os efeitos de apresentação inicial do estímulo a ser estampado não são as mudanças nas probabilidades do responder. Antes, são as Operações Estabelecedoras. Elas mudam a importância do estímulo. O S estampado adquire sua importância para o organismo simplesmente por ter sido apresentado sob circunstâncias adequadas. Exemplo clássico: estampagem com patos filhotes, onde um estímulo grande que se move (uma mãe pata ou uma caixa sobre rodas) terá seu valor alterado drasticamente por ter sido apresentado sob circunstâncias adequadas (neste caso, o início da vida do patinho). Qual a relação entre operações estabelecedoras e a importância de estímulos? As mudanças na importância dos estímulos que ocorrem com as operações estabelecedoras são discutidas em termos de impulso e motivação. Estudos fisiológicos de motivação normalmente estão relacionados nas relações entre os fatores orgânicos e a importância de estímulos. Ex: hormônios e comportamento sexual. A motivação logo não é uma força ou impulso a ser localizada dentro do organismo; antes, é um termo aplicado a muitas variáveis orgânicas e ambientais, que tornam vários estímulos importantes para um organismo. 14 Parte III - Aprendizagem Sem Palavras 5 - As consequências do Responder: Reforço Reforço e Extinção Labirintos, curvas de aprendizagem, câmaras experimentais e registros cumulativos. O decréscimo gradual do tempo gasto na realização de uma tarefa veio a se chamar aprendizagem por tentativa e erro. Acreditava-se que a inteligência de espécies poderia ser medida pelo tempo de resolução de caixas-problema, labirintos (como os de Thorndike) e outros aparatos. Na época se perguntava se a aprendizagem ocorria por saltos discretos ou eram na base do tudo-ou-nada (insights). Os organismos nestas tarefas aprendiam movimentos ou propriedades dos ambientes? De qualquer forma, os experimentos indicavam que o responder se tornava mais provável após certas consequências. Curvas de aprendizagem são gráficos que mostram como o comportamento muda durante o experimento. Medir tempo de desempenho não especificava o que os organismos estavam realmente fazendo durante o tempo. Ocorreram duas inovações na pesquisa experimental: -Um aparelho construído de tal modo que o organismo podia emitir rapidamente, sem a intervenção do experimentador, uma resposta facilmente especificada; diferente de labirintos e caixa-problemas. -Um método de registro, baseado diretamente na taxa ou frequência de respostas, em contraposição às medidas indiretas derivadas de sequências de respostas ou de grupos de organismos (médias de curvas de aprendizagem de vários organismos). Inovações pensadas para reduzir a manipulação do organismo, simplificando o trabalho do experimentador. Caixa experimental = Caixa de Skinner. Algumas características de registros cumulativos: Quanto a textura ou granulação: Registro em degraus - surtos de respostas. 15 Registro liso - respostas constantes Quanto à aceleração: Positiva - poucas respostas no início com um aumento no final Negativa - muitas respostas no início com um decréscimo no final Para outras características, olhar página 89 O que é reforço? Terminologia do reforço. Esta terminologia é adequada se, e somente se, estiverem presentes as seguintes 3 condições: (1) uma resposta produz alguma consequêcia, (2) a resposta ocorre com mais frequência do que quando não produz consequências e (3) o aumento das respostas ocorre porque a resposta tem aquela consequência. 16 Termo Restrições Exemplos Reforçador (substantivo)Um estímulo. Pelotas de alimento foram empregadas como reforçadores para as pressões à barra por ratos. Reforçador (adjetivo) Uma propriedade de um estímulo. O estímulo reforçador era produzido mais frequentemente do que outros estímulos não reforçadores. Reforço (substantivo) Como uma Operação, apresentar consequências quando uma resposta ocorre. Como um Processo, o aumento nas respostas que resultam do reforço. O esquema de reforço em razão fixa programava a apresentação de alimento a cada 10 respostas de bicar. O experimento com macacos demonstrou reforço produzido por consequências sociais. Reforçar (verbo) Como uma Operação, apresentar consequências quando uma resposta ocorre; respostas são reforçadas, não organismos. Como um Processo, aumentar o responder mediante a operação de reforço. Quando um período de recreio foi usado para reforçar o cumprimento de uma tarefa escolar, as notas da criança aumentaram. O experimento foi planejado para verificar se estrelas douradas reforçariam jogos de cooperação em alunos de 1a série. Princípio do reforço: o responder aumenta quando produz reforçadores. Problema lógico: quando uma resposta se torna mais provável porque produziu um S, dizemos que a R foi reforçada e que S é reforçador. Se os perguntam como sabemos que S é reforçador, podemos dizer que a R foi reforçada. Logo começamos a nos repetir. Uma solução seria reconhecer que o termo reforço é descritivo, não explicativo. Ele nomeia uma relação entre uma classe de respostas e uma classe de estímulos. A relação é composta pelas 3 condições da terminologia do reforço: (1) uma resposta produz alguma consequêcia, (2) a resposta ocorre com mais frequência do que quando não produz consequências e (3) o aumento das respostas ocorre porque a resposta tem aquela consequência. Caso o R aumente, é precipitado dizer que R foi reforçado antes de avaliar que outras relações podem ter ocorrido (R pode ter sido eliciado em algum grau p. e.). A eficácia de reforçadores é variável e consequências podem reforçar certas classes de respostas e não reforçar outras. (ver relatividade de reforço). O reforço não é uma explicação da aprendizagem: antes, faz parte da descrição do que é aprendido. Os organismos aprendem as consequências de seu próprio comportamento. O que é extinção? O responder volta aos níveis anteriores tão logo o reforço seja suspenso. Operação: Extinção. Resultado da operação: responder extinto. Os efeitos do reforço são temporários. 17 A redução no responder durante a extinção não é um processo especial que requeira um tratamento separado, é uma das propriedades do reforço. Termo em desuso: resistência à extinção. Problema: qual critério para observar a resistência à extinção? Tempo sem respostas?l ou total de respostas acumuladas? Em contrapartida a resistência a mudança é uma importante propriedade do comportamento. Comportamentos resistentes a mudança são os que após reforços e repetidas práticas são executados com grande exatidão e latência curta, se tornando fluentes. Quando fluentes, é improvável que sejam perturbados por mudanças no ambiente ou por outras distrações. Qual a diferença entre extinção e inibição? Se não ocorresse a extinção, os efeitos do reforçamento seriam permanentes. Por muito tempo se supôs que a extinção suprimia ativamente o responder. Afirmava-se que a extinção tinha efeitos inibitórios, ao contrário dos efeitos excitatórios supostos para o reforço. Por isto reforço e extinção eram tratados diferencialmente, quando hoje sabe-se que são dois aspectos do mesmo fenômeno. Um exemplo de recuperação do responder (previamente extinto) é a regressão (ou ressurgimento), onde um responder extinto tem maior probabilidade de emissão devido a extinção de um responder atual. O que são contingências resposta-reforço e apresentações do reforçador? Descontinuar o reforço tem dois efeitos: (1) eliminar a contingência entre as R e os reforçadores, de modo que (2) os reforçadores não mais ocorrem. Neste contexto, contingência 18 descreve as consequências do responder; aqui ele indica o efeito de uma resposta sobre a probabilidade de um estímulo. O procedimento padrão de extinção envolve a (1) suspensão da contingência e (2) das apresentações do estímulo. Porém suspender a contingência e manter a apresentação de estímulos tem consequências diferentes da suspensão total de (1) e (2). Em ambos os casos o responder reforçado diminui. Mas descontinuar (2) altera outra faixa de respostas. Tomando o rato como exemplo, ao suspender a apresentação de estímulo certas respostas tornam-se mais prováveis, como comportamentos agressivos, defecar e urinar. Estes efeitos (colaterais) não são decorrentes da suspensão da contingência, mas sim da apresentação do estímulo. As operações comportamentais, tem, em geral, mais de um efeito. O que extinção tem a ver com superstição? A suspensão das contingências sem a suspensão da apresentação de estímulo não se tornou a operação usual para se estudar a extinção por poder ocasionar o processo de superstição. Superstição neste caso ocorre pela sucessão acidental de respostas e reforçadores, pois R não gera S (R não é contingente à S), mas o organismo se comporta como se fosse. O responder supersticioso é um problema na análise do comportamento, pois tais comportamentos podem ocorrer quer os reforçadores sejam consequências das respostas ou não. As consequências podem reforçar diferentes propriedades das respostas. Os reforçadores com oportunidades para o comportamento O que é relatividade de reforço? Coloquialmente chama-se reforçadores de “recompensas”, mas isto é um equívoco. Os reforçadores não funcionam porque fazem o organismo “se sentir bem”. Nossa linguagem cotidiana não captura as propriedades essenciais dos reforçadores. Alguns eventos que, superficialmente, parecem “recompensadores” podem não funcionar como reforçadores; o contrário também é válido. Um exemplo são quedas livres em brinquedos de parques de diversão, não “recompensadores”, mas muito provavelmente reforçadores. A efetividade de um reforçador depende da sua relação com as respostas que o produzem. Reforçadores não podem ser definidos independentemente das respostas que reforçam. Reforçadores são relativos e suas propriedades importantes são baseadas nas respostas às quais eles criam oportunidade de ocorrência. A privação (e alguns tipos de OEs) torna os reforçadores mais efetivos, porque a probabilidade de uma resposta em geral aumenta quando a oportunidade de se engajar nela fica restrita. 19 O reforço é uma relação, que envolve o responder, suas consequências e a mudança no comportamento que se segue. Como um comportamento é adquirido? Como um organismo pode adquirir respostas por meio do reforço? Reforço não produz aprendizado, produz comportamento. Ao observar se o rato pressiona a barra quando a contingência de reforço está em operação e não na sua ausência estamos simplesmente interessados em até que ponto o rato aprendeu as consequências de sua ação de pressionar a barra. As consequências do responder são críticas para a aprendizagem não porque a aprendizagem ocorra a partir delas, mas porque elas são o que é aprendido. Certas contingências envolvem o modo pelo qual o ambiente é afetado pelo comportamento, sendo, portanto, características importantes do ambiente a serem aprendidas pelos organismos. O que é aprendizagem latente? Experimentos (em labirintos) sobre aprendizagem latente mostravam que a aprendizagem poderia ocorrer “sem reforço”. Porém se contra-argumentouque outros reforços não planejados estavam atuando, como os reforços sensório-motores, o acesso para a caixa com alimento e água, etc. A aprendizagem latente portanto deixou de ser uma questão teórica crítica, pelo argumento que sempre há uma consequência a resposta, e são estas consequências que o organismo aprende. Chamá-las de reforçadores é uma questão de preferência. O que é aprendizagem sensório-motora? A interação dos processos sensoriais com o comportamento tem sido uma fonte de controvérsias na Psicologia da Aprendizagem. A aprendizagem é motora ou sensorial? Os organismos aprendem respostas ou relações entre estímulos? Aprendem associações resposta-estímulo ou não associações estímulo-estímulo? Os processos sensoriais são comportamentais como relações entre classes de estímulos e classes de respostas. Olhar aumenta a probabilidade de ver, e desta forma o olhar é mantido por suas consequências. Sons, luzes e outros eventos básicos tem sido descritos como estímulos neutros, mas este rótulo, embora conveniente, é um nome enganoso. Os eventos não podem ser verdadeiramente neutros se forem consequências do comportamento. Após experimentos o fenômeno chamado reforço sensorial foi estabelecido, podendo-se discutir com mais clareza a curiosidade e o comportamento exploratório (podendo o reforço sensorial ser uma possível consequência determinante de tais comportamentos). 6 - As consequências do Responder: Controle Aversivo 20 Controle aversivo = punição + reforço negativo O que é punição? Terminologia da punição. Esta terminologia é adequada se, e somente se, estiverem presentes as seguintes 3 condições: (1) uma resposta produz alguma consequêcia, (2) a resposta ocorre com menos frequência do que quando não produz consequências e (3) a diminuição das respostas ocorre porque a resposta tem aquela consequência. Termo Restrições Exemplos Punidor (substantivo) Um estímulo. Choques foram empregados como punidores para as pressões à barra por ratos. Punitivo (adjetivo) Uma propriedade de um estímulo. O estímulo punitivo era produzido menos frequentemente do que outros estímulos não punitivos. Punição (substantivo) Como uma Operação, apresentar consequências quando uma resposta ocorre. Como um Processo, a diminuição nas respostas que resultam da punição. O esquema de punição emparelhada com um esquema de reforço de razão fixa 10 programava a apresentação de choques e alimento a cada 10 bicadas. O experimento com macacos demonstrou punição produzido por consequências sociais. Punir (verbo) Como uma Operação, apresentar consequências quando uma resposta ocorre; respostas são punidas, não organismos. Como um Processo, diminuir o responder mediante a operação de punição. Quando um castigo foi usado para punir o cumprimento de uma tarefa escolar, as notas da criança diminuiram. O experimento foi planejado para verificar se broncas puniriam jogos de cooperação em alunos de 1a série. Punição pode se referir a processos e operações. Operação: apresentar consequência punitiva. Processo: a redução do responder. É mais adequado usar punição como operação, e se referir ao processo pelos efeitos diretos no responder. Como no reforço, são as respostas que são punidas, não organismos. 21 Comparando Reforço e Punição O efeito da punição é o contrário do reforço. Extinção: suspensão do reforço e diminuição do responder até a linha de base. Recuperação: suspensão da punição e aumento do responder até a linha de base. Punição é inadequado no controle do comportamento não por ser temporário, já que segundo este critério o reforço também seria inadequado, já que ambos são temporários. Ver ética do controle aversivo. Como estudar punição se não há mais o responder? O que acontece se a recuperação ultrapassar a vida de um organismo? Os efeitos da punição devem ser estudados, pois é uma forma de controle presente e atuante. Como o reforço, o efeito da punição deve depender da relação entre as respostas e os estímulos punitivos (contingências) e não simplesmente da aplicação de punidores. Ver relatividade da punição. O termo punição se aplica à relação entre o responder e a consequência. A questão é, principalmente, saber quando a aplicação do termo é apropriada. Ambas as operações tem efeitos temporários; quando interrompidas, o responder retorna a níveis prévios. Como Punição é relativa? Experimentos com punição costumam usar choques como estímulos por sua relação fidedigna sobre uma variedade de respostas, porém este é um exemplo extremo de punidor. Esguichos de água podem punir efetivamente comportamentos autolesivos fortes, sendo que um estímulo inofensivo pode atuar como punidor. Da mesma forma que reforçadores, punidores não podem ser especificados em termos absolutos, nem em termos de variáveis em comum. Eles devem ser avaliados com base na relação entre as respostas punidas e as respostas ocasionadas pelo estímulo punitivo. Os estímulos e as respostas em experimentos típicos de reforço e punição têm sido escolhidos de modo a fazer com que estes experimentos funcionem. Eles obscurecem, assim, a reversibilidade potencial das consequências como reforçadoras ou punitivas. O responder pode ser aumentado ou reduzido pela mudança de suas consequências, e esses efeitos são determinados pelas propriedades comportamentais, e não pelas propriedades físicas, das consequências. Quais são os efeitos eliciadores dos estímulos punitivos? Estímulos punitivos podem ter efeitos independentes de sua relação de contingência com as respostas. A dificuldade em estudar a punição é distinguir os diferentes efeitos da punição que não tem relação com a contingência. 22 Devemos distinguir os diferentes efeitos da aplicação de estímulos contingentes a resposta das aplicações não contingentes a resposta. É importante reconhecer os efeitos separados de contingências resposta-estímulo e das apresentações de estímulo As vezes é mais apropriado comparar o choque produzido pela resposta com o choque produzido independentemente da resposta do que com uma situação sem choques. O choque, por exemplo, elicia respostas manipulativas (pressionar a barra) em macacos. Estes efeitos foram observados em Intervalo Fixo 5 minutos, onde o responder se manteve alto. Porém comparando com outras contingências outros resultados surgiram. O responder foi menor em IF 2m, mostrando que o responder aumentava com menos estímulos por resposta. E em esquemas onde a punição era aplicada a cada resposta o responder ficou bastante reduzido. Em cotrapartida, o responder do macaco era menor sem punições do que no esquema de IF 4m. Esses efeitos eliciadores do choque podem ser fortes o suficiente para anular seus efeitos punitivos, de modo que pressionar a barra ocorre a despeito de, e não por causa, da contingência punitiva. Quais são os efeitos discriminativos dos estímulos aversivos? Outro efeito colateral da punição pode ocorrer, porque os estímulos punitivos podem adquirir propriedades discriminativas, como quando uma resposta é reforçada apenas quando é também punida. Uma analogia humana seria a de uma criança que apanha pode provocar o pai a ponto de ser surrada, porque a surra geralmente é seguida por uma quantidade de atenção do pai arrependido que é maior do que a atenção em outros contextos. A atenção pode ser um reforçador poderoso e superar consequências que, de outra forma, serviriam de estímulos punitivos. O que é reforço negativo? Definição antiga: Quando uma resposta termina ou evitaum estímulo aversivo e, assim, torna-se mais provável, o estímulo é denominado reforçador negativo e a operação de reforço negativo. A distinção entre reforço positivo e negativo depende se uma resposta produz ou remove um estímulo Definição conteporânea: 1. O reforço faz a resposta reforçada aumentar. 2. A punição faz a resposta punida diminuir. 3. O adjetivo positivo significa que a consequência do responder é a adição de um estímulo ao ambiente do organismo. 4. O adjetivo negativo signiica que a consequência do responder é a subtração de um estímulo ao ambiente do organismo. 5. Os reforçadores e punidores são estímulos e a não ausência de estímulos (supondo que seja possível fazer uma distinção clara). 23 O que caracteriza a fuga? Procedimento simples de fuga: a resposta de um organismo suspende um estímulo aversivo. A terminologia da fuga e da esquiva (ver esquiva) é consistente com o uso cotidiano. A pesquisa em reforço negativo é dominada por procedimentos mais complexos, como a esquiva. Qual a relação entre o responder eliciado e a fuga? O motivo da relativa negligência em se pesquisar a fuga é que geralmente é fácil aumentar a probabilidade de respostas utilizando o reforçamento positivo, mas, às vezes, é difícil fazer isso, utilizando o reforçamento negativo em procedimentos de fuga. Parte da dificuldade ocorre, em parte, porque a relação temporal entre as respostas reforçadas e as respostas produzidas por um reforçador difere, no reforço positivo, daquela produzida no reforço negativo. Também no reforço negativo o estímulo está presente antes que a resposta a ser reforçada possa ser emitida. E o estímulo aversivo aumenta a probabilidade de outras resposas concorrentes com a resposta a ser reforçada sejam emitidas, diminuindo a probabilidade de que a resposta a ser reforçada seja emitida. 24 Exemplo: Para fugir de uma luz intensa o rato pode fechar os olhos e se encolher em um canto, sendo que qualquer comportamento que seja emitido será punido pela luz intensa (enquanto que se o rato apertasse a barra a luz cessaria). Sobre a ambiguidade da distinção entre reforço positivo e reforço negativo. Se os estímulos são apresentados ou removidos, isso pode ser um critério menos importante na distinção entre reforço positivo e reforço negativo do que se as respostas geradas pelo reforçador ocorrem em momentos em que elas podem competir com a resposta reforçada. Podemos considerar as mudanças no ambiente do organismo que produzem um contínuo de efeitos, que variam entre aqueles em que outras respostas têm alta probabilidade de preceder e competir com a resposta reforçada, até aqueles em que elas não fazem ou talvez até mesmo contribuam para um aumento na probabilidade de ocorrência da resposta reforçada. O que caracteriza a esquiva? Na esquiva, o estímulo aversivo não está presente quando a resposta reforçada ocorre. O procedimento simples de esquiva: a resposta evita ou atrasa um estímulo aversivo. As duas principais variantes da esquiva são denominadas cancelamento e adiamento. Analogia para cancelamento: matar um pernilongo antes que ele pique você. Analogia para evitação: colocar fichas em um telefone público para manter a ligação. O comportamento de esquiva costuma ser persistente e sua extinção lenta. A consequência de uma resposta de esquiva é que nada acontece. Embora seja fácil manter a persistência do comportamento de esquiva, é difícil instalar este comportamento. Isto explica porque medidas preventivas são difíceis de modelar e manter: elas não tem consequência aparente. O que são reações de defesa específicas da espécie? Uma vantagem dos procedimentos de esquiva sobre os de fuga é que a resposta reforçada ocorre na ausência do estímulo aversivo. Assim, outras respostas geradas pelo estímulo aversivo não compete continuamente com a resposta de esquiva. Também certas respostas funcionam melhor sob fuga, outras melhor sob esquiva. Tem se argumentado que as diferenças surgem porque os organismos são equipados de maneira variada, com respostas de defesa que são específicas da espécie. Sendo assim, o sucesso com procedimentos de esquiva dependerá de o experimentador escolher respostas que o organismo puder emitir. Certos comportamentos de esquiva podem ter tido grande valor de sobrevivência no passado, e por isso, foram selecionados filogeneticamente. Comportamentos específicos da espécie limitam o que pode ser aprendido. Saber se o responder de esquiva se mantém por prevenir a consequência aversiva, ou por uma resposta da espécie, é uma questão experimental. Algumas diferenças podem também depender dos determinantes específicos da espécie para o que é aversivo, p.e. o barulho de correnteza de água como estímulo aversivo para castores, sendo este estímulo um possível determinante para a construção de diques em rios. 25 Qual é a natureza do reforçador na esquiva? Outra questão é especificar o que reforça o responder na esquiva. Por a esquiva bem sucedida não gerar consequências, como pode a ausência de evento reforçar o comportamento? Uma teoria foi formulada a partir de experimentos que envolviam a sinalização do estímulo aversivo, sendo que tal estímulo sinalizador adquiriria propriedades aversivas ao ser consistentemente emparelhado com o estímulo aversivo. O término do estímulo sinalizador reforçaria negativamente a resposta evasiva. Tal concepção foi denominada teoria dos dois processos de esquiva. Mas o efeito do reforço voltou ao debate depois que Sidman realizou seus experimentos com esquiva não sinalizada. Também outro problema surgiu com experimentos onde a esquiva diminuía a taxa total de estímulos aversivos, mas não completamente. (ver páginas 123-125 para maiores detalhes). Orientações molar e molecular em Análise do Comportamento. Molecular: lida com o comportamento em termos de sequências de eventos, momento a momento, em um dado contexto. Molar: lida com propriedades que podem ser medidas ao longo de extensos períodos de tempo. Abordagem molecular da esquiva examina os intervalos de tempo individuais que separam respostas particulares de choques individuais. Abordagem molar da esquiva examina a relação mais geral entre taxas de resposta e as taxas de choque ao longo de uma amostra grande de respostas. As propriedades molares e moleculares do comportamento podem ser importantes em contextos diferentes. É razoável supor que a evolução equipou os organismos com a capacidade de responder, diferencialmente, a muitas propriedades das situações que se encontram. A questão é decidir qual abordagem é mais apropriada à análise de uma dada situação. Qual a relação entre extinção, fuga, esquiva e reforço negativo? Os efeitos da extinção também são temporários. Os efeitos de eliminar contingências devem ser distinguidos das de eliminar estímulos aversivos. Em fuga, o responder cessa pois não há mais ocasião para responder. No entanto, em esquiva, desligar a fonte do choque é, às vezes, considerado uma operação de extinção. Se o responder da esquiva for mantido por raros estímulos aversivos, o responder continuará por um longo tempo. Por essas razões a esquiva em sido considerada relevante para casos de comportamento humano, como compulsões. Suspender as apresentações do estímulo aversivo tem sido o procedimento de extinção mais comum em esquiva, mas apresentar o estímulo aversivo enquanto interrompe-se as contingências do responder é um paralelo mais próximo da extinção após reforço negativo. 26 Sobre punição positiva e punição negativa. Também é possível distinguir entre punição positiva e negativa (embora aqui também sejam possíveis casos ambíguos). É difícil estudara punição negativa experimentalmente retirando-se o reforço positivo; o que se tem feito é a remoção de um estímulo na presença do qual as respostas são reforçadas, o que é um paralelo da ênfase na esquiva e não na fuga, em estudos de reforço negativo. Tais períodos sem estímulos sinalizadores que ocasionam reforço da resposta são chamados de suspensão discriminada das contingências de reforço, às vezes, de punição por timeout de reforço positivo. Os procedimentos que sinalizam punição negativa têm sido chamados de treino de omissão. Assim como qualquer forma de punição, a função principal da punição negativa é reduzir certos comportamentos, mas ela é frequentemente aplicada sem uma atenção para os comportamentos alternativos que poderiam ser reforçados. A utilização do timeout sem a compreensão de suas bases comportamentais pode ser contraproducente. Sobre a linguagem e a ética do controle aversivo. Ao falarmos de estímulos punitivos, reforçadores negativos e estímulos aversivos, temos que lembrar que cada um é apropriado em contextos diferentes. Estímulos aversivos foram apresentados com fenômenos de eliciação, os estímulos punitivos foram apresentados durante a discussão de consequências que reduzem o responder e os reforçadores negativos foram incluídos como classes de consequências que aumentam a probabilidade de resposta. Seria conveniente se pudéssemos supor que cada termo identifica diferentes aspectos de uma categoria única de eventos. Para muitos estímulos, na maior parte do tempo, tal premissa é possivelmente correta. Mas devemos lembrar das diferentes probabilidades de resposta e da relatividade de reforçadores e punidores. Tal premissa não é garantida. As propriedades comportamentais do controle aversivo têm implicações que são consistentes com os argumentos éticos contra o controle aversivo. A punição só é justificável em casos extremos, como comportamentos autolesivos (a punição pode prevenir danos permanentes). Porém a punição permanece como uma prática recorrente de controle alheio, por sua imediaticidade da diminuição do responder; o reforço positivo é mais complexo de ser aplicado e tem consequências atrasadas. É necessário estudar os mecanismos do comportamento para prevenir seus maus usos. 27 7 - Operantes: A Seleção do Comportamento O que é modelagem? Modelagem é o reforçamento de respostas que se aproximem de uma resposta alvo. Modelar implica em um meio termo entre os extremos da apresentação frequente e não frequente de reforço. Reforçar demais sacia e pode fortalecer respostas não planejadas. Reforçar pouco leva a extinção. A modelagem também pode ocorrer como um resultado de contingências naturais e também pode gerar mudanças qualitativas abruptas, ao invés de lentas aproximações de propriedades de uma classe de respostas (exemplos destes processos na página 131). A modelagem é baseada no reforço diferencial: em estágios sucessivos, algumas respostas são reforçadas e outras não. À medida que o responder se altera, os critérios para o reforço diferencial também mudam. A propriedade do comportamento que torna a modelagem efetiva é a variabilidade do comportamento. O paradoxo (antigo) da modelagem é que não aumentamos a probabilidade de uma mesma resposta ocorrer porque nunca uma resposta é igual a outra. Mas não se lidam com respostas singulares, mas sim com diferentes respostas que pertencem a uma mesma classe. O que são classes de respostas e classes operantes? Não podemos discutir o comportamento apenas em termos de respostas isoladas. As respostas individuais são instâncias do comportamento, e cada uma pode ocorrer apenas uma única vez; as respostas podem ter propriedades em comum, mas não podem ser idênticas em todos os aspectos. Assim temos que respostas reforçadas produzem outras respostas que não a mesma resposta, mas não podemos agrupar respostas sem distinção, porque ficaríamos sem nada a falar a não ser do comportamento em geral. Um nível intermediário de análise, que não são respostas individuais nem o comportamento em geral, mas sim classes de respostas definidas por propriedades em comum. Se as consequências modificam a probabilidade de respostas de uma classe ela é denominada classe operante. Conceitos antigos relacionados a classe operante: instrumental, voluntário. Comportamentos “autônomos” podem ser operantes (ver exemplo na página 133). 28 Essa definição de classes de respostas depende de propriedades comportamentais do responder e não de propriedades fisiológicas, como a distinção somática-autonômica. As propriedades comportamentais de classes operantes são baseadas na operação denominada reforço diferencial (o reforço de apenas algumas respostas de uma classe de respostas). Esta operação torna o responder subsequente cada vez mais estreitamente ajustado às propriedades definidoras da classe. A característica essencial de um operante é a correspondência entre uma classe de respostas definida por suas consequências e o espectro de respostas geradas por essas consequências. O que é diferenciação e indução? Indução: extensão do efeito do reforço a outras respostas não incluídas na classe reforçadora. Sinônimo ocasional: generalização de respostas. Diferenciação: processo de distribuição de respostas emitidas que passa a se circunscrever estreitamente aos limites da classe de respostas reforçadas. O responder estabelecido desta maneira é denominado diferenciado. Quais as diferenças entre topografia e função na classe operante? Vimos como classes de comportamentos podem ser criadas por meio de reforço diferencial. Mas elas não são definidas por sua topografia, mas sim por sua função comum. Topografia: pisar na barra, morder a barra para baixo, sentar na barra, pressionar a barra com a pata esquerda, direita ou ambas. Função comum: todas produzem as mesmas consequências. Os operantes são definidos por suas funções e não por suas formas. Respostas com topografias similares, mas funções diferentes, serão agrupadas em diferentes classes. Reforço diferencial da organização temporal. As propriedades temporais do responder incluem a latência, a duração e o ritmo. Quaisquer dessas propriedades podem servir de base para o reforço diferencial. Reforço diferencial de baixas taxas - DRH (Differential reinforcement of low response rate). Exemplo: DRL10" = um rato é reforçado pela primeira resposta depois de 10s, mas se o rato responder antes que 10s não haverá reforço e o rato terá que esperar 10 segundos a partir da última resposta. Reforço diferencial de altas taxas - DRH (Differential reinforcement of high rate). Muitas R em pouco t para receber reforço. 29 Exemplo: DRH10"/15 responses = um rato deve apertar a barra 15 vezes dentro de 10 segundos para receber reforço. A taxa de resposta não é uma medida fundamental do reforço, mas é apenas uma propriedade do comportamento que pode ser diferenciada. O responder sob DRL ocorre a uma baixa taxa, mas é facilmente estabelecida e sustentada. O responder sob DRH ocorre a uma taxa alta, mas é difícil de se estabelecer e é frágil quando estabelecido. Outras classes de reforço diferencial: Reforço diferencial de responder espaçado: estabelece limites tanto inferiores quanto superiores para os IRT (tempo entre respostas) que precedem uma resposta reforçada e que tende a manter uma taxa de respostas razoavelmente constante. Reforço diferencial de outro comportamento (DRO): apresenta um reforçador na condição que ocorra um tempo definido sem a resposta especificada. Este é o nome técnico para o procedimento geralmente usado para programar reforço para comportamentos alternativos.A estrutura do operante Noção de comportamento complexo em labirintos. Além de respostas discretas, sequências complexas de respostas também podem ser tratadas como classes operantes. Exemplo: o percurso por um labirinto pode ser considerado uma resposta única, mas complexa. Escolher os caminhos certos pode ser reforçado diferencialmente. O responder em um labirinto não é fruto de tentativas e erros, nem de hipóteses que o organismo formula, são antes alterações consistentes no responder integrado de um organismo. Sequências de respostas: qual a diferença entre encadeamento e unidades temporalmente extendidas? Quebrar uma sequência comportamental pode mostrar uma sucessão de operantes. Este tipo de sequência é denominado cadeia de respostas, onde as respostas tem funções duplas: elas reforçam a resposta anterior (ver reforço condicionado) e servem de ocasião para a próxima resposta. Alguns componentes de certas cadeias são independentes entre si, mas algumas sequências apresentam outros problemas: as respostas são sequências específicas de respostas encadeadas ou unidades temporalmente extendidas, não redutíveis a tais sequências? Esta é 30 uma questão experimental, onde ambos os processos podem ocorrer. O desafio é saber qual sequência está em vigor. Classes operantes e comportamento novo. As classes operantes podem ter propriedades mais complexas, como nos casos de reforço diferencial, labirintos e sequências de respostas interligadas. O nosso interesse principal está nas dimensões ao longo das quais o responder se conforma à classe de respostas que é reforçada. A estrutura do comportamento é tal que nem sempre podemos definir tais dimensões independentemente das contingências de reforço. Tomando o exemplo do treino de golfinhos para diferenciar respostas novas. Como definir tal classe operante sem ser pelo critério de reforço? O fato de que temos dificuldade em medir a originalidade ou outras dimensões complexas do comportamento não as elimina como propriedades que possam definir as classes operantes. Mesmo a variabilidade do responder pode ser tomada como base para o reforço diferencial. Isto mostra que organismos são sensíveis a populações de respostas e consequências ao longo de extensos períodos de tempo, e não meramente a sequências individuais resposta- estímulo (ver análises molares x moleculares). 31 8 - Operantes Discriminados: Controle de Estímulo O que são operantes discriminados? O reforço diferencial também pode ocorrer com base nas dimensões em cuja presença as respostas ocorrem. Quando o responder é reforçado apenas na presença de alguns estímulos, dizemos que o reforço é correlacionado com aquele estímulo. Uma classe de respostas criada por este reforço diferencial em relação às propriedades do estímulo é chamada de operante discriminado. É bem possível que não exista uma classe operante sem estímulos discriminativos. Mesmo o ambiente constante de um organismo atua controlando seu comportamento. SDs estabelecem a ocasião em que as respostas têm consequencias, e diz-se que eles ocasionam respostas. Notação científica usual: SD: estímulo discriminativo (ou) S+: estímulo positivo SΔ: estímulo correlacionado com o não reforço (ou) S-: estímulo negativo (o mais apropriado seria S0, pois nada é removido em presença deste estímulo). A dispersão do efeito do reforço na presença de um estímulo para outros estímulos não correlacionados com o reforço é denominada generalização. Discriminação: processo no qual estímulos que ocasionam o responder vieram a conformar-se estreitamente com a classe de estímulos correlacionada com o reforço. O responder sob tal controle de estímulo é denominado de comportamento discriminado. Devemos reconhecer duas classes de estímulos: 1. Uma classe correlacionada com a contingência de reforço. 2. Uma classe onde o responder ocorre. O interesse está na correspondência entre estas 2 classes. Os estímulos estabelecem a ocasião para as respostas pois quando uma classe de respostas é definida pela presença de um estímulo, as respostas nesta classe não podem ocorrer quando o estímulo está ausente. Quando falamos de diferenciação e indução ou de discriminação e generalização, a operação subjacente em cada caso é o reforço diferencial. Tanto a diferenciação quanto a discriminação envolvem correspondências entre as dimensões sobre as quais o reforço diferencial é aplicado e as dimensões do comportamento resultante. Porque atentar para as propriedades de estímulo? 32 Ao discutir a correspondência entre os estímulos com os quais as contingências de reforço estão correlacionadas e os estímulos os quais o organismo responde, fala-se a partir de um valor de estímulo específico. Os estímulos são variáveis e não há garantias que o organismo responda a apenas um grupo de variáveis específicas. As variáveis de estímulo às quais um organismo tende a responder discriminativamente são, às vezes, denominadas salientes. Mas saliência não é uma variável de um estímulo, mas sim uma propriedade do comportamento do organismo com relação à aquele estímulo. O conceito de atenção é essencial em um tratamento dos operantes discriminados, porque os organismos tendem a responder a algumas variáveis de estímulos, e não a outras. Na medida em que atentar para, ou prestar atenção a uma variável ou a outra, é algo que os organismos fazem, podemos tratá-lo como um tipo de comportamento (ver capítulo 20). Uma razão importante para tratar a atenção desta maneira é que o atentar (para) pode ter consequencias. Aprendizagem de lugar x Aprendizagem de resposta. A questão é se os organismos aprendem dimensões das respostas (uma sequência específica em um labirinto, por exemplo) ou aprendem dimensões do estímulo (se movimentar em direção a um local particular, se movimentando em um labirinto em direção à uma janela, p.e.). As propriedades espaciais do ambiente são particularmente importantes, mas, em circunstâncias apropriadas, um rato pode aprender propriedades do ambiente. Gradientes de controle de estímulo Em um procedimento de diferenciação, o organismo determina a ordem das respostas, mas em um procedimento de discriminação o experimentador deve decidir a ordem em que os estímulos são apresentados. Um experimentador que esteja interessado em algum contínuo de estímulo (isto é, alguma dimensão ao longo da qual os estímulos podem variar, como a intensidade ou a posição de uma luz) deve preocupar-se com quantos estímulos apresentar, por quanto tempo de que forma os estímulos deveriam ser correlacionados com o reforço e com o não reforço, para mencionar algumas das possibilidades mais importantes. A seguir, alguns exemplos de possíveis gradientes de controle de estímulo. Gradientes de Generalização Se uma resposta é reforçada durante um estímulo, e alguma propriedade daquele estímulo então é variada, o responder pode depender de quanto o estímulo mudou. 33 Os efeitos do reforço na presença do vermelho estenderam-se para outras cores. O gradiente de generalização pode ser afetado por outras variáveis, como a privação e diferentes esquemas de reforços. Gradientes de Pós-discriminação Os gradientes de controle de estímulos podem ser obtidos após uma discriminação entre dois ou mais estímulos ao longo de uma dimensão. Em um treino de discriminação, onde SD é reforçado e SΔ é extinto, as respostas tendem a serem mais frequentes em valores de estímulos distantes de SΔ. Um pombo treinado com SD=550 milimicrons (um comprimento de onda, neste caso de luz) e com SΔ=570 milimicrons responde majoritariamente em 540 milimicrons, distante de SΔ. Este deslocamento visto num gráfico de respostas é denominado deslocamento de pico. Gradientesde Inibição Aqui os gradientes são para avaliar em que medida um estímulo não-correlacionado com SD inibe altera o responder. Em tais gradientes, o responder aumenta quanto mais os valores do estímulo correlacionado com a extinção se afastam da característica negativa (valor de estímulo correlacionado com a extinção). É mais fácil treinar características positivas (valores de estímulos correlacionados com o reforço) do que características negativas. O que é esvanecimento (fading)? Do mesmo modo que as propriedades de resposta que definem uma classe operante podem ser gradualmente modificados por meio de procedimentos de modelagem, as propriedades de estímulo que definem uma classe operante discriminada podem ser gradualmente alterados por procedimentos análogos de esvanecimento ou esmaecimento. 34 O treino não tem que começar com estímulos que são difíceis de discriminar. Ele pode começar com aqueles que são fáceis de discriminar e, então, mudar gradualmente para estímulos mais difíceis. Como no caso da modelagem, não há regras simples para determinar quão rapidamente os estímulos devem ser gradualmente introduzidos (fading in) ou removidos (fading out) em diferentes situações. O esvanecimento requer que algum comportamento sob controle discriminativo esteja disponível para ser mudado no controle de uma nova dimensão de estímulo. Como é a terminologia do reforço diferencial? Tanto a diferenciação quanto a discriminação envolvem reforço diferencial. A diferença está em se o reforço diferencial é imposto sobre as propriedades do responder ou sobre as propriedades do estímulo em cuja presença o responder ocorre. A principal implicação dessa diferença diz respeito ao procedimento: em estudos de diferenciação, o experimentador deve esperar pelas respostas do organismo, enquanto em estudos de discriminação o experimentador controla a ordem e a duração das apresentações de estímulo. O reforço diferencial pode ser programado para propriedades complexas dos estímulos que não são facilmente quantificáveis. Frequentemente, tratamos os estímulos como se fossem restritos a objetos concretos ou a eventos ambientais. Mas também discriminamos entre as características, às vezes, chamadas de abstratas ou de relacionais que são independentes dos objetos ou dos eventos particulares. O termo estímulo também funciona no sentido de propriedade de eventos ambientais (como estar a direita ou a esquerda de algo). 35 Cognição Animal Os estudos sobre cognição animal estão interessados no que os organismos sabem, e as explicações, geralmente, estão vinculadas à estrutura dos estímulos relevantes. Por exemplo, se um organismo discrimina entre certos estímulos com base em alguma característica crítica, um cognitivista pode dizer que o organismo representa os estímulos para si mesmo com base naquela característica. Tais questões serão retomadas no contexto da memória e da recordação, e no contexto das teorias comportamentais e cognitivas no capítulo 20. Mapas cognitivos A descoberta de que organismos podem localizar uma área mesmo quando se aproximam dela por uma nova direção demonstra que eles podem aprender as relações espaciais além das, ou talvez em vez de trilhas específicas. Isto justifica falar de mapas cognitivos. Algumas habilidades de “navegação” são aprendidas, e outras foram selecionadas filogenéticamente. Uma análise das propriedades do estímulo que determinam o comportamento é relevante tanto para a filogenia quanto para a ontogenia. Conceitos naturais e Classes de estímulo probabilísticas Podemos falar de generalização, dentro de uma classe de estímulos, e discriminação, entre classes de estímulos. Assim, nosso conceito de vermelho deve envolver a generalização entre todos os estímulos a que chamamos de vermelho, e a discriminação entre estes estímulos e todos os outros a que não chamamos de vermelho. Então, os conceitos estão para classes de estímulos como os operantes estão para as classes de respostas. É difícil definir os estímulos por dimensões físicas, seja a discriminação entre letras, números e objetos, por exemplo. O que distingue os cachorros dos outros animais? Pombos foram ensinados a discriminar formas humanas de não humanas, e tais discriminações complexas foram denominadas conceitos naturais. Os conceitos naturais são exemplos de classes de estímulo probabilísticas, classes em que cada membro contém algum subconjunto de caracterísicas mas nenhum é comum a todos os membros. Às vezes, estas classes denominadas conjuntos imprecisos ou indefinidos (fuzzy sets) não tem limites bem definidos. 36 Algumas classes de estímulo probabilísticas são definidas por referência a um protótipo. Um protótipo é um membro típico de uma classe probabilística; é derivado de uma média ponderada de todas as características de todos os membros da classe. Exemplo: os pássaros (como classe probabilística), em sua maioria, voam, mas alguns dos membros desta classe não (avestruz, pinguim). Outros tipos de classes de estímulos: -classes de estímulo polimorfas -classes de equivalência (ver capítulo 9) A classe de estímulo é, ela própria, uma classe de estímulo probabilística, no sentido de que sua definição muda à medida que expandimos os limites de pesquisa relevantes. Qual a definição de Classes de estímulo? O problema de definir as classes de estímulo é generalizado. Ela não será resolvido por meio do apelo a procedimentos de mensuração física, porque a leitura de instrumentos de medida também é um comportamento discriminativo. 37 9 - Discriminação Condicional e Classes de Ordem Superior Discriminações em que o papel de um estímulo depende de outros que forneçam o contexto para ele são denominadas discriminações condicionais. Estes procedimentos geram classes de ordem superior, no sentido de que as classes são definidas não por estímulos ou respostas particulares mas por relações que incluem tais estímulos e tais respostas como casos especiais. O que são as dimensões relacionais dos estímulos? Muitas discriminações condicionais envolvem relações arbitrárias entre um estímulo discriminativo condicional e as discriminações para as quais ele estabelece condição. Alguns casos em que tais relações não são arbitrárias são de interesse especial. Se em uma situação um estímulo é comparável, igual, ou diferentes a outros, depende do, ou é condicional ao, contexto na qual ele é apresentado. Por exemplo, se os estímulos A e B são azuis e o estímulo C é amarelo, então, em relação a A, B é um estímulo igual e C é um estímulo diferente. Emparelhamento com o modelo, emparelhamento por singularidade e as classes de equivalência são propriedades de tais discriminações condicionais. Como funciona o Emparelhamento com o Modelo (identidade) e o Emparelhamento por Singularidade? 38 Pode-se dizer que o emparelhamento foi bem sucedido se as respostas forem generalizadas para outras cores. Uma variação de tal emparelhamento é o de emparelhamento por singularidade (oddity), onde o reforço é programado para que o reforço ocorra no estímulo não-emparelhado. As relações entre os estímulos também podem implicar no emparelhamento arbitrário. Em um procedimento pode-se treinar o bicar no disco verde a partir de um modelo “quadrado” e o bicar um disco vermelho a partir de um modelo “círculo”. Todas estas tarefas são relações entre diferentes classes de estímulos. O que é o Comportamento Simbólico e qual o papel das Classes de Equivalência neste comportamento? Propriedades das relações: reflexidade, simetria e transitividade. As propriedades reflexivas são aquelas em que se mantém entre um termoe ele mesmo. Ex: A=A As propriedades simétricas são aquelas em que a ordem dos termos é reversível. Ex: se A=B, então B=A. As propriedades transitivas são aquelas em que os temos comuns em dois pares ordenados determinam um terceiro par ordenado. Ex: se A=B e B=C, então A=C. As relações de equivalência são aquelas que têm todas as três propriedades, e os termos que entram nelas (aqui, A, B e C) são considerados membros de uma Classe de Equivalência. Outras relações partilham apenas algumas dessas propriedades. A relação de oposição é simétrica (se D é o oposto de E, E é o oposto de D), mas não é reflexiva (D não é o oposto de si mesmo) nem transitiva (se D é o oposto de E e E é o oposto de F, D não é o oposto de F). E uma relação de magnitude como maior que é transitiva (se G é maior que H e H é maior que I, então G é maior que I), mas não é nem reflexiva nem simétrica. A figura abaixo ilustra como os procedimentos de emparelhamento de identidade (modelo) e emparelhamento arbitrário podem ser usados para demonstrar as três propriedades das relações de equivalência. 39 O teste da última linha combina os testes de reversão e de transitividade (intensidade e cor); ele é denominado teste de equivalência, e a relação entre os estímulos do teste de equivalência é denominada relação de equivalência. As relações dos testes de reversão e equivalência nunca foram explicitamente ensinadas. Se ocorre um emparelhamento apropriado nestes testes, as novas relações demonstradas por este comportamento são denominadas relações emergentes, no sentido de que emergiram sem um treino explícito; elas são exemplos de comportamento novo, produzidas por contingências de emparelhamento arbitrário. Não pode-se reduzir classes de equivalência a classes de estímulos discriminativos. As relações de equivalência são simétricas, mas as relações entre os termos de uma contingência de três termos não são (uma resposta A não é igual a um estímulo B, mas os estímulos que compõem uma classe de equivalência são simétricos entre si, no sentido que um estímulo C é igual a um estímulo D). As relações de equivalência são dificilmente (e suspeitosamente) demonstradas por pombos, mas são facilmente geradas em humanos. As relações de equivalência emergentes em 40 humanos justificam nomear tais desempenhos de emparelhamento simbólico, e não apenas de emparelhamento arbitrário. Não há limites óbvios para o número de classes que podem ser criadas ou para o número de estímulos que podem ser incluídos em cada classe. O status destes tipos de classes no comportamento de não-humanos permanece objeto de controvérsias. Mas as classes de equivalência definem comportamento simbólico, e assim, pode ser que elas sejam uma propriedade exclusiva do comportamento humano (ou também de seus parentes próximos). Elas tem grande relevância no comportamento verbal (ver capítulos 14, 15 e 16). O que são comportamentos de ordem superior? Se demonstramos, por exemplo, um emparelhamento por identidade (modelo), cada emparelhamento específico define uma classe, mas o emparelhamento de identidade é, então, uma classe de ordem superior que inclui, como seus componentes, todos os emparelhamentos específicos, ou seja, classes embutidas em outras classes. Um teste para o operante de ordem superior é se as relações novas podem ser demonstradas, como o emparelhamento de outras cores; um outro teste é se todas as subclasses em um emparelhamento se mantêm juntas como classe, caso mudemos as contingências somente para um subconjunto delas. Aprender a Aprender A aprendizagem de uma nova discriminação pode depender daquilo que organismo já aprendeu (o que no laboratório é chamado de história experimental). O fenômeno do learning set ocorre quando o responder pode depender das relações entre as propriedades do estímulo, independentes de estímulos específicos. (Com macacos,) quanto mais problemas eles haviam aprendido, mais rapidamente eles resolviam um novo problema. O desempenho depende de relações entre os estímulos e suas consequências correlacionadas, a longo de problemas sucessivos, e não de pares particulares de estímulos que aparecem dentro de problemas particulares. Podemos definir o operante discriminado (no experimento com os macacos) como se segue: se a resposta de selecionar um dos objetos é reforçada na primeira tentativa de um novo problema, selecione aquele objeto em todas as tentativas subsequentes. Na aprendizagem de problemas sucessivos, esse é o desempenho que é reforçado e é nisso que o comportamento do organismo se transforma. Assim, a correspondência entre as contingências de reforço e o comportamento gerado por essas contingências permanece como um critério apropriado para essa classe operante. 41 Aprende a aprender qualifica-se como uma classe de ordem superior, porque é definida por essas relações, e não pelos estímulos e pelas respostas a qualquer problema particular. Um fenômeno que pode ser visto como uma variação de learning set é o desamparo aprendido. Ratos que receberam choques elétricos inescapáveis e inevitáveis em uma situação tendem a não aprender uma resposta de esquiva quando esta se torna disponível, ao contrário dos ratos que nunca foram expostos a tal situação. Aqui, novamente, é difícil definir a classe de respostas, exceto se notarmos que os ratos que receberam choques inevitáveis e inescapáveis aparentemente aprenderam que suas respostas não tinham consequências importantes; o comportamento gerado por essas contingências se transfere para situações nas quais o responder poderia ter consequências. Talvez o desamparo aprendido, como uma classe de ordem superior, pudesse ser colocado sob controle de estímulos discriminativos, por meio de contingências diferenciais. O learning set ilustra a amplitude e a complexidade do que os organismos podem aprender. Propriedades de classes de ordem superior Sempre que as contingências que mantêm uma classe de ordem superior são diferentes das que mantém uma ou mais de suas subclasses, podemos nos perguntar quais das contingências prevalecerão. Enquanto a classe de ordem superior mantém sua integridade, suas subclasses são mantidas juntamente com os outros membros, mesmo que não estejam consistentemente envolvidas nas continências que mantém as outras. Quando isso acontece, as subclasses de ordem inferior parecerão insensíveis às mudanças nas contingências que são programadas para elas. Quando programamos novas contingências para as subclasses das classes de ordem superior, geralmente, esperamos que aquelas subclasses, eventualmente, sejam diferenciadas das outras. Mas se as subclasses se superpõem de diversas maneiras com outras classes que partilham de outras contingências, isso pode não acontecer. Muito do comportamento humano complexo pare de que ordens de classes superior; como regras, princípios, estratégias e similares; são mantidas por contingências sociais. Tentar explicar o comportamento humano apenas por relações estímulo-resposta, sem levar em consideração as classes de ordem superior, gerará explicações falhas e incompletas. Origens da Estrutura A maior parte das classes consideradas até agora tem sido as classes estruturais. As propriedades que as definem não eram arbitrárias, mas sim derivadas de relações sistemáticas entre as propriedades de eventos ambientais (p.e. emparelhamento, a singularidade, a simetria). 42 Porém classes arbitrárias também podem ser criadas, onde uma classe de estímulos, se for sistematicamente contingente com o reforço, terá a função de uma classe de ordem superior. A diferença entre esta estrutura e as outras
Compartilhar