Baixe o app para aproveitar ainda mais
Prévia do material em texto
Capítulo 5 AprendizagemAprendizagemAprendizagemAprendizagem Capítulo 5: Aprendizagem I. Aprendizagem e adaptação ........................................................1 II. Definições de aprendizagem......................................................5 III. Categorias de aprendizagem...................................................6 A. HABITUAÇÃO ........................................................................................................... 6 1. Características da habituação ................................................................................... 7 2. O Valor adaptativo da habituação ............................................................................ 9 B. CONDICIONAMENTO CLÁSSICO ........................................................................ 11 1. Características do condicionamento clássico ......................................................... 11 2. O estímulo condicionado como um sinal ............................................................... 13 3. Extinção ................................................................................................................. 13 4. O valor adaptativo do condicionamento clássico................................................... 14 C. CONDICIONAMENTO OPERANTE....................................................................... 16 1. Características do condicionamento operante ........................................................ 16 2. Modelagem............................................................................................................. 18 3. Extinção ................................................................................................................. 19 4. Esquema de reforçamento ...................................................................................... 20 D. APRENDIZAGEM LATENTE ................................................................................. 21 E. A ADAPTATIVIDADE DA APRENDIZAGEM LATENTE................................... 22 F. APRENDIZAGEM POR “INSIGHT”........................................................................ 23 G. APRENDIZAGEM DE REGRAS ............................................................................. 26 H. APRENDIZAGEM SOCIAL..................................................................................... 28 I. BRINCADEIRA .......................................................................................................... 31 IV. Estudos da cognição e aprendizagem animal......................35 V. Sumário .......................................................................................38 Capítulo 5 / Aprendizagem / página 1 Vivendo e aprendendo. Um dizer aparentemente verdadeiro. Mas, a verdade é que uns aprendem e outros não. Alguns seres vivos, como as solitárias, por exemplo, aprendem pouco ao longo da vida. Outros como os chimpanzés, aprendem bastante e ao longo de toda sua vida. Se forem saudáveis provavelmente estarão aprendendo até o momento de sua morte. Sem a habilidade de aprender perderiam a luta pela sobrevivência num mundo mutante. I. Aprendizagem e adaptação Quando observamos um animal na natureza geralmente vemos que seu comportamento aumenta suas chances de sobrevivência e reprodução. No capitulo anterior enfocamos a seleção natural como um mecanismo que produz comportamentos adequados às condições ambientais. Alguns teóricos evolucionistas só aplicam o conceito de adaptação para aquelas circunstancias onde existem evidencias de que a seleção natural modelou o comportamento para aquela função específica (Williams 1966). Outros, no entanto, definem a adaptação mais amplamente, como sendo todas as diferenças entre traços que aumentam a aptidão abrangente. As adaptações portanto não só podem incluir os traços com causa genética conhecida, mas também o potencial de aprendizagem herdado (Clutton-Brock e Harvey 1979). A aprendizagem é um processo pelo qual o animal se beneficia pela experiência, de forma que seu comportamento seja mais adequado às condições ambientais (Rescorla 1988). Aqui veremos a aprendizagem como adaptativa e consideraremos algumas das diferentes maneiras pelas quais ela pode modelar o comportamento, acentuando as habilidades do indivíduo sobreviver e reproduzir. Capítulo 5 / Aprendizagem / página 2 Desde que a habilidade de aprender é um produto da seleção natural, deveríamos ver diferenças entre espécies nos mecanismos e processos de aprendizagem (Kamil e Mauldin 1988, Kamil e Yoerg 1982). Essas diferenças são esperadas porque o ambiente e a história evolutiva da espécie influenciarão o efeito de um determinado tipo de aprendizado sobre a aptidão (o número relativo de filhos deixados por um indivíduo). No capítulo 2 consideramos algumas restrições biológicas à aprendizagem e algumas maneiras pelas quais os indivíduos de algumas espécies podem estar biologicamente preparados para aprender certas coisas e não outras. Aqui consideramos um exemplo de diferenças específicas da espécie na aprendizagem espacial e memória nos quebra-nozes de Clark (Nucifraga columbiana), gaios de pinhão (Gymnorhinus cyanocephalus) e gaios da capoeira (Aphelocoma coerulescens), ilustrando como a ecologia e a evolução podem influenciar as habilidades de uma espécie para a aprendizagem (figura 5.1). Essas aves estão entre as que armazenam sementes para recupera-las mais tarde, quando o alimento estiver escasso. Para que suas sementes não sejam roubadas por outras aves eles as escondem em pequenos buracos que fazem no chão e depois as cobrem. As sementes são armazenadas dessa maneira no outono e utilizadas, se necessário, no inverno e primavera. Os quebra-nozes de Clark podem também utilizar as sementes armazenadas para alimentar seus filhotes no verão (Vander Wall e Hutchins 1983). Isso significa que as aves devem ser capazes de retornar aos locais de armazenamento meses depois de enterrar as sementes. A recuperação das sementes é um feito impressionante para esses quebra- nozes, que podem possuir até 9000 depósitos numa área de muitos quilômetros quadrados (Balda 1980; Vander Wall e Balda 1977). Como eles encontram as sementes enterradas a tanto tempo atrás? Por mais surpreendente que isso pareça para os humanos, muitos dos quais tem problemas de Capítulo 5 / Aprendizagem / página 3 lembrar onde colocaram suas chaves do carro, as evidencias se acumulam de que essas aves recuperam as sementes simplesmente porque se lembram exatamente de onde as esconderam (Balda 1980, Vander Wall 1982). Se a seleção natural modela a habilidade de aprender nesta espécie, podemos prever que aquelas espécies que dependem mais dos depósitos de alimento para sua sobrevivência são melhores em recuperar os armazéns dos que as espécies que menos dependem disso. Os quebra-nozes de Clark, gaios do pinhão e gaios da capoeira são espécies aparentadas, membros da mesma família, mas que diferem na sua dependência do alimento armazenado. Os quebra-nozes vivem a grandes altitudes onde há pouco o que comer além das sementes armazenadas durante o inverno e a primavera. Sua dieta de inverno consiste quase que inteiramente de pinhões. Os quebra-nozes se preparam para o inverno armazenando cerca de 33 mil sementes. Gaios do pinhão vivem a altitudes mais baixas onde o alimento é mais facilmente encontrado durante o inverno. Mesmo assim, entre 70 e 90 porcento da dieta dos gaios do pinhão consiste das 22 mil sementes que armazenam em preparação para o inverno. Os gaios da capoeira são menores do que as outras duas espécies e exigem menos energia para se manter. Além disso, vivem a altitudes menores onde o alimento é mais facilmente encontrado no inverno.Os gaios da capoeira armazenam cerca de 6 mil sementes por ano e essas formam menos de 60 porcento da dieta de inverno. Um estudo comparando a recuperação dos armazéns pelos quebra-nozes de Clark, gaios do pinhão e os gaios da capoeira encontrou diferenças interespecíficas nessa habilidade correlacionadas com sua dependência relativa das sementes armazenadas (Balda e Kamil 1989). Nesses experimentos permitiu-se que as aves armazenassem sementes em buracos cheios de areia no chão de um aviário. Quaisquer de 90 buracos no chão poderiam ser enchidos de areia ou cobertos por um tapume de madeira. Esse arranjo permitiu que os experimentadores manipulassem a posição e o número de buracos disponíveis para Capítulo 5 / Aprendizagem / página 4 armazenagem. As habilidades de cada pássaro na recuperação dos armazéns foi testada em duas condições. Numa, somente 15 buracos estavam disponíveis para armazenagem. Noutra, todos os 90 buracos estavam disponíveis. A ave era removida do aviário depois de encher oito desses depósitos. Uma semana depois a ave era recolocada no aviário onde todos os 90 buracos estavam cheios de areia. A ave tinha que se lembrar onde enterrou as sementes. A precisão da recuperação foi medida pela proporção de buracos explorados que continham sementes. As três espécies se desempenharam melhor do que o esperado ao acaso. No entanto, os gaios do pinhão e os quebra-nozes, que mais dependem de encontrar as sementes no inverno, foram significativamente melhores do que os gaios da capoeira sob condições experimentais (figura 5.2). Na verdade os gaios do pinhão desempenharam melhor do que os quebra-nozes. Eram apenas um pouco melhores quando haviam apenas 15 buracos disponíveis, mas bem melhores quando haviam 90. Foi sugerido que isso pode ter sido devido ao fato dos gaios do pinhão tenderem a colocar seus armazéns mais próximos uns dos outros do que os quebra-nozes, tendo portanto que procurar numa área menor. O aglomeração dos armazéns foi inesperada mas os pesquisadores especulam que pode ser um resultado evolutivo de diferenças de estrutura social. Os gaios do pinhão são os únicos das três espécies testadas que permanecem em bandos o ano todo. Então os armazéns são feitos e recuperados na presença de outros, que podem evitar que espalhem seus depósitos por áreas grandes. Essa idéia poderia ser testada pela comparação destas aves com espécies aparentadas que também permanecem em bandos o ano todo, para ver se esses outros também colocam seus armazéns em aglomerados. De qualquer forma, os experimentos sugeriram a influência da ecologia e da evolução nas habilidades de aprender. Capítulo 5 / Aprendizagem / página 5 II. Definições de aprendizagem Geralmente podemos identificar o fenômeno da aprendizagem quando o vemos. No entanto, a aprendizagem pode ser difícil de definir precisamente. No interesse da simplicidade começaremos com uma definição mais ampla e depois a refinaremos. Primeiro, digamos que a aprendizagem seja o processo pelo qual a experiência modifica o comportamento do indivíduo. Nem todas mudanças de comportamento são fruto da aprendizagem. Um atleta pode correr a última milha de uma maratona a uma velocidade menor do que a inicial, mas isso é devido à fadiga muscular e não à aprendizagem. Uma pessoa que entra num cinema escuro vindo de um exterior ensolarado, inicialmente poderá tropeçar em objetos pelo chão. No entanto, depois de alguns minutos é capaz de evitar isso. Essa mudança resultou da adaptação dos receptores do olho, que se tornam menos sensíveis na luz forte, levando minutos para se adaptarem à luz fraca de modo a perceber os objetos pelo chão. A maturação do sistema nervoso também pode alterar o comportamento. Nossa definição de aprendizagem deve portanto especificar que as mudanças comportamentais causadas “não devem ser compreendidas em termos de processos maturacionais do sistema nervoso, adaptação ou fadiga sensorial” (Hinde 1970). Ao invés disso, as mudanças aprendidas do comportamento são devidas a experiência (Thorpe 1963). A experiência pode ser com uma determinada situação estímulo (Hilgard 1956) ou prática (Kimble 1961). Mais ainda, a maioria das experiências devem ser repetidas na aprendizagem. Mesmo que alguns tipos de aprendizagem ocorram em uma única tentativa, a maioria ocorre gradualmente ao longo de várias tentativas. A mudança comportamental que resulta da aprendizagem pode não ser expressa imediatamente. Por exemplo, uma pessoa pode memorizar um fato para um teste e não demonstrar que ocorreu a aprendizagem até o dia do exame. A possibilidade de um lapso Capítulo 5 / Aprendizagem / página 6 de tempo entre o processo de aprendizagem e a mudança resultante no desempenho requer que modifiquemos nossa definição de aprendizagem mais uma vez. A mudança no comportamento decorrente da aprendizagem é mais precisamente uma modificação na probabilidade de ocorrência de certos comportamentos. III. Categorias de aprendizagem Por conveniência, a aprendizagem é freqüentemente agrupada em diferentes categorias. Mas tenhamos em mente que a relação entre elas pode ser mais complexa do que parece a princípio. Por exemplo, pode haver sobreposição e a distinção entre elas não ser clara. Como resultado disso, os que estudam aprendizagem nem sempre concordam sobre a natureza das categorias e nem sobre quantas deveriam haver. Mesmo assim, a categorização de tipos de aprendizagem tem sua utilidade, nem que seja apenas de ajudar na comunicação. Então seguiremos adiante, ignorando os argumentos e considerando algumas das características distintas de algumas das categorias comumente reconhecidas de aprendizagem. Nossa lista de categorias não estará completa. Adiaremos para capítulos posteriores as discussões dos exemplos de aprendizagem que alguns consideram como categorias distintas. A estampagem, por exemplo, é discutida no capítulo sobre o desenvolvimento do comportamento (Capítulo 8). A. HABITUAÇÃO Normalmente pensamos que a mudança no comportamento resultante da aprendizagem como o acréscimo de uma nova resposta ao repertório do indivíduo. No entanto, na habituação, freqüentemente considerada a forma mais simples de Capítulo 5 / Aprendizagem / página 7 aprendizagem, o animal aprende a não mostrar uma resposta característica a um estímulo em particular porque ao longo de sucessivos encontros esse estímulo se mostrou inócuo. Uma ave deve aprender a não sair voando sempre que perceber uma folha soprada pelo vento. A habituação é simplesmente a eliminação de respostas ao invés do seu acréscimo ou modificação. Ela tem sido mais precisamente definida como “uma diminuição relativamente permanente de uma resposta como resultado de estimulações repetidas, não seguidas de qualquer tipo de reforço. É específica ao estímulo” (Hinde 1970). Persistente significa que os efeitos da habituação, uma vez adquiridos, são relativamente duradouros. Vemos a habituação em todos os lugares, ocorrendo tanto em simples protozoários unicelulares quanto nos complexos humanos (Wyers, Pecker e Herz 1973). Considere alguns exemplos. A Hydra cnidariana colocada num recipiente de vidro com pouca água, rapidamente retrairá seus tentáculos e encolherá seu corpo em resposta a uma batida no vidro. Mas, depois de algumas batidas suas reações diminuem e podem parar (Rushforth 1965). Uma lesma que atravessa uma lâmina de vidro se retrairá rapidamente se dermos uma batida no vidro. No entanto, se as batidas continuarem passarão a ser ignoradas. A princípios as aves se espantam com um espantalho mas após uma refeição nos grãos do fazendeiro passam a ignora-lo e a pousar em seusbraços, limpando suas penas. 1. Características da habituação Como ilustração das características essenciais da habituação nos referiremos à minhoca marinha Nereis palagica. Essa minhoca vive em tocas submarinas que constrói de lama. Elas emergem parcialmente dos tubos quando se alimentam. No entanto, certos estímulos súbitos, como uma sombra, que indique a aproximação de um predador, provocam uma rápida retração protetora. Se o estímulo se repetir e não houverem Capítulo 5 / Aprendizagem / página 8 conseqüências adversas, a resposta de retração diminui gradativamente. Obviamente a retração é adaptativa quando o predador estiver próximo, mas a minhoca não pode capturar suas próprias presas enquanto estiver dentro da toca. Então, é adaptativo que aprenda a não se retrair na ausência de perigo. A redução da responsividade da Nereis a estímulos recorrentes foi facilmente demonstrada no laboratório. Um grupo de minhocas foi mantido em um recipiente raso com tubos de vidro como tocas. Uma sombra foi usada para disparar a resposta de retração. A primeira vez que a sombra surgiu havia uma alta probabilidade de que cada minhoca se retraísse. Na segunda vez um pouco menos minhocas responderam. A terceira apresentação da sombra provocou menos retração. Como mostra a figura 5.3, as apresentações subsequentes de estímulos resultaram em percentuais cada vez menores de respostas grupais. Os animais começaram a aprender que o estímulo não estava associado com uma ameaça (Clark 1960). Se as minhocas de fato estavam aprendendo que o estímulo não era danoso, então sua falta de responsividade não foi devido à adaptação sensorial, ou seja, a falha dos receptores sensitivos em registrar a presença do estímulo. Sabemos disso porque o tempo necessário para a recuperação da resposta é maior do que o necessário para a recuperação do receptor. A adaptação sensorial é uma condição temporária que reduz a responsividade do receptor durante estímulos contínuos. A sensibilidade do receptor é rapidamente restabelecida após alguns segundos de descanso do estímulo. No entanto, a recuperação da habituação, análoga ao esquecimento, geralmente leva mais tempo. Depois de 20 apresentações de uma sombra em movimento, com intervalos de um minuto, a minhoca levou 3 horas para recuperar a resposta de retração. Assim, o declínio na responsividade não foi devido à adaptação sensorial. Capítulo 5 / Aprendizagem / página 9 Os animais também podem falhar na resposta a estímulos repetidos devido a fadiga muscular. Eles podem simplesmente estar cansados demais para repetir a resposta. A fadiga muscular pode ser eliminada como explicação para a falta de resposta pela aplicação de diferentes estímulos. Mais uma vez os estudos com a Nereis são uma boa ilustração disso. Um grupo de minhocas habituadas a uma sombra recursiva continuaram a responder integralmente a um choque mecânico e vice-versa. Isso é, quando sujeitas a repetidos choques mecânicos as minhocas habituaram mas as apresentações subsequentes de sombras provocavam o mesmo grau de resposta encontrado nos animais controle que descansavam (figura 5.4). Claramente, as minhocas não estavam simplesmente muito preocupadas para se retrair pois continuaram respondendo a estímulos diferentes (Clark 1960). 2. O Valor adaptativo da habituação O benefício da habituação é que ela elimina respostas a estímulos que ocorrem com freqüência e que não tem implicações no bem-estar do animal, sem diminuir as reações aos estímulos significativos. Obviamente é importante para a Nereis se retrair para a segurança de sua toca quando a sombra for de um predador. No entanto, se a sombra é vista e o ataque não ocorrer, é provável que ela seja causada por algo inofensivo, talvez uma alga boqueando o sol enquanto balança nas ondas. Nesse caso, se a minhoca respondesse à sombra toda vez que ela aparecesse sobraria pouco tempo para outras atividades essenciais como comer e reproduzir. Essas respostas não essenciais não só competiriam com atividades vitais como também seriam um desperdício de energia. A habituação é um dos mecanismos que concentra a energia nos aspectos importantes do ambiente (Leibrecht e Askew 1980). Capítulo 5 / Aprendizagem / página 10 Como exemplo da adaptatividade da habituação considere seu papel na modelagem dos padrões naturais das respostas de fuga em aves do campo. Aves jovens, como perus, galinhas e faisões não precisam ser ensinados a se agacharem quando avistarem objetos em sobrevôo. Como a Pequena Galinha da estória infantil os pintos exibem respostas de proteção a uma variedade de objetos, somente alguns dos quais são de fato perigosos. Por outro lado, os adultos só respondem a imagens de predadores como gaviões em sobrevôo. O estreitamento da responsividade nos adultos é divido à habituação. Isso ocorre porque os estímulos inócuos são muito mais comuns no ambiente do animal do que os nocivos. À medida que os jovens amadurecem são freqüentemente expostos a estímulos inofensivos, como nozes que caem, folhas ou aves não predatórias, gradualmente aprendendo a não se retraírem frente a eles. No entanto, como os predadores são raros os jovens não se habituam a eles e continuam a responder à sua aparição (figura 5.5). Mesmo que essa explicação seja intuitivamente lógica, Schleidt (1961 a, b) verificou que a habituação podia modelar o comportamento desta forma. Ele mostrou que modelos de diferentes formatos - uma silhueta de um ganso, um círculo e um quadrado - eram todos eficientes em eliciar vocalizações de alarme em perus jovens durante os dois primeiros dias de teste. Quando qualquer um desses modelos era apresentado com freqüência, o número de alarmes que provocava caia. Só ocasionalmente os pintos permaneciam responsivos aos estímulos que encontravam. Comportamentos agressivos, assim como comportamentos de fuga, se habituarão. Isso é adaptativo porque o comportamento agressivo gasta uma grande quantidade de energia e potencialmente expõe o animal ao perigo. Por exemplo, quando machos esgana- gata (Gasterosteus aculeatus) estabelecem seus territórios ocorre uma grande quantidade de exibições agressivas nas fronteiras. No entanto, ao longo do tempo os vizinhos se habituam uns com os outros e a freqüência das exibições agressivas diminui (Van den Capítulo 5 / Aprendizagem / página 11 Assem e van der Molem 1969). De semelhante forma, sabe-se que o comportamento agressivo de outro peixe territorial, o chiclídeo convicto (Cichlasoma nigrofasciatum), se habitua (Peeke, Herz e Gallagher 1971). No laboratório a resposta agressiva do macho do peixe siamês Betta splendens pode ser eliciado colocando um espelho ao lado do seu tanque. Ao se ver no espelho ele responde com uma exibição agressiva que o faz parecer maior e mais brilhante do que realmente é. Se o espelho for deixado, no entanto, e a imagem não é seguida por um ataque, ele logo se desinteressa (Claytone e Hinde 1968). B. CONDICIONAMENTO CLÁSSICO Mesmo que fosse verdade o ditado: “não se pode ensinar truques novos a um cão velho”, podería-se ensinar um truque velho em novas circunstancias. Vemos tal relação no condicionamento clássico. 1. Características do condicionamento clássico O princípio do condicionamento clássico foi primeiro apresentado por Ivan Pavlov, um fisiólogo russo cujo interesse principal era na atividade digestiva dos cães. O trabalho de Pavlov se iniciou com a simples observação de que um cão saliva em antecipação à comida. Pavlov pensou que era pouco provável que a salivação que ocorria antes da ingestão da comida fosse uma resposta inata. Ele pensou que o animal aprenderaa associar a imagem ou o cheiro da comida com a comida em si e que a salivação era resultado dessa aprendizagem. Então, antecipando a comida, o cão começaria a salivar frente a um estímulo novo que sinalizasse a chegada do alimento - formando uma ligação entre uma resposta antiga e um estímulo novo. Capítulo 5 / Aprendizagem / página 12 Pavlov começou então a investigar experimentalmente a associação. Para quantificar a resposta foi feito um pequeno orifício, ou fístula, na bochecha do cão. A saliva era drenada para um funil onde era coletada para medição. Um cão faminto era então amarrado a um pedestal onde podia ser submetido a vários estímulos. Um dos estímulos testados foi a comida em pó e, como esperado, o cão salivava quando a comida era soprada para dentro de sua boca. Então, imediatamente antes da comida ser oferecida Pavlov apresentou outro estímulo ao cão, um que inicialmente não causava salivação; o som de um sino. Em intervalos, ao longo de vários dias, o cão foi exposto a esse par de estímulos. Primeiro o som, depois a comida. Depois disso Pavlov verificou se o cão salivava em resposta ao sino por si só. Ele o fazia. Os resultados do experimento são demonstrados na figura 5.6. Mesmo que o tom originalmente não eliciasse a salivação, depois de 30 emparelhamentos entre os estímulos a saliva do cão fluía quando o som era apresentado sem o alimento. À medida que o número de tentativas aumentava ocorria um aumento na quantidade de saliva secretada e um decréscimo no tempo que o cão levava para responder (Pavlov 1927). Em termos mais gerais, o que aconteceu? De início o animal possui uma resposta inata e específica para certos estímulos. Esse estímulo é chamado Estímulo Incondicionado (EI ou US, para “Unconditioned Stimulus”) porque o animal não teve que aprender a responder a ele. Um segundo estímulo, o que inicialmente não elicia a resposta, é apresentado repetidamente antes do EI. Depois de vários emparelhamentos o segundo estímulo é capaz de eliciar a resposta (a resposta condicionada na verdade difere ligeiramente da resposta original, mas esse aspecto não será tratado aqui). Esse novo estímulo agora é chamado de Estímulo Condicionado (EC ou CS, para “Conditioned Stimulus”) porque a resposta do animal se tornou condicionada à sua apresentação. O fenômeno todo é chamado reflexo condicionado. O termo “condicionado” é uma tradução Capítulo 5 / Aprendizagem / página 13 infeliz do russo. O termo deveria ser “condicional”, implicando que o comportamento é condicional a alguma outra coisa. 2. O estímulo condicionado como um sinal A ordem de apresentação do EI e do EC é importante. O EC deve preceder o EI. O EC serve como sinal de que o EI irá surgir, esse indicador teria pouco valor se ocorresse depois do fato. Existe ainda um intervalo ótimo entre o EC e o EI para que o EC efetivamente sirva de sinal. Experimentos tem mostrado que um intervalo de 0.5 segundos entre os estímulos é o mais eficiente (Hilgard e Atkinson 1967). Ainda mais, sinais úteis são específicos, servindo como indicadores de que um evento ou estímulo em particular se seguirá. O sinal é inútil se simplesmente indicar que qualquer de uma dúzia de eventos poderá seguir. Assim, não é surpresa que para que ocorra o condicionamento clássico o EC deve preceder o EI mais freqüentemente do que outros estímulos (Rescorla 1967, 1988). 3. Extinção Se o EC (o som no experimento descrito) é freqüentemente apresentado sem ser seguido do EI (nesse caso a comida), a associação entre os estímulos é gradualmente perdida. A perda da resposta é chamada extinção. O progresso da extinção é mostrado na figura 5.6. Capítulo 5 / Aprendizagem / página 14 4. O valor adaptativo do condicionamento clássico Ivan Pavlov (1927) via as respostas condicionadas como benéficas. Mesmo que a citação abaixo se refira a respostas motoras, pode tão facilmente se referir a uma resposta interna: “É evidente que sob condições naturais o animal normal não só deve responder aos estímulos que trazem benefícios ou danos imediatos, mas também a outros (eventos) que por si mesmos sinalizam a aproximação desses estímulos; mesmo que não seja a visão ou o som do predador que seja nocivo... mas seus dentes e garras.” Karen Hollis tem testado experimentalmente a hipótese de que a função adaptativa do condicionamento clássico é de preparar o animal para eventos importantes. Seus estudos tem-se centrado nos comportamentos territoriais e reprodutivos dos gouramis azuis (Trichogaster trichopterus). Aqui só serão descritos os experimentos sobre respostas agressivas condicionadas. Para uma discussão mais completa que inclua informações sobre a inibição condicionada da agressão e o papel do condicionamento clássico no comportamento reprodutivo se refira a Hollis (1990). Um gourami azul macho inicia sua defesa territorial contra um intruso com uma exibição frontal onde se aproxima rapidamente do peixe intruso com as nadadeiras eretas. Se o intruso não responder com uma postura submissa ou se retirar, o confronto se torna uma batalha com sérios ferimentos. Os machos se mordem e batem as caudas para jogar água contra a sensível linha lateral do oponente. Vimos no capítulo anterior que a teoria dos jogos prevê que competições agressivas danosas tem mais probabilidade de ocorrer quando o recurso é valioso. Capítulo 5 / Aprendizagem / página 15 Essa previsão é sustentada pelos gouramis azuis. É essencial que machos sejam mais bem sucedidos na defesa territorial porque as fêmeas raramente se acasalam com um macho sem território. Assim se pensa que qualquer mecanismo que possa aumentar as chances de uma defesa bem sucedida seria favorecido pela seleção natural. Uma resposta condicionada aos sinais que indiquem a aproximação de um rival poderão prepara o macho para a batalha e lhe trazerem uma pequena vantagem inicial. Na natureza o rival que se aproxima inadvertidamente envia sinais visuais, químicos ou mecânicos de que uma invasão territorial é iminente. Hollis tem mostrado gouramis azuis machos que foram classicamente condicionados a um sinal que indica um confronto com um rival são mais bem sucedidos nesses confrontos agressivos. Pares escolhidos para serem do mesmo tamanho e níveis de agressividade, foram mantidos em lados separados de um aquário dividido. Um membro de cada par foi treinado de forma que 10 segundos de luz (o EC) precedia uma visão de 15 segundos do rival (o EI). O EC e o EI também eram apresentados ao outro membro do par, mas sem emparelhamento. Durante os testes era dado um sinal luminoso antes da retirada da divisão, permitindo que interagissem. Os machos condicionados foram melhores na defesa territorial. Eles se aproximavam da borda do território já com as nadadeiras eretas e em exibição frontal. Durante as brigas territoriais davam significativamente mais “rabadas” e mordidas nos seus competidores (Hollis 1984). Os machos condicionados podem ser os vencedores porque a luz (EC) aumenta o nível de andrógenos, hormônios sexuais masculinos que sabidamente aumentam a agressividade em muitas espécies. Um macho mais agressivo tem mais chances de vencer a batalha e de defender seu território, aumentando suas chances de acasalamento (Hollis 1990). Capítulo 5 / Aprendizagem / página 16 C. CONDICIONAMENTO OPERANTE 1. Características do condicionamento operante Quando o comportamento tem conseqüências favoráveis a probabilidade do ato se repitir aumenta. Essa relação resulta porque o animal aprende a desempenhar o comportamento de forma a ser recompensado. Esse tipo de aprendizagem tem sido chamadode condicionamento operante para enfatizar que o animal opera no ambiente para produzir conseqüências. Novamente, como no condicionamento clássico, a sincronia dos eventos é crítica. No entanto, nesse caso o comportamento deve ser emitido espontaneamente e não eliciado por um estímulo, como no caso do condicionamento clássico, e o resultado favorável, ou reforço, seguir imediatamente. Nesse sentido, se desenvolve uma relação de causa-efeito entre o desempenho do ato e a emissão do reforçador. Já em 1855, antes do termo condicionamento operante ser cunhado, Herbert Spencer observou animais aprendendo a responder através do condicionamento operante. Seu relato é interessante porque ilustra como o condicionamento operante pode aperfeiçoar as habilidades motoras na natureza. Agora suponhamos, que ao expor sua cabeça para pegar uma presa quase ao alcance, uma criatura falhe repetidamente. Suponhamos que junto com um grupo de ações motoras aproximadamente adaptadas para capturar presas a essa distância... ocorra um leve movimento do corpo [que é causado em algumas ocasiões]. Ocorrerá o sucesso ao invés da falha... Na recorrência destas circunstâncias esses movimentos musculares que foram seguidos do sucesso provavelmente serão repetidos: o que inicialmente era uma combinação acidental de movimentos agora será uma combinação com uma razoável probabilidade. Capítulo 5 / Aprendizagem / página 17 Mais tarde B.F Skinner criou um apararato que ainda é usado no estudo do condicionamento operante no laboratório. Tipicamente, um animal faminto é colocado na “caixa de Skinner” e deve aprender a acionar um mecanismo que fornece alimento. Por exemplo, um rato faminto colocado na caixa de Skinner se moverá randomicamente investigando cada pedaço. Eventualmente se apoiará na barra existente na caixa (figura 5.7). Quando a barra é pressionada um pedaço de comida cai num recipiente. O rato normalmente pressionará a barra novamente depois de alguns minutos. Em outras palavras, primeiro o ato de pressionar a barra é randômico mas quando é recompensado aumenta a probabilidade do ato se repetir. Esse aparato foi modificado para ser usado com pombos, que devem aprender a bicar um botão para obter uma recompensa alimentar. Por definição, um estímulo que altera a probabilidade de um comportamento ser repetido é chamado reforçador. Nos experimentos até aqui descritos foram utilizados reforçadores positivos. Reforçadores Positivos são aqueles que aumentam a probabilidade de um comportamento se repetir. Exemplos disso incluem o alimento oferecido a um rato faminto ou bebida para um sedento. Reforçadores Negativos são aqueles que aumentam a probabilidade de resposta quando são removidos. Se um estímulo desagradável ou doloroso cessa quando o animal realiza um determinado ato, é provável que a ação seja repetida. Por exemplo, um rato aprenderá a empurrar um painel para terminar um choque elétrico (Mowrer 1940) ou pressionar uma barra para desligar uma luz elétrica forte por 60 segundos (Keller 1941). Geralmente pensamos em reforçadores como recompensas. Skinner, no entanto, preferia o termo reforçador porque a recompensa implica em sensações que podem ser intuitivamente inferidas mas que não são medidas. Assim, a melhor definição operacional de reforço: altera a probabilidade de uma resposta. Capítulo 5 / Aprendizagem / página 18 2. Modelagem Pode-se ensinar atos novos e complexos aos animais para que possam receber a recompensa. O processo pelo qual isso ocorre, chamado “modelagem”, foi equiparado à maneira pela qual o escultor modela um pedaço de argila (Skinner 1953). Quando cria uma escultura o artista modifica uma massa disforme tornando-a uma obra- prima através de uma série de mudanças minúsculas na forma original. Na modelagem qualquer aproximação grosseira ao comportamento desejado é recompensada. Mas, reforços posteriores exigem uma aproximação crescente em direção ao alvo desejado. Por exemplo, se fossemos treinar um leão marinho a saltar através de um aro fora da água, primeiro o recompensaríamos por se aproximar do aro. Quando tivesse aprendido a se aproximar só seria recompensado quando nadasse por dentro do aro. Depois elevaríamos o aro nas tentativas subsequentes até que estivesse fora da água e o leão marinho teria que saltar para fora da água para passar pelo aro para receber a recompensa. Treinadores de animais tem usado essas técnicas para criar comportamentos espantosamente elaborados, que impressionam os espectadores. A anos atrás havia um popular show de televisão que estrelava Priscilla a porca obstinada. Dentre os truques que ela fazia havia o de ligar o rádio e comer à mesa. Diferente de seus primos da pocilga Priscilla era extremamente limpa e podia demonstrar isso pegando roupas espalhadas pelo chão e as colocando na cesta. Quando lhe era oferecida uma variedade de comidas diferentes ela, com sabedoria, escolhia o produto da companhia que patrocinava o show. Priscilla até participava de um desafio respondendo Capítulo 5 / Aprendizagem / página 19 perguntas feitas pelo auditório, apagando e ascendendo uma lâmpada para sinalizar “sim” ou “não”. Não havia nada de excepcional sobre as habilidades de Priscilla. Como os porcos crescem muito rapidamente, uma nova Priscilla era treinada para substitui-la a cada poucos meses (Breland e Breland 1966). O comportamento humano também pode ser modelado, às vezes contra a vontade. De fato, para seu espanto, muitos pais inconscientemente modelam comportamentos inadequados nos seus filhos. Por exemplo, muitos pais ensinam suas crianças a gritar e fazer manha. Uma mãe preocupada com suas atividades diárias pode ignorar os pedidos silenciosos de seu filho de três anos. Tipicamente a criança eleva a voz um pouco e repete seu pedido, até que a mãe responda. Quando a mãe tiver se ajustado a essa nova intensidade de voz, novamente tenderá a ignorá-lo e só uma nova elevação chamará sua atenção. Daí a criança aprende que a mãe responde mais rapidamente se fizer manha. Essa nova mania irrita ela tanto que ela responde imediatamente, para faze-lo parar. Agora a criança grita e faz manha regulamente. 3. Extinção Quando o reforço é retido a razão de resposta gradualmente diminui da mesma maneira que a força do reflexo condicionado diminui quando o EC (Estímulo Condicionado) for apresentado muitas vezes sem o EI (Estímulo Incondicionado). Esse processo é chamado de EXTINÇÃO. Capítulo 5 / Aprendizagem / página 20 4. Esquema de REFORÇAMENTO Na vida real a recompensa raramente segue cada ato desempenhado. Ao invés disso, a recompensa normalmente é intermitente. Por exemplo, uma abelha melífera só pode obter néctar durante um intervalo limitado de tempo a cada dia, quando uma flor em particular se abre. Assim, uma vez que tiver visitado uma flor, ela terá que esperar um dia até que seja novamente recompensada naquela localidade. A freqüência de oferta de recompensas é chamada esquema de reforçamento. Esquemas parciais de reforço variam tanto a razão entre respostas reforçadas e não-reforçadas, ou o período de tempo entre reforços sucessivos. Alternativamente, a recompensa pode ser dada não periodicamente (Ferster e Skinner 1957). Estudos cuidadosos tem mostrado os efeitos dos esquemas de reforço na força do comportamento. Cada esquema de reforço tem efeitos previsíveis sobre a razão de resposta e sobre o tempo ao longo do qual o animal continuará respondendo quando não mais estiver recebendo o reforço. Acentuaremos apenas alguns exemplos. Um esquema de REFORÇO CONTÍNUO, onde cada ocorrência do comportamento éreforçada, é melhor durante o treino inicial para estabelecer e modelar a resposta. Um esquema de RAZÃO FIXA, onde o animal deve responder um determinado número de vezes antes de receber o reforço, normalmente resulta numa alta razão de resposta porque o indivíduo, em essência, determina a rapidez da recompensa. Quanto mais rápido responder, quanto antes completará o número de respostas necessárias para que receba a recompensa. O esquema de razão fixa de reforço é semelhante ao esquema de pagamento por produtividade na indústria, onde o empregado é pago quando um determinado número de itens for completo. O alto grau de produtividade gerado é a razão que os empregados gostam desse sistema e os Capítulo 5 / Aprendizagem / página 21 sindicatos geralmente se opõe a eles. Num esquema de RAZÃO VARIADA o número de respostas necessárias para a obtenção do reforço varia randomicamente. Isso também gera altas taxas de resposta porque o indivíduo é recompensado pela velocidade da resposta. Além disso a resposta tende a persistir mesmo que a recompensa é retida por algum tempo porque a variabilidade impede que qualquer padrão óbvio de resposta se estabeleça. Um indivíduo jogando num caça-níqueis experimenta um esquema de razão de reforço variado. o caça-níqueis oferece um determinado número de ganhos mas a recompensa é assistemática e variada. Esse tipo de esquema de reforçamento tem sido o culpado do jogo persistente daqueles viciados em jogos de azar. D. APRENDIZAGEM LATENTE Sabemos que a aprendizagem aumenta as chances de repetição de um comportamento. No entanto, de acordo com muitos teóricos da aprendizagem, não deveria haver mudanças na freqüência de ocorrência de um comportamento não reforçado. No entanto, existem situações em que o animal aprende sem recompensa óbvia. Se um rato que não está nem faminto nem sedento é colocado em um labirinto onde não existe recompensa, ele ainda investigará os caminhos, percorrendo os corredores e rastreando seu caminho. Tendo sido permitido a explorar o labirinto, esse rato aprenderá a percorrer esse labirinto em menos tentativas do que os ratos sem experiência quando o alimento é oferecido como reforço (Tlman e Holzik 1930). Claramente o rato aprendeu algumas das características do labirinto durante sua exploração não recompensada, mesmo que o conhecimento obtido não tivesse sido colocado em prática logo imediatamente: Isto é, foi latente. Capítulo 5 / Aprendizagem / página 22 A aprendizagem latente merece sua própria categoria? Thorpe (1963) define isso como “a associação de diferentes estímulos ou situações sem recompensa patente”. A diferença essencial entre a aprendizagem latente e a aprendizagem por ensaio e erro (condicionamento operante) é a ausência de recompensa na aprendizagem latente. No entanto, mesmo que esse aspecto tenha sido discutido por muitos anos (ver revisão em Munn 1950), alguns teóricos da aprendizagem não mais consideram o reforço essencial para a aprendizagem de ensaio e erro, erradicando a diferença entre essas formas de aprendizagem. Hinde, no entanto, os distinguiu dando ênfase na natureza não expressa da aprendizagem latente. Ele sugeriu que tanto a aprendizagem por ensaio e erro quanto a aprendizagem latente envolvem a memorização de características de uma situação, mas somente o primeiro traduz essa maestria pelo desempenho imediato. E. A ADAPTATIVIDADE DA APRENDIZAGEM LATENTE Qualquer maneira de categorizar a aprendizagem latente é acadêmica; a aprendizagem pela exploração é possível e é adaptativas para animais no seu ambiente natural. Por exemplo, um jovem coiote e seus irmãos se aventuram para fora de suas tocas para explorar sob o olhar cuidadoso dos pais. À medida que o fazem se tornam familiarizados com o terreno. Onde estão os bons locais para se encontrar o alimento? Onde estão os refúgios que assegurem a fuga dos predadores? Enquanto andam por aí, olhando e cheirando, ganham um conhecimento detalhado de seu ambiente que aumenta suas chances de sobrevivência posterior. Mesmo que o valor da aprendizagem latente pareça óbvia, estudos laboratoriais tem mostrado que a familiaridade com o terreno é valiosa para a sobrevivência (Metzgar 1967). Pares de ratos dos pés brancos (Peromyscus leucopus) foram libertados em um quarto com Capítulo 5 / Aprendizagem / página 23 uma coruja (Otus asio). Um dos membros da dupla tinha a oportunidade de explorar o recinto por alguns dias antes do teste. O outro rato não teve essa experiência. Em 13 de 17 testes a coruja capturou um rato. Onze destes eram ratos que não exploraram o ambiente, o que claramente mostra que o conhecimento do ambiente aumenta a habilidade de fugir dos predadores. A exploração também pode ter significado funcional na orientação. Um animal que se aventura em viagens longas de forrageio deve ser capaz de retornar para sua casa (figura 5.8). Por exemplo, a vespa escavadeira aprende a localização de sua toca pelos marcos durante o vôo. Isso foi demonstrado pela colocação de um anel de 20 pinhas ao redor da entrada da toca enquanto a vespa estava em seu interior (Tinbergen e Kruyt 1938). Quando ela saiu em sua viagem de caça ela gastou os 6 primeiros segundos sobrevoando a área imediatamente acima da toca. Enquanto ela estava ausente os pesquisadores moveram o anel de pinhas um pé. Quando a vespa retornou com sua presa procurou a entrada da toca no centro do anel. Nesse teste e nos testes subsequentes a vespa se orientou erroneamente pelos marcos, mostrando que a breve exploração da vicinidade da toca era importante para sua habilidade de localiza-la. F. APRENDIZAGEM POR “INSIGHT” Nos desenhos animados uma solução repentina para um problema é indicado por uma lâmpada que se acende sobre a cabeça. As pessoas freqüentemente expressam essa experiência como “a-rá, entendi”. Talvez você pensou sobre o problema por vários dias ou semanas e repentinamente a resposta lampeja na sua mente. Alguns teóricos da aprendizagem chamam isso de aprendizagem por “insight”. É caracterizada pela Capítulo 5 / Aprendizagem / página 24 repentinidade, parece ocorrer rápido demais para resultar de um processo de ensaio e erro (Thorpe 1963). Um exemplo famoso da aprendizagem por insight vem do comportamento dos chimpanzés de Wolfgang Köhler (1927), particularmente um chamado Sultan. Num experimento Sultan primeiro aprendeu a usar uma vara como instrumento para aumentar seu alcance e puxar uma banana que se encontrava do lado de fora da jaula. Tendo dominado esse truque, lhe foi dada uma segunda vara que, quando se juntava a outra, poderia com sucesso alcançar. Sultan tentou, sem sucesso, alcançar as bananas com cada uma das varas separadamente. Até conseguiu até empurrar uma das varas com a outra até encostar nas bananas mas, como as varas não estavam encaixadas, ele não conseguia puxar as bananas. Finalmente parecia ter desistido e começou a brincar com as varas. Mais tarde um lampejo intelectual pareceu ter surgido. Enquanto brincava com as varas (figura 5.9) aconteceu de segurar uma em uma mão e outra em outra, com as extremidades apontadas uma para a outra. Aí ele percebeu que a ponta de uma vara poderia ser colocada dentro da outra vara. Imediatamente correu para a beira da jaula e começou a puxar as bananas. Enquanto puxava as bananas para si as duas varas se separaram. Sultan rapidamente concertou as varas numa evidência de que o chimpanzés compreendia que a junção das duas varas de bambu era uma forma efetiva de aumentar seu alcance para obter frutos. Köhler acreditava que o chimpanzé mostrou um comportamento resultante do insight, sendo capaz de aplicara informação ganha pela experiência de brincar com as varas para resolver o problema de obtenção das bananas. A explicação de Köhler para as habilidades do chimpanzé de resolver problemas era que ele viu novas relações entre eventos, relações que não foram especificamente aprendidas no passado e que era capaz de considerar o problema como um todo e não apenas uma associação tipo estímulo/resposta entre certos elementos do problema. Tem Capítulo 5 / Aprendizagem / página 25 sido sugerido, por exemplo, que os chimpanzés formam uma representação mental do problema e depois aplicam um padrão tipo ensaio-e-erro. Um animal poderia estar “pensando” as respostas possíveis e avaliando a possibilidade de sucesso de cada tentativa com base na sua experiência passada. A solução pode parecer súbita aos observadores porque estes não tem acesso aos processos mentais do animal. Outros pesquisadores explicam a resolução súbita de problemas, como ocorreu nos chimpanzés de Köhler, como resultado de associações entre componentes previamente aprendidos. Tem-se argumentado, por exemplo, que os chimpanzés que moviam caixas e subiam nelas para alcançar a banana tinham previamente adquirido dois comportamentos separados - mover as caixas rumo aos alvos e subir no objeto para alcançar outro objeto. Essa idéia foi testada em pombos. Pombos não costumam fazer nenhuma dessas duas coisas, mas podem aprender a faze-las. Quando uma situação semelhante de aprendizagem por insight foi montada para os pombos se mostrou que somente os pombos que aprenderam ambas ações foram capazes de resolver o problema de alcançar a banana. Em um experimento os pombos eram reforçados por empurrar uma caixa rumo a uma mancha verde no chão, mas não por empurrar a caixa na ausência da mancha verde. Num experimento separado um pombo aprendeu a se sentar em uma caixa para bicar uma banana suspensa acima dela. Os pombos treinados para executar ambas ações foram então colocados em um recinto sem a mancha verde no chão, mas com uma caixa e uma banana pendurados do teto. O comportamento destas aves foi muito semelhante ao dos chimpanzés de Köhler. Mesmo que no início se esticassem e virassem sob a banana, repentinamente empurravam a caixa para debaixo da banana e subiam nela, assim bicando a banana. No entanto, quando os pombos que foram treinados para bicar a banana, mas não para subir na caixa, eram colocados na mesma situação, se esticavam mas nunca alcançavam a banana. Capítulo 5 / Aprendizagem / página 26 Então, aprender a escalar foi um importante componente do comportamento. Outros pombos foram treinados a empurrar uma caixa numa certa direção para receber uma recompensa, mas nunca foram treinados a bicar a banana. Quando essas aves eram colocadas na mesma situação empurravam a caixa pela sala sem rumo, nunca subindo nela para bicar a banana. Assim, aprender a empurrar uma caixa numa determinada direção para receber uma recompensa também era um componente importante da resposta. Concluiu-se portanto que um comportamento aparentemente resultante de insight pode ser construído a partir de relações específicas entre estímulo e resposta (Epstein et al. 1984). Então vemos que mesmo que ninguém discorde sobre a importância da experiência anterior na aprendizagem por insight, existe controvérsia sobre seu papel. Investigações da aprendizagem por insight tem se mostrado difíceis. Por um lado ela ocorre rápido demais para se prever quando ocorrerá. Assim, o experimentador pode facilmente perder o exato momento da iluminação. Além disso, pequenas mudanças na arrumação da situação problema podem grandemente alterar o resultado. Mas um problema ainda maior é a interpretação da observação. Só o que o observador vê é a solução para o problema. É difícil de se saber como o animal chegou àquela solução. Então, a interpretação de comportamento de insight pode levar a controvérsia, como veremos mais tarde nesse capítulo. G. APRENDIZAGEM DE REGRAS Às vezes um animal soluciona um problema num estalo devido à sua experiência anterior com tarefas semelhantes. O animal parece ter aprendido o princípio daquele tipo de problema. Esse tipo de “aprender como aprender” tem sido chamado de aprendizagem Capítulo 5 / Aprendizagem / página 27 de regras. Por exemplo, os humanos realizam a aprendizagem de regras na solução de problemas de matemática quando já resolveram problemas do mesmo tipo. Como ilustração da aprendizagem de regras nos referimos aos experimentos de Harry Harlow (1949). Harlow repetidamente apresentou a um macaco dois objetos, cada um colocado sobre um orifício onde podia ser colocado comida. Somente um dos orifícios continha comida. A posição dos objetos era alterada randomicamente, mas o macaco rapidamente aprendia qual o objeto que cobria a comida. Depois disso dois novos objetos eram introduzidos e mais uma vez o macaco tinha que aprender qual objeto cobria a comida. A cada novo desafio o macaco aprendia mais depressa. Depois de várias centenas de testes no problema de discriminação de objetos o sujeito era capaz de escolher o objeto recompensador depois da segunda tentativa em 97 por cento dos casos (figura 5.10). O macaco havia adotado a estratégia vencer-ficar, perder-mudar: se o objeto é recompensador, permaneça com ele, se não for, escolha o outro e permaneça com ele. O macaco havia formado uma regra de aprendizagem. Uma variação desse experimento de aprendizagem de regras é o problema das inversões repetidas. Nesse caso, se os objetos a serem discriminados forem um círculo e um quadrado, talvez a escolha do quadrado fosse recompensada até que a associação seja feita e depois a escolha do círculo passaria a ser recompensada. Quando o animal aprendesse a escolher o círculo o quadrado passaria a ser a escolha correta. A estratégia para esse tipo de problema seria ganhar-mudar, perder-ficar. A habilidade para formar uma regra de aprendizagem seria adaptativa. Na vida real o animal se depara com uma variedade de problemas que deve aprender a solucionar. Muitos desses são variações desse tema, como as tentativas nos experimentos de aprendizagem de regras aqui descritos. A aprendizagem de regras reduziria tremendamente a quantidade de tempo gasto na solução de problemas semelhantes separadamente. Capítulo 5 / Aprendizagem / página 28 H. APRENDIZAGEM SOCIAL Alguns organismos são capazes de aprender com outros. A possibilidade de aprendizagem dessa maneira é bem maior nas espécies sociais porque passam mais tempo próximos uns aos outros. Pensa-se que a aprendizagem social pela observação e imitação seja a base de muitos comportamentos humanos (Bandura 1962; Meltzoff 1988). Talvez você tenha muitos exemplos disso na sua própria família. Por exemplo, uma criança pode imitar a técnica de cuidado dos pais aos irmãos mais novos, passando a manusear a boneca daquela mesma maneira. O valor adaptativo da aprendizagem social é claro. Economiza tempo e energia que poderiam ser desperdiçados se o indivíduo tivesse que aprender sobre a sobrevivência por ensaio e erro. Indivíduos de algumas espécies, como os ratos noruegueses (Ratus norvegicus) por exemplo, aprendem o que e quando comer através dos membros de sua espécie (Galef 1990). Outros podem aprender a evitar situações perigosas observando seus companheiros. Por exemplo, macacos rhesus (Macaca mulatta) podem aprender a temer cobras e evita-las pela observação de outros indivíduos que exibem medo de cobras (Mineka e Cool 1988). Então vemos que mesmo que a população tenha a capacidade de aprender respostas apropriadas por si mesma, é mais eficiente e menos perigoso que se aprenda sobre o mundopelos outros (Galef 1976). Em outros casos as interações com adultos é critica para que os jovens aprendam o comportamento apropriado. Um exemplo disso seria o juvenil da carriça (Thryomanes bewicki) que aperfeiçoa as emissões rudimentares do canto que utiliza na defesa territorial através do contracanto com machos vizinhos (Kroodsma 1974). Capítulo 5 / Aprendizagem / página 29 Muitas observações de pássaros e mamíferos na natureza parecem envolver a aprendizagem social. Alguns dos exemplos mais comumente citados envolvem tradições, comportamentos aprendidos que aparecem em um entre centenas de grupos de uma única espécie no seu ambiente natural. Por exemplo, uma tradição se iniciou na Inglaterra por volta de 1921, quando certos pássaros aprenderam a romper os lacres das garrafas de leite para roubar a nata, que naqueles dias flutuava. Essa técnica se espalhou pelo continente e várias aves adquiriram o hábito (Fisher e Hinde 1949, figura 5.11). Existem muitos exemplos de hábitos que se espalham por entre grupos de primatas. Jane van Lawick- Goodal (1968) observou jovens chimpanzés na natureza aprendendo a usar gravetos para retirar cupins dos buracos, imitando suas mães e outros adultos. Além disso, um chimpanzé do Delta Primate Center, em Louisiana, E.U.A. brincou com varas durante vários anos antes de descobrir que poderia escora-las na parede para subir e ter acesso a objetos na prateleira. Outros logo aprenderam esse novo truque. Os chimpanzés podiam inclusive evitar fios elétricos, colocados ao redor das árvores, para subir e comer folhas. Mesmo que observações como estas sejam freqüentemente interpretadas como exemplos de aprendizagem social, não devemos nos precipitar a concluir isso. Tem havido discordância sobre os mecanismos de desenvolvimento de um dos exemplos mais citados de aprendizagem social, o hábito dos macacos japoneses lavarem comida. Como diz a estória, uma jovem fêmea chamada Imo desenvolveu técnicas para tratar as batatas e o trigo oferecidos pelos pesquisadores que estudavam seu comportamento social. Primeiro Imo descrobriu que lavar as batatas no mar não só limpava as batatas mas lhes dava um melhor sabor, levemente salgado (figura 5.12). Um dos companheiros de Imo a observou e imitou. Depois disso foi a mãe dela quem aprendeu. Assim a tradição se espalhou, normalmente do jovem para a mãe e irmãos. Quando as jovens se tornavam mães seus filhotes imitavam seu comportamento como se o alimento sempre tivesse sido lavado daquela maneira. Capítulo 5 / Aprendizagem / página 30 Muitos anos depois Imo iniciou um novo costume. Os pesquisadores espalhavam trigo na areia e os macacos tinham que laboriosamente catar cada grão. Um dia Imo jogou uma mão cheia de areia e trigo na água. A areia afundou e o trigo flutuou e ela pode pega- lo facilmente da superfície. Esse truque também foi logo aprendido pela maioria dos macacos da tropa ao longo dos próximos anos (Kawai 1965; Kawamura 1959). Outros processos, que não a aprendizagem social, tem sido utilizados para explicar a difusão do comportamento de lavar batatas. Os cuidadores dos macacos podem ter inadvertidamente recompensado o lavar das batatas. A única fonte de batatas era os cuidadores. Como o lavar das batatas interessava aos pesquisadores a aos turistas os cuidadores davam mais batatas àqueles macacos que o faziam. O reforço diferencial pode ter mantido o comportamento. O hábito pode ter se espalhado porque os macacos próximos aos que lavavam as batatas (que por coincidência provavelmente eram parentes) também estavam próximos aos cuidadores e à fonte de recompensa (Green 1975). Mesmo que o hábito tenha claramente se espalhado pela população, não se sabe se os macacos japoneses aprenderam a lavar as batatas pela imitação ou porque foram treinados a faze-lo pelos cuidadores. Algumas tradições são devido à aprendizagem social, mas não porque o indivíduo observou o outro realizando a atividade para depois imitá-lo. Como veremos no capítulo 8, os ratos podem aprender a preferência dietética de outros ratos. Eles aprendem o que comer, não pela observação aos outros, mas cheirando seu hálito. Em um experimento um rato “demonstrador” ingeriu uma comida com cacau e canela. O demonstrador foi então anestesiado e colocado a 2 polegadas da gaiola de um rato “observador” acordado. Mesmo que o demonstrador tenha dormido durante a demonstração o observador posteriormente demonstrou a preferência pelo alimento ingerido pelo demonstrador (Galef 1990). Capítulo 5 / Aprendizagem / página 31 Surpreendentemente existem poucos exemplos de animais que aprendem a fazer algo só por ver outros fazerem. Num desses exemplos pássaros aprenderam uma técnica específica de remoção da cobertura de um prato de comida. Nesse experimento um pássaro observava um demonstrador retirando a tampa de uma entre três maneiras: usando os pés, bicando ou puxando com o bico. Quando oferecidos um prato de comida semelhante o observador utilizava a mesma técnica que havia observado (Dawson e Foss 1965; Galef, Manzig e Field 1986). I. BRINCADEIRA Brincar é divertido. Reconhecemos uma brincadeira quando a fazemos ou quando vemos outro animal fazendo (figura 5.13). Normalmente podemos prontamente identificar animais brincando. Durante uma visita ao zoológico até reconhecemos brincadeiras em espécies que nunca havíamos visto. Isso é verdade mesmo que diversas formas de comportamento sejam classificadas como brincadeira. Um tipo de brincadeira é a simulação de luta ou perseguição. Todos nós já nos fascinamos com os ataques amistosos de gatinhos e cãezinhos que perseguem, lutam e pulam uns sobre os outros. Um segundo tipo de brincadeira é o exercício. Potros galopam levantando bem os cascos. Jovens primatas, incluindo os humanos, podem balançar e rolar de um lado para o outro. Infantes de gorilas da montanha gostam de escorregar. Começam a fazer isso no corpo de suas mães e depois passam para ladeiras e troncos. Filhotes de ursos polares sobem no gelo só para pular de volta na água. A terceira forma de brincadeira é a manipulação de objetos. Quando um animal jovem se depara com um objeto novo tipicamente o explora apalpando, cheirando ou o olhando de diferentes ângulos. Depois da investigação sensorial inicial o objeto poderá se Capítulo 5 / Aprendizagem / página 32 tornar um brinquedo (Fagan 1981). Seja qual for a forma de expressão da brincadeira, o atributo que caracteriza todas as suas formas e o identifica é o nosso julgamento de falta de seriedade. Mesmo que seja fácil identificar uma brincadeira, é difícil defini-la. Uma razão para que a brincadeira dificulte uma definição simples é a falta de um padrão específico de comportamento, ou uma série de atividades, que exclusivamente caracterize a brincadeira. As brincadeiras emprestam partes de outros padrões de comportamento, normalmente seqüências incompletas e freqüentemente exageradas. As características chave do comportamento de brincar que devem ser incluídas em qualquer definição são: 1. Mistura de atos de tipos de comportamentos funcionalmente distintos. A brincadeira consiste de elementos retirados de outros padrões de comportamento, justapostos em novas seqüências. Gatos do mato e martas rapidamente alternam movimentos de captura de presas com comportamentos agressivos. Durante suas brincadeiras de luta os oponentes podem inverter os papéis de forma que o animal submisso experimente a dominância e vice-versa (Eibl-Eibesfeldt 1956). Um mangusto ao brincar mistura componentes dos comportamentos de caça e sexual (Rensch e Ducker 1959). 2. Seqüências incompletas. No seu contexto normal os comportamentos temvárias ações que se seguem de forma previsível. Um gato adulto normalmente negaciaria um rato para depois atacá-lo, mas o gatinho brincalhão simplesmente saltará em cima de uma folha. Um filhote de macaco rhesus montará seu companheiro sem intromissão. A luta de gatos do mato não inclui as formas extremas de ataque (“mordidas persistentes no pescoço” e “ataques laterais”), ou as duas respostas extremas de medo (“ameaça defensiva” ou “gritos”) (Poole 1966). Quando um cão é agressivo mostra os dentes e rosna. Seus pelos ficam eriçados, acentuando sua aparência feroz. No entanto, numa brincadeira de luta o rosnado não é acompanhado do eriçamento dos pelos. Mas, porque os animais brincam? Em outras palavras, qual a função dessa atividade? As hipóteses da importância a longo prazo da brincadeira podem ser agrupadas em três categorias (Bekoff e Byers 1981). Capítulo 5 / Aprendizagem / página 33 1) Fisiológico: treino físico para força, resistência e coordenação muscular. 2) Social: Prática de habilidades sociais como a catação e comportamento sexual, importantes no estabelecimento de laços sociais. 3) Cognitivo: Aprendizagem de habilidades específicas ou melhoria das habilidades perceptuais em geral. Como o enfoque desse capítulo é na aprendizagem nos concentraremos no que os animais podem aprender através da brincadeira. Os animais aprendem bastante enquanto manipulam os objetos como se fossem brinquedos. Lembre-se que o chimpanzé de Köhler, Sultão, não descobriu como recolher a banana fora de alcance até que tivesse brincado com as varas. Foi durante a brincadeira que o chimpanzé no Delta Primate Center aprendeu a usar a vara para saltar, uma habilidade posteriormente utilizada para alcançar folhas nas árvores altas ou fuga do confinamento. A informação obtida pela manipulação dos “brinquedos” pode fornecer a experiência que será usada na aprendizagem por insight. Uma hipótese comum para a função adaptativa da brincadeira é que ela dá ao animal a oportunidade de praticar habilidades que lhe serão essenciais para a sobrevivência no futuro (Caro 1988). Jogos de caça, por exemplo, podem ajudar a aperfeiçoar os movimentos de captura de presas como: perseguir, derrubar e sacudir a presa. Alguns exemplos dessas ações são familiares. Gatinhos perseguem bolas e saltam sobre folhas. Cãezinhos perseguem pedaços de pau e freqüentemente os sacodem como se fossem presas. Mesmo a mordida no pescoço, utilizada para matar presas, pode ser praticada na brincadeira. Por exemplo, a mordida da suricata no pescoço (um viverídeo da África do Sul, aparentado ao mangusto) é o mesmo quer o animal esteja brincando, copulando ou matando uma presa (Eibl-Eibesfeldt 1975). Capítulo 5 / Aprendizagem / página 34 A brincadeira de luta dos animais jovens pode ser a prática para as batalhas dos adultos, que estabelecem as hierarquias de dominância e defesa territorial. Na fúria das brincadeiras de luta não ocorrem mordidas sérias ou comportamentos de ameaça. O grito do gato do mato, mordido intencionalmente pelo oponente, inibirá a continuidade da agressão (Eibl-Eibesfeldt 1975). Animais maiores, mais velhos e mais dominantes se diminuem para brincar com companheiros mais fracos. Suas habilidades e força são equiparados aos do parceiro (Fagan 1981). Alguns animais também parecem praticar a defesa territorial. Irenaus Eibl-Eibesfeldt (1975) tinha gatos do mato mansos que defendiam cestos de lixo e se escondiam debaixo de cobertores para saltar sobre companheiros que passavam. Jovens cervos e cabras lutam pela posse de uma área num jogo parecido com o “rei da montanha” (Darling 1937). Mesmo que freqüentemente seja sugerido que a função adaptativa da brincadeira seja de ajudar no desenvolvimento das habilidades adultas de predação e luta, essa hipótese ainda não foi comprovada. Muitas observações de brincadeiras, inclusive as aqui mencionadas, sugerem que a forma e a sincronia das brincadeiras dos animais são como esperaríamos pelas funções da brincadeira. Em outras palavras, às vezes parece que a brincadeira foi desenhada para essa função específica. O “argumento pelo desenho” talvez seja a melhor abordagem para sustentar as evidências que temos. Outras abordagens, como a alteração experimental da experiência de brincar na tenra idade, ou a busca de correlações entre as variações naturais de brincar dentro da população e as expressões de outros tipos de comportamento, tem falhado em nos fornecer uma resposta clara. Por exemplo, num estudo a freqüência da brincadeira social em quatro filhotes de coiote (Canis latrans) foi registrada quando estes tinham entre 20 e 34 dias. Diferenças entre filhotes na quantidade de tempo que gastavam brincando foram analisadas. Durante os próximos 10 dias cada filhote teve 10 minutos para capturar um rato vivo. A medida de Capítulo 5 / Aprendizagem / página 35 sucesso predatório foi, portanto, o número de tentativas em que o rato foi morto. Não houve correlação entre o grau de brincadeira e sucesso predatório (Vincent e Bekoff 1978). No entanto, existem problemas com esse estudo e os resultados não são conclusivos (Martin e Caro 1985). Primeiro, uma amostra de quatro animais é muito pequena para se assegurar uma correlação significativa, que poderia ter sido encontrada se mais filhotes fossem estudados. Segundo, as diferenças naturais de brincadeira podem ser causados por fatores adicionais que não foram considerados. Terceiro, a medida de sucesso predatório, se o rato foi morto ou não, é tão grosseira que pode ter ignorado diferenças nas habilidades predatórias entre os filhotes. Quarto, sucesso predatório foi determinado apenas dias após a experiência de brincar, talvez cedo demais para os efeitos da brincadeira se tornarem aparentes. Então, vemos que a questão das funções adaptativas da brincadeira ainda está aberta. IV. Estudos da cognição e aprendizagem animal No início dos anos 80 alguns cientistas começaram a pensar se os animais possuíam experiências mentais - pensamentos e sentimentos, por exemplo (Bateson e Klopfer 1991; Griffin 1981, 1982, 1984; Hoage e Goldman 1986; Mellgren 1983; Ristau 1991). Mas como saberíamos se os animais pensam ou se estão conscientes? Alguns cientistas acreditam que os estudos da aprendizagem podem iluminar algumas questões sobre cognição animal, então reconsideraremos alguns dos estudos discutidos. Anteriormente, neste capítulo, a natureza controvertida da interpretação da aprendizagem por insight foi mencionada. Porque isso é controvertido? Como vimos, alguns pesquisadores acreditam que a aprendizagem por insight mostra que o animal está “pensando” e pode-se dizer que um animal que pensa sobre objetos ou eventos Capítulo 5 / Aprendizagem / página 36 experimenta um nível simples de consciência (Griffin 1991). Um animal que pensa também deve formar representações mentais de objetos e eventos. Portanto, o insight tem sido utilizado como evidência da consciência animal ou cognição. Mas nem todos concordam que os animais, nem mesmo alguns, podem estar conscientes. Alguns talvez aceitem a idéia de consciência nos chimpanzés, mas não nos pombos. No entanto, no experimento descrito anteriormente, se o chimpanzé solucionou o problema pensando, o pombo também não estava? Alguns pesquisadores sugerem que a habilidade de formar regras de aprendizagem pode ser evidência de consciência. De acordo com Harlow (1949) a formação de regras de aprendizagem “transforma o organismo que se adapta através de ensaio e erro a um ambiente que se modifica, em um que se adapta pela derivação de hipóteses e insight”. A aprendizagem de regras, diz ele, “são o mecanismo que,em parte, transforma o organismo de um robô de respostas condicionadas para uma criatura razoável e racional”. Indivíduos de algumas espécies tem sido capazes de aprender certos conceitos (idéias abstratas). Certamente isso deve mostrar que animais formam representações mentais de eventos e objetos. Pombos (Columba livia) são capazes de formar conceitos naturais como “árvore” ou “água” ou “humano”. Eles reconhecem água de várias formas, por exemplo, uma gota, um rio, um lago (Hernstein, Loveland e Cable 1976; Mallot e Siddall 1972; Siegel e Honig 1970). Somente um animal não humano tem demonstrado a habilidade vocal de formar conceitos. Esse indivíduo é Alex, o papagaio africano (Psittacus erithacus) (figura 5.14). Todos sabemos que os papagaios podem ser treinados a falar, mas a maioria de nós julgaríamos que esses estariam imitando os treinadores. Isso certamente não é verdade para Alex. Ele tem aprendido a identificar, pedir, recusar ou comentar a respeito de mais de 80 objetos diferentes. Mais ainda, ele tem usado a linguagem para mostrar que compreende Capítulo 5 / Aprendizagem / página 37 certos conceitos. Um desses conceitos é quantitativo. Ele pode nos dizer quantos itens existem em um grupo com até seis itens comuns (Pepperberg 1987a). Talvez mais surpreendente seja sua habilidade de compreender as idéias de equivalência ou diferença, uma habilidade que se pensava ser uma característica humana e talvez de alguns primatas mais aparentados a nós (Premack 1978). Alex demonstrou que compreendia os conceitos em experimentos onde era mostrado dois objetos de cada vez. Os objetos diferiam em uma de três qualidades: cor, forma ou material. Poderia lhe ser mostrado um pentágono de couro amarelo e um pentágono de madeira cinza, ou um triângulo de madeira verde e um triângulo de madeira azul. Se lhe fosse perguntado “o que é igual?” ou “o que é diferente?” se esperaria que a resposta correta para a primeira pergunta fosse o nome da categoria com a característica semelhante. No primeiro dos exemplos citados ele deveria responder “forma” e não “pentágono”. No segundo exemplo ele deveria responder “cor” e não “verde”. Quando apresentado a objetos que já havia visto antes, Alex corretamente identificou as características que eram iguais ou diferentes em 76.6 porcento dos casos. Quando lhe eram mostrados pares de objetos que nunca havia visto antes acertava em 85 porcento das vezes, identificando a característica que era diferente ou igual (Pepperberg 1987b). Os experimentos com Alex sugeriram que não primatas podem aprender conceitos e que deveríamos continuar nossos esforços para compreender como as outras espécies lidam com idéias. E a brincadeira? Os animais estão realmente se “divertindo”? Tenha essa questão sobre cognição animal em mente à medida que você se tornar mais familiar com aspectos do comportamento animal. Retornaremos novamente a esse assunto, especialmente na discussão da comunicação animal. Capítulo 5 / Aprendizagem / página 38 V. Sumário Mesmo que a aprendizagem não caiba em categorias distintas e a aprendizagem que ocorre na natureza não caiba nessas categorias limitadas, às vezes a categorização ajuda a enfatizar as características únicas de certos modos pelos quais a aprendizagem ocorre. Alguns casos comuns são: 1. Habituação. O animal aprende a não responder a estímulos específicos porque estes freqüentemente são encontrados, não levando a conseqüências importantes. A perda da responsividade pode ser distinguida da adaptação sensorial e da fadiga muscular. A habitação é adaptativa porque conserva a energia e deixa mais tempo livre para outras atividades importantes. 2. Condicionamento clássico. O animal aprende a dar uma resposta normalmente eliciada por um estímulo (estímulo incondicionado) frente a um novo estímulo (estímulo condicionado). Se o EC for apresentado várias vezes sem o EI a resposta ao novo estímulo será gradualmente perdida. Isso é chamado extinção. 3. Condicionamento operante. A freqüência de alguma ação aumenta porque é reforçada. Comportamentos novos podem ser introduzidos no repertório através da modelagem. Durante a modelagem o reforço se torna contingente a aproximações sucessivas à ação desejada. Algumas vezes nem todas as respostas são reforçadas. A freqüência pela qual a recompensa e distribuída é chamada de esquema de reforçamento. Capítulo 5 / Aprendizagem / página 39 4. Aprendizagem latente. A aprendizagem latente ocorre sem qualquer reforço óbvio até algum tempo posterior da vida. A informação obtida pela exploração é um exemplo disso. 5. Aprendizagem por insight. Esse tipo de aprendizagem ocorre rapidamente e sem respostas óbvias de tentativa e erros. O sujeito aprende a solucionar problemas mais rapidamente porque tem a idéia do princípio que rege o problema como resultado de sua experiência com outras tarefas semelhantes. 6. Aprendizagem de regras. Durante a formação de uma regra de aprendizagem o animal está aprendendo como aprender. O sujeito parece aprender a problemas mais rapidamente o problema por já ter uma idéia do princípio do problema, resultante da experiência com tarefas semelhantes. 7. Aprendizagem social. O animal aprende com os outros. A aprendizagem social pode ocorrer pela observação do comportamento de outros, mas também pode ocorrer de forma mais simples. Alguns costumes se espalham rapidamente pela população de animais pela aprendizagem social, mas algumas tradições podem surgir pela aprendizagem individual. 8. Brincadeiras. A brincadeira é expressa de uma variedade de maneira: lutas simuladas, perseguição, exercício e manipulação de objetos. As hipóteses sobre a função da brincadeira pode incluir que a melhoria da condição física, que são importantes para o desenvolvimento das habilidades e laços sociais e que ajudam os animais a aperfeiçoarem suas habilidades. Capítulo 5 / Aprendizagem / página 40 Muitos cientistas tem pensado se os animais possuem experiências mentais. Alguns experimentos de aprendizagem podem estar apoiando a idéia de que os animais formam representações mentais de objetos externos ou eventos e que podem formar conceitos.
Compartilhar