Buscar

Esquemas de Reforçamento

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

REFORÇO
Para o Behaviorismo, segundo Skinner (2009), o comportamento é toda a ação observável e pode ser medido. O homem é visto como um organismo que responde a estímulos provenientes do meio exterior, e que aprendizagem é considerada como uma forma de condicionamento, resultado de condicionamento, resultado de associações entre estímulos e respostas que podem ser reforçadas ou inibidas. Sendo assim, para Skinner (2009) pode-se modelar o indivíduo condicionando-o a reagir a determinado estímulo do ambiente (condicionamento operante).
Com base na noção de comportamento apresentada anteriormente, pode-se dizer que os organismos se comportam, principalmente para operar sobre o meio em que estão. Como visto, o comportamento operante tem consequências que influenciam na apresentação futura dele, podendo ser apresentado mais ou menos vezes, dependendo da função que se estabelece entre uma resposta e sua respectiva consequência. As consequências que aumentam a probabilidade de ocorrência dos comportamentos são chamadas de reforço (Moreira e Medeiros, 2007). Porém, é importante ressaltar que os estímulos só serão entendidos como reforçadores ou aversivos de acordo com a função que cada organismo estabelece em suas relações comportamentais, de modo que aquilo que é reforçador para certas pessoas pode ser aversivo a outras e vice-e-versa. Assim, qualquer estímulo consequente que provoca o aumento da frequência de um determinado comportamento pode ser entendido como reforçador. O comportamento de um menino, por exemplo, de fazer a tarefa de casa pode ser reforçado toda vez que ele é elogiado pela ação realizada, sendo o elogio o reforço (consequência) para que o menino faça mais vezes a tarefa de casa.
Segundo Moreira e Medeiros (2007), o reforço pode ser positivo ou negativo, sendo o primeiro referente a apresentação de um estímulo ao organismo que aumente a probabilidade de um comportamento ser emitido, ou seja, se refere à adição de um estímulo – como receber uma promoção no trabalho em função do esforço, solucionar um problema recorrente, ganhar um chocolate, entre outros. Já o reforço negativo é a consequência de não apresentação de um estímulo aversivo ao organismo – como evitar uma briga de namorados, não ser atropelado ao olhar a sinalização de trânsito, não apanhar quando se lava a louça, entre outros. Como no exemplo já citado, o menino, quando elogiado, foi reforçado positivamente, o que elevará a probabilidade de ele fazer a tarefa de casa no futuro (emitir mais vezes a resposta). Agora, caso o comportamento de fazer a tarefa (lavar a louça) tenha como consequência a não apresentação do castigo por parte da mãe dele, ocorre uma contingência de reforçamento negativo, pois a frequência do comportamento (fazer a tarefa) poderá aumentar em função de evitar o estímulo aversivo (apanhar). Em algumas situações, as consequências, ao contrário dos casos de reforço, provocam a diminuição da frequência dos comportamentos emitidos. Os processos pelos quais a probabilidade de ocorrência de uma determinada resposta diminui em função de uma consequência aversiva apresentada previamente a ela são chamados de punição (Moreira e Medeiros, 2007). Tais processos são classificados também como positivos – diminuição da frequência de uma resposta devido a apresentação de um estímulo aversivo – e negativos – diminuição da frequência de uma resposta através da retirado de um estímulo reforçador. De acordo com Moreira e Medeiros (2007) a punição é um exemplo do que estabelece o que é chamado em Análise do Comportamento de controle aversivo, que é a aplicação da punição para o controle dos comportamentos emitidos por um organismo, o que propende a gerar mudanças comportamentais mais significativas em relação à rapidez em que elas ocorrem, que tende a ser maior do que no processo de reforço. No esquema de reforço Intermitente de Razão Fixa e Reforço Intermitente de Razão Variável o sujeito não sabe quando ocorrerá o reforço e isto faz com que ele trabalhe de forma mais constante em busca deste reforço. Nestes dois tipos de reforçamento a obtenção do reforço depende do sujeito, pois sabendo ou não o número de comportamentos que se deve apresentar esta frequência não muda, somente pode variar o número de comportamentos de um reforço para o outro, e devido a isto dependerá do esforço do sujeito. Reforço intermitente, segundo Moreira e Medeiros (2007), necessita de um número variável de respostas para que o reforçador fique disponível, já que nem todas as respostas são seguidas de reforço. Para Moreira e Medeiros (2007), no reforço intermitente de razão fixa o número de respostas exigido para a apresentação de cada reforçador é sempre o mesmo, para ter o seu comportamento reforçado, o organismo deve emitir um número fixo de respostas. No reforço intermitente de razão variável, para Moreira e Medeiros (2007), o número de resposta varia, isto é, a resposta entre cada reforçador se modifica. Dessa forma podemos dizer que quando o reforço é constante é chamado de “reforçamento contínuo” e quando o reforço é alternado se diz, “reforçamento intermitente de razão fixa (quando é necessário o mesmo número de vezes de repetição do mesmo comportamento para o sujeito conseguir o reforço) ou razão variável (quando existe um número instável de repetição do comportamento para que ocorra o reforço)”.
 Esquemas de Reforçamento
Segundo Moreira e Medeiros (2007), os esquemas de reforçamento são combinações de contingencias de reforçamento que particularizam uma relação de dependência entre a quantidade de respostas ou sua distribuição temporal, e a quantidade de reforços produzidos por essas respostas. De acordo com Ferster e Skinner (1957) esquemas de reforçamento são regras que especificam as relações entre respostas e reforços. Uma contingencia é uma relação de dependência entre eventos (tipo: se..., então...). Nesse sentido, o termo “contingencia” é mais geral que o termo “esquema de reforçamento” de modo que podemos dizer que os esquemas são exemplos de contingencia de reforçamento.
O estudo dos esquemas de reforçamento, Moreira e Medeiros (2007), é muito importante para compreendermos como alguns de nossos repertórios são mantidos e com que aplicação nos engajamos em determinadas atividades em detrimento de outras. Quando um esquema de reforçamento especifica que todas as respostas de uma determinada classe operante serão reforçadas (um reforço para cada resposta) nomeamos o esquema de esquema de reforçamento contínuo ou CRF (Continuous Reinforcement). Esse é um esquema que produz uma taxa alta de respostas, mas apesar de produzir frequência alta e contínuas de respostas, o organismo submetido ao esquema CRF para de trabalhar por algum tempo cada vez que recebe um reforço. Esse é o fenômeno conhecido por “pausa pós-reforçamento” que levou alguns pesquisadores a levantarem a hipótese de que o reforço, além de produzir um aumento na probabilidade de ocorrência futura de resposta reforçada, teria uma função inibitória imediata sobre essa resposta e outras da mesma classe operante. Na nossa vida cotidiana é raro o esquema de reforçamento contínuo. 
Para Moreira e Medeiros (2007), muito mais comum são os esquemas de reforçamento intermitente, nos quais, mais de uma resposta ou uma determinada distribuição temporal das respostas é necessária para que haja reforçamento. Há, portanto, duas bases para a definição dos esquemas de reforçamento intermitente: a quantidade de respostas emitidas ou a passagem do tempo. Quando o reforçamento depende da emissão de um determinado número de respostas, dizemos que o esquema é de Razão. Quando a resposta só é reforçada após a passagem de intervalos de tempo fixo (invariáveis) dizemos que o esquema é de intervalo fixo. Quando o intervalo de tempo que é necessário transcorrer para que a resposta seja reforçada é variável, dizemos que o esquema é de intervalo variável, o reforçamento se torna mais provável a medida em que o tempo pass. A quantidade de respostas que osujeito emite durante o intervalo não altera a probabilidade de reforçamento. Essa é uma importante característica dos esquemas de intervalo. Segundo Moreira e Medeiros (2007), é significativo ressaltar, que o reforçamento nos esquemas de intervalo só ocorre após uma resposta emitida depois que se encerra o intervalo (fixo ou variável). Nos esquemas de intervalo fixo e intervalo variável a contingencia de reforçamento em vigor para uma dada resposta não é sinalizada, e o indivíduo exposto a um esquema de reforçamento de intervalo tem uma única dica ambiental sinalizando a probabilidade de reforço para cada resposta especificada: a passagem do tempo. Isso significa que a frequência da resposta vai se adaptando ao esquema à medida que o sujeito é exposto a ele. Emitindo a resposta, ela é algumas vezes reforçada, outras vezes não. Se nenhuma resposta ocorrer, nunca ocorrerá reforçamento, mesmo que passe mais tempo do que o especificado para que uma resposta, se emitida, seja reforçada. Para Moreira e Medeiros (2007), no esquema de reforçamento em intervalo variável, a contingencia pode especificar a qualquer tempo que a próxima resposta será reforçada. Responder depressa ou devagar não afeta a frequência de reforço. Se houver pausas longas, (a frequência máxima de reforços é alcançada quando uma resposta ocorre sempre logo depois que cada reforço fica disponível de acordo com o esquema programado). Assim, quando exposto a um esquema de intervalo variável, o sujeito tende a emitir as respostas regularmente, sem muita pressa, mas, também, sem muita pausa entre as respostas.
Com longa exposição a um esquema, a frequência da resposta tende a se adaptar de forma bastante típica.
No esquema de intervalo fixo (IF), é normal que ocorra uma pausa mais ou menos longa, um período sem emissão de respostas, após cada reforçamento, seguida de um “jorro” de respostas (um número grande de respostas emitida em um tempo curto) durante a parte final do intervalo, que vai até o final do mesmo, quando o reforço fica disponível e, então, a primeira resposta a ocorrer é reforçada (Moreira e Medeiros, 2007). 
 O registro cumulativo das respostas de pressão a barra emitidas por um rato privado de alimento e exposto aos esquemas de intervalo tende para as formas mostradas na figura a seguir:
Figura 1 – Registro cumulativo das respostas de pressão a barra mantidas sob esquema de reforçamento por intervalo, em ratos como sujeitos. O gráfico a esquerda apresenta dados em esquema de IF e da direita IV (Ellen P. Reese, 1075).
Segundo Ellen P. Reese (1975), quando o reforçamento depende do número de respostas desde o reforço anterior, dizemos que o esquema é de Razão. Como o nome indica, este esquema estabelece uma porção (razão) entre o número de respostas dadas e o número de reforços. Aqui, como no caso dos esquemas em intervalo, também temo Razão Fixa, se o número de respostas exigidas para o reforçamento é sempre o mesmo (designado por RF, de Fixed Ratio), e Razão Variável, se o número de respostas varia de um reforçamento para o outro (designada por RV, de Variable Ratio). Uma característica importante dos esquemas de razão é o fato de que o reforço se torna mais provável a medida que as respostas são emitidas, não importando o intervalo de tempo em que isso é feito. Isso quer dizer que se o sujeito trabalha mais, ele obtém mais reforços. O número (fixo ou médio) de respostas exigida para reforçamento ou de intervalo de tempo (fixo ou médio) entre cada reforçamento é indicado por índices numéricos colocados após a abreviatura do nome do esquema. Assim IV 30s se refere a um esquema de intervalo variável, no qual o reforço fica disponível por 30 segundos, em média desde o último reforçamento; RF 10, a uma razão fixa, no qual o reforçamento ocorre para cada décima resposta após a última resposta reforçada.
. 
 
 
DE 14 PÁGINAS

Continue navegando