Capítulo do Livro

Alfabetização e Letramento na Educação Infantil

•
FAMAC

Lueny
24/01/2024
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 22 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 22 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 22 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Alfabetização e Letramento na Educação Infantil

404 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
SÉRIE A. 
CONTEÚDO 
QUE 
ENVOLVE.
Livros-texto diferentes de tudo que você já viu, criados a partir de pesquisas feitas 
com um só objetivo: descobrir a melhor forma de despertar o interesse 
e envolver os estudantes com o conteúdo. A Série A é uma solução inovadora, 
que quebra paradigmas e melhora o processo de aprendizado.
PSICO
P
S
IC
O
PSICOLOGIA:
O que ela pode
fazer por você
O cérebro dos
homens é diferente 
do das mulheres?
Envolva-se!
Aprenda sobre comportamento
Qual é o SEU estilo de memória?
PSICOLOGIA
www.grupoa.com.br
31789_capa_ultima.indd 1 09/05/12 10:34
Catalogação na publicação: Fernanda B. Handke dos Santos – CRB 10/2107
P974 Psico [recurso eletrônico] / [Tanya Renner ... et al.] ; tradução: 
 Marcelo de Abreu Almeida ; revisão técnica: Silvia H. 
 Koller. – Dados eletrônicos. – Porto Alegre : AMGH, 2012.
 Editado também como livro impresso em 2012.
 ISBN 978-85-8055-093-1
 1. Psicologia. I. Renner, Tanya.
CDU 159.9
124 • PSICO
A aprendizagem é uma mudança relativamente permanente 
no comportamento acarretada pela experiência. Desde o início 
de sua vida, os seres humanos primam pela aprendizagem. As 
crianças exibem um tipo primitivo de aprendizagem chamado 
de habituação, definido por psicólogos como a diminuição 
na resposta a um estímulo após repetidas apresentações do 
mesmo estímulo. Crianças pequenas, por exemplo, podem, no 
início, demonstrar interesse em um estímulo novo, tal como 
um brinquedo colorido, mas logo perdem o interesse se veem 
o brinquedo com muita frequência. A habituação nos permite 
ignorar coisas que pararam de fornecer novas informações. 
Os adultos também exibem a habituação: recém-casados logo 
não percebem mais que estão usando a aliança.
A maior parte da aprendizagem é consideravelmente 
mais complexa do que a habituação, e o estudo da apren-
dizagem tem estado no centro do campo da psicologia. Os 
psicólogos abordaram o estudo da aprendizagem de diversos 
ângulos. Entre os mais fundamentais estão os estudos do tipo 
de aprendizagem que é ilustrado por respostas que variam 
desde um cão salivando quando ouve o dono abrir uma lata 
de comida para cachorro até as emoções que sentimos quan-
do o hino nacional é tocado. Outras teorias consideram como 
aprender é uma consequência de circunstâncias reforçadoras. 
Por fim, diversas outras abordagens se pautam nos aspectos 
cognitivos da aprendizagem, isso é, os processos de pensa-
mento que subjazem à aprendizagem.
Apesar de os filósofos terem especulado acerca das ba-
ses da aprendizagem desde a época de Aristóteles, a primeira 
pesquisa sistemática sobre a aprendizagem no Ocidente se 
deu no início do século XX, quando Ivan Pavlov desenvolveu 
um sistema para a aprendizagem chamado de condiciona-
mento clássico.
>>
você LÊ
Enquanto
 • Qual o papel da recompensa e da punição na aprendizagem?
 • Como as informações deste capítulo podem ser usadas para 
modificar comportamentos indesejados?
 • Será que pensar interessa para a aprendizagem?
A Times Square, em Nova York, 
é um dos destinos favoritos dos 
turistas, que não têm como deixar 
de perceber as placas de néon, as 
ruas lotadas, o barulho e odores 
desconhecidos, todos estímulos 
aos quais os residentes já estão 
acostumados.
PsychSmart_05.indd 124PsychSmart_05.indd 124 07/03/12 17:2407/03/12 17:24
Aprendizagem • 125
>> Condicionamento clássico
No Havaí, existe um lanche popular chamado de li hin mui. 
Basta dizer essas três palavras em voz alta ao redor de pes-
soas que cresceram no Havaí que muitas vão começar a sa-
livar. Se você não vem do Havaí, então provavelmente não 
exibiu reação alguma às palavras li hin mui. Existe uma pa-
lavra ou frase ou evento que o faça salivar? Talvez os arcos 
dourados do McDonald’s o façam salivar. Se sim, então você 
está exibindo uma forma básica de aprendizagem chamada 
de condicionamento clássico. O condicionamento clássico 
ajuda a explicar fenômenos tão diversos como tremer quando 
você olha para fora de noite e vê neve, e suar nas mãos e sen-
tir o coração acelerar quando assiste a um filme com música 
assustadora, cenas escuras e mudanças repentinas nas cenas.
O QUE É O CONDICIONAMENTO 
CLÁSSICO?
Ivan Pavlov (1849-1936), fisiologista russo, nunca pretendeu 
realizar pesquisas psicológicas. Em 1904, ele ganhou o Prê-
mio Nobel por seu trabalho em digestão, prova de sua con-
tribuição na área. Ainda assim, Pavlov é lembrado não por 
sua pesquisa fisiológica, mas por seus experimentos sobre a 
aprendizagem – trabalho que ele começou quase por acidente 
(Marks, 2004; Samoilov e Zayas, 2007).
Pavlov vinha estudando a secreção dos ácidos estoma-
cais e da salivação nos cachorros em resposta à ingestão de 
quantidades e tipos de comida variados. Enquanto fazia isso, 
ele observou um curioso fenômeno: às vezes, as secreções 
do estômago e a salivação começavam nos cachorros antes 
de eles terem comido qualquer coisa. A mera visão do expe-
rimentador que normalmente lhes trazia comida, ou mesmo 
o som de seus passos, era o bastante para produzir salivação 
nos cachorros. O gênio de Pavlov estava em sua habilidade 
de reconhecer as implicações da descoberta. Ele percebeu 
que os cães não estavam respondendo apenas com base na 
necessidade biológica (fome), mas também como resultado 
da aprendizagem – ou, como veio a ser conhecido, o con-
dicionamento clássico. O condicionamento clássico é um 
tipo de aprendizagem em que um estímulo neutro (tal como 
os passos do experimentador) elicia uma resposta após ser 
associado com um estímulo (tal como a comida) que natural-
mente acarreta essa resposta.
Para demonstrar o condicionamento clássico, Pavlov 
(1927) conectou um tubo à boca de um cachorro para que 
ele pudesse medir precisamente a salivação do animal. A 
seguir, ele tocou uma campainha e, alguns segundos de-
pois, permitiu que o cachorro comesse a comida. Essa as-
sociação ocorreu repetidamente e foi cuidadosamente pla-
nejada para que, cada vez, exatamente a mesma quantidade 
de tempo se passasse entre a apresentação da campainha 
e a comida. A princípio, o cão salivava apenas quando a 
comida estava em sua boca, mas logo começou a salivar ao 
som da campainha. De fato, mesmo quando Pavlov parou 
de dar comida ao cão, o animal ainda salivava após ouvir o 
som. O cão havia sido classicamente condicionado a salivar 
ao som da campainha.
Os processos básicos do condicionamento clássico que 
subjazem à descoberta de Pavlov são bem diretos, apesar 
de a terminologia que ele es-
colheu não ser simples. An-
tes do condicionamento, ha-
via dois estímulos não 
relacionados: o som da cam-
painha e a comida. Sabemos 
que normalmente o som da 
campainha não acarreta sali-
vação, apesar de causar al-
gum outro tipo de resposta, 
tal como levantar as orelhas. 
A campainha, portanto, é 
chamada de estímulo neu-
tro, já que é um estímulo 
que, antes do condiciona-
mento, não provoca natural-
mente a resposta na qual es-
tamos interessados. Também 
temos a comida, que natural-
mente faz o cão salivar quan-
do é colocada em sua língua 
– a resposta que queremos 
condicionar. A comida na 
língua é considerada o estí-
mulo não condicionado, ou ENC, visto que comida na 
boca de um cachorro automaticamente causa a salivação. A 
resposta reflexa que a comida elicia (salivação) é chamada 
de resposta não condicionada, ou RNC. Essa é uma res-
posta reflexa, natural e inata que não está associada à 
aprendizagem anterior.
Um modo de saber se um estímulo é um ENC é consi-
derar se todo o ser humano normal apresentaria a RNC. Se 
a resposta é sim, então provavelmente ele é um ENC. Por 
exemplo, será que qualquer pessoa saudável suaria em um 
clima extremamente quente e úmido? A resposta é sim. Logo, 
calor extremo e humidade são o ENC, e o suor é a RNC. Res-
postas não condicionadas são sempre causadas pela presença 
de estímulos não condicionados.
De volta ao estudo de Pavlov, a campainha toca cada vez 
que o cão está para receber comida. O objetivo do condicio-
namentoé que o cachorro associe a campainha ao estímulo 
não condicionado (carne) e, portanto, elicie a mesma respos-
ta que o estímulo não condicionado. Após diversas associa-
ções entre a campainha e a carne, a campainha por si só já é 
capaz de fazer o cão salivar.
Quando o condicionamento está completo, a campainha 
já não é mais um estímulo neutro, tendo se tornado um es-
tímulo condicionado, ou EC. Nesse ponto, a salivação em 
resposta ao estímulo condicionado (campainha) é considera-
da uma resposta condicionada, ou RC. Após o condiciona-
mento, portanto, o estímulo condicionado evoca uma respos-
ta condicionada.
Embora a terminologia que Pavlov usou para descrever o 
condicionamento clássico possa parecer confusa, o seguinte 
resumo pode ajudar a tornar as relações entre estímulos e res-
postas mais fáceis de compreender e lembrar:
aprendizagem Mudança 
relativamente permanente no 
comportamento acarretada pela 
experiência.
condicionamento clássico Tipo 
de aprendizagem em que um 
estímulo neutro gera uma resposta 
após ser associado a um estímulo 
que naturalmente acarreta essa 
reação.
estímulo neutro Estímulo que, 
antes do condicionamento, não 
provoca naturalmente a resposta de 
interesse.
estímulo não condicionado 
(ENC) Estímulo que naturalmente 
causa uma resposta específica que 
não tem de ser aprendida.
resposta não condicionada 
(RNC) Resposta que é natural e 
que não precisa de treinamento 
(por exemplo, salivar ao cheiro de 
comida).
PsychSmart_05.indd 125PsychSmart_05.indd 125 07/03/12 17:2407/03/12 17:24
126 • PSICO
 • Condicionado = aprendido
 • Não condicionado = não aprendido (inato, genetica-
mente programado)
 • Um estímulo não condicionado leva a uma resposta 
não condicionada.
 • Associações entre estímulos não condicionados e 
respostas não condicionadas não são aprendidas e 
não são treinadas.
 • Durante o condicionamento, um estímulo previamen-
te neutro se transforma no estímulo condicionado.
 • Um estímulo condicionado leva a uma resposta con-
dicionada, e uma associação entre estímulo condi-
cionado e resposta condicionada é uma consequên-
cia de aprendizagem e de treinamento.
 • Uma resposta não condicionada e uma resposta con-
dicionada são semelhantes (tais como a salivação no 
experimento de Pavlov), mas a resposta não condi-
cionada ocorre naturalmente e é tipicamente mais 
forte, enquanto a resposta condicionada é aprendida 
e costuma ser menos intensa.
COMO OS PRINCÍPIOS DO 
CONDICIONAMENTO SE APLICAM 
AO COMPORTAMENTO HUMANO?
Apesar de os primeiros experimentos de condicio-
namento terem sido realizados com animais, logo se 
viu que os princípios do condicionamento clássico 
podiam ser usados para explicar muitos aspectos do 
comportamento humano diário. Lembre-se, por exem-
plo, da ilustração anterior sobre como as pessoas po-
dem salivar ao ver os arcos dourados do McDonald’s. 
O motivo dessa reação é o condicionamento clássico: 
os arcos anteriormente neutros foram associados aos 
alimentos de dentro do restaurante que foram comidos 
em ocasiões anteriores (o estímulo não condicionado), 
fazendo com que os arcos se tornassem um estímulo 
condicionado que causa a resposta condicionada da 
salivação.
Respostas emocionais têm especial probabilidade 
de serem aprendidas por meio dos processos de condi-
cionamento clássico. Por exemplo, como é que alguns 
de nós desenvolvem medo de ratos, baratas e outras 
criaturas que são tipicamente inofensivas? Em um es-
tudo de caso já infame, o psicólogo John B. Watson e 
sua colega Rosalie Rayner (1920) demonstraram que 
o condicionamento clássico poderia ser uma causa de 
tais medos ao condicionar um bebê de 11 meses cha-
mado Albert a ter medo de ratos. O “Pequeno Albert”, 
como qualquer bebê saudável com audição normal, inicial-
mente tinha medo de barulhos altos (ENC), mas não tinha 
medo de ratos (estímulo neutro).
No estudo, os experimentadores ficavam atrás de Albert 
e faziam um barulho muito alto e repentino ao mesmo tem-
po em que lhe mostravam um rato. O barulho (o estímulo 
não condicionado) evocou o medo (a resposta não condicio-
nada). Após algumas associações entre o barulho e o rato, 
Albert começou a demonstrar medo do próprio rato, debu-
Estímulo neutro:
som da campainha
Resposta sem relação com a carne:
levantar as orelhas
Salivação
Salivação
Estímulo não condicionado (ENC)
Estímulo não condicionado (ENC)
Resposta não condicionada (RNC)
Carne
Som da campainha
Estímulo neutro
Carne
Estímulo condicionado (EC)
Salivação
Som da campainha
1
2
3
Condicionamento clássico
Antes do condicionamento A campainha não causa a salivação,
fazendo dela um estímulo neutro.
Durante o condicionamento A campainha é tocada logo antes
da apresentação da carne.
Resposta não 
condicionada (RNC)
Após o condicionamento O som da campainha sozinho estimula a
salivação, tornando-o um estímulo condicionado, e a salivação a resposta
condicionada.
Resposta condicionada (RC)
DICA DE ESTUDO
Para entender o processo do 
condicionamento clássico, você precisa saber 
a diferença entre o EC e o ENC, e sua 
relação com a RC e a RNC.
DICDIC
Para
con
a 
r
PsychSmart_05.indd 126PsychSmart_05.indd 126 07/03/12 17:2407/03/12 17:24
Aprendizagem • 127
lhando-se em lágrimas quando o via. O rato, então, tornou-
-se o EC que causava a RC, medo. Além disso, os efeitos do 
condicionamento permaneceram: cinco dias depois, Albert 
reagiu com medo não apenas ao rato, mas também a objetos 
semelhantes ao rato branco e peludo, inclusive um coelho 
branco, um casaco de pele de foca e mesmo uma máscara 
branca de Papai Noel. (Falando nisso, não sabemos o 
que aconteceu com o pobre Pequeno Albert. Wat-
son, o experimentador, foi condenado por usar 
procedimentos eticamente questionáveis que não 
seriam permitidos hoje.)
A aprendizagem por meio do condiciona-
mento clássico ocorre ao longo de toda a vida. Por 
exemplo, você pode ser um 
de muitos que não vão ao 
dentista com a frequência de-
vida por causa de suas asso-
ciações anteriores de dentista 
com dor. Nesse caso, o ENC 
seria a broca atingindo um 
nervo no dente, e a RNC se-
ria a dor. Qual o EC? Em ca-
sos extremos, o condiciona-
mento clássico pode levar ao 
desenvolvimento de fobias, 
que são medos intensos e irracionais que iremos considerar 
mais adiante no livro.
O condicionamento clássico também dá conta de expe-
riências prazerosas. Isso é, certos eventos causam a liberação 
de neurotransmissores que nos ajudam 
a sentir prazer. A “euforia do corredor”, 
por exemplo, ocorre quando endorfinas 
são liberadas em resposta a cor-
rer uma longa distância. O ENC 
é a corrida estendida, e a RNC 
é a liberação de endorfinas. O 
EC poderia ser diversas coisas, 
incluindo o odor ou a visão de 
roupas ou de tênis de corrida. O 
condicionamento clássico, então, 
pode explicar muitas das reações 
que temos a estímulos no mundo 
ao nosso redor.
A EXTINÇÃO DE 
UMA RESPOSTA 
CONDICIONADA
O que aconteceria se um cachor-
ro que estivesse classicamente 
condicionado a salivar ao som 
de uma campainha nunca mais 
recebesse comida quando a cam-
painha tocasse? A resposta se 
encontra em um dos fenômenos 
básicos da aprendizagem: a ex-
tinção. A extinção ocorre quan-
Evitar o dentista 
devido a uma 
experiência anterior 
desagradável não é 
incomum. É assim 
que a generalização 
do estímulo 
funciona.
estímulo condicionado (EC) 
Estímulo anteriormente neutro 
que foi associado a um estímulo 
não condicionado para provocar 
uma resposta anteriormente 
causada apenas pelo estímulo não 
condicionado.
resposta condicionada 
(RC) Resposta que, após o 
condicionamento, segue um estímulo 
anteriormente neutro (por exemplo, 
salivação ao som da campainha).
Da perspectiva de...
UM MÉDICO Como o conhecimento do 
condicionamento clássico poderia ajudar no 
tratamento das ansiedades dos pacientes 
quanto a visitas ao médico? Quais são 
algumas mudanças que um médico poderia 
fazer quando lida com um pacienteque tem 
uma fobia associada a visitar o médico?
, tornou-
feitos do
s, Albert 
a objetos
m coelho
máscara
s o
U
c
tr
qu
alg
faze
uma
Com que velocidade você pode condicionar classicamente o seu animal 
de estimação (ou o de um amigo)? Comece a ensinar ao animal uma 
nova associação dizendo “Os ingleses estão 
vindo, os ingleses estão vindo!” (ou qual-
quer frase que você possa inventar) e 
imediatamente dê algo de comer ao 
seu bichinho. Quantas vezes você pre-
cisa fazer isso antes que o animal co-
mece a responder à sua declaração da 
mesma forma que reage à comida? Se 
você tem acesso a diversos cães e 
gatos, você pode até compará-
-los. Que espécies você acha 
que aprenderiam mais rápido 
por meio do condicionamento 
clássico? Você pode se surpre-
ender.
E
n
vo
lv
a
-s
e
!
PsychSmart_05.indd 127PsychSmart_05.indd 127 07/03/12 17:2407/03/12 17:24
128 • PSICO
Aquisição (estímulo condicionado
e estímulo não condicionado
apresentados juntos)
Extinção (estímulo
condicionado por si só)
Recuperação espontânea
de resposta condicionada
Ocorre a extinção
(apenas o estímulo
condicionado)
Tempo
Forte
Fo
rç
a 
da
 re
sp
os
ta
co
nd
ic
io
na
da
 (R
C)
Fraco (a)Treinamento
Aquisição, extinção e recuperação
espontânea no condicionamento clássico
(b) Apenas EC (c) Pausa (d) Recuperação espontânea
do uma resposta previamente condicionada torna-se menos 
frequente, até desaparecer.
Para produzir a extinção, é necessário acabar com a 
associação entre os estímulos condicionados e os estí-
mulos não condicio-
nados. Por 
exemplo, 
se tivésse-
mos treina-
do um cão 
para salivar (RC) ao som de 
uma campainha (EC), pode-
ríamos produzir a extinção ao 
repetidamente tocar a cam-
painha, mas não lhe dar comi-
da. A princípio, o cão conti-
nuaria a salivar quando 
ouvisse a campainha, mas, 
após algumas vezes, a quanti-
dade de salivação provavel-
mente decairia, e o cão iria, 
por fim, parar de responder à 
campainha por completo. 
Nesse momento, poderíamos dizer que a resposta está extin-
ta. Resumindo, a extinção ocorre quando o estímulo condi-
cionado é apresentado repetidamente sem o estímulo não 
condicionado.
Quando uma resposta condicionada estiver extinta, ela 
terá desaparecido para sempre? Pavlov descobriu esse fenô-
meno quando ele retornou a seu cachorro alguns dias depois 
do comportamento condicionado ter sido aparentemente ex-
tinto. Se ele tocasse a campainha, o cachorro salivava no-
vamente – um efeito conhecido como recuperação espon-
tânea, ou o reaparecimento de uma resposta condicionada 
extinta após um período de descanso e sem novo condicio-
namento.
A recuperação espontânea ajuda a ex-
plicar por que é tão difícil superar a depen-
dência a drogas. Por exemplo, viciados em 
cocaína que se achavam “curados” podem 
sentir um impulso irresistível de usar a droga 
novamente se forem subsequentemente con-
frontados por um estímulo com fortes cone-
xões à droga, tal como um pó branco (DiCano e 
Everitt, 2002; Plowright, Simonds e Butler, 2006; Rodd et 
al., 2004).
GENERALIZAÇÃO E DISCRIMINAÇÃO
Apesar de diferenças na cor e na forma, para a maioria de 
nós, uma rosa é uma rosa. O prazer que sentimos pela beleza, 
pelo odor e pela graça da flor é similar para diferentes tipos 
de rosas. Pavlov percebeu um fenômeno semelhante. Seu cão 
frequentemente salivava não apenas ao som da campainha 
usada durante o condicionamento original, mas ao som de 
outras campainhas também.
Esse comportamento é chamado de generalização de 
estímulos. A generalização de estímulos ocorre quando 
uma resposta condicionada segue um estímulo que é seme-
lhante ao estímulo condicionado original. Quanto maior a 
semelhança entre dois estímulos, maior a probabilidade da 
generalização de estímulos. O Pequeno Albert, que, como 
mencionamos anteriormente, foi condicionado a ter medo de 
ratos brancos, passou a temer outras coisas brancas peludas 
também. Contudo, de acordo com o princípio da generaliza-
ção de estímulos, é improvável que ele tivesse medo de um 
cachorro preto, já que sua cor o teria diferenciado suficiente-
mente do estímulo amedrontador original.
extinção Fenômeno básico 
da aprendizagem que ocorre 
quando uma resposta previamente 
condicionada torna-se menos 
frequente e enfim desaparece.
recuperação 
espontânea Reaparecimento de 
uma resposta condicionada extinta 
após um período de descanso e sem 
novo condicionamento.
generalização de 
estímulo Ocorre quando uma 
resposta condicionada segue um 
estímulo que é semelhante ao 
estímulo condicionado original; 
quanto maior a semelhança entre os 
dois estímulos, maior a probabilidade 
de ocorrer a generalização.
PsychSmart_05.indd 128PsychSmart_05.indd 128 07/03/12 17:2407/03/12 17:24
Aprendizagem • 129
A generalização de estímulos é 
o motivo por que os motoristas 
sabem que devem parar em todos 
os semáforos vermelhos, mesmo que 
haja pequenas variações em tamanho, 
formato e tonalidade do semáforo.
A resposta condicionada produzida pelo novo estímulo 
não costuma ser tão intensa quanto a resposta original con-
dicionada, apesar de que, quanto mais o novo estímulo se 
parece com o antigo, mais semelhante é a nova resposta. É 
improvável, portanto, que o medo que o Pequeno Albert sen-
tia da máscara do Papai Noel fosse tão grande quanto o medo 
que ele aprendera a ter do rato. Ainda assim, a generalização 
de estímulos é o motivo por que os motoristas sabem, por 
exemplo, que devem parar em todos os semáforos vermelhos, 
mesmo que haja pequenas variações em tamanho, formato e 
tonalidade do semáforo.
A discriminação de estímulos, por outro lado, ocorre se 
dois estímulos são suficientemente distintos um do outro para 
que um evoque uma resposta condicionada, mas o outro não. 
A discriminação de estímulos é a habilidade de diferenciar 
os estímulos. Por exemplo, minha cadela, Cleo, vem corren-
do para a cozinha quando ouve o barulho do abridor de latas 
elétrico, o qual ela aprendeu que é usado para abrir a comida 
dela quando sua janta está para ser servida. Mas ela não vem 
correndo até a cozinha ao som do processador de alimentos, 
que é semelhante. Ou seja, ela discrimina entre os estímu-
los do som do abridor de latas e do som do processador de 
alimentos. De maneira semelhante, nossa habilidade de dis-
criminar entre o comportamento de um cão que rosna e de 
um cujo rabo está balançando pode levar ao comportamento 
adaptativo – evitar o cão que rosna e acariciar o amistoso.
>> Condicionamento 
operante
Muito bom... Que ideia inteligente... Fantástico... Concor-
do... Obrigado... Excelente... Ótimo... Exatamente... Esse é 
o melhor trabalho que você escreveu; merece um 10... Você 
está pegando o jeito... Estou impressionado... Tome um bis-
coito... Você está ótima... Eu te amo...
Poucos de nós se incomoda por ser o alvo de algum des-
ses comentários. Mas o que é especialmente notável acerca 
deles é que cada uma dessas simples afirmações pode ser 
usada, por meio de um processo conhecido como condicio-
namento operante, para realizar poderosas mudan-
ças no comportamento e para ensinar tarefas 
extremamente complexas. O con-
dicionamento operante é a base 
para muitos dos tipos mais 
importantes de aprendizagem 
humana e animal.
O condicionamento 
operante é a aprendizagem 
na qual uma resposta volun-
tária tem maiores ou menores 
chances de ocorrer novamente, de-
pendendo de suas consequências favorá-
veis ou desfavoráveis. Por exemplo, se 
dinheiro caísse do céu toda vez que você 
terminasse de ler uma página do seu livro 
didático, você acha que leria mais páginas 
do livro? Se sim, então o dinheiro seria 
considerado uma consequência favorá-
vel que levou ao fortalecimento de sua 
resposta de leitura.
Diferentemente do condicionamen-
to clássico, em que os comportamentos originais são respos-
tas biológicas naturais invo-
luntárias à presença de um 
estímulo como água, comida 
ou dor, o condicionamento 
operante se aplica a respostas 
voluntárias,que um organis-
mo desempenha deliberada-
mente para produzir um resul-
tado desejável. O termo 
operante enfatiza esse aspec-
to: o organismo opera em seu 
ambiente para produzir um 
resultado desejável. O condi-
cionamento operante está em 
funcionamento quando aprendemos que trabalhar duro pode 
acarretar um aumento ou que estudar bastante resulta em 
boas notas.
Assim como aconteceu com o condicionamento clássi-
co, as bases para compreender o condicionamento operante 
foram lançadas pelo trabalho feito com animais. Iremos ob-
servar agora o início dessas pesquisas.
COMO O CONDICIONAMENTO 
OPERANTE FUNCIONA
B. F. Skinner (1904-1990), um dos psicólogos mais influen-
tes do século XX, inspirou toda uma geração de psicólogos 
que estudam o condicionamento operante. Skinner se interes-
sou em especificar como o comportamento varia como resul-
tado de alterações no ambiente. Para ilustrar, consideremos o 
que acontece com um rato em uma típica caixa de Skinner, 
discriminação de 
estímulos Processo que ocorre se 
dois estímulos são suficientemente 
distintos um do outro para que um 
evoque uma resposta condicionada, 
mas o outro, não; habilidade de 
diferenciar os estímulos.
condicionamento 
operante Aprendizagem em que 
uma resposta voluntária é fortalecida 
ou enfraquecida dependendo de 
suas consequências favoráveis ou 
desfavoráveis.
pense PSICO
> > > Quais as chances de que o Pequeno Albert, alvo 
dos experimentos de Watson, tenha vivido com medo do 
Papai Noel? Descreva o que poderia ter sido feito para 
dar fim ao seu temor do Bom Velhinho.
PsychSmart_05.indd 129PsychSmart_05.indd 129 07/03/12 17:2407/03/12 17:24
130 • PSICO
uma câmara com um ambiente alta-
mente controlado que Skinner proje-
tou para estudar os processos do con-
dicionamento operante com animais 
de laboratório (Pascual e Rodríguez, 
2006).
Imagine que você quer ensinar um 
rato faminto a usar uma alavanca que 
está em sua caixa. A princípio, o rato 
irá caminhar pela caixa, explorando o 
ambiente de modo relativamente alea-
tório. Em algum momento, contudo, 
ele provavelmente irá apertar a ala-
vanca por acaso, e, quando o fizer, a 
caixa terá sido projetada de modo que 
o rato receba comida. Na primeira vez 
que isso acontecer, o rato não aprende-
rá a conexão entre apertar a alavanca e 
receber comida e voltará a explorar a 
caixa. Mais cedo ou mais tarde, o rato 
irá apertar a alavanca novamente e re-
ceber comida; com o tempo, o número 
de vezes em que ele apertou a alavanca 
irá aumentar. Por fim, o rato irá apertar 
a alavanca continuamente até que sua 
fome esteja satisfeita, assim demons-
trando que aprendeu que receber comida está associado a com 
apertar a alavanca.
Reforçamento: o conceito central do condiciona-
mento operante Skinner chamava o processo que faz os 
ratos continuarem apertando a chave de “reforçamento”. O 
reforçamento é o processo pelo qual um estímulo aumenta 
a probabilidade de que um comportamento anterior a ele 
seja repetido. Em outras pala-
vras, é mais provável que o 
rato aperte a alavanca nova-
mente devido ao estímulo da 
comida.
Em uma situação como 
essa, a comida é chamada de 
reforçador. Um reforçador 
é qualquer estímulo que au-
mente a probabilidade de que 
um comportamento anterior a ele ocorra novamente. Portan-
to, a comida é um reforçador, já que aumenta a probabilidade 
de que o comportamento de apertar (formalmente referido 
como a resposta de apertar) ocorra.
Que tipos de estímulo podem 
agir como reforçadores? Bônus, brin-
quedos e boas notas podem funcionar 
como reforçadores – se fortalecerem a 
probabilidade da resposta que ocorreu 
antes de sua introdução. O que faz de 
algo um reforço depende de preferên-
cias individuais. Apesar de uma barra 
de chocolate poder funcionar como 
um reforço para uma pessoa, um in-
divíduo que não gosta de chocolate 
pode achar 75 centavos mais desejá-
vel. O único modo de descobrirmos 
se um estímulo é reforçador para um 
organismo particular é observar se a 
frequência de um comportamento que 
ocorreu previamente a ele aumenta 
após a apresentação do estímulo.
É claro, nós não nascemos sa-
bendo que 75 centavos podem com-
prar um doce. Ao contrário, com a 
experiência, nós aprendemos que o 
dinheiro é um artigo de valor devido 
à sua associação a estímulos, como 
alimentos e bebidas, que são reforça-
dores naturais. Esse fato sugere uma 
distinção entre reforços primários e reforços secundários. Um 
reforço primário satisfaz alguma necessidade biológica e fun-
ciona naturalmente, independentemente da experiência ante-
rior da pessoa. Comida para alguém que está com fome, calor 
para quem sente frio e alívio para quem tem dor seriam todos 
classificados como reforços primários. Um reforço secundá-
rio, por outro lado, é um estímulo que se torna reforçador por 
causa de sua associação a um reforço primário. Por exemplo, 
sabemos que o dinheiro é valioso porque aprendemos que ele 
nos permite obter objetos desejáveis, incluindo reforços pri-
mários como comida e abrigo. O dinheiro, portanto, torna-se 
um reforço secundário.
Reforçadores positivos, reforçadores negativos e pu-
nição Em muitos aspectos, os reforçadores podem ser vistos 
como recompensas; tanto um reforçador quanto uma recom-
pensa aumentam a probabilidade de uma resposta anterior a 
eles ocorrer novamente. Mas o termo recompensa é limitado 
a ocorrências positivas, e é aqui que ele se diferencia de um 
reforçador – pois acontece que reforçadores podem ser posi-
tivos ou negativos.
reforçamento Processo pelo 
qual um estímulo aumenta 
a probabilidade de que um 
comportamento anterior seja 
repetido.
reforçador Qualquer estímulo 
que aumente a probabilidade de que 
um comportamento anterior a ele 
ocorra novamente.
B. F. Skinner projetou a caixa de Skinner para 
condicionar ratos a apertarem uma alavanca para 
obter comida.
Skinner realmente ensinou pombos a 
jogar boliche e tênis de mesa, e 
cachorros a escalar paredes usando o 
condicionamento operante.
Você sabia? DICA DE ESTUDO
Lembre-se de que os reforçadores primários 
satisfazem uma necessidade biológica; 
reforçadores secundários são efetivos 
devido à associação prévia com um 
reforçador primário.
DICDIC
Lemb
sati
re
d
PsychSmart_05.indd 130PsychSmart_05.indd 130 07/03/12 17:2407/03/12 17:24
Aprendizagem • 131
Um reforço positivo é um estí-
mulo adicionado ao ambiente que 
causa um aumento em uma resposta 
precedente. Se comida, água, di-
nheiro ou um elogio for dado após 
uma resposta, é mais provável que 
a resposta ocorra novamente no fu-
turo. O salário que um trabalhador 
recebe ao final do mês, por exemplo, 
aumenta a probabilidade de que ele 
volte ao trabalho no mês seguinte.
Por outro lado, um reforço negativo 
refere-se a um estímulo desagradável cuja re-
moção leva a um aumento na probabilidade de que 
uma resposta precedente seja repetida no futuro. Por exem-
plo, se você tem um machucado que arde (um estímulo desa-
gradável) que é aliviado quando você aplica certa marca de 
pomada, é mais provável que você use aquela pomada na vez 
em que tiver outro machucado. Usar a pomada, então, é ne-
gativamente reforçador, já que alivia o machucado desagra-
dável. De modo semelhante, se o volume do seu iPod está tão 
alto que machuca seus ouvidos quando o liga, é provável que 
você reduza o volume. Baixar o volume é negativamente re-
forçador, e você tem maior probabilidade de repetir a ação no 
futuro quando o ligar. O reforço negativo, então, ensina o 
indivíduo que realizar uma ação remove uma condição nega-
tiva que existe no ambiente. Como os reforços positivos, os 
reforços negativos aumentam a probabilidade de que com-
portamentos precedentes sejam repetidos.
O reforço aumenta a frequência do 
comportamento que o precedeu; 
a punição diminui a frequência do 
comportamento que a precedeu.
Note que um reforçamento negativo não é o mesmo que 
uma punição. Punição refere-se a um estímulo que diminui 
a probabilidade de que um comportamentoan-
terior ocorra novamente. Ao contrário do 
reforço negativo, que produz um aumento 
no comportamento, a punição reduz a 
probabilidade de uma resposta ante-
rior.
Considere algo desagradável 
que pode acontecer em seu ambien-
te: seu colega de quarto ou os seus 
pais reclamam. Sua mãe reclamando 
que você precisa limpar o seu quarto 
pode ser um estímulo desagradável. Se 
você limpar o quarto para fazê-la parar 
de reclamar, é mais provável que você re-
pita esse comportamento no futuro. Desse 
modo, seu comportamento de limpeza do quar-
to terá sido reforça-
do. Digamos, contudo, que o 
seu colega de quarto reclame 
toda a vez que você aumenta 
o volume da TV. Para evitar 
ouvir a reclamação, você pode 
parar de ver televisão com o 
volume tão alto. Nesse caso, o 
seu comportamento de ouvir a 
TV com um volume muito alto 
diminui para evitar a punição 
da reclamação. No primeiro 
caso, o comportamento espe-
cífico pode aumentar devido 
ao reforço negativo; no segun-
do, é provável que diminua devido à punição.
Há dois tipos de punição: punição positiva e punição ne-
gativa, assim como existe o reforço positivo e o reforço ne-
gativo. Em ambos os casos, “positivo” significa acrescentar 
algo, e “negativo” significa remover algo. Punição positiva 
enfraquece uma resposta por meio da aplicação de um estímu-
lo desagradável. Por exemplo, dar palmadas em uma criança 
por se comportar mal ou passar 10 anos na cadeia por cometer 
um crime são punições positivas. Em contraste, punição ne-
gativa consiste da remoção de algo agradável. Por exemplo, 
quando um adolescente ouve que está “de castigo” e não vai 
mais poder usar o carro da família devido a suas notas baixas, 
ou quando um funcionário é informado de que recebeu um 
corte no salário devido a sua fraca avaliação, a punição nega-
tiva está sendo administrada. Tanto a punição negativa quanto 
a positiva resultam na diminuição da possibilidade de que um 
comportamento prévio seja repetido.
Essas regras podem ajudar você a distinguir os conceitos 
de reforço e punição positivos e negativos:
 • Reforço aumenta a frequência do comportamento que 
o precedeu; punição diminui a frequência do comporta-
mento que a precedeu.
 • A aplicação de um estímulo positivo gera um aumento 
na frequência do comportamento, e é referida como re-
forçamento positivo; a aplicação de um estímulo negati-
vo diminui ou reduz a frequência do comportamento e é 
chamada de punição positiva.
reforço positivo Estímulo 
acrescentado ao ambiente que gera 
um aumento na resposta que o 
precedeu.
reforço negativo Estímulo 
desagradável cuja remoção leva a um 
aumento na probabilidade de que 
uma resposta anterior a ele seja 
repetida no futuro.
punição Estímulo que diminui 
a probabilidade de que um 
comportamento anterior a ele 
ocorra novamente.
Aprendemos o valor do dinheiro como reforço 
secundário desde cedo.
PsychSmart_05.indd 131PsychSmart_05.indd 131 07/03/12 17:2407/03/12 17:24
132 • PSICO
 • A remoção de um estímulo negativo que resulta no au-
mento da frequência do comportamento é reforçamento 
negativo; a remoção de um estímulo positivo que dimi-
nui a frequência do comportamento é punição negativa.
Os prós e contras da punição: por que o reforçamen-
to é melhor do que a punição A punição é uma forma 
adequada de modificar o comportamento? A punição costu-
ma se apresentar como o caminho mais rápido para modificar 
comportamentos que, se continuarem, podem ser perigosos 
para um indivíduo. Por exemplo, um pai pode não ter uma 
segunda chance de dizer ao filho como é perigoso atravessar 
uma rua em movimento, então puni-lo na primeira incidência 
desse comportamento pode se provar sábio. Além disso, o 
uso da punição para suprimir o comportamento, mesmo tem-
porariamente, dá a oportunidade de reforçar uma pessoa por 
se comportar de um modo mais desejável no futuro.
Existem alguns poucos momentos em que a punição pode 
ser a abordagem mais humana para tratar certos transtornos 
graves. Por exemplo, algumas crianças sofrem de autismo, 
um transtorno psicológico que pode levá-las à autoagressão, 
arranhando a própria pele ou batendo a cabeça na parede, 
machucando-se gravemente no processo. Em tais casos – e 
quando todos os outros tratamentos já falharam – a punição 
na forma de um choque elétrico rápido, porém intenso, foi 
utilizada para impedir o comportamento autodestrutivo. Esse 
tipo de punição é usado apenas para manter a criança segura 
e ganhar tempo até procedimentos de reforçamento positivo 
poderem ser iniciados (Ducharme, Sanjuan e Drain, 2007; 
Salvy, Mulick e Butter, 2004; Toole et al., 2004).
A punição tem várias desvantagens que tornam seu uso 
rotineiro questionável. Para começo de conversa, a punição 
frequentemente é ineficaz, especialmente se não for utilizada 
logo após o comportamento indesejado ou se o indivíduo é 
capaz de deixar o local em que está sendo punido. Um em-
pregado que recebe uma reprimenda do chefe pode se demi-
tir; um adolescente que não pode mais usar o carro da família 
pode pegar o carro de um amigo emprestado. Nessas situa-
ções, o comportamento inicial que está sendo punido pode 
ser substituído por um que é ainda menos desejável.
Pior ainda, a punição física pode passar ao alvo a ideia 
de que agressão física é permissível e, talvez, até mesmo de-
sejável. Um pai que grita e bate no filho por se comportar 
mal está ensinando ao filho que a agressão é uma resposta 
adulta apropriada. Logo, o filho pode copiar o comportamen-
to do pai agindo agressivamente com outras pessoas. Além 
disso, a punição física costuma ser administrada por pessoas 
que estão com raiva ou irritadas. É improvável que indivíduos 
em tal estado emocional consigam pensar claramente no que 
Resultado pretendido
Reforço
(aumento do
comportamento)
Reforço positivo
Exemplo: Conceder um
aumento por bom
desempenho
Resultado: Aumento
na resposta de bom
desempenho
Exemplo: Passar uma
pomada para aliviar uma
coceira torna mais
provável a utilização
futura dessa pomada
Resultado: Aumento na
resposta de usar pomada
Reforço negativo
Punição
(diminuição do
comportamento)
Punição positiva
Exemplo: Gritar com uma
adolescente quando ela
rouba um bracelete
Resultado: Diminuição na
frequência da resposta
roubar
Exemplo: Acesso da ado-
lescente ao carro é restrito
pelos pais por ter chegado
depois da hora combinada
Resultado: Diminuição na
resposta de desrespeitar o
horário combinado
Punição negativa
Quando um estímulo é removido ou eliminado,
o resultado é...Quando um estímulo é acrescentado, o resultado é...
Reforço e punição
DICA DE ESTUDO
As diferenças entre reforço positivo, reforço 
negativo, punição positiva e punição negativa 
são mais complicadas do que se pensa, 
então preste especial atenção à lista e à 
tabela de resumo na figura acima.
DICDIC
As di
neg
sã
e
PsychSmart_05.indd 132PsychSmart_05.indd 132 07/03/12 17:2407/03/12 17:24
Aprendizagem • 133
estão fazendo e controlar cuidadosamente o grau de punição 
que estão infligindo. Por fim, aqueles que recorrem à puni-
ção física correm o risco de passar a ser temidos. As punições 
também podem diminuir a autoestima dos alvos, a menos que 
eles compreendam as razões para elas (Baumrind, Larzerele 
e Cowan, 2002; Sorbring, Deater-Deckard e Palmerus, 2006).
Por fim, a punição não passa qualquer informação so-
bre o que possa ser um comportamento alternativo mais ade-
quado. Para ser útil na geração de um comportamento mais 
desejável no futuro, a punição deve ser acompanhada por 
informações específicas quanto ao comportamento que está 
sendo punido, junto de sugestões específicas quanto a um 
comportamento mais desejável. Punir uma criança por olhar 
pela janela no colégio pode simplesmente fazê-la olhar para 
o chão. A menos que lhe ensinemos as formas adequadas de 
responder, teremos simplesmente substituído um comporta-
mento indesejado por outro. Se a punição não for seguida 
por um reforçamento de comportamentos subsequentesque 
sejam mais apropriados, não se terá conseguido muito.
Ou seja, reforçar o comportamento desejado é uma téc-
nica mais eficaz para modificar o comportamento do que usar 
a punição. Tanto na área científica quanto fora dela, o refor-
çamento costuma ser melhor do que a punição (Hiby, Rooney 
e Bradshaw, 2004; Pogarsky e Piquero, 2003; Sidman, 2006).
Esquemas de reforço O mundo seria um lugar diferente 
se jogadores de pôquer nunca mais jogassem depois de perder 
uma mão, se os pescadores voltassem para a beira assim que 
perdessem um peixe, ou se os atendentes de telemarke-
ting nunca mais ligassem depois que alguém desligasse 
na cara deles. O fato de que esses comportamentos tão 
“não reforçados” continuam, em geral com grande fre-
quência e persistência, ilustra que o reforçamento não 
precisa ser recebido continuamente para que o compor-
tamento seja aprendido e mantido. De fato, o compor-
tamento que é reforçado apenas casualmente pode, no 
final das contas, ser mais bem aprendido do que aquele 
comportamento que é reforçado continuamente.
Quando nos referimos à frequência e ao momento 
do reforçamento que segue o comportamento desejado, 
estamos falando de esquemas de reforço. Diz-se que o 
comportamento que é reforçado toda a vez em que ocor-
re está em um esquema de reforço contínuo; se é refor-
çado algumas vezes, mas não o tempo todo, está em um 
esquema de reforço parcial (ou intermitente). A 
aprendizagem ocorre mais rápido quando o comporta-
mento é continuamente reforçado. Imagine, por exem-
plo, que você está tentando ensinar seu gato a recebê-lo 
toda vez que você chega em casa. O gato irá aprender 
muito mais rápido que vai ganhar uma recompensa quan-
do vier recebê-lo se você lhe der uma recompensa toda 
vez que ele vier recebê-lo quando você chegar em casa. 
Depois que o comportamento for aprendido, ele vai du-
rar mais se você parar de 
reforçá-lo. Se você só 
recompensar esse com-
portamento ocasional-
mente, ou seja, se você 
usar o esquema de refor-
çamento parcial para manter 
esse comportamento, é mais 
provável que ele continue rece-
bendo você mesmo depois de 
você ter parado de recompen-
sá-lo (Casey, Cooper-Brown e 
Wacher, 2006; Gottlieb, 2004; 
Staddon e Cerutti, 2003).
Por que o reforço intermitente resultaria em aprendiza-
gem mais contundente e de maior duração do que o reforço 
contínuo? Podemos responder a essa pergunta examinando 
como podemos nos comportar quando usamos uma máquina 
de venda de doces comparada com uma máquina de caça-ní-
queis em Las Vegas. Quando usamos a máquina de vendas, a 
experiência anterior nos ensinou que sempre que colocarmos 
esquema de reforço Diferentes 
padrões de frequência e momento 
do reforçamento seguindo o 
comportamento desejado.
esquema de reforço 
contínuo Reforçar um 
comportamento toda vez que ele 
ocorre.
esquema de reforço parcial 
(ou intermitente) Reforçar um 
comportamento algumas vezes, mas 
não todas, em que ele ocorre.
De que formas a punição é ineficaz?
pense PSICO
> > > Dados os achados científicos que acabamos de 
discutir, o que você diria aos pais que perguntarem se o 
uso rotineiro de punição física pode ser uma estratégia 
útil para ajudar seus filhos a aprender a gostar de estudar? 
Você acha que a sua resposta pode mudar com base em 
diferenças na cultura de origem ou na experiência?
PsychSmart_05.indd 133PsychSmart_05.indd 133 07/03/12 17:2407/03/12 17:24
134 • PSICO
a quantidade certa de dinheiro, 
o reforço, um doce, será entre-
gue. Em outras palavras, o es-
quema de reforço é contínuo. 
Em comparação, um caça-
-níqueis oferece reforço inter-
mitente. As pessoas que usam 
essas máquinas aprendem 
que, depois que colocaram o 
dinheiro, na maioria das vezes 
não receberão nada em troca. 
Ao mesmo tempo, contudo, 
elas sabem que ocasionalmen-
te ganharão algo.
Agora imagine que, sem 
o nosso conhecimento, tan-
to a máquina de venda de doces quanto o caça-níqueis es-
tão estragados, portanto nenhum deles pode entregar nada. 
Não demoraria muito para pararmos de depositar moedas na 
máquina quebrada de doces. Provavel-
mente tentaríamos no máximo duas 
ou três vezes antes de nos afastarmos 
irritados. Mas com o caça-níqueis a 
história seria outra. Aqui, o dinheiro 
seria depositado por um tempo con-
sideravelmente maior, mesmo não 
havendo retorno.
Em termos formais, podemos 
ver a diferença entre os dois es-
quemas de reforço: esquemas de reforço parcial (tais como 
os fornecidos pelos caça-níqueis) mantêm um desempenho 
por mais tempo do que esquemas de reforço contínuo (tais 
como o estabelecido nas máquinas de venda de doces) antes 
da extinção – o desaparecimento da resposta condicionada 
– ocorrer.
Certos tipos de esquemas de reforço parcial produzem 
respostas mais fortes e duráveis antes da extinção do que ou-
tros. Apesar de muitos tipos de esquemas de reforço parcial 
terem sido examinados, eles podem ser praticamente todos 
dispostos em duas categorias: esquemas que consideram o 
número de respostas feitas antes de o reforço ser dado, cha-
mados de esquemas de razão fixa e de razão variável, e os 
que consideram a quantidade de tempo que passa antes de ser 
fornecido reforço, chamados de esquemas de intervalo fixo e 
de intervalo variável (Gottlieb, 2006; Pellegrini et al., 2004; 
Svartdal, 2003).
Em um esquema de razão fixa, o reforço é dado apenas 
após um número específico de respostas. Por exemplo, um 
rato pode receber comida a cada dez vezes que apertar uma 
alavanca; aqui, a razão seria de 1:10. De modo similar, alfaia-
tes geralmente são pagos em esquemas de razão fixa: eles re-
cebem uma quantidade específica de dinheiro para cada peça 
de roupa que tecerem. Já que uma taxa maior de produção 
significa mais reforço, pessoas em esquemas de razão fixa 
trabalham o mais rápido possível.
Em um esquema de razão variável, o reforço ocorre 
após um número variado de respostas, ao invés de um núme-
ro fixo. Apesar de o número específico de respostas necessá-
rias para receber a recompensa variar, o número de respostas 
costuma girar ao redor de uma média específica. Um bom 
exemplo de um esquema de razão variável é o trabalho de 
um operador de telemarketing. Ele pode realizar uma venda 
na terceira, oitava, nona e vigésima chamadas, sem sucesso 
entre elas. Apesar de o número de ligações que devem ser fei-
tas antes de uma venda variar, a média é de 20% de sucesso. 
Nessas circunstâncias, podemos esperar que o vendedor faça 
tantas ligações quanto possível no menor tempo possível. 
Esse é o caso com todos os esquemas de 
razão variável, que levam a um alto 
índice de respostas e resistência à 
extinção.
Em contraste com os esque-
mas de razão fixa e de razão variá-
vel, em que o fator crucial é o nú-
mero de respostas, os esquemas de 
intervalo fixo e de intervalo variável 
se concentram em quanto tempo se 
passou desde que uma pessoa ou um 
animal foi recompensado. Um exem-
plo de esquema de intervalo fixo é o salário semanal. Para as 
pessoas que recebem salários regulares semanalmente, não 
costuma haver grande diferença entre o quanto elas produ-
zem em cada semana.
Como um esquema de intervalo fixo fornece reforço 
para uma resposta apenas se um período fixo de tempo pas-
sou, os índices gerais de resposta são relativamente baixos. 
Isso é especialmente verdadeiro no período diretamente pos-
terior ao reforçamento, quando o tempo de espera até o pró-
©
 T
h
e
 N
e
w
 Y
o
rk
e
r 
C
o
lle
ct
io
n
 2
0
0
1
 C
h
ri
st
o
p
h
e
r 
W
e
ya
n
t,
 e
x
tr
aí
d
o
d
e
 c
ar
to
o
n
b
an
k
.c
o
m
. 
T
o
d
o
s 
o
s 
d
ir
e
it
o
s 
re
se
rv
ad
o
s.PRÓXIMO
ESTÍMULO
32 KM
DICA DE ESTUDO
Lembre-se de que os diferentes esquemas 
de reforço afetam a rapidez com que uma 
resposta é aprendida e por quanto tempo 
ela dura depois de não ser mais reforçada.
DICDIC
Lemb
de
re
e
esquema de razão fixa Esquema 
pelo qual o reforçamento só é dado 
após um número específico de 
respostas.
esquema de razão variável 
Esquema peloqual o reforçamento 
ocorre após um número variável de 
respostas ao invés de um número 
específico.
esquema de intervalo fixo 
Esquema que fornece reforço 
para uma resposta apenas se um 
período fixo de tempo tiver passado, 
tornando taxas gerais de resposta 
relativamente baixas.
PsychSmart_05.indd 134PsychSmart_05.indd 134 07/03/12 17:2407/03/12 17:24
Aprendizagem • 135
ximo reforço é relativamente longo. Os hábitos de estudo dos 
estudantes frequentemente exemplificam essa realidade. Se o 
período entre provas é relativamente longo (o que quer dizer 
que a oportunidade para o reforçamento de bons desempe-
nhos é dada com pouca frequência), os estudantes estudam 
o mínimo, ou nada, até os dias de prova se aproximarem. 
Contudo, logo antes das provas, os estudantes começam a 
se entupir de informações, sinalizando um rápido aumento 
no índice de sua resposta de estudo. Como é de se esperar, 
imediatamente após a prova, há um rápido declínio na taxa 
de respostas, com poucas pessoas abrindo um livro um dia 
depois do teste. Esquemas de intervalo fixo produzem o tipo 
de “efeito ascendente” que se vê no gráfico acima.
Uma forma de diminuir o atraso de resposta que ocorre 
logo após o reforço, e de manter o comportamento desejado 
de modo mais consistente ao longo de um intervalo, é usar 
um esquema de intervalo variável. Em um esquema de in-
tervalo variável, o tempo entre os reforços varia ao redor 
de alguma média ao invés de ser fixo. Por exemplo, um pro-
fessor que faz testes surpresas – variando de um a cada três 
dias até um a cada três semanas, com média de um a cada 
duas semanas –, está usando um esquema de intervalo variá-
vel. Comparado com os hábitos de estudo que observamos 
com um esquema de intervalo fixo, os hábitos de estudos 
dos alunos em um esquema de intervalo variável como esse 
certamente seriam bem diferentes. Os estudantes poderiam 
estudar mais regularmente, já que nunca saberiam quando vi-
ria o próximo teste surpresa. Esquemas de intervalo variável, 
em geral, têm maior probabilidade de produzir taxas relativa-
mente constantes de respostas 
do que esquemas de intervalo 
fixo, com respostas que de-
moram mais a se extinguir 
após o reforçamento terminar.
Discriminação e generali-
zação no condicionamento operante Não demora muito 
para uma criança aprender que compartilhar os brinquedos é 
recompensado com um biscoito, e que se recusar a compartilhá-
-los resulta em castigo. Os mesmos princípios do condiciona-
Há pequenas pausas
após cada resposta
Resposta ocorre em uma
taxa alta e constante
Respostas ocorrem em
uma taxa constante
Há tipicamente longas
pausas após cada
resposta
Fr
eq
uê
nc
ia
 c
um
ul
at
iv
a 
de
 re
sp
os
ta
s
Tempo
Fr
eq
uê
nc
ia
 c
um
ul
at
iv
a 
de
 re
sp
os
ta
s
Tempo
Esquema de intervalo fixo
Fr
eq
uê
nc
ia
 c
um
ul
at
iv
a 
de
 re
sp
os
ta
s
Tempo
Fr
eq
uê
nc
ia
 c
um
ul
at
iv
a 
de
 re
sp
os
ta
s
Tempo
Esquema de razão fixa Esquema de razão variável Resultados de
esquemas
de reforço
Esquema de intervalo variável
esquema de intervalo 
variável Esquema pelo qual o 
tempo entre os reforços varia ao 
redor de alguma média ao invés de 
ser fixo.
pense PSICO
conecte-se
Esquemas de reforço
> > > Como o condicionamento operante pode ser apli-
cado à sala de aula para aumentar a probabilidade de que as 
crianças façam os deveres de casa com maior frequência?
Aceite o desafio PSICO! Aprenda a usar a psicologia 
para motivar as pessoas. Depois responda à questão 8 do 
Pop Quiz na p. 147 para descobrir o quanto você entende 
sobre os esquemas de reforço.
PsychSmart_05.indd 135PsychSmart_05.indd 135 07/03/12 17:2407/03/12 17:24
136 • PSICO
mento operante dão conta de como um pombo pode aprender a 
bicar uma chave quando uma luz verde acende, mas não quando 
uma luz vermelha aparece. Assim como no condicionamento 
clássico, então, a aprendizagem operante envolve os fenômenos 
de discriminação e generalização.
O processo pelo qual as pessoas aprendem a discriminar 
estímulos é conhecido como treinamento de controle de estí-
mulos. No treinamento de controle de estímulos, um compor-
tamento é reforçado na presença de um estímulo específico, 
mas não em sua ausência. Por 
exemplo, uma das discrimina-
ções mais difíceis que muitas 
pessoas enfrentam é determi-
nar quando a amizade de al-
guém não é mera amizade, 
mas um sinal de interesse amoroso. As pessoas aprendem a 
discriminar observando a presença de certas pistas não verbais 
– tais como contato visual aumentado e maior frequência de 
toque – que indicam interesse amoroso. Quando essas pistas 
estão ausentes, as pessoas aprendem que não há indício de in-
teresse amoroso. Nesse caso, a pista não verbal funciona como 
um estímulo discriminatório, ao qual o organismo aprende a 
responder durante o treinamento de controle de estímulos. Um 
estímulo discriminatório sinaliza a possibilidade de que um 
reforço venha em seguida a uma resposta. Por exemplo, se 
você esperar até o seu colega de quarto estar de bom humor 
antes de pedir emprestado o CD preferido dele, pode-se dizer 
que o seu comportamento está sob o controle de estí-
mulos, porque você pode discriminar os humores do 
colega de quarto.
Assim como no condicionamento clássico, o fe-
nômeno da generalização de estímulos, em que um or-
ganismo aprende uma resposta a um estímulo e depois 
exibe a mesma resposta para estímulos ligeiramente 
diferentes, ocorre no condicionamento operante. Se 
você aprendeu que ser educado ajuda a conseguir o que 
você quer em determinada situação (reforçando a sua 
educação), é provável que você generalize sua resposta 
para outras situações. Às vezes, contudo, a generaliza-
ção pode ter consequências infelizes, como quando as 
pessoas se comportam negativamente contra todos os 
membros de um grupo racial porque tiveram uma expe-
riência desagradável com um membro daquele grupo.
Modelagem: reforçando o que não ocorre na-
turalmente Considere a dificuldade de usar apenas 
o condicionamento operante para ensinar as pessoas 
a consertar uma transmissão de carro. Você teria de 
esperar até que elas realizassem um comportamento 
desejado antes de providenciar o reforço. Elas pro-
vavelmente levariam muito tempo até que acidental-
mente se deparassem com o comportamento correto.
Existem muitos comportamentos complexos, va-
riando desde o conserto de carros até a administração 
de um zoológico, e que não esperamos que ocorram na-
turalmente como parte do comportamento espontâneo 
de alguém. Já que esses comportamentos nunca ocor-
reriam naturalmente, não existiria a oportunidade de re-
forçá-los. Todavia, existe um procedimento, conhecido 
como modelagem, que pode ser usado para orientar alguém a 
realizar o comportamento adequado. Modelagem é o proces-
so de ensinar um comportamento complexo reforçando apro-
ximações cada vez maiores do comportamento desejado. Na 
modelagem, começa-se reforçando qualquer comportamento 
que seja de alguma forma semelhante ao que se quer que a pes-
soa aprenda. A seguir, são reforçadas apenas respostas que são 
mais próximas do comportamento que se quer por fim ensinar. 
No final, é reforçada apenas a resposta desejada. Cada passo na 
modelagem, então, afasta-se apenas um pouco do comporta-
mento previamente aprendido, permitindo que a pessoa associe 
o novo passo com o comportamento aprendido anterior.
Modelagem é o processo de ensinar 
um comportamento complexo 
reforçando aproximações cada vez 
maiores do comportamento desejado.
A modelagem permite que outras espécies aprendam 
respostas complexas que nunca ocorreriam naturalmente, 
variando desde leões pulando por argolas, golfinhos salvan-
do mergulhadores perdidos no mar ou roedores encontran-
do minas terrestres. A modelagem também subjaz a apren-
dizagem de muitas habilidades humanas complexas. Por 
modelagem Processo de ensinar 
um comportamento complexo 
reforçando aproximações cada 
vez maiores do comportamento 
desejado.Os seus hábitos de estudo seguem um esquema de intervalo fixo?
PsychSmart_05.indd 136PsychSmart_05.indd 136 07/03/12 17:2407/03/12 17:24
Aprendizagem • 137
exemplo, a habilidade de participar de uma aula de psicolo-
gia da faculdade é modelada desde as primeiras experiências 
de sala de aula, quando crianças. Comportamentos como 
prestar atenção e concentrar-se, por exemplo, são muito me-
nos aparentes na pré-escola do que em uma sala de faculda-
de. Ao longo dos anos, somos recompensados por aproxi-
mações cada vez maiores dos comportamentos de atenção e 
concentração desejados.
Comparando o condicionamento clássico e o ope-
rante Consideramos o condicionamento clássico e o con-
dicionamento operante como dois processos completamente 
diferentes. E há diversas distinções-chave entre as duas for-
mas de aprendizagem. Por exemplo, os conceitos-chave no 
condicionamento clássico são as associações entre estímulos 
e as respostas reflexas que temos, ao passo que no condi-
cionamento operante o conceito-chave é criar uma resposta 
voluntária para obter reforço.
ANÁLISE DE COMPORTAMENTO E 
MODIFICAÇÃO DE COMPORTAMENTO
Duas pessoas que vinham morando juntas há três anos co-
meçaram a brigar frequentemente. As questões de conflito 
variavam desde quem deveria lavar os pratos até a qualidade 
de sua vida amorosa.
Perturbado, o casal foi ver um analista de comportamen-
to, um psicólogo que se especializa em técnicas de modifica-
ção de comportamento. Ele pediu a ambos os parceiros que 
mantivessem um registro escrito detalhado de suas interações 
ao longo das próximas duas semanas.
Quando voltaram com as informações, o analista cuida-
dosamente revisou os registros com eles. Ao fazer isso, ele 
notou um padrão: cada uma de suas brigas ocorreu logo após 
algum deles ter deixado de fazer alguma tarefa de casa, tal 
como deixar os pratos sujos na pia ou pendurar roupas na 
única cadeira do quarto.
Usando as informações que o casal coletara, o analista 
de comportamento pediu a ambos os parceiros que listas-
sem todas as tarefas que poderiam surgir e que cada um lhes 
pense PSICO
conecte-se
Modelagem
> > > Tendo em vista o que você aprendeu sobre o con-
dicionamento clássico e o operante, você acha que Declan, 
o cão farejador de bombas e de drogas descrito no início 
desse capítulo, aprendeu suas habilidades específicas princi-
palmente pelo condicionamento clássico ou pelo condicio-
namento operante? Por quê? Se você já teve um cãozinho, 
que técnicas de condicionamento você usou para treiná-lo?
Aceite o desafio PsychSmart! Torne-se um treinador 
de pássaros. Treine Jingles, a arara, a tocar o sino. Depois 
responda à questão 9 do Pop Quiz na p. 147 para garantir 
que você entendeu a modelagem.
Conceito Condicionamento clássico Condicionamento operante
Princípio 
básico
Construir associações entre um estímulo 
condicionado e uma resposta condicionada
Reforço aumenta a frequência do comportamento que 
o precedeu; punição diminui a frequência do 
comportamento que a precedeu.
Natureza do
comportamento
Baseado em comportamento involuntário, 
natural e inato. O comportamento é eliciado
pelo estímulo condicionado ou não condicionado.
Organismo opera voluntariamente em seu ambiente para
produzir um resultado desejado. Após o comportamento 
ocorrer, a probabilidade de o comportamento ocorrer 
novamente é maior ou menor dependendo das 
consequências do comportamento.
Ordem dos 
eventos
Antes do condicionamento, um estímulo não condicionado
leva a uma resposta não condicionada. Após o condicio-
namento, um estímulo condicionado leva a uma 
 resposta condicionada.
Reforço resulta em aumento do 
comportamento; punição resulta 
em diminuição do comportamento.
Exemplo Após um médico dar a uma criança
uma série de injeções dolorosas
(um estímulo não condicionado) 
que produz uma reação emocional 
(uma resposta não condicionada), 
a criança desenvolve uma reação 
emocional (uma resposta 
condicionada) sempre que vê o 
médico (o estímulo condicionado).
Um estudante que, após estudar 
bastante para uma prova, ganha 
um 10 (o reforço positivo) tem 
maior probabilidade de estudar 
bastante no futuro. Um estudante 
que, após sair para beber na 
noite antes da prova, é reprovado 
(punição) tem menor probabilidade 
de sair para beber na noite anterior a uma prova.
Condicionamentos clássico
e operante comparados
PsychSmart_05.indd 137PsychSmart_05.indd 137 07/03/12 17:2407/03/12 17:24
138 • PSICO
atribuísse um valor dependendo do quanto tempo ela demo-
rasse para ser realizada. Depois, ele os fez dividir as tarefas 
igualmente e concordar em um contrato escrito em cumprir 
as tarefas a eles atribuídas. Se algum deles deixasse de cum-
prir suas tarefas, teria de depositar um dólar por ponto em 
um fundo para o outro gastar. Eles também concordaram em 
realizar um programa de elogio verbal, prometendo recom-
pensar um ao outro por completar uma tarefa.
Ambos os parceiros concordaram em experimentar o 
programa por um mês e manter registros cuidadosos do nú-
mero de brigas que tivessem durante aquele período. Para sua 
surpresa, o número decaiu rapidamente.
Esse caso ilustra a modificação de comportamento, 
uma técnica formalizada para aumentar a frequência dos 
comportamentos desejados e 
diminuir a incidência dos in-
desejados. Usando os princí-
pios básicos da teoria da 
aprendizagem, técnicas de 
modificação de comporta-
mento se provaram úteis em 
diversas situações. Por exemplo, pessoas com retardo mental 
grave começaram a se vestir e a se alimentar sozinhas pela 
primeira vez em suas vidas como resultado da modificação 
de comportamento. A modificação de comportamento tam-
bém ajudou pessoas a perder peso, deixar de fumar e se com-
portar com mais segurança (Delinsky, Latner e Wilson, 2006; 
Ntinas, 2007; Wadden, Crerand e Brock, 2005).
As técnicas usadas por analistas de comportamento são tão 
variadas quanto a lista de processos que modificam o comporta-
mento. Esses processos incluem esquemas de reforço, modela-
gem, treinamento de generalização e extinção. Os participantes 
de um programa de modificação de comportamento, contudo, 
costumam seguir uma série de passos básicos semelhantes:
 • Identificar objetivos e comportamentos-alvo. O primei-
ro passo é definir o comportamento desejado. É um au-
mento no tempo que se passa estudando? Uma perda de 
peso? Um aumento no uso da linguagem? Uma redução 
na agressividade demonstrada por uma criança? Os ob-
jetivos devem ser declarados em termos observáveis e 
indicar alvos específicos. Por exemplo, um objetivo pode 
ser “aumentar o tempo de estudo”, ao passo que o com-
portamento-alvo seria “estudar ao menos duas horas por 
dia em dias de semana e uma hora por dia aos sábados”.
 • Criar um sistema de registro de informações e registrar 
informações preliminares. Para determinar se um com-
portamento mudou, devem-se coletar dados antes que 
mudanças sejam feitas na situação. Essa informação for-
nece uma linha de base contra a qual mudanças futuras 
podem ser mensuradas.
 • Selecionar uma estratégia de modificação de comporta-
mento. O passo mais importante é selecionar uma estra-
tégia adequada. Já que todos os princípios da aprendi-
zagem podem ser empregados para gerar uma mudança 
no comportamento, um “pacote” de tratamentos normal-
mente é usado. Isso pode incluir o uso sistemático de 
reforço positivo para o comportamento desejado (elogio 
verbal ou algo mais tangível, como comida), assim como 
um programa de extinção para comportamento indeseja-
do (ignorar uma criança que fica de birra). Selecionar os 
reforços certos é decisivo, e pode ser necessário experi-
mentar um pouco para descobrir o que é importante para 
um indivíduo em particular.
 • Implementar o programa. É provável que o aspecto mais 
importante da implementação do programa seja a con-
sistência. Também é importante reforçar o comporta-
mento pretendido. Por exemplo, imagine que uma mãe 
quer que a filha passemais tempo fazendo as lições de 
casa, mas assim que a menina senta para estudar, pede 
um lanche. Se a mãe pegar um lanche para ela, é pro-
vável que ela esteja reforçando a tática de postergar da 
filha, e não seus estudos.
 • Manter registros cuidadosos após o programa ser im-
plementado. Outra tarefa crucial é manter o registro. Se 
os comportamentos-alvo não são monitorados, não há 
como saber se o programa de fato está tendo sucesso.
 • Avaliar e alterar o programa em andamento. Por fim, os re-
sultados do programa devem ser comparados com os dados 
de pré-implementação de linha de base, para determinar a 
eficácia do programa. Se o programa tiver sido bem-suce-
dido, os procedimentos empregados podem ser retirados 
gradualmente. Por exemplo, se o programa necessitava de 
reforço a cada vez que era preciso pegar as roupas do chão 
do quarto, o esquema de reforço poderia ser trocado por 
um esquema de razão fixa em que houvesse reforçamento 
a cada três vezes. Todavia, se o programa não tiver tido 
sucesso em gerar a mudança desejada de comportamento, 
pode ser bom considerar outras abordagens.
Técnicas de mudança de comportamento baseadas nes-
ses princípios gerais obtiveram bastante sucesso e se mostra-
ram um dos melhores modos de modificar comportamentos. 
Claramente, é possível empregar as noções básicas da teoria 
da aprendizagem para melhorar nossas vidas.
>> Abordagens cognitivas da 
aprendizagem
Considere o que acontece quando as pessoas aprendem a di-
rigir um carro. Elas não sentam na frente da direção e tateiam 
até aleatoriamente encaixar a chave na ignição e, depois, após 
muitos começos em falso, acidentalmente conseguem fazer o 
carro se mover para frente, assim recebendo reforço positi-
vo. Pois é desse jeito que aconteceria se o condicionamento 
fosse o único tipo de aprendizagem. Na vida real, contudo, 
o condicionamento é só uma parte de como aprendemos 
comportamentos complexos. Por exemplo, já conhecemos 
os elementos básicos da direção devido a nossa experiência 
anterior como passageiros, quando provavelmente notamos 
como a chave era inserida na ignição, o carro era manobrado 
e o acelerador era apertado para fazer o carro seguir adiante.
Claramente, nem toda a aprendizagem pode ser expli-
cada por paradigmas de condicionamento clássico e ope-
rante. De fato, atividades como aprender a dirigir um carro 
implicam que alguns tipos de aprendizagem devem envolver 
processos de ordem maior em que os pensamentos e as me-
mórias das pessoas, e as formas como elas processam a infor-
modificação de 
comportamento Técnica 
formalizada para aumentar a 
frequência dos comportamentos 
desejados e diminuir a incidência dos 
indesejados.
PsychSmart_05.indd 138PsychSmart_05.indd 138 07/03/12 17:2407/03/12 17:24
Aprendizagem • 139
mação, dão conta de suas respostas. Tais situações depõem 
contra a aprendizagem como a aquisição automática, mecâ-
nica e impensada de associações entre estímulos e respostas, 
como no condicionamento clássico, ou a apresentação de re-
forço, como no condicionamento operante.
Alguns psicólogos enxergam a aprendizagem em termos 
de processos de pensamento, chamados de cognições, que a 
subjazem – uma abordagem conhecida como teoria cogniti-
va da aprendizagem. Apesar de os psicólogos que traba-
lham a partir da perspectiva cognitiva da aprendizagem não 
negarem a importância dos condicionamentos clássico e ope-
rante, eles desenvolveram abordagens que se concentram nos 
processos mentais invisíveis que ocorrem durante a aprendi-
zagem, ao invés de se concentrar apenas em estímulos, res-
postas e reforços externos. Por exemplo, dois tipos de apren-
dizagem que não podem ser explicados pelos conceitos do 
condicionamento clássico ou do operante são a aprendiza-
gem latente e a aprendizagem por observação.
APRENDIZAGEM LATENTE
As primeiras evidências da importância dos processos cog-
nitivos vêm de uma série de experimentos com animais que 
revelaram um tipo de aprendizagem cognitiva chamada de 
aprendizagem latente. Na aprendizagem latente, um novo 
comportamento é aprendido, mas não demonstrado, até que lhe 
seja dado algum incentivo para isso (Tolman e Honzik, 1930). 
Ou seja, a aprendizagem latente ocorre sem o reforço.
Nos estudos que demonstram a aprendizagem 
latente, os psicólogos examinaram o comportamen-
to de ratos em um labirinto – como o demonstrado 
na página 140. Em um experimento, os ratos eram 
designados aleatoriamente a uma das três condições 
experimentais. Um grupo de ratos podia passear pelo 
labirinto uma vez por dia durante 17 dias, mas sem 
nunca receber uma recompensa. Compreensivel-
mente, esses ratos cometiam muitos erros e demo-
ravam relativamente bastante tempo até alcançarem 
o final do labirinto. Um segundo grupo, contudo, 
sempre recebia comida no final do labirinto. Não é 
de surpreender que esses ratos aprenderam a correr 
rápida e diretamente até a caixa de comida, cometen-
do poucos erros.
Um terceiro grupo de ratos começou na mesma situação 
em que os ratos que não recebiam recompensas, mas só nos 
primeiros 10 dias. No 11º dia, foi introduzida uma manipulação 
experimental crítica: daquele ponto em diante, os ratos nesse 
grupo passaram a receber comida ao completarem o labirinto. 
Os resultados da manipulação foram surpreendentes. Os ratos 
que não recebiam recompensas, que pareciam percorrer o la-
birinto ao acaso, demonstraram tamanha redução no tempo de 
corrida e tal declínio em índices de erros que seu desempenho 
igualou quase imediatamente 
o do grupo que recebia recom-
pensas desde o começo.
Para os teóricos cogniti-
vos, parecia claro que os ratos 
não recompensados haviam 
aprendido o plano do labirinto 
no início de suas explorações; 
eles só nunca demonstraram 
sua aprendizagem latente até 
o reforço ser oferecido. Ao 
invés disso, aqueles ratos pa-
receram desenvolver um mapa cognitivo do labirinto – uma 
representação mental de localizações e direções espaciais.
teoria cognitiva da 
aprendizagem Abordagem ao 
estudo da aprendizagem que se foca 
nos processos de pensamento que 
subjazem a aprendizagem.
aprendizagem latente 
Aprendizagem em que um novo 
comportamento é adquirido, mas 
não é demonstrado, até que seja 
fornecido algum incentivo para 
demonstrá-lo.
Aprender a dirigir um carro é um exemplo de uma abordagem cognitiva da 
aprendizagem.
DICA DE ESTUDO
Lembre-se de que a abordagem cognitiva da 
aprendizagem se foca nos pensamentos 
e expectativas internos dos aprendizes, 
ao passo que as abordagens do 
condicionamento clássico e do operante 
se focam em estímulos, respostas e 
reforços externos.
DICDIC
Lemb
apr
e 
a
A aprendizagem latente 
ocorre sem reforço.
©
 T
he
 N
ew
 Y
or
ke
r C
ol
le
ct
io
n 
19
95
 G
ah
an
 W
ils
on
, e
xt
ra
íd
o 
de
ca
rt
oo
nb
an
k.
co
m
. T
od
os
 o
s 
di
re
ito
s 
re
se
rv
ad
os
.
PsychSmart_05.indd 139PsychSmart_05.indd 139 07/03/12 17:2407/03/12 17:24
140 • PSICO
As pessoas também desenvolvem mapas 
cognitivos de seus arredores. Por exemplo, a 
aprendizagem 
latente pode 
ajudá-lo a saber 
a localização 
de uma loja de 
utensílios de cozinha em um pequeno shopping 
que você visita com frequência, mesmo que nun-
ca tenha entrado na loja nem goste de cozinhar.
A possibilidade de que desenvolvamos 
nossos mapas cognitivos por meio da aprendi-
zagem latente apresenta uma espécie de pro-
blema para os teóricos ortodoxos do condicionamento ope-
rante. Se considerarmos os resultados do experimento sobre 
a aprendizagem do labirinto, por exemplo, não poderemos 
ver claramente qual reforço permitiu que os ratos que inicial-
mente não receberam nenhuma recompensa aprendessem a 
estrutura do labirinto, já que não havia nenhum reforçador 
presente óbvio. Em vez disso, os resultados 
sustentam uma visão cognitiva da aprendiza-
gem, em que mudanças ocorrem em proces-
sos mentais não observáveis (Beatty, 2002; 
Frensch e Rünger, 2003; Stouffer e White, 
2006; Voicu e Schmajuk, 2002).
APRENDIZAGEMPOR 
OBSERVAÇÃO: APRENDENDO 
POR MEIO DA IMITAÇÃO
Vamos voltar por um momento para o caso da 
pessoa que está aprendendo a dirigir. Como podemos dar 
conta de instâncias em que um indivíduo sem experiência 
direta com a execução de um comportamento em especí-
fico aprende o comportamento e a seguir o executa? Para 
responder a essa pergunta, os psicólogos se focaram em ou-
tro aspecto cognitivo da aprendizagem: a aprendizagem por 
observação.
De acordo com o psicólogo Albert Bandura e seus co-
laboradores, uma grande parte da aprendizagem humana 
consiste de aprendizagem por observação, que é a apren-
dizagem ao observar o comportamento de outra pessoa, 
ou modelo. Devido à sua dependência da observação de 
outros – um fenômeno social –, a perspectiva adotada por 
Bandura é frequentemente referida como uma abordagem 
sociocognitiva para a aprendizagem (Bandura, 1999, 2004).
Bandura demonstrou a habilidade dos modelos de es-
timular a aprendizagem com um experimento clássico. No 
estudo, crianças pequenas viram um filme de um adulto ba-
tendo selvagemente em um boneco inflável de 1,5 m chama-
Final
Cortina de
ida e volta
Cortina só
de ida
10
N
úm
er
o 
m
éd
io
 d
e 
er
ro
s
Dias
2
4
6
8
Grupo experimental
Controle
recompensado
Controle não
recompensado
Início
Começam a
recompensar
grupo experimental
por completar o
labirinto com sucesso.
Aprendizagem latente
em ratos
0 2 4 6 8 10 12 14 16 18 Fo
nt
e: T
ol
m
as
 e
 H
on
zi
k,
 1
93
0.
Uma vez por dia durante 17 dias os ratos podiam correr pelo labirinto. Os 
ratos que nunca eram recompensados (condição controle não recompensada) 
cometiam muitos erros consistentemente. Os ratos que recebiam comida 
toda vez que completavam o labirinto (condição controle recompensada) 
cometiam muito menos erros. O grupo experimental inicialmente não era 
recompensado, mas passou a ser recompensado no 10º dia. Logo, seu índice de 
erros caiu para mais ou menos o mesmo nível dos controles recompensados. 
Aparentemente, esse grupo havia 
desenvolvido um mapa cognitivo 
do labirinto e demonstrou sua 
aprendizagem latente quando 
foi recompensado por 
completar o labirinto com 
sucesso.
aprendizagem por observação 
Aprendizagem ao observar o 
comportamento de outra pessoa ou 
modelo.
Aprender realmente modifica o seu cérebro! 
Quando você aprende novas informações, 
os neurônios no seu cérebro ficam mais 
bem interligados ou programados. 
Quanto mais você usa a informação, 
mais fortes serão essas interligações – 
e por mais tempo você irá retê-la.
Você sabia?
bro! 
s, 
PsychSmart_05.indd 140PsychSmart_05.indd 140 07/03/12 17:2407/03/12 17:24
Aprendizagem • 141
do de boneco Bobo (Bandura, Ross e Ross, 1963a, 1963b). 
Depois, as crianças recebiam a oportunidade de brincar com 
o boneco Bobo, e, é claro, a maioria demonstrou o mesmo 
tipo de comportamento, em alguns casos imitando quase 
identicamente o comportamento agressivo.
A aprendizagem por observação é particularmente im-
portante para adquirir habilidades em que a técnica de mode-
lagem do condicionamento operante não é apropriada. Pilotar 
um avião e realizar cirurgia cerebral, por exemplo, são com-
portamentos que dificilmente podem ser aprendidos usando 
métodos de tentativa e erro sem sérias consequências – lite-
ralmente – para os envolvidos no processo de aprendizagem.
Nem todo o comportamento que observamos é apren-
dido ou executado, é claro. Um fator crucial que determina 
se iremos imitar um modelo mais tarde é se o modelo 
é recompensado pelo seu comportamento. Se observar-
mos um amigo ser recompensado por passar mais tempo 
estudando recebendo notas mais altas, é mais provável 
que imitemos o seu comportamento do que se o com-
portamento resultasse apenas em estresse e cansaço. 
Modelos que são recompensados por se comportar 
de um modo específico têm maior propensão a se-
rem imitados do que modelos que recebem punição. 
Observar a punição de um modelo, no entanto, não 
necessariamente impede observadores de aprender o 
comportamento. Os observadores ainda podem descrever 
o comportamento do modelo – serão apenas menos pro-
pensos a imitá-lo (Bandura, 1977, 1986, 1994).
A aprendizagem por observação fornece uma estru-
tura para compreender diversas questões importantes re-
lacionadas ao quanto as pessoas aprendem simplesmente 
por observar o comportamento dos outros. Por exemplo, 
assistir a violência na televisão nos torna mais violentos?
VIOLÊNCIA NA TELEVISÃO E NOS 
VIDEOGAMES: A MENSAGEM DA MÍDIA 
IMPORTA?
Em um episódio da série de TV Os Sopranos, o mafioso 
fictício Tony Soprano assassinou um de seus associados. 
Laranja mecânica
Um jovem britânico 
ultraviolento, preso por 
estupro e assassinato, se 
voluntaria para participar de 
um programa experimental em 
que o condicionamento clássico 
e a terapia de aversão são 
usados na tentativa de reabilitá-lo.
Sob o domínio do mal
Os efeitos do condicionamento 
clássico e da hipnose nesse filme são 
tão poderosos que transformam um soldado leal 
em um perigoso assassino.
Nosso querido Bob
Bob usa estratégias de modelagem (reforçando 
“passos de tartaruga”) do livro do seu psicólogo 
para tentar superar seus medos e ansiedades 
irracionais.
Cartas na mesa
Os cassinos ganham dinheiro com o poder dos 
esquemas intermitentes de reforço. O personagem 
principal deste filme vive uma luta contra seu vício 
em jogo.
Eu, você e todos nós
Robby tem 5 anos e passa muito tempo com 
o irmão no computador. Ele desenvolve tanto 
suas habilidades computacionais por meio da 
aprendizagem por observação que entra em um 
bate-papo adulto e arranja um encontro com uma 
mulher no parque.
s
é
m
n
c
o
p
o.
 
P
si
c
o
lo
g
ia
no
C
in
e
m
a
DICA DE ESTUDO
Um ponto-chave da abordagem da 
aprendizagem por observação é que o 
comportamento de modelos que são 
recompensados tem maior chance de 
ser imitado do que o comportamento 
pelo qual o modelo é punido.
DICDIC
Um p
apr
co
r
PsychSmart_05.indd 141PsychSmart_05.indd 141 07/03/12 17:2407/03/12 17:24
142 • PSICO
Para dificultar a identificação do cor-
po, Soprano e um de seus capangas 
desmembraram o corpo e jogaram os pedaços fora.
Alguns meses depois, dois meio-irmãos da vida real em 
Riverside, na Califórnia, estrangularam a mãe e cortaram a 
cabeça e as mãos do corpo. Victor Bautista, 20, e Matthew 
Montejo, 15, foram pegos pela polícia depois de um segu-
rança ter percebido que havia um pé saltando para fora de 
um pacote que eles estavam tentando jogar em uma lixeira. 
Eles disseram à polícia que o plano de desmembrar a mãe foi 
e inspirado no episódio de Os Sopranos (Martelle, Hanley e 
Yoshino, 2003).
Como outros assassinatos imitando a mídia, a brutali-
dade a sangue frio dos irmãos levanta uma questão crítica: 
observar atos violentos e antissociais na mídia leva os espec-
tadores a se comportar de maneiras semelhantes? Já que pes-
quisas sobre modelos mostram que as pessoas frequentemen-
te aprendem e imitam a agressividade que observam, essa 
pergunta está entre as questões mais importantes estudadas 
por psicólogos.
Com certeza, a quantidade de violência na mídia de mas-
sas é enorme. Na época em que estiver deixando o ensino 
fundamental, uma criança comum nos Estados Unidos terá 
assistido a mais de 8 mil assassinatos e 800 mil atos violentos 
na televisão a cabo (Huston et al., 1992; Mifflin, 1998).
A maior parte dos especialistas concorda que assistir a 
níveis elevados de violência na mídia torna os espectadores 
mais suscetíveis a agir agressivamente, e pesquisas recentes 
sustentam essa afirmação. Por exemplo, um levantamento 
com criminosos jovens agressivos do sexo masculino encar-
cerados na Flórida mostrou que um quarto deles havia ten-
tado cometer um crime inspirado no que vira na mídia (Su-
rette, 2002). Uma proporção significativa desses criminosos 
adolescentes afirmou que prestava bastante atenção na mídia.
Videogames violentos também foram associados a