Buscar

Aula 8 Esquemas de Reforço.pptx

Prévia do material em texto

Esquemas	de	Reforçamento	
Como	explicamos?	
•  Por	que	as	pessoas	viciam-se	em	jogos	de	azar?	
•  Se	no	começo	do	mês,	a	resposta	de	ir	ao	banco	é	reforçada	
com	o	saque	de	dinheiro,	por	que	não	se	repete	durante	todo	
o	mês?	
•  Por	que	começamos	a	estudar	apenas	na	véspera	das	provas?	
•  Por	que	as	pessoas	ainda	torcem	para	o	“Palmares	não	tem	
mundial”,	se	o	time	raramente	vence?	
Esquemas	de	reforçamento	
•  Nem	todas	as	respostas	são	reforçadas	quando	
emitidas	–	intermitentemente	reforçadas	
•  Esquemas	de	reforçamento:	critério	que	uma	
resposta,	ou	conjunto	de	respostas,	deve	atingir	para	
que	ocorra	o	reforçamento	ou;	
Regras	que	especificam	as	relações	entre	respostas	e	
reforços	
Esquemas	de	reforçamento	
•  Reforço	Contínuo	(CRF	–	continuous	reinforcement)	
–  Toda	resposta	é	seguida	do	reforçador	
–  Menos	comum	na	vida	cotidiana	
–  Ex.:	choro	de	bebê,	birra	de	criança,	etc.	
•  Reforço	Intermitente	
–  Apenas	algumas	respostas	são	seguidas	de	reforço	
–  Mais	comum	na	vida	cotidiana	
–  Ex.:	pregar	um	prego,	procurar	filme	no	Netflix,	
comportamento	verbal,	etc.	
Esquemas	de	Reforçamento	Intermitente	
Quatro	tipos	principais:	FR,	VR,	FI	e	VI	
	
a)  Esquemas	de	razão:	de	acordo	com	o	nº	de	respostas	para	
cada	reforçador	(FR/VR)	
b)  Esquemas	de	intervalo:	de	acordo	com	o	tempo	entre	
reforçadores	(FI/VI)	
c)  Razão	ou	intervalo	fixos:	nº	de	respostas	ou	tempo	entre	
reforçadores	é	sempre	o	memos	(fixos	–	FI/FR)	
d)  Razão	ou	intervalo	variáveis:	nº	de	respostas	ou	tempo	
entre	reforçadores	é	variável	(VI/VR)	
Esquemas	de	Razão	
•  Exige	um	certo	número	de	respostas	para	a	
apresentação	de	cada	reforçador	
•  Razão	Fixa	(FR)	
–  O	nº	de	respostas	exigido	para	a	apresentação	de	cada	
reforçador	é	sempre	o	mesmo	
–  Ex.:	aula	de	Ed.	Física	(FR5),	trabalhador	que	recebe	por	nº	
de	peças	produzidas,	corrigir	provas,	chamada	telefonica,	
subir	degraus	de	escada	
–  Difícil	encontrar	exemplos	de	razão	fixa	–	ambiente	
mutável	
Esquemas	de	Razão	
•  Razão	Variável	(VR)	
–  O	nº	de	respostas	exigido	para	a	apresentação	de	cada	
reforçador	é	variável	
–  Ex.:	fazer	a	barba,	escovar	os	dentes,	fazer	pedidos,	
ordens,	jogos	de	azar	etc.	
–  VR5	=	o	reforçador	é	apresentado	após	a	ocorrência	de	5	
respostas,	em	média	
Esquemas	de	Intervalo	
•  Nº	de	respostas	não	é	relevante,	basta	apenas	a	
ocorrência	de	uma	resposta	para	produzir	o	
reforçador	
•  Tempo	decorrido	desde	o	último	reforçador	é	o	
determinante	para	uma	resposta	produzir	ou	não	o	
reforçador	
•  Intervalo	entre	o	último	reforçador	e	a	
disponibilidade	do	próximo	
Esquemas	de	Intervalo	
•  Intervalo	Fixo	(FI)	
–  Período	entre	o	último	reforçador	e	a	disponibilidade	do	
próximo	é	sempre	o	mesmo	
–  Ex.:	eventos	regulares	–	programas	de	TV,	metrô/trem	em	
Londres	(resposta	de	olhar),	colocar	água	pra	ferver,	etc.	
–  Além	do	intervalo	de	tempo,	deve	ocorrer	ao	menos	uma	
resposta!	
–  FI20”	–	intervalo	fixo	de	20	segundos	
Esquemas	de	Intervalo	
•  Intervalo	Variável	(VI)	
–  Período	entre	o	último	reforçador	e	a	disponibilidade	do	
próximo	é	variável.	
–  Ex.:	achar	música	no	rádio,	procurar	emprego,	metrô/trem	
em	São	Paulo	(resposta	de	olhar).	
–  Além	do	intervalo	de	tempo,	deve	ocorrer	ao	menos	uma	
resposta!	
–  VI5”	–	intervalo	fixo	5	segundos	
Esquemas	de	Intervalo	
•  Tempo	de	Disponibilidade	(limited	hold)	
–  Os	reforçadores	não	ficam	disponíveis	indefinidamente	
–  Limite	temporal	para	a	resposta	ser	emitida.	Usado	para	
aumentar	similaridade	em	situações	experimentais	ao	
cotidiano	
–  Ex.:	programa	de	TV,	metrô/trem	etc.	
–  FI5’	limited	hold	30”	
Comparação	entre	esquemas	intermitentes	e	
contínuo	(CRF)	
•  Frequência	de	Respostas	
–  Intermitentes	produzem	frequência	maior	de	respostas	
–  Relação	maior	de	respostas	por	reforço	
–  No	caso	de	reforçadores	incondicionados,	saciação	ocorre	
mais	rapidamente	no	CRF	
•  Aquisição	do	comportamento	
–  CRF	mais	eficaz	para	aquisição	de	novo	comportamento	
–  Intermitentes:	no	início,	respostas	não	reforçadas	
poderiam	entrar	em	extinção	mais	rapidamente	
Comparação	entre	esquemas	intermitentes	e	
contínuo	(CRF)	
•  Manutenção	do	comportamento	
–  Intermitentes	são	ideais	para	a	manutenção	do	
comportamento	
–  Aumentam	a	resistência	à	extinção,	já	que	muitas	
respostas	não	são	reforçadas	
–  Mais	difícil	a	discriminação	entre	o	reforçamento	
intermitente	e	o	não	reforçamento	da	extinção	
Comparação	entre	esquemas	intermitentes	e	
contínuo	(CRF)	
•  Efeitos	sobre	a	extinção	
–  Padrões	comportamentais	na	extinção	após	esquemas	
intermitentes	difere	dos	padrões	após	esquema	contínuo	
–  Efeitos	mais	amenos	
–  Sem	respostas	emocionais,	nem	aumento	súbito	da	
frequência	da	resposta	
–  Diminuição	do	responder	também	é	mais	lenta	
	
Padrões	de	cada	esquema	
•  Cada	esquema	produz	um	padrão	comportamental	
característico	em	estabilidade	
•  Dados	de	Transição	
–  Observado	quando	o	organismo	acabou	de	ser	submetido	
ao	novo	esquema	
–  Padrão	comportamental	tem	características	do	antigo	
esquema	e	do	novo	
•  Estado	Estável	
–  Comportamento	já	se	adaptou	ao	novo	esquema	e	não	
mudará	mais	
–  Organismo	precisa	ser	submetido	a	varias	sessões	do	
esquema	
Padrões	de	cada	esquema	
Padrão	de	FR	
•  Taxa	alta	de	respostas	
–  Quanto	mais	resposta,	mais	reforços	
•  Pausa	pós-reforçamento	
–  Organismo	não	é	reforçado	logo	após	um	
reforçamento	anterior	
–  Reforço	sinaliza	que	as	próximas	
respostas	não	serão	reforçadas,	tornando	
o	responder	menos	provável	
–  A	medida	que	começa	a	responder,	suas	
respostas	atingem	rapidamente	uma	taxa	
alta	constante	que	permanece	até	o	
reforço	(ex.,	abdominal)	
Padrão	de	VR	
•  Taxa	alta	de	resposta	
–  Esquema	que	produz	maiores	taxas	
•  Ausência	de	pausa	pós-reforçamento	
–  Ausência	de	pausas	ou	pausas	curtas	–	
não	é	possível	discriminar	se	o	reforço	
será	liberado	com	muitas	ou	poucas	
respostas	
–  Ex.:	jogos	de	azar	
Padrão	de	FI	
•  Menores	taxas	de	respostas	
–  Não	é	exigido	um	nº	de	respostas,	basta	
apenas	uma	
•  Pausa	pós-reforçamento	
–  Produz	maiores	pausa	pós-reforçamento	
–  Discriminação	temporal	entre	reforçamento	
e	não-reforçamento	facilitada	pelas	
regularidade	das	durações	dos	intervalos	
entre	reforçamento	
–  Longas	pausa	pós-reforçamento,	com	início	
lento	do	responder	e	aumento	gradual	na	
taxa	de	respostas	
–  Aceleração	no	responder	-	scalop	
Padrão	de	VI	
•  Taxa	relativamente	alta	e	constante	de	
respostas	
•  Não	tem	como	prever	quando	o	
reforçador	estará	disponível	
•  Permanecerá	respondendo	quase	o	
tempo	todo,	moderadamente	
•  Ex.:	olhar	para	ônibus	em	São	Paulo	
Efeito	do	tamanho	do	esquema	
•  Esquemas	de	razão:	
–  Quanto	maior	o	valor	do	esquema,	maior	a	frequência	de	
respostas	
–  Maiores	as	pausas	pós-reforçamento	
•  Esquemas	de	intervalo:	
–  Quanto	maior	o	valor	do	esquema,	menores	serão	as	
frequências	de	respostas	
–  Maiores	as	pausas	pós-reforçamento	
Controle	de	Estímulos:	
discriminação	e	generalização	
Controle	de	Estímulos	
•  “Embora	a	resposta	seja	livre	para	ocorrer	em	um	
número	muito	grande	de	situações	estimuladoras,	
ela	será	efetiva	na	produção	de	reforçamento	
somente	em	uma	pequena	parte	delas”	(Skinner,	
1966,	p.	177)	
•  Por	que	nos	comportamos	de	formas	diferentes	em	
situações	diferentes?	
Controle	de	Estímulos	
•  Controle:	 descreve	 relações	 entre	 eventos	
ambientais	e	do	organismo	
•  Controle	 de	 estímulos:	 influência	 dos	 estímulos	
antecedentes	sobre	as	respostas	
•  Importante	 para	 compreensão	 de	 comportamentos	
humanos	 complexos,	 como	 o	 conhecimento	 do	
mundo	e	de	si	próprio	
Controle	de	Estímulos	
•  Descrição	do	comportamento	operante	envolveduas	
relações:	
1.  Relação	resposta	e	sua	consequência	
2.  Relação	entre	a	resposta	e	os	estímulos	que	a	
antecedem	
•  Sensibilidade	a	estímulos	que	antecedem	a	resposta	
é	produto	evolucionário	
Controle	de	Estímulos	
•  Discriminação:	organismo	passa	a	responder	sempre	
que	estiver	presente	o	estímulo	que	estava	presente	
na	 ocasião	 do	 reforçamento	 e	 a	 não	 responder	 em	
outras	situações.	
•  Estímulo	antecedente	estabelece	a	ocasião	na	qual	a	
resposta	será	reforçada.	
•  Processo	 de	 estabelecimento	 das	 discriminações	
envolve	história	de	reforçamento	diferencial.	
Antecedente	1														R																		Consequência																
Presença	da	mãe							choro																			atenção	
	
Antecedente	2														R																		Consequência	
Presença	do	pai								choro																				atenção	
	
EXTINÇÃO	
Discriminação	
REFORÇO	
Controle	de	Estímulos	
•  Reforçamento	diferencial:	uma	classe	de	respostas	é	
seguida	 de	 reforço	 quando	 emitida	 na	 presença	 de	
determinados	estímulos	e	não	na	presença	de	outros	
estímulos	
•  Resultado:		
	 a)	 a	 resposta	 será	 emitida	 dependendo	 dos	
estímulos	presentes	e;		
	 b)	 a	 apresentação	 de	 determinados	 estímulos	
alterará	a	probabilidade	de	emissão	da	resposta	
	
Controle	de	Estímulos	
•  Sd	 ou	 S+	 (estímulo	 discriminativo):	 estímulo	 que	
aumenta	 a	 probabilidade	 de	 a	 resposta	 ocorrer;	
estímulo	 diante	 do	 qual	 as	 respostas	 foram	
reforçadas.	
•  SΔ	 ou	 S-	 (estímulo	 delta):	 estímulo	 que	 diminui	 a	
probabilidade	de	a	resposta	ocorrer;	estímulo	diante	
do	qual	as	respostas	não	foram	reforçadas.	
														Sd																						R																												Sr																										
	 			mãe																choro																			atenção	
	
														SΔ																						R																														Sr	
														pai																		choro																				atenção	
	
Tríplice	Contingência	
•  Unidade	básica	de	análise	do	comportamento	
Discriminação	
Dado	 1.   Uma	classe	de	resposta	
2.   Duas	condições	de	estímulo	
Procedimento	 Reforçamento	diferencial:	reforçar	a	resposta	em	uma	das	condições	
de	estímulo	(Sd)	e	não	reforçar	a	resposta	na	outra	condição	de	
estímulo	(SΔ)	
Processo	 Aumento	gradual	na	frequência	da	resposta	diante	do	Sd	
Diminuição	gradual	na	frequência	da	resposta	diante	do	SΔ	
(extinção)	
Produto	 Organismo	passa	a	responder	diante	de	Sd	e	a	não	responder	(ou	
responder	em	menor	frequência)	diante	do	SΔ	
Millenson	(1967)	
Tipos	de	Procedimentos	
•  Discriminação	 sucessiva:	 Sd	 e	 SΔ	 são	 apresentados	
um	de	cada	vez,	sucessivamente.	
–  Aspecto	crítico:	tempo	de	apresentação	do	estímulo	
	
Sd	
	
R	
	
Sr	
Sd	
	
R	
	
Sr	
SΔ	
	
R	
	
Sr	
Tipos	de	Procedimentos	
•  Discriminação	simultânea:	Sd	e	SΔ	são	apresentados	
ao	mesmo	tempo,	simultaneamente	
–  Aspecto	crítico:	posição	do	Sd	e	SΔ	
Sd	
	
R	
	
Sr	
SΔ	
	
R	
	
Sr	
Sd	
	
R	
	
Sr	
SΔ	
	
R	
	
Sr	
Sd	
	
R	
	
Sr	
SΔ	
	
R	
	
Sr

Continue navegando