Buscar

Aula 1 Natureza da inferência estatística

Prévia do material em texto

Introdução:	
A	natureza	da	inferência	estatística		
	
Prof.	Armando	Castelar	
Caracterização	Esquemática	
Problema	 Informação	 Metodologia	 Resposta	
•  Estimação	pontual	
•  Estimação	por	intervalos	
•  Teste	de	Hipótese	
Modelo	
Estatístico	
Modelo	Estatístico	
•  Modelo	Amostral:	
–  Características	da	amostra	
– Amostra:	subconjunto	de	elementos	da	população	
– Amostra	pode	ser	gerada	pelo	próprio	pesquisador	
(informações	primárias)	ou	por	um	outro	pesquisador	
(informações	secundárias)	
•  Modelo	probabilístico:	
–  Conjunto	de	todas	as	possíveis	distribuições	da	
amostra	
– Na	prática,	o	pesquisador	tem	alguma	ideia	sobre	a	
forma	da	distribuição	
População	x	amostra	
População.	Ex.:	população	de	todos	os	
alunos	da	UFRJ	
Amostra:	subconjunto	de	elementos	da	
população.	Ex.:	subconjunto	de	30	alunos	
sorteados	dentre	todos	os	alunos	da	UFRJ		
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Modelo	probabilístico	
•  Modelo	probabilístico:	conjunto	de	todas	as	possíveis	
distribuições	da	amostra	(i.e.,	do	vetor	X)	
•  Modelo	probabilístico	paramétrico:	A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
Problemas	de	Inferência	
•  Estimação	pontual:	
–  Problema	é	“saber”	o	verdadeiro	valor	de	𝜃	
•  Estimação	por	intervalos	
– Problema	é	determinar	um	intervalo	que	tenha	
uma	probabilidade	conhecida,	em	geral	elevada,	
de	conter	o	verdadeiro	valor	de	𝜃	
•  Teste	de	Hipótese	
–  Tem-se	uma	conjectura	sobre	qual		o	verdadeiro	valor	
de	𝜃	e	se	deseja	avaliar	se	a	informação	de	que	se	
dispõe	sobre	o	problema	indica	se	essa	conjectura	
está	certa	ou	errada	
Estimação	pontual	
Rx=	Conjunto	de	todos	os	possíveis	
valores	que	a	amostra	pode	assumir.	
Ex.:	todos	os	possíveis	conjuntos	de	30	
alunos	da	UFRJ	
Espaço	paramétrico	
x	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– Θ,	o	espaço	paramétrico,	é	conhecido	
– θ	é	desconhecido	
	
! ! 	
	
! . 	
	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– Θ,	o	espaço	paramétrico,	é	conhecido	
– θ	é	desconhecido	
	
! ! 	
	
! . 	
	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
Rx	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ		,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
	
!! . ,!! . 	
	
	
!! ! ,!! ! 	
	
	
Θ!						Θ!	
	
!! !!	
	
! ! 	é	um	estimador	de	!	
Intervalo	de	confiança	
x	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
Rx	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
	
!! . ,!! . 	
	
	
!! ! ,!! ! 	
	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
	
!! . ,!! . 	
	
	
!! ! ,!! ! 	
	
Teste	de	Hipótese	
Rx	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ		,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
	
!! . ,!! . 	
	
	
!! ! ,!! ! 	
	
	
Θ!						Θ!	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ		,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
	
!! . ,!! . 	
	
	
!! ! ,!! ! 	
	
	
Θ!						Θ!	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ		,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
	
!! . ,!! . 	
	
	
!! ! ,!! ! 	
	
	
Θ!						Θ!	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ		,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
	
!! . ,!! . 	
	
	
!! ! ,!! ! 	
	
	
Θ!						Θ!	
	
!! !!	
	
A	amostra	é	um	vetor	de	variáveis	aleatórias:	! = !!, !!,⋯ !! 	
	
Φ = ! !,! ; ! ! Θ 	
	
• No	modelo	paramétrico:	
– f(.)	é	conhecida,	
– x	é	um	vetor	com	n	elementos		
– !	é	um	número	real	que	representa	uma	característica	da	população	
(p.ex.,	a	altura	média	de	todos	os	alunos	e	alunas	da	UFRJ)	
– Θ		,	o	espaço	paramétrico,	é	conhecido	
– !	é	desconhecido	
	
! ! 	
	
! . 	
	
	
!! . ,!! . 	
	
	
!! ! ,!! ! 	
	
	
Θ!						Θ!	
	
!! !!	
	
Regra	de	
decisão	
Exemplo	
•  Suponha	que	a	população	de	interesse	é	o	conjunto	de	
todos	os	alunos	da	UFRJ	e	que	o	parâmetro	de	interesse	
(𝜃)	é	a	altura	média	dessa	população	
–  Vamos	chamar	𝜃	de	altura	média	populacional,	ou	
simplesmente	média	populacional	
–  Para	fazer	inferências	a	respeito	de	𝜃	vamos	selecionar	
uma	amostra,	um	subconjunto	composto	por	alguns	
alunos	da	UFRJ	
•  Estimação	pontual:	
–  Obter	uma	estimativa,	um	‘chute	educado”	de	qual	o	valor	
de	𝜃	
–  Um	bom	estimador	seria	a	altura	média	dos	alunos	na	
amostra	
–  Nós	chamamos	essa	média	de	média	amostral	
–  Vamos	supor	que	para	a	amostra	que	observamos,	essa	
média	assumiu	o	valor	de	1,7	m	
Exemplo	(cont.)	
•  Estimação	por	intervalos	
–  Vamos	achar	um	intervalo	que	tenha	uma	probabilidade	
elevada	de	conter	a	altura	média	populacional	(𝜃)	
–  Por	exemplo,	podemos	concluir	que	há	uma	probabilidade	
de	95%	de	que	o	intervalo[1,6	m,	1,8	m]	contenha	o	valor	
da	média	populacional	
•  Teste	de	Hipótese	
–  Podemos	fazer	uma	conjectura	de	que	a	média	
populacional	é	menor	do	que	1,75	m	
–  Podemos	definir	como	regra	que	se	nossa	média	amostral	
der	1,78	m	ou	mais	nós	vamos	rejeitar	nossa	conjectura	e	
se	der	menor	vamos	aceitá-la	
Pontos	Gerais	
•  Objetivo	do	curso:		
– Apresentar	os	métodos	estatísticos	que	permitem	
tirar	conclusões	sobre	as	características	de	uma	
população	com	base	em	informações	sobre	uma	
amostra.	
Caracterização	Esquemática	
Problema	 Informação	 Metodologia	 Resposta	
•  Estimação	pontual	
•  Estimação	por	intervalos	
•  Teste	de	Hipótese	
Modelo	
Estatístico	
	
	
OBRIGADO

Mais conteúdos dessa disciplina