Parâmetros e Estatísticas

•

UFBA

0

Rodrigo Marcio Vital Amaral

20.03.2018

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Bioestatística I

12.311 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1 
Parâmetros: 
Um parâmetro é uma medida usada para descrever uma característica da 
população: o valor médio (), a dispersão em torno deste valor médio (2 ) 
ou a proporção de elementos com uma determinada característica (p). 
Estatísticas: 
Uma estatística T é uma função dos valores observados na amostra. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Parâmetros e Estatísticas 
1 
População 
Amostra 
n
x
psX 
22ˆˆ 
Amostra 1 
Distribuição amostral da Média Amostral 
2 
 
1X
2X
5X
kX
4X
População 
Amostra 2 
Amostra 3 
Amostra 4 
Amostra 5 
Amostra k 
3X
x
Variável X 
2 
Teorema Limite Central (TLC) 
Dado que : 
• A variável aleatória X tem distribuição (que pode ser 
normal, ou não), com média  e desvio padrão . 
• Amostra de tamanho “n” são extraídas aleatoriamente 
dessa população. 
3 
Conclusões: 
• Na medida que o tamanho da amostra aumenta, a distribuição 
das médias amostrais tende para uma distribuição normal. 
 
• A média das médias amostrais será a média populacional. 
 
• O desvio padrão das médias amostrais será 
 x
n
x
 
4 
Teorema Limite Central (TLC) 
3 
Regras Práticas de Uso Comum: 
• Para amostras de tamanho n > 30, a distribuição das médias 
amostrais pode ser aproximada satisfatoriamente por uma 
distribuição normal. 
 
• Se a própria distribuição original tem distribuição normal, 
então as médias amostrais terão distribuição normal para 
qualquer tamanho amostral n. 
X
5 
Teorema Limite Central (TLC) 
Coeficiente de Confiança 
(1- ) 
/2 /2 
z/2 - z/2 
A distribuição normal 
padronizada o valor z/2 
é o valor crítico 
O grau de confiança é 
também chamado de 
nível de confiança ou 
coeficiente de confiança. 
Estimativa de uma Média Populacional: 
Grandes Amostras 
6 
4 
Valores críticos mais comuns: 
1 -  0,80 0,85 0,90 0,95 0,99
z/2 1,28 1,44 1,645 1,96 2,58
 /2 
 /2 1 -  
0 z/2 - z/2 
Normal(0,1) 
7 
A margem de erro, denotado por E é a diferença máxima 
provável (com probabilidade 1- ) entre a média amostral 
observada e a verdadeira média populacional  . 
X
A margem de erro pode ser obtida multiplicando-se o valor 
crítico pelo desvio padrão das médias amostrais, 
n
.zE
2


Margem de Erro 
8 
5 
Áreas de uma distribuição amostral de usada para 
fazer declarações de probabilidade sobre o erro de 
amostragem 
 /2  /2 
Distribuição amostral da 
X
(1-  )% 

X
 
n
z  2/
9 
Intervalo de Confiança IC para  
A partir de uma amostra de uma distribuição f(x,), que 
depende de um parâmetro  desconhecido, desejamos 
encontrar um intervalo aleatório que contenha  com alta 
probabilidade 
 
é chamado de intervalo IC de (1-)% de confiança para  
 
)()( xLSxLI  
    1)()(Pr xLSxLI
10 
6 
Tamanho da Amostra para estimar  
Pode-se aplicar a fórmula E também para determinar o 
tamanho da amostra que é necessário para atingir um grau de 
precisão desejado . 
Resolvendo a equação do erro em n obtemos, 
2
2







E
z
n

n
.zE
2


11 
12 
α 0.2 0.15 0.10 0.05 0.01
1-α 0.80 0.85 0.90 0.95 0.99
zα/2 1.28 1.44 1.645 1.96 2.58
Ex. :Tamanho de amostras para uma variável  =10 
para diversos Coeficientes de Confiança: 
7 
13 
Ex. :Tamanho de amostras cujo =10 para diversos 
Coeficientes de Confiança: 
Intervalo de Confiança para a média populacional : 
EXEX  
Onde 
n
.zE
2









n
zX;
n
zX
22


Outras formas equivalentes de escrever: 
• com variância conhecida o intervalo de confiança 
100(1-)% para  
Intervalo de Confiança (IC) para  
14 
8 
Intervalo de Confiança (IC) para  
Exemplo 1: Uma amostra de n=40 de uma variável aleatória X tem 
distribuição Normal com média desconhecida e variância  = 410. 
Qual o intervalo de confiança de 95% para .? 
1428X
96,1025,02/  zz
15 
   
]06,1555;94,1300[
06,1271428;06,1271428;

 EXEX
O IC para  com 95% de confiança para  é [1300,64 ; 1555,06] 
06,127
40
410
96,12/ 
n
zE


n = 40,  = 410 
16 
• com variância desconhecida, substituímos 2 por S2 , a 
variância amostral: 
 - Para n grande da ordem de 100 podemos usar a 
distribuição normal para construir o IC(1-) 
Intervalo de Confiança para a média populacional  
Intervalo de Confiança (IC) para  
 - Para n não muito grande, a distribuição normal NÃO 
pode ser usada. 







n
S
zX
n
S
zX
22
; 
9 
17 
• Seja (X1, X2, ... Xn ) uma amostra aleatória proveniente de uma 
distribuição Normal com variância desconhecida. 
 
Se substituímos 2 por S2, se n for grande o efeito desta 
substituição é muito pouco, pelo que podemos usar a distribuição 
normal; se n for pequeno devemos usar uma distribuição t, então 
o intervalo de confiança 100(1-)% para  é dado por 
Intervalo de Confiança (IC) para  






 
n
S
tX
n
S
tX nn 11 ;
Onde t é o percentil (1 - /2) da distribuição t com n -1 
graus de liberdade. 
18 
Distribuição t de Student 
 Graus de 
liberdade 
 
P(T<x) 
 0,95 
 
0,99 
 
0,975 
 
0,995 
 
0,9995 
 
1 
 
6,314 
 
12,706 
 
31,821 
 
63,657 
 
636,62 
 
2 
 
9,925 
 
6,965 
 
4,303 
 
2,920 
 
31,598 
 
 
 
 
 
 
 
 
 
 
 
 
 
10 
 
3,163 
 
2,764 
 
2,228 
 
1,812 
 
4,587 
 
 
 
 
 
 
 
 
 
 
 
 
22 
 
2,756 
 
2,462 
 
2,045 
 
1,699 
 
1,311 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ex.: Seja X uma 
variável aleatória com t 
de Student com com 10 
g.l. 
Pr[X < 2,764] = 0,99 
 
xt 
Pr[X < xt ] 
10 
Intervalo de Confiança (IC) para  
Exemplo 1: Uma amostra de n=30 de uma variável aleatória X tem 
distribuição Normal com média e variância desconhecida. Qual o 
intervalo de confiança de 95% para .? 1200X 0227,2025,02/  tt
19 
   
]72,1347;28,1052[
72,1471200;72,1471200;

 EXEX
O IC para  com 95% de confiança para  é [1052,28; 1347,72] 
72,147
30
400
0227,22/ 
n
S
tE 
n = 40, S= 400 
20 
O objetivo dos testes de hipóteses é avaliar afirmações 
sobre os valores de parâmetros. 
A Hipótese Nula é uma afirmação que diz que o 
parâmetro populacional é tal como especificado (isto é, a 
afirmação é verdadeira), denotado por H0 
A Hipótese Alternativa é uma afirmação que oferece 
uma alternativa alegação, Isto é, o parâmetro é maior 
(ou menor) que o valor alegado), denotado por H1. 
Testes de Hipóteses 
11 
21 
Procedimento: 
1) Formula as hipóteses: 
01
00
:
:




H
H
01
00
:
:




H
H
01
00
:
:




H
H
Teste unilaterais 
Testes de Hipóteses para a Média Populacional  
2) Escolher o nível de significância, em geral  = 0,01 ou  = 0,05; 
Teste bilateral 
3ª ) Calculando o intervalo de Confiança (1-)% - para a média 
populacional : 







n
zX;
n
zX
22


22 
Testes de Hipóteses paraa Média Populacional  
Se 0  IC(1-)% rejeitamos H0. 






 
n
S
tX
n
S
tX nn 11 ;
ou 
01
00
:
:




H
H
12 
Intervalo de Confiança (IC) para proporções 
n
x
p ˆ
n
pp
p
)ˆ1(ˆ
ˆ


23 
)1(2 ppep  Se Y ~ Binomial(n,p), onde , dada uma amostra 
aleatória de tamanho n com x elementos com a característica de 
interesse, a proporção amostral é definida por . 
Na medida que np > 5 e n(1-p)> 5, a distribuição da proporção 
amostral tende a uma distribuição Normal satisfatoriamente, 
O valor médio das proporções amostrais será p e o desvio padrão 
das proporções amostrais será 
O Teorema Limite Central pode justificar a ideia de Aproximação 
Normal à Binomial. 
Para n grande podemos considera a distribuição amostral de p 
como aproximadamente normal 
 EpEp  ˆ;ˆ
Logo, temos que o IC para a proporção populacional ao nível de 
significância (1-) : 
Intervalo de Confiança (IC) para proporções 





 

n
pp
pNp
)1(
,ˆ
Para construir o IC para p desconhecida, determinarmos na 
amostra e consideremos 
pˆ
n
pp
p
)ˆ1(ˆ
ˆ


24 
n
pp
zE
)ˆ1(ˆ
2

 
 onde 
13 
Tamanho da Amostra para estimar p 
Se tivermos alguma informação sobre p, resolvendo a equação 
do erro em n obtemos, 





 

2
2
2/ )1(
E
ppz
n 
 
4
1
1  pp
25 
Se a verdadeira proporção é desconhecido, podemos usar o fato 
que para qualquer valor de p temos que 
n
pp
zE
)1(
2

 
Então o valor de n pode ser aproximado pela relação: 







2
2
2/
4E
z
n 
Exemplo: Retiramos de uma população uma amostra de 100 
elementos e encontramos 20 sucessos. Construir um IC com 99% de 
coeficiente de confiança, para a proporção real de sucessos na 
população. Dados n=100, x=20 
 
 
  .99,03028,0;0972,0
99,004,0.57,22,004,0.57,22,0
99,0ˆ;ˆ ˆˆ
22



P
pP
zpzpP pp  
Logo, temos o IC com 99% de coeficiente de confiança para a 
proporção populacional: 
Intervalo de Confiança (IC) para proporções 
8,0)ˆ1(2,0
100
20
ˆ  pe
n
x
p 04,0
100
8,0.2,0
ˆ p
26