Buscar

Inferência Estatística - Estimadores

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 67 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 67 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 67 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
Capítulo 1
Inferência Estatística
1.1 Introdução
 Considere-se que o resultado de um experimento qualquer é a observação de uma
variável aleatória , discreta ou continua. Esta variável é caracterizada por uma distribuição de
probabilidade pertencendo a alguma família de distribuições especificada na qual um  
número finito de parâmetros ( , . . ., ) é, em geral, desconhecido. Seja ( ; ) a      
função de probabilidade ou densidade de dado . 
 Aqui ( ; ) é escrito indiferentemente para distribuições univariadas discretas ou  
contínuas. Admite-se que temos observações ( , . . ., ) - rea1izações da variável     
aleatória - geradas repetindo-se o experimento.
 A teoria de probabilidade trata do problema da distribuição de quando esta é
completamente definida (i.é, todos os parâmetros 's são conhecidos). Entretanto, se a
distribuição de não está completamente definida e podemos apenas supor que a sua
distribuição pertence a família ), o problema passa a ser de inferência estatística. O  
interesse é então, a partir das observações , ter alguma informação sobre e assim determinar 
completamente a distribuição ) de .  
 Parece razoavel supor que a distribuicao das alturas dos brasileiros adultos possa ser´ ¸~
representada por uma distribuição Normal. Mas esta afirmacao nao e suficiente para¸~ ~ ´
determinar qual a distribuicao Normal correspondente; precisariamos conhecer os¸~ ´
parametros, media e variancia, desta Normal.^ ^´
Se pudessemos medir as alturas de todos os brasileiros adultos, teriamos meios de´ ´
obter os verdadeiros valores dos parametros e, assim, produzir a distribuicao Normal exata.^ ¸~
Contudo, fazer inferencia atraves dos dados populacionais nem sempre e possivel ou^ ´ ´ ´
viavel.´
 Considere um experimento estatistico cujos resultados, , sao valores assumidos´ ~ 
por uma variavel aleatoria .´ ´ 
 Seja ( ) a distribuicao de probabilidade de onde é desconhecido e¸~     
denominado PARÂMETRO.
 e uma caracteristica numerica desconhecida que determina completamente a´ ´´
distribuição de probabilidade ( ).   
2
Exemplos:       pode representar a chegada de navios no porto: , com parâmetro  
onde
 Media Populacional e Variancia Populacional´ ^    
 2) altura das pessoas de uma cidade, usualmente , com parâmetros         
e , onde
Media Populacional e Variancia Populacional´ ^    
 3 temperatura em cada mê do ano com parâmetro de forma e          
parâmetro de escala , onde
      e 
 4 tempo de falha de um componente eletrônico ou            
 Na pratica, ( ) nao sera completamente conhecida, isto e, um ou mais´ ´ ´~    
parametros serao desconhecidos.^ ~
 O objetivo do estatistico e estimar estes parametros desconhecidos ou testar a´ ´ ^
validade de certas afirmacoes sobre eles.¸~
Definição: O conjunto de todos os possíveis valores que um parâmetro (de uma f.d.p 
   ( ) pode assumir é chamado Espaço Paramétrico.
Exemplos:        No primeiro exemplo acima, temos , logo .  
 2) No segundo, temos e 0, então: e           
              ( e . 
 Se é conhecido, então .          
 3) No terceiro exemplo, temos 0 e 0, então , e        
          ( , 0 e 0 .
 4) Seja ~ com desconhecido, então e .              
3
1.2 Amostra Aleatória
 Para o estatístico estimar os parâmetros da distribuição de probabilidade ( ) ele   
então observa valores , assumidos pela v.a. . Cada pode ser consideradon . . .,     i
como o valor assumido por uma v.a. , i , . . ., , onde , . . ., sao v.a's.~       n
independentes com f.d.p comum ( ).   
Definição: Seja uma v.a. com f.d.p ( )    
 As observacoes , , . . . , formam uma ¸~      AMOSTRA ALEATORIA (a.a.)´
de tamanho n da v.a. , se elas resultam de selecoes independentes e cada tem a mesma¸~ 
distribuicao de (da populacao).¸ ¸~ ~
Exemplo: Numa linha de producao, e muito importante que o tempo gasto numa¸~ ´
determinada operacao nao varie muito de empregado para empregado.¸~ ~
 11 empregados apresentam os tempos abaixo para realizar essa operacao¸~
125 135 115 120 150 130 125 145 125 140 130
QUESTÕES: 1) Qual distribuição de probabilidade ( ) melhor representaria a   
população tempo gasto na operacao baseada nesses dados?¸~  
 2) Uma vez reconhecida a distribuição (ou a melhor distribuição dentre várias
possíveis) ( ), para os dados acima, como estimar o(s) parâmetro(s) .    
 Entao, o objetivo do estatistico e decidir, com base numa amostra adequadamente~ ´ ´
selecionada, que membro ou membros da familia { ( ), } pode representar a f.d.p´      
de .
 Problemas deste tipo sao chamados problemas de Inferencia Estatistica e sera o~ ^ ´ ´
objeto de estudo destas notas.
4
1.3 Histograma: estimador da 'forma' da distribuição de 
 Suponhamos que temos uma populacao cuja distribuicao desconhecemos.¸ ¸~ ~
 Extraimos uma amostra de tamanho dessa populacao.¸~
 Com esta informacao queremos ter uma ideia da forma da distribuicao¸ ¸~ ~´
desconhecida, ou seja, queremos estimar a funcao densidade (no caso de variavel continua)¸~ ´ ´
ou a distribuicao de probabilidades (no caso de variavel discreta).¸~ ´
 No caso de v.a. discreta, o problema a ser investigado geralmente já sugere a
distribuição de probabilidade a ser adotada, contudo, para uma v.a. contínua, pode existir
várias distribuições a ser utilizada no problema.
Exemplo: Numa central telefonica chegam 300 telefonemas por hora.^
Qual a probabilidade de que num minuto nao haja nenhum chamado.~
Sol: Seja X: nu´mero de chamadas por minuto.
X Poisson( ) onde E(X) = .~  
 O nu´mero medio de chamadas por minuto e = = 5´ ´  30060
 Portanto, P{X = 0} = = 0,006738e . 5 0! 
-5 0
Exemplo: Os dados abaixo referem-se aos montantes (em milhares de dolares) de 32´
emprestimos pessoais em uma companhia financeira.´
6.0 0.0 2.0 6.5 5.0 3.5 4.0 7.0 8.0 7.0 8.5 6.0 4.5 0.0 6.5 6.0
2.0 5.0 5.5 5.0 7.0 1.5 5.0 5.0 4.0 4.5 4.0 1.0 5.5 3.5 2.5 4.5
Com os dados da tabela construimos o histograma dado abaixo.
h=hist(X)
 xhist=c(min(h$breaks),h$breaks)
yhist=c(0,h$density,0)
xfit=seq(min(X),max(X) ,length=85)
yfit=dnorm(xfit,5,1.8)
plot(xhist,yhist,type="s",ylim=c(0,max(yhist,yfit)))
lines(xfit,yfit,col="red")
5
 
0 2 4 6 8 10
0.
00
0.
05
0.
10
0.
15
0.
20
xhist
yh
is
t
 A curva suavizada da figura da uma ideia da verdadeira forma da distribuicao da´ ´ ¸~
variavel momentante de empréstimos.´
 Uma comparacao visual permite-nos concluir que a distribuicao obtida aproxima-se¸ ¸~ ~
razoavelmente de uma Distribuicao Normal, i.é, .¸~      
 Podemos checar a Normalidade dos dados pelo Teste .
 Existem vários métodos (gráficos e testes) para checarmos o ajustamento dos dados
(a.a.) a uma distribuição de probabilidade conhecida.
1.4 Estatistica´
Definic¸a~o: Seja , , . . . , uma a.a. de uma v.a. , e sejam , , . . . , os           
valores tomados pela amostra.
 Definimos ESTATISTICA à uma funcao ( , , . . . , ), que tome o valor´ ¸~      
     ( , , . . . , ).  
Obs: 1) Uma Estatistica e uma funcao de valor numerico das observacoes amostrais.´ ´ ´¸ ¸~ ~
 Qualquer função da amostra que não depende de parâmetros desconhecidos é uma
estatística.
6
 2) Os valores de uma estatistica possuem uma variabilidade, pois dependem da´
amostra, portanto a estatistica e uma v.a..´ ´
 As seguintes estatisticas sao de grande interesse:´ ~
 i) 
_
MediaAmostral´  




1
 
 


 ii) S = Variancia Amostral^ 
  
n
i=1
i X - X 
_
 n - 1 

 iii) K = min (X , . . ., X )´Minimo da Amostra´  n
 iv) M = max (X , . . ., X )´Maximo da Amostra´  n
 v) Correlação Amostral  

 
n
i=1
i i
n n
i=1 i=1
i i
( )( )
_ _
( ) ( )
_ _
 
   
Exemplo: Seja , onde é conhecido mas é desconhecido.   ~     
 Seja , . . ., uma amostra de    
 De acordo com a definição,




=1
 não é uma estatística
1.5 Distribuicao Amostral de uma Estatistica¸~ ´
 Lembremos que estatisticas amostrais, p.ex, X, S , e outras, sao variaveis aleatorias,´
_ ~ ´ ´
enquanto os parametros populacionais , sao constantes fixadas que podem ser^ ~ 
desconhecidas.
Definic¸a~o: A distribuicao de probabilidade de uma estatistica e chamada sua¸~ ´ ´
DISTRIBUICAO AMOSTRAL¸
~ .
 Naturalmente, há muitas outras estatística importantes que encontraremos, mas
certamente aquelas mencionadas acima desempenham importante papel em muitas
aplicações estatísticas. Enunciaremos agora (e demonstraremos) alguns teoremas referentes
às estatísticas acima.
7
1.5.1 Média Amostral
Teorema: Seja uma v.a. qualquer com media e variancia .´ ^  
 Seja , . . . , uma amostra aleatória.  
 Seja = a Media Amostral, entao E(X) = e var(X) = 
_
´ ~
_ _
    
  
. . . 
n

prova: i) E(X) = = = = .
_
E(X ) + E(X ) + . . . + E(X )
n n n
 + + . . . + n.  n     
 ii) Pelo fato das variaveis serem independentes, vem´
 var(X) = = = = .
_
var(X ) + var(X ) + . . . + var(X )
n n n n
 + + . . . + n. 
   
    n      
Exemplo: Seja uma populacao consistindo de 3 residencias; sendo que uma delas contem 2¸~ ^ ´
comodos, outra contem 3 comodos e a terceira residencia contem 4 comodos.^ ^ ^ ^´ ´
 Seja a v.a. X: no. de comodos em cada residencias.^ ^
 Sup. que selecionamos aleatoriamente uma amostra de duas residencia com^
reposicao.¸~
 A distribuicao amostral de X e dada por,¸~
_
´
 --------------------------------------------
 Valor de X Probabilidade
_
 
 ---------------------------------------------
 2.0 1/9
 2.5 2/9 
 3.0 3/9 
 3.5 2/9 
 4.0 1/9 
 -------------------------------------------
 Calculando a media populacional e a variancia populacional, encontraremos:´ ^
  = = 3 e = = 0.67 2 + 3 + 43 3
(2 - 3) + (3 - 3) + (3 - 4)   
 Pela distribuicao de probabilidade da v.a. X podemos calcular E(X) e var(X), como¸~
_ _ _
segue:
E(X) = X .P(X = x ) = 2x + 2.5x + 3x + 3.5x + 4x = = 3
_ _ _ _
5
i=1
i i i
 1 2 3 2 1 27
9 9 9 9 9 9 
E(X ) = X .P(X =x) = 4x + 6.25x + 9x + 12.25x + 16x = = 9.33
_ _ _ _ 
5
i=1
i i
1 2 3 2 1 84
9 9 9 9 9 9 
var(X) = E(X ) - E(X) = 9.333 - 9 = 0.3333
_ _ _
  
8
 Portanto, E(X) = e var(X) = ,
_ _
 n

o que comprova o resultado do Teorema. 
 Ja determinamos a media e a variancia da distribuicao de X. Para obtermos as´ ´ ^ ¸~
_
demais propriedades de X, bastaria agora determinar qual a forma da curva referente à
_
distribuicao de X , ou seja qual o modelo probabilistico de X.¸~
_ _
´
 Para amostras casuais simples X , . . . , X , retiradas de uma populacao Normal, a¸~ n
distribuicao amostral da media X sera Normal.¸~ ´ ´
_
Teorema: Seja uma v.a. com distribuição normal .      
 Seja , . . . , uma amostra aleatória, entao , ~
_
       

prova: Com o proposito de encontrar a funcao densidade de X, considere sua funcao´ ¸ ¸~ ~
_
geratriz de momentos. Dai,´
 M (t) = E e = E e = E e . E e . . . E e =X
_ t.X t.(X +X + . . . +X )/n t.X /n t.X /n t.X /n
_
            n n
= E e = M (t/n). Ou seja,  t.X /n Xi i
M (t) = M (t/n). X
_
X i
 Sabemos que se X N( , ) entao M (t) = exp .t + .~i ~ X .t2  

i  
 
 Dai, M (t) = exp . + . = exp + = exp .t + ´ X
_ t t .t .t
n 2 n n 2.n 2.n
.t
n
         
      


 Logo, M (t) e a funcao geratriz de momentos da variavel normal com media e´ ´ ´¸~X
_ 
variancia /n.^  
9
Exemplo: Numa urna tem-se 5 tiras de papel numeradas 1, 3, 5, 5, e 7.
 Seja a v.a. X = valor assumido pelo elemento na populacao.¸~
 A distribuicao de X e dada por¸~ ´
 --------------------------------------------------------
 x 1 3 5 7
 --------- ----------------------------------------------
 p(X=x) 1/5 1/5 2/5 1/5
 --------------------------------------------------------
 Uma tira de papel e sorteada e recolocada na urna; entao uma segunda tira e´ ´~
sorteada.
 Sejam X e X , respectivamente, o primeiro e o segundo nu´meros sorteados. 
Tabela: Possiveis valores de X.´
_
(X , X ) (1,1) (1,3) (1,5) (1,5) (1,7) (3,1) (3,3) (3,5) (3,5) (3,7) (5,1) (5,3) 
-----------------------------------------------------------------------------------------------------
X= 1 2 3 3 4 2 3 4 4 5 3 4
_
X +X
2
 
 (5,5) (5,5) (5,7) (5,1) (5,3) (5,5) (5,5) (5,7) (7,1) (7,3) (7,5) (7,5) (7,7)
--------------------------------------------------------------------------------------------------
 5 5 6 3 4 5 5 6 4 5 6 6 7
 Assim, a distribuicao amostral de X p/ n=2 e dada por,¸~
_
´
 x 1 2 3 4 5 6 7
_
P{X = x} 1/25 2/25 5/25 6/25 6/25 4/25 1/25
_ _
10
Exemplo: Digamos que a v.a. X represente o peso real de pacotes de cafe, enchidos´
automaticamente. Sabe-se que X tem distribuicao Normal N(500, 81). Sorteamos 9 pacotes¸~
e medimos seus pesos. Assim, se a maquina estiver regulada, a probabilidade de´
encontrarmos a media de 9 pacotes diferindo de 500 com menos de 6 gramas sera?´ ´
Sol: P X - 500 6 P{494 X 506} P 
_ _
           494 500 X 500 506 5009/3 9/3 9/3
_
  
 P{ 2 Z 2} = 95%~   
 Ou seja, dificilmente 9 pacotes terao uma media fora do intervalo [498, 502]. Caso~ ´
9 pacotes apresentem uma media fora desse intervalo, sera razoavel desconfiar que a´ ´ ´
maquina esteja desregulada.´ 
 Como a maioria das variaveis de interesse possuem distribuicoes que nao sao nem´ ¸~ ~ ~
mesmo aproximadamente normais, e importante sabermos se as propriedades anteriores de´
X sao aproximadamente satisfeitas quando a amostragem e realizada a partir de uma
_ ~ ´
distribuicao nao-normal.¸~ ~
Teorema: Seja uma amostra aleatória de uma distribuição de Poisson        com
média Então tem distribuição de Poisson com parâmetro .  


 n
 Daí, para = 0, 1, 2, ...P k   
_
    
 


  
 n 
que fornece a distribuição exata da média amostral para uma amostra de uma distribuição
de Poisson.
11
Teorema: Se X , . . . , X é uma amostra aleatória de ( ) , com fdp dada por n    
    ( ) entao ( , ).~      I ( ,   
_

prova: Veja Mood, Graybill e Boes.
Exemplo: Um dispositivo eletrônico tem uma duração de vida , a qual é
exponencialmente distribuída, com parâmetro 0,001; quer dizer, sua fdp é 
   ( ) 0,001 . Suponha-se que 100 desses dispositivos constituem uma a.a., 0,001
fornecendo os valores observados , . . ., . Qual é a probabilidade de que 1 
950 1.100? 
_

Sol: No caso presente, poderemos realmente obter a distribuição exata de Pelo Teorema
_
 
acima
       99!
99 0,001(0,001)
onde é a fdp de . . . . Daí, a fdp de será dada por
_
     1 
  
_ _
   
99!
99 0,01(0,01) .
_
 Portanto, tem uma distribuição gama com parâmetros 0,1 e 100. Logo,
_

 950 1.100 ......       
_ _ _
 950
1100
 A figura abaixo sugere-nos que, quando o tamanho da amostra aumenta,
independendo da distribuicao da populacao original, a distribuicao amostral de X aproxima-¸ ¸ ¸~ ~ ~
_
se cada vez mais de uma de uma distribuicao normal. Este resultado, fundamental na teoria¸~
de Inferencia Estatistica, e conhecido como Teorema do Limite Central.^ ´ ´
TEOREMA DO LIMITE CENTRAL TLC:
Seja X uma v.a. qualquer com media e variancia .´ ^ 
 Seja , . . . , uma amostra aleatória, entao , ~
_
       

quando e grande.´
prova: Ver Meyer pgs. 293 e 294.
12
NOTA: Independente de a distribuicao populacional ser continua, discreta, simetrica ou¸~ ´ ´
assimetrica, o TLC estabelece que se a variancia populacional e finita, entao, a distribuicao´ ´^ ~ ~¸
da media amostral X e aproximadamente Normal se o tamanho da amostra for grande.´ ´
_
 A rapidez dessa convergencia depende da distribuicao da populacao da qual a^ ¸ ¸~ ~
amostra e retirada. Se a populacao original e proxima da Normal, sua convergencia e´ ´ ´ ´¸~ ^
rapida; ja, se a distribuicao da populacao tem a forma de um V, essa convergencia e mais´ ´ ´¸ ¸~ ~ ^
demorada.
13
 Para introduzirmos os conceitos, neste curso, assumiremos que para amostras com
mais de 30 elementos a aproximacao por uma uma distribuição Normal ja pode ser¸~ ´
considerada muito boa. Na pratica, isto precisa ser checado antes de qualquer analise´ ´
apresentada.
Exemplo: Queremos investigar a duracao de vida de um novo tipo de lampada, pois¸~ ^
acreditamos que ela tenha uma duracao maior do que as fabricadas atualmente. Cem¸~
lampadas do novo tipo sao deixadas acesas ate queimarem. A duracao em horas de cada^ ~ ~´ ¸
lampada e registrada.^ ´
 Supor que a populacao tenha media = 82 e variancia = 144.¸~ ´ ^ 
i) Se uma amostra aleatoria de tamanho n = 64 e selecionada, qual e a probabilidade´ ´ ´
da media amostral estar entre 80.8 e 83.2?´
ii) Com n = 100, calcular P{80.8 X 83.2}.
_
 
Sol: i) Com = 82 e = 144 e como n = 64 e grande, o TLC estabelece que X ´
_
 a  ~
N( , ). Portanto, Z = = N(0, 1). Dai, a ´   X 
_
 1.5 
X 82 
_
~


 n 
 P{80.8 X 83.2} P P{-0.8 Z 0.8}
_
         80.8 82 X 82 83.2 821.5 1.5 1.5
_
  
 0.7881 0.2119 0.5762  
ii) Com n = 100, temos = = 1.2. Portanto 12 n 100

 
 P{80.8 X 83.2} = P = P{-1 Z 1
_
       80.8 82 X 82 83.2 821.2 1.2 1.2
_
  
= 0.8413 -0.1587 = 06826. 
NOTAS 1) Incidentalmente, no exemplo anterior, o modelo geralmente adotado e o´
exponencial, i.e, o conhecimento do problema fisico sugere a adocao do modelo´ ´ ¸~
exponencial para a duracao das lampadas. Se nao soubéssemos a distribuicao da media¸ ¸~ ~ ~^ ´
amostral para um modelo exponencial utilizaríamos o TLC, por se tratar de uma amostra
grande.
 2) Observem que, nos exemplos, consideramos sempre uma populacao com media e¸~ ´
variancia conhecidas, cujo interesse e obter a probabilidade da media estar dentro de um^ ´ ´
intervalo fixado. Isto na pratica nem sempre e possivel, pois desconhecemos tais valores. O´ ´ ´
que faremos e, com base nos resultados apresentados, obter intervalos que contenham estes´
parametros, para uma probabilidade fixada e media resultante da amostra.^ ´
14
1.5.2 Variância Amostral
Teorema: Suponhamos que (X , . . . , X ) constitua uma amostra casual simples de uma n
populacao Normal com media e variancia .¸~ ´ ^ 
 Seja
 S = 



n
i=1
i (X X)
_
n 1

a Variancia Amostral. Entao:^ ~
i) E(S ) = ; 
ii) X e S sao v.a's. independentes;
_ ~
iii) a estatistica tem uma distribuicao Qui-Quadrado com n 1 graus de´ ¸~(n 1).S

 
liberdade.
prova: i) Escrevamos:
    
n n n
i=1 i=1 i=1
i i i i(X X) = (X + X) = (X ) + 2.( X)(X ) + ( X) =
_ _ _ _
              
     (X ) + 2.( X). (X ) + n.( X) =
_ _
 
n n
i=1 i=1
i i    
= (X ) 2.n.( X) + n.( X) = (X ) n.(X ) .
_ _ _
 
n n
i=1 i=1
i i              
 Portanto, E(S ) = E = . n. n. =   

    

n
i=1
i (X X)
_
n 1 n 1 n
1


  
NOTA: Se tivessemos dividido por n em vez de faze-lo por (n 1) ao definir S , a´ ^  
propriedade acima nao seria valida.~ ´
 ii) Prova Omitida.
 iii) Vemos inicialmente que a soma + + . . . +      X X X    
    
  
n
tem distribuicao (n) , pois cada tem distribuicao N(0 , 1). Agora,¸ ¸~ ~ X i 
    
n n n
i=1 i=1 i=1
i i i i(X ) = (X X + X ) = (X X) + 2(X X)(X ) + (X )
_ _ _ _ _ _
             =
= (X X) + 2.(X ). (X X) + n.(X ) ,
_ _ _ _
 
n n
i=1 i=1
i i     
e do fato de (X X) = X n.X = 0 , vem (X ) = (X X) + n.(X 
_ _ _ _
   
n n n n
i=1 i=1 i=1 i=1
i i i i      
) .
15
 Dividindo ambos os membros por , e reescrevendo convenientemente, teremos:
      
n n
i=1 i=1
X X X X
_ _
/ n = + . (*)
i i 
   
  
 O primeiro membro da expressao (*) tem distribuicao (n) e a u´ltima expressao do~ ~ ~¸ 
segundo membro tem distribuicao (1), pois¸~ 
 X 
_
/ n
 

tem distribuicao N(0 , 1). Do item ii) deste teorema pode-se provar que e¸~ ´   
n
i=1
X X
_
i 


 X 
_
/ n
  
 sao v.a. independentes. Pelo Teorema 3 da Distribuicao , podemos concluir
~ ~¸ 
que
  
n
i=1
X X
_
 i 


tem distribuicao (n - 1). Com isso, observamos imediatamente que a v.a.¸~ 
 = . . (X X) = 
_
(n 1).S (n 1) 1
n 1
n n
i=1 i=1
i
X X
_
 

 

   
    i
tem distribuicao (n - 1).¸~  
NOTA: Muito embora S seja definida como a soma de quadrado de n variaveis, estas n´
variaveis nao sao independentes. S contem somente n 1 variaveis independentes por´ ´ ´~ ~  
ser a soma das variaveis nula.´

n
i=1
i (X X) = 0
_

 Por isso, existe uma relacao linear entre estas n variaveis, o que significa que tao¸~ ~´
logo quaisquer n 1 delas sejam conhecidas a n- ficara determinada.a ´
Corola´rio: var(S ) = . 2n - 1

prova: Vimos que se X ( ) entao var(X) = 2. .~~   
Do item iii) do Teorema acima, tem-se (n - 1)´ (n 1).S ~ 

 
 Dai,´
 var = 2.(n 1) (n 1).S

 
 n 1


 .var(S ) = 2.(n 1)
 Logo, var(S ) = . 2n - 1
 
16
 A inferencia sobre a media amostral X vista anteriormente dependeu inteiramente do^ ´
_
fato de que a variancia populacional era conhecida.^ 
 Quando nao se conhecer , uma situacao muito comum na pratica, nao sera~ ~ ~¸ ´ ´
possivel calcular a variancia da media amostral, var(X) = .´ ^ ´
_

n
 Sera entao necessario obter uma distribuicao exata da media, a qual nao envolve o´ ´ ´~ ~ ~¸
parametro .^ 
Teorema: Se é uma a.a. de uma distribuição , com media e´            
variancia desconhecidas. Entao, a estatistica^ ~ ´
     
_



prova: Inicialmente dividamos numerador e denominador pelo desvio-padrao da~ 
populacao, e teremos¸~
 / .   X 
_
/ n
S
 
 
 
 O numerador Z = . n tem distribuicao N(0 , 1), como ja foi visto.¸~ ´X 
_
 


 O quadrado do denominador pode ser escrito como
(n 1).S Y
n 1



 /(n 1) = , 
onde Y = . Mas como foi visto, se osX forem normalmente distribuidos, Y tem´(n 1).S i


distribuicao (n - 1).¸~ 
 Observe que Z e Y sao independentes, pois X e S sao independentes.~ ~
_

 Logo, por teorema T = t(n - 1).X 
_
 
 
S
n
 
Observac¸a~o: O teorema vale mesmo no caso de amostras extraidas de populacoes nao¸~ ~
Normais, mas que tenham distribuicoes em forma de sino, como a distribuicao Normal.¸ ¸~ ~
TEOREMA: Sejam X , X , . . ., X uma populacao qualquer com media . Suponhamos¸~ ´  N 
que uma a.a. (X , . . . , X ) seja selecionada dessa populacao. Entao,¸~ ~ n
Z = N(0, 1) quando n e grande´X - 
_
 ~

S
n
17
Teorema: Se e são amostras aleatórias independentes obtidas das              
distribuições e , respectivamente, então:           
 ~    



_ _
Y   
  
 
 
 
 
 
   
      
 Em particular, se , então   
 ~       
_ _
Y   
 
       
Teorema: Seja , . . ., uma a.a. de tamanho de uma distribuição .     1    
Seja uma a.a. de tamanho de uma distribuição .              
Se as duas amostras são independentes, então:
    










onde e       
    
 
 
 
 
 
 
_ _
 Se, em particular, então ~ .   

     




 Todos os resultados desta seção só se aplicam a populações normais. De fato, pode
ser demonstrado que para nenhuma outra distribuição:
 (i) a média amostral e a variância amostral são independentementes distribuídas ou
 (ii) a média amostral tem uma distribuição normal exata.
1.5.3 Estatísticas de Ordem
 As variáveis aleatórias , 1, são denominadas Estatísticas de Ordem      
associadas com a amostra aleatória , . . ., . Neste caso,  
         1 2 . . . .
 Os valores extremos de amostra ( e ) são freqüentemente de considerável  
interesse. Por exemplo, na construção de diques para controle de enchentes, a maior altura
da água que um rio particular tenha atingido nos últimos 50 anos pode ser muito
importante.
18
Teorema: Seja uma variável aleatória continua com fdp e fd . Seja , . . ., uma    1 
amostra aleatória de e sejam e o mínimo e o máximo da amostra, respectivamente.  
Então,
 (a) A fdp de será dada por ( ) [ ( )] ( ).        
 (b) A fdp de será dada por ( ) [1 ( )] ( ).         
prova: Seja ( ) a fd de .      
 Ora, é equivalente ao evento , para todo . Logo, visto que os      
 são independentes, encontramos
                 ( ) [ ( )] .   
 Por isso,
          ( ) ( ) [ ( )] ( ). 
 A dedução da fdp de será deixada como exercício.
Exemplo: Um dispositivo eletrônico tem uma duração de vida , a qual é
exponencialmente distribuída, com parâmetro 0,001; quer dizer, sua fdp é 
   ( ) 0,001 . Suponha-se que 100 desses dispositivos sejam ensaiados, fornecendo 0,001
os valores observados , . . ., . 1 
 (a) Qual é a probabilidade de que o maior valor observado ultrapasse 7.200 horas?
Sol: Pede-se que 7.200 1 7.200 .       
 Ora, o valor máximo será menor que 7.200 se, e somente se, todo valor amostral for
menor que 7.200. Daí,
     7.200 1 [ (7.200)] .100
 Para calcular (7.200), recordemos que para a variável aleatória exponencialmente
distribuída com parâmetro 0,001, ( ) 1 Portanto,      0,001
 (7.200) 1 0,99925.     0,001 7200)
 Por conseguinte, a probabilidade pedida é 1 (0,99925) 0,071. 100
 (b) Qual é a probabilidade de que a menor duração até falhar seja menor do que 10
horas? Exigiremos que 10 10 .        
19
 Ora, o mínimo da amostra será maior do ou igual que 10, se, e somente se, todo
valor amostral for maior do ou igual que 10. Portanto,
         0 1 [ ( 0)] .100
 Empregando a expressão de dada em (a), acima, teremos
1 (10) 1 0,99005.         0,001 0) 0,01
 Daí,
 0 1 [0,99005] 0,63.       100
1.5.4 Correlação Amostral
 Quando temos duas variáveis aleatórias bidimensionais ( , ) que dão origern a 
uma amostra aleatória ( , ), . . ., ( , Y ), um dos parâmetros importantes, associado a     
uma variável alestória bidimensional é o coeficiente de correlação .
 A estimativa geralmente empregada para é o coeficiente de correlação amostral,
assim definido:
r 

 
n
i=1
i i
n n
i=1 i=1
i i
( )( )
_ _
( ) ( )
_ _
 
   
Exemplo: Os dados reunidos na Tabela abaixo representarn a velocidade (km/seg) e a
altitude (km) do meteoro N." 1.242, como relatado em "Smithsonian Contributions to
Astrophysics", dos Proceedings of the Symposium on Astronomy and Physics of Meteors,
Cambridge, Mass., ago. 28-set., 1, 1961.
 Tabela:
 ---------------------------------------------------------------------------------
 X(velocidade, km/seg) 11,93 11,81 11,48 10,49 10,13 8,87
 ---------------------------------------------------------------------------------
 Y(alt.itude, km) 62,56 57,78 53,10 48,61 44,38 40,57
 ---------------------------------------------------------------------------------
 Um cálculo direto fornece r = 0,94. 
20
1.5.5 Inferencia sobre a proporcao amostral p^ ^¸~
 Seja p a proporcao de unidades que possuem uma dada caracteristica numa¸~ ´
populacao.¸~
 Assim, a populacao pode ser considerada como a variavel X tal que¸~ ´
1 se o individuo tem a dada caracteristica´ ´
 X =
 0 se o individuo nao tem a dada caracteristica´ ´~
 Logo, = E(X) = p e = var(X) = p.(1 p)  
 Retirada uma amostra casual simples (X , . . . , X ), com reposicao, dessa¸~ n
populacao, e se indicarmos por S o total de unidades que possuem a dada caracteristica na¸~ ´n
amostra, ou seja
S = X n i
n
i=1

onde X = 1 se a i- unidade na amostra tem a dada caracteristicaa ´i
 0 se a i- unidade na amostra tem a dada caracteristicaa ´
entao S b(n , p)~ n ~
 Definindo como p a proporcao de unidades que possuem a dada caracteristica na^ ¸~ ´
amostra, i.e.,´
p = ^ Sn
n
temos que P{S = k} = P = = P p = ^n Sn n n 
k k   n
ou seja, a distribuicao amostral de p e obtida da distribuicao de S .¸ ¸~ ~^ ´ n
Propriedades de p^:
 i) E(p) = p e var(p) = ^ ^ p.(1 p)n

 ii) a funcao de probabilidade para p pode ser escrita explicitamente por:¸~ ^
21
f(p) = .p .(1 p) , p = 0 , , , . . . .1^ ^ 
 
np n n ^
n.p n.(1-p)^ ^ 1 2n 
 Figura: Distribuicao Amostral de S e p para n = 3 e p = ¸~ ^n 1 2 
 iii) A proporcao amostral p e um caso especial da media amostral X.¸~ ^ ´ ´
_
prova: i) E(p) = E = = = p^  Sn n n
E(S ) n.pn n
 var(p) = = = ^ var(S ) n.p.(1 p) p.(1 p)n n n
n
 
 
 iii) p = = = X^
_
S X + X + . . . + X
n n
n n 
TEOREMA: Para n suficientemente grande, podemos considerar a distribuicao amostral de¸~
p do seguinte modo:^
p N p , , quando n +^ ~ p.(1 - p)n   
i.e, N(0, 1)´ ap - p ^
 
~
 p(1-p)n
prova: Vimos que S b(n , p)n ~
 Podemos escrever S = n.X ,
_
n
mas pelo Teorema do Limite Central, X tera distribuicao aproximadamente normal, com
_
´ ¸~
media p e variancia ,´ ^ p.(1 p)n

X N p , 
_
~
p.(1 p)
n 

22
 Logo, a transformada S tera a distribuicao aproximada´ ¸~n
S N n.p , n.p.(1 p) .n ~  
 Observe que X, na propriedade (iii), e a propria variavel p; assim, para n
_
´ ´ ´ ^
suficientemente grande, podemos considerar adistribuicao amostral de p do seguinte modo:¸~ ^
p N p , .^ ~ p.(1 p)n 

NOTA 1) Esta aproximacao e bastante satisfatoria quando a proporcao p nao esta proxima¸ ¸~ ~ ~´ ´ ´ ´
de 0 ou de 1, e n e suficientemente grande; em geral quando n.p 5 e n.(1 - p) 5.´  
 2) Para uma boa aproximacao a normalidade usar uma correcao de continuidade¸ ¸~ ~#
(somar e subtrair para cada valor de uma v.a. p com distribuicao binomial.¸~1 2 
Exemplo: Constata-se que 2% das pecas fabricadas por determinada maquina sao¸ ´ ~
defeituosas. Qual a probabilidade de, em um lote de 400 de tais pecas, 3% ou mais serem¸
defeituosas?
Sol: De acordo com as propriedades anteriores, tem-se:
 E(p) = p = 0.02 e var (p) = = = = 0.000049^ ^ p.(1 - p)n 400 400
0.02x0.98 0.0196
 Portanto, P{3% ou mais} = P{p 0.03} = P .^   p - 0.02^0.007 0.007
0.03 - 0.02
 Como n = 400 e um valor grande, utilizamos a aproximacao pela Normal, i.e,´ ´¸~
 P = P{Z 1.428} = 0.5 - 0.4236 = 0.0764. p - 0.02^0.007 0.007
0.03 - 0.02 
1.6 Normalidade dos dados
 Observaremos que a distribuição normal representa um papel muito importante na
Estatística. De fato, o Teorema do Limite Central por si só assegura isto, mas há outras
razões igualmente importantes.
 Em primeiro lugar, muitas populações encontradas na prática nas diversas áreas do
conhecimento parecem ter uma distribuição aproximadamente normal.
23
 Outra consideração em favor da distribuição normal é o fato que distribuições
amostrais baseadas numa distribuição aparentemente normal são facilmente manipuladas
analiticamente.
 Assim, o problema matemático de obter distribuições para as várias funções da
amostra é freqüentemente mais fácil para amostras de uma população normal que de
qualquer outra, e esta seção será dedicada ao problema de se obter as distribuições de
várias funções diferentes de uma amostra aleatória de uma população normalmente
distribuída. Para aplicar os métodos estatísticos baseados na distribuição normal, o
pesquisador tem que saber, pelo menos aproximadamente, a forma geral da função de
distribuição que os seus dados seguem. Se for normal, pode usar os métodos diretamente;
se não for, pode, às vezes, transformar os dados de modo que as observações transformadas
sigam uma distribuição normal. Quando o pesquisador não sabe a forma da distribuição de
sua população, então ele pode usar outros métodos mais gerais mas normalmente menos
poderosos de análise chamados métodos de não-paramétricos.
1.7 Inferencia Estatistica^ ´
 Na disciplina Estatistica Descritiva, vimos como resumir descritivamente um conjunto´
de dados e no 1- semestre de Probabilidade e Estatística vê-se como construir modeloso
probabilisticos para descrever alguns fenomenos.´ ^
O estudo da Inferencia Estatistica tem como objetivo estudar os metodos que permitam^ ´ ´
tirar conclusoes sobre os parametros desconhecidos da populacao a partir da analise dos dados~ ~^ ¸ ´
amostrais.
 As inferencias de interesse sao baseadas em informacoes ou quantidades obtidas de uma^ ~ ~¸
amostra selecionada da populacao.¸~
Tais inferencias podem ser de dois tipos:^
I) : quando usamos os dados amostrais para produzir estimativas do parametro^ESTIMACAO¸
~
populacional.
A estimacao dos parametros pode ser feita de duas maneiras:¸~ ^
a) ESTIMACAO PONTUAL¸
~
- quando a partir da amostra procuramos obter um u´nico valor para representar o
parametro populacional.^
Exemplo: X e um estimador pontual do parametro populacional .
_
´ ^ 
24
 b) ESTIMACAO POR INTERVALO¸
~
- quando a partir da amostra procuramos construir um intervalo para^ ^    
um certo coeficiente de confianca 1 , fixado a priori. Em 100.(1 )% das vezes que o¸   
experimento for realizado, este intervalo contera o verdadeiro parametro populacional .´ ^ 
Exemplo: Se tem uma distribuicao Normal, i.e,¸~ ´
f( ; , ) = exp ,   1 1
2 2 

  

onde o parametro = ( , ) e desconhecido.^ ´  
i) se e desejavel estimar a media = , entao´ ´ ´ ~ 
 a estatistica ( ) = X = e um possivel estimador de .´ ´~
_
´ 

n
i=1
iX
n 
 ii) e (X 1.96 S /n ; X 1.96 S /n ) e um possivel estimador intervalar de .
_ _
´ ´    
II) : quando usamos os dados amostrais para testarmos possiveis´TESTES DE HIPOTESES´
valores de certos parametros da populacao, ou mesmo tratarmos da natureza da populacao.^ ¸ ¸~ ~
 Quanto aos testes de hipoteses eles podem ser de dois tipos:´
 a) : quando formulamos hipoteses com respeito ao valor de um´PARAMETRICOS´
parametro populacional.^
Exemplo: 1) a media populacional da altura dos brasileiros e 1,65 m, i.e., 1,65.´ ´ ´   o 
2) a proporcao de brasileiros com a doenca X e 40%, ou seja, 0,40.¸ ¸~ ´    o
 b) : quando formulamos hipoteses com respeito a natureza´NAO-PARAMETRICOS~ ´ #
da distribuicao da populacao, independencia de amostras, variaveis qualitativas.¸ ¸~ ~ ^ ´
Exemplo: : A distribuicao da populacao e N 1 , 0.2 .¸ ¸~ ~ ´   o
 2) Deseja-se verificar se existe dependência entre a renda (variável A) e o número de
filhos em famílias (variável B) de uma cidade, i.é, : A e B são variáveis independenteso
 3)   : o modelo é linear        
25
Capítulo 2
Estimação Pontual
2 1 Introdução
 Vamos assumir que a distribuição da variável aleatória pertence a certa família de
distribuições em que um particular elemento é especificado, quando o valor do parâmetro 
é especificado.
 No caso de um problema de estimação, o objetivo é procurar, segundo algum
critério especificado, valores que representem adequadamente os parâmetros
desconhecidos. 
 Neste capítulo o conceito de estimador são introduzidos. Critérios para a
comparação de estimadores são também considerados.
Definição: Qualquer estatística ( , . . ., que assuma valores em é um       
estimador para .
 O estimadador da ideia de um possivel valor do parametro.´ ´ ´ ^
Exemplo: 1) Seja , . . ., uma a.a. de onde não é conhecido.      
 Então ( ) é um estimador de , e também ( )~ ~
_
           
 
 
   2(n+1)
 Na verdade, qualquer ( ) é um estimador de .~    
Exemplo: 2) Seja , . . ., uma a.a. de onde é desconhecido.     
 Então é um estimador de 
_
   



 Alguns outros estimadores são ( ) , ( ) e ( )~ ~ ~          

 
  
 Nosso interesse é conhecer aproximadamente com base na amostra , . . .,    
disponível, i.é, determinar uma funcao (X) dessas observacoes que represente o verdadeiro¸ ¸~ ~~
valor do parametro .^ 
 Em muitas situações, o interesse é estimar uma função ( ). 
Exemplo: 3) Seja onde o parametro e desconhecido Se e desejavel estimar^ ´ ´ ´     
a media, i.e, , então ( )´ ´           
26
Exemplo: 4) Weibull , e função de confiabilidade ( ) ,                

para fixo, então ( ) .~              
 


NOTAÇÃO: O estimador ( ) de é usualmente denotado por ~   ^
 Um dos grandes problemas da Estatística é o de encontrar um estimador razoável
para o parâmetro desconhecido ou para uma função ( ). 
2.2 Propriedades de Estimadores
Definic¸a~o: Diz-se que o estimador e um Estimador Nao-Viciado do parametro se:^ ´ ~ ^ 
E( ) = , para todo ^  
Exemplo: Sejam , . . . , uma amostra aleatória da v.a. com [ ] e       
  [ ] . Temos, então, que
 i) E(X) = = = = ,
_
E(X ) + E(X ) + . . . + E(X )
n n n
 + + . . . + n.  n     
e pelo fato das variaveis serem independentes, vem´
 var(X) = = = = 
_
var(X ) + var(X ) + . . . + var(X )
n n n n
 + + . . . + n. 
   
    n     
 Portanto Xé um estimador não-viciado para .
_

Exemplo: Suponha-se que desejemos um estimador não-viciado da variância de uma
variável aleatória, baseada em uma amostra , . . . , .  
 Muito embora intuitivamente pudéssemos considerar o estimador
^ (X X) ,
_  1n
n
i=1
i
verifica-se que este estimador tem um valor esperado E( ) . De fato,^    (n 1)n
 E( ) = E (X X) E (X X) n(X ) =^
_ _ _
        1 1n n
n n
i=1 i=1
i i    
 E(X X) E(X ) .
_ _
   1n
n
i=1
i  
 Lembrando que = E(X ) e var(X) = E(X ) , temos
_ _
    i  
27
E( ) = n var(X) = = .^
_
      1n n n
(n 1)   

Portanto é viciado para , mas é assintóticamente não viciado, ou seja, à^  
medida que o tamanho da amostra aumenta, o vício diminui.
Por isso, um estimador não-viciado de é dado pela variância amostral
 (X X) .
_
    
1
n
i=1
i
Interpretação: "Não-viciado" significa, essencialmente, que o valor médio do estimador
será próximo do verdadeiro valor do parâmetro. Por exemplo, se o mesmo estimador for
empregado repetidamente e fizermos a média desses valores, esperaríamos que essa média
fosse próxima do verdadeiro valor do parâmetro (Veja exemplo no cap 1). Muito embora
seja desejável que um estimador seja não-viciado, haverá ocasiões em que poderemos
preferir estimador viciado (veja abaixo). É possível (e na verdade muito facilmente feito)
encontrar mais de um estimador não-viciado para um parâmetro desconhecido. A fim de
realizar uma escolha plausível em tais situações, introduziremos o seguinte conceito.
Definic¸a~o: O Erro Quadrático Médio (EQM) de um estimador do parâmetro é dado por^ 
    ( ) .^ ^   
 Pode-se mostrar que
 ( ) ício( ).^ ^ ^       
onde ício( )=[ ( ) é o vicío do estimador .^ ^ ^      
 No caso em que é um estimador não viciado para , temos que^ 
   ( ) ,^ ^ 
ou seja, o erro quadrático médio de se reduz à sua variância.^
Exemplo: Sejam , . . . , uma amostra aleatória da variável aleatória ( .         
 Conforme visto no anterior (X X) é um estimador viciado para .^
_
    1n
n
i=1
i
 Também vimos que (X X) é um estimador não viciado para .
_
    
1
n
i=1
i 
 Por outro lado, temos que
     [ ] [ ]  
2
28
e que
   [ ] .^  
2
 
 Notemos que , apesar de viciado, apresenta um menor que o do^  
estimador . 
Definic¸a~o: Seja um estimador não-viciado de .^ 
 Diremos que é um estimatidor não-viciado, de variância mínima de , se para^ 
todas os estimadores * tais que ( *) , tivermos^ ^   
  ( ) ( *) para todo .^ ^  
 Isto é, dentre todas os estimadores não-viciados de , tem a menor variância de^ 
todos.
Definic¸a~o: Sejam e dois estimadores nao-viciados de um mesmo parametro . Diz-se^ ^ ~ ^  
que e Mais Eficiente do que se:^ ^´  
  ( ) ( )^ ^  
NOTA: A variância de uma variável aleatória mede a variabilidade da variável aleatória em
torno de seu valor esperado. Por isso, exigir que um estimador não-viciado tenha variância
pequena é intuitivamente com preensível, pois se a variância for pequena, então o valor da
variável aleatória tende a ser próximo de sua média, o que no caso de um estimador não-
viciado significa próximo do verdadeiro valor do parâmetro.
Exemplo: Sejam , , e estimadores de , cuja f.d.p. esta esbocada na figura^ ^ ^ ^ ´ ¸       
abaixo.
 Presumivelmente prefeririamos a . Ambos estimadores sao nao viciados e´ ^ ^ ~ ~  
var( ) var( ).^ ^  
29
 No caso dos estimadores e , a decisão não é tão evidente (Fig. 14.2), porque ^ ^ ^    3
é não-viciado, enquanto não o é. Todavia, ( ) ( ). Isso significa que,^ ^ ^  4    
enquanto em média será próximo de , sua grande variância revela que desvios^ 
consideráveis em relação a não serão de surpreender. por sua vez, tende a ser um tanto^ 
maior do que , em média, e no entanto, poderá ser mais próximo de do que (veja a^  
Figura acima).
Exemplo: Sejam , , uma amostra aleatória da variável aleatória com [ ]         
e [ ] 1. Consideremos os estimadores  
 ^ ^
_
e X X X .    
       X X X 4 42 3
  
 Então, [ ] e [ ]^ ^          

n 3
 Temos também que
 Então, [ ] e [ ]^ ^             2 2 1 1 1 64 6 6 16 

 Como e são ambos não viciados, segue que é melhor que , pois^ ^ ^ ^    2 2
  [ ] [ ], para todo .^ ^   
Exemplo: Outro interessante exemplo é dado no livro do Meyer (Exemplo 14.2 pg 336).
NOTA: Existem algumas técnicas gerais para encontrar estimadores não-viciados de
variância mínima. Contudo, não estamos capacitados a explicar isso aqui. Faremos uso
deste conceito principalmente com a finalidade de escolher entre dois ou mais estimadores
não-viciados disponíveis. Quer dizer, se e forem ambos estimadores não-viciados de^ ^  
   , e se ( ) ( ), preferiremos .^ ^ ^    
30
1- Lista de Exercicios de Probabilidade e Estatistica a ´ ´
1) Em uma populacao em que N = 6, tal que X = {1, 3, 4, 7, 8, 11}, calcular a media¸~ ´
amostral para todas as possiveis amostras de tamanho 2.´
a) Verificar as propriedades da media amostral X e da variancia amostral S . Use o´
_
^ 
processo com e sem reposicao.¸~
b) Determinar a distribuicao amostral destas duas estatisticas.¸~ ´
2) Sabe-se que 20% das pecas de um lote sao defeituosas. Sorteiam-se 8 pecas, com¸ ¸~
reposicao, e calcula-se a proporcao p de pecas defeituosas na amostra.¸ ¸ ¸~ ~ ^
a) Construa a distribuicao exata de p (use a tabua da distribuicao binomial)¸ ¸~ ~^ ´
 b) Construa a aproximacao normal a binomial¸~ #
 c) Voce acha que a segunda distribuicao e uma boa aproximacao da primeira?^ ¸ ¸~ ~´
 d) Ja sabemos que, para dado p fixo, a aproximacao melhora a medida que n´ ¸~ #
aumenta. Agora, se n e fixo, para qual valor de p a aproximacao e melhor?´ ´¸~
3) Uma amostra simples ao acaso de 30 domicilios foi selecionada em uma zona urbana que´
contem 15000 domicilios. O nu´mero de pessoas de cada um dos domicilios que integram a´ ´ ´
amostra e o seguinte:´
5 6 3 3 2 3 3 3 4 4 3 2 7 4 3
5 4 4 3 3 4 3 3 1 2 4 3 4 2 4
Estimar o nu´mero total de pessoas que vivem nesta zona.
4) Definimos a variavel e = X como sendo o erro amostral da media. Suponha que a´ ´
_
 
variancia dos salarios de uma certa regiao seja 400 unidades ao quadrado.^ ´ ~
a) Determine E(e) e var(e)
 b) Que proporcao das amostras de tamanho 25 terao erro amostral absoluto maior¸~ ~
do que 2 unidades?
 c) E que proporcao das amostras de tamanho 100?¸~
 d) Neste u´ltimo caso, qual o valor de d, tal que P e d = 1%?  
 e) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos
sejam inferiores a uma unidade?
5) A vida media de determinado ser vivo e de 2000 horas, com desvio-padrao de 60 horas.´ ´ ~
Escolhida uma amostra aleatoria de 10 desses seres vivos, determine a probabilidade de o´
desvio-padrao amostral nao exceder 50 horas.~ ~
31
6) Uma v.a. X tem distribuicao Normal, com media 100 e desvio-padrao 10.¸~ ~´
a) Qual a P{90 X 110} ? 
 b) se X e a media de uma amostra de 16 elementos retirados dessa populacao,
_
´ ´ ¸~
calcule P{90 X 110}.
_
 
 c) Desenhe, num grafico, as distribuicoes de X e X.´ ¸~
_
 d) Que tamanho deveria ter a amostra para que P{90 X 110} = 95% ?
_
 
7) A maquina de empacotar um determinado produto o faz segundo uma distribuicao´ ¸~normal, com media e desvio-padrao 10g.´ ~
a) Em quanto deve ser regulado o peso medio para que apenas 10% dos pacotes´ 
tenham menos do que 500g?
b) Com a maquina assim regulada, qual a probabilidade de que o peso total de 4´
pacotes escolhidos ao acaso seja inferior a 2 kg?
8) Um procedimento de controle de qualidade foi planejado para garantir um maximo de´
10% de itens defeituosos na producao. Supondo que a producao esteja sob controle e que´ ¸ ¸~ ~
os itens sejam vendidos em caixas com 100, qual a probabilidade de que uma caixa :´
a) tenha mais do que 10% de defeituosos?
 b) Tenha nenhum defeituoso?
 c) Se um cliente encontrar mais do que 18 defeituosos ele recebe uma caixa gratis.´
Qual a proporcao esperada de clientes bonificados?¸~
9) A distribuicao dos comprimentos dos elos de corrente de bicicleta e normal, com media 2¸~ ´ ´
cm e variancia igual a 0,01 cm . Para que uma corrente se ajuste a bicicleta, deve ter^  #
comprimento total entre 58 e 61 cm. Qual a probabilidade de uma corrente com 30 elos nao~
se ajustar a bicicleta?#
10) Ao medir o tempo de reacao, um psicologista avaliou que seu desvio-padrao era de¸~ ~
0.05 segundos. De que tamanho deve ser tomada uma amostra destinada as medicoes, para¸~#
que se possa estar 99% confiante de que o erro da estimativa do tempo medio de reacao´ ¸~
nao exceda a 0.01 segundos?~
11) Em um parque existe uma populacao muito grande de esquilos. Em uma amostra¸~
aleatoria, 40 destes esquilos achou-se que estao infetados com o bacilo da peste. De que´ ~
tamanho deveria ser tomada a amostra para estimar a dita proporcao com um erro nao¸~ ~
maior de 5%, com uma probabilidade de acerto de 99%?
32
Capítulo 3
Intervalos de Confiança
3.1 Introducao¸~
Suponhamos que o modelo de probabilidade f(x , ) para um experimento envolve
um parametro desconhecido .^ 
 Atraves de uma amostra aleatoria (X , . . . , X ) , desejamos obter alguma´ ´  n
informacao sobre o verdadeiro valor do parametro da populacao .¸ ¸~ ~^ 0
Uma maneira de se ter uma ideia do verdadeiro valor de e atraves dos´ ´ ´ 0
estimadores pontuais; estes especificam um u´nico valor para o estimador.
Por exemplo, a media X obtida da amostra e uma estimativa da media real da´ ´ ´
_

populacao. Este procedimento nao permite julgar qual a possivel magnitude do erro que¸~ ~ ´
estamos cometendo.
 Dai, surge a ideia de construir Intervalos de Confianca que, nos casos estudados´ ´ ¸
neste curso, sao baseados na distribuicao amostral do estimador pontual.~ ~¸
Desse modo, se e um estimador de , e conhecida a distribuicao amostral de ,^ ^´ ¸~  
geralmente podemos obter dois valores A e B , tais que0 0
P{A B } = 0 0  
onde e denominado Coeficiente de Confianca.´ ¸
Portanto, o intervalo de confianca e dado por dois limites numericos A e B entre¸ ´ ´ 0 0
os quais supomos estar o verdadeiro parametro, com um coeficiente de confianca ^ ¸ 
especificado.
 Entao, valores dentro do intervalo (A , B ) seriam melhores estimadores de do~ 0 0 
que valores fora do intervalo.
Agora, se (A , B ) e um intervalo de confianca para com um coeficiente de´ ¸0 0 
confianca podemos esperar encontrar, ou estar confiantes em encontrar no intervalo (A¸   0
, B ) em cerca de das vezes que o experimento for realizado.0 
 Ou seja, sera a probabilidade de obter um intervalo que inclua o valor exato, e´
desconhecido, do parametro.^
 Por exemplo, se escolhermos = 95%, podemos esperar que cerca de 95% das
amostras que podemos obter fornecerao intervalos que incluem o valor de , enquanto os~ 
restantes 5% nao incluem. Dessa maneira a afirmacao "o intervalo inclui" sera correta em~ ~¸ ´
cerca de 475 casos dentre 500 casos, enquanto que nos restantes sera falsa.´
O coeficiente de confianca e escolhido a priori, e dependera do grau de precisao¸ ´ ´ ~
com que desejamos obter a estimativa, sendo os coeficiente de confianca mais comuns os¸
que correspondem as probabilidades 95% e 90%.#
Quanto maior o coeficiente de confianca exigido para o intervalo, maior sera a¸ ´
amplitude deste.
33
3.2 Interpretacao do IC¸~
 Imaginemos uma serie de repeticoes do experimento com fixado, por exemplo, =´ ¸~  
0. Alem disso, imaginemos que um intervalo de confianca (A , B) com coeficiente de´ ¸
confianca seja calculado atraves dos dados do mesmo modo para cada repeticao.¸ ¸´ ~
Devido à variabilidade dos dados, o intervalo (A , B) variaria em cada repeticao do¸~
experimento.
A interpretacao do que seja um intervalo de confianca para com coeficiente de¸ ¸~ 
confianca e a seguinte:¸ ´
- construindo 100 intervalos, correspondentes a 100 amostras de tamanho n, deles
conterao o valor .~ 0
Graficamente, teriamos a situacao da figura a seguir.´ ¸~
 Um IC 95% incluiria o verdadeiro valor parametrico em 95% das repeticoes do´ ¸~0
experimento com fixado.
34
NOTA: 1) Exceto em casos especiais, nao e correto concluir que um particular intervalo de~ ´
confianca 95% (A , B ) tenha uma probabilidade de 95% de conter o verdadeiro valor ¸ 0 0 0
do parametro. Pode acontecer que (A , B ) contenha todos os possiveis valores de com^ ´0 0 
probabilidade 100% ou nao contenha nenhum. O coeficiente de confianca 95% e uma media~ ¸ ´ ´
teorica figurada que refere-se a uma sequencia imaginaria de repeticoes do experimento.´ ´^ ¸~
 Logo, poderemos dizer que em 95% das vezes, o intervalo contem o verdadeiro´
valor de . Isto nao e o mesmo que afirmar que 95% e a probabilidade do parametro cair~ ´ ´ ^ 
dentro do intervalo, o que constituira um erro, pois e um parametro ( nao e uma variavel´ ´ ´ ´^ ~ 
aleatoria) e ele esta ou nao no intervalo.´ ´ ~
 2) Na pratica, tem-se um particular conjunto de dados observados e desejamos obter´
informacao sobre o valor de . Se os intervalos de confianca sao suficientes numa pesquisa,¸ ¸~ ~
eles devem ser construidos de modo que um u´nico intervalo observado (A , B )´ 0 0
proporcione informacoes. Valores dentro do intervalo seriam de algum modo melhores¸~
estimadores de do que valores fora do intervalo.
 Comumente os intervalos de confianca que mais nos interessam relacionam-se ou¸
com a media populacional ou com o parametro p (probabilidade de ocorrencia do evento)´ ^ ^
na Distribuicao Binomial ou variancia populacional .¸~ ^ 
3.3 Intervalo de Confianca para a media ¸ ´ 
 No caso da estimativa de , atraves do intervalo de confianca, temos dois casos a´ ¸
considerar que dependem do tamanho da amostra, amostra pequena ou grande, ou do fato
de termos ou nao conhecimento do valor da variancia da populacao.~ ~^ ¸
Teorema: Seja (X , X , . . . , X ) uma amostra aleatoria de uma populacao Normal N( ,´ ¸~  n 
  ) com conhecido.
 Entao,~
 X .z , X + .z 
_ _
   n n  2 2
e um Intervalo de Confianca 100.(1 )% bicaudal para .´ ¸   
prova: Suponhamos que (A , B) seja o intervalo procurado, entao:~
P{A B} = 1 -   
 Sabemos que Z = N(0 , 1). Dai,´X 
_
 ~
 

 n
P = 1  
X B X A 
_ _
 
X 
_
 
  
 n n n  
   
35
 Pela tabela da Normal, temos P z Z z = 1 onde Z N(0 ,     
2 2
 ~
1).
 Logo, = z B = X + .z 
_
X B 
_
 n

  
 n 2 2
  
 = z A = X .z 
_
X A 
_
 n

  
 n 2 2
  
 Portanto, X .z , X + .z e um IC 100.(1 )% para , supondo
_ _
´    n n  2 2  
 conhecido.
Exemplo: Uma maquina enche pacotes de cafe com uma variancia igual a 100 g . Ela´ ´ ^ 
estava regulada para enche-los com 500 g, em media. Agora ela se desregulou, e queremos^ ´
saber qual a nova media . Uma amostra de 25 pacotes apresentou uma media igual a 485´ ´
g. Construir um intervalo 95% de confianca para .¸ 
Sol: = 100 n = 25 30 e X = 485
_ 
 A = X .z = 485 .1.96 = 481
_
  n
10
 25 

2
 B = X + .z = 485 + .1.96 = 489
_

 n
10
 25 

2
 Logo, o IC 95% bicaudal para , com conhecido, e (481 , 489).´ 
36
Exerci´cio: Obter um IC 100.(1 )% unicaudal a direita para , supondo conhecido.   # 
Sol: Suponhamos que (A, + ) seja o intervalo procurado, entao:~
P{A } = 1   
 Sabemos que Z = N(0 , 1). Dai,´X 
_
 ~
 

 n
P = 1 -  
X 
_
 
X A 
_
 
 
 n n 
 
 Pela tabela da Normal, temos P{Z z } = 1 onde Z N(0 , 1).   ~
 Logo, = z A = X .z 
_
X A 
_
 n


 n
 
  
 Portanto, X .z , + e um IC 100.(1 )% unicaudal para ,
_
´     n  
supondo conhecido.
Teorema: Seja (X , X , . . . , X ) uma amostra aleatoria de uma populacao Normal N( ,´ ¸~  n 
  ) com desconhecio.
 Entao,~
 X .t , X + .t 
_ _
 S S n n  2 2
e um Intervalo de Confianca 100.(1 )% bicaudal para .´ ¸   
prova: Neste caso precisamos calcular o estimador S = do parametro e^ 


 (X X)
_
 n 1

n
i=1
i


utilizando o resultado
t = t . X 
_
 ~ (n-1)
 
S
 n
procedemos de forma analoga ao caso anterior.´
Exemplo: A seguinte amostra:
9 8 12 7 9 6 11 6 10 9
37
foi extraida de uma populacao Normal. Construir um IC 95% para .´ ¸~ 
Sol: X = 8.7 e S = 4.0 S = 2
_
 
 g.l. = n 1 = 9
 A = X .t = 7.27
_
 S n 2
 B = X + .t = 10.13
_
S
 n

2
 Logo, o IC 95% bicaudal para , com desconhecido, e (7.27 , 10.13).´ 
Exerci´cio: Selecione, segundo uma a.c.s com reposicao (use a Tabua de N- Aleatorios),¸~ ´ ´o
uma amostra de tamanho 35 da populacao de quarteiroes listada na tabela anexa com N =¸~ ~
270.
Y = n- de residencias alugadas no quarteirao i.o ^ ~i
Sabemos que = 16.9 e = 428.07 
 Construa um IC 95% para a media : a) com conhecido;´  
 b) supondo desconhecido.
NOTA: Pelo Teorema do Limite Central, independente de X ter distribuicao Normal,¸~
temos
Z = N(0 , 1) para n grande. aX 
_
~
 

n
 Assim, qualquer que seja a distribuicao de X, um intervalo de confianca 100.(1 ¸ ¸~ 
 )% para , considerando-se amostras grandes e dado por:´
i) se e conhecido´
 X .z , X + .z 
_ _
   n n  2 2
onde z e dado pela tabela da Normal.´
2
ii) se e desconhecido´
 X .z , X + .z 
_ _
 S S n n  2 2
38
onde S = .



n
i=1
i(X X)
_
 n 1

Exemplo: Seja X a duracao da vida de uma peca de equipamento. Admita-se que 100 pecas¸ ¸ ¸~
foram ensaiadas fornecendo uma duracao de vida media de X = 500 horas e desvio-padrao¸~ ~´
_
S = 5 horas. Deseja-se obter um intervalo de 95% para a media .´ 
Sol: Sabemos que a distribuicao do tempo de vida de um equipamento nao e Normal,¸~ ~ ´
porem, n = 100. Podemos entao utilizar o TLC.´ ~
 Dai, A = X .z = 499.02´
_
 S n 2
e
 B = X + .z = 500.98
_
S
 n

2
 Portanto, 499.02 , 500.98 e um IC 95% para .´  
3.4 Intervalo de Confianca para a variancia ¸ ^ 
Teorema: Seja (X , X , . . . , X ) uma amostra aleatoria extraida de uma populacao com´ ´ ¸~  n
distribuicao Normal N( , ), onde e desconhecido. Entao¸~ ~´   
 ,   (n 1).S (n 1).S 
  
   
2 21-
e um IC 100.(1 )% para .´   
prova: Suponhamos que (A , B) seja o IC 100.(1 )% para . Entao,~  
P{A B} = 1    
 Sabemos que , onde S = , entao:~(n 1).S ~ (n- )
(X X)
_
 n 1
  






 

n
i=1
i
P = 1   (n 1).S (n 1).S (n 1).S B A
    
   
39
P{ } = 1 onde          1- ~ (n-1) 2 2  
 Logo, = B = (n 1).S (n 1).S B 1-
  
  2 1- 2
 
e
 = A =   
2 2
 (n 1).S (n 1).S 
A 
 
 
 Portanto, , e um IC 100.(1 )% para .´  (n 1).S (n 1).S 
   
   
2 21-
  
Exemplo: Supondo populacao Normal, construir o intervalo de confianca para a variancia¸ ¸~ ^
populacional ao nivel de 90% para a amostra:´
9 8 12 7 9 6 11 6 10 9
Sol: Temos n = 10 , S = 4 , g.l. = 9 , = 10% 
 Entao: A = = 2.13 e B = = 10.81~ (n 1).S (n 1).S 
  
   
2 21-
 Portanto, o IC 100(1 )% bicaudal para e (2.13 , 10.81).´  
40
3.5 Intervalo de Confianca para o desvio-padrao ¸ ~ 
A partir do IC 100.(1 )% para a variancia , podemos obter o IC para o^  
desvio-padrao , bastando para isto extrair a raiz quadrada do intervalo para a variancia,~ ^
obtendo dessa maneira aproximadamente um intervalo para . Assim,
 S. , S.    n 1 n 1 
 
   
2 21-
e um IC 100.(1 )% para .´   
3.6 Intervalo de Confianca para a proporcao p¸ ¸~
Teorema: Seja p a proporcao de "sucessos" em uma amostra de tamanho n (n:grande)^ ¸~
extraida de uma populacao binomial em que p e a proporcao populacional de sucessos.´ ¸ ¸~ ~´
 Suponhamos que n.p 5 e n.(1 p) 5. Entao,~  
 p z . , p + z . ^ ^    
2 2
p.(1 p) p.(1 p)^ ^ ^ ^
n n
 
e um IC 100.(1 )% bicaudal para p.´  
prova; Suponhamos que seja (A , B) o intervalo procurado, entao:~
P{A p B} = 1    
 Sabemos que Z = N(0 , 1) , considerando-se n grande e n.p 5 e n.(1 p p ^
 
~

 p.(1 p)n


  p) 5. Dai,´
P = 1  
p B p p p A ^ ^ ^
 
  
  p.(1 p) p.(1 p) p.(1 p)n n n
  
   
 Como nao conhecemos p, usamos p como estimador de p. Entao o intervalo fica,~ ~^
P = 1  
p B p p p A ^ ^ ^
 
  
  p.(1 p) p.(1 p) p.(1 p)^ ^ ^ ^ ^ ^
n n n
  
   
 Pela tabela da Normal, temos P z Z z = 1 onde Z N(0 ,     
2 2
 ~
1).
41
 Logo, = z B = p + z . ^p B p.(1 p)^ ^ ^
 n
 
 p.(1 p) 2 2^ ^
n

   
e
 = z A = p z . ^p A p.(1 p)^ ^ ^
 n
 
 p.(1 p) 2 2^ ^
n

   
 Portanto, p z . , p + z . e um IC 100.(1 ^ ^ ´    
2 2
p.(1 p) p.(1 p)^ ^ ^ ^
n n
 
)% , bicaudal, para p.
Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferencias eleitorais, 260^
mostraram-se favoraveis ao candidato Y. Calcular um intervalo de confianca ao nivel de´ ¸ ´
90% para a porcentagem dos eleitores favoraveis a Y.´
Sol: Pelos dados do problema, verificamos que n = 500 x = 260 1 = 90% e 
p = = = 0.52^ x 260 n 500 
 O IC 100.(1 )% para p e dado por´ 
 p - z . , p + z . .^ ^   
2 2
 p.(1 p) p.(1 p) ^ ^ ^ ^
n n
 
 Substituindo os dados do problema no intervalo acima e utilizando-se os valores da
tabela da Normal.
tem-se 0.52 1.64. , 0.52 + 1.64. .   0.52.(1 0.52) 0.52.(1 0.52) 500 500
 
 Logo, o IC 90% para p e dado por: (0.488 , 0.552)´
42
2a. Lista de Probabilidade e Estatistica´
1) De 50.000 valvulas fabricadas por uma companhia retira-se uma amostra de 400´
valvulas, e obtem-se a vida media de 800 horas e o desvio-padrao de 100 horas.´ ´ ´ ~
a) Qual o intervalo de confianca de 99% para a vida media da populacao?¸ ¸´ ~
b) Com que confianca dir-se ia que a vida media e 800 0,98?¸ ´ ´ 
c) Que tamanho deve ter a amostra para que seja de 95% a confianca na estimativa¸
800 7,84?
2) Uma amostra aleatoria de 625 donas-de-casa revela que 70% delas preferem a marca X´
de detergente. Construir um intervalo de confianca para aproporcao populacional das¸ ¸~
donas-de-casa que preferem X com coeficiente de confianca 90%.¸
3) Antes de uma eleicao, um determinado partido esta interessado em estimar a proporcao¸ ¸~ ~´
p de eleitores favoraveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que´
60% dos eleitores eram favoraveis ao candidato em questao.´ ~
 a) Determine o tamanho da amostra necessario para que o erro cometido na´
estimacao seja de, no maximo, 0.01 com probabilidade de 80%.¸~ ´
b) Se na amostra final, com tamanho igual ao obtido em (a), observou-se que 55%
dos eleitores eram favoraveis ao candidato em questao, construa um intervalo de confianca´ ~ ¸
para a proporcao p. (Utilize = 0,95.)¸~ 
4) Numa linha de producao, e muito importante que o tempo gasto numa determinada¸~ ´
operacao nao varie muito de empregado para empregado.¸~ ~
a) Que parametro estatistico poderia ser usado para avaliar esse fato? Por que?^ ^´
 b) Se 11 empregados apresentam os tempos abaixo para realizar essa operacao, qual¸~
seria a estimativa para o parametro acima?^
125 135 115 120 150 130 125 145 125 140 130
c) Determine um intervalo de confianca 90% para o parametro.¸ ^
5) Um pesquisador esta estudando a resistencia de um determinado material sob´ ^
determinadas condicoes. Ele sabe que essa variavel e normalmente distribuida com desvio-¸~ ´ ´ ´
padrao de 2 unidades.~
a) Utilizando os valores 4.9 , 7.0 , 8.1 , 4.5 , 5.6 , 6.8 , 7.2 , 5.7 , 6.2 unidades,
obtidos de uma amostra de tamanho 9, determine o intervalo de confianca para a resistencia¸ ^
media com um coeficiente de confianca = 0,90.´ ¸ 
b) Qual o tamanho da amostra necessario para que o erro cometido, ao estimarmos´
a resistencia media, nao seja superior a 0,01 unidades com probabilidade 0,90?^ ´ ~
c) Suponha que no item (a) nao fosse conhecido o desvio-padrao. Como voce´ ~ ~ ^
procederia para determinar o intervalo de confianca, e que suposicoes voce faria para isso?¸ ¸~ ^
43
6) Suponha que X tenha uma distribuicao uniforme no intervalo (0 , ), onde e¸~ ´ 
desconhecido. Uma amostra de n observacoes e escolhida. Suponha que n seja¸~ ´
suficientemente grande para que o Teorema do Limite Central se aplique e se possa
aproximar a distribuicao de X por uma Normal N( , /n). Obtenha um intervalo de¸~
_
 
confianca para , com coeficiente de confianca 90%.¸ ¸
 
44
Capítulo 4
Testes de hipóteses
4.1 Introducao¸~
 Testes de Hipoteses sao procedimentos estatisticos que nos permitem aceitar ou´ ~ ´
rejeitar uma hipotese H com base nos dados amostrais.´ 0
 Em testes estatisticos, copiamos a estrategia matematica de provar por contradicao.´ ´ ´ ¸~
Comecando com uma hipotese H que se quer rejeitar, supomos que H e verdadeira e¸ ´ ´0 0
desenvolvendo argumentos de forma correta, se chegarmos a uma contradicao, entao a¸~ ~
hipotese H deve ser falsa.´ 0
 Em estatistica, copiamos este enfoque, mas em vez de atingir uma contradicao,´ ¸~
observamos um resultado improvavel.´
 Quando uma investigacao e relacionada a um fato baseado na amostra, a negacao¸ ¸~ ~´
deste fato e considerado como a hipotese H e o fato a ser comprovado pelos dados e´ ´ ´0
considerado como a hipotese alternativa H .´ 
 O objetivo do teste de hipotese e dizer, atraves de uma estatistica obtida de uma´ ´ ´ ´ ^
amostra, se a hipotese H e ou nao aceitavel. Operacionalmente, isto e conseguido atraves´ ´ ´ ´ ´~0
de uma regiao critica RC. Caso o valor da estatistica pertenca a esta regiao, rejeitamos H ;~ ~´ ´ ¸ 0
caso contrario, nao rejeitamos H . Esta regiao e construida de modo que P{ RC | H e´ ´ ´~ ~ ´ ^0 0 
verdadeira} seja igual a , um n- fixado.o
 Os testes de hipoteses podem ser de dois tipos:´
i) Testes Parametricos´
ii) Testes Nao-Parametricos~ ´ : Aderencia, Independencia, Homogeneidade e etc.^ ^
4.2 Hipotese Nula e Hipotese Alternativa´ ´
 H : Hipotese Nula e a hipotese a ser testada.´ ´ ´0
H : Hipotese Alternativa.´
45
 A rejeicao de H implica a aceitacao de H , e a aceitacao de H implica a rejeicao¸ ¸ ¸ ¸~ ~ ~ ~0 0
de H .
Exemplos: Para o caso dos testes parametricos podemos ter:´
 1) Teste Bicaudal H : = 1000 
 H : 100  
2) Teste Unicaudal a Direita H : = 0.01# 0 
 H : 0.01  
3) Teste Unicaudal a Esquerda H : p = 0.4# 0
 H : p 0.4 
NOTA: 1) A informacao para verificar se uma hipotese e verdadeira ou falsa e obtida da¸~ ´ ´ ´
amostra da populacao.¸~
 2) Durante o curso abordaremos a hipotese nula somente como uma hipotese´ ´
estatistica simples, onde a distribuicao e completamente especificada.´ ¸~ ´
Admitindo que H seja verdadeira, estamos admitindo conhecidos os parametros^0
que definem a distribuicao da estatistica usada no teste.¸~ ´
4.3 Estatistica do Teste´
 A Estatistica do Teste e uma estatistica T cujo valor serve para determinar a decisao´ ´´ ~
a ser tomada.
NOTA: Assim como ocorreu para o desenvolvimento da estimacao por intervalo, os testes¸~
de hipotese tambem sao baseados nas distribuicoes dos estimadores.´ ´ ~ ~¸
Dessa maneira, as distribuicoes de probabilidade da media amostral X; da variancia¸~ ´
_
^
amostral S ; da proporcao amostral p, serao utilizadas para os respectivos testes sobre a¸~ ~^
media , a variancia e a proporcao p.´ ^ ¸~ 
4.4 Erros Tipo I e Tipo II
 Quando tomamos uma decisao sobre a hipotese proposta corremos o risco de~ ´
tomarmos uma decisao errada.~
46
 Associado a um teste de hipoteses temos dois erros possiveis:´ ´
 i) a hipotese H e verdadeira mas o teste leva a conclusao de que H´ ´ ~Erro Tipo I: 0 0
deve ser rejeitada.
 ii) a hipotese H e falsa mas o teste leva a conclusao de que H nao´ ´ ~ ~Erro Tipo II: 0 0
#
deve ser rejeitada.
 A tabela a seguir apresenta as possibilidades de cometermos os erros tipo I e tipo II.
------------------------------------------------------------------
 Aceitar H Rejeitar H0 0
 -------------------------------------------------------------------
H e verdadeira Decisao Correta Erro Tipo I´ ~0
H e falsa Erro Tipo II Decisao Correta´ ~0
 --------------------------------------------------------------------
 Designaremos
 = P{cometer erro tipo I} = P{Rejeitar H | H e verdadeira}´ 0 0
e
 = P{cometer erro tipo II} = P{Aceitar H | H e falsa}´ 0 0
Exemplo: H : = 0 0 
 H :    0
NOTA: A probabilidade do erro do tipo II, , na maioria dos casos, nao e possivel calcular,~ ´ ´
pois usualmente nao especifica uma u´nica possibilidade, mas uma familia de possibilidades~ ´
alternativas.
47
4.5 Regiao Critica do Teste~ ´
 A Regiao Critica (RC) do Teste e a regiao de rejeicao da hipotese H .~ ~ ~´ ´ ´¸ 0
NOTA: 1) Normalmente, temos que determinar um valor critico T da estatistica T, que nos´ ´c
permite escolher entre H e H . Este valor critico T delimitara a regiao critica.´ ´´ ~0 c
2) Observem que determina a regiao critica do teste.~ ´
4.6 Escolha da Hipotese Nula´
 Qual sera a hipotese nula H ?´ ´ 0
_ A formulacao da hipotese nula a ser testada depende de qual e o erro mais grave.¸~ ´ ´
 A teoria Classica do teste de hipotese considera que o erro do tipo I e muito mais´ ´ ´
grave que o erro tipo II. Ou seja, e muito mais grave rejeitar H quando ela e verdadeira do´ ´0
que aceita-la quando e falsa. Isto significa que se deve ter muita evidencia de que H e falsa´ ´ ´^ 0
antes de rejeita-la.´
 Consideraremos, portanto, H a hipotese cuja rejeicao implicaria num erro tipo I´ ¸~0
mais grave.
Exemplo: Suponhamos que uma vacina contra uma doenca vai ser testada em um grupo de¸
pessoas, enquanto que um grupo de controle recebe apenas soro. Apos algum tempo´
verificamos quais pessoas adquiriram a doenca (afetados) e quais nao adquiriram (nao¸ ~ ~
afetados), obtendo-se a tabela abaixo:
 Afetados Nao-Afetados~---------------------------------------------------------------
 Receberam n n  
 Vacinas
 ---------------------------------------------------------------
 Receberam n n  
 Soro
 ---------------------------------------------------------------
 Assim, n pessoas foram vacinadas e nao ficaram doentes, enquanto que n~  
pessoas receberam apenas soro e ficaram doentes, . . .
48
 Suponhamos que queremos escolher uma das seguintes hipoteses nulas.´
 H' : a vacina e eficiente.´
 H'' : a vacina e inocua.´ ´
 -Se H = H' , o erro tipo I consiste em rejeitar H' sendo ela verdadeira, i.e, a vacina´0
e eficiente, mas a consideramos inocua.´ ´
 -Se H = H'' , o erro tipo I consiste rejeitar H'' sendo ela verdadeira, i.e, a vacina e´ ´0
inocua, mas a consideramos eficiente.´
 Tomamos H'' como hipotese nula, pois o erro tipo I decorrente nos parece ser o´
mais grave.
4.7 Mecanismo dos Erros
 Para o entendimento do relacionamento entre as probabilidades e , vamos 
idealizar um exemplo.
Exemplo: Um professor aplica um teste envolvendo 10 questoes do tipo certo-errado. Ele~
quer testar a hipotese "o estudante esta adivinhando".´ ´
Sol: Designemos por p, a probabilidade do estudante responder corretamente a uma
questao.~
 A hipotese que iremos testar sera H : p = .´ ´ 0 1 2 
O teste sera baseado no nu´mero de sucessos nas n = 10 repeticoes independentes do´ ¸~
experimento, i.e, no nu´mero de acertos nas 10 questoes.´ ~
 Seja X: nu´mero de respostas certas em 10 questoes~
 Portanto X b 10 , onde X = 0, 1, 2, 3, 4, 5, . . . , 10 .~ 12 
 Se H for verdadeira, o nu´mero de acertos devera estar proximo de E(X) = n.p =´ ´0
10. = 5 1 2
i) Seja RC = {8, 9, 10} a regiao critica do teste, i.e,~ ´ ´
"Se oito ou mais respostas estao corretas, o estudante nao esta adivinhando, caso~ ~ ´
contrario diremos que o estudante esta adivinhando."´ ´
49
 H sera rejeitada se X = 8 ou X = 9 ou X = 10.´0
 Dai,´
 = P{Rej. H | H e verd.} = P{X = 8 ou X = 9 ou X = 10 | p = 0.5} =´ 0 0
 = .0,5 .0,5 + .0,5 .0,5 + .0,5 .0,5 = 0.054     10 10 108 9 10
8 10-8 9 10-9 10 10-10
 Suponhamos, que na realidade, a hipotese testada H :p = seja falsa, ou seja que p´ 0 12
= 0.8. Calculemos o valor de .
 = P{Aceit. H | H e falsa} = P{X = 0 ou X = 1 ou . . . ou X = 7 | p = 0.8} =´ 0 0
 = .0,8 .0,8 + .0,8 .0,8 + . . . + .0,8 .0,8 = 0.322      10 10 100 1 7
0 10-0 1 10-1 7 10-7
ii) Agora, seja RC = {9, 10}, entao,~
 = P{Rej. H | H e verd.} = P{X = 9 ou X = 10 | p = 0.5} =´ 0 0
 = .0,5 .0,5 + .0,5 .0,5 = 0.01   10 107 7
9 10-9 10 10-10
 = P{Aceit. H | H e falsa} = P{X = 0 ou X = 1 ou . . . ou X = 8 | p = 0.8} =´ 0 0
 = .0,8 .0,8 + .0,8 .0,8 + . . . + .0,8 .0,8 = 0.624      10 10 100 1 8
0 10-0 1 10-1 8 10-8
iii) Agora, seja RC = {7, 8, 9, 10}, entao, = ? e = ? (Exercicio)~ ´ 
 Obtemos, entao, o seguinte quadro:~
 RC  
 ------------------------------------------------------
 {7, 8, 9, 10} 0.17 0.121
 {8, 9, 10} 0.054 0.322
 {9, 10} 0.01 0.624
 ------------------------------------------------------
 Portanto, diminuindo , aumenta. 
50
NOTA: Um teste ideal e dado quando e tem os menores valores possiveis.´ ´ 
 Porem, para o tamanho da amostra n fixado, vimos no exemplo acima que quanto´
menor for o valor de , maior sera o valor de . Ou seja, nao e possivel tomar e que´ ´~ ´   
sejam minimos possiveis.´ ´
 Como solucao, fixa-se um valor para e toma-se o menor possivel. A justificativa¸~ ´ 
de fixar e dada pelo fato que, em geral, o erro tipo I e mais grave do que o erro tipo II.´ ´
 Portanto, na construcao do teste de hipoteses, procuramos controlar o erro tipo I,¸~ ´
fixando-se a sua probabilidade de ocorrencia. Uma vez fixado esse valor, a regiao critica e^ ~ ´ ´
construida de modo que P{ RC | H e verdadeira} seja igual ao valor fixado .´  0
4.8 Nivel de Significancia do Teste´ ^
Definic¸a~o: A probabilidade de cometer um erro tipo I e um valor arbitrario e recebe o´ ´
nome de Nivel de Significancia do teste.´ ^
O resultado da amostra e cada vez mais significante para rejeitar H quanto menor´ 0
for esse nivel .´ 
Interpretac¸a~o: Se escolhermos um nivel de significancia de 5%, significa que em 100´ ^
realizacoes do experimento cerca de 5 vezes rejeitariamos H quando ela devesse ser aceita,¸~ ´ 0
ou seja podemos ter 95% de confianca de termos tomado a decisao correta.¸ ~
 De modo geral, a regiao de aceitacao de um teste de hipoteses H : = vs H : ~ ~¸ ´ 0 0  
 , com nivel de significancia , corresponde a um intervalo de confianca bicaudal´ ^ ¸ 0
100.(1 )% para .  
 Na pratica, costuma-se adotar um nivel de significancia de 0,05 ou 0,01.´ ´ ^
4.9 Procedimentos para se efetuar um Teste de Hipoteses´
 O procedimento para a realizacao deste teste pode ser resumido nos seguintes¸~
passos:
 1- Identificar as hipoteses H e H .´ 0 
2- Fixar o limite de erro (nivel de significancia).´ ^
3- Identificar a estatistica do teste.´
4- Calcular o valor da estatistica do teste a partir dos dados da amostra selecionada.´
5- Determinar a regiao critica do teste.~ ´
51
6- Verificar se o valor calculado em 4) esta incluido na regiao de rejeicao ou nao, e´ ~ ~ ~¸
concluir pela aceitacao ou rejeicao de H .¸ ¸~ ~ 0
 Procuraremos, sempre que fizermos teste de hipoteses, distinguir bem estes passos.´
Exemplo: Consideremos uma amostra de 16 elementos retirada de uma populacao Normal¸~
N( , ), onde = 16, dada por   
 20 18 19 17 24 18 17 26 21 17 19 3 21 20 21 21
Desejamos testar H : = 20 com nivel de significancia = 5%.´ ^0  
 H : 20  
Sol: Se fixarmos os riscos de cometer o erro tipo I, ou seja a probabilidade , obteremos
a regiao critica para o teste sujeito a este erro.~ ´
 Sabemos que a Estatistica do Teste e: Z = N(0 , 1).´ ´ X - 
_
 ~


 n
Como H indica que a media populacional deve ser maior do que 20, teremos um´
teste unicaudal a direita, concentrando-se o risco na cauda a direita da distribuicao.¸~# #
Assim:
Determinemos o valor de x da seguinte forma,
_
c
 P{X x } = 0.05 P = 0.05 = 1.64 x =
_ _ _
    c cX - 20
_
x - 20 x - 20
_ _
 4 4 4
16 16 16
c c
  
21.64
 Logo, a regra de decisao para aceitacao ou rejeicao de H : = 20, para = 0.05~ ~ ~¸ ¸ 0  
sera:´
Regiao Critica (RC): Rejeita-se H quando X 21,64~ ´
_
0 
Regiao de Aceitacao (RA): Aceita-se H quando X 21,64~ ~¸
_
0 
 Conclusao: O valor observado da estatistica e X = 18.88, i.e, a media obtida da~ ´ ´ ´ ´
_
amostra. Como X = 18.88 x = 21,64 aceitamos H .
_
 c 0
52
NOTA: 1) A critica a este procedimento e que, em muitos casos, a escolha do nivel de´ ´´
significancia e completamente arbitraria.^ ´ ´
Alem disso, nos casos em que a distribuicao sob H e discreta, o nivel de´ ´¸~ ´0
significancia escolhido pode nem mesmo ser atingido.^
Exemplo: Um praticante de tiro ao alvo vai comprar um lote muito grande de municao e o¸~
vendedor garante que a porcentagem de projeteis em bom estado e 90%.´ ´
 No entanto, o comprador decide fazer uma experiencia para testar a veracidade da^
afirmacao do vendedor. Ele escolhe 10 projeteis e vai verificar quantos sao bons.¸~ ~´
 Ele decide nao comprar o lote se X = nu´mero de bons na amostra for muito~
pequeno.
Sol: X e uma v.a. t.q. X b(10 , p) e X = 0, 1, 2, . . . , 10, onde p = proporcao de bons´ ¸~ ~
projeteis no lote.´
 A hipotese a ser testada e H : p = 0,9.´ ´ 0
 Suponhamos que para cada suposta regiao critica ele calcula a probabilidade .~ ´ 
 Dado que p = 0.9, temos (ver tabelas):
P{X = 0} = P{X = 1} = P{X = 2} = P{X = 3} = P{X = 4} = 0,~
 P{X = 5} =

Continue navegando