Buscar

3 INFERÊNCIA ESTATÍSTICA 1 (1)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

​​​​ 
UNIVERSIDADE FEDERAL RURAL DA AMAZÔNIA
 INSTITUTO CIBERESPACIAL
INFERÊNCIA ESTATÍSTICA
 LUCIANA MARIA DE OLIVEIRA
luciana_oliveira658@hotmail.com
BELÉM/PA
Set/2014
SUMÁRIO
3 INFERÊNCIAS ESTATÍSTICA
 3.1 Distribuição Amostral 
	3.2 Intervalos de Confiança
	3.3 Testes de Hipóteses
3 INFERÊNCIA ESTATÍSTICA
Introdução
Nas unidades anteriores, vimos como construir modelos probabilísticos para descrever alguns fenômenos. Nesta parte, iremos estudar um ramo muito importante da Estatística conhecido como Inferência Estatística, ou seja, como fazer afirmações sobre características de uma população, baseando-se em resultados de uma amostra. 
O objetivo da Inferência Estatística é produzir afirmações sobre uma dada característica da população, na qual estamos interessados, a partir de informações colhidas de uma parte dessa população (amostra). Esta característica pode ser representada por uma variável aleatória. Se tivéssemos informação completa sobre a função de probabilidade, no caso discreto, ou sobre a função densidade de probabilidade, no caso contínuo, da variável em questão, não teríamos necessidade de colher uma amostra. Toda afirmação desejada seria obtida por meio da distribuição da variável, usando-se as propriedades estudadas anteriormente. Mas isso raramente acontece. Ou não temos qualquer informação a respeito da variável, ou ela é apenas parcial.
A maneira mais usual de selecionarmos uma amostra (amostra casual simples) é atribuir a cada elemento da população a mesma probabilidade de seleção, e repor o elemento sorteado na população antes do próximo sorteio. Este procedimento torna-se inviável quando a população é muito grande. Neste caso usa-se um processo alternativo, onde os elementos são numerados e em seguida sorteados através de uma tabela de números aleatórios. A maneira de se obter uma amostra é tão importante, e existem tantos modos de fazê-lo, que estes procedimentos constituem uma especialidade dentro da Estatística, conhecida como Amostragem.
Estatísticas e parâmetros
As distribuições amostrais tendem a produzir estatísticas amostrais representativas dos parâmetros populacionais. Isto é, apesar do fato de tenderem a apresentar certa variabilidade, podemos dizer que as estatísticas amostrais devem aproximar parâmetros populacionais de forma bastante satisfatória. Esta característica de ser representativa resulta em estatísticas amostrais que tendem a se acumular na vizinhança dos verdadeiros valores populacionais.
 População (N elementos) Amostra (n elementos)
 
 					 
 Inferência ou
 Indução Estatística
Estatística
Uma estatística é uma característica da amostra, ou seja, uma estatística T é uma função de X1, X2, ..., Xn, T = f (X1, X2, ..., Xn ).As estatísticas mais comuns são:
	
	
: média da amostra,
	
	
: variância da amostra,
	X(1) = min(X1, X2, ..., Xn,)
	: o menor valor da amostra,
	X(n) = max(X1, X2, ..., Xn,)
	: o maior valor da amostra,
	A = X(n) - X(1)
	: amplitude total da amostra,
	X(i) 
	: i-ésima maior observação da amostra.
 
Parâmetro
Um parâmetro é uma medida usada para descrever uma característica da população. Assim, se estamos colhendo amostras de uma população identificada pela v.a. X, então, seriam parâmetros a média E(X) ou, ainda, sua variância Var(X).
Os símbolos mais comuns são dados na tabela a seguir.
	
	Estatística
	População
	Média
	
	(
	Variância
	S2
	(2
	Nº de elementos
	n
	N
	Proporção
	
	p
3.1 DISTRIBUIÇÃO AMOSTRAL
O problema da Inferência Estatística é fazer uma afirmação sobre parâmetros da população através da amostra. Digamos que nossa afirmação deva ser feita sobre um parâmetro ( da população (média, variância ou qualquer outra medida). Decidimos que usaremos uma amostra casual simples, com reposição, de n elementos sorteados dessa população. Também decidimos que a nossa decisão será baseada na estatística T, que será uma função da amostra (X1, X2, ..., Xn), ou seja, T = f (X1, X2, ..., Xn ). Colhida uma amostra, teremos observado um particular valor de T, digamos t0, e baseados nesse valor é que faremos a afirmação sobre (, o parâmetro populacional.
A validade da nossa resposta seria melhor compreendida se soubéssemos o que acontece com a estatística t, quando retiramos todas as amostras de uma população conhecida segundo o plano amostral adotado. Isto é, qual a distribuição de T quando (X1, X2, ..., Xn) assume todos os valores possíveis. Esta distribuição é chamada de distribuição amostral da estatística T e desempenha papel fundamental na teoria de Inferência Estatística.
 
Ex.2: Numa urna tem 5 tiras de papel, numeradas 1, 3, 5, 5 e 7. Uma tira de papel é sorteada e recolocada na urna; então uma segunda tira é sorteada. Seja X1 e X2, respectivamente, o primeiro e o segundo número sorteados. Selecionamos todas as amostras de tamanho 2, com reposição. A distribuição conjunta da variável bidimensional (X1, X2) é dada na Tabela 1.
Tabela 1 - Distribuição das probabilidades das possíveis amostras de tamanho 2 que podem ser selecionadas com reposição da população {1,3,5,5,7}
	X1
X2
	1
	3
	5
	7
	Total
	1
	1/25
	1/25
	2/25
	1/25
	1/5
	3
	1/25
	1/25
	2/25
	1/25
	1/5
	5
	2/25
	2/25
	4/25
	2/25
	2/5
	7
	1/25
	1/25
	2/25
	1/25
	1/5
	Total
	1/5
	1/5
	2/5
	1/5
	1
Vejamos qual a distribuição amostral da estatística 
. Esta distribuição é obtida por meio da Tabela 1. Por exemplo, quando amostra selecionada é o par (1,1), corresponderá à média 1; então, temos P(
=1) = 1/25. Obteremos média igual a 3 quando ocorrer o evento A = {(1,5), (3,3), (5,1)}, logo, P(
=3) = P(A) = 2/25+1/25+2/25 = 1/5.
Procedendo de modo análogo, obtemos a distribuição amostral de 
 (Tabela 2)
Tabela 2 - Distribuição amostral da estatística 
	
	1
	2
	3
	4
	5
	6
	7
	Total
	P(
)
	1/25
	2/25
	5/25
	6/25
	6/25
	4/25
	1/25
	1
Com um procedimento análogo, podemos determinar a distribuição amostral da amplitude total W, dada na Tabela 3.
Tabela 3 - Distribuição amostral de W
	w
	0
	2
	4
	6
	Total
	P(W = w)
	7/25
	10/25
	6/25
	2/25
	1
Ou ainda, da variância S2 (Tabela 4).
Tabela 4 - Distribuição amostral de S2
	s2
	0
	2
	8
	18
	Total
	P(S2 = s2)
	7/25
	10/25
	6/25
	2/25
	1
Distribuição Amostral da Média
Vamos estudar agora a distribuição amostral da estatística 
; a média da amostra. Consideremos uma população identificada pela variável X, cujos parâmetros média populacional ( = E(X) e variância populacional (2 = Var(X) são supostamente conhecidos. Vamos retirar todas as possíveis amostras casuais simples de tamanho n dessa população, e para cada uma calcular a média 
. Em seguida, construamos a distribuição amostral e estudemos suas propriedades. Ilustremos com os dados do Ex. 2:
Ex.3: A população {1,3,5,5,7} tem média ( = 4,2 e (2 = 4,16. 
E(X1) = E(X2) = 1.1/5 + 3.1/5 + 5.2/5 + 7.1/5 = 1/5 + 3/5 + 10/5 + 7/5 = 21/5 = 4,2
Var(X1) = Var(X2) = 4,16
e a distribuição amostral de 
 para n = 2 está na Tab. 2. Baseando-nos naqueles dados, podemos verificar que
E(
) = 1/25 + 4/25 + 15/25 + 24/25 + 30/25 + 24/25 + 7/25 = 105/25 = 4,2
Var(
) = 4,16/2 = 2,08
Observe que a média das médias amostrais é igual a média populacional. E a variância de 
 é igual a Var(X) dividida por 2. Isso sempre acontece.
Teorema 3.1: Seja X uma v.a. com média ( e variância (2, e seja (X1, X2, ..., Xn) uma amostra casual simples. Então, se 
temosE(
) = ( e Var(
) = (2/n
Já determinamos a média e a variância da distribuição de 
. Para derivar as demais propriedades de 
, bastaria agora determinar qual a forma (modelo probabilístico) da curva referente à distribuição (histograma) de 
. A derivação dessa propriedade exige recursos matemáticos que estão fora dos objetivos dessa disciplina. Assim, iremos mostrar empiricamente o que acontece com a distribuição de 
.
	Ex 4. (continuação): Na população {1,3,5,5,7}, construímos os histogramas das distribuições de 
 para n = 1, 2, 3 e 4.
 (b) (c)
Distribuição de 
 para n = 1; a distribuição coincide com a distribuição de 
.
Distribuição de 
 para n = 2 (Tab. 2)
Distribuição de 
 para n = 3.
Observe que, n vai aumentando, o histograma vai ficando mais serrilhado e tende a concentrar-se cada vez mais em torno de E(
). Os casos extremos passam a ter pouca probabilidade de ocorrência. Quando n for suficientemente grande, o histograma alisado aproxima-se da distribuição normal. Este resultado fundamental na teoria de Inferência Estatística é conhecido como Teorema Limite Central.
Teorema 3.2: Para amostras casuais simples (X1, X2, ..., Xn) retiradas de uma população com média ( e variância (2, a distribuição amostral da média 
 aproxima-se de uma distribuição normal com média ( e variância (2/n, quando n tende ao infinito.
Ex.5: Voltemos ao Ex. 1, onde a máquina enchia pacotes. Digamos que ela esteja regulada para enchê-los segundo uma normal com média 500 gramas e desvio padrão de 10 gramas, isto é X: N(500,100). Colhendo uma amostra de 100 pacotes e pesando-os, sabemos pelo Teorema do Limite Central que 
 terá distribuição normal, com média 500 e variância 100/100 = 1 (g)2. Assim, se a máquina estiver regulada, a probabilidade de encontrarmos a média de 100 pacotes diferindo de 500 com menos de 2 gramas (para mais ou para menos) será: 
P(|
 - 500|) < 2) = P(498 < 
 < 502) = P(-2 < Z < 2) ( 95%.
Ou seja, dificilmente 100 pacotes serão uma média fora do intervalo ]498; 502[.
Corolário 3.1: Se (X1, X2, ..., Xn) é amostra casual simples da população X com média ( e variância (2, e 
 = (X1+ X2+ ...+ Xn)/n, então, 
Corolário 3.2: A distribuição de (
-() aproxima-se de uma distribuição normal com média 0 e variância (2/n, isto é, (
-() ~ N(0, (2/n). Pois, o Teorema Limite Central afirma que 
 se aproxima de uma normal quando n tende para infinito.
3.1.2 Distribuição Amostral da Proporção
Vamos considerar uma população em que a proporção de elementos portadores de uma certa característica é p. Assim, a população pode ser considerada como a variável X, tal que
X =	1, se o indivíduo é portador da característica
	0, se o indivíduo não é portador da característica;
logo, ( = E(X) = p e (2 = Var(x) = p(1-p). Retirada uma amostra casual simples, com reposição, dessa população, e se indicarmos por Sn o total de indivíduos portadores da característica na amostra, já vimos que Sn : b(n, p).
Definimos como 
 a proporção de indivíduos portadores da característica na amostra, isto é, 
. Podemos considerar a distribuição amostral de 
 do seguinte modo:
Exercícios 
Suponha que de uma população normal com média 85 e variância 144, uma amostra aleatória simples de tamanho 25 foi escolhida com reposição. Encontre:
	a) P (
 ( 75).			b) P ( ( 
 - 87 ( ( 1).
	c) P (80 ( 
 ( 90).			d) O valor de a tal que P(
 ( a) = 2.P(
 ( a).
Suponha que de uma população normal com média ( = 100 e variância (2 = 225. Uma amostra de tamanho n = 16 foi escolhida com reposição. Calcule:
	a) P (
 ( 105).		b) P (
 ( 96).		c) P ((
 - 98 ( ( 1)
3.2 INTERVALO DE CONFIANÇA
Até agora, todos os estimadores apresentados foram estimadores pontuais, isto é, especificam um único valor para o estimador. Este procedimento não permite julgar qual a possível magnitude do erro que estamos cometendo. Daí surge a ideia de construir os intervalos de confiança, que são baseados na distribuição amostral do estimador pontual.
3.2.1 Intervalo de Confiança para a Média (variância conhecida)
A estimativa pontual da média populacional ( será feita por um valor 
. Qualquer que seja esta amostra, teremos um erro que será 
 - (. Convém lembrar que ( não é variável aleatória mas um parâmetro, e a expressão 
P(
- 1,96
< ( < 
 + 1,96
) = 0,95
deve ser interpretada do seguinte modo: construídos todos os intervalos da forma 
 ( 1,96
, 95% deles conterão o parâmetro (.
Sorteada uma amostra e encontrada sua média, e admitindo-se conhecido 
, podemos construir o intervalo:
 ( 1,96
Este intervalo pode ou não conter o parâmetro (, mas pelo exposto acima temos 95% de confiança de que contenha.
Ex.: Uma máquina enche pacotes de café com uma variância igual a 100g2. Ela estava regulada para enchê-los com 500g, em média. Agora ela se desregulou, e queremos saber qual a nova média (. Uma amostra de 25 pacotes apresentou uma média igual a 485 g. Vamos construir um intervalo de 95% de confiança para (:
IC(( : 95%) = 485 ( 1,96 x 2 = ]481, 489[ já que 
Exemplo 1
Vamos partir de um exemplo prático, onde uma v.a. X, com população infinita, tem média ( desconhecida e desvio padrão (=25. Suponhamos que, para estimar (, tomamos uma amostra aleatória simples com n=100 observações a 95%. Então para essa amostra teremos:
Como , enquanto encaramos como variável, podemos afirmar que:
Admitamos que com base nos valores da amostra obtivemos =17,6. Então:
e
Portanto, o intervalo encontrado de (12,7; 22,5) é denominando de intervalo de 95% de confiança para (. Nesse caso, a interpretação é a de que, se fossem determinados intervalos, da mesma maneira para um grande número de amostras, em 95% dos casos tais intervalos incluiriam a verdadeira média (.
3.2.2 Intervalo de Confiança para a Média (variância desconhecida)
O processo para se obter o intervalo de confiança é semelhante àquele mostrado no item anterior. Como não se conhece (, porém, é preciso substituí-lo por S (desvio padrão amostral) que, contrariamente a (, é uma variável aleatória. Daí se ter o cociente entre duas variáveis aleatórias, 
 e S. Assim,
e pode-se mostrar que t tem distribuição “t de Student” com (n-1) graus de liberdade. Fixando-se um nível de confiança: 1 - ( temos que:
Ou seja:	
	Substituindo-se o valor t e resolvendo-se as inequações para (, obtém-se o intervalo para a média quando a variância ((²) é desconhecida.
,	em que a variável t tem distribuição “t de Student” com (n-1) graus de liberdade.
Exemplo
Uma amostra de tamanho 9, extraída de uma população normal, acusa x=1,0 e s=0,264. Construir intervalos de 98% e 95% de confiança para a média populacional.
	 
	
3.2.3 Intervalo de Confiança para a Proporção
Seja o seguinte exemplo: Uma amostra de n = 500 pessoas de uma cidade é escolhida, e a cada pessoa da amostra é feita uma pergunta a respeito de um problema municipal, para o qual foi apresentada uma solução pela Prefeitura. A resposta à pergunta poderá ser SIM (favorável a solução) ou NÃO (contrária a solução). Deseja-se estimar a proporção (p) de pessoas na cidade favoráveis à solução apresentada.
Vamos obter um intervalo de confiança para p. Sabemos que se X = número de sucessos nas n provas, então X tem uma distribuição aproximadamente normal, com média ( = np e variância (2 = npq, q = 1-p. 
Portanto, com probabilidade 0,95, temos que 
 
Assim,
P(
- 1,96
< p < 
+ 1,96
)= 0,95
Sorteada uma amostra e encontrado a proporção 
, podemos construir o intervalo
 ( 1,96
Exemplo: Numa pesquisa de mercado, n = 400 pessoas foram entrevistadas sobre determinado produto, e 60% destas pessoas preferiram a marca A. Aqui 
 = 0,6, e um intervalo de confiançapara p com c.c ( = 0,95 será
	IC(p : 95%) = 
 = 0,6 ( 0,049 ou seja,
 	IC(p : 95%) = [0,551 ; 0,649]
Exercícios 
Uma amostra extraída de uma população normal cujo desvio padrão é igual a 0,17 forneceu os seguintes valores: 25,4; 25,2; 25,6; 25,3; 25,8; 25,4. Construa intervalos de confiança de 90%, 95% e 97,74% para a média populacional.
De uma população normal com parâmetros desconhecidos, retirou-se uma amostra de 25 elementos para se estimar µ, obtendo-se 
= 15 e s2 = 36. Determinar um intervalo de confiança de 95% para a média. 
Seja X uma variável aleatória normal com parâmetros desconhecidos. Dessa população foi retirada uma amostra cujos valores foram: 14, 12, 14, 15, 16, 18, 15, 12, 16, 10, 15, 15, e 17. Construa um intervalo de 90% de confiança para a média.
São dadas as seguintes distribuições de frequências representativas dos dados de duas amostras de n elementos. Para cada amostra, encontrar intervalos de 90%; 95%; 97,74% e 80%, para a média populacional.
	Classes
	fi
	
	Classes
	fi
	10 ( 20
20 ( 30
30 ( 40
40 ( 50
50 ( 60
60 ( 70
	3
9
15
10
8
5
	
	10 ( 14
14 ( 18
18 ( 22
22 ( 26
26 ( 30
	18
22
28
18
12
	Total
	
	
	Total
	
3.3 TESTE DE HIPÓTESES
		O Teste de Hipóteses e a estimação por Intervalo de Confiança são dois ramos principais da inferência estatística. O objetivo do Teste de Hipóteses é decidir se determinada afirmação sobre um parâmetro populacional é verdadeira sob a ótica da Teoria de Probabilidades. O Teste de Hipóteses é um processo de decisão estatística. 
Definição 3.1: A hipótese nula, denotada por H0 é geralmente a crença convencional ou o ponto de vista prevalente. Normalmente, a hipótese nula é a afirmação de que não aconteceu nada, não há efeito, ou não houve mudança na população.
Definição 3.2: A hipótese alternativa, denotada por H1 é a crença concorrente a H0. Em muitas situações, a hipótese alternativa reflete o que o pesquisador gostaria de que fosse verdade, refletindo uma mudança na população.
Definição 3.3: Os dados coletados são estatisticamente significantes se os mesmos forem bastante improváveis sob a suposição de H0 ser verdadeira. Se rejeitarmos H0 então os dados são estatisticamente significantes.
Tipos de Erros
Erro Tipo I ((): Rejeitar a hipótese nula quando na realidade ela é verdadeira.
Erro Tipo II ((): Não rejeitar a hipótese nula quando na realidade ela é falsa.
Sobre os Erros
Evitar erros elaborando testes que os tornem os menores possíveis (planejamento);
Não é possível minimizar ambos os erros ao mesmo tempo;
Na literatura médica, normalmente aceita-se um Erro Tipo I entre 1% e 5%. Para o Erro do Tipo II, normalmente aceita-se 20% (Poder do Teste = 1 - ();
Devido às flutuações amostrais, ao comparar duas hipóteses e tomar uma decisão, pode-se tomar a decisão errada!
O Erro Tipo I é comumente denominado Nível de Significância do Teste e Erro Tipo II pode nos levar a construir a Função Poder do Teste. Nesta apostila, trabalharemos apenas com o Nível de Significância (().
Procedimento geral para o Teste de Hipóteses
Formular as hipóteses de interesse. Por exemplo, para testes a respeito da média, temos:
 Bilateral: H0: ( = (0 
 		 H1: ( ≠ (0
 Unilateral: H0: ( = (0
 		 H1: ( < (0
 Unilateral: H0: ( = (0
		 H1: ( > (0
Fixar o nível de significância (() e determinar a região de rejeição. Por exemplo, no teste bilateral temos:
Região de Rejeição – valores da estatística do teste improváveis de ocorrer se H0 for verdadeira, e muito prováveis se H0 for falsa.
OBS: Esta região deve ser construída com base na estatística do teste (conforme a teoria estatística) e nas hipóteses definidas em 1). Assim, determina-se o valor crítico (z(, t(, ..., para o teste unilateral ou ±z(/2, ±t(/2, ..., para o teste bilateral).
Usar as informações fornecidas pela amostra para calcular a estatística do teste (zc, tc, ...), usando a fórmula conforme a teoria estatística.
Decidir se rejeita ou não rejeita H0.
Decisão: rejeita-se H0, se o valor da estatística do teste calculado no passo 3) estiver na Região de Rejeição, isto é se for:
Maior que z(/2 ou menor que -z(/2 (no teste bilateral). 
Menor do -z( (no teste unilateral à esquerda) 
Maior do que z( (no teste unilateral à direita). 
3.3.1 Teste de Hipóteses para a Média Populacional ( com ( conhecido
	Como regra geral, devemos seguir os 4 passos definidos acima e usar, no terceiro passo, a seguinte estatística do teste:
, 
que, sob a hipótese H0: ( = (0, tem distribuição Normal com média 0 e desvio padrão 1.
Exemplo
Uma máquina automática de encher pacotes de café enche-os segundo uma distribuição normal, com média ( e variância 400g2. O valor de ( é apresentado num mostrador situado numa posição inacessível dessa máquina. A máquina foi regulada para ( = 500g. Desejamos, de meia em meia hora, colher uma amostra de 16 pacotes e verificar se a produção está sob controle, isto é, se ( = 500g ou não. Se uma dessas amostras apresentasse uma média 
 = 492g. Com base num teste de hipóteses, a produção deve parar para fixar a média?
Solução:
Visto que a máquina pode se desregular para mais ou para menos, vamos usar o teste bilateral e as hipóteses de interesse são:
H0: ( = 500 
H1: ( ≠ 500
Vamos fixar o nível de significância em 1% ((=0,01). Sendo assim, como o teste é bilateral, temos: ±z(/2 = ±z0,005 = ±2,575.
Neste caso, em que definimos as hipóteses sobre ( com ( conhecido, a estatística do teste é:
Decisão: visto que -1,6 está entre -2,575 e 2,575, não rejeitamos H0 ao nível de significância de 1%. Isto é, não há evidências de que a máquina tenha se desregulado.
Exemplo 2: A resistência à tração do aço inoxidável produzido numa usina permanecia estável, com uma resistência média de 72 kg/mm2 e um desvio padrão de 2,0 kg/mm2. Recentemente, a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas. 
	76,2 78,3 76,4 74,7 72,6 78,4 75,7 70,2 73,3 74,2
Presuma que o desvio padrão seja o mesmo que antes do ajuste. Podemos concluir que o ajuste mudou a resistência à tração de aço? (Adote um nível de significância de 5%)
Passo 1 : Definição da Hipótese
Ho: ( = 72 kg/mm2
H1: ( ≠ 72 kg/mm2
s = 2 kg/mm2
Passo 2: Calcular a estatística do Teste
Sendo = 75,0 e s = 2 kg/mm2, temos:
Isso significa que a média da amostra retirada aleatoriamente da produção está a 4,74 devios-padrão da média alegada em Ho que é 72.
Passo 3: Região Crítica
Passo 4: Regra de Decisão 
	Como o valor crítico para 5% é 1,96 desvios (Z tabelado), estamos na região de rejeição de Ho. 
Passo 5: Conclusão 
	Ho é rejeitada e concluímos que a resistência à tração do aço mudou.
Exemplo 3
Uma amostra de 36 elementos de uma variável X normalmente distribuída forneceu: 
X = 42,3 e S = 5,2. Testar, no nível de significância 0,05, a hipótese de que μ > 40.
Resolução: Seguindo o roteiro, temos: 
1º passo: 
H0: μ = 40; 
H1: μ > 40 (teste unilateral à direita);
2º passo: a amostra é grande (n > 30). Logo, usaremos a Tabela Normal; 
3º passo: o teste é unilateral, com α = 0,05. Logo, na tabela, teremos: ZTAB = 1.64
4º passo: desenhar a curva, plotando ZTAB;
5º passo: calcular a estatística teste:
6º passo: ZCALC > ZTAB.
Conclusão: Ao nível de significância de 5%, REJEITO H0: μ = 40. Logo, μ > 40.
3.3.2 Teste de Hipóteses para a Média Populacional ( com ( desconhecido
Neste caso, observando os 4 passos definidos acima, usaremos, no terceiro passo, a seguinte estatística do teste:
 ,
 que, sob a hipótese H0: (=(0, tem distribuição “t de Student” com (n-1) graus de liberdade.
Exemplo 1
Um trecho de uma rodoviária estadual, quando é utilizado o radar, são verificadas em média 7 infrações diárias por excesso de velocidade. O chefe de polícia acredita que este número pode ter aumentado.Para verificar isso, o radar foi mantido por 10 dias consecutivos. Os resultados foram:
 8, 9, 5, 7, 8, 12, 6, 9, 6, 10
Os dados trazem evidência de aumento nas infrações? 
Passo 1 : Definição da Hipótese
	Ho: m = 7 
	H1: m > 7
Passo 2: Calcular a estatística do Teste:
Temos = 8. Não conhecendo , estimamos por S (desvio-padrão da amostra), logo, S = 2,10. (Desvio-padrão foi estimado a partir de uma pequena amostra) deve-se usar a estatística t-student.
 
Isso significa que a média da amostra retirada aleatoriamente da produção está a 1,5 desvios-padrão da média alegada em Ho que é 7.
Passo 3: Região Crítica
O valor tabelado de t depende do nível de significância (5%) e dos graus de liberdade, que são função do tamanho da amostra: GL = n – 1 = 9. Nesse exemplo, 
	 t tabelado = 1,833
Passo 4: Regra de Decisão 
	O valor calculado de t está dentro da região de aceitação de Ho
Passo 5: Conclusão 
	Como aceitamos Ho, a conclusão é que e não houve um aumento significativo no número de infrações. Veja que, apesar de 8 ser maior que 7, a diferença não foi significativa para concluir que o número de infrações aumentou. É como se não houvesse provas suficientes para condenar o réu.
Exemplo 2
Os registros de um colégio atestam, para calouros admitidos, uma nota média de 115. Para testar a hipótese de que a média de uma nova turma é maior, selecionou-se, ao acaso, uma amostra de 20 notas, obtendo-se média 125 e desvio padrão 20. Admitindo um nível de significância de 5%, pode-se concluir que a média, de fato, aumentou?
Solução:
As hipóteses de interesse são:
H0: ( = 115 
H1: ( > 115
Para o nível de significância de 5% e baseando-se na distribuição “t de Student”, temos: t( = t0,05 = 1,7291.
A estatística do teste é:
Decisão: visto que 2,2361 > 1,7291, rejeitamos H0 ao nível de significância de 5%. Isto é, há evidências de que a média aumentou.
3.3.3 Teste de Hipóteses para a Proporção Populacional
	A estatística do teste é dada por:
, 
que, sob a hipótese H0: p = p0 , tem distribuição Normal com média 0 e desvio padrão 1.
OBS: A principal diferença entre os dois testes é que no Teste de Hipóteses para a Média precisávamos nos preocupar com o tamanho da amostra e se era conhecida ou não a variância populacional para decidir se usávamos a Tabela Normal ou a Tabela t-Student. Já no Teste de Hipóteses para Proporções não precisamos nos preocupar com isso, pois para encontrar o valor tabulado a ser comparado com o valor calculado (estatística teste) usaremos sempre a TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO.
Exemplo 1
Uma empresa de TV afirma que 60% dos televisores estavam ligados no seu programa especial do último domingo. Uma empresa competidora deseja contestar essa afirmação, e decide, para isso, usar uma amostra de 200 famílias, observando que 104 famílias estavam assistindo ao referido programa. Elabore um teste de hipóteses adequado, usando um nível de significância de 5%.
Solução:
Visto que a afirmação da empresa é de 60% de telespectadores, deve-se suspeitar que, na realidade, essa proporção é inferior. Assim, as hipóteses de interesse são:
H0: p = 0,60 
H1: p < 0,60
Para o nível de significância de 5% e baseando-se na distribuição Normal, temos que: -z( = -z0,05 = -1,645.
A estatística do teste é:
Decisão: visto que -2,309 < -1,645, rejeitamos H0 ao nível de significância de 5%. Isto é, há evidências de que o verdadeiro percentual de telespectadores é inferior a 60%.
Exemplo 2
As condições de mortalidade de uma região são tais que a proporção de nascidos que sobrevivem até 60 anos é de 0,6. Testar essa hipótese ao nível de 5% se em 1.000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos.
Resolução:
1º passo: Enunciar as hipóteses. 
H0: p = 0,6; 
H1: p ≠ 0,6 (teste bilateral);
2º passo: o teste é bilateral, com α = 0,05. Logo, teremos na Tabela da Distribuição Normal Padrão: ZTAB = 1.96.
3º passo: desenhar a curva, plotando ZTAB.
4º passo: Calcular a estatística teste. Antes, veremos qual a proporção na amostra. Têm-se 530 sobreviventes em 1.000 nascimentos (tamanho da amostra), então a proporção ou frequência relativa de sobreviventes na amostra será de: 
5º passo: Comparando, vemos que ZCALC < −ZTAB.
Conclusão: ao nível de significância de 5%, REJEITAMOS H0: p = 0,6. Logo, p ≠ 0,6.
Exercícios 
Testar: H0: ( = 50
 H1: ( ≠ 50
Em que: (2 = 4; ( = 5%; n=100 e 
= 52.
Testar: H0: ( = 36
 H1: ( < 36
Em que: (2 = 9; ( = 1%; n=64 e 
= 34,5.
A duração em horas de trabalho de 5 tratores foi 9420, 8200, 9810, 9290 e 7030 horas. Sabe-se que a duração dos tratores dessa marca tem distribuição normal com desvio padrão de 55 horas. Ao nível de significância de 3%, testar:
H0: ( = 8700
H1: ( ≠ 8700;
H0: ( = 8700
H1: ( > 8700;
H0: ( = 8700
H1: ( < 8700;
Um certo hormônio, ao ser injetado em galinhas, aumenta o peso médio do ovo em 0,3g. Uma amostra de 30 ovos tem média 0,4g acima da média anterior à injeção e s = 0,30g. Há razões suficientes para aceitar a afirmação de que o aumento da média é superior a 0,3g ao nível de significância de 5%?
Uma máquina de misturar fertilizantes é adaptada para fornecer 10g de nitrato para cada 100g de fertilizante. Dez porções de 100g são examinadas, com as seguintes porcentagens de nitrato: 9, 12, 11, 10, 11, 9, 11, 12, 9, 10. Há razões para crer que a porcentagem de nitrato não é 10%, ao nível de significância de 10%?
De uma população normal de parâmetros desconhecidos, retira-se uma amostra de 16 elementos, obtendo-se 
= 12 e s = 4. Ao nível de significância de 2%. Testar:
H0: ( = 10
H1: ( ≠ 10
 Um certo tipo de rato apresenta, nos três primeiros meses de vida, um ganho médio de peso de 58g. Uma amostra de 10 ratos foi alimentada desde o nascimento até a idade de 3 meses com uma ração especial, e o ganho de peso de cada rato foi (em gramas): 55; 58; 60; 62; 65; 67; 54; 64; 62 e 68. Há razões para crer, ao nível de significância de 5%, que a ração especial aumenta peso nos 3 primeiros meses de vida?
 Testar: H0: ( = 100
 H1: ( < 100
ao nível de significância de 5% com n = 64; 
= 98,6; e s2 = 2,56.
 Uma máquina automática que empacota o alimento A é programada para colocar 100g de peso. Para verificar a precisão da máquina, uma amostra de 60 pacotes do referido alimento fornece peso médio de 98g e desvio padrão de 6g. O que se pode concluir ao nível de 1%?
 Determine para ( = 10%, n = 35 e ( = 10 os valores de 
que levariam a rejeitar H0: ( = 50 contra H1: ( ≠ 50.
 Um fabricante de correntes sabe, por experiência própria, que a resistência à ruptura dessas correntes tem distribuição normal com média de 15,9 libras e desvio padrão de 2,4 libras. Uma modificação no processo é introduzida. Toma-se então uma amostra de 16 correntes fabricadas com o novo processo, obtendo-se resistência média de ruptura de 15 libras. Pode esse resultado significar que a resistência média à ruptura diminuiu ao nível de significância de 5%? Resolver o mesmo problema para uma amostra de 64 correntes e mesma média amostral.
 Um comprador de blocos de cimento acredita que a qualidade dos produtos da marca A esteja se deteriorando. Sabe-se, por experiência passada, que a força média do esmagamento desses blocos era de 400 libras, com desvio padrão de 20 libras. Uma amostra de 100 blocos da marca A forneceu uma força média de esmagamento de 390 libras (supor distribuição normal). Testar ao nível de significância de 2,5%, supondo que a qualidade média dos blocos tenha diminuído.
Um processo deveria produzir bancado com 0,85 m de altura. O engenheiro desconfia que as bancadas que estão sendo produzidas são diferentes que o especificado. Uma amostra de 8 valores foi coletada e indicou . Sabendo que o desvio padrão é , teste a hipótese do engenheirousando um nível de significância (=0,05.
 Um ensaio de tensões de ruptura de 6 cabos produzidos por uma companhia mostrou a tensão média de ruptura de 7.750kg e o desvio padrão de 145kg, ao passo que o fabricante declara que aquela tensão média é de 8.000kg. Será verdadeira a declaração do fabricante, ao nível de significância α = 0,05?
Os sistemas de escapamentos de uma aeronave funcionam devido a um propelente sólido. A taxa de queima desse propelente é uma característica importante do produto. Um técnico da qualidade seleciona uma amostra aleatória de n=25 e obtém uma taxa média amostral de queima de
= 51,3 cm/s. As especificações requerem que a taxa média de queima seja de 50 cm/s. Sabemos que o desvio padrão da taxa de queima é de 
 cm/s. Teste a hipótese de que a taxa média de queima seja igual a 50 cm/s usando um nível de significância de 0,05.
Um artigo no periódico Materials Engineering (1989, v(2) n.4 pp.275-281) descreve os resultados de teste de tensão quanto a adesão em 22 corpos de prova de liga U 700. A carga no ponto de falha do corpo de prova é dada a seguir (em MPa):
a)Existe alguma evidência forte para indicar que a carga média no ponto de falha do corpo de prova exceda 10 Mpa, usando 
?
b)Encontre um intervalo de confiança de 95 % para a carga média no ponto de falha do corpo de prova.
17)10 corpos de provas foram submetidos a um teste de corrosão onde foram submersos em água salgada durante 60 segundos/dia. A corrosão foi medida pela perda de peso em miligramas/decâmetro quadrado/dia (MDD). Os dados obtidos foram: 
 130.1 124.2 122.0 110.8 113.1 103.9 101.5 92.3 91.4 83.7
a) Encontre estimativas para a média e variância para a perda de peso em MDD.
b) Construa um intervalo de 95% de confiança para a média.
REFERÊNCIAS BIBLIOGRÁFICAS
FONSECA, J.S. e Martins, G.A. Curso de Estatística. São Paulo: Atlas
FARIA, E.S. de. Estatística. Edicao 97/1. (Apostila)
Graça Martins, M. E. (2005) – Introdução à Probabilidade e à Estatística. Sociedade Portuguesa de Estatística.
FARIAS, Ana M.; Métodos Estatísticos I. Rio de Janeiro. Fundação CECIERJ, 2009.
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Unknown ���
_1475566392.unknown
_1475566408.unknown
_1475566424.unknown
_1475566447.unknown
_1475566460.unknown
_1475566464.unknown
_1475566468.unknown
_1475566469.unknown
_1475566470.unknown
_1475566466.unknown
_1475566467.unknown
_1475566465.unknown
_1475566462.unknown
_1475566463.unknown
_1475566461.unknown
_1475566451.unknown
_1475566455.unknown
_1475566458.unknown
_1475566459.unknown
_1475566456.unknown
_1475566457.unknown
_1475566453.unknown
_1475566454.unknown
_1475566452.unknown
_1475566449.unknown
_1475566450.unknown
_1475566448.unknown
_1475566439.unknown
_1475566443.unknown
_1475566445.unknown
_1475566446.unknown
_1475566444.unknown
_1475566441.unknown
_1475566442.unknown
_1475566440.unknown
_1475566428.unknown
_1475566432.unknown
_1475566434.unknown
_1475566436.unknown
_1475566438.unknown
_1475566437.unknown
_1475566435.unknown
_1475566433.unknown
_1475566430.unknown
_1475566431.unknown
_1475566429.unknown
_1475566426.unknown
_1475566427.unknown
_1475566425.unknown
_1475566416.unknown
_1475566420.unknown
_1475566422.unknown
_1475566423.unknown
_1475566421.unknown
_1475566418.unknown
_1475566419.unknown
_1475566417.unknown
_1475566412.unknown
_1475566414.unknown
_1475566415.unknown
_1475566413.unknown
_1475566410.unknown
_1475566411.unknown
_1475566409.unknown
_1475566400.unknown
_1475566404.unknown
_1475566406.unknown
_1475566407.unknown
_1475566405.unknown
_1475566402.unknown
_1475566403.unknown
_1475566401.unknown
_1475566396.unknown
_1475566398.unknown
_1475566399.unknown
_1475566397.unknown
_1475566394.unknown
_1475566395.unknown
_1475566393.unknown
_1475566376.unknown
_1475566384.unknown
_1475566388.unknown
_1475566390.unknown
_1475566391.unknown
_1475566389.unknown
_1475566386.unknown
_1475566387.unknown
_1475566385.unknown
_1475566380.unknown
_1475566382.unknown
_1475566383.unknown
_1475566381.unknown
_1475566378.unknown
_1475566379.unknown
_1475566377.unknown
_1475566368.unknown
_1475566372.unknown
_1475566374.unknown
_1475566375.unknown
_1475566373.unknown
_1475566370.unknown
_1475566371.unknown
_1475566369.unknown
_1475566364.unknown
_1475566366.unknown
_1475566367.unknown
_1475566365.unknown
_1475566362.unknown
_1475566363.unknown
_1475566361.unknown