44935151-Apostila-Unidade-3-2010-2

breadcrumb-separator

UFOB

em 06/09/2021

Conteúdos escolhidos para você

UNIDADE 3 - Probabilidade e estatistica AMPLI

UNIDADE 3 - Probabilidade e estatistica AMPLI

AMPLI

Livro-Texto - Unidade I- estatística

Livro-Texto - Unidade I- estatística

Resumo Estatistica aplicada

Resumo Estatistica aplicada

Função Densidade de Probabilidade

Função Densidade de Probabilidade

UEL

Estatística aplicada a quimica e a Engenharia Quimica

Estatística aplicada a quimica e a Engenharia Quimica

Perguntas dessa disciplina

de da Pergunta: 0,5 pontos Salva PERGUNTA 1 Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as características de ...

UNIP São Luís

Leia o texto a seguir: Consideremos o seguinte experimento aleatório: Vamos sortear uma amostra de 20 funcionários de uma empresa que tem 100 funcioná

FAM

Questão 1/10 - Bioestatística Ler em voz alta Leia o excerto de texto: “O processo de investigação passa por diferentes estádios, dos quais já salient

5. Enquanto a estatística descritiva se concentra em resumir os dados em mãos, a estatística inferencial dá um passo adiante e busca usar uma pequena

Leia o texto a seguir: Consideremos o seguinte experimento aleatórioLeia o texto a seguir: A distribuição binomial de probabilidade é aplicada à exper

FAM

Material

Conteúdos escolhidos para você

UNIDADE 3 - Probabilidade e estatistica AMPLI

UNIDADE 3 - Probabilidade e estatistica AMPLI

AMPLI

Livro-Texto - Unidade I- estatística

Livro-Texto - Unidade I- estatística

Resumo Estatistica aplicada

Resumo Estatistica aplicada

Função Densidade de Probabilidade

Função Densidade de Probabilidade

UEL

Estatística aplicada a quimica e a Engenharia Quimica

Estatística aplicada a quimica e a Engenharia Quimica

Perguntas dessa disciplina

de da Pergunta: 0,5 pontos Salva PERGUNTA 1 Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as características de ...

UNIP São Luís

Leia o texto a seguir: Consideremos o seguinte experimento aleatório: Vamos sortear uma amostra de 20 funcionários de uma empresa que tem 100 funcioná

FAM

Questão 1/10 - Bioestatística Ler em voz alta Leia o excerto de texto: “O processo de investigação passa por diferentes estádios, dos quais já salient

5. Enquanto a estatística descritiva se concentra em resumir os dados em mãos, a estatística inferencial dá um passo adiante e busca usar uma pequena

Leia o texto a seguir: Consideremos o seguinte experimento aleatórioLeia o texto a seguir: A distribuição binomial de probabilidade é aplicada à exper

FAM

Prévia do material em texto

UNIVERSIDADE FEDERAL DA BAHIA 
INSTITUTO DE MATEMÁTICA 
DEPARTAMENTO DE ESTATÍSTICA 
 
 
 
 
 
 
 
NOTAS DE AULA 
MAT236 – MÉTODOS ESTATÍSTICOS 
3ª UNIDADE – 1ª PARTE 
 NOÇÕES DE INFERÊNCIA ESTATÍSTICA 
 
 
 
 
 
 
 
 
 
 
Elaborada pelos professores: 
Giovana Silva, Lia Moraes, 
Rosana Castro e Rosemeire Fiaccone 
 
Revisada por: Giovana Silva (2010.2) 
 
Monitora: Tatiana Felix da Matta 
 
 
1
 
10. Noções de Inferência Estatística 
 
10.1 Introdução 
 
O objetivo principal da inferência estatística é fazer afirmações sobre características de 
uma população, baseando-se em resultados de uma amostra. 
Na inferência estatística a incerteza está sempre presente. No entanto, se o experimento 
foi feito de acordo com certos princípios, essa incerteza pode ser medida. 
Uma função da estatística é fornecer um conjunto de técnicas para fazer inferências e 
medir o grau de incerteza destas inferências. Esta incerteza é medida em termos de 
probabilidades. 
 
Exemplo 1: 
 Flores brancas 
Sementes 
(10.000.000) 
(POPULAÇÃO) Flores vermelhas 
 
Suponha que em um celeiro existam 10 milhões de sementes de flores que podem produzir 
flores brancas ou flores vermelhas. Deseja-se a seguinte informação: que proporção, 
dessas 10 milhões de sementes, produzirá flores brancas? 
Não é de interesse plantar todas as sementes para verificar a cor das flores produzidas. 
Vamos plantar algumas poucas e com base nas cores dessas poucas, fazer alguma 
afirmação sobre a proporção (das 10 milhões) que produzirá flores brancas. Não podemos 
fazer esta generalização com certeza, mas podemos fazer uma afirmação probabilística, 
se selecionarmos as sementes que pertencerão à amostra de forma adequada. 
 
Suponha que foi retirada uma amostra aleatória (ao acaso) composta de 200 sementes da 
população acima. Observou-se que dessas sementes 120 eram de flores brancas e 80 de 
flores vermelhas. A proporção de flores brancas encontrada na amostra foi então de 60 % . 
 
Como poderíamos utilizar o resultado de uma amostra para estimar a verdadeira 
proporção de sementes de flores brancas? 
 
 
Analisando o problema em questão com auxílio da teoria das probabilidades, pode-se 
encontrar um intervalo em torno da proporção observada na amostra (60%) e afirmar com 
bastante segurança que a proporção populacional de sementes de flores brancas estará 
contida neste intervalo. Por exemplo, no problema acima, se admitíssemos uma chance de 
erro de 5%, com o tamanho de amostra utilizado (n=200), a teoria estatística permite 
afirmar que a proporção populacional de flores brancas está entre 53% e 67%. Se os 
métodos estatísticos forem corretamente utilizados podemos garantir que é de apenas 5% a 
probabilidade de estarmos fornecendo um intervalo que não contenha a verdadeira 
proporção populacional. Mais tarde veremos como calcular este tipo de intervalo. 
 
 
2
 
10.2 Estatísticas, Parâmetros e Estimadores 
Alguns conceitos básicos são necessários para o desenvolvimento da Inferência 
Estatística: 
 
Parâmetro: qualquer valor calculado com base em todos os elementos da população. 
Estatística: qualquer valor calculado com base (apenas) nos elementos da amostra. 
Estimador: uma estatística destinada a estimar um parâmetro populacional. 
 
Estimativa: é o valor numérico do estimador com base nas observações amostrais. 
 
Alguns exemplos de estatísticas que são também estimadores: 
n
X...XX
X n
+++= 21 (média amostral) 
 �� = ���� ∑ (	
 − 	�)��
�� (variância amostral) 
Símbolos mais comuns 
 
 Estimador Parâmetro 
Média X µ 
Variância S2 σ2 
Proporções p̂ p ou π 
 
10.3 Introdução à Amostragem 
 
Usualmente é impraticável observar toda uma população, seja pelo alto custo, seja 
por dificuldades diversas. Examina-se então uma amostra da população. Se essa amostra for 
bastante representativa, os resultados obtidos poderão ser generalizados para toda a 
população. 
Uma amostra muito grande pode implicar em custos desnecessários enquanto que 
uma amostra pequena pode tornar a pesquisa inconclusiva. Assim, deve-se procurar dentro 
das restrições impostas pelo orçamento, desenhar uma amostra que atinja os objetivos, 
produzindo estimativas com menor imprecisão possível. 
 
A experiência com amostragem é fato corrente no cotidiano. Basta lembrar como um 
cozinheiro verifica o tempero de um prato que está preparando, como alguém testa a 
temperatura de um prato de sopa, ou ainda como um médico detecta as condições de um 
paciente através de exames de sangue. Porém, o uso inadequado de um procedimento 
amostral pode levar a um viés de interpretação do resultado. Por exemplo, não mexer bem a 
sopa antes de retirar uma colher para experimentar, pode levar a sub-avaliação da 
temperatura do prato todo, com consequências desagradáveis para o experimentador. 
O uso de amostras que produzam resultados confiáveis e livres de vieses é o ideal. 
Assim, a maneira de se obter a amostra é tão importante que constitui uma especialidade 
 
 
3
 
dentro da Estatística, conhecida como Amostragem. Os vários procedimentos de se 
escolher uma amostra podem ser agrupados em dois grandes grupos: os chamados planos 
probabilísticos e planos não-probabilísticos. O primeiro grupo reúne todas as técnicas 
que usam mecanismos aleatórios de seleção dos elementos da amostra, atribuindo a cada 
um deles uma probabilidade, conhecida a priori, de pertencer à amostra. No segundo grupo 
estão os demais procedimentos, tais como: amostras intencionais, onde os elementos são 
selecionados com auxílio de especialistas, e amostras de voluntários, como ocorre em 
alguns testes sobre novos remédios. 
Ambos os procedimentos têm suas vantagens e desvantagens. Os estatísticos 
preferem trabalhar com as amostras probabilísticas pois, têm toda teoria de probabilidade e 
de inferência estatística para dar suporte às conclusões. Dessa forma, é possível medir a 
precisão dos resultados, baseando-se na informação contida da própria amostra. Planos de 
amostragem probabilísticos podem ser exemplificados pela amostragem aleatória simples e 
pela amostragem estratificada. 
 
Amostragem Aleatória Simples 
Quando o sistema de referência (lista ou descrição das unidades da população) é 
“perfeito”, isto é, quando ele lista uma a uma todas as unidades da população, é possível 
então usar um procedimento onde cada unidade é sorteada diretamente, com igual 
probabilidade de pertencer a amostra. A melhor maneira para definir este plano é 
descrevendo o processo de sorteio, que seria o seguinte: - “da relação de unidades do 
sistema de referência sorteie, com igual probabilidade o primeiro elemento da amostra, 
repita o processo para o segundo, e assim sucessivamente até sortear o último elemento 
programado para a amostra”. As amostras assim obtidas definem o plano de Amostragem 
Aleatória Simples que pode ser concebido com ou sem reposição. 
 
Amostragem Estratificada 
Informações adicionais podem aprimorar um desenho amostral. Por exemplo, em 
uma pesquisa sobre renda familiar média, conhece-se de antemão as regiões da cidade onde 
predominam moradias de diferentes classes de renda. Este conhecimento pode ser usado 
para definir sub-populações homogêneas segundo a renda, e aí então sortear amostras 
dentro de cada uma dessas regiões. Este procedimento é conhecido como a divisão da 
população em estratos, e consequentemente, definem os planos de Amostragem 
Estratificada. 
 
10.4 Erros amostrais e não-amostrais 
 
O uso de um levantamento amostral introduz um tipo de erro, que pode ser 
resumido na diferença entre o valor de uma certa característica na amostra e o parâmetro de 
interesse na população. Esta diferença pode ocorrer apenas devido à particular amostra 
selecionada, ou então devido a fatores externos ao plano amostral. Quando o erro é devido 
à amostra selecionada é chamado de erro amostral e quando é devido à fatores 
independentes do plano amostral (erros de medida, digitação, etc)é chamado de erro não-
amostral. 
 
Considera-se um erro amostral aquele desvio que aparece porque o pesquisador não 
levantou a população toda. Cada amostra possível de um plano acarreta em um desvio. 
 
 
4
 
Vejamos o esquema que se segue que considera a média como a característica de interesse. 
Vamos denotar por µ e X a média populacional e a média amostral da variável, 
respectivamente. 
 
 
População ou Amostras possíveis 
Universo de tamanho n 
 
 1 A1 => 1X 
2 
3 
 A2 => 2X 
. 
 . ………………… |X - µµµµ | = E = erro 
. 
 Ai => iX 
N 
 ………………… 
 
 Ak => kX 
 
 
 
No caso da média, o estudo do erro amostral consiste basicamente em estudar o 
comportamento da diferença (X - µ) quando X percorre todas as possíveis amostras que 
poderiam ser formadas através do plano amostral escolhido. Conhecendo-se a distribuição 
amostral de X pode-se avaliar sua média e seu desvio padrão. Neste caso particular o 
desvio padrão recebe o nome de erro padrão de X . 
 
10.5 Distribuições Amostrais 
 
Diferentes amostras extraídas da população irão originar valores distintos para a 
estatística considerada. Por este motivo, dizemos que as estatísticas são variáveis aleatórias, 
já que seu valor não pode ser predito com certeza antes da amostra ter sido extraída. Além 
disso, as estatísticas, como funções de variáveis aleatórias, são também variáveis aleatórias, 
e, portanto, têm uma distribuição de probabilidade, esperança e variância. 
 
A distribuição de probabilidade de uma estatística quando consideramos todas as 
amostras possíveis de tamanho n é denominada de distribuição amostral. 
 
 
 
 
 
 
5
 
10.5.1 Distribuição Amostral da Média 
 
A distribuição amostral da média X , de amostras aleatórias simples de tamanho n, 
extraída de uma população que tem média µ e desvio padrão σ, tem as seguintes 
características: 
E(X ) = µ 
V( X ) = σ2/n 
 
Caso a população tenha distribuição normal com média µ e desvio padrão σ, a 
distribuição amostral da médiaX , é normal com média µ e desvio padrão σ/ n . 
 A distribuição amostral da média X , de amostras aleatórias simples de tamanho n 
extraída de uma população não-normal, com média µ e desvio padrão σ, é 
aproximadamente normal com média µ e desvio padrão σ/ n , quando n é 
suficientemente grande. Este resultado é uma aplicação de um importante teorema de 
probabilidade, chamado Teorema Central do Limite. Para a utilização deste resultado, é 
usual considerar que o tamanho n da amostra é suficientemente grande quando n é pelo 
menos 30. 
 
Exercícios: 
 
1) A máquina de empacotar um determinado produto o faz segundo uma distribuição 
normal, com média µ e desvio padrão de 10g. 
a) Em quanto deve ser regulado o peso médio µ para que apenas 10% dos pacotes tenham 
menos do que 500g. Resp.:512,8 g 
b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes 
escolhidos ao acaso seja inferior a 2 Kg? Resp.:0,0052 
 
2) No exemplo anterior, e após a máquina estar regulada, programou-se uma carta de 
controle. De hora em hora, será retirada uma amostra de 4 pacotes, e estes serão pesados. 
Se a média da amostra for inferior a 495 g ou superior a 520 g para-se a produção para 
reajustar a máquina, isto é reajustar o peso médio. 
a) Qual a probabilidade de ser feita uma parada desnecessária? Resp.: 0,0749 
b) Se o peso médio da máquina desregulou-se para 500g, qual a probabilidade de 
continuar-se a produção fora dos padrões desejados? Resp.: 0,8413 
 
3) Para uma população com desvio padrão igual a 10, qual deve se o tamanho da amostra 
para que a diferença da média amostral para a média populacional, em valor absoluto, seja 
menor que 1, com probabilidade igual a 0.99 ? Resp.: 666 
 
10.5.2 Distribuição Amostral da Proporção 
 
Considere que a proporção de elementos numa população com determinada 
característica é p. 
 
 
 
 
6
 
Assim, para cada elemento da população podemos definir uma variável X, tal que 
 
X = 



 ticacaracterís daportador é não elemento o se 0,
ticacaracterís daportador é elemento o se ,1
 
 
Isto é, X ~Bernoulli(p) = Binomial (1,p) , e portanto E(X) = p e V(X) = p(1-p). 
 
Seja X1 , X2 , ... , Xn uma amostra aleatória simples retirada dessa população, e seja 
∑=
n
in X
1
S o total de elementos portadores da característica na amostra. Tem-se que Sn ~ 
Binomial (n,p). 
 
Defina como p̂ a proporção de elementos portadores da característica na amostra, 
isto é, X
n
X
n
i
===
∑
1n
n
S
p̂ . 
 
Utilizando o Teorema Central do Limite, tem-se que a distribuição amostral de p̂ é 
aproximadamente 




 −
n
p)p(1
p,N , quando n é suficientemente grande (np≥5 e n(1-p)≥5). 
 
Exercícios: 
1) Um procedimento de controle de qualidade foi planejado para garantir um máximo de 
10% de itens defeituosos na produção. A cada 60 minutos sorteia-se uma amostra de 50 
peças, e, havendo mais de 15% de defeituosos, pára-se a produção para verificações. 
Qual a probabilidade de uma parada desnecessária? Resp.: 0,119 
 
2) Suponha que uma indústria farmacêutica deseja saber a quantos voluntários se deva 
aplicar uma vacina, de modo que a proporção de indivíduos imunizados na amostra 
difira de menos de 2% da proporção verdadeira de imunizados na população, com 
probabilidade de 90%. Qual tamanho da amostra a escolher? Resp: 1702 
 
10.5.3 Distribuição Amostral de S2 
 
 Considere uma amostra aleatória de tamanho n que é retirada de uma população 
normal com média µ e variância σ2, e seja S2 a variância amostral. Então a estatística (���)���� tem distribuição qui-quadrado com ν=n-1 graus de liberdade. 
 A variável aleatória Z tem função de densidade dada por: 
( )
( )




 >−
=
riocasocontrá 0,
0z , 2z-e z 12
2Γ2 2
1
f(z)
ν
νν 
diz-se que Z segue uma distribuição qui-quadrado com ν graus de liberdade, denotada por ��.� A média e a variância para a distribuição ��� são, respectivamente, ν e 2ν. 
 
 
7
 
 A distribuição qui-quadrado é contínua e assimétrica e como a distribuição normal 
padronizada, também é tabelada. A tabela fornece valores de �α,ν� para vários graus de 
liberdade sendo ����� � ��,�� � = �. A seguir, é mostrado como usar a tabela da 
distribuição qui-quadrado: ������ � ��,��;��� � = �(���� � 18,31) = 0,05. 
 
 
 
 
A tabela completa é fornecida no final da apostila. 
 
Exercícios: 
1) Para uma distribuição qui-quadrado, determine: 
a) ��,���;��� b) ��,��;%� c) ��,��;�&� Resp: 20,48; 18,48 e 36,42 
 
2) Determine a probabilidade de que uma amostra aleatória de 25 observações, de uma 
população normal com variância σ2 =6, terá uma variância amostral S2: 
a) maior que 9,1; Resp: 0,05 
b) entre 3,642 e 10,745. Resp.: 0,94 
 
10.5.4 Outra distribuição amostral 
 
 Em muitas situações, o conhecimento do valor de σ não é razoável. 
Frequentemente, uma estimativa para σ é fornecida pela amostra. Suponha que X1, ..., Xn 
seja uma amostra aleatória de uma população normal, com média µ e variância σ2, e sejam 	 ' e S2 a média e a variância amostrais, respectivamente. Então ( = )�� *+ √�⁄ segue uma 
distribuição t ou t de Student, com ν=n-1 graus de liberdade. A função de densidade de T é 
dada por: 
.(/) = Γ0(�1�) �⁄ 2
Γ0� �⁄ 2√3� 41 5 6�� 7�(�1�) �⁄ , − ∞ 9 / 9 ∞. 
 
A média e a variância da distribuição t são 0 e ν/(ν+2) para ν<2, respectivamente. 
 
 
 
 
Graus de 
liberdade 
Probabilidade de ��� ser 
maior que determinado valor 
 
 
8
 
Figura 1: Gráficos da função densidade da distribuição t de Student para alguns 
valores de graus de liberdade 
n=1 grau de liberdade
0,000
0,125
0,250
0,375
0,500
-3,50 -1,75 0,00 1,75 3,50
n=5 graus de liberdade
0,000
0,125
0,250
0,375
0,500
-3,50 -1,75 0,00 1,75 3,50
 
 
A distribuição t de Student é contínua e simétrica com média igual a zero. Sua 
aparência é bastante parecida com a normal padrão, veja Figura 1. Ambasas distribuições 
tem forma de sino, mas a distribuição t tem mais probabilidade nos extremos. A 
qualificação “com n-1 graus de liberdade” é necessária, porque para cada valor diferente do 
tamanho da amostra n existe uma distribuição t de Student específica. O número de graus 
de liberdade (gl) é o parâmetro da distribuição t de Student. 
 
Assim como a distribuição normal padrão a distribuição t de Student também é 
tabelada. A tabela fornece valores de /�,ν para vários graus de liberdade sendo ��( � /�,ν� = �. A seguir, é mostrado como usar a tabela da distribuição t de Student: ��( � /�,��;�� � = �(( � 1,812) = 0,05 
 
 
 
A tabela completa é fornecida no final da apostila. 
 
Exercícios: 
1) Para uma distribuição T, determine: 
a) P(T<2,365) quando ν= 7 b) P(-1,356<T<2,179) quando ν= 12 Resp: 0,975 e 0,875 
 
 Graus de 
liberdade 
Probabilidade de T ser 
maior que determinado valor 
 
 
9
 
2) Um engenheiro químico afirma que a média populacional do rendimento de certo lote do 
processo é 500 gramas por mililitro de matéria-prima. Para verificar essa afirmação, ele 
amostra 25 lotes a cada mês. Se o valor t calculado ficar entre –t0,05;24 e t0,05;24, ele fica 
satisfeito com sua afirmação. A que conclusão ele deveria chegar em relação a uma amostra 
que tem média ;< = 518 gramas por mililitro e desvio padrão 40 gramas? Assuma que a 
distribuição dos rendimentos é aproximadamente normal. 
 
11. Estimação 
 
Os parâmetros em geral são desconhecidos. A inferência estatística consiste em, 
através de uma amostra, “estimar” os valores dos parâmetros, ou também testar se algumas 
hipóteses são válidas sobre determinados parâmetros. Estes são os problemas da inferência 
paramétrica conhecidos como problemas de estimação e testes de hipóteses, 
respectivamente. 
 
Exemplos: 
Problemas de estimação 
1) Estimar a proporção de peças defeituosas num lote. 
2) Estimar o peso médio de um determinado produto de uma linha de produção. 
 
Problemas de testes de hipóteses 
1) Testar a afirmação de que a proporção de peças defeituosas é menor que 4% do lote. 
2) Testar a afirmação de que o peso médio de um determinado produto de uma linha de 
produção é 500 g. 
 
Exemplo 11.1: Queremos investigar a duração de vida de um novo tipo de lâmpada, pois 
acreditamos que ela tenha duração maior do que as fabricadas atualmente. 
Cem lâmpadas são deixadas acesas até queimarem. A duração em horas de cada 
lâmpada (T) é registrada. 
 
POPULAÇÃO: todas as lâmpadas fabricadas ou que venham a ser fabricadas por 
 esta fábrica. 
AMOSTRA: cem lâmpadas selecionadas. 
Em geral, neste tipo de problema é adotada a função de densidade exponencial 
para duração T ~ exp (α). 
 
Objetivo : Fazer inferência sobre α. Vale lembrar que E(T) = 1/ α. 
 
Existem dois tipos de estimação de um parâmetro populacional: estimação pontual 
e a estimação intervalar . 
 
11.1 Estimação Pontual 
 
Procura encontrar um valor numérico único que esteja bastante próximo do 
verdadeiro valor do parâmetro. Este procedimento não permite julgar a magnitude do erro 
que podemos estar cometendo. 
 
 
10
 
 
 ESTIMADORES PONTUAIS RAZOÁVEIS DOS PRINCIPAIS PARÂMETROS POPULACIONAIS 
Parâmetro Estimador 
Média (µ) 
∑
=
=
n
1i
iXn
1
X 
Variância (σ2) �� = 1= − 1 > (	
 − 	�)�=?=1 
Desvio padrão � = @ 1= − 1 > (	
 − 	�)�=?=1 
Proporção (p) 
n
X
p̂ = onde 
X = número de elementos da amostra que possuem a 
característica 
n = tamanho da amostra 
 
Podem existir outros estimadores pontuais para esses parâmetros. Assim, é necessário 
definir propriedades desejáveis para os estimadores de maneira que se possa escolher qual 
estimador pontual de um determinado parâmetro é o melhor a ser usado. Este assunto não 
será abordado nesta apostila. 
Muito provavelmente uma estimativa pontual não coincide exatamente com o valor 
verdadeiro do parâmetro populacional que está sendo estimado e, além disto, esta 
estimativa não traz associada a ela uma medida de sua precisão. A estimação intervalar que 
será apresentada a seguir ajuda a resolver este tipo de dúvida. 
 
11.2 Estimação Intervalar 
 
Procura determinar um intervalo que abranja o valor do parâmetro, com certa 
margem de segurança. Este procedimento permite julgar a magnitude do erro que podemos 
estar cometendo. 
Como mencionado anteriormente, os estimadores pontuais especificam um único 
valor para o estimador e este procedimento não permite julgar qual a possível magnitude do 
erro. Daí surge à ideia de construirmos os intervalos de confiança. De um modo geral, nos 
basearemos na amostra para construir um intervalo que com alto grau (ou nível) de 
confiança contenha o verdadeiro valor do parâmetro. 
 
Grau de confiança é a probabilidade do intervalo de confiança conter o verdadeiro valor do 
parâmetro. É também chamado de nível de confiança e geralmente expresso em 
porcentagem. 
 
 
 
Formalizando um pouco, se denotarmos o parâmetro de interesse por 
um intervalo com limite inferior I e limite superior S tal que 
em que α é um valor pequeno, ou seja 1
variáveis aleatórias pois dependem da amostra selecionada. Um intervalo deste tipo é 
denominado intervalo de 1
Valores de α mais comumente usados são
α
α
α
A precisão com que se conhece 
Quanto menor esta amplitude melhor determinado estará o valor do parâmetro.
 
Para esclarecer o conceito de intervalo de confiança, suponha que retiremos um grande 
número de amostras de tamanho n (fixo) da população em estudo e para cada amostra, 
construamos um intervalo. 
amostra. 
Por exemplo, ao desejar um intervalo de confiança de 90% para estimar a média de uma 
população , uma pessoa pode retirar uma amostra que dê um intervalo entre 48,5 e 51,5. Por 
outro lado, uma segunda pessoa, baseada em outra amostra retirada da mesma população, 
calculou o intervalo entre 47,9 e 52,9, aparentemente gerando uma dúvida sobre qual dos 
intervalos contém o verdadeiro valor da média. Ocorre que se 100 desses intervalos fossem 
calculados a partir de 100 amostras diferentes, deve
intervalos contenham o valor da verdadeira média, embora não se saiba quais são estes 
intervalos, uma vez que a média é desconhecida. Na prática trabalhamos em geral
apenas uma amostra e obtemos um único intervalo.
 
A figura a seguir ilustra bem o conceito de intervalo de confiança.
O verdadeiro valor do parâmetro estará contido em 
 
Formalizando um pouco, se denotarmos o parâmetro de interesse por 
um intervalo com limite inferior I e limite superior S tal que 
P(I < θ < S) = 1 - α, 
é um valor pequeno, ou seja 1-α é próximo de 1. Os limites deste intervalo são 
variáveis aleatórias pois dependem da amostra selecionada. Um intervalo deste tipo é 
intervalo de 1-αααα(××××100)% confiança para o parâmetro θ. 
mumente usados são 
α = 0,10 1 – α = 0,90 ou 90% 
α = 0,05 1 – α = 0,95 ou 95% 
α = 0,01 1 – α = 0,99 ou 99% 
A precisão com que se conhece θ depende da amplitude deste intervalo dada por S 
a amplitude melhor determinado estará o valor do parâmetro.
Para esclarecer o conceito de intervalo de confiança, suponha que retiremos um grande 
número de amostras de tamanho n (fixo) da população em estudo e para cada amostra, 
construamos um intervalo. Os limites dos intervalos resultantes variarão de amostra para 
Por exemplo, ao desejar um intervalo de confiança de 90% para estimar a média de uma 
população , uma pessoa pode retirar uma amostra que dê um intervalo entre 48,5 e 51,5. Por 
do, uma segunda pessoa, baseada em outra amostra retirada da mesma população, 
calculou o intervalo entre 47,9 e 52,9, aparentemente gerando uma dúvida sobre qual dos 
intervalos contém o verdadeiro valor da média. Ocorre que se 100 desses intervalos fossem 
calculados a partir de 100 amostras diferentes, deve-se esperar que em torno de 90 desses 
intervalos contenham o valor da verdadeira média, embora não se saiba quais são estes 
intervalos, uma vez quea média é desconhecida. Na prática trabalhamos em geral
apenas uma amostra e obtemos um único intervalo. 
A figura a seguir ilustra bem o conceito de intervalo de confiança. 
 
O verdadeiro valor do parâmetro estará contido em 1-αααα(××××100)% desses intervalos.
11
 
Formalizando um pouco, se denotarmos o parâmetro de interesse por θ, desejamos obter 
é próximo de 1. Os limites deste intervalo são 
variáveis aleatórias pois dependem da amostra selecionada. Um intervalo deste tipo é 
depende da amplitude deste intervalo dada por S – I . 
a amplitude melhor determinado estará o valor do parâmetro. 
Para esclarecer o conceito de intervalo de confiança, suponha que retiremos um grande 
número de amostras de tamanho n (fixo) da população em estudo e para cada amostra, 
Os limites dos intervalos resultantes variarão de amostra para 
Por exemplo, ao desejar um intervalo de confiança de 90% para estimar a média de uma 
população , uma pessoa pode retirar uma amostra que dê um intervalo entre 48,5 e 51,5. Por 
do, uma segunda pessoa, baseada em outra amostra retirada da mesma população, 
calculou o intervalo entre 47,9 e 52,9, aparentemente gerando uma dúvida sobre qual dos 
intervalos contém o verdadeiro valor da média. Ocorre que se 100 desses intervalos fossem 
se esperar que em torno de 90 desses 
intervalos contenham o valor da verdadeira média, embora não se saiba quais são estes 
intervalos, uma vez que a média é desconhecida. Na prática trabalhamos em geral com 
desses intervalos. 
 
 
12
 
Observe que algumas estimativas intervalares incluem e outras não incluem o verdadeiro 
valor do parâmetro da população. Quando se retira uma amostra e se calcula um intervalo 
de confiança, não se sabe na verdade, se o parâmetro da população se encontra naquele 
intervalo calculado. O importante é saber que se está utilizando um método com 
1-αααα(××××100)% de probabilidade de sucesso. 
 
Os intervalos de confiança são construídos a partir da distribuição amostral de uma 
estatística. A seguir são descritos alguns intervalos. 
 
11.2.1 Intervalo de Confiança para a Média de uma População 
 
A média é uma importante característica da população. Vejamos como obter 
intervalos de confiança para este parâmetro populacional. Temos que distinguir algumas 
situações que podem surgir na prática: 
 
1. Amostras pequenas (n < 30) 
� População Normal 
� População não Normal 
 
2. Amostras grandes (n ≥ 30) 
� População Normal 
� População não Normal 
 
Para pequenas amostras os procedimentos estatísticos de inferência paramétrica 
exigem que se verifique a normalidade da população e outras distribuições de probabilidade 
(por exemplo a distribuição t de Student) devem ser estudadas a fim de utilizar os 
procedimentos adequados. Além disso, se a normalidade não for aceitável, no caso de 
amostras pequenas, devemos utilizar procedimentos alternativos, por exemplo, inferência 
não-paramétrica. 
 
Para amostras suficientemente grandes os procedimentos simplificam bastante e 
mesmo sem conhecermos a distribuição da população, as inferências podem ser feitas com 
base na distribuição normal mesmo que a população não seja normal. 
 
• Amostras pequenas 
1) Distribuição normal, σσσσ 2 = σσσσ o2 (conhecido) 
Esta situação é um tanto quanto rara na prática, pois embora a hipótese de 
normalidade seja razoável em muitos casos, dificilmente se conhece a variância de uma 
população quando sua média é desconhecida. Algumas vezes o conhecimento σ pode 
provir de dados históricos sobre a população de interesse ou de resultados obtidos em 
estudos similares ao que está sendo realizado. 
 
 
13
 
Sabemos que A = (	� − B)/ �√� segue uma distribuição normal padrão. Assim, 
 
α
σ
µ
αααα −=







<−<−=




 <<− 1
/ 2222
z
n
X
zPzZzP
 
 
Neste caso o Intervalo de Confiança de 1-α(×100)% para µ é dado por: 





 +−
n
zX
n
zX oo
σσ
αα
22
 , 
 
 
Ilustração do nível de confiança de 95% 
 
Exemplo 11.2: Um pesquisador está estudando a resistência média de um determinado 
material. Ele sabe que esta variável é normalmente distribuída com desvio padrão de 2 
unidades. Utilizando os valores 4,9; 7,0; 8,1; 4,5; 5,6; 6,8; 7,2; 5,7; 6,2 unidades obtidos de 
uma amostra de tamanho 9, determine o intervalo de confiança para a resistência média 
com um nível de confiança de 95%. 
Temos que 2,6=X , n=9, σ0=2 e para obtermos um intervalo de 95% de confiança 
zα/2= 1,96. Substituindo estes valores na fórmula acima, obtemos 
[6,222 – 1,96
9
2
 ; 6,222 + 1,96
9
2
] = [4,915 , 7,529] 
Então podemos afirmar com 95% de confiança que a resistência média (µ) do material está 
entre 4,915 e 7,529 unidades. 
 
 
 
 
0
0,95
0,0250,025
Distribuição Normal (0,1)
-1,96 1,96
 
 
14
 
2) Distribuição normal, σσσσ 2 desconhecido 
Neste caso, utilizamos que a distribuição amostral da estatística ( = (	� −B)/( �√�) é a distribuição t com n-1 graus de liberdade. O intervalo de confiança para a 
média µ é obtido de 
 αµ αααα −=







<−<−=







<<−
−−−−
1
1,
2
1,
2
1,
2
1,
2
nnnn
t
nS
X
tPtTtP 
 
Neste caso o Intervalo de Confiança de 1-α(×100)% para µ é dado por: 








+−
−− n
s
tX
n
s
tX
nn 1,
2
1,
2
; αα 
 
Exemplo 11.3: O consumo diário de alimentos observado em certa amostra da população é, 
em calorias (x100), igual a: 10 11 11 12 13 13 13 13 13 14 14 14 15 15 16 16. Construir um 
intervalo de confiança para a média com um nível de confiança de 90%. 
 
Solução: 
 








+−
−− n
s
tX
n
s
tX
nn 1,
2
1,
2
; αα = [13,3125 − 1,753 4
7404,1 ; 13,3125 + 1,753
4
7404,1 ] 
 = [ 12,543 ; 14,073 ] 
 
Com 90% podemos afirmar que o consumo médio de calorias, na população da qual essa 
amostra foi retirada, está entre 12,543 e 14,073. 
 
• Amostras Grandes - População normal ou não-normal 
 
Se n é suficientemente grande (em geral, n > 30), mesmo sem conhecermos a 
distribuição da população, os limites do Intervalo de Confiança para a média (µ) poderão 
ser calculados com base na distribuição Normal padrão. Da mesma forma podemos utilizar 
o desvio padrão amostral s no lugar de σ (desvio-padrão populacional). Neste caso o 
Intervalo de Confiança para a média µ é dado por: 








+−
n
s
zX
n
s
zX
22
; αα 
Exemplo 11.4: Resistência à tração de 31 corpos de prova (ordenados). 
131; 132; 134; 135; 136; 135; 138; 139; 140; 142; 143; 144; 144; 145; 146; 146; 147; 147; 
148; 149; 150; 150; 151; 151; 152; 152; 153; 153; 154; 160; 160. 
Estabelecer um intervalo de confiança de 95% para a média populacional. 
Solução: 
Temos que, X = 145,39 e s = 7,75 
 
 
15
 
Como o tamanho da amostra já pode ser considerado suficientemente grande para uma 
aproximação normal, o intervalo de confiança para a média populacional é: 








+−
n
s
zX
n
s
zX
22
; αα = [145,39 − 1,96
31
75,7 ; 145,39 + 1,96
31
75,7 ] = 
= [ 142,66 ; 148,12 ] 
 
Podemos então afirmar que com nível de confiança de aproximadamente de 95% a 
resistência média do concreto está entre 142,66 e 148,12 kg/cm2. 
 
Exemplo 11.5 (Werkema, 1996): Um dos principais produtos de uma empresa siderúrgica 
é a folha-de-flandes com têmpera T4 RC, que é uma folha de aço de baixo teor de carbono, 
revestida em ambas as faces com uma camada de estanho, empregada principalmente na 
fabricação de recipientes utilizados para o acondicionamento de alimentos. 
Os limites de especificação para a dureza final das folhas-de-flandres são: 
LIE = 58,0 HR e LSE = 64,0 HR, 
em que LIE e LSE representam os limites inferior e superior de especificação, 
respectivamente, e HR representa a unidade de dureza definida como índice de dureza 
Rockwell. 
Nos últimos meses ocorreu um aumento da produção de folhas-de-flandres com dureza 
final fora da faixa de especificação. A empresa concentrou sua atenção no processo de 
RECOZIMENTOCONTÍNUO (RC), por ser este o principal processo responsável pela 
dureza das folhas-de-flandres. Como foi verificado que o processo estava sob controle 
estatístico, a indústria decidiu estimar a dureza média das folhas-de-flandres (µ), a 
variabilidade das medidas de dureza (σ), a proporção de folhas-de-flandres com dureza fora 
da faixa de especificação. Com este objetivo, foram coletados 50 observações da dureza das 
folhas-de-flandres produzidas pela empresa, que estão listadas abaixo: 
 Medidas de dureza (HR) das folhas-de-flandres fabricadas pela indústria siderúrgica 
61,0 61,0 60,3 60,2 58,7 60,0 60,0 60,9 61,2 59,1 
60,0 59,3 59,8 60,1 58,6 59,6 60,5 60,5 60,2 60,5 
60,5 60,1 60,7 60,3 60,8 59,9 60,1 60,2 60,6 61,0 
60,0 61,1 59,8 60,1 60,8 60,7 60,0 59,8 59,0 60,0 
60,2 60,8 61,6 59,8 60,4 60,2 59,7 60,3 60,4 60,2 
 
� Dureza média das folhas-de-flandres: ∑
=
=
n
1i
ixn
1
x = 60,212 HR 
� Desvio padrão:� = D ���� ∑ (	
 − 	�)��
�� = 0,6107 HR 
� Proporção amostral de folhas-de-flandres com dureza fora da faixa de especificação 
(58,0 – 64,0 HR): 00,0p̂ = 
 
A equipe de trabalho da empresa suspeita que a dureza média da folha-de-flandres (µ), 
resultante do processo de recozimento contínuo, é diferente do valor nominal da 
especificação (61,0 HR). 
 
 
16
 
A equipe técnica da indústria passou a ter a seguinte dúvida: a obtenção do resultado 
61,0 60,2 x <= já era suficiente para que se pudesse concluir, com bastante segurança, que 
o processo de recozimento contínuo estava centrado abaixo do valor nominal da 
especificação ? 
 
Essa dúvida pode ser solucionada por meio da construção de um intervalo de confiança 
para a dureza média (µ) das folhas-de-flandres produzidas pelo processo: 
 
60,21 ± 1,96 x 
50
61,0
 ⇒ [60,04 ; 60,38] HR 
O intervalo de confiança não contém o valor nominal da especificação (61,0 HR). Portanto, 
a equipe técnica da indústria pode concluir, com 95% de confiança, que o processo estava 
centrado abaixo do valor nominal e então, deve-se passar a estudar o processo de 
recozimento contínuo para descobrir as causas deste deslocamento. 
 
11.2.2 Intervalo de Confiança para uma Proporção Populacional 
 
Em muitas situações pode ser de interesse construir um intervalo de confiança para 
a proporção de elementos da população que possuem alguma característica de interesse (p). 
Seja X o no de elementos de uma amostra de tamanho n que apresenta a 
característica de interesse. Já vimos que um estimador de p é : 
n
X
p̂ = 
Se o tamanho da amostra for suficientemente grande, é possível construir um 
intervalo de (1-α)×100% de confiança para p, baseado em A = EF�EDG(HIG)J que segue uma 
distribuição normal padrão. Portanto, temos que 
ααααα −=







−<
−
−<=




 <<− 1
)1(
)(
2/2/
22
z
pp
ppn
zPzZzP
)
 
Como o valor de p não é conhecido, uma solução é substituir K(1 − K) por K̂(1 − K̂). Assim, o intervalo de confiança de 1-α(×100)% para a proporção populacional 
p é dado por: 





 −+−− αα n
)p̂1(p̂
zp̂;
n
)p̂1(p̂
zp̂
22
. 
Exemplo 11.6: Examinam-se 98 animais, encontrando-se 53 infectados com determinado 
vírus. Construir um intervalo de 95% de confiança para a proporção p de animai infectados. 
Solução: 
n = 98 (pode ser considerada grande) 
541,0
98
53
ˆ ==p 459,0)ˆ1( =− p 
α = 0,05 → 96,1
2
=αz
 
 
 
17
 
M0,541 − 1,96@(0,541)(0,459)98 ; 0,541 5 1,96@(0,541)(0,459)98 Q = 00,442; 0,6402 
 
 
11.2.3 Intervalo de Confiança para a Variância e o Desvio Padrão de uma 
População Normal 
 
Suponha que a população de interesse tenha distribuição normal com média µ e 
variância σ2 e que desta população foi extraída uma amostra aleatória de tamanho n. A 
partir do resultado que a distribuição amostral da estatística �� = (���)���� é a distribuição 
qui-quadrado com n-1 graus de liberdade. Temos que, 
 
 � 4���R�;��� ≤ �� ≤ �R�;���7 = � 4���R�;��� ≤ (���)���� ≤ �R�;���7 = 1 − �. 
 
Neste contexto, um intervalo de confiança para σ2 de 100(1-α)% de confiança é 
T(= − 1)���� �;���⁄� ; (= − 1)�
�
���� �;���⁄� U 
 
O intervalo de confiança para o desvio padrão é obtido extraindo a raiz quadrada dos 
limites de confiança do intervalo para a variância. 
 
Exemplo 11.7: Voltando ao exemplo 11.5. Construa um intervalo de confiança para o 
desvio padrão da dureza de folhas-de-flandres. Suponha que a dureza siga uma distribuição 
normal. (α=5%) 
Solução: Intervalo de confiança para a variância V&W × �,Y%%�,&� ; &W × �,Y%Y�,YZ [ HR2. 
Então, V\0,25; \0,56[ é o intervalo de confiança para o desvio padrão. Assim, podemos 
afirmar com 95% de confiança que o desvio padrão da dureza está entre \0,25 e \0,56 
HR. 
 
Observação: No gerenciamento de processos são muito comuns as situações em que 
desejamos comparar dois grupos de interesse, mantendo o controle dos riscos associados 
ao estabelecimento de conclusões incorretas. Consideremos por exemplo uma indústria que 
opera duas linhas de produção. Muito provavelmente os técnicos da empresa terão interesse 
em comparar as duas linhas, com o objetivo de verificar se estão trabalhando de forma 
similar. As comparações de dois grupos geralmente podem ser traduzidas, na linguagem 
estatística, em comparações de duas médias, duas variâncias ou duas proporções. Este 
assunto não será abordado nesta apostila. 
 
 
 
18
 
12 Noções de Testes de Hipóteses 
 
Outro tipo de problema da Inferência Estatística é o de testar se uma conjectura 
sobre determinada característica de uma ou mais populações é, ou não, apoiada pela 
evidência obtida de dados amostrais. 
 
Conjectura → hipótese estatística 
Regra de decisão → teste de hipóteses 
 
Alguns exemplos: 
1. Testar se um novo tipo de fertilizante é melhor que o fertilizante padrão. 
2. Testar se um novo método de fabricação de lâmpadas aumentará o tempo médio de vida 
das lâmpadas. 
3. Testar se um método de preservar alimentos é melhor que outro, no que diz respeito à 
retenção de vitaminas. 
4. Determinar qual de dois tratamentos é mais eficiente (problema de duas amostras) 
 
Consideremos o exemplo das lâmpadas. Suponha que no processo padrão o tempo 
de vida médio é conhecido de 1400 horas. 
 
Objetivo: testar o novo processo de fabricação. 
 
Modelo: 
Duas populações de lâmpadas: 
POP1 – lâmpadas fabricadas pelo processo padrão; 
POP2 – lâmpadas fabricadas pelo novo processo. 
 
Informação anterior: Tempo de vida médio das lâmpadas fabricadas pelo processo padrão é 
de 1400 horas. 
 
Pergunta: O tempo de vida médio das lâmpadas fabricadas pelo novo processo é maior que 
1400 horas? 
 
Procedimento: 
1. Estabelecer duas hipóteses: 
 H0) o novo processo não é melhor que o padrão; 
 H1) o novo processo é melhor que o padrão. 
 
2. Selecionar lâmpadas fabricadas pelo procedimento novo, medir seus tempos de vida e 
calcular o tempo de vida médio, X , observado na amostra. 
3. Suponha que a média da amostra selecionada é 1550X = horas. O resultado parece 
indicar que o novo procedimento é melhor. 
 
Calculando-se o intervalo de confiança de 95% para o tempo de vida médio do processo 
novo obteve-se: 
(1300;1800) 
 
 
19
 
 
Ou seja, não temos evidência de que o novo processo é melhor, uma vez que a média 1400 
é um valor possível para a média do novo processo (está contido no intervalo). Logo, 
tomaríamos a decisão de não rejeitar a hipótese H0. 
 
Vamos supor agora, que o intervalo de confiança de 95% tivesse os seguintes limites: 
(1500; 1600). Neste caso, teríamos forte evidência para rejeitar H0 e afirmar que o novo 
processo é superior. 
Obs: Note que os testes de hipóteses são muito relacionados com o problema de estimação 
por intervalo. 
 
12.1 Hipótese nula e hipótese alternativa 
Em geral devemos decidir entre duas hipóteses. Denominaremos essas hipóteses de 
 H0 → hipótese nula 
 H1 → hipótese alternativa 
 
No exemplo das lâmpadas se µ é a média do tempo de vida das lâmpadas fabricadas pelo 
novo processo, então 
H0)µ ≤1400 
 H1) µ > 1400 
 
12.2 Erro tipo I e Erro tipo II 
 
Qualquer que seja a decisão tomada em um teste de hipóteses, estamos sujeitos a 
cometer erros, devido à presença da incerteza. 
 
Conclusão Situação da população 
do teste H0 verdadeira H0 falsa 
Não rejeitar H0 Correto Erro tipo II 
Rejeitar H0 Erro tipo I Correto 
 
 
É fundamental que, em cada caso, se saiba qual são os erros possíveis e que se decida a 
priori qual é o mais sério. Não é possível controlar ambos os erros ao mesmo tempo. 
Quando diminuímos muita a probabilidade de erro tipo I, aumentamos a probabilidade do 
erro tipo II e vice-versa. 
 
Assim, a decisão de rejeitar H0 é equivalente à opinião “H0 é falsa” e a decisão de aceitar H0 
não é equivalente à opinião “H0 é verdadeira”. Neste caso a opinião adequada é a de que os 
dados não contêm evidência suficientemente forte contra H0. 
 
Exemplo 12.1: No caso das lâmpadas, o erro tipo I seria aprovar o novo processo de 
fabricação quando na realidade ele não é superior. O erro tipo II seria rejeitar o novo 
processo de fabricação quando é, de fato, melhor. 
 
 
 
20
 
12.3 Nível de significância e Poder 
 
O valor de α é fixado pelo pesquisador. Esta probabilidade recebe o nome de nível 
de significância do teste. Usualmente, esses valores são fixados em 5%, 1% ou 0,1%. O 
valor 1- β é chamado poder do teste. O poder do teste é a capacidade deste de detectar que 
H0 é falsa quando de fato esta hipótese é falsa. No caso das lâmpadas, o poder do teste seria 
a probabilidade deste aceitar o novo processo de fabricação (rejeitar H0) quando este for 
realmente melhor. 
Como a probabilidade do erro tipo I (α) é fixada em valores pequenos, este deveria 
ser o tipo de erro mais grave. 
 
 
12.4 Estatística de teste e região crítica 
 
A decisão entre as hipóteses é tomada com base nos dados de uma amostra extraída 
da população. No nosso exemplo, suspeitamos que o tempo de vida médio das lâmpadas é 
maior que 1400. Colhe-se uma amostra aleatória de 100 lâmpadas e determina-se o valor da 
média amostral para, através dela, comprovar ou refutar tal hipótese. 
Suponha que o pesquisador decide adotar a seguinte regra de decisão: 
Rejeitar Ho se X for maior que 1800 
Neste exemplo, X está sendo usada como estatística de teste e a região crítica ou região de 
rejeição aos valores que forem maiores que 1800. 
 
12.5 Nível Descritivo ou p-valor 
 
O procedimento descrito anteriormente é conhecido como procedimento clássico de 
testes de hipóteses. Um outro procedimento que vem sendo muito adotado consiste 
em apresentar o p-valor do teste. A diferença básica entre esses dois procedimentos é 
que, trabalhando-se com o p-valor não é necessário construir a região crítica. Vejamos o 
seguinte exemplo: 
Suponha que no caso das lâmpadas foi obtido X = 1550 para uma amostra de 100 
lâmpadas. O pesquisador calcula a seguinte probabilidade: 
1400) | 1550 ( =≥ µXP . 
O valor desta probabilidade é chamado de p-valor e neste exemplo, indica a 
probabilidade de uma população com média 1400 gerar uma amostra de tamanho 100 que 
tenha média igual ou maior que o resultado observado. Caso esta probabilidade seja muito 
pequena devemos suspeitar da veracidade da hipótese e portanto “rejeitar” que µ = 1400. 
 
Procedimento para a decisão com o p-valor 
1. Escolher o máximo valor de tolerável para o erro do tipo I ( α). 
2. Se o p-valor for menor que o α adotado, então deve-se rejeitar a hipótese nula . 
 
 
 
 
 
21
 
Regra de decisão 
p-valor > α α α α ⇒⇒⇒⇒ não rejeitar Η Η Η Η0000 
p-valor ≤ α ⇒ rejeitar Η0 
 A saída dos pacotes estatísticos apresenta o p-valor. 
12.6 Testes de Hipóteses para Média Populacional 
 
A média de uma população é uma de suas características mais importantes e 
frequentemente temos que tomar decisões a seu respeito. Vamos denotar um valor fixo 
qualquer por µ0. 
 
Consideremos as diversas hipóteses que podem ocorrer num teste de hipóteses para 
médias: 
 
Hipóteses unilaterais 
Η0) µ ≤ µ0 (ou µ = µ0) versus H1) µ > µ0 
Η0) µ ≥ µ0 (ou µ = µ0 ) versus H1) µ < µ0 
Hipótese Bilateral 
 Η0) µ = µ0 versus H1) µ ≠ µ0 
 
• Distribuição normal, σσσσ 2 desconhecido 
Neste caso, como vimos em Intervalo de Confiança precisamos usar o desvio padrão 
amostral s para estimar σ, e utilizaremos a distribuição t de Student para encontrar a 
região crítica do teste ou calcular o p-valor. A estatística de teste é: 
n
s
µx 0− 
 
 Vejamos as regras de decisão para cada tipo de hipótese considerada: 
 
1. Η Η Η Η0000) µ ) µ ) µ ) µ ≤≤≤≤ µ µ µ µ0 0 0 0 (ο (ο (ο (οu µ = µµ = µµ = µµ = µ0000) ) ) ) versus H1) µ > µµ > µµ > µµ > µ0000 . . . . 
 
Rejeitar H0 se 1-nα,
0 t
n
s
µx
>
−
 
 
2. Η2. Η2. Η2. Η0000) µ ) µ ) µ ) µ ≥≥≥≥ µ µ µ µ0000 ( ( ( (ou µ = µµ = µµ = µµ = µ0 0 0 0 ) ) ) ) versus H1) µ < µµ < µµ < µµ < µ0000 
 
 
 
22
 
Rejeitar H0 se 1-nα,
0 t
n
s
µx
−<
− 
 
3. Η3. Η3. Η3. Η0000) µ = µ) µ = µ) µ = µ) µ = µ0000 versus H1) µ µ µ µ ≠≠≠≠ µ µ µ µ0000 
 
Rejeitar H0 se 1;2
0 t
n
s
µx
−>
−
nα 
 
Exemplo 12.2: O tempo médio, por operário, para executar uma tarefa, tem sido 100 
minutos. Introduziu-se uma modificação para diminuir esse tempo, e, após certo período, 
sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução de cada um. O 
tempo médio da amostra foi 85 minutos, e o desvio padrão foi 12 minutos. Estes resultados 
trazem evidências estatísticas da melhora desejada? Apresente as suposições teóricas 
usadas para resolver problema. 
 
 Αs hipóteses a serem testadas são 
 
Η0) µ ≥ 100 versus H1) µ < 100 
 
Vejamos as estatísticas descritivas da amostra: média 85 e desvio padrão 12. 
Temos que α = 0,05 e n = 16. Portanto 
1,
2
t
−nα
= 2,131. A região crítica é 
Rejeitar H0 se 
1,
2
0 t
n
s
µx
−
−<
−
n
α 
 
Vamos substituir os valores: 
Rejeitar H0 se ,1312-
16
12
00185 <− 
 
Como o valor observado foi -15 e pertence à região crítica, a decisão deve ser de rejeitar 
H0, e concluímos que existe evidência de que o tempo médio de execução é menor que 100 
minutos. 
 
Suposição: Variável tempo segue distribuição Normal. 
 
 
 
 
23
 
• Tamanho da amostra é suficientemente grande 
 
Assim como vimos no caso dos Intervalos de Confiança, podemos utilizar a 
distribuição normal para encontrar a região crítica do teste ou calcular o p-valor. Vejamos 
as regras de decisão para cada tipo de hipótese considerada: 
 
1. Η Η Η Η0000) µ ) µ ) µ ) µ ≤≤≤≤ µ µ µ µ0 0 0 0 (ο (ο (ο (οu µ = µµ = µµ = µµ = µ0000) ) ) ) versus H1) µ > µµ > µµ > µµ > µ0000 
 
Rejeitar H0 se α
0 z
n
s
µx >− 
 
2. Η2. Η2. Η2. Η0000) µ ) µ ) µ ) µ ≥≥≥≥ µ µ µ µ0000 ( ( ( (ou µ = µµ = µµ = µµ = µ0 0 0 0 ) ) ) ) versus H1) µ < µµ < µµ < µµ < µ0000 
 
Rejeitar H0 se α
0 z
n
s
µx
−<
− 
3. Η3. Η3. Η3. Η0000) µ = µ) µ = µ) µ = µ) µ = µ0000 versus H1) µ µ µ µ ≠≠≠≠ µ µ µ µ0000 
 
Rejeitar H0 se 
2
0 z
n
s
µx
α>
−
 
 
Exemplo 12.3: Uma rede de pizzarias deseja testar com nível de 5% de significância se o 
teor médio de gordura em peças de salame produzidas por determinada indústria de 
alimentos é igual a 15%. De um grande lote retirou uma amostra de 50 peças de salame e os 
resultados estão a seguir: 
 19,8 23,4 13,6 6,6 13,7 5,2 14,3 
 13,3 12,2 14,3 8,5 15,8 16,0 18,3 
 28,7 11,6 16,4 14,4 26,2 17,0 6,5 
 10,0 24,5 34,9 19,1 6,9 19,5 11,0 
 8,9 10,6 9,5 14,0 6,0 18,0 10,8 
 16,7 18,4 10,1 12,3 6,5 25,4 15,3 
 12,1 13,1 7,7 17,4 10,7 24,1 14,0 
 21,4 
 
 Αs hipóteses a serem testadas são 
 
Η0) µ = 15 versus H1) µ ≠ 15 
 
Vejamos as estatísticas descritivas da amostra: 
Teor de Gordura 
Média 14,894 
Desvio padrão 6,3871 
 
 
24
 
Temosque α = 0,05 e portanto 
2
αz = 1,96. A região crítica é 
Rejeitar H0 se 
2
0 z
n
s
µx
α>
−
 
 
Vamos substituir os valores: 
Rejeitar H0 se 
2
z
50
6,3871
15894,14
α>
−
 
 
Assim, rejeitaremos H0 se 
2
z1174,0 α>− 
 
 
Como o valor observado foi 0,1174, que não pertence à região crítica, a decisão deve ser 
de não rejeitar H0, e concluímos que não existe evidência de que o teor de gordura nas 
peças de salame produzidas pela indústria seja diferente de 15%. 
 
Usando um pacote estatístico: 
Variável n Média erro padrão t p-valor 
Teor de Gordura 50 14,894 0,903 -0,12 0,91 
 
Exemplo 12.4: Iremos utilizar teste de hipótese para solucionar a dúvida da equipe técnica 
da indústria siderúrgica: pode-se concluir, com bastante segurança, que o processo de 
recozimento contínuo estava centrado abaixo do valor nominal da especificação (61,0 HR)? 
Essa dúvida pode ser solucionada por meio da realização de teste de hipótese para a dureza 
média (µ) das folhas-de-flandres produzidas pelo processo: 
 
 Αs hipóteses a serem testadas são 
 
Η0) µ ≥ 61 versus H1) µ <61 
 
Temos que α = 0,05 e portanto αz = 1,65. A região crítica é 
Rejeitar H0 se α
0 z
n
s
µx −<− 
 
 
 
25
 
Vamos substituir os valores: αz−<
−
50
0,611
16212,06 
Assim, rejeitaremos H0 se αz12,9 −<− 
 
 
Como o valor observado foi -9,12, que pertence à região crítica, a decisão deve ser de 
rejeitar H0, e concluímos que existe evidência de que a dureza média nas peças produzidas 
pela indústria seja inferior a 61. 
 
12.7 Teste para Proporções 
 
Quando trabalhamos com grandes amostras vimos que a distribuição amostral das 
proporções se aproxima da distribuição normal. Se p é a proporção populacional e p0 um 
valor fixo. A estatística de teste é : 
n
qp
pp̂
00
0− 
Vamos considerar os seguintes testes: 
 
1. Η Η Η Η0000) ) ) ) p ≤≤≤≤ p0 0 0 0 ( ( ( ( p = = = =p0000)))) versus H1) p > > > > p 
 
Rejeitar H0 se α
00
0 z
n
qp
pp̂ >− 
2. Η Η Η Η0000) ) ) ) p ≥≥≥≥ p0 0 0 0 (ο (ο (ο (οu p = = = =p0000)))) versus H1) p < < < < p0000 
 
Rejeitar H0 se α
00
0 z
n
qp
pp̂ −<− 
3. Η Η Η Η0000) ) ) ) p = = = = p0 0 0 0 versus H1) p ≠≠≠≠ p0000 
 
Rejeitar H0 se α/2
00
0 z
n
qp
pp̂ >− 
 
Exemplo 12.5: A fábrica A de automóveis afirma que 60% dos consumidores compram 
carros produzidos por ela. Uma fábrica concorrente deseja testar a veracidade desta 
afirmação. Para isso decide realizar uma pesquisa por amostragem com 300 proprietários 
de veículos. 
 
 
 
 
26
 
Hipóteses a serem testadas 
H0) p = 0,60 
H1) p < 0,60 
 
p = proporção de consumidores que compram carros produzidos pela fábrica A. 
 
A hipótese alternativa foi definida desta forma, pois se espera uma proporção menor, nunca 
maior. Observe que a hipótese alternativa não foi influenciada pelo resultado da pesquisa. 
 
Vamos fixar α= 5% e como a amostra é grande podemos utilizar aproximação normal e o 
teste 2 dado acima. 
 
Suponha agora que os resultados da pesquisa apontaram 165 proprietários de carros da 
fábrica A, isto equivale a uma proporção amostral (p̂ ) de 55% pois 
p̂ = 550
300
165
,= 
Portanto devemos rejeitar H0 se α
00
0 z
n
qp
pp̂ −<− . 
Como α= 5%, zα = 1,645 e 645,177,1
300
40,060,0
60,055,0
n
qp
pp̂
00
0 −<−≅
×
−=− 
logo rejeitamos H0 e concluímos que há evidências de que a proporção de consumidores da 
fábrica A é inferior a 60% com 95% de confiança. 
 
Bibliografia: 
 
MONTGOMERY, Douglas C.; RUNGER, George C.; HUBELE, Norma Faris. Estatística 
aplicada à engenharia. Rio de Janeiro: LTC, 2004. 335 p. 
 
MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. 5. ed. São 
Paulo: Saraiva, 2006. 526 p. 
 
WERKEMA, Maria Cristina Catarino. Como estabelecer conclusoes com confianca: 
entendendo inferencia estatistica. Belo Horizonte, MG: UFMG. Escola de Engenharia, 
[1996]. 309 p. (Ferramentas da qualidade 4) . 
 
 
 
 
 
 
 
 
 
 
 
 
27
 
6a LISTA DE EXERCICIOS 
 
1) De sua opinião sobre os tipos de problemas que surgirão nos seguinte plano de 
amostragem. 
Para investigar a proporção de estudantes da UFU, favoráveis à mudança do início das 
atividades das 7:10 h para as 8:00 h, decidiu-se entrevistar os 30 primeiros estudantes que 
chegassem no bloco 4K, na segunda – feira. 
 
2) Uma população encontra-se dividida em 3 estratos, com tamanhos, respectivamente, 
N1 = 80, N2 =120 e N3 = 60. Pretende-se retirar uma amostra de 50 elementos da 
população. Por que não é recomendada uma amostra aleatória simples? 
 
3) A capacidade máxima de um elevador é de 500 kg. Se a distribuição dos pesos dos 
usuários é suposta N(70, 100). Qual a probabilidade de 7 passageiros ultrapassarem este 
limite? 
 
4) Uma empresa fabrica cilindros com diâmetro médio de 50mm e desvio padrão de 2,5 
mm. A distribuição dos diâmetros é normal. Os diâmetros de uma amostra de 4 cilindros 
são medidos a cada hora. A média da amostra é usada para decidir se o processo de 
fabricação está operando satisfatoriamente. Aplica-se a seguinte regra de decisão: se o 
diâmetro médio da amostra de 4 cilindros é igual a 53,7mm ou mais, ou igual a 46,3 ou 
menos, deve-se parar o processo. Se o diâmetro médio estiver entre 46,3 e 53,7 mm, o 
processo deve continuar. 
a) Qual a probabilidade de se parar o processo se a média (µ) for igual a 50 mm? 
b) Qual a probabilidade do processo continuar se a média se deslocar para µ = 53,7? 
 
5) Um distribuidor de sementes determina, através de testes, que 5% das sementes não 
germinam. Ele vende pacotes de 200 sementes com garantia de 90% de germinação. Qual a 
probabilidade de um pacote não satisfazer a garantia? 
 
6) Para uma distribuição qui-quadrado, determine χ�,�� , de modo que: 
a) �(�� > χ�,&� )=0,99 b) �(37,65 9 �� 9 χ�,��� )=0,045 
 
7) Dada uma amostra de tamanho 24 de uma distribuição normal, determine k de modo 
que: a) P(-2,069<T<k)=0,965 b) P(k<T<2,807)=0,095 c) P(-k<T<k)=0,90 
 
8) Se recolhesse 200 amostras de dimensão 40 a partir da mesma população, de modo que 
com elas construísse 200 intervalos de confiança a 99%, quantos destes intervalos esperaria 
que contivessem o verdadeiro valor da proporção de estudantes em análise? 
 
9) Num estudo de mercado foi encontrado o seguinte intervalo de confiança a 95% para a 
proporção de pessoas receptivas a um novo tipo de espuma de banho a lançar em breve no 
mercado: ]0.52; 0.61[ . Comente as seguintes afirmações, indicando se estas lhe parecem 
corretas ou incorretas: 
a)95% das pessoas vão passar a usar a nova espuma de banho. 
b) A probabilidade da nova espuma de banho alcançar uma quota de mercado de 50%, é de 
0.95. 
 
 
28
 
c) A quota de mercado poderá ser, com 95% de confiança, de 56.5% (valor intermédio do 
intervalo); 
d) O resultado obtido indica apenas que é oportuno proceder ao lançamento da nova 
espuma de banho. 
 
10) A força de compressão de concreto está sendo testada por um engenheiro civil. 
Suponha normalidade. Ele testa 12 amostras e obtém os seguintes dados: 
2216 2237 2249 2204 2225 2301 2281 2263 2318 2255 2275 2295 
a) Construir o intervalo de 95% para a força média; 
b) Construir o intervalo de 99% para a força média; 
c) Ao nível de 5% de significância, verificar se a verdadeira média da força de compressão 
difere de 2280. 
d) Repetir o item c, usando α=1%. 
e) Repetir o item c, porém verificando se a verdadeira média da força de compressão difere 
de 2300. 
f) Compare as conclusões obtidas usando-se IC e teste de hipóteses. 
 
11) A experiência com trabalhadores de certa indústria indica que o tempo necessário para 
que um trabalhador, aleatoriamente selecionado, realize uma tarefa é aproximadamente 
normal, com desvio padrão de 12 minutos. Uma amostra aleatória de 25 trabalhadores 
forneceu x = 140 minutos. Determinar os limites de confiança de 95% para a média µ da 
populaçãode todos os trabalhadores que fazem aquele determinado serviço. 
 
12) Em uma linha de produção de certa peça mecânica, colheu-se uma amostra de 100 
itens, constatando-se que 4 peças eram defeituosas. Construir o IC para a proporção p das 
peças defeituosas ao nível de 10%. 
 
13) Um fabricante sabe que a vida útil das lâmpadas que fabrica tem distribuição 
aproximadamente normal com desvio padrão de 200 horas. Para estimar a vida média das 
lâmpadas, tomou uma amostra de 400 delas, obtendo vida média de 1.000 horas. 
a) Construir um IC para µ ao nível de 1%; 
b) Qual o valor do erro de estimação cometida em a? 
c) Qual o tamanho da amostra necessária para se obter um erro de 5 horas, com 99% de 
probabilidade de acerto? 
 
14) Uma amostra de 10.000 itens de uma produção foi inspecionada e o número de defeitos 
por peça foi registrado na tabela abaixo: 
Número de 
Defeitos 
0 1 2 3 4 
Frequência 
Absoluta 
6000 3200 600 150 50 
a) Chamando de p a proporção de itens defeituosos nessa produção, determinar os limites 
de confiança de 98% de p; Resp.: [38,86% ; 41,14% ] 
b) Qual o erro de estimação cometido em a? Resp.: 1,14% 
 
15) De 50.000 válvulas fabricadas por uma companhia retira-se uma amostra de 400 
válvulas, e obtém-se a vida média de 800 horas e o desvio padrão de 100 horas. 
 
 
29
 
a) Qual o intervalo de confiança de 99% para a vida média da população? Resp.: 
[787,1;812,9] 
b) Com que confiança dir-se-ia que a vida média é 800 ± 0,98? Resp.:0.16 
c) Que tamanho deve ter a amostra para que seja de 95% a confiança na estimativa 800 ± 
7,84? Resp.: 625 
 
16) Antes de uma eleição, um determinado partido está interessado em estimar a proporção 
p de eleitores favoráveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 
60% dos eleitores eram favoráveis ao candidato em questão. 
a) Determine o tamanho da amostra necessário para que o erro cometido na estimação seja 
de no máximo 0,01 com probabilidade de 0,80. Resp.: 3932 
b) Se na amostra final, com tamanho igual ao obtido em ‘a’ , observou-se que 55% dos 
eleitores eram favoráveis ao candidato em questão, construa um intervalo de confiança de 
95% para a proporção p. Resp.: [0,5345 ; 0,5655] 
 
17) Um aditivo para gasolina está sendo testado para ver se aumenta a quilometragem. 
Vinte e cinco carros recebem 5 galões de gasolina e são postos a andar até que a gasolina 
termine. No fim do experimento, calcula-se a quilometragem média para cada carro. Os 
cálculos forneceram uma média de 18,5 milhas por galão e um desvio padrão de 2,2 milhas 
por galão para os 25 carros. Suponha que a quilometragem segue uma distribuição normal. 
Encontre um IC de 95% para µ. Resp.: [17,59 ; 19,41] 
 
18) Uma amostra de 30 peças , forneceu os seguintes pesos: 
250 265 267 269 271 275 277 281 283 284 
287 289 291 293 293 298 301 303 306 307 
307 309 311 315 319 322 324 328 335 339 
Considere que a variável peso seja normalmente distribuída. 
Por meio da construção do IC, responder se esta amostra satisfaz a especificação pela qual 
o peso médio deve ser 300 Kg. Resp.:[288,33 ; 309,95] Sugestão: Adote α = 2,5% 
 
19) a) Supor uma amostra aleatória de 10 contas correntes em uma grande loja de uma 
cadeia, com um saldo devedor médio de 27,60 dólares. Admitindo que o desvio padrão de 
todos os saldos é de 12,00 dólares, calcular um intervalo de 95% de confiança para a média 
de todos os saldos. Suponha normalidade. Resp.:[20.16 ; 35.04] 
b) Explicar ao vice-presidente da firma o significado de sua resposta (a), em termos tão 
simples quanto possíveis. 
 
20) Uma empresa de embalagens que presta o serviço de envelopamento de revistas, 
decidiu reduzir a proporção de embalagens defeituosas produzidas. 
A empresa tomou como meta reduzir para menos de 2% a proporção de embalagens 
defeituosas até o final do ano. Para alcançar esta meta foram adotadas ações corretivas. 
Foram coletadas 2000 revistas embaladas, para confirmar a efetividade das ações. Dentre 
estas revistas 50 foram consideradas defeituosas. Construa um intervalo de 99% de 
confiança para a proporção de defeituosas (p). A partir da interpretação do intervalo, a 
empresa pode concluir que a meta de melhoria foi alcançada? 
 
 
 
30
 
21) Um hospital vinha recebendo diversas queixas de seus pacientes quanto ao elevado 
tempo de espera para a realização de exames no setor de diagnóstico cardiovascular. Diante 
desta situação, o departamento administrativo do hospital resolveu melhorar este resultado, 
tendo como meta reduzir para 10 minutos ou menos o tempo médio de espera dos pacientes 
para a realização de exames no setor de diagnóstico cardiovascular, até o final do mês. 
 Fez-se uma ação corretiva e para avaliar se esta ação foi realmente efetiva, isto é, se 
esta ação foi capaz de reduzir o tempo médio de espera dos pacientes para 10 minutos ou 
menos. Para a realização da avaliação da efetividade da ação, a equipe de trabalho registrou 
os tempos de espera de 25 pacientes atendidos após a implementação da ação de bloqueio, 
obtendo média de 8,712 e desvio padrão de 2,73. Admita que os tempos de espera seguem 
distribuição normal. 
a) Construa um intervalo de 95% de confiança para o tempo médio de espera e diga se a 
meta estabelecida foi alcançada. 
b) Construa um IC para o desvio padrão do tempo de espera ( α = 1%) . 
 
22) Uma companhia de seguros decidiu avaliar qual era a proporção de formulários de 
apólices de seguro preenchidos incorretamente (p) pelos operadores responsáveis por esta 
tarefa. A empresa considerava um resultado indesejável descobrir que p ≥ 5%, o que 
implicaria na necessidade de ser iniciado um trabalho para melhorar o nível de qualidade 
que vinha sendo alcançado. De uma amostra de 200 formulários examinados, foram 
encontrados 9 que apresentavam erros no preenchimento. A partir deste resultado, os 
técnicos da empresa desejam tomar uma decisão. Construa um intervalo de confiança para 
p e diga qual a decisão. (α = 5%) 
 
23) As fibras óticas são instrumentos ideais para transmissão de sons e imagens e são 
largamente utilizadas em redes de telecomunicações, computadores e redes de TV. Para que 
uma fibra ótica seja de boa qualidade, ela deve possuir alta capacidade para transportar 
rápidos impulsos de luz através de uma rede de longo comprimento. Para isso, é necessário 
que o diâmetro ou espessura da fibra seja bastante pequeno, da ordem de 125 mícrons ou 
1/8 milímetro ( o fio de cabelo é da ordem de ¼ de milímetro). Assim, um dos itens de 
controle do processo de produção é a espessura das fibras óticas, cuja faixa de 
especificação é 125,0 ± 3,0 mícrons. Admita distribuição normal. 
a) Sabendo que a diferença máxima que será permitida entre a verdadeira espessura média 
das fibras produzidas pelo processo e a espessura média amostral é igual a 0,3 mícrons e 
que, historicamente, o desvio padrão da espessura é igual a 0,9 mícrons, determine o 
tamanho da amostra necessária para a construção de um intervalo de 99% de confiança 
para a espessura média das fibras óticas. 
b) Os técnicos da empresa mediram a espessura de 60 fibras óticas e obtiveram média de 
125,18 e desvio padrão de 0,89. Construa o intervalo de 99% de confiança para a 
espessura média das fibras e interprete o resultado obtido. 
 
24) O tempo de vida (em horas) das lâmpadas da marca X tem distribuição 
aproximadamente normal. Uma amostra de 16 lâmpadas forneceu os dados: 
1.200 ; 1100 ; 900 ; 1.250 ; 1.300 ; 1.290 ; 1.100 ; 1.060 ; 1.180 ; 1.120 ; 1.160 ; 1.140 ; 
1.190 ; 1.110 ; 1.100 e 1.220 horas. Construir um intervalo com 90% de confiança para a 
variância da população. 
 
 
31
 
25) Quantas residências com TV a Nielsen deve pesquisar para estimar a percentagem das 
que estão sintonizadas no programa Jô Soares Onze e Meia? Adote a margem de 97% de 
confiança em que sua percentagem amostral tenha uma margem de erro de dois pontos 
percentuais. Admita também que nada se sabe sobre a percentagem de residênciassintonizadas para qualquer show de TV após 11 horas da noite. 
 
26) A cadeia de hotéis American Resort dá um teste de aptidão aos candidatos a emprego, e 
considera fácil uma questão do tipo múltipla escolha se ao menos 80% das respostas são 
corretas. Uma amostra aleatória de 6503 respostas a determinada questão apresenta 84% de 
respostas corretas. Construa o intervalo de confiança de 99% para a verdadeira 
percentagem de respostas corretas. É admissível que a questão seja realmente fácil? 
Justifique. 
 
27) Obtém-se uma amostra de 15 crânios de homens egípcios que viveram por volta de 
1850 A.C. Mede-se a largura máxima de cada crânio, como resultado ;< = 134,5 mm S = 3,5 
mm (com base em dados de Ancient Races of Thebaid, porThomson e Randall-Maciver). 
Com esses dados amostrais, construa um intervalo de 95% de confiança para o desvio-
padrão populacional. 
 
28) Os valores relacionados são tempos de espera (em minutos) de clientes no Jefferson 
Valley Bank, onde os clientes entram em uma fila única que é atendida por três guichês. 
Construa um intervalo de 95% de confiança para o desvio-padrão populacional. 
6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 
 
29) A associação dos proprietários de industrias metalúrgicas está muito preocupada com o 
tempo perdido com acidentes de trabalho, cuja média, nos últimos tempo, tem sido da 
ordem de 60 h/homem por ano e desvio padrão de 20 h/homem. Tentou-se um programa de 
prevenção de acidentes e após o mesmo, tomou-se uma amostra de 9 indústrias e mediu-se 
o número de horas/homens perdidas por acidentes que foi 50 horas. Você diria, ao nível de 
5%, que há evidência de melhoria? 
 
30) O salário médio dos empregados das indústrias siderúrgicas é de 2,5 salários mínimos. 
Se uma firma particular emprega 49 empregados com salário médio de 2,3 salários 
mínimos e com um desvio padrão de 0,5 salário mínimo, podemos afirmar que está 
indústria paga salários inferiores, ao nível de 5% ? 
 
31) O consumidor de um certo produto acusou o fabricante, dizendo que mais de 20% das 
unidades fabricadas apresentam defeito. Para confirmar sua acusação, ele usou uma 
amostra de tamanho 50, onde 27% das peças eram defeituosas. Mostre como o fabricante 
poderia retirar acusação. Utilize um nível de significância de 10%. 
 
32) Os produtores de um programa de televisão pretendem modificá-lo se for assistido 
regularmente por menos de um quarto dos possuidores de televisão. Uma pesquisa 
encomendada a uma empresa especializada mostrou que, de 400 famílias entrevistadas 80 
assistem ao programa regularmente. Baseado nos dados, qual deve ser a decisão dos 
produtores? 
 
 
32
 
33) A Debug Company vende um repelente de insetos que chega a ser eficiente pelo prazo 
de 400 horas no mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma 
média de eficiência de 380 horas com um desvio de 60 horas. A duração média de 
eficiência ao repelente é inferior ao fornecido pela companhia? (α = 1%). 
 
34) Estudos efetuados sobre a densidade (em kg/dm3) do betão numa estrutura de betão 
armado levam a supor que a resistência à compressão (aos 28 dias) desta estrutura se 
encontra frágil. Suspeitando que a densidade média real se encontrasse abaixo do nível 
ótimo (0,3 kg/dm3), decidiu-se recolher uma amostra de 10 densidades tendo-se obtido os 
seguintes resultados. 
( ) 00081,0X e 93,2
10
1i
2
i
10
1
=−= ∑∑
==
XX
i
i 
 
Efetuando um teste de hipóteses ao nível de 90% de confiança, indique se rejeita, ou não, a 
hipótese de densidade média real ser significativamente inferior ao nível ótimo (0,3 
kg/dm3). 
 
35) Um comprador, ao receber de um fornecedor um grande lote de peças, decidiu 
inspecionar 200 delas. Decidiu, também, que o lote será rejeitado se ficar convencido, ao 
nível de 5% de significância, de que a proporção de peças defeituosas no lote é superior a 
4%. Qual será sua decisão (não rejeitar ou rejeitar o lote) se na amostra foram encontradas 
onze peças defeituosas? Passos: defina as hipóteses, faça o teste, tome a decisão. 
 
36) É conhecido, como experiência de muitos anos de uso, que o tempo médio de vida de 
uma lâmpada de um aparelho odontológico sob condições normais de funcionamento é de 
356 horas. Uma nova lâmpada apareceu recentemente no mercado, com um custo de 5% a 
mais, e o dentista testou dez delas. Obteve como valor médio dessas dez lâmpadas o tempo 
de 380 horas e como desvio padrão estimado de 30,3 horas. Qual deve ser a decisão dele? É 
o caso de substituir a velha lâmpada por essa nova? Use p-valor da saída de um programa 
computacional dada a seguir para tomar uma decisão. 
 
Test of µ = 356 vs not = 356 
 
 N Mean StDev SE Mean T p-value 
10 382.000 30.300 9.582 2.71 0.024 
 
37) Os seguintes dados vêm de um estudo que examina a eficácia da cotinina na saliva como um 
indicador para a exposição à fumaça do tabaco. Em uma parte do estudo, a sete indivíduos – 
nenhum dos quais grandes fumantes e todos eles se abstiveram de fumar pelo menos uma semana 
antes do estudo – foi solicitado fumar um único cigarro. Foram tomadas amostras da saliva de todos 
os indivíduos 12 e 24 horas depois de terem fumado o cigarro. 
 
 
 
 
 
 
 
 
33
 
Os níveis de cotinina obtidos são mostrados abaixo*: 
 
Indivíduo Níveis de Cotinina (mmol/l) 
Depois de 12 horas Depois de 24 horas 
1 73 24 
2 58 27 
3 67 49 
4 93 59 
5 33 0 
6 18 11 
7 147 43 
*DIGIUSTO, E. e ECKHARD, I. Some Properties of Saliva Continine Measurements in Indicating Exposure 
To Tobacco Smoking, American Journal of Public Health, v. 76, out., 1986, p. 1245-1246. 
 
A partir da saída de um programa computacional a seguir, teste a hipótese nula de que as médias da 
população sejam idênticas ao nível de significância de 5%. O que você conclui? 
 
Paired T-Test 
 
 N Mean StDev SE Mean 
Doze 7 69.8571 42.2154 15.9559 
VinteQuatro 7 30.4286 21.1176 7.9817 
Difference 7 39.4286 31.3946 11.8660 
95% CI for mean difference: ( 10.3934, 68.4637) 
T-Test of mean difference = 0 (vs not = 0): 
T-Value = 3.32 
P-Value = 0.016 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
34
 
13. Análise de Regressão 
 
13.1 Introdução 
 
Frequentemente estamos interessados em estudar como duas ou mais variáveis estão 
associadas. Algumas vezes o interesse é apenas medir o grau de associação e outras vezes 
deseja-se obter um modelo matemático-estatístico que seja capaz de descrever a relação 
funcional entre as variáveis. Para investigar e modelar a relação entre elas, usa-se a Análise 
de Regressão. 
 
Quando estamos estudando o comportamento de apenas duas variáveis x e y que 
supostamente se relacionam através de uma função linear, devemos considerar a seguinte 
equação: 
y = β0 + β1x + ε 
em que ε representa um erro aleatório e pode ser pensado como uma “falha” da equação 
linear em se ajustar aos dados exatamente. Este modelo é chamado de Modelo de 
Regressão Linear Simples. Para estimar os parâmetros β0 e β1, uma amostra de pares (x,y) 
deve ser coletada e analisada. A variável x é conhecida como variável preditora ou 
independente e y é conhecida como variável resposta ou dependente. 
 
Obtemos um modelo mais geral quando a variável resposta pode ser relacionada a k 
variáveis preditoras, x1, x2, ..., xk e, neste caso, o modelo adequado seria: 
y= β0 + β1x1 + β2x2 + ... + βkxk + ε 
Este modelo é chamado Modelo de Regressão Linear Múltipla. 
 
Nem sempre um modelo de regressão linear é o mais adequado para uma 
determinada situação. Algumas vezes, devemos modelar a relação entre variáveis utilizando 
funções não lineares ou mesmo fazendo alguma transformação funcional na(s) variável(s) 
de modo a obter linearidade. 
 
Em todos os casos é importante destacar que um modelo de regressão não implica 
numa relação de causa-e-efeito. Para estabelecer causalidade, a relação entre as variáveis 
preditoras e a resposta deve ter uma base além do conjunto dedados. Por exemplo, o 
relacionamento entre variáveis pode ser sugerido por considerações teóricas. A Análise de 
Regressão pode apenas ajudar a confirmar esta relação. 
 
13.2 Diagrama de Dispersão e Coeficiente de Correlação 
 
Como dissemos anteriormente, para estudar a relação entre duas variáveis devemos 
partir da coleta de uma amostra de pares de observações. Para isto, é necessário realizar um 
experimento em que se faz simultaneamente medidas de duas variáveis x e y para uma 
amplitude de diferentes condições experimentais. Sejam (x1,y1), (x2,y2), ... , (xn,yn) os n 
pares de observações. 
Um procedimento para visualizarmos a forma da relação entre as variáveis x e y é o 
diagrama de dispersão, que nada mais é do que a representação dos pares de valores num 
sistema cartesiano. 
 
 
 
35
 
Exemplo 1 (Werkema, 1996): Uma indústria fabricante de eletrodomésticos da chamada 
“linha branca” , tem como objetivo resolver o problema apresentado pelo elevado índice de 
refugo da gaveta de legumes de um modelo de refrigerador produzido pela empresa. A 
observação do problema indicou que a maior parte das gavetas refugadas era considerada 
defeituosa por apresentarem corte fora de esquadro. Os técnicos da empresa suspeitaram 
que a ocorrência do corte de gavetas fora de esquadro pudesse estar relacionada à variação 
de tensão na rede elétrica, que poderia prejudicar o desempenho do equipamento de corte. 
Para a verificação da validade desta hipótese, foram coletados dados sobre a tensão na rede 
elétrica (x) e a variação no corte (y), os quais estão apresentados na tabela abaixo. 
 
Medidas da Tensão na Rede Elétrica (Volts) e Variação no Corte das Gavetas (mm) 
Número da 
Medida i 
Tensão na Rede 
Elétrica (Volts) 
Variação no Corte 
(mm) 
1 222,7 15,7 
2 217,7 17,0 
3 219,4 16,3 
4 220,9 16,1 
5 214,4 18,6 
6 216,5 17,8 
7 213,0 19,5 
8 221,7 16,0 
9 224,7 15,3 
10 215,5 18,3 
11 220,0 16,3 
12 218,6 16,7 
13 223,5 15,7 
14 217,0 17,4 
15 221,5 16,1 
16 218,4 16,8 
17 213,6 19,3 
18 221,2 16,2 
19 219,9 16,2 
20 222,2 15,9 
21 213,9 19,1 
22 216,0 18,0 
23 218,1 17,0 
24 222,0 16,0 
25 224,1 15,4 
26 214,9 18,6 
27 214,2 18,7 
28 223,3 15,6 
29 216,7 17,6 
30 215,3 18,5 
31 223,8 15,5 
32 220,6 16,1 
33 215,8 18,2 
34 217,3 17,3 
35 219,2 16,5 
 
 
36
 
 
Figura 1. Diagrama de dispersão da Tensão e da Variação no Corte 
 
Pelo gráfico acima, podemos constatar que existe uma tendência decrescente, já que 
maiores valores para a tensão correspondem a menores valores para a variação no corte. 
Porém, observada esta associação, é útil quantificá-la. Neste caso, podemos utilizar 
o coeficiente de correlação para quantificar esta associação. Em geral, a letra r é usada 
para representar este coeficiente. Valores de r variam de –1.0 a +1.0. Um r próximo a +1 
corresponde a um diagrama de dispersão em que os pontos caem em torno de linha reta 
com inclinação positiva, e um r próximo a –1 corresponde a um diagrama em que os 
pontos caem em torno de uma linha reta com inclinação negativa. Um r próximo a 0 
corresponde a um conjunto de pontos que não mostram nenhuma tendência, nem crescente, 
nem decrescente. A Figura 2, a seguir, mostra cinco diagramas de dispersão de Y e X. 
 Os diagramas das Figuras 2(a) e 2(b) mostram duas situações em que os pontos 
estão em torno de uma reta imaginária ascendente. Valores pequenos de X estão associados 
a valores pequenos de Y, o mesmo acontecendo para valores grandes. Estes dois casos 
indicam o que chamamos de correlação linear positiva de Y e X. Porém, os dados em 2(b) 
apresentam, uma correlação linear positiva mais forte que em 2(a). 
 
 
 
 
 
225220215
19.5
19.0
18.5
18.0
17.5
17.0
16.5
16.0
15.5
15.0
(volts)
Tensão
C
or
te
 (m
m
)
V
ar
ia
çã
o 
no
b) r=1
X
Y
4
8
12
16
20
24
28
32
0 2 4 6 8 10 12 14 16
a) r > 0
X
Y
-4
2
8
14
20
26
32
0 2 4 6 8 10 12 14 16
 
 
37
 
d) r = -1
X
Y
-11
-9
-7
-5
-3
-1
1
0 2 4 6 8 10 12
 
 
Figura 2. Gráficos de Dispersão 
 
As Figuras 2(c) e 2(d) mostram que os pontos em X e Y estão em torno de uma reta 
imaginária descendente, indicando o que chamamos de correlação linear negativa, ou seja, 
valor de r menor que zero. Observe que em 2(d) a correlação é igual a -1. 
Os valores de X e Y na Figura 2(e) não sugerem uma associação entre duas 
variáveis, pois valores pequenos ou grandes de X estão associados tanto a valores pequenos 
quanto a valores grandes de Y. Os pontos do diagrama não se posicionam em torno de uma 
linha imaginária ascendente ou descendente. 
 O coeficiente de correlação, também chamado de Coeficiente de Correlação de 
Pearson, é calculado por: 
 
 
 
 
 
 
ou 














−



















−

















−
=
∑∑∑∑
∑∑∑
====
===
2n
1i
i
n
1i
2
i
2n
1i
i
n
1i
2
i
n
1i
i
n
1i
i
n
1i
ii
y
n
1
yx
n
1
x
yx
n
1
yx
r 
( )( )
( ) ( )∑ ∑
∑
−−
−−
= −
2
i
2
i
n
1i
ii
xxyy
xxyy
r 
c) r < 0
X
Y
e) r
X
Y
≅ 0 
 
 
38
 
em que xi e yi são os valores observados de X e Y, respectivamente; i=1,2,...,n e n é o 
número de observações para cada variável. yx e são as médias de X e Y, respectivamente. 
 
Exemplo 2: Calculando o coeficiente de correlação linear para os dados do exemplo 1, 
r = -0,9764 , um valor muito próximo de –1, podemos concluir que existe uma forte 
correlação negativa entre a tensão na rede elétrica e a variação no corte das gavetas de 
legumes do refrigerador produzido pela indústria. 
 
Dados para o Cálculo do Coeficiente de Correlação para o exemplo 1 
i x y x2 y2 xy 
1 222,7 15,7 49595,29 246,49 3496,39 
2 217,7 17 47393,29 289 3700,9 
3 219,4 16,3 48136,36 265,69 3576,22 
4 220,9 16,1 48796,81 259,21 3556,49 
5 214,4 18,6 45967,36 345,96 3987,84 
6 216,5 17,8 46872,25 316,84 3853,7 
7 213 19,5 45369 380,25 4153,5 
8 221,7 16 49150,89 256 3547,2 
9 224,7 15,3 50490,09 234,09 3437,91 
10 215,5 18,3 46440,25 334,89 3943,65 
11 220 16,3 48400 265,69 3586 
12 218,6 16,7 47785,96 278,89 3650,62 
13 223,5 15,7 49952,25 246,49 3508,95 
14 217 17,4 47089 302,76 3775,8 
15 221,5 16,1 49062,25 259,21 3566,15 
16 218,4 16,8 47698,56 282,24 3669,12 
17 213,6 19,3 45624,96 372,49 4122,48 
18 221,2 16,2 48929,44 262,44 3583,44 
19 219,9 16,2 48356,01 262,44 3562,38 
20 222,2 15,9 49372,84 252,81 3532,98 
21 213,9 19,1 45753,21 364,81 4085,49 
22 216 18 46656 324 3888 
23 218,1 17 47567,61 289 3707,7 
24 222 16 49284 256 3552 
25 224,1 15,4 50220,81 237,16 3451,14 
26 214,9 18,6 46182,01 345,96 3997,14 
27 214,2 18,7 45881,64 349,69 4005,54 
28 223,3 15,6 49862,89 243,36 3483,48 
29 216,7 17,6 46958,89 309,76 3813,92 
30 215,3 18,5 46354,09 342,25 3983,05 
31 223,8 15,5 50086,44 240,25 3468,9 
32 220,6 16,1 48664,36 259,21 3551,66 
33 215,8 18,2 46569,64 331,24 3927,56 
34 217,3 17,3 47219,29 299,29 3759,29 
35 219,2 16,5 48048,64 272,25 3616,8 
Total 7657,6 595,3 1675792 10178,11 130103,4 
 
 
39
 
 
( )
( ) ( ) 


 −



−
=
22 3,595
35
1
11,101786,7657
35
1
-1675792
595,3x 6,7657
35
1
4,130103
r = -0,9764 
 
 
13.3 Cuidados com Correlações 
 
 Um dos cuidados que devemos ter quando a correlação é interpretada é saber que 
correlação não é o mesmo que causalidade (relação de causa e efeito). Isto é, quando duas 
variáveis são altamente correlacionadas, não significa, necessariamente, que uma causa a 
outra. Em alguns casos, podem existir relações causais, mas não se saberá isso pelo 
coeficiente de correlação. Provar uma relação de causa e efeito é muito mais difícil do que 
somente mostrar um coeficiente de correlação alto. 
 Um outro cuidado que deve ser tomado ao se interpretar correlação é associar um 
diagrama de dispersão ao conjunto de dados. Veja o exemplo abaixo. 
 
Exemplo 3: Vamos calcular para cada um dos quatro conjuntos de dados abaixo o 
coeficiente de correlação. 
 
Conjunto 1 Conjunto 2 Conjunto 3 Conjunto4 
X Y X Y X Y X Y 
10 8,04 10 9,14 10 7,46 8 6,58 
8 6,95 8 8,14 8 6,77 8 5,76 
13 7,58 13 8,74 13 12,74 8 7,71 
9 8,81 9 8,77 9 7,11 8 8,84 
11 8,33 11 9,26 11 7,81 8 8,47 
14 9,96 14 8,1 14 8,84 8 7,04 
6 7,24 6 6,13 6 6,08 8 5,25 
4 4,26 4 3,1 4 5,39 19 12,5 
12 10,84 12 9,13 12 8,15 8 5,56 
7 4,82 7 7,26 7 6,42 8 7,91 
5 5,68 5 4,74 5 5,73 8 6,89 
 
Para cada um deles, temos: r= 0,82 (Verifique!). Porém, estes conjuntos de dados 
apresentam disposições completamente diferentes no diagrama. 
 
 
 
 
 
 
 
 
 
40
 
 
 
 
 
 
 
 
 
Figura 3. Diagrama de Dispersão. 
 
 
13.4 Questões não respondidas pela Correlação 
 
Ao estudarmos a relação entre variação no corte (mm) e tensão (volts) surgem 
algumas questões importantes tais como: 
1) Qual é a previsão de variação no corte (mm) usando uma tensão especificada em 
volts? 
Conjunto 3: r=0,82
X
Y
4
6
8
10
12
14
2 4 6 8 10 12 14 16
Conjunto 1: r=0,82
X
Y
3
4
5
6
7
8
9
10
11
12
2 4 6 8 10 12 14 16
Conjunto 2: r=0,82
X
Y
2
3
4
5
6
7
8
9
10
2 4 6 8 10 12 14 16
Conjunto 4: r=0,82
X
Y
4
6
8
10
12
14
6 8 10 12 14 16 18 20
 
 
41
 
2) Qual é a média estimada de variação no corte (mm) para uma especificada tensão 
em volts? 
3) Quais são os limites de confiança para variação no corte (mm) predita? 
 
Questões deste tipo podem ser respondidas com uma análise de regressão dos dados, 
que é o assunto das próximas seções. 
 
 
13.5 Principais Objetivos da Análise de Regressão 
 
De maneira geral, os modelos de regressão podem ser usados para vários propósitos, 
dentre os quais é possível destacar: 
a) Descrição dos dados 
b) Estimação dos parâmetros 
c) Predição 
d) Controle 
 
Descrição dos dados 
É muito comum a utilização da análise de regressão para descrever um conjunto de 
dados. Isto é, a construção de um modelo que relacione, por exemplo, o efeito do ar 
condicionado no consumo de energia elétrica é uma maneira muito mais efetiva de 
conhecer o relacionamento entre estas variáveis em comparação a uma tabela ou mesmo 
um gráfico. 
 
Estimação dos parâmetros 
No exemplo sobre o consumo de energia elétrica, podemos utilizar a análise de 
regressão para conhecermos qual o número médio de kilowatt/hora consumido usando o ar 
condicionado por uma hora. 
 
Predição 
É possível também, utilizar regressão para predizer valores para a variável resposta. 
Voltando ao exemplo 1, o fabricante pode estar interessado em conhecer quanto será a 
variação do corte em (mm) para uma determinada tensão na rede elétrica (volts). 
 
Controle 
A Análise de Regressão pode ser usada com o objetivo de controlar a variável 
resposta. Considere, como exemplo, um engenheiro químico que está interessado em 
controlar o rendimento de um processo químico através das variáveis temperatura e tempo 
de reação. Esta equação poderá ser utilizada para determinar a natureza dos ajustes a serem 
realizados nas variáveis temperatura e tempo de reação, para que o rendimento possa ser 
mantido num intervalo pré-estabelecido. 
 
É importante destacar que, quando o modelo de regressão for empregado com o 
objetivo de controle, a relação existente entre a variável de interesse e as variáveis 
utilizadas para seu controle sejam do tipo causa-e-efeito. 
 
 
 
 
42
 
13.6 Regressão por Mínimos Quadrados 
 
Um coeficiente de correlação descreve a associação linear entre variáveis porém, 
para investigar e modelar a relação entre elas, usa-se a Análise de Regressão. 
Para se ajustar um modelo de regressão por mínimos quadrados a variável resposta 
deve ser quantitativa. 
 O que se deseja, freqüentemente, com base em dados amostrais, é estimar o valor da 
variável y, correspondente ao conhecimento de uma variável x. Isto pode ser feito mediante 
a estimativa da função linear f(x) = y = β0 + β1x. 
 Observe porém, que as linhas que várias pessoas podem traçar para este conjunto de 
pontos seriam, provavelmente, similares, desde que o gráfico tenha um padrão bem 
definido. Porém, elas não seriam idênticas, de forma que os valores preditos para 
variável resposta poderiam diferir também. 
 Para um conjunto de dados sem um padrão óbvio no gráfico; diferentes pessoas 
poderiam traçar diferentes linhas sobre os dados, permitindo grandes diferenças entre os 
valores preditos. Usando a Análise de Regressão, qualquer um obterá exatamente a mesma 
linha reta. Este processo é chamado de ajuste de uma reta de regressão. O método usado 
mais freqüentemente para ajustar uma reta usa um princípio chamado de Mínimos 
Quadrados. Este método será descrito posteriormente.. 
Observe a Figura 4 a seguir. O princípio de mínimos quadrados envolve ajustar uma 
reta passando por pontos de forma que as diferenças verticais entre todos os pontos e a reta 
são calculadas. Então, estas diferenças são elevadas ao quadrado para dar aos pontos acima 
e abaixo da reta a mesma importância (as diferenças ao quadrado são todas positivas). As 
diferenças são então somadas. A “melhor” reta é aquela que minimiza esta soma das 
diferenças ao quadrado, sendo chamada, de mínimos quadrados. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
AR
C
O
N
S
U
M
O
10
20
30
40
50
60
70
80
90
100
0 2 4 6 8 10 12 14 16
Reta dos mínimos 
quadrados minimiza os 
valores ao quadrado de 
todas as diferenças 
verticais como estas. 
= ε 
Figura 4 – Processo de Mínimos Quadrados 
 
 
43
 
 
 
Já vimos que uma relação linear entre duas variáveis pode ser expressa através da 
equação: 
ε+β+β= xy 10 
em que, 
 0β é o intercepto; 
 1β é a inclinação; 
 ε é o erro. 
 
Esta equação é a que se obteria medindo-se a população inteira de valores de x e y. Na 
realidade, apenas uma amostra é medida e usa-se esta amostra para estimar a reta. A reta 
estimada por meio da amostra pela regressão de mínimos quadrados será denotada por: 
 
xbby 10 +=
)
 
 
em que 10 e bb são estimativas de 10 e ββ , respectivamente. O valor 0b é o valor predito 
de y
)
 quando x é zero e é chamado de intercepto da reta desde que ele é o local em que a 
reta intercepta o eixo vertical. O valor 1b é o incremento em y
)
 resultante do incremento de 
uma unidade em x e é chamado de inclinação da reta. 
 
O método de Mínimos Quadrados é baseado na soma dos quadrados dos resíduos, ε
, ou seja: 
( )∑∑ β−β−=ε 2102 ii xy 
fazendo-se tal soma a menor possível. A solução deste problema matemático fornece as 
seguintes expressões para 10 e bb : 
( )( )
( )
xbyb
xx
xxyy
b
i
ii
1021
 e , −=
−
−−
=
∑
∑
 
 
ou 
 
( )∑ ∑
∑ ∑ ∑ ∑
−
−
=
2
i
2
i
iiii
2
i
0
xxn
yxxyx
b e 
( )∑ ∑
∑ ∑ ∑
−
−
=
2
i
2
i
iiii
1
xxn
xyxyn
b 
 
em que yi e xi são os valores observados das variáveis Y e X e y e x são as respectivas 
médias amostrais destas variáveis. 
 
 
 
 
 
 
 
44
 
Exemplo 4.: 
 
Vamos ajustar agora um modelo de regressão linear simples com dados do Exemplo 1. 
 
( ) ( )
36,0
7657,6- x167579235
7657,6 x 595,3 - 130103,4 x 35
b e 03,95
7657,6- x167579235
130103,4 x 7657,6-595,3 x 1675792
2120
−====b
 
portanto, variação = 95,03 – 0,36 x (tensão). 
 
 
13.7 Avaliação do modelo de regressão 
 
Uma maneira de verificar a adequação do modelo de regressão linear simples é por 
meio da realização de teste de hipóteses ou a construção de certos intervalos de confiança 
sobre os parâmetros do modelo. Para tal, é necessário supor que o erro ε tem distribuição 
normal com média 0 e variância σ2. Na Seção 13.8 será estudada a análise de resíduo para 
a verificação desta suposição. 
O intervalo de confiança para β1 com (1−α)% de confiança é dado por: 
M`� − /��;���@∑ (a
 − aF)�
�
��= − 2 @ 1∑ (;
 − ;<)��
�� ; `�
5 /��;���@∑ (a
 − aF)�
�
��= − 2 @ 1∑ (;
 − ;<)��
�� Q 
 
Exemplo 5: Vamos calcular o IC para β com 95% para o modelo de regressão linear 
simples com dados do Exemplo 1. 
 
M−0,36 − 2,042 ∗ @21,8126 33 @ 1397,0154 ; −0,36 − 2,042 ∗ @21,8126 33 @ 1397,0154Q
= 0−0,44; −0,282Baseado neste intervalo pode-se concluir que existe evidência que β1≠0, com 95% de 
confiança e, portanto, o modelo de regressão linear é adequado. 
 
13.8 Predição de Novas Observações 
 
Suponha que se queira predizer uma nova observação y correspondendo a um nível 
especificado da variável preditora x. Denotando x= x* como sendo este o valor de interesse, 
então, 
y* = b0 + b1 . x
* 
é uma estimativa pontual para o novo valor da resposta. Considerando que o erro ε tem 
distribuição normal com média 0 e variância σ2, o intervalo de predição para y* com (1-
α)% de confiança é dado por: 
 
 
45
 
( )
∑
=
−
−
−++±+
n
i
i
n
xx
xx
n
stxbb
1
2
2*
2,
2
*
10
)(
1
1 α 
em que 
 
 
 
 
 
ou 
2n
yx
n
1
yxby
n
1
y
s
n
1i
i
n
1i
i
n
1i
ii1
2n
1i
i
n
1i
2
i
2
−

















−−













−





=
∑∑∑∑∑
=====
 
 
s é o desvio padrão do erro; 
 
2,
2
t
−nα
 é o ponto que define uma área de (α/2) na cauda superior da distribuição t 
com n-2 graus de liberdade. 
 
Exemplo 6: 
Suponha que se queira predizer a variação no corte (mm) quando a tensão é 200 volts. 
Neste caso, 
x* = 200 volts, e portanto, 
variação predita = 95,03 – (0,36 x 200) = 23,03 
e o intervalo de 95% confiança é: (α = 0,05 ⇒ 
2,
2
t
−nα
 = 2,042 (aproximado para n=30) ; 
n = 35 ; s = 0,2456) 
 
23,03 ± 2,042 x 0,2456 
6354,396
)7886,218200(
35
1
1
2−++ =[22,34;23,72] 
isto significa que você pode estar confiante 95% que a variação do corte (mm) quando a 
tensão é de 200 volts varia entre 22,34 e 23,72. 
 
Observação: Deve-se tomar cuidado quando estender uma reta de regressão ajustada para 
se fazer predições fora do intervalo de variação dos x, usados para ajustar a reta de 
regressão. Não somente o intervalo de predição começa a se tornar mais largo, tornando as 
previsões de pouca confiança, como o padrão da relação entre as variáveis pode mudar 
drasticamente para valores distantes de x. Os dados coletados não dão nenhuma indicação 
sobre a natureza desta mudança. 
 
 
 
( ) ( )( )
2n
xxyy x byy
s
n
1i
ii1
n
1i
2
i
2
−
−−−−
=
∑∑
−−
 
 
46
 
13.9 Diagnósticos Básicos em regressão 
 
Como determinar se um modelo representa adequadamente os dados? Como saber 
se mais termos devem ser adicionados ao modelo? Como identificar outliers, isto é, 
observações que não são típicas do restante da massa de dados? Estas são questões que 
podem ser respondidas examinando-se os resíduos do modelo ajustado, isto é, as diferenças 
entre os valores observados e preditos pelo modelo. 
Para que um modelo de regressão possa ser empregado como base para outros 
estudos, é necessário que as suposições feitas durante sua construção sejam válidas. Se 
algumas destas suposições não se confirmarem, o modelo poderá ser inadequado para fazer 
as inferências de interesse. Neste caso, deve ser procurado outro modelo mais adequado ou 
ser empregada outra abordagem para a análise do problema. 
As suposições que devem ter sua validade verificada são: 
• O relacionamento entre y e x é linear; 
• O erro ε tem média zero; 
• O erro ε tem variância constante; 
• Os erros são não correlacionados; 
• O erro ε tem distribuição normal. 
Diagnósticos básicos em regressão e ajuste de modelos são interdependentes. 
Primeiro um modelo é ajustado, e então se examina o modelo usando diagnósticos. Isso 
pode levar ao ajuste de um segundo modelo, o qual deve ser examinado por meio da análise 
dos resíduos. O processo continua até que se encontre um modelo que se ajuste bem aos 
dados. Note que é possível não se encontrar um modelo que represente adequadamente os 
dados. 
 
 Nesta seção serão discutidos métodos úteis para o estudo da adequação do modelo 
de regressão. 
 
13.9.1. Análise de Resíduos 
 
 Um resíduo é definido por: 
 
ei = yi - iŷ , i = 1,2,...,n 
 
em que yi é o valor observado e iŷ é o correspondente valor estimado por meio do modelo 
de regressão. 
 È conveniente visualizar os resíduos como valores observados para o erro ε que 
aparecem no modelo. Portanto, é razoável esperar que quaisquer desvios das suposições 
feitas sobre o erro poderão ser detectados se for realizada uma análise de resíduos. 
 
13.9.2. Gráficos dos Resíduos (ei) contra os Valores Preditos ( iŷ ) 
 
 Se o modelo tem todos os termos que precisa, então o gráfico dos resíduos contra os 
valores preditos ou contra as variáveis independentes deveria parecer como uma 
distribuição aleatória de pontos sem tendência (numa faixa horizontal). Se o modelo precisa 
 
 
de outros termos, então o gráfico dos resíduos tem um padrão que sugere que tipo de termo 
deveria ser adicionado ao modelo. Alguns padrões são mostrados na Figura 7 a seguir
 O padrão da figura 7a representa a situação satisfatória. Nela os resíduos estão 
situados, aproximadamente, em uma faixa horizontal centrada em e
e d da figura 7, indicam a presença de inadequações no modelo.
 
 
 
 
 
 
 O padrão apresentado na figura 7b, o qual é semelhante à forma de um funil, indica 
que a variância do erro não é constante. Nesta figura a variância do erro é uma função 
crescente de ŷ . No entanto também existem situações 
com o decréscimo de ŷ . 
 O padrão apresentado na figura 7c ocorre quando a variância dos erros é maior para 
valores intermediários de 
constante. 
 A figura 7d indica não linearidade. Este padrão pode indicar a necessidade da 
inclusão no modelo de um termo quadrático em x.
de outros termos, então o gráfico dos resíduos tem um padrão que sugere que tipo de termo 
deveria ser adicionado ao modelo. Alguns padrões são mostrados na Figura 7 a seguir
O padrão da figura 7a representa a situação satisfatória. Nela os resíduos estão 
situados, aproximadamente, em uma faixa horizontal centrada em ei = 0. Já os padrões b, c 
e d da figura 7, indicam a presença de inadequações no modelo. 
 
O padrão apresentado na figura 7b, o qual é semelhante à forma de um funil, indica 
que a variância do erro não é constante. Nesta figura a variância do erro é uma função 
. No entanto também existem situações em que a variância do erro aumenta 
O padrão apresentado na figura 7c ocorre quando a variância dos erros é maior para 
valores intermediários de y e, portanto, também indica que erros não têm variância 
A figura 7d indica não linearidade. Este padrão pode indicar a necessidade da 
inclusão no modelo de um termo quadrático em x. 
47
 
de outros termos, então o gráfico dos resíduos tem um padrão que sugere que tipo de termo 
deveria ser adicionado ao modelo. Alguns padrões são mostrados na Figura 7 a seguir. 
O padrão da figura 7a representa a situação satisfatória. Nela os resíduos estão 
= 0. Já os padrões b, c 
 
O padrão apresentado na figura 7b, o qual é semelhante à forma de um funil, indica 
que a variância do erro não é constante. Nesta figura a variância do erro é uma função 
iância do erro aumenta 
O padrão apresentado na figura 7c ocorre quando a variância dos erros é maior para 
e, portanto, também indica que erros não têm variância 
A figura 7d indica não linearidade. Este padrão pode indicar a necessidade da 
 
 
 Quando é detectado que a variância do erro não é constante um
problema consiste em realizar transformações na variância resposta para estabilizar a 
variância. 
 
13.9.3. Gráfico de Resíduos (e
 
 No caso do modelo de regressão linear simples, um gráfico dos
valores da variável preditora fornece o mesmo tipo de informação gerada pelo gráfico de 
resíduos contra os valores ajustados. A configuração dos gráficos e
corresponder a um dos quatro padrões gerais já apresentados na
que, nesta Figura, iŷ seja substituído por x
figura 7, após a substituição de 
 
13.9.4 Gráfico de Resíduos Contra o Tempo
 
 A validade da suposição de que erros não são correlacionados pode ser verificada 
por meio de um gráfico de resíduos contra o tempo ou ordem de coleta das observações. A 
presença de configurações especiais neste gr
correlacionados. As duasconfigurações apresentadas na Figura 8 a seguir indicam a 
presença de correlação entre os erros, que representam uma séria violação das suposições 
associadas ao modelo de regressão.
 
 
 
 
 
 
13.9.5 Gráfico de Probabilidade Normal para os Resíduos
 
A validade da suposição de normalidade pode ser verificada por meio do gráfico de 
probabilidade normal para os resíduos. A suposição de normalidade será considerada válida 
se os pontos do gráfico estiverem localizados, aproximadamente, ao longo de uma linha 
Quando é detectado que a variância do erro não é constante um
problema consiste em realizar transformações na variância resposta para estabilizar a 
.3. Gráfico de Resíduos (ei) Contra Valores da Variável Preditora (x
No caso do modelo de regressão linear simples, um gráfico dos
valores da variável preditora fornece o mesmo tipo de informação gerada pelo gráfico de 
resíduos contra os valores ajustados. A configuração dos gráficos e
corresponder a um dos quatro padrões gerais já apresentados na figura7, bastando para isso 
seja substituído por xi. A interpretação dos padrões representados na 
figura 7, após a substituição de iŷ por xi , é semelhante à já apresentada na seção anterior.
.4 Gráfico de Resíduos Contra o Tempo 
A validade da suposição de que erros não são correlacionados pode ser verificada 
por meio de um gráfico de resíduos contra o tempo ou ordem de coleta das observações. A 
presença de configurações especiais neste gráfico pode indicar que os erros são 
correlacionados. As duas configurações apresentadas na Figura 8 a seguir indicam a 
presença de correlação entre os erros, que representam uma séria violação das suposições 
associadas ao modelo de regressão. 
Gráfico de Probabilidade Normal para os Resíduos 
A validade da suposição de normalidade pode ser verificada por meio do gráfico de 
probabilidade normal para os resíduos. A suposição de normalidade será considerada válida 
estiverem localizados, aproximadamente, ao longo de uma linha 
48
 
Quando é detectado que a variância do erro não é constante uma solução para este 
problema consiste em realizar transformações na variância resposta para estabilizar a 
) Contra Valores da Variável Preditora (x)) 
No caso do modelo de regressão linear simples, um gráfico dos resíduos contra os 
valores da variável preditora fornece o mesmo tipo de informação gerada pelo gráfico de 
resíduos contra os valores ajustados. A configuração dos gráficos ei versus xi poderá 
figura7, bastando para isso 
. A interpretação dos padrões representados na 
, é semelhante à já apresentada na seção anterior. 
A validade da suposição de que erros não são correlacionados pode ser verificada 
por meio de um gráfico de resíduos contra o tempo ou ordem de coleta das observações. A 
áfico pode indicar que os erros são 
correlacionados. As duas configurações apresentadas na Figura 8 a seguir indicam a 
presença de correlação entre os erros, que representam uma séria violação das suposições 
 
A validade da suposição de normalidade pode ser verificada por meio do gráfico de 
probabilidade normal para os resíduos. A suposição de normalidade será considerada válida 
estiverem localizados, aproximadamente, ao longo de uma linha 
 
 
49
 
reta. Como esta avaliação é subjetiva, um teste estatístico pode ser utilizado para 
complementar esta avaliação. 
 
Exemplo 7: Vamos agora examinar os resíduos para o modelo linear simples ajustado para 
a variação no corte. 
 
 
 
Análise de Resíduos 
 
Gráfico de Probabilidade Normal 
 
 
 
 
 
Histograma 
 
 
 
0.40.30.20.10.0-0.1-0.2-0.3-0.4-0.5
.999
.99
.95
.80
.50
.20
.05
.01
.001
P
ro
ba
bi
lid
ad
e
Resíduos
0.500.250.00-0.25-0.50
10
5
0
Resíduos
F
re
qü
ên
ci
a
 
 
50
 
Resíduos versus valores ajustados 
 
 
 
 
Resíduos versus Ordem dos Dados 
 
 
O primeiro gráfico serve para verificar a suposição de normalidade dos resíduos. Este 
gráfico parece indicar que os resíduos seguem uma distribuição normal. 
 
O segundo gráfico é o histograma dos resíduos. 
 
O terceiro gráfico apresenta os valores preditos versus resíduos. O padrão deste gráfico é 
semelhante ao apresentado na figura 7d, o que indica a necessidade da inclusão no modelo 
de um termo quadrático em X. 
 
O quarto gráfico apresenta a ordem em que os valores foram observados versus resíduos 
(foi considerado que as observações estão listadas no exemplo 1 na ordem em que foram 
observadas). Pode-se notar que a relação entre os valores preditos e a ordem de observação 
é aleatória. 
1918171615
0.5
0.4
0.3
0.2
0.1
0.0
-0.1
-0.2
-0.3
-0.4
-0.5
Ajustado
Valor
R
es
íd
uo
35302520151050
0.5
0.4
0.3
0.2
0.1
0.0
-0.1
-0.2
-0.3
-0.4
-0.5
Observada
Ordem
R
es
íd
uo
 
 
51
 
7ª LISTA DE EXERCÍCIOS 
 
1) Uma indústria produz grandes quantidades de alumina (Al2O3 de elevado teor de pureza) 
para a fabricação de alumínio metálico. A matéria prima para a fabricação da alumina é a 
bauxita, um mineral com cerca de 55% de óxido de alumínio (Al2O3). 
No processo de produção da alumina, o teor da Na2O (óxido de sódio) ocluído no produto é 
um fator importante do ponto de vista da qualidade da alumina fabricada. O Na2O é uma 
impureza, e portanto é desejável que o seu teor na alumina seja o mais baixo possível. 
Com o objetivo de minimizar o teor da Na2O ocluído no produto durante a etapa de 
precipitação, um dos estágios do processo de produção da alumina, a indústria iniciou 
trabalhos para melhoria. 
Os técnicos da empresa sabiam que a razão Al2O3 / NaOH era um dos fatores responsáveis 
pelas variações no teor de Na2O da alumina. Nesta razão, o símbolo Al2O3 está 
representando a massa de óxido de alumínio proveniente da bauxita que entra no processo 
de produção, e o símbolo NaOH se refere à massa de hidróxido de sódio, um dos reagentes 
do processo, que é empregada na fabricação de alumina. 
Durante a etapa de observação do problema, para se conhecer melhor a relação entre estas 
duas variáveis (variável resposta: Na2O e variável preditora: Al2O3 / NaOH), os técnicos da 
indústria coletaram os dados apresentados na tabela abaixo. A partir destes dados, avaliar a 
relação linear entre essas duas variáveis. 
Tabela: Teor de Na2O ocluído na Alumina em Função da Razão Al2O3 / NaOH 
Índice Razão Al2O3 / NaOH 
– x 
Teor Na2O 
(%) – y 
x2 y2 xy Valores ajustados aF Resíduos c
 
1 0,645 0,46 0,416025 0,2116 0,2967 0,442743 0,0172575 
2 0,643 0,46 0,413449 0,2116 0,29578 0,434803 0,0251966 
3 0,648 0,45 0,419904 0,2025 0,2916 0,454651 -0,004651 
4 0,639 0,44 0,408321 0,1936 0,28116 0,418925 0,0210750 
5 0,641 0,45 0,410881 0,2025 0,28845 0,426864 0,0231358 
6 0,648 0,47 0,419904 0,2209 0,30456 0,454651 0,0153487 
7 0,635 0,42 0,403225 0,1764 0,2667 0,403047 0,0169533 
8 0,646 0,47 0,417316 0,2209 0,30362 0,446712 0,0232879 
9 0,646 0,45 0,417316 0,2025 0,2907 0,446712 0,0032879 
10 0,643 0,44 0,413449 0,1936 0,28292 0,434803 0,0051966 
11 0,641 0,4 0,410881 0,16 0,2564 0,426864 -0,026864 
12 0,643 0,42 0,413449 0,1764 0,27006 0,434803 -0,014803 
13 0,637 0,42 0,405769 0,1764 0,26754 0,410986 0,0090142 
14 0,635 0,42 0,403225 0,1764 0,2667 0,403047 0,0169533 
15 0,64 0,41 0,4096 0,1681 0,2624 0,422895 -0,012894 
16 0,646 0,43 0,417316 0,1849 0,27778 0,446712 -0,016712 
17 0,636 0,41 0,404496 0,1681 0,26076 0,407016 0,0029837 
18 0,639 0,4 0,408321 0,16 0,2556 0,418925 -0,018925 
19 0,634 0,39 0,401956 0,1521 0,24726 0,399077 -0,009077 
20 0,636 0,38 0,404496 0,1444 0,24168 0,407016 -0,027016 
21 0,643 0,4 0,413449 0,16 0,2572 0,434803 -0,034803 
22 0,647 0,43 0,418609 0,1849 0,27821 0,450682 -0,020681 
23 0,637 0,42 0,405769 0,1764 0,26754 0,410986 0,0090142 
24 0,631 0,37 0,398161 0,1369 0,23347 0,387168 -0,017168 
25 0.633 0.41 0,400689 0,1681 0,25953 0.395107 0.0148925 
Total 16.012 10.62 10,25598 4,5292 6,80432 
 
 
52
 
Resp.: r = 0,7321 
 
Teor Na2O (%) = - 2.12 + 3.97 Razão Al2O3 / NaOH 
 
Figura: Diagrama de Dispersão: Teorde Na2O ocluído na Alumina em Função da Razão 
Al 2O3 / NaOH 
 
 
 
 
 
 
 
0
0,1
0,2
0,3
0,4
0,5
0,63 0,635 0,64 0,645 0,65
252015105
0.03
0.02
0.01
0.00
-0.01
-0.02
-0.03
-0.04
Ordem das Observa ões
R
es
íd
uo
s
Ordenadas 
Residuos Versus Observa ões
 
0.4550.4450.4350.4250.4150.4050.3950.385
0.03
0.02
0.01
0.00
-0.01
-0.02
-0.03
-0.04
Ajustado
Valor
R
es
íd
uo
s
Resíduos Versus Valores Ajustados
 
Na2O 
Al 2O3 / NaOH 
 
 
53
 
 
 
2) Uma empresa localizada na cidade de São Paulo, produtora de pneumáticos, possui uma 
rede distribuidora por todo o interior do Estado. Realizou um estudo para determinar qual a 
função que ligava o preço do produto e a distância do mercado consumidor da cidade de 
São Paulo. Os dados são os seguintes: 
Preço 36 48 50 70 42 58 91 69 
Distância (Km) 50 240 150 350 100 175 485 335 
a) Calcule o coeficiente de correlação; r = 0,959 
b) Estimar a reta de regressão; P = 30,19 + 0,12D 
c) Calcule um intervalo de confiança para o preço quando a distância é 250Km. 
d) A empresa tem uma filial no Rio de Janeiro e o preço de venda do pneumático lá 
produzido, na cidade B, é de R$160,00. Sabendo-se que a distância entre São Paulo e a 
cidade B é de 250 km, pergunta-se qual produto deve ser vendido: o produzido no Rio 
de Janeiro ou o fabricado em São Paulo. 
Resp.: São Paulo 
 
3) Suponhamos que uma cadeia de supermercados tenha financiado um estudo dos gastos 
com mercadoria para famílias de 4 pessoas. A investigação se limitou a famílias com renda 
líquida entre $8.000 e $20.000. Obteve-se a seguinte equação: 
Y = -200 + 0,10X 
em que: Y = despesa anual estimada com mercadorias 
X = renda líquida anual 
Suponha que a equação proporcione um ajustamento razoavelmente bom . 
a) estime a despesa de uma família de quatro com renda de $15.000. Resp.: 1.300,00 
b) um dos vice-presidentes da firma ficou intrigado com o fato de a equação aparentemente 
sugerir que uma família com $2.000 de renda não gaste nada em mercadorias. Qual a 
explicação? 
 
4) Os dados a seguir dão um custo líquido por real de prêmio (Y) e o tempo de apólice em 
meses (X). 
X 8 29 47 24 57 45 39 14 70 40 66 55 
Y 1,26 1,15 0,81 1,14 0,61 0,88 0,99 1,11 0,58 0,74 0,67 0,70 
 
0.0200.008-0.004-0.016-0.028-0.040
9
8
7
6
5
4
3
2
1
0
Resíduos
Fr
eq
üê
nc
ia
 
 
54
 
a) Estimar a reta de regressão; Y=1,35 -0,01X 
b) Calcule um intervalo de confiança de 95% de confiança para a inclinação β1. Baseado no 
intervalo, qual a conclusão sobre a relação linear entre x e y. 
 
Resp.: T−0,01 − 2,228 ∗ D�,��YZ �� D �&���,Z% ; −0,01 5 2,228 ∗ D�,��YZ �� D �&���,Z%U 
 
c) Construir um IC para o valor de um prêmio cuja apólice tem 3 anos; α = 5% 
( )
67,4225
17,4136
12
1
1 x 0,1167 x 228,299,0:.Re
2−++±sp 
 
 
Bibliografia: 
 
MONTGOMERY, Douglas C.; RUNGER, George C.; HUBELE, Norma Faris. Estatística 
aplicada à engenharia. Rio de Janeiro: LTC, 2004. 335 p. 
 
MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. 5. ed. São 
Paulo: Saraiva, 2006. 526 p. 
 
WERKEMA, Maria Cristina Catarino; AGUIAR, Silvio. Analise de regressao: como 
entender o relacionamento entre as variaveis de um processo. Belo Horizonte, MG: 
UFMG. Escola de Engenheria, [1996]. 311 p. 
 
 
55
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
56