Buscar

Apostila Estatística Parte 1

Prévia do material em texto

FACULDADE DE TECNOLOGIA DE SOROCABA 
 
 
 
 
 
 
 
 
 
APOSTILA DE ESTATÍSTICA 
 
CURSO: ANÁLISE E DESENVOLVIMENTO DE 
SISTEMA 
 
PARTE II 
 
 
 
 
 
 
 
 Ao escrever esta Apostila não pretendi outra 
coisa, senão proporcionar aos alunos da disciplina ESTATÍSTICA , a facilidade 
de dispor de notas de aulas dos temas do Programa da Disciplina. 
 
O acompanhamento das aulas e a pesquisa em Bibliografia sobre o assunto, 
tornam-se necessárias para o adequado aproveitamento do curso. 
 
 
 
 
 
 
PROF. OSNI PAULA LEITE 
 
 
 
 
INTERFERÊNCIA ESTATÍSTICA 
 
 
1.0 CONFIABILIDADE DA AMOSTRA 
 
A estimativa do tamanho da amostra é um dos fatores determinantes para o sucesso de 
uma Pesquisa Estatística. Como já mencionado, o tamanho da amostra pode ser pequeno 
em relação à população geral. Ao longo do curso veremos formas especificas para o 
calculo da amostra mínima necessária para dar confiança aos resultados obtidos. 
Entretanto, existem dois fatores estatísticos que devem ser mantidos em mente: 
- Quanto maior o tamanho da amostra, mais precisas são as informações sobre a 
população; 
- Acima de determinado tamanho, poucas informações extras sobre a população 
podem ser obtidas, no entanto, os custos de tempo e dinheiro aumentam. 
 
 
1.1 PLANEJAMENTO DA AMOSTRA 
 
 
A amostragem ideal para todo o estudo estatístico e a Amostragem Aleatória. 
Em estatística, um planejamento da amostra e um plano definido, completamente antes 
da coleta de quaisquer dados e que tem por objetivo a obtenção de uma amostra de uma 
população. 
Os métodos mais usuais de amostragem já foram estudados no curso e são: 
- Amostragem Sistemática; 
- Amostragem Estratificada; 
- Amostragem por Conglomerados. 
 
1.2 ERROS PROVENIENTES DA AMOSTRAGEM 
 
Estes erros surgem do fato de a amostra não ser representativa em relação à população 
em questão. Eles geralmente são minimizados com a consideração cuidadosa do 
método de amostragem a ser utilizado. Com amostras Aleatórias, o tamanho desses 
erros de amostragem podem ser utilmente estimados e o método de cálculos veremos 
nos capítulos adiante. -94- 
 
 
1.3 ERROS NÃO PROVENIENTES DA AMOSTRAGEM 
 
Estes surgem devido a varias causas, incluindo: 
 
- Registros incorretos dos dados; 
- Transferência incorreta de dados para a calculadora ou computador para 
processamento; 
- Medições incorretas; 
- Perguntas mal projetadas; 
 
 
1.4 PLANEJAMENTO GERAL DA PESQUISA 
 
Para resumir, aqui temos uma lista de verificação das principais etapas do projeto de uma 
pesquisa: 
 
– Defina as metas da pesquisa; 
– Defina a população; 
– Identifique o esquema de Amostragem (definir a amostra e o tamanho que ela deve 
ter); 
– Decida que método de coleta de dados utilizar (questionário pessoal, entrevista, 
medições, etc); 
– Caso decida usar questionário, preparar um apropriado para entrevistas pessoais; 
– Selecione e treine qualquer pessoa envolvida no processo de coleta de dados. 
 
 
 
 
 
-95- 
 
 
 
 1.5 DISTRIBUIÇÕES AMOSTRAIS 
 
A distribuição Amostral é provavelmente o conceito mais fundamental da interferência 
estatística, e está relacionado com a idéia de variação aleatória que permite enfatizar a 
necessidade de medir a variabilidade de dados. 
Para ilustrar o conceito de distribuição amostral, vamos construir a da média de uma 
amostra aleatória de tamanho n=2 extraídas sem reposição, de uma população finita de 
tamanho N=5 cujos dados poderiam ser (3,5,7,9 e 11). 
Neste caso teremos: 
 
 
μ = 3 + 5 + 7 +9 +11 = 7 
 5 
 
e seu desvio padrão é: 
 
σ = √ (3 – 7)² + (5 - 7)²+ (7 - 7)²+(9 - 7)²+(11 - 7)² = √8 
 5 
 
Se tomarmos agora amostra n=2 neste caso temos 10 possibilidades, isto é, a 
combinação 5,2, ou seja, 5! = 10 
 2! 3! 
 
3 e 5 3 e 7 3 e 9 3 e 11 5 e 7 5 e 9 5 e 11 7 e 9 7 e 11 9 e 11 
e suas médias são: 
 
4 5 6 7 6 7 8 8 9 10 
 
Como cada amostra tem probabilidade 1/10, obtemos a seguinte Distribuição Amostral da 
Média: 
 Média X Probabilidade 
 4 1/10 
 5 1/10 
6 2/10 
7 2/10 
8 2/10 
9 1/10 
 10 1/10 
 
-96- 
 
 
Desta forma o Histograma da Distribuição das Probabilidades fica: 
 
 
 
y 
 
 
 
 2/10 
 
 1/10 1/10 
 
 X 
 
 
Observa-se que para X = 6, 7, 8 há uma probabilidade de 6/10 de uma Média Amostral 
não ser diferente de 1 da Média Populacional μ = 7. 
Também para média X = 5, 6, 7, 8 ou 9 há uma probabilidade de 8/10 de uma Média 
Amostral não ser diferente de 2 da Média Populacional μ = 7 
Assim, se não conhecêssemos a Média da População dada e quiséssemos estima-la com 
a média de uma Amostra Aleatória de tamanho n =2 o processo acima nos daria uma 
idéia do tamanho possível do erro envolvido. 
 
Para obtermos outras informações úteis sobre a distribuição Amostral da Média 
Calculamos : μ x e σ x . 
 
μ x = 4 + 5 + 6 + 6 + 7 + 7 + 8 + 8 + 9 + 10 = 7 
 10 
 
 σ x = (4 – 7)²+ (6 – 7)²+ (6 – 7)²+ (7 – 7)²+ (7 – 7)²+ (8 – 7)²+ (8 – 7)²+ (9 – 7)²+ (10 – 7)² 
 10 
 σ x = √ 3 
-97- 
 
 
1.6 ERRO PADRÃO DA MÉDIA 
 
Para amostras Aleatória de tamanho n extraídas de uma população com média μ e 
desvio padrão σ, a Distribuição Normal de x tem média: 
μ x = μ 
e o Desvio Padrão da Média 
 
σ x = σ ou σ x = σ x √ N -n 
 √n √n N -1 
 
Dependendo de a População ser Infinita ou Finita de Tamanho N, respectivamente. 
Costuma-se referir-se a σ como o Erro Padrão da Média, se: 
σ x e pequeno há uma boa chance que a Média da Amostra estar próximo da Média da 
População. 
σ x e Grande a Média Amostral e consideravelmente diferente da Média da População. 
O Fator √ N -n e chamado de fator de Correção para População Finita 
 N -1 
 
Exemplo 
Com referência ao exercício anterior, tínhamos n =2 e N =5 e σ = √ 8 verifique que a 
segunda das formulas de σ x da √3 
Fazendo n = 2 ,N = 5 e σ = √ 8 para formula para populações finitas temos: 
 
σ x = σ x √ N -n = √8 √5 – 2 = √ 8X3 = √ 3 
 √n N –1 √2 5 - 1 2X4 
-98- 
 
 
EXERCÍCIOS 
 
 
1- Qual e o valor do erro de correção para a população finita, Quando: 
 
a - n = 10 e N = 200 
b- n = 10 e N = 500 
c- n = 10 e N = 2000 
d- n = 20 e N = 200 
e- n = 40 e N = 400 
 f- n = 400 e N = 4000 
 
2- Uma população Finita de N = 6 números 6, 9, 12, 15, 18 e 21: 
 
 
a- Calcule a Média Populacional e o Desvio Padrão 
b- Relacione Quantas Amostras são possíveis se n = 2 (combinação 6,2) 
c- Montar todas as amostras possíveis e calcular os X 
d- Construa o Histograma da Distribuição Amostral da Média para amostras 
Aleatórias de tamanho n = 2 extraídas, sem reposição, dessa População 
Finita. 
e- Determine o Desvio Padrão da Distribuição Amostral da Média σ x . 
 
 
 
 
 
-99- 
 
 
 
1.7 TEOREMA CENTRAL DOLIMITE 
 
A capacidade de usar AMOSTRAS para se fazer interferências sobre parâmetros 
POPULACIONAIS depende do conhecimento da distribuição Amostral. 
 
Sabemos já calcular a média e o desvio padrão, mas temos também que saber a forma 
da Distribuição Amostral. 
Se temos uma distribuição A distribuição das médias também será normal para 
individual normal qualquer número de amostras 
 
Se a distribuição individual A distribuição das médias será normal para 
não e normal Amostras Grandes 
 
Isso significa que para qualquer distribuição individual, podemos sempre que tenhamos a 
distribuição normal com a única restrição que o tamanho da amostra seja grande, ou seja, 
acima de 30 amostras. 
Esses resultados são conhecidos como o Teorema Central do Limite. 
 
O TEOREMA CENTRAL DO LIMITE 
 
1- Se a população sob amostragem tem distribuição normal, a distribuição das médias 
também será normal para todos os tamanhos de amostras. 
2- Se a população básica não e normal, a distribuição das médias amostrais será 
aproximadamente normal para grandes amostras. 
 
Exemplo 1 Uma população muito grande tem média μ = 20 e desvio padrão σ = 1,4. 
Extrai-se uma amostra de 49 observações . 
 
Questões Resolvidas: 
 
A- Qual a média da Distribuição Amostral? 
A média da distribuição Amostral e sempre igual a média da população μ, logo μ x = 20. 
-100 - 
 
 
 A - Qual o desvio padrão da distribuição amostral? 
 
σ x = σx 1,4 = 1,4 = 0,2 
 √n √49 7 
 
 C - Qual a Percentagem das possíveis médias amostrais que diferirão por mais de 0,2 
da média da população ? 
 
Como n > 30, podemos supor que a distribuição e normal. 
 
TEMOS: 
σ x = 0,2 
μ x = 20 
Portanto a curva normal seria 
 
 
 
 
 
 
 
 
 
 μ x 
 μ x-3σ x μ x-2σ x μ x -σ x μ x+σ x μ x +2σ x μ x+ 3σ x 
 Z 
 Z1 Z2 
Z1 = 19,8 – 20 = - 0,2 = -1 Iz1= 0,3413 
 0,2 0,2 
 
Z1 = 20,2 – 20 = 0,2 = 1 Iz1= 0,3413 
 0,2 0,2 
 
IT= 0,5 – 0,3413 + 0,5 – 0,3413 0,1587 + 0,1587 = 0,3174 
Médias Inferiores a 19,8 e Superiores a 20,2 
-101 - 
 F (x) 
 
 
 
 
 
 
 
0,3413 
 
 
0,3413 
 
 
 
 
 
 
 
 
 
 
EXERCICIOS 
 
1- Um fabricante de baterias alega que seu artigo de primeira categoria tem uma vida 
esperada média de 50 meses. Sabe-se que o desvio padrão correspondente é de 4 
meses. Que percentagem da amostra de 36 observações acusara vida média no intervalo 
de 1 mês em torno de 50 meses, admitindo-se ser de 50 meses a verdadeira vida média 
das baterias? Qual será a reposta para uma amostra de 64 observações? 
 
2- Se se extrai uma amostra de uma distribuição normal, qual a probabilidade de a média 
amostral estar compreendida em cada intervalo? 
 
 a - μx ± 1,96 σx 
 b - μx ± 2,00 σx 
 c - μx ± 2,33 σx 
 
3- A média de uma distribuição amostral de médias e 50 e seu desvio padrão e de 10. 
Suponha normal a distribuição Amostral. 
 
 a - Que percentagem de médias amostrais estará entre 45 e 55? 
 b- Idem para 42,5 e 57,5 
 c - Que percentagem de médias amostrais será menor que a média populacional? 
 d - Que percentagem de médias amostrais será igual à média populacional? 
 
4- Determine a média da distribuição de médias amostrais, dada cada uma das seguintes 
médias populacionais: 
 
a- 5,01 
b- 199,5 
 -102 - 
 
 
 
5- Calcule o desvio padrão da distribuição amostral de médias para cada um dos casos 
seguintes: 
 
 a- σ x = 5,0 e n = 6 
 b- σ x = 6,2 e n = 100 
 c- σ x = 1,0 e n = 36 
 d- σ x = 3,2 e n = 44 
 e- σ x = 2,0 e n = 40 
 
6- Deve-se extrair uma amostra de 36 observações de uma máquina que cunha moedas 
comemorativas a espessura média das moedas e de 0,2 cm, com desvio padrão de 0,01 
cm. 
 
a- É preciso saber que a população é normal para determinar a percentagem de 
médias amostrais que estão dentro de certos intervalos? Explique. 
b- Que percentagem de médias amostrais estará no intervalo 0,20 ± 0,004 cm? 
c- Qual a probabilidade de se obter uma média amostral que se afaste por mais de 
0,005 cm da média do processo? 
 
 
 
 
 
 
 
 
 
 
 
 
 
-103 - 
 
 
2.0 ESTIMATIVAS E TAMANHO DE AMOSTRAS 
 
2.1 ASPECTOS GERAIS 
 
Quando decidimos usar métodos de Amostragem para checar a uma decisão sobre a 
variável investigada, devemos definir rigorosamente nossos conceitos e procedimentos. 
 
Em seguida, devemos assegurar que nossa “Amostra” reflita as características do 
agregado no máximo grau possível. 
 
A principal vantagem de se adotar seleção aleatória de amostras em investigação 
cientifica é a de que sabemos matematicamente alguma coisa sobre a natureza do 
comportamento destas Amostras Aleatórias. 
 
Do ponto de vista do Estatístico as amostras devem ser tão grandes quanto possíveis. 
Quanto maior è a amostra, maior é a confiança que se tem nos resultados. Para 
entender as razoes desse ponto de vista, imagine que em uma cidade existem dois 
hospitais. 
 
Em um deles nascem 120 bebes por dia e no outro 12. A razão de meninos e meninas é, 
em média, 50% nos dois hospitais. 
 
Uma vez nasceu, em um dos hospitais, duas vezes mais meninos do que meninas (67% 
meninos e 33% meninas). Em qual dos hospitais é provável que isso tenha ocorrido? É 
claro que foi no menor. 
 
A probabilidade de obter uma estimativa que se desvia muito do parâmetro aumenta 
quando a amostra for pequena. 
 
As amostras muito pequenas são inúteis por que não dão, em geral, boas estimativas. 
 
No entanto amostras muito grandes, porem mal feitas, são piores porque dão a ilusão de 
conter a verdade. 
-104 - 
 
 
2.2 ESTIMATIVAS DE UMA MÉDIA POPULACIONAL: GRANDES 
AMOSTRAS 
 
Em geral a média amostral x é a melhor estimativa de uma média populacional μ. 
 
Um estimador é uma estatística amostral (como a média amostral x) utilizada para obter 
uma aproximação de um parâmetro populacional. 
 
Uma estimativa è um valor especifico, ou um intervalo de valores, usado para 
aproximar um parâmetro populacional. 
 
Há duas razoes para explicar por que uma média amostral x tende a centrar-se em 
torno da média populacional μ. 
 
1- Para muitas populações, a distribuição de médias amostrais x tende a ser 
consistente (apresentar menor variação) do que as distribuições de outras 
estatísticas amostrais (mediana ou a moda). 
 
2- A média amostral x tende a centrar-se em torno da média Populacional μ. 
 
 x 1 x6 
 x 3 x5 
 x4 μ 
 x 2 x8 
 x7 
 
 
2.2.1INTERVALOS DE CONFIANÇA 
 
Quando usamos a média x para estimar a média populacional μ e fazemos uma 
estimativa pontual não temos qualquer indicação de quão boa e essa estimativa. Para 
isso foi desenvolvida outro tipo de estimativa, que efetivamente indica quão boa é uma 
estimativa pontual. 
-105 - 
 
 
 
Essa estimativa, chamada intervalo de confiança ou estimativa intervalar, consiste em 
uma amplitude (ou um intervalo) de valores, em lugar de um único valor. 
 
Um intervalo de confiança está associado a um grau de confiança que e a medida da 
nossa certeza de que o intervalo contem o parâmetro populacional. 
 
Para tanto usa a probabilidade α, que corresponde a área na curva normal, a qual pela 
simetria da curva divide-se em duas partes como aprece sombreada na curva abaixo: 
 
 
 
 
 
 
 
 
 
 
 α/2 z=0 α/2 
 
São escolhas comuns para o grau de confiança: 
90% (com α = 0,10) 
95% (com α = 0,05) 
99% (com α = 0,01) 
A opção mais comum e a opção 95% 
 
EXEMPLOS 
1- Ache os valores críticos z α/2 correspondentes aos graus de confiança: 
 90% 
 95% 
 99% 
-106 - 
 
 
 
 
 
 
 α 
 
 
 
 
 
 
 
 
 
 
90% α = 0,10 10% DE INCERTEZA 
 
α/2=0.05 
 
 
 
 
 
α/2=0,05 
 
 
 z=-1,645 z=0 z=1,645 
95% α = 0,05 5% DE INCERTEZA 
 
 
 
 
 
 
 α/2=0.025 α/2=0.025 
 
 
 z=-1,96 z=0 z=1,96 
99% α = 0,01 1% DE INCERTEZA 
 
 
 
 
 
α/2=0.005 
 α/2=0.005 
 
 
 z=-2,575 z=0 z=2,575 
-107 - 
 
 
 
 
 
 
 α 
 0,45 
 0,45 
 
 
 
 
 
 
 α/2=0.05 
 
 
 
 
 
 
 
 
 
 α 
 
 
 
0,475 0,475 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 α 
 
 0,495 0,495 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 z α/2 z=0 z α/2 
AREAS SIMETRICAS NAS CAUDAS 
AREA Z α/2 AREA Z α/2 AREA Z α/2 AREA Z α/2 
0,001 3,291 0,01 2,576 0,06 1,881 0,20 1,282 
0,002 3,090 0,02 2,326 0,07 1,812 0,30 1,036 
0,003 2,968 0,03 2,170 0,08 1,751 0,40 0,842 
0,004 2,878 0,04 2,054 0,09 1,695 0,50 0,674 
0,005 2,807 0,05 1,960 0,10 1,645 0,60 0,524 
 
Quando utilizamos dados amostrais para estimar uma média populacional μ, a margem 
de erro, denotada por E e a diferença máxima provável (com probabilidade 1-α) entre a 
média amostral observada é a verdadeira média populacional μ. 
E = erro máximo da estimativa 
FORMULA 
 
 
 E = Z α/2 x σ 
 √n 
 
 
Essa formula só pode ser usada quando conhecemos σ (Desvio padrão da população) 
-108 - 
 
 
 
 
 
 
 α 
 
 
 
 
 
 
 
 
 
 
Quando σ e desconhecido: 
 
Se n > 30, podemos substituir σ na fórmula acima pelo Desvio padrão Amostral S. 
 
Se n ≤ 30, a curva deve ser normal e devemos conhecer obrigatóriamente o σ para 
aplicar a formula. 
 
Adiante daremos uma outra solução quando n ≤ 30. 
 
Com base na definição da margem de erro E, podemos agora identificar o intervalo de 
confiança para a média populacional μ. 
 
Intervalo de confiança ( ou estimativa Intervalar) para a média populacional μ (com base 
em grandes amostras: n > 30). 
 
 
 X – E ≤ μ ≤ X - E 
 
 
 Onde E = Z α/2 x σ 
 √n 
RESUMO 
Processo de construção de um intervalo de confiança para a média μ (n > 30). 
1- Determinar o valor critico Z α/2 correspondente ao grau de confiança desejado. 
Exemplo: 95% Z α/2 = 1,96 
2- Calcular a margem de erro E = Z α/2 x σ se o desvio padrão da população 
 √n 
não é conhecido, utilizar o desvio padrão da amostra S, desde que n > 30. 
 
3- Com a margem de erro e o valor da média amostral X, calcular os valores X – E e X+ E 
Levar esses valores na expressão do intervalo de confiança. 
 X – E ≤ μ ≤ X – E 
 ±E 
Ou μ = X 
 
 
ou ( X – E ;X – E) 
-109 - 
 
 
EXERCÍCIO: 
 
1- Determine o intervalo de confiança 95% para a média populacional μ para os valores 
abaixo: 
 
 
 69,9 69,9 72,6 70,2 70,0 71,8 70,6 72,8 69,0 68,4 
 60,0 68,4 68,3 69,6 71,7 69,2 70,8 71,0 70,4 66,8 
 70,4 66,8 69,9 69,2 70,5 70,2 70,0 70,8 72,6 70,6 
 72,8 70,8 70,2 71,7 70,0 68,3 66,8 69,9 69,0 69,4 
 70,4 69,4 69,9 70,0 71,7 70,2 70,8 72,8 71,0 69,9 
 
2- Determine o valor critico de Z α/2 que corresponde ao grau de confiança indicado: 
a- 99% 
b- 94% 
c- 98% 
d- 92% 
e- 96% 
2- Use o grau de confiança e os valores amostrais dados para achar a margem de erro 
e o intervalo de confiança para a média populacional μ. 
 
a- Altura das alunas: 95% de confiança, n = 50, X = 164 S = 4,5 
b- Médias das notas: 99% de confiança, n = 70, X = 7,0 S = 0,88 
c- Notas de um teste: 90% de confiança, n = 150, X = 77,6 S = 14,6 
d- Salário da Policia: 92% de confiança, n = 64, X = R$ 1200,00 S = R$ 80,00 
 
 
3- A partir de uma amostra de 35 crânios de homens egípcios que viveram por volta de 
1850 AC mede-se a largura máxima de cada crânio, obtendo-se: 
 
X = 134,5 mm e S = 3,48 mm. Com esses dados amostrais construa um intervalo de 
95% de confiança para a média populacional μ. 
 
-110 - 
 
 
2.2.2 DETERMINAÇÃO DO TAMANHO DA AMOSTRA 
 
Suponha que estamos definindo um procedimento para uma pesquisacientifica. Como 
sabemos quantos elementos da população devem ser escolhidos? 
 
Suponha por exemplo, que queiramos estimar a renda média de pessoas que concluíram 
um curso superior, no primeiro ano após a formatura. Quantas rendas devemos incluir 
em nossa amostra? 
 
Partindo da expressão da margem de erro E e resolvendo em relação ao tamanho da 
amostra n temos: 
 
 2 
 n = Z α/2 x σ 
 E 
 
O número da amostra deve ser um número inteiro, quando isso não ocorre devemos 
arredondar usando o número inteiro mais próximo para cima. 
 
 EXEMPLO 
Um Economista deseja estimar a renda média para o primeiro ano de trabalho de um 
bacharel por uma faculdade, que teve a feliz idéia de fazer um curso de Estatística. 
Quantos valores de renda devem ser tomados, se o Economista deseja ter 95% de 
confiança que a média amostral esteja a menos de R$ 20,00 da verdadeira média 
Populacional? suponha que saibamos por um estudo prévio, que, para tais rendas o 
desvio padrão σ = R$ 100,00. 
 
SOLUÇÃO: Queremos determinar o tamanho da amostra “n” dado que α = 0,05 (95% de 
confiança). 
Desejamos que a média Amostral esteja a menos de R$ 20,00 da média populacional de 
forma que o Erro E = 20. Supondo que σ = R$ 100,00, aplicamos a Formula 
 
 2 2 
 n = Z α/2 x σ 1,96 x 100 = 96.04 ≈ 97 amostras 
 E 20 
-111 - 
 
 
Devemos, portanto, obter uma amostra de 97 rendas de primeiro ano, selecionadas 
aleatoriamente, de Bacharéis de Faculdades que tenham feito um curso de estatística. 
 
Com tal amostra teremos 95% de confiança em que a média amostral X difira em menos 
de R$ 20,00 da verdadeira média populacional, 
 
X – E < μ < X - E X – 20 < μ < X + 20 
 
 
Quando não conhecemos o valor de σ podemos estimar o valor a partir pelo menos de 31 
valores amostrais selecionando aleatoriamente em um estudo piloto, no caso anterior 
poderíamos encontrar o valor R$ 2300,00 como a maior renda e R$ 1900,00 como a 
menor renda, o σ pode ser estimado: 
 
 σ = RT σ = 400 = 100 
 4 4 
 
2.3 ESTIMATIVA DE UMA MÉDIA POPULACIONAL, PEQUENAS 
AMOSTRAS 
 
Agora veremos a estimativa da média populacional “μ” quando o tamanho “n” da m 
amostra é pequeno, ou seja, n ≤ 30. 
 
Neste caso: 
A melhor estimativa continua sendo a partir de X 
 Usaremos intervalo de confiança a partir da curva normal com a mesma margem de erro 
do capitulo anterior. 
 
Usaremos a distribuição t de Student 
 
 t = X - μ 
 S 
 √n 
-112 - 
 
 
O número de graus de liberdade para um conjunto de dados corresponde ao número de 
valores que podem variar apos terem sido impostas certas restrições a todos os valores. 
 
EXEMPLO 
Se 10 estudantes têm em um teste média 80, podemos atribuir valores arbitrários a nove 
delas, mas a décima fica determinada univocamente. 
A soma das 10 notas deve ser 800, de modo que a 10ª deve ser igual a 800 menos a 
soma das 9 primeiras. 
Como as nove primeiras podem ser escolhidas arbitrariamente, dizemos que há nove 
graus de liberdade (n – 1 ). 
 
Propriedades importantes da distribuição t de Student 
 
1- A distribuição t de Student é diferente, conforme o tamanho da amostra; 
2- A t de Student tem a mesma forma geral simétrica (forma de sino) que a 
distribuição normal, mas reflete a maior variabilidade que é esperada em 
pequenas amostras; 
3- A distribuição t de Student tem média t = 0 igual a distribuição normal 
padronizada que tem média Z = 0. 
4- O desvio padrão da distribuição t de Student varia com o tamanho da amostra 
”n” mas é superior a 1, ao contrário que a destruição normal onde σ = 1. 
5- À medida que aumenta o tamanho “n” da amostra a distribuição t de Student 
se aproxima mais e mais da distribuição normal Padronizada. 
 
Condições para o uso da distribuição t de Student 
 
1- O tamanho da amostra é pequeno (n ≤ 30) 
2- σ é desconhecido 
3- A população original tem distribuição Normal 
 
 
-113 - 
 
 
Margem de erro para a estimativa de μ para n ≤ 30 
 
E = t α/2 x S onde t α/2 tem n-1 graus de liberdade 
 √n 
 
Intervalo de confiança para estimativa de μ 
 
 X – E < μ < X - E 
 
Onde 
 
E = t α/2 x S 
 √n 
 
 
EXEMPLO: Testes Destrutivos 
 
O teste de colisão de carros é um exemplo muito dispendioso de teste 
destrutivo.Dificilmente pode-se fazer colidir mais de 30 carros, a fim de poder utilizar uma 
distribuição normal. 
 
Suponhamos que tenhamos feito teste de colisão de 12 carros de um tipo “A” cujo preço 
de venda seja R$ 59.000,00 sob diversas condições que simulam colisões típicas. 
 
A analise do 12 carros danificados resulta em custos de conserto que parecem ter 
distribuição em forma de sino com média de $ 26.000,00 e desvio padrão S= $ 15.000,00. 
Determine: 
 
a- A melhor estimativa da média populacional μ, do custo de conserto de cada carro 
danificado. 
 
b- A estimativa intervalar de 95% de μ. 
 
 
-114 - 
 
 
SOLUÇÃO: 
a- A melhor estimativa pontual de μ é o valor X neste caso $ 26.000,00. 
b- Usamos t de Student porque as condições básicas estão satisfeitas: 
 - n ≤ 30 n=12 
 - σ desconhecido porem conhecemos S= $ 15.000,00 
- A curva tem a forma de Sino 
Então: 
E = t α/2 x S 2,201 x 15000 = 9.530,61 
 √n √12 
 
 Podemos agora escrever a estimativa intervalar de 95% de confiança: 
 
 X – E < μ < X - E 
 
26.000 – 9.530,61 < μ < 26.000 + 9.530,61 
 
16.490 < μ < 35.530 
ou 
 ± 9.530 
26.000 
ou 
(16.490;35.530) 
 
Com base nesse resultado, temos 95% de confiança de que os limites 16.490 e 35.530 
contem o valor da média populacional μ. 
 
Esse exemplo é real e trata de um carro americano, dos mais caros para consertar em 
caso de colisão. 
 
Esta informação é de grande importância para as companhias de seguros. 
 
 
 
-115 - 
 
 
EXERCICIOS: 
 
1- Ache os valores críticos t α/2 que corresponde ao grau de confiança e ao 
tamanho da amostra “n” 
 
 a- 98% n=10 
b- 98% n=21 
c- 95% n=16 
d- 90% n=8 
 
2- Dados os graus de confiança e os elementos amostrais, determine: 
 I- Margem de erro 
 II-O intervalo de confiança para a média μ. Admita que a população tenha 
distribuição normal. 
a- Altura das alunas: 95% de confiança; n=10; X= 164; S= 4,5cm. 
b- Média das Notas: 99% de confiança; n=15; X= 7,0; S= 0,88. 
c- Notas de um teste: 90% de confiança; n= 16 X= 77,6; S= 14,2 
d- salário da Policia: 98% de confiança, n=19, X=R$1200,00; S= R$80,00 
 
3- Determine corretamente se os intervalos de confiança são calculados com a 
distribuição normal padronizada ou com a distribuição t de Student. Em 
teste de colisão feitos em 15 minivans Honda, os custos de conserto 
apresentam distribuição em forma de sino, com média de $ 1786 e desvio 
padrão de $937.Construa um intervalo de confiança de 99% para o custo 
médio de conserto para esse tipo de veiculo. 
 
4- Suponha que tenhamos apenas 10 temperaturas do corpo Humano, para 
esses valoresa média X = 98,44°F e S= 0,30°F. Construa um intervalo de 
confiança de 95% para a média de todas as temperaturas do corpo humano. 
Sabendo-se que essa distribuição é normal. 
 
 
-116 - 
 
 
2.4 ESTIMATIVA DE UMA PROPORCÃO POPULACIONAL 
 
Neste capitulo vamos abordar os mesmos três conceitos estudados nos capítulos 
anteriores. 
(1) Estimativa pontual 
(2) Intervalo de confiança 
(3) Determinação do tamanho da Amostra “n”. 
Nos capítulos anteriores aplicamos esses conceitos a estimativa de uma média 
populacional μ; neste capitulo vamos aplica-lo a Proporção Populacional “P”. 
 
EXEMPLO: 
Uma companhia de seguros poderia se interessar na estimativa da proporção de 
motoristas embriagados. 
 
Vamos trabalhar com a denominação p^ ( lê-se p chapéu) para a proporção amostral. 
Sabemos já que Q=1-P; podemos associar que Q^= 1-P^, desta forma: 
 
P= Proporção Populacional 
P^= proporção Amostral 
 
FORMULAS 
Estimativa Pontual 
A proporção Amostral P^ é a melhor estimativa pontual da proporção Populacional P. 
 
Margem de Erro da Estimativa P 
E= Z α/2 √ P^Q^ 
 n 
Intervalo de confiança (ou estimativa intervalar de uma proporção Populacional P) 
P^ - E < P < P^+E 
Eventualmente podemos dizer: 
 ±E 
P = P^ 
Ou ( P^- E; P^+E) 
 
-117 - 
 
 
EXEMPLO: 
Os pesquisadores de opinião publica são atormentados por uma diversidade de fatores de 
confusão, como secretárias eletrônicas. 
Em uma pesquisa junto a 1068 Americanos, 673 informaram ter secretaria eletrônica com 
esses resultados amostrais determine: 
a- A estimativa pontual da proporção populacional de todos os Americanos que 
possuem secretaria eletrônica. 
b- A estimativa intervalar 95% da proporção Populacional de todos os Americanos 
que tem secretaria eletrônica 
 
SOLUCAO: 
A- A estimativa pontual de P e: 
 
P^ = X = 673 = 0,630 
 n 1068 
Dai Q^= 1 – P^ 1 – 0,63 = 0,37 
 
B- A construção do intervalo de confiança exige primeiro o calculo da 
margem de erro E. 
E= Z α/2 √ P^Q^ 1,96 x √ 0,63 x 0,37 = 0,029 
 n 1068 
 
Podemos agora achar o intervalo de confiança usando P^= 0,63 e E= 0,029 
P^ - E < P < P^+E 
 
0,63 – 0,029 < P < 0,63 + 0,029 
 
0,601 < P < 0,659 ou 60,1% < P < 65,9% 
 
O resultado costuma ser apresentado da seguinte forma: 
 
Entre os Americanos, a percentagem dos que tem secretaria eletrônica e estimada em 
63%, com uma margem de erro de ± 2,9 pontos percentuais 
-118 - 
 
 
C- Determinação do tamanho da amostra 
 
Se E= Z α/2 √ P^Q^ 
 n 
Podemos definir: 
 
Quando se conhece uma estimativa de P^ 
 
 n = Z α/2 ² x P^ x Q^ 
 E² 
 
Quando não se conhece uma estimativa de P^ 
 
 n = Z α/2 ² x 0,25 
 E² 
 
EXEMPLO: As companhias de seguros estão preocupadas com o fato de que o número 
crescente de telefones celulares resulte em um maior número de colisões de veículos. 
Então, por isso, estão pensando em cobrar um prêmio maior para motoristas que usam 
celulares. Desejamos estimar com uma margem de erro de três pontos percentuais 3%, a 
percentagem de motoristas que falam ao celular enquanto estão dirigindo. Supondo que 
se pretende um nível de confiança de 95% nos resultados, Quantos motoristas devem 
ser pesquisados? 
 
A- Suponha que tenhamos uma estimativa de P^ com base em estudos anteriores que 
mostrou que 18% dos motoristas falam ao telefone dirigindo. 
B- Suponha que não tenhamos qualquer informação que possa sugerir um valor de P^ 
 
a- P^= 0,18 Q^ = 0,82 
 
Ao nível de 95% Z α/2 = 1,96 
Margem de erro 3% 0,03 
n = Z α/2 x P^x Q^ 1,96² x 0,18 x 0,82 = 631 (arredondado para cima) 
 E² 0,03² 
-119 - 
 
 
b- Quando não sabemos P^ usamos P^xQ^= 0,25 
 
n = Z α/2 x 0,25 1,96² x 0,25 = 1068 (arredondado para cima) 
 E² 0,03² 
 
No caso da pesquisa eleitoral Determine o tamanho da amostra necessária para saber a 
preferência do eleitorado com um nível de confiança de 95% e admitindo um erro de mais 
ou menos 2,2 pontos percentuais. 
 
SOLUÇÃO: 
 
Como desconhecemos as proporções P^ dos candidatos usamos a fórmula: 
 
n = Z α/2 x 0,25 1,96² x 0,25 = 1985 (arredondado para cima) 
 E² 0,022² 
 
a- Calcular o mesmo exercício para um nível de confiança de 99% com margem de 
erro de ± 2 pontos percentuais. 
 
b- Calcular o mesmo exercício para um nível de confiança de 90% com margem de 
erro de ± 2 pontos percentuais. 
 
 
Note que essas fórmulas não incluem o tamanho da população N, neste caso e 
irrelevante. 
 
A maioria das pesquisas de opinião apresentadas em jornais, revistas e tv envolvem 
amostras com tamanho de 1000 a 2000 elementos. 
 
 
 
 
-120 - 
 
 
 
EXERCICIOS: 
1- Usando uma amostra para estimar uma proporção populacional P. Determine a 
margem de erro que corresponde aos valores dados n, X, e o grau de confiança: 
 
 a- n= 800 X=600 grau de confiança 95% 
 b- n= 4275 X=2576 grau de confiança 98% 
 c- n= 1400 X=420 grau de confiança 99% 
 d- n= 887 X=209 grau de confiança 90% 
 
2- Utilize os dados amostrais e o grau de confiança para construir uma estimativa 
intervalar para a proporção populacional P: 
 
 a- n= 800 X=600 grau de confiança 95% 
 b- n= 2000 X=300 grau de confiança 99% 
 c- n= 2475 X=992 grau de confiança 90% 
 d- n= 5200 X=1024 grau de confiança 98% 
 
3- Utilize os dados abaixo para determinar o tamanho da amostra necessária para estimar 
uma proporção ou percentagem populacional? 
 
a- Margem de erro 0,02, nível de confiança 95% P^ e Q^ desconhecidos. 
 
b- Margem de erro 0,01, nível de confiança 90% P^ e Q^ desconhecidos 
 
c- Margem de erro 4 pontos percentuais, nível de confiança 99%, P^ estimado em 0,20 
com base em estudos anteriores. 
 
d- Margem de erro 2 pontos percentuais, nível de confiança 97%, P^ estimado em 0,85 
com base em estudos anteriores. 
 
4- A Itaú seguros deseja estimar a percentagem dos motoristas que trocam fita ou CD 
enquanto dirigem, uma amostra de 850 motoristas acusou 544 que trocam fitas ou CD 
quando dirigem. 
-121 - 
 
 
a- Determine a estimativa pontual da percentagem de todos os motoristas que 
trocam fitas ou Cd quando dirigem. 
b- Determine uma estimativa intervalar de 90% da percentagem de todos os 
motoristas que trocam fitas ou Cd. 
 
5- Selecionados aleatoriamente e pesquisados 500 estudantes universitários verificou/se 
que 135 deles tem computadores pessoais. 
 
A- Determine a estimativa pontual da verdadeira proporção populacional de 
todos os universitários que tem computador pessoal. 
B- Determine um intervalo de confiança de 95% para a verdadeira proporção 
de todos os universitários que tem computador pessoal. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
-121 - 
 
 
2.5 ESTIMATIVA DE UMA VARIANÇA POPULACIONAL 
 
Neste capitulomantendo a linha de estudos dos capítulos anteriores usaremos agora a 
VARIANCA Populacional σ², uo ao desvio padrão σ. 
Para isso usaremos a distribuição Qui-Quadrado 
 
Χ ² = (n – 1) S ² 
 σ ² 
n= Tamanho da Amostra 
S ² = Variança Amostral 
σ ² = Variança da população 
Denotamos Qui-Quadrado por Χ ². 
 
Para achar os valores críticos dos valores Qui-Quadrado recorremos à Tabela 1 a seguir. 
A distribuição Qui-Quadrado e determinada pelo número de graus de liberdade< neste 
capitulo utilizamos (n-1) graus de liberdade. 
 
Propriedades da distribuição da estatística Qui-Quadrado. 
 
1- A distribuição Qui-Quadrado não e simétrica ao contrario das distribuições Normal 
e t de Student. Na medida que aumenta o número de graus de liberdade, a 
distribuição vai se tornando menos assimétrica. 
 
 
 
 GL=10 
 
 
 
 GL=20 
 
 
 
 5 10 15 20 25 30 40 45 
-122 - 
 
 
2- Os valores podem ser zero ou positivos nunca negativos. 
 
3- A uma distribuição Qui-Quadrado diferente para cada número de graus de 
liberdade. À medida que eles aumentam a distribuição tende à Normal. 
 
Tabela 1 Cada valor critico Χ ² corresponde a uma área dada na linhá superior da Tabela, 
e essa área representa a região total localizada a direita do valor critico. 
 
EXEMPLO: Determine os valores críticos de Χ² que definem regiões criticas contendo 
uma área de 0,025 em cada cauda. Suponhá que o tamanho da amostra seja 10, de 
modo que o número de graus de liberdade é 10-1= 9. 
 
solução: Conforme a figura abaixo, obtem-se o valor critico à direita (Χ² = 19,023) 
diretamente, localizando 9 na coluna de graus de liberdade a Esquerda e 0,025 na parte 
superior. O valor critico Χ² = 2,70 a esquerda mais uma vez correspondente a 9 na coluna 
de graus de liberdade mas devemos localizar 0,975 (1- 0,025) na parte superior, por que 
os valores no topo são sempre áreas à direita do valor critico. Verifique na figura abaixo, 
que a área total a direita de Χ ² = 2,70 e 0,975. 
 
 
 
 
 
 0,025 
 
 
 0,025 
 
 
 Χ²L=2,7 Χ²R =19,023 
Este valor corresponde na coluna Este valor corresponde na coluna 
esquerda 9 graus de liberdade esquerda 9 graus de liberdade e 
 e 0,975 na linhá superior 0,025 na linhá superior. 
 Χ² (GL=9) 
-123 - 
 
 
Estimadores de σ² 
 
A variança Amostral S² e a melhor estimativa pontual da variança populacional σ². 
Embora S² seja a melhor estimativa de σ² não podemos avaliar quão boa e essa 
estimativa, portanto estabelecemos uma estimativa intervalar mais reveladora. 
 
Intervalo de confiança (ou estimativa Intervalar) para a variança populacional σ². 
 
(n-1) σ² < σ² < n-1) σ² 
 Χ²R Χ²L 
 
 Dessa expressão deferimos a estimativa Intervalar para o desvio padrão Populacional 
através da raiz quadrada de cada componente. 
 
 √ (n-1) σ² < σ < √ n-1) σ² 
 Χ²R Χ²L 
 
 Com uma área total α dividida igualmente entre as extremidades de uma distribuição 
Qui-Quadrado, Χ²L denota o valor critico da extrema esquerda e Χ²R denota o valor critico 
da extrema direita. 
 
Outra conotação: 
 
Χ²L= Χ 1 - α/2 
Χ²R = Χ α/2 
 
EXEMPLO: 
 
Uma confeitaria fabrica bombons que são embalados em pacotes com 12 unidades 
pesando no total 420 g. Se a variação dos bombons e muito grande, algumas caixas terão 
peso a menos (prejudicando o consumidor) e outras terão peso a mais (diminuindo o 
lucro). Este problema pode ser evitado se os bombons tiverem um peso médio de 35 
gramas e um desvio padrão de 0,60 gramas ou menos. Selecionam-se aleatoriamente, na 
linhá de produção, doze bombons que são pesados, dando os resultados a seguir: 
 35,8 35,0 36,8 36,1 34,2 35,2 36,6 35,0 33,6 34,2 
-124 - 
 
 
Construa dois intervalos de confiança de 95%, um para σ² e outro para σ, e determine 
se o processo esta com problemas. 
 
Calcula-se: 
X = 35,25 σ n-1 = 1,070 superior ao desejado 0,60. 
Passamos a construção do intervalo de confiança de σ² 
Com uma amostra de 10 valores, temos 9 graus de liberdade. Com o grau de confiança 
de 95%, dividimos α = 0,05 igualmente entre as duas caudas de distribuição Χ² e 
localizamos os valores 0,975 e 0,25 na linhá superior. Os valores críticos de Χ²R e Χ²L 
na tabela são: 
Χ²L = 2,70 
Χ²R = 19,023 
X = 35,25 
σ n-1 = 1,070 
n = 10 
Aplicamos a fórmula 
 
(n-1) σ² < σ² < n-1) σ² 
 Χ²R Χ²L 
 
(10 –1) 1,07² < σ² < (10 –1) 1,07² 
 19,023 2,70 
 
 0,5416 < σ² < 3,816 
ou 
 0,736 < σ < 1,953 
Com base nesses resultados parece que o desvio padrão populacional e sempre superior 
ao desejado σ= 0,60 mostrando que o peso dos bombons deve ser mais consistente. 
Deve-se controlar melhor o processo. 
 
-125 - 
 
 
EXERCICIOS: 
 
1- Ache os valores críticos Χ²L e Χ²R que correspondem ao grau de confiança e ao 
tamanho da amostra dados: 
 
a- 95% n = 26 
b- 90% n = 60 
a- 99% n = 17 
a- 95% n = 50 
 
2- Use o grau de confiança e os dados amostrais indicados para achár um intervalo de 
confiança para o desvio padrão populacional σ. Em cada caso admita que a população 
tenhá distribuição normal. 
 
a- Altura das alunas: 95% de confiança, n = 10, X = 164 S = 4,5 
b- Médias das notas: 99% de confiança, n = 15, X = 7,0 S = 0,88 
c- Notas de um teste: 95% de confiança, n = 16, X = 77,6 S = 14,2 
 d- salário da Policia: 92% de confiança, n = 19, X = R$ 1200,00 S= R$ 80,00 
 
3- Suponhá uma pesquisa na Uniso junto aos formandos do curso de Administração, 
sobre o tempo gasto para se formarem. A média é de 5,15 anos e o desvio padrão 1,68 
anos, Suponhá que a amostra seja 100 alunos. Com base nesses dados amostrais, 
construa o intervalo de 99% de confiança para o desvio padrão do tempo gasto por todos 
os formandos? 
 
 
 
-126 - 
 
 
 Bibliografia 
 Bibliografia básica 
FREUND, John E. e SIMON, Gary A. Estatística aplicada –economia, administração e 
contabilidade. Porto Alegre: Bookman, 2000. 
TRIOLA, Mário F. Introdução à estatística. Rio de Janeiro: LTC, 1999. 
 
 Bibliografia complementar 
KUME, Hitoshi, Métodos Estatísticos para a Melhoria da Qualidade. São 
Paulo:Gente,1993. 
RAMOS A.W., CEP para Processos Contínuos e em Bateladas. São 
Paulo:E.Blucher, 2000. 
BUSSAB, Wilton O e MORETTIN, Pedro A. Estatística básica. São Paulo: 
Saraiva,2002. 
DOWNING Douglas e CLARK Jeffrey. Estatística aplicada. São Paulo: Saraiva, 2000. 
MILONE, Giuseppe e ANGELINI, Flávio. Estatística aplicada. São Paulo: Atlas, 1995. 
KAZMIER, L.B. Estatística aplicada à Economia e à Administração. São Paulo: 
McGraw-Hill, 1982. 
SPIEGEL, Murray R. Estatística. São Paulo: Makron Books, 1993. (519.5 S734e) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
-127 -

Continue navegando