Apostila de Estatistica Geral e Aplicada
228 pág.

Apostila de Estatistica Geral e Aplicada


DisciplinaIntrodução à Estatística251 materiais2.032 seguidores
Pré-visualização50 páginas
realiza uma pesquisa em uma universidade pode usar estudantes voluntários para 
construir uma amostra simplesmente porque eles estão disponíveis e participarão como indivíduos por um 
pequeno custo ou sem custo algum, ou seja, se um professor está usando alunos de sua classe (são os 
alunos que estão ao seu alcance) como amostra de toda a universidade está usando uma amostra de 
conveniência. Por exemplo, se ele quiser fazer uma pesquisa sobre pessoas canhotas. 
 
 
 
c) Pesquisa com pessoas que moram no mesmo edifício em que o pesquisador mora, ou que façam 
compras no mesmo supermercado, ou que talvez residam no mesmo bairro. 
 
 
 
d) Um inspetor pode amostrar o embarque de laranjas selecionando as laranjas a esmo entre vários 
engradados. Rotular cada laranja e usar o método de probabilidade de amostragem seria impraticável. 
 
 
 
e) Exemplo prático: Um(a) nutricionista que entrevistar 50 mães de crianças com idade de 3 a 4 anos para 
conhecer os hábitos alimentares dessas crianças. Como obteria essa amostra? 
 
 
Solução: Se o(a) nutricionista trabalha em uma escola, para obter essa amostra, provavelmente procurará as 
mães de crianças matriculadas nessa escola. 
 
 
 
UM ALERTA: Se uma emissora de TV quiser fazer uma pesquisa com os espectadores que liguem para um 
número de telefone \u201c0800\u201d para registrar suas opiniões, poderia ser muito conveniente (e talvez até lucrativo), 
mas essa pesquisa seria autosselecionada e os resultados seriam provavelmente tendenciosos. 
 
IMPORTANTE: A recomendação para que os resultados da amostra se aproximem das características da 
população em estudo, é que sejam utilizados os métodos da amostragem probabilística, pois uma amostragem de 
excelência não pode ser feita com base em amostragem de conveniência ou de julgamento. Assim, deve-se 
tomar muito cuidado na interpretação dos resultados quando métodos de amostragem não probabilística são 
usados. 
 
ERRO AMOSTRAL: Um erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado 
populacional, sendo que tais erros resultam de flutuações amostrais aleatórias. 
 
 
 132
 
 
D i s t r i b u i ç ã o a m o s t r a l 
 
 
 
Uma distribuição amostral é uma distribuição de probabilidades que indica até que ponto uma estatística 
amostral tende a variar devido a variações casuais na amostragem aleatória. 
Na prática, as distribuições amostrais são deduzidas matematicamente e colocadas à disposição dos 
analistas sob forma de tabelas e gráficos. Duas das distribuições amostrais mais usadas são a binomial e a 
normal (de GAUSS). 
 
Um fato importante é que a média da distribuição amostral é igual a média populacional. 
 
Exemplo: Este fato ilustra bem o caso: Seja uma população composta de 3 valores (por exemplo, preços de um 
certo produto): 2, 3 e 7. A distribuição amostral se compõe de todas as amostras possíveis. Considerando todas 
as amostras de dois valores, as combinações são: 2 e 3, 2 e 7, 3 e 7, cujas médias amostrais são: 
5,2
2
5
2
32
11 =\u21d2=
+
= mm ; 5,4
2
9
2
72
22 =\u21d2=
+
= mm e 5
2
10
2
73
33 =\u21d2=
+
= mm 
Assim, a média das três médias amostrais é: 4
3
55,45,2
3
321
=\u21d2
++
=
++
= m
mmm
m 
E a média da população é: 4
3
12
3
732
=\u21d2=
++
= MM 
Portanto, a média da distribuição amostral (ou valor esperado) = média da população. 
 
 
Observação: Se tivermos uma amostra de 4 elementos, por exemplo, 7, 10, 9 e 6, a média populacional será 
igual a 8 e a média das médias para todas as amostras com 2 elementos também será igual a 8, o mesmo 
acontecendo para as amostras com 3 elementos. Verifique! 
 
 
 
 
 
E S T I M A Ç Ã O 
 
 
 
Um dos principais objetivos da inferência estatística consiste em estimar os valores das características da 
população com base nas características obtidas por meio de amostras (aleatórias). 
Dois são os principais problemas que a inferência estatística envolve: a estimação e o teste de hipóteses ou 
teste de significância (será visto mais adiante). 
A estimação é o processo que consiste em utilizar dados amostrais para estimar parâmetros populacionais 
desconhecidos. Esses parâmetros são: a média, o desvio padrão e a proporção populacional (em 
porcentagem). 
I n t e r v a l o s d e c o n f i a n ç a 
 
 
 
Um intervalo de confiança (ou estimativa intervalar) está associado a um grau de confiança (ou nível de 
confiança ou coeficiente de confiança) que é uma medida de nossa certeza de que o intervalo contém o 
parâmetro populacional. 
Se tomarmos uma amostra dos preços de certa mercadoria e a média for R$ 45,21, a nossa dúvida é a 
seguinte: Será que a nossa média (amostral) está muito próxima ou muito afastada da média da população? 
Como nunca saberemos ao certo, devemos contentar-nos com uma atribuição probabilística dada pelos 
intervalos de confiança. 
 
T i p o s d e e s t i m a t i v a s 
 
 
 
a) Estimativa por pontos \u2013 quando é dada por um número único, isto é, por um único parâmetro populacional. 
 
 
Obs.: A média amostral m é a melhor estimativa pontual da média populacional M. 
 
 
b) Estimativa por intervalos \u2013 ocorre quando é dada por dois números, entre os quais pode-se considerar 
que ele esteja situado. 
 
Exemplo: Se afirmarmos que o preço de certa mercadoria é de R$ 80,00, estamos fazendo uma estimativa por 
pontos. Agora, se dissermos que o preço é de R$ 80,00 ± R$ 5,00, ou seja, que o preço compreendido entre R$ 
75,00 e R$ 85,00, temos uma estimativa por intervalo (isto é, dada por dois números). 
 
 
 133
 
 
E S T I M A T I V A D E U M A M É D I A P O P U L A C I O N A L 
 
 
 
 
 
 
O método usado para estimar a média de uma população depende de sabermos se o desvio padrão da 
população é conhecido ou se deve ser estimado nos dados amostrais. 
 
 
Lembremos do fato de que se a amostra aumenta de valores, temos duas consequências: a média amostral 
se aproxima da média populacional e o desvio padrão da distribuição amostral diminui. 
 
 
 
1º Caso: Estimativa da média quando o desvio padrão populacional é CONHECIDO: 
 
 
 
 
(A) Estimativa pontual da média: m (é o próprio valor da média amostral) 
 
 
 
 
(B) Estimativa intervalar da média: 
 
 
 
 
O intervalo de confiança da média populacional é dado pela fórmula: 
 
 
 
 
n
zm
\u3c3
\u22c5±
 ( I ) 
 
 
 
onde 
m = média amostral 
z = coeficiente de confiança desejado para \u221d\u221d\u221d\u221d% (valor dado pela Tabela 1) 
\u3c3 = desvio padrão populacional (ou estimativa) 
n = nº de dados (preços) da amostra, isto é, tamanho da amostra 
 
 
 
 
 Intervalo de confiança 
 
 
n
zm
\u3c3
\u22c5\u2212
 
m
 
n
zm
\u3c3
\u22c5+
 
 
 
 
 
 
 
Assim, por exemplo, para uma confiança de \u221d\u221d\u221d\u221d = 95%, o intervalo de confiança para a verdadeira média 
populacional (M) será dado por: 
n
m
\u3c3
\u22c5± 96,1 . Isto significa que 95% das médias amostrais devem estar no 
intervalo de
n
m
\u3c3
\u22c5\u2212 96,1 a 
n
m
\u3c3
\u22c5+ 96,1 ,ou seja, esperamos que de cada 100 amostras do mesmo tipo, em 95 
amostras as médias caiam dentro desse intervalo, ou seja, só 5% das amostras tenham média fora desse 
intervalo. 
 
 
 
 
 
 
 
Observação: Devemos empregar este método para amostras com mais de 30 observações. 
 
 
 
 
Para 30 ou menos observações, a amostra deve ser considerada normal (ou aproximadamente normal). 
 
 
 
 
 
 
 134
 
 
IMPORTANTE: 
 
 
 
Para a determinação dos intervalos de confiança das médias populacionais, precisaremos utilizar os 
valores dos coeficientes z e t os quais são dados pelas Tabelas