Buscar

Apostila_Estatstica_Aplicada

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

ESTATÍSTICA 
APLICADA 
 
 
 
 
 
 
 
 
 
 
 
 
Profa. Dra. Angela Maria Pizzo 
 
 
 
 
 1
 2
 
 3
ESTATÍSTICA 
 
1 - INTRODUÇÃO: 
 
1.1 Definições: 
 
Definição 1: A Estatística trata dos métodos científicos para coleta, organização, descrição, análise 
e interpretação (conclusão) dos dados experimentais visando a tomada de decisões. 
 
“Estatística”, palavra de origem latina, significou por muito tempo “ciência dos negócios do 
Estado”. 
 A Estatística pode ser dividida basicamente em 3 etapas: 
 
- 1ª etapa: Coleta de dados a partir de uma amostra escolhida da população. Para esta 
primeira etapa estudaremos as técnicas de Amostragem. 
- 2ª etapa: Análise descritiva (ou Estatística Dedutiva), que envolve a parte de resumo e 
interpretação dos dados por meio de tabelas, gráficos e medidas descritivas 
(quantidades). 
- 3ª etapa: Escolha de um possível modelo explicativo para o comportamento do objeto 
em estudo, afim de se fazer, numa etapa posterior, a análise confirmatória dos dados, 
conhecida como inferência (ou Estatística Indutiva). Para esta última etapa, faz-se 
necessário a linguagem das probabilidades, para o esclarecimento de conclusões. 
 
Definição 2: Estatística Dedutiva trata da organização, sumário e apresentação gráfica dos dados. 
 
Definição 3: Estatística Indutiva consiste de métodos para tirar conclusões sobre uma população 
baseados em informações obtidas a partir de uma amostra da população. 
 
1.2 População e Amostra 
 
 Ao se coletar dados sobre as características de um conjunto de elementos, como por 
exemplo, os brinquedos produzidos por uma indústria, os carros que passam por um determinado 
farol ou as preferências da população sobre candidatos a uma determinada eleição, nem sempre é 
possível considerar todos os elementos, ou seja, toda a população ou universo. Considera-se, então, 
apenas uma pequena parte do todo, chamada amostra. No caso da eleição, a população é formada 
por todos os cidadãos com direito a voto e a amostra é formada pelos eleitores que serão 
entrevistados. 
 Para se coletar uma amostra é preciso usar técnicas eficientes denominadas Técnicas de 
Amostragem que veremos mais adiante. 
 
Definição 4: População: População estatística é a coleção completa e total dos elementos (pessoas, 
medidas, itens, etc.) a serem considerados em um estudo estatístico. 
 
Definição 5: Amostra: é um subconjunto de uma população de interesse. 
 
1.3 Variáveis: 
 
 A cada fenômeno corresponde um número de resultados possíveis. Assim por exemplo: 
- para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e feminino; 
- para o fenômeno “nº de filhos” há um nº de resultados possíveis expresso através dos 
números naturais: 0, 1, 2, 3, ... , n; 
- para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem 
tomar um nº infinito de valores numéricos dentro de um determinado intervalo. 
 
 4
Definição 6: Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. 
 
 Tipos de variáveis: - variável qualitativa (ou categórica); 
 - variável quantitativa (ou numérica). 
 
Definição 7: Variável qualitativa é quando seus valores são expressos por atributos, por exemplo: 
sexo (masculino – feminino), cor da pele ( branca, preta, amarela, vermelha, parda, etc.), tipo de 
sangue (A, B, AB, O), etc. 
 
Definição 8: Variável quantitativa é quando seus valores são expressos em números, por exemplo: 
salários dos operários, idade dos alunos de uma escola, peso, altura, nº de filhos por família, etc. 
 Tipos de variável quantitativa: - Discreta; 
 - Contínua. 
 
- Variável quantitativa discreta: é uma variável que só pode assumir valores pertencentes a 
um conjunto enumerável, ou seja, só assume valores inteiros. 
 
- Variável quantitativa contínua: é uma variável que pode assumir qualquer valor dentro 
de dois limites, ou seja, pode assumir valores “quebrados” (decimais). 
 
1ª LISTA DE EXERCÍCIOS DE ESTATÍSTICA 
 
1-) Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas) 
a-) cor dos olhos 
b-) número de filhos 
c-) o ponto obtido em uma jogada 
d-) número de peças produzidas por hora 
e-) diâmetro externo 
 
2-) Sugira uma população a cada uma das variáveis citadas no exercício 1. 
 
3-) Ligue as variáveis abaixo com sua possível população de interesse: 
Variáveis População 
a-) cor dos olhos 1-) aparelhos produzidos por uma linha de montagem 
b-) precipitação pluviométrica, (1 ano) 2-) seguimentos de reta 
c-) número de ações negociadas 3-) casais residentes em uma cidade 
d-) salários 4-) funcionários de uma empresa 
e-) tamanho 5-) estação meteorológica de uma cidade 
f-) sexo dos filhos 6-) alunos de uma escola 
g-) produção de algodão 7-) bolsa de valores de uma escola 
h-) comprimento 8-) pregos produzidos por uma máquina 
i-) número de volumes 9-) propriedades agrícolas do Brasil 
j-) número de defeitos por unidade 10-) bibliotecas da cidade de São Paulo 
 
Em relação as variáveis, diga quais são qualitativas, quantitativas discretas e quantitativas 
contínuas. 
4-) Defina com suas palavras: 
a-) Estatística 
b-) Variável, variável quantitativa e variável qualitativa 
c-) População 
d-) Amostra 
 
 5
2 – DISTRIBUIÇÃO POR FREQÜÊNCIAS 
 
Definição 9: Distribuição por freqüência é a tabela em que se resumem grandes quantidades de 
dados, determinando o nº de vezes que cada dado ocorre (freqüência) e a porcentagem com que 
aparece (freqüência relativa). 
 
Tipos de freqüência: 
 
- Freqüência absoluta ou simplesmente freqüência (F): é o nº de vezes que cada dado 
aparece na pesquisa. 
- Freqüência relativa ou percentual (Fr): é o cociente da freqüência absoluta pelo número 
total de dados. 
- Freqüência acumulada (Fa): é a soma de cada freqüência com as que lhe são anteriores 
na distribuição. 
 
Exemplo 1: Dada a tabela abaixo, defina qual é a variável em estudo e qual o tipo de variável. 
Depois, complete a tabela de distribuição de freqüências encontrando as freqüências relativa e 
acumulada. 
 
Distribuição de renda no Brasil - 1971 
Faixa de renda Habitações 
Até um salário mínimo 224.740 
De 1 a 3 salários mínimos 363.860 
De 4 a 8 salários mínimos 155.700 
Mais de 8 salários mínimos 47.500 
Total 791.800 
Fonte: Brasil em dados. Coutinho, M. T. e Cunha, S.E. 
Iniciação à Estatística. Belo Horizonte, 1979, p. 40 
 
Solução: 
 
 
 
 
 
 
 
 
 
 
2.1 Agrupamento em classes 
 
 Como vimos no exemplo 1, para representar a variável contínua “renda” foi necessário 
organizar os dados em classes. Portanto podemos dizer que a variável renda foi dividida em “4 
classes de freqüências”. 
 O agrupamento em classes acarreta uma perda de informações, uma vez que não é possível a 
volta aos dados originais a partir da tabela. Assim, quando necessitarmos de informações mais 
detalhadas sobre os dados da tabela, devemos usar algumas medidas obtidas a partir das classes de 
freqüências. São elas: 
 
- Limite inferior (Li): é o menor valor que a variável pode assumir em uma classe de 
freqüências; 
- Limite superior (Ls): é o maior valor que a variável pode assumir em uma classe de 
freqüências; 
- Ponto médio (Pm): o ponto médio de uma classe de freqüências é a média aritmética 
entre o Li e o Ls da mesma (classe), ou seja, 
2
LsLiPm += ; 
- Amplitude (h): é a diferença entre o Ls e o Li da classe, ou seja: h = Ls – Li; 
- Amplitude Total (ht): è a diferença entre o LS da última classe de freqüência com o LI 
da primeira classe, ou seja: ht = LS – LI. 
 
Exemplo: Considerando o exemplo 1, temos: 
 
 
 
 
 
 
 
 
 
 
2ª LISTA DE EXERCÍCIOS DE ESTATÍSTICA 
 
1-) A partir das idades dos alunos de uma escola, fazer uma distribuição por freqüência,agrupando 
os dados em classes e depois tire as informações: 
- ponto médio para cada classe; 
- amplitude para cada classe; 
- amplitude total. 
 
Idades (dados brutos) 
8 8 7 6 9 9 7 8 10 10 12 15 13 12 
11 11 9 7 8 6 5 10 6 9 8 6 7 11 9 
 
2-) Em uma escola tomou-se a medida da altura de cada um de quarenta estudantes, obtendo-se os 
seguintes dados (em centímetros): 
 
160 152 155 154 161 162 162 161 150 160 
163 156 162 161 161 171 160 170 156 164 
155 151 158 166 169 170 158 160 168 164 
163 167 157 152 178 165 156 155 153 155 
 Fazer a distribuição de freqüência e usar 6 classes. (iniciando por 150cm e terminando em 
180cm) e responder as questões abaixo: 
a-) Quantos são os estudantes com estatura inferior a 160cm? 
b-) Que porcentagem de estudantes tem estatura igual ou superior a 175cm? 
c-) Quantos são os estudantes com estatura maior ou igual a 160cm e ao mesmo tempo 
menor que 175cm? 
d-) Qual a porcentagem de estudantes com estatura abaixo de 170cm? 
 
 6
 7
3. MÉTODOS GRÁFICOS 
 
Objetivo: Facilitar a compreensão do fenômeno estatístico por meio do efeito visual imediato que 
lhe é próprio. 
 
3.1 Tipos de gráficos: Existem vários tipos de gráficos, os mais usados são: 
 
- Gráficos de linha; 
 
Diagramas de área: 
- Gráficos de coluna; 
- Gráficos de barras; 
- Gráficos de setores (ou gráfico de Pizza). 
 
Representação gráfica para as distribuições de freqüências: 
- Polígono de freqüências; 
- Histograma e 
- Ogiva. 
 
3.3.1 Gráficos de linha: Sempre que as categorias utilizadas representarem um intervalo de tempo, 
assim como sucede com os dados do exemplo 1 – Figura 1, os dados podem ser descritos também 
através de um gráfico de linha. Um gráfico de linha retrata as mudanças nas quantidades com 
respeito ao tempo através de uma série de segmentos de reta 
 
3.3.2 Gráfico (ou Diagrama) de barras (ou colunas): O diagrama de barras representa por meio 
de uma série de barras, quantidades ou freqüências para diferentes categorias de dados. (Ver 
Exemplo 1 – Figura 2) A diferença entre um diagrama de barras e um histograma é que o 
histograma refere-se sempre aos dados de uma distribuição de freqüências, enquanto o diagrama de 
barras ilustra quantidades para qualquer tipo de categorias. 
OBS: O gráfico de barras, quando as barras estão dispostas no sentido vertical, também é chamado 
de gráfico de colunas. 
 
3.3.3 Gráfico (ou Diagrama) de setores: O diagrama de setores, também conhecido como gráfico 
de Pizza, é uma gráfico particularmente apropriado para representar as divisões de um montante 
total. (Ver Exemplo 2 – Figura 3). 
 
3.3.4 Histograma: Um Histograma é um diagrama de barras de uma distribuição de freqüência com 
uma diferença: não há espaços entre as barras. Os intervalos de classe são colocados no eixo 
horizontal enquanto as freqüências são colocadas no eixo vertical. (Ver Exemplo 3 – Figura 4). 
 
3.3.5 Polígonos de Freqüência: O polígono de freqüência é um gráfico de linha de uma 
distribuição de freqüência. Os eixos de um Polígono de freqüência são similares ao do Histograma, 
exceto que no eixo horizontal são colocados os pontos médios de cada intervalo de classe. (Ver 
Exemplo 3 – Figura 5) 
 
3.3.6 Ogiva: Um Ogiva é um gráfico de uma distribuição de freqüência acumulada. (Ver Exemplo 
3 – Figura 6) 
 
Exemplo 1: De acordo com os dados dos censos demográficos do FIBGE, temos os seguintes 
dados, em termos percentuais, sobre o analfabetismo no Brasil: 
 
ANO 1872 1890 1920 1940 1950 1960 1970 1980 1990 
% 82,3 82,6 71,2 61,1 57,1 46,7 38,7 31,9 26,5 
 
Construa: 
a-) um gráfico de linha; 
GRÁFICO DE LINHAS
0
10
20
30
40
50
60
70
80
90
1872- 1890- 1920- 1940- 1950- 1960- 1970- 1980- 1990-
A N O
 
b-) um gráfico de barras (ou colunas); 
GRÁFICO DE BARRAS
0
10
20
30
40
50
60
70
80
90
1872- 1890- 1920- 1940- 1950- 1960- 1970- 1980- 1990-
A N O
 
 
Exemplo 2: De 75.200 mortes por acidentes nos EUA, em um ano recente, 43.500 foram causadas 
por veículos motorizados, 12.200 por quedas, 6.400 por envenenamento, 4.600 por afogamento, 
4.200 por incêndios, 2.900 por ingestão de alimentos ou de um objeto, e 1.400 por armas de fogo 
(com base em dados do Conselho de Segurança Nacional). Descrever estes dados através de um 
gráfico de setores. 
GRÁFICO DE SETORES 
Veiculo Mot orizado; 
43500; 57%
Armas de f ogo; 1400; 
2%
Ingest çao de 
aliment os ou objet o; 
2900; 4%
Incêndio; 4200; 6%
Af ogament o; 4600; 6%
Envenenament o; 
6400; 9%
Quedas; 12200; 16%
 
 
Exemplo 3: A tabela abaixo representa o salário de famílias de uma pequena comunidade. 
 
Salário (em reais) Freq. Absoluta (F) Freq. Acumulada 
(Fa) 
8000,00 |- 9000,00 18 18 
9000,00 |- 10000,00 31 49 
10000,00 |- 11000,00 15 64 
11000,00 |- 12000,00 3 67 
12000,00 |- 13000,00 1 68 
13000,00 |- 14000,00 1 69 
14000,00 |- 15000,00 1 70 
Total 70 
 8
 
Construa com estes dados: 
 
a-) um Histograma; 
HISTOGRAMA
0
18
31
15
3 1 1 1
0
5
10
15
20
25
30
35
0-8000 8000-9000 9000-10000 10000-11000 11000-12000 12000-13000 13000-14000 14000-15000
SA LÁ R IOS ( EM R EA IS)
 
 
b-) Um polígono de freqüências 
 
POLÍGONO DE FREQÜÊNCIAS
0
18
31
15
3 1 1 10
5
10
15
20
25
30
35
0-8000 8000-9000 9000-10000 10000-11000 11000-12000 12000-13000 13000-14000 14000-15000
SA LÁ R IOS ( EM R EA IS)
 
 
c-) Um Ogiva 
OGIVA
0
10
20
30
40
50
60
70
80
8000- 9000- 10000- 11000- 12000- 13000- 14000- 15000-
SA LÁ R IOS (EM R EA IS)
 
 
 
 9
4. MEDIDAS DE POSIÇÃO 
 
Definição 11: As medidas de posição mais importantes são as medidas de tendência central, que 
recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em 
torno dos valores centrais. Dentre as medidas de tendência central, destacamos: 
- a média aritmética; 
- a mediana; 
- a moda. 
As outras medidas de posição são as separatrizes, que englobam: 
- a própria mediana; 
- os quartis; 
- os percentis. 
 
 
Para dados não-agrupados 
(Quando os dados não estiverem na forma de distribuição de freqüência) 
 
4.1 Média aritmética ( x ): é o quociente da divisão da soma dos valores (dados, observações) da 
variável pelo número deles: 
 
n
x
x
n
1i
i∑
== 
sendo: 
 x = a média aritmética; 
 = os valores da variável; ix
 n = o número de valores. 
 
4.2 Moda (Mo): Denominamos moda de um conjunto de dados o valor (ou valores) que ocorre 
com maior freqüência. 
 Por ex..: o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o 
salário recebido pelo maior número de empregados dessa indústria. 
 
4.3 Mediana (Md).: A mediana é outra medida de posição definida como o número que se 
encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em 
outras palavras, a mediana de um conjunto de valores, ordenados, é o valor situado de tal forma no 
conjunto que o separa em dois subconjuntos de mesmo número de elementos. 
 
Obs: - Se o nº de elementos for ímpar, então a mediana será exatamente o valor “do meio” 
 - Se o nº de elementos for par, então a mediana será exatamente a média “dos dois valores do 
meio”. 
 
 
Emprego da Mediana 
 
 Empregamos a mediana quando: 
- desejamos obter o ponto que divide a distribuição em partes iguais; 
- há valores extremos que afetam de uma maneira acentuada a média; 
- a variável em estudo é salário. 
 
Exemplo: Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de: 10, 14, 
13, 15, 16, 18 e 12 litros, pergunta-se: Encontre a média, a moda e a mediana para a produção diária 
de leite desta vaca. 
 10Média: 
14
7
98
7
12.181615131410
n
x
x
n
1i
i
==++++++==
∑
= 
 
Logo, x = 14 litros de leite em média por dia que representa uma produção de 98 litros de leite em 
média por semana. 
 
OBS.: a média pode ser um número diferente de todos os valores da amostra que ela representa. 
 
Moda: Como não existe um valor que aparece com maior freqüência que os outros, não há valor de 
moda para este exemplo. 
 
Mediana: Ordenando os dados temos: 
 
10 12 13 14 15 16 18 
 
 Desta forma, o valor mediano é o valor central dos dados, ou seja, 14 litros de leite por dia 
 
 
Para dados agrupados 
(Quando os dados estiverem na forma de distribuição de freqüência) 
 
Quando os dados estiverem agrupados, ou seja, na forma de distribuição de freqüências a 
forma de calcular a média aritmética muda um pouco. Nestes casos, como as freqüências são 
números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de 
ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: 
 
∑
∑
=
== n
1i
i
n
1i
ii
f
fx
x 
 
OBS.: A moda e a mediana são encontradas teoricamente da mesma forma citada 
anteriormente. 
 
 
Exemplos: 
 
1-) Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o 
número de filhos do sexo masculino: 
 
Nº de 
meninos 
if xifi
0 2 
1 6 
2 10 
3 12 
4 4 
 =∑ if 34 
 
 11
Qual é a média, a moda e a mediana do nº de meninos por família? 
 
Solução: 
 
Média: 
Devemos usar a fórmula 
∑
∑
=
== n
1i
i
n
1i
ii
f
fx
x , já que estamos trabalhando com dados agrupados, 
assim temos: 
∑
=
n
1i
ii fx = 
=∑
=
n
1i
if 
Portanto, 3,229,2
34
78
f
fx
x n
1i
i
n
1i
ii
≈===
∑
∑
=
= . 
 
Interpretação: Sendo x uma variável discreta, como interpretar o resultado obtido, 2 filhos e 3 
décimos (ou 0,3) de menino? 
 
 O valor médio 2,3 meninos sugere, que o maior número de famílias com 4 filhos tem 2 
meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em 
relação ao número de meninos. 
 
Moda: O valor encontrado com maior freqüência para este conjunto de dados é de 3 meninos por 
família de 4 filhos. 
 
Mediana: Geralmente, quando os dados estão tabelados, a variável de interesse já está ordenada. 
Portanto, basta encontrar o valor central dos dados. Neste exemplo temos que a mediana é de 2 
meninos. 
 
2-) Calcule a média, a moda e a mediana da seguinte distribuição de freqüência e interprete os 
resultados obtidos: 
 
Custos R$ 
Classes de fr. 
Pm 
( ) ix
if ii fx 
450 |- 550 500 8 
550 |- 650 600 10 
650 |- 750 700 11 
750 |- 850 800 16 
850 |- 950 900 13 
950 |- 1050 1000 5 
1050 |- 1150 1100 1 
Total 64 
 
 
 
 
 
 12
3ª LISTA DE EXERCÍCIOS DE ESTATÍSTICA 
 
1-) Considere a distribuição de freqüências das estaturas de 40 alunos de uma determinada classe de 
8ª série. 
 
Estaturas 
(cm) 
if ii fx 
150 |- 154 4 
154 |- 158 9 
158 |- 162 11 
162 |- 166 8 
166 |- 170 5 
170 |- 174 3 
Total 40 
 
Pergunta-se: qual a estatura média, a estatura mediana e a moda dos alunos desta sala? 
 
2-) Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo tiveram 
seu consumo observado durante 1000 quilômetros. A informação obtida é apresentada na tabela 
abaixo em Km/litro. 
 
Faixas Freqüência 
7 |- 8 
8 |- 9 
9 |-10 
10 |- 11 
11 |- 12 
27 
29 
46 
43 
55 
Determine: 
a-) Qual a variável em estudo? Esta variável é discreta ou contínua? 
b-) A média aritmética, a mediana e a moda da variável em estudo. Interprete os resultados. 
c-) Construa um histograma para os dados. 
 
3-) Os salários-hora de sete funcionários de uma companhia são: R$180,00, R$220,00, R$253,00, 
R$220,00 e R$192,00 R$1200,00 e R$750,00. Determine a média a moda e a mediana e interprete 
os resultados. 
 
4-) A pulsação de 10 estudantes após exercícios físicos foram as seguintes (em batimentos por 
minuto): 80, 91, 84, 86, 80, 89, 85 e 86. Determine a média a moda e a mediana e interprete os 
resultados. 
 
 
 13
 14
5. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE 
 
 
Definição 13: Vimos que a moda a mediana e a média podiam ser usadas para resumir, num único 
número, aquilo que é “médio” ou “típico” de um conjunto de dados. Mas a informação contida 
fornecida pelas medidas de posição necessita em geral ser complementada pelas medidas de 
dispersão. Estas servem para indicar o quanto os dados se apresentam dispersos em torno da região 
central. Caracterizam, portanto, o grau de variação existente no conjunto de valores. As medidas de 
dispersão que nos interessam são: 
- a amplitude total; 
- o desvio-padrão; 
- a variância; 
- e o coeficiente de variação. 
 
OBS: Quanto maior as medidas de dispersão, mais heterogêneos são os dados, e ao contrário, 
quanto menor essas medidas, mais homogêneo o conjunto. 
 
Para ilustrar a necessidade de conhecermos as medidas de dispersão de um conjunto de 
dados iremos introduzir alguns exemplos: 
 
Exemplo 1: 
Sabe-se que em Honolulu (Havaí) e Houston (Texas) a temperatura média diária é quase a 
mesma em torno de aproximadamente 23,9ºC. Pergunta-se: Será que, por isso, podemos admitir que 
a temperatura é basicamente a mesma em ambas as localidades? Ou não será possível que enquanto 
uma cidade é melhor para natação a outra o seja para atividades externas? 
 
Sabendo-se que a temperatura em Honolulu varia muito pouco ao longo do ano, oscilando, 
em geral, entre 21,1ºC e 26,7ºC. Por outro lado, a temperatura em Houston pode diferir 
estacionalmente, isto é, apresentar-se baixa em janeiro (cerca de 4,4ºC) e alta em julho e agosto 
(bem perto de 37,8ºC). Desnecessário dizer que as praias em Houston não estão abarrotadas de 
gente o ano todo! 
 
Exemplo 2: 
 Suponham que, numa particular cidade, tanto ladrões quanto professores secundários 
tenham uma renda média anual de R$ 900,00. Será que essa informação indica que as duas 
distribuições de renda são necessariamente semelhantes? Muito ao contrário, poder-se-ia descobrir 
que elas diferem, e muito, num outro aspecto importante que é o fato de as rendas dos professores 
concentrar-se ao redor de R$ 900,00 (serem constantes, homogêneas), enquanto que as dos ladrões 
espalham-se mais (são descontínuas, heterogêneas), o que reflete, portanto, maiores oportunidades 
para prisões, desemprego, pobreza e, em alguns casos, fortunas excepcionais. 
 Tais fatos demonstram que necessitamos, além de uma medida de tendência central, de um 
índice que indique o grau de dispersão dos dados em torno da média. Este “índice” é uma medida 
indicativa do que costumamos chamar de variabilidade (ou dispersão). 
 Voltando ao exemplo 1, poderíamos dizer que a distribuição de temperatura em Houston 
(Texas) tem maior variabilidade do que a distribuição de temperaturas em Honolulu (Havaí). Da 
mesma forma podemos dizer que a distribuição de rendas entre professores apresenta menos 
variabilidade do que a distribuição de rendas entre ladrões. 
 
Assim sendo, vejamos as definições das medidas de dispersão e uma aplicação simples dela 
para exemplificar. 
 
 
 
 
Considere os seguintes conjuntos de valores das variáveis X, Y e Z: 
 
X: 70, 70, 70, 70, 70. 
Y: 68, 69, 70, 71, 72. 
Z: 5, 15, 50, 120, 160. 
 
Calculando a média aritmética de cada um destes conjuntos, obtemos: 
 
=X 70 
=Y 70 
=Z 70 
 
Vemos então, que os três conjuntos apresentam a mesma média aritmética: 70, entretanto é fácil 
notar que o conjunto X é mais homogêneo que os conjuntos Y e Z. Para quantificar o quão os dados 
são heterogêneos precisamos encontrar algumas medidas de posição. Sãoelas: 
 
5.1 Amplitude total (R): a amplitude total é a diferença entre o maior e o menor valor observado: 
 
R = .)mín(x.)máx(x − 
 
OBS: A amplitude só leva em conta dois valores de todo o conjunto de dados e, assim, seria mais 
conveniente considerarmos uma medida que utilizasse todas as observações. Uma idéia inicial é 
considerar o desvio de cada observação em relação a média aritmética do conjunto de dados. Daí 
surgem as outras medidas de variabilidade. 
 
 Vamos definir a palavra desvio em estatística: 
 
Definição 14: o desvio é definido como sendo a distância entre qualquer valor do conjunto de dados 
em relação a média aritmética do conjunto de dados. Existem várias medidas de dispersão que 
envolvem os desvios, são elas: o desvio-padrão, a variância e o coeficiente de variação. 
 
5.2 Desvio-Padrão (S): o desvio-padrão é a medida mais usada na comparação de diferenças entre 
grupos, por ser mais precisa e estar na mesma medida do conjunto de dados. Ele determina a 
dispersão dos valores em relação a média. Sua formulação é dada pela raiz quadrada da média 
aritmética dos quadrados dos desvios, ou seja: 
 
1n
)xx(
S
n
1i
2
i
−
−
=
∑
= =
1n
)xx()xx()xx( 2n
2
2
2
1
−
−++−+− L 
 
onde, é cada uma das observações do conjunto de dados, ix x é a média do conjunto de dados e n é 
o número total de observações do conjunto de dados. 
 
5.3 Variância ( ): a variância nada mais é do que o valor do desvio-padrão elevado ao quadrado, 
ou seja, 
2S
 
1n
)xx(
1n
)xx(
)S(S
n
1i
2
i
2
n
1i
2
i
22
−
−
=
⎟⎟
⎟⎟
⎟
⎠
⎞
⎜⎜
⎜⎜
⎜
⎝
⎛
−
−
==
∑∑
== 
 15
 
A variância não é uma medida conveniente de ser usada pois expressa o seu resultado numa medida 
ao quadrado. Portanto não vamos trabalhar com esta medida constantemente. 
 
 Por último, temos: 
 
5.4 Coeficiente de Variação (cv):.O coeficiente de variação (cv) é definido como o quociente entre 
o desvio-padrão e a média. É freqüentemente expresso em porcentagem. (Ele mede o “grau” de 
variabilidade do conjunto de dados). 
 
x
Scv = 
 
Vamos exemplificar o cálculo da amplitude, do desvio-padrão, da variância e do coeficiente de 
variação utilizando os mesmos exemplos anteriores (aqueles utilizados para exemplificar as 
medidas de posição). 
 
 
Para dados não-agrupados 
(Quando os dados não estiverem na forma de distribuição de freqüência) 
 
 
Exemplo: Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de: 10, 14, 
13, 15, 16, 18 e 12 litros, pede-se calcular a amplitude, o desvio-padrão (S), a variância ( ) e o 
coeficiente de variação (cv). 
2S
 
Solução: 
 
Amplitude: 
 
R= 18 – 10 = 8 litros de leite 
 
ou seja, a maior variação do número de litros de leite produzidos por dia pela vaquinha A é de 8 
litros. 
 
 OBS: Sabemos que a média para estes dados é: x = 14 litros de leite por dia 
 
 
Desvio-padrão: 
 
1n
)xx(
S
n
1i
2
i
−
−
=
∑
= =
1n
)xx()xx()xx( 2n
2
2
2
1
−
−++−+− L = 
 
( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( ) ( )
semanapor leite de litros 65,27
6
42
6
416411016
6
2421104
17
14121418141614151413)1414()1410(
2222222
2222222
≅=
==++++++=−++++−++−=
=−
−+−+−+−+−+−+−=
 
 
 16
Variância: 
 
 ( ) 2222 leite) de (litros765,2)( ≅== SS
 
Coeficiente de variação: 
 
 1893,0
14
65,2 ===
x
Scv ou seja, existe uma variabilidade de 18,93% dos dados em relação a 
média. 
Para dados agrupados 
(Quando os dados estiverem na forma de distribuição de freqüência) 
Para o Exemplo 1 temos: 
 
Exemplo 1: Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para 
variável o número de filhos do sexo masculino: 
 
Nº de 
meninos 
( ) ix
if ( )xx i − ( )2i xx − ( )2ii xxf − 
0 2 (0-2,3)=-2,3 (-2,3) =5,292 2(5,29)=10,58 
1 6 (1-2,3)=-1,3 (-1,3) =1,692 6(1,69)=10,14 
2 10 (2-2,3)=-0,3 (-0,3) =0,092 10(0,09)=0,9 
3 12 (3-2,3)=0,7 (0,7) =0,492 12(0,49)=5,88 
4 4 (4-2,3)=1,7 (1,7) =2,892 4(2,89)=11,56 
 =∑ if 34 ( )∑ − 2ii xxf =
39,06 
 
Calcule a amplitude, o desvio-padrão (S), a variância ( ) e o coeficiente de variação (cv). 2S
 
 Solução: 
 
Amplitude: 
 
R= 4 – 0 = 4 meninos 
 
ou seja, a maior variação encontrada neste conjunto de dados é de 4 meninos. 
 
OBS: Sabemos que a média para este conjunto de dados é x =2,3 filhos 
 
 17
Desvio-padrão: 
 
1n
)xx(f
S
n
1i
2
ii
−
−
=
∑
= =
1n
)xx(f)xx(f)xx(f 2nn
2
22
2
11
−
−++−+− L = 
( ) ( ) ( )
( ) ( ) ( ) ( ) ( )
filho1088,11836,1
33
06,39
33
56,1188,59,014,1058,10
33
)89,2(4)49,0(12)09,0(10)69,,1(6)29,5(2
33
7,147,0123,0103,163,22
134
3,2443,23123,2210)3,21(6)3,20(2
22222
22222
≅≅==++++=
=++++=
=++−+−+−=
=−
−+−+−+−+−=
 
 
ou seja, o número médio de filhos homens por família de 4 filhos é de 2,3 com uma variabilidade de 
aproximadamente 1 filho, ou seja, a maior parte das famílias com 4 filhos têm entre: 
 
2,3 1 = (1,3 e 3,3) (1 e 3) filhos homens. ± ≅
 
Variância: 
 
 ( ) 2222 homens) (filhos 1837,1088,1)S(S ≅==
 
Coeficiente de variação: 
 
 4730,0
3,2
088,1
x
Scv ≅== ou seja, existe uma variabilidade de 47,30% dos dados em relação 
a média. (variabilidade alta). 
 
Exemplo 2: Considere a seguinte distribuição de freqüência referente aos salários de operários de 
uma determinada fábrica: 
Custos R$ 
Classes de fr. 
Pm ( ) ix if ( )xx i − ( )2i xx − ( )2ii xxf − 
450 |- 550 500 8 (500-754,68)= 
-254,68 
(-254,68) 2 = 
64861,90 
8(64861,90)= 
518895,2 
550 |- 650 600 10 (600-754,68)= 
-154,68 
(-154,68) 2 = 
23925,90 
10(23925,90)= 
239259,0 
650 |- 750 700 11 (700-754,68)= 
-54,68 
(-54,68) = 2
2989,90 
11(2989,90)= 
32888,9 
750 |- 850 800 16 (800-754,68)= 
45,32 
(45,32) = 2
2053,90 
16(2053,90)= 
32862,4 
850 |- 950 900 13 (900-754,68)= 
145,32 
(145,32) = 2
21117,90 
13(21117,90)= 
274532,7 
950 |- 1050 1000 5 (1000-754,68)=
245,32 
(245,32) = 2
60181,90 
5(60181,90)= 
300909,5 
1050 |- 1150 1100 1 (1100-754,68)=
345,32 
(345,32) = 2
119245,90 
1(119245,90)= 
119245,9 
Total 64 ( )∑ − 2ii xxf
=1518593,6 
 18
Calcule a amplitude, o desvio-padrão (S), a variância ( ) e o coeficiente de variação (cv). 2S
 
Solução: 
 
Amplitude: 
 
R= 1150 – 450 = 700 
 
ou seja, a maior diferença existente entre os salários dos operários desta determinada fábrica é de 
R$ 700,00. 
 
OBS: Sabemos que a média para este conjunto de dados é x =754,69 filhos 
 
Desvio-padrão: 
 
1n
)xx(f
S
n
1i
2
ii
−
−
=
∑
= =
1n
)xx(f)xx(f)xx(f 2nn
2
22
2
11
−
−++−+− L = 
( ) ( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( ) ( )
)reais(26,15566,24104
63
60,1518593
63
90,1192455,30090970,27453240,3286290,328880,2392592,518895
63
)90,119245(1)90,60181(5)90,21227(1390,2053(1690,2989(11)90,23925(10)90,64861(8
63
32,345132,245532,1451332,451668,541168,1541068,2548
164
68,7541100168,7541000568,7549001368,7548001668,7547001168,7546001068,7545008
2222222
2222222
≅=≅++++++
=++++++=
=++++−+−+−=
=−
−+−+−+−+−+−+−=
 
 
ou seja, o número médio de salários é de R$754,68 com uma variabilidade de aproximadamente 
R$155,26, ou seja, a maior parte dos operários recebem entre: 754,68 ± 155,26 = (599,42 e 909,94) 
reais. 
 
Variância: 
 
 ( ) 2222 (reais) 66,2410426,155)S(S ≅==
 
Coeficiente de variação: 
 
 2057,0
68,754
26,155
x
Scv ≅== ou seja, existe uma variabilidade de 20,57% dos dados em 
relação a média. 
 
4ª LISTA DE EXERCÍCIOS DE ESTATÍSTICA 
 
 
1-) Para todos os exercícios da 3ª lista, encontre: 
a-) A amplitude; 
b-) O desvio-padrão;c-) A variância e 
d-) O coeficiente de variação. 
e-) Interprete os resultados obtidos nos itens a), b), c) e d). 
 
 
 19
 20
6. TÉCNICAS DE AMOSTRAGEM 
 
 Em amostragem, é necessário garantir que a amostra seja representativa da população, ou 
seja, no processo de amostragem, a amostra deve possuir as mesmas características básicas da 
população. 
 
Tipos de amostragem: probabilística e não-probabilística. 
 
Definição 15: A amostragem será probabilística se todos os elementos da população tiverem 
probabilidade conhecida e diferente de zero, de pertencer à amostra. Caso contrário a amostragem 
será não probabilística. 
 
6.1 Tipos de técnicas de amostragem probabilística: 
- Amostragem casual simples 
- Amostragem sistemática 
- Amostragem por meio de conglomerados 
- Amostragem estratificada 
 
6.2 Tipos de técnicas de amostragem não-probabilística: 
- Inacessibilidade a toda população 
- Amostragem a esmo ou sem norma 
- Amostragens intencionais 
 
Definições das técnicas de amostragem probabilística 
 
6.1.1 Amostragem casual simples 
 
É feita quando todos os elementos da população têm a mesma chance (ou probabilidade 
igual) de pertencer à amostra. 
 Na prática a amostragem casual simples é realizada numerando-se a população de 1 a N e 
sorteando-se, a seguir, de forma aleatória, n números dessa sequência, os quais corresponderão aos 
elementos sorteados para a amostra. 
 
 Ex: Seja uma população de 800 elementos da qual desejamos tirar uma amostra casual 
simples de 50 elementos. 
 Procedimento: 
- numeramos a população de 001 a 800, sendo os números tomados sempre de 3 
algarismos. 
- Usar uma tabela de números aleatórios escolhendo (ou sorteando) uma linha e uma 
coluna da tabela e pegando os números com 3 algarismos subsequentes, os quais irão 
indicar os elementos da amostra. 
 
OBS: Se o número 856 for sorteado, devemos substituí-lo pois não existe o elemento de número 
856 na população. 
 
6.1.2 Amostragem sistemática 
 
É feita quando os elementos da população se apresentam ordenados e a retirada dos 
elementos da amostra é feita periodicamente. 
 
 Ex: Usando o exemplo anterior, onde a população é composta de 800 elementos ordenados, 
poderíamos utilizar a amostragem sistemática da seguinte forma: 
16
50
800 = Æ que será o 1º elemento da amostra, os 49 que faltarão serão encontrados, a 
partir do 16º elemento, retirados de 16 em 16. 
 
OBS: Cuidados com ciclos de variação. 
 
6.1.3 Amostragem por meio de conglomerados 
 
Quando a população apresenta uma subdivisão em pequenos grupos, chamados 
conglomerados, é possível e até conveniente fazer-se a amostragem por meio desses 
conglomerados, a qual consiste em sortear um número suficiente de conglomerados, cujos 
elementos constituirão a amostra. 
 
Ex: Suponhamos que desejamos estudar alguma característica dos indivíduos que moram na 
favela da Rocinha. 
 
População: todos os indivíduos que moram na favela da Rocinha 
Conglomerado: cada barraco da favela 
Amostra: ordeno os barracos e sorteio (amostragem casual simples) um determinado número 
deles. Cada indivíduo de dentro do barraco sorteado fará parte da minha amostra. 
 
6.1.4 Amostragem estratificada 
 
Muitas vezes a população se divide em subpopulações ou estratos. A amostragem 
estratificada consiste em especificar quantos elementos da amostra serão retirados em cada estrato. 
Geralmente, o número de elementos sorteados em cada estrato é proporcional ao número de 
elementos existente no extrato. 
 
 Ex: Estudar uma determinada característica do povo brasileiro, por exemplo, renda familiar. 
 
 População: todo cidadão que mora no Brasil 
 Estrato: cada Estado do Brasil 
 Amostra: nº x de elementos proporcional a cada estado 
 
Definições das técnicas de amostragem não-probabilística 
 
6.2.1: Inacessibilidade a toda população 
 
Nem sempre temos acesso a toda população, então somos obrigados a realizar o trabalho 
estatístico somente na parte acessível. 
 
 Ex: Suponha a produção de peças por uma máquina 
 
 População: todas as peças produzidas por esta máquina. 
 Problema: não tenho acesso a todas as peças, pois existem peças que já foram repassadas, 
peças que estão sendo produzidas (tenho acesso) e peças que ainda serão produzidas. 
 Amostra: pode-se usar amostra casual simples, ou sistemática na parte da população que 
tenho acesso. 
 
6.2.2 Amostragem a esmo ou sem norma 
 
É a amostragem em que o amostrador, para simplificar o processo, procura ser aleatório 
sem, no entanto, usar algum dispositivo aleatório confiável. 
 
 21
 Ex: Suponha que desejamos retirar uma amostra de 100 parafusos de uma caixa contendo 
10.000, evidentemente não faremos uma amostragem casual simples, pois seria extremamente 
trabalhosa, desta forma faríamos a retirada a esmo. 
 
6.2.3 Amostragens Intencionais 
 
É quando o amostrador deliberadamente escolhe certos elementos para pertencer à amostra, 
por julgar tais elementos bem representativos da população. 
 
 Ex: Avaliar o quanto determinada disciplina está sendo bem dada. 
 População: todos os alunos que fazem determinada disciplina. 
 Amostra: os melhores alunos da sala. 
 
5ª LISTA DE EXERCÍCIOS DE ESTATÍSTICA 
 
1-) Os números seguintes representam as notas de Estatística de trinta alunos. Construa o 
histograma, polígono de frequências, a média e o desvio-padrão dos dados. A variável é contínua ou 
discreta? 
 
5,5 3,0 4,0 4,5 7,0 
6,5 3,5 4,5 3,0 7,5 
4,5 0,0 4,5 3,5 4,5 
7,0 9,0 6,0 4,0 5,0 
8,0 9,5 4,5 4,5 4,5 
2,5 2,0 5,0 6,0 4,5 
 
2-) Uma população se encontra dividida em três estratos, com tamanhos respetivamente, , 
 e Ao se realizar uma amostragem estratificada proporcional, doze elementos da 
amostra foram retirados do primeiro estrato. Qual o número total de elementos da amostra? 
80N1 =
120N2 = .60N3 =
 
3-) Uma amostragem entre os moradores de uma cidade é realizada da seguinte forma: em cada 
subdistrito, sorteia-se um certo número de quarteirões proporcional à área do subdistrito; de cada 
quarteirão, são sorteadas cinco residências, cujos moradores são entrevistados. 
a) Essa amostra será representativa da população ou poderá apresentar algum vício? 
b) Que tipos de amostragem foram usados no procedimento? 
 
4-) Uma indústria especializada em montagem de grandes equipamentos industriais recebeu setenta 
dispositivos de controle do fornecedor A e outros trinta dispositivos do fornecedor B. O aspecto 
relevante, que se deseja controlar, relativo a esses dispositivos, é a resistência elétrica de certo 
componente crítico. Vamos admitir que os cem dispositivos foram numerados de 1 a 100 ao darem 
entrada no almoxarifado, e que os setenta primeiros foram os recebidos do fornecedor ª Vamos 
admitir, também, que os valores reais da variável de interesse (a resistência elétrica do componente 
crítico) dos cem dispositivos recebidos sejam os dados seguintes, respectivamente na ordem de 
entrada no almoxarifado (lê-se segundo as linhas, tal como se lê um livro): 
33 38 34 34 34 31 36 35 32 37 
35 34 30 37 36 33 34 34 32 39 
35 33 33 34 31 32 36 33 29 36 
34 35 34 33 31 35 35 35 37 32 
34 34 36 35 34 33 32 38 34 33 
33 32 34 35 37 35 35 30 35 34 
36 36 33 34 33 32 31 37 35 34 
39 40 40 42 39 38 40 40 40 40 
40 41 45 41 40 39 41 41 40 42 
39 40 41 40 40 42 39 39 38 40 
 22
 
a-) Uma amostra simples, ao acaso, de dez dispositivos foi retirada da população de 100 
dispositivos, com auxílio dos números aleatórios da Tab. A6.7. O processo de utilização da tabela 
foi o usual, com início no dígito situado na interseção da Quinta linha com a oitava coluna da 
referida tabela. A seguir, foi calculada a resistência elétrica média da amostra dedez dispositivos. 
Que valor você acha que foi obtido para essa média? 
b-) Suponha agora que se pensasse em fazer amostragem estratificada. Em sua opinião, seria 
isso razoável, no caso? Caso afirmativo, indique como você procederia , ainda utilizando os 
números aleatórios. Suponha que o numero total de dispositivos a examinar na amostra continue 
sendo dez. 
 
c-) Suponha agora que tivesse sido utilizada amostragem estratificada uniforme, num total ainda 
de dez dispositivos examinados, e que tivessem sido obtidos, no primeiro e no segundo estratos, 
respectivamente, 8,33x1 = e 2,40x 2 = . Em quanto você estimaria a média da população de cem 
dispositivos? 
 
d-) Suponha agora que, dos setenta dispositivos provenientes do fornecedor A, tenha sido 
colhida uma amostra sistemática de dez dispositivos, sendo constante o período de retirada dos 
elementos para a amostra, e sendo conhecido que o segundo dispositivo a entrar no 
almoxarifado (cujo valor da resistência elétrica é 38) pertencia a essa amostra. Calcule a média 
dos valores da resistência elétrica observados nessa amostra. 
 
5-) Os registros de uma companhia de seguros mostram que, entre 3800 sinistros reportados ‘a 
companhia durante certo tempo, 2600 são sinistros pequenos (inferiores a $200), enquanto os outros 
1200 são sinistros grandes ($200 ou mais). Para estimar o valor médio desses sinistros, a companhia 
extrai uma amostra de 1%, alocada proporcionalmente aos dois estratos, com os resultados 
seguintes (arredondados para o dólar mais próximo): 
 
Sinistros pequenos Sinistros grandes 
 42 115 63 78 45 148 
195 66 18 73 55 89 
170 41 92 103 22 138 
 49 62 88 113 29 71 
 58 83 
246 355 872 649 253 
338 491 860 755 502 
488 311 
 
 Determine as médias dessas duas amostras e, em seguida, sua média ponderada, tomando 
como pesos os dois tamanhos de estratos N1 = 2600 e N2 = 1200. 
 
6-) Consideremos um estudo realizado em propriedades rurais de um município, composto por 1000 
propriedades rurais, distribuídas, quanto a sua área, conforme Tabela 1 e que neste município sejam 
amostrados 50 propriedades. 
 
Tabela 1: Distribuição do n° de propriedades rurais de um município qualquer, quanto a área e n° de 
propriedades a serem amostradas por estrato (classes). 
 
Amostra estratificada (n=50) Área (ha) N° de 
propriedades Uniforme Proporcional 
0 ├ 20 500 
20 ├50 320 
50 ├ 100 100 
100 ├ 200 50 
200 ├ 400 30 
Total 1000 50 50 
 
a-) Qual deverá ser o tamanho da amostra dentro de cada estrato no caso uniforme e no 
proporcional? 
 23
 24
 
b-) Determine a média amostral obtida para a amostragem estratificada uniforme e para a 
amostragem estratificada proporcional. Comente os resultados. 
 
7-) Em uma amostra de 32 elementos de uma população ordenada formada por 2432 elementos, 
qual dos elementos abaixo seria escolhido para pertencer a amostra, sabendo que o elemento de 
ordem 1420 a ela pertence? 
 
1648, 290, 725, 2025, 1120 
 
8-) Ordene uma amostra de 15 elementos de uma população ordenada formada por 210 elementos, 
sabendo que o elemento de ordem 149 a ela pertence. 
 
 
ANEXOS 
 
ESTATÍSTICA USANDO O EXCEL 
 
 A palavra estatística provém do latim status, que significa estado. A primitiva utilização da estatística envolvia 
compilações de dados e gráficos que descreviam vários aspectos de um estado ou país. Em 1662, John Graunt publicou 
informes estatísticos sobre nascimentos e mortes. O trabalho de Graunt foi secundado por estudos de mortalidade, 
tamanho de populações, rendas e taxas de desemprego. As famílias, os governos e as empresas se apóiam largamente 
em dados estatísticos. Assim é que as taxas de desemprego, de inflação, os índices do consumidor, as taxas de 
natalidade e mortalidade são calculadas cuidadosamente a intervalos regulares, e seus resultados são utilizados por 
empresários para tomarem decisões que afetam a futura contratação de empregados, níveis de produção e expansão para 
novos mercados. 
 
1. INTRODUÇÃO 
 
Primeiramente devemos instalar o módulo de Estatística que se encontra na opção Ferramentas. Se Análise de 
Dados não aparecer como uma escolha no menu Ferramentas, a opção Suplementos, deste mesmo menu, deve ser 
selecionada e dentro da caixa de diálogo Suplementos deve-se selecionar Ferramentas de Análise, se existir tal caixa 
de verificação na lista “Suplementos Disponíveis”. Seguindo estes passos, a opção Análise de Dados será incluída no 
menu Ferramentas. 
 
 
Figura 1.1. Seleção de Ferramentas de Análise na caixa de diálogo “Suplementos”. 
 
 
Figura 1.2. Algumas técnicas estatísticas disponíveis na Análise de Dados. 
 
 
 
 
 25
 
 
2. GRÁFICOS E TABELAS 
 
2.1 TIPOS DE GRÁFICOS 
 
1-) Porcentagem de votos (Gráfico de Linhas) 
 
Meses Lula FHC 
Abril 31,7 20,2 
Maio 38,3 23,5 
Junho 37,9 22,8 
Julho 30,1 30,5 
Agosto 27,6 36,3 
Setembro 21,0 42,8 
Outubro 22,8 43,5 
 
PORCENTAGEM DE VOTOS PARA 
PRESIDENTE
0
10
20
30
40
50
ab
ril
ma
io
jun
ho
jul
ho
ag
os
to
se
tem
bro
ou
tub
ro
MESES
VO
TO
S
0
10
20
30
40
50
MESES
VO
TO
S
 
 
2-) A tabela abaixo apresenta os percentuais de reprovação de uma determinada disciplina no ano letivo (Gráfico de 
Colunas): 
 
Bimestres Porcentuais 
1º 45% 
2º 35% 
3º 55% 
4º 15% 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 26
 
 
3-) A Próxima tabela apresenta a avaliação dos estudantes, em porcentagens, com relação à UNE 
(união Nacional dos Estudantes) (Gráfico de Barras) 
 
Ótimo 4% 
Bom 25% 
Regular 27% 
Ruím 9% 
Péssimo 13% 
Não avaliaram 22% 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4-) Situação conjugal dos presos de um determinada cadeia (Gráfico de Setores) 
 
Solteiros 55%
Casados 18%
Namorados 27%
 
Gráfico de setores
Solteiros
55%Casados
18%
Namorados
27%
Solteiros Casados Namorados
 
 
Considere agora o exemplo A para desenvolver as próximas ferramentas estatísticas no 
Microsoft EXCEL 
 
Exemplo A: Em uma escola tomou-se a medida da altura de cada um de quarenta estudantes, 
obtendo-se os seguintes dados (em centímetros): 
 
160 152 155 154 161 162 162 161 150 160 
163 156 162 161 161 171 160 170 156 164 
155 151 158 166 169 170 158 160 168 164 
163 167 157 152 178 165 156 155 153 155 
 27
 
Fazer a distribuição de freqüência e usar 6 classes. (iniciando por 150cm e terminando em 
180cm) e responder as questões abaixo: 
a) Quantos são os estudantes com estatura inferior a 160cm? 
b) Que porcentagem de estudantes tem estatura igual ou superior a 175cm? 
c) Quantos são os estudantes com estatura maior ou igual a 160cm e ao mesmo tempo 
menor que 175cm? 
d) Qual a porcentagem de estudantes com estatura abaixo de 170cm? 
 
 
2.2 TABELAS DE FREQÜÊNCIAS 
 
No Microsoft EXCEL, para obter tabelas de freqüências, a opção do Histograma da ferramenta Análise de 
Dados, encontrada no menu Ferramentas, pode ser utilizada. Para isto, os limites superiores dos intervalos de classe 
devem ser inseridos na planilha que contém os dados a serem analisados. 
 
Passo 1: Após ter digitado os dados do exemplo A na coluna A da planilha 1 do Excel, digite os limites 
superiores desejados da tabela de freqüências na coluna C da mesma planilha. 
Passo 2: Depois disso selecione a opção Histograma da ferramenta Análise de Dados, encontrada no menu 
Ferramentas e preencha a caixa Histograma. (ver figura 2.1). 
 
 
Figura 2.1. Seleção do intervalo de dados e dos limites superiores das classes para a construção da tabela de freqüência. 
 
Passo 3: Agora criamos uma tabela de freqüências na planilha 4 do Excel que é a seguinte: 
 
Tabela 2.1.Tabela de Freqüência para a variávelaltura 
Bloco Freqüência
155 10
160 10
165 12
170 6
175 1
180 1
Mais 0
 
 A freqüência relativa e a percentagem de cada classe podem ser incluídas na tabela acima, através da inserção 
das seguintes funções: 
 28
 
Tabela 2.2. Tabela de Freqüência Completa para a variável altura 
Bloco Freqüência Freq. Relativa 
Percentagem
155 10 0,25 25
160 10 0,25 25
165 12 0,3 30
170 6 0,15 15
175 1 0,025 2,5
180 1 0,025 2,5
Mais 0 0 0
Total 40 1 100
=SOMA(B2:B8)
=(C2*100)
=(B2/$B$9)
 
 
 
Através da tabela acima verifica-se que o intervalo com maior concentração dos dados é o intervalo entre 165 e 
170, com 30% das observações, enquanto que nenhuma observação foi coletada acima de 180. 
 
 
2.3 GRÁFICOS PARA TABELA DE FREQÜÊNCIA 
 
 Como vimos, para uma distribuição de freqüências, o gráfico mais apropriado é o Histograma 
 O histograma é uma importante ferramenta de análise porque fornece visualmente uma idéia 
da variação dos dados, da tendência central e indica a quantidade de dados que está fora das 
especificações. 
 No Microsoft EXCEL, um histograma pode ser construído da seguinte maneira: 
 
 
2.3.1 HISTOGRAMA 
 
Passo1: Selecione os comandos Ferramentas, Análise de Dados, Histograma e clique em OK; 
Passo2: Defina o intervalo com os dados da variável a ser analisada e o intervalo com os limites superiores dos 
intervalos, digitando-os ou clicando no botão ao lado direito da caixa de edição e selecionando, na planilha, o 
intervalo de dados. Selecione, também, as opção Resultado do Gráfico como na figura a seguir e clique em OK; 
 
 29
 
Figura 2.2. Construção do Histograma. 
 
 O gráfico construído conterá dois erros. Existem lacunas entre as barras que correspondem aos intervalos de 
classe, e existe uma classe adicional, denominada Mais pelo Excel. Para eliminar as falhas, o seguinte procedimento 
deve ser realizado: 
 
Passo 3: Com um clique duplo sobre uma barra do gráfico, abra a caixa de diálogo Formatar Seqüências de 
Dados, selecione a aba Opções; 
Passo 4: Na caixa de edição Espaçamento, modifique o valor para zero (0). Clique no botão OK. O Histograma 
conterá, assim, barras contínuas. 
 
Para remover a classe adicional, o procedimento a seguir deve ser feito: 
Passo 5: Aparecerá um segundo conjunto de pontos de dados sobrepostos às barras junto com uma fórmula que 
começa com a palavra Seqüências na caixa de edição acima das planilhas de trabalho, na Barra de Fórmulas; 
Passo 6: Na Barra de Fórmulas, modifique a célula final de $B$8 para $B$7 e tecle Enter; 
Passo 7: O gráfico resultante tem agora o número apropriado de classes. 
 
Histograma
0
2
4
6
8
10
12
14
155 160 165 170 175 180
Bloco
Fr
eq
üê
nc
ia
Freqüência
 
Figura 2.3. Histograma para a variável altura 
 
 Pelo Histograma acima, verifica-se que as observações de altura variam entre 150cm e 180cm. A maioria das 
observações esta entre 150cm e 165cm. O intervalo com maior número de observações é o terceiro que varia de 160cm 
a 165cm. 
 30
Se desejarmos ainda, podemos modificar os “títulos” do gráfico e das variáveis, inclusive o tamanho da letra 
(fonte) e a cor das barras. Para isso, basta clicarmos no cantinho do gráfico (ainda no excel) e depois que estiver 
marcado com uns quadradinhos pretos, basta clicarmos em cima de cada item a ser modificado (título do gráfico, título 
das variáveis, valores das variáveis e também na barra do histograma). 
 
 
2.3.2 POLÍGONO DE FREQÜÊNCIA 
 
No polígono de freqüências, cada intervalo de valores é representado pelo seu ponto médio. Resumidamente, 
este gráfico é construído pela conexão, através de uma série de linhas retas, da seqüência de pontos médios em seus 
respectivos percentuais de intervalo. 
 Como no histograma, o fenômeno de interesse é exibido ao longo do eixo horizontal e o eixo vertical 
representa a freqüência relativa ou absoluta de cada intervalo. 
 No Microsoft EXCEL, o polígono de freqüência pode ser construído através do Assistente de Gráfico, através 
do seguinte procedimento: 
 
Passo 1: Selecione na tabela de freqüências, descrita na seção 2.1., as colunas que contêm os limites superiores 
dos intervalos e as freqüências de cada intervalo de dados, como na figura abaixo; 
 
 
Figura 2.4. Seleção dos intervalos de dados. 
 
Passo 2: Selecione Inserir, Gráficos e Linhas. Selecione, então, o formato do gráfico de linhas na etapa 1 das 
4 etapas do assistente de gráficos e clique em Avançar, como na Figura 2.5. 
 
 31
 
Figura 2.5. Definição do formato do Polígono de Freqüência. 
 
Passo 3: Como os intervalos de dados já foram definidos, clique também em Avançar na etapa 2; 
Passo 4: A etapa 3 consiste na definição estrutural do gráfico, na qual são definidos o título, a ausência ou não 
de legenda e linhas de grade, título dos eixos, entre outras opções. Realizadas as escolhas sobre o formato do 
gráfico, clique em Avançar e Concluir na etapa 4. 
 
Se o polígono de freqüências for examinado, será possível verificar que as marcações de categorias no eixo X 
referem-se aos limites superiores das classes, não aos pontos médios. Para alterar estas marcações, clique duas vezes no 
eixo X a caixa de diálogo Formatar Eixos aparecerá. Selecione a aba Escala e selecione os cruzamentos do Eixo dos 
Valores (Y) entre as categorias da caixa de verificação. Clique no botão OK. Altere, na planilha da tabela de 
freqüências, os limites superiores pelos pontos médios de cada classe, automaticamente estes valores serão trocados no 
gráfico. 
 
Dessa forma, o polígono de freqüência, construído como definido acima, para estes dados é o seguinte: 
Polígono de Freqüência
0
2
4
6
8
10
12
14
152,5 157,5 162,5 167,5 172,5 177,5
Altura
Fr
eq
üê
nc
ia
s
 
Figura 2.6. Polígono de Freqüências para a variável altura 
 
 Pelo polígono de freqüência acima, verifica-se que o intervalo de dados mais freqüente é o intervalo com ponto 
médio igual a 162.5cm. 
 
 
 32
3 RESUMO E DESCRIÇÃO DOS DADOS ATRAVÉS DE MEDIDAS 
 
 No Microsoft EXCEL, as medidas de tendência central e dispersão podem ser calculadas através da inserção de 
funções na planilha de dados, como será discutido em cada tópico específico. 
 
 
3.1 MEDIDAS DE TENDÊNCIA CENTRAL 
 
A maioria dos dados apresenta uma tendência de se agrupar ou concentrar em torno de um ponto central, 
caracterizado pelo valor típico da variável observada. Determinar este valor típico é uma maneira de resumir a 
informação contida nos dados, pois um único valor será escolhido para representar todos os outros. 
Nesta seção serão apresentados três tipos de medidas de posição: a média, a mediana e a moda. 
 
 
 
3.1.1 MÉDIA ARITMÉTICA 
 
Vários tipos de médias de um conjunto de dados podem ser definidas. Neste texto, porém, apenas a média 
aritmética, representada por X , será apresentada por ser o tipo de média mais utilizada. 
 
 No Microsoft EXCEL, a média aritmética pode ser calculada através da inserção de função na planilha de 
dados, como será feito com o Exemplo A. 
 
 Então, voltando a planilha de dados do Excel, vamos considerar a coluna E como receptora dos resumos dos 
dados (como a média, mediana, moda, amplitude, desvio-padrão e coeficiente de variação), assim, devemos inserir, na 
célula E1 a função = MEDIA(A1:A40) e teclar enter. 
O valor dessa média será 160,525. Embora nenhum aluno apresente altura igual a 160,525cm, este é o valor da 
média aritmética, ou seja, o valor típico ou médio de altura, para este conjunto de dados. 
 
 
3.1.2 MEDIANA 
 
Usada como alternativa, em relação à média, para caracterizar o centro do conjunto de dados, a mediana não é 
influenciada por pontos extremos ou discrepantes, por issoquando uma observação extrema está presente no conjunto 
de dados é mais conveniente o uso da mediana do que da média para descrever o conjunto de valores. 
 
 Para o Exemplo A, devemos inserir, na célula E2 a função = MED(A1:A40) e teclar enter. 
O valor encontrado para a mediana será 160,5cm, ou seja, podemos dizer que 50% dos alunos têm estatura 
maior que 160,5cm. 
 
 
3.1.3 MODA 
 
A moda também não é afetada pela ocorrência de valores extremos. A moda é também a única das medidas de 
tendência central que faz sentido no caso de variáveis qualitativas. Assim, a categoria dessas variáveis que aparecer com 
maior freqüência é chamada de categoria modal. 
Um conjunto de dados pode ser classificado como unimodal, bimodal, multimodal ou amodal quando possuir, 
respectivamente, uma, duas, mais de duas ou nenhuma moda. 
 
 33
 Para o nosso exemplo, devemos inserir, na célula E3 a função = MODO(A1:A40) e teclar enter. 
O valor encontrado para a moda será 160cm, ou seja, é mais freqüente encontrar alunos (nesse conjunto de 
dados) com estatura igual a 160cm. 
 
3.2 MEDIDAS DE DISPERSÃO 
 
Sabemos que as informações fornecidas pelas medidas de posição necessita, em geral, ser complementada 
pelas medidas de dispersão. Estas servem para indicar o quanto os dados se apresentam dispersos em torno da região 
central. As medidas de dispersão caracterizam, portanto, o grau de variação existente no conjunto de valores. 
Vamos então encontrar as principais medidas de dispersão (amplitude, o desvio-padrão e o coeficiente de 
variação) com o auxílio do Excel. 
 
3.2.1 AMPLITUDE 
 
No Microsoft Excel, a amplitude para o nosso exemplo será dada pela inserção de funções 
=MÁXIMO(A1:A40)-MÍNIMO(A1:A40). 
 
Assim, as alturas dos alunos diferem entre si por, no máximo, 28cm. 
 
 
3.2.2 DESVIO PADRÃO 
 
O desvio padrão, será definido, no Excel, pela função =DESVPAD(A1:A40). 
 
Então, o desvio padrão encontrado foi de aproximadamente 6,23cm, ou seja, houve uma dispersão “média” em 
torno da média aritmética de 6,23cm. Isto significa que a maioria das estaturas, nesse conjunto de dados, concentra-se 
entre (160,525 ± 6,23). 
 
 
3.2.3 COEFICIENTE DE VARIAÇÃO 
 
Como o coeficiente de variação, denotado por CV, é definido como o quociente entre o desvio padrão e a 
média, freqüentemente expresso em porcentagem, devemos, no Excel, inserir a expressão =(E5/E1)*100, onde E5 é a 
célula que contém o valor do desvio-padrão e E1 a célula que contém o valor da média aritmética e *100 para 
expressarmos o mesmo em porcentagem. 
 
 Sua vantagem, é caracterizar a dispersão dos dados em termos relativos a seu valor médio. Assim, uma 
pequena dispersão absoluta pode ser, na verdade, considerável quando comparada com a ordem de grandeza dos valores 
da variável e vice-versa. 
 
 O valor obtido para o CV foi de aproximadamente 3,88%, isto dizer que este conjunto de dados é homogêneo, 
ou seja, não há grandes diferenças entre as estaturas dos alunos com relação a média. 
 
 OBS.: Algumas das principais medidas de tendência central e de dispersão podem ser calculadas 
conjuntamente no Microsoft EXCEL, sem a necessidade da inserção de funções na planilha de dados. Esta análise 
descritiva do conjunto de dados pode ser realizada através dos comandos Ferramentas, Análise de Dados e Estatística 
Descritiva. Selecionadas estas opções, a caixa de diálogo Estatística Descritiva, apresentada na Figura 3.1, será aberta 
para a especificação do intervalo de dados a ser analisado e das estatísticas de interesse, que serão calculadas. 
 
 
 34
 
 
 
 
 
 
 
Figura 3.1. Módulos para realização da Análise Descritiva dos dados. 
 
 Especifique, então, o intervalo de dados a ser analisado na caixa de edição Intervalo de Dados, digitando-o ou 
selecionando-o diretamente na planilha através do botão ao lado direito da caixa de edição. Escolha a opção de saída 
das estatísticas e selecione a opção Resumo Estatístico. O resultado será uma nova tabela contendo várias das medidas 
descritas nas seções anteriores. 
 
 
Figura 3.2. Caixa de Diálogo “Estatística Descritiva”. 
 35
 36
 Logo, teremos a seguinte Tabela-Resumo 
 
Coluna1 
 
Média 160,525 
Erro padrão 0,985138 
Mediana 160,5 
Modo 160 
Desvio padrão 6,23056 
Variância da amostra 38,81987 
Curtose 0,216636 
Assimetria 0,542412 
Intervalo 28 
Mínimo 150 
Máximo 178 
Soma 6421 
Contagem 40 
Tabela 3.1. Análise Descritiva da variável altura 
 
Pela tabela acima, verifica-se que foram observados 40 valores de altura, variando entre 150 e 178 e resultando 
em uma amplitude de 28cm. O valor mais freqüente (moda) é 160 e a média dos dados coletados (160,525) é muito 
próxima ao valor da mediana (160,5), indicando a não existência de pontos muito extremos e discrepantes que afetam o 
valor da média. A maioria dos valores de altura, neste conjunto de dados, concentra-se entre 6,23cm em torno da média 
aritmética, situação evidenciada pelo desvio padrão. 
	Variáveis População 
	Distribuição de renda no Brasil - 1971 
	Faixa de renda
	Para dados não-agrupados 
	Para dados agrupados 
	Custos R$ 
	Estaturas 
	Freqüência
	Para dados não-agrupados 
	Para dados agrupados 
	Custos R$ 
	1-) Para todos os exercícios da 3ª lista, encontre: 
	Definições das técnicas de amostragem probabilística 
	OBS: Se o número 856 for sorteado, devemos substituí-lo pois não existe o elemento de número 856 na população. 
	Definições das técnicas de amostragem não-probabilística 
	6.2.1: Inacessibilidade a toda população 
	Meses
	Solteiros
	Bloco
	Coluna1

Outros materiais