Buscar

Parte_3_Estatistica_Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
1 
 
1. Introdução às distribuições normais e à distribuição normal padrão 
Normalmente, os pesquisadores precisam trabalhar com dados amostrais a fim de 
analisar populações, mas, algumas vezes, é possível coletar todos os dados para 
certa população. 
 
Exemplo 1.1: 
Os dados a seguir representam as idades das 50 mulheres mais influentes do mundo, 
em 2012. (Fonte: Forbes.) 
 
26, 31, 35, 37, 43, 43, 43, 44, 45, 47, 48, 48, 49, 50, 51, 51, 51, 51, 52, 54, 54, 54, 54, 
55, 55, 55, 56, 57, 57, 57, 58, 58, 58, 58, 59. 59, 59, 62, 62, 63, 64, 65, 65, 65, 66, 66, 
67, 67, 72, 86. 
 
O objetivo é tornar os dados mais fáceis de serem entendidos descrevendo 
tendências, medidas centrais e variações. Por exemplo, nos dados brutos que 
mostram as idades das 50 mulheres mais influentes do mundo em 2012, não é fácil 
ver um padrão ou característica em especial. Na Tabela 1.1 e na Figura 1.1 estão 
algumas maneiras de organizar e descrever os dados. 
 
 
 
Tabela 1.1 
 
Figura 1.1 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
2 
 
 
 
Você aprenderá que há muitas maneiras para se organizar e descrever um conjunto 
de dados. Algumas características importantes que devem ser consideradas quando 
organizamos e descrevemos um conjunto de dados são seu centro, sua variabilidade 
(ou dispersão) e sua forma. 
 
Quando um conjunto de dados tem muitos valores, pode ser difícil de observar 
padrões. Nesta seção, você aprenderá como organizar conjuntos de dados 
agrupando-os em intervalos chamados de classes e formando uma distribuição de 
frequência. Você também aprenderá como usar as distribuições de frequência para a 
construção de gráficos. 
 
 
 
Na distribuição de frequência mostrada na Tabela 1.2 há seis classes. As frequências 
para cada uma das seis classes são 5, 8, 6, 8, 5 e 4. Cada classe tem um limite inferior 
de classe, que é o menor número que pode pertencer à classe, e um limite superior 
de classe, que é o maior número que pode pertencer à classe. Na distribuição de 
frequência mostrada, os limites inferiores de classe são 1, 6, 11, 16, 21 e 26 e os 
limites superiores de classe são 5, 10, 15, 20, 25 e 30. A amplitude de classe é a 
distância entre os limites inferiores (ou superiores) de classes consecutivas. Por 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
3 
 
exemplo, a amplitude de classe na distribuição de frequência mostrada é 6 – 1 = 5. 
Note que as classes não se sobrepõem. 
A diferença entre os valores máximo e mínimo dos dados é chamada de amplitude. 
Na tabela de frequência mostrada, suponha que o valor máximo seja 29, e o mínimo 
seja 1. A amplitude é, então, 29 – 1 = 28. 
 
 
 
Tabela 1.2 Exemplo de uma distribuição de frequência. 
 
 
 
Exemplo 1.2: 
Construindo uma distribuição de frequência com base em um conjunto de dados. 
O conjunto de dados a seguir lista os preços (em dólares) de 30 aparelhos GPS (global 
positioning system) portáteis. Construa uma distribuição de frequência com sete 
classes. 
 
 
 
Solução 
1. O número de classes (7) é dado no problema. 
2. O valor mínimo é 65 e o máximo é 340, então, a amplitude é 340 – 65 = 275. Divida 
a amplitude pelo número de classes e arredonde para encontrar a amplitude de 
classe. 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
4 
 
 
 
 
3. O valor mínimo é um limite inferior conveniente para a primeira classe. Para 
encontrar os limites inferiores das seis classes restantes, adicione a amplitude de 
classe, 40, ao limite inferior de cada classe precedente. Logo, os limites inferiores 
das demais classes são: 65 + 40 = 105, 105 + 40 = 145, e assim por diante. O 
limite superior da primeira classe é 104, que é uma unidade a menos que o limite 
inferior da segunda classe. Os limites superiores das outras classes são: 104 + 40 
= 144, 144 + 40 = 184, e assim por diante. Os limites inferiores e superiores para 
todas as sete classes são mostrados na Tabela 1.3. 
 
Tabela 1.3 Limites das classes. 
 
 
 
 
 
 
Exemplo: quantidade entre 105 e 144, frequência igual a 9 
 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
5 
 
 
 
Encontrando pontos médios, frequências relativas e frequências acumuladas. 
 
 
Solução: 
Os pontos médios e as frequências relativas e acumuladas para as três primeiras 
classes são: 
 
 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
6 
 
Os demais pontos médios e frequências relativas e acumuladas são mostradas na 
distribuição de frequência expandida. 
 
 
 
Interpretação: Há diversos padrões no conjunto de dados. Por exemplo, o preço mais 
comum de navegador GPS encontra-se no intervalo de US$ 105 a US$ 144. Além 
disso, metade dos navegadores GPS custa menos que US$ 145. 
 
 
Exemplo 1.3: 
Lendo uma distribuição de frequência. Use a distribuição de frequência dada para 
determinar: 
a) a amplitude das classes; 
b) os pontos médios das classes; 
c) frequência relativa 
d) frequência acumulada 
 
Temperaturas altas (Farad) em Cleveland, Ohio. 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
7 
 
Solução: 
 
Classes 
Frequência, 
𝑓 
Amplitude 
das Classes 
Pontos 
Médios 
Frequência 
relativa 
Frequência 
Acumulada 
20 - 30 19 
31 - 41 43 
42 - 52 68 
53 - 63 69 
64 - 74 74 
75 - 85 68 
86 - 96 24 
 𝚺𝒇 = 
 
𝚺
𝒇
𝒏
≈ 𝟏 
 
 
 
 
Exemplo 1.4: 
Lendo uma distribuição de frequência. Use a distribuição de frequência dada para 
determinar: 
a) a amplitude das classes; 
b) os pontos médios das classes; 
c) frequência relativa 
d) frequência acumulada 
 
Tempo de deslocamento até o trabalho (em minutos). 
 
 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
8 
 
Solução: 
 
Classes 
Frequência, 
𝑓 
Amplitude 
das Classes 
Pontos 
Médios 
Frequência 
relativa 
Frequência 
Acumulada 
0 - 9 188 
10 - 19 372 
20 - 29 264 
30 - 39 205 
40 - 49 83 
50 - 59 76 
60 - 69 32 
 𝚺𝒇 = 
 
𝚺
𝒇
𝒏
≈ 𝟏 
 
 
 
2. Medidas de Tendência Central 
Aprenderemos sobre como complementar as representações gráficas com 
estatísticas numéricas que descrevem o centro e a variabilidade de um conjunto de 
dados. 
Uma medida de tendência central é um valor que representa uma observação 
típica ou central de um conjunto de dados. As três medidas da tendência central mais 
comumente usadas são a média, a mediana e a moda. 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
9 
 
Exemplo 2.1: 
Encontrando a média amostral. 
Os pesos (em libras) de uma amostra de adultos antes de iniciarem um estudo sobre 
perda de peso estão listados. Qual é o peso médio dos adultos? 
 
274 235 223 268 290 285 235 
 
Solução: 
A soma dos pesos é: 
Σx = 274 + 235 + 223 + 268 + 290 + 285 + 235 = 1.810 
Há 7 adultos na amostra, logo n = 7. Para encontrar o peso médio, divida a soma dos 
pesos pelo número de adultos na amostra. 
 
 
 
Então, o peso médio dos adultos é aproximadamente 258,6 libras. 
 
 
 
 
 
Exemplo 2.2: 
Encontrando a mediana. 
Encontrea mediana para os pesos listados no Exemplo 2.1. 
274 235 223 268 290 285 235 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
10 
 
Solução: 
Para encontrar o peso mediano, primeiro ordene os dados. 
223 235 235 268 274 285 290 
Em razão de termos sete observações (um número ímpar), a mediana está no meio, 
é a quarta observação. Então, o peso mediano é 268 libras. 
 
 
Exemplo 2.3: 
Encontrando a mediana. 
No Exemplo 2.1, o adulto pesando 285 libras decide não participar do estudo. Qual é 
o peso mediano dos adultos restantes? 
 
274 235 223 268 290 285 235 
Solução: 
Os pesos restantes em ordem são: 
223 235 235 268 274 290 
Em razão de termos seis observações (um número par), a mediana é a média dos 
dois elementos do meio. 
 
Então, o peso mediano dos adultos restantes é 251,5 libras. 
 
 
Exemplo 2.4: 
Os preços (em dólares) de uma amostra de porta-retratos digital estão listados a 
seguir. 
70 10 50 130 80 100 50 120 100 70 
 
a) Ordene os dados. 
b) Determine a média amostral dos preços dos porta-retratos. 
c) Determine o preço mediano dos porta-retratos. 
 
Solução: ????????? 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
11 
 
 
 
Entenda 
A moda é a única medida de tendência central que pode ser usada para descrever 
dados no nível nominal de mensuração. Mas, quando trabalhamos com dados 
quantitativos, ela é raramente utilizada. 
 
 
Exemplo 2.5: 
Encontrando a moda. 
Encontre a moda dos pesos listados no Exemplo 2.1. 
274 235 223 268 290 285 235 
 
Solução: 
Para encontrar a moda, primeiro ordene os dados. 
223 235 235 268 274 285 290 
 
A partir dos dados ordenados, podemos ver que o valor 235 ocorre duas vezes, 
enquanto os demais ocorrem somente uma vez. Então, a moda dos pesos é 235 libras. 
 
 
Exemplo 2.6: 
Encontrando a moda. 
Em um debate político nos Estados Unidos, pede-se a uma amostra dos membros da 
plateia que indique o partido político ao qual pertencem. 
Suas respostas são mostradas na Tabela abaixo. Qual é a moda das respostas? 
 
Preferência por partido político em uma amostra de membros de um debate. 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
12 
 
 
 
 
Solução: 
A resposta que ocorre com maior frequência é “Democrata”. Então, a moda é Partido 
Democrata. 
Interpretação: Nessa amostra havia mais democratas do que pessoas de qualquer 
outra afiliação. 
 
 
Exemplo 2.7: 
condomínios de South Beach (Miami Beach, Flórida) estão listados a seguir. 
Determine a moda dos preços. 
 
 
 
a. Ordene os dados. 
b. Identifique o valor ou valores que ocorrem com maior frequência. 
c. Interprete os resultados no contexto dos dados. 
 
Solução: ????????? 
 
 
 
 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
13 
 
Embora a média, a mediana e a moda descrevam, cada uma, um valor típico de um 
conjunto de dados, há vantagens e desvantagens em seus usos. 
A média é uma medida mais usual e confiável, pois leva em conta cada elemento de 
um conjunto de dados. Contudo, a média pode ser muito afetada quando o conjunto 
de dados contém valores discrepantes (outliers). 
 
 
 
 
Enquanto alguns outliers são dados válidos, outros podem ocorrer por causa de erros 
no registro dos dados. Um conjunto de dados pode ter um ou mais outliers, causando 
lacunas em uma distribuição. As conclusões que são tomadas de um conjunto de 
dados que contém outliers podem ser falhas. 
 
 
Exemplo 2.8: 
Comparando a média, a mediana e a moda. 
Encontre a média, a mediana e a moda da amostra das idades dos alunos de uma 
turma mostradas na Tabela. Qual medida de tendência central melhor descreve um 
valor típico (representante) desse conjunto de dados? Há outliers? 
 
 
 
Solução: 
 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
14 
 
Mediana: Em razão de termos 20 observações (um número par), a mediana é a média 
dos dois elementos do meio. 
 
20 20 20 20 20 20 21 21 21 21 22 22 22 23 23 23 23 24 24 65 
 
 
 
Moda: o valor que ocorre com maior frequência é 20 anos. 
20 20 20 20 20 20 21 21 21 21 22 22 22 23 23 23 23 24 24 65 
 
Interpretação A média leva em consideração todos os valores, mas é influenciada 
pelo outlier de valor 65. A mediana também leva em consideração todos os valores, e 
não é afetada pelo outlier. Nesse caso, a moda existe, mas não parece representar 
um valor típico (região central). Algumas vezes, uma comparação gráfica pode ajudar 
a decidir qual medida de tendência central melhor representa o conjunto de dados. 
O histograma da Figura apresenta a distribuição dos dados e a localização da média, 
da mediana e da moda. Nesse caso, a mediana parece representar melhor o conjunto 
de dados. 
 
Histograma representativo das idades dos alunos de uma turma mostrando medidas 
de tendência central e outlier. 
 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
15 
 
Exemplo 2.9: 
Remova o valor 65 do conjunto de dados do Exemplo 2.8. Então, refaça o exemplo. 
Como a ausência desse outlier muda cada uma das medidas? 
a. Encontre a média, a mediana e a moda. 
b. Compare essas medidas de tendência central com as do Exemplo 7. 
 
 
 
Solução: ????????? 
 
 
 
3. Média ponderada e média de dados agrupados 
Às vezes, os conjuntos de dados possuem valores que têm um efeito maior na média 
do que outros. Para calcular a média de tais conjuntos, você deve encontrar a média 
ponderada. 
 
Definição: 
Uma média ponderada é a média de um conjunto de dados cujos valores têm pesos 
variados. A média ponderada é dada por: 
 
�̅� =
Σ(𝑥. 𝑦)
Σ𝑤
 
 
em que w é o peso de cada valor de x. 
 
Exemplo 3.1: 
Você está frequentando uma disciplina na qual sua nota é determinada com base em 
5 fontes: 
• 50% da média de seu teste; 
• 15% de sua prova bimestral; 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
16 
 
• 20% de sua prova final; 
• 10% de seu trabalho no laboratório de informática e; 
• 5% de seus deveres de casa. 
 
Suas notas são: 86 (média do teste), 96 (prova bimestral), 82 (prova final), 98 
(laboratório) e 100 (dever de casa). Qual é a média ponderada de suas notas? 
 
Solução 
Comece organizando os dados e os pesos em uma tabela. 
 
 
�̅� =
Σ(𝑥. 𝑦)
Σ𝑤
=
88,6
1
= 88,6 
 
Sua média ponderada para o curso é 88,6. 
 
 
Exemplo 3.2: 
Houve um erro no cálculo da nota de seu prova final. Em vez de 82, você obteve 98. 
Qual é a sua nova média ponderada? 
a) Multiplique cada nota por seu peso e encontre a soma desses produtos. 
b) Determine a soma dos pesos. 
c) Calcule a média ponderada. 
d) Interprete os resultados no contexto dos dados. 
 
Solução: ???????? 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
17 
 
Para dados apresentados em uma distribuição de frequência, você pode aproximar a 
média como mostrado na próxima definição. 
 
Definição: 
A média de uma distribuição de frequência para uma amostra é aproximadapor: 
 
�̅� =
Σ(𝑥. 𝑓)
n
 𝒏𝒐𝒕𝒂 𝒒𝒖𝒆 𝒏 = 𝚺𝒇 
 
em que x e f são os pontos médios e as frequências de cada classe, respectivamente. 
 
 
Encontrando a média de uma distribuição de frequência 
 
1) Determine o ponto médio de cada 
classe. 
 
𝑥 =
𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 − 𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
2
 
2) Calcule a soma dos produtos dos 
pontos médios pelas frequências 
 
Σ(𝑥. 𝑓) 
3) Calcule a soma das frequências. 
 
n = Σ𝑓 
4) Determine a média da distribuição 
de frequência. 
�̅� =
Σ(𝑥. 𝑓)
𝑛
 
 
 
Exemplo 3.3: 
Encontrando a média de uma distribuição de frequência. 
Use a distribuição de frequência da tabela para aproximar o número médio de minutos 
que uma amostra de usuários de internet gastou on-line durante sua mais recente 
conexão. 
 
Dados e operações para o cálculo da média em dados agrupados em classes. 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
18 
 
 
Ponto médio 
das classes, 𝑥 
Frequência, 
𝑓 
𝑥. 𝑓 
12,5 6 75,0 
24,5 10 245,0 
36,5 13 474,5 
48,5 8 388,0 
60,5 5 302,5 
72,5 6 435,0 
84,5 2 169,0 
 𝒏 = 𝟓𝟎 𝚺 = 𝟐𝟎𝟖𝟗 
 
Solução: 
�̅� =
Σ(𝑥. 𝑓)
𝑛
=
2089
50
 ≈ 41,8 
 
Logo, o tempo médio gasto on-line foi de aproximadamente 41,8 minutos. 
 
 
 
Exemplo 3.4: 
Use uma distribuição de frequência para aproximar a idade média das 50 mulheres 
mais influentes do mundo conforme exercício resolvido 1.1. 
Os dados a seguir representam as idades das 50 mulheres mais influentes do mundo, 
em 2012. (Fonte: Forbes.) 
 
26, 31, 35, 37, 43, 43, 43, 44, 45, 47, 48, 48, 49, 50, 51, 51, 51, 51, 52, 54, 54, 54, 54, 
55, 55, 55, 56, 57, 57, 57, 58, 58, 58, 58, 59. 59, 59, 62, 62, 63, 64, 65, 65, 65, 66, 66, 
67, 67, 72, 86. 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
19 
 
 
 
a) Determine o ponto médio de cada classe. 
b) Calcule a soma dos produtos de cada ponto médio e sua frequência 
correspondente. 
c) Calcule a soma das frequências. 
d) Determine a média da distribuição de frequência. 
 
Solução: ????? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
20 
 
4. Medidas de Variação (dispersão) 
Amplitude 
Vamos aprender as diferentes maneiras de medir a variação (ou dispersão) de um 
conjunto de dados. A medida mais simples é a amplitude do conjunto. 
 
 
 
 
Exemplo 4.1: 
Encontrando a amplitude de um conjunto de dados. 
Duas empresas contrataram 10 formandos cada. O salário inicial para cada formando 
é mostrado nas tabelas (a) e (b). Encontre a amplitude dos salários iniciais para a 
empresa A. 
 
(a) Salários iniciais para a empresa A (em milhares de dólares). 
 
 
(b) Salários iniciais para a empresa B (em milhares de dólares). 
 
 
Solução: 
 
a) Ordenar os dados ajuda a encontrar os salários mínimos e máximos. 
 
 
 
Amplitude = (salário máximo) – (salário mínimo) 
Amplitude = 47 – 37 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
21 
 
Amplitude = 10 
 
Então, a amplitude dos salários iniciais para a empresa A é 10 ou US$ 10.000. 
 
b) Ordenar os dados ajuda a encontrar os salários mínimos e máximos. 
 
23 29 32 40 41 41 49 50 52 58 
 
Amplitude = (salário máximo) – (salário mínimo) 
Amplitude = 58 – 23 
Amplitude = 35 
 
 
c) Ambos os conjuntos de dados têm média de 41,5, ou US$ 41.500, mediana de 41, 
ou US$ 41.000, e moda de 41, ou US$ 41.000. E ainda os dois conjuntos diferem 
significantemente. A diferença é que os valores no segundo conjunto têm uma 
variação maior. Como pode ser observado nas figuras (a) e (b), os salários iniciais 
para a empresa B estão mais dispersos que os da empresa A. 
 
Histograma representativo dos salários iniciais das empresas A e B. 
 
(a) Empresa A. 
 
 
(b) Empresa B. 
 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
22 
 
5. Variância e desvio padrão 
Como uma medida de variação, a amplitude tem a vantagem de ser fácil de 
calcular. Sua desvantagem, entretanto, é que ela usa somente dois valores do 
conjunto de dados. 
Duas medidas de variação que usam todos os valores do conjunto de dados são: 
• a variância; 
• e o desvio padrão. 
 
Porém, antes de aprendermos essas medidas, precisamos entender o que 
chamamos desvio de um valor no conjunto de dados. 
 
 
 
Considere os salários iniciais da empresa A do Exemplo 4.1. 
 
 
 
O salário inicial médio é 𝜇 = 415/10 = 41,5 ou US$ 41.500. A Tabela abaixo lista 
os desvios de cada salário em relação à média. 
Por exemplo, o desvio de 41 é 41 – 41,5 = –0,5. 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
23 
 
Note que a soma dos desvios é 0. De fato, a soma dos desvios para qualquer 
conjunto de dados é 0. Então, não faz sentido encontrar a média dos desvios. 
Para superar esse problema, tomamos o quadrado de cada desvio. A soma dos 
quadrados dos desvios, ou soma dos quadrados, é indicada por SSx. Em uma 
população, a média dos quadrados dos desvios é a variância populacional. 
 
 
 
Como uma medida de variação, uma desvantagem da variância é que sua 
unidade de medida é diferente da unidade de medida do conjunto de dados. 
Por exemplo, a variância para os salários iniciais (em milhares de dólares) no 
Exemplo 4.1 é medida em “milhares de dólares quadrados”. Para superar esse 
problema, tiramos a raiz quadrada da variância para obter o desvio padrão. 
 
 
 
Algumas observações sobre o desvio padrão. 
• O desvio padrão mede a variação dos dados com relação à média e tem a 
mesma unidade de medida que o conjunto de dados. 
• O desvio padrão é sempre maior ou igual a 0. Quando 𝜎 = 0, o conjunto de 
dados não apresenta variação (todos os elementos têm o mesmo valor). 
• À medida que os valores se afastam da média (isto é, estão mais dispersos), o 
valor de 𝜎 aumenta. 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
24 
 
Para encontrar a variância e o desvio padrão de um conjunto de dados populacional, 
siga as instruções a seguir. 
 
 
 
Exemplo 5.1: 
Encontre a variância e o desvio padrão populacionais dos salários iniciais para a 
empresa A. Dados no Exemplo 4.1. 
 
Salários iniciais para a empresa A (em milhares de dólares). 
 
 
 
Solução: 
Para esse conjunto de dados, N = 10 e Σx = 415. A média é m = 415/10 = 41,5. A 
Tabela resume os passos usados para encontrar 𝑆𝑆𝑥. 
 
Soma dos quadrados dos desvios relativos aos salários iniciais para a empresa A. 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
25 
 
 
 
𝑆𝑆𝑥 = 88,5 𝜎
2 =
88,5
10
≈ 8,9 𝜎 = ඨ
88,5
10
≈ 3,0 
 
Assim, a variância populacional é de aproximadamente 8,9, e o desvio padrão 
populacional é de aproximadamente 3,0 ou US$ 3.000. 
 
 
Exemplo 5.2: 
Encontre a variância e o desvio padrão populacionais dos salários iniciais para a 
empresa B no Exemplo 4.1. 
 
 
 
a) Calcule a média e cada desvio. 
b) Faça o quadrado de cada desvio e some para obter a soma dos quadrados. 
c) Divida por N para obter a variância populacional. 
d) Calcule a raiz quadrada da variância populacional para obter o desvio padrão 
populacional. 
e) Interprete os resultados fornecendo o desviopadrão populacional em dólares. 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
26 
 
Solução: 
 
Salário 
x 
Desvio 
(𝑥 − 𝜇) 
Desvio 
(𝑥 − 𝜇)2 
 
 
 
 
 
 
 
 
 
 
𝚺𝐱 = 𝑺𝑺𝑿 = 
 
 
 
As fórmulas exibidas no quadro Definição a seguir para a variância amostral s2 e o 
desvio padrão amostral s diferem ligeiramente daquelas para a população. Por 
exemplo, para encontrar s, a fórmula usa x. Além disso, SSx é dividido por n – 1. Por 
que dividir por uma unidade a menos do total de elementos? Em muitos casos, uma 
estatística é calculada para estimar o parâmetro correspondente, tal como usar x para 
estimar m. A teoria estatística tem mostrado que as melhores estimativas de s2 e s 
são obtidas ao dividir SSx por n – 1 nas fórmulas para s2 e s. 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
27 
 
 
 
A Tabela abaixo resume os símbolos usuais e indicações operacionais relativas a 
variância e desvio padrão. 
 
 
 
 
Exemplo 5.3: 
Encontrando a variância e o desvio padrão amostral. 
Em um estudo com jogadores de futebol americano do ensino médio que sofreram 
lesões, os pesquisadores colocaram os jogadores em dois grupos. Jogadores que se 
recuperaram das concussões em 14 dias ou menos foram colocados no grupo 1. 
Aqueles que levaram mais de 14 dias foram para o grupo 2. Os tempos de 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
28 
 
recuperação (em dias) para o grupo 1 estão listados a seguir. Encontre a variância e 
o desvio padrão amostrais dos tempos de recuperação. 
(Adaptado de: The American Journal of Sports Medicine.) 
 
4 7 6 7 9 5 8 10 9 8 7 10 
 
Solução 
Para esse conjunto de dados, n = 12 e Σx = 90. A média é �̅� = 90/12 = 7,5. Para 
calcular 𝑠2 e s, note que n – 1 = 12 – 1 = 11. 
 
 
 
Logo, a variância amostral é, aproximadamente, 3,5 e o desvio padrão amostral é, 
aproximadamente, 1,9 dia. 
 
 
 
 
 
http://www.portaleletronica.com.br/
Estatística e Probabilidade 
Estatística Descritiva (Teoria) – Rev2 
 
www.portaleletronica.com.br 
 
29 
 
Exemplo 5.4: 
Veja o estudo do Exemplo 5.3. Os tempos de recuperação (em dias) para o grupo 2 
estão listados a seguir. Encontre a variância e o desvio padrão amostrais dos tempos 
de recuperação. 
 
43 57 18 45 47 33 49 24 
 
a) Calcule a soma dos quadrados. 
b) Divida por n – 1 para obter a variância amostral. 
c) Calcule a raiz quadrada da variância amostral para obter o desvio padrão 
amostral. 
http://www.portaleletronica.com.br/

Outros materiais