Buscar

est estatística resumo 2_EVP

Prévia do material em texto

NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 1 
 
MEDIDAS DE POSIÇÃO 
Fornecem um indicativo acerca do posicionamento dos dados. Podem ser de dois 
tipos: 
• Medidas de tendência central: indicam o centro da distribuição de dados 
(média, mediana, moda) 
• Medidas separatrizes: separam o conjunto de dados de maneiras bem 
específicas (mediana, quartis, decis, percentis) 
 
MÉDIA (��) 
A média aritmética dos dados é dada pela soma dos valores observados, dividida pelo 
total de observações. 
 
Exemplo de cálculo de média para dados em ROL: 
1, 2, 2, 2, 3, 4, 4, 5, 6, 7 
 
�� =
∑��
�
=
1 + 2 + 2 + 2 + 3 + 4 + 4 + 5 + 6 + 7
10
= 3,6 
 
Exemplo de cálculo de média para dados agrupados por valor: 
Salários Frequência absoluta simples = Salário x frequência 
1 1 1 
2 3 6 
3 1 3 
4 2 8 
5 1 5 
6 1 6 
7 1 7 
TOTAL 10 36 
 
�� =
36
10
= 3,6 
 
Exemplo de cálculo de média para dados em classe: 
NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 2 
 
Classes de valores Ponto médio 
Frequência absoluta 
simples 
Ponto médio x 
frequência 
[1;4) 2,5 5 12,5 
[4;7) 5,5 4 22 
[7;10) 8,5 1 8,5 
Total 10 43 
 
�� =
43
10
= 4,3 
Vejam que, quando temos dados em classe, perdemos informação. Assim, precisamos 
fazer algumas considerações. Consideramos que as frequências se referem aos pontos 
médios das classes. Por isso a média deu 4,3, diferente do valor 3,6 encontrado 
anteriormente. 
 
Procedimento opcional: utilizar a variável auxiliar “d”. 
Como fazer? 
Subtrair cada valor de X do ponto de maior frequência (2,5) e dividir pela amplitude de 
classe (3). 
Assim: 
X � =
� − 2,5
3
 
2,5 0 
5,5 1 
8,5 2 
 
Em seguida, calculamos a média para “d”: 
� Frequência absoluta 
simples 
� × � 
0 5 0 
1 4 4 
2 1 2 
 10 6 
�̅ =
6
10
= 0,6 
Agora usamos as propriedades da média para calcular a média de X: 
� =
� − 2,5
3
 
� = 3� + 2,5 
�� = 3�̅ + 2,5 = 3 × 0,6 + 2,5 = 4,3 
NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 3 
 
Vantagem do procedimento: facilita as contas, caso os valores de X sejam difíceis de se 
trabalhar. 
 
MÉDIA PONDERADA 
Multiplicamos cada valor pelo seu peso. Em seguida somamos. Depois dividimos pela 
soma dos pesos. 
Exemplo: nota da P1 igual a 9,5 e peso 1. 
Nota da P2 igual a 7,5 e peso 3. 
A média ponderada fica: 
1 × 9,5 + 3 × 7,5
1 + 3
= 8 
A média ponderada é igual a 8. 
 
PROPRIEDADES DAS MEDIDAS DE POSIÇÃO 
Somando uma constante k a cada elemento do conjunto de dados, a média também é 
somada de “k”. 
Subtraindo uma constante k de cada elemento do conjunto de dados, a média também 
é subtraída de “k”. 
Multiplicando cada elemento do conjunto de dados por uma constante “k”, a média 
fica multiplicada pela mesma constante. 
Dividindo cada elemento do conjunto de dados por uma constante “k”, a média fica 
dividida pela mesma constante. 
 
Tudo isso vale também para mediana e moda. 
 
MÉDIA GEOMÉTRICA E MÉDIA HARMÔNICA 
Por definição, a média geométrica de n valores não negativos (X1, X2, ..., Xn) é: 
n
n
i
i
n
n XXXXG ∏
=
=×××=
1
21 ... 
Ou seja, calculamos o produto de todos os valores. Depois tiramos a raiz “enésima”. 
 
Por definição, a média harmônica de n valores diferentes de zero (X1, X2, ..., Xn) é: 
1
1
11
−
=
−






= ∑
n
i
iX
n
H 
Ou seja: 
NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 4 
 
• Calculamos os inversos dos valores; 
• Em seguida, determinamos a média aritmética desses inversos; 
• Posteriormente, invertemos o resultado, obtendo a média harmônica 
 
Vamos ver alguns exemplos que fica mais fácil. 
Suponhamos que nossos dados são apenas: 3 e 12. Apenas dois números (para facilitar 
as contas). 
Para calcular a média aritmética, conforme vimos na seção anterior, ficamos com: 
5,7
2
123
=
+
=X 
A média geométrica é diferente. Para obtê-la, multiplicamos todos os dados. Depois 
tiramos a raiz “enésima”. Como neste caso são apenas dois valores, será a raiz 
quadrada. 
61232 =×=G 
A média harmônica é um pouco mais complicada. Vamos dividir em três passos. 
Primeiro passo: achamos os recíprocos de cada valor. 
Para obter o recíproco de um número, basta inverter seu numerador com seu 
denominador. Vamos a um exemplo. 
Tomemos o número 
3
2
. Seu recíproco é 
2
3
. 
No nosso caso, os valores são 3 e 12. 
O recíproco de 3 é 
3
1
. 
O recíproco de 12 é 
12
1
. 
 
Segundo passo: calculamos a média aritmética dos recíprocos. 
Ficamos com: 
24
5
2
12
14
2
12
1
3
1
=
+
=
+
 
Terceiro passo: calculamos o recíproco do valor obtido acima. Pronto. Esta é a média 
harmônica. 
5
24
=H 
8,4=H 
NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 5 
 
Se resumirmos todos esses três passos numa frase, podemos dizer que a média 
harmônica é o recíproco da média aritmética dos recíprocos dos valores. 
Uma coisa que cai bastante em concurso não é essa parte de contas. É simplesmente 
saber o seguinte: 
Para qualquer conjunto de n números positivos, a média harmônica é menor ou igual à 
média geométrica e esta é menor ou igual à média aritmética. A igualdade só ocorre se 
todos os números forem iguais entre si. 
Vamos olhar no caso dos números 3 e 12. A média aritmética foi de 7,5. Foi a maior 
das médias. A média harmônica foi de 4,8. Foi a menor das três. E a média geométrica 
foi de 6, o valor intermediário. 
Se, em vez de 3 e 12, os valores fossem 12 e 12, aí teríamos: 
12=== HGX 
Quando todos os valores são iguais, as médias coincidem. 
Resumindo, o que geralmente cai em prova é saber que: 
XGH ≤≤ (e a igualdade só ocorre se todos os dados forem iguais) 
 
MEDIDAS SEPARATRIZES 
Medidas separatrizes são medidas que separam os dados de forma bem específica. 
A medida separatriz mais importante é a mediana. Além de ser uma medida separatriz, 
ela é uma medida de tendência central. Ela, assim como a média e a moda, nos indica 
um valor em torno do qual os dados “giram”. 
Além de ser uma medida de tendência central, ela também é uma medida separatriz. 
Isto porque ela separa os dados de uma forma bem específica. Sendo a mediana o 
termo do meio, ela deixa metade dos dados à sua esquerda e a outra metade à sua 
direita. 
Outra medida separatriz é o quartil. São três quartis, dividindo a seqüência de dados 
em quatro partes iguais (em quatro partes com o mesmo número de termos). 
O primeiro quartil separa a sequência de dados de forma que à sua esquerda fiquem 
25% dos valores e à sua direita 75%. Assim, o primeiro quartil é o valor que não é 
superado por 25% das observações. 
O segundo quartil coincide com a mediana, deixando 50% dos valores de cada lado. 
O terceiro quartil deixa à sua esquerda 75% dos valores e à sua direita 25%. Logo, o 
terceiro quartil é o valor que não é superado por 75% das observações. 
Outra medida separatriz é o decil. São nove decis que dividem a série em dez partes 
iguais. 
O primeiro decil deixa à sua esquerda 10% dos valores; à sua direita 90% (ou seja, não 
é superado por 10% das observações). O segundo decil deixa à sua esquerda 20% dos 
valores; à sua direita 80%. E assim por diante. 
NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 6 
 
O quinto decil coincide com a mediana, deixando 50% dos valores de cada lado. 
A última medida separatriz que veremos é o percentil. O primeiro percentil deixa àsua 
esquerda 1% dos valores e à sua direita 99% (ou seja, não é superado por 1% das 
observações). O segundo percentil deixa à sua esquerda 2% dos valores e à sua direita 
98%. E assim por diante. O quinquagésimo percentil coincide com a mediana, deixando 
50% dos valores de cada lado. 
 
Mediana para dados em ROL. 
O termo que ocupa a posição central é a mediana. 
Se o conjunto tiver um número par de elementos, a mediana é a média dos dois 
termos centrais. 
Exemplo: 
1, 2, 2, 2, 3, 4, 4, 5, 6, 7 
Dados centrais destacados em vermelho. 
� =
3 + 4
2
= 3,5 
 
Quartis para dados em ROL 
A mediana coincide com o segundo quartil. Ela divide o conjunto em duas partes 
iguais. 
A mediana da primeira parte é o primeiro quartil. 
A mediana da segunda parte é o terceiro quartil. 
Obs: amplitude interquartílica: �� − �� 
 
Medidas separatrizes para dados em classe 
Usar interpolação linear a partir dos valores de frequências acumuladas. 
Exemplo: 
AFRF 2003 [ESAF] 
Considere a tabela de frequências seguinte correspondente a uma amostra da variável 
X. Não existem observações coincidentes com os extremos das classes. 
 
NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 7 
 
Classes Frequências Acumuladas 
2.000 – 4.000 5 
4.000 – 6.000 16 
6.000 – 8.000 42 
8.000 – 10.000 77 
10.000 – 12.000 89 
12.000 – 14.000 100 
 
Assinale a opção que corresponde à estimativa do valor x da distribuição amostral de X 
que não é superado por cerca de 80% das observações. 
a) 10.000 
b) 12.000 
c) 12.500 
d) 11.000 
e) 10.500 
 
Primeiro localizamos os valores com frequências próximas de 80%: 
Classes Frequências Acumuladas 
2.000 – 4.000 5 
4.000 – 6.000 16 
6.000 – 8.000 42 
8.000 – 10.000 77 
10.000 – 12.000 89 
12.000 – 14.000 100 
 
Na interpolação linear, nós vamos fazer o seguinte. Fazemos a segunda linha menos a 
primeira. Fazemos a terceira linha menos a primeira. 
Primeira linha 10.000 77 
Segunda linha Z 80 
Terceira linha 12.000 89 
Subtraindo, ficamos com: 
000.10−Z 7780 − 
000.10000.12 − 7789 − 
A interpolação linear nos diz que as diferenças das linhas de baixo com a linha de cima 
são proporcionais. 
7789
7780
000.10000.12
000.10
−
−
=
−
−Z
 
 
NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 8 
 
Isolando o Z, temos: 
12
3000.2000.10 ×+=Z 
500.10=Z 
Concluindo: O valor 10.500 não é superado por 80 observações. 
 
MODA 
Corresponde ao termo de maior frequência simples. 
Se os dados estiverem em classe, usamos a moda de Czuber: 
)()( postMantM
antM
M ffff
ffhlM
−+−
−
+= 
Exemplo: 
SEFAZ BA 2004 [FCC] 
Considere a tabela abaixo, que mostra a distribuição de salários (em reais) de 160 
funcionários de determinada empresa, com suas respectivas frequências relativas 
acumuladas. Classes em reais Frequência relativa acumulada (%) 
Classes em 
reais 
Frequência relativa 
acumulada (%) 
[600,1000) 10 
[1000,1400) 30 
[1400,1800) 70 
[1800,2200) 95 
[2200,2600) 100 
 
O valor modal dos salários (desprezando os centavos), é: 
a) 1784 
b) 1666 
c) 1648 
d) 1636 
e) 1628 
 
Primeira consideração: a moda está na classe de maior frequência simples. É a classe 
modal: 
NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 9 
 
 Classes Frequência simples (%) 
 [600,1000) 10 
Classe anterior [1000,1400) 20 
Classe modal [1400,1800) 40 
Classe posterior [1800,2200) 25 
 [2200,2600) 5 
Segundo passo: determinar os valores de amplitude, frequência e limite inferior da 
classe modal. 
A classe modal é a de [1400,1800). 
Qual sua amplitude? 
A amplitude da classe é a diferença entre o limite superior e o limite inferior. No caso: 
=h 40014001800 =− 
Logo, sua amplitude é de 400 (h = 400). 
A frequência da classe modal é de 40% (fmo = 0,4). Basta olhar na tabela fornecida 
acima. 
O limite inferior da classe modal é 1400 (lM = 1400). 
 
Terceiro passo: determinar os valores das frequências das classes anterior e posterior. 
A classe que vem logo antes da classe modal é a classe [1000,1400). Esta é a classe 
anterior. A frequência da classe anterior é 20% (fant = 0,2). 
A classe que vem logo depois da classe modal é a classe [1800,2200). Esta é a classe 
posterior. A frequência da classe posterior é 25% (fpost = 0,25). 
 
Identificados todos esses elementos, basta aplicar uma fórmula. É a chamada fórmula 
de Czuber. Esta fórmula é fruto de uma segunda consideração. Ela considera que os 
valores das frequências se comportam segundo uma parábola. É claro que nós não 
vamos ficar desenhando gráficos de parábola. Para concurso, é muito mais prático 
gravar logo a fórmula de Czuber. 
Resumindo: quando os dados estão em classes, o cálculo da moda se resume à 
aplicação da seguinte fórmula (de Czuber): 
)()( postMantM
antM
M ffff
ffhlM
−+−
−
+= 
 
Onde: 
• lM é o limite inferior da classe modal 
• h é a amplitude da classe modal 
• fM é a frequência simples da classe modal 
NOTAS DE AULA – ESTATÍSTICA 
PROF. VÍTOR MENEZES 
 
Prof. Vítor Menezes Santana 10 
 
• fant é a frequência da classe anterior 
• fpost é a frequência da classe posterior 
 
Substituindo os valores: 
)()( postMantM
antM
M ffff
ffhlM
−+−
−
+= 
57,1628)25,04,0()2,04,0(
2,04,04001400 =
−+−
−
×+=M 
Gabarito: E. 
 
Observação: existem outras modas, quase nunca cobradas em prova. 
• King: 
postant
post
M ff
f
hlM
+
+= 
• Bruta: considerar que a moda é igual ao ponto médio da classe modal 
• Pearson: XDM 23 −≅ (onde D é a mediana)

Continue navegando