Buscar

AULA 05 MEDIDAS NUMERICAS DESCRITIVAS (PARTE 01)

Prévia do material em texto

Probabilidade 
e 
Estatística
⊷Profa. Kellen Lima
AULA 05
CAPÍTULO 03
MEDIDAS NUMÉRICAS DESCRITIVAS
Levine et al. (2011)
“
3.1 Objetivos da Aula
NESTA AULA, VOCÊ APRENDERÁ:
MEDIDAS DE TENDÊNCIA CENTRAL
Médias (aritmética e ponderada);
Mediana;
Moda;
MEDIDAS SEPARATRIZES 
(quantis  quartis, decis, centis)
“
3.2 Medidas Numéricas Descritivas
TENDÊNCIA CENTRAL
Corresponde à extensão na qual todos os
valores de dados se agrupam em torno de um 
valor central típico.
VARIAÇÃO
Corresponde ao montante da dispersão de 
valores em relação a um valor central.
FORMATO
Corresponde ao padrão da distribuição de 
valores, do valor mais baixo para o mais alto.
“
3.3 Medidas de Tendência Central
Medidas tipicamente usadas:
Médias (aritmética e ponderada)
Mediana
Moda
Medidas separatrizes 
(quantis  quartis, decis, centis)
“
3.3.1 Média Aritmética
3.3 Medidas de Tendência Central
Para uma amostra de tamanho n:
n
XXX
n
X
X n21
n
1i
i 


 
A média de um conjunto de valores numéricos é
calculada somando-se todos os valores e
dividindo-se o resultado pelo número de
elementos somados
Onde:
Ponto de 
equilíbrio; 
É a medida
de 
tendência
central 
mais
comum;
Afetada por
valores
extremos
(outliers);
Todos os
valores
desenpen
ham o 
mesmo
papel. 
0 1 2 3 4 5 6 7 8 9 10
Média = 3
3
5
15
5
54321


Média = 4
0 1 2 3 4 5 6 7 8 9 10
4
5
20
5
104321


“
3.3.1.1 Propriedades da Média Aritmética
3.3 Medidas de Tendência Central
1ª PROPRIEDADE
A média aritmética de 
um conjunto de 
dados que não varia, 
ou seja, cujos valores 
são uma constante, é 
a própria constante.
Exemplo: 
𝑿𝒊 = 𝟒, 𝟒, 𝟒, 𝟒
 𝑿 = 𝟒
𝑋𝑖 = 9, 7, 5, 10, 4
 𝑋 = 7
𝑆𝑜𝑚𝑎𝑟 𝑐𝑜𝑛𝑡𝑎𝑛𝑡𝑒 𝑐 = 2 ;
𝐸𝑛𝑡ã𝑜: 𝑋𝑖 + 2 = 11, 9, 7, 12, 6
 𝑋𝑋𝑖+2 =
 (𝑋𝑖 + 2)
𝑛
=
11 + 9 + 7 + 12 + 6
5
=
45
5
= 9
𝐿𝑜𝑔𝑜,
 𝑋𝑋𝑖+2 = 7 + 2
 𝑋𝑋𝑖+𝑐 =
 𝑋 + 2
2ª PROPRIEDADE
Ao somar uma 
constante c para 
todos os valores de 
um conjunto de 
dados, sua média 
também é somada por 
esta constante.
Exemplo: 
𝑋𝑖 = 9, 7, 5, 10, 4
 𝑋 = 7
𝑀𝑢𝑙𝑡𝑖𝑝𝑙𝑖𝑐𝑎𝑟 𝑝𝑜𝑟 𝑐 = 2
𝐸𝑛𝑡ã𝑜: 2𝑋𝑖 = 18, 14, 10, 20, 8
 𝑋2𝑋𝑖 =
 2𝑋𝑖
𝑛
=
18 + 14 + 10 + 20 + 8
5
=
70
5
= 14
𝐿𝑜𝑔𝑜:
 𝑋2𝑋𝑖 = 2 × 7
 𝑋𝑐𝑋𝑖 = 𝑐
 𝑋
3ª PROPRIEDADE
Ao multiplicar uma 
constante c por todos 
os valores de um 
conjunto de dados, 
sua média também é 
multiplicada por esta 
constante.
Exemplo:
4ª PROPRIEDADE
A SOMA DE TODOS 
OS DESVIOS EM 
RELAÇÃO À MÉDIA 
DE UM CONJUNTO DE 
VALORES É NULA. 
Exemplo:
 (𝑋𝑖 − 𝑋) = 0
DESVIO
Diferença entre observação e média aritmética
𝑿𝒊 = 𝟗, 𝟕, 𝟓, 𝟏𝟎, 𝟒
 𝑿 = 𝟕
Observado Desvio
𝒊 𝑿𝒊 𝑿𝒊 − 𝑿
1 9 9 – 7 = 2
2 7 7 – 7 = 0
3 5 5 – 7 = -2
4 10 10 – 7 = 3
5 4 4 – 7 = -3
 
35 0
PROVA 2012.2 – O valor do módulo de Young (GPa) foi determinado para
chapas fundidas feitas de algumas substâncias metálicas, resultando nas
observações a seguir:
116,4 115,9 114,6 115,2 115,8
(a) Calcule a média aritmética e os desvios (somente os desvios e não o desvio-
padrão!) em relação à média. Média = 115,58 Desvios = 0,82 0,32 -0,98 -0,38
0,22
?????????????????????????????????????????????????????????????????
(a) Calcule a variância e o desvio-padrão. S2 = 0,482 S= 0,69
(b) Subtraia 100 de cada observação para obter uma amostra de valores
transformados. A partir desta nova amostra, calcule somente os desvios em
relação à nova média, e compare com os dados originais. O que você percebeu
nos valores dos desvios da nova amostra quando comparados com a amostra
original? Desvios = 0,82 0,32 -0,98 -0,38 0,22.
(c) Sem precisar fazer cálculos, o que você acredita que ocorra com a nova
variância e o desvio-padrão, após a subtração de 100 unidades dos dados
originais? Portanto, ao subtraímos uma constante dos dados originais, a
variância e o desvio-padrão não serão modificados.
PROVA 2013.1 – Para um conjunto de quatro números cuja
média aritmética simples é 2.5, se incluirmos o número 8
neste conjunto, quanto passará a ser a nova média
aritmética simples?
 𝑋 =
 𝑖=1
𝑛 𝑋𝑖
𝑛
 𝑋𝑖
4
= 2,5
 𝑋𝑖 = 2,5 ∗ 4
 𝑋𝑖 = 10
 𝑋𝑖
𝑛
=
10 + 8
4 + 1
=
18
5
= 3,6
“
3.3.2 Média Ponderada
3.3 Medidas de Tendência Central
Nos cálculos envolvendo média aritmética simples, todas as
ocorrências têm exatamente a mesma importância ou o
mesmo peso. Então, dizemos que elas têm o mesmo peso
relativo.
No entanto, existem casos onde as ocorrências têm
importância relativa diferente. Nestes casos, o cálculo da
média deve levar em conta esta importância relativa ou peso
relativo.
 𝑿𝑷 =
 𝒊=𝟏
𝒏 𝒑𝒊 ∙ 𝒙𝒊
 𝒊=𝟏
𝒏 𝒑𝒊
=
𝒑𝟏 ∙ 𝒙𝟏 + 𝒑𝟐 ∙ 𝒙𝟐 +⋯+ 𝒑𝒏 ∙ 𝒙𝒏
𝒑𝟏 + 𝒑𝟐 +⋯+ 𝒑𝒏
Onde:
Um candidato participou de um concurso, onde foram
realizadas provas de Português, Matemática, Biologia e
História. Essas provas tinham pesos 3, 3, 2 e 2,
respectivamente. Sabendo que o candidato tirou 8,0 em
Português, 7,5 em Matemática, 5,0 em Biologia e 4,0 em
História, qual foi a média que ele obteve?
 𝑿𝑷 =
𝟖, 𝟎 × 𝟑 + 𝟕, 𝟓 × 𝟑 + 𝟓, 𝟎 × 𝟐 + 𝟒, 𝟎 × 𝟐
𝟑 + 𝟑 + 𝟐 + 𝟐
 𝑿𝑷 =
𝟔𝟒,𝟓
𝟏𝟎
= 𝟔, 𝟒𝟓
Portanto, a média do candidato foi de 6,45
RESOLUÇÃO
“
3.3.3 Mediana
3.3 Medidas de Tendência Central
0 1 2 3 4 5 6 7 8 9 10
Mediana = 4
0 1 2 3 4 5 6 7 8 9 10
Mediana = 4
Em um rol, a mediana
é o “número” do meio, 
(50% acima, 50% 
abaixo).
Não é afetada por
valores extremos
(outliers).
Ordenar os dados de maneira CRESCENTE!!!
“
3.3.3.1 Localizando a Mediana
3.3 Medidas de Tendência Central
OBS: Note que, (n+1)/2 NÃO é o valor da mediana, apenas a posição
da mediana nos dados ordenados.
REGRA 02 - Se o número de valores é PAR, 
a mediana é a média dos dois valores do meio;
REGRA 01 - Se o número de valores é ÍMPAR, 
a mediana é o número do meio;
A mediana de um conjunto de dados ordenados é localizada no
(n+1)/2 valor;
Dada uma série de valores: 5, 13, 10, 2, 18, 15, 6,
16, 9. Qual é o valor da mediana?
1°) Ordenar os dados de maneira CRESCENTE: 
2, 5, 6, 9, 10, 13, 15, 16, 18
2°) n = VALOR ÍMPAR = 9
3°) Logo, a mediana é igual ao valor do meio da série ordenada, 
ou seja, 10.
RESOLUÇÃO
n = VALOR ÍMPAR
Dada uma série de valores: 52, 44, 29, 44, 35,
39, 40, 31, 39, 43. Qual é o valor da mediana?
1°) Ordenar os dados de maneira CRESCENTE: 
29, 31, 35, 39, 39, 40, 43, 44, 44, 52
2°) n = VALOR PAR = 10
3°) Aplicar (n+1)/2 para encontrar a posição dos valores:
(10+1)/2 = 5,5
4°) Logo, devemos fazer a média entre o 5° e 6° valores na ordem de 
classificação;
5°) Portanto, a mediana é igual a (39+40)/2 = 39,5
RESOLUÇÃO
n = VALOR PAR
PROVA 2015.2 – Os valores de pressão sanguínea frequentemente
são informados com aproximação de 5 mmHg (100, 105, 110, etc.
Portanto, use essa condição na resolução do problema!). Suponha
que os valores reais (sem aproximação) de pressão sanguínea de
nove indivíduos selecionados aleatoriamente sejam:
118,6 126,4 138,4 130,0 113,7 122,0 108,3 131,5 134,2
(a) Qual é a mediana dos valores de pressão sanguínea?
(b) Suponha que a pressão sanguínea do segundo indivíduo seja
128,6 em vez de 126,4 (uma pequena alteração em um único valor).
Como isso afeta a mediana dos valores informados? O que isso diz
sobre a sensibilidade da mediana ao arredondamento dos dados?
1) Ordenar os dados:110, 115, 120, 120, 125, 130, 130, 135 e 140
Deste modo, a mediana será 125
2) Então, substituindo 128.6 por 126.4, agora a nova mediana é 130, ou seja,
um mudança substancial. Isto nos mostra que quando há arredondamento no
conjunto de dados, a mediana é altamente sensível a pequenas
modificações.
“
3.3.4 Moda
3.3 Medidas de Tendência Central
Valor que ocorre com maior
frequência;
Não é afetada por
valores
extremos;
Usada tanto para dados numéricos
quanto para dados categóricos;
Pode não haver
moda e pode haver
várias modas.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Sem Moda
Considere os dados a seguir sobre a concentração do
receptor transferrina de uma amostra em mulheres
grávidas com evidências laboratoriais de uma visível
anemia por deficiência de ferro. Calcule a média, mediana e
a moda destes valores.
15,2 9,3 7,6 11,9 10,4 9,7
20,4 9,4 11,5 16,2 9,4 8,3
1°) Ordenar os dados: 
7,6 8,3 9,3 9,4 9,4 9,7 10,4 11,5 11,9 15,2 16,2 20,4
2°) Cálculo da média = = 11,61
3°) Cálculo da mediana 
 par 
 (n+1)/2 
 (12+1)/2 = 6,5 (posição) 
 média entre o 6° e 7° valores = (9,7+10,4)/2 = 10,05
4°) Moda = 9,4
RESOLUÇÃO
n
XXX
n
X
X n21
n
1i
i 


 
“
3.3.5 Qual medida escolher?
3.3 Medidas de Tendência Central
A média geralmente é usada, exceto
quando existem valores extremos
(outliers).
Nesse caso, a mediana é a mais usada,
uma vez que não é sensível a valores
extremos, assim como a moda e os
quartis.
“
3.3 Medidas Separatrizes
Medidas separatrizes são valores de posição que
dividem o rol em partes iguais, também chamadas de
percentis ou quantis.
Medidas separatrizes tipicamente usadas:
Centis 
(100 partes)
Decis 
(10 partes)
Quartis
(4 partes)
“
3.4 Medidas Separatrizes
3.4.1 Quartis
Quartis dividem os dados ordenados em 4 segmentos
com o mesmo número de valores por segmento.
25% 25% 25% 25%
Q
1
Q
2
Q
3
O primeiro
quartil, Q1, é o 
valor para o 
qual 25% das 
observações
são menoros e 
75% são
maiores;
Q2 é o mesmo
que a mediana
(50% são
menores, 50% 
são maiores);
Apenas, 25% 
dos valores
são maiores
do que o 
terceiro
quartil, Q3.
“
3.4 Medidas Separatrizes
3.4.1.1 Localizando os Quartis
Encontre os quartis ao determinar o valor
correspondente a posição apropriada nos dados
ordenados, onde:
Posição do primeiro quartil: Q1 = (n+1)/4
Posição do segundo quartil: Q2 = (n+1)/2
Posição do terceiro: Q3 = 3(n+1)/4
Em que: n é o tamanho da amostra.
Regra 1: Se o resultado é um número inteiro, então o quartil
corresponde ao valor ordenado nesta posição.
Ex: Para n=7 Q1= (7+1)/4 = 2° valor
Regra 2: Se o resultado é uma fração em 0.5, p.e, (2.5 ; 3.5), então
o quartil é igual a média dos valores correspondendo as posições
adjacentes (2 e 3 ; 3 e 4);
Ex: Para n=9 Q1= (9+1)/4 = 2,5  média 2° e 3° valores
Regra 3: Se o resultado não é inteiro e nem uma fração com 0.5,
então arredonda-se a posição para o inteiro mais próximo e
determina-se o valor correspondente.
Ex: Para n=10 Q1= (10+1)/4 = 2,75 arredonda para 3
Para a amostra ordenada de dados abaixo,
encontre o primeiro quartil:
11 12 13 16 16 17 18 21 22
1) Primeiro, note que n = 9.
2) Q1 está na posição (9+1)/4 = 2,5 dos dados ordenados, então é o
valor médio entre os 2° e 3° valores ordenados, Q1 = (12+13)/2 = 12,5
Q1 e Q3 são medidas de locação não centrais
Q2 = mediana, é uma medida de tendência central
RESOLUÇÃO
PROVA 2013.1 – As observações de resistência à ruptura
(MPa, lidas de um gráfico de “Heat-Resistant Active
Brazing of Silicon Nitride: Mechanical Evaluation of Braze
Joints”, Welding J., August, 2007) são descritas na
sequência:
114 128 87 168 93 98 142 96 131 105
(a) Qual o formato da distribuição?
(b) Utilize duas medidas de tendência central e faça os
devidos cálculos;
(c) Utilize duas medidas de variação e faça os devidos
cálculos.
Questão resolvida em sala de aula!
PROVA 2013.2 – Uma maternidade está analisando a
idade das mulheres que tiveram o seu primeiro filho. Os
dados obtidos são:
25 23 21 28 41 18 19 23 20 22 23
Considerando os dados como amostrais, calcule a
média, a mediana, a moda e o desvio padrão desses
dados. Classifique os dados em relação à assimetria.
Questão resolvida em sala de aula!
PROVA 2015.2 – A pressão mínima de injeção (psi) em amostras de
moldagem por injeção de milho de alta amilose foi determinada para oito
amostras diferentes (pressões mais altas correspondem a maior
dificuldade de processamento), resultando nas observações a seguir (de
“Thermoplastic Starch Blends with a Polyethlene-Co-Vinyl Alcohol:
Processability and Physical Properties”, Polymer Engr. and Science,
1994, p.17-23):
13 18 14,5 12 11 8,9 8
(a) Calcule duas medidas de tendência central;
(b) Calcule duas medidas de dispersão que não sejam afetadas por
valores extremos;
(c) Qual o formato dessa distribuição de dados? Mostre os cálculos!
(a) Média = 𝑋 = 𝑖=1
𝑛 𝑥𝑖
𝑛
= 12,55
(a) Quartis
8 8,9 11 12 13 14,5 15 18
𝑄2 =
𝑛 + 1
2
=
9
2
= 4,5 → 𝑚é𝑑𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 4º 𝑒 5º 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 =
12 + 13
2
= 12,5
Também, podem ser as outras medidas vistas em sala de aula
b) Amplitude Interquartil
𝑄1 =
𝑛 + 1
4
= 2,25 𝑝𝑜𝑠𝑖çã𝑜 = 2º 𝑣𝑎𝑙𝑜𝑟 = 8,9
𝑄3 =
3 𝑛 + 1
4
= 6,75 𝑝𝑜𝑠𝑖çã𝑜 = 7º 𝑣𝑎𝑙𝑜𝑟 = 15
𝐴𝐼 = 𝑄3 − 𝑄1 = 15 − 8,9 = 6,1
(b) Desvio-padrão = 𝑆 = 
(𝑋𝑖− 𝑋
𝑛−1
= 3,30
Também, pode ser a variância.
c) 𝑋 > 𝑄2, 𝑝𝑜𝑟𝑡𝑎𝑛𝑡𝑜 𝑡𝑒𝑚𝑜𝑠 𝑎𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑎 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎
Também, pode ser pela distância entre os quartis
RESUMO
CONTINUARÁ…
Tendência Central
Média
Aritmética
Média
Ponderada
ModaMediana
25% 25% 25% 25%
Q
1
Q
2
Q
3
Medidas Separatrizes
48
Thanks!
ANY QUESTIONS?
You can find me at
⊷ kellencarla@gmail.com
Os dados abaixo representam a vida útil de baterias (em
termos do número de fotografias) de câmeras digitais de
três megapixels. Calcule a média, a mediana, a moda, o
primeiro quartil e o terceiro quartil.
Exercício 01– Aula 05
300 180 85 170 380 460
260 35 380 120 110 240
 𝑿 = 𝟐𝟐𝟔, 𝟔𝟕 Q2 = 210Q1 = 110 Q3 = 380Mo = ?
Entre 100 números, vinte são 4, quarenta são 5, trinta são 6
e os restantes são 7. Determinar a média aritmética deste
conjunto de números.
Exercício 02– Aula 05
Resposta: 5,3

Continue navegando