Baixe o app para aproveitar ainda mais
Prévia do material em texto
Probabilidade e Estatística ⊷Profa. Kellen Lima AULA 05 CAPÍTULO 03 MEDIDAS NUMÉRICAS DESCRITIVAS Levine et al. (2011) “ 3.1 Objetivos da Aula NESTA AULA, VOCÊ APRENDERÁ: MEDIDAS DE TENDÊNCIA CENTRAL Médias (aritmética e ponderada); Mediana; Moda; MEDIDAS SEPARATRIZES (quantis quartis, decis, centis) “ 3.2 Medidas Numéricas Descritivas TENDÊNCIA CENTRAL Corresponde à extensão na qual todos os valores de dados se agrupam em torno de um valor central típico. VARIAÇÃO Corresponde ao montante da dispersão de valores em relação a um valor central. FORMATO Corresponde ao padrão da distribuição de valores, do valor mais baixo para o mais alto. “ 3.3 Medidas de Tendência Central Medidas tipicamente usadas: Médias (aritmética e ponderada) Mediana Moda Medidas separatrizes (quantis quartis, decis, centis) “ 3.3.1 Média Aritmética 3.3 Medidas de Tendência Central Para uma amostra de tamanho n: n XXX n X X n21 n 1i i A média de um conjunto de valores numéricos é calculada somando-se todos os valores e dividindo-se o resultado pelo número de elementos somados Onde: Ponto de equilíbrio; É a medida de tendência central mais comum; Afetada por valores extremos (outliers); Todos os valores desenpen ham o mesmo papel. 0 1 2 3 4 5 6 7 8 9 10 Média = 3 3 5 15 5 54321 Média = 4 0 1 2 3 4 5 6 7 8 9 10 4 5 20 5 104321 “ 3.3.1.1 Propriedades da Média Aritmética 3.3 Medidas de Tendência Central 1ª PROPRIEDADE A média aritmética de um conjunto de dados que não varia, ou seja, cujos valores são uma constante, é a própria constante. Exemplo: 𝑿𝒊 = 𝟒, 𝟒, 𝟒, 𝟒 𝑿 = 𝟒 𝑋𝑖 = 9, 7, 5, 10, 4 𝑋 = 7 𝑆𝑜𝑚𝑎𝑟 𝑐𝑜𝑛𝑡𝑎𝑛𝑡𝑒 𝑐 = 2 ; 𝐸𝑛𝑡ã𝑜: 𝑋𝑖 + 2 = 11, 9, 7, 12, 6 𝑋𝑋𝑖+2 = (𝑋𝑖 + 2) 𝑛 = 11 + 9 + 7 + 12 + 6 5 = 45 5 = 9 𝐿𝑜𝑔𝑜, 𝑋𝑋𝑖+2 = 7 + 2 𝑋𝑋𝑖+𝑐 = 𝑋 + 2 2ª PROPRIEDADE Ao somar uma constante c para todos os valores de um conjunto de dados, sua média também é somada por esta constante. Exemplo: 𝑋𝑖 = 9, 7, 5, 10, 4 𝑋 = 7 𝑀𝑢𝑙𝑡𝑖𝑝𝑙𝑖𝑐𝑎𝑟 𝑝𝑜𝑟 𝑐 = 2 𝐸𝑛𝑡ã𝑜: 2𝑋𝑖 = 18, 14, 10, 20, 8 𝑋2𝑋𝑖 = 2𝑋𝑖 𝑛 = 18 + 14 + 10 + 20 + 8 5 = 70 5 = 14 𝐿𝑜𝑔𝑜: 𝑋2𝑋𝑖 = 2 × 7 𝑋𝑐𝑋𝑖 = 𝑐 𝑋 3ª PROPRIEDADE Ao multiplicar uma constante c por todos os valores de um conjunto de dados, sua média também é multiplicada por esta constante. Exemplo: 4ª PROPRIEDADE A SOMA DE TODOS OS DESVIOS EM RELAÇÃO À MÉDIA DE UM CONJUNTO DE VALORES É NULA. Exemplo: (𝑋𝑖 − 𝑋) = 0 DESVIO Diferença entre observação e média aritmética 𝑿𝒊 = 𝟗, 𝟕, 𝟓, 𝟏𝟎, 𝟒 𝑿 = 𝟕 Observado Desvio 𝒊 𝑿𝒊 𝑿𝒊 − 𝑿 1 9 9 – 7 = 2 2 7 7 – 7 = 0 3 5 5 – 7 = -2 4 10 10 – 7 = 3 5 4 4 – 7 = -3 35 0 PROVA 2012.2 – O valor do módulo de Young (GPa) foi determinado para chapas fundidas feitas de algumas substâncias metálicas, resultando nas observações a seguir: 116,4 115,9 114,6 115,2 115,8 (a) Calcule a média aritmética e os desvios (somente os desvios e não o desvio- padrão!) em relação à média. Média = 115,58 Desvios = 0,82 0,32 -0,98 -0,38 0,22 ????????????????????????????????????????????????????????????????? (a) Calcule a variância e o desvio-padrão. S2 = 0,482 S= 0,69 (b) Subtraia 100 de cada observação para obter uma amostra de valores transformados. A partir desta nova amostra, calcule somente os desvios em relação à nova média, e compare com os dados originais. O que você percebeu nos valores dos desvios da nova amostra quando comparados com a amostra original? Desvios = 0,82 0,32 -0,98 -0,38 0,22. (c) Sem precisar fazer cálculos, o que você acredita que ocorra com a nova variância e o desvio-padrão, após a subtração de 100 unidades dos dados originais? Portanto, ao subtraímos uma constante dos dados originais, a variância e o desvio-padrão não serão modificados. PROVA 2013.1 – Para um conjunto de quatro números cuja média aritmética simples é 2.5, se incluirmos o número 8 neste conjunto, quanto passará a ser a nova média aritmética simples? 𝑋 = 𝑖=1 𝑛 𝑋𝑖 𝑛 𝑋𝑖 4 = 2,5 𝑋𝑖 = 2,5 ∗ 4 𝑋𝑖 = 10 𝑋𝑖 𝑛 = 10 + 8 4 + 1 = 18 5 = 3,6 “ 3.3.2 Média Ponderada 3.3 Medidas de Tendência Central Nos cálculos envolvendo média aritmética simples, todas as ocorrências têm exatamente a mesma importância ou o mesmo peso. Então, dizemos que elas têm o mesmo peso relativo. No entanto, existem casos onde as ocorrências têm importância relativa diferente. Nestes casos, o cálculo da média deve levar em conta esta importância relativa ou peso relativo. 𝑿𝑷 = 𝒊=𝟏 𝒏 𝒑𝒊 ∙ 𝒙𝒊 𝒊=𝟏 𝒏 𝒑𝒊 = 𝒑𝟏 ∙ 𝒙𝟏 + 𝒑𝟐 ∙ 𝒙𝟐 +⋯+ 𝒑𝒏 ∙ 𝒙𝒏 𝒑𝟏 + 𝒑𝟐 +⋯+ 𝒑𝒏 Onde: Um candidato participou de um concurso, onde foram realizadas provas de Português, Matemática, Biologia e História. Essas provas tinham pesos 3, 3, 2 e 2, respectivamente. Sabendo que o candidato tirou 8,0 em Português, 7,5 em Matemática, 5,0 em Biologia e 4,0 em História, qual foi a média que ele obteve? 𝑿𝑷 = 𝟖, 𝟎 × 𝟑 + 𝟕, 𝟓 × 𝟑 + 𝟓, 𝟎 × 𝟐 + 𝟒, 𝟎 × 𝟐 𝟑 + 𝟑 + 𝟐 + 𝟐 𝑿𝑷 = 𝟔𝟒,𝟓 𝟏𝟎 = 𝟔, 𝟒𝟓 Portanto, a média do candidato foi de 6,45 RESOLUÇÃO “ 3.3.3 Mediana 3.3 Medidas de Tendência Central 0 1 2 3 4 5 6 7 8 9 10 Mediana = 4 0 1 2 3 4 5 6 7 8 9 10 Mediana = 4 Em um rol, a mediana é o “número” do meio, (50% acima, 50% abaixo). Não é afetada por valores extremos (outliers). Ordenar os dados de maneira CRESCENTE!!! “ 3.3.3.1 Localizando a Mediana 3.3 Medidas de Tendência Central OBS: Note que, (n+1)/2 NÃO é o valor da mediana, apenas a posição da mediana nos dados ordenados. REGRA 02 - Se o número de valores é PAR, a mediana é a média dos dois valores do meio; REGRA 01 - Se o número de valores é ÍMPAR, a mediana é o número do meio; A mediana de um conjunto de dados ordenados é localizada no (n+1)/2 valor; Dada uma série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9. Qual é o valor da mediana? 1°) Ordenar os dados de maneira CRESCENTE: 2, 5, 6, 9, 10, 13, 15, 16, 18 2°) n = VALOR ÍMPAR = 9 3°) Logo, a mediana é igual ao valor do meio da série ordenada, ou seja, 10. RESOLUÇÃO n = VALOR ÍMPAR Dada uma série de valores: 52, 44, 29, 44, 35, 39, 40, 31, 39, 43. Qual é o valor da mediana? 1°) Ordenar os dados de maneira CRESCENTE: 29, 31, 35, 39, 39, 40, 43, 44, 44, 52 2°) n = VALOR PAR = 10 3°) Aplicar (n+1)/2 para encontrar a posição dos valores: (10+1)/2 = 5,5 4°) Logo, devemos fazer a média entre o 5° e 6° valores na ordem de classificação; 5°) Portanto, a mediana é igual a (39+40)/2 = 39,5 RESOLUÇÃO n = VALOR PAR PROVA 2015.2 – Os valores de pressão sanguínea frequentemente são informados com aproximação de 5 mmHg (100, 105, 110, etc. Portanto, use essa condição na resolução do problema!). Suponha que os valores reais (sem aproximação) de pressão sanguínea de nove indivíduos selecionados aleatoriamente sejam: 118,6 126,4 138,4 130,0 113,7 122,0 108,3 131,5 134,2 (a) Qual é a mediana dos valores de pressão sanguínea? (b) Suponha que a pressão sanguínea do segundo indivíduo seja 128,6 em vez de 126,4 (uma pequena alteração em um único valor). Como isso afeta a mediana dos valores informados? O que isso diz sobre a sensibilidade da mediana ao arredondamento dos dados? 1) Ordenar os dados:110, 115, 120, 120, 125, 130, 130, 135 e 140 Deste modo, a mediana será 125 2) Então, substituindo 128.6 por 126.4, agora a nova mediana é 130, ou seja, um mudança substancial. Isto nos mostra que quando há arredondamento no conjunto de dados, a mediana é altamente sensível a pequenas modificações. “ 3.3.4 Moda 3.3 Medidas de Tendência Central Valor que ocorre com maior frequência; Não é afetada por valores extremos; Usada tanto para dados numéricos quanto para dados categóricos; Pode não haver moda e pode haver várias modas. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Moda = 9 0 1 2 3 4 5 6 Sem Moda Considere os dados a seguir sobre a concentração do receptor transferrina de uma amostra em mulheres grávidas com evidências laboratoriais de uma visível anemia por deficiência de ferro. Calcule a média, mediana e a moda destes valores. 15,2 9,3 7,6 11,9 10,4 9,7 20,4 9,4 11,5 16,2 9,4 8,3 1°) Ordenar os dados: 7,6 8,3 9,3 9,4 9,4 9,7 10,4 11,5 11,9 15,2 16,2 20,4 2°) Cálculo da média = = 11,61 3°) Cálculo da mediana par (n+1)/2 (12+1)/2 = 6,5 (posição) média entre o 6° e 7° valores = (9,7+10,4)/2 = 10,05 4°) Moda = 9,4 RESOLUÇÃO n XXX n X X n21 n 1i i “ 3.3.5 Qual medida escolher? 3.3 Medidas de Tendência Central A média geralmente é usada, exceto quando existem valores extremos (outliers). Nesse caso, a mediana é a mais usada, uma vez que não é sensível a valores extremos, assim como a moda e os quartis. “ 3.3 Medidas Separatrizes Medidas separatrizes são valores de posição que dividem o rol em partes iguais, também chamadas de percentis ou quantis. Medidas separatrizes tipicamente usadas: Centis (100 partes) Decis (10 partes) Quartis (4 partes) “ 3.4 Medidas Separatrizes 3.4.1 Quartis Quartis dividem os dados ordenados em 4 segmentos com o mesmo número de valores por segmento. 25% 25% 25% 25% Q 1 Q 2 Q 3 O primeiro quartil, Q1, é o valor para o qual 25% das observações são menoros e 75% são maiores; Q2 é o mesmo que a mediana (50% são menores, 50% são maiores); Apenas, 25% dos valores são maiores do que o terceiro quartil, Q3. “ 3.4 Medidas Separatrizes 3.4.1.1 Localizando os Quartis Encontre os quartis ao determinar o valor correspondente a posição apropriada nos dados ordenados, onde: Posição do primeiro quartil: Q1 = (n+1)/4 Posição do segundo quartil: Q2 = (n+1)/2 Posição do terceiro: Q3 = 3(n+1)/4 Em que: n é o tamanho da amostra. Regra 1: Se o resultado é um número inteiro, então o quartil corresponde ao valor ordenado nesta posição. Ex: Para n=7 Q1= (7+1)/4 = 2° valor Regra 2: Se o resultado é uma fração em 0.5, p.e, (2.5 ; 3.5), então o quartil é igual a média dos valores correspondendo as posições adjacentes (2 e 3 ; 3 e 4); Ex: Para n=9 Q1= (9+1)/4 = 2,5 média 2° e 3° valores Regra 3: Se o resultado não é inteiro e nem uma fração com 0.5, então arredonda-se a posição para o inteiro mais próximo e determina-se o valor correspondente. Ex: Para n=10 Q1= (10+1)/4 = 2,75 arredonda para 3 Para a amostra ordenada de dados abaixo, encontre o primeiro quartil: 11 12 13 16 16 17 18 21 22 1) Primeiro, note que n = 9. 2) Q1 está na posição (9+1)/4 = 2,5 dos dados ordenados, então é o valor médio entre os 2° e 3° valores ordenados, Q1 = (12+13)/2 = 12,5 Q1 e Q3 são medidas de locação não centrais Q2 = mediana, é uma medida de tendência central RESOLUÇÃO PROVA 2013.1 – As observações de resistência à ruptura (MPa, lidas de um gráfico de “Heat-Resistant Active Brazing of Silicon Nitride: Mechanical Evaluation of Braze Joints”, Welding J., August, 2007) são descritas na sequência: 114 128 87 168 93 98 142 96 131 105 (a) Qual o formato da distribuição? (b) Utilize duas medidas de tendência central e faça os devidos cálculos; (c) Utilize duas medidas de variação e faça os devidos cálculos. Questão resolvida em sala de aula! PROVA 2013.2 – Uma maternidade está analisando a idade das mulheres que tiveram o seu primeiro filho. Os dados obtidos são: 25 23 21 28 41 18 19 23 20 22 23 Considerando os dados como amostrais, calcule a média, a mediana, a moda e o desvio padrão desses dados. Classifique os dados em relação à assimetria. Questão resolvida em sala de aula! PROVA 2015.2 – A pressão mínima de injeção (psi) em amostras de moldagem por injeção de milho de alta amilose foi determinada para oito amostras diferentes (pressões mais altas correspondem a maior dificuldade de processamento), resultando nas observações a seguir (de “Thermoplastic Starch Blends with a Polyethlene-Co-Vinyl Alcohol: Processability and Physical Properties”, Polymer Engr. and Science, 1994, p.17-23): 13 18 14,5 12 11 8,9 8 (a) Calcule duas medidas de tendência central; (b) Calcule duas medidas de dispersão que não sejam afetadas por valores extremos; (c) Qual o formato dessa distribuição de dados? Mostre os cálculos! (a) Média = 𝑋 = 𝑖=1 𝑛 𝑥𝑖 𝑛 = 12,55 (a) Quartis 8 8,9 11 12 13 14,5 15 18 𝑄2 = 𝑛 + 1 2 = 9 2 = 4,5 → 𝑚é𝑑𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 4º 𝑒 5º 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 = 12 + 13 2 = 12,5 Também, podem ser as outras medidas vistas em sala de aula b) Amplitude Interquartil 𝑄1 = 𝑛 + 1 4 = 2,25 𝑝𝑜𝑠𝑖çã𝑜 = 2º 𝑣𝑎𝑙𝑜𝑟 = 8,9 𝑄3 = 3 𝑛 + 1 4 = 6,75 𝑝𝑜𝑠𝑖çã𝑜 = 7º 𝑣𝑎𝑙𝑜𝑟 = 15 𝐴𝐼 = 𝑄3 − 𝑄1 = 15 − 8,9 = 6,1 (b) Desvio-padrão = 𝑆 = (𝑋𝑖− 𝑋 𝑛−1 = 3,30 Também, pode ser a variância. c) 𝑋 > 𝑄2, 𝑝𝑜𝑟𝑡𝑎𝑛𝑡𝑜 𝑡𝑒𝑚𝑜𝑠 𝑎𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑎 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎 Também, pode ser pela distância entre os quartis RESUMO CONTINUARÁ… Tendência Central Média Aritmética Média Ponderada ModaMediana 25% 25% 25% 25% Q 1 Q 2 Q 3 Medidas Separatrizes 48 Thanks! ANY QUESTIONS? You can find me at ⊷ kellencarla@gmail.com Os dados abaixo representam a vida útil de baterias (em termos do número de fotografias) de câmeras digitais de três megapixels. Calcule a média, a mediana, a moda, o primeiro quartil e o terceiro quartil. Exercício 01– Aula 05 300 180 85 170 380 460 260 35 380 120 110 240 𝑿 = 𝟐𝟐𝟔, 𝟔𝟕 Q2 = 210Q1 = 110 Q3 = 380Mo = ? Entre 100 números, vinte são 4, quarenta são 5, trinta são 6 e os restantes são 7. Determinar a média aritmética deste conjunto de números. Exercício 02– Aula 05 Resposta: 5,3
Compartilhar