Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNISEB Centro Universitário Estatística Aplicada Prof. Valeria Ferreira Módulo UNISEB Centro Universitário Medidas Resumo Unidade 2 1.1 Objetivos da aprendizagem • Aprender como caracterizar um conjunto de dados por meio de medidas numéricas. • Aprender a calcular e interpretar as medidas de posição. • Aprender a calcular e interpretar as medidas de dispersão. 3 Medidas - resumo •Medidas de Posição ou Tendência Central Têm o objetivo de apresentar um ponto central em torno do qual os dados se distribuem. As mais conhecidas são: a média, a mediana e a moda. •Medidas de Dispersão Servem para indicar o quanto os dados se apresentam dispersos em torno da região central. 4 Medidas de posição •Média Aritmética A média aritmética de um conjunto de dados apresentados numa tabela de frequências é calculada da seguinte maneira: Em que: • são os valores que a variável assume; • é a frequência referente a cada valor; • é a soma dos valores das frequências. 5 k i i k i ii f fx x 1 1 ix if k i if 1 Média Aritmética Exemplo 1: os dados abaixo são referentes às idades de funcionários do setor administrativo de uma empresa: 22 24 19 21 25 18 28 24 25 28 22 25 Vamos calcular a idade média dos funcionários: 6 anos 42,23 12 281 12 2521192422 x Agora, vamos calcular a média aritmética por meio dos dados organizados numa tabela de frequências. 7 Idade Nº funcionários 18 1 18 19 1 19 21 1 21 22 2 44 24 2 48 25 3 75 28 2 56 Total 12 281 )( ix )( if ii fx Utilizando as informações do quadro, temos: Portanto, podemos concluir que os dados estão concentrados em torno de 23,42 anos. 8 anos 42,23 12 281 1 1 k i i k i ii f fx x Média Ponderada Em algumas situações, os valores que queremos resumir têm graus de importância diferentes. Nesses casos, utilizamos a média ponderada. A média ponderada dos números com pesos , representada por ,é definida como: 9 nxxx ,...,, 21 nppp ,...,, 21 px n nn p ppp pxpxpx x 21 2211 Média Ponderada Exemplo 2: um aluno assistiu a um curso no qual sua média final é determinada a partir de cinco fontes: 50% da média de seus testes, 15% de seu exame no meio do curso, 20% do seu exame final, 10% de seu trabalho no laboratório de informática e 5% do trabalho feito em casa. As notas obtidas em cada fonte são, respectivamente: 8,6 9,5 8,1 7,8 9 Calcule a média final obtida pelo aluno. 10 Média Ponderada Utilizando a fórmula da média ponderada: O aluno obteve média final 8,58. 11 58,8 1 575,8 05,010,02,015,05,0 05,0910,08,72,01,815,05,95,06,8 321 332211 p p p x x ppp pxpxpx x Moda A moda de um conjunto de dados é o valor (ou valores) que ocorre com maior frequência. A moda, diferentemente das outras medidas de posição, também pode ser encontrada quando a variável em estudo for qualitativa. Um conjunto de dados pode não apresentar moda (amodal), duas modas (bimodal) ou mais de duas modas (multimodal). 12 Moda Analisando o conjunto de dados do Exemplo 1, verificamos que o valor que aparece com a maior frequência é o 25. Portanto, moda = 25 anos. 13 Mediana A mediana é outra medida de posição, dita mais robusta que a média, pois, da forma como ela é determinada, não permite que alguns valores muito altos ou muito baixos interfiram de maneira significativa em seu valor. A mediana é encontrada ordenando os dados do menor para o maior valor e, em seguida, identificando o valor central desses dados ordenados. É uma medida que divide o conjunto de dados ao meio, deixando a mesma quantidade de valores abaixo dela e acima. 14 Mediana Se o número de elementos do conjunto de dados for ímpar, então a mediana será exatamente o valor “do meio”, ou seja: Se o número de elementos do conjunto de dados for par, então a mediana será exatamente a média “dos dois valores do meio”, isto é: 15 2 1n xMd 2 2 2 2 nn xx Md Mediana Exemplo 3: os dados abaixo são referentes às idades de funcionários do setor administrativo de uma empresa: 22 24 19 21 25 18 28 24 25 28 22 25 Vamos encontrar a mediana para esse conjunto de dados. Para encontrar a mediana, os dados devem estar ordenados: 18 19 21 22 22 24 24 25 25 25 28 28 16 Mediana Como n = 12 é um número par, encontraremos a mediana por meio da seguinte fórmula: Portanto, podemos afirmar que 50% das observações são menores ou iguais a 24 anos e as outras 50% das observações são maiores ou iguais a 24 anos. 17 anos 24 2 2424 2 2 76 2 2 2 xx Md xx Md nn Medidas de posição para dados agrupados em classes Quando o conjunto de dados for apresentado sob a forma agrupada, perdemos a informação dos valores das observações. Nesse caso, vamos supor que todos os valores dentro de uma classe tenham seus valores iguais ao ponto médio dessa classe. 18 Exemplo 4: Tabela 3: distribuição de frequências dos salários de funcionários de uma empresa. 19 Salário (R$) Nº funcionários 581|―876 13 32,5 13 876|―1171 11 27,5 24 1171|―1466 3 7,5 27 1466|―1761 2 5,0 29 1761|―2056 6 15 35 2056|―2351 2 5,0 37 2351|―2646 3 7,5 40 Total 40 100 (%)rf af Para calcular as medidas de posição por meio da Tabela 3, vamos seguir o procedimento: 20 Salário (R$) Nº funcionários 581|―876 13 728,50 9470,50 876|―1171 11 1023,50 11258,50 1171|―1466 3 1318,50 3955,50 1466|―1761 2 1613,50 3227,00 1761|―2056 6 1908,50 11451,00 2056|―2351 2 2203,50 4407,00 2351|―2646 3 2498,50 7495,50 Total 40 51265,00 ix ii fx Então, a média aritmética para as informações contidas no quadro é: Se calcularmos a média aritmética por meio dos dados brutos (sem agrupar), vamos obter .Isso nos mostra que as medidas descritivas obtidas por meio dos dados agrupados são apenas aproximações dos verdadeiros valores. 21 reais 63,1281 40 51265 1 1 k i i k i ii f fx x 85,1274x No caso da mediana, vamos utilizar a seguinte fórmula: Em que: 22 md md anterior md h f fa n lMd 2inf 876inf mdl 20 2 40 2 n 13anteriorfa 11mdf 295mdh Substituindo os valores encontrados na fórmula: Então, 50% das observações são menores ou iguais a R$ 1063,73 e as outras 50% das observações são maiores ou iguais a R$ 1063,73. 23 md md anterior md h f fa n lMd 2inf reais 73,1063 73,187876 295 11 1320 876 Md Md Md Para calcular a moda, utilizamos a seguinte fórmula: Em que: d1 = 13 d2 = 2 24 momo h dd d lMo 21 1 inf 581inf mol 295moh Substituindo os valores na fórmula: 25 momo h dd d lMo 21 1 inf 67,836 67,255581 295 213 13 581 Mo Mo Mo Exercício 1: uma pizzaria, interessada em estudar o número de pedidos de pizza por telefone, fez um levantamento dos pedidos dos últimos 30 dias e obteve os seguintes resultados: 26 35 12 15 15 20 30 40 30 8 10 22 30 45 50 62 5 8 12 26 30 40 32 4 12 20 18 30 38 40 10 a) Indique e classifique a variável em estudo. b) Encontre as medidas de posição: média, moda e mediana por meio do conjunto de dados brutos. 27 Resolução a) A variável em estudo é o número de pizzas pedidas por telefone nos últimos 30 dias. Essa variável é classificada como quantitativa discreta. b) A média é calculada por: Foram pedidas, em média, aproximadamente 25 pizzas nos últimos 30 dias. 28 pizzas 97,24 30 749 30 622102854 1 1 k i i k i ii f fx x Resolução Para encontrar a mediana, os dados devem estar ordenados: 29 4 5 8 8 10 10 12 12 12 15 15 18 20 20 22 26 30 30 30 30 30 32 35 38 40 40 40 45 50 62 Resolução Como n = 30 é um número par, temos que a mediana é : Então, 50% dos valores são menores ou iguais a 24 e os outros 50% dos valores são maiores ou iguais a 24. 30 2 2 2 2 nn xx Md pizzas 24 2 2622 22 16152 230 2 30 xx xx Md Resolução A moda para esse conjunto de dados é 30 pizzas, ou seja: Moda = 30 pizzas 31 Medidas de Dispersão Para entender a importância e o conceito das medidas de dispersão, vamos analisar a situação a seguir: Por exemplo, você é um agente de compra de uma grande firma de manufatura e que regularmente faz pedidos de compra com dois diferentes fornecedores. Depois de diversos meses de trabalho, você descobre que o número médio de dias exigido para preencher os pedidos de compra é de 10 dias para ambos os fornecedores. 32 Medidas de Dispersão A Figura 1 resume o número de dias trabalhados exigido para preencher os pedidos de compra dos fornecedores. Embora o número médio de dias seja 10 para ambos os fornecedores, será que eles têm o mesmo grau de confiabilidade em termos de fazer entregas no tempo programado? Que fornecedor você preferiria? 33 Medidas de Dispersão Figura 1: diagrama em colunas mostrando o número de dias exigidos par preencher as ordens de compra. Fonte: Anderson et al. Estatística Aplicada à Administração e Economia 34 0 0,1 0,2 0,3 0,4 0,5 0,6 9 10 11 Fr eq uê nc ia R el al iv a Número de dias trabalhados - Fornecedor A 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 7 8 9 10 11 12 13 14 15 Fr eq uê nc ia R el at iv a Número de dias trabalhados - Fornecedor B Medidas de Dispersão Para a maioria das empresas, o recebimento de materiais no tempo programado é muito importante. As entregas em sete ou oito dias pelo fornecedor B podem ser vistas como favoráveis, no entanto, ter uma parte das entregas com demora de 13 a 15 dias pode causar problemas em termos de fazer a produção no tempo programado. Esse exemplo ilustra uma situação na qual a variabilidade no tempo de entrega pode ser considerada primordial na seleção de um fornecedor. 35 Medidas de Dispersão As medidas de dispersão indicam o grau de variabilidade das observações. Essas medidas possibilitam que façamos distinção entre conjuntos de observações quanto à sua homogeneidade. Quanto menor as medidas de dispersão, mais homogêneo é o conjunto de dados. As medidas que vamos apresentar são: •Amplitude Total •Desvio-Padrão •Variância •Coeficiente de Variação 36 Amplitude Total A amplitude total é a diferença entre o maior e o menor valor observado no conjunto de dados, ou seja: A amplitude não é uma medida muito utilizada, pois só leva em conta dois valores de todo o conjunto de dados e é muito influenciada por valores extremos. Uma medida mais interessante seria aquela que considerasse todos os valores do conjunto de dados, por exemplo, o desvio-padrão. 37 mínimomáximo xxR Desvio-Padrão Quando os dados estiverem dispostos numa tabela de frequências, o desvio-padrão pode ser encontrado da seguinte forma: 38 11 2 2 1 2 n n fx fx n fxx s ii ii k i ii Interpretação do desvio-padrão Para conjuntos de dados que tenham distribuição em forma de sino, valem as seguintes considerações: •cerca de 68% das observações do conjunto de dados ficam a um desvio-padrão da média, ou seja, ; •cerca de 95% das observações do conjunto de dados ficam a dois desvios-padrões da média, ou seja, ; •cerca de 99,7% das observações do conjunto de dados ficam a três desvios-padrões da média, ou seja, . 39 )( e )( sxsx )2( e )2( sxsx )3( e )3( sxsx Figura 2: Gráfico da Curva Normal 40 Variância A variância é o valor do desvio-padrão elevado ao quadrado, ou seja: A variância expressa o seu resultado numa medida ao quadrado, ficando difícil interpretar o seu valor. Portanto, para interpretação, utilizaremos o desvio- padrão, que se apresenta na mesma medida do conjunto de dados. 41 11 2 2 1 2 2 n n fx fx n fxx s ii ii k i ii Coeficiente de Variação O coeficiente de variação é uma estatística útil para comparar a variação para valores originados de diferentes variáveis (por exemplo: peso, em Kg e altura, em cm), pois ele é adimensional. Esse coeficiente é obtido por meio da seguinte fórmula: 42 100 x s cv Exemplo 5: vamos utilizar os dados do Exemplo 1 para calcular as medidas de dispersão. 43 Idade Nº funcionários 18 1 18 324 19 1 19 361 21 1 21 441 22 2 44 968 24 2 48 1152 25 3 75 1875 28 2 56 1568 Total 12 281 6689 ii fx ii fx 2 A amplitude é calculada como: O desvio-padrão é calculado por: 44 anos 101828 mínimomáximo xxR anos 15,390,9 11 08,65806689 11 12 281 6689 1 2 2 2 s s n n fx fx s ii ii Como o conjunto de dados não apresenta uma distribuição em forma de sino, não vamos utilizar a interpretação do desvio-padrão vista anteriormente. 45 0 1 2 3 4 18 19 21 22 24 25 28 N º fu nc io ná ri os Idade Como a variância é definida como o quadrado do desvio-padrão, temos:o que nos mostra que não conseguimos interpretar esse valor. O coeficiente de variação é dado por: 46 222 anos 92,9anos) 15,3( s %45,13 100 42,23 15,3 100 cv cv x s cv Alguns autores consideram a seguinte regra empírica para a interpretação do coeficiente de variação: Baixa dispersão: 47 %15.. VC
Compartilhar