Prévia do material em texto
17/10/2024 1 Unidade 9 Medidas de dispersão para dados não agrupados Medidas de Dispersão São medidas que tangenciam o grau de dispersão ou de variabilidade dos dados em relação a média ( o valor esperado ) As principais medidas de dispersão : a) Variância ( medida absoluta ) b) Desvio – padrão ( medida absoluta ) c) Coeficiente de variação (CV) – Medida relativa 17/10/2024 2 Por exemplo , temos duas amostras de dados (A e B) , conforme ilustra a tabela abaixo: Q1 Q3 Md ҧ𝑥 =13 17/10/2024 3 Média = 13 17/10/2024 4 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 1 2 1 1 1 2 1 1 2 1 2 1 2 ........ ........... ....... = ....... . ....... . 0 n n i n i i i n i n i n n n D d d d d x x D x x x x x x x x x x x x x x n x x x x n n = = = = = + + + = − = − = − + − + + − = + + + + + + − = + + + − = Consiste em trabalhar com o quadrado dos desvios . Isso nos leva a definição da variância . Variância 17/10/2024 5 Inúmeros estudos realizados validam matematicamente que quando utilizamos a variância de uma amostra de dimensões pequenas usando 𝒏 − 𝟏 , a variância obtida será a melhor estimativa da variância da população, torna-se assim uma estimativa não tendenciosa e com menor erro médio. Omitiremos a dedução pela sua complexidade . Desvio – padrão Suponhamos que os valores xi representem os pesos, em quilogramas, de um conjunto de pessoas. Então, o valor médio x representa o peso médio dessas pessoas e sua unidade também é quilogramas, o mesmo acontecendo com as diferenças ( ). Ao elevarmos essas diferenças ao quadrado, passamos a ter a variância medida em quilogramas ao quadrado, uma unidade que não tem interpretação física. Uma solução é tomar a raiz quadrada da variância na qual definimos como sendo o desvio – padrão. O desvio padrão indica em média qual será o “erro” ( desvio) cometido ao tentar substituir cada observação da série pela sua média . xxi − 17/10/2024 6 Propriedades das medidas de dispersão ✓ Todas as medidas de dispersão são positivas ✓ Somando-se uma mesma constante a todas as observações, as medidas de dispersão não se alteram. ✓ Ao multiplicarmos todos os dados por uma constante K , a variância será multiplicada pela constante K2 e o desvio - padrão pela mesma constante K . ✓ Aumentar o tamanho da amostra ( n ) não garante a queda do desvio padrão 17/10/2024 7 Exemplo 2 Durante 14 dias, uma pessoa anotou o tempo de espera no ponto de ônibus, quando se dirigia ao trabalho. Os valores obtidos são (em minutos): 15, 10, 2, 17, 6, 8, 8, 10, 2, 9, 6, 10, 13 ,10 . Calcule o desvio padrão do tempo de espera. Resp. 4,28 minutos ( ) ( ) ( ) ( ) 2 2 2 2 média : 15 10 2 17 6 8 8 10 2 9 6 10 13 10 = = 9 14 Variância : 15 9 10 9 2 9 ......... 10 9 238 Var = = 18,3077 14 1 13 Desvio padrão : dp = var = 18,3077 = 4,28 min. x + + + + + + + + + + + + + − + − + − + + − = − Exemplo 3 Calcule a média e o desvio padrão dados pluviométricos para o período resp : dp = 36,58 mm 17/10/2024 8 ( ) ( ) ( ) ( ) 2 2 2 2 média : 0 4,7 5,4 ......81,1 130 = = 38,21 mm 14 Variância : 0 38,21 4,7 38,21 5,4 38,21 ......... 130 38,21 17398,6493 Var = = 1338,3576 13 13 Desvio padrão : dp = var = 1338,3576 = 36,58 mm x + + + + − + − + − + + − = Coeficiente de Variação (CV) ( ) desvio padrão CV = .100 0 50 % alta dispersão relativa dos dados em torno da média Exemplo Considere a seguinte situação: uma fábrica de enlatados comercializa seu produto em embalagens de 500 gramas e em embalagens de um quilo ou 1000 gramas. Para efeitos de controle do processo de enchimento das embalagens, sorteia-se uma amostra de 10 embalagens de cada uma das máquinas, obtendo-se os seguintes resultados: CV = (5/495).100 = 1,01 % CV = (5/996).100 = 0,50 % 17/10/2024 10 Interpretação dos dados : ✓ Na primeira máquina, as embalagens deveriam estar fornecendo peso de 500 g mas, devido a erros de ajuste da máquina de preenchimento, o peso médio das 10 embalagens é de 495g. O desvio padrão de 5g significa que, em média, os pesos das embalagens estão 5 gramas abaixo ou acima do peso médio das 10 latas. Uma interpretação análoga vale para a segunda máquina. ✓ Em qual das duas situações a variabilidade parece ser maior ? ou seja, em qual das duas máquinas parece haver um problema mais sério? Note que, em ambos os casos, há uma dispersão de 5 g em torno da média, mas 5g em 996 g é menos preocupante que 5 g em 495 g. ✓ Comparando os coeficientes de variação para as embalagens oriundas das duas máquinas pode – se afirmar que a variabilidade na máquina de 500 g é relativamente maior. Exemplo Você esta indeciso em comprar uma TV e decide avaliar algumas informações estatísticas , fornecidas pelo fabricante sobre a vida útil (h) da placa de imagem . Qual a marca você compraria ? Justifique a sua resposta . 17/10/2024 11 Exercício Proposto Para se estudar o desempenho de 2 companhias corretoras de ações, selecionou – se de cada uma delas amostras das ações negociadas. Para cada ação selecionada, computou-se a porcentagem de lucro apresentada durante um período fixado de tempo, obtendo-se os dados abaixo. a) Com base nos coeficientes de variação, qual companhia teve melhor desempenho? a) 17/10/2024 12 Referências consultadas : FARIAS, A.M.L.F. e LAURENCEL , L.C. Apostila – Estatística Descritiva . Universidade Federal Fluminense – Departamento de Estatística , RJ, 2006 MAGALHÃES, M.N. e LIMA , A.C. Noções de Probabilidade e Estatística . 3º edição . Departamento de Estatística - IME – USP . MORETTIN, L.G . e BUSSAB , W.O. Estatística Básica - volume único. Editora Saraiva, São Paulo - SP , 2012. OBRIGADO !!! Até a próxima aula