Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Artur Coutinho 04/09/2015 Aula 04 - Estatística Descritiva UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO ACADÊMICO DO AGRESTE CURSO DE ENGENHARIA CIVIL ESTATÍSTICA 1 Prof. Artur Coutinho Slide 2 Estatística Descritiva Tipo de Medidas Descritivas 2 Prof. Artur Coutinho Slide 3 Estatística Descritiva Medidas de Posição - Média aritmética - Média para dados agrupados - Mediana - Moda - Média geométrica - Percentil, decil, quartil - Escore Z 3 Prof. Artur Coutinho Slide 4 Estatística Descritiva Medidas de Dispersão Amplitude Desvio médio Variância Desvio padrão Coeficiente de variação 4 Prof. Artur Coutinho Slide 5 Estatística Descritiva Medidas de Dispersão Medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação é aparente, para que nos permita, por exemplo, comparar conjuntos diferentes de valores. Algumas característica desta medida devem ser atendidos como veremos a seguir. 5 Prof. Artur Coutinho Slide 6 Estatística Descritiva Medidas de Dispersão Para um conjunto de dados, uma única medida representativa da posição central, esconde toda a informação sobre a variabilidade dos dados. Veja, por exemplo, os seguintes dados: Variável A : 8, 8, 9, 10, 11, 12, 12 Variável B : 5, 6, 8, 10, 12, 14, 15 Variável C : 1, 2, 5, 10, 15, 18, 19 Média; Mediana; Moda?? 10; 10; 8 e 12(A) e Sem Moda (B e C) 6 Prof. Artur Coutinho Slide 7 Estatística Descritiva Medidas de Dispersão Variável A : 8, 8, 9, 10, 11, 12, 12 (Méd 10, Md 10, Mo 8 e 12) Variável B : 5, 6, 8, 10, 12, 14, 15 (Méd 10, Md 10, Mo não tem) Variável C : 1, 2, 5, 10, 15, 18, 19 (Méd 10, Md 10, Mo não tem) As medidas de tendência central pouco ou nada informam a respeito da dispersão dos dados. O conceito de medida de dispersão é relativamente difícil. O quanto informativo é dizer que as três amostragens possuem dispersão 4, 10 e 18? 7 Prof. Artur Coutinho Slide 8 Estatística Descritiva Medidas de Dispersão Variável D : 8, 9, 10, 10, 10, 11, 12 (Méd 10, Md 10, Mo 10) Variável E : 5, 7, 9, 10, 11, 13, 15 (Méd 10, Md 10, Mo não tem) Variável F : 1, 5, 8, 10, 12, 15, 19 (Méd 10, Md 10, Mo não tem) Estes três conjuntos de dados também possuem dispersão máxima igual a 4, 10 e 18, respectivamente. As amostras A, B e C apresentam um maior número de observações mais distantes da média, enquanto nas amostras D, E e F ocorre um maior número de observações concentradas em torno da média. Torna-se interessante que haja uma definição a qual use todas as observações e que seja um pequeno valor quando as observações se aproximam da média e grande quando estas são espaçadas. 8 Prof. Artur Coutinho Slide 9 Estatística Descritiva Medidas de Dispersão Na prática, existem várias medidas que expressam a variabilidade de um conjunto de dados, sendo que as mais utilizadas baseiam-se na ideia que consiste em verificar a distância de cada valor observado em relação à média. Para uma sequência de valores, a Amplitude será a diferença entre o maior e o menor valor. 9 Prof. Artur Coutinho Slide 10 Estatística Descritiva Medidas de Dispersão A Amplitude é a medida de dispersão mais simples. Um problema é que a amplitude depende apenas dos valores extremos. Variável G : 2, 9, 10, 10, 10, 11, 12 (Amplitude 10) Variável H : 5, 7, 9, 10, 11, 13, 15 (Amplitude 10) Variável I : 5, 5, 8, 10, 12, 15, 15 (Amplitude 10) 10 Prof. Artur Coutinho Slide 11 Estatística Descritiva Medidas de Dispersão O critério geralmente utilizado é aquele que mede a concentração dos dados em torno da média, e algumas medidas são as mais usadas: desvio médio, variância, desvio padrão e Coeficiente de Variação. Ex: 3, 4, 5, 6, 7 (média 5), os desvios xi-x, são: -2, -1, 0, 1 ,2. 1, 3, 5, 7, 9 (média 5), os desvios xi-x, são: -4, -2, 0, 2, 4. É fácil observar que a soma dos desvios é igual a zero, o que torna inviável esta medida. As opções são: a) Considerar o total dos desvios em valor absoluto (módulo) ou, b) Considerar o total dos quadrados dos desvios. Assim teríamos: Para a amostra: 3, 4, 5, 6, 7 = 2 + 1 + 0 + 1 + 2 = 6 (a) ² = 4 + 1 + 0 + 1 + 4 = 10 (b) 11 Prof. Artur Coutinho Slide 12 Estatística Descritiva Medidas de Dispersão – Desvio médio O desvio médio para uma sequência com n elementos e média μ será: Ex: 3, 4, 5, 6, 7 DM = 1,2 1, 3, 5, 7, 9 DM = 2,4 Baseado nos dados, pode-se dizer que a primeira amostra é mais homogênea. 12 Prof. Artur Coutinho Slide 13 Estatística Descritiva Medidas de Dispersão – Variância A medida que contempla os aspectos apresentados e que é mais utilizada é a Variância. A variância é representada por dois símbolos: s² (letra grega sigma) para população e s² para uma amostra. A variância é uma medida que expressa um desvio quadrático médio. A unidade da variância é portanto o quadrado dos dados originais. Ex: para dados expressos em centímetros a variância será expressa em centímetros quadrados. 13 Prof. Artur Coutinho Slide 14 Estatística Descritiva Medidas de Dispersão – Variância A variância será determinada pela equação abaixo: Onde: N = número de elementos existente na população μ = média da população σ2 = variância da população Obs.: A variância pode ser representado por “Var(X)”. 14 Prof. Artur Coutinho Slide 15 Estatística Descritiva Medidas de Dispersão – Variância amostral A variância da amostra será determinada pela equação abaixo: Onde: s2 = variância amostral n = número de elementos da amostra em estudo x = média da amostra O denominador n-1 tem o propósito de tornar a variância da amostra a estimativa da variância da população. (n-1) é conhecido como grau de liberdade e refere-se ao número de somas independentes lineares numa soma de quadrados. 15 Prof. Artur Coutinho Slide 16 Estatística Descritiva Medidas de Dispersão – Variância amostral Para as amostras: (1) 3, 4, 5, 6, 7 e (2) 1, 3, 5, 7, 9 As variâncias seriam: s1² = [(3-5)²+ (4-5) ² + (5-5) ²+ (6-5) ²+ (7-5) ²]/4 s1² =2,5 s2² = [(1-5) ²+ (3-5) ²+ (5-5) ²+ (7-5) ²+ (9-5) ²]/4 s2² =10 A amostra (1) é mais homogênea. 16 Prof. Artur Coutinho Slide 17 Estatística Descritiva Medidas de Dispersão – Variância para dados agrupados A variância será determinada pela equação abaixo: Onde: N = número de elementos existente na população n = número de elementos da amostra em estudo μ = média da população x = média da amostra σ2 = variância da população s2 = variância amostral fi = frequência de cada um dos elementos Xi 17 Prof. Artur Coutinho Slide 18 Estatística Descritiva Medidas de Dispersão – Variância para dados agrupados Média = (0*4)+(1*5)+(2*7)+(3*3)+(5*1))/20 = 1,65 DM(x) = [4*(0-1,65) + 5* (1-1,65) + 7* (2-1,65) + 3* (3-1,65) + 1* (5-1,65)]/20 = 0,98 Var(x) s² = [4*(-1,65)² + 5* (-0,65)² + 7* (0,35)² + 3* (1,35)² + 1* (3,35)²]/19 = 1,6 Média, DM(x) e Var (x)? 18 Prof. Artur Coutinho Slide 19 Estatística Descritiva Medidas de Dispersão – Variância para dados agrupados Desenvolvendo as fórmulas anteriores é possível chegar aos seguintes resultados. Essas fórmulas facilitarão bastante o cálculo manual. Obs.: Para o cálculo da variância, quando os dados estão agrupados em classes, basta substituir os verdadeiros valores observados Xi pelo ponto médio da i-ésima classe. 19 Prof. Artur Coutinho Slide 20 Estatística Descritiva Medidas de Dispersão – Desvio-padrão O desvio-padrão será dado pela raiz quadrada da variância. O resultado será válido também para o desvio-padrão amostral. O uso do desvio padrão como medida de variabilidade é preferível pelo fato de ser expresso namesma unidade de medida dos valores observados, pois a variância pode causar problemas de interpretação por ser expressa em termos quadráticos. Obs.: O desvio-padrão pode ser representado por “DP(X)”. 20 Prof. Artur Coutinho Slide 21 Estatística Descritiva Medidas de Dispersão – Desvio-padrão Para as amostras: (1) 3, 4, 5, 6, 7 e (2) 1, 3, 5, 7, 9 s1= =1,58 s2= =3,16 21 Prof. Artur Coutinho Slide 22 Estatística Descritiva Medidas de Dispersão – Variância amostral x Variância da população Na prática o valor de μ raramente é conhecido. Por isso, o valor x é utilizado como substituto. No entanto, as observações Xi, tendem a ser mais próximas do seu valor, do que da média populacional μ. Para compensar isso, usa-se n-1 como divisor em vez de n. A utilização de n traria distorções na medida de variabilidade. 22 Prof. Artur Coutinho Slide 23 Estatística Descritiva Medidas de Dispersão Exemplo: Considere as forças de ruptura obtidas de duas amostras de seis corpos de prova de concreto (em psi): Amostra 1: 230; 250; 245; 258; 265; 240 Amostra 2: 190; 228; 305; 240; 265; 260 Qual são as médias das medidas observadas? Med = 248 psi 23 Prof. Artur Coutinho Slide 24 Estatística Descritiva Medidas de Dispersão Amostra 1: 230; 250; 245; 258; 265; 240 Amostra 2: 190; 228; 305; 240; 265; 260 Qual são as variâncias e desvio-padrão das medidas observadas? Amostra 1: s² = 1025,15 psi²; s= 32,02 psi Amostra 2: s² = 1502,00 psi²; s= 38,76 psi Diagrama de pontos 24 Prof. Artur Coutinho Slide 25 Estatística Descritiva Medidas de Dispersão Exemplo: Calcule a variância e o desvio-padrão para a seguinte distribuição amostral. Solução: Para calcular a variância amostral será utilizado o resultado a seguir, já conhecido. A tabela será montada de forma a facilitar os cálculos e as substituições na fórmula. 25 Prof. Artur Coutinho Slide 26 Estatística Descritiva Medidas de Dispersão Exemplo: Calcule a variância e o desvio-padrão para a seguinte distribuição amostral. xi 5 7 8 9 11 Soma fi 2 3 4 5 2 16 xi.fi 10 21 32 45 22 130 xi².fi 50 147 256 405 242 1100 26 Prof. Artur Coutinho Slide 27 Estatística Descritiva Medidas de Dispersão Exemplo: Calcule a média e o desvio-padrão para a seguinte distribuição amostral. Solução: 27 Prof. Artur Coutinho Slide 28 Estatística Descritiva Medidas de Dispersão Exemplo: Calcule a variância e o desvio-padrão para a seguinte distribuição amostral. Solução (continuação): 28 Prof. Artur Coutinho Slide 29 Estatística Descritiva Medidas de Dispersão – Coeficiente de Variação O coeficiente de variação (CV) é uma medida relativa de variabilidade. A utilidade imediata do coeficiente de variação é a possibilidade de avaliar o grau de representatividade da média. Esta medida também é bastante útil na comparação entre conjuntos de dados, em relação à variabilidade, ainda que as unidades de medida nos conjuntos de dados sejam distintas. Um critério de decisão sobre a representatividade ou não da média, pode ser dada pela seguinte linha de corte: Se CV ≥ 50%, a média não é representativa. Se CV < 50%, a média é representativa. (expresso em porcentagem (%)) 29 Prof. Artur Coutinho Slide 30 Estatística Descritiva Medidas de Posição, Dispersão – Exercício Acredita-se que a resistência à tensão da borracha siliconizada seja uma função da temperatura de cura. Um estudo foi realizado, no qual amostras de 12 espécimes de borracha foram preparadas usando temperaturas de cura de 20ºC e 45ºC. Os dados mostram os valores de resistência à tensão, em megapascals: 20ºC: 2,07; 2,14; 2,22; 2,03; 2,21; 2,03; 2,05; 2,18; 2,09; 2,14; 2,11; 2,02 45ºC: 2,52; 2,15; 2,49; 2,03; 2,37; 2,05; 1,99; 2,42; 2,08; 2,42; 2,29; 2,01 a) Mostre o diagrama de pontos dos valores da resistência à tensão em temperaturas baixas e altas. b) Calcule a média amostral da resistência à tensão em ambas as amostras. c) A temperatura de cura parece ter influência na resistência à tensão baseando-se no gráfico? Comente. d) Calcule os desvios-padrões. O aumento nas temperaturas parece influenciar a variabilidade da resistência à tensão? Explique. 30 Prof. Artur Coutinho Slide 31 Estatística Descritiva Medidas de Posição, Dispersão – Exercício As emissões de hidrocarboneto em velocidade lenta, em partes por milhão (ppm), de automóveis de 1980 e 1990 são dadas pro 20 carros selecionados aleatoriamente: Modelos de 1980: 141; 359; 247; 940; 882; 494; 306; 210; 105; 880; 200; 223; 188; 940; 241; 190; 300; 435; 241; 380 Modelos de 1990: 140; 160; 20; 20; 223; 60; 20; 95; 360; 70; 220; 400; 217; 58; 235; 380; 200; 175; 85; 65 a) Construa um diagrama de pontos sobrepostos. b) Calcule as médias amostrais para os dois anos e sobreponha as duas médias no gráfico. c) Comente o que o gráfico indica em relação às mudanças de emissões da população de canos de 1980 para a de 1990. Use os conceitos de variabilidade em seus comentários. 31 Prof. Artur Coutinho Slide 32 Estatística Descritiva Medidas de Dispersão – Exercício Calcule a média, o desvio-padrão, a variância, a mediana e a moda amostrais aproximadas para os dados na seguinte distribuição de frequências: Intervalo de Classe Frequência -10 – 0 3 0 – 10 8 10 – 20 12 20 – 30 16 30 – 40 9 40 – 50 4 50 – 60 2 Med = 22,41; Var(X) = 208,25; DP(X) = 14,43 Mo = 23,64 32 Prof. Artur Coutinho Slide 33 Estatística Descritiva Medidas de Dispersão – Exercício Um livro com 50 páginas apresentou um número de erros de impressão por página conforme tabela: 1) Qual o número médio de erros por página? 2) Qual o número mediano de erros por página? 3) Qual o número modal de erros por página? 4) Qual o desvio padrão do número de erros por página? Erros NºPáginas 0 25 1 20 2 3 3 1 4 1 Total 50 Med = 0,66 erros; Md = 0,50 erros; Mo = 0,00 erros; DP(X) = 0,84 erros 33 Prof. Artur Coutinho Slide 34 Estatística Descritiva Medidas de Dispersão – Exercício Dada a tabela abaixo, calcule: Desvio médio, Variância, Desvio padrão, e Coeficiente de variação 33 35 35 39 41 41 42 45 47 48 50 52 53 54 55 55 57 59 60 60 61 64 65 65 65 66 66 66 67 68 69 71 73 73 74 74 76 77 77 78 80 81 84 85 85 88 89 91 94 97 34
Compartilhar