Baixe o app para aproveitar ainda mais
Prévia do material em texto
✓ Medidas de dispersão: Desvio padrão ✓ Intervalo de confiança ✓ Estatística usando o excel ESTATÍSTICA: Tópico 4 ESTA TÍSTIC A MEDIDAS DE DISPERSÃO As medidas de dispersão são utilizadas para indicar o grau de variação ou afastamento de todos os valores em relação à sua média. A partir do desvio padrão é possível saber a “distância” de cada uma informações numéricas até a média aritimética delas. O desvio é obtido a partir da subtração de cada um dos valores de um conjunto da média aritmética. E a variância é igual ao desvio padrão ao quadrado, é representada por S2, refere-se a medida que se obtém, somando os quadrados dos desvios para a média das observações da amostra. O desvio padrão é igual a raiz quadrada da variância. MEDIDAS DE DISPERSÃO Variância populacional A variância de uma população {x1,...,xN} de N elementos é a medida de dispersão definida como a média do quadrado dos desvios dos elementos em relação à média populacional μ. Variância amostral A variância de uma amostra {x1,...,xn} de n elementos é definida como a soma ao quadrado dos desvios dos elementos em relação à sua média dividido por (n-1). MEDIDAS DE DISPERSÃO Para calcularmos o desvio padrão de uma amostra devemos primeiramente calcular a média , isto é: ҧ𝑥 = 65 + 72 + 70 +72 + 60 + 67 + 69 + 68 = 67,87 8 Agora vamos subtrair de cada valor, elevar os resultados ao quadrado e somá-los. Então dividimos o total dos quadrados pelo número de valores menos 1, ou seja, por (n-1) e extraímos a raiz quadrada: 110,875 ÷7 = 15,839 ⱱ15,839 = 3,979 Portanto, o desvio padrão é 3,97986. MEDIDAS DE DISPERSÃO Vamos calcular o desvio padrão de uma população composta pelas notas: 3; 4; 7 e 9, obtidas por 4 alunos, numa avaliação da disciplina de análise de dados. Primeiro passo: calcular a média: ∑ fi ÷ n = 3 + 4 + 7 + 9 = 23 ÷ 4 = �̅� = 5,75 Segundo passo: Usando a média (5,75) determinar cada desvio. O desvio padrão corresponde a raiz quadrada da variância (5,68). Variância é a média aritmética dos quadrados dos desvios. S = √5,68 = 2,38 1º passo: cálculo da média: Média=2 + 8 + 5 + 6 = 21 = 5,25 4 4 2º passo: cálculo da variância da população: Desvio médio = Soma do quadrado do desvio para a média dividido por n (4) Variância = 10,56 + 7,56+ 0,06 + 0,56 = 18,74 = 4,6850 4 4 Desvio padrão = 𝟒, 𝟔𝟖5 =2,16 Notas (n) Desvio para a média Quadrado do desvio para a média 2 (2-5,25) = -3,25 (-3,25)2 = 10,56 8 (8-5,25) = 2,75 (-2,75)2 = 7,56 5 (5-5,25) = -0,25 (-0,25)2 = 0,062 6 (6-5,25) = 0,75 (-0,75)2 = 0,56 Soma 7,5 (DM) 18,74 ÷ 4 = 4,685 MEDIDAS DE DISPERSÃO MEDIDAS DE DISPERSÃO ҧ𝑥: média Ʃ: soma 𝑛: quantidade de elementos da amostra 𝐷𝑀𝑆 : desvios médios S2: variância S: desvio padrão CV: coeficiente de variação Pm: ponto médio Os desvios são calculados da seguinte forma: di = Pm - 𝑥 ̅ Já os desvios médios são calculados da seguinte forma: Dm = ∑ Pm - �̅� × fi ÷ n S = √∑ (Pm - x ) 2 × fi ÷ n-1 DESVIO MÉDIO: POPULAÇÃO Para iniciar você precisa obter a média aritmética dos valores: ഥ𝑥 = 4 + 6 + 8 + 9 + 10 + 11 = 48 = 8 6 6 ഥ𝑥 = 8 O Dm = 12 ÷ 6 = 2 Dm =528 ÷ 100 = 5,28 DESVIO MÉDIO: POPULAÇÃO Dm = ∑ Pm - �̅� × fi ÷ n DESVIO MÉDIO: AMOSTRA S = √ 3879 ÷ 100-1 S = √ 3879 ÷ 99 S = √ 39,18 S = 6,26 S = √∑ (Pm - x ) 2 × fi ÷ n-1 OUTLIERS Presuma que os valores medidos do Índice Cardíaco de 15 pacientes foram: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 459, 143, 172. Sabe-se que “Um outlier é uma observação que se diferencia tanto das demais observações que levanta suspeitas de que aquela observação foi gerada por um mecanismo distinto” (Hawkins, 1980). Outliers são observações que apresentam um grande desvio das restantes, podem ser também designadas por observações “anormais”. Considerando os valores medidos do Índice Cardíaco, quais valores podem ser Outliers? 34 e 758 ASSIMETRIA Na distribuição estatística, a assimetria é o quanto a sua curva de frequência se afasta da média, pode ser definida também, como uma distribuição que depende das suas medidas de posição: média, mediana e moda. Uma distribuição é simétrica somente quando apresenta o mesmo valor para a moda, a média e a mediana, coincidem num mesmo ponto, havendo um perfeito equilíbrio na distribuição -0,6275 +0,88905 INTERVALO DE CONFIANÇA Presuma que os valores medidos do Índice Cardíaco de 15 pacientes foram: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 459, 143, 172. O intervalo de confiança se refere a dois limites numéricos: limite superior e limite inferior, onde se encontra o verdadeiro parâmetro, com o grau de confiança especificado. Os mais utilizados são: 90%, 95% e 99%. Uma das vantagens do intervalo de confiança é expressar o erro que o pesquisador deseja aceitar em seu cálculo, permitindo ter uma ideia da precisão da estimativa do parâmetro. Cálculo no excel: Comando:=INT.CONFIANÇA.NORM(αlfa; desvio_padrão; tamanho da amostra) Intervalo de confiança (90%) 78,90946933 (=INT.CONFIANÇA.NORM(0,10;185,800764;15) Intervalo de confiança (95%) 94,02643213 (=INT.CONFIANÇA.NORM(0,05;185,800764;15) Intervalo de confiança (99%) 123,5716784 (=INT.CONFIANÇA.NORM(0,01;185,800764;15) ESTATÍSTICA USANDO O EXCEL O coeficiente de variação é usado para analisar a dispersão em termos relativos a seu valor médio quando duas ou mais séries de valores apresentam unidades de medida diferentes. Como o coeficiente de variação analisa a dispersão em termos relativos, ele será dado em %. Quanto menor for o valor do coeficiente de variação, mais homogêneos serão os dados, ou seja, menor será a dispersão em torno da média. De uma forma geral, se o CV: For menor ou igual a 15% → baixa dispersão: dados homogêneos For entre 15 e 30% → média dispersão For maior que 30% → alta dispersão: dados heterogêneos ESTATÍSTICA USANDO O EXCEL Função média: Para calcular a média de uma faixa de valores, basta digitar o comando =MÉDIA(..) marcar os valores e clicar enter. ESTATÍSTICA USANDO O EXCEL Função mediana: Para calcular a mediana de uma faixa de valores, basta digitar o comando =MÉDIA(..) marcar os valores e clicar enter. ESTATÍSTICA USANDO O EXCEL Presuma que os valores medidos do Índice Cardíaco de 15 pacientes foram: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 459, 143, 172. Intervalo de confiança 95% Média 312,73333 (=MÉDIA(b48:b62) Mediana 294 (=MED(b48:b62) Desvio padrão 185,800764 (=DESVPAD.A(B48:B62) Variância 34521,92381 (=VAR.A(b48:b62) Curtose 1,080386 (=CURT(B48:B62) Intervalo de confiança (95%) 94,02643213 (=INT.CONFIANÇA.NORM(0,05;185,800764;15) Limite inferior 218,70690 (média - interv de confiança) Limite superior 406,75977 (média + interv de confiança) Coeficiente de variação (CV) 59,41% (CV=DP/Média x 100) Assimetria 0,88903947 (=DISTORÇÃO(B48:B62) n (números de elementos) 15 ESTATÍSTICA USANDO O EXCEL Média 312,73333 Mediana 294 Desvio padrão 185,800764 Variância 34521,92381 Curtose 1,080386 Intervalo de confiança 94,02643213 Limite inferior 218,70690 Limite superior 406,75977 Coeficiente de variação 59,41% Assimetria 0,88903947 n (números de elementos) 15 CV=desvio padrão/média dos dados x 100. Neste caso é heteregêneo > de 50% Quanto ao Grau de homogeneidade dos dados, o CV foi de 59,41% portanto, ruim, acima de 30% . Os valores 34 e o 758 podem ser Outliers: valores de dados que estão distantes de outros valores de dados e podem afetar fortemente os resultados de sua análise. Presuma que os valores medidos do Índice Cardíaco de 15 pacientes foram: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 459, 143, 172. Intervalo de confiança 95% Tópico 4 Profª Me. Lourdes Utrilla MUITO OBRIGADA! ESTA TÍSTIC A
Compartilhar