Baixe o app para aproveitar ainda mais
Prévia do material em texto
@CECATTOVET Laura Cecatto . Bioestatística MEDIDAS DE DISPERSÃO DESVIO-PADRÃO E VARIÂNCIA Identificar o quanto a sua amostra é diferente Variáveis heterogêneas (distantes) ou homogêneas (semelhantes) MEDIDAS DE TENDÊNCIA CENTRAL – MTC Resumem a informação contida em um conjunto de dados, mas não contam toda a história Por causa da variabilidade, as MTC não são suficientes para descrever um conjunto de dados Domicílio 1 (república): moram 7 pessoas, todas com 22 anos Domicílio 2 (família): moram 7 pessoas (17, 23, 2, 3, 38, 8, 65) A média dos dois domicílios é 22 anos, no entanto esse valor descreve bem o domicílio 1, mas não o 2. As MTC são tanto mais descritivas quanto menor é a variabilidade, portanto ao apresentar um conjunto de dados você deve fornecer não apenas a MTC, mas também uma medida de variabilidade ou dispersão MÉDIA ARITMÉTICA Obtida somando os valores de todos os dados e dividindo pela soma de números apresentados Por exemplo, qual a médica aritmética entre os números 2, 4, 6, 8 e 10? MA = (2+4+6+8+10)/5 MA = 30/5 MA = 6 DESVIO Para encontrar o desvio-padrão e variância obrigatoriamente vai precisar encontrar o valor médio do conjunto de dados SITUAÇÃO PROBLEMA: Considere a distribuição numérica cujos resultados constam na lista: 1, 6, 4, 10 e 9. A média é 6 O desvio é a apresentação do valor mostrando a diferença entre ele e a média aritmética. Desvio do valor 1: 1 – 6 = -5 Desvio do valor 6: 6 – 6 = 0 Desvio do valor 4: 4 – 6 = -2 Desvio do valor 10: 10 – 6 = 4 Desvio do valor 9: 9 – 6 = 3 Dessa forma, os desvios em relação à média são -5, 0, -2, 4 e 3 Agora calculamos as medidas de dispersão propriamente ditas – Variância e Desvio-Padrão VARIÂNCIA Vai dizer se a amostra é mais heterogênea ou homogênea Método varia de acordo com o agrupamento do conjunto de dados DADOS NÃO AGRUPADOS Chama-se variância (S²) É a soma dos quadrados dos desvios de cada observação em relação à média dividida por (n-1) N = Número absoluto (quantidade de dados que tenho) S² = ((-5)² + (0)² + (-2)² + (4)² + (3)²)/4 S² = (25+0+4+16+9)/4 S² = 54/4 = 13,5 1ª Linha: Colocado mais um colchete no começo e no final da equação para ignorar os sinais negativos Quanto mais distante de 0 for o resultado mais heterogênea é a amostra – mais diferentes serão as variáveis @CECATTOVET Laura Cecatto . Bioestatística DADOS AGRUPADOS SEM INTERVALO DE CLASSES Utiliza-se a seguinte fórmula: EXEMPLO: 1º é a somatória de todos os Fs (frequência) 2º é a somatória de X . F na linha (X é a amostra) 3º é a somatória de X² . F (na linha) Neste caso o resultado é 1,5 DADOS AGRUPADOS COM INTERVALO DE CLASSE Mesma fórmula anterior, porém o X vai ser a média do intervalo EXEMPLO: A média do intervalo é calculada somando os valores do intervalo e dividindo por 2. 1,5 + 2 = 3,5 3,5/2 = 1,75 Esses novos valores irão substituir o X DESVIO-PADRÃO É a raiz quadrada da variância Quanto mais afastada de 0 mais heterogênea é a amostra No exemplo em análise, temos a variância de 13,5, portanto: DP = √𝟏𝟑,𝟓 = 𝟑, 𝟔𝟕
Compartilhar