Baixe o app para aproveitar ainda mais
Prévia do material em texto
MEDICINA UNIVERSIDADE NOVE DE JULHO @julia.navesv 1 Análise descritiva Para dados categóricos ou qualitativos ➔ Distribuição de frequência: absoluta e relativa Para dados contínuos ou quantitativos ➔ Medida de tendencia central: da ideia de onde se localiza o centro, o ponto médio da amostra, pode ser expressa em média, mediana, moda ➔ Medidas de dispersão: é o modo como os dados se posicionam ao redor do ponto central, pode ser expressa como desvio padrão, intervalo interquartílico Média ➔ Média da amostra ( ) ➔ Média aritmética de um conjunto de dados = 𝑆𝑜𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑄𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 ➔ Por que é nomeado de média da amostra? ❖ Para distingui-lo da média da população μ (um valor de interesse desconhecido μ, que pode ser estimado por . ➔ Sensibilidade a valores extremos (em pequenas amostras) ❖ Alterar o valor de um ponto determinado pode fazer uma alteração substancial nos valores de uma média de amostra. Por exemplo, a média aritmética de 2, 5, 8, 13, 14, 15, 20, 30, 46, 47 é MEDICINA UNIVERSIDADE NOVE DE JULHO @julia.navesv 2 Mediana ➔ Cálculo da mediana para amostra ímpar → ➔ Cálculo da mediana parra amostra par: somar os dois valores centrais e dividir por dois. Podem ser obtidos da seguinte forma: ❖ T1 = n ÷ 2 ❖ T2 = (n + 2) ÷ 2 ➔ A mediana da amostra não é sensível à influência dos valores extremos da amostra (ao contrário da média da amostra) Moda ➔ É o valor mais frequente ➔ É o valor da variável com maior frequência em distribuições sem intervalo de classe Exemplo: 9, 26, 15, 2, 50, 31, 44, 21 1° passo: ordenar os dados (2, 5, 9, 15, 21, 26, 31, 44, 50) 2° passo: aplicar equação → Med = (9-° + 1-°) ÷ 5-° Exemplo: 9, 26, 15, 2, 5, 50, 31, 44 1° passo: ordenar os dados (2, 5, 9, 15, 26, 31, 44, 50) 2° passo: encontrar os 2 valores centrais → T1 = 8 ÷ 2 = 4° elemento T2 = (8 + 2) ÷ 2 = 5° elemento 3° passo: Med = (15 + 26) ÷ 2 = 20,5 (valor teórico) MEDICINA UNIVERSIDADE NOVE DE JULHO @julia.navesv 3 Medidas de dispersão ➔ Desvio padrão, intervalo interquartílico. ➔ Definição: medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média ou da mediada. ➔ Servem para medir a representatividade da média ou da mediana. Variância (s²) ➔ Chamada de raiz quadrada da variância. ➔ Representada por 𝑠2. ➔ O que faz: mede a dispersão dos dados de uma amostra em relação à respectiva média. Desvio padrão (s) ➔ O desvio padrão da amostra é representado por s. ➔ Frequentemente abreviado como SD ou sd. ➔ Quanto mais variabilidade houver em uma amostra de dados maior será o valor de s ➔ O desvio padrão (s) mede a variabilidade (propagação) dos valores da amostra individual em torno da média da amostra. ➔ Pode ser igual a 0 apenas se não houver variabilidade (se todas as n observações da mostra tiverem o mesmo valor). ➔ As unidades de s são iguais às unidades das medições de dados na amostra (por exemplo, mmHg). ➔ O 𝒔𝟐 é a melhor estimativa da amostra da variância da população 𝝈𝟐 ; s é a melhor estimativa do desvio padrão da população 𝝈𝟐. Intervalo interquartílico ➔ Representamos o IQ por: (Q1 – Q3). ➔ Quartil: ❖ Q1 = 1° quartil, contém 25% da amostra. ❖ Q2 = 2° quartil, coincide com a mediana, contém 50% da amostra. ❖ Q3 = 3° quartil, contém 75% da amostra. MEDICINA UNIVERSIDADE NOVE DE JULHO @julia.navesv 4 Como fazer a análise descritiva ➔ Determinar a normalidade dos dados; Como? ❖ Histograma. ❖ Teste de normalidade: Kolmogorov Smirnov ou Shapiro Wilk. ➔ Média ± DP (ou EP ou 95% IC). ➔ Mediana (IQ 25-75%). Dados paramétricos são representados em média ➔ Assumem a curva de Gauss, dados normais. ➔ Indicada para distribuição simétrica. Dados NÃO paramétricos são representados em mediana ➔ Não assume a curva de Gauss, dados não normais. ➔ Indicada para distribuição assimétrica. Distribuição normal: características ➔ A média, mediana e moda coincidem e estão no centro da distribuição. ➔ A curva é simétrica, 50% dos valores estão acima da média e 50% dos valores estão abaixo da média. ➔ A curva abriga 100% da população, ou seja, toda população está sob a curva. MEDICINA UNIVERSIDADE NOVE DE JULHO @julia.navesv 5
Compartilhar