Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Nove de Julho Maria Lívia Análise Descritiva Introdução: • Análise para dados categóricos ou qualitativos: ‣ Distribuição de frequência - absoluta e relativa; • Análise para dados contínuos ou quantitativos: ‣ Medida de Tendência Central: - Dá ideia de onde se localiza o centro, o ponto médio da amostra; - Pode ser expressa em média, moda ou mediana. ‣ Medida de Dispersão: - É o modo como os dados se posicionam ao redor do ponto central; - Pode ser expressa como desvio-padrão, intervalo interquartílico ou variância. Média: • Média da amostra (x): ‣ Média aritmética de um conjunto de dados = soma de todos os valores ÷ quantidade de valores; ‣ É nomeado média da amostra para distingui-lo da média da população µ (um valor de interesse desconhecido µ, pode ser estimado por X); ‣ Sensibilidade a valores extremos: - Em pequenas amostras; - Alterar o valor de um ponto determinado pode fazer uma alteração substancial nos valores de uma média de amostra. Mediana: • Cálculo da mediana para amostra ímpar: ‣ Med = (n + 1) ÷ 2; ‣ Exemplo: 9, 26, 15, 2, 50, 5, 31, 44, 21 - 1º passo: ordenar os dados; - 2º passo: aplicar a equação -> Med = (9 + 1) ÷ 2 = 5 -> 5º elemento. • Cálculo da mediana para amostra par: ‣ Somar os 2 valores centrais e dividir por 2; ‣ Os mesmos podem ser obtidos da seguinte forma: T1 = n ÷ 2 e T2 = (n + 2) ÷ 2 • A mediana da amostra não é sensível à influência dos valores extremos da amostra - ao contrário da média da amostra. Moda: • É o valor mais frequente; • Em distribuições sem intervalos de classe, a moda é o valor da variável com maior frequência. Medidas de Dispersão: • Desvio padrão, intervalo interquartílico; • São medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média ou da mediana; • Servem para medir a representatividade da média ou da mediana • Variância e desvio padrão: Universidade Nove de Julho Maria Lívia ‣ O desvio padrão é a raiz quadrada da variância - mede a dispersão dos dados de uma amostra em relação à respectiva média; ‣ Desvio Padrão da Amostra: - É representado por s; - Frequentemente abreviado como sd; - Quanto mais variabilidade houver em uma amostra de dados, maior será o valor de s; - S mede a variabilidade (propagação) dos valores da amostra individual em torno da média da amostra; - S pode ser igual a 0 apenas se não houver variabilidade - se todas as n observações da amostra tiverem o mesmo valor; - As unidades de s são iguais às unidades das medições de dados na amostra; - S ao quadrado é a melhor estimativa da amostra da variância da população; s é a melhor estimativa do desvio padrão da população. • Intervalo interquartílico (iq): ‣ Representamos o IQ por: (Q1 - Q3); ‣ Quartil: - Q1 = 1º quartil, contém 25% da amostra; - Q2 = 2º quartil, coincide com a mediana, contém 50% da amostra; - Q3 = 3º quartil, contém 75% da amostra. Como fazer a Análise Dcritiva: • Determinar a normalidade dos dados através de histograma e teste de normalidade; • Calcular a média +/- DP e a mediana; • Dados paramétricos são representados em MÉDIA: ‣ Indicada para distribuição simétrica = assume a curva de normalidade de GAUSS. • Dados não paramétricos são representados em MEDIANA: ‣ Indicada para distribuição assimétrica = não assume a curva de normalidade de GAUSS • Distribuição normal - características: ‣ A média, mediana e moda coincidem e estão no centro da distribuição; ‣ A curva é simétrica. 50% dos valores estão acima da média e 50% estão abaixo da média; ‣ A curva abriga 100% da população, ou seja, toda população está sob a curva.
Compartilhar