Buscar

Análise Descritiva

Prévia do material em texto

Universidade Nove de Julho Maria Lívia
Análise Descritiva 
Introdução: 
• Análise para dados categóricos ou qualitativos: 
‣ Distribuição de frequência - absoluta e relativa; 
• Análise para dados contínuos ou quantitativos: 
‣ Medida de Tendência Central: 
- Dá ideia de onde se localiza o centro, o ponto 
médio da amostra; 
- Pode ser expressa em média, moda ou 
mediana. 
‣ Medida de Dispersão: 
- É o modo como os dados se posicionam ao 
redor do ponto central; 
- Pode ser expressa como desvio-padrão, 
intervalo interquartílico ou variância. 
Média: 
• Média da amostra (x): 
‣ Média aritmética de um conjunto de dados = 
soma de todos os valores ÷ quantidade de 
valores; 
‣ É nomeado média da amostra para distingui-lo 
da média da população µ (um valor de interesse 
desconhecido µ, pode ser estimado por X); 
‣ Sensibilidade a valores extremos: 
- Em pequenas amostras; 
- Alterar o valor de um ponto determinado 
pode fazer uma alteração substancial nos 
valores de uma média de amostra. 
Mediana: 
• Cálculo da mediana para amostra ímpar: 
‣ Med = (n + 1) ÷ 2; 
‣ Exemplo: 9, 26, 15, 2, 50, 5, 31, 44, 21 
- 1º passo: ordenar os dados; 
- 2º passo: aplicar a equação -> Med = (9 + 1) 
÷ 2 = 5 -> 5º elemento. 
• Cálculo da mediana para amostra par: 
‣ Somar os 2 valores centrais e dividir por 2; 
‣ Os mesmos podem ser obtidos da seguinte 
forma: T1 = n ÷ 2 e T2 = (n + 2) ÷ 2 
• A mediana da amostra não é sensível à influência 
dos valores extremos da amostra - ao contrário da 
média da amostra. 
Moda: 
• É o valor mais frequente; 
• Em distribuições sem intervalos de classe, a moda 
é o valor da variável com maior frequência. 
Medidas de Dispersão: 
• Desvio padrão, intervalo interquartílico; 
• São medidas estatísticas utilizadas para avaliar o 
grau de variabilidade, ou dispersão, dos valores em 
torno da média ou da mediana; 
• Servem para medir a representatividade da média 
ou da mediana 
• Variância e desvio padrão: 
Universidade Nove de Julho Maria Lívia
‣ O desvio padrão é a raiz quadrada da variância - 
mede a dispersão dos dados de uma amostra 
em relação à respectiva média; 
‣ Desvio Padrão da Amostra: 
- É representado por s; 
- Frequentemente abreviado como sd; 
- Quanto mais variabilidade houver em uma 
amostra de dados, maior será o valor de s; 
- S mede a variabilidade (propagação) dos 
valores da amostra individual em torno da 
média da amostra; 
- S pode ser igual a 0 apenas se não houver 
variabilidade - se todas as n observações da 
amostra tiverem o mesmo valor; 
- As unidades de s são iguais às unidades das 
medições de dados na amostra; 
- S ao quadrado é a melhor estimativa da 
amostra da variância da população; s é a 
melhor estimativa do desvio padrão da 
população. 
• Intervalo interquartílico (iq): 
‣ Representamos o IQ por: (Q1 - Q3); 
‣ Quartil: 
- Q1 = 1º quartil, contém 25% da amostra; 
- Q2 = 2º quartil, coincide com a mediana, 
contém 50% da amostra; 
- Q3 = 3º quartil, contém 75% da amostra. 
Como fazer a Análise Dcritiva: 
• Determinar a normalidade dos dados através de 
histograma e teste de normalidade; 
• Calcular a média +/- DP e a mediana; 
• Dados paramétricos são representados em MÉDIA: 
‣ Indicada para distribuição simétrica = assume a 
curva de normalidade de GAUSS. 
• Dados não paramétricos são representados em 
MEDIANA: 
‣ Indicada para distribuição assimétrica = não 
assume a curva de normalidade de GAUSS 
• Distribuição normal - características: 
‣ A média, mediana e moda coincidem e estão no 
centro da distribuição; 
‣ A curva é simétrica. 50% dos valores estão 
acima da média e 50% estão abaixo da média; 
‣ A curva abriga 100% da população, ou seja, toda 
população está sob a curva.

Continue navegando