Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Descritiva II Prof. Oto Murer Küll Montagner 1 Bibliografia Dancey & Reidy: Capítulo 2 Descrição gráfica dos dados AED (Análise Exploratória dos Dados): Explorar os dados a partir de técnicas gráficas. Histograma de frequências Foi perguntado a 181 pessoas a cor favorita em uma lista de sete cores 4 Histograma de frequências Boa forma de inspecionar os dados, verificando se há informações fora do contexto. Facilita a observação da moda e dá uma boa ideia da distribuição. Diagrama de caule e folhas Forma concisa de apresentar um grande conjunto de dados. Não é muito informativo: Dificulta a observação da distribuição. Boxplot Um valor fora das linhas (bigodes) é considerado outlier. 7 Boxplot Auxilia na busca por valores extremos, que atrapalham na interpretação da média. Diagramas de dispersão Diagramas de dispersão São úteis para examinar a relação entre as duas variáveis. Erro de amostragem e relacionamento entre variáveis Raramente, estamos certos que a amostra representa o comportamento da população. Quanto maior a amostra, maior a probabilidade da generalização estar correta. No caso anterior, a amostra com 6 observações mostra uma relação positiva. Caso a amostra seja com 2 observações, a relação pode se apresentar negativa. Erro de amostragem e relacionamento entre variáveis Distribuição normal Variáveis tais como peso, altura, tamanho do sapato, níveis de ansiedade e resultados de testes tendem a ser normalmente distribuídas. Características da distribuição normal: População deve ser simétrica em torno da média. As caudas encontram o eixo x no infinito. A população deve ter a forma de sino. Média, mediana e moda coincidem. Exemplo de distribuição normal: altura Subir a tela e desenhar a linha da distribuição normal. 14 Distribuição normal Variação ou dispersão de distribuições Além das medidas de tendência central, outro aspecto importante de uma população ou amostra é quão dispersas elas são. Quanta variação existe em uma amostra ou população. Amplitude Diferença entre o valor máximo e o valor mínimo. Exemplo: Uma amostra com escores de depressão individuais. Um indivíduo apresentou o menor valor, sendo ele 0. Outra pessoa obteve o maior valor, sendo ele 64. Amplitude: 64. Não fornece nenhuma informação sobre o que ocorre no interior do conjunto. Desvio-padrão Fornece uma indicação sobre o que ocorre no interior entre os dois extremos. Informa o quanto os valores do conjunto variam em torno da média. Subtraindo a média de cada valor, se sabe o quão cada um está longe dela. 18 Desvio-padrão É possível calcular, então, a média desses desvios. Soma todos os desvios e divide pelo número de dados do conjunto. No entanto, a soma desses desvios sempre será 0. Eleva-se, então, todos os valores ao quadrado, para eliminar resultados negativos. A média desses desvios ao quadrado será a variância. Coloca-se raiz quadrada para retornar ao valor original. Temos, então, o desvio-padrão. Geralmente, 70% dos dados estão situados em um intervalo de desvio-padrão, a contar da média. Permite a comparação de amostras que possuem a mesma média. Exemplo de cálculo do desvio-padrão Valores: 1; 4; 5; 6; 9; 11.
Compartilhar