Baixe o app para aproveitar ainda mais
Prévia do material em texto
-Revisão de estatística Professora Marina S. Almeida Retângulo construído com os quartis Essa forma de representação fornece informações importantes sobre a dispersão dos dados Ajuda a achar os outliers Mediana, Q1, Q3, intervalo interquartil Exemplo: 1) Definir o conjunto de dados a ser utilizado: 2) Ordenar os dados, do menor para o maior: 3) Calcular as posições do primeiro quartil (Q1), segundo quartil (Q2=mediana) e terceiro quartil (Q3): Exemplo: 1) Definir o conjunto de dados a ser utilizado: 2) Ordenar os dados, do menor para o maior: 3) Calcular as posições do primeiro quartil (Q1), segundo quartil (Q2=mediana) e terceiro quartil (Q3): Exemplo: 1) Definir o conjunto de dados a ser utilizado: 2) Ordenar os dados, do menor para o maior: 3) Calcular as posições do primeiro quartil (Q1), segundo quartil (Q2=mediana) e terceiro quartil (Q3): 1/4 2/4 =1/2 3/4 0/4=0 4/4=1 n=Número de dados Posição Q1=(n+1)*1/4 Posição Q2=(n+1)*2/4 Posição Q3=(n+1)*3/4 Q1=7 Q2=43 -> mediana Q3=61 Posição Amplitude interquartis A=Q3-Q1 A=54 Extremo inferior=valor mínimo da amostra Extremo superior=valor máximo da amostra Outliers=valores que estão além dos extremos, para baixo ou para cima. Simetria x enviesamento: Concentração dos dados: Outlier severo ou extremo Outlier moderado Q3+3(Q3-Q1) Q1-3(Q3-Q1) Normalmente devemos retirar da amostra todos os outliers encontrados, mas nem sempre este é o procedimento mais correto. Se for um valor que corresponde a uma característica própria do fenômeno, ele não pode ser desprezado. Se houver dúvidas deve-se aumentar a amostra, ou seja, coletar mais dados. Bom senso, avaliação honesta conforme o objetivo da simulação. IMPORTANTE: Sempre apresentar uma justificativa para tirar ou não os outliers. Após a retirada dos outliers que podem ser desprezados por alguma justificativa razoável: Verificar se a amostra é composta por uma sequência de valores independentes e identicamente distribuídos, ou seja, se não há correlações entre as observações que compoem a amostra. Dado o conjunto de dados: 12 – 4 – 8 – 9 – 5 – 2 – 13 – 22 – 25 – 34 A) Calcule os 3 quartis B) Determine a amplitude interquartil C) Identifique os outliers moderados e severos D) Os dados são simétricos ou enviesados? D) Identifique o segundo decil. E) Determine o quinquagésimo percentil. A principal medida da variabilidade ou dispersão dos dados em relação ao centro (média) da amostra é a VARIÂNCIA. Amostras com médias iguais podem apresentar dispersões diferentes: 3 – 4 – 5 – 6 – 7 1 – 3 - 5 – 7 – 9 5 – 5 – 5 – 5 - 5 3 – 4 – 5 – 6 – 7 1 3 5 7 9 5 – 5- 5 - 5 - 5 Medida de dispersão relativa É o desvio padrão da amostra dividido pela média: Conhecendo-se as médias e os desvios padrão das alturas de duas amostras de indivíduos, sendo a primeira composta por recém-nascidos e a segunda por adolescentes, o que essas amostras tem em comum? Ambas as amostras apresentam coeficiente de variabilidade bastante parecidos. Se houver correlação entre os dados da amostra, os valores não podem ser considerados independentes e identicamente distribuídos (iid). Geralmente não há independência dos dados quando há uma curva de aprendizado regendo o processo. É a forma mais simples de verificar se os dados são independentes entre si. Após a retirada dos outliers que podem ser desprezados, deve-se construir um diagrama de dispersão com as observações na ordem em que foram coletadas em campo. Observação Tempo 1 45 2 42 3 37 4 33 5 35 6 28 7 27 8 26 9 19 10 21 11 15 12 13 13 9 14 12 15 14 16 10 17 12 18 13 19 11 20 15 0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 T e m p o g a s t o Observação
Compartilhar