Buscar

Aula 3.1 - Dados de entrada

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

-Revisão de estatística 
Professora Marina S. Almeida 
 Retângulo construído com os quartis 
 
 Essa forma de representação fornece 
informações importantes sobre a dispersão 
dos dados 
 
 Ajuda a achar os outliers 
 
 Mediana, Q1, Q3, intervalo interquartil 
 
 
 Exemplo: 
 1) Definir o conjunto de dados a ser utilizado: 
 
 
 2) Ordenar os dados, do menor para o maior: 
 
 
 3) Calcular as posições do primeiro quartil (Q1), 
segundo quartil (Q2=mediana) e terceiro quartil 
(Q3): 
 
 Exemplo: 
 1) Definir o conjunto de dados a ser utilizado: 
 
 
 2) Ordenar os dados, do menor para o maior: 
 
 
 3) Calcular as posições do primeiro quartil (Q1), 
segundo quartil (Q2=mediana) e terceiro quartil 
(Q3): 
 
 Exemplo: 
 1) Definir o conjunto de dados a ser utilizado: 
 
 
 2) Ordenar os dados, do menor para o maior: 
 
 
 3) Calcular as posições do primeiro quartil (Q1), 
segundo quartil (Q2=mediana) e terceiro quartil 
(Q3): 
 
1/4 2/4 
=1/2 
3/4 0/4=0 4/4=1 
 n=Número de dados 
 Posição Q1=(n+1)*1/4 
 Posição Q2=(n+1)*2/4 
 Posição Q3=(n+1)*3/4 
 
 
 
 
 Q1=7 
 Q2=43 -> mediana 
 Q3=61 
 
Posição 
 Amplitude interquartis 
 A=Q3-Q1 
 A=54 
 
 Extremo inferior=valor mínimo da amostra 
 Extremo superior=valor máximo da amostra 
 
 Outliers=valores que estão além dos extremos, 
para baixo ou para cima. 
Simetria x enviesamento: 
Concentração dos dados: 
Outlier severo ou extremo 
Outlier moderado 
Q3+3(Q3-Q1) 
Q1-3(Q3-Q1) 
 Normalmente devemos retirar da amostra todos os 
outliers encontrados, mas nem sempre este é o 
procedimento mais correto. 
 
 Se for um valor que corresponde a uma característica 
própria do fenômeno, ele não pode ser desprezado. 
 
 Se houver dúvidas deve-se aumentar a amostra, ou 
seja, coletar mais dados. 
 
 Bom senso, avaliação honesta conforme o objetivo da 
simulação. 
 
 IMPORTANTE: Sempre apresentar uma justificativa para 
tirar ou não os outliers. 
 
 Após a retirada dos outliers que podem ser 
desprezados por alguma justificativa 
razoável: 
 
 Verificar se a amostra é composta por uma 
sequência de valores independentes e 
identicamente distribuídos, ou seja, se não há 
correlações entre as observações que 
compoem a amostra. 
 Dado o conjunto de dados: 
12 – 4 – 8 – 9 – 5 – 2 – 13 – 22 – 25 – 34 
 A) Calcule os 3 quartis 
 B) Determine a amplitude interquartil 
 C) Identifique os outliers moderados e 
severos 
 D) Os dados são simétricos ou enviesados? 
 D) Identifique o segundo decil. 
 E) Determine o quinquagésimo percentil. 
 A principal medida da variabilidade ou 
dispersão dos dados em relação ao centro 
(média) da amostra é a VARIÂNCIA. 
 
 Amostras com médias iguais podem 
apresentar dispersões diferentes: 
 3 – 4 – 5 – 6 – 7 
 
 1 – 3 - 5 – 7 – 9 
 
 5 – 5 – 5 – 5 - 5 
 
 
 3 – 4 – 5 – 6 – 7 
 
 
 
 1 3 5 7 9 
 
 
 5 – 5- 5 - 5 - 5 
 Medida de dispersão relativa 
 
 É o desvio padrão da amostra dividido pela 
média: 
 
 
 Conhecendo-se as médias e os desvios padrão 
das alturas de duas amostras de indivíduos, 
sendo a primeira composta por recém-nascidos e 
a segunda por adolescentes, o que essas 
amostras tem em comum? 
 
 
 
 
 
 Ambas as amostras apresentam coeficiente de 
variabilidade bastante parecidos. 
 
 
 Se houver correlação entre os dados da 
amostra, os valores não podem ser 
considerados independentes e identicamente 
distribuídos (iid). 
 
 Geralmente não há independência dos dados 
quando há uma curva de aprendizado 
regendo o processo. 
 É a forma mais simples de verificar se os 
dados são independentes entre si. 
 
 Após a retirada dos outliers que podem ser 
desprezados, deve-se construir um diagrama 
de dispersão com as observações na ordem 
em que foram coletadas em campo. 
Observação Tempo 
1 45 
2 42 
3 37 
4 33 
5 35 
6 28 
7 27 
8 26 
9 19 
10 21 
11 15 
12 13 
13 9 
14 12 
15 14 
16 10 
17 12 
18 13 
19 11 
20 15 
0 
5 
10 
15 
20 
25 
30 
35 
40 
45 
50 
0 5 10 15 20 25 
T
e
m
p
o
 
g
a
s
t
o
 
Observação

Outros materiais