Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise Exploratória de Dados ● Medidas de Posição (tendência central) – Média – Moda (medida mais frequente) – Mediana (medida que ocupa a posição central) ● Medidas de Dispersão indicam se valores relativamente próximos um dos outros, ou separados em torno de uma medida de posição: a média. – Desvio padrão – Variância – Coeficiente de Variação Medidas de Dispersão Dados Não Agrupados Medidas de Dispersão Dados Não Agrupados ● Desvio padrão (S) Mede o grau de dispersão dos dados numéricos em torno de um valor médio. Sejam os elementos de uma amostra, portanto “n” valores da variável x. x1 , x2 , x3 ,... , xn Medidas de Dispersão Dados Não Agrupados ● Exemplo de cálculo do desvio padrão: Seja a amostra 10, 12, 14, 16, 18. 1º – calcula-se a média 2º – calculam-se os desvios de cada valor em relação a média 3º – aplica-se a formula do desvio padrão Medidas de Dispersão Dados Não Agrupados ● Exemplo de cálculo do desvio padrão: Seja a amostra 10, 12, 14, 16, 18. 1º – calcula-se a média: = 14. 2º – calculam-se os desvios de cada valor em relação a média 10 – 14 = -4 12 – 14 = -2 14 – 14 = 0 16 – 14 = 2 18 – 14 = 4 3º – aplica-se a formula do desvio padrão x S=√ (−4 )2+(−2)2+(0)2+(2)2+(4 )24 =√ 16+4+0+4+164 =√ 404 =√ 10 S=3,162277. Medidas de Dispersão Dados Não Agrupados ● Variância (S²) Mede a variação média em torno da Média. Sejam os elementos de uma amostra, portanto “n” valores da variável x. x1, x2 , x3 ,... , xn Medidas de Dispersão Dados Não Agrupados ● Exemplo de cálculo da variância: Seja a amostra de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. 1º – calcula-se a média 2º – calculam-se os desvios de cada valor em relação a média 3º – aplica-se a formula da variância Medidas de Dispersão Dados Não Agrupados ● Exemplo de cálculo da variância: Seja a amostra 3, 7, 8, 10 e 11. 1º – calcula-se a média: = 7,8. 2º – calculam-se os desvios de cada valor em relação a média 3 – 7,8 = -4,8 7 – 7,8 = -0,8 8 – 7,8 = 0,2 10 – 7,8 = 2,2 11 – 7,8 = 3,2 3º – aplica-se a formula da variância S² = [(-4,8)² + (-0,8)² + (0,2)² + (2,2)² + (3,2)²] / 4 S² = [23,04 + 0,64 + 0,04 + 4,84 + 10,24] / 4 S² = 38,8 / 4 = 9,7. E o desvio padrão: S = 3,11448.. x Medidas de Dispersão Dados Não Agrupados ● Relação entre desvio padrão e variância: Desvio padrão: Variância: Relação: Medidas de Dispersão Dados Não Agrupados ● Coeficiente de Variação (CV) média relativa útil para comparação e observação em termos relativos ao grau de concentração em torno da média de séries distintas. Representa o desvio padrão expresso como porcenta- gem da média. Medidas de Dispersão Dados Não Agrupados ● Coeficiente de Variação Classificação da distribuição quanto à dispersão: ● Dispersão baixa: CV ≤ 15% ● Dispersão média: 15% < CV < 30% ● Dispersão alta: CV ≥ 30% Medidas de Dispersão Dados Não Agrupados ● Exemplo de cálculo do coeficiente de variação: Seja a amostra de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. 1º – calcula-se a média 2º – calcula-se o desvio padrão 3º – aplica-se a formula do coeficiente de variação Medidas de Dispersão Dados Não Agrupados ● Exemplo de cálculo do coeficiente de variação: Seja a amostra 3, 7, 8, 10 e 11. 1º – calcula-se a média: = 7,8. 2º – calcula-se o desvio padrão: S = 3,11448 = 3,11 3º – aplica-se a formula do coeficiente de variação CV = (3,11 / 7,8) * 100 CV = 0,3987* 100 CV = 39,87%. x Propriedades Medidas de Posição e Dispersão Dados Não Agrupados Medidas de Posição Propriedades Dados Não Agrupados ● Média Aritmética – A soma algébrica dos desvios em relação a média é nula. onde – A soma dos quadrados dos desvios em relação a média é um mínimo. ∑ i=1 n d i=∑ i=1 n (x i−x)=0 ∑ i=1 n (x i−x) 2<∑ i=1 n (xi−x0) 2 d i=x i−x i=1, 2,... , n ● Média Aritmética – Se números tem média , se números tem média , … , se números tem média então: n1 x1 n2 x2 nk xk x= x1 .n1+ x2.n2+...+xk .nk n1+n2+...+nk x= ∑ j=1 k x j .n j ∑ j=1 n n j Medidas de Posição Propriedades Dados Não Agrupados ● Média Aritmética – Ao somar (ou subtrair) uma constante a cada elemento de uma série , a média fica somada (ou subtraída) por essa constante. – Ao multiplicar (ou dividir) uma constante a cada elemento de uma série , a média fica multiplicada (ou dividida) por essa constante. Y=X±X0⇒ y=x± x0 X0 X c X Y=c . X⇒ y=c .x Y= Xc ⇒ y= x c Medidas de Posição Propriedades Dados Não Agrupados ● Desvio Padrão – Ao somar (ou subtrair) uma constante a cada elemento de uma série , o desvio padrão não se altera. – Ao multiplicar (ou dividir) uma constante a cada elemento de uma série , o desvio padrão fica multiplicado (ou dividido) por essa constante. Y=X±X0⇒SY=S X X0 X c X Y=c . X⇒SY=c . SX Y= X c ⇒SY= S X c Medidas de Dispersão Propriedades Dados Não Agrupados ● Variância – Ao somar (ou subtrair) uma constante a cada elemento de uma série , a variância não se altera. – Ao multiplicar (ou dividir) uma constante a cada elemento de uma série , a variância fica multipli- cada (ou dividida) pelo quadrado dessa constante. Y=X±X0⇒SY 2=S X 2 X0 X c X Y=c . X⇒SY 2=c2 . SX 2 Y= X c ⇒SY 2= S X 2 c2 Medidas de Dispersão Propriedades Dados Não Agrupados Análise Exploratória de Dados ● Medidas de Posição (tendência central) – Média – Moda (medida mais frequente) – Mediana (medida que ocupa a posição central) ● Medidas de Dispersão indicam se valores relativamente próximos um dos outros, ou separados em torno de uma medida de posição: a média. – Desvio padrão – Variância – Coeficiente de Variação Medidas de Posição Dados Agrupados ● Média – Distribuição de frequência por valores simples Faz-se a média aritmética de ponderados pelas respectivas frequências absolutas onde k: quantidade de elementos distintos. x1, x2 , x3 ,... , xn f 1, f 2, ... , f n . x= ∑ i=1 k x i . f i n n=∑ i=1 k f i Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calcular a média aritmética por valores simples 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 123 84 43 44 45 92 100 51 52 54 57 116 120 981 x= ∑ i=1 13 x i . f i 20 =? Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calcular a média aritmética por valores simples x= ∑ i=1 13 x i . f i 20 = 981 20 =49,05 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 123 84 43 44 45 92 100 51 52 54 57 116 120 981 Medidas de Posição Dados Agrupados ● Média – Distribuição de frequência por classes Faz-sea média aritmética dos pontos médios de cada classe, ponderados pelas respectivas frequências absolutas onde k: quantidade de classes. x1 , x2 , x3 ,... , xn f 1, f 2, ... , f n . x= ∑ i=1 k x i . f i n n=∑ i=1 k f i Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calcular a média aritmética por classes x=? Classes Frequência 1 41 |-- 45 7 2 45 |-- 49 3 3 49 |-- 53 4 4 53 |-- 57 1 5 57 |-- 61 5 Total 20 Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calcular a média aritmética por classes Classes 1 41 |-- 45 7 2 45 |-- 49 3 3 49 |-- 53 4 4 53 |-- 57 1 5 57 |-- 61 5 Total 20 f i x i x i . f i x= ∑ i=1 5 x i . f i 20 =? Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calcular a média aritmética por classes x= ∑ i=1 5 x i . f i 20 = 996 20 =49,80 Classes 1 41 |-- 45 7 43 301 2 45 |-- 49 3 47 141 3 49 |-- 53 4 51 204 4 53 |-- 57 1 55 55 5 57 |-- 61 5 59 295 Total 20 996 f i x i x i . f i Medidas de Posição Dados Agrupados ● Moda – Distribuição de frequência por valores simples Faz-se pela simples observação do elemento que apresenta a maior frequência. Exemplo: nº de alunos em 20 turmas da UFC Como a maior frequência é então Mo = 41. 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 f i=3 Medidas de Posição Dados Agrupados ● Moda – Distribuição de frequência por classes Temos diversos métodos para o cálculo da moda neste caso. Usaremos o Método de Czuber: ● Identifica-se a classe modal (maior frequência) Classe (Mo) ● Aplica-se a formula: Mo=li+h . Δ1 Δ2+Δ1 Medidas de Posição Dados Agrupados ● Moda – Distribuição de frequência por classes em que: Limite inferior da classe modal (freq. modal – freq. anterior) (freq. modal – freq. posterior) amplitude da classe modal Mo=li+h . Δ1 Δ2+Δ1 li : Δ1=f mo−f ant : Δ2=f mo−f post : h : Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calculando a moda por classes, temos: Classe (Mo) = ?, , , Classes 1 41 |-- 45 7 2 45 |-- 49 3 3 49 |-- 53 4 4 53 |-- 57 1 5 57 |-- 61 5 Total 20 f i li=? h=? Δ1=f mo−f ant=? Δ2= f mo−f post=? Mo=li+h . Δ1 Δ2+Δ1 Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calculando a moda por classes, temos: Classe (Mo) = 41 |-- 45, , , li=41 h=4 Δ1=f mo−f ant=7−0=7 Δ2=f mo−f post=7−3=4 Classes 1 41 |-- 45 7 2 45 |-- 49 3 3 49 |-- 53 4 4 53 |-- 57 1 5 57 |-- 61 5 Total 20 f i Mo=li+h . Δ1 Δ2+Δ1 Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calculando a moda por classes, temos: Classe (Mo) = 41 |-- 45, , , li=41 h=4 Δ1=f mo−f ant=7−0=7 Δ2=f mo−f post=7−3=4 Classes 1 41 |-- 45 7 2 45 |-- 49 3 3 49 |-- 53 4 4 53 |-- 57 1 5 57 |-- 61 5 Total 20 f i Mo=li+h . Δ1 Δ2+Δ1 =41+4 . 77+4 Mo=43,55 Medidas de Posição Dados Agrupados ● Mediana – Distribuição de frequência por valores simples Verifica-se se o número de observações é par ou impar para determinar o elemento mediano. – Em seguida, acrescentam-se as frequências acumuladas a tabela original para encontrar a localização do elemento mediano. Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calcular a mediana por valores simples 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 3 5 6 7 8 10 12 13 14 15 16 18 20 EMe=? Me=? Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calcular a mediana por valores simples 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 41 42 43 44 45 46 50 51 52 54 57 58 60 3 2 1 1 1 2 2 1 1 1 1 2 2 20 3 5 6 7 8 10 12 13 14 15 16 18 20 EMe= 20 2 =10 Me= 46+50 2 =48 Medidas de Posição Dados Agrupados ● Mediana – Distribuição de frequência por classes Procedimento: ● Calcula-se o elemento mediano ● Pela identifica-se a classe com o valor da mediana – Classe (Me). Frequência acumulada. ● Aplica-se a formula: Me=li+h . EMe−Fant f Me EMe . Fi Fi : Medidas de Posição Dados Agrupados ● Mediana – Distribuição de frequência por classes em que: Limite inferior da classe mediana Amplitude da classe mediana Frequência acumulada anterior a classe mediana Frequência absoluta simples da classe mediana se n par se n impar li : Fant : h : f Me : Me=li+h . EMe−Fant f Me EMe= n 2 : EMe= n+1 2 : Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calculando a mediana por classes, temos: Classes 1 41 |-- 45 7 2 45 |-- 49 3 3 49 |-- 53 4 4 53 |-- 57 1 5 57 |-- 61 5 Total 20 f i Fant=? f Me=? Me=li+h . EMe−Fant f Me EMe=? , li=? ,h=? , Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calculando a mediana por classes, temos: Fant=? f Me=? Me=li+h . EMe−Fant f Me EMe=? , li=? ,h=? , Classes 1 41 |-- 45 7 7 2 45 |-- 49 3 10 3 49 |-- 53 4 14 4 53 |-- 57 1 15 5 57 |-- 61 5 20 Total 20 f i Fi Medidas de Posição Dados Agrupados ● Exemplo: nº de alunos em 20 turmas da UFC Calculando a mediana por classes, temos: Classe(Me) = 45|--49, Fant=7 f Me=3 Me=li+h . EMe−Fant f Me =49 EMe=10⇒ Classes 1 41 |-- 45 7 7 2 45 |-- 49 3 10 3 49 |-- 53 4 14 4 53 |-- 57 1 15 5 57 |-- 61 5 20 Total 20 f i Fi li=45,h=4, Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36 Slide 37 Slide 38 Slide 39 Slide 40 Slide 41
Compartilhar