Buscar

Parte 2.1 (Aula 5) Continuação Medidas Descritivas, Covariância e Correlação

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

04/11/2015
1
� O objetivo é encontrar as possíveis relações ou
associações entre duas variáveis.
� Ex:
Existe relação entre a altura das pessoas e o sexo
(homem ou mulher) em dada comunidade?
◦ Qual frequência esperada de uma pessoa dessa
população ter mais de 170 cm de altura?
◦ Qual frequência esperada de uma mulher (ou homem)
dessa população ter mais de 170 cm de altura?
Mesma resposta. Não há associação entre as variáveis.
Respostas diferentes. Provável associação.
� VariáveisVariáveisVariáveisVariáveis qualitativasqualitativasqualitativasqualitativas
� Ex: Analisar o comportamento conjunto das
variáveis Y (grau de instrução) e V (região de
procedência)
Ensino 
Fundamental
Ensino Médio Superior Total 
Capital
Interior
Outra
Total
V
Y
Tabela de dupla entrada.
4
3
5
12
5
7
6
18
2
2
2
6
11
12
13
36
Distribuição da variável Y.
Distribuição da variável V.
Distribuições Marginais.
DistribuiçãoConjunta de Y e V.
04/11/2015
2
� Possibilidades de expressar a proporção de
cada casela:
a) em relação ao total geral;
b) em relação ao total de cada linha;
c) em relação ao total de cada coluna.
Ensino 
Fundamental
Ensino Médio Superior Total 
Capital
Interior
Outra
Total
V
Y
Distribuição conjunta das proporções (em porcentagem), expressas como proporções do total geral.
4/36 = 11%
3/36 = 8%
5/36 = 14%
33%
14%
19%
17%
50%
6%
6%
5%
17%
31%
33%
36%
100%
aproximação das divisões
Ensino 
Fundamental
Ensino Médio Superior Total 
Capital
Interior
Outra
Total
V
Y
Distribuição conjunta das proporções (em porcentagem) em relação ao total de cada coluna.
4/12 = 33%
3/12 = 25%
5/12 = 42%
100%
28%
39%
33%
100%
33%
33%
34%
100%
31%
33%
36%
100%
Esse tipo de tabela serve para comparar a distribuição da procedência dos 
indivíduos conforme grau de instrução.
04/11/2015
3
Distribuição da região de procedência por grau de instrução
0%
20%
40%
60%
80%
100%
fundamental medio superior total
Capital Interior Outra
� Um dos principais objetivos de se construir uma
distribuição conjunta de duas variáveis é descrever
a associação entre elas.
Ex: Verificar se existe ou não associação entre o sexo e a
carreira escolhida por 200 alunos de Economia e
Administração.
Masculino Feminino Total 
Economia 85 35 120
Administração 55 25 80
Total 140 60 200
Y
X
Distribuição conjunta de alunos segundo o sexo(X) e o curso escolhido (Y).
04/11/2015
4
Masculino Feminino Total 
Economia 85/140 = 61% 58% 60%
Administração 55/140 = 39% 42% 40%
Total 100% 100% 100%
Y
X
Distribuição conjunta das proporções de alunos segundo o sexo(X) e o curso escolhido (Y).
Independentemente do sexo, 60% das pessoas preferem Economia e 40% 
preferem Administração.
As proporções do sexo masculino (61% e 39%) e feminino (58% e 42%) são 
próximas das marginais (60% e 40%).
Neste caso, as variáveis sexo e escolha do curso parecem ser não associadas.
Ex: Semelhante ao anterior, mas envolvendo alunos de
Física e Ciências Sociais.
Masculino Feminino Total 
Física 100 (71%) 20 (33%) 120 (60%)
Ciências Sociais 40 (29%) 40 (67%) 80 (40%)
Total 140 (100%) 60 (100%) 200 (100%)
Y
X
Distribuição conjunta das freqüências e proporções de alunos segundo o sexo(X) e o curso escolhido (Y).
As proporções do sexo masculino (71% e 29%) e feminino (33% e 67%) são 
bem diferentes das marginais (60% e 40%).
Parece haver uma maior concentração de homens no curso de Física e de 
mulheres no de Ciências Sociais. 
Neste caso, as variáveis sexo e curso escolhido parecem ser associadas.
04/11/2015
5
*VariáveisVariáveisVariáveisVariáveis quantitativasquantitativasquantitativasquantitativas
Ex: Verificar se existe ou não associação entre os anos de
serviço (X) e o número de clientes (Y) dos agentes de uma
empresa de seguros.
Agente Anos de serviço (X) Número de clientes (Y) 
A 2 48
B 3 50
C 4 56
D 5 52
E 4 43
F 6 60
G 7 62
H 8 58
I 8 64
J 10 72
Gráfico de dispersão para as variáveis X e Y
40
45
50
55
60
65
70
75
1 2 3 4 5 6 7 8 9 10 11
Anos de serviço
N
ú
m
e
ro
 d
e
 c
li
e
n
te
s
Parece haver uma associação entre as variáveis.
04/11/2015
6
� CovariânciaCovariânciaCovariânciaCovariância: mede o grau em que os valores
de X e Y se alteram mutuamente.
Se:
σXY = COV (X,Y) > 0 relação positiva;
σXY = COV (X,Y) < 0 relação negativa;
σXY = COV (X,Y) = 0 não existe relação. 
� CoeficienteCoeficienteCoeficienteCoeficiente dededede correlaçãocorrelaçãocorrelaçãocorrelação: é uma medida
do grau de associação entre duas variáveis
e também da proximidade dos dados a
uma reta.
◦ 0,7 ~ 0,9 (forte)
◦ 0,4 ~ 0,6 (moderada)
◦ 0,1 ~ 0,3 (fraca)
YX
YX
YXCOV
σσ
ρ
),(
, =
11 , +≤≤− YXρ
04/11/2015
7
0>COV 0<COV
1=ρ
0=COV
1−=ρ 0=ρ
� Uma amostra de 5 operários
a) Faça o diagrama de dispersão;
b) Você acha que existe uma dependência
linear entre as duas variáveis?
c) Calcule o coeficiente de correlação.
X 1 2 4 4 5
Y 7 8 3 2 2
X: anos de experiência
Y: tempo (min) gasto na 
execução de certa tarefa
iiii xxxxiiii yyyyiiii xxxxiiii –––– xxxx (x(x(x(xi i i i –––– x)x)x)x)
2222 yyyyiiii----yyyy ((((yyyyiiii----y)y)y)y)
2222 (x(x(x(xiiii –––– xxxx)()()()(yyyyiiii----yyyy))))
_ _ _ _ _ _
04/11/2015
8
0
1
2
3
4
5
6
7
8
9
0 1 2 3 4 5 6
Anos de experiência
T
e
m
p
o
 (
m
in
)
9189,0−=ρ

Outros materiais