Buscar

Estatística Exploratória 1 - Medidas de Associação para Variáveis Categorizadas

Prévia do material em texto

2 - 1
UnB - IE 
Departamento 
de 
Estatística
Medidas de Associação e 
Correlação
Maria Teresa Leão Costa
Estatística Exploratória 1
2 - 2
UnB - IE 
Departamento 
de 
Estatística
Medidas de Associação 
para Variáveis 
Categorizadas
2 - 3
UnB - IE 
Departamento 
de 
Estatística
Tabelas de 
Contingência
� Mostra a freqüência conjunta de duas 
variáveis categorizadas 
� Variáveis categorizadas:
� variáveis qualitativas
� variáveis quantitativas organizadas em 
categorias
� Exemplos:
� sexo e tipo de conta de clientes de um banco
� tipo de aplicação e faixas de renda
2 - 4
UnB - IE 
Departamento 
de 
Estatística
Tabelas de 
Contingência
� Para analisar tabelas de contingência 
podemos usar as seguintes freqüências 
relativas, expressas em percentagem: 
� % da linha
� % da coluna
� % do total
� Ajuda a estudar relações entre variáveis 
2 - 5
UnB - IE 
Departamento 
de 
Estatística
Notação
ijf Æ freqüência observada da linha i coluna j
.if Æ freqüência total da linha i
jf . Æ freqüência total da coluna j
2 - 6
UnB - IE 
Departamento 
de 
Estatística
Exemplo
Tipo de Sexo
Conta Masc. Fem. Total
Corrente 5
Poupança 5
Total 6 4 10
Tipo de Sexo
Conta Masc. Fem. Total
Corrente 5
Poupança 5
Total 6 4 10
Tipo de Conta: C C P P C C P P C P
Sexo: M F F M M M F M M F
(C=conta corrente, P=Poupança; M=Masc., F=Fem.)
4 1
2 3
f ij
f i.
f j.
2 - 7
UnB - IE 
Departamento 
de 
Estatística
Tabelas de Contingência
(% da Linha )
Tipo Sexo
De Conta Masc. Fem. Total
Corrente 4
(80)
1
(20)
5
(100)
Poupança 2
(40)
3
(60)
5
(100)
Total 6
(60)
4
(40)
10
(100)
Tipo Sexo
De Conta Masc. Fem. Total
Corrente 4
(80)
1
(20)
5
(100)
Poupança 2
(40)
3
(60)
5
(100)
Total 6
(60)
4
(40)
10
(100)
(Freq. da célula) (100)
Freq. Total da Linha
(3/5)(100) = 60%
2 - 8
UnB - IE 
Departamento 
de 
Estatística
Tabelas de Contingência
(% da Coluna)
Tipo Sexo
De Conta Masc. Fem. Total
Corrente 4
(67)
1
(25)
5
(50)
Poupança 2
(33)
3
(75)
5
(50)
Total 6
(100)
4
(100)
10
(100)
Tipo Sexo
De Conta Masc. Fem. Total
Corrente 4
(67)
1
(25)
5
(50)
Poupança 2
(33)
3
(75)
5
(50)
Total 6
(100)
4
(100)
10
(100)
(Freq. da célula) (100)
Freq. Total da Coluna
(3/4)(100) = 75%
2 - 9
UnB - IE 
Departamento 
de 
Estatística
Tabelas de Contingência
(% do Total)
Tipo Sexo
De Conta Masc. Fem. Total
Corrente 4
(40)
1
(10)
5
(50)
Poupança 2
(20)
3
(30)
5
(50)
Total 6
(60)
4
(40)
10
(100)
Tipo Sexo
De Conta Masc. Fem. Total
Corrente 4
(40)
1
(10)
5
(50)
Poupança 2
(20)
3
(30)
5
(50)
Total 6
(60)
4
(40)
10
(100)
(Freq. da célula) (100)
Freq. Total
(3/10)(100) = 30%
2 - 10
UnB - IE 
Departamento 
de 
Estatística
Qual Porcentagem 
usar?
� Calcular a % na direção 
da variável explanatória 
ou explicativa
� Se a variável explicativa 
está linha, usar total da 
linha
� Exemplo: sexo é a 
variável explicativa
� ‘Explica’ tipo de conta
2 - 11
UnB - IE 
Departamento 
de 
Estatística
Para Pensar...
Em uma pesquisa de 
mercado para Visa, 
deseja-se analisar os 
dados sobre uso de 
cartão de crédito e 
renda anual.
Renda (x1000):12 20 32 45 72 46 18 55 ...
Uso: S N N S S S N S ...
(Categorias de renda: < $25 000; ≥ $25 000 ;
Categorias de uso de cartão de crédito: S = sim, N = não)
2 - 12
UnB - IE 
Departamento 
de 
Estatística
Representação 
Tabular
Uso
Renda Não Sim Total
< 25 200
(67)
100
(33)
300
(100)
≥ 25 100
(20)
400
(80)
500
(100)
Total 300(37,5)
500
(62,5)
800
(100)
Uso
Renda Não Sim Total
< 25 200
(67)
100
(33)
300
(100)
≥ 25 100
(20)
400
(80)
500
(100)
Total 300(37,5)
500
(62,5)
800
(100)
(400/500)(100) = 80%
Variável 
Explicativa
Percentagem da linha
2 - 13
UnB - IE 
Departamento 
de 
Estatística
Representação Gráfica
0
10
20
30
40
50
60
70
80
90
< 25 000 25 000 ou mais
Não usa cartão 
Usa cartão
0
50
100
150
200
250
300
350
400
450
< 25 000 25 000 ou mais
Não usa cartão
Usa cartão
2 - 14
UnB - IE 
Departamento 
de 
Estatística
Associação
� Deseja-se saber o grau de 
associação entre duas variáveis de 
modo que se possa prever melhor o 
resultado de uma delas quando 
conhecemos a realização de outra.
Ø
Medidas de Associação
2 - 15
UnB - IE 
Departamento 
de 
Estatística
Freqüência Esperada
� Supondo que não existe associação entre 
renda anual e o uso de cartão de crédito, 
qual a freqüência esperada de pessoas 
com renda < 25000 que deveriam usar 
cartão de crédito ?
proporção de usuários
de cartão de crédito
X Total de pessoas
com renda <25000
0,625 x 300 = 187,5




n
f j. f i .
2 - 16
UnB - IE 
Departamento 
de 
Estatística
Freqüência Esperada
nne
ff
f
f
ij
i
j
ij
..
.
.
×
=×=
� Onde:
f i . Æ freqüência total da linha i
f j. Æ freqüência total da coluna j
Æ tamanho da amostran
2 - 17
UnB - IE 
Departamento 
de 
Estatística
Freqüência Esperada
Uso
Renda Não Sim Total
< 25 200 (112,5) 100 (187,5) 300
≥ 25 100 (187,5) 400 (312,5) 500
Total 300 500 800
Uso
Renda Não Sim Total
< 25 200 (112,5) 100 (187,5) 300
≥ 25 100 (187,5) 400 (312,5) 500
Total 300 500 800
2 - 18
UnB - IE 
Departamento 
de 
Estatística
Freqüência Esperada
Uso
Renda Não Sim Total
< 25 200 (112,5)
87,5
100 (187,5)
--87,5
300
≥ 25 100 (187,5)
-87,5
400 (312,5)
87,5
500
Total 300 500 800
Uso
Renda Não Sim Total
< 25 200 (112,5)
87,5
100 (187,5)
--87,5
300
≥ 25 100 (187,5)
-87,5
400 (312,5)
87,5
500
Total 300 500 800
2 - 19
UnB - IE 
Departamento 
de 
Estatística
Qui-quadrado ( χ2 )
∞〈≤
−= ∑∑
= =
χ
χ
2
1 1
2
2
0
)(
:queObserve
eij
ijef ijr
i
s
j
2 - 20
UnB - IE 
Departamento 
de 
Estatística
Coeficiente de 
Contingência
n
C
+
=
2
2
χ
χ
),(min srtonde
t
tCe
=
−≤≤ 10
2 - 21
UnB - IE 
Departamento 
de 
Estatística
Exemplo
22,174
50,2483,4083,4006,68
)5,312400()5,187100(
)5,187100()5,112200(
5,3125,187
5,1875,112
2
22
22
=
+++=
=−+−+
+−+−=χ
2 - 22
UnB - IE 
Departamento 
de 
Estatística
Exemplo
707,02
120
2)2,2min(
80022,174
22,174 42,0
=−≤≤
==
+ ==
Centão
t
C

Continue navegando