Baixe o app para aproveitar ainda mais
Prévia do material em texto
04/11/2015 1 � O objetivo é encontrar as possíveis relações ou associações entre duas variáveis. � Ex: Existe relação entre a altura das pessoas e o sexo (homem ou mulher) em dada comunidade? ◦ Qual frequência esperada de uma pessoa dessa população ter mais de 170 cm de altura? ◦ Qual frequência esperada de uma mulher (ou homem) dessa população ter mais de 170 cm de altura? Mesma resposta. Não há associação entre as variáveis. Respostas diferentes. Provável associação. � VariáveisVariáveisVariáveisVariáveis qualitativasqualitativasqualitativasqualitativas � Ex: Analisar o comportamento conjunto das variáveis Y (grau de instrução) e V (região de procedência) Ensino Fundamental Ensino Médio Superior Total Capital Interior Outra Total V Y Tabela de dupla entrada. 4 3 5 12 5 7 6 18 2 2 2 6 11 12 13 36 Distribuição da variável Y. Distribuição da variável V. Distribuições Marginais. DistribuiçãoConjunta de Y e V. 04/11/2015 2 � Possibilidades de expressar a proporção de cada casela: a) em relação ao total geral; b) em relação ao total de cada linha; c) em relação ao total de cada coluna. Ensino Fundamental Ensino Médio Superior Total Capital Interior Outra Total V Y Distribuição conjunta das proporções (em porcentagem), expressas como proporções do total geral. 4/36 = 11% 3/36 = 8% 5/36 = 14% 33% 14% 19% 17% 50% 6% 6% 5% 17% 31% 33% 36% 100% aproximação das divisões Ensino Fundamental Ensino Médio Superior Total Capital Interior Outra Total V Y Distribuição conjunta das proporções (em porcentagem) em relação ao total de cada coluna. 4/12 = 33% 3/12 = 25% 5/12 = 42% 100% 28% 39% 33% 100% 33% 33% 34% 100% 31% 33% 36% 100% Esse tipo de tabela serve para comparar a distribuição da procedência dos indivíduos conforme grau de instrução. 04/11/2015 3 Distribuição da região de procedência por grau de instrução 0% 20% 40% 60% 80% 100% fundamental medio superior total Capital Interior Outra � Um dos principais objetivos de se construir uma distribuição conjunta de duas variáveis é descrever a associação entre elas. Ex: Verificar se existe ou não associação entre o sexo e a carreira escolhida por 200 alunos de Economia e Administração. Masculino Feminino Total Economia 85 35 120 Administração 55 25 80 Total 140 60 200 Y X Distribuição conjunta de alunos segundo o sexo(X) e o curso escolhido (Y). 04/11/2015 4 Masculino Feminino Total Economia 85/140 = 61% 58% 60% Administração 55/140 = 39% 42% 40% Total 100% 100% 100% Y X Distribuição conjunta das proporções de alunos segundo o sexo(X) e o curso escolhido (Y). Independentemente do sexo, 60% das pessoas preferem Economia e 40% preferem Administração. As proporções do sexo masculino (61% e 39%) e feminino (58% e 42%) são próximas das marginais (60% e 40%). Neste caso, as variáveis sexo e escolha do curso parecem ser não associadas. Ex: Semelhante ao anterior, mas envolvendo alunos de Física e Ciências Sociais. Masculino Feminino Total Física 100 (71%) 20 (33%) 120 (60%) Ciências Sociais 40 (29%) 40 (67%) 80 (40%) Total 140 (100%) 60 (100%) 200 (100%) Y X Distribuição conjunta das freqüências e proporções de alunos segundo o sexo(X) e o curso escolhido (Y). As proporções do sexo masculino (71% e 29%) e feminino (33% e 67%) são bem diferentes das marginais (60% e 40%). Parece haver uma maior concentração de homens no curso de Física e de mulheres no de Ciências Sociais. Neste caso, as variáveis sexo e curso escolhido parecem ser associadas. 04/11/2015 5 *VariáveisVariáveisVariáveisVariáveis quantitativasquantitativasquantitativasquantitativas Ex: Verificar se existe ou não associação entre os anos de serviço (X) e o número de clientes (Y) dos agentes de uma empresa de seguros. Agente Anos de serviço (X) Número de clientes (Y) A 2 48 B 3 50 C 4 56 D 5 52 E 4 43 F 6 60 G 7 62 H 8 58 I 8 64 J 10 72 Gráfico de dispersão para as variáveis X e Y 40 45 50 55 60 65 70 75 1 2 3 4 5 6 7 8 9 10 11 Anos de serviço N ú m e ro d e c li e n te s Parece haver uma associação entre as variáveis. 04/11/2015 6 � CovariânciaCovariânciaCovariânciaCovariância: mede o grau em que os valores de X e Y se alteram mutuamente. Se: σXY = COV (X,Y) > 0 relação positiva; σXY = COV (X,Y) < 0 relação negativa; σXY = COV (X,Y) = 0 não existe relação. � CoeficienteCoeficienteCoeficienteCoeficiente dededede correlaçãocorrelaçãocorrelaçãocorrelação: é uma medida do grau de associação entre duas variáveis e também da proximidade dos dados a uma reta. ◦ 0,7 ~ 0,9 (forte) ◦ 0,4 ~ 0,6 (moderada) ◦ 0,1 ~ 0,3 (fraca) YX YX YXCOV σσ ρ ),( , = 11 , +≤≤− YXρ 04/11/2015 7 0>COV 0<COV 1=ρ 0=COV 1−=ρ 0=ρ � Uma amostra de 5 operários a) Faça o diagrama de dispersão; b) Você acha que existe uma dependência linear entre as duas variáveis? c) Calcule o coeficiente de correlação. X 1 2 4 4 5 Y 7 8 3 2 2 X: anos de experiência Y: tempo (min) gasto na execução de certa tarefa iiii xxxxiiii yyyyiiii xxxxiiii –––– xxxx (x(x(x(xi i i i –––– x)x)x)x) 2222 yyyyiiii----yyyy ((((yyyyiiii----y)y)y)y) 2222 (x(x(x(xiiii –––– xxxx)()()()(yyyyiiii----yyyy)))) _ _ _ _ _ _ 04/11/2015 8 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 Anos de experiência T e m p o ( m in ) 9189,0−=ρ
Compartilhar