Buscar

Análise Bidimensional - Exercícios

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

1 
LISTA DE EXERCÍCIOS 
ESTATÍSTICA I (BIOLOGIA) 
 
Análise Bidimensional / Regressão Linear 
 
 
1. Numa pesquisa sobre rotatividade de mão-de-obra, para uma amostra de 40 pessoas foram 
observadas duas variáveis: número de empregos nos últimos dois anos (X) e salário mais recente, em 
número de salários mínimos (Y). Os resultados foram: 
 
Indivíduo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 
X 1 3 2 3 2 2 3 1 2 3 2 3 1 2 3 4 1 2 2 2 
Y 6 2 4 1 4 1 3 5 2 2 5 2 6 6 2 2 5 5 1 1 
 
Indivíduo 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 
X 2 3 4 1 2 3 4 1 4 3 2 1 4 2 4 3 1 3 2 2 
Y 4 2 1 5 4 2 1 5 4 3 2 1 1 6 2 1 4 2 3 5 
 
a. Usando a mediana, classifique os indivíduos em dois níveis, alto e baixo, para cada uma das 
variáveis, e construa a distribuição de frequências conjunta das duas classificações. 
b. Qual a porcentagem das pessoas com baixa rotatividade e ganhando pouco? 
c. Qual a porcentagem das pessoas que ganham pouco? 
d. Entre as pessoas com baixa rotatividade, qual a porcentagem das que ganham pouco? 
e. A informação adicional dada no ítem (d) mudou muito a porcentagem observada em (c) ? O 
que isso significa? 
f. Verifique se há relação entre as variáveis rotatividade e salário. 
g. Qual o valor de 2χ e do coeficiente de contingência para estes dados? 
h. Construa a tabela de frequências conjuntas para as variáveis X e Y. 
i. Construa o gráfico de dispersão destes dados. 
j. Calcule o coeficiente de correlação. Baseado neste número você diria que existe dependência 
entre as duas variáveis? 
 
Respostas: 
(a) Temos que 0,2)( =Xmd e 5,2)( =Ymd . Assim, 
 
 Y 
X Baixo Alto Total 
Baixo 1 (0,025) 7 (0,175) 8 (0,20) 
Alto 19 (0,475) 13 (0,325) 32 (0,80) 
Total 20 (0,50) 20 (0,50) 40 (1,00) 
 
(b) Da tabela, tem-se que 2,5% dos indivíduos encontram-se nessas condições. 
 2 
(c) 50%. 
(d) Dentre as pessoas com baixa rotatividade, 12,5% ganham pouco. 
(e) A probabilidade em (c) foi bastante modificada. Isto indica que a maioria das pessoas que 
ganham pouco têm rotatividade. 
 
 
2. Uma companhia de seguros analisou a frequência com que 2000 segurados (1000 homens e 1000 
mulheres) usaram o hospital. Os resultados foram: 
 Homens Mulheres 
Usaram o hospital 100 150 
Não usaram o hospital 900 850 
 
a. Calcule a proporção de homens entre os indivíduos que usaram o hospital. 
b. Calcule a proporção de homens entre os indivíduos que não usaram o hospital. 
c. O uso do hospital independe do sexo do segurado? 
d. Encontre uma medida de dependência entre as variáveis. 
 
Respostas: 
(a) A proporção de homens entre os indivíduos que usaram o hospital é: 4,0250100 = 
(b) A proporção de homens entre os indivíduos que não usaramo hospital é: 514,01750900 = 
(c) Tabela do total de colunas. 
Usaram o hospital 100 (0,10) 150 (0,15) 0,25 
Não usaram o hospital 900 (0,90) 850 (0,85) 0,75 
 1,00 1,00 1,00 
Independentemente do sexo, 25% das pessoas usam e 75% não usam o hospital. Essas porcentagens deveriam ser 
iguais nas duas colunas e não são. Portanto, o uso do hospital depende do sexo do segurado. 
 
 
3. No estudo de uma certa comunidade verificou-se que: 
 
(I) A proporção de indivíduos solteiros é de 0,4. 
(II) A proporção de indivíduos que recebem até 10 salários mínimos é de 0,2. 
(III) A proporção de indivíduos que recebem até 20 salários mínimos é de 0,7. 
(IV) A proporção de indivíduos casados entre os que recebem mais de 20 salários mínimos é de 0,7. 
(V) A proporção de indivíduos que recebem até 10 salários mínimos entre os solteiros é de 0,3. 
 
a. Construa a distribuição conjunta das variáveis estado civil e faixa salarial e as respectivas 
distribuições marginais. 
b. Você diria que existe relação entre as duas variáveis consideradas? 
 
 3 
Respostas: 
(a) 
 Salário 
Estado Civil Menos de 10 SM Entre 10 e 20 SM Mais de 20 SM Total 
Solteiro 0,12 0,19 0,09 0,40 
Casado 0,08 0,31 0,21 0,60 
Total 0,20 0,50 0,30 1,00 
(b) Considere-se a tabela do total de colunas: 
 Salário 
Estado Civil Menos de 10 SM Entre 10 e 20 SM Mais de 20 SM Total 
Solteiro 0,60 0,38 0,30 0,40 
Casado 0,40 0,62 0,70 0,60 
Total 1,00 1,00 1,00 1,00 
Pelas diferenças entre as proporções marginais e as do interior da tabela, parece haver relação entre as 
variáveis. 
 
 
4. Uma pesquisa para verificar a tendência dos alunos a prosseguir os estudos, segundo a classe social 
do respondente, mostrou o seguinte quadro: 
 
Pretende Classe Social Total 
continuar? Alta Média Baixa 
Sim 200 220 380 800 
Não 200 280 720 1200 
 
a. Você diria que a distribuição de respostas afirmativas é igual a de respostas negativas? 
b. Existe dependência entre os dois fatores? Dê uma medida quantificadora da dependência. 
c. Se dos 400 alunos da classe alta 160 escolhessem continuar e 240 não, você mudaria sua 
conclusão? Justifique. 
 
Respostas: 
(a) Tabela dos totais de colunas. 
Pretende 
continuar? 
Classe social 
Alta Média Baixa Total 
Sim 0,50 0,44 0,38 0,40 
Não 0,50 0,56 0,72 0,60 
Há evidências de que a distribuição das respostas afirmativas e negativas não coincidem. 
(b) Tabela dos valores observados e esperados: 
Pretende 
continuar? 
Classe social 
Alta Média Baixa Total 
Sim 200 (160) 220 (200) 380 (440) 800 
Não 200 (240) 280 (300) 720 (660) 1200 
 4 
( )
∑ =+++++=
−
= 63,3345,533,167,618,800,200,10
2
2
i
ii
e
eoχ 
Existe dependência entre as variáveis. 
(c) Se houvesse tal modificação, a dependência entre as variáveis seria apenas menor ( 01,72 =χ ). 
 
 
 
5. Lançam-se, simultaneamente, uma moeda de um real e uma de um quarto de dólar. Em cada 
tentativa anotou-se o resultado obtido, cujos dados estão resumidos na tabela. 
 
Número de caras e coroas em 100 lançamentos de uma moeda de 1 real e de 1/4 de dólar 
 
 Cara 
(moeda de 1 real) 
Coroa 
(moeda de 1 real) 
 Total 
Cara 
(moeda 1/4 de dólar) 
24 22 46 
Coroa 
(moeda 1/4 de dólar) 
28 26 54 
 Total 
 
52 48 100 
 
a. Estes dados sugerem que os resultados da moeda de um real e as de 1/4 de dólar estão 
associados? 
b. Atribua para ocorrência de cara o valor 0, e para a ocorrência de coroa o valor 1. Chamando de 
1X o resultado da moeda de um real e de 2X o resultado do quarto de dólar, calcule a correlação 
entre 1X e 2X . Esta medida está de acordo com a resposta que você deu anteriormente? 
 
 
Respostas: 
(a) Tabela dos valores observados e dos observados: 
 Cara Coroa Total 
Cara 24 (23,92) 22 (22,08) 46 
Coroa 28 (28,08) 26 (25,92) 54 
Total 52 48 100 
( )
∑ =+++=
−
= 0008,00002,00002,00002,00002,0
2
2
i
ii
e
eoχ 
Logo, não há associação entre os resultados das moedas de um real e de um quarto de dólar. 
(b) O coeficiente de correlação linear entre as variáveis X1 e X2 é 0, pois X1 e X2 são 
independentes. Esse resultado está de acordo com o resultado do item anterior 
 
 
 5 
6. Os dados referem-se ao índice de inflação (y) de 1967 a 1979: 
 
Ano (x) 1967 1969 1971 1973 1975 1977 1979 
Inflação (y) 128 192 277 373 613 1236 2639 
 
a. Faça o gráfico de y em relação a t (onde t=0 corresponde a 1973). 
b. Encontre as estimativas para o modelo ttf βα +=)( . 
c. De acordo com o modelo, qual seria a previsão de inflação para 1981 ? 
d. Você teria alguma restrição em adotar o modelo linear neste caso? 
 
Respostas: (b) ttf 6,3557,779)(ˆ +=/ (onde t=0 corresponde a 1973) ; (c) 2202; (d) Sim, pois o gráfico 
sugere uma função quadrática. 
 
 
7. A velocidade v de um corpo em queda livre foi determinada em função do tempo t . Desprezando a 
resistência do ar, a relação esperada entre v e t é tgv = onde g é a aceleração da gravidade local. 
Os resultados da experiência são mostrados na tabela: 
t (s) v (m/s) 
0,00 0,00 
0,05 0,71 
0,10 0,96 
0,15 1,69 
0,20 2,10 
0,25 2,54 
0,30 2,81 
0,35 3,57 
0,40 3,90 
 
a. Estabeleça a equação de regressão linear tgv ˆˆ = . Construa o diagrama de dispersão e trace a reta 
de regressão. 
b. A partir dos dados, qual é a estimativa para a aceleração dagravidade local g ? 
 
Respostas: (a) Equação de regressão: ˆ 9,99v t= ; (b) 29,99g m s≈ 
 
 
8. A tabela abaixo apresenta uma amostra com os pesos de 10 pais e de seus filhos mais velhos. 
 
Peso dos pais 
(x) 
 60 65 70 68 63 69 71 64 66 64 
Peso dos filhos 
(y) 
 63 64 71 69 63 68 73 63 64 62 
 
 Calcular o coeficiente de correlação linear entre os pesos dos pais e dos filhos. 
 
Resposta: 0,9011r = 
 6 
9. Os dados a seguir são a média das notas x e salários mensais y de estudantes que obtiveram 
bacharelado em administração. 
Média das notas Salário Mensal (US$) 
2,6 2800 
3,4 3100 
3,6 3500 
3,2 3000 
3,5 3400 
2,9 3100 
 
a. Obtenha a equação de regressão para estes dados. 
b. Calcule a Soma de Quadrados Total 
( )2
1
n
i
i
SQT y y
=
= −∑ , 
a Soma dos Quadrados devida à Regressão 
( )2
1
ˆ
n
i
i
SQR y y
=
= −∑ 
e a Soma dos Quadrados devida ao Erro 
( )2
1
ˆ
n
i i
i
SQE y y SQT SQR
=
= − = −∑ . 
 
c. Calcule o coeficiente de determinação 2r . Interprete este resultado. 
d. Qual é o valor do coeficiente de correlação da amostra? 
 
 
Respostas: (a) ˆ 1290,5 581,1y x= + ; (b) 335000SQT = ; 249864,86SQR = ; 85135,14SQE = . (c) 
2 0,746r = . A reta de mínimos quadrados explica 74,6% da soma de quadrados total; (d) 0,8637r = + .

Outros materiais