Análise Bidimensional - Exercícios
6 pág.

Análise Bidimensional - Exercícios

Disciplina:Introdução à Probabilidade e a Estatística II116 materiais1.289 seguidores
Pré-visualização2 páginas
1

LISTA DE EXERCÍCIOS
ESTATÍSTICA I (BIOLOGIA)

Análise Bidimensional / Regressão Linear

1. Numa pesquisa sobre rotatividade de mão-de-obra, para uma amostra de 40 pessoas foram
observadas duas variáveis: número de empregos nos últimos dois anos (X) e salário mais recente, em
número de salários mínimos (Y). Os resultados foram:

Indivíduo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X 1 3 2 3 2 2 3 1 2 3 2 3 1 2 3 4 1 2 2 2
Y 6 2 4 1 4 1 3 5 2 2 5 2 6 6 2 2 5 5 1 1

Indivíduo 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
X 2 3 4 1 2 3 4 1 4 3 2 1 4 2 4 3 1 3 2 2
Y 4 2 1 5 4 2 1 5 4 3 2 1 1 6 2 1 4 2 3 5

a. Usando a mediana, classifique os indivíduos em dois níveis, alto e baixo, para cada uma das
variáveis, e construa a distribuição de frequências conjunta das duas classificações.

b. Qual a porcentagem das pessoas com baixa rotatividade e ganhando pouco?
c. Qual a porcentagem das pessoas que ganham pouco?
d. Entre as pessoas com baixa rotatividade, qual a porcentagem das que ganham pouco?
e. A informação adicional dada no ítem (d) mudou muito a porcentagem observada em (c) ? O

que isso significa?
f. Verifique se há relação entre as variáveis rotatividade e salário.
g. Qual o valor de 2χ e do coeficiente de contingência para estes dados?
h. Construa a tabela de frequências conjuntas para as variáveis X e Y.
i. Construa o gráfico de dispersão destes dados.
j. Calcule o coeficiente de correlação. Baseado neste número você diria que existe dependência

entre as duas variáveis?

Respostas:

(a) Temos que 0,2)( =Xmd e 5,2)( =Ymd . Assim,

 Y
X Baixo Alto Total
Baixo 1 (0,025) 7 (0,175) 8 (0,20)
Alto 19 (0,475) 13 (0,325) 32 (0,80)
Total 20 (0,50) 20 (0,50) 40 (1,00)

(b) Da tabela, tem-se que 2,5% dos indivíduos encontram-se nessas condições.

 2

(c) 50%.
(d) Dentre as pessoas com baixa rotatividade, 12,5% ganham pouco.
(e) A probabilidade em (c) foi bastante modificada. Isto indica que a maioria das pessoas que

ganham pouco têm rotatividade.

2. Uma companhia de seguros analisou a frequência com que 2000 segurados (1000 homens e 1000
mulheres) usaram o hospital. Os resultados foram:

 Homens Mulheres

Usaram o hospital 100 150

Não usaram o hospital 900 850

a. Calcule a proporção de homens entre os indivíduos que usaram o hospital.
b. Calcule a proporção de homens entre os indivíduos que não usaram o hospital.
c. O uso do hospital independe do sexo do segurado?
d. Encontre uma medida de dependência entre as variáveis.

Respostas:

(a) A proporção de homens entre os indivíduos que usaram o hospital é: 4,0250100 =

(b) A proporção de homens entre os indivíduos que não usaramo hospital é: 514,01750900 =

(c) Tabela do total de colunas.
Usaram o hospital 100 (0,10) 150 (0,15) 0,25

Não usaram o hospital 900 (0,90) 850 (0,85) 0,75
 1,00 1,00 1,00

Independentemente do sexo, 25% das pessoas usam e 75% não usam o hospital. Essas porcentagens deveriam ser
iguais nas duas colunas e não são. Portanto, o uso do hospital depende do sexo do segurado.

3. No estudo de uma certa comunidade verificou-se que:

(I) A proporção de indivíduos solteiros é de 0,4.
(II) A proporção de indivíduos que recebem até 10 salários mínimos é de 0,2.
(III) A proporção de indivíduos que recebem até 20 salários mínimos é de 0,7.
(IV) A proporção de indivíduos casados entre os que recebem mais de 20 salários mínimos é de 0,7.
(V) A proporção de indivíduos que recebem até 10 salários mínimos entre os solteiros é de 0,3.

a. Construa a distribuição conjunta das variáveis estado civil e faixa salarial e as respectivas
distribuições marginais.

b. Você diria que existe relação entre as duas variáveis consideradas?

 3

Respostas:

(a)
 Salário
Estado Civil Menos de 10 SM Entre 10 e 20 SM Mais de 20 SM Total
Solteiro 0,12 0,19 0,09 0,40
Casado 0,08 0,31 0,21 0,60
Total 0,20 0,50 0,30 1,00

(b) Considere-se a tabela do total de colunas:
 Salário
Estado Civil Menos de 10 SM Entre 10 e 20 SM Mais de 20 SM Total
Solteiro 0,60 0,38 0,30 0,40
Casado 0,40 0,62 0,70 0,60
Total 1,00 1,00 1,00 1,00

Pelas diferenças entre as proporções marginais e as do interior da tabela, parece haver relação entre as
variáveis.

4. Uma pesquisa para verificar a tendência dos alunos a prosseguir os estudos, segundo a classe social
do respondente, mostrou o seguinte quadro:

Pretende Classe Social Total
continuar? Alta Média Baixa

Sim 200 220 380 800
Não 200 280 720 1200

a. Você diria que a distribuição de respostas afirmativas é igual a de respostas negativas?
b. Existe dependência entre os dois fatores? Dê uma medida quantificadora da dependência.
c. Se dos 400 alunos da classe alta 160 escolhessem continuar e 240 não, você mudaria sua

conclusão? Justifique.

Respostas:

(a) Tabela dos totais de colunas.
Pretende
continuar?

Classe social
Alta Média Baixa Total

Sim 0,50 0,44 0,38 0,40
Não 0,50 0,56 0,72 0,60

Há evidências de que a distribuição das respostas afirmativas e negativas não coincidem.
(b) Tabela dos valores observados e esperados:

Pretende
continuar?

Classe social
Alta Média Baixa Total

Sim 200 (160) 220 (200) 380 (440) 800
Não 200 (240) 280 (300) 720 (660) 1200

 4

( )
∑ =+++++=

−

= 63,3345,533,167,618,800,200,10
2

2

i

ii

e

eoχ

Existe dependência entre as variáveis.

(c) Se houvesse tal modificação, a dependência entre as variáveis seria apenas menor ( 01,72 =χ ).

5. Lançam-se, simultaneamente, uma moeda de um real e uma de um quarto de dólar. Em cada
tentativa anotou-se o resultado obtido, cujos dados estão resumidos na tabela.

Número de caras e coroas em 100 lançamentos de uma moeda de 1 real e de 1/4 de dólar

 Cara
(moeda de 1 real)

Coroa
(moeda de 1 real)

 Total

Cara
(moeda 1/4 de dólar)

24 22 46

Coroa
(moeda 1/4 de dólar)

28 26 54

 Total

52 48 100

a. Estes dados sugerem que os resultados da moeda de um real e as de 1/4 de dólar estão
associados?

b. Atribua para ocorrência de cara o valor 0, e para a ocorrência de coroa o valor 1. Chamando de
1X o resultado da moeda de um real e de 2X o resultado do quarto de dólar, calcule a correlação

entre 1X e 2X . Esta medida está de acordo com a resposta que você deu anteriormente?

Respostas:

(a) Tabela dos valores observados e dos observados:
 Cara Coroa Total
Cara 24 (23,92) 22 (22,08) 46
Coroa 28 (28,08) 26 (25,92) 54
Total 52 48 100

( )
∑ =+++=

−

= 0008,00002,00002,00002,00002,0
2

2

i

ii

e

eoχ

Logo, não há associação entre os resultados das moedas de um real e de um quarto de dólar.
(b) O coeficiente de correlação linear entre as variáveis X1 e X2 é 0, pois X1 e X2 são

independentes. Esse resultado está de acordo com o resultado do item anterior

 5

6. Os dados referem-se ao índice de inflação (y) de 1967 a 1979:

Ano (x) 1967 1969 1971 1973 1975 1977 1979
Inflação (y) 128 192 277 373 613 1236 2639

a. Faça o gráfico de y em relação a t (onde t=0 corresponde a 1973).
b. Encontre as estimativas para o modelo ttf βα +=)( .
c. De acordo com o modelo, qual seria a previsão de inflação para 1981 ?
d. Você teria alguma restrição em adotar o modelo linear neste caso?

Respostas: (b) ttf 6,3557,779)(ˆ +=/ (onde t=0 corresponde a 1973) ; (c) 2202; (d) Sim, pois o gráfico
sugere uma função quadrática.

7. A velocidade v de um corpo em queda livre foi determinada em função do tempo t . Desprezando a
resistência do ar, a relação esperada entre v e t é tgv = onde g é a aceleração da gravidade local.
Os resultados da experiência são mostrados na tabela:

t (s) v (m/s)
0,00 0,00
0,05 0,71
0,10 0,96
0,15 1,69
0,20 2,10
0,25 2,54
0,30 2,81
0,35 3,57
0,40 3,90

a. Estabeleça a equação de regressão linear tgv ˆˆ = . Construa o diagrama de dispersão e trace a reta
de regressão.

b. A partir dos dados, qual é a estimativa para a aceleração da