Buscar

Lista de exercícios 1 - variáveis, média, mediana, moda, desvio padrão, variância

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade de Bras´ılia
Departamento de Estat´ıstica
Lista de exerc´ıcios 1
Bioestat´ıstica - Turma A - 1o/2018
1. Classifique as seguintes varia´veis:
a) Prefereˆncias pol´ıticas (esquerda, direita ou centro).
b) Marcas de cerveja.
c) Velocidade em hm/h.
d) O peso em kg.
e) Signo do zod´ıaco.
f) Nı´vel educacional (prima´rio, secunda´rio, superior).
g) Anos de estudos completos.
h) Tipo de ensino (privado ou pu´blico).
i) Nu´mero de empregados de uma empresa.
j) A temperatura de um paciente em graus Celsius.
k) A classe social (baixa, me´dia ou alta).
l) A pressa˜o de um pneu em Nw/cm2.
2. Classifique as va´ria´veis que aparecem no seguinte questiona´rio:
a. Qual sua idade?
b. Qual o seu estado civil?
I. Solteiro
II. Casado
III. Divorciado
IV. Viu´vo
c. Quanto tempo leva para voceˆ se locomover ao trabalho?
d. Qual e´ o tamanho do munic´ıpio onde voceˆ reside?
I. menos de 2.000 habitantes
II. de 2.000 a 10.000 habitantes
III. de 10.000 a 50.000 habitantes
IV. de 50.000 a 100.000 habitantes
V. mais de 100.000 habitantes
e. Voceˆ e´ associado a` Prevideˆncia Social?
3. No seguinte conjunto de dados, sa˜o fornecidos os pesos (arredondados em quilos) de
crianc¸as nascidas em certo intervalo de tempo:
1.8, 3.6, 1.8, 2.7, 3.6, 2.7, 3.2, 3.2, 3.2, 3.6, 4.5, 4.1, 3.2, 2.7, 4.5, 3.6, 2.3, 4.1,
2.7, 1.4, 3.2, 2.7, 1.8, 3.2, 2.7, 4.1, 3.2, 1.8, 3.2, 2.7, 3.6, 3.6, 4.1, 5.0, 3.6, 3.2,
4.5, 3.6, 2.3, 3.2, 3.2, 2.7, 2.3, 4.5, 3.6, 4.1, 3.2, 2.3, 2.7, 2.3.
a) Construa uma dristribuic¸a˜o de frequeˆncia desses pesos.
b) Encontre as frequeˆncias relativas, frequeˆncias acumuladas e frequeˆncias relativas
acumuladas.
c) Desenhe um histograma com os dados do item a).
d) Por que se utilizou um histograma para representar tais dados em vez de um gra´fico
de barras?
e) Calcule as medidas de tendeˆncia central
f) Calcule as medidas de dispersa˜o
g) A distribuic¸a˜o e´ sime´trica? Caso na˜o seja, em que direc¸a˜o esta´ a assimetria?
4. Com a finalidade de observar a relac¸a˜o entre a inteligeˆncia e o n´ıvel socioeconoˆmico
(medido pela renda mensal familiar), foram constitu´ıdos dois grupos, um formado com
indiv´ıduos de quociente intelectual inferior a 95 e outro formado pelos demais. De cada
indiv´ıduo, foi anotada a renda mensal familiar. Considere os resultados indicados na
tabela:
Nı´vel socioeconoˆmico Indiv´ıduos com CI < 95 Indiv´ıduos com CI ≥ 95
Intervalos Frequeˆncia Frequeˆncia
10 ou menos ≡ (4, 10] 75 19
10−| 16 35 26
16−| 22 20 25
22−| 28 30 30
28−| 34 25 54
mais de 34 ≡ (34, 40] 15 46
a) Desenhe um gra´fico que permita comparar ambos os grupos.
b) Calcule as medidas de tendeˆncia central para cada grupo.
c) Calcule as medidas de dispersa˜o para cada grupo.
d) Fac¸a uma ana´lise comparativa entre os dois grupos.
5. Um estudo consistiu em anotar o nu´mero de palavras lidas em 15 segundos por um
grupo de 120 indiv´ıduos disle´xicos e por outro de 120 indiv´ıduos normais. Considerando
os resultados da tabela:
No de palavras lidas Disle´xicos nD Normais nN
25 ou menos ≡ 25 56 1
26 24 9
27 16 21
28 12 29
29 10 28
30 ou mais ≡ 30 2 32
a) Calcule as me´dias aritme´ticas de ambos os grupos.
b) Calcule as medianas de ambos os grupos.
c) Calcule as medidas de dispersa˜o para cada grupo.
d) Fac¸a uma ana´lise comparativa entre os dois grupos.
6. A tabela seguinte mostra a composic¸a˜o por idade, sexo e trabalho de um grupo de
pessoas com tuberculose pulmonar na prov´ıncia de Viscaya no ano de 1979:
Idade Trabalhadores Na˜o-trabalhadores Totais
Homem Mulher Total Homem Mulher Total Homem Mulher Total
14 |− 19 2 1 3 25 40 65 27 41 68
19 |− 24 10 4 14 20 36 56 30 40 70
24 |− 29 32 10 42 15 50 65 47 60 107
29 |− 34 47 12 59 13 34 47 60 46 106
34 |− 39 38 8 46 10 25 35 48 33 81
39 |− 44 22 4 26 7 18 25 29 22 51
a) Represente graficamente a distribuic¸a˜o de frequeˆncias daquelas pessoas trabalha-
doras que padecem de tuberculose.
b) Represente graficamente a distribuic¸a˜o de frequeˆncias dos homens na˜o-trabalhadores
que padecem de tuberculose.
c) Represente graficamente a distribuic¸a˜o de frequeˆncias do nu´mero total de mulheres
que padecem de tuberculose.
d) Qual e´ a idade em que se observa, com maior frequeˆncia, que os homens na˜o
trabalham? E as mulheres? Determine tambe´m a idade mais frequente (sem
distinc¸a˜o de sexo e ocupac¸a˜o).
e) Abaixo de que idade esta˜o 50% dos homens?
f) Acima de que idade esta˜o os 80% das mulheres?
g) Obtenha a me´dia, mediana e o desvio padra˜o da distribuic¸a˜o das idades da amostra
total.
h) Estude a assimetria das treˆs distribuic¸o˜es.
7. Durante uma epidemia de escarlatina, recolheu-se um certo nu´mero de mortos em 40
cidades de um pa´ıs, obtendo-se a seguinte tabela:
No de mortos 0 1 2 3 4 5 6 7
Cidades 7 11 10 7 1 2 1 1
a) Represente graficamente esses dados.
b) Obtenha a distribuic¸a˜o acumulada e represente-a.
c) Calcule a me´dia, a mediana e a moda.
d) Calcule a variaˆncia e o desvio padra˜o.
e) Calcule a porcentagem de cidades com, pelo menos, 2 mortos.
f) Calcule a porcentagem de cidades com mais de 3 mortos.
g) Calcule a porcentagem de cidades com, no ma´ximo, 5 mortos.
8. As taxas me´dias geome´tricas de incremento anual (por 100 habitantes) dos 30 maiores
munic´ıpios do Brasil esta˜o listadas abaixo
3,67 1,82 3,73 4,10 4,30
1,28 8,14 2,43 4,17 5,36
3,96 6,54 5,84 7,35 3,63
2,93 2,82 8,45 5,28 5,41
7,77 4,65 1,88 2,12 4,26
2,78 5,54 0,90 5,09 4,07
a) Construa a distribuic¸a˜o de frequeˆncias com classes de amplitude de tamanho 2
comec¸ando em zero e terminando em 10.
b) Fac¸a um histograma a partir de a).
9. Dispomos uma relac¸a˜o de 200 alugue´is de imo´veis urbanos e uma relac¸a˜o de 100 alugue´is
de imo´veis rurais.
Classes de aluguel (codificados) Zona Urbana Zona Rural
2|−3 10 30
3|−5 40 50
5|−7 80 15
7|−10 50 5
10|−15 20 0
Total 200 100
a) Construa o histograma das duas distribuic¸o˜es.
b) Represente as distribuic¸o˜es em um mesmo gra´fico, utilizando pol´ıgonos de frequeˆncias.
c) Com base nos itens acima, discuta e compare as distribuic¸o˜es.
10. O nu´mero de divo´rcios em uma cidade, de acordo com a durac¸a˜o do casamento, esta´
representado na tabela abaixo
Anos de casamento No de divo´rcios
0|−6 2.800
6|−12 1.400
12|−18 600
18|−24 150
24|−30 50
a) Qual a durac¸a˜o me´dia dos casamentos? E a mediana
b) Encontre a variaˆncia e desvio padra˜o dos casamentos.
c) Construa o histograma da distribuic¸a˜o.
d) Encontre o P25 e P75.
e) A distribuic¸a˜o parece sime´trica?
11. O que acontece com a mediana, me´dia e o desvio padra˜o de uma se´rie de dados quando:
a) Cada observac¸a˜o e´ multiplicada por 2.
b) Soma-se 10 a cada observac¸a˜o.
c) Subtrai-se a me´dia geral x¯ de cada observac¸a˜o.
d) De cada observac¸a˜o subtrai-se a me´dia x¯ e divide-se o valor pelo desvio padra˜o
dp(x).
12. Numa pesquisa sobre rotatividade da ma˜o de obra, para uma amostra de 40 pessoas
foram observadas duas varia´veis: Nu´mero de empregos nos u´ltimos dois anos (X) e
sala´rio mais recente, em nu´mero de sala´rios mı´nimos (Y ). Os resultados foram:
Indiv´ıduo X Y Indiv´ıduo X Y
1 1 6 21 2 4
2 3 2 22 3 2
3 2 4 23 4 1
4 3 1 24 1 5
5 2 4 25 2 4
6 2 1 26 3 2
7 3 3 27 4 1
8 1 5 28 1 5
9 2 2 29 4 4
10 3 2 30 3 3
11 2 5 31 2 2
12 3 2 32 1 1
13 1 6 33 4 1
14 2 6 34 2 6
15 3 2 35 4 2
16 4 2 36 3 1
17 1 5 37 1 4
18 2 5 38 3 2
19 2 1 39 2 3
20 2 1 40 2 5
a) Usando a mediana, classifique os indiv´ıduos em dois n´ıveis, alto e baixo, para cada
uma das varia´veis e construa a distribuic¸a˜o de frequeˆncias conjunta das duas
classificac¸o˜es.
b) Qual a porcentagem de pessoas com baixa rotatividade e ganhando pouco?
c) Qual a porcentagem de pessoas que ganham pouco?
d) Entre as pessoas com baixa rotatividade,qual a porcentagem das pessoas que
ganham pouco?
e) A informac¸a˜o de adicional dada em d) mudou muito em relac¸a˜o a porcentagem
obtida em c)? O que isso significa?
f) Verifique se ha´ associac¸a˜o entre as varia´veis rotatividade e sala´rio.
g) Se houver associac¸a˜o, ajuste a reta de regressa˜o que explique o sala´rio pela rotati-
vidade.
13. Se 0 < α < 1, uma me´dia aparada a 100α% e´ obtida eliminando 100α% dentre as
maiores e menores observac¸o˜es e calculando-se a me´dia aritme´tica das restantes. Por
exemplo, se tivermos 10 observac¸o˜es ordenadas x(1) < x(2) < . . . < x(10), a me´dia
aparada a 10% e´:
x¯(0, 10) =
x(2) + . . .+ x(9)
8
.
Abaixo temos os dados de sala´rio (em sala´rios mı´nimos) de 36 funciona´rios de uma
empresa:
4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59
7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80
10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85
14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30
a) Calcule a me´dia aparada a 10% e 25% para os dados de sala´rio.
b) Qual o objetivo do autor ao criar a me´dia aparada?
14. A companhia A de detetizac¸a˜o afirma que o processo de por ela utilizado garante
um efeito mais prolongado do que aquele obtido por seu concorrentes diretos. Uma
amostra de va´rios ambientes foi dedetizados foi colhida e anotou-se a durac¸a˜o do efeito
da dedetizac¸a˜o. Os resultados esta˜o na tabela abaixo. Voceˆ acha que existe alguma
evideˆncia a favor ou contra a afirmac¸a˜o feita pela companha A?
Compania
Durac¸a˜o do efeito da dedetizac¸a˜o
Menos de 4 meses De 4 a 8 meses Mais de 8 meses
A 64 120 16
B 104 17 21
C 27 48 5
15. Prove que
1
n
n∑
i=1
(
xi − x¯
dp(x)
)(
yi − y¯
dp(y)
)
=
∑n
i=1 xiyi − nx¯y¯√
(
∑n
i=1 x
2
i − nx¯2)(
∑n
i=1 y
2
i − ny¯2)
16. Foi realizado um estudo para estabelecer uma equac¸a˜o mediante a qual se possa utilizar
a concentrac¸a˜o de estro´geno na saliva (X) para predizer a concentrac¸a˜o de estro´geno
em plasma livre (Y ). Foram extra´ıdos os seguintes dados de 14 homens sadios:
X 1,4 7,5 8,5 9 9 11 13 14 14,5 16 17 18 20 23
Y 30 25 31,5 27,5 39,5 38 43 49 55 48,5 51 64,5 63 68
a) Estude a poss´ıvel relac¸a˜o linear entre ambas a varia´veis.
b) Obtenha a equac¸a˜o mencionada no enunciado do problema.
c) Determine a variac¸a˜o da concentrac¸a˜o de estro´geno em plasma livre por unidade
de estro´geno na saliva.
17. Pesquisadores esta˜o estudando a correlac¸a˜o entre obesidade e resposta individual a dor.
A obesidade e´ medida como porcentagem sobre o peso ideal (X), e a resposta a` dor e´
medida utilizando o limiar do reflexo de flexa˜o nociceptiva (Y ), que e´ uma medida de
sensac¸a˜o de ser pungido. Obteˆm-se os seguintes dados:
X 89 90 75 30 51 75 62 45 90 20
Y 2 3 4 4,5 5,5 7 9 13 15 14
a) Que porcentagem da variaˆncia do peso e´ explicada mediante um modelo de regressa˜o
linear pela variac¸a˜o do limiar do reflexo?
b) Estude a poss´ıvel relac¸a˜o entre ambas varia´veis, obtendo seu grau de ajuste.
c) Que porcentagem de sobrepeso podemos esperar um limiar de reflexo 10?
18. Para estudar o efeito das a´guas residuais dos bueiros que desa´guam em um lago, sa˜o
utilizadas as medidas da concentrac¸a˜o de nitrato na a´gua. Para monitorar a varia´vel,
utilizava-se um antigo me´todo manual, agora, idealiza-se um novo me´todo automa´tico.
Se evidenciarmos uma alta correlac¸a˜o positiva entre as medidas consideradas empre-
gando os dois me´todos, enta˜o faremos uso habitual do me´todo automa´tico. Os dados
obtidos sa˜o os seguintes:
Manual ≡ X 25 40 120 75 150 300 270 400 450 575
Automa´tico ≡ Y 30 80 150 80 200 350 240 320 470 583
a) Determine o coeficiente de determinac¸a˜o para ambas as varia´veis.
b) Comprove a idoneidade do modelo linear de regressa˜o. Caso o modelo seja apropri-
ado, determine a reta de regressa˜o de Y sobre X e utilize-a para predizer a leitura
que se obteria empregando a te´cnica automa´tica com uma amostra de a´gua, cuja
leitura manual e´ 100.
c) Para cada uma das observac¸o˜es, determine as predic¸o˜es que o modelo linear de
regressa˜o oferece para Y em func¸a˜o de X, ou seja, Yˆ .
d) Calcule os erros para cada uma das predic¸o˜es, ou seja, Y − Yˆ .
e) Que relac¸a˜o existe entre as medidas Y e Yˆ .
f) Calcule a me´dia de Y − Yˆ . O valor obtido foi esperado?
g) Calcule as variaˆncias de Y , Yˆ e Y − Yˆ .
h) Que relac¸a˜o existe entre S2Y e S
2
Yˆ
?
i) Que relac¸a˜o existe entre S2Y e S
2
Yˆ
?
j) Justifique, a partir de todas as considerac¸o˜es anteriores, por que r2 e´ denominado
grau de qualidade do ajuste linear.
19. Realizaram-se 9 tomadas de pressa˜o intracraniana em animais de laborato´rio, por meio
de um me´todo padra˜o direto e por meio de uma nova te´cnica experimental indireta,
obtendo-se os seguintes resultados em mm de Hg:
Me´todo padra˜o ≡ X 9 12 28 72 30 38 76 26 52
Me´todo experimental ≡ Y 6 10 27 67 25 35 75 27 53
a) Determine a equac¸a˜o linear que expressa a relac¸a˜o existente entre as presso˜es in-
tracranianas determinadas pelos dois me´tods.
b) Que porcentagem da variabilidade de Y e´ explicada pela regressa˜o? Determine o
grau de dependeˆncia entre as duas varia´veis.

Outros materiais