Buscar

material bioestatística (1)

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

material_bioestatística/aulas/Aula_10_10_Ap.pdf
Quantitativas
EST211 Bioestat´ıstica
Prof. Tiago Martins Pereira
10 de outubro de 2017
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
AULA PASSADA
Cap´ıtulo 2: ESTAT´ISTICA DESCRITIVA
1. Conjuntos de Dados e Varia´veis
1.1. Tipos de Varia´veis
Tabela : Classificac¸a˜o de varia´veis utilizadas em estat´ıstica.
Qualitativas Quantitativas
Nominais Discretas
Ordinais Cont´ınuas
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
AULA PASSADA
2. Descric¸a˜o de Varia´veis Qualitativas
* frequeˆncias absoluta, relativa e percentual
* distribuic¸a˜o de frequeˆncias
2.1.1. Representac¸a˜o Tabular (tabelas)
2.1.2. Representac¸a˜o Gra´fica
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Varia´veis Qualitativas
2.2. Duas Varia´veis Qualitativas
* A Estat´ıstica Descritiva se torna ainda mais interessante quando
dispomos frequeˆncias de duas varia´veis (Estat´ıstica Descritiva
Bidimensional), ou ainda mais de duas, simultaneamente.
→ Isto permite perceber eventuais associac¸o˜es entre varia´veis.
Por exemplo, sera´ que o Esta´gio de Maturac¸a˜o estaria associado
com o sexo dos bacalhaus?
→ Podemos usar uma tabela... de dupla entrada
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Varia´veis Qualitativas
Tabela : Frequeˆncias absolutas de bacalhaus conforme o sexo e o esta´gio
de maturac¸a˜o, em uma coleta feita no Mar de Barents.
Sexo
Maturac¸a˜o Machos Feˆmeas Totais
Imaturos 19 14 33
Intermedia´rios 3 5 8
Maduros 6 7 13
Totais 28 26 54
→ Na˜o se percebe uma associac¸a˜o; a frequeˆncia e´ maior para
imaturos e maduros, sendo menor para intermedia´rios, de maneira
semelhante em ambos os sexos
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Varia´veis Qualitativas
Disposic¸a˜o gra´fica: podemos dispor dois gra´ficos de colunas em
uma mesma figura:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Qualitativas
Outra opc¸a˜o e´ a de usar um Gra´fico de Colunas Empilhadas:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Discretas
3. Descric¸a˜o de Varia´veis Quantitativas
3.1. Discretas
* Lembre: varia´veis discretas sa˜o contagens
Tambe´m faz sentido calcular frequeˆncias para cada valor da
varia´vel
Obtenc¸a˜o das frequeˆncias: mesma maneira
No nosso exemplo: “nu´mero de tripanosomas por amostra de
sangue” e´ uma varia´vel discreta
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Discretas
Dados brutos: nu´mero de tripanosomas em amostras de sangue de
bacalhaus:
1 0 3 0 0 0 0 0
0 0 0 0 4 2 0 0
0 0 0 0 0 0 2 0
1 1 0 0 0 0 3 0
0 0 0 0 2 1 0 0
2 3 0 1 0 0 1 1
0 0 0 0 0 0
Podemos construir a tabela de distribuic¸a˜o de frequeˆncia:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Discretas
Tabela : Distribuic¸a˜o de frequeˆncias do nu´mero de tripanosomas em
amostras de sangue de bacalhaus do Mar de Barents.
Tripanosomas fa
1 fr
2 fp
3(%)
0 39 0,7222 72,22
1 7 0,1296 12,96
2 4 0,0741 7,41
3 3 0,0556 5,56
4 1 0,0185 1,85
Totais 54 1,0000 100,00
1 freq. absoluta
2 freq. relativa
3 freq. percentual
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Discretas
Representac¸a˜o Gra´fica
O gra´fico mais usual e´ o Gra´fico de Linhas:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Discretas
3.2. Estat´ıstica Bidimensional: discreta × qualitativa
Pode haver interesse em investigar poss´ıvel associac¸a˜o entre uma
varia´vel discreta e uma qualitativa
→ Podemos, tambe´m aqui, usar tabela de dupla entrada
Como ilustrac¸a˜o, vamos dar um tratamento discreto a` varia´vel
“idade”, embora, a rigor, seja cont´ınua, como discutido antes
Assim, podemos, digamos, nos perguntar...
...existiria uma associac¸a˜o entre idade e esta´gio de maturac¸a˜o?
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Discretas
Tabela : Frequeˆncias absolutas de bacalhaus quanto a` idade e o esta´gio
de maturac¸a˜o.
Maturac¸a˜o
Anos Imaturos Intermedia´rios Maduros Totais
1 1 0 0 1
2 3 1 0 4
3 9 0 0 9
4 8 0 0 8
5 3 2 2 7
6 9 4 4 17
7 0 1 3 4
8 0 0 3 3
9 0 0 0 0
10 0 0 1 1
Totais 33 8 13 54
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Discretas
Ha´ uma clara associac¸a˜o entre idade e esta´gio de maturac¸a˜o
maiores esta´gios ocorrem com maiores idades
percebe-se ainda uma considera´vel dispersa˜o de idades dentro
de cada esta´gio de maturac¸a˜o
fases de maturac¸a˜o se sobrepo˜em
esta e´ uma interessante informac¸a˜o biolo´gica, mostrando que
bacalhaus amadurecem com idades diferentes
suscitando inclusive questionamentos interessantes para
pesquisas futuras.. quais fatores induzem o bacalhau a
amadurecer?
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Cont´ınuas
3.3. Descric¸a˜o de Varia´veis Quantitativas Cont´ınuas
→ mensurac¸o˜es: idade, peso, comprimento, altura etc
* Calcular frequeˆncias de cada valor e´ pouco eficiente → valores se
repetem com baixa ou nenhuma frequeˆncia
Exemplo: comprimento (cm) dos bacalhaus:
59 51 76 48 77 56 93 26
75 72 66 92 44 61 31 68
71 36 49 51 54 69 49 54
58 62 28 52 57 55 74 45
40 30 55 44 40 84 72 38
76 69 47 51 63 62 53 48
46 65 73 76 70 55
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Cont´ınuas
Para obter frequeˆncias de varia´veis cont´ınuas, uma soluc¸a˜o
interessante consiste em calcular frequeˆncias em pequenos
intervalos, chamados classes
Mas.. quantos classes, e de que tamanho?
Na˜o existe um crite´rio u´nico
Poucas classes descrevem pouco, e muitas classes
“espalham”demais os dados
Na˜o havendo experieˆncia anterior, sugere-se o seguinte algoritmo:
Crite´rio emp´ırico para o nu´mero K de classes:
n ≤ 100 n > 100
K =
√
n K = 5 log10 n
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Cont´ınuas
Calcular amplitude total dos dados: A = max−min
Calcular a amplitude de cada classe c = Ak−1
Calcular o limite inferior da primeira classe como
LI1 = min− c2
Calcular limite superior da primeira classe: LS1 = LI1 + c
Fazer LI2 = LS1 e sucessivamente ir somando c
Obtidas as classes, contar frequeˆncia absoluta em cada uma
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Cont´ınuas
Para contar as frequeˆncias, e´ conveniente ordenar os dados brutos:
26 28 30 31 36 38 40 40
44 44 45 46 47 48 48 49
49 51 51 51 52 53 54 54
55 55 55 56 57 58 59 61
62 62 63 65 66 68 69 69
70 71 72 72 73 74 75 76
76 76 77 84 92 93
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Cont´ınuas
Aplicando aos dados do nosso exemplo, temos:
Nu´mero de classes: Como n < 100, usa-se
K =
√
n =
√
54 = 7, 3 ≈ 7
Calcular amplitude total dos dados: A = 93− 26 = 67
Calcular a amplitude de cada classe c = 677−1 = 11, 2
Calcular o limite inferior da primeira classe como
LI1 = 26− 11,22 = 20,
4
Calcular limite superior da primeira classe:
LS1 = 20, 4 + 11, 2 = 31, 6
Fazer LI2 = LS1 = 31, 6
Sucessivamente somando 11,2 e contando as frequeˆncias,
temos a tabela a seguir:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Cont´ınuas
Tabela : Distribuic¸a˜o de frequeˆncias do comprimento de bacalhaus
coletados em um estudo no Mar de Barents.
Classes fa fr fp(%)
[20, 4; 31, 6) 4 0, 0741 7, 41
[31, 6; 42, 8) 4 0, 0741 7, 41
[42, 8; 54, 0) 14 0, 2593 25, 93
[54, 0; 65, 2) 14 0, 2593 25, 93
[65, 2; 76, 4) 14 0, 2593 25, 93
[76, 4; 87, 6) 2 0, 0370 3, 70
[87, 6; 98, 8) 2 0, 0370 3, 70
Totais 54 1, 0000 100, 00
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Cont´ınuas
O gra´fico correspondente e´ chamado histograma, que corresponde
a um gra´fico de colunas justapostas:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantitativas
Descric¸a˜o de Varia´veis Cont´ınuas
Este comportamento aprox. sime´trico, com caudas de menor
frequeˆncia, e´ relativamente comum em fenoˆmenos biolo´gicos
Como veremos no pro´x. cap´ıtulo, este comportamento, na
populac¸a˜o infinita, poderia ser descrito pela chamada curva
Normal:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
		Quantitativas
material_bioestatística/aulas/Aula_11_10_Ap.pdf
Medidas de Posic¸a˜o
EST211 Bioestat´ıstica
Prof. Tiago Martins Pereira
11 de outubro de 2017
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Descric¸a˜o de Varia´veis Cont´ınuas
Da aula passada...
Tabela : Distribuic¸a˜o de frequeˆncias do comprimento de bacalhaus
coletados em um estudo no Mar de Barents.
Classes fa fr fp(%)
[20, 4; 31, 6) 4 0, 0741 7, 41
[31, 6; 42, 8) 4 0, 0741 7, 41
[42, 8; 54, 0) 14 0, 2593 25, 93
[54, 0; 65, 2) 14 0, 2593 25, 93
[65, 2; 76, 4) 14 0, 2593 25, 93
[76, 4; 87, 6) 2 0, 0370 3, 70
[87, 6; 98, 8) 2 0, 0370 3, 70
Totais 54 1, 0000 100, 00
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Descric¸a˜o de Varia´veis Cont´ınuas
O gra´fico correspondente e´ chamado histograma, que corresponde
a um gra´fico de colunas justapostas:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Descric¸a˜o de Varia´veis Cont´ınuas
Este comportamento aprox. sime´trico, com caudas de menor
frequeˆncia, e´ relativamente comum em fenoˆmenos biolo´gicos
Como veremos no pro´x. cap´ıtulo, este comportamento, na
populac¸a˜o infinita, poderia ser descrito pela chamada curva
Normal:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Medidas Descritivas
4. MEDIDAS DESCRITIVAS
Ate´ aqui, vimos como as frequeˆncias sa˜o uma importante
ferramenta de descric¸a˜o. Para varia´veis quantitativas, uma outra
importante ferramenta sa˜o as Medidas Descritivas
Medidas Descritivas: Ferramenta descritiva que busca
resumir o conjunto de dados em um u´nico nu´mero, no tocante
a algum aspecto
As mais importantes medidas sa˜o
Medidas de Posic¸a˜o
Medidas de Dispersa˜o
Antes de apresenta´-las, contudo, e´ necessa´rio revisar a importante
notac¸a˜o de somato´rio
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Somato´rio
4.1. A Notac¸a˜o de Somato´rio
* ate´ aqui temos lidado com conjuntos de dados, referentes a`
avaliac¸a˜o de varia´veis
A varia´vel e´ a caracter´ıstica descritora. Quando e´ quantitativa, e´
usual representa´-la por letra maiu´scula do final do alfabeto (X , Y ,
Z etc.)
Cada dado e´ a realizac¸a˜o (ou acontecimento) de uma varia´vel em
particular, e e´ representado pela letra minu´scula correspondente.
(x , y , z etc.)
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Somato´rio
Nessa notac¸a˜o, tambe´m e´ comum usar um ı´ndice para indicar a
posic¸a˜o do dado no conjunto. Geralmente usa-se letras do meio do
alfabeto (i , j , k etc.)
→ yi : dado que ocupa posic¸a˜o “i”na amostra Y
Ex.:
y1 : 1
a observac¸a˜o
y2 : 2
a observac¸a˜o
...
yn : n
a observac¸a˜o
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Somato´rio
* Em estat´ıstica, e´ muito comum o uso de somas. Assim, ao inve´s
de escrever:
y1 + y2 + y3 + . . . + yn
usa-se a representac¸a˜o:
n∑
i=1
yi
onde se leˆ “Somato´rio de yi , com i variando de 1 ate´ n”
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Medidas de Posic¸a˜o
4.2. Medidas de Posic¸a˜o
Medidas de Posic¸a˜o: Indicam a posic¸a˜o global dos dados na
escala dos valores poss´ıveis
4.2.1. Me´dia
Por definic¸a˜o, dado um conjunto de n valores de uma varia´vel
quantitativa (discreta ou cont´ınua), temos que:
y¯ =
n∑
i=1
yi
n
A notac¸a˜o y¯ designa a me´dia de um conjunto de dados (amostra
ou censo).
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Me´dia
No exemplo da amostra de bacalhaus, t´ınhamos quatro varia´veis
quantitativas:
Idade
Peso
Comprimento
Nu´mero de tripanosomas
No caso do comprimento:
y¯ =
59 + 51 + · · ·+ 55
54
=
3116
54
= 57, 7 cm
No caso do nu´mero de tripanosomas:
y¯ =
1 + 0 + · · ·+ 0
54
=
28
54
= 0, 5185 tripanossomas
Perceba: a me´dia de uma varia´vel discreta pode ser um nu´mero
quebrado
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Me´dia
Estat´ıstica Descritiva Bidimensional: Me´dias
→ tambe´m aqui pode ser interessante calcular me´dias de uma
varia´vel, para cada categoria de outra varia´vel
Exemplo: me´dias dos comprimentos conforme a A´rea de Coleta:
Tabela : Comprimento me´dio de bacalhaus coletados em 4 a´reas do Mar
de Barents.
A´rea y¯ n1
Soroya 63,8 14
Tanafjord 58,3 19
Varangerfjord 53,5 8
Mageroya 52,9 13
Total — 54
1 nu´mero de peixes coletados em
cada a´rea
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Me´dia
→ percebe-se uma diferenc¸a de quase 10 cm entre as a´reas de
maior e menor me´dia
Outro exemplo: nu´mero me´dio de tripanosomas e sexo:
Tabela : Nu´mero me´dio de tripanosomas em bacalhaus coletados no Mar
de Barents, conforme o sexo.
Sexo y¯ n1
Machos 0,71 28
Feˆmeas 0,31 26
Total — 54
1 nu´mero de peixes coletados
de cada sexo
→ infestac¸a˜o e´ mais que o dobro em machos
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Mediana
4.2.2. Mediana (Md)
Para entender a importaˆncia da Md, e´ interessante um exemplo de
motivac¸a˜o
Seja o seguinte conjunto de dados referente a uma varia´vel Y :
y1 y2 y3 y4 y5
3 5 6 8 48
→ y¯ = 14
* Veˆ-se que a me´dia foi muito afetada pelo valor extremo 48
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Mediana
A mediana e´ uma medida de posic¸a˜o mais adequada neste caso
(menos afetada por valores extremos)
Mediana: Valor que, nos dados ordenados, ocupa a posic¸a˜o
central
Ou seja:
n ı´mpar: Md(Y) = y n+1
2
n par: Md(Y) =
y n
2
+ y n
2
+1
2
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Mediana
No exemplo, como n = 5 e´ ı´mpar, temos:
Md(Y) = y 5+1
2
= y3 = 6
Se o conjunto tivesse n = 4, enta˜o:
Md(Y) =
y 4
2
+ y 4
2
+1
2
=
y2 + y3
2
Quando falamos
em “dados extremos”, isto e´ o mesmo que dizer
que ha´ assimetria
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Exemplo de Distribuic¸a˜o Assime´trica
Como exemplo, a varia´vel Peso dos bacalhaus e´ assime´trica. De
fato, sua distribuic¸a˜o de frequeˆncia e´:
Tabela : Distribuic¸a˜o de frequeˆncias absoluta e percentual do peso (g) de
bacalhaus coletados em uma pesquisa no Mar de Barents.
Classes fa fp(%)
[0, 0; 1382, 7) 24 44, 4
[1382, 7; 2765, 3) 13 24, 1
[2765, 3; 4148, 0) 11 20, 4
[4148, 0; 5530, 7) 3 5, 6
[5530, 7; 6913, 3) 1 1, 9
[6913, 3; 8296, 0) 1 1, 9
[8296, 0; 9678, 7) 1 1, 9
Totais 54 100, 0
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Exemplo de Distribuic¸a˜o Assime´trica
O histograma correspondente e´:
→ distribuic¸a˜o assime´trica, com valores extremos a` direita
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Mediana
A me´dia desses dados e´:
y¯ =
1548 + 1382 + · · ·+ 1346
54
=
119656
54
= 2215, 9 g
E a mediana?
→ para isso e´ interessante ordenar os dados:
130 178 220 240 440 544 554 612
760 794 844 856 968 982 986 1070
1072 1108 1154 1276 1316 1346 1354 1382
1522 1548 1608 1680 1726 1746 1824 2280
2404 2410 2508 2710 2724 2814 2900 3042
3266 3412 3426 3618 3888 3948 4076 4130
4228 4292 4336 6044 6934 8426
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Mediana
Como n = 54 e´ par, temos que:
Md(Y )
y 54
2
+ y 54
2
+1
2
=
y27 + y28
2
=
1608 + 1680
2
= 1644 g
* vejam que a me´dia (2215,9) e´ mais de 500 g maior que a
mediana
→ isto se deve ao fato de Md(Y ) na˜o ser influenciada por valores
extremos, como a me´dia
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Moda
4.2.3. Moda (Mo)
Medida de posic¸a˜o ainda menos influenciada por valores extremos
→ indicada para distribuic¸o˜es fortemente assime´tricas
Moda: Para varia´veis discretas e´ valor de maior frequeˆncia;
varia´veis cont´ınuas: valor com maior concentrac¸a˜o de
frequeˆncia em torno de si.
Exemplo com varia´veis discretas:
Para tanto, vamos retomar a varia´vel nu´mero de tripanosomas por
bacalhau:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Moda
Tripanosomas fa fr fp (%)
0 39 0,7222 72,22
1 7 0,1296 12,96
2 4 0,0741 7,41
3 3 0,0556 5,56
4 1 0,0185 1,85
Totais 54 1,0000 100,00
Claramente, o valor mais frequente e´ o valor zero.
* Portanto, a moda e´ Mo(Y ) = 0
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Moda
Varia´veis cont´ınuas
Na˜o faz sentido a definic¸a˜o de moda para varia´veis cont´ınuas, pois,
rigorosamente falando, as varia´veis cont´ınuas “na˜o se repetem”
Existem diversos me´todos para o ca´lculo da moda em varia´veis
cont´ınuas
No´s nos limitaremos a um me´todo muito simples, baseado nos
dados agrupados
Segundo este me´todo, a moda e´ dada pelo ponto me´dio da classe
de maior frequeˆncia
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Moda
Retomando o exemplo do Peso dos bacalhaus, t´ınhamos a seguinte
distribuic¸a˜o:
Classes fa fp(%)
[0, 0; 1382, 7) 24 44, 4
[1382, 7; 2765, 3) 13 24, 1
[2765, 3; 4148, 0) 11 20, 4
[4148, 0; 5530, 7) 3 5, 6
[5530, 7; 6913, 3) 1 1, 9
[6913, 3; 8296, 0) 1 1, 9
[8296, 0; 9678, 7) 1 1, 9
Totais 54 100, 0
Veˆ-se que a classe de maior frequeˆncia e´ a primeira classe
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Posic¸a˜o
Moda
Assim, a moda seria dada por:
Mo(Y ) =
0, 0 + 1382, 7
2
=
1382, 7
2
= 691, 4 g
Veja como este valor e´ ainda menor que a mediana (1644 g),
reforc¸ando que a moda e´ ainda menos influenciada por valores
extremos
Conforme a distribuic¸a˜o, temos as posic¸o˜es relativas:
Assime´trica com cauda a` direita: Mo < Md < y¯
Assime´trica com cauda a` esquerda: Mo > Md > y¯
Sime´trica: Mo = Md = y¯
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
		Medidas de Posição
material_bioestatística/aulas/Aula_17_10_Ap.pdf
Medidas de Dispersa˜o
EST211 Bioestat´ıstica
Prof. Tiago Martins Pereira
17 de outubro de 2017
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
AULA PASSADA
Cap´ıtulo 2: ESTAT´ISTICA DESCRITIVA
4. MEDIDAS DESCRITIVAS
4.1. A Notac¸a˜o de Somato´rio
4.2. Medidas de Posic¸a˜o
Me´dia
Mediana
Moda
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Medidas de Dispersa˜o
4.3. Medidas de Dispersa˜o
Medida de Dispersa˜o: Medida descritiva que quantifica a
variabilidade presente nos dados
Para entender sua importaˆncia, seja o exemplo a seguir: padro˜es
espaciais de 3 espe´cies vegetais
Y: nu´mero de plantas por parcela
3 espe´cies: Salvia leucophylla, Pinus thunbergii e Sequoia
sempervirens
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Medidas de Dispersa˜o
Salvia leucophylla Pinus thunbergii Sequoia sempervirens
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Medidas de Dispersa˜o
Espe´cie
Parcela 1 2 3
1 3 6 3
2 4 5 3
3 4 2 0
4 4 2 10
5 4 3 4
6 3 1 5
7 4 5 3
8 4 5 1
9 3 3 5
y¯ 3,67 3,56 3,78
Md(Y) 4 3 3
→ as medidas de posic¸a˜o sa˜o parecidas; na˜o discriminam as
espe´cies
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Amplitude
→ mas... as espe´cies diferem quanto a` variabilidade
4.3.1. Amplitude
Definic¸a˜o: diferenc¸a entre o maior e o menor valor
A = max −min
Salvia leucophylla: A = 4− 3 = 1
Pinus thunbergii: A = 6− 1 = 5
Sequoia sempervirens: A = 10− 0 = 10
→ de fato, a u´ltima espe´cie e´ a mais heterogeˆnea
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Amplitude
Desvantagem da amplitude: comparac¸a˜o entre conjuntos e´
limitada, caso tenham tamanhos diferentes
* Basta pensar em amostras tomadas de uma mesma populac¸a˜o
→ deveriam refletir a mesma variabilidade, mas amostras maiores
da˜o chance ao aparecimento de valores mais extremos (e maiores
A)
Ex.: se amostra´ssemos 90 parcelas na espe´cie 1 (ao inve´s de 9),
talvez a amplitude fosse maior que a da espe´cie 3
Assim, seria interessante conceber medidas que levem em
conta o nu´mero de observac¸o˜es
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Variaˆncia e Desvio Padra˜o
4.3.2. Variaˆncia e Desvio Padra˜o
→ levam em conta todas as observac¸o˜es
→ baseadas nos desvios di em relac¸a˜o a` me´dia:
di = yi − y¯
* Quanto maiores os di (em valor absoluto), maior a variabilidade
De fato, no exemplo, os di sa˜o:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Variaˆncia e Desvio Padra˜o
Valores do desvio di para cada parcela em cada espe´cie:
Espe´cie
Parcela 1 2 3
1 -0,67 2,44 -0,78
2 0,33 1,44 -0,78
3 0,33 -1,56 -3,78
4 0,33 -1,56 6,22
5 0,33 -0,56 0,22
6 -0,67 -2,56 1,22
7 0,33 1,44 -0,78
8 0,33 1,44 -2,78
9 -0,67 -0,56 1,22
→ os maiores desvios esta˜o na espe´cie 3, Sequoia sempervirens
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Variaˆncia e Desvio Padra˜o
Temos que a soma dos desvios em relac¸a˜o a` me´dia e´ sempre igual
a zero → vamos trabalhar
com os quadrados de di
Isso nos conduz a` importante medida de dispersa˜o chamada
Variaˆncia
A variaˆncia pode ser de dois tipos:
Populacional
Amostral
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Variaˆncia e Desvio Padra˜o
Variaˆncia Populacional (representada por σ2)
Definic¸a˜o: me´dia dos desvios ao quadrado
* veremos que esta definic¸a˜o e´ bastante geral, sendo a populac¸a˜o
finita ou infinita
No caso de ser finita (N elementos), pela definic¸a˜o:
σ2 =
N∑
i=1
(yi − µ)2
N
* OBS.: µ representa a me´dia populacional
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Variaˆncia e Desvio Padra˜o
Ex.: reconsidere a espe´cie 3, lembrando que µ = 3, 78
Parcela i yi di = yi − µ d2i = (yi − µ)2
1 3 -0,78 0,608
2 3 -0,78 0,608
3 0 -3,78 14,288
4 10 6,22 38,688
5 4 0,22 0,048
6 5 1,22 1,488
7 3 -0,78 0,608
8 1 -2,78 7,728
9 5 1,22 1,488
Totais 34 0, 00 65, 56
Se os dados fossem um censo, a variaˆncia populacional seria, enta˜o:
σ2 =
65, 56
9
= 7, 2840
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Variaˆncia e Desvio Padra˜o
Note: a unidade da variaˆncia esta´ ao quadrado
No ex.: σ2 = 65,569 = 7, 2840 (plantas/parcela)
2
Para retornarmos a` escala dos dados, pode-se usar o Desvio
Padra˜o Populacional (σ)
Definic¸a˜o: raiz quadrada da variaˆncia:
σ =
√
σ2
No exemplo, σ =
√
7, 2840 = 2, 6989 plantas/parcela
O desvio padra˜o da´ uma ideia do quanto, em me´dia, os dados
desviam-se em relac¸a˜o a` me´dia µ
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Variaˆncia e Desvio Padra˜o
Na maioria das vezes, temos uma amostra, e na˜o um censo em
ma˜os
Neste caso, usamos a:
Variaˆncia Amostral (representada por s2)
Em sua definic¸a˜o, a u´nica diferenc¸a e´ o denominador:
s2 =
n∑
i=1
(yi − y¯)2
n − 1
e o desvio padra˜o amostral (ou seja, s), por sua vez:
s =
√
s2
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Variaˆncia e Desvio Padra˜o
* A raza˜o de usarmos (n − 1) no denominador se relaciona com o
fato de que s2 e´ usada para estimar σ2
Se usa´ssemos n no denominador, isto subestimaria a variaˆncia
populacional. Isto porque cada amostra tem uma y¯ diferente. O
ideal seria calcularmos desvios em relac¸a˜o a` me´dia populacional
desconhecida
O denominador (n−1) e´ chamado de nu´mero de graus de liberdade
→ Isto porque (n − 1) e´ o nu´mero de observac¸o˜es com liberdade
para variar, apo´s termos calculado y¯
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Variaˆncia e Desvio Padra˜o
No exemplo, tendo calculado y¯ = 3, 78, e sabendo que:
y1 = 3, y2 = 3, y3 = 0, y4 = 10
y5 = 4, y6 = 5, y7 = 3, y8 = 1
a u´ltima observac¸a˜o, isto e´, y9, na˜o tem liberdade para variar
→ para que a me´dia seja igual a 3, 78 (em outras palavras, para
que a soma seja igual a 34), obrigatoriamente y9 = 5
No exemplo, se houver mais sentido que as parcelas sejam uma
amostra da populac¸a˜o de plantas:
s2 =
65, 56
9− 1 = 8, 195 s =
√
s2 = 2, 8627
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Coeficiente de Variac¸a˜o
4.2.3. Coeficiente de Variac¸a˜o (CV)
Como motivac¸a˜o, considere agora as espe´cies:
Parcela A B
1 5 47
2 7 49
3 6 46
4 8 48
y¯ 6,5 47,5
s 1,291 1,291
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Coeficiente de Variac¸a˜o
Variac¸o˜es, por exemplo, da ordem de 10 plantas/parcela teˆm uma
importaˆncia relativa maior na espe´cie A
* da´ı surgiu a ide´ia de relativizar o desvio padra˜o em relac¸a˜o a`
me´dia
CV =
s
y¯
100
(“Coeficiente de Variac¸a˜o”)
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Medidas de Dispersa˜o
Coeficiente de Variac¸a˜o
No exemplo, temos:
Espe´cie A: CV =
1, 291
6, 5
× 100 = 19, 9%
Espe´cie B: CV =
1, 291
47, 5
× 100 = 2, 7%
→ Espe´cie A e´ relativamente mais heterogeˆnea
Assim, o CV permite comparar:
conjuntos de me´dias diferentes
conjuntos de unidades diferentes
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
		Medidas de Dispersão
material_bioestatística/aulas/Aula_18_10_Ap.pdf
EST211 Bioestat´ıstica
Prof. Tiago Martins Pereira
18 de outubro de 2017
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantis
5. ESTAT´ISTICA DESCRITIVA: TO´PICOS ADICIONAIS
* neste u´ltimo item do Cap´ıtulo 2, veremos o conceito de Quantil,
e de como descrever duas varia´veis quantitativas cont´ınuas
simultaneamente
5.1. Quantis
* Quantis sa˜o medidas de posic¸a˜o muito u´teis que, apresentados
em conjunto, descrevem na˜o apenas a posic¸a˜o de um conjunto de
dados, mas tambe´m sua dispersa˜o e sua assimetria.
Quantil: Um quantil Qq e´ o valor que, nos dados ordenados,
deixa uma frac¸a˜o q de dados abaixo dele.
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantis
Exemplos:
A mediana Md(Y) corresponde ao quantil Q0,5
O Primeiro Quartil corresponde ao quantil Q0,25 , deixando
1
4
das observac¸o˜es abaixo dele
O Terceiro Quartil corresponde ao quantil Q0,75 , deixando
3
4
das observac¸o˜es abaixo dele
* note: a mediana poderia ser chamada de Segundo Quartil
O Primeiro Decil corresponde ao quantil Q0,1 , deixando
1
10 das
observac¸o˜es abaixo dele
O Primeiro Percentil corresponde ao quantil Q0,01 , deixando
1% das observac¸o˜es abaixo dele
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantis
Procedimento para o ca´lculo de quantis Qq
1 Calculamos o produto n × q
2 Vamos chamar a parte inteira desta divisa˜o de int, e a parte
fraciona´ria vamos chamar de frac
3 O quantil Qq sera´ dado por:
Qq =

1
2
(
yint + yint+1
)
, se frac = 0
yint+1 , se frac > 0
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantis
Considere o comprimento dos 5 primeiros bacalhaus, ja´ ordenados:
y1 y2 y3 y4 y5
48 51 59 76 77
Qual e´ a mediana? → Md(Y ) = Q0,50 = 59
Qual e´ o primeiro quartil? → Q0,25 = 51
Qual e´ o primeiro decil? → Q0,10 = 48
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantis
Considere agora o peso dos n = 12 primeiros bacalhaus, ja´
ordenados:
y1 y2 y3 y4 y5 y6
130 986 1382 1548 1746 2814
y7 y8 y9 y10 y11 y12
2900 3948 4292 4336 6934 8426
Qual e´ a mediana? (ou seja, Q0,5)
1 n × q = 12× 0, 5 = 6, 0
2 int = 6, frac = 0
3 Assim, Md(Y ) = Q0,5 =
1
2 (y6 + y7) =
1
2
(
2814+2900
2
)
= 2857
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantis
Qual e´ primeiro quartil Q0,25?
1 n × q = 12× 0, 25 = 3, 0
2 int = 3, frac = 0
3 Assim, Q0,25 =
1
2 (y3 + y4) =
1
2
(
1382+1548
2
)
= 1465
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Quantis
Qual e´ primeiro decil Q0,10?
1 n × q = 12× 0, 10 = 1, 2
2 int = 1, frac = 2
3 Assim, Q0,10 = y1+1 = y2 = 986
Ou seja, perceba que, nem sempre quando n e´ par, teremos que
calcular uma me´dia de dois valores
A utilidade dos quantis fica evidente quando usados em associac¸a˜o
com os Diagramas de Caixa
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Boxplots
5.2. Diagramas de Caixa (ou boxplots)
Um boxplot tem a seguinte apareˆncia:
Prof. Tiago Martins
Pereira EST211 Bioestat´ıstica
Boxplots
Elementos de um boxplot:
O eixo das ordenadas apresenta a escala da varia´vel
Ha´ uma caixa central (“box”)
A linha interior da caixa demarca a posic¸a˜o da mediana
As extremidades inferior e superior da caixa sa˜o,
respectivamente, o primeiro e o terceiro quartis
Ha´ um segmento de reta inferior e outro superior (“whiskers”,
ou fio de bigode
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Boxplots
O whisker superior vai ate´ a maior observac¸a˜o na˜o distante da
caixa 1,5 vezes seu tamanho
O whisker inferior vai ate´ a menor observac¸a˜o na˜o distante da
caixa 1,5 vezes seu tamanho.
Caso haja, sa˜o plotados valores discrepantes, distantes mais
do que 1,5 vezes o tamanho da caixa
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Boxplots
Estes elementos sa˜o identificados abaixo:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Boxplots
Assim, os boxplots sa˜o gra´ficos extremamente simples, mas que
permitem visualizar, simultaneamente, a posic¸a˜o, a dispersa˜o e a
eventual assimetria do conjunto de dados
whiskers relativamente pequenos (em relac¸a˜o a` caixa) indicam
dados mais homogeˆneos
whiskers relativamente grandes indicam dados mais
heterogeˆneos
Mediana pro´xima de um dos quartis indica assimetria
whiskers desiguais refletem assimetria
Dados discrepantes sa˜o evidenciados, o que tambe´m ajuda a
destacar a assimetria, quando presente
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Boxplots
Exemplo: boxplot da varia´vel comprimento, considerando todos os
54 bacalhaus:
→ dados sa˜o sime´tricos, com considera´vel dispersa˜o.
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Boxplots
Agora reconsidere o exemplo do peso dos bacalhaus:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Boxplots
Veja como fica o boxplot desta varia´vel:
0
20
00
40
00
60
00
80
00
Pe
so
 (g
)
→ nota-se assimetria, e 2 bacalhaus com peso discrepante
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
material_bioestatística/aulas/Aula_24_10_Ap.pdf
EST211 Bioestat´ıstica
Prof. Tiago Martins Pereira
24 de outubro de 2017
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
5.3. Estat´ıstica Descritiva Bidimensional (envolvendo varia´veis
cont´ınuas)
5.3.1. Entre Uma Varia´vel Qualitativa e Uma Quantitativa
Cont´ınua
* poder´ıamos, em casos assim, construir uma tabela contendo as
classes da varia´vel cont´ınua na coluna indicadora, e as categorias
da varia´vel qualitativa no cabec¸alho
Isto na˜o e´ muito comum
Uma soluc¸a˜o consistiria em construir boxplots para cada categoria
da varia´vel qualitativa
Ex.: no nosso exemplo, haveria alguma associac¸a˜o entre o peso e o
sexo?
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
F M
0
40
00
80
00
Sexo
Pe
so
→ medianas semelhantes, mas feˆmeas com maior dispersa˜o
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
5.3.2. Entre Duas Varia´veis Quantitativas
Neste caso, em geral na˜o se faz representac¸a˜o tabular
→ representac¸a˜o gra´fica e Medidas de Associac¸a˜o
A representac¸a˜o gra´fica corresponde aos Diagramas de Dispersa˜o
Ex.: no nosso exemplo, haveria associac¸a˜o entre peso e
comprimento?
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Diagrama de dispersa˜o:
30 40 50 60 70 80 90
0
40
00
80
00
Comprimento
Pe
so
* percebe-se uma associac¸a˜o positiva
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Gra´ficos de dispersa˜o tambe´m podem ser feitos entre uma varia´vel
cont´ınua e uma discreta:
2 4 6 8 10
0
40
00
80
00
Idade (Anos)
Pe
so
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Para caracterizar a associac¸a˜o entre varia´veis quantitativas,
podemos usar medidas de associac¸a˜o
As mais importantes sa˜o:
Covariaˆncia
Coeficiente de Correlac¸a˜o
A covariaˆncia e´ uma generalizac¸a˜o do conceito de variaˆncia
Aqui, consideraremos apenas a covariaˆncia amostral
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Definic¸a˜o de covariaˆncia (amostral):
dadas duas varia´veis quantitativas X e Y , a covariaˆncia entre elas
e´:
Cov(X , Y ) =
n∑
i=1
(x i − x¯) (y i − y¯)
n − 1
Tambe´m aqui, o denominador e´ chamado de nu´mero de graus de
liberdade
Por que temos (n − 1) gruas de liberdade, se estamos usando duas
me´dias?
* porque, na realidade, basta conhecermos uma das me´dias para
calcularmos a covariaˆncia
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Pode-se demonstrar que:
Cov(X , Y ) =
n∑
i=1
(x i − x¯) y i
n − 1
Ou:
Cov(X , Y ) =
n∑
i=1
(y i − y¯) x i
n − 1
Por isso e´ que sa˜o apenas (n − 1) graus de liberdade
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Perceba que, nesta expressa˜o:
Cov(X , Y ) =
n∑
i=1
(x i − x¯) (y i − y¯)
n − 1
se ocorrer X = Y , enta˜o a covariaˆncia e´ igual a` definic¸a˜o de
variaˆncia amostral
“A variaˆncia e´ a covariaˆncia de uma varia´vel com ela mesma”
Uma outra maneira alternativa de expressar a covariaˆncia e´:
Cov(X , Y ) =
n∑
i=1
x i y i −
n∑
i=1
x
i
n∑
i=1
y
i
n
n − 1
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Como a covariaˆncia de uma varia´vel com ela mesmo representa a
variaˆncia desta varia´vel, podemos obter uma forma alternativa para
se calcular a variaˆncia amostral:
s2 =
n∑
i=1
y2
i
−
(
n∑
i=1
y
i
)2
n
n − 1
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Como exemplo nume´rico, considere os 5 primeiros bacalhaus de
nosso exemplo, em relac¸a˜o ao comprimento (que chamaremos de
varia´vel X ) e ao peso (que chamaremos de varia´vel Y ):
Bacalhau X Y X × Y
1 59 1548 91332
2 51 1382 70482
3 76 4336 329536
4 48 986 47328
5 77 4292 330484
Totais 311 12544 869162
Com esta tabela, podemos calcular a covariaˆncia:
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Cov(X , Y ) =
869162− 311×125445
5− 1 =
= 22231, 3 cm g
Como a covariaˆncia foi positiva, dizemos que houve uma
associac¸a˜o positiva
Ha´, contudo, a dificuldade de interpretar o valor 22231,3 devido a`
sua unidade, cm g
Nesse sentido, uma medida de associac¸a˜o mais apropriada e´ o
Coeficiente de Correlac¸a˜o, que assume valores entre –1 e 1
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Para que “padronizemos ” o valor da covariaˆncia para uma escala
entre –1 e 1, basta que a dividamos pelos desvios padro˜es de X e Y
Isto nos leva a` definic¸a˜o de coeficiente de correlac¸a˜o amostral:
r =
Cov(X , Y )
sX sY
Se r e´ pro´ximo de 1, temos uma associac¸a˜o fortemente
positiva
Se r e´ pro´ximo de –1, temos uma associac¸a˜o fortemente
negativa
Se r e´ pro´ximo de 0, temos uma auseˆncia de associac¸a˜o
Prof.
Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
Retornando ao nosso exemplo, podemos compor uma outra tabela:
Paciente X Y X 2 Y 2 X × Y
1 59 1548 3481 2396304 91332
2 51 1382 2601 1909924 70482
3 76 4336 5776 18800896 329536
4 48 986 2304 972196 47328
5 77 4292 5929 18421264 330484
Totais 311 12544 20091 42500584 869162
E assim...
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
Estat´ıstica Descritiva Bidimensional
s
X
=
√
20091− 31125
5− 1 = 13, 6638
s
Y
=
√
42500584− 1254425
5− 1 = 1660, 587
E assim:
r =
22231, 3
13, 6638× 1660, 587 = 0, 98
Portanto, pacientes ha´ uma forte associac¸a˜o entre comprimento e
peso
(ao menos considerando apenas estes 5 bacalhaus)
Prof. Tiago Martins Pereira EST211 Bioestat´ıstica
material_bioestatística/listas/Para entregar/Lista1.pdf
Disciplina: EST211 - Bioestat´ıstica
Professor: Tiago Martins Pereira
Lista de Exerc´ıcios
Entregar ate´ o dia 08 de novembro
1. O Projeto TAMAR (“Tartarugas Marinhas” – www.tamar.org.br) dispo˜e de 25 bases de pesquisa
espalhadas pelo litoral brasileiro. Um bio´logo necessita sortear uma amostra de 5 dessas bases. Em
cada uma, fara´ um monitoramento por ocasia˜o da desova das tartarugas (flagrar feˆmeas em ato
de postura, observar o comportamento do animal, registrar dados morfome´tricos e coletar material
para ana´lise gene´tica). As bases de pesquisa esta˜o identificadas abaixo, cada uma com um nu´mero,
de 1 a 25. Fac¸a este sorteio de n = 5 bases usando a tabela de nu´meros aleato´rios em anexo.
Indique, de alguma forma, as linha e coluna iniciais do processo de sorteio.
1. Almofala (CE) 2. B. do Inferno (RN) 3. Pipa (RN) 4. F. de Noronha (PE) 5. P. dos Mangues (SE)
6. Pirambu (SE) 7. Aracaju (SE) 8. Aba´ıs (SE) 9. Mangue Seco (BA) 10. S´ıtio do Conde (BA)
11. Costa do Sau´ıpe (BA) 12. Praia do Forte (BA) 13. Arembepe (BA) 14. Busca Vida (BA) 15. Guriri (ES)
16. Pontal do Ipiranga (ES) 17. Povoac¸a˜o (ES) 18. Regeˆncia (ES) 19. Trindade (ES) 20. Vito´ria (ES)
21. S. F. Itabapoana (RJ) 22. Farol S. Tome´ (RJ) 23. Ubatuba (SP) 24. Itaja´ı (SC) 25. Floriano´polis (SC)
2. As violetas sa˜o plantas ornamentais do geˆnero Viola. Um bio´logo deseja estudar estudar o efeito de
dois hormoˆnios vegetais (uma auxina e uma citocinina) na induc¸a˜o (ou inibic¸a˜o) de seu florescimento.
Para isso toma 10 plantas de diferentes espe´cies do geˆnero Viola (ver tabela abaixo). Para evitar
tendenciosidades, o bio´logo deseja fazer um sorteio para alocar quais 5 espe´cies recebera˜o a auxina
e quais 5 espe´cies recebera˜o a citocinina.
(a) Usando a tabela de nu´meros aleato´rios ou a func¸a˜o randoˆmica de sua calculadora, preencha a
tabela abaixo, associando a cada espe´cie de violeta um nu´mero aleato´rio. No caso do sorteio
ser realizado atrave´s da tabela de nu´meros aleato´rios, indique, de alguma forma, as linha e
coluna iniciais do processo de sorteio.
Espe´cie Nu´mero Aleato´rio
V. arvensis
V. biflora
V. glabella
V. hirta
V. odorata
V. pedunculata
V. pubescens
V. riviniana
V. rostrata
V. tricolor
(b) Ordene agora os nu´meros aleato´rios, ministrando a`s plantas das cinco primeiras espe´cies cor-
respondentes a auxina, e a`s cinco restantes a citocinina:
Nu´mero Aleato´rio Espe´cie Hormoˆnio
Auxina
Auxina
Auxina
Auxina
Auxina
Citocinina
Citocinina
Citocinina
Citocinina
Citocinina
3. Nos levantamentos a seguir, classifique a varia´vel descritora em qualitativa ou quantitativa, e ainda
(no primeiro caso) em nominais ou ordinais, e (no segundo caso) em discretas ou cont´ınuas.
(a) Um pesquisador estuda a cor das flores da planta conhecida como “Maravilha” (Mirabilis
jalapa), que podem ser: branca, rosa ou vermelha. Estas cores representam um aumento
crescente de pigmento, e correspondem, respectivamente, aos geno´tipos aa, Aa e AA.
(b) Em um estudo sobre a diversidade de tatu (Dasypodidae) na Regia˜o dos Inconfidentes, amostras
de animais sa˜o tomadas, os quais sa˜o medidos quanto ao comprimento .
(c) Em um estudo sobre o efeito da hidroxiure´ia (HU) na induc¸a˜o de divisa˜o celular em rad´ıculas
de baru (Dipteryx alata), amostras de sementes sa˜o submetidas a` HU, e conta-se o nu´mero
de ce´lulas metafa´sicas por laˆmina.
(d) Em um estudo sobre a ocorreˆncia de orqu´ıdeas na Serra do Mar, amostras de plantas sa˜o
aleatoriamente tomadas, e cada qual e´ classificada quanto a` espe´cie.
4. Com os dados do exemplo dos bacalhaus (visto em aula), construa uma tabela de dupla entrada da
distribuic¸a˜o conjunta de frequeˆncia absoluta das varia´veis “A´rea de Coleta” e “Sexo”. Os 54 dados
brutos esta˜o apresentados a seguir:
(Mageroya,Feˆmea) (Soroya,Feˆmea) (Soroya,Macho) (Varangerfjord,Feˆmea)
(Mageroya,Macho) (Mageroya,Feˆmea) (Soroya,Feˆmea) (Varangerfjord,Feˆmea)
(Tanafjord,Macho) (Soroya,Feˆmea) (Varangerfjord,Macho) (Tanafjord,Macho)
(Varangerfjord,Macho) (Soroya,Macho) (Tanafjord,Feˆmea) (Tanafjord,Feˆmea)
(Mageroya,Macho) (Mageroya,Feˆmea) (Mageroya,Feˆmea) (Tanafjord,Macho)
(Soroya,Macho) (Soroya,Feˆmea) (Mageroya,Macho) (Mageroya,Macho)
(Tanafjord,Feˆmea) (Mageroya,Macho) (Tanafjord,Macho) (Tanafjord,Macho)
(Soroya,Macho) (Soroya,Macho) (Tanafjord,Macho) (Mageroya,Feˆmea)
(Tanafjord,Macho) (Mageroya,Macho) (Tanafjord,Macho) (Varangerfjord,Macho)
(Varangerfjord,Feˆmea) (Varangerfjord,Feˆmea) (Soroya,Macho) (Tanafjord,Macho)
(Varangerfjord,Feˆmea) (Soroya,Macho) (Mageroya,Feˆmea) (Soroya,Macho)
(Tanafjord,Feˆmea) (Tanafjord,Macho) (Mageroya,Feˆmea) (Soroya,Macho)
(Tanafjord,Feˆmea) (Soroya,Feˆmea) (Tanafjord,Feˆmea) (Tanafjord,Feˆmea)
(Tanafjord,Feˆmea) (Tanafjord,Feˆmea)
5. Agora, a` ma˜o livre, fac¸a um gra´fico de colunas da distribuic¸a˜o de frequeˆncia percentual das varia´veis
“A´rea de Coleta” e “Sexo”, colocando a primeira no eixo horizontal, e uma legenda para a segunda.
Voceˆ perceba alguma associac¸a˜o entre elas, ou teˆm comportamento semelhante?
2
6. Usando o algoritmo visto na aula para varia´veis cont´ınuas, construa uma tabela com a distribuic¸a˜o
de frequeˆncias absoluta, relativa e percentual da varia´vel “Peso” dos bacalhaus (os quais esta˜o
abaixo, ordenados). Obs.: se pela fo´rmula o LI da primeira classe for negativo, estabelec¸a LI como
sendo zero, pois na˜o faz sentido peso negativo. Em seguida, a` ma˜o livre, fac¸a o histograma da
frequeˆncia absoluta destes dados. O comportamento do peso e´ semelhante ao do comprimento,
visto em sala (aproximadamente sime´trico), ou apresenta assimetria?
130 178 220 240 440 544 554 612 760 794 844 856 968 982
986 1070 1072 1108 1154 1276 1316 1346 1354 1382 1522 1548 1608 1680
1726 1746 1824 2280 2404 2410 2508 2710 2724 2814 2900 3042 3266 3412
3426 3618 3888 3948 4076 4130 4228 4292 4336 6044 6934 8426
7. Considere os dados das idades dos bacalhaus (cujos valores em anos passaremos a designar por Y):
6 4 5 4 6 5 8 1 7 6 8 10 4 6 2 6 5 2 6 3
5 6 3 6 6 6 2 4 6 4 5 3 3 2 4 3 3 7 7 3
6 5 4 6 6 6 4 3 3 7 8 6 5 6
Considere ainda a ordem de leitura da esquerda para a direita, ou seja, o primeiro bacalhau avaliado
tinha 6 anos, o segundo bacalhau tinha 4 anos, e assim por diante. Calcule:
(a)
6∑
i=1
yi
(b)
36∑
i=33
yi
(c) A me´dia y¯, usando a fo´rmula:
y¯ =
n∑
i=1
yi
n
Considere agora estes mesmos dados, ordenados:
1 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4
4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6
6 6 6 6 6 6 7 7 7 7 8 8 8 10
Calcule
agora:
(d) A mediana Md(Y).
(e) A moda Mo(Y). Para tal, considere que a idade dos bacalhaus seja uma varia´vel quantitativa
discreta, embora, rigorosamente, seja uma varia´vel cont´ınua.
8. A seguir esta˜o apresentados os dados de comprimento (em cm) dos bacalhaus, ja´ ordenados:
26 28 30 31 36 38 40 40 44 44 45 46 47 48 48
49 49 51 51 51 52 53 54 54 55 55 55 56 57 58
59 61 62 62 63 65 66 68 69 69 70 71 72 72 73
74 75 76 76 76 77 84 92 93
(a) Sabendo-se que
54∑
i=1
yi = 3116, calcule a me´dia y¯.
(b) Obtenha a mediana Md(Y) desses dados.
3
(c) A distribuic¸a˜o de frequeˆncia absoluta (fa) destes dados, feita em aula, foi:
Classes fa
[20, 4; 31, 6) 4
[31, 6; 42, 8) 4
[42, 8; 54, 0) 14
[54, 0; 65, 2) 14
[65, 2; 76, 4) 14
[76, 4; 87, 6) 2
[87, 6; 98, 8) 2
Total 54
Vimos que, para varia´veis cont´ınuas, estamos usando como definic¸a˜o da moda Mo(Y) o ponto
me´dio da classe de maior frequeˆncia. No entanto, aqui temos 3 classes “empatadas” no centro
da distribuic¸a˜o. Que valor voceˆ enta˜o indicaria como sendo a moda, neste caso?
(d) Comparando a me´dia, a mediana e a moda do comprimento dos peixes, eles foram muito
diferentes (como aconteceu com o peso dos peixes), ou foram semelhantes? A que voceˆ atribui
este resultado?
9. Quatro parcelas cont´ıguas de uma a´rea foram observadas quanto ao nu´mero de a´rvores (Y ) de uma
certa espe´cie, para um estudo de padra˜o espacial. Os seguintes resultados foram observados: 5, 7,
2 e 9.
(a) Calcule a me´dia da varia´vel Y .
(b) Preencha a tabela abaixo.
Parcela i yi yi − y¯ (yi − y¯)2
1 5
2 7
3 2
4 9
Totais
(c) Embora na˜o seja, vamos admitir num primeiro momento que estes dados correspondam a um
censo. Calcule a variaˆncia populacional, fazendo uso do total da u´ltima coluna.
(d) Reconhecendo agora que estes dados correspondem a uma amostra, calcule a variaˆncia amostral
e o desvio padra˜o amostral.
10. Preencha agora a tabela abaixo.
i yi y
2
i
1 5
2 7
3 2
4 9
Totais
Calcule
n∑
i=1
y2i −
(
n∑
i=1
yi
)2
n . Verifique que este valor e´ igual ao total da quarta coluna da tabela do
item (b) do exerc´ıcio anterior, sendo assim uma maneira alternativa de calcular o numerador da
variaˆncia.
4
11. Uma das grandes vantagens do coeficiente de variac¸a˜o (CV) e´ a possibilidade de comparar a varia-
bilidade de conjuntos de dados de diferentes unidades, porque e´ uma porcentagem.
(a) Calcule o CV referente ao comprimento dos bacalhaus.
(b) Calcule o CV referente a` idade dos bacalhaus.
(c) Conforme este medida de dispersa˜o, voceˆ diria que a variabilidade das varia´veis comprimento
e idade dos bacalhaus e´ semelhante, ou a variabilidade de uma delas se sobressai em relac¸a˜o a`
da outra?
12. Considere novamente os dados de comprimento dos 54 bacalhaus apresentados no exerc´ıcio 8.
(a) Obtenha o quantil Q0,5 , tambe´m chamado de segundo quartil ou mediana Md(Y ).
(b) Obtenha os quantis Q0,25 e Q0,75 , tambe´m chamados, respectivamente, de primeiro quartil e
terceiro quartil.
(c) Obtenha o quantil Q0,10 , tambe´m chamado de primeiro decil.
(d) Pode-se calcular quantis com qualquer frac¸a˜o que se tenha interesse. Obtenha o quantil Q
6/7
(ou seja, Q0,8571), e, em seguida, o quantil Q16/17 (ou seja, Q0,9412).
13. Considere novamente os dados dos pesos dos 54 bacalhaus apresentados no exerc´ıcio 6. Para cons-
truir um boxplot, ou diagrama de caixa, obtenha as seguintes grandezas:
(a) O primeiro, o segundo, e o terceiro quartis (ou seja, Q
0,25
, Q
0,5
e Q
0,75
)
(b) O tamanho da caixa, correspondendo a` diferenc¸a Q
0,75
−Q
0,25
(c) O limite do whisker superior, correspondendo ao maior valor na˜o superior a Q
0,75
+ 1, 5 ×
tamanho da caixa.
(d) O limite do whisker inferior, correspondendo ao menor valor na˜o inferior a Q
0,25
– 1, 5 ×
tamanho da caixa.
(e) A ma˜o livre, desenhe o boxplot referente ao peso dos bacalhaus. Ele esta´ parecido com o que
foi mostrado na aula teo´rica?
14. Abaixo, esta˜o os comprimentos dos bacalhaus de apenas duas a´reas, Mageroya e Soroya:
Mageroya
30 36 45 47 49 49 53 54 56 59 62 71 77
Soroya
48 51 51 54 55 57 61 65 69 69 72 72 76 93
(a) Obtenha e apresente em uma mesma figura, lado a lado, os dois boxplot.
(b) Compare as duas a´reas quanto ao grau de assimetria.
(c) Compare as duas a´reas quanto a` dispersa˜o. Uma das a´reas aparentemente apresenta uma
dispersa˜o levemente maior?
5
15. Abaixo, esta˜o listados os dados de glicemia (designada por X) e de colesterol (designada por Y ) de
5 cobaias. Preencha a tabela:
Indiv´ıduo Glicemia (X) Colesterol (Y ) X2 Y 2 X × Y
1 107 199
2 145 267
3 237 272
4 91 166
5 185 239
Totais 765 1143 131149 269551 183793
(a) Calcule a variaˆncia e o desvio padra˜o amostrais da glicemia e do colesterol.
(b) Calcule a covariaˆncia entre a glicemia e o colesterol. E´ uma associac¸a˜o positiva ou negativa?
(c) Calcule o coeficiente de correlac¸a˜o entre a glicemia e o colesterol.
(d) O recurso gra´fico para visualizar a associac¸a˜o entre duas varia´veis quantitativas, conforme
vimos, e´ o diagrama de dispersa˜o. Fac¸a o diagrama de dispersa˜o destes 5 dados. Voceˆ percebe
a existeˆncia de uma associac¸a˜o? Positiva ou negativa?
6
7
material_bioestatística/listas/Para estudar/Lista1_ESTUDAR.pdf
Disciplina: EST211 - Bioestat´ıstica
Professor: Tiago Martins Pereira
Lista de Exerc´ıcios para estudar
1. Classifique cada uma das varia´veis abaixo em qualitativa (nominal/ordinal) ou quantitativa (dis-
creta/cont´ınua):
(a) Renda salarial da populac¸a˜o de Ouro Preto ( baixa, me´dia, alta sa˜o as poss´ıveis respostas para
esta varia´vel).
(b) Nu´mero de defeitos de soldagem observados em 24 amostras de cinco circuitos impressos.
(c) Intenc¸a˜o de voto para presidente (poss´ıveis respostas sa˜o os nomes dos candidatos, ale´m de
na˜o sei).
(d) Tempo de esgotamento de um fluido isolante entre eletrodos a 34 kV, em minutos.
(e) Grau de satisfac¸a˜o de uma indu´stria com relac¸a˜o a` qualidade do ac¸o utilizada em sua linha de
produc¸a˜o (totalmente insatisfeito, insatisfeito, satisfeito e totalmente satisfeito sa˜o as poss´ıveis
respostas para esta varia´vel).
2. Fale sobre a diferenc¸a entre populac¸a˜o e amostra, e explique quais sa˜o as vantagens do uso da
amostragem.
3. Classifique as varia´veis apresentadas nas situac¸o˜es abaixo:
(a) Tempo de durac¸a˜o de uma reac¸a˜o qu´ımica;
(b) Nu´mero de pessoas que chegam a um posto de sau´de, por minuto;
(c) Alocac¸a˜o de funciona´rios por ala, num hospital;
(d) Tempo de recuperac¸a˜o de atletas em tratamento apo´s trauma;
(e) Grau de instruc¸a˜o dos funciona´rios de uma repartic¸a˜o pu´blica;
(f) Nu´mero de gols marcados nas partidas de futebol do campeonato Brasileiro;
(g) Numa pesquisa de intenc¸a˜o de votos, anota-se o nu´mero do candidato a presidente;
(h) Peso de cobaias submetidas a uma dieta suplementar;
(i) Idade dos usua´rios dos servic¸os de atendimento ao consumidor de uma empresa telefoˆnica.
4. Num levantamento sobre o tipo sangu´ıneo foram registrados os seguintes dados (dados fict´ıcios):
O O O O A O O B O O O O O O O O O O B O
O A O O O A O A O O O AB O A O B O A O O
O O A B A O A A A O B O B O O A O O A A
A A AB A B A A O O A O O A A A O A O O AB
(a) Identifique o tipo de varia´vel e construa a tabela de frequeˆncias.
(b) Represente os valores da tabela de frequeˆncias num gra´fico adequado.
5. A tabela abaixo indica a frequeˆncia de escovac¸a˜o dia´ria de pacientes da Cl´ınica de Graduac¸a˜o da
Disciplina de periodontia de uma Faculdade, entre 1994 e 1999, separados por sexo.
Frequeˆncia dia´ria de Contagem
escovac¸a˜o Feminino Masculino
1 vez 12 30
2 vezes 96 84
3 vezes 257 153
4 vezes ou mais 115 43
Total 480 310
(a) Qual o percentual de mulheres e de homens na amostra?
(b) Construa tabelas de frequeˆncias individuais para ambos os sexos.
(c) Qual e´ a proporc¸a˜o de mulheres que informaram escovar os dentes quatro vezes ou mais por
dia?
(d) Qual e´ a porcentagem de homens que informaram escovar os dentes uma u´nica vez por dia?
(e) Represente os valores da tabela de frequeˆncias em gra´ficos adequados. Compare os resultados.
6. Os dados abaixo foram coletados num estudo sobre mulheres encarceradas e representam as ob-
servac¸o˜es da varia´vel Frequeˆncia com que o(s) filho(s) visitam a presidia´ria.
Fac¸a uma categorizac¸a˜o considerando a seguinte classificac¸a˜o para a frequeˆncia de visitas:
• Alta: 3 vezes ao meˆs, ou mais;
• Moderada: de uma vez a cada dois meses a uma vez a cada meˆs;
• Baixa: de 3 vezes ao a no a uma vez a cada treˆs meses;
• Muito Pouco: de 1 vez, ou menos, ao ano, e,
• Outros: nenhum dos anteriores.
Frequeˆncia de visita dos filhos fai Classificac¸a˜o
1 vez ao meˆs 42
1 vez por semana 31
2 vezes ao meˆs 26
Veˆ de vez em quando 4
1 vez a cada 3 meses 3
1 vez ao ano 3
6 vezes ao ano 2
2 vezes por semana 1
3 vezes ao meˆs 1
2 ou 3 vezes ao meˆs 1
1 ou 2 vezes ao meˆs 1
1 vez a cada 2 meses 1
4 ou 5 vezes ao ano 1
4 vezes ao ano 1
3 vezes ao ano 1
(a) Como voceˆ classifica a varia´vel frequeˆncia de visitas com a nova categorizac¸a˜o?
(b) Construa a tabela de frequeˆncia para a varia´vel na nova categorizac¸a˜o.
(c) Construa um gra´fico de setores (pizza) para representar as porcentagens de cada categoria
2
7. Ainda com os dados de mulheres presidia´rias, a tabela abaixo representam as contagens da varia´vel
“Forma de comunicac¸a˜o com os familiares”. Complete a tabela de frequeˆncias e comente os resul-
tados.
Qual a forma de comunicac¸a˜o fa faac fr frac fp fpac
Carta e telefone 51
Carta e visitas 31
Visitas 22
Outros 15
Total 119
8. Numa pesquisa sobre obesidade foram medidos o Indice de Massa Corporal (IMC) de 55 pessoas,
sendo 30 do sexo masculino e 25 do sexo feminino. Os resultados esta˜o sintetizados na figura abaixo.
(dados fict´ıcios)
Comparando os gra´ficos, o que voceˆ destacaria com relac¸a˜o a`s categorias de IMC: Magro, Adequado
e Sobrepeso?
9. Um grupo de alunos do curso de educac¸a˜o f´ısica fez um levantamento na universidade para verificar
se havia alguma influencia do pa´ıs de origem no esporte preferido do estudante. Os entrevistadores
perguntaram, enta˜o, qual o esporte o aluno preferia praticar. Os quatro esportes mais frequentes
sa˜o apresentados na tabela e gra´fico abaixo. (dados fict´ıcios)
3
Observando a figura, o aluno responsa´vel pela ana´lise dos resultados conclui que:
“Os alunos do pa´ıs B praticam mais Futebol, Handbol e Basquete do que os do pa´ıs A, com destaque
para este u´ltimo, onde ocorre a maior diferenc¸a entre as frequeˆncias. A modalidade Voleibol, a mais
praticada no pa´ıs B, ocorre com frequeˆncias iguais nos dois pa´ıses”.
(a) Voceˆ acha correta a conclusa˜o do aluno que analisou os resultados? Comente.
(b) Refac¸a a ana´lise, corrigindo o eventual erro cometido
10. Um o´rga˜o do governo do estado esta´ interessado em determinar padro˜es sobre investimento em
educac¸a˜o, por habitante, realizado pelas prefeituras. De um levantamento em 10 cidades, foram
obtidos os seguintes valores:
Cidade A B C D E F G H I J
Investimento 20 14 18 16 19 16 15 18 19 14
Voceˆ acha coerente construir um histograma para esses dados? Se sim fac¸a o histograma.
11. Num estudo sobre a condic¸a˜o cognitiva de crianc¸as com menos de 5 anos foram registrados os
tempos, em minutos, para a realizac¸a˜o de uma atividade.
13,1 12,3 17,5 15,4 10,0 10,2 12,1 10,8 9,6 11,2 16,0 14,4 13,6 15,0 13,0 13,2
9,3 15,4 16,7 12,7 11,6 14,5 11,9 11,5 9,8 12,0 12,3 12,0 14,2 12,7 11,7 13,1
(a) Encontre tabela de distribuic¸a˜o de frequeˆncias, fac¸a o histograma e comente sobre a simetria.
(b) Encontre a classe modal e estime a moda.
(c) Encontre a me´dia, a mediana, os quartis, a variaˆncia amostral, o desvio-padra˜o amostral e
verifique se ha´ pontos discrepantes.
12. Analise o comportamento de cada um dos gra´ficos abaixo, levando em considerac¸a˜o a simetria,
dispersa˜o/concentrac¸a˜o dos dados:
4
13. Os dados apresentados abaixo representam as notas obtidas em 2 testes aplicados na mesma turma,
em tempos diferentes. O objetivo aqui e´ verificar se os me´todos tendem a avaliar de forma diferente.
Me´todo 01 0,63 0,69 0,77 0,80 1,00 1,30 1,38 1,59 2,07 2,43 3,42
4,32 5,04 5,85 6,39 7,74 8,91 10,0 10,0 10,0 10,0
Me´todo 02 0,44 0,55 0,60 0,77 1,00 1,25 1,56 1,86 2,25 2,25 3,60
4,05 4,41 5,31 5,85 6,12 6,84 8,73 8,91 9,99 10,0
(a) Encontre as medidas de posic¸a˜o para cada me´todo.
(b) Encontre as medidas de dispersa˜o para cada me´todo.
(c) Encontre os quartis e esboce um boxplot para cada me´todo.
(d) Baseado em todas as informac¸o˜es acima, voceˆ diria que ha´ algum ind´ıcio de que as notas dos
alunos para os 2 me´todos apresentem comportamentos distintos?
14. Apresentamos a seguir os resultados da primeira prova da turma A de Cieˆncias Biolo´gicas da
disciplina Bioestat´ıstica.
6 12 12 14 15 15 15 15 16
17 18 18 19 19 19 20 21 21
22 22 22 23 23 23 23 23 23
24 25 25 25 27 27 28 32
(a) Calcule a moda, a me´dia e a mediana.
(b) Calcule o primeiro e o terceiro quartis. Explique o significado desses nu´meros.
(c) Calcule o primeiro, sexto e nono decis. Explique o significado desses nu´meros.
(d) Calcule os percentis P1, P58 e P91. Explique o significado desses nu´meros.
(e) Considere tambe´m os resultados das turmas B e C. Compare as notas das treˆs turmas quanto
a sua homogeneidade.
Turma Me´dia Desvio-padra˜o
B 22,5 4,5
C 24,0 5,4
15. Os dados abaixo representam o peso, em quilogramas, e o comprimento, em cent´ımetros, de 10 ca˜es.
Calcule a me´dia, o desvio-padra˜o e o coeficiente de variac¸a˜o. Comente os resultados.
Peso (Kg) Comprimento (cm)
23,0 104
22,7 107
21,2 103
21,5 105
17,0 100
28,4 104
19,0 108
14,5 91
19,0 102
19,5 99
5
16. Considerando ainda os dados do exemplo anterior, calcule a covariaˆncia, o coeficiente de correlac¸a˜o
entre as varia´veis peso e comprimento. Esboce o gra´fico de dispersa˜o entre essas varia´veis. Existe
algum tipo de relacionamento entre elas?
17. Um estudo foi conduzido para comparar o consumo energe´tico de mulheres adolescentes que sofriam
de bulimia com mulheres adolescentes com composic¸a˜o corporal e n´ıveis de atividade f´ısica similares,
pore´m, sem o distu´rbio. A seguir sa˜o listados os valores de ingesta˜o calo´rica dia´ria, em quilocalorias
por quilograma, para as amostras de adolescentes dos dois grupos.
Consumo calo´rico dia´rio (Kcal/kg)
Bul´ımica Sauda´vel
15,9 18,9 25,1 20,7 30,6
16,0 19,6 25,2 22,4 33,2
16,5 21,5 25,6 23,1 33,7
17,0 21,6 28,0 23,8 36,6
17,6 22,9 28,7 24,5 37,1
18,1 23,6 29,2 25,3 37,4
18,4 24,1 30,9 25,7 40,8
18,9 24,5 30,6
(a) Obtenha o consumo calo´rico me´dio e mediano para cada grupo de adolescentes.
(b) Calcule o desvio padra˜o de cada grupo.
(c) o consumo calo´rico dia´rio e´ maior para as adolescentes que sofrem de bulimia ou para as
adolescentes sauda´veis? Que grupo tem maior variabilidade nas medidas?
18. Calcule o coeficiente de correlac¸a˜o para os dados apresentados na tabela abaixo:
Idade gestacional Peso ao nascer
28 1,25
32 1,25
35 1,75
38 2,25
39 3,25
41 3,25
42 4,25
19. Um laborato´rio resolveu divulgar, ale´m do valor da dosagem, a ordem do percentil para pessoas
sadias. Fac¸a comenta´rios sobre os seguintes resultados: albumina = 5,3 g/dL (ordem do percentil
= 95) e colesterol ¿ 180 mg/dL (ordem do percentil = 5).
20. Em um trabalho sobre acumulac¸a˜o de placa dental em pacientes jovens, foi obtido tanto um ı´ndice
cl´ınico para medir a quantidade de placa como o peso seco das placas, em miligramas. Os dados
esta˜o na Tabela abaixo.
6
I´ndice Cl´ınico Peso Seco
25 2,7
45 2,7
60 3,5
68 3,7
80 5,8
100 5,1
120 4,8
140 11,7
143 11,1
148 14,2
(a) Construa um diagrama de dispersa˜o. Voceˆ acha que existe correlac¸a˜o entre as duas varia´veis?
(b) Calcule a covariaˆncia e o coeficiente de correlac¸a˜o. Essas medidas corroboram com sua opinia˜o?
21. Em Massachusetts, oito indiv´ıduos sofreram um episo´dio inexplica´vel de contaminac¸a˜o por vitamina
D que exigiu hospitalizac¸a˜o; pensou-se que essas ocorreˆncias extraordina´rias pudessem resultar de
uma excessiva suplementac¸a˜o de leite. Os n´ıveis de ca´lcio e albumina – um tipo de prote´ına – no
sangue para cada indiv´ıduo no momento da internac¸a˜o no hospital sa˜o mostrados abaixo:
Ca´lcio (mmol/l) Albumina (g/l)
2,92 43
3,84 42
2,37 42
2,99 40
2,67 42
3,17 38
3,74 34
3,44 42
(a) Obtenha a me´dia, a mediana, o desvio-padra˜o e a amplitude dos n´ıveis de ca´lcio registrados.
(b) Obtenha a me´dia, a mediana, o desvio-padra˜o e a amplitude dos n´ıveis de albumina.
(c) Para indiv´ıduos sauda´veis, o intervalo normal de valores de ca´lcio e´ de 2,12 ate´ 2,74 mmol/l,
enquanto o intervalo de n´ıveis de albumina e´ de 32 ate´ 55 g/l. Voceˆ acredita que os pacientes
que sofreram intoxicac¸a˜o por vitamina D tinham n´ıveis normais de ca´lcio e de albumina no
sangue?
7

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando