Buscar

Livro-Texto - Unidade II (1)

Prévia do material em texto

72
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
Unidade II
5 INDO ALÉM DOS DADOS
5.1 Distribuição amostral e o teorema central do limite
Para entender uma distribuição amostral, vamos usar exemplo uma população bem pequena. 
Durante a Primeira Guerra Mundial, os alemães ocuparam a floresta Białowieža, na Polônia, um dos 
últimos locais onde o bisão europeu ainda podia ser visto na natureza. Como consequência do cerco 
e para a manutenção do exército, os soldados alemães caçaram esses espécimes. Ao final da guerra, 
durante a retirada, eles atiraram em mais espécimes (simplesmente porque podiam). Como resultado, 
apenas nove animais sobreviveram. A população de uma espécie estava reduzida a nove indivíduos. 
Os sobreviventes foram abrigados em zoológicos e um programa de reprodução em cativeiro foi iniciado, 
com a tentativa de reintroduzir a espécie na natureza. Conforme dados de 2017 (MILLER, 2017), a floresta 
Białowieža abriga, atualmente, 600 espécimes em vida livre (cerca de 10% da população atualmente 
existente na Europa). Sabendo que a massa corporal de um bisão adulto pode variar entre 300 e 920 kg, 
suponhamos que a massa dessa população de nove indivíduos seguisse o perfil observado na figura seguinte.
0
300 350 400 450 500 550 600 650 700 750 800 850 900 950
Fr
eq
uê
nc
ia
Massa (kg)
1
2
Figura 19 – Histograma da distribuição da massa corporal de bisões europeus. 
A distribuição de escores nessa população é achatada (dados hipotéticos)
Esses nove indivíduos correspondiam a toda a população de bisões europeus. Assumindo que os valores 
de suas massas corporais fossem conforme apresentado, poderíamos obter a média populacional (µ):
X
N
∑
µ =
73
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Sendo:
µ = a média populacional
ΣX = o somatório dos valores da variável X
N = o número de observações da população
( )350 430 480 540 560 680 760 810 880
9
+ + + + + + + +
µ =
5490
610 kg
9
µ = =
Para realizar uma distribuição amostral para a média dessa população, em primeiro lugar se retira, 
aleatoriamente, amostras a partir da população; para cada amostra, calcula‑se sua média; e, em seguida, 
verifica‑se a distribuição de frequências das médias amostrais.
Dois aspectos importantes precisam ser destacados:
I – A amostragem ocorre com reposição: isso significa que, após a seleção de um indivíduo e 
registro do seu valor de massa (kg), ele será devolvido para a população, dando‑lhe a chance de ser 
selecionado novamente; de tal forma, todos os indivíduos apresentam sempre a mesma chance de 
serem aleatoriamente selecionados (no caso, 1/9 = 0,1111 = 11,11%).
II – A ordem em que os casos forem selecionados não importa: se o indivíduo A for selecionado 
primeiro e, em seguida, o indivíduo B, isso levaria ao mesmo resultado caso o indivíduo B fosse 
selecionado primeiro e, em seguida, o indivíduo A.
Assumindo que nossas amostras obtidas a partir da população possuam tamanho igual a dois 
indivíduos, quantas possibilidades únicas seriam possíveis, extraindo‑se dois indivíduos de uma 
população com total de nove?
 Observação
O número de combinações com repetição a partir N elementos tomados 
n a n é 
( )
( )N n 1,n 1
N n 1 !
C 
n! N 1 !+ − −
+ −
=
−
 possíveis amostras de n elementos, que 
 
podem ser extraídas a partir da população. No caso, N = 9 e n = 2, logo:
( )
( )
( )
9 2 1 !N n 1! 10! 10.9.8! 10.9 90
 45
n! N 1 ! 2! 9 1 ! 2!8! 2!8! 2 2
+ −+ −
= = = = = =
− −
74
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
Observe a tabela seguinte e as 45 combinações únicas. Sua segunda seção traz os pares de valores 
de massa para cada amostra, enquanto a terceira apresenta os valores de média para essas amostras. 
Observe que os valores das médias amostrais diferem entre si, estando algumas mais próximas da média 
populacional e outras mais distantes.
Como existe variabilidade entre as médias, é possível calcular uma medida de dispersão para a distribuição 
amostral. Essa medida é conhecida como erro padrão da média (σM) e indica quanta variabilidade há, 
em média, entre uma média amostral e outra. Diferentemente do desvio padrão, que mede a variabilidade 
dentro de uma única amostra, o erro padrão da média estima a variabilidade entre elas.
Tabela 20 – Amostras (n = 2) a partir de uma população contendo nove indivíduos
Todas as amostras possíveis com combinação única
A, A A, B A, C A, D A, E A, F A, G A, H A, I
B, B B, C B, D B, E B, F B, G B, H B, I
C, C C, D C, E C, F C, G C, H C, I
D, D D, E D, F D, G D, H D, I
E, E E, F E, G E, H E, I
F, F F, G F, H F, I
G, G G, H G, I
H, H H, I
I, I
Valores de massa (kg) para todas as amostras possíveis
350, 350 350, 430 350, 480 350, 540 350, 560 350, 680 350, 760 350, 810 350, 880
430, 430 430, 480 430, 540 430, 560 430, 680 430, 760 430, 810 430, 880
480, 480 480, 540 480, 560 480, 680 480, 760 480, 810 480, 880
540, 540 540, 560 540, 680 540, 760 540, 810 540, 880
560, 560 560, 680 560, 760 560, 810 560, 880
680, 680 680, 760 680, 810 680, 880
760, 760 760, 810 760, 880
810, 810 810, 880
880, 880
Médias dos valores de massa (kg) para as amostras
350 390 415 445 455 515 555 580 615
430 455 485 495 555 595 620 655
480 510 520 580 620 645 680
540 550 610 650 675 710
560 620 660 685 720
680 720 745 780
760 785 820
810 845
880
75
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
 Observação
As letras empregadas na primeira seção representam todas as 
possibilidades de combinações para uma amostragem com reposição e 
n = 2. Na segunda parte, são apresentados os valores de massa (kg) dos 
indivíduos em cada amostra. Na terceira, são reportados os valores de 
média para cada amostra.
A figura a seguir apresenta o histograma para as 45 médias obtidas na terceira parte da tabela 
anterior. Observe o formato da distribuição: a população apresentava, na figura anterior, distribuição 
achatada, mas a distribuição amostral aparenta assumir o formato de uma distribuição normal (compare 
com a curva normal, em vermelho, sobreposta ao histograma).
0
300 350 400 450 500 550 600 650 700 750 800 850 900 950
Fr
eq
uê
nc
ia
Média da massa (kg)
8
7
6
5
4
3
2
1
Figura 20 – Distribuição amostral das médias para amostragem com reposição e n = 2, a partir dos valores 
da massa corporal de bisões europeus (N = 9). O teorema central do limite estabelece que uma distribuição 
amostral da média tenderá à distribuição normal, independentemente do formato da distribuição da população, 
desde que o tamanho amostral seja grande (n ≥ 30). Nesse exemplo, ainda que n amostral seja 
pequeno (n = 2), a distribuição amostral já aparenta assumir o formato de uma distribuição normal, 
como é possível evidenciar pela comparação com a curva sobreposta
A média dessa distribuição amostral (µM) leva a uma observação interessante: ela é igual à média da 
população. Observe que, se tirarmos a média dos 45 valores da terceira seção da tabela anterior, temos:
M
27450
610 kg
45
µ = =
Uma vez observadas as diferentes médias amostrais, a partir da massa (kg) de uma pequena 
população de bisões europeus, imagine, agora, que uma amostra de 100 brasileiros foi selecionada ao 
acaso e a média de sua massa corporal (kg) foi obtida. Como seria o formato da distribuição amostral 
76
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
para a média se muitas amostras aleatórias contendo 100 indivíduos fossem coletadas? Com mais de 
200 milhões de habitantes no Brasil, seria impossível obter cada amostra com n = 100 indivíduos. 
É nessa hora que entra em cena o teorema central do limite, fornecendo uma descrição matemática 
do que a distribuição amostral se pareceria, caso um pesquisador obtivesse todas as amostras possíveiscom tamanho n a partir da população.
Tenha em mente que, para que o teorema central do limite se aplique, o tamanho da amostra precisa 
ser grande. Quão grande? Com n = 2, tal como vimos no exemplo anterior, certamente estamos bem 
distante da concepção do termo. Em geral, assume‑se que um n = 30 já pode assim ser considerado. 
De tal forma, o teorema central do limite se aplica quando o tamanho das amostras utilizadas para 
avaliar uma distribuição amostral seja n ≥ 30.
O teorema central do limite é importante, pois três constatações podem ser observadas:
I – Se o n amostral for grande, então a distribuição amostral da média tenderá à distribuição normal, 
independentemente do formato da distribuição de frequências da população.
II – Se o n amostral for grande, então a média das médias que compõem a distribuição amostral será 
igual à média da população, a partir da qual as amostras foram obtidas.
III – Se o n amostral for grande, será possível estimar o erro padrão da média, uma medida que 
indicará quanta variabilidade haverá, em média, entre uma média amostral e outra. O erro padrão pode 
ser calculado conforme a seguinte equação:
M
n
σ
σ =
Sendo:
σM = o erro padrão da média
σ = o desvio padrão populacional
n = o número de observações da amostra
Com base no exemplo dos bisões, sendo o desvio padrão populacional 128,60 kg, tem‑se:
M
n
σ
σ =
M
128,60 128,60
 90,94 kg
1,41422
σ = = ≅
77
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
O acesso a toda uma população raramente ocorre e, portanto, dificilmente se tem acesso ao 
desvio padrão populacional. Então, como será possível calcular o erro padrão para a média sem o desvio 
padrão populacional? Nessas situações, emprega‑se o desvio padrão amostral, uma estimativa 
do desvio padrão populacional, para calcular uma estimativa do erro padrão da média (sM). 
Observe a equação:
M
s
s
n
=
Sendo:
sM = uma estimativa do erro padrão da média
s = o desvio padrão amostral
n = o número de observações da amostra
Comparemos duas amostras extraídas da tabela anterior: A1 = {540, 680} e A2 = {560, 760}; cujas 
médias são, respectivamente, 610 e 660 kg. Os desvios padrões amostrais obtidos serão de 99,00 e 
141,42 kg, respectivamente. Substituindo‑se, na equação:
M
s
s
n
=
M1
99 99
s 70,00 kg
1,41422
= = =
M1
141,42 141,42
s 100,00 kg
1,41422
= = =
Quanto menor for a medida do erro padrão da média, mais as médias em uma distribuição amostral 
se aproximam. Por consequência, isso nos diz que há menos erro amostral. Assumindo que a 
amostra tenha um n grande, logo, a média dessa amostra tenderá a estar mais próxima da média 
populacional. Em outras palavras, se o erro padrão da média for pequeno, então a média de uma amostra 
provavelmente refletirá com maior precisão a média populacional.
Note, no exemplo anterior, que as médias que compõem a primeira amostra se distanciam 
em 140 unidades (680 – 540 = 140), já as médias que compõem a segunda amostra se distanciam em 
200 unidades (760 – 560 = 200). A estimativa do erro padrão foi menor na primeira amostra 
(sM1 = 70,00 kg) do que na segunda (sM2 = 100,00 kg), indicando que há menos erro amostral na primeira, 
ou seja, seus valores se aproximam mais entre si.
78
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
Graças ao teorema central do limite, um pesquisador não precisa se preocupar com o formato da 
distribuição de frequências da população a partir da qual uma amostra é retirada. Desde que o tamanho 
amostral seja grande o suficiente, a distribuição amostral da média tenderá à normalidade, ainda 
que a população não o seja. Esta noção é útil, pois a curva normal possui propriedades matemáticas 
conhecidas, em relação à porcentagem de casos que estão sob diferentes porções da curva. No próximo 
capítulo serão introduzidos os testes de hipóteses, e este conceito permitirá estimar com que frequência 
um dado valor pode ocorrer.
5.2 Calculando intervalos de confiança
Em geral, utilizamos informações obtidas a partir de uma amostra para estimar parâmetros de 
uma população. Vimos que a estimativa de um parâmetro (como a média populacional) variará entre 
diferentes amostras obtidas a partir dessa população. É possível utilizar o erro padrão para ter ideia do 
quanto essas estimativas se diferem entre si. Também é possível utilizar essa informação para calcular 
limites dentro dos quais se acredita que o parâmetro populacional cairá. Tais limites são chamados 
intervalos de confiança.
Domjan, Blesbois e Williams (1998) estudaram a quantidade de sêmen e espermatozoides liberados 
por codornas quando estimuladas para cópula. Basicamente, as aves foram colocadas em uma 
câmara experimental na presença de fêmeas, em que associaram elementos do ambiente com o ato 
de copular. Uma vez condicionadas, as aves foram colocadas na câmara experimental, só que, dessa 
vez, em vez de uma fêmea, uma boneca de feltro com cabeça embalsamada de codorna foi colocada 
para estimular os machos, e o volume do ejaculado foi coletado para análise. Animais que haviam 
sido condicionados e haviam associado o ambiente com o ato da cópula liberaram volumes maiores 
de sêmen, contendo mais espermatozoides do que os animais que não haviam sido condicionados à 
câmara experimental.
Figura 21 – Boneca de codorna utilizada pelos pesquisadores 
para estimular as aves no dia da coleta do ejaculado
79
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Um dos grupos condicionados (n = 7) obteve uma média, de espermatozoides liberados, de 17 
milhões. Essa é a média amostral. E quanto seria a média populacional? Não temos acesso a essa 
informação. Como não sabemos a média populacional, não podemos inferir que 17 milhões seja um 
bom ou mau estimador desse valor. Portanto, em vez de fixar apenas um único valor da amostra, é 
possível estimar um intervalo, usando a média amostral como ponto médio e estabelecendo um limite 
superior e inferior para esse intervalo.
Assumindo que o valor da média populacional fosse de 15 milhões de espermatozoides 
(hipoteticamente), observe a figura seguinte e considere que 50 experimentos independentes foram 
realizados, gerando 50 amostras diferentes (com n = 7 cada). Note que as médias amostrais (pontos) 
variam entre si e diferem da média populacional (linha pontilhada). Embora a maioria dos intervalos 
contenha o valor real da média populacional (eles cruzam a linha pontilhada, indicando que o valor de 
15 milhões de espermatozoides está contido entre o limite superior e inferior do intervalo de confiança), 
alguns não a possuem (pontos vermelhos, em destaque).
0
6
8
10
12
14
16
18
20
22
24
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
Es
pe
rm
at
oz
ói
de
s (
m
ilh
õe
s)
Amostra
Figura 22 – Intervalos de confiança da contagem de espermatozoides de codornas em 50 amostras diferentes. Assumindo, 
hipoteticamente, que a média populacional seja de 15 milhões de espermatozoides (linha pontilhada), a média de cada uma 
das 50 amostras diferentes (com n = 7) – pontos em preto – é apresentada com seus respectivos intervalos de confiança 
(barras acima e abaixo da média). Das 50 amostras, três (destaque) não contemplam a média populacional em seus intervalos
De certa forma, os intervalos de confiança informam a chance que esses valores possuem em conter 
o parâmetro que se procura estimar (nesse caso, a média). Em geral, procuramos por intervalos de 
confiança de 95% (e, algumas vezes, intervalos de confiança de 99%): eles são limites calculados de tal 
forma que certa porcentagem de amostras contenha o valor real do parâmetro dentro da amplitude 
do intervalo. Assim, quando vir um intervalo de confiança de 95% para a média, pense da seguinte 
forma: se coletássemos100 amostras independentes, calculássemos a média e, então, obtivéssemos os 
intervalos de confiança para a média, em 95 das 100 amostras, os intervalos de confiança conteriam o 
valor da média populacional.
Para calcular um intervalo de confiança de 95%, é preciso conhecer os limites dentro dos quais 95% 
das médias cairão. Sabemos que, se o n amostral for grande, a distribuição amostral das médias será 
normal. Para facilitar a explicação, vamos assumir uma distribuição normal com centro (média) igual 
a 0 e desvio padrão igual a 1. A vantagem disso é que podemos utilizar valores tabelados. O intervalo 
compreendido entre ‑1 e +1 unidades de desvio padrão seleciona aproximadamente 68,27% da área 
80
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
total sob a curva; já o intervalo compreendido entre ‑2 e +2 unidades de desvio padrão corresponde 
a 95,45% da área sob a curva; enquanto o intervalo compreendido entre ‑3 e +3 unidades de desvio 
padrão, a aproximadamente 99,73% da área sob a curva. Essas são propriedades matemáticas da 
distribuição normal.
–3 –2 –1 0
z
1 2 3
68,27%
95,45%
99,73%
Figura 23 – A curva normal padrão e suas porcentagens de área sob a curva. Assumindo‑se média = 0 e desvio padrão = 1, 
nota‑se que o intervalo compreendido entre ‑1 e +1 seleciona aproximadamente 68,27% da área total sob a curva; já o intervalo 
compreendido entre ‑2 e +2 corresponde a 95,45%; enquanto o intervalo compreendido entre ‑3 e +3, a aproximadamente 99,73%
Qual seria o valor exato de desvios padrões acima e abaixo da média que criariam um intervalo 
compreendendo os 95% centrais da área sob a curva? Para responder a essa pergunta, devemos recorrer 
a uma tabela de z escores – que corresponde à transformação de qualquer valor de um conjunto de 
dados em unidades de uma curva normal padrão.
X M
z 
s
−
=
Sendo:
z = o escore padrão
X = um valor da amostra
M = a média amostra
s = o desvio padrão amostral
Uma tabela completa de z escores pode ser encontrada no Apêndice A deste livro‑texto. A seguir, 
observe um recorte da tabela z escores para encontrarmos a informação desejada. Procuramos pela 
informação correspondente ao valor de z escore necessário para termos preenchidos os 95% centrais 
da área sob a curva normal. Conforme esquematiza a figura a seguir, devemos buscar essa informação 
na coluna D da tabela mencionada.
81
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
média–z z
D
Figura 24 – Esquematização de área central sob a curva normal. Os valores de z 
escores necessários para que se obtenha determinada área (representada pela coluna D 
na tabela 21 – excertos do Apêndice A) podem ser consultados em uma tabela de z escores
Tabela 21 – Área sob a curva normal (excerto do Apêndice A)
Área sob a curva normal
z escore
A
Abaixo de +z
acima de ‑z
B
Da média a +z ou a ‑z
C
Acima de +z
abaixo de ‑z
D
Entre ‑z e +z
1,90 97,13% 47,13% 2,87% 94,26%
1,91 97,19% 47,19% 2,81% 94,39%
1,92 97,26% 47,26% 2,74% 94,51%
1,93 97,32% 47,32% 2,68% 94,64%
1,94 97,38% 47,38% 2,62% 94,76%
1,95 97,44% 47,44% 2,56% 94,88%
1,96 97,50% 47,50% 2,50% 95,00%
1,97 97,56% 47,56% 2,44% 95,12%
1,98 97,61% 47,61% 2,39% 95,23%
1,99 97,67% 47,67% 2,33% 95,34%
2,00 97,72% 47,72% 2,28% 95,45%
Nota: o intervalo necessário para que 95% da área central sob a curva normal seja assinalado 
está compreendido entre ‑1,96 e +1,96 desvios padrões a partir da média (destaque).
O intervalo de confiança de 95% para a média pode ser facilmente calculado uma vez que o desvio 
padrão amostral e a média amostral sejam conhecidos. Entretanto, para o cálculo se utiliza o erro padrão, 
porque estamos interessados na variabilidade de uma distribuição amostral de médias e não na 
variabilidade das observações dentro de uma amostra. Assim:
s
limite inferior doI C95% M 1,96
n
= − ×
82
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
s
limite superior doI C95% M 1,96
n
= + ×
Sendo:
IC95% = o intervalo de confiança de 95% para a média
M = a média amostra
s = o desvio padrão amostral
n = o número de observações da amostra
 Lembrete
Lembre que o desvio padrão amostral (s) dividido pela raiz quadrada de 
n é igual ao erro padrão (sM):
M
s
s
n
=
Exemplo de aplicação
Exemplo 18
Assuma que a variável pressão diastólica tenha uma distribuição normal com média populacional (µ) 
desconhecida. Em uma amostra de 83 indivíduos, a média amostral foi de 81 mmHg e o erro padrão foi 
de 1,21 mmHg. Qual seria o intervalo de confiança de 95% para a média?
Resolução
Temos:
Mlimite inferior do IC95% M 1,96 s= − ×
limite inferior do IC95% 81 1,96 1,21= − ×
limite inferior doI C95% 81 2,3716= −
limite inferior doI C95% 78,63=
Mlimite superior do IC95% M 1,96 s= + ×
83
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
limite superior do IC95% 81 1,96 1,21= + ×
limite superior doI C95% 81 2,3716= +
limite superior doI C95% 83,37=
O intervalo de confiança de 95% para a média varia de 78,63 a 83,37 mmHg. Note que a subtração 
foi feita primeiro, pois o intervalo de confiança é reportado do limite inferior para o limite superior. 
Logo, o intervalo [78,63; 83,37] contém o valor médio da população com 95% de confiança. De forma 
abreviada, poderíamos reportar estes valores como M = 81,00, IC95% [78,63; 83,37].
O procedimento anterior é válido desde que as amostras sejam grandes, uma vez que o teorema 
central do limite nos diz que a distribuição amostral das médias será normal. Entretanto, para amostras 
pequenas, a distribuição amostral não será necessariamente normal. Nesses casos, emprega‑se a 
distribuição t – uma família de distribuições de probabilidade cujos formatos variam à medida que o 
tamanho amostral aumenta (quando a amostra for muito grande, tenderá à distribuição normal – veja 
na figura a seguir).
Para construir um intervalo de confiança para a média em uma amostra pequena, utiliza‑se o mesmo 
princípio apresentado anteriormente, mas, em vez de um valor de z, utiliza‑se um valor de t. Assim, 
quais seriam os valores de t que limitariam os 95% centrais da área sob a curva t? Para responder a essa 
pergunta, devemos recorrer a uma tabela de valores críticos de t.
Uma tabela t pode ser encontrada no Apêndice B deste livro‑texto. A seguir, observe um recorte dessa 
tabela para encontrarmos a informação desejada. Procuramos pela informação correspondente ao valor de t 
necessário para termos preenchidos os 95% centrais da área sob a curva t. Conforme esquematiza a figura 26, 
devemos buscar essa informação na coluna B.
0–1–2–3 1 2 3
GL = +∞
GL = 1
GL = 2
GL = 5
Figura 25 – Distribuição t. À medida que o n amostral aumenta – observado pelo aumento 
dos graus de liberdade (GL) – a distribuição t se assemelha à distribuição normal
84
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
0–t t
B
Figura 26 – Valores críticos da distribuição t. Para uma distribuição t com n – 1 graus de liberdade (GL), os valores críticos de t no 
eixo x, que correspondam aos limites inferior e superior de 95% da área sob a curva, podem ser encontrados na coluna B da tabela 
seguinte. Se a área assinalada em cinza corresponder a 95% da curva, tem‑se 2,5% à esquerda e 2,5% à direita nas áreas em branco
Tabela 22 – Valores críticos de t (excerto do Apêndice B)
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
1 6,314 12,706 31,821 63,657
2 2,920 4,303 6,965 9,925
3 2,353 3,182 4,541 5,841
4 2,132 2,776 3,747 4,604
5 2,015 2,571 3,365 4,032
6 1,943 2,447 3,143 3,707
7 1,895 2,365 2,998 3,499
8 1,860 2,306 2,896 3,355
9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,7643,169
Nota: a distribuição t varia conforme o grau de liberdade (GL). Para se obter os 95% c entrais da área sob a curva, 
deve‑se olhar na coluna B (destaque) e cruzar com a informação do grau de liberdade desejado, pois a soma das 
áreas das caudas à esquerda e à direita corresponderão a 5% da área sob a curva (α = 0,05 ou 5%).
Assim:
n 1
s
limite inferior doI C95% M t
n
−= − ×
n 1
s
limite superior doI C95% M t
n
−= + ×
85
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Sendo:
IC95% = o intervalo de confiança de 95% para a média
M = a média amostra
tn – 1 = valor crítico de t com n – 1 graus de liberdade
s = o desvio padrão amostral
n = o número de observações da amostra
Exemplo de aplicação
Exemplo 19
Assumindo que uma amostra de sete codornas condicionadas obteve, em média, 17 milhões de 
espermatozoides em seu ejaculado, com desvio padrão de 8,8 milhões de espermatozoides, calcule o 
intervalo de confiança de 95% para a média.
Resolução
Temos que, conforme a tabela anterior, para n – 1 graus de liberdade (n = 7, portanto GL = 6), o valor 
crítico de t na coluna B seria t = 2,447. Assim:
s
limite inferior doI C95% M 2,447
n
= − ×
8,8
limite inferior doI C95% 1 7,0 2,447
7
= − ×
8,8
limite inferior doI C95% 1 7,0 2,447
2,6458
= − ×
limite inferior doI C95% 1 7,0 8,14 8,86= − =
s
limite superior doI C95% M 2,447
n
= + ×
8,8
limite superior doI C95% 1 7,0 2,447
7
= + ×
8,8
limite superior doI C95% 1 7,0 2,447
2,6458
= + ×
86
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
limite superior doI C95% 1 7,0 8,14 25,14= + =
O intervalo de confiança de 95% para a média varia de 8,86 a 25,14 milhões de espermatozoides. 
Note que a subtração foi feita primeiro, pois o intervalo de confiança é reportado do limite inferior para 
o limite superior. De forma abreviada, poderíamos reportar a média e o intervalo de confiança como 
M = 17,00, IC95% [8,86; 25,14].
 Lembrete
O que o intervalo de confiança nos diz? Oficialmente, um intervalo 
de confiança de 95% apenas revela que, se repetíssemos o processo de 
coleta de dados e de obtenção de novas amostras e calculássemos o 
intervalo de confiança para cada amostra, em 95 de 100 repetições, os 
intervalos de confiança calculados conteriam o valor da média populacional.
Diante de um intervalo de confiança calculado, não se sabe, contudo, se estamos diante de uma 
dessas 95 situações. No dia a dia, as pessoas tendem a interpretar o intervalo de confiança como um 
limite dentro do qual o parâmetro populacional pode estar. Também há uma chance de o parâmetro 
populacional não cair dentro de um intervalo de confiança calculado (reveja as amostras destacadas em 
vermelho na figura 21 e observe a figura seguinte).
0
µ
–2 2–1–3 31
B A
Figura 27 – Distribuição amostral de médias com destaque para dois intervalos de confiança de 95%. 
Conforme o teorema central do limite, uma distribuição amostral de médias tenderá à distribuição normal, 
sendo o ponto médio da distribuição – a média das médias de todas as amostras que compõem essa 
distribuição – igual à média populacional (µ). Duas médias aleatórias – pontos A e B – são destacadas com 
seus respectivos intervalos de confiança de 95% demarcados. Note que a média populacional 
(centro da distribuição) está compreendida dentro dos limites do intervalo de confiança da média destacada pelo 
ponto A, mas não está compreendida dentro dos limites do intervalo de confiança da média destacada pelo ponto B
87
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
5.3 Probabilidade
As conclusões estatísticas envolvem noções de probabilidade, tal como os meteorologistas indicam 
que há chance de chover ao longo da semana. As condições podem ser adequadas para a previsão 
de que choverá, no entanto, a chuva não é garantida. A probabilidade pode ser explicada em função do 
número de eventos específicos para um dado resultado em função do total de eventos possíveis.
( ) número de vezes que um evento A pode ocorrerp A
número total de eventos possíveis
=
Sendo:
p = probabilidade
A = um evento específico
Moedas geralmente são usadas como exemplos simples para ensinar noções de probabilidade. Uma 
moeda possui duas faces – cara e coroa –, que são mutuamente exclusivas, ao jogar uma moeda não 
é possível obter cara e coroa simultaneamente. Assim, qual seria a chance de obter cara ao jogar uma 
moeda? Tendo em vista apenas dois resultados possíveis, observa‑se que:
( ) 1p cara ou 0,50 ou 50%
2
=
A probabilidade pode ser reportada como uma fração; nesse caso, há uma chance em duas de 
uma moeda dar cara. É possível, ainda, reportar na forma decimal, afirmando que a probabilidade 
de uma moeda dar cara é 0,50. Multiplicando‑se o decimal por 100, a probabilidade pode ser 
expressa em porcentagem, e alguém poderia afirmar que, ao jogar uma moeda, há uma chance de 
50% de obter cara.
Se lançássemos um dado, qual seria a chance de obtermos um número quatro na face voltada para 
cima? Assumindo que um dado possui seis faces, e todas têm a mesma chance de serem obtidas em um 
lançamento, para obter o número quatro (evento específico), devemos dividir o número de vezes que 
esse resultado pode ocorrer pelo total de eventos possíveis (seis faces):
( ) 1p quatro ou 0,1667 ou1 6,67%
6
=
E se resolvêssemos tirar aleatoriamente uma carta em um baralho, qual seria a chance de ser um ás 
de copas? Existe apenas um evento possível em um total de 52 possibilidades, logo:
( ) 1p ás de copas ou 0,0192 ou1 ,92%
52
=
88
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
E qual seria a chance de tirarmos um ás qualquer? Como existem quatro ases em 52 cartas:
( ) 4p ás ou 0,0769 ou 7,69%
52
=
Vejamos agora como se comportam eventos independentes. Ao jogar duas moedas, simultaneamente, 
qual a chance de obter duas caras? Ao assumir que os eventos são independentes, entende‑se que o 
resultado de uma moeda não impacta no resultado da outra moeda, ou seja, obter cara ou coroa na 
primeira moeda não exercerá efeito sobre o resultado da segunda moeda.
Existem quatro cenários possíveis para o lançamento de duas moedas:
• cara na primeira e cara na segunda;
• cara na primeira e coroa na segunda;
• coroa na primeira e cara na segunda;
• coroa na primeira e coroa na segunda.
Logo:
( ) 1p cara, cara ou 0,25 ou 25,00%
4
=
É possível obter o mesmo resultado multiplicando a probabilidade de um evento específico acontecer 
pela probabilidade do outro evento específico também ocorrer: a chance de obter cara em uma moeda 
é de 
1
2
, e a chance de obter cara na outra moeda também é de 
1
2
. Assim:
( ) 1 1 1p cara, cara ou 0,25 ou 25,00%
2 2 4
= × =
Se lançássemos dois dados, qual seria a chance de obtermos uma soma igual a sete nas faces voltadas 
para cima?
Para que seja obtida uma soma igual a sete, vejamos os cenários possíveis no lançamento de dois dados:
• um no primeiro e seis no segundo;
• dois no primeiro e cinco no segundo;
• três no primeiro e quatro no segundo;
89
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
• quatro no primeiro e três no segundo;
• cinco no primeiro e dois no segundo;
• seis no primeiro e um no segundo.
Havendo seis possibilidades de resultados no primeiro dado e outras seis possibilidades no segundo 
dado, temos um total de 36 resultados possíveis, logo:
( ) 6 1p soma sete ou 0,1667 ou1 6,67%
36 6
= =
Vejamos agora como se comportam eventos relacionados. Uma urna contém três bolas brancas e 
três bolas pretas. Suponha que sejam sorteadas duas bolas ao acaso, sem reposição. Isso significa que, ao 
extrairmos a primeira bola, observamos sua cor e não a devolvemos à urna. O total de bolas disponíveis 
na urna reduziuem uma unidade após a extração da primeira, e isso terá impacto sobre o número de 
eventos possíveis. Nesse exemplo, qual seria a chance de obter duas bolas pretas?
Existem três bolas pretas em um total de seis bolas na urna, logo, a chance de a primeira bola sorteada 
ser preta é de 
3 1
6 2
= ; para que a segunda bola também seja preta, devemos atentar que restaram apenas 
duas bolas pretas em um total de cinco, ou seja, resultando em uma chance de 
2
5
. Assim:
( ) 1 2 2 1p preta, preta ou 0,20 ou 20,00%
2 5 10 5
= × = =
Se a probabilidade de um evento for igual a 1,00 – ou expressa em porcentagem (100%) –, isso 
significa que determinado resultado é uma certeza. Nenhum evento possível pode possuir uma 
probabilidade maior que 1,00; e a soma das probabilidades de todos os eventos possíveis será sempre 
igual a 1,00. De forma inversa, é possível concluir que a probabilidade de um evento ocorrer nunca 
poderá ser menor que zero (0%) – uma probabilidade zero indica que um resultado não pode ocorrer. 
Assim, verifica‑se que:
( )0,00 p A 1,00≤ ≤
Noções de probabilidade são muito importantes quando trabalhamos com a curva normal. Por exemplo, 
se uma variável apresentar perfil de distribuição normal e um caso for selecionado aleatoriamente a 
partir da população, qual a chance desse caso cair dentro de um determinado intervalo da curva (por 
exemplo, entre ‑1 e +1 desvios padrões a partir da média populacional)? Como vimos na figura 23, a 
área sob uma curva normal compreendida entre ‑1 e +1 desvios padrões a partir da média corresponde 
a aproximadamente 68,27% do total da curva.
Os estatísticos usam probabilidade para avaliar se um determinado resultado ou evento será comum 
ou raro. Por comum, deduz‑se que certo resultado ocorra frequentemente, ou seja, ocorrerá em alguma 
90
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
região próxima ao centro de uma distribuição normal. Tipicamente, algo que tenha 95% de chance de 
ocorrer é considerado comum. Um resultado raro, por outro lado, é aquele que tem uma chance 
pequena de ocorrer, ou seja, estará mais distante do centro da distribuição, em alguma de suas caudas (à 
esquerda ou à direita). Usualmente, os estatísticos consideram um evento raro aquele que tenha menos 
de 5% de chance de ocorrer. Escrito em termos de probabilidade, se p < 0,05, em geral, esse evento é 
considerado raro.
Considerando que uma variável numérica qualquer assuma um perfil de distribuição normal na 
população, qual a probabilidade de um evento aleatório cair acima de dois desvios padrões da média?
média z
C
Figura 28 – Esquematização de área sob a curva normal à direita de um z escore. 
Os valores de área sob a curva à direita de um z escore (representada pela 
coluna C na tabela 21) podem ser consultados numa tabela de z escores
Ao consultarmos uma tabela de z escores (Apêndice A), veremos que, para um z escore igual a 2,00, a 
área à direita da curva (coluna C) corresponde a 2,28% do total da curva. Logo, a chance de um evento 
aleatório cair acima de dois desvios padrões da média é considerada rara, com p = 0,0228.
6 TESTES DE HIPÓTESES PARA UMA E DUAS AMOSTRAS
6.1 Introdução aos testes de hipóteses
Na definição de inferência estatística, vimos que as informações obtidas em uma amostra podem ser 
utilizadas para obter uma conclusão geral acerca da população. A transição entre a estatística descritiva 
e a estatística inferencial começa com a lógica que os estatísticos utilizam para tomada de decisão, um 
processo chamado testes de hipóteses.
As etapas de um teste de hipóteses se assemelham ao preparo de um bolo. Antes de colocar a massa 
para assar, você precisa obter os ingredientes, misturá‑los na ordem adequada, pré‑aquecer o forno etc. 
Da mesma forma, existe uma ordem nas etapas para a condução de um teste de hipóteses.
Uma hipótese é uma predição a partir de uma teoria, ou seja, uma explicação proposta para os fatos 
observados. Por exemplo, um dia, a observação de que pessoas que fumavam desenvolviam câncer de 
91
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
pulmão com frequência mais elevada do que não fumantes levou à hipótese de que fumar causaria 
câncer de pulmão (hoje essa hipótese é considerada fato).
Vejamos dez conceitos importantes acerca de testes de hipóteses:
I – Uma hipótese é uma predição a partir da população, não da amostra. Isso porque um pesquisador 
deseja estender sua conclusão para o todo e não apenas para a amostra específica à qual tem acesso.
II – Trabalha‑se com o modelo de duas hipóteses – uma hipótese nula, H0, e outra, chamada 
hipótese alternativa, Ha.
III – As duas hipóteses precisam contemplar, juntas, todos os resultados possíveis – se alguém formulasse 
duas hipóteses dizendo que (1) “todas as flores do mundo são vermelhas” e (2) “todas as flores do mundo 
são brancas”, essas duas hipóteses não contemplariam todos os resultados possíveis, pois também existem 
flores de outras cores. Contudo, se alguém dissesse que (1) “todas as flores são brancas” e (2) “nem todas 
as flores são brancas”, então as duas hipóteses cobririam todos os eventos possíveis.
IV – As duas hipóteses precisam ser mutuamente exclusivas, o que significa que apenas uma hipótese 
pode ser correta em um dado momento.
V – A hipótese nula sempre deverá afirmar que a variável independente não exerce efeito sobre a 
variável dependente. Por exemplo, se um pesquisador está avaliando o efeito de um dado tratamento 
para curar uma doença, a hipótese nula deverá afirmar que aquele tratamento não exerce efeito de cura. 
Em outras palavras, esse tratamento teria impacto zero (nulo) sobre a cura.
VI – A hipótese alternativa é aquela que os pesquisadores acreditam estar certa, pois ela afirma que 
a variável independente exerce certo efeito sobre a variável dependente. Para o exemplo do parágrafo 
anterior, seria dito que o tratamento exerce algum efeito de cura. Note que a hipótese alternativa não 
estabelece como será esse efeito, mas seguramente será diferente de zero.
VII – Uma hipótese nula, por ser uma hipótese negativa, não pode ser provada. Suponha que um 
adulto deseje provar para uma criança que não existem monstros embaixo da cama. Não importa 
quantas evidências ele ofereça, a criança sempre contra‑argumentará dizendo que o adulto não olhou 
direito ou que os monstros ouviram seus passos e se esconderam. Uma negação não pode ser provada.
VIII – Entretanto, uma negação pode ser refutada/rejeitada – basta apenas um exemplo. Se uma 
criança conseguir capturar um monstro embaixo da cama, um adulto não poderá mais afirmar que não 
existem monstros embaixo da cama. Se um experimento não se der conforme postula a hipótese nula, 
um pesquisador a rejeitará e, então, poderá aceitar a hipótese alternativa.
IX – Por serem mutuamente exclusivas, caso a hipótese nula seja rejeitada, o pesquisador aceitará 
a hipótese alternativa. Como um pesquisador geralmente acredita que a hipótese alternativa seja 
verdadeira, o objetivo de um estudo quase sempre é rejeitar a hipótese nula.
92
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
X – Entretanto, se um pesquisador falhar em refutar a hipótese nula, não se pode afirmar que a 
hipótese nula seja verdadeira. Lembre‑se de que uma negação não pode ser provada. O melhor que o 
pesquisador poderá afirmar é que ele não obteve evidências suficientes para rejeitar a hipótese nula. 
Em analogia a um veredito jurídico, dizer que não há evidências que permitam refutar a hipótese 
nula seria como declarar que o réu não é culpado; não ser culpado não quer dizer que o réu seja 
inocente, apenas não houve evidências suficientes para que o juiz ou júri o considerasse culpado.
O aprendizado para completar um teste de hipóteses é semelhante ao processo de aprender a 
cozinhar – o melhor a fazer é seguir uma receita. Vejamos umareceita de seis passos para condução de 
um teste de hipóteses:
I – Escolher o teste estatístico adequado.
II – Verificar os pressupostos (ou pré‑requisitos) do teste estatístico escolhido.
III – Listar as hipóteses nula e alternativa.
IV – Encontrar o valor crítico da estatística que determine quando rejeitar a hipótese nula.
V – Calcular o valor do teste estatístico.
VI – Interpretar os resultados e reportar, por extenso, o que eles indicam.
A primeira etapa consiste na escolha do teste estatístico adequado, pois existem centenas de testes 
disponíveis. A escolha correta dependerá de alguns fatores, tais como a pergunta de pesquisa, o tipo de estudo 
a ser realizado, a escala de medição dos dados, a quantidade e o tipo de variáveis envolvidas na pergunta.
Todos os testes estatísticos possuem pressupostos, condições que precisam ser atendidas antes que o 
teste seja efetuado. Se os pressupostos não forem atendidos, os pesquisadores não poderão ter certeza 
se os resultados do teste realmente são válidos. Existem dois tipos de pressupostos: robustos e não 
robustos. Um pressuposto não robusto precisa ser atendido para dar prosseguimento ao teste; a violação 
de um pré‑requisito não robusto indica que o pesquisador deverá parar e reavaliar a escolha do teste 
em questão. Um pressuposto robusto poderá ser violado até certo grau, de forma que o teste poderá ser 
concluído e interpretado.
Imagine um indivíduo cujo sistema imune esteja abalado (não robusto), tal como um indivíduo em 
tratamento quimioterápico ou à base de medicamentos imunossupressores, para que não haja rejeição 
de um órgão transplantado. Podemos imaginar que o funcionamento adequado do sistema imune é 
um pressuposto do nosso estado de saúde. Esse indivíduo, cuja imunidade está violada, estará mais 
propenso a contrair uma infecção, como gripe, caso esteja em um ambiente com certa aglomeração de 
pessoas e alguém contaminado espirre no ambiente.
Agora, uma pessoa que esteja com seu sistema imune funcional (robusto) será capaz de lidar com 
esse agente infeccioso e, de tal forma, permanecerá saudável. Entretanto, ainda assim, essa pessoa 
93
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
poderá contrair a doença caso a exposição ao patógeno se dê em grande quantidade ou por uma via 
mais direta – digamos que, em vez de estar em um ambiente em que alguém simplesmente espirrou, o 
aerossol formado pelas gotículas de saliva atingiram em cheio o rosto dessa pessoa ou ela compartilhou 
sua escova de dentes com alguém gripado. Mesmo que um pressuposto seja robusto, ele poderá ser 
violado a depender das condições.
As hipóteses podem ser listadas para testes bicaudais (bilaterais ou não direcionais) ou unicaudais 
(unilaterais ou direcionais). Um teste de hipóteses bicaudal não indica se a variável independente exerce 
um efeito positivo ou negativo sobre a variável dependente, apenas indica que há algum impacto. 
Em geral, testes bilaterais são muito mais empregados do que testes unilaterais. Quando um pesquisador 
estabelece, a priori, uma direção para o impacto da variável independente sobre a variável dependente 
(se levará a um resultado maior que ou menor que), emprega‑se um teste de hipóteses unicaudal. 
A vantagem deste sobre o outro é que a rejeição da hipótese nula se torna mais fácil, facilitando o aceite 
da hipótese alternativa.
Para a tomada de decisão, é importante estabelecer um valor crítico – que deve ser alcançado 
ou excedido para que se possa rejeitar a hipótese nula – da estatística adotada. Qual será esse valor 
crítico dependerá de uma série de fatores, tais como quão disposto o pesquisador está em assumir uma 
conclusão errada (em termos probabilísticos) e quantos casos existem em sua amostra.
O cálculo da medida de afastamento da hipótese nula, ou estatística do teste, é a etapa mais direta 
das seis apresentadas: basta adicionar os valores certos a uma equação e apertar os botões corretos da 
calculadora na ordem certa.
A interpretação dos resultados é a razão pela qual os testes estatísticos são realizados. Na última 
etapa, reportam‑se os achados de forma direta. Alguns aspectos devem constar na descrição dos 
resultados, tais como:
• uma recapitulação das causas pelas quais o estudo foi realizado;
• a apresentação de medidas‑resumo importantes, como média e desvio padrão;
• uma explicação do que esses resultados significam; e
• possíveis sugestões para pesquisas futuras.
6.2 Teste z para uma amostra
Agora que a lógica geral por trás de um teste de hipóteses foi apresentada, vejamos as etapas 
específicas para a condução de um teste z para uma amostra.
O teste z para uma amostra é utilizado para avaliar se a média de uma amostra (M) difere da média 
populacional (µ) quando o desvio padrão populacional (σ) for conhecido.
94
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
Suponhamos uma máquina automática de encher pacotes de café os enche segundo uma distribuição 
normal, com média ajustável e variância igual 400 g2 (desvio padrão populacional = 400 = 20 g). 
O valor da média ajustável pode ser fixado em um mostrador, porém a sua localização está em uma 
posição pouco acessível. A máquina foi regulada para uma média = 500 g (média populacional). 
Desejamos, de meia em meia hora, colher uma amostra de 16 pacotes e verificar se a produção está sob 
controle, isto é, se a média realmente é igual a 500 g ou não. Caso a média amostral em uma dessas 
coletas seja igual a 492 g, seria necessário parar a produção para verificar o mostrador?
Os pressupostos do teste z para uma amostra são os seguintes:
• Amostras aleatórias: a amostra deve ser obtida aleatoriamente a partir da população. Este 
pré‑requisito é robusto, logo, mesmo que a coleta de dados não se dê de forma randômica, 
ainda poderemos prosseguir com o teste. Deve‑se, contudo, permanecer atento à conclusão do 
teste, pois, ao estender os resultados obtidos na amostra para a população, deve‑se lembrar das 
características do processo de amostragem.
• Independência de observações: o segundo pressuposto nos diz que os casos registrados em uma amostra 
são independentes, ou seja, não são influenciados por outros casos na mesma amostra. Este pré‑requisito 
não é robusto, logo sua violação implica cuidado, pois não devemos prosseguir com o teste escolhido.
• Normalidade: o terceiro pressuposto indica que a variável dependente deverá apresentar distribuição 
normal na população. Este pré‑requisito também é robusto, logo, sua violação não implica 
necessariamente na anulação do teste, desde que o desvio à normalidade não seja tão grande.
Em nosso exemplo, observamos que amostras de 16 pacotes são coletadas aleatoriamente da linha de 
produção, a cada meia hora. Os eventos são independentes, pois o conteúdo de café em um pacote não 
influencia no resultado do outro pacote. Conforme o enunciado, sabemos que a máquina automática 
preenche os pacotes segundo uma distribuição normal. Logo, todos os pressupostos foram atendidos e 
podemos prosseguir para a próxima etapa.
O próximo passo consiste em listar as hipóteses nula e alternativa. Devemos iniciar pela determinação 
da hipótese nula, que deve ser sempre uma hipótese negativa. Em seguida, podemos estabelecer a 
hipótese alternativa, mutuamente exclusiva à hipótese nula, dizendo seu contrário.
Como o objetivo do experimento proposto é determinar se a média amostral em uma das coletas 
pode ser considerada diferente da média populacional (500 g, informação que vai estampada no rótulo 
das embalagens) e a hipótese nula deve ser sempre uma hipótese negativa, assumiremos que a média da 
amostra não será diferente da média populacional ou, em outras palavras, que essas médias são iguais:
H
0: média amostral (M) = média populacional (µ)
Já a hipótese alternativa deverá ser mutuamente exclusiva à hipótese nula. No caso, assumindo 
um teste bicaudal (pois não nosimporta se a média da amostra será maior ou menor que a média 
populacional, mas sim se será diferente):
95
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Ha: média amostral (M) ≠ média populacional (µ)
A quarta etapa consiste em encontrar o valor crítico da estatística, que determina quando rejeitar 
a hipótese nula. Em qualquer teste de hipóteses, até que se prove o contrário, devemos sempre assumir 
que a hipótese nula seja verdadeira. Graças ao teorema central do limite, sabemos que a distribuição 
amostral das médias terá como centro a média populacional e essa distribuição será normal.
Sabemos que a distribuição normal possui características importantes, especialmente quanto à 
área sob a curva em função de quantos desvios padrões nos deslocamos à esquerda ou à direita do 
centro (veja a figura no Apêndice A). Logo, podemos dividir essa área sob a curva em duas partes: 
uma região em que os eventos são frequentes e outra em que são raros. Vimos que, quanto mais 
próximo do centro, maior a frequência de observações, logo mais comuns serão os eventos. Quanto 
mais nos distanciamos do centro, mais os eventos passam a ser raros. Assim, duas constatações 
podem ser feitas:
• Se a média de uma amostra cair dentro da área em que os eventos são frequentes, não haverá 
razão para rejeitarmos a hipótese nula. A média da amostra será um valor considerado comum, o 
que seria esperado se a hipótese nula fosse verdadeira.
• Se a média de uma amostra cair dentro da área em que os eventos são raros (região crítica ou área 
de rejeição), então estamos diante da ocorrência de um evento não frequente, incomum. Nessa 
situação, conforme a lógica dos testes de hipóteses, a hipótese nula deverá ser rejeitada e será 
aceita a hipótese alternativa.
A divisória entre a área em que os eventos são frequentes e aquela em que são raros é conhecida como 
valor crítico do teste. O valor crítico de z (zcrit) dependerá de quão pequena o pesquisador considerar a 
área de rejeição. Por convenção, assume‑se que um evento comum é aquele que ocorre 95% das vezes, 
logo, se algo ocorre apenas 5% das vezes ou menos, será considerado raro. Esses valores são arbitrários 
e deverão ser estabelecidos pelo pesquisador, a priori.
Sendo os 95% da área mais próxima ao centro considerados a região em que os eventos são 
frequentes, teremos uma área de rejeição de 5%, que corresponderá a 2,5% da área dispostos na cauda 
à esquerda e a 2,5% dispostos na cauda à direita. Por essa razão, um teste é considerado bicaudal – a 
área crítica se localiza em ambas as laterais (caudas) da distribuição de frequências. Um teste unicaudal 
assumirá uma área crítica em apenas uma das laterais da distribuição.
 Lembrete
Vimos que os valores de z escores de ±1,96 limitam os 95% centrais 
de uma distribuição normal padrão. Agora, eles serão usados como valores 
críticos para o teste z para uma amostra. Outros valores críticos de z podem 
ser obtidos conforme necessário no Apêndice A.
96
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
Se um valor de z escore calculado (na próxima etapa) for menor ou igual ao valor de ‑zcrit ou maior 
ou igual ao valor de +zcrit, então a hipótese nula de um teste bicaudal deverá ser rejeitada. Escrito de 
forma matemática, se zcalc ≤ ‑zcrit ou se zcalc ≥ +zcrit, rejeita‑se H0 e aceita‑se Ha. Já se for maior que o 
valor de ‑zcrit e menor que o valor de +zcrit, então não haverá evidências para rejeitar a hipótese nula. 
Escrito de forma matemática, se ‑zcrit < zcalc < +zcrit, aceita‑se H0.
O tamanho da região crítica, expresso em termos de probabilidade, é conhecido como nível de 
significância (α) e consiste na probabilidade de um resultado cair na região crítica e a hipótese nula ser 
rejeitada, mesmo quando a hipótese nula for verdadeira. Os valores críticos que dividem a área em que 
os eventos são mais frequentes da área em que são mais raros dependem se o pesquisador realizará um 
teste unicaudal ou bicaudal e qual será o nível de significância (α) adotado.
Para o nosso exemplo, assumindo um teste de hipóteses bicaudal e um nível de significância 
(α) = 0,05 ou 5%, quais seriam os valores críticos de z? Conforme mencionado anteriormente, os 
valores de zcrit seriam iguais a ±1,96 e podem ser consultados no Apêndice A deste livro‑texto.
Devemos agora prosseguir com o cálculo da estatística do teste. A estatística z pode ser calculada 
conforme a seguinte equação:
M
M
z
−µ
=
σ
Sendo:
z = um valor de z escore
M = a média amostral
µ = a média populacional
σM = o erro padrão da média
Para o nosso exemplo, temos que:
M = 492 g
µ = 500 g
σM = 
20 20
4N 16
σ
= = = 5 g
97
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Aplicando‑os na equação:
M
M
z
−µ
=
σ
492 500 8
z 1,6
5 5
− −
= = = −
Para interpretar os resultados, vejamos se a hipótese nula foi rejeitada. Conforme destacado 
anteriormente, se zcalc ≤ ‑zcrit ou se zcalc ≥ +zcrit, rejeita‑se H0 e se aceita Ha, caso seja empregado um 
teste bicaudal.
Para o nosso exemplo, temos que zcalc = ‑1,6. Para um α = 0,05 em um teste z bicaudal, zcrit = ±1,96. Assim:
‑zcrit < zcalc < +zcrit
‑1,96 < ‑1,6 < +1,96
Portanto, aceita‑se H0 como verdadeira, pois os dados não forneceram evidências suficientes para 
rejeitá‑la. Conclui‑se que a média amostral de 492 g de café não pôde ser considerada significativamente 
diferente da média populacional de 500 g.
Estabelecida a conclusão, além da interpretação, convém reportar algumas informações adicionais, 
como o valor do teste estatístico utilizado, o valor do nível de significância (α) adotado e se a hipótese 
nula foi ou não rejeitada, indicando‑se a chance de erro (p ou p‑valor) obtida.
Quando se realiza um teste de hipóteses, o p‑valor pode ser utilizado para determinar a significância 
dos seus achados. A chance de erro é a probabilidade de obter o valor observado (estatística do teste, 
no caso, zcal). É importante ter a noção de que, quanto menor o p‑valor (p ≤ α), maior será a evidência 
contra a hipótese nula, portanto, seria mais prudente rejeitá‑la (se p = 0,01 e α = 0,05, a probabilidade 
de a hipótese nula ser verdadeira será de 1%, menos do que o nível de significância adotado). Um valor 
alto da chance de erro (p > α) indica uma fraca evidência contra a hipótese nula, assim, seria mais 
prudente aceitá‑la como verdadeira (se p = 0,10 e α = 0,05, a probabilidade de a hipótese nula ser 
verdadeira será de 10%, mais do que o nível de significância adotado).
 Observação
Se p > α, os dados não fornecem evidências para rejeitar H0, logo 
aceitamos H0 como verdadeira; se p ≤ α, os dados fornecem evidências 
para rejeitar H0, logo, aceitamos Ha.
98
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
Associando o valor da estatística do teste (zcal, no caso) à chance de erro (p), nota‑se uma relação 
importante em um teste bicaudal:
• se ‑zcrit < zcalc < +zcrit, ou, dito em termos mais diretos, |zcalc| < |zcrit|, p > α, logo, não existem 
evidências para rejeitar H0, devendo aceitá‑la como verdadeira;
• se zcalc ≤ ‑zcrit ou se zcalc ≥ +zcrit, ou melhor, se |zcalc| ≥ |zcrit|, p ≤ α, logo, os dados fornecem evidências 
para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Nessa avaliação, uma amostra de 16 pacotes de café foi aleatoriamente selecionada a partir da linha 
de produção e suas massas foram avaliadas, a fim de verificar se a regulagem da empacotadora estava 
em acordo com as especificações preestabelecidas.
Sendo a média populacional µ = 500 g e o desvio padrão populacional σ = 20 g, um teste z 
para uma amostra bilateral foi empregado, visando avaliar se a diferença entre a média amostral 
e a média populacional seria considerada significativamente distinta a um nível de significância 
α = 0,05. A média amostral obtidaM = 492 g não pôde ser considerada diferente da média 
populacional (z(n = 16) = – 1,6, p = 0,1096). Conclui‑se que não é necessário interromper a produção, 
visto que o equipamento não gerou uma amostra com média diferente das especificações.
Note que o valor da chance de erro (p), em testes bicaudais, corresponde à soma da área sob a curva 
normal à esquerda e à direita do módulo do valor de zcalc (coluna C do Apêndice A – para z = 1,6, valor 
da coluna C = 5,48%; dobrando‑se esse valor, obtemos p = 0,1096).
Veja que:
|zcalc| < |zcrit|, logo p > α
|‑1,6| < |1,96|, logo p > 0,05
Se p > α (p = 0,1096), aceita‑se H0 como verdadeira.
Exemplo de aplicação
Exemplo 20
O departamento de saúde de uma cidade deseja determinar se a média de coliformes fecais 
por unidade de volume de água em uma lagoa está dentro dos níveis considerados saudáveis 
(µ = 200 unidades formadoras de colônia/unidade de volume, σ = 20 unidades formadoras de 
colônia/unidade de volume). Considere que foram coletadas, aleatoriamente, 10 amostras de água 
da lagoa, e se obteve os seguintes valores de unidades formadoras de colônia (UFC):
 175 190 215 198 184
 207 210 193 196 180
99
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Com base nesses dados, considerando α = 0,01 e assumindo que a distribuição respeita a normalidade, 
compare a média amostral com a média populacional.
Resolução
Desse modo, sendo o desvio padrão populacional conhecido, podemos empregar o teste z para uma 
amostra. Em relação aos pressupostos do teste, observamos que 10 amostras de água foram coletadas 
aleatoriamente a partir de uma lagoa, com cada coleta independente da outra, e o enunciado indica 
que a distribuição respeita a normalidade. Sem haver violação dos pressupostos, podemos proceder 
com o teste.
Quanto às hipóteses, observe que o desejo é avaliar se a média de coliformes fecais por unidade 
de volume de água está dentro dos níveis considerados saudáveis (µ = 200 unidades formadoras de 
colônia/unidade de volume). Se a média for menor ou igual a 200 unidades formadoras de colônia/unidade 
de volume, estamos dentro dos níveis considerados saudáveis; porém, se esse valor estiver acima de 200, 
os níveis serão considerados impróprios para o consumo humano. Assim, o delineamento do objetivo 
sugere um teste de hipóteses unicaudal com as seguintes hipóteses:
H0: média amostral (M) ≤ média populacional (µ)
Ha: média amostral (M) > média populacional (µ)
Segundo o enunciado, o nível de significância adotado é α = 0,01. Sendo o teste unilateral à direita, 
deseja‑se saber o valor crítico de z que corresponda a uma área crítica de 1% à direita. Conforme o 
Apêndice A, em sua coluna C, observamos que para uma área de 1% à direita, zcrit = 2,33.
Podemos, enfim, prosseguir com a estatística do teste. Com base nos valores apresentados, 
temos que:
M = 194,8 unidades formadoras de colônia/unidade de volume
µ = 200 unidades formadoras de colônia/unidade de volume
σM = 
20 20
3,1623N 10
σ
= = = 6,3245 unidades formadoras de colônia/unidade de volume
Aplicando‑os na equação:
M
M
z
−µ
=
σ
194,8 200 5,2
z 0,8222 0,82
6,3245 6,3245
− −
= = = − ≅−
100
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
Temos que zcalc = ‑0,82. Para um α = 0,01 em um teste z unicaudal, zcrit = 2,33. Assim:
zcalc < zcrit
‑0,82 < 2,33
Se zcalc < zcrit, logo p > α; assim, os dados não fornecem evidências para rejeitar H0. Para estimar o 
valor de p, podemos recorrer ao Apêndice A e procurar pela área à direita de ‑0,82 (no caso, coluna A 
– veja figura no Apêndice). Nota‑se que a área à direita de z = ‑0,82 corresponde a 79,39% do total da 
curva, portanto, p‑valor = 0,7939.
O que esse valor nos indica? Que a média amostral de 194,8 unidades formadoras de colônia/unidade 
de volume tem 79,39% de chance de ser menor ou igual à média populacional de 200 unidades formadoras de 
colônia/unidade de volume. Como p > α, aceita‑se H0.
Resta‑nos, agora, reportar a conclusão final por extenso:
Nessa avaliação, uma amostra com 10 coletas de água foi realizada a partir de uma lagoa, e 
seus valores de unidades formadoras de colônia/unidade de volume foram determinados para 
verificar se os níveis de coliformes fecais estavam dentro dos limites considerados saudáveis. Sendo 
a média populacional µ = 200 unidades formadoras de colônia/unidade de volume e o desvio padrão 
populacional σ = 20 unidades formadoras de colônia/unidade de volume, um teste z para uma amostra 
unilateral foi empregado, visando avaliar se a média amostral seria significativamente maior que a 
média populacional, a um nível de significância α = 0,01. A média amostral obtida M = 194,8 unidades 
formadoras de colônia/unidade de volume não pôde ser considerada maior que a média populacional 
(z(n = 10) = ‑0,82, p = 0,7939). Conclui‑se que o nível de coliformes fecais por unidade de volume de água 
na lagoa está dentro dos níveis considerados saudáveis.
Todo teste de hipóteses tem sua conclusão sujeita a erro. O erro em afirmar que existe 
uma diferença quando ela efetivamente não existe – ou seja, rejeitar H0 quando se deveria 
aceitá‑la – é chamado de erro do tipo I e tem uma probabilidade de ocorrer igual ao α adotado. 
No entanto, também é possível cometer o erro de aceitar H0 quando não se deveria, isto é, 
afirmar uma igualdade quando o correto seria afirmar uma diferença. Chamamos esse erro 
de erro do tipo II ou β, cuja probabilidade, em geral, é difícil de estimar, pois é necessário 
conhecer o valor do parâmetro na população amostrada. Como a probabilidade complementar 
desse erro (1 – β) representa a probabilidade em afirmar corretamente que existe uma diferença 
quando ela realmente existe, diz‑se que 1 – β é o poder do teste estatístico em detectar uma 
diferença real. Não serão abordados cálculos de β e poder do teste, mas esses conceitos podem 
ser utilizados para estimar o tamanho amostral necessário para atingir determinado objetivo 
ou para determinar, após a realização de uma pesquisa, que poder a amostra estudada tem em 
detectar uma diferença estipulada pelo pesquisador.
101
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
 Saiba mais
Para mais informações sobre erros do tipo I e do tipo II, consulte:
HOEL, P. G. Introduction to Mathematical Statistics. 3 ed. New York: 
John Wiley & Sons Inc, 1966.
6.3 Teste t para uma amostra
O teste t para uma amostra é utilizado para comparar a média de uma amostra a um valor específico, 
como a média populacional. Em suma, é equivalente ao teste z para uma amostra, entretanto, é mais 
utilizado, pois não demanda o conhecimento do desvio padrão populacional (σ). Em vez disso, o teste t 
para uma amostra emprega o desvio padrão amostral (s).
Suponhamos que, durante uma semana, 13 bebês nasceram em determinada maternidade. Parte do 
procedimento padrão consiste em medir o comprimento dos recém‑nascidos. Com base nos dados a 
seguir, dispostos em cm, a um nível de significância de 5%, os dados fornecem evidências para afirmar 
que o comprimento médio dessa amostra é diferente de 50 cm?
49 50 45 51 47 49 48 54 53 55 45 50 48
A primeira etapa de um teste de hipóteses é a seleção do teste adequado. Como o objetivo é comparar 
uma média amostral a certo valor (como a média populacional), devemos considerar o teste z para uma 
amostra ou o teste t para uma amostra. Entretanto, por não dispormos do desvio padrão populacional, 
nesse caso, devemos escolher o teste t para uma amostra.
Os pressupostos do teste t para uma amostra são os mesmos do teste z para uma amostra: 
amostras devem ser aleatórias, deve haver independência de observações e os dados devem apresentar 
distribuição normal.
Assim, os 13 bebês da suposição anterior, que compõem a amostra, representam uma amostra 
aleatória entre os nascimentosregistrados na maternidade. Há independência entre as observações, 
pois não há informações que indiquem que os casos exerçam influência uns sobre os outros. A variável 
dependente (comprimento) apresenta perfil de distribuição normal na população, portanto, assumiremos 
que os dados seguem esse perfil.
 Observação
Existem testes de hipóteses chamados testes de normalidade, que visam 
avaliar se os valores contidos em determinada amostra apresentam perfil 
semelhante à curva normal. Alguns exemplos são os testes de Shapiro‑Wilk, 
102
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
d’Agostino‑Pearson, Anderson‑Darling e Kolgomorov‑Smirnov. Nesses 
testes, temos H0: distribuição dos dados = distribuição normal; Ha: 
distribuição dos dados ≠ distribuição normal.
Para esse conjunto de dados, o teste de normalidade de Shapiro‑Wilk 
teve chance de erro p = 0,6842. Para um nível de significância α = 0,05, 
podemos concluir que p > α, portanto, se aceita H0 – os dados apresentam 
distribuição normal.
 Saiba mais
Para mais informações sobre os testes de normalidade, leia:
FÁVERO, L. P.; BELFIORE, P. Manual de análise de dados. Rio de Janeiro: 
Elsevier, 2017.
FIELD, A. Discovering statistics using IBM SPSS statistics. 4. ed. Thousand 
Oaks: Sage, 2013.
Na figura a seguir, a inspeção visual do box‑plot indica se tratar de um conjunto de dados relativamente 
simétrico, sem outliers. Ao lado, vemos um gráfico quantil‑quantil (Q‑Q plot), muito útil para ter uma ideia 
do perfil de distribuição de um conjunto de dados numéricos. Quanto mais os pontos se aproximarem da 
linha de tendência central, mais tenderão à normalidade. Note que nenhuma observação (cada ponto no 
Q‑Q plot) ultrapassou o limite de ±2,0 desvios padrões (eixo vertical) em função da média.
40 40 45 50 55 60
–2.0
–1.5
–1.0
–0.5
0.0
0.5
1.0
1.5
2.0
45
50
55
60
Co
m
pr
im
en
to
 (c
m
)
Recém‑nascidosA) B) Valores observados
N
or
m
al
 e
sp
er
ad
a
Figura 29 – Box‑plot e Q‑Q plot da variável comprimento (cm) de uma amostra de recém‑nascidos (n = 13). 
O box‑plot indica se tratar de conjunto de dados relativamente simétrico, sem outliers (A). O Q‑Q plot indica 
que os dados do conjunto apresentam distribuição que tende à normalidade (pontos se aproximam da linha de 
tendência central), sendo que nenhuma observação ultrapassou o limite de ±2,0 desvio padrão em função da média (B)
103
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
A próxima etapa consiste na descrição das hipóteses nula e alternativa. Antes de defini‑las, deve‑se 
estipular se estamos diante de um teste unicaudal ou bicaudal. Testes bicaudais são comumente 
empregados e são mais conservadores, no sentido de que tornam mais difícil a rejeição de H0. De tal 
forma, um teste bicaudal é a escolha padrão, em geral – devendo ser empregado quando um pesquisador 
deseja avaliar se existe alguma diferença entre a média amostral e o valor a ser comparado, para qualquer 
uma das direções.
Um teste unicaudal é utilizado quando um pesquisador já possui uma dada predição a partir da 
direção dos resultados antes da coleta de dados. Em outras palavras, deseja avaliar se a média amostral 
é maior que ou menor que determinado valor a ser comparado, ou seja, objetiva‑se apenas uma das 
laterais da distribuição.
Dada a hipótese anterior, uma vez que se deseja avaliar se o comprimento médio dessa amostra é 
diferente de 50 cm, pressupõe‑se o uso de um teste bicaudal. Assim, temos:
H0: média amostral = 50 cm
Ha: média amostral ≠ 50 cm
Em seguida, devemos estimar o valor crítico do teste. Lembre‑se que, ao utilizar um teste t, 
utilizaremos uma distribuição t. A interpretação do valor crítico é a mesma que vimos para o teste z 
para uma amostra, entretanto, para obter esse valor na tabela de valores críticos de t, devemos levar em 
conta as seguintes observações:
• O teste é unicaudal ou bicaudal?
• Qual é o nível de significância (α) adotado?
• Qual é o tamanho da amostra (n)?
Para os dados do nosso exemplo, temos que o teste em questão é bicaudal; segundo o enunciado, o 
nível de significância adotado é α = 0,05 ou 5% e; o tamanho da amostra é de 13 bebês.
Com base nesses valores, é possível recorrer a uma tabela t (Apêndice B) e cruzar os graus de liberdade 
(n – 1) com o nível de significância adotado.
Sendo GL = n – 1 = 12 e α bicaudal = 0,05, observamos que o valor crítico de t para essa estatística 
será igual a 2,179.
tcrit = 2,179
104
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
Tabela 23 – Valores críticos de t (excerto do Apêndice B)
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
1 6,314 12,706 31,821 63,657
2 2,920 4,303 6,965 9,925
3 2,353 3,182 4,541 5,841
4 2,132 2,776 3,747 4,604
5 2,015 2,571 3,365 4,032
6 1,943 2,447 3,143 3,707
7 1,895 2,365 2,998 3,499
8 1,860 2,306 2,896 3,355
9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169
11 1,796 2,201 2,718 3,106
12 1,782 2,179 2,681 3,055
Nota: a distribuição t varia conforme o grau de liberdade (GL). Como o nível de significância 
adotado no nosso exemplo é α = 0,05 bicaudal e o conjunto apresenta 12 graus de liberdade, 
temos que o valor crítico de t para este cálculo será de 2,179 (conforme destaque)
Para um teste bicaudal, a tomada de decisão se dará:
• se ‑tcrit < tcalc < +tcrit, não há evidências para rejeitar H0, devendo aceitá‑la como verdadeira;
• se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Calcula‑se o valor da estatística t, conforme a equação a seguir:
M
M
t
s
−µ
=
Sendo:
t = o valor da estatística t
M = a média amostral
µ = a média populacional (ou valor de referência)
sM = a estimativa do erro padrão da média
105
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Com base nos 13 valores descritos no início de nossa suposição, podemos calcular a média e o desvio 
padrão amostrais:
Média M = 49,54 cm e desvio padrão s = 3,13 cm.
Em seguida, substituindo‑se, na equação do teste t para uma amostra, temos:
M = 49,54 cm
µ = 50 cm
sM = 
s 3,13 3,13
 
3,6056n 13
= = = 0,8681 cm
M
M
t
s
−µ
=
49,54 50 0,46
t 0,530
0,8681 0,8681
− −
= = ≅ −
Vamos agora à interpretação do resultado do teste. Em primeiro lugar, a hipótese nula foi rejeitada? 
Temos que tcalc = ‑0,530 e tcrit = 2,179. Como o teste é bicaudal, devemos observar que, se ‑tcrit < tcalc < +tcrit, 
não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, 
há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Nesse caso, estamos diante da primeira situação, pois:
‑tcrit < tcalc < +tcrit
–2,179 < –0,530 < 2,179
Portanto, não há evidências para rejeitar H0 e devemos aceitá‑la como verdadeira.
Assim, quanto será a chance de erro (p)? Ela é maior ou menor que o nível de significância (α) adotado? 
A interpretação segue o mesmo raciocínio apresentado para o teste z para uma amostra. Como:
|tcalc| < |tcrit|, logo p > α
|‑0,530| < |2,179|, logo p > 0,05
Se p > 0,05, aceita‑se H0 como verdadeira. Mas qual será o valor exato da chance de erro (p)? 
Para obter o valor exato, teríamos duas abordagens: calcular a integral da área sob a curva além 
106
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
do valor de tcalc (ambas as caudas) ou utilizar um software de análise (para o exemplo em questão, 
via software, p = 0,6042).
Ambas as opções demandam conhecimentos específicos que não serão abordados. Note que, 
independentemente de estar em posse do valor exato da chance de erro (p) ou não, nossa conclusão 
nãose altera: p > 0,05. Compare os Apêndices A e B e note como a nossa tabela t é reduzida se 
comparada à tabela z. Isso se deve ao fato de, nessa tabela t, apresentarmos apenas alguns valores 
de probabilidade (α – no topo das colunas), que, em geral, são necessários para obtenção dos 
valores críticos.
 Observação
Para um teste t bicaudal, temos que, se ‑tcrit < tcalc < +tcrit, ou, dito em termos 
mais diretos, |tcalc| < |tcrit|, p > α, logo, não existem evidências para rejeitar 
H0, devendo aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, ou 
melhor, |tcalc| ≥ |tcrit|, p ≤ α, logo, os dados fornecem evidências para rejeitar H0, 
devendo‑se aceitar Ha como verdadeira.
Uma vez interpretado o resultado, podemos prosseguir para sua descrição por extenso. Devemos 
destacar alguns elementos importantes na resposta, tais como:
I – o teste utilizado;
II – o número de elementos da amostra;
III – o valor calculado do teste estatístico acompanhado dos graus de liberdade;
IV – o nível de significância (α) adotado;
V – se H0 foi rejeitada ou não.
Assim, vejamos como concluiríamos nosso caso: uma amostra contendo 13 recém‑nascidos foi 
avaliada em uma maternidade, e um teste t para uma amostra bilateral foi empregado, visando avaliar se o 
comprimento médio amostral seria diferente de 50 cm, a um nível de significância de 5%. A média obtida 
M = 49,54 cm, com desvio padrão s = 3,13 cm, não pôde ser considerada diferente de 50 cm (t(12) = ‑0,530, 
p > 0,05). Conclui‑se que o comprimento médio desses bebês não foi diferente do valor esperado.
Exemplo de aplicação
Exemplo 21
Uma empresa diz que o volume médio de suas garrafas de refrigerante é de 1500 mL (1,5 L). Para 
que ela não corra o risco de sofrer punições do órgão fiscalizador, seu departamento de controle de 
107
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
qualidade realiza testes frequentes com amostras retiradas da linha de produção. Sabendo‑se que a 
empresa só seria autuada caso as garrafas apresentassem volume inferior a 1500 mL, determine se 
a empresa corre esse risco por não cumprir a informação divulgada nas embalagens de seus produtos. 
Para seus cálculos, observe a amostra a seguir e adote um nível de significância α = 0,025.
Volumes medidos (mL)
 1508 1518 1492 1505 1515
 1498 1496 1505 1510 1507
Resolução
Assumindo que a distribuição amostral seja normal, a primeira etapa de um teste de hipóteses é 
a seleção do teste adequado. Como o objetivo é comparar uma média amostral a certo valor (como a 
média populacional), devemos considerar o teste z para uma amostra ou o teste t para uma amostra. 
Entretanto, por não dispormos do desvio padrão populacional, neste caso, devemos escolher o teste t 
para uma amostra.
As dez garrafas que compõem a amostra representam uma amostra aleatória retirada da linha de 
produção. Há independência entre as observações, pois não há informações que indiquem que os casos 
da amostra exerçam influência uns sobre os outros. A variável dependente (volume em mL) apresenta 
perfil de distribuição normal na população, conforme relatado no enunciado, portanto, assumiremos 
que os dados seguem esse perfil. Podemos inspecionar o box‑plot e o Q‑Q plot dos dados.
1485
1490
1495
1500
1505
1510
1515
1520
1485 1495 1505 1515 1525
–2.0
–1.5
–1.0
–0.5
0.0
0.5
1.0
1.5
2.0
Vo
lu
m
e 
(m
l)
Refrigerante
A) B)
Valores observados
N
or
m
al
 e
sp
er
ad
a
Figura 30 – Box‑plot e Q‑Q plot da variável volume (mL) de uma amostra de refrigerantes (n = 10). 
O box‑plot indica se tratar de conjunto de dados relativamente simétrico, sem outliers (A). O Q‑Q plot 
indica que os dados do conjunto apresentam distribuição que tende à normalidade (pontos se aproximam 
da linha de tendência central), sendo que nenhuma observação ultrapassou o limite de ±2,0 
desvios padrões em função da média (B)
108
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
Unidade II
Quanto às hipóteses, observe que o desejo é avaliar se a média do volume amostral condiz com 
a informação do rótulo da embalagem (1500 mL). Sabendo que a empresa só seria autuada caso as 
garrafas apresentassem volume inferior a 1500 mL, o delineamento do objetivo sugere um teste de 
hipóteses unicaudal com as hipóteses de H0: média amostral ≥ valor de referência (1500 mL); Ha: média 
amostral < valor de referência (1500 mL).
Segundo o enunciado, o nível de significância adotado é α = 0,025. Sendo o teste unilateral à 
esquerda, deseja‑se saber um valor crítico de t que corresponda a uma área crítica de 2,5% à esquerda. 
Conforme a tabela anterior, em sua coluna B, observamos que, para uma área de 2,5% à esquerda, com 
9 graus de liberdade (n – 1 = 10 – 1 = 9), tcrit = ‑2,262 (negativo, pois está à esquerda).
Para um teste unilateral à esquerda, a tomada de decisão se dará de modo que, se tcalc > ‑tcrit, não 
há evidências para rejeitar H0, devendo aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit, há evidências para 
rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Para calcular o valor da estatística t a partir do conjunto de dados, podemos determinar a média 
amostral M = 1505,4 mL e o desvio padrão amostral s = 8,20 mL. Substituindo‑se, na equação:
M = 1505,4 mL
µ = 1500 mL
sM = 
s 8,20 8,20
 
3,1623n 10
= = = 2,593 mL
M
M
t
s
−µ
=
1505,4 1500 5,4
t 2,083
2,593 2,593
−
= = ≅
Vamos agora à interpretação do resultado do teste t para uma amostra. Em primeiro lugar, a hipótese 
nula foi rejeitada? Note que a média amostral foi maior que a média populacional, que nos dá um indício 
importante (pois a empresa só seria autuada se o volume médio dos refrigerantes estivesse abaixo da 
informação da embalagem).
Temos que tcalc = 2,083 e tcrit = ‑2,262. Como o teste é unicaudal à esquerda, observamos que:
tcalc > ‑tcrit
2,083 > ‑2,262
Portanto, não há evidências para rejeitar H0, e devemos aceitá‑la como verdadeira. Assim, quanto 
será a chance de erro (p)? Ela é maior ou menor que nível de significância (α) adotado?
109
Re
vi
sã
o:
 B
ru
no
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Para um teste t unilateral à esquerda, temos que, se tcalc > ‑tcrit, p > α; já se tcalc ≤ ‑tcrit, p ≤ α. Como:
tcalc > ‑tcrit, logo p > α
2,083 > ‑2,262, logo p > 0,025
Se p > 0,025, aceita‑se H0 como verdadeira. Como o teste em questão é unilateral à esquerda, para 
obter o valor exato da chance de erro (p), teríamos duas abordagens: calcular a integral da área sob a 
curva à esquerda do valor de tcalc ou utilizar um software de análise (para o exemplo em questão, via 
software, p = 0,9665). Note que, independentemente de estar em posse do valor exato da chance de erro 
(p) ou não, nossa conclusão não se altera: p > 0,025.
Resta‑nos, agora, reportar a conclusão final por extenso:
Uma amostra contendo 10 garrafas de refrigerante foi avaliada em uma fábrica, e um teste t para uma 
amostra unilateral foi empregado, visando avaliar se o volume médio amostral seria menor que 1500 mL 
a um nível de significância de 2,5%. Visto que a empresa só seria autuada caso as garrafas apresentassem 
volume inferior à informação presente no rótulo, a média amostral obtida M = 1505, 4 mL, com desvio padrão 
s = 8,20 mL, não pôde ser considerada menor que 1500 mL (t(9) = 2,083, p > 0,025). Conclui‑se que o volume 
médio das garrafas presentes na amostra não foi menor do que o valor esperado, portanto, a empresa 
não corre riscos.
6.4 Teste t para duas amostras independentes
Nos dois últimos tópicos, vimos o teste z e o teste t, ambos para uma amostra. Eles foram os 
primeiros testes apresentados porque são bons para introduzir a lógica dos testes de hipóteses. Contudo, 
raramente os pesquisadores se perguntam se a média de uma amostra difere da média populacional.
Agora, veremos um teste utilizado para comparar duas amostras. Essa estratégia é bastante

Continue navegando