Prévia do material em texto
72
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Unidade II
5 INDO ALÉM DOS DADOS
5.1 Distribuição amostral e o teorema central do limite
Para entender uma distribuição amostral, vamos usar exemplo uma população bem pequena.
Durante a Primeira Guerra Mundial, os alemães ocuparam a floresta Białowieža, na Polônia, um dos
últimos locais onde o bisão europeu ainda podia ser visto na natureza. Como consequência do cerco
e para a manutenção do exército, os soldados alemães caçaram esses espécimes. Ao final da guerra,
durante a retirada, eles atiraram em mais espécimes (simplesmente porque podiam). Como resultado,
apenas nove animais sobreviveram. A população de uma espécie estava reduzida a nove indivíduos.
Os sobreviventes foram abrigados em zoológicos e um programa de reprodução em cativeiro foi iniciado,
com a tentativa de reintroduzir a espécie na natureza. Conforme dados de 2017 (MILLER, 2017), a floresta
Białowieža abriga, atualmente, 600 espécimes em vida livre (cerca de 10% da população atualmente
existente na Europa). Sabendo que a massa corporal de um bisão adulto pode variar entre 300 e 920 kg,
suponhamos que a massa dessa população de nove indivíduos seguisse o perfil observado na figura seguinte.
0
300 350 400 450 500 550 600 650 700 750 800 850 900 950
Fr
eq
uê
nc
ia
Massa (kg)
1
2
Figura 19 – Histograma da distribuição da massa corporal de bisões europeus.
A distribuição de escores nessa população é achatada (dados hipotéticos)
Esses nove indivíduos correspondiam a toda a população de bisões europeus. Assumindo que os valores
de suas massas corporais fossem conforme apresentado, poderíamos obter a média populacional (µ):
X
N
∑
µ =
73
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Sendo:
µ = a média populacional
ΣX = o somatório dos valores da variável X
N = o número de observações da população
( )350 430 480 540 560 680 760 810 880
9
+ + + + + + + +
µ =
5490
610 kg
9
µ = =
Para realizar uma distribuição amostral para a média dessa população, em primeiro lugar se retira,
aleatoriamente, amostras a partir da população; para cada amostra, calcula‑se sua média; e, em seguida,
verifica‑se a distribuição de frequências das médias amostrais.
Dois aspectos importantes precisam ser destacados:
I – A amostragem ocorre com reposição: isso significa que, após a seleção de um indivíduo e
registro do seu valor de massa (kg), ele será devolvido para a população, dando‑lhe a chance de ser
selecionado novamente; de tal forma, todos os indivíduos apresentam sempre a mesma chance de
serem aleatoriamente selecionados (no caso, 1/9 = 0,1111 = 11,11%).
II – A ordem em que os casos forem selecionados não importa: se o indivíduo A for selecionado
primeiro e, em seguida, o indivíduo B, isso levaria ao mesmo resultado caso o indivíduo B fosse
selecionado primeiro e, em seguida, o indivíduo A.
Assumindo que nossas amostras obtidas a partir da população possuam tamanho igual a dois
indivíduos, quantas possibilidades únicas seriam possíveis, extraindo‑se dois indivíduos de uma
população com total de nove?
Observação
O número de combinações com repetição a partir N elementos tomados
n a n é
( )
( )N n 1,n 1
N n 1 !
C
n! N 1 !+ − −
+ −
=
−
possíveis amostras de n elementos, que
podem ser extraídas a partir da população. No caso, N = 9 e n = 2, logo:
( )
( )
( )
9 2 1 !N n 1! 10! 10.9.8! 10.9 90
45
n! N 1 ! 2! 9 1 ! 2!8! 2!8! 2 2
+ −+ −
= = = = = =
− −
74
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Observe a tabela seguinte e as 45 combinações únicas. Sua segunda seção traz os pares de valores
de massa para cada amostra, enquanto a terceira apresenta os valores de média para essas amostras.
Observe que os valores das médias amostrais diferem entre si, estando algumas mais próximas da média
populacional e outras mais distantes.
Como existe variabilidade entre as médias, é possível calcular uma medida de dispersão para a distribuição
amostral. Essa medida é conhecida como erro padrão da média (σM) e indica quanta variabilidade há,
em média, entre uma média amostral e outra. Diferentemente do desvio padrão, que mede a variabilidade
dentro de uma única amostra, o erro padrão da média estima a variabilidade entre elas.
Tabela 20 – Amostras (n = 2) a partir de uma população contendo nove indivíduos
Todas as amostras possíveis com combinação única
A, A A, B A, C A, D A, E A, F A, G A, H A, I
B, B B, C B, D B, E B, F B, G B, H B, I
C, C C, D C, E C, F C, G C, H C, I
D, D D, E D, F D, G D, H D, I
E, E E, F E, G E, H E, I
F, F F, G F, H F, I
G, G G, H G, I
H, H H, I
I, I
Valores de massa (kg) para todas as amostras possíveis
350, 350 350, 430 350, 480 350, 540 350, 560 350, 680 350, 760 350, 810 350, 880
430, 430 430, 480 430, 540 430, 560 430, 680 430, 760 430, 810 430, 880
480, 480 480, 540 480, 560 480, 680 480, 760 480, 810 480, 880
540, 540 540, 560 540, 680 540, 760 540, 810 540, 880
560, 560 560, 680 560, 760 560, 810 560, 880
680, 680 680, 760 680, 810 680, 880
760, 760 760, 810 760, 880
810, 810 810, 880
880, 880
Médias dos valores de massa (kg) para as amostras
350 390 415 445 455 515 555 580 615
430 455 485 495 555 595 620 655
480 510 520 580 620 645 680
540 550 610 650 675 710
560 620 660 685 720
680 720 745 780
760 785 820
810 845
880
75
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Observação
As letras empregadas na primeira seção representam todas as
possibilidades de combinações para uma amostragem com reposição e
n = 2. Na segunda parte, são apresentados os valores de massa (kg) dos
indivíduos em cada amostra. Na terceira, são reportados os valores de
média para cada amostra.
A figura a seguir apresenta o histograma para as 45 médias obtidas na terceira parte da tabela
anterior. Observe o formato da distribuição: a população apresentava, na figura anterior, distribuição
achatada, mas a distribuição amostral aparenta assumir o formato de uma distribuição normal (compare
com a curva normal, em vermelho, sobreposta ao histograma).
0
300 350 400 450 500 550 600 650 700 750 800 850 900 950
Fr
eq
uê
nc
ia
Média da massa (kg)
8
7
6
5
4
3
2
1
Figura 20 – Distribuição amostral das médias para amostragem com reposição e n = 2, a partir dos valores
da massa corporal de bisões europeus (N = 9). O teorema central do limite estabelece que uma distribuição
amostral da média tenderá à distribuição normal, independentemente do formato da distribuição da população,
desde que o tamanho amostral seja grande (n ≥ 30). Nesse exemplo, ainda que n amostral seja
pequeno (n = 2), a distribuição amostral já aparenta assumir o formato de uma distribuição normal,
como é possível evidenciar pela comparação com a curva sobreposta
A média dessa distribuição amostral (µM) leva a uma observação interessante: ela é igual à média da
população. Observe que, se tirarmos a média dos 45 valores da terceira seção da tabela anterior, temos:
M
27450
610 kg
45
µ = =
Uma vez observadas as diferentes médias amostrais, a partir da massa (kg) de uma pequena
população de bisões europeus, imagine, agora, que uma amostra de 100 brasileiros foi selecionada ao
acaso e a média de sua massa corporal (kg) foi obtida. Como seria o formato da distribuição amostral
76
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
para a média se muitas amostras aleatórias contendo 100 indivíduos fossem coletadas? Com mais de
200 milhões de habitantes no Brasil, seria impossível obter cada amostra com n = 100 indivíduos.
É nessa hora que entra em cena o teorema central do limite, fornecendo uma descrição matemática
do que a distribuição amostral se pareceria, caso um pesquisador obtivesse todas as amostras possíveiscom tamanho n a partir da população.
Tenha em mente que, para que o teorema central do limite se aplique, o tamanho da amostra precisa
ser grande. Quão grande? Com n = 2, tal como vimos no exemplo anterior, certamente estamos bem
distante da concepção do termo. Em geral, assume‑se que um n = 30 já pode assim ser considerado.
De tal forma, o teorema central do limite se aplica quando o tamanho das amostras utilizadas para
avaliar uma distribuição amostral seja n ≥ 30.
O teorema central do limite é importante, pois três constatações podem ser observadas:
I – Se o n amostral for grande, então a distribuição amostral da média tenderá à distribuição normal,
independentemente do formato da distribuição de frequências da população.
II – Se o n amostral for grande, então a média das médias que compõem a distribuição amostral será
igual à média da população, a partir da qual as amostras foram obtidas.
III – Se o n amostral for grande, será possível estimar o erro padrão da média, uma medida que
indicará quanta variabilidade haverá, em média, entre uma média amostral e outra. O erro padrão pode
ser calculado conforme a seguinte equação:
M
n
σ
σ =
Sendo:
σM = o erro padrão da média
σ = o desvio padrão populacional
n = o número de observações da amostra
Com base no exemplo dos bisões, sendo o desvio padrão populacional 128,60 kg, tem‑se:
M
n
σ
σ =
M
128,60 128,60
90,94 kg
1,41422
σ = = ≅
77
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
O acesso a toda uma população raramente ocorre e, portanto, dificilmente se tem acesso ao
desvio padrão populacional. Então, como será possível calcular o erro padrão para a média sem o desvio
padrão populacional? Nessas situações, emprega‑se o desvio padrão amostral, uma estimativa
do desvio padrão populacional, para calcular uma estimativa do erro padrão da média (sM).
Observe a equação:
M
s
s
n
=
Sendo:
sM = uma estimativa do erro padrão da média
s = o desvio padrão amostral
n = o número de observações da amostra
Comparemos duas amostras extraídas da tabela anterior: A1 = {540, 680} e A2 = {560, 760}; cujas
médias são, respectivamente, 610 e 660 kg. Os desvios padrões amostrais obtidos serão de 99,00 e
141,42 kg, respectivamente. Substituindo‑se, na equação:
M
s
s
n
=
M1
99 99
s 70,00 kg
1,41422
= = =
M1
141,42 141,42
s 100,00 kg
1,41422
= = =
Quanto menor for a medida do erro padrão da média, mais as médias em uma distribuição amostral
se aproximam. Por consequência, isso nos diz que há menos erro amostral. Assumindo que a
amostra tenha um n grande, logo, a média dessa amostra tenderá a estar mais próxima da média
populacional. Em outras palavras, se o erro padrão da média for pequeno, então a média de uma amostra
provavelmente refletirá com maior precisão a média populacional.
Note, no exemplo anterior, que as médias que compõem a primeira amostra se distanciam
em 140 unidades (680 – 540 = 140), já as médias que compõem a segunda amostra se distanciam em
200 unidades (760 – 560 = 200). A estimativa do erro padrão foi menor na primeira amostra
(sM1 = 70,00 kg) do que na segunda (sM2 = 100,00 kg), indicando que há menos erro amostral na primeira,
ou seja, seus valores se aproximam mais entre si.
78
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Graças ao teorema central do limite, um pesquisador não precisa se preocupar com o formato da
distribuição de frequências da população a partir da qual uma amostra é retirada. Desde que o tamanho
amostral seja grande o suficiente, a distribuição amostral da média tenderá à normalidade, ainda
que a população não o seja. Esta noção é útil, pois a curva normal possui propriedades matemáticas
conhecidas, em relação à porcentagem de casos que estão sob diferentes porções da curva. No próximo
capítulo serão introduzidos os testes de hipóteses, e este conceito permitirá estimar com que frequência
um dado valor pode ocorrer.
5.2 Calculando intervalos de confiança
Em geral, utilizamos informações obtidas a partir de uma amostra para estimar parâmetros de
uma população. Vimos que a estimativa de um parâmetro (como a média populacional) variará entre
diferentes amostras obtidas a partir dessa população. É possível utilizar o erro padrão para ter ideia do
quanto essas estimativas se diferem entre si. Também é possível utilizar essa informação para calcular
limites dentro dos quais se acredita que o parâmetro populacional cairá. Tais limites são chamados
intervalos de confiança.
Domjan, Blesbois e Williams (1998) estudaram a quantidade de sêmen e espermatozoides liberados
por codornas quando estimuladas para cópula. Basicamente, as aves foram colocadas em uma
câmara experimental na presença de fêmeas, em que associaram elementos do ambiente com o ato
de copular. Uma vez condicionadas, as aves foram colocadas na câmara experimental, só que, dessa
vez, em vez de uma fêmea, uma boneca de feltro com cabeça embalsamada de codorna foi colocada
para estimular os machos, e o volume do ejaculado foi coletado para análise. Animais que haviam
sido condicionados e haviam associado o ambiente com o ato da cópula liberaram volumes maiores
de sêmen, contendo mais espermatozoides do que os animais que não haviam sido condicionados à
câmara experimental.
Figura 21 – Boneca de codorna utilizada pelos pesquisadores
para estimular as aves no dia da coleta do ejaculado
79
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Um dos grupos condicionados (n = 7) obteve uma média, de espermatozoides liberados, de 17
milhões. Essa é a média amostral. E quanto seria a média populacional? Não temos acesso a essa
informação. Como não sabemos a média populacional, não podemos inferir que 17 milhões seja um
bom ou mau estimador desse valor. Portanto, em vez de fixar apenas um único valor da amostra, é
possível estimar um intervalo, usando a média amostral como ponto médio e estabelecendo um limite
superior e inferior para esse intervalo.
Assumindo que o valor da média populacional fosse de 15 milhões de espermatozoides
(hipoteticamente), observe a figura seguinte e considere que 50 experimentos independentes foram
realizados, gerando 50 amostras diferentes (com n = 7 cada). Note que as médias amostrais (pontos)
variam entre si e diferem da média populacional (linha pontilhada). Embora a maioria dos intervalos
contenha o valor real da média populacional (eles cruzam a linha pontilhada, indicando que o valor de
15 milhões de espermatozoides está contido entre o limite superior e inferior do intervalo de confiança),
alguns não a possuem (pontos vermelhos, em destaque).
0
6
8
10
12
14
16
18
20
22
24
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
Es
pe
rm
at
oz
ói
de
s (
m
ilh
õe
s)
Amostra
Figura 22 – Intervalos de confiança da contagem de espermatozoides de codornas em 50 amostras diferentes. Assumindo,
hipoteticamente, que a média populacional seja de 15 milhões de espermatozoides (linha pontilhada), a média de cada uma
das 50 amostras diferentes (com n = 7) – pontos em preto – é apresentada com seus respectivos intervalos de confiança
(barras acima e abaixo da média). Das 50 amostras, três (destaque) não contemplam a média populacional em seus intervalos
De certa forma, os intervalos de confiança informam a chance que esses valores possuem em conter
o parâmetro que se procura estimar (nesse caso, a média). Em geral, procuramos por intervalos de
confiança de 95% (e, algumas vezes, intervalos de confiança de 99%): eles são limites calculados de tal
forma que certa porcentagem de amostras contenha o valor real do parâmetro dentro da amplitude
do intervalo. Assim, quando vir um intervalo de confiança de 95% para a média, pense da seguinte
forma: se coletássemos100 amostras independentes, calculássemos a média e, então, obtivéssemos os
intervalos de confiança para a média, em 95 das 100 amostras, os intervalos de confiança conteriam o
valor da média populacional.
Para calcular um intervalo de confiança de 95%, é preciso conhecer os limites dentro dos quais 95%
das médias cairão. Sabemos que, se o n amostral for grande, a distribuição amostral das médias será
normal. Para facilitar a explicação, vamos assumir uma distribuição normal com centro (média) igual
a 0 e desvio padrão igual a 1. A vantagem disso é que podemos utilizar valores tabelados. O intervalo
compreendido entre ‑1 e +1 unidades de desvio padrão seleciona aproximadamente 68,27% da área
80
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
total sob a curva; já o intervalo compreendido entre ‑2 e +2 unidades de desvio padrão corresponde
a 95,45% da área sob a curva; enquanto o intervalo compreendido entre ‑3 e +3 unidades de desvio
padrão, a aproximadamente 99,73% da área sob a curva. Essas são propriedades matemáticas da
distribuição normal.
–3 –2 –1 0
z
1 2 3
68,27%
95,45%
99,73%
Figura 23 – A curva normal padrão e suas porcentagens de área sob a curva. Assumindo‑se média = 0 e desvio padrão = 1,
nota‑se que o intervalo compreendido entre ‑1 e +1 seleciona aproximadamente 68,27% da área total sob a curva; já o intervalo
compreendido entre ‑2 e +2 corresponde a 95,45%; enquanto o intervalo compreendido entre ‑3 e +3, a aproximadamente 99,73%
Qual seria o valor exato de desvios padrões acima e abaixo da média que criariam um intervalo
compreendendo os 95% centrais da área sob a curva? Para responder a essa pergunta, devemos recorrer
a uma tabela de z escores – que corresponde à transformação de qualquer valor de um conjunto de
dados em unidades de uma curva normal padrão.
X M
z
s
−
=
Sendo:
z = o escore padrão
X = um valor da amostra
M = a média amostra
s = o desvio padrão amostral
Uma tabela completa de z escores pode ser encontrada no Apêndice A deste livro‑texto. A seguir,
observe um recorte da tabela z escores para encontrarmos a informação desejada. Procuramos pela
informação correspondente ao valor de z escore necessário para termos preenchidos os 95% centrais
da área sob a curva normal. Conforme esquematiza a figura a seguir, devemos buscar essa informação
na coluna D da tabela mencionada.
81
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
média–z z
D
Figura 24 – Esquematização de área central sob a curva normal. Os valores de z
escores necessários para que se obtenha determinada área (representada pela coluna D
na tabela 21 – excertos do Apêndice A) podem ser consultados em uma tabela de z escores
Tabela 21 – Área sob a curva normal (excerto do Apêndice A)
Área sob a curva normal
z escore
A
Abaixo de +z
acima de ‑z
B
Da média a +z ou a ‑z
C
Acima de +z
abaixo de ‑z
D
Entre ‑z e +z
1,90 97,13% 47,13% 2,87% 94,26%
1,91 97,19% 47,19% 2,81% 94,39%
1,92 97,26% 47,26% 2,74% 94,51%
1,93 97,32% 47,32% 2,68% 94,64%
1,94 97,38% 47,38% 2,62% 94,76%
1,95 97,44% 47,44% 2,56% 94,88%
1,96 97,50% 47,50% 2,50% 95,00%
1,97 97,56% 47,56% 2,44% 95,12%
1,98 97,61% 47,61% 2,39% 95,23%
1,99 97,67% 47,67% 2,33% 95,34%
2,00 97,72% 47,72% 2,28% 95,45%
Nota: o intervalo necessário para que 95% da área central sob a curva normal seja assinalado
está compreendido entre ‑1,96 e +1,96 desvios padrões a partir da média (destaque).
O intervalo de confiança de 95% para a média pode ser facilmente calculado uma vez que o desvio
padrão amostral e a média amostral sejam conhecidos. Entretanto, para o cálculo se utiliza o erro padrão,
porque estamos interessados na variabilidade de uma distribuição amostral de médias e não na
variabilidade das observações dentro de uma amostra. Assim:
s
limite inferior doI C95% M 1,96
n
= − ×
82
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
s
limite superior doI C95% M 1,96
n
= + ×
Sendo:
IC95% = o intervalo de confiança de 95% para a média
M = a média amostra
s = o desvio padrão amostral
n = o número de observações da amostra
Lembrete
Lembre que o desvio padrão amostral (s) dividido pela raiz quadrada de
n é igual ao erro padrão (sM):
M
s
s
n
=
Exemplo de aplicação
Exemplo 18
Assuma que a variável pressão diastólica tenha uma distribuição normal com média populacional (µ)
desconhecida. Em uma amostra de 83 indivíduos, a média amostral foi de 81 mmHg e o erro padrão foi
de 1,21 mmHg. Qual seria o intervalo de confiança de 95% para a média?
Resolução
Temos:
Mlimite inferior do IC95% M 1,96 s= − ×
limite inferior do IC95% 81 1,96 1,21= − ×
limite inferior doI C95% 81 2,3716= −
limite inferior doI C95% 78,63=
Mlimite superior do IC95% M 1,96 s= + ×
83
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
limite superior do IC95% 81 1,96 1,21= + ×
limite superior doI C95% 81 2,3716= +
limite superior doI C95% 83,37=
O intervalo de confiança de 95% para a média varia de 78,63 a 83,37 mmHg. Note que a subtração
foi feita primeiro, pois o intervalo de confiança é reportado do limite inferior para o limite superior.
Logo, o intervalo [78,63; 83,37] contém o valor médio da população com 95% de confiança. De forma
abreviada, poderíamos reportar estes valores como M = 81,00, IC95% [78,63; 83,37].
O procedimento anterior é válido desde que as amostras sejam grandes, uma vez que o teorema
central do limite nos diz que a distribuição amostral das médias será normal. Entretanto, para amostras
pequenas, a distribuição amostral não será necessariamente normal. Nesses casos, emprega‑se a
distribuição t – uma família de distribuições de probabilidade cujos formatos variam à medida que o
tamanho amostral aumenta (quando a amostra for muito grande, tenderá à distribuição normal – veja
na figura a seguir).
Para construir um intervalo de confiança para a média em uma amostra pequena, utiliza‑se o mesmo
princípio apresentado anteriormente, mas, em vez de um valor de z, utiliza‑se um valor de t. Assim,
quais seriam os valores de t que limitariam os 95% centrais da área sob a curva t? Para responder a essa
pergunta, devemos recorrer a uma tabela de valores críticos de t.
Uma tabela t pode ser encontrada no Apêndice B deste livro‑texto. A seguir, observe um recorte dessa
tabela para encontrarmos a informação desejada. Procuramos pela informação correspondente ao valor de t
necessário para termos preenchidos os 95% centrais da área sob a curva t. Conforme esquematiza a figura 26,
devemos buscar essa informação na coluna B.
0–1–2–3 1 2 3
GL = +∞
GL = 1
GL = 2
GL = 5
Figura 25 – Distribuição t. À medida que o n amostral aumenta – observado pelo aumento
dos graus de liberdade (GL) – a distribuição t se assemelha à distribuição normal
84
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
0–t t
B
Figura 26 – Valores críticos da distribuição t. Para uma distribuição t com n – 1 graus de liberdade (GL), os valores críticos de t no
eixo x, que correspondam aos limites inferior e superior de 95% da área sob a curva, podem ser encontrados na coluna B da tabela
seguinte. Se a área assinalada em cinza corresponder a 95% da curva, tem‑se 2,5% à esquerda e 2,5% à direita nas áreas em branco
Tabela 22 – Valores críticos de t (excerto do Apêndice B)
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
1 6,314 12,706 31,821 63,657
2 2,920 4,303 6,965 9,925
3 2,353 3,182 4,541 5,841
4 2,132 2,776 3,747 4,604
5 2,015 2,571 3,365 4,032
6 1,943 2,447 3,143 3,707
7 1,895 2,365 2,998 3,499
8 1,860 2,306 2,896 3,355
9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,7643,169
Nota: a distribuição t varia conforme o grau de liberdade (GL). Para se obter os 95% c entrais da área sob a curva,
deve‑se olhar na coluna B (destaque) e cruzar com a informação do grau de liberdade desejado, pois a soma das
áreas das caudas à esquerda e à direita corresponderão a 5% da área sob a curva (α = 0,05 ou 5%).
Assim:
n 1
s
limite inferior doI C95% M t
n
−= − ×
n 1
s
limite superior doI C95% M t
n
−= + ×
85
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Sendo:
IC95% = o intervalo de confiança de 95% para a média
M = a média amostra
tn – 1 = valor crítico de t com n – 1 graus de liberdade
s = o desvio padrão amostral
n = o número de observações da amostra
Exemplo de aplicação
Exemplo 19
Assumindo que uma amostra de sete codornas condicionadas obteve, em média, 17 milhões de
espermatozoides em seu ejaculado, com desvio padrão de 8,8 milhões de espermatozoides, calcule o
intervalo de confiança de 95% para a média.
Resolução
Temos que, conforme a tabela anterior, para n – 1 graus de liberdade (n = 7, portanto GL = 6), o valor
crítico de t na coluna B seria t = 2,447. Assim:
s
limite inferior doI C95% M 2,447
n
= − ×
8,8
limite inferior doI C95% 1 7,0 2,447
7
= − ×
8,8
limite inferior doI C95% 1 7,0 2,447
2,6458
= − ×
limite inferior doI C95% 1 7,0 8,14 8,86= − =
s
limite superior doI C95% M 2,447
n
= + ×
8,8
limite superior doI C95% 1 7,0 2,447
7
= + ×
8,8
limite superior doI C95% 1 7,0 2,447
2,6458
= + ×
86
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
limite superior doI C95% 1 7,0 8,14 25,14= + =
O intervalo de confiança de 95% para a média varia de 8,86 a 25,14 milhões de espermatozoides.
Note que a subtração foi feita primeiro, pois o intervalo de confiança é reportado do limite inferior para
o limite superior. De forma abreviada, poderíamos reportar a média e o intervalo de confiança como
M = 17,00, IC95% [8,86; 25,14].
Lembrete
O que o intervalo de confiança nos diz? Oficialmente, um intervalo
de confiança de 95% apenas revela que, se repetíssemos o processo de
coleta de dados e de obtenção de novas amostras e calculássemos o
intervalo de confiança para cada amostra, em 95 de 100 repetições, os
intervalos de confiança calculados conteriam o valor da média populacional.
Diante de um intervalo de confiança calculado, não se sabe, contudo, se estamos diante de uma
dessas 95 situações. No dia a dia, as pessoas tendem a interpretar o intervalo de confiança como um
limite dentro do qual o parâmetro populacional pode estar. Também há uma chance de o parâmetro
populacional não cair dentro de um intervalo de confiança calculado (reveja as amostras destacadas em
vermelho na figura 21 e observe a figura seguinte).
0
µ
–2 2–1–3 31
B A
Figura 27 – Distribuição amostral de médias com destaque para dois intervalos de confiança de 95%.
Conforme o teorema central do limite, uma distribuição amostral de médias tenderá à distribuição normal,
sendo o ponto médio da distribuição – a média das médias de todas as amostras que compõem essa
distribuição – igual à média populacional (µ). Duas médias aleatórias – pontos A e B – são destacadas com
seus respectivos intervalos de confiança de 95% demarcados. Note que a média populacional
(centro da distribuição) está compreendida dentro dos limites do intervalo de confiança da média destacada pelo
ponto A, mas não está compreendida dentro dos limites do intervalo de confiança da média destacada pelo ponto B
87
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
5.3 Probabilidade
As conclusões estatísticas envolvem noções de probabilidade, tal como os meteorologistas indicam
que há chance de chover ao longo da semana. As condições podem ser adequadas para a previsão
de que choverá, no entanto, a chuva não é garantida. A probabilidade pode ser explicada em função do
número de eventos específicos para um dado resultado em função do total de eventos possíveis.
( ) número de vezes que um evento A pode ocorrerp A
número total de eventos possíveis
=
Sendo:
p = probabilidade
A = um evento específico
Moedas geralmente são usadas como exemplos simples para ensinar noções de probabilidade. Uma
moeda possui duas faces – cara e coroa –, que são mutuamente exclusivas, ao jogar uma moeda não
é possível obter cara e coroa simultaneamente. Assim, qual seria a chance de obter cara ao jogar uma
moeda? Tendo em vista apenas dois resultados possíveis, observa‑se que:
( ) 1p cara ou 0,50 ou 50%
2
=
A probabilidade pode ser reportada como uma fração; nesse caso, há uma chance em duas de
uma moeda dar cara. É possível, ainda, reportar na forma decimal, afirmando que a probabilidade
de uma moeda dar cara é 0,50. Multiplicando‑se o decimal por 100, a probabilidade pode ser
expressa em porcentagem, e alguém poderia afirmar que, ao jogar uma moeda, há uma chance de
50% de obter cara.
Se lançássemos um dado, qual seria a chance de obtermos um número quatro na face voltada para
cima? Assumindo que um dado possui seis faces, e todas têm a mesma chance de serem obtidas em um
lançamento, para obter o número quatro (evento específico), devemos dividir o número de vezes que
esse resultado pode ocorrer pelo total de eventos possíveis (seis faces):
( ) 1p quatro ou 0,1667 ou1 6,67%
6
=
E se resolvêssemos tirar aleatoriamente uma carta em um baralho, qual seria a chance de ser um ás
de copas? Existe apenas um evento possível em um total de 52 possibilidades, logo:
( ) 1p ás de copas ou 0,0192 ou1 ,92%
52
=
88
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
E qual seria a chance de tirarmos um ás qualquer? Como existem quatro ases em 52 cartas:
( ) 4p ás ou 0,0769 ou 7,69%
52
=
Vejamos agora como se comportam eventos independentes. Ao jogar duas moedas, simultaneamente,
qual a chance de obter duas caras? Ao assumir que os eventos são independentes, entende‑se que o
resultado de uma moeda não impacta no resultado da outra moeda, ou seja, obter cara ou coroa na
primeira moeda não exercerá efeito sobre o resultado da segunda moeda.
Existem quatro cenários possíveis para o lançamento de duas moedas:
• cara na primeira e cara na segunda;
• cara na primeira e coroa na segunda;
• coroa na primeira e cara na segunda;
• coroa na primeira e coroa na segunda.
Logo:
( ) 1p cara, cara ou 0,25 ou 25,00%
4
=
É possível obter o mesmo resultado multiplicando a probabilidade de um evento específico acontecer
pela probabilidade do outro evento específico também ocorrer: a chance de obter cara em uma moeda
é de
1
2
, e a chance de obter cara na outra moeda também é de
1
2
. Assim:
( ) 1 1 1p cara, cara ou 0,25 ou 25,00%
2 2 4
= × =
Se lançássemos dois dados, qual seria a chance de obtermos uma soma igual a sete nas faces voltadas
para cima?
Para que seja obtida uma soma igual a sete, vejamos os cenários possíveis no lançamento de dois dados:
• um no primeiro e seis no segundo;
• dois no primeiro e cinco no segundo;
• três no primeiro e quatro no segundo;
89
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
• quatro no primeiro e três no segundo;
• cinco no primeiro e dois no segundo;
• seis no primeiro e um no segundo.
Havendo seis possibilidades de resultados no primeiro dado e outras seis possibilidades no segundo
dado, temos um total de 36 resultados possíveis, logo:
( ) 6 1p soma sete ou 0,1667 ou1 6,67%
36 6
= =
Vejamos agora como se comportam eventos relacionados. Uma urna contém três bolas brancas e
três bolas pretas. Suponha que sejam sorteadas duas bolas ao acaso, sem reposição. Isso significa que, ao
extrairmos a primeira bola, observamos sua cor e não a devolvemos à urna. O total de bolas disponíveis
na urna reduziuem uma unidade após a extração da primeira, e isso terá impacto sobre o número de
eventos possíveis. Nesse exemplo, qual seria a chance de obter duas bolas pretas?
Existem três bolas pretas em um total de seis bolas na urna, logo, a chance de a primeira bola sorteada
ser preta é de
3 1
6 2
= ; para que a segunda bola também seja preta, devemos atentar que restaram apenas
duas bolas pretas em um total de cinco, ou seja, resultando em uma chance de
2
5
. Assim:
( ) 1 2 2 1p preta, preta ou 0,20 ou 20,00%
2 5 10 5
= × = =
Se a probabilidade de um evento for igual a 1,00 – ou expressa em porcentagem (100%) –, isso
significa que determinado resultado é uma certeza. Nenhum evento possível pode possuir uma
probabilidade maior que 1,00; e a soma das probabilidades de todos os eventos possíveis será sempre
igual a 1,00. De forma inversa, é possível concluir que a probabilidade de um evento ocorrer nunca
poderá ser menor que zero (0%) – uma probabilidade zero indica que um resultado não pode ocorrer.
Assim, verifica‑se que:
( )0,00 p A 1,00≤ ≤
Noções de probabilidade são muito importantes quando trabalhamos com a curva normal. Por exemplo,
se uma variável apresentar perfil de distribuição normal e um caso for selecionado aleatoriamente a
partir da população, qual a chance desse caso cair dentro de um determinado intervalo da curva (por
exemplo, entre ‑1 e +1 desvios padrões a partir da média populacional)? Como vimos na figura 23, a
área sob uma curva normal compreendida entre ‑1 e +1 desvios padrões a partir da média corresponde
a aproximadamente 68,27% do total da curva.
Os estatísticos usam probabilidade para avaliar se um determinado resultado ou evento será comum
ou raro. Por comum, deduz‑se que certo resultado ocorra frequentemente, ou seja, ocorrerá em alguma
90
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
região próxima ao centro de uma distribuição normal. Tipicamente, algo que tenha 95% de chance de
ocorrer é considerado comum. Um resultado raro, por outro lado, é aquele que tem uma chance
pequena de ocorrer, ou seja, estará mais distante do centro da distribuição, em alguma de suas caudas (à
esquerda ou à direita). Usualmente, os estatísticos consideram um evento raro aquele que tenha menos
de 5% de chance de ocorrer. Escrito em termos de probabilidade, se p < 0,05, em geral, esse evento é
considerado raro.
Considerando que uma variável numérica qualquer assuma um perfil de distribuição normal na
população, qual a probabilidade de um evento aleatório cair acima de dois desvios padrões da média?
média z
C
Figura 28 – Esquematização de área sob a curva normal à direita de um z escore.
Os valores de área sob a curva à direita de um z escore (representada pela
coluna C na tabela 21) podem ser consultados numa tabela de z escores
Ao consultarmos uma tabela de z escores (Apêndice A), veremos que, para um z escore igual a 2,00, a
área à direita da curva (coluna C) corresponde a 2,28% do total da curva. Logo, a chance de um evento
aleatório cair acima de dois desvios padrões da média é considerada rara, com p = 0,0228.
6 TESTES DE HIPÓTESES PARA UMA E DUAS AMOSTRAS
6.1 Introdução aos testes de hipóteses
Na definição de inferência estatística, vimos que as informações obtidas em uma amostra podem ser
utilizadas para obter uma conclusão geral acerca da população. A transição entre a estatística descritiva
e a estatística inferencial começa com a lógica que os estatísticos utilizam para tomada de decisão, um
processo chamado testes de hipóteses.
As etapas de um teste de hipóteses se assemelham ao preparo de um bolo. Antes de colocar a massa
para assar, você precisa obter os ingredientes, misturá‑los na ordem adequada, pré‑aquecer o forno etc.
Da mesma forma, existe uma ordem nas etapas para a condução de um teste de hipóteses.
Uma hipótese é uma predição a partir de uma teoria, ou seja, uma explicação proposta para os fatos
observados. Por exemplo, um dia, a observação de que pessoas que fumavam desenvolviam câncer de
91
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
pulmão com frequência mais elevada do que não fumantes levou à hipótese de que fumar causaria
câncer de pulmão (hoje essa hipótese é considerada fato).
Vejamos dez conceitos importantes acerca de testes de hipóteses:
I – Uma hipótese é uma predição a partir da população, não da amostra. Isso porque um pesquisador
deseja estender sua conclusão para o todo e não apenas para a amostra específica à qual tem acesso.
II – Trabalha‑se com o modelo de duas hipóteses – uma hipótese nula, H0, e outra, chamada
hipótese alternativa, Ha.
III – As duas hipóteses precisam contemplar, juntas, todos os resultados possíveis – se alguém formulasse
duas hipóteses dizendo que (1) “todas as flores do mundo são vermelhas” e (2) “todas as flores do mundo
são brancas”, essas duas hipóteses não contemplariam todos os resultados possíveis, pois também existem
flores de outras cores. Contudo, se alguém dissesse que (1) “todas as flores são brancas” e (2) “nem todas
as flores são brancas”, então as duas hipóteses cobririam todos os eventos possíveis.
IV – As duas hipóteses precisam ser mutuamente exclusivas, o que significa que apenas uma hipótese
pode ser correta em um dado momento.
V – A hipótese nula sempre deverá afirmar que a variável independente não exerce efeito sobre a
variável dependente. Por exemplo, se um pesquisador está avaliando o efeito de um dado tratamento
para curar uma doença, a hipótese nula deverá afirmar que aquele tratamento não exerce efeito de cura.
Em outras palavras, esse tratamento teria impacto zero (nulo) sobre a cura.
VI – A hipótese alternativa é aquela que os pesquisadores acreditam estar certa, pois ela afirma que
a variável independente exerce certo efeito sobre a variável dependente. Para o exemplo do parágrafo
anterior, seria dito que o tratamento exerce algum efeito de cura. Note que a hipótese alternativa não
estabelece como será esse efeito, mas seguramente será diferente de zero.
VII – Uma hipótese nula, por ser uma hipótese negativa, não pode ser provada. Suponha que um
adulto deseje provar para uma criança que não existem monstros embaixo da cama. Não importa
quantas evidências ele ofereça, a criança sempre contra‑argumentará dizendo que o adulto não olhou
direito ou que os monstros ouviram seus passos e se esconderam. Uma negação não pode ser provada.
VIII – Entretanto, uma negação pode ser refutada/rejeitada – basta apenas um exemplo. Se uma
criança conseguir capturar um monstro embaixo da cama, um adulto não poderá mais afirmar que não
existem monstros embaixo da cama. Se um experimento não se der conforme postula a hipótese nula,
um pesquisador a rejeitará e, então, poderá aceitar a hipótese alternativa.
IX – Por serem mutuamente exclusivas, caso a hipótese nula seja rejeitada, o pesquisador aceitará
a hipótese alternativa. Como um pesquisador geralmente acredita que a hipótese alternativa seja
verdadeira, o objetivo de um estudo quase sempre é rejeitar a hipótese nula.
92
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
X – Entretanto, se um pesquisador falhar em refutar a hipótese nula, não se pode afirmar que a
hipótese nula seja verdadeira. Lembre‑se de que uma negação não pode ser provada. O melhor que o
pesquisador poderá afirmar é que ele não obteve evidências suficientes para rejeitar a hipótese nula.
Em analogia a um veredito jurídico, dizer que não há evidências que permitam refutar a hipótese
nula seria como declarar que o réu não é culpado; não ser culpado não quer dizer que o réu seja
inocente, apenas não houve evidências suficientes para que o juiz ou júri o considerasse culpado.
O aprendizado para completar um teste de hipóteses é semelhante ao processo de aprender a
cozinhar – o melhor a fazer é seguir uma receita. Vejamos umareceita de seis passos para condução de
um teste de hipóteses:
I – Escolher o teste estatístico adequado.
II – Verificar os pressupostos (ou pré‑requisitos) do teste estatístico escolhido.
III – Listar as hipóteses nula e alternativa.
IV – Encontrar o valor crítico da estatística que determine quando rejeitar a hipótese nula.
V – Calcular o valor do teste estatístico.
VI – Interpretar os resultados e reportar, por extenso, o que eles indicam.
A primeira etapa consiste na escolha do teste estatístico adequado, pois existem centenas de testes
disponíveis. A escolha correta dependerá de alguns fatores, tais como a pergunta de pesquisa, o tipo de estudo
a ser realizado, a escala de medição dos dados, a quantidade e o tipo de variáveis envolvidas na pergunta.
Todos os testes estatísticos possuem pressupostos, condições que precisam ser atendidas antes que o
teste seja efetuado. Se os pressupostos não forem atendidos, os pesquisadores não poderão ter certeza
se os resultados do teste realmente são válidos. Existem dois tipos de pressupostos: robustos e não
robustos. Um pressuposto não robusto precisa ser atendido para dar prosseguimento ao teste; a violação
de um pré‑requisito não robusto indica que o pesquisador deverá parar e reavaliar a escolha do teste
em questão. Um pressuposto robusto poderá ser violado até certo grau, de forma que o teste poderá ser
concluído e interpretado.
Imagine um indivíduo cujo sistema imune esteja abalado (não robusto), tal como um indivíduo em
tratamento quimioterápico ou à base de medicamentos imunossupressores, para que não haja rejeição
de um órgão transplantado. Podemos imaginar que o funcionamento adequado do sistema imune é
um pressuposto do nosso estado de saúde. Esse indivíduo, cuja imunidade está violada, estará mais
propenso a contrair uma infecção, como gripe, caso esteja em um ambiente com certa aglomeração de
pessoas e alguém contaminado espirre no ambiente.
Agora, uma pessoa que esteja com seu sistema imune funcional (robusto) será capaz de lidar com
esse agente infeccioso e, de tal forma, permanecerá saudável. Entretanto, ainda assim, essa pessoa
93
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
poderá contrair a doença caso a exposição ao patógeno se dê em grande quantidade ou por uma via
mais direta – digamos que, em vez de estar em um ambiente em que alguém simplesmente espirrou, o
aerossol formado pelas gotículas de saliva atingiram em cheio o rosto dessa pessoa ou ela compartilhou
sua escova de dentes com alguém gripado. Mesmo que um pressuposto seja robusto, ele poderá ser
violado a depender das condições.
As hipóteses podem ser listadas para testes bicaudais (bilaterais ou não direcionais) ou unicaudais
(unilaterais ou direcionais). Um teste de hipóteses bicaudal não indica se a variável independente exerce
um efeito positivo ou negativo sobre a variável dependente, apenas indica que há algum impacto.
Em geral, testes bilaterais são muito mais empregados do que testes unilaterais. Quando um pesquisador
estabelece, a priori, uma direção para o impacto da variável independente sobre a variável dependente
(se levará a um resultado maior que ou menor que), emprega‑se um teste de hipóteses unicaudal.
A vantagem deste sobre o outro é que a rejeição da hipótese nula se torna mais fácil, facilitando o aceite
da hipótese alternativa.
Para a tomada de decisão, é importante estabelecer um valor crítico – que deve ser alcançado
ou excedido para que se possa rejeitar a hipótese nula – da estatística adotada. Qual será esse valor
crítico dependerá de uma série de fatores, tais como quão disposto o pesquisador está em assumir uma
conclusão errada (em termos probabilísticos) e quantos casos existem em sua amostra.
O cálculo da medida de afastamento da hipótese nula, ou estatística do teste, é a etapa mais direta
das seis apresentadas: basta adicionar os valores certos a uma equação e apertar os botões corretos da
calculadora na ordem certa.
A interpretação dos resultados é a razão pela qual os testes estatísticos são realizados. Na última
etapa, reportam‑se os achados de forma direta. Alguns aspectos devem constar na descrição dos
resultados, tais como:
• uma recapitulação das causas pelas quais o estudo foi realizado;
• a apresentação de medidas‑resumo importantes, como média e desvio padrão;
• uma explicação do que esses resultados significam; e
• possíveis sugestões para pesquisas futuras.
6.2 Teste z para uma amostra
Agora que a lógica geral por trás de um teste de hipóteses foi apresentada, vejamos as etapas
específicas para a condução de um teste z para uma amostra.
O teste z para uma amostra é utilizado para avaliar se a média de uma amostra (M) difere da média
populacional (µ) quando o desvio padrão populacional (σ) for conhecido.
94
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Suponhamos uma máquina automática de encher pacotes de café os enche segundo uma distribuição
normal, com média ajustável e variância igual 400 g2 (desvio padrão populacional = 400 = 20 g).
O valor da média ajustável pode ser fixado em um mostrador, porém a sua localização está em uma
posição pouco acessível. A máquina foi regulada para uma média = 500 g (média populacional).
Desejamos, de meia em meia hora, colher uma amostra de 16 pacotes e verificar se a produção está sob
controle, isto é, se a média realmente é igual a 500 g ou não. Caso a média amostral em uma dessas
coletas seja igual a 492 g, seria necessário parar a produção para verificar o mostrador?
Os pressupostos do teste z para uma amostra são os seguintes:
• Amostras aleatórias: a amostra deve ser obtida aleatoriamente a partir da população. Este
pré‑requisito é robusto, logo, mesmo que a coleta de dados não se dê de forma randômica,
ainda poderemos prosseguir com o teste. Deve‑se, contudo, permanecer atento à conclusão do
teste, pois, ao estender os resultados obtidos na amostra para a população, deve‑se lembrar das
características do processo de amostragem.
• Independência de observações: o segundo pressuposto nos diz que os casos registrados em uma amostra
são independentes, ou seja, não são influenciados por outros casos na mesma amostra. Este pré‑requisito
não é robusto, logo sua violação implica cuidado, pois não devemos prosseguir com o teste escolhido.
• Normalidade: o terceiro pressuposto indica que a variável dependente deverá apresentar distribuição
normal na população. Este pré‑requisito também é robusto, logo, sua violação não implica
necessariamente na anulação do teste, desde que o desvio à normalidade não seja tão grande.
Em nosso exemplo, observamos que amostras de 16 pacotes são coletadas aleatoriamente da linha de
produção, a cada meia hora. Os eventos são independentes, pois o conteúdo de café em um pacote não
influencia no resultado do outro pacote. Conforme o enunciado, sabemos que a máquina automática
preenche os pacotes segundo uma distribuição normal. Logo, todos os pressupostos foram atendidos e
podemos prosseguir para a próxima etapa.
O próximo passo consiste em listar as hipóteses nula e alternativa. Devemos iniciar pela determinação
da hipótese nula, que deve ser sempre uma hipótese negativa. Em seguida, podemos estabelecer a
hipótese alternativa, mutuamente exclusiva à hipótese nula, dizendo seu contrário.
Como o objetivo do experimento proposto é determinar se a média amostral em uma das coletas
pode ser considerada diferente da média populacional (500 g, informação que vai estampada no rótulo
das embalagens) e a hipótese nula deve ser sempre uma hipótese negativa, assumiremos que a média da
amostra não será diferente da média populacional ou, em outras palavras, que essas médias são iguais:
H
0: média amostral (M) = média populacional (µ)
Já a hipótese alternativa deverá ser mutuamente exclusiva à hipótese nula. No caso, assumindo
um teste bicaudal (pois não nosimporta se a média da amostra será maior ou menor que a média
populacional, mas sim se será diferente):
95
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Ha: média amostral (M) ≠ média populacional (µ)
A quarta etapa consiste em encontrar o valor crítico da estatística, que determina quando rejeitar
a hipótese nula. Em qualquer teste de hipóteses, até que se prove o contrário, devemos sempre assumir
que a hipótese nula seja verdadeira. Graças ao teorema central do limite, sabemos que a distribuição
amostral das médias terá como centro a média populacional e essa distribuição será normal.
Sabemos que a distribuição normal possui características importantes, especialmente quanto à
área sob a curva em função de quantos desvios padrões nos deslocamos à esquerda ou à direita do
centro (veja a figura no Apêndice A). Logo, podemos dividir essa área sob a curva em duas partes:
uma região em que os eventos são frequentes e outra em que são raros. Vimos que, quanto mais
próximo do centro, maior a frequência de observações, logo mais comuns serão os eventos. Quanto
mais nos distanciamos do centro, mais os eventos passam a ser raros. Assim, duas constatações
podem ser feitas:
• Se a média de uma amostra cair dentro da área em que os eventos são frequentes, não haverá
razão para rejeitarmos a hipótese nula. A média da amostra será um valor considerado comum, o
que seria esperado se a hipótese nula fosse verdadeira.
• Se a média de uma amostra cair dentro da área em que os eventos são raros (região crítica ou área
de rejeição), então estamos diante da ocorrência de um evento não frequente, incomum. Nessa
situação, conforme a lógica dos testes de hipóteses, a hipótese nula deverá ser rejeitada e será
aceita a hipótese alternativa.
A divisória entre a área em que os eventos são frequentes e aquela em que são raros é conhecida como
valor crítico do teste. O valor crítico de z (zcrit) dependerá de quão pequena o pesquisador considerar a
área de rejeição. Por convenção, assume‑se que um evento comum é aquele que ocorre 95% das vezes,
logo, se algo ocorre apenas 5% das vezes ou menos, será considerado raro. Esses valores são arbitrários
e deverão ser estabelecidos pelo pesquisador, a priori.
Sendo os 95% da área mais próxima ao centro considerados a região em que os eventos são
frequentes, teremos uma área de rejeição de 5%, que corresponderá a 2,5% da área dispostos na cauda
à esquerda e a 2,5% dispostos na cauda à direita. Por essa razão, um teste é considerado bicaudal – a
área crítica se localiza em ambas as laterais (caudas) da distribuição de frequências. Um teste unicaudal
assumirá uma área crítica em apenas uma das laterais da distribuição.
Lembrete
Vimos que os valores de z escores de ±1,96 limitam os 95% centrais
de uma distribuição normal padrão. Agora, eles serão usados como valores
críticos para o teste z para uma amostra. Outros valores críticos de z podem
ser obtidos conforme necessário no Apêndice A.
96
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Se um valor de z escore calculado (na próxima etapa) for menor ou igual ao valor de ‑zcrit ou maior
ou igual ao valor de +zcrit, então a hipótese nula de um teste bicaudal deverá ser rejeitada. Escrito de
forma matemática, se zcalc ≤ ‑zcrit ou se zcalc ≥ +zcrit, rejeita‑se H0 e aceita‑se Ha. Já se for maior que o
valor de ‑zcrit e menor que o valor de +zcrit, então não haverá evidências para rejeitar a hipótese nula.
Escrito de forma matemática, se ‑zcrit < zcalc < +zcrit, aceita‑se H0.
O tamanho da região crítica, expresso em termos de probabilidade, é conhecido como nível de
significância (α) e consiste na probabilidade de um resultado cair na região crítica e a hipótese nula ser
rejeitada, mesmo quando a hipótese nula for verdadeira. Os valores críticos que dividem a área em que
os eventos são mais frequentes da área em que são mais raros dependem se o pesquisador realizará um
teste unicaudal ou bicaudal e qual será o nível de significância (α) adotado.
Para o nosso exemplo, assumindo um teste de hipóteses bicaudal e um nível de significância
(α) = 0,05 ou 5%, quais seriam os valores críticos de z? Conforme mencionado anteriormente, os
valores de zcrit seriam iguais a ±1,96 e podem ser consultados no Apêndice A deste livro‑texto.
Devemos agora prosseguir com o cálculo da estatística do teste. A estatística z pode ser calculada
conforme a seguinte equação:
M
M
z
−µ
=
σ
Sendo:
z = um valor de z escore
M = a média amostral
µ = a média populacional
σM = o erro padrão da média
Para o nosso exemplo, temos que:
M = 492 g
µ = 500 g
σM =
20 20
4N 16
σ
= = = 5 g
97
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Aplicando‑os na equação:
M
M
z
−µ
=
σ
492 500 8
z 1,6
5 5
− −
= = = −
Para interpretar os resultados, vejamos se a hipótese nula foi rejeitada. Conforme destacado
anteriormente, se zcalc ≤ ‑zcrit ou se zcalc ≥ +zcrit, rejeita‑se H0 e se aceita Ha, caso seja empregado um
teste bicaudal.
Para o nosso exemplo, temos que zcalc = ‑1,6. Para um α = 0,05 em um teste z bicaudal, zcrit = ±1,96. Assim:
‑zcrit < zcalc < +zcrit
‑1,96 < ‑1,6 < +1,96
Portanto, aceita‑se H0 como verdadeira, pois os dados não forneceram evidências suficientes para
rejeitá‑la. Conclui‑se que a média amostral de 492 g de café não pôde ser considerada significativamente
diferente da média populacional de 500 g.
Estabelecida a conclusão, além da interpretação, convém reportar algumas informações adicionais,
como o valor do teste estatístico utilizado, o valor do nível de significância (α) adotado e se a hipótese
nula foi ou não rejeitada, indicando‑se a chance de erro (p ou p‑valor) obtida.
Quando se realiza um teste de hipóteses, o p‑valor pode ser utilizado para determinar a significância
dos seus achados. A chance de erro é a probabilidade de obter o valor observado (estatística do teste,
no caso, zcal). É importante ter a noção de que, quanto menor o p‑valor (p ≤ α), maior será a evidência
contra a hipótese nula, portanto, seria mais prudente rejeitá‑la (se p = 0,01 e α = 0,05, a probabilidade
de a hipótese nula ser verdadeira será de 1%, menos do que o nível de significância adotado). Um valor
alto da chance de erro (p > α) indica uma fraca evidência contra a hipótese nula, assim, seria mais
prudente aceitá‑la como verdadeira (se p = 0,10 e α = 0,05, a probabilidade de a hipótese nula ser
verdadeira será de 10%, mais do que o nível de significância adotado).
Observação
Se p > α, os dados não fornecem evidências para rejeitar H0, logo
aceitamos H0 como verdadeira; se p ≤ α, os dados fornecem evidências
para rejeitar H0, logo, aceitamos Ha.
98
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Associando o valor da estatística do teste (zcal, no caso) à chance de erro (p), nota‑se uma relação
importante em um teste bicaudal:
• se ‑zcrit < zcalc < +zcrit, ou, dito em termos mais diretos, |zcalc| < |zcrit|, p > α, logo, não existem
evidências para rejeitar H0, devendo aceitá‑la como verdadeira;
• se zcalc ≤ ‑zcrit ou se zcalc ≥ +zcrit, ou melhor, se |zcalc| ≥ |zcrit|, p ≤ α, logo, os dados fornecem evidências
para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Nessa avaliação, uma amostra de 16 pacotes de café foi aleatoriamente selecionada a partir da linha
de produção e suas massas foram avaliadas, a fim de verificar se a regulagem da empacotadora estava
em acordo com as especificações preestabelecidas.
Sendo a média populacional µ = 500 g e o desvio padrão populacional σ = 20 g, um teste z
para uma amostra bilateral foi empregado, visando avaliar se a diferença entre a média amostral
e a média populacional seria considerada significativamente distinta a um nível de significância
α = 0,05. A média amostral obtidaM = 492 g não pôde ser considerada diferente da média
populacional (z(n = 16) = – 1,6, p = 0,1096). Conclui‑se que não é necessário interromper a produção,
visto que o equipamento não gerou uma amostra com média diferente das especificações.
Note que o valor da chance de erro (p), em testes bicaudais, corresponde à soma da área sob a curva
normal à esquerda e à direita do módulo do valor de zcalc (coluna C do Apêndice A – para z = 1,6, valor
da coluna C = 5,48%; dobrando‑se esse valor, obtemos p = 0,1096).
Veja que:
|zcalc| < |zcrit|, logo p > α
|‑1,6| < |1,96|, logo p > 0,05
Se p > α (p = 0,1096), aceita‑se H0 como verdadeira.
Exemplo de aplicação
Exemplo 20
O departamento de saúde de uma cidade deseja determinar se a média de coliformes fecais
por unidade de volume de água em uma lagoa está dentro dos níveis considerados saudáveis
(µ = 200 unidades formadoras de colônia/unidade de volume, σ = 20 unidades formadoras de
colônia/unidade de volume). Considere que foram coletadas, aleatoriamente, 10 amostras de água
da lagoa, e se obteve os seguintes valores de unidades formadoras de colônia (UFC):
175 190 215 198 184
207 210 193 196 180
99
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Com base nesses dados, considerando α = 0,01 e assumindo que a distribuição respeita a normalidade,
compare a média amostral com a média populacional.
Resolução
Desse modo, sendo o desvio padrão populacional conhecido, podemos empregar o teste z para uma
amostra. Em relação aos pressupostos do teste, observamos que 10 amostras de água foram coletadas
aleatoriamente a partir de uma lagoa, com cada coleta independente da outra, e o enunciado indica
que a distribuição respeita a normalidade. Sem haver violação dos pressupostos, podemos proceder
com o teste.
Quanto às hipóteses, observe que o desejo é avaliar se a média de coliformes fecais por unidade
de volume de água está dentro dos níveis considerados saudáveis (µ = 200 unidades formadoras de
colônia/unidade de volume). Se a média for menor ou igual a 200 unidades formadoras de colônia/unidade
de volume, estamos dentro dos níveis considerados saudáveis; porém, se esse valor estiver acima de 200,
os níveis serão considerados impróprios para o consumo humano. Assim, o delineamento do objetivo
sugere um teste de hipóteses unicaudal com as seguintes hipóteses:
H0: média amostral (M) ≤ média populacional (µ)
Ha: média amostral (M) > média populacional (µ)
Segundo o enunciado, o nível de significância adotado é α = 0,01. Sendo o teste unilateral à direita,
deseja‑se saber o valor crítico de z que corresponda a uma área crítica de 1% à direita. Conforme o
Apêndice A, em sua coluna C, observamos que para uma área de 1% à direita, zcrit = 2,33.
Podemos, enfim, prosseguir com a estatística do teste. Com base nos valores apresentados,
temos que:
M = 194,8 unidades formadoras de colônia/unidade de volume
µ = 200 unidades formadoras de colônia/unidade de volume
σM =
20 20
3,1623N 10
σ
= = = 6,3245 unidades formadoras de colônia/unidade de volume
Aplicando‑os na equação:
M
M
z
−µ
=
σ
194,8 200 5,2
z 0,8222 0,82
6,3245 6,3245
− −
= = = − ≅−
100
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Temos que zcalc = ‑0,82. Para um α = 0,01 em um teste z unicaudal, zcrit = 2,33. Assim:
zcalc < zcrit
‑0,82 < 2,33
Se zcalc < zcrit, logo p > α; assim, os dados não fornecem evidências para rejeitar H0. Para estimar o
valor de p, podemos recorrer ao Apêndice A e procurar pela área à direita de ‑0,82 (no caso, coluna A
– veja figura no Apêndice). Nota‑se que a área à direita de z = ‑0,82 corresponde a 79,39% do total da
curva, portanto, p‑valor = 0,7939.
O que esse valor nos indica? Que a média amostral de 194,8 unidades formadoras de colônia/unidade
de volume tem 79,39% de chance de ser menor ou igual à média populacional de 200 unidades formadoras de
colônia/unidade de volume. Como p > α, aceita‑se H0.
Resta‑nos, agora, reportar a conclusão final por extenso:
Nessa avaliação, uma amostra com 10 coletas de água foi realizada a partir de uma lagoa, e
seus valores de unidades formadoras de colônia/unidade de volume foram determinados para
verificar se os níveis de coliformes fecais estavam dentro dos limites considerados saudáveis. Sendo
a média populacional µ = 200 unidades formadoras de colônia/unidade de volume e o desvio padrão
populacional σ = 20 unidades formadoras de colônia/unidade de volume, um teste z para uma amostra
unilateral foi empregado, visando avaliar se a média amostral seria significativamente maior que a
média populacional, a um nível de significância α = 0,01. A média amostral obtida M = 194,8 unidades
formadoras de colônia/unidade de volume não pôde ser considerada maior que a média populacional
(z(n = 10) = ‑0,82, p = 0,7939). Conclui‑se que o nível de coliformes fecais por unidade de volume de água
na lagoa está dentro dos níveis considerados saudáveis.
Todo teste de hipóteses tem sua conclusão sujeita a erro. O erro em afirmar que existe
uma diferença quando ela efetivamente não existe – ou seja, rejeitar H0 quando se deveria
aceitá‑la – é chamado de erro do tipo I e tem uma probabilidade de ocorrer igual ao α adotado.
No entanto, também é possível cometer o erro de aceitar H0 quando não se deveria, isto é,
afirmar uma igualdade quando o correto seria afirmar uma diferença. Chamamos esse erro
de erro do tipo II ou β, cuja probabilidade, em geral, é difícil de estimar, pois é necessário
conhecer o valor do parâmetro na população amostrada. Como a probabilidade complementar
desse erro (1 – β) representa a probabilidade em afirmar corretamente que existe uma diferença
quando ela realmente existe, diz‑se que 1 – β é o poder do teste estatístico em detectar uma
diferença real. Não serão abordados cálculos de β e poder do teste, mas esses conceitos podem
ser utilizados para estimar o tamanho amostral necessário para atingir determinado objetivo
ou para determinar, após a realização de uma pesquisa, que poder a amostra estudada tem em
detectar uma diferença estipulada pelo pesquisador.
101
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Saiba mais
Para mais informações sobre erros do tipo I e do tipo II, consulte:
HOEL, P. G. Introduction to Mathematical Statistics. 3 ed. New York:
John Wiley & Sons Inc, 1966.
6.3 Teste t para uma amostra
O teste t para uma amostra é utilizado para comparar a média de uma amostra a um valor específico,
como a média populacional. Em suma, é equivalente ao teste z para uma amostra, entretanto, é mais
utilizado, pois não demanda o conhecimento do desvio padrão populacional (σ). Em vez disso, o teste t
para uma amostra emprega o desvio padrão amostral (s).
Suponhamos que, durante uma semana, 13 bebês nasceram em determinada maternidade. Parte do
procedimento padrão consiste em medir o comprimento dos recém‑nascidos. Com base nos dados a
seguir, dispostos em cm, a um nível de significância de 5%, os dados fornecem evidências para afirmar
que o comprimento médio dessa amostra é diferente de 50 cm?
49 50 45 51 47 49 48 54 53 55 45 50 48
A primeira etapa de um teste de hipóteses é a seleção do teste adequado. Como o objetivo é comparar
uma média amostral a certo valor (como a média populacional), devemos considerar o teste z para uma
amostra ou o teste t para uma amostra. Entretanto, por não dispormos do desvio padrão populacional,
nesse caso, devemos escolher o teste t para uma amostra.
Os pressupostos do teste t para uma amostra são os mesmos do teste z para uma amostra:
amostras devem ser aleatórias, deve haver independência de observações e os dados devem apresentar
distribuição normal.
Assim, os 13 bebês da suposição anterior, que compõem a amostra, representam uma amostra
aleatória entre os nascimentosregistrados na maternidade. Há independência entre as observações,
pois não há informações que indiquem que os casos exerçam influência uns sobre os outros. A variável
dependente (comprimento) apresenta perfil de distribuição normal na população, portanto, assumiremos
que os dados seguem esse perfil.
Observação
Existem testes de hipóteses chamados testes de normalidade, que visam
avaliar se os valores contidos em determinada amostra apresentam perfil
semelhante à curva normal. Alguns exemplos são os testes de Shapiro‑Wilk,
102
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
d’Agostino‑Pearson, Anderson‑Darling e Kolgomorov‑Smirnov. Nesses
testes, temos H0: distribuição dos dados = distribuição normal; Ha:
distribuição dos dados ≠ distribuição normal.
Para esse conjunto de dados, o teste de normalidade de Shapiro‑Wilk
teve chance de erro p = 0,6842. Para um nível de significância α = 0,05,
podemos concluir que p > α, portanto, se aceita H0 – os dados apresentam
distribuição normal.
Saiba mais
Para mais informações sobre os testes de normalidade, leia:
FÁVERO, L. P.; BELFIORE, P. Manual de análise de dados. Rio de Janeiro:
Elsevier, 2017.
FIELD, A. Discovering statistics using IBM SPSS statistics. 4. ed. Thousand
Oaks: Sage, 2013.
Na figura a seguir, a inspeção visual do box‑plot indica se tratar de um conjunto de dados relativamente
simétrico, sem outliers. Ao lado, vemos um gráfico quantil‑quantil (Q‑Q plot), muito útil para ter uma ideia
do perfil de distribuição de um conjunto de dados numéricos. Quanto mais os pontos se aproximarem da
linha de tendência central, mais tenderão à normalidade. Note que nenhuma observação (cada ponto no
Q‑Q plot) ultrapassou o limite de ±2,0 desvios padrões (eixo vertical) em função da média.
40 40 45 50 55 60
–2.0
–1.5
–1.0
–0.5
0.0
0.5
1.0
1.5
2.0
45
50
55
60
Co
m
pr
im
en
to
(c
m
)
Recém‑nascidosA) B) Valores observados
N
or
m
al
e
sp
er
ad
a
Figura 29 – Box‑plot e Q‑Q plot da variável comprimento (cm) de uma amostra de recém‑nascidos (n = 13).
O box‑plot indica se tratar de conjunto de dados relativamente simétrico, sem outliers (A). O Q‑Q plot indica
que os dados do conjunto apresentam distribuição que tende à normalidade (pontos se aproximam da linha de
tendência central), sendo que nenhuma observação ultrapassou o limite de ±2,0 desvio padrão em função da média (B)
103
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
A próxima etapa consiste na descrição das hipóteses nula e alternativa. Antes de defini‑las, deve‑se
estipular se estamos diante de um teste unicaudal ou bicaudal. Testes bicaudais são comumente
empregados e são mais conservadores, no sentido de que tornam mais difícil a rejeição de H0. De tal
forma, um teste bicaudal é a escolha padrão, em geral – devendo ser empregado quando um pesquisador
deseja avaliar se existe alguma diferença entre a média amostral e o valor a ser comparado, para qualquer
uma das direções.
Um teste unicaudal é utilizado quando um pesquisador já possui uma dada predição a partir da
direção dos resultados antes da coleta de dados. Em outras palavras, deseja avaliar se a média amostral
é maior que ou menor que determinado valor a ser comparado, ou seja, objetiva‑se apenas uma das
laterais da distribuição.
Dada a hipótese anterior, uma vez que se deseja avaliar se o comprimento médio dessa amostra é
diferente de 50 cm, pressupõe‑se o uso de um teste bicaudal. Assim, temos:
H0: média amostral = 50 cm
Ha: média amostral ≠ 50 cm
Em seguida, devemos estimar o valor crítico do teste. Lembre‑se que, ao utilizar um teste t,
utilizaremos uma distribuição t. A interpretação do valor crítico é a mesma que vimos para o teste z
para uma amostra, entretanto, para obter esse valor na tabela de valores críticos de t, devemos levar em
conta as seguintes observações:
• O teste é unicaudal ou bicaudal?
• Qual é o nível de significância (α) adotado?
• Qual é o tamanho da amostra (n)?
Para os dados do nosso exemplo, temos que o teste em questão é bicaudal; segundo o enunciado, o
nível de significância adotado é α = 0,05 ou 5% e; o tamanho da amostra é de 13 bebês.
Com base nesses valores, é possível recorrer a uma tabela t (Apêndice B) e cruzar os graus de liberdade
(n – 1) com o nível de significância adotado.
Sendo GL = n – 1 = 12 e α bicaudal = 0,05, observamos que o valor crítico de t para essa estatística
será igual a 2,179.
tcrit = 2,179
104
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Tabela 23 – Valores críticos de t (excerto do Apêndice B)
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
1 6,314 12,706 31,821 63,657
2 2,920 4,303 6,965 9,925
3 2,353 3,182 4,541 5,841
4 2,132 2,776 3,747 4,604
5 2,015 2,571 3,365 4,032
6 1,943 2,447 3,143 3,707
7 1,895 2,365 2,998 3,499
8 1,860 2,306 2,896 3,355
9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169
11 1,796 2,201 2,718 3,106
12 1,782 2,179 2,681 3,055
Nota: a distribuição t varia conforme o grau de liberdade (GL). Como o nível de significância
adotado no nosso exemplo é α = 0,05 bicaudal e o conjunto apresenta 12 graus de liberdade,
temos que o valor crítico de t para este cálculo será de 2,179 (conforme destaque)
Para um teste bicaudal, a tomada de decisão se dará:
• se ‑tcrit < tcalc < +tcrit, não há evidências para rejeitar H0, devendo aceitá‑la como verdadeira;
• se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Calcula‑se o valor da estatística t, conforme a equação a seguir:
M
M
t
s
−µ
=
Sendo:
t = o valor da estatística t
M = a média amostral
µ = a média populacional (ou valor de referência)
sM = a estimativa do erro padrão da média
105
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Com base nos 13 valores descritos no início de nossa suposição, podemos calcular a média e o desvio
padrão amostrais:
Média M = 49,54 cm e desvio padrão s = 3,13 cm.
Em seguida, substituindo‑se, na equação do teste t para uma amostra, temos:
M = 49,54 cm
µ = 50 cm
sM =
s 3,13 3,13
3,6056n 13
= = = 0,8681 cm
M
M
t
s
−µ
=
49,54 50 0,46
t 0,530
0,8681 0,8681
− −
= = ≅ −
Vamos agora à interpretação do resultado do teste. Em primeiro lugar, a hipótese nula foi rejeitada?
Temos que tcalc = ‑0,530 e tcrit = 2,179. Como o teste é bicaudal, devemos observar que, se ‑tcrit < tcalc < +tcrit,
não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit,
há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Nesse caso, estamos diante da primeira situação, pois:
‑tcrit < tcalc < +tcrit
–2,179 < –0,530 < 2,179
Portanto, não há evidências para rejeitar H0 e devemos aceitá‑la como verdadeira.
Assim, quanto será a chance de erro (p)? Ela é maior ou menor que o nível de significância (α) adotado?
A interpretação segue o mesmo raciocínio apresentado para o teste z para uma amostra. Como:
|tcalc| < |tcrit|, logo p > α
|‑0,530| < |2,179|, logo p > 0,05
Se p > 0,05, aceita‑se H0 como verdadeira. Mas qual será o valor exato da chance de erro (p)?
Para obter o valor exato, teríamos duas abordagens: calcular a integral da área sob a curva além
106
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
do valor de tcalc (ambas as caudas) ou utilizar um software de análise (para o exemplo em questão,
via software, p = 0,6042).
Ambas as opções demandam conhecimentos específicos que não serão abordados. Note que,
independentemente de estar em posse do valor exato da chance de erro (p) ou não, nossa conclusão
nãose altera: p > 0,05. Compare os Apêndices A e B e note como a nossa tabela t é reduzida se
comparada à tabela z. Isso se deve ao fato de, nessa tabela t, apresentarmos apenas alguns valores
de probabilidade (α – no topo das colunas), que, em geral, são necessários para obtenção dos
valores críticos.
Observação
Para um teste t bicaudal, temos que, se ‑tcrit < tcalc < +tcrit, ou, dito em termos
mais diretos, |tcalc| < |tcrit|, p > α, logo, não existem evidências para rejeitar
H0, devendo aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, ou
melhor, |tcalc| ≥ |tcrit|, p ≤ α, logo, os dados fornecem evidências para rejeitar H0,
devendo‑se aceitar Ha como verdadeira.
Uma vez interpretado o resultado, podemos prosseguir para sua descrição por extenso. Devemos
destacar alguns elementos importantes na resposta, tais como:
I – o teste utilizado;
II – o número de elementos da amostra;
III – o valor calculado do teste estatístico acompanhado dos graus de liberdade;
IV – o nível de significância (α) adotado;
V – se H0 foi rejeitada ou não.
Assim, vejamos como concluiríamos nosso caso: uma amostra contendo 13 recém‑nascidos foi
avaliada em uma maternidade, e um teste t para uma amostra bilateral foi empregado, visando avaliar se o
comprimento médio amostral seria diferente de 50 cm, a um nível de significância de 5%. A média obtida
M = 49,54 cm, com desvio padrão s = 3,13 cm, não pôde ser considerada diferente de 50 cm (t(12) = ‑0,530,
p > 0,05). Conclui‑se que o comprimento médio desses bebês não foi diferente do valor esperado.
Exemplo de aplicação
Exemplo 21
Uma empresa diz que o volume médio de suas garrafas de refrigerante é de 1500 mL (1,5 L). Para
que ela não corra o risco de sofrer punições do órgão fiscalizador, seu departamento de controle de
107
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
qualidade realiza testes frequentes com amostras retiradas da linha de produção. Sabendo‑se que a
empresa só seria autuada caso as garrafas apresentassem volume inferior a 1500 mL, determine se
a empresa corre esse risco por não cumprir a informação divulgada nas embalagens de seus produtos.
Para seus cálculos, observe a amostra a seguir e adote um nível de significância α = 0,025.
Volumes medidos (mL)
1508 1518 1492 1505 1515
1498 1496 1505 1510 1507
Resolução
Assumindo que a distribuição amostral seja normal, a primeira etapa de um teste de hipóteses é
a seleção do teste adequado. Como o objetivo é comparar uma média amostral a certo valor (como a
média populacional), devemos considerar o teste z para uma amostra ou o teste t para uma amostra.
Entretanto, por não dispormos do desvio padrão populacional, neste caso, devemos escolher o teste t
para uma amostra.
As dez garrafas que compõem a amostra representam uma amostra aleatória retirada da linha de
produção. Há independência entre as observações, pois não há informações que indiquem que os casos
da amostra exerçam influência uns sobre os outros. A variável dependente (volume em mL) apresenta
perfil de distribuição normal na população, conforme relatado no enunciado, portanto, assumiremos
que os dados seguem esse perfil. Podemos inspecionar o box‑plot e o Q‑Q plot dos dados.
1485
1490
1495
1500
1505
1510
1515
1520
1485 1495 1505 1515 1525
–2.0
–1.5
–1.0
–0.5
0.0
0.5
1.0
1.5
2.0
Vo
lu
m
e
(m
l)
Refrigerante
A) B)
Valores observados
N
or
m
al
e
sp
er
ad
a
Figura 30 – Box‑plot e Q‑Q plot da variável volume (mL) de uma amostra de refrigerantes (n = 10).
O box‑plot indica se tratar de conjunto de dados relativamente simétrico, sem outliers (A). O Q‑Q plot
indica que os dados do conjunto apresentam distribuição que tende à normalidade (pontos se aproximam
da linha de tendência central), sendo que nenhuma observação ultrapassou o limite de ±2,0
desvios padrões em função da média (B)
108
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Quanto às hipóteses, observe que o desejo é avaliar se a média do volume amostral condiz com
a informação do rótulo da embalagem (1500 mL). Sabendo que a empresa só seria autuada caso as
garrafas apresentassem volume inferior a 1500 mL, o delineamento do objetivo sugere um teste de
hipóteses unicaudal com as hipóteses de H0: média amostral ≥ valor de referência (1500 mL); Ha: média
amostral < valor de referência (1500 mL).
Segundo o enunciado, o nível de significância adotado é α = 0,025. Sendo o teste unilateral à
esquerda, deseja‑se saber um valor crítico de t que corresponda a uma área crítica de 2,5% à esquerda.
Conforme a tabela anterior, em sua coluna B, observamos que, para uma área de 2,5% à esquerda, com
9 graus de liberdade (n – 1 = 10 – 1 = 9), tcrit = ‑2,262 (negativo, pois está à esquerda).
Para um teste unilateral à esquerda, a tomada de decisão se dará de modo que, se tcalc > ‑tcrit, não
há evidências para rejeitar H0, devendo aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit, há evidências para
rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Para calcular o valor da estatística t a partir do conjunto de dados, podemos determinar a média
amostral M = 1505,4 mL e o desvio padrão amostral s = 8,20 mL. Substituindo‑se, na equação:
M = 1505,4 mL
µ = 1500 mL
sM =
s 8,20 8,20
3,1623n 10
= = = 2,593 mL
M
M
t
s
−µ
=
1505,4 1500 5,4
t 2,083
2,593 2,593
−
= = ≅
Vamos agora à interpretação do resultado do teste t para uma amostra. Em primeiro lugar, a hipótese
nula foi rejeitada? Note que a média amostral foi maior que a média populacional, que nos dá um indício
importante (pois a empresa só seria autuada se o volume médio dos refrigerantes estivesse abaixo da
informação da embalagem).
Temos que tcalc = 2,083 e tcrit = ‑2,262. Como o teste é unicaudal à esquerda, observamos que:
tcalc > ‑tcrit
2,083 > ‑2,262
Portanto, não há evidências para rejeitar H0, e devemos aceitá‑la como verdadeira. Assim, quanto
será a chance de erro (p)? Ela é maior ou menor que nível de significância (α) adotado?
109
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Para um teste t unilateral à esquerda, temos que, se tcalc > ‑tcrit, p > α; já se tcalc ≤ ‑tcrit, p ≤ α. Como:
tcalc > ‑tcrit, logo p > α
2,083 > ‑2,262, logo p > 0,025
Se p > 0,025, aceita‑se H0 como verdadeira. Como o teste em questão é unilateral à esquerda, para
obter o valor exato da chance de erro (p), teríamos duas abordagens: calcular a integral da área sob a
curva à esquerda do valor de tcalc ou utilizar um software de análise (para o exemplo em questão, via
software, p = 0,9665). Note que, independentemente de estar em posse do valor exato da chance de erro
(p) ou não, nossa conclusão não se altera: p > 0,025.
Resta‑nos, agora, reportar a conclusão final por extenso:
Uma amostra contendo 10 garrafas de refrigerante foi avaliada em uma fábrica, e um teste t para uma
amostra unilateral foi empregado, visando avaliar se o volume médio amostral seria menor que 1500 mL
a um nível de significância de 2,5%. Visto que a empresa só seria autuada caso as garrafas apresentassem
volume inferior à informação presente no rótulo, a média amostral obtida M = 1505, 4 mL, com desvio padrão
s = 8,20 mL, não pôde ser considerada menor que 1500 mL (t(9) = 2,083, p > 0,025). Conclui‑se que o volume
médio das garrafas presentes na amostra não foi menor do que o valor esperado, portanto, a empresa
não corre riscos.
6.4 Teste t para duas amostras independentes
Nos dois últimos tópicos, vimos o teste z e o teste t, ambos para uma amostra. Eles foram os
primeiros testes apresentados porque são bons para introduzir a lógica dos testes de hipóteses. Contudo,
raramente os pesquisadores se perguntam se a média de uma amostra difere da média populacional.
Agora, veremos um teste utilizado para comparar duas amostras. Essa estratégia é bastanteutilizada
porque, classicamente, os experimentos envolvem dois grupos: um grupo experimental e um grupo
controle; algo diferente é feito ou administrado no grupo experimental (mas não no grupo controle), e,
então, os resultados obtidos são comparados para avaliar se existe efeito da variável independente
(algo diferente feito ou administrado) sobre a variável dependente que se registra.
Existem dois tipos de testes t que envolvem duas amostras: teste t para amostras independentes e
para amostras dependentes (pareadas ou relacionadas). Por amostras independentes, entende‑se que a
forma como os casos são selecionados para compor uma amostra não exerce influência sobre a forma
como os casos são selecionados para compor a outra amostra.
Já por amostras dependentes, os casos selecionados para compor uma amostra estão
relacionados/conectados com os casos que compõem a outra amostra. Para facilitar a compreensão,
vejamos dois exemplos:
110
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
• Uma amostra aleatória de homens é selecionada a partir da população de homens e uma amostra
aleatória de mulheres é selecionada a partir da população de mulheres. Cada indivíduo terá
determinado analito dosado em seu sangue e sua média no grupo dos homens será comparada à
média do grupo das mulheres.
• Uma amostra de casais heterossexuais será selecionada aleatoriamente a partir da população.
Cada cônjuge terá um determinado analito dosado em seu sangue, e a média do grupo dos
homens será comparada à média do grupo das mulheres.
No primeiro exemplo, os casos selecionados para compor um grupo não exercem influência sobre os
casos selecionados para compor o outro grupo, de tal forma, diz‑se que as amostras são independentes.
Já no segundo cenário, os homens estão relacionados às mulheres (e vice‑versa), diz‑se que as amostras são
pareadas ou dependentes.
É importante determinar se as amostras que serão analisadas são independentes ou não, para que
seja escolhido o teste estatístico mais adequado à situação. Observe o quadro seguinte, que traz algumas
informações resumidas sobre esse assunto.
Quadro 3 – Como determinar se as amostras são independentes ou pareadas
Amostras independentes Amostras pareadas
Cada amostra é selecionada aleatoriamente a partir
da sua respectiva população;
ou
se cada amostra apresentar um tamanho amostral
diferente*, isto é, n1 ≠ n2.
As amostras são compostas pelos mesmos casos (por
exemplo, os mesmos indivíduos) que serão avaliados
mais de uma vez ao longo do tempo, ou antes e após
uma determinada intervenção;
ou
a escolha dos casos para uma amostra determina a
seleção dos casos para a outra amostra;
ou
os casos são pares, ou correspondentes um ao outro, de
certa forma, entre as amostras.
Nota: estas diretrizes ajudam a decidir se as amostras são independentes ou pareadas.
*Amostras independentes podem diferir entre si quanto ao tamanho amostral, entretanto amostras pareadas
sempre deverão apresentar o mesmo n.
Primeiramente, será abordado o teste para duas amostras independentes.
Suponhamos que um fabricante de aspiradores de pó resolveu avaliar se o teor de poeira
acumulada na ventilação dos aparelhos, como consequência do escape do saco armazenador, seria
diferente entre dois modelos de sua companhia. Durante um período de tempo similar, diferentes
equipamentos foram testados nas mesmas condições, e a quantidade de poeira (em gramas) presa
nos filtros de cada aparelho foi conforme segue. A um nível de significância de 5%, é possível afirmar
que o teor de poeira acumulada nos dois modelos é diferente? Assumindo que as distribuições
amostrais sejam normais:
111
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Modelo A
73,1; 56,4; 82,1; 67,2; 78,7; 75,1; 48,0; 53,3; 55,5; 61,5; 60,6; 55,2; 63,1
Modelo B
53,0; 39,3; 55,8; 58,8; 41,2; 66,6; 46,0; 56,4; 58,9
Uma forma útil de efetuar uma comparação entre os grupos é construir um box‑plot para cada
conjunto de dados, lado a lado. Nota‑se que os equipamentos do modelo B, embora em menor número
(nA = 13 e nB = 9), apresentaram valores de poeira (g) retida em seus filtros aparentemente menores do
que os do modelo A. Será que essa diferença será considerada significativa?
30
40
50
60
70
80
90
Qu
an
tid
ad
e
de
p
oe
ira
(g
)
Modelo A Modelo B
Figura 31 – Box‑plots da variável quantidade de poeira (g) para duas amostras de aspiradores de pó.
A inspeção visual dos box‑plots indica que os conjuntos de dados possuem leve assimetria,
possivelmente não o suficiente para deixarem de serem considerados normais;
além disso, não foram observados outliers nos conjuntos
A primeira etapa de um teste de hipóteses é a seleção do teste adequado. Como o objetivo é comparar
a média de uma população (aspiradores do modelo A) à média de outra população (aspiradores do
modelo B), um teste t é adequado à proposição. Sem acesso aos valores populacionais, selecionou‑se
uma amostra a partir de cada população de aspiradores. O tamanho das duas amostras é diferente
(nA = 13 e nB = 9), o que indica se tratar de amostras independentes (veja a tabela anterior). Além
disso, nota‑se que os dados não são relacionados, outro indicador de amostras independentes. Portanto,
diante das evidências, a escolha do teste t para duas amostras independentes é adequada à situação.
A maioria dos pressupostos do teste t para duas amostras são semelhantes aos do teste t para uma
amostra, mas um deles é novo:
I – Cada amostra deve ser aleatoriamente selecionada a partir da população: o teste é robusto a
esse pressuposto.
112
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
II – Deve haver independência de observações: o teste não é robusto à violação deste pressuposto.
III – A variável dependente deve apresentar distribuição normal em cada população: o teste é
relativamente robusto a esse pressuposto, sobretudo se o n amostral for grande.
IV – Deve haver homogeneidade de variâncias, em outras palavras, a variabilidade em ambas as
populações deve ser equivalente: o teste é relativamente robusto a esse pressuposto, sobretudo se o n
amostral for grande.
V – O pressuposto IV (a homogeneidade de variâncias) indica que a variabilidade nas duas populações
a partir das quais as amostras foram extraídas deve ser aproximadamente igual. Uma regra prática
sugere que, ao comparar os desvios padrões amostrais, se o maior desvio padrão não for mais do que
duas vezes o menor desvio padrão, então as variabilidades podem ser consideradas iguais (BARTZ, 1999).
Outra abordagem para avaliar esse pré‑requisito é executar um teste de homogeneidade de variâncias.
Assim, temos que os aspiradores de pó foram aleatoriamente selecionados para compor as amostras.
Há independência entre as observações, pois se tratam de dois modelos diferentes de equipamentos
(modelos A e B), sendo que a seleção de um caso em uma amostra não exerce influência sobre a seleção
de um caso na outra amostra. A variável dependente (poeira acumulada) apresenta perfil de distribuição
normal nas populações de origem (segundo enunciado), portanto, assumiremos que os dados seguem
esse perfil. A inspeção dos Q‑Q plots reforça essa afirmação. Ao compararmos os desvios padrões das
duas amostras, temos que sA = 10,63 g e sB = 9,00 g; como o maior desvio padrão não excede o menor
em mais de duas vezes, então as variabilidades podem ser consideradas iguais, afirmando‑se que há
homogeneidade de variâncias.
Modelo A Modelo B
30 3050 5070 7090 90
–2.0 –2.0
–1.5 –1.5
–1.0 –1.0
–0.5 –0.5
0.0 0.0
0.5 0.5
1.0 1.0
1.5 1.5
2.0 2.0
Valores observados Valores observados
N
or
m
al
e
sp
er
ad
a
N
or
m
al
e
sp
er
ad
a
Figura 32 – Q‑Q plots da variável quantidade de poeira (g) para amostras de aspiradores de pó do
modelo A (A) e do modelo B (B). Q‑Q plots indicandoque os dados dos conjuntos apresentam
distribuição que tende à normalidade (pontos se aproximam da linha de tendência central), sendo
que nenhuma observação ultrapassou o limite de ±2,0 desvios padrões em função da média
113
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Observação
Existem testes de hipóteses chamados testes de homogeneidade de variâncias
(ou homocedasticidade), que avaliam se a variabilidade em uma população, a
partir da qual uma amostra foi retirada, assemelha‑se à variabilidade na outra
população, da qual a outra amostra foi retirada. Um exemplo bastante empregado
para esse fim é o teste de Levene, que segue as seguintes hipóteses:
H0: variância população1 = variância população2
Ha: variância população1 ≠ variância população2
Para os dados do exemplo proposto, o teste de Levene teve chance de
erro p = 0,4797. Para um nível de significância α = 0,05, podemos concluir
que p > α, portanto, se aceita H0 – as variâncias são homogêneas.
A próxima etapa consiste na descrição das hipóteses nula e alternativa. Antes de definir as hipóteses,
deve‑se estipular se estamos diante de um teste unicaudal ou bicaudal. Testes bicaudais são empregados
mais frequentemente, então vamos iniciar a explicação por eles.
Testes bilaterais são utilizados quando não há predição acerca de qual grupo apresentará um escore
maior do que o outro. Em outras palavras, um pesquisador deseja avaliar se existe alguma diferença
entre a média de uma população (µ1) e a média da outra população (µ2). Isso significa que a
diferença entre as médias amostrais M1 e M2 deverá ser maior do que o erro amostral poderia explicar,
caso fossem extraídas da mesma população. Assim:
H0: µ1 = µ2
Ha: µ1 ≠ µ2
Um teste unilateral requer mais atenção na formulação das hipóteses, pois o pesquisador já possui
uma dada predição da direção dos resultados antes da coleta de dados. Deseja‑se, assim, avaliar se
a média de uma população (µ1) é maior que ou menor que a média de outra população (µ2), ou seja,
objetiva‑se apenas uma das laterais da distribuição. Desse modo:
H0: µ1 ≤ µ2 H0: µ1 ≥ µ2
ou
Ha: µ1 > µ2 Ha: µ1 < µ2
Uma vez que se deseja avaliar se as médias da quantidade de poeira acumulada nos filtros dos
aspiradores de pó dos modelos A e B diferem entre si, pressupõe‑se o uso de um teste bicaudal. Assim,
nossas hipóteses serão:
114
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
H0: µA = µB
Ha: µA ≠ µB
Em seguida, devemos estimar o valor crítico do teste. A interpretação do valor crítico é a mesma
mencionada anteriormente para o teste t para uma amostra, cujo valor se encontra na tabela seguinte
(excerto do Apêndice B). Deveremos levar em conta as seguintes observações:
I – O teste é unicaudal ou bicaudal?
II – Qual o nível de significância (α) adotado?
III – Quantos graus de liberdade nosso teste possui?
Para os dados fornecidos, temos que o teste em questão é bicaudal; segundo o enunciado, o nível
de significância adotado é α = 0,05 ou 5%, e como nA = 13 e nB = 9, cada mostra possui um grau de
liberdade GL = n – 1, correspondendo a um grau de liberdade total GL = GLA + GLB = 12 + 8 = 20.
Note que, no cálculo do teste para duas amostras independentes, o tamanho amostral das duas
amostras deve ser considerado. Simplificando‑se a observação acima, temos que:
GL = n1 + n2 – 2
Com base nesses valores, é possível recorrer a uma tabela t (Apêndice B) e cruzar os graus de liberdade
com o nível de significância adotado.
Sendo GL = 20 e α bicaudal = 0,05, observamos que o valor crítico de t para essa estatística será
igual a 2,086 (veja na tabela a seguir).
tcrit = 2,086
Tabela 24 – Valores críticos de t
GL
A
α = 0,05 unicaudal ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal ou
α = 0,01 bicaudal
18 1,734 2,101 2,552 2,878
19 1,729 2,093 2,539 2,861
20 1,725 2,086 2,528 2,845
21 1,721 2,080 2,518 2,831
22 1,717 2,074 2,508 2,819
Nota: a distribuição t varia conforme o grau de liberdade (GL). Como o nível de significância adotado no nosso
exemplo é α = 0,05 bicaudal e o teste possui 20 graus de liberdade, temos que o valor crítico de t para esse
cálculo será de 2,086 (conforme destaque).
115
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Para um teste bicaudal, a tomada de decisão se dará:
• se ‑tcrit < tcalc < +tcrit, não há evidências para rejeitar H0, devendo aceitá‑la como verdadeira;
• se tcalc ≤ ‑tcrit ou tcalc ≥ +tcrit, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Assim, podemos calcular o valor da estatística t. Para compreendermos a fórmula do teste t para
duas amostras independentes, recordemos a equação do teste t para uma amostra:
Lembrete
A fórmula do teste para uma amostra é:
M
M
t
s
−µ
=
Sendo:
t = o valor da estatística t
M = a média amostral
µ = a média populacional (ou valor de referência)
sM = a estimativa do erro padrão da média
Note que o numerador da equação consiste em uma medida de desvio (ou erro), ou seja, o
quanto a média amostral se distancia da média populacional. Já o denominador é um tipo de
desvio padrão: uma medida do desvio padrão da distribuição amostral das médias, que chamamos
de erro padrão. Considere agora que, no teste t para duas amostras independentes, teremos duas
amostras nessa equação, logo, informações dessas duas amostras deverão constar no numerador
e no denominador:
( ) ( )1 2 1 2
M M1 2
M Mmedida de desvio
t
erro padrão s −
− − µ −µ
= =
Como um teste de hipóteses assume a suposição de que a hipótese nula seja verdadeira, podemos
considerar que µ1 = µ2, simplificando o numerador para M1 – M2. Já no denominador, temos o erro
padrão da diferença, ou seja, precisamos transformar uma estimativa da variância combinada das duas
amostras em um erro padrão.
116
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
A variância combinada das duas amostras pode ser calculada da seguinte forma:
( ) ( )2 22 1 1 2 2
combinada
s n 1 s n 1
s
GL
× − + × −
=
Sendo:
s2combinada = a variância combinada das duas amostras
s1
2 = a variância do grupo 1
n1 = o tamanho do grupo 1
s2
2 = a variância do grupo 2
n2 = o tamanho do grupo 2
GL = os graus de liberdade totais (n1 + n2 – 2)
Com base nos dados, em que:
s1
2 = 113,01 g2
n1 = 13
s2
2 = 81,08 g2
n2 = 9
GL = 13 + 9 – 2 = 20
Temos:
( ) ( )2 22 1 1 2 2
combinada
s n 1 s n 1
s
GL
× − + × −
=
( ) ( )2
combinada
113,01 13 1 81,08 9 1 1356,12 648,64
s
20 20
× − + × − +
= =
2
combinadas 100,24=
A variância combinada das duas amostras é de 100,24 g2.
117
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Em posse da variância combinada, podemos calcular o erro padrão da média com base na seguinte equação:
2 1 2
M M combinada1 2
1 2
n n
s s
n n−
+
= × ×
Sendo:
M M1 2
s − = o erro padrão da diferença
s2combinada = a variância combinada das duas amostras
n1 = o tamanho do grupo 1
n2 = o tamanho do grupo 2
Com base nos dados, em que:
s2combinada = 100,24 g
2
n1 = 13
n2 = 9
Temos:
2 1 2
M M combinada1 2
1 2
n n
s s
n n−
+
= × ×
M M1 2
13 9
s 100,24
13 9−
+ = × ×
M M1 2
22
s 100,24
117−
= ×
M M1 2
s 100,24 0,1880− = ×
M M1 2
s 18,8451− =
M M1 2
s 4,34− =
O erro padrão da diferença é 4,34 g.
118
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Passada a parte mais complicada do cálculo, basta voltar à equação simplificada do teste t para duas
amostras independentes para descobrir o valor da estatística t:
1 2
M M1 2
M M
t
s −
−
=
Sendo:
t = o valor da estatística t
M1 = a média dogrupo 1
M2 = a média do grupo 2
M M1 2
s − = o erro padrão da diferença
Com base nos dados, em que:
M1 = 63,83 g
M2 = 52,89 g
M M1 2
s − = 4,34 g
Temos:
1 2
M M1 2
M M
t
s −
−
=
63,83 52,89
t
4,34
−
=
10,94
t 2,521
4,34
= =
119
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Observação
É possível calcular a estatística t sem obter primeiramente a variância
combinada e o erro padrão da diferença?
Reorganizando as equações e com um pouco de álgebra, quase tudo é
possível. A equação combinada do teste t para duas amostras independentes
ficaria assim:
( ) ( )
1 2
2 2
1 1 2 2 1 2
1 2
M M
t
s n 1 s n 1 n n
GL n n
−
=
× − + × − +
× ×
Entre realizar o cálculo por etapas ou de uma única vez, siga a estratégia
que se sentir mais confortável.
Quanto à interpretação do resultado do teste, é necessário, em primeiro lugar, saber se a hipótese
nula foi rejeitada.
Temos que tcalc = 2,521 e tcrit = 2,086. Como o teste é bicaudal, devemos observar que, se ‑tcrit < tcalc < +tcrit,
não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit ou tcalc ≥ +tcrit, há
evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Nesse caso, estamos diante da segunda situação, pois:
tcalc ≥ +tcrit
2,521 ≥ 2,086
Portanto, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Quanto será a chance de erro (p)? Ela é maior ou menor que o nível de significância (α) adotado?
A interpretação segue o mesmo raciocínio apresentado para o teste t para uma amostra. Veremos a seguir.
Para um teste t bicaudal, temos que, se ‑tcrit < tcalc < +tcrit, ou, dito em termos mais diretos, |tcalc| < |tcrit|,
p > α, logo, não existem evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se
tcalc ≤ ‑tcrit ou tcalc ≥ +tcrit, ou melhor, |tcalc| ≥ |tcrit|, p ≤ α, logo, os dados fornecem evidências para rejeitar
H0, devendo‑se aceitar Ha como verdadeira.
120
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Assim:
|tcalc| ≥ |tcrit|, logo p ≤ α
|2,521| ≥ |2,086|, logo p ≤ 0,05
Se p ≤ 0,05, rejeita‑se H0 como verdadeira. Mas qual será o valor exato da chance de erro (p)? Para obter o
valor exato, teríamos duas abordagens: calcular a integral da área sob a curva além do valor de tcalc (ambas
as caudas) ou utilizar um software de análise (para o exemplo em questão, via software, p = 0,0203).
Ambas as opções demandam conhecimentos específicos que não abordados. Note que, independentemente de
estar em posse do valor exato da chance de erro (p) ou não, nossa conclusão não se alterará: p < 0,05.
Observação
Note como o valor de tcalc = 2,521 está bem próximo do valor da
intersecção entre 20 graus de liberdade e α bicaudal = 0,02 (coluna C
da tabela anterior), indicando que o valor da chance de erro está mais
próximo de p = 0,02 (2%) do que de p = 0,05 (5%). De qualquer forma,
p < α adotado, apenas podemos dar um pouco mais de precisão ao cálculo,
utilizando informações disponíveis sobre os valores de t.
Uma vez interpretado o resultado, segue‑se para sua descrição por extenso. Devemos destacar
alguns elementos importantes na resposta, tais como:
I – o teste utilizado;
II – o tamanho das amostras;
III – o valor calculado do teste estatístico acompanhado dos graus de liberdade;
IV – o nível de significância (α) adotado;
V – se H0 foi rejeitada ou não.
Veja: com o objetivo de avaliar se haveria diferença no teor médio de poeira acumulada nos filtros de
ventilação de dois modelos distintos de aspiradores de pó (modelos A e B), duas amostras independentes
– uma contendo 13 equipamentos do modelo A e outra contendo 9 equipamentos do modelo B –
foram avaliadas nas mesmas condições. Um teste t para amostras independentes foi empregado e as
médias puderam ser consideradas distintas a um nível de significância α = 0,05. Os equipamentos do
modelo A retiveram significativamente mais poeira em seus filtros (MA = 63,83 g, sA = 10,63 g) do que
aqueles do modelo B (MB = 52,89 g, sB = 9,00 g) – t(20) = 2,521, p < 0,05. Conclui‑se, portanto, que os
equipamentos do modelo A apresentam maior escape de poeira do saco armazenador, refletindo em
mais poeira acumulada nos filtros dos aparelhos.
121
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Exemplo de aplicação
Exemplo 22
Um indivíduo, suspeitando que o preço dos estacionamentos na região em que trabalha é acima da média
da região em que ele mora, resolveu avaliar se sua suspeita era verdadeira. Ele coletou informações do preço de
meia diária (12 h) em cinco estacionamentos próximos a seu trabalho e em cinco estacionamentos próximos
a sua residência. Os resultados estão apresentados a seguir. Com base nessas informações, determine se a
suspeita do indivíduo é verdadeira ou não. Assuma α = 2,5% e considere que a normalidade foi respeitada.
Custo do período de 12 h (em R$) próximo ao trabalho: 35,00; 40,00; 50,00; 45,00; 45,00.
Custo do período de 12 h (em R$) próximo à residência: 25,00; 18,00; 30,00; 20,00; 25,00.
Como os conjuntos de dados são pequenos, realizemos uma inspeção gráfica dos dot‑plots para
cada amostra, lado a lado. É possível avaliar que as médias das duas amostras são numericamente
distintas entre si e o valor praticado pelos estacionamentos próximos à residência do indivíduo é menor
do que próximo ao trabalho. Será que essa diferença será considerada significativa?
0
10
20
30
40
50
60
Próximo ao trabalho Próximo à residência
Va
lo
r (
R$
)
Figura 33 – Dot‑plots da variável valor (R$) da meia diária em estacionamentos
dispostos em duas regiões. A inspeção visual dos dot‑plots indica que os valores
praticados pelos estacionamentos próximos à residência do indivíduo são menores do
que os praticados próximo ao trabalho. Serão essas diferenças significativas?
Resolução
Os estacionamentos foram aleatoriamente selecionados para compor as amostras com base na
região em que se localizam. Há independência entre as observações, pois se tratam de estabelecimentos
em regiões diferentes (próximo ao trabalho ou à residência), sendo que a seleção de um caso em uma
amostra não exerce influência sobre a seleção de um caso na outra amostra. A variável dependente
(valor de meia diária em R$) apresenta perfil de distribuição normal nas populações de origem (segundo
enunciado), portanto, assumiremos que os dados seguem esse perfil.
122
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
A inspeção dos Q‑Q plots reforça essa afirmação (veja a figura seguinte). Ao compararmos os desvios
padrões das duas amostras, temos que sTrabalho = R$ 5,70 e sResidência = R$ 4,72, como o maior desvio padrão
não excede o menor em mais de duas vezes, então, as variabilidades podem ser consideradas iguais,
afirmando‑se que há homogeneidade de variâncias.
Próximo ao trabalho Próximo à residência
0 020 2040 4060 60
–2.0 –2.0
–1.5 –1.5
–1.0 –1.0
–0.5 –0.5
0.0 0.0
0.5 0.5
1.0 1.0
1.5 1.5
2.0 2.0
Valores observados Valores observados
N
or
m
al
e
sp
er
ad
a
N
or
m
al
e
sp
er
ad
a
A) B)
Figura 34 – Q‑Q plots da variável valor (R$) da meia diária em estacionamentos dispostos próximo
ao trabalho (A) e próximo à residência (B). Q‑Q plots indicando que os dados dos conjuntos apresentam
distribuição que tende à normalidade (pontos se aproximam da linha de tendência central), sendo que
nenhuma observação ultrapassou o limite de ±2,0 desvio padrão em função da média
A próxima etapa consiste na descrição das hipóteses nula e alternativa. Antes de definir as hipóteses,
deve‑se estipular se estamos diante de um teste unicaudal ou bicaudal. No caso, o indivíduo deseja
avaliar se o preço praticado próximo ao trabalho está acima do preço praticado próximo à residência.
Portanto,estamos diante de um teste unilateral à direita. Assim, nossas hipóteses serão:
H0: µTrabalho ≤ µResidência
Ha: µTrabalho > µResidência
Em seguida, devemos estimar o valor crítico do teste. Consideremos que o teste em questão é
unicaudal. Segundo o enunciado, o nível de significância adotado é α = 0,025 ou 2,5% e, como
nTrabalho = 5 e nResidência = 5, cada amostra possui um grau de liberdade GL = n – 1, correspondendo a
um grau de liberdade total GL = GLA + GLB = 4 + 4 = 8.
Com base nesses valores, é possível recorrer a uma tabela t (Apêndice B) e cruzar os graus de liberdade
com o nível de significância adotado.
Sendo GL = 8 e α unicaudal = 0,025, observamos que o valor crítico de t para essa estatística é igual
a 2,306 (veja na tabela em seguida).
tcrit = 2,306
123
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Tabela 25 – Recorte de valores críticos de t
GL
A
α = 0,05 unicaudal ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal ou
α = 0,01 bicaudal
6 1,943 2,447 3,143 3,707
7 1,895 2,365 2,998 3,499
8 1,860 2,306 2,896 3,355
9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169
Nota: a distribuição t varia conforme o grau de liberdade (GL). Como o nível de significância adotado no nosso
exemplo é α = 0,025 unicaudal e o teste possui 8 graus de liberdade, temos que o valor crítico de t para este
cálculo será de 2,306 (conforme destaque).
Para um teste unilateral à direita, a tomada de decisão se dará de modo que, se tcrit < tcalc, não há
evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se tcalc ≥ tcrit, há evidências para
rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Para calcular o valor da estatística t, prossigamos em etapas, obtendo: (1) a variância combinada; (2)
o erro padrão da diferença e (3) o valor da estatística do teste.
(1) ( ) ( )
2 2
2 1 1 2 2
combinada
s n 1 s n 1
s
GL
× − + × −
=
Com base nos dados do nosso exemplo, em que:
s1
2 = 32,5 reais2
n1 = 5
s2
2 = 22,3 reais2
n2 = 5
GL = 5 + 5 – 2 = 8
Temos:
( ) ( )2
combinada
32,5 5 1 22,3 5 1 130 89,2
s
8 8
× − + × − +
= =
2
combinadas 27,4=
A variância combinada das duas amostras é de 27,4 reais2.
(2) 2 1 2M M combinada1 2
1 2
n n
s s
n n−
+
= × ×
124
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Sendo:
s2combinada = 27,4 reais
2
n1 = 5
n2 = 5
M M1 2
5 5
s 27,4
5 5−
+ = × ×
M M1 2
10
s 27,4
25−
= ×
M M1 2
s 27,4 0,4− = ×
M M1 2
s 10,96− =
M M1 2
s 3,31− =
O erro padrão da diferença é R$ 3,31.
(3) 1 2
M M1 2
M M
t
s −
−
=
Sendo:
M1 = R$ 43,00
M2 = R$ 23,60
M M1 2
s − = R$ 3,31
43,00 23,60
t
3,31
−
=
19,4
t 5,861
3,31
= =
O valor da estatística t é tcalc = 5,861.
Interpretando o resultado do teste, temos que, em primeiro lugar, saber se a hipótese nula foi rejeitada.
125
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Temos que tcalc = 5,861 e tcrit = 2,306. Como o teste é unicaudal à direita, devemos observar que, se
tcrit < tcalc, não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se tcalc ≥ tcrit,
há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Nesse caso, estamos diante da segunda situação, pois:
tcalc ≥ tcrit
5,861 ≥ 2,306
Portanto, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Quanto será a chance de erro (p)? Ela é maior ou menor que o nível de significância (α) adotado?
Para um teste t unilateral à direita, temos que, se tcrit < tcalc, p > α, logo, não existem evidências
para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se tcalc ≥ tcrit, p ≤ α, logo, os dados fornecem
evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Como:
tcalc ≥ tcrit, logo p ≤ α
5,861 ≥ 2,306, logo p ≤ 0,025
Se p ≤ 0,025, rejeita‑se H0 como verdadeira. Mas qual será o valor exato da chance de erro (p)? Para obter
o valor exato, teríamos duas abordagens: calcular a integral da área sob a curva além do valor de tcalc (ambas
as caudas) ou utilizar um software de análise (para o exemplo em questão, via software, p = 0,0002).
Com base na tabela t, ao observarmos a linha de 8 graus de liberdade, notamos que o valor de t
que mais se aproxima do valor calculado é 3,355, que corresponde a uma probabilidade unicaudal
de 0,005 (coluna D da tabela anterior), indicando que o valor da chance de erro está mais próximo de
p = 0,005 (0,5%) do que de p = 0,025 (2,5%). De qualquer forma, para o p < α adotado, apenas
podemos dar um pouco mais de precisão ao cálculo utilizando informações disponíveis na tabela de
valores de t.
Uma vez interpretado o resultado, podemos prosseguir para sua descrição por extenso:
Com o objetivo de avaliar se o preço médio praticado por estacionamentos próximos ao trabalho
seria maior do que o preço médio praticado próximo a sua residência, um indivíduo obteve duas amostras
independentes de cinco orçamentos cada. Um teste t para amostras independentes foi conduzido e, a
um nível de significância α = 0,025, concluiu‑se que os estacionamentos próximos ao trabalho cobram
valores significativamente maiores (MTrabalho = R$ 43,00, sTrabalho = R$ 5,70) do que aqueles próximos à
residência (MResidência = R$ 23,60, sresidência = R$ 4,72) – t(8) = 5,861, p < 0,025.
126
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
6.4.1 Teste t para duas amostras independentes com variâncias desiguais
Vimos que os pressupostos do teste t para duas amostras independentes são: aleatoriedade das
amostras, independência de observações, normalidade e homogeneidade de variâncias. O último
pressuposto indica que a variabilidade nas duas populações, a partir das quais as amostras foram
extraídas, deve ser aproximadamente igual.
Caso ocorra a violação desse pressuposto e se conclua que as amostras são heterocedásticas
(variâncias desiguais), uma correção pode ser aplicada à fórmula do teste t e aos graus de liberdade,
conforme se segue:
1 2
2 2
1 2
1 2
M M
t
s s
n n
−
=
+
Sendo:
t = o valor da estatística t
M1 = a média do grupo 1
M2 = a média do grupo 2
s1
2 = a variância do grupo 1
n1 = o tamanho do grupo 1
s2
2 = a variância do grupo 2
n2 = o tamanho do grupo 2
Os cálculos dos graus de liberdade, nesse caso, se darão por:
( )
( )
( )
( )
22 2
1 2
1 2
2 22 2
1 1 2 2
1 2
s s
n n
GL
s / n s / n
n 1 n 1
+
=
+
− −
Sendo:
GL = o grau de liberdade da estatística t
127
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
s1
2 = a variância do grupo 1
n1 = o tamanho do grupo 1
s2
2 = a variância do grupo 2
n2 = o tamanho do grupo 2
Essa correção, conhecida como teste t de Welch, é mais robusta à violação da homogeneidade
de variâncias e pode ser aplicada sem qualquer desvantagem, mesmo quando as variâncias forem
consideradas iguais. Caso as duas amostras tenham o mesmo tamanho amostral e as variâncias sejam
homogêneas, as duas fórmulas do teste t apresentadas darão os mesmos resultados.
Com base nos valores a seguir, observe:
M1 = R$ 43,00
M2 = R$ 23,60
s1
2 = 32,5 reais2
n1 = 5
s2
2 = 22,3 reais2
n2 = 5
GL = 5 + 5 – 2 = 8
( ) ( )
1 2
2 2
1 1 2 2 1 2
1 2
M M
t
s n 1 s n 1 n n
GL n n
−
=
× − + × − +
× ×
1 2
2 2
1 2
1 2
M M
t
s s
n n
−
=
+
( ) ( )
43,00 23,60
t
32,5 5 1 22,3 5 1 5 5
8 5 5
−
=
× − + × − + × ×
43,00 23,60
t
32,5 22,3
5 5
−
=
+
19,4
t
32,5 4 22,3 4 10
8 25
=
× + × ×
19,4
t
54,8
5
=
128
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
19,4
t
130 89,2
0,4
8
=
+
×
19,4
t
10,96
=
19,4
t
27,4 0,4
=
×
19,4
t 5,861
3,31= =
19,4
t
10,96
=
19,4
t 5,861
3,31
= =
Note que ambas as equações forneceram resultados iguais.
6.5 Teste t para duas amostras pareadas
Quando duas amostras são pareadas (dependentes, emparelhadas, relacionadas), cada caso consiste
em um par de dados, sendo um valor apresentado em cada amostra. Uma forma de emparelhar os
dados ocorre em desenhos experimentais que envolvam medidas repetidas, ou seja, os participantes da
amostra são avaliados em dois pontos do tempo (antes e depois de alguma intervenção, por exemplo).
Outra forma de emparelhamento são os estudos que visam avaliar efeitos dentro dos grupos
(within‑subjects design, em inglês). Por exemplo, suponha que os mesmos indivíduos serão avaliados
em duas situações diferentes: o nível de atenção dos alunos será avaliado pelo professor, por meio
do desempenho em um teste quantitativo, quando os alunos forem expostos ao silêncio e quando os
alunos forem expostos a um ruído de fundo (como o maquinário de obra civil nos arredores da sala de
aula). Os mesmos indivíduos serão avaliados em ambas as situações.
Observação
Medidas repetidas ou efeitos dentro dos grupos envolvem uma
amostra de casos avaliada em dois momentos do tempo ou sob duas
condições distintas.
Suponhamos que dois laboratórios determinaram a quantidade de cloro (ppm, partes por
milhão) das mesmas amostras de água retiradas da rede de abastecimento de uma cidade. Com
base nessas informações, procuraremos informações para dizer se existem diferenças significativas
entre as medições realizadas pelos dois laboratórios. Assumiremos α = 1% e consideraremos que a
normalidade foi respeitada.
129
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Tabela 26 – Quantidade de cloro (ppm) em amostras de
água retiradas da rede de abastecimento de uma cidade
Amostra Laboratório A Laboratório B Escore da diferença(B – A)
1 1,15 1,00 ‑0,15
2 1,86 1,90 0,04
3 0,75 0,90 0,15
4 1,82 1,80 ‑0,02
5 1,14 1,20 0,06
6 1,65 1,70 0,05
7 1,90 1,95 0,05
M = 1,467 1,493 0,026
s = 0,451 0,446 0,092
Nota: o escore da diferença é obtido se subtraindo os valores de cada observação
emparelhada. A ordem da subtração (A – B ou B – A) não interessa, desde que a
mesma abordagem seja efetuada em todos os pares. Neste exemplo, optou‑se pela
subtração que resultou em média positiva.
A primeira etapa de um teste de hipóteses é a seleção do teste adequado. Como o objetivo é comparar
a dosagem média de cloro efetuada por dois laboratórios nas mesmas amostras de água, observe que os
casos são relacionados ou emparelhados. Portanto, diante das evidências, a escolha do teste t para duas
amostras pareadas aparenta ser adequada à situação.
A figura a seguir traz os box‑plots dos valores de cloro, obtidos a partir das dosagens efetuadas pelos
dois laboratórios. A inspeção visual dos gráficos sugere não haver diferença, em média, na dosagem
efetuada pelos dois laboratórios. Será que chegaremos à mesma conclusão em termos de probabilidade?
0.0
0.5
1.0
1.5
2.0
2.5
Qu
an
tid
ad
e
de
p
oe
ira
(g
)
Laboratório A Laboratório B
Figura 35 – Box‑plots da variável quantidade de cloro (ppm) para dosagem das mesmas amostras de água efetuada
por dois laboratórios distintos, indicando que os conjuntos de dados possuem leve assimetria, possivelmente não
o suficiente para deixarem de serem considerados normais; além disso, não foram observados outliers nos conjuntos
130
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Existem três pressupostos para o teste t pareado, que já são familiares ao leitor:
I – Cada amostra deve ser aleatoriamente selecionada a partir da população: o teste é robusto a esse
pressuposto.
II – Deve haver independência de observações dentro da amostra: o teste não é robusto à violação
deste pressuposto. Note que a independência de observações, nesse caso, não se dá entre amostras
(pois os grupos são relacionados), não sim dentro da amostra, ou seja, um par de observações deve ser
avaliado individualmente e não exercer efeito sobre outro par de observações presente na amostra.
III – O escore da diferença deve apresentar distribuição normal: o teste é relativamente robusto
a esse pressuposto, sobretudo se o n amostral for grande. Além disso, não deverá haver um número
significativo de outliers nos escores da diferença, uma vez que exercerão forte impacto sobre a média
da diferença e sobre o desvio padrão da diferença.
Assim, as amostras de água foram aleatoriamente selecionadas a partir da rede de abastecimento de
uma cidade, e a quantidade de cloro foi, então, dosada em cada amostra por dois laboratórios diferentes.
Há independência de observações, pois cada observação emparelhada não exerce influência sobre outro par
de observações presente no conjunto. O escore da diferença entre as medições apresenta perfil de distribuição
normal (segundo enunciado), portanto, assumiremos que os dados seguem esse perfil. A inspeção do
Q‑Q plot dos escores da diferença reforça essa afirmação.
Escore da diferença
–0.20 –0.10 0.00 0.10 0.20
–2.0
–1.5
–1.0
–0.5
0.0
0.5
1.0
1.5
2.0
Valores observados
N
or
m
al
e
sp
er
ad
a
Figura 36 – Q‑Q plot do escore da diferença da quantidade de cloro (ppm) obtido a partir da dosagem
por dois laboratórios distintos. O Q‑Q plot indica que os escores da diferença apresentam distribuição
que tende à normalidade (pontos se aproximam da linha de tendência central), sendo que nenhuma
observação ultrapassou o limite de ±2,0 desvios padrões em função da média
A próxima etapa consiste na descrição das hipóteses nula e alternativa. O raciocínio será o mesmo
do teste t para duas amostras independentes. Antes de definir as hipóteses, deve‑se estipular se estamos
diante de um teste unicaudal ou bicaudal. Testes bicaudais são empregados mais frequentemente, então
vamos iniciar a explicação por eles.
131
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Testes bilaterais são utilizados quando não há predição de qual grupo apresentará um escore maior
do que o outro. Em outras palavras, a hipótese nula nos dirá que as médias populacionais são iguais
entre si. A hipótese alternativa afirmará que as médias populacionais diferem entre si, mas sem indicar
a direção ou a magnitude da diferença. Isso significa que a diferença entre as médias amostrais M1 e
M2 deverá ser maior do que o erro amostral poderia explicar, assumindo que foram extraídas da mesma
população. Assim:
H0: se µ1 = µ2, logo, µ1 – µ2 = 0
Ha: se µ1 ≠ µ2, logo, µ1 – µ2 ≠ 0
Para a hipótese nula, caso as médias sejam iguais, é possível inferir que a diferença entre as médias
será igual a zero. Já para a hipótese alternativa, assumindo que as médias sejam distintas entre si, a
diferença entre as médias levará a algum valor diferente de zero.
Um teste unilateral requer mais atenção na formulação das hipóteses, pois um pesquisador já possui
uma dada predição da direção dos resultados antes da coleta de dados. Assim, deseja‑se avaliar se a
média de uma população (µ1) é maior que ou menor que a média de outra população (µ2), ou seja,
objetiva‑se apenas uma das laterais da distribuição, e, dessa forma, a diferença entre as médias assumirá
um valor maior que ou menor que zero. Temos, então:
H0: se µ1 ≤ µ2, logo, µ1 – µ2 ≤ 0 H0: se µ1 ≥ µ2, logo, µ1 – µ2 ≥ 0
ou
Ha: se µ1 > µ2, logo, µ1 – µ2 > 0 Ha: se µ1 < µ2, logo, µ1 – µ2 < 0
Uma vez que se deseja avaliar se as medições realizadas pelos dois laboratórios são diferentes entre
si para os mesmos materiais, pressupõe‑se o uso de um teste bicaudal. Assim, nossas hipóteses serão:
H0: se µA = µB, logo, µA – µB = 0
Ha: se µA ≠ µB, logo, µA – µB ≠ 0
Em seguida, devemos estimar o valor crítico do teste. A interpretação do valor crítico éa mesma que
vimos no teste t para duas amostras independentes. Procuraremos por este valor na tabela t seguinte
(Apêndice B). Deveremos levar em conta as seguintes observações:
I – O teste é unicaudal ou bicaudal?
II – Qual o nível de significância (α) adotado?
III – Quantos graus de liberdade nosso teste possui?
132
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Para os dados do nosso exemplo, temos que o teste em questão é bicaudal; segundo o enunciado, o
nível de significância adotado é α = 0,01 ou 1%; como sete amostras de água foram avaliadas por dois
laboratórios, temos que GL = n – 1, logo, GL = 6.
Com base nesses valores, é possível recorrer a uma tabela t e cruzar os graus de liberdade com o nível
de significância adotado.
Sendo GL = 6 e α bicaudal = 0,01, observamos que o valor crítico de t para essa estatística será igual
a 3,707 (veja na tabela seguinte).
tcrit = 3,707
Tabela 27 – Recorte de valores críticos de t
GL
A
α = 0,05 unicaudal ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal ou
α = 0,01 bicaudal
4 2,132 2,776 3,747 4,604
5 2,015 2,571 3,365 4,032
6 1,943 2,447 3,143 3,707
7 1,895 2,365 2,998 3,499
8 1,860 2,306 2,896 3,355
Nota: a distribuição t varia conforme o grau de liberdade (GL). Como o nível de significância adotado no nosso
exemplo é α = 0,01 bicaudal e o teste possui 6 graus de liberdade, temos que o valor crítico de t para esse cálculo
será de 3,707 (conforme destaque).
Para um teste bicaudal, a tomada de decisão se dará de forma que:
• se ‑tcrit < tcalc < +tcrit, não haverá evidências para rejeitar H0, devendo aceitá‑la como verdadeira;
• se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, haverá evidências para rejeitar H0, devendo‑se aceitar Ha como
verdadeira.
Para compreendermos a fórmula do teste t pareado e calcular o valor da estatística t, utilizamos a
equação do teste t para uma amostra.
Lembrete
A fórmula do teste para uma amostra é:
M
M
t
s
−µ
=
133
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Sendo:
t = o valor da estatística t
M = a média amostral
µ = a média populacional (ou valor de referência)
sM = a estimativa do erro padrão da média
Note que o numerador da equação consiste em uma medida de desvio (ou erro), ou seja, o quanto
a média amostral se distancia da média populacional. Já o denominador é um tipo de desvio padrão:
uma medida do desvio padrão da distribuição amostral das médias, que chamamos de erro padrão. Para
o teste t pareado, empregam‑se as medidas do escore da diferença, logo, essas informações deverão
constar no numerador e no denominador:
( ) ( )1 2 1 2
M M1 2
M Mmedida de desvio
t
erro padrão s −
− − µ −µ
= =
Como um teste de hipóteses assume a suposição de que a hipótese nula seja verdadeira, podemos
considerar que µ1 = µ2, simplificando o numerador para M1 – M2. Já no denominador, temos o erro
padrão da diferença, que pode ser representado por:
D
MD
s
s
n
=
Sendo:
MD
s
= o erro padrão da diferença média para os escores da diferença
sD = o desvio padrão dos escores da diferença
n = o número de observações emparelhadas
A equação do teste t pareado se torna:
1 2
MD
M M
t
s
−
=
Sendo:
t = o valor da estatística t
M1 = a média do grupo 1
M2 = a média do grupo 2
MD
s
= o erro padrão da diferença média para os escores da diferença
134
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Observação
A diferença entre médias (M1 – M2) será numericamente igual à média dos
escores da diferença (MD). Observe a tabela 26, com os dados do exemplo, e
note que, se subtrairmos as médias entre si, obteremos exatamente o valor
da média dos escores da diferença (linha M da tabela). Assim, a equação do
teste t pareado pode ser grafada como:
1 2 D
M MD D
M M M
t ou t
s s
−
= =
Com base nos dados, em que:
MD = 0,026 ppm
sD = 0,092 ppm
n = 7
Temos:
D
MD
M
t
s
=
( )
0,026
t
0,092 / 7
=
( )
0,026
t
0,092 / 2,6458
=
0,026
t 0,747
0,0348
= =
Para a interpretação do resultado do teste, é necessário, em primeiro lugar, saber se a hipótese nula
foi rejeitada.
Temos que tcalc = 0,747 e tcrit = 3,707. Como o teste é bicaudal, devemos observar que, se ‑tcrit < tcalc < tcrit,
não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit,
há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
135
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Nesse caso, estamos diante da primeira situação, pois:
‑tcrit < tcalc < +tcrit
‑3,707 < 0,747 < 3,707
Portanto, não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira.
Quanto será a chance de erro (p)? Ela é maior ou menor que o nível de significância (α) adotado?
A interpretação segue o mesmo raciocínio apresentado para o teste t para duas amostras independentes.
Para um teste t bicaudal, temos que, se ‑tcrit < tcalc < +tcrit, ou, dito em termos mais diretos, |tcalc| < |tcrit|,
p > α, logo, não existem evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se
tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, ou melhor, |tcalc| ≥ |tcrit|, p ≤ α, logo, os dados fornecem evidências para
rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Como:
|tcalc| < |tcrit|, logo, p > α
|0,747| ≥ |3,707|, logo, p > 0,01
Se p > 0,01, aceita‑se H0 como verdadeira. Para obter o valor exato da chance de erro (p), teríamos
duas abordagens: calcular a integral da área sob a curva além do valor de tcalc (ambas as caudas) ou
utilizar um software de análise (para o exemplo em questão, via software, p = 0,4883). Ambas as opções
demandam conhecimentos específicos não abordados. Note que, independentemente de estar em posse
do valor exato da chance de erro (p) ou não, nossa conclusão não se alterará: p > 0,01.
Observação
Com base na tabela anterior, na linha de 6 graus de liberdade, note
que o valor de tcalc = 0,747 está mais próximo de 1,943 (intersecção entre
6 graus de liberdade e α bicaudal = 0,10, coluna A) do que de tcrit = 3,707.
Se 0,747 < 1,943, então, p > 0,10 (10%). Não temos acesso ao valor exato
de p, mas podemos usar a tabela para dar um pouco mais de precisão ao
cálculo. De qualquer forma, a conclusão se mantém: p > α adotado.
Uma vez interpretado o resultado, podemos prosseguir para sua descrição por extenso. Devemos
destacar alguns elementos importantes na resposta, tais como:
I – o teste utilizado;
II – o tamanho da amostra emparelhada;
136
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
III – o valor calculado do teste estatístico acompanhado dos graus de liberdade;
IV – o nível de significância (α) adotado;
V – se H0 foi rejeitada ou não.
Assim, vejamos como ficaria a descrição do nosso exemplo: com o objetivo de avaliar se haveria
diferença na dosagem de cloro (ppm) obtida por dois laboratórios nas mesmas amostras de água (n = 7),
empregou‑se um teste t pareado. A um nível de significância α = 0,01, os resultados obtidos pelo
laboratório A (MA = 1,467 ppm, sA = 0,451 ppm) não foram considerados significativamente distintos
dos resultados obtidos pelo laboratório B (MB = 1,493 ppm, sB = 0,446 ppm) – t(6) = 0,747, p > 0,01.
Conclui‑se, portanto, que os resultados liberados pelos dois laboratórios estão em acordo.
Exemplo de aplicação
Exemplo 23
A fim de determinar a eficiência de um medicamento antitérmico, a temperatura corporal (ºC) de
20 indivíduos foi medida. Em seguida, foi administrado o medicamento, e, depois de uma hora, suas
temperaturas foram medidas novamente. Os resultados podem ser encontrados na tabela a seguir.
Com base nessas informações, verifique se há evidências suficientes nos resultadosque nos permitam
afirmar que o medicamento é um bom antitérmico. Assuma α = 2,5% e considere que a normalidade
foi respeitada.
Tabela 28 – Temperatura corporal (ºC) em indivíduos antes e
depois da administração de medicamento antitérmico
Indivíduo Temperaturaantes
Temperatura
depois
Escore da diferença
(A – B)
1 37,5 37,8 ‑0,3
2 36,0 36,4 ‑0,4
3 39,0 37,6 1,4
4 38,0 37,2 0,8
5 37,8 36,9 0,9
6 38,5 37,7 0,8
7 36,9 36,8 0,1
8 39,4 38,1 1,3
9 37,2 36,7 0,5
10 38,1 37,3 0,8
11 39,3 38,0 1,3
12 37,5 37,1 0,4
13 38,5 36,6 1,9
14 39,0 37,5 1,5
137
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
15 36,9 37,0 ‑0,1
16 37,0 36,2 0,8
17 38,5 37,6 0,9
18 39,0 36,8 2,2
19 36,2 36,4 ‑0,2
20 36,8 36,8 0,0
M = 37,86 37,13 0,73
s = 1,03 0,56 0,74
Nota: o escore da diferença é obtido subtraindo‑se os valores de cada observação emparelhada.
A ordem da subtração (A – B ou B – A) não interessa, desde que a mesma abordagem seja efetuada
em todos os pares. Neste exemplo, optou‑se pela subtração que resultou em média positiva.
A primeira etapa de um teste de hipóteses é a seleção do teste adequado. Como o objetivo é
comparar a temperatura corporal dos mesmos indivíduos em dois momentos, observe que os casos são
relacionados ou emparelhados. Portanto, diante das evidências, a escolha do teste t para duas amostras
pareadas aparenta ser adequada à situação.
A figura seguinte traz os box‑plots dos valores de temperatura obtidos antes e depois da administração
do medicamento antitérmico. É possível avaliar que, após a administração do medicamento, a temperatura
média dos indivíduos diminuiu. Será que essa diferença será considerada significativa?
34
35
36
37
38
39
40
Te
m
pe
ra
tu
ra
(º
C)
Antes Depois
Figura 37 – Box‑plots da variável temperatura corporal (ºC) de indivíduos antes e depois da administração de medicamento
antitérmico. A inspeção visual dos box‑plots indica que, após a administração do medicamento antitérmico, os valores de
temperatura corporal dos indivíduos diminuíram. Os conjuntos são relativamente simétricos e não foram observados outliers
Os indivíduos foram aleatoriamente selecionados a partir da população, e suas temperaturas
corporais foram, então, avaliadas em dois momentos, antes e depois da administração de medicamento
antitérmico. Há independência de observações, pois cada observação emparelhada não exerce influência
sobre outro par de observações presente no conjunto. O escore da diferença entre as medições apresenta
perfil de distribuição normal (segundo enunciado), portanto, assumiremos que os dados seguem esse perfil.
A inspeção do Q‑Q plot dos escores da diferença reforça esta afirmação.
138
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Escore da diferença
–0.5 0.5 1.5 2.5
–2.0
–1.5
–1.0
–0.5
0.0
0.5
1.0
1.5
2.0
Valor observado
N
or
m
al
e
sp
er
ad
a
Figura 38 – Q‑Q plot do escore da diferença da temperatura corporal (ºC)
de indivíduos antes e depois da administração de medicamento antitérmico,
indicando que os escores da diferença apresentam distribuição que tende
à normalidade (pontos se aproximam da linha de tendência central), sendo que
nenhuma observação ultrapassou o limite de ±2,0 desvio padrão em função da média
A próxima etapa consiste na descrição das hipóteses nula e alternativa. Antes de defini‑las,
deve‑se estipular se estamos diante de um teste unicaudal ou bicaudal. No caso, procura‑se saber se
o medicamento é um bom antitérmico, ou seja, se levará a uma significativa redução (µAntes > µDepois)
da temperatura corporal. Portanto, estamos diante de um teste unilateral à direita. Assim, nossas
hipóteses serão:
H0: se µAntes ≤ µDepois, logo µAntes – µDepois ≤ 0
Ha: se µAntes > µDepois, logo µAntes – µDepois > 0
Em seguida, devemos estimar o valor crítico do teste. Consideremos que o teste em questão é
unicaudal. Segundo o enunciado, o nível de significância adotado é α = 0,025 ou 2,5%; como, ao
todo, vinte indivíduos foram avaliados antes e depois da administração do medicamento, temos que
GL = n – 1, logo, GL = 19.
Com base nesses valores, é possível recorrer à tabela t e cruzar os graus de liberdade com o nível de
significância adotado.
Sendo GL = 19 e α unicaudal = 0,025, observamos que o valor crítico de t para essa estatística será
igual a 2,093 (veja na tabela seguinte).
tcrit = 2,093
139
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Tabela 29 – Recorte de valores críticos de t
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
17 1,740 2,110 2,567 2,898
18 1,734 2,101 2,552 2,878
19 1,729 2,093 2,539 2,861
20 1,725 2,086 2,528 2,845
21 1,721 2,080 2,518 2,831
Nota: a distribuição t varia conforme o grau de liberdade (GL). Como o nível de significância adotado no nosso
exemplo é α = 0,025 unicaudal e o teste possui 19 graus de liberdade, temos que o valor crítico de t para esse
cálculo será de 2,093 (conforme destaque).
Para um teste unilateral à direita, a tomada de decisão se dará de modo que, se tcrit < tcalc, não há
evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se tcalc ≥ tcrit, há evidências para
rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Com base nos dados apresentados, em que:
MD = 0,73ºC
sD = 0,74ºC
n = 20
Para calcular o valor da estatística t, temos:
D
MD
M
t
s
=
( )
0,73
t
0,74 / 20
=
( )
0,73
t
0,74 / 4,4721
=
0,73
t 4,411
0,1655
= =
O valor da estatística t é tcalc = 4,411.
140
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Temos que tcalc = 4,411 e tcrit = 2,093. Como o teste é unicaudal à direita, devemos observar que, se
tcrit < tcalc, não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se tcalc ≥ tcrit, há
evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Nesse caso, estamos diante da segunda situação, pois:
tcalc ≥ tcrit
4,411 ≥ 2,093
Portanto, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Quanto será a chance de erro (p)? Ela é maior ou menor que nível de significância (α) adotado? Para
um teste t unilateral à direita, temos que, se tcrit < tcalc, p > α, logo, não existem evidências para rejeitar
H0, devendo‑se aceitá‑la como verdadeira; se tcalc ≥ tcrit, p ≤ α, logo, os dados fornecem evidências para
rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Como:
tcalc ≥ tcrit, logo, p ≤ α
4,411 ≥ 2,093, logo, p ≤ 0,025
Se p ≤ 0,025, rejeita‑se H0 como verdadeira. Mas qual será o valor exato da chance de erro (p)?
Para obtê‑lo, teríamos duas abordagens: calcular a integral da área sob a curva além do valor de
tcalc (ambas as caudas) ou utilizar um software de análise (para o exemplo em questão, via software,
p = 0,00014 ou 0,014%).
Com base na tabela t, ao observarmos a linha de 19 graus de liberdade, notamos que o valor que
mais se aproxima do valor calculado é 2,861, que corresponde a uma probabilidade unicaudal de 0,005
(coluna D da tabela anterior), indicando que o valor da chance de erro está mais próximo de p = 0,005
(0,5%) do que de p = 0,025 (2,5%). De qualquer forma, p < α adotado, apenas podemos dar um pouco
mais de precisão ao cálculo utilizando informações disponíveis na tabela t.
Uma vez interpretado o resultado, podemos prosseguir para sua descrição por extenso:
Com o objetivo de avaliar se um medicamento antitérmico levaria a uma redução da temperatura corporal
em 20 indivíduos, registros de temperatura foram realizados antes (MAntes = 37,86 ºC, sAntes = 1,03 ºC)
e depois de uma hora (MDepois = 37,13 ºC, sDepois = 0,56 ºC) da administração do medicamento. Por se
tratarem de dados emparelhados(medidas repetidas), um teste t pareado foi conduzido, e, a um nível
de significância α = 0,025, concluiu‑se que houve uma redução significativa de 0,73 ºC entre os dois
momentos, como consequência da intervenção (t(19) = 4,411, p < 0,025).
141
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
7 TESTES DE HIPÓTESES PARA TRÊS OU MAIS AMOSTRAS
7.1 Análise de variância (ANOVA) de um fator
A análise de variância (ANOVA) é uma família de testes utilizados para comparação de médias
entre dois ou mais grupos. Trataremos, aqui, apenas da ANOVA de um fator (one‑way ANOVA,
em inglês), uma extensão do teste t para amostras independentes. A ANOVA de um fator permite
verificar o efeito de uma variável explicativa de natureza qualitativa (fator, por exemplo, grupos)
em uma variável dependente de natureza quantitativa. Cada grupo inclui as observações da variável
dependente em uma categoria do fator.
Considere um estudo com cinco condições (cinco grupos). Você poderia imaginar que seria possível
analisar esses resultados efetuando uma série de testes t para amostras independentes. Por exemplo,
um pesquisador poderia comparar a média da condição 1 com a da condição 2, a média da condição 1
com a da condição 3, a média da condição 1 com a da condição 4 e assim sucessivamente, conforme a
tabela a seguir. Seriam necessários 10 testes t nesse cenário.
Quadro 4 – Todos os possíveis pares da
comparação de cinco grupos experimentais
1 versus 2 1 versus 3 1 versus 4 1 versus 5
2 versus 3 2 versus 4 2 versus 5
3 versus 4 3 versus 5
4 versus 5
Nota: se um estudo possuir cinco condições experimentais, e comparações múltiplas,
uma a uma, fossem realizadas, seriam necessários 10 testes t. Se cada comparação
individual assumir uma chance de 5% de incorrer em erro do tipo I, haverá quase
50% de chance de uma em dez comparações apresentar um erro do tipo I.
A probabilidade de incorrer em um erro do tipo I – rejeitar a hipótese nula quando ela for verdadeira
– é determinada pelo nível de significância (α) adotado. Para α = 0,05, assumimos que, caso repetíssemos
um mesmo experimento 100 vezes, em 5 dessas 100 repetições, chegaríamos a conclusões diferentes
por conta do acaso. Logo, ao assumir α = 0,05, um pesquisador assume que sua chance de cometer um
erro do tipo I é de 5%.
O problema em efetuar múltiplos testes t é que aumentamos a probabilidade de incorrer em erro do
tipo I. Em dez testes separados, o nível de significância total se eleva para quase 50%. Isso significa que
há perto de 50% de chance de uma em dez comparações conduzir a uma conclusão errada, rejeitando
a hipótese nula quando ela for verdadeira. Isto não é bom sinal, e o experimentador não saberia qual
dessas dez análises leva a uma conclusão incorreta.
142
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Observação
Testes t comparam médias entre grupos, então por que a análise de
variância é necessária? Se tivermos mais de dois grupos, por que não
fazemos múltiplos testes t, simplesmente?
A ANOVA é necessária para que evitemos a rejeição incorreta da hipótese
nula (afirmando que há uma diferença significativa quando ela, de fato,
pode não existir). Esse erro é chamado erro do tipo I e sua probabilidade é
determinada pelo nível de significância (α) adotado.
A análise de variância resolve esse problema porque todas as médias são comparadas entre si de uma
única vez. De tal forma, o nível de significância (α) é mantido constante, conforme adoção inicial. Se
o resultado da ANOVA for significativo, ou seja, conduzir à conclusão de que a hipótese nula deve ser
rejeitada, é preciso efetuar uma análise post‑hoc (do latim, “depois disso”), visando descobrir quais pares
de grupos realmente são diferentes entre si.
Observação
Note que a ANOVA não informa quais grupos diferem entre si,
somente informa que há uma diferença. Após encontrar uma diferença,
é preciso conduzir testes post‑hoc no fator para examinar as diferenças entre
os níveis.
Observe uma analogia que ajuda a entender melhor o relacionamento entre uma ANOVA e um
teste post‑hoc. Imagine‑se do lado de fora de um estádio de futebol em um dia de jogo, com a casa
cheia. De repente, você escuta um brado da multidão. Esse seria o equivalente ao resultado da ANOVA –
sinalizando, em geral, que alguma coisa interessante ocorreu, mas sem especificar o quê. Para descobrir
o que houve naquela partida, estando do lado de fora, você precisaria obter uma entrada para o estádio.
Entrar no estádio seria como efetuar um teste post‑hoc. Testes post‑hoc são conduzidos após a ANOVA,
quando se tem certeza de que há algo interessante a ser encontrado.
Assim, na ANOVA, um conjunto de valores é analisado e são identificadas diferentes fontes de
variabilidade. A variabilidade total da amostra pode ser dividida em duas fontes de variação: entre
os grupos e dentro dos grupos. Esta é causada primariamente pelas diferenças entre os valores que
compõem um mesmo grupo, fruto da variabilidade individual caso a caso. Já a primeira é resultado
da combinação entre os tratamentos diferentes que os grupos recebem e da variabilidade entre os
indivíduos divididos nos diferentes grupos.
Por exemplo, deseja‑se avaliar o efeito do álcool no organismo quanto à seletividade na escolha de
parceiros sexuais. Imaginemos que um grande grupo de pessoas será dividido aleatoriamente em três
143
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
grupos, em que os indivíduos consumirão (1) 4 latas de cerveja em um curto intervalo de tempo, (2) 2
latas de cerveja em curto intervalo de tempo e (3) 2 latas de cerveja sem álcool – grupo controle. Cada
grupo possuirá certa variabilidade observada na variável dependente, como reflexo da sua composição
diversa – essa seria a fonte de variação dentro dos grupos. Uma vez que os indivíduos foram distribuídos
aleatoriamente entre os grupos, espera‑se que eles sejam relativamente homogêneos entre si, em termos
de sexo, massa corporal, tempo de jejum, experiência com álcool e assim por diante. Cada grupo foi
exposto a uma quantidade diferente de álcool.
Os resultados da variável dependente serão exatamente os mesmos entre eles? Não, porque existem
diferenças entre os grupos em função do tratamento – quantidade de álcool consumida – e das diferenças
individuais entre os componentes dos três grupos.
Outro exemplo, agora com números, para compreendermos as etapas da ANOVA é supormos que
doze mulheres, de mesma faixa etária e massa corporal aproximada, foram divididas aleatoriamente em
três grupos, submetidos a diferentes dietas, durante quatro semanas. A perda de massa individual
(em kg) está indicada na tabela seguinte. A um nível de significância de 5%, é possível inferir que houve
efeito da dieta adotada sobre a perda de massa? Assumindo que a normalidade e a homogeneidade
foram respeitadas.
Tabela 30 – Perda de massa (kg) ao
final do período experimental
Dieta A Dieta B Dieta C Total
2,00 3,00 6,00
5,00 4,00 5,00
4,00 5,00 7,00
3,00 6,00 8,00
Σ= 14,00 18,00 26,00 58,00
n = 4 4 4 12
M = 3,50 4,50 6,50 4,83
s = 1,29 1,29 1,29 1,75
Nota: esses valores representam os resultados obtidos para a variável
dependente perda de massa (kg), para 12 mulheres distribuídas
aleatoriamente em três grupos, cada qual submetido a uma dieta diferente
durante o período de quatro semanas. A última coluna, denominada total,
fornece a informação para todos os indivíduos combinados.
A primeira etapa de um teste de hipóteses é a seleção do teste adequado. No exemplo anterior, o
objetivo é comparar a média da perda de massas em três grupos, cada qual submetido a uma dieta
diferente, sendo que os indivíduos que compõem um grupo não estão relacionados com os indivíduos
que compõem outro, ou seja, são observações independentes. Portanto, diante dasevidências, a escolha
da ANOVA de um fator aparenta ser adequada à situação.
144
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Como o tamanho amostral em cada grupo é pequeno, a figura seguinte traz os dot‑plots da
perda de massa obtida em função das dietas empregadas. Será que esses resultados são significativos,
adotando‑se α = 0,05?
0
1
2
3
4
5
6
7
8
9
Dieta A Dieta B Dieta C
Pe
rd
a
de
m
as
sa
(k
g)
Figura 39 – Dot‑plots da variável perda de massa (kg) para mulheres
submetidas a três dietas distintas. A inspeção visual dos dot‑plots indica que a
dieta C levou a maior média de perda de massa entre as apresentadas
Os pressupostos da ANOVA de um fator são os mesmos do teste t para duas amostras independentes,
já mencionados:
I – Cada amostra deve ser aleatoriamente selecionada a partir da população: o teste é robusto a
este pressuposto.
II – Deve haver independência de observações: o teste não é robusto à violação deste pressuposto.
III – A variável dependente deve apresentar distribuição normal em cada população: o teste é
relativamente robusto a este pressuposto, sobretudo se o n amostral for grande.
IV – Deve haver homogeneidade de variâncias, em outras palavras, a variabilidade em ambas as
populações deve ser equivalente: o teste é relativamente robusto a este pressuposto, sobretudo se o n
amostral for grande.
Assim, temos que as participantes foram aleatoriamente selecionadas para compor os grupos.
Há independência entre as observações, pois cada participante foi alocada em um grupo e avaliada
individualmente, sendo que a seleção de uma participante em um grupo não exerceu influência sobre a
seleção de outra participante em outro grupo. A variável dependente (perda de massa) apresenta perfil
de distribuição normal nas populações de origem (segundo enunciado), portanto, assumiremos que os
dados seguem esse perfil.
145
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
A inspeção dos Q‑Q plots reforça essa afirmação. Ao compararmos os desvios padrões das três
amostras, temos que sA = 1,29 kg, sB = 1,29 kg e sC = 1,29 kg, então as variabilidades podem ser
consideradas iguais, afirmando‑se que há homogeneidade de variâncias.
Dieta A
0 2 4 6 8 10
–2.0
–1.5
–1.0
–0.5
0.0
0.5
1.0
1.5
2.0
Valores observados
N
or
m
al
e
sp
er
ad
a
Dieta B
0 2 4 6 8 10
–2.0
–1.5
–1.0
–0.5
0.0
0.5
1.0
1.5
2.0
Valores observados
N
or
m
al
e
sp
er
ad
a
Dieta C
0 2 4 6 8 10
–2.0
–1.5
–1.0
–0.5
0.0
0.5
1.0
1.5
2.0
Valores observados
N
or
m
al
e
sp
er
ad
a
Figura 40 – Q‑Q plots da variável perda de massa (kg) em função da dieta adotada. O Q‑Q plots indica
que os dados dos conjuntos apresentam distribuição que tende à normalidade (pontos se aproximam
da linha de tendência central), sendo que nenhuma observação ultrapassou o limite
de ±2,0 desvios padrões em função da média
A próxima etapa consiste na descrição das hipóteses nula e alternativa. A hipótese nula nos dirá que
as médias populacionais são iguais entre si. A hipótese alternativa afirmará que nem todas as médias
populacionais são iguais entre si, ou seja, pelo menos uma das médias será diferente das demais. Isso
significa que a diferença entre pelo menos um par de médias amostrais (M1, M2 e M3) deverá ser maior
do que o erro amostral poderia explicar, assumindo que foram extraídas da mesma população. Assim:
H0: µ1 = µ2 = µ3
146
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Ha: pelo menos uma das médias populacionais é diferente das demais
Em seguida, devemos estimar o valor crítico do teste. A interpretação do valor crítico é
semelhante à que vimos para o teste t, entretanto, lidamos, agora, com outro teste estatístico
e deveremos procurar por esse valor na tabela seguinte (excerto do Apêndice C). Deveremos levar
em conta algumas observações:
I – Qual o nível de significância (α) adotado?
II – Quantos graus de liberdade há no numerador da equação do teste?
III – Quantos graus de liberdade há no denominador da equação do teste?
Os graus de liberdade no numerador da estatística F, que estão representados nas colunas da tabela
de valores críticos de F, são os graus de liberdade entre os grupos e correspondem a:
nGrupos – 1
Os graus de liberdade no denominador da estatística F, que estão representados nas linhas da tabela
de valores críticos de F, são os graus de liberdade dentro dos grupos e correspondem a:
nTotal – nGrupos
Os graus de liberdade totais da estatística F correspondem a:
nTotal – 1
Para os dados do nosso exemplo, temos que o nível de significância é α = 0,05 ou 5%; os
graus de liberdade no numerador nGrupos – 1 = 3 – 1 = 2; e os graus de liberdade no denominador
nTotal – nGrupos = 12 – 3 = 9.
Com base nesses valores, é possível recorrer a uma tabela F (Apêndice C) e cruzar as informações dos
valores dos graus de liberdade no numerador com as dos graus de liberdade no denominador (note que
a tabela de valores críticos de F possui nível de significância fixado em α = 0,05; para outros valores de
α, outras tabelas deverão ser consultadas, em outras fontes).
Sendo GLNumerador = 2 e GLDenominador = 9, com α = 0,05, observamos que o valor crítico de F para essa
estatística será igual a 4,256 (veja a tabela seguinte).
Fcrit = 4,256
147
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Tabela 31 – Valores críticos de F, α = 0,05
GL denominador GL numerador
1 2 3 4 5 6 7 8
1 161,448 199,500 215,707 224,583 230,162 233,986 236,768 238,883
2 18,513 19,000 19,164 19,247 19,296 19,330 19,353 19,371
3 10,128 9,552 9,277 9,117 9,013 8,941 8,887 8,845
4 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041
5 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818
6 5,987 5,143 4,757 4,534 4,387 4,284 4,207 4,147
7 5,591 4,737 4,347 4,120 3,972 3,866 3,787 3,726
8 5,318 4,459 4,066 3,838 3,687 3,581 3,500 3,438
9 5,117 4,256 3,863 3,633 3,482 3,374 3,293 3,230
10 4,965 4,103 3,708 3,478 3,326 3,217 3,135 3,072
11 4,844 3,982 3,587 3,357 3,204 3,095 3,012 2,948
12 4,747 3,885 3,490 3,259 3,106 2,996 2,913 2,849
13 4,667 3,806 3,411 3,179 3,025 2,915 2,832 2,767
14 4,600 3,739 3,344 3,112 2,958 2,848 2,764 2,699
15 4,543 3,682 3,287 3,056 2,901 2,790 2,707 2,641
Nota: a distribuição F varia conforme os graus de liberdade (GL). Como o nível de significância adotado no nosso
exemplo é α = 0,05 e o teste possui GLNumerador = 2 e GLDenominador = 9, temos que o valor crítico de F para esse
cálculo será de 4,256 (conforme destaque).
Para a ANOVA, a tomada de decisão se dará de modo que:
• se Fcalc < Fcrit, não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira;
• se Fcalc ≥ Fcrit, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Para compreendermos a fórmula da ANOVA de um fator e calcularmos o valor da estatística F,
usamos a equação que define a variância amostral.
Lembrete
Fórmula da variância amostral:
( )22 X M soma dos quadradoss
n 1 grau de liberdade
∑ −
= =
−
Sendo:
s2 = a variância amostral
148
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
X = um valor observado
M = a média amostral
n = o tamanho da amostra
Simplificadamente, a variância amostral pode ser definida como a soma dos quadrados dividida
por grau de liberdade. Para o cálculo da ANOVA, existem três somas dos quadrados que deverão ser
calculadas: a soma dos quadrados entre os grupos, a dentro dos grupos e a total. A soma dos quadrados
total representa toda a variabilidade existente nos dados, assim:
SQTotal = SQEntre + SQDentro
Para calcular SQTotal, todas as observações são tratadas como se houvesse apenas um único e grande
grupo: a média total será subtraída de cada observação; esses desviosserão elevados ao quadrado e,
então, somados entre si. De forma simplificada, podemos usar a equação a seguir:
( ) ( )
2
2
Total
X
SQ X
n
∑
= ∑ −
Sendo:
SQTotal = a soma dos quadrados total
X = um valor observado
n = o tamanho da amostra
Essa fórmula indica que devemos:
I – Elevar todos os valores observados ao quadrado e somá‑los entre si.
II – Somar todos os valores entre si, elevar a soma ao quadrado e dividi‑la pelo total de elementos
da amostra.
III – Subtrair o resultado da etapa II do resultado da etapa I.
Com base nos valores do nosso exemplo, observe:
149
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Tabela 32 – Perda de massa (kg) ao final do
período experimental, quadrados e somas
Dieta A Dieta B Dieta C Total
X X2 X X2 X X2
2,00 4,00 3,00 9,00 6,00 36,00
5,00 25,00 4,00 16,00 5,00 25,00
4,00 16,00 5,00 25,00 7,00 49,00
3,00 9,00 6,00 36,00 8,00 64,00 X X2
Σ= 14,00 54,00 18,00 86,00 26,00 174,00 58,00 314,00
n = 4 4 4 12
Substituindo‑os na equação:
( ) ( )
2
2
Total
X
SQ X
n
∑
= ∑ −
( )2
Total
58
SQ 314
12
= −
Total
3364
SQ 314
12
= −
TotalSQ 314 280,33 33,67= − =
Em seguida, devemos calcular a soma dos quadrados entre os grupos, conforme a seguinte equação:
( ) ( )2 2Grupo
Entre
Grupo
X X
SQ
n n
∑ ∑ = ∑ −
Sendo:
SQEntre = a soma dos quadrados entre os grupos
XGrupo = os valores observados em um grupo
nGrupo = o número de elementos em um grupo
X = os valores observados
n = o tamanho da amostra
150
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Essa fórmula indica que devemos:
I – Para cada grupo: somar todos os valores observados, elevar seu resultado ao quadrado e, então,
dividir pelo tamanho do respectivo grupo. Somar, então, os resultados obtidos para todos os grupos.
II – Somar todos os valores entre si, elevar a soma ao quadrado e dividi‑la pelo total de elementos
da amostra.
III – Subtrair o resultado da etapa II do resultado da etapa I.
Substituindo‑os, na equação:
( ) ( )2 2Grupo
Entre
Grupo
X X
SQ
n n
∑ ∑ = ∑ −
( )22 2 2
Entre
5814 18 26
SQ
4 4 4 12
= + + −
Entre
196 324 676 3364
SQ
4 4 4 12
= + + −
Entre
1196 3364
SQ
4 12
= −
EntreSQ 299 280,33 18,67= − =
Por fim, calculamos a soma dos quadrados dentro dos grupos, conforme a equação a seguir:
( )2Grupo2
Dentro Grupo
Grupo
X
SQ X
n
∑ = ∑ ∑ −
Sendo:
SQDentro = a soma dos quadrados dentro dos grupos
XGrupo = os valores observados em um grupo
nGrupo = o número de elementos em um grupo
151
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Nessa fórmula, deve‑se:
I – Para cada grupo: elevar todos os valores observados ao quadrado e somá‑los.
II – Para cada grupo: somar todos os valores observados, elevar seu resultado ao quadrado e, então,
dividir pelo tamanho do respectivo grupo.
III – Para cada grupo: subtrair o resultado da etapa II do resultado da etapa I.
IV – Somar todos os valores obtidos na etapa III.
Substituindo‑os, na equação:
( )2Grupo2
Dentro Grupo
Grupo
X
SQ X
n
∑ = ∑ ∑ −
2 2 2
Dentro
14 18 26
SQ 54 86 174
4 4 4
= − + − + −
Dentro
196 324 676
SQ 54 86 174
4 4 4
= − + − + −
( ) ( ) ( )DentroSQ 54 49 86 81 174 169= − + − + −
( ) ( ) ( )DentroSQ 5 5 5 15= + + =
Note que:
SQTotal = SQEntre + SQDentro
33,67 = 18,67 + 15
33,67 = 33,67
Agora que as somas dos quadrados e os graus de liberdade foram calculados, podemos calcular a estatística F.
Organizando os valores obtidos até o momento em uma tabela, temos:
152
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Tabela 33 – Cálculos da ANOVA
Fonte de variação Soma dos quadrados
Graus de
liberdade
Quadrados
médios F
Entre os grupos 18,67 2 SQEntre/GLEntre QMEntre/QMDentro
Dentro dos grupos 15,00 9 SQDentro/GLDentro
Total 33,67 11
Note que, a partir das somas dos quadrados e dos graus de liberdade, é possível obter medidas de
variância, que também podemos chamar de quadrados médios. Duas dessas medidas são importantes
para nosso cálculo, o quadrado médio entre os grupos e o quadrado médio dentro dos grupos, que
podem ser obtidos dividindo‑se as somas dos quadrados pelos respectivos graus de liberdade, conforme
apontado na tabela anterior.
Em posse desses valores, podemos calcular a estatística F, que corresponde a:
Entre
Dentro
QM
F
QM
=
Sendo:
F = a estatística F
QMEntre = o quadrado médio entre os grupos
QMDentro = o quadrado médio dentro dos grupos
Atualizando as informações da tabela anterior, obtemos a tabela seguinte:
Tabela 34 – Cálculos completos da ANOVA
Fonte de variação Soma dos quadrados
Graus de
liberdade
Quadrados
médios F
Entre os grupos 18,67 2 9,335 5,600
Dentro dos grupos 15,00 9 1,667
Total 33,67 11
Para a interpretação do resultado do teste, é necessário saber se a hipótese nula foi rejeitada. Temos
que Fcalc = 5,600 e Fcrit = 4,256. Devemos observar que, se Fcalc < Fcrit, não há evidências para rejeitar H0,
devendo‑se aceitá‑la como verdadeira; já se Fcalc ≥ Fcrit, há evidências para rejeitar H0, devendo‑se aceitar
Ha como verdadeira.
153
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Nesse caso, estamos diante da segunda situação, pois:
Fcalc ≥ Fcrit
5,600 ≥ 4,256
Portanto, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Quanto será a chance de erro (p)? Ela é maior ou menor que o nível de significância (α) adotado?
A interpretação segue o mesmo raciocínio apresentado no teste t para duas amostras independentes.
Se Fcalc < Fcrit, p > α, logo, não existem evidências para rejeitar H0, devendo‑se aceitá‑la como
verdadeira; se Fcalc ≥ Fcrit, p ≤ α, logo, os dados fornecem evidências para rejeitar H0, devendo‑se aceitar
Ha como verdadeira.
Assim, como:
Fcalc ≥ Fcrit, logo, p < α
5,600 ≥ 4,256, logo, p < 0,05
Se p < 0,05, rejeita‑se H0 e aceita‑se Ha como verdadeira. Para obter o valor exato da chance de
erro (p), teríamos duas abordagens: calcular a integral da área sob a curva, além do valor de Fcalc, ou
utilizar um software de análise (para o exemplo em questão, via software, p = 0,0263). Note que,
independentemente de estar em posse do valor exato da chance de erro (p) ou não, nossa conclusão
não se altera: p < 0,05.
Uma vez interpretado o resultado, chegou‑se à conclusão de que ao menos uma das médias é
diferente das demais. Mas qual(is)? Para responder a essa pergunta, precisamos efetuar um teste
post‑hoc para múltiplas comparações.
Há uma grande variedade de testes post‑hoc, como Bonferroni, Scheffé, Newman‑Keuls, entre
outros. Veremos o teste de Tukey (HSD, do inglês honestly significant difference, diferença mínima
significativa). Por meio do teste de Tukey, poderemos determinar uma diferença mínima necessária para
considerar duas médias significativamente distintas entre si.
A fórmula do teste de Tukey (HSD) é como segue:
Dentro
Menor Grupo
QM
HSD q
n
=
154
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Sendo:
HSD = a diferença mínima necessária para considerar duas médias significativamente distintas entre si
q = um valor da amplitude estudentizada para uso no teste de Tukey (Apêndice D)
QMDentro = o quadrado médio dentro dos grupos
nMenor Grupo = tamanho do menor grupo
Para obter o valor de q, é necessário recorrer a uma tabela de valores da amplitude total estudentizada
(disponível no Apêndice D). Observe um recorte na tabela em seguida.
Tabela 35 – Valores da amplitude total estudentizada (q),
para uso no teste de Tukey, α = 0,05
GLDentro
Número de grupos
2 3 4 5 6 7 8 9
1 17,969 26,97632,819 37,082 40,408 43,119 45,397 47,357
2 6,085 8,331 9,798 10,881 11,734 12,435 13,027 13,539
3 4,501 5,910 6,825 7,502 8,037 8,478 8,852 9,177
4 3,926 5,040 5,757 6,287 6,706 7,053 7,347 7,602
5 3,635 4,602 5,218 5,673 6,033 6,330 6,582 6,801
6 3,460 4,339 4,896 5,305 5,628 5,895 6,122 6,319
7 3,344 4,165 4,681 5,060 5,359 5,606 5,815 5,997
8 3,261 4,041 4,529 4,886 5,167 5,399 5,596 5,767
9 3,199 3,948 4,415 4,755 5,024 5,244 5,432 5,595
10 3,151 3,877 4,327 4,654 4,912 5,124 5,304 5,460
Nota: um valor de q é necessário para o cálculo do teste post‑hoc de Tukey. Um valor de q pode
ser obtido a partir da intersecção do número de grupos presente em sua análise (colunas) com o
grau de liberdade dentro dos grupos (linhas). A um nível de significância α = 0,05, GLDentro = 9 e
nGrupos = 3, temos que o valor de q para esse cálculo será de 3,948 (conforme destaque).
Substituindo‑se os valores na equação:
Dentro
Menor Grupo
QM
HSD q
n
=
1,667
HSD 3,948
4
=
155
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
HSD 3,948 0,4168=
HSD 3,948 0,6456 2,55= × =
Quaisquer médias que diferirem entre si por pelo menos 2,55 unidades serão consideradas
significativamente distintas entre si. Assim, se efetuarmos uma comparação entre as médias, é possível
evidenciar que o único par da comparação que obteve uma diferença entre médias acima de 2,55 foi
dieta A versus dieta C:
Tabela 36 – Comparação múltipla entre as médias
Grupo 1 Grupo 2 |M1 – M2|
Diferença
crítica
Diferença
significativa
Dieta A Dieta B 1,00 2,55 Não
Dieta A Dieta C 3,00 2,55 Sim
Dieta B Dieta C 2,00 2,55 Não
Uma vez interpretado o resultado, podemos prosseguir para sua descrição por extenso. Devemos
destacar alguns elementos importantes na resposta, tais como:
I – o teste utilizado;
II – o tamanho da amostra;
III – o valor calculado do teste estatístico acompanhado dos graus de liberdade;
IV – o nível de significância (α) adotado;
V – se H0 foi rejeitada ou não;
VI – o resultado do teste post‑hoc (caso efetuado).
Vejamos como ficaria a descrição do nosso exemplo: com o objetivo de avaliar se haveria efeito
da dieta adotada sobre a perda de massa corporal, doze mulheres, de mesma faixa etária e massa
corporal aproximada, foram distribuídas aleatoriamente em três grupos que diferiram entre si pela dieta
praticada. Os indivíduos que adotaram a dieta A perderam, em média, MA = 3,50 kg (sA = 1,29 kg, nA = 4);
os indivíduos que seguiram a dieta B perderam, em média, MB = 4,50 kg (sB = 1,29 kg, nB = 4); já os
indivíduos que seguiram a dieta C eliminaram, em média, MC = 6,50 kg (sC = 1,29 kg, nC = 4).
Uma análise de variância de um fator foi conduzida, a fim de investigar se as médias observadas
poderiam ser consideradas distintas entre si a um nível de significância α = 0,05. Houve uma diferença
significativa da dieta escolhida sobre a perda de massa média (F(2,9) = 5,600, p < 0,05). Um teste post‑hoc
156
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
de Tukey (HSD) foi efetuado para avaliar quais médias poderiam ser consideradas distintas entre si,
concluiu‑se, assim, que a dieta C levou a uma perda de massa significativamente maior do que a dieta A
(diferença entre médias = 3,0 kg, diferença mínima necessária = 2,55 kg), sendo, portanto, mais efetiva
para o objetivo inicial, em termos comparativos.
8 TESTES DE HIPÓTESES PARA VARIÁVEIS CATEGÓRICAS
8.1 Teste do chi quadrado
Vimos, até o momento, os testes z, t e F, que vêm de uma família de testes chamados testes
paramétricos. Esses testes devem ser utilizados apenas quando os pressupostos acerca da população
são respeitados. Em contrapartida, os testes não paramétricos não assumem os mesmos pressupostos.
Existem duas situações em que os testes não paramétricos são empregados:
• se a variável dependente é avaliada em escala nominal ou ordinal, então um teste não paramétrico
deve ser considerado;
• se um pesquisador planeja utilizar um teste paramétrico, mas há violação a algum(ns) pressuposto(s).
Em geral, testes não paramétricos são menos poderosos do que os testes paramétricos. Abordaremos
um teste chamado teste do chi quadrado (x2), que é empregado quando lidamos com variáveis tratadas
como categóricas. Existem três empregos principais para esse teste estatístico:
I – Um teste de chi quadrado (x2) de aderência (ou de ajustamento) serve para ajudar o pesquisador
a decidir se os dados que ele colheu se ajustam bem a uma determinada lei. Em outras palavras, serve
para testar a adequabilidade de um modelo probabilístico a um conjunto de dados observados.
II – Um teste de chi quadrado (x2) de homogeneidade visa verificar se uma variável aleatória se
comporta de modo similar ou homogêneo em várias subpopulações. Em outras palavras, em um teste
de chi quadrado de homogeneidade, podemos testar a afirmação de que diferentes populações têm a
mesma proporção de indivíduos com alguma característica.
III – Um teste de chi quadrado (x2) de independência é semelhante ao teste de chi quadrado de
aderência, mas considera uma lei oriunda da própria tabela de dados experimentais, a fim de avaliar
se há ou não dependência entre duas variáveis. Quanto maior a dependência entre as duas variáveis,
maior será o valor de x2. Quando as duas variáveis forem independentes, o valor de x2 tenderá a zero.
Para uma melhor compreensão, vejamos que, segundo Mendel, os resultados dos cruzamentos de
ervilhas amarelas redondas com ervilhas verdes enrugadas seguem uma distribuição de probabilidades
dada pela seguinte razão de fenótipos: 9:3:3:1.
Uma amostra de 556 ervilhas resultantes de cruzamentos de ervilhas amarelas redondas com ervilhas
verdes enrugadas foi classificada da seguinte forma:
157
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Tabela 37 – Resultados obtidos para o cruzamento de ervilhas
Resultado Amarela redonda
Amarela
enrugada
Verde
redonda
Verde
enrugada
Frequência observada 315 101 108 32
Consideraremos α = 0,05, a fim de investigar se há evidências de que os resultados desse experimento
estejam de acordo com a distribuição de probabilidades proposta por Mendel.
O cenário anterior se adequa à aplicação de um teste de aderência, pois se deseja avaliar se os
resultados obtidos estão de acordo com a distribuição de probabilidades proposta por Mendel.
Os pressupostos de um teste do chi quadrado são três:
I – Cada amostra deve ser aleatoriamente selecionada a partir da população: o teste é robusto a
este pressuposto.
II – Deve haver independência de observações: o teste não é robusto à violação deste pressuposto.
III – A frequência esperada em cada casela da tabela deve ser de, no mínimo, cinco casos: o teste
não é robusto à violação deste pressuposto, portanto, o chi quadrado não poderá ser calculado se não
houver um número mínimo de casos. Veremos mais adiante como estimar a frequência esperada.
O próximo passo consiste em listar as hipóteses nula e alternativa. A hipótese nula afirma que
a proporção de cada categoria na população respeita valores específicos. Isso significa que, desde
que a amostra seja representativa da população, as proporções na amostra deverão corresponder
a valores específicos. Lembre‑se, contudo, da existência do erro amostral, logo, não se espera que a
amostra corresponda exatamente aos valores esperados na população. A hipótese alternativa afirma
que a distribuição das características na população é diferente daqueles valores específicos. Em outras
palavras, a diferença entre as frequências observadas na amostra e na população seriam muito grandes
para serem explicadas apenas pelo erro amostral. Assim:
• H0: o modelo proposto é adequado a esta situação;
• Ha: o modelo proposto não é adequado a esta situação.
Em nosso exemplo, podemos listar que, para H0, a razão 9:3:3:1 é observadanessa amostra; para Ha,
ao menos uma das igualdades não se verifica segundo a razão mendeliana.
Em seguida, devemos estimar o valor crítico do teste. A interpretação do valor crítico é semelhante
à que vimos para os demais testes, entretanto, lidamos, agora, com outro teste estatístico e devemos
procurar por esse valor na tabela seguinte (excerto do Apêndice E). Devemos, também, levar em conta
as seguintes observações:
158
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
• Qual o nível de significância (α) adotado?
• Quantos graus de liberdade possui nosso teste?
Os graus de liberdade do chi quadrado (x2) de aderência, que estão representados nas linhas da
tabela de valores críticos, correspondem a:
GL = nCategorias – 1
Já o nível de significância é definido a priori e dependerá da escolha do pesquisador. Tradicionalmente
se emprega α = 0,05.
Para os dados do nosso exemplo, temos o nível de significância é α = 0,05 ou 5% e os graus de
liberdade GL = nCategorias – 1 = 4 – 1 = 3.
Com base nesses valores, é possível recorrer a uma tabela x2 (Apêndice E) e cruzar as informações
entre os valores dos graus de liberdade com o nível de significância adotado.
Sendo GL = 3, com α = 0,05, observamos que o valor crítico de x2 para essa estatística será igual a
7,815 (veja na tabela a seguir).
x2crit = 7,815
Tabela 38 – Valores críticos de
chi quadrado (excerto do Apêndice E)
GL
Nível de significância adotado
0,100 0,050 0,025 0,010 0,005 0,001
1 2,706 3,841 5,024 6,635 7,879 10,828
2 4,605 5,991 7,378 9,210 10,597 13,816
3 6,251 7,815 9,348 11,345 12,838 16,266
4 7,779 9,488 11,143 13,277 14,860 18,467
5 9,236 11,070 12,833 15,086 16,750 20,515
6 10,645 12,592 14,449 16,812 18,548 22,458
7 12,017 14,067 16,013 18,475 20,278 24,322
Nota: a distribuição x2 varia conforme os graus de liberdade (GL). Como o nível de
significância adotado no nosso exemplo é α = 0,05 e o teste possui GL = 3, temos
que o valor crítico de x2 para esse cálculo será de 7,815 (conforme destaque).
Para o chi quadrado, a tomada de decisão se dará de modo que:
• se x2calc < x
2
crit, não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira;
• se x2calc ≥ x
2
crit, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
159
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Para calcular o valor da estatística x2, a primeira etapa é obter a frequência esperada e, depois, calcular
os resíduos para cada casela, lembrando que o resíduo = frequência observada – frequência esperada.
Para calcular a frequência esperada, dada a razão mendeliana de 9:3:3:1, temos:
n = 556 ervilhas
9+3+3+1=16
556 x 9/16 = 312,75
556 x 3/16 = 104,25
556 x 3/16 = 104,25
556 x 1/16 = 34,75
Assim:
Tabela 39 – Frequência observada e frequência
esperada para o cruzamento de ervilhas
Resultado Amarela redonda
Amarela
enrugada
Verde
redonda
Verde
enrugada
Frequência observada 315 101 108 32
Frequência esperada 312,75 104,25 104,25 34,75
A diferença entre a frequência observada e a frequência esperada é chamada de resíduo. Observe a
tabela a seguir:
Tabela 40 – Frequência observada, frequência
esperada e resíduos para o cruzamento de ervilhas
Resultado Amarela redonda
Amarela
enrugada
Verde
redonda
Verde
enrugada
Frequência observada 315 101 108 32
Frequência esperada 312,75 104,25 104,25 34,75
Resíduo 2,25 ‑3,25 3,75 ‑2,75
Por fim, podemos substituir os valores na equação do chi quadrado:
( ) ( )2 2Observada Esperada2
Esperada Esperada
f f resíduo
f f
−
χ = ∑ = ∑
160
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Sendo:
x2 = o valor da estatística do teste de chi quadrado
fObservada = frequência observada
fEsperada = frequência esperada
Substituindo‑se, na equação, os valores já calculados, temos:
( ) ( )2 2Observada Esperada2
Esperada Esperada
f f resíduo
f f
−
χ = ∑ = ∑
( ) ( ) ( ) ( )2 2 2 22 2,25 3,25 3,75 2,75
312,75 104,25 104,25 34,75
− −
χ = + + +
2 0,016 0,101 0,135 0,218χ = + + +
2 0,470χ =
Assim, para a interpretação do resultado do teste, é necessário saber se a hipótese nula foi rejeitada.
Temos que x2calc = 0,470 e x
2
crit = 7,815. Devemos observar que, se x
2
calc < x
2
crit, não há evidências para
rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se x
2
calc ≥ x
2
crit, há evidências para rejeitar H0,
devendo‑se aceitar Ha como verdadeira.
Nesse caso, estamos diante da primeira situação, pois:
x2calc < x
2
crit
0,470 < 7,815
Portanto, não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira.
Quanto será a chance de erro (p)? Ela é maior ou menor que o nível de significância (α) adotado?
A interpretação segue o mesmo raciocínio apresentado para os últimos testes.
Se x2calc < x
2
crit, p > α, logo, não existem evidências para rejeitar H0, devendo aceitá‑la como
verdadeira; se x2calc ≥ x
2
crit, p ≤ α, logo, os dados fornecem evidências para rejeitar H0, devendo‑se
aceitar Ha como verdadeira.
161
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Como:
x2calc < x
2
crit, logo p > α
0,470 < 7,815, logo p > 0,05
Se p > 0,05, aceita‑se H0 como verdadeira.
Uma vez interpretado o resultado, podemos prosseguir para sua descrição por extenso. Devemos
destacar alguns elementos importantes na resposta, tais como:
I – o teste utilizado;
II – tamanho da amostra;
III – valor calculado do teste estatístico acompanhado dos graus de liberdade;
IV – nível de significância (α) adotado;
V – se H0 foi rejeitada ou não.
Vejamos como ficaria a descrição do nosso exemplo: com o objetivo de avaliar se uma amostra de
556 ervilhas seguiria uma distribuição de probabilidades mendeliana, dada por uma razão de fenótipos
(9:3:3:1), um teste de chi quadrado de aderência foi empregado. Para um nível de significância de 5%,
os dados não forneceram evidências para rejeitar H0, ou seja, essa amostra segue uma distribuição de
probabilidades mendeliana na proporção de 9:3:3:1 (x2(3) = 0,470; p > 0,05).
Observe, agora, um exemplo de um teste de chi quadrado (x2) de independência, quando se considera
uma lei oriunda da própria tabela de dados experimentais, a fim de avaliar se há ou não dependência
entre duas variáveis.
Suponhamos, então, que um pesquisador resolveu avaliar se a droga Prozac (fluoxetina) apresentaria
efeitos benéficos no tratamento da anorexia em pacientes que sofrem desse distúrbio. O Prozac é um inibidor
seletivo da recaptação de serotonina, utilizado normalmente para combater sintomas de depressão, pânico,
ansiedade e sintomas obsessivos‑compulsivos. Após o tratamento, observou‑se se o quadro de anorexia seria
superado (sucesso) ou se haveria reincidência do distúrbio alimentar (falha). Com base nos resultados a seguir
e considerando α = 0,05, há associação entre o tipo de tratamento e a permanência do distúrbio alimentar?
Tabela 41 – Frequência observada para tratamento
com Prozac ou placebo e efeito sobre anorexia
Anorexia
Droga Sucesso Falha
Prozac 13 36
Placebo 14 30
162
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Assumindo que os pressupostos não foram violados, como proceder em situações em que há duas
variáveis categóricas na mesma tabela? O objetivo de um teste do chi quadrado (x2) de independência
é, justamente, avaliar se existe ou não associação entre as variáveis categóricas.
Sendo as hipóteses nula e alternativa:
• H0: as variáveis são independentes.
• Ha: as variáveis não são independentes.
Para proceder com o cálculo, devemos encontrar os valores totais para linhas e colunas da tabela de
frequência observada:
Tabela 42 – Frequência observada para tratamento
com Prozac ou placebo e efeito sobre anorexia, com
destaque para os totais das linhas e das colunasAnorexia
Droga Sucesso Falha Totais
Prozac 13 36 49
Placebo 14 30 44
Totais 27 66 93
Em seguida, calcula‑se a frequência esperada, sendo que, para cada casela, a frequência esperada
será igual a:
linha coluna
Esperada
tabela
n n
f
n
×
=
Tabela 43 – Frequência esperada para tratamento
com Prozac ou placebo e efeito sobre anorexia
Anorexia
Droga Sucesso Falha
Prozac 14,23 34,77
Placebo 12,77 31,23
A partir das frequências observada e esperada, obtêm‑se os resíduos (frequência observada –
frequência esperada):
163
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Tabela 44 – Resíduos para tratamento com
Prozac ou placebo e efeito sobre anorexia
Anorexia
Droga Sucesso Falha
Prozac ‑1,23 1,23
Placebo 1,23 ‑1,23
Prosseguindo com o cálculo do chi quadrado, substituindo‑se, na equação, os valores já calculados:
( ) ( )2 2Observada Esperada2
Esperada Esperada
f f resíduo
f f
−
χ = ∑ = ∑
( ) ( ) ( ) ( )2 2 2 22 1,23 1,23 1,23 1,23
14,23 34,77 12,77 31,23
− −
χ = + + +
2 0,106 0,043 0,118 0,048χ = + + +
2 0,315χ =
Qual será o valor crítico? Como trabalhamos com uma tabela que possui duas linhas e duas colunas,
o número de graus de liberdade será igual a:
GL = (ncoluna ‑1)(nlinha – 1) = (2 – 1)(2 – 1) = 1 x 1 = 1
Assim, para um nível de significância α = 0,05 e uma estatística x2 com 1 grau de liberdade, espera‑se
um valor crítico de 3,841 (observe no Apêndice E).
Quanto à interpretação do resultado do teste, é necessário, em primeiro lugar, saber se a hipótese
nula foi rejeitada. Temos que x2calc = 0,315 e x
2
crit = 3,841. Devemos observar que, se x
2
calc < x
2
crit, não há
evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se x
2
calc ≥ x
2
crit, há evidências para
rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Nesse caso, estamos diante da primeira situação, pois:
x2calc < x
2
crit
0,315 < 3,841
Portanto, não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira.
164
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Quanto será a chance de erro (p)? Ela é maior ou menor que nível de significância (α) adotado?
Se x2calc < x
2
crit, p > α, logo, não existem evidências para rejeitar H0, devendo aceitá‑la como
verdadeira; se x2calc ≥ x
2
crit, p ≤ α, logo, os dados fornecem evidências para rejeitar H0, devendo‑se
aceitar Ha como verdadeira.
Como:
x2calc < x
2
crit, logo p > α
0,315 < 3,841, logo p > 0,05
Se p > 0,05, aceita‑se H0 como verdadeira.
Uma vez interpretado o resultado, podemos prosseguir para sua descrição por extenso. Devemos
destacar alguns elementos importantes na resposta, tais como:
I – o teste utilizado;
II – tamanho da amostra;
III – valor calculado do teste estatístico acompanhado dos graus de liberdade;
IV – nível de significância (α) adotado;
V – se H0 foi rejeitada ou não.
Vejamos como ficaria a descrição do nosso exemplo: com o objetivo de avaliar se haveria associação
entre o tipo de tratamento (Prozac ou placebo), e se os pacientes apresentariam superação ou reincidência
no quadro de anorexia, um teste de chi quadrado de independência foi empregado. Para um nível de
significância de 5%, os dados não forneceram evidências para rejeitar H0 (x
2
(1) = 0,315; p > 0,05), ou
seja, conclui‑se que as variáveis são independentes: tanto faz serem tratados com uma droga ou outra,
a chance de reincidirem no quadro de anorexia é a mesma para os participantes e independe do tipo de
tratamento utilizado.
Resumo
O teorema central do limite é baseado em uma distribuição amostral da
média e assume três predições importantes: a distribuição amostral tenderá à
normalidade; a média da distribuição amostral será a média populacional;
e o erro padrão da média poderá ser calculado se forem conhecidos o desvio
padrão e o tamanho amostral.
165
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
BIOESTATÍSTICA APLICADA À BIOMEDICINA
O intervalo de confiança de 95% para a média populacional é uma
estimativa de um valor populacional a partir da média amostral, criando um
intervalo dentro do qual o valor populacional possui chance de ser encontrado.
Testes de hipóteses utilizam amostras para extrapolar predições sobre a
população. Se o que for observado em uma amostra estiver próximo ao que
for esperado, com base na hipótese, então não há motivos para refutá‑la.
A hipótese nula deve ser emparelhada com uma hipótese que a anule
mutuamente, e que, em geral, o pesquisador acredite ser verdadeira. Esta
hipótese é conhecida como hipótese alternativa. Se a hipótese nula não for
rejeitada, o pesquisador não pode afirmar que ela foi provada, apenas que
não houve evidências suficientes para rejeitá‑la.
Para calcular um teste de hipóteses, lembre‑se de escolher o teste
apropriado em função da pergunta de pesquisa e das variáveis envolvidas.
Sempre avalie se os pressupostos estão sendo violados ou não. Liste as
hipóteses nula e alternativa. Obtenha o valor crítico de um teste e
esquematize, de forma clara, seu procedimento para tomada de decisão.
Calcule, então, o teste estatístico e interprete os resultados.
Um teste z para uma amostra é utilizado para comparar uma média
amostral a uma média populacional ou a um valor específico, desde
que o desvio padrão populacional seja conhecido. Caso o desvio padrão
populacional não seja conhecido, um teste t para uma amostra é uma
alternativa possível. Diferentemente do teste z, com um teste t obteremos
uma estatística t, que deverá ser interpretada de forma adequada.
Um teste t para duas amostras independentes compara as suas médias,
como, por exemplo, de dois grupos experimentais não relacionados. Existem
dois tipos de testes t para duas amostras: para amostras independentes e
para amostras emparelhadas. Neste caso, deve‑se optar pelo teste t pareado.
A análise de variância (ANOVA) é uma família de testes que também
visa comparar médias entre si, porém, diferentemente do teste t, é possível
comparar mais de duas. Caso um resultado significativo aponte pela
rejeição da hipótese nula, um teste post‑hoc deverá ser empregado, para
que se localize entre quais pares de médias realmente há uma diferença
mínima significativa.
Um teste do chi quadrado é um exemplo de teste não paramétrico que
pode ser usado com variáveis categóricas, quando o interesse é investigar
se a frequência de eventos em uma amostra se adequa a algum modelo
probabilístico ou se existe, ou não, associação entre variáveis categóricas.
166
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Unidade II
Todos os testes de hipóteses apresentam raciocínios semelhantes para
a tomada de decisão, sendo que, se estatísticacalc < estatísticacrit, p > α,
logo, não existem evidências para rejeitar H0, devendo‑se aceitá‑la como
verdadeira; agora, se estatísticacalc ≥ estatísticacrit, p ≤ α, logo, os dados
fornecem evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira.
Exercícios
Questão 1. (Idecan 2014) As reações adversas de uma nova vacina que foi desenvolvida para gripe
estão sendo estudadas. A tabela resume os resultados obtidos.
Tabela 45
Reação adversa
Tratamento Não Sim
Vacina 83 17
Placebo 87 13
Deseja‑se testar a hipótese de homogeneidade na ocorrência de reações adversas entre os pacientes
tratados com placebo e vacina. O valor da contribuição da primeira célula da tabela para a estatística do
teste chi quadrado de homogeneidade é, aproximadamente, igual a:
A) 0,023.
B) 0,047.
C) 1,232.
D) 2,447.
E) 3,651.
Resposta correta: alternativa B.
Análise da questão
O valor da contribuição da primeira célula da tabela para a estatística do teste chi quadrado de
homogeneidade é obtido da seguinte fórmula:
Pela fórmula:
X
E
E
2
20
�
�� ��
167
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
2019
BIOESTATÍSTICA APLICADA À BIOMEDICINA
Primeiro você vai totalizar as linhas e colunas.
Tabela 46
Reação adversa
Tratamento Não Sim Total
Vacina 83 17 100
Placebo 87 13 100
Total 170 30 200
Em seguida você irá calcular os valores esperados (E):
Os valores esperados, que estão entre parênteses na tabela a seguir, são calculados multiplicando
o total de cada linha pelo total de cada coluna e em seguida dividindo este resultado pelo total geral
(número de sujeitos da amostra).
Tabela 47
Reação adversa
Tratamento Não Sim Total
Vacina 83 (85) 17 (15) 100
Placebo 87 (85) 13 (15) 100
Total 170 30 200
E, por último, você irá calcular (O–E)2/E:
(O‑E)2/E =
(83‑85)2/85 =
0,047
Questão 2. (Cetro 2013) Para fazer uso do teste de chi quadrado, é preciso que se satisfaçam
algumas condições. Assinale a alternativa que não apresenta uma dessas condições.
A) Cada grupo deve ter itens selecionados aleatoriamente.
B) Observações devem ser feitas por frequências ou contagens.
C) Os grupos devem ser codependentes.
D) Cada observação pertence a uma e somente uma categoria.
E) A amostra é grande em relação ao grupo estudado.
Resolução desta questão na plataforma.
168
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
FIGURAS E ILUSTRAÇÕES
Figura 1
FIELD, A. Discovering statistics using IBM SPSS statistics. 4. ed. Thousand Oaks: Sage, 2013. Adaptada.
Figura 2
CORTY, E. W. Using and Interpreting Statistics. 3. ed. New York: Worth Publishers, 2016. Adaptada.
Figura 3
CORTY, E. W. Using and Interpreting Statistics. 3. ed. New York: Worth Publishers, 2016. Adaptada.
Figura 4
FÁVERO, L. P.; BELFIORE, P. Manual de análise de dados. Rio de Janeiro: Elsevier, 2017. Adaptada.
Figura 10
RAKOTOMALALA, R. Tanagra: un logiciel gratuit pour l’enseignement et la recherche. In Actes de
EGC’2005, RNTI‑E‑3, v. 2, 2005. Adaptada.
Figura 11
INSTITUTO NACIONAL DE METEOROLOGIA (INMET). Estação meteorológica de observação de
superfície automática. 2019. Disponível em: <http://www.inmet.gov.br/portal/index.php?r=estacoes/
estacoesAutomaticas>. Acesso em: 3 jun. 2019.
Figura 12
CORTY, E. W. Using and Interpreting Statistics. 3. ed. New York: Worth Publishers, 2016. Adaptada.
Figura 14
ROBERT_WADLOW_POSTCARD.JPG. Disponível em: <https://upload.wikimedia.org/wikipedia/
commons/f/f7/Robert_Wadlow_postcard.jpg>. Acesso em: 29 abr. 2019.
Figura 21
HILLIARD, S.; NGUYEN, M.; DOMJAN, M. One‑trial appetitive conditioning in the sexual behavior
system. Psychonomic Bulletin & Review, v. 4, n. 2, p. 238, 1997.
169
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Figura 22
FIELD, A. Discovering statistics using IBM SPSS statistics. 4. ed. Thousand Oaks: SAGE Publications, 2013. Adaptada.
REFERÊNCIAS
Textuais
BARTZ, A. E. Basic statistical concepts. 4. ed. Upper Saddle River: Prentice Hall, 1999.
BOLFARINE, H.; BUSSAB, W. O. Elementos de amostragem. São Paulo: Edgard Blücher, 2005.
BRASIL. Ministério da Saúde. Monitoramento dos casos de dengue, febre de chikungunya e febre
pelo vírus zika até a semana epidemiológica 52, 2017. Boletim Epidemiológico, Brasília, v. 49,
n. 2, 2018a. Disponível em: <http://portalarquivos2.saude.gov.br/images/pdf/2018/janeiro/23/
Boletim‑2018‑001‑Dengue.pdf>. Acesso em: 15 dez. 2018.
___. Ministério da Saúde. Monitoramento integrado de alterações no crescimento e desenvolvimento
relacionadas à infecção pelo vírus zika e outras etiologias infecciosas, até a Semana Epidemiológica
45 de 2018. Boletim Epidemiológico, Brasília, v. 49, n. 54, dez. 2018b. Disponível em: <http://
portalarquivos2.saude.gov.br/images/pdf/2018/dezembro/14/2018‑061.pdf>. Acesso em: 30 abr. 2019.
BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 8. ed. São Paulo: Saraiva, 2013.
CALLEGARI‑JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2003.
CAREY, T. Why Britain’s cats and dogs have turned into couch pawtatoes. Daily Mail, Dec. 2018.
Disponível em: <https://www.dailymail.co.uk/femail/article‑6477343/New‑HD‑TVs‑twice‑powerful
‑used‑mean‑pets‑FINALLY‑watch‑telly.html>. Acesso em: 30 abr. 2019.
CORTY, E. W. Using and interpreting statistics. 3. ed. New York: Worth Publishers, 2016.
COSTA NETO, P. L. O. Estatística. 2. ed. São Paulo: Edgard Blücher, 2002.
DANCEY, C. P.; REIDY, J. Estatística sem matemática para psicologia. 5. ed. Porto Alegre: Penso, 2013.
DOMJAN, M.; BLESBOIS, E.; WILLIAMS, J. The adaptive significance of sexual conditioning: pavlovian
control of sperm release. Psychological Science, v. 9, n. 5, p. 411–415, 1998.
FÁVERO, L. P.; BELFIORE, P. Manual de análise de dados. Rio de Janeiro: Elsevier, 2017.
FIELD, A. Discovering statistics using IBM SPSS statistics. 4. ed. Thousand Oaks: Sage, 2013.
170
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto Alegre:
Bookman, 2006.
HOEL, P. G. Introduction to mathematical statistics. 3 ed. New York: John Wiley & Sons Inc, 1966.
INSTITUTO NACIONAL DE METEOROLOGIA (INMET). Estação meteorológica de observação de
superfície automática. 2019. Disponível em: <http://www.inmet.gov.br/portal/index.php?r=estacoes/
estacoesAutomaticas>. Acesso em: 3 jun. 2019.
MILLER, M. L. The remarkable story of how the bison returned to europe. Nature,
Wildlife, Aug. 2017. Disponível em: <https://blog.nature.org/science/2017/08/22/
remarkable‑story‑how‑bison‑returned‑europe/>. Acesso em: 30 abr. 2019.
MILLER, P. E.; MURPHY, C. J. Vision in dogs. Journal of the American Veterinary Medical Association,
v. 207, n. 12, p. 1623‑1634, Dec. 1995.
Exercícios
Unidade I – Questão 1: CONSULPLAN. Tribunal Superior Eleitoral 2012: analista judiciário. Estatística.
Questão 53. Disponível em: <https://s3.amazonaws.com/files‑s3.iesde.com.br/resolucaoq/prova/
prova/1543.pdf>. Acesso em: 6 maio 2019.
Unidade I – Questão 2: POLÍCIA MILITAR DE MINAS GERAIS (PM‑MG). Concurso público para admissão
ao curso de formação de soldados da polícia militar de minas gerais (QPPM), para o ano de 2019,
2018. Questão 29. Disponível em: <https://www.policiamilitar.mg.gov.br/conteudoportal/sites/
concurso/030920181024443820.pdf>. Acesso em: 6 maio 2019.
Unidade II – Questão 1: INSTITUTO DE DESENVOLVIMENTO EDUCACIONAL, CULTURAL E ASSISTENCIAL
NACIONAL (IDECAN). Departamento Estadual de Trânsito de Rondônia 2014: analista em trânsito.
Estatística. Questão 38. Disponível em: <https://s3.amazonaws.com/files‑s3.iesde.com.br/resolucaoq/
prova/prova/36703.pdf>. Acesso em: 13 maio 2019.
Unidade II – Questão 2: CETRO CONCURSOS PÚBLICOS. Ministério das Cidades 2013: estatístico.
Questão 41. Disponível em: <https://s3.amazonaws.com/files‑s3.iesde.com.br/resolucaoq/prova/
prova/31674.pdf>. Acesso em: 13 maio 2019.
171
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
APÊNDICE A: VALORES DE Z ESCORES
média
média
média
média
média
média
zzz
–z –z –z
C
C
B
B
A
A
média z–z
D
Apêndice A: tabela de valores de z escores
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de –z
D
Entre ‑z e +z
0,00 50,00% 0,00% 50,00% 0.00% 0,14 55,57% 5,57% 44,43% 11,14%
0,01 50,40% 0,40% 49,60% 0,80% 0,15 55,96% 5,96% 44,04% 11,92%
0,02 50,80% 0,80% 49,20% 1,60% 0,16 56,36% 6,36% 43,64% 12,72%
0,03 51,20% 1,20% 48,80% 2,40% 0,17 56,75% 6,75% 43,35% 13,50%
0,04 51,60% 1,60% 48,40% 3,20% 0,18 57,14% 7,14% 42,86% 14,28%
0,05 51,99% 1,99% 48,01% 3,98% 0,19 57,53% 7,53% 42,47% 15,06%
0,06 52,39% 2,39% 47,61% 4,78% 0,20 57,93% 7,93% 42,07% 15,86%
0,07 52,79% 2,79% 47,21% 5,58% 0,21 58,32% 8,32% 41,68% 16,64%
0,08 53,19% 3,19% 46,81% 6,38% 0,22 58,71% 8,71% 41,29% 17,42%
0,09 53,59% 3,59% 46,41% 7,18% 0,23 59,10% 9,10% 40,90%18,20%
0,10 53,98% 3,98% 46,02% 7,96% 0,24 59,48% 9,48% 40,52% 18,96%
0,11 54,38% 4,38% 45,62% 8,76% 0,25 59,87% 9,87% 40,13% 19,74%
0,12 54,78% 4,78% 45,22% 9,56% 0,26 60,26% 10,26% 39,74% 20,52%
0,13 55,17% 5,17% 44,83% 10.34% 0,27 60,64% 10,64% 39,36% 21,28%
172
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice A: valores de z escores (continuação)
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de –z
D
Entre ‑z e +z
0,28 61,03% 11,03% 38,97% 22,05% 0,56 71,23% 21,23% 28,77% 42,45%
0,29 61,41% 11,41% 38,59% 22,82% 0,57 71,57% 21,57% 28,43% 43,13%
0,30 61,79% 11,79% 38,21% 23,58% 0,58 71,90% 21,90% 28,10% 43,81%
0,31 62,17% 12,17% 37,83% 24,34% 0,59 72,24% 22,24% 27,76% 44,48%
0,32 62,55% 12,55% 37,45% 25,10% 0,60 72,57% 22,57% 27,43% 45,15%
0,33 62,93% 12,93% 37,07% 25,86% 0,61 72,91% 22,91% 27,09% 45,81%
0,34 63,31% 13,31% 36,69% 26,61% 0,62 73,24% 23,24% 26,76% 46,47%
0,35 63,68% 13,68% 36,32% 27,37% 0,63 73,57% 23,57% 26,43% 47,13%
0,36 64,06% 14,06% 35,94% 28,12% 0,64 73,89% 23,89% 26,11% 47,78%
0,37 64,43% 14,43% 35,57% 28,86% 0,65 74,22% 24,22% 25,78% 48,43%
0,38 64,80% 14,80% 35,20% 29,61% 0,66 74,54% 24,54% 25,46% 49,07%
0,39 65,17% 15,17% 34,83% 30,35% 0,67 74,86% 24,86% 25,14% 49,71%
0,40 65,54% 15,54% 34,46% 31,08% 0,68 75,17% 25,17% 24,83% 50,35%
0,41 65,91% 15,91% 34,09% 31,82% 0,69 75,49% 25,49% 24,51% 50,98%
0,42 66,28% 16,28% 33,72% 32,55% 0,70 75,80% 25,80% 24,20% 51,61%
0,43 66,64% 16,64% 33,36% 33,28% 0,71 76,11% 26,11% 23,89% 52,23%
0,44 67,00% 17,00% 33,00% 34,01% 0,72 76,42% 26,42% 23,58% 52,85%
0,45 67,36% 17,36% 32,64% 34,73% 0,73 76,73% 26,73% 23,27% 53,46%
0,46 67,72% 17,72% 32,28% 35,45% 0,74 77,04% 27,04% 22,96% 54,07%
0,47 68,08% 18,08% 31,92% 36,16% 0,75 77,34% 27,34% 22,66% 54,67%
0,48 68,44% 18,44% 31,56% 36,88% 0,76 77,64% 27,64% 22,36% 55,27%
0,49 68,79% 18,79% 31,21% 37,59% 0,77 77,94% 27,94% 22,06% 55,87%
0,50 69,15% 19,15% 30,85% 38,29% 0,78 78,23% 28,23% 21,77% 56,46%
0,51 69,50% 19,50% 30,50% 38,99% 0,79 78,52% 28,52% 21,48% 57,05%
0,52 69,85% 19,85% 30,15% 39,69% 0,80 78,81% 28,81% 21,19% 57,63%
0,53 70,19% 20,19% 29,81% 40,39% 0,81 79,10% 29,10% 20,90% 58,21%
0,54 70,54% 20,54% 29,46% 41,08% 0,82 79,39% 29,39% 20,61% 58,78%
0,55 70,88% 20,88% 29,12% 41,77% 0,83 79,67% 29,67% 20,33% 59,35%
173
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice A: valores de z escores (continuação)
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de –z
D
Entre ‑z e +z
0,84 79,95% 29,95% 20,05% 59,91% 1,11 86,65% 36,65% 13,35% 73,30%
0,85 80,23% 30,23% 19,77% 60,47% 1,12 86,86% 36,86% 13,14% 73,73%
0,86 80,51% 30,51% 19,49% 61,02% 1,13 87,08% 37,08% 12,92% 74,15%
0,87 80,78% 30,78% 19,22% 61,57% 1,14 87,29% 37,29% 12,71% 74,57%
0,88 81,06% 31,06% 18,94% 62,11% 1,15 87,49% 37,49% 12,51% 74,99%
0,89 81,33% 31,33% 18,67% 62,65% 1,16 87,70% 37,70% 12,30% 75,40%
0,90 81,59% 31,59% 18,41% 63,19% 1,17 87,90% 37,90% 12,10% 75,80%
0,91 81,86% 31,86% 18,14% 63,72% 1,18 88,10% 38,10% 11,90% 76,20%
0,92 82,12% 32,12% 17,88% 64,24% 1,19 88,30% 38,30% 11,70% 76,60%
0,93 82,38% 32,38% 17,62% 64,76% 1,20 88,49% 38,49% 11,51% 76,99%
0,94 82,64% 32,64% 17,36% 65,28% 1,21 88,69% 38,69% 11,31% 77,37%
0,95 82,89% 32,89% 17,11% 65,79% 1,22 88,88% 38,88% 11,12% 77,75%
0,96 83,15% 33,15% 16,85% 66,29% 1,23 89,07% 39,07% 10,93% 78,13%
0,97 83,40% 33,40% 16,60% 66,80% 1,24 89,25% 39,25% 10,75% 78,50%
0,98 83,65% 33,65% 16,35% 67,29% 1,25 89,44% 39,44% 10,56% 78,87%
0,99 83,89% 33,89% 16,11% 67,78% 1,26 89,62% 39,62% 10,38% 79,23%
1,00 84,13% 34,13% 15,87% 68,27% 1,27 89,80% 39,80% 10,20% 79,59%
1,01 84,38% 34,38% 15,62% 68,75% 1,28 89,97% 39,97% 10,03% 79,95%
1,02 84,61% 34,61% 15,39% 69,23% 1,29 90,15% 40,15% 9,85% 80,29%
1,03 84,85% 34,85% 15,15% 69,70% 1,30 90,32% 40,32% 9,68% 80,64%
1,04 85,08% 35,08% 14,92% 70,17% 1,31 90,49% 40,49% 9,51% 80,98%
1,05 85,31% 35,31% 14,69% 70,63% 1,32 90,66% 40,66% 9,34% 81,32%
1,06 85,54% 35,54% 14,46% 71,09% 1,33 90,82% 40,82% 9,18% 81,65%
1,07 85,77% 35,77% 14,23% 71,54% 1,34 90,99% 40,99% 9,01% 81,98%
1,08 85,99% 35,99% 14,01% 71,99% 1,35 91,15% 41,15% 8,85% 82,30%
1,09 86,21% 36,21% 13,79% 72,43% 1,36 91,31% 41,31% 8,69% 82,62%
1,10 86,43% 36,43% 13,57% 72,87% 1,37 91,47% 41,47% 8,53% 82,93%
174
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice A: valores de z escores (continuação)
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de –z
D
Entre ‑z e +z
1,38 91,62% 41,62% 8,38% 83,24% 1,65 95,05% 45,05% 4,95% 90,11%
1,39 91,77% 41,77% 8,23% 83,55% 1,66 95,15% 45,15% 4,85% 90,31%
1,40 91,92% 41,92% 8,08% 83,85% 1,67 95,25% 45,25% 4,75% 90,51%
1,41 92,07% 42,07% 7,93% 84,15% 1,68 95,35% 45,35% 4,65% 90,70%
1,42 92,22% 42,22% 7,78% 84,44% 1,69 95,45% 45,45% 4,55% 90,90%
1,43 92,36% 42,36% 7,64% 84,73% 1,70 95,54% 45,54% 4,46% 91,09%
1,44 92,51% 42,51% 7,49% 85,01% 1,71 95,64% 45,64% 4,36% 91,27%
1,45 92,65% 42,65% 7,35% 85,29% 1,72 95,73% 45,73% 4,27% 91,46%
1,46 92,79% 42,79% 7,21% 85,57% 1,73 95,82% 45,82% 4,18% 91,64%
1,47 92,92% 42,92% 7,08% 85,84% 1,74 95,91% 45,91% 4,09% 91,81%
1,48 93,06% 43,06% 6,94% 86,11% 1,75 95,99% 45,99% 4,01% 91,99%
1,49 93,19% 43,19% 6,81% 86,38% 1,76 96,08% 46,08% 3,92% 92,16%
1,50 93,32% 43,32% 6,68% 86,64% 1,77 96,16% 46,16% 3,84% 92,33%
1,51 93,45% 43,45% 6,55% 86,90% 1,78 96,25% 46,25% 3,75% 92,49%
1,52 93,57% 43,57% 6,43% 87,15% 1,79 96,33% 46,33% 3,67% 92,65%
1,53 93,70% 43,70% 6,30% 87,40% 1,80 96,41% 46,41% 3,59% 92,81%
1,54 93,82% 43,82% 6,18% 87,64% 1,81 96,49% 46,49% 3,51% 92,97%
1,55 93,94% 43,94% 6,06% 87,89% 1,82 96,56% 46,56% 3,44% 93,12%
1,56 94,06% 44,06% 5,94% 88,12% 1,83 96,64% 46,64% 3,36% 93,28%
1,57 94,18% 44,18% 5,82% 88,36% 1,84 96,71% 46,71% 3,29% 93,42%
1,58 94,29% 44,29% 5,71% 88,59% 1,85 96,78% 46,78% 3,22% 93,57%
1,59 94,41% 44,41% 5,59% 88,82% 1,86 96,86% 46,86% 3,14% 93,71%
1,60 94,52% 44,52% 5,48% 89,04% 1,87 96,93% 46,93% 3,07% 93,85%
1,61 94,63% 44,63% 5,37% 89,26% 1,88 96,99% 46,99% 3,01% 93,99%
1,62 94,74% 44,74% 5,26% 89,48% 1,89 97,06% 47,06% 2,94% 94,12%
1,63 94,84% 44,84% 5,16% 89,69% 1,90 97,13% 47,13% 2,87% 94,26%
1,64 94,95% 44,95% 5,05% 89,90% 1,91 97,19% 47,19% 2,81% 94,39%
175
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice A: valores de z escores (continuação)
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
1,92 97,26% 47,26% 2,74% 94,51% 2,19 98,57% 48,57% 1,43% 97,15%
1,93 97,32% 47,32% 2,68% 94,64% 2,20 98,61% 48,61% 1,39% 97,22%
1,94 97,38% 47,38% 2,62% 94,76% 2,21 98,64% 48,64% 1,36% 97,29%
1,95 97,44% 47,44% 2,56% 94,88% 2,22 98,68% 48,68% 1,32% 97,36%
1,96 97,50% 47,50% 2,50% 95,00% 2,23 98,71% 48,71% 1,29% 97,43%
1,97 97,56% 47,56% 2,44% 95,12% 2,24 98,75% 48,75% 1,25% 97,49%
1,98 97,61% 47,61% 2,39% 95,23% 2,25 98,78% 48,78% 1,22% 97,56%
1,99 97,67% 47,67% 2,33% 95,34% 2,26 98,81% 48,81% 1,19% 97,62%
2,00 97,72% 47,72% 2,28% 95,45% 2,27 98,84% 48,84% 1,16% 97,68%
2,01 97,78% 47,78% 2,22% 95,56% 2,28 98,87% 48,87% 1,13% 97,74%
2,02 97,83% 47,83% 2,17% 95,66% 2,29 98,90% 48,90%1,10% 97,80%
2,03 97,88% 47,88% 2,12% 95,76% 2,30 98,93% 48,93% 1,07% 97,86%
2,04 97,93% 47,93% 2,07% 95,86% 2,31 98,96% 48,96% 1,04% 97,91%
2,05 97,98% 47,98% 2,02% 95,96% 2,32 98,98% 48,98% 1,02% 97,97%
2,06 98,03% 48,03% 1,97% 96,06% 2,33 99,01% 49,01% 0,99% 98,02%
2,07 98,08% 48,08% 1,92% 96,15% 2,34 99,04% 49,04% 0,96% 98,07%
2,08 98,12% 48,12% 1,88% 96,25% 2,35 99,06% 49,06% 0,94% 98,12%
2,09 98,17% 48,17% 1,83% 96,34% 2,36 99,09% 49,09% 0,91% 98,17%
2,10 98,21% 48,21% 1,79% 96,43% 2,37 99,11% 49,11% 0,89% 98,22%
2,11 98,26% 48,26% 1,74% 96,51% 2,38 99,13% 49,13% 0,87% 98,27%
2,12 98,30% 48,30% 1,70% 96,60% 2,39 99,16% 49,16% 0,84% 98,32%
2,13 98,34% 48,34% 1,66% 96,68% 2,40 99,18% 49,18% 0,82% 98,36%
2,14 98,38% 48,38% 1,62% 96,76% 2,41 99,20% 49,20% 0,80% 98,40%
2,15 98,42% 48,42% 1,58% 96,84% 2,42 99,22% 49,22% 0,78% 98,45%
2,16 98,46% 48,46% 1,54% 96,92% 2,43 99,25% 49,25% 0,75% 98,49%
2,17 98,50% 48,50% 1,50% 97,00% 2,44 99,27% 49,27% 0,73% 98,53%
2,18 98,54% 48,54% 1,46% 97,07% 2,45 99,29% 49,29% 0,71% 98,57%
176
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice A: valores de z escores (continuação)
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
2,46 99,31% 49,31% 0,69% 98,61% 2,73 99,68% 49,68% 0,32% 99,37%
2,47 99,32% 49,32% 0,68% 98,65% 2,74 99,69% 49,69% 0,31% 99,39%
2,48 99,34% 49,34% 0,66% 98,69% 2,75 99,702% 49,702% 0,298% 99,404%
2,49 99,36% 49,36% 0,64% 98,72% 2,76 99,711% 49,711% 0,289% 99,422%
2,50 99,38% 49,38% 0,62% 98,76% 2,77 99,720% 49,720% 0,280% 99,439%
2,51 99,40% 49,40% 0,60% 98,79% 2,78 99,728% 49,728% 0,272% 99,456%
2,52 99,41% 49,41% 0,59% 98,83% 2,79 99,736% 49,736% 0,264% 99,473%
2,53 99,43% 49,43% 0,57% 98,86% 2,80 99,744% 49,744% 0,256% 99,489%
2,54 99,45% 49,45% 0,55% 98,89% 2,81 99,752% 49,752% 0,248% 99,505%
2,55 99,46% 49,46% 0,54% 98,92% 2,82 99,760% 49,760% 0,240% 99,520%
2,56 99,48% 49,48% 0,52% 98,95% 2,83 99,767% 49,767% 0,233% 99,535%
2,57 99,49% 49,49% 0,51% 98,98% 2,84 99,774% 49,774% 0,226% 99,549%
2,58 99,51% 49,51% 0,49% 99,01% 2,85 99,781% 49,781% 0,219% 99,563%
2,59 99,52% 49,52% 0,48% 99,04% 2,86 99,788% 49,788% 0,212% 99,576%
2,60 99,53% 49,53% 0,47% 99,07% 2,87 99,795% 49,795% 0,205% 99,590%
2,61 99,55% 49,55% 0,45% 99,09% 2,88 99,801% 49,801% 0,199% 99,602%
2,62 99,56% 49,56% 0,44% 99,12% 2,89 99,807% 49,807% 0,193% 99,615%
2,63 99,57% 49,57% 0,43% 99,15% 2,90 99,813% 49,813% 0,187% 99,627%
2,64 99,59% 49,59% 0,41% 99,17% 2,91 99,819% 49,819% 0,181% 99,639%
2,65 99,60% 49,60% 0,40% 99,20% 2,92 99,825% 49,825% 0,175% 99,650%
2,66 99,61% 49,61% 0,39% 99,22% 2,93 99,831% 49,831% 0,169% 99,661%
2,67 99,62% 49,62% 0,38% 99,24% 2,94 99,836% 49,836% 0,164% 99,672%
2,68 99,63% 49,63% 0,37% 99,26% 2,95 99,841% 49,841% 0,159% 99,682%
2,69 99,64% 49,64% 0,36% 99,29% 2,96 99,846% 49,846% 0,154% 99,692%
2,70 99,65% 49,65% 0,35% 99,31% 2,97 99,851% 49,851% 0,149% 99,702%
2,71 99,66% 49,66% 0,34% 99,33% 2,98 99,856% 49,856% 0,144% 99,712%
2,72 99,67% 49,67% 0,33% 99,35% 2,99 99,861% 49,861% 0,139% 99,721%
177
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice A: valores de z escores (continuação)
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
3,00 99,865% 49,865% 0,135% 99,730% 3,27 99,946% 49,946% 0,054% 99,892%
3,01 99,869% 49,869% 0,131% 99,739% 3,28 99,948% 49,948% 0,052% 99,896%
3,02 99,874% 49,874% 0,126% 99,747% 3,29 99,950% 49,950% 0,050% 99,900%
3,03 99,878% 49,878% 0,122% 99,755% 3,30 99,952% 49,952% 0,048% 99,903%
3,04 99,882% 49,882% 0,118% 99,763% 3,31 99,953% 49,953% 0,047% 99,907%
3,05 99,886% 49,886% 0,114% 99,771% 3,32 99,955% 49,955% 0,045% 99,910%
3,06 99,889% 49,889% 0,111% 99,779% 3,33 99,957% 49,957% 0,043% 99,913%
3,07 99,893% 49,893% 0,107% 99,786% 3,34 99,958% 49,958% 0,042% 99,916%
3,08 99,896% 49,896% 0,104% 99,793% 3,35 99,960% 49,960% 0,040% 99,919%
3,09 99,900% 49,900% 0,100% 99,800% 3,36 99,961% 49,961% 0,039% 99,922%
3,10 99,903% 49,903% 0,097% 99,806% 3,37 99,962% 49,962% 0,038% 99,925%
3,11 99,906% 49,906% 0,094% 99,813% 3,38 99,964% 49,964% 0,036% 99,928%
3,12 99,910% 49,910% 0,090% 99,819% 3,39 99,965% 49,965% 0,035% 99,930%
3,13 99,913% 49,913% 0,087% 99,825% 3,40 99,966% 49,966% 0,034% 99,933%
3,14 99,916% 49,916% 0,084% 99,831% 3,41 99,968% 49,968% 0,032% 99,935%
3,15 99,918% 49,918% 0,082% 99,837% 3,42 99,969% 49,969% 0,031% 99,937%
3,16 99,921% 49,921% 0,079% 99,842% 3,43 99,970% 49,970% 0,030% 99,940%
3,17 99,924% 49,924% 0,076% 99,848% 3,44 99,971% 49,971% 0,029% 99,942%
3,18 99,926% 49,926% 0,074% 99,853% 3,45 99,972% 49,972% 0,028% 99,944%
3,19 99,929% 49,929% 0,071% 99,858% 3,46 99,973% 49,973% 0,027% 99,946%
3,20 99,931% 49,931% 0,069% 99,863% 3,47 99,974% 49,974% 0,026% 99,948%
3,21 99,934% 49,934% 0,066% 99,867% 3,48 99,975% 49,975% 0,025% 99,950%
3,22 99,936% 49,936% 0,064% 99,872% 3,49 99,976% 49,976% 0,024% 99,952%
3,23 99,938% 49,938% 0,062% 99,876% 3,50 99,9767% 49,9767% 0,0233% 99,9535%
3,24 99,940% 49,940% 0,060% 99,880% 3,51 99,9776% 49,9776% 0,0224% 99,9552%
3,25 99,942% 49,942% 0,058% 99,885% 3,52 99,9784% 49,9784% 0,0216% 99,9568%
3,26 99,944% 49,944% 0,056% 99,889% 3,53 99,9792% 49,9792% 0,0208% 99,9584%
178
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice A: valores de z escores (continuação)
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de –z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
3,54 99,9800% 49,9800% 0,0200% 99,9600% 3,81 99,9931% 49,9931% 0,0069% 99,9861%
3,55 99,9807% 49,9807% 0,0193% 99,9615% 3,82 99,9933% 49,9933% 0,0067% 99,9867%
3,56 99,9815% 49,9815% 0,0185% 99,9629% 3,83 99,9936% 49,9936% 0,0064% 99,9872%
3,57 99,9822% 49,9822% 0,0178% 99,9643% 3,84 99,9938% 49,9938% 0,0062% 99,9877%
3,58 99,9828% 49,9828% 0,0172% 99,9656% 3,85 99,9941% 49,9941% 0,0059% 99,9882%
3,59 99,9835% 49,9835% 0,0165% 99,9669% 3,86 99,9943% 49,9943% 0,0057% 99,9887%
3,60 99,9841% 49,9841% 0,0159% 99,9682% 3,87 99,9946% 49,9946% 0,0054% 99,9891%
3,61 99,9847% 49,9847% 0,0153% 99,9694% 3,88 99,9948% 49,9948% 0,0052% 99,9896%
3,62 99,9853% 49,9853% 0,0147% 99,9705% 3,89 99,9950% 49,9950% 0,0050% 99,9900%
3,63 99,9858% 49,9858% 0,0142% 99,9717% 3,90 99,9952% 49,9952% 0,0048% 99,9904%
3,64 99,9864% 49,9864% 0,0136% 99,9727% 3,91 99,9954% 49,9954% 0,0046% 99,9908%
3,65 99,9869% 49,9869% 0,0131% 99,9738% 3,92 99,9956% 49,9956% 0,0044% 99,9911%
3,66 99,9874% 49,9874% 0,0126% 99,9748% 3,93 99,9958% 49,9958% 0,0042% 99,9915%
3,67 99,9879% 49,9879% 0,0121% 99,9757% 3,94 99,9959% 49,9959% 0,0041% 99,9919%
3,68 99,9883% 49,9883% 0,0117% 99,9767% 3,95 99,9961% 49,9961% 0,0039% 99,9922%
3,69 99,9888% 49,9888% 0,0112% 99,9776% 3,96 99,9963% 49,9963% 0,0037% 99,9925%
3,70 99,9892% 49,9892% 0,0108% 99,9784% 3,97 99,9964% 49,9964% 0,0036% 99,9928%
3,71 99,9896% 49,9896% 0,0104% 99,9793% 3,98 99,9966% 49,9966% 0,0034% 99,9931%
3,72 99,9900% 49,9900% 0,0100% 99,9801% 3,99 99,9967% 49,9967% 0,0033% 99,9934%
3,73 99,9904% 49,9904% 0,0096% 99,9809% 4,00 99,9968% 49,9968% 0,0032% 99,9937%
3,74 99,9908% 49,9908% 0,0092% 99,9816% 4,01 99,99696% 49,99696% 0,00304% 99,99393%
3,75 99,9912% 49,9912% 0,0088% 99,9823% 4,02 99,99709% 49,99709% 0,00291% 99,99418%
3,76 99,9915% 49,9915% 0,0085% 99,9830% 4,03 99,99721% 49,99721% 0,00279% 99,99442%
3,77 99,9918% 49,9918% 0,0082% 99,9837%4,04 99,99733% 49,99733% 0,00267% 99,99465%
3,78 99,9922% 49,9922% 0,0078% 99,9843% 4,05 99,99744% 49,99744% 0,00256% 99,99488%
3,79 99,9925% 49,9925% 0,0075% 99,9849% 4,06 99,99755% 49,99755% 0,00245% 99,99509%
3,80 99,9928% 49,9928% 0,0072% 99,9855% 4,07 99,99765% 49,99765% 0,00235% 99,99530%
179
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice A: valores de z escores (continuação)
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de –z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z e +z
4,08 99,99775% 49,99775% 0,00225% 99,99550% 4,35 99,99932% 49,99932% 0,00068% 99,99864%
4,09 99,99784% 49,99784% 0,00216% 99,99569% 4,36 99,99935% 49,99935% 0,00065% 99,99870%
4,10 99,99793% 49,99793% 0,00207% 99,99587% 4,37 99,99938% 49,99938% 0,00062% 99,99876%
4,11 99,99802% 49,99802% 0,00198% 99,99604% 4,38 99,99941% 49,99941% 0,00059% 99,99881%
4,12 99,99811% 49,99811% 0,00189% 99,99621% 4,39 99,99943% 49,99943% 0,00057% 99,99887%
4,13 99,99819% 49,99819% 0,00181% 99,99637% 4,40 99,99946% 49,99946% 0,00054% 99,99892%
4,14 99,99826% 49,99826% 0,00174% 99,99653% 4,41 99,99948% 49,99948% 0,00052% 99,99897%
4,15 99,99834% 49,99834% 0,00166% 99,99668% 4,42 99,99951% 49,99951% 0,00049% 99,99901%
4,16 99,99841% 49,99841% 0,00159% 99,99682% 4,43 99,99953% 49,99953% 0,00047% 99,99906%
4,17 99,99848% 49,99848% 0,00152% 99,99695% 4,44 99,99955% 49,99955% 0,00045% 99,99910%
4,18 99,99854% 49,99854% 0,00146% 99,99708% 4,45 99,99957% 49,99957% 0,00043% 99,99914%
4,19 99,99861% 49,99861% 0,00139% 99,99721% 4,46 99,99959% 49,99959% 0,00041% 99,99918%
4,20 99,99867% 49,99867% 0,00133% 99,99733% 4,47 99,99961% 49,99961% 0,00039% 99,99922%
4,21 99,99872% 49,99872% 0,00128% 99,99745% 4,48 99,99963% 49,99963% 0,00037% 99,99925%
4,22 99,99878% 49,99878% 0,00122% 99,99756% 4,49 99,99964% 49,99964% 0,00036% 99,99929%
4,23 99,99883% 49,99883% 0,00117% 99,99766% 4,50 99,99966% 49,99966% 0,00034% 99,99932%
4,24 99,99888% 49,99888% 0,00112% 99,99776% 4,51 99,99968% 49,99968% 0,00032% 99,99935%
4,25 99,99893% 49,99893% 0,00107% 99,99786% 4,52 99,99969% 49,99969% 0,00031% 99,99938%
4,26 99,99898% 49,99898% 0,00102% 99,99796% 4,53 99,99971% 49,99971% 0,00029% 99,99941%
4,27 99,99902% 49,99902% 0,00098% 99,99805% 4,54 99,99972% 49,99972% 0,00028% 99,99944%
4,28 99,99907% 49,99907% 0,00093% 99,99813% 4,55 99,99973% 49,99973% 0,00027% 99,99946%
4,29 99,99911% 49,99911% 0,00089% 99,99821% 4,56 99,99974% 49,99974% 0,00026% 99,99949%
4,30 99,99915% 49,99915% 0,00085% 99,99829% 4,57 99,99976% 49,99976% 0,00024% 99,99951%
4,31 99,99918% 49,99918% 0,00082% 99,99837% 4,58 99,99977% 49,99977% 0,00023% 99,99954%
4,32 99,99922% 49,99922% 0,00078% 99,99844% 4,59 99,99978% 49,99978% 0,00022% 99,99956%
4,33 99,99925% 49,99925% 0,00075% 99,99851% 4,60 99,99979% 49,99979% 0,00021% 99,99958%
4,34 99,99929% 49,99929% 0,00071% 99,99858% 4,61 99,99980% 49,99980% 0,00020% 99,99960%
180
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice A: valores de z escores (continuação)
Área sob a curva normal Área sob a curva normal
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de –z
D
Entre ‑z e +z
z
escore
A
Abaixo de +z
Acima de ‑z
B
Da média
a +z ou a ‑z
C
Acima de +z
Abaixo de ‑z
D
Entre ‑z
e +z
4,62 99,99981% 49,99981% 0,00019% 99,99962% 4,89 99,99995% 49,99995% 0,00005% 99,99990%
4,63 99,99982% 49,99982% 0,00018% 99,99963% 4,90 99,99995% 49,99995% 0,00005% 99,99990%
4,64 99,99983% 49,99983% 0,00017% 99,99965% 4,91 99,99995% 49,99995% 0,00005% 99,99991%
4,65 99,99983% 49,99983% 0,00017% 99,99967% 4,92 99,99996% 49,99996% 0,00004% 99,99991%
4,66 99,99984% 49,99984% 0,00016% 99,99968% 4,93 99,99996% 49,99996% 0,00004% 99,99992%
4,67 99,99985% 49,99985% 0,00015% 99,99970% 4,94 99,99996% 49,99996% 0,00004% 99,99992%
4,68 99,99986% 49,99986% 0,00014% 99,99971% 4,95 99,99996% 49,99996% 0,00004% 99,99993%
4,69 99,99986% 49,99986% 0,00014% 99,99973% 4,96 99,99996% 49,99996% 0,00004% 99,99993%
4,70 99,99987% 49,99987% 0,00013% 99,99974% 4,97 99,99997% 49,99997% 0,00003% 99,99993%
4,71 99,99988% 49,99988% 0,00012% 99,99975% 4,98 99,99997% 49,99997% 0,00003% 99,99994%
4,72 99,99988% 49,99988% 0,00012% 99,99976% 4,99 99,99997% 49,99997% 0,00003% 99,99994%
4,73 99,99989% 49,99989% 0,00011% 99,99978% 5,00 99,99997% 49,99997% 0,00003% 99,99994%
4,74 99,99989% 49,99989% 0,00011% 99,99979%
4,75 99,99990% 49,99990% 0,00010% 99,99980%
4,76 99,99990% 49,99990% 0,00010% 99,99981%
4,77 99,99991% 49,99991% 0,00009% 99,99982%
4,78 99,99991% 49,99991% 0,00009% 99,99982%
4,79 99,99992% 49,99992% 0,00008% 99,99983%
4,80 99,99992% 49,99992% 0,00008% 99,99984%
4,81 99,99992% 49,99992% 0,00008% 99,99985%
4,82 99,99993% 49,99993% 0,00007% 99,99986%
4,83 99,99993% 49,99993% 0,00007% 99,99986%
4,84 99,99994% 49,99994% 0,00006% 99,99987%
4,85 99,99994% 49,99994% 0,00006% 99,99988%
4,86 99,99994% 49,99994% 0,00006% 99,99988%
4,87 99,99994% 49,99994% 0,00006% 99,99989%
4,88 99,99995% 49,99995% 0,00005% 99,99989%
181
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice B: valores críticos de t
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
1 6,314 12,706 31,821 63,657
2 2,920 4,303 6,965 9,925
3 2,353 3,182 4,541 5,841
4 2,132 2,776 3,747 4,604
5 2,015 2,571 3,365 4,032
6 1,943 2,447 3,143 3,707
7 1,895 2,365 2,998 3,499
8 1,860 2,306 2,896 3,355
9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169
11 1,796 2,201 2,718 3,106
12 1,782 2,179 2,681 3,055
13 1,771 2,160 2,650 3,012
14 1,761 2,145 2,624 2,977
15 1,753 2,131 2,602 2,947
16 1,746 2,120 2,583 2,921
17 1,740 2,110 2,567 2,898
18 1,734 2,101 2,552 2,878
19 1,729 2,093 2,539 2,861
20 1,725 2,086 2,528 2,845
21 1,721 2,080 2,518 2,831
22 1,717 2,074 2,508 2,819
23 1,714 2,069 2,500 2,807
24 1,711 2,064 2,492 2,797
25 1,708 2,060 2,485 2,787
26 1,706 2,056 2,479 2,779
27 1,703 2,052 2,473 2,771
28 1,701 2,048 2,467 2,763
29 1,699 2,045 2,462 2,756
182
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice B: valores críticos de t (continuação)
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
30 1,697 2,042 2,457 2,750
31 1,696 2,040 2,453 2,744
32 1,694 2,037 2,449 2,738
33 1,692 2,035 2,445 2,733
34 1,691 2,032 2,441 2,728
35 1,690 2,030 2,438 2,724
36 1,688 2,028 2,434 2,719
37 1,687 2,026 2,431 2,715
38 1,686 2,024 2,429 2,712
39 1,685 2,023 2,426 2,708
40 1,684 2,021 2,423 2,704
41 1,683 2,020 2,421 2,701
42 1,682 2,018 2,418 2,698
43 1,681 2,017 2,416 2,695
44 1,680 2,015 2,414 2,692
45 1,679 2,014 2,412 2,690
46 1,679 2,013 2,410 2,687
47 1,678 2,012 2,408 2,685
48 1,677 2,011 2,407 2,682
49 1,677 2,010 2,405 2,680
50 1,676 2,009 2,403 2,678
51 1,675 2,008 2,402 2,676
52 1,675 2,007 2,400 2,674
53 1,674 2,006 2,399 2,672
54 1,674 2,005 2,397 2,670
55 1,673 2,004 2,396 2,668
56 1,673 2,003 2,395 2,667
57 1,672 2,002 2,394 2,665
58 1,672 2,002 2,392 2,663
183
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice B: valores críticos de t (continuação)
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
59 1,671 2,001 2,391 2,662
60 1,671 2,000 2,390 2,660
61 1,670 2,000 2,389 2,659
62 1,670 1,999 2,388 2,657
63 1,669 1,998 2,387 2,656
64 1,669 1,998 2,386 2,655
65 1,669 1,997 2,385 2,654
66 1,6681,997 2,384 2,652
67 1,668 1,996 2,383 2,651
68 1,668 1,995 2,382 2,650
69 1,667 1,995 2,382 2,649
70 1,667 1,994 2,381 2,648
71 1,667 1,994 2,380 2,647
72 1,666 1,993 2,379 2,646
73 1,666 1,993 2,379 2,645
74 1,666 1,993 2,378 2,644
75 1,665 1,992 2,377 2,643
76 1,665 1,992 2,376 2,642
77 1,665 1,991 2,376 2,641
78 1,665 1,991 2,375 2,640
79 1,664 1,990 2,374 2,640
80 1,664 1,990 2,374 2,639
81 1,664 1,990 2,373 2,638
82 1,664 1,989 2,373 2,637
83 1,663 1,989 2,372 2,636
84 1,663 1,989 2,372 2,636
85 1,663 1,988 2,371 2,635
86 1,663 1,988 2,370 2,634
87 1,663 1,988 2,370 2,634
184
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice B: valores críticos de t (continuação)
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
88 1,662 1,987 2,369 2,633
89 1,662 1,987 2,369 2,632
90 1,662 1,987 2,368 2,632
91 1,662 1,986 2,368 2,631
92 1,662 1,986 2,368 2,630
93 1,661 1,986 2,367 2,630
94 1,661 1,986 2,367 2,629
95 1,661 1,985 2,366 2,629
96 1,661 1,985 2,366 2,628
97 1,661 1,985 2,365 2,627
98 1,661 1,984 2,365 2,627
99 1,660 1,984 2,365 2,626
100 1,660 1,984 2,364 2,626
110 1,659 1,982 2,361 2,621
120 1,658 1,980 2,358 2,617
130 1,657 1,978 2,355 2,614
140 1,656 1,977 2,353 2,611
150 1,655 1,976 2,351 2,609
160 1,654 1,975 2,350 2,607
170 1,654 1,974 2,348 2,605
180 1,653 1,973 2,347 2,603
190 1,653 1,973 2,346 2,602
200 1,653 1,972 2,345 2,601
210 1,652 1,971 2,344 2,599
220 1,652 1,971 2,343 2,598
230 1,652 1,970 2,343 2,597
240 1,651 1,970 2,342 2,596
250 1,651 1,969 2,341 2,596
260 1,651 1,969 2,341 2,595
185
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice B: valores críticos de t (continuação)
GL
A
α = 0,05 unicaudal
ou
α = 0,10 bicaudal
B
α = 0,025 unicaudal
ou
α = 0,05 bicaudal
C
α = 0,01 unicaudal
ou
α = 0,02 bicaudal
D
α = 0,005 unicaudal
ou
α = 0,01 bicaudal
270 1,651 1,969 2,340 2,594
280 1,650 1,968 2,340 2,594
290 1,650 1,968 2,339 2,593
300 1,650 1,968 2,339 2,592
400 1,649 1,966 2,336 2,588
500 1,648 1,965 2,334 2,586
600 1,647 1,964 2,333 2,584
700 1,647 1,963 2,332 2,583
800 1,647 1,963 2,331 2,582
900 1,647 1,963 2,330 2,581
1000 1,646 1,962 2,330 2,581
∞ 1,645 1,960 2,326 2,576
186
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice C: valores críticos de F, α = 0,05
GL denominador
GL numerador
1 2 3 4 5 6 7 8
1 161,448 199,500 215,707 224,583 230,162 233,986 236,768 238,883
2 18,513 19,000 19,164 19,247 19,296 19,330 19,353 19,371
3 10,128 9,552 9,277 9,117 9,013 8,941 8,887 8,845
4 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041
5 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818
6 5,987 5,143 4,757 4,534 4,387 4,284 4,207 4,147
7 5,591 4,737 4,347 4,120 3,972 3,866 3,787 3,726
8 5,318 4,459 4,066 3,838 3,687 3,581 3,500 3,438
9 5,117 4,256 3,863 3,633 3,482 3,374 3,293 3,230
10 4,965 4,103 3,708 3,478 3,326 3,217 3,135 3,072
11 4,844 3,982 3,587 3,357 3,204 3,095 3,012 2,948
12 4,747 3,885 3,490 3,259 3,106 2,996 2,913 2,849
13 4,667 3,806 3,411 3,179 3,025 2,915 2,832 2,767
14 4,600 3,739 3,344 3,112 2,958 2,848 2,764 2,699
15 4,543 3,682 3,287 3,056 2,901 2,790 2,707 2,641
16 4,494 3,634 3,239 3,007 2,852 2,741 2,657 2,591
17 4,451 3,592 3,197 2,965 2,810 2,699 2,614 2,548
18 4,414 3,555 3,160 2,928 2,773 2,661 2,577 2,510
19 4,381 3,522 3,127 2,895 2,740 2,628 2,544 2,477
20 4,351 3,493 3,098 2,866 2,711 2,599 2,514 2,447
21 4,325 3,467 3,072 2,840 2,685 2,573 2,488 2,420
22 4,301 3,443 3,049 2,817 2,661 2,549 2,464 2,397
23 4,279 3,422 3,028 2,796 2,640 2,528 2,442 2,375
24 4,260 3,403 3,009 2,776 2,621 2,508 2,423 2,355
25 4,242 3,385 2,991 2,759 2,603 2,490 2,405 2,337
26 4,225 3,369 2,975 2,743 2,587 2,474 2,388 2,321
27 4,210 3,354 2,960 2,728 2,572 2,459 2,373 2,305
28 4,196 3,340 2,947 2,714 2,558 2,445 2,359 2,291
29 4,183 3,328 2,934 2,701 2,545 2,432 2,346 2,278
187
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice C: valores críticos de F, α = 0,05 (continuação)
GL denominador
GL numerador
9 10 11 12 13 14 15 16
1 240,543 241,882 242,983 243,906 244,690 245,364 245,950 246,464
2 19,385 19,396 19,405 19,413 19,419 19,424 19,429 19,433
3 8,812 8,786 8,763 8,745 8,729 8,715 8,703 8,692
4 5,999 5,964 5,936 5,912 5,891 5,873 5,858 5,844
5 4,772 4,735 4,704 4,678 4,655 4,636 4,619 4,604
6 4,099 4,060 4,027 4,000 3,976 3,956 3,938 3,922
7 3,677 3,637 3,603 3,575 3,550 3,529 3,511 3,494
8 3,388 3,347 3,313 3,284 3,259 3,237 3,218 3,202
9 3,179 3,137 3,102 3,073 3,048 3,025 3,006 2,989
10 3,020 2,978 2,943 2,913 2,887 2,865 2,845 2,828
11 2,896 2,854 2,818 2,788 2,761 2,739 2,719 2,701
12 2,796 2,753 2,717 2,687 2,660 2,637 2,617 2,599
13 2,714 2,671 2,635 2,604 2,577 2,554 2,533 2,515
14 2,646 2,602 2,565 2,534 2,507 2,484 2,463 2,445
15 2,588 2,544 2,507 2,475 2,448 2,424 2,403 2,385
16 2,538 2,494 2,456 2,425 2,397 2,373 2,352 2,333
17 2,494 2,450 2,413 2,381 2,353 2,329 2,308 2,289
18 2,456 2,412 2,374 2,342 2,314 2,290 2,269 2,250
19 2,423 2,378 2,340 2,308 2,280 2,256 2,234 2,215
20 2,393 2,348 2,310 2,278 2,250 2,225 2,203 2,184
21 2,366 2,321 2,283 2,250 2,222 2,197 2,176 2,156
22 2,342 2,297 2,259 2,226 2,198 2,173 2,151 2,131
23 2,320 2,275 2,236 2,204 2,175 2,150 2,128 2,109
24 2,300 2,255 2,216 2,183 2,155 2,130 2,108 2,088
25 2,282 2,236 2,198 2,165 2,136 2,111 2,089 2,069
26 2,265 2,220 2,181 2,148 2,119 2,094 2,072 2,052
27 2,250 2,204 2,166 2,132 2,103 2,078 2,056 2,036
28 2,236 2,190 2,151 2,118 2,089 2,064 2,041 2,021
29 2,223 2,177 2,138 2,104 2,075 2,050 2,027 2,007
188
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice C: valores críticos de F, α = 0,05 (continuação)
GL denominador
GL numerador
1 2 3 4 5 6 7 8
30 4,171 3,316 2,922 2,690 2,534 2,421 2,334 2,266
31 4,160 3,305 2,911 2,679 2,523 2,409 2,323 2,255
32 4,149 3,295 2,901 2,668 2,512 2,399 2,313 2,244
33 4,139 3,285 2,892 2,659 2,503 2,389 2,303 2,235
34 4,130 3,276 2,883 2,650 2,494 2,380 2,294 2,225
35 4,121 3,267 2,874 2,641 2,485 2,372 2,285 2,217
36 4,113 3,259 2,866 2,634 2,477 2,364 2,277 2,209
37 4,105 3,252 2,859 2,626 2,470 2,356 2,270 2,201
38 4,098 3,245 2,852 2,619 2,463 2,349 2,262 2,194
39 4,091 3,238 2,845 2,612 2,456 2,342 2,255 2,187
40 4,085 3,232 2,839 2,606 2,449 2,336 2,249 2,180
41 4,079 3,226 2,833 2,600 2,443 2,330 2,243 2,174
42 4,073 3,220 2,827 2,594 2,438 2,324 2,237 2,168
43 4,067 3,214 2,822 2,589 2,432 2,318 2,232 2,163
44 4,062 3,209 2,816 2,584 2,427 2,313 2,226 2,157
45 4,057 3,204 2,812 2,579 2,422 2,308 2,221 2,152
46 4,052 3,200 2,807 2,574 2,417 2,304 2,216 2,147
47 4,047 3,195 2,802 2,570 2,413 2,299 2,212 2,143
48 4,043 3,191 2,798 2,565 2,409 2,295 2,207 2,138
49 4,038 3,187 2,794 2,561 2,404 2,290 2,203 2,134
50 4,034 3,183 2,790 2,557 2,400 2,286 2,199 2,130
51 4,030 3,179 2,786 2,553 2,397 2,283 2,195 2,126
52 4,027 3,175 2,783 2,550 2,393 2,279 2,192 2,122
53 4,023 3,172 2,779 2,546 2,389 2,275 2,188 2,119
54 4,020 3,168 2,776 2,543 2,386 2,272 2,185 2,115
55 4,016 3,165 2,773 2,540 2,383 2,269 2,181 2,112
56 4,013 3,162 2,769 2,537 2,380 2,266 2,178 2,109
57 4,010 3,159 2,766 2,534 2,377 2,263 2,175 2,106
58 4,007 3,156 2,764 2,531 2,374 2,260 2,172 2,103
189
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice C: valores críticos de F, α = 0,05 (continuação)
GL denominador
GL numerador
9 10 11 12 13 14 15 16
30 2,211 2,165 2,126 2,092 2,063 2,037 2,015 1,995
31 2,199 2,153 2,114 2,080 2,051 2,026 2,003 1,983
32 2,189 2,142 2,103 2,070 2,040 2,015 1,992 1,972
33 2,179 2,133 2,093 2,060 2,030 2,004 1,982 1,961
34 2,170 2,123 2,084 2,050 2,021 1,995 1,972 1,952
35 2,161 2,1142,075 2,041 2,012 1,986 1,963 1,942
36 2,153 2,106 2,067 2,033 2,003 1,977 1,954 1,934
37 2,145 2,098 2,059 2,025 1,995 1,969 1,946 1,926
38 2,138 2,091 2,051 2,017 1,988 1,962 1,939 1,918
39 2,131 2,084 2,044 2,010 1,981 1,954 1,931 1,911
40 2,124 2,077 2,038 2,003 1,974 1,948 1,924 1,904
41 2,118 2,071 2,031 1,997 1,967 1,941 1,918 1,897
42 2,112 2,065 2,025 1,991 1,961 1,935 1,912 1,891
43 2,106 2,059 2,020 1,985 1,955 1,929 1,906 1,885
44 2,101 2,054 2,014 1,980 1,950 1,924 1,900 1,879
45 2,096 2,049 2,009 1,974 1,945 1,918 1,895 1,874
46 2,091 2,044 2,004 1,969 1,940 1,913 1,890 1,869
47 2,086 2,039 1,999 1,965 1,935 1,908 1,885 1,864
48 2,082 2,035 1,995 1,960 1,930 1,904 1,880 1,859
49 2,077 2,030 1,990 1,956 1,926 1,899 1,876 1,855
50 2,073 2,026 1,986 1,952 1,921 1,895 1,871 1,850
51 2,069 2,022 1,982 1,947 1,917 1,891 1,867 1,846
52 2,066 2,018 1,978 1,944 1,913 1,887 1,863 1,842
53 2,062 2,015 1,975 1,940 1,910 1,883 1,859 1,838
54 2,059 2,011 1,971 1,936 1,906 1,879 1,856 1,835
55 2,055 2,008 1,968 1,933 1,903 1,876 1,852 1,831
56 2,052 2,005 1,964 1,930 1,899 1,873 1,849 1,828
57 2,049 2,001 1,961 1,926 1,896 1,869 1,846 1,824
58 2,046 1,998 1,958 1,923 1,893 1,866 1,842 1,821
190
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice C: valores críticos de F, α = 0,05 (continuação)
GL denominador
GL numerador
1 2 3 4 5 6 7 8
59 4,004 3,153 2,761 2,528 2,371 2,257 2,169 2,100
60 4,001 3,150 2,758 2,525 2,368 2,254 2,167 2,097
61 3,998 3,148 2,755 2,523 2,366 2,251 2,164 2,094
62 3,996 3,145 2,753 2,520 2,363 2,249 2,161 2,092
63 3,993 3,143 2,751 2,518 2,361 2,246 2,159 2,089
64 3,991 3,140 2,748 2,515 2,358 2,244 2,156 2,087
65 3,989 3,138 2,746 2,513 2,356 2,242 2,154 2,084
66 3,986 3,136 2,744 2,511 2,354 2,239 2,152 2,082
67 3,984 3,134 2,742 2,509 2,352 2,237 2,150 2,080
68 3,982 3,132 2,740 2,507 2,350 2,235 2,148 2,078
69 3,980 3,130 2,737 2,505 2,348 2,233 2,145 2,076
70 3,978 3,128 2,736 2,503 2,346 2,231 2,143 2,074
71 3,976 3,126 2,734 2,501 2,344 2,229 2,142 2,072
72 3,974 3,124 2,732 2,499 2,342 2,227 2,140 2,070
73 3,972 3,122 2,730 2,497 2,340 2,226 2,138 2,068
74 3,970 3,120 2,728 2,495 2,338 2,224 2,136 2,066
75 3,968 3,119 2,727 2,494 2,337 2,222 2,134 2,064
76 3,967 3,117 2,725 2,492 2,335 2,220 2,133 2,063
77 3,965 3,115 2,723 2,490 2,333 2,219 2,131 2,061
78 3,963 3,114 2,722 2,489 2,332 2,217 2,129 2,059
79 3,962 3,112 2,720 2,487 2,330 2,216 2,128 2,058
80 3,960 3,111 2,719 2,486 2,329 2,214 2,126 2,056
81 3,959 3,109 2,717 2,484 2,327 2,213 2,125 2,055
82 3,957 3,108 2,716 2,483 2,326 2,211 2,123 2,053
83 3,956 3,107 2,715 2,482 2,324 2,210 2,122 2,052
84 3,955 3,105 2,713 2,480 2,323 2,209 2,121 2,051
85 3,953 3,104 2,712 2,479 2,322 2,207 2,119 2,049
86 3,952 3,103 2,711 2,478 2,321 2,206 2,118 2,048
87 3,951 3,101 2,709 2,476 2,319 2,205 2,117 2,047
191
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice C: valores críticos de F, α = 0,05 (continuação)
GL denominador
GL numerador
9 10 11 12 13 14 15 16
59 2,043 1,995 1,955 1,920 1,890 1,863 1,839 1,818
60 2,040 1,993 1,952 1,917 1,887 1,860 1,836 1,815
61 2,037 1,990 1,949 1,915 1,884 1,857 1,834 1,812
62 2,035 1,987 1,947 1,912 1,882 1,855 1,831 1,809
63 2,032 1,985 1,944 1,909 1,879 1,852 1,828 1,807
64 2,030 1,982 1,942 1,907 1,876 1,849 1,826 1,804
65 2,027 1,980 1,939 1,904 1,874 1,847 1,823 1,802
66 2,025 1,977 1,937 1,902 1,871 1,845 1,821 1,799
67 2,023 1,975 1,935 1,900 1,869 1,842 1,818 1,797
68 2,021 1,973 1,932 1,897 1,867 1,840 1,816 1,795
69 2,019 1,971 1,930 1,895 1,865 1,838 1,814 1,792
70 2,017 1,969 1,928 1,893 1,863 1,836 1,812 1,790
71 2,015 1,967 1,926 1,891 1,861 1,834 1,810 1,788
72 2,013 1,965 1,924 1,889 1,859 1,832 1,808 1,786
73 2,011 1,963 1,922 1,887 1,857 1,830 1,806 1,784
74 2,009 1,961 1,921 1,885 1,855 1,828 1,804 1,782
75 2,007 1,959 1,919 1,884 1,853 1,826 1,802 1,780
76 2,006 1,958 1,917 1,882 1,851 1,824 1,800 1,778
77 2,004 1,956 1,915 1,880 1,849 1,822 1,798 1,777
78 2,002 1,954 1,914 1,878 1,848 1,821 1,797 1,775
79 2,001 1,953 1,912 1,877 1,846 1,819 1,795 1,773
80 1,999 1,951 1,910 1,875 1,845 1,817 1,793 1,772
81 1,998 1,950 1,909 1,874 1,843 1,816 1,792 1,770
82 1,996 1,948 1,907 1,872 1,841 1,814 1,790 1,768
83 1,995 1,947 1,906 1,871 1,840 1,813 1,789 1,767
84 1,993 1,945 1,905 1,869 1,838 1,811 1,787 1,765
85 1,992 1,944 1,903 1,868 1,837 1,810 1,786 1,764
86 1,991 1,943 1,902 1,867 1,836 1,808 1,784 1,763
87 1,989 1,941 1,900 1,865 1,834 1,807 1,783 1,761
192
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice C: valores críticos de F, α = 0,05 (continuação)
GL denominador
GL numerador
1 2 3 4 5 6 7 8
88 3,949 3,100 2,708 2,475 2,318 2,203 2,115 2,045
89 3,948 3,099 2,707 2,474 2,317 2,202 2,114 2,044
90 3,947 3,098 2,706 2,473 2,316 2,201 2,113 2,043
91 3,946 3,097 2,705 2,472 2,315 2,200 2,112 2,042
92 3,945 3,095 2,704 2,471 2,313 2,199 2,111 2,041
93 3,943 3,094 2,703 2,470 2,312 2,198 2,110 2,040
94 3,942 3,093 2,701 2,469 2,311 2,197 2,109 2,038
95 3,941 3,092 2,700 2,467 2,310 2,196 2,108 2,037
96 3,940 3,091 2,699 2,466 2,309 2,195 2,106 2,036
97 3,939 3,090 2,698 2,465 2,308 2,194 2,105 2,035
98 3,938 3,089 2,697 2,465 2,307 2,193 2,104 2,034
99 3,937 3,088 2,696 2,464 2,306 2,192 2,103 2,033
100 3,936 3,087 2,696 2,463 2,305 2,191 2,103 2,032
120 3,920 3,072 2,680 2,447 2,290 2,175 2,087 2,016
140 3,909 3,061 2,669 2,436 2,279 2,164 2,076 2,005
160 3,900 3,053 2,661 2,428 2,271 2,156 2,067 1,997
180 3,894 3,046 2,655 2,422 2,264 2,149 2,061 1,990
200 3,888 3,041 2,650 2,417 2,259 2,144 2,056 1,985
250 3,879 3,032 2,641 2,408 2,250 2,135 2,046 1,976
300 3,873 3,026 2,635 2,402 2,244 2,129 2,040 1,969
350 3,868 3,022 2,630 2,397 2,240 2,125 2,036 1,965
400 3,865 3,018 2,627 2,394 2,237 2,121 2,032 1,962
450 3,862 3,016 2,625 2,392 2,234 2,119 2,030 1,959
500 3,860 3,014 2,623 2,390 2,232 2,117 2,028 1,957
600 3,857 3,011 2,620 2,387 2,229 2,114 2,025 1,954
700 3,855 3,009 2,618 2,385 2,227 2,112 2,023 1,952
800 3,853 3,007 2,616 2,383 2,225 2,110 2,021 1,950
900 3,852 3,006 2,615 2,382 2,224 2,109 2,020 1,949
1000 3,851 3,005 2,614 2,381 2,223 2,108 2,019 1,948
∞ 3,841 2,996 2,605 2,372 2,214 2,099 2,010 1,938
193
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice C: valores críticos de F, α = 0,05 (continuação)
GL denominador
GL numerador
9 10 11 12 13 14 15 16
88 1,988 1,940 1,899 1,864 1,833 1,806 1,782 1,760
89 1,987 1,939 1,898 1,863 1,832 1,804 1,780 1,758
90 1,986 1,938 1,897 1,861 1,830 1,803 1,779 1,757
91 1,984 1,936 1,895 1,860 1,829 1,802 1,778 1,756
92 1,983 1,935 1,894 1,859 1,828 1,801 1,776 1,755
93 1,982 1,934 1,893 1,858 1,827 1,800 1,775 1,753
94 1,981 1,933 1,892 1,857 1,826 1,798 1,774 1,752
95 1,980 1,932 1,891 1,856 1,825 1,797 1,773 1,751
96 1,979 1,931 1,890 1,854 1,823 1,796 1,772 1,750
97 1,978 1,930 1,889 1,853 1,822 1,795 1,771 1,749
98 1,977 1,929 1,888 1,852 1,821 1,794 1,770 1,748
99 1,976 1,928 1,887 1,851 1,820 1,793 1,769 1,747
100 1,975 1,927 1,886 1,850 1,819 1,792 1,768 1,746
120 1,959 1,910 1,869 1,834 1,803 1,775 1,750 1,728
140 1,947 1,899 1,858 1,822 1,791 1,763 1,738 1,716
160 1,939 1,890 1,849 1,813 1,782 1,754 1,729 1,707
180 1,932 1,884 1,842 1,806 1,775 1,747 1,722 1,700
200 1,927 1,878 1,837 1,801 1,769 1,742 1,717 1,694
250 1,917 1,869 1,827 1,791 1,759 1,732 1,707 1,684
300 1,911 1,862 1,821 1,785 1,753 1,725 1,700 1,677
350 1,907 1,858 1,816 1,780 1,748 1,720 1,695 1,672
400 1,903 1,854 1,813 1,776 1,745 1,717 1,691 1,669
450 1,901 1,852 1,810 1,774 1,742 1,714 1,689 1,666
500 1,899 1,850 1,808 1,772 1,740 1,712 1,686 1,664
600 1,895 1,846 1,805 1,768 1,736 1,708 1,683 1,660
700 1,893 1,844 1,802 1,766 1,734 1,706 1,681 1,658
800 1,892 1,843 1,801 1,764 1,732 1,704 1,679 1,656900 1,890 1,841 1,799 1,763 1,731 1,703 1,678 1,655
1000 1,889 1,840 1,798 1,762 1,730 1,702 1,676 1,654
∞ 1,880 1,831 1,789 1,752 1,720 1,692 1,666 1,644
194
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice D: valores da amplitude total estudentizada (q), para uso no teste de Tukey,
α = 0,05
GLDentro
Número de grupos
2 3 4 5 6 7 8 9
1 17,969 26,976 32,819 37,082 40,408 43,119 45,397 47,357
2 6,085 8,331 9,798 10,881 11,734 12,435 13,027 13,539
3 4,501 5,910 6,825 7,502 8,037 8,478 8,852 9,177
4 3,926 5,040 5,757 6,287 6,706 7,053 7,347 7,602
5 3,635 4,602 5,218 5,673 6,033 6,330 6,582 6,801
6 3,460 4,339 4,896 5,305 5,628 5,895 6,122 6,319
7 3,344 4,165 4,681 5,060 5,359 5,606 5,815 5,997
8 3,261 4,041 4,529 4,886 5,167 5,399 5,596 5,767
9 3,199 3,948 4,415 4,755 5,024 5,244 5,432 5,595
10 3,151 3,877 4,327 4,654 4,912 5,124 5,304 5,460
11 3,113 3,820 4,256 4,574 4,823 5,028 5,202 5,353
12 3,081 3,773 4,199 4,508 4,750 4,950 5,119 5,265
13 3,055 3,734 4,151 4,453 4,690 4,884 5,049 5,192
14 3,033 3,701 4,111 4,407 4,639 4,829 4,990 5,130
15 3,014 3,673 4,076 4,367 4,595 4,782 4,940 5,077
16 2,998 3,649 4,046 4,333 4,557 4,741 4,896 5,031
17 2,984 3,628 4,020 4,303 4,524 4,705 4,858 4,991
18 2,971 3,609 3,997 4,276 4,494 4,673 4,824 4,955
19 2,960 3,593 3,977 4,253 4,468 4,645 4,794 4,924
20 2,950 3,578 3,958 4,232 4,445 4,620 4,768 4,895
21 2,941 3,565 3,942 4,213 4,424 4,597 4,743 4,870
22 2,933 3,553 3,927 4,196 4,405 4,577 4,722 4,847
23 2,926 3,542 3,914 4,180 4,388 4,558 4,702 4,826
24 2,919 3,532 3,901 4,166 4,373 4,541 4,684 4,807
25 2,913 3,523 3,890 4,153 4,358 4,526 4,667 4,789
26 2,907 3,514 3,880 4,141 4,345 4,511 4,652 4,773
27 2,902 3,506 3,870 4,130 4,333 4,498 4,638 4,758
28 2,897 3,499 3,861 4,120 4,322 4,486 4,625 4,745
29 2,892 3,493 3,853 4,111 4,311 4,475 4,613 4,732
195
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice D: valores da amplitude total estudentizada (q), para uso no teste de Tukey,
α = 0,05 (continuação)
GLDentro
Número de grupos
10 11 12 13 14 15 16 17
1 49,071 50,592 51,957 53,194 54,323 55,361 56,320 57,212
2 13,988 14,389 14,749 15,076 15,375 15,650 15,905 16,143
3 9,462 9,717 9,946 10,155 10,346 10,522 10,686 10,838
4 7,826 8,027 8,208 8,373 8,524 8,664 8,793 8,914
5 6,995 7,167 7,323 7,466 7,596 7,716 7,828 7,932
6 6,493 6,649 6,789 6,917 7,034 7,143 7,244 7,338
7 6,158 6,302 6,431 6,550 6,658 6,759 6,852 6,939
8 5,918 6,053 6,175 6,287 6,389 6,483 6,571 6,653
9 5,738 5,867 5,983 6,089 6,186 6,276 6,359 6,437
10 5,598 5,722 5,833 5,935 6,028 6,114 6,194 6,269
11 5,486 5,605 5,713 5,811 5,901 5,984 6,062 6,134
12 5,395 5,510 5,615 5,710 5,797 5,878 5,953 6,023
13 5,318 5,431 5,533 5,625 5,711 5,789 5,862 5,931
14 5,253 5,364 5,463 5,554 5,637 5,714 5,785 5,852
15 5,198 5,306 5,403 5,492 5,574 5,649 5,719 5,785
16 5,150 5,256 5,352 5,439 5,519 5,593 5,662 5,726
17 5,108 5,212 5,306 5,392 5,471 5,544 5,612 5,675
18 5,071 5,173 5,266 5,351 5,429 5,501 5,567 5,629
19 5,037 5,139 5,231 5,314 5,391 5,462 5,528 5,589
20 5,008 5,108 5,199 5,282 5,357 5,427 5,492 5,553
21 4,981 5,081 5,170 5,252 5,327 5,396 5,460 5,520
22 4,957 5,056 5,144 5,225 5,299 5,368 5,431 5,491
23 4,935 5,033 5,121 5,201 5,274 5,342 5,405 5,464
24 4,915 5,012 5,099 5,179 5,251 5,319 5,381 5,439
25 4,897 4,993 5,079 5,158 5,230 5,297 5,359 5,417
26 4,880 4,975 5,061 5,139 5,211 5,277 5,339 5,396
27 4,864 4,959 5,044 5,122 5,193 5,259 5,320 5,377
28 4,850 4,944 5,029 5,106 5,177 5,242 5,302 5,359
29 4,837 4,930 5,014 5,091 5,161 5,226 5,286 5,342
196
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice D: valores da amplitude total estudentizada (q), para uso no teste de Tukey,
α = 0,05 (continuação)
GLDentro
Número de grupos
2 3 4 5 6 7 8 9
30 2,888 3,486 3,845 4,102 4,301 4,464 4,601 4,720
31 2,884 3,481 3,838 4,094 4,292 4,454 4,591 4,709
32 2,881 3,475 3,832 4,086 4,284 4,445 4,581 4,698
33 2,877 3,470 3,825 4,079 4,276 4,436 4,572 4,689
34 2,874 3,465 3,820 4,072 4,268 4,428 4,563 4,680
35 2,871 3,461 3,814 4,066 4,261 4,421 4,555 4,671
36 2,868 3,457 3,809 4,060 4,255 4,414 4,547 4,663
37 2,865 3,453 3,804 4,054 4,249 4,407 4,540 4,655
38 2,863 3,449 3,799 4,049 4,243 4,400 4,533 4,648
39 2,861 3,445 3,795 4,044 4,237 4,394 4,527 4,641
40 2,858 3,442 3,791 4,039 4,232 4,388 4,521 4,634
41 2,856 3,439 3,787 4,034 4,227 4,383 4,515 4,628
42 2,854 3,436 3,783 4,030 4,222 4,377 4,510 4,622
43 2,852 3,433 3,780 4,026 4,217 4,373 4,504 4,616
44 2,850 3,430 3,776 4,022 4,213 4,368 4,499 4,611
45 2,848 3,427 3,773 4,018 4,209 4,363 4,494 4,606
46 2,846 3,425 3,770 4,015 4,205 4,359 4,490 4,601
47 2,845 3,422 3,767 4,011 4,201 4,355 4,485 4,596
48 2,843 3,420 3,764 4,008 4,197 4,351 4,481 4,592
49 2,842 3,418 3,761 4,005 4,194 4,347 4,477 4,588
50 2,840 3,416 3,759 4,002 4,190 4,344 4,473 4,584
51 2,839 3,414 3,756 3,999 4,187 4,340 4,469 4,580
52 2,838 3,412 3,754 3,996 4,184 4,337 4,466 4,576
53 2,836 3,410 3,751 3,993 4,181 4,334 4,462 4,572
54 2,835 3,408 3,749 3,991 4,178 4,330 4,459 4,569
55 2,834 3,407 3,747 3,988 4,175 4,327 4,456 4,565
56 2,833 3,405 3,745 3,986 4,173 4,325 4,452 4,562
57 2,832 3,403 3,743 3,984 4,170 4,322 4,449 4,559
58 2,831 3,402 3,741 3,981 4,168 4,319 4,447 4,556
197
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice D: valores da amplitude total estudentizada (q), para uso no teste de Tukey,
α = 0,05 (continuação)
GLDentro
Número de grupos
10 11 12 13 14 15 16 17
30 4,824 4,917 5,001 5,077 5,147 5,211 5,271 5,327
31 4,812 4,905 4,988 5,064 5,134 5,198 5,257 5,313
32 4,802 4,894 4,976 5,052 5,121 5,185 5,244 5,299
33 4,791 4,883 4,965 5,040 5,109 5,173 5,232 5,287
34 4,782 4,873 4,955 5,030 5,098 5,161 5,220 5,275
35 4,773 4,863 4,945 5,020 5,088 5,151 5,209 5,264
36 4,764 4,855 4,936 5,010 5,078 5,141 5,199 5,253
37 4,756 4,846 4,927 5,001 5,069 5,131 5,189 5,243
38 4,749 4,838 4,919 4,993 5,060 5,122 5,180 5,234
39 4,741 4,831 4,911 4,985 5,052 5,114 5,171 5,225
40 4,735 4,824 4,904 4,977 5,044 5,106 5,163 5,216
41 4,728 4,817 4,897 4,970 5,037 5,098 5,155 5,208
42 4,722 4,811 4,890 4,963 5,029 5,091 5,148 5,200
43 4,716 4,804 4,884 4,956 5,023 5,084 5,140 5,193
44 4,710 4,798 4,878 4,950 5,016 5,077 5,134 5,186
45 4,705 4,793 4,872 4,944 5,010 5,071 5,127 5,179
46 4,700 4,787 4,866 4,938 5,004 5,065 5,121 5,173
47 4,695 4,782 4,861 4,932 4,998 5,059 5,115 5,167
48 4,690 4,777 4,856 4,927 4,993 5,053 5,109 5,161
49 4,686 4,772 4,851 4,922 4,988 5,048 5,104 5,155
50 4,681 4,768 4,846 4,917 4,983 5,043 5,098 5,150
51 4,677 4,764 4,842 4,913 4,978 5,038 5,093 5,145
52 4,673 4,760 4,838 4,908 4,973 5,033 5,089 5,140
53 4,669 4,756 4,833 4,904 4,969 5,028 5,084 5,136
54 4,666 4,752 4,829 4,900 4,965 5,024 5,080 5,131
55 4,662 4,748 4,825 4,896 4,961 5,020 5,075 5,127
56 4,659 4,745 4,822 4,892 4,957 5,016 5,071 5,122
57 4,655 4,741 4,818 4,888 4,953 5,012 5,067 5,118
58 4,652 4,738 4,815 4,885 4,949 5,008 5,063 5,114
198
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice D: valores da amplitude total estudentizada (q), para uso no teste de Tukey,
α = 0,05 (continuação)
GLDentro
Número de grupos
2 3 4 5 6 7 8 9
59 2,830 3,400 3,739 3,979 4,165 4,317 4,444 4,553
60 2,829 3,399 3,737 3,977 4,163 4,314 4,441 4,550
61 2,828 3,398 3,735 3,975 4,161 4,312 4,438 4,547
62 2,827 3,396 3,734 3,973 4,159 4,309 4,436 4,545
63 2,826 3,395 3,732 3,971 4,157 4,307 4,434 4,542
64 2,825 3,394 3,731 3,970 4,155 4,305 4,431 4,540
65 2,824 3,392 3,729 3,968 4,153 4,303 4,429 4,537
66 2,824 3,391 3,728 3,966 4,151 4,301 4,427 4,535
67 2,823 3,390 3,726 3,964 4,149 4,299 4,425 4,533
68 2,822 3,389 3,725 3,963 4,147 4,297 4,423 4,531
69 2,821 3,388 3,723 3,961 4,145 4,295 4,421 4,529
70 2,820 3,386 3,722 3,960 4,1444,293 4,419 4,527
71 2,820 3,385 3,721 3,958 4,142 4,291 4,417 4,525
72 2,819 3,384 3,720 3,957 4,140 4,289 4,415 4,523
73 2,818 3,383 3,718 3,956 4,139 4,288 4,413 4,521
74 2,818 3,382 3,717 3,954 4,137 4,286 4,411 4,519
75 2,817 3,381 3,716 3,953 4,136 4,284 4,410 4,517
76 2,816 3,380 3,715 3,952 4,134 4,283 4,408 4,515
77 2,816 3,380 3,714 3,951 4,133 4,281 4,407 4,514
78 2,815 3,379 3,713 3,949 4,132 4,280 4,405 4,512
79 2,815 3,378 3,712 3,948 4,130 4,278 4,403 4,511
80 2,814 3,377 3,711 3,947 4,129 4,277 4,402 4,509
81 2,813 3,376 3,710 3,946 4,128 4,276 4,401 4,507
82 2,813 3,375 3,709 3,945 4,127 4,274 4,399 4,506
83 2,812 3,375 3,708 3,944 4,125 4,273 4,398 4,505
84 2,812 3,374 3,707 3,943 4,124 4,272 4,396 4,503
85 2,812 3,373 3,706 3,942 4,123 4,271 4,395 4,502
86 2,811 3,373 3,706 3,941 4,122 4,269 4,394 4,500
87 2,811 3,372 3,705 3,940 4,121 4,268 4,393 4,499
199
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice D: valores da amplitude total estudentizada (q), para uso no teste de Tukey,
α = 0,05 (continuação)
GLDentro
Número de grupos
10 11 12 13 14 15 16 17
59 4,649 4,735 4,811 4,881 4,945 5,005 5,060 5,111
60 4,646 4,732 4,808 4,878 4,942 5,001 5,056 5,107
61 4,643 4,729 4,805 4,875 4,939 4,998 5,053 5,103
62 4,640 4,726 4,802 4,872 4,936 4,994 5,049 5,100
63 4,638 4,723 4,799 4,869 4,932 4,991 5,046 5,097
64 4,635 4,721 4,796 4,866 4,930 4,988 5,043 5,093
65 4,633 4,718 4,794 4,863 4,927 4,985 5,040 5,090
66 4,630 4,715 4,791 4,860 4,924 4,982 5,037 5,087
67 4,628 4,713 4,788 4,858 4,921 4,979 5,034 5,084
68 4,626 4,710 4,786 4,855 4,918 4,977 5,031 5,081
69 4,624 4,708 4,783 4,852 4,916 4,974 5,028 5,078
70 4,621 4,706 4,781 4,850 4,913 4,971 5,026 5,076
71 4,619 4,703 4,779 4,848 4,911 4,969 5,023 5,073
72 4,617 4,701 4,777 4,845 4,909 4,966 5,021 5,070
73 4,615 4,699 4,775 4,843 4,906 4,964 5,018 5,068
74 4,613 4,697 4,772 4,841 4,904 4,962 5,016 5,065
75 4,612 4,695 4,770 4,839 4,902 4,959 5,014 5,063
76 4,610 4,693 4,768 4,837 4,900 4,957 5,011 5,061
77 4,608 4,691 4,766 4,835 4,898 4,955 5,009 5,058
78 4,606 4,690 4,765 4,833 4,896 4,953 5,007 5,056
79 4,605 4,688 4,763 4,831 4,894 4,951 5,005 5,054
80 4,603 4,686 4,761 4,829 4,892 4,949 5,003 5,052
81 4,601 4,684 4,759 4,827 4,890 4,947 5,001 5,050
82 4,600 4,683 4,758 4,825 4,888 4,945 4,999 5,048
83 4,598 4,681 4,756 4,824 4,887 4,943 4,997 5,046
84 4,597 4,680 4,754 4,822 4,885 4,942 4,995 5,044
85 4,595 4,678 4,753 4,821 4,883 4,940 4,994 5,042
86 4,594 4,677 4,751 4,819 4,882 4,938 4,992 5,041
87 4,593 4,675 4,750 4,817 4,880 4,937 4,990 5,039
200
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice D: valores da amplitude total estudentizada (q), para uso no teste de Tukey,
α = 0,05 (continuação)
GLDentro
Número de grupos
2 3 4 5 6 7 8 9
88 2,810 3,371 3,704 3,939 4,120 4,267 4,391 4,498
89 2,810 3,371 3,703 3,938 4,119 4,266 4,390 4,497
90 2,809 3,370 3,702 3,937 4,118 4,265 4,389 4,495
91 2,809 3,369 3,702 3,936 4,117 4,264 4,388 4,494
92 2,809 3,369 3,701 3,935 4,116 4,263 4,387 4,493
93 2,808 3,368 3,700 3,934 4,115 4,262 4,386 4,492
94 2,808 3,368 3,699 3,934 4,114 4,261 4,385 4,491
95 2,807 3,367 3,699 3,933 4,113 4,260 4,384 4,490
96 2,807 3,367 3,698 3,932 4,113 4,259 4,383 4,489
97 2,807 3,366 3,697 3,931 4,112 4,258 4,381 4,487
98 2,806 3,365 3,697 3,930 4,111 4,257 4,381 4,486
99 2,806 3,365 3,696 3,930 4,110 4,256 4,380 4,485
100 2,806 3,364 3,695 3,929 4,109 4,255 4,379 4,484
120 2,800 3,356 3,685 3,917 4,096 4,241 4,363 4,468
140 2,796 3,350 3,678 3,908 4,087 4,231 4,352 4,456
160 2,793 3,346 3,672 3,902 4,080 4,223 4,344 4,448
180 2,791 3,342 3,668 3,897 4,074 4,217 4,337 4,441
200 2,789 3,339 3,664 3,893 4,070 4,212 4,332 4,435
250 2,785 3,334 3,658 3,886 4,062 4,204 4,322 4,425
300 2,783 3,331 3,654 3,881 4,056 4,198 4,316 4,419
350 2,782 3,328 3,651 3,878 4,053 4,194 4,312 4,414
400 2,780 3,327 3,649 3,875 4,050 4,191 4,309 4,411
450 2,779 3,325 3,647 3,873 4,048 4,189 4,306 4,408
500 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387
600 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387
700 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387
800 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387
1000 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387
∞ 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387
201
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice D: valores da amplitude total estudentizada (q), para uso no teste de Tukey,
α = 0,05 (continuação)
GLDentro
Número de grupos
10 11 12 13 14 15 16 17
88 4,591 4,674 4,748 4,816 4,878 4,935 4,989 5,037
89 4,590 4,672 4,747 4,814 4,877 4,934 4,987 5,036
90 4,589 4,671 4,745 4,813 4,875 4,932 4,985 5,034
91 4,587 4,670 4,744 4,812 4,874 4,931 4,984 5,032
92 4,586 4,668 4,743 4,810 4,872 4,929 4,982 5,031
93 4,585 4,667 4,741 4,809 4,871 4,928 4,981 5,029
94 4,584 4,666 4,740 4,808 4,870 4,926 4,979 5,028
95 4,583 4,665 4,739 4,806 4,868 4,925 4,978 5,026
96 4,582 4,664 4,738 4,805 4,867 4,924 4,977 5,025
97 4,580 4,662 4,736 4,804 4,866 4,922 4,975 5,024
98 4,579 4,661 4,735 4,803 4,864 4,921 4,974 5,022
99 4,578 4,660 4,734 4,801 4,863 4,920 4,972 5,021
100 4,577 4,659 4,733 4,800 4,862 4,918 4,971 5,020
120 4,560 4,641 4,714 4,781 4,842 4,898 4,950 4,998
140 4,548 4,628 4,701 4,767 4,828 4,883 4,935 4,983
160 4,539 4,619 4,691 4,757 4,817 4,873 4,924 4,971
180 4,531 4,611 4,683 4,749 4,809 4,864 4,915 4,962
200 4,526 4,605 4,677 4,743 4,802 4,857 4,908 4,955
250 4,515 4,594 4,666 4,731 4,790 4,845 4,895 4,942
300 4,508 4,587 4,659 4,723 4,782 4,837 4,887 4,933
350 4,503 4,582 4,654 4,718 4,777 4,831 4,881 4,927
400 4,500 4,578 4,650 4,714 4,772 4,827 4,876 4,923
450 4,497 4,575 4,647 4,711 4,769 4,823 4,873 4,919
500 4,474 4,552 4,622 4,685 4,743 4,796 4,845 4,891
600 4,474 4,552 4,622 4,685 4,743 4,796 4,845 4,891
700 4,474 4,552 4,622 4,685 4,743 4,796 4,845 4,891
800 4,474 4,552 4,622 4,685 4,743 4,796 4,845 4,891
1000 4,474 4,552 4,622 4,685 4,743 4,796 4,845 4,891
∞ 4,474 4,552 4,622 4,685 4,743 4,796 4,845 4,891
202
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice E: valores críticos de chi quadrado
GL
Nível de significância adotado
0,100 0,050 0,025 0,010 0,005 0,001
1 2,706 3,841 5,024 6,635 7,879 10,828
2 4,605 5,991 7,378 9,210 10,597 13,816
3 6,251 7,815 9,348 11,345 12,838 16,266
4 7,779 9,488 11,143 13,277 14,860 18,467
5 9,236 11,070 12,833 15,086 16,750 20,515
6 10,645 12,592 14,449 16,812 18,548 22,458
7 12,017 14,067 16,013 18,475 20,278 24,322
8 13,362 15,507 17,535 20,090 21,955 26,124
9 14,684 16,919 19,023 21,666 23,589 27,877
10 15,987 18,307 20,483 23,209 25,188 29,588
11 17,275 19,675 21,920 24,725 26,757 31,264
12 18,549 21,026 23,337 26,217 28,300 32,909
13 19,812 22,362 24,736 27,688 29,819 34,528
14 21,064 23,685 26,119 29,141 31,319 36,123
15 22,307 24,996 27,488 30,578 32,801 37,697
16 23,542 26,296 28,845 32,000 34,267 39,252
17 24,769 27,587 30,191 33,409 35,718 40,790
18 25,989 28,869 31,526 34,805 37,156 42,312
19 27,204 30,144 32,852 36,191 38,582 43,820
20 28,412 31,410 34,170 37,566 39,997 45,315
21 29,615 32,671 35,479 38,932 41,401 46,797
22 30,813 33,924 36,781 40,289 42,796 48,268
23 32,007 35,172 38,076 41,638 44,181 49,728
24 33,196 36,415 39,364 42,980 45,559 51,179
25 34,382 37,652 40,646 44,314 46,928 52,620
26 35,563 38,885 41,923 45,642 48,290 54,052
27 36,741 40,113 43,195 46,963 49,645 55,476
28 37,916 41,337 44,461 48,278 50,993 56,892
29 39,087 42,557 45,722 49,588 52,336 58,301
203
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Apêndice E: valores críticos de chi quadrado (continuação)
GL
Nível de significância adotado
0,100 0,050 0,025 0,010 0,005 0,001
30 40,256 43,773 46,979 50,892 53,672 59,703
31 41,422 44,985 48,232 52,191 55,003 61,09832 42,585 46,194 49,480 53,486 56,328 62,487
33 43,745 47,400 50,725 54,776 57,648 63,870
34 44,903 48,602 51,966 56,061 58,964 65,247
35 46,059 49,802 53,203 57,342 60,275 66,619
36 47,212 50,998 54,437 58,619 61,581 67,985
37 48,363 52,192 55,668 59,893 62,883 69,346
38 49,513 53,384 56,896 61,162 64,181 70,703
39 50,660 54,572 58,120 62,428 65,476 72,055
40 51,805 55,758 59,342 63,691 66,766 73,402
41 52,949 56,942 60,561 64,950 68,053 74,745
42 54,090 58,124 61,777 66,206 69,336 76,084
43 55,230 59,304 62,990 67,459 70,616 77,419
44 56,369 60,481 64,201 68,710 71,893 78,750
45 57,505 61,656 65,410 69,957 73,166 80,077
46 58,641 62,830 66,617 71,201 74,437 81,400
47 59,774 64,001 67,821 72,443 75,704 82,720
48 60,907 65,171 69,023 73,683 76,969 84,037
49 62,038 66,339 70,222 74,919 78,231 85,351
50 63,167 67,505 71,420 76,154 79,490 86,661
204
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
205
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
206
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
207
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
208
Re
vi
sã
o:
B
ru
no
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
10
/0
6/
20
19
Informações:
www.sepi.unip.br ou 0800 010 9000