Buscar

BIOESTATÍSTICA 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 57 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 57 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 57 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

90
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Unidade II
Como já falamos, o objetivo maior da Bioestatística é a tomada de decisões, agora trataremos 
exatamente das técnicas disponíveis para tomada de decisões. Iniciaremos com uma revisão de conceitos 
de probabilidade para entendermos melhor como esses conceitos são utilizados em bioestatística, pois 
podem nos apresentar proporções interessantes a respeito de amostras.
A inferência estatística é o momento em que podemos determinar os parâmetros de nossas variáveis 
e, consequentemente, chegar a conclusões a respeito da população em estudo por meio da amostra.
As técnicas que apresentaremos são os testes de hipóteses para amostras pequenas e grandes, 
incluindo o teste T de Student e o teste qui‑quadrado.
Esses testes nos permitem levantar hipóteses a respeito de nossa pesquisa, da amostra e da média 
fazendo comparações que nos permitem validar ou não essas hipóteses.
Apresentaremos ainda o teste para correlação entre duas variáveis por meio da determinação 
do coeficiente de correlação do gráfico gerado pelos dados e da equação de regressão, que nos dará 
previsão de resultados para novos valores das variáveis.
5 Distribuições teóricas De ProbabiliDaDe
5.1 introdução à probabilidade
A Teoria da Probabilidade estuda as possibilidades da ocorrência de um experimento aleatório, ou 
seja, eventos que, mesmo quando repetidas inúmeras vezes, nas mesmas condições, podem apresentar 
resultados diferentes.
5.1.1 Experimento aleatório
As características de um experimento aleatório são: repetir‑se várias vezes na mesma condição. O 
conjunto de todos os resultados possíveis é conhecido e, mesmo assim, não se pode prever qual é o 
resultado.
Os elementos de um experimento aleatório são:
Espaço amostral ou Universo (U)
É o conjunto de todos os resultados possíveis de um experimento aleatório.
91
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
A cada experimento corresponde, em geral, a vários resultados possíveis.
Exemplos:
1) Quando lançamos uma moeda, há dois resultados possíveis: ocorrer cara ou coroa. Portanto, o 
espaço amostral é U = {cara, coroa}.
2) Quando jogamos um dado, há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6, portanto o espaço 
amostral é U = {1, 2, 3, 4, 5, 6}.
3) Quando utilizamos um baralho de 52 cartas, nosso espaço amostral são as 52 cartas, que podem 
ser de quatro naipes diferentes: ouros, copas, espadas e paus, conforme figura a seguir. Cada naipe 
tem nove cartas numeradas de 2 a 10, o número 1 é representado pela carta Às (A) e 3 cartas 
representadas pelas figuras de um valete, uma dama e um rei.
Copas Espadas Ouros Paus
Figura 75 – Naipes do baralho
4) Se lançarmos duas moedas sucessivamente, teremos o espaço amostral: U = {(Ca, Ca), (Ca, Co), 
(Co, Ca), (Co, Co)}, como podemos verificar na figura a seguir:
1ª moeda 2ª moeda Resultados possíveis
Cara, cara
Cara, coroa
Coroa, cara
Coroa, coroa
Figura 76 – Diagrama das possibilidades do lançamento de duas moedas sucessivamente
5.1.2 Probabilidade da ocorrência de um evento P(A)
Chamamos de probabilidade de um evento A (A ⊂ U) o número real P(A), tal que:
P A
n A
n U
( ) = ( )( )
92
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Onde:
n(A) é o número de elementos de A.;
n(U) é o número de elementos de U.
Exemplos:
1. Considerando o lançamento de uma moeda e o evento A “obter cara”, temos:
U = {Ca, Co}, então n(U) = 2 A = {Ca}, então n(A) = 1
Portanto,
P A( ) = 1
2
ou P(A) = 0,5
ou ainda P(A) = 50%
2. Sabe‑se que a quantidade de quartos do Asilo Seja Bem‑Vindo é 50, se 30 deles estão ocupados, 
qual é a porcentagem de leitos ocupados?
N(U) = 50, N(A) = 30, logo:
P A( ) = =30
50
0 6,
Ou seja 0,6 x 100 = 60% dos quartos estão ocupados.
5.1.3 Eventos complementares
Sabemos que um evento pode ocorrer (sucesso) ou não (insucesso). Sendo s a probabilidade de que 
ele ocorra e i a probabilidade de que ele não ocorra, temos a relação:
s + i = 1, pois a probabilidade da ocorrência de um evento qualquer sempre está entre 0 e 1, ou seja: 
0<P(A)<1.
No exemplo do asilo, temos 60% (sucesso) dos quartos ocupados, portanto, restam 40% (insucesso) 
dos quartos para ser ocupados, pois 60%: 60% + 40% = 100% ou ainda:
30
50
20
50
50
50
1+ = =
93
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
5.1.4 Eventos independentes (e)
Dois eventos são independentes quando a realização ou não de um não afeta a probabilidade da 
realização do outro. A fórmula para seu cálculo é dada por:
P = P1 x P2
Exemplo:
No lançamento de dois dados, simultaneamente, qual a probabilidade de ocorrer 3 no primeiro dado 
e 5 no segundo dado?
p1
1
6
= (3 no 1º dado) p2
1
6
= (5 no 2º dado)
Então, a probabilidade de obtermos, simultaneamente, 3 no primeiro dado e 5 no segundo dado é:
P x= =1
6
1
6
1
36
5.1.5 Eventos mutuamente exclusivos (ou)
Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a 
realização do(s) outro(s).
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à 
soma das probabilidades de que cada um deles se realize: P = P1 + P2
Exemplo:
No lançamento de dois dados, simultaneamente, qual a probabilidade de ocorrer 2 no primeiro ou 
4 no segundo dado?
p1
1
6
= (2 no 1º dado) p2
1
6
= (4 no 2º dado)
Então, a probabilidade de obtermos 2 no primeiro dado ou 4 no segundo dado é:
P = + = =1
6
1
6
2
6
1
3
94
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
 lembrete
Quando estamos lidando com eventos independentes (e) devemos 
multiplicar as probabilidades. Para eventos dependentes (ou), somamos as 
probabilidades.
 observação
Neste primeiro momento desta parte do estudo, iremos relembrar 
probabilidade, pois em Bioestatística utilizamos apenas as distribuições 
teóricas de probabilidade para descrever o comportamento das variáveis.
5.2 Distribuições teóricas de probabilidade
A cada variável aleatória é associada uma distribuição de probabilidade para as variáveis discretas, 
especifica todos os resultados possíveis da variável aleatória e a probabilidade de sua ocorrência, 
já para as contínuas, nos permite determinar as probabilidades de sua ocorrência nos intervalos 
específicos de valores.
Para uma amostra de observações, a distribuição de frequências exibe os resultados observados e 
quantas vezes aparecem no conjunto de dados.
A distribuição de probabilidades para variáveis aleatórias discretas mostra cada possível resultado da 
variável e sua probabilidade correspondente.
As probabilidades representam a frequência relativa de ocorrência de cada resultado em vários ensaios 
repetidos sob condições essenciais idênticas, o que pode ser associado com amostras infinitamente grandes.
São distribuições de probabilidade: a distribuição binomial para variáveis aleatórias discretas, a distribuição 
de Poisson e a distribuição normal de probabilidade. Em Bioestatística, vamos abordar apenas a última.
Exemplos:
1. O Hospital e Maternidade Baruch de Toulouse realizará concurso para preencher alguns cargos 
administrativos para os quais 100 candidatos se inscreveram. O gestor do hospital deseja saber 
qual a proporção do grau de instrução dos candidatos.
Resolução:
Para tanto, basta encontrar a frequência relativa das classes e teremos a proporção do grau de 
instrução dos 100 candidatos, conforme tabela a seguir.
95
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Figura 77 – Grau de instrução dos candidatos ao cargo administrativo do hospital
2. O gestor do Hospital e Maternidade Athena de Toulouse deseja saber qual a proporção de 
funcionários de cada geração, entre os 30 funcionários que fizeram o curso oferecido emEnsino 
a Distância. Para tanto, utilizou as respostas à questão:
Q.1: Você nasceu:
a) Antes de 1955 – considerada geração Baby Boomers.
b) Entre 1956 e 1970 – considerada geração X.
c) Entre 1971 e 1990 – considerada geração Y.
d) Após 1990 – considerada geração Z.
O gestor obteve o seguinte resultado:
Figura 78 – Proporção de respondentes em relação à geração a que pertence
96
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
 lembrete
As probabilidades representam a frequência relativa ou proporcional de 
ocorrência de cada resultado:
Fr
Fi
Fi
=
∑
 observação
Os cálculos de todas as frequências são apresentados quando criamos a 
distribuição de frequências completa, porém, as frequências são utilizadas 
de acordo com a necessidade.
5.2.1 Distribuição normal de probabilidade
A distribuição normal de probabilidade é uma das mais empregadas entre as distribuições teóricas 
de variável aleatória contínua.
O aspecto gráfico de uma distribuição normal é (curva normal ou de Gauss):
f(x)
Média x
Figura 79 – Curva de Gauss
A variável x pode assumir qualquer valor real.
Curva de Gauss é uma curva em forma de sino assintótica em relação ao eixo x e simétrica em 
relação à média. Portanto, a probabilidade de ocorrer valor maior que a média é igual à probabilidade de 
ocorrer valor menor do que a média.
97
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Escrevemos:
P(x>x) = P(x<x) = 5.
A distribuição normal reduzida, ou padronizada, que admite média 0 e desvio padrão 1, é indicada pela 
letra Z. Para reduzirmos os valores que desejamos para a curva padronizada, devemos utilizar a fórmula:
Para amostras:
Z
x x
S
= −
Para população:
Z
x= − m
σ
A utilização da fórmula nos dá a associação das probabilidades à distribuição normal reduzida, que 
se apresenta na tabela de distribuição normal:
Tabela 2 – Tabela de distribuição normal reduzida. Áreas sob a curva normal padrão. 
Para os valores negativos de z as áreas são obtidas por simetria
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,10 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,20 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409
0,30 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,40 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793
0,50 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,60 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490
0,70 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,80 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,90 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891
1,00 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214
1,10 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,20 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,30 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41309 0,41466 0,41621 0,41774
1,40 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189
1,50 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,60 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,70 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327
98
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
1,80 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,90 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670
2,00 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,10 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574
2,20 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,30 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,40 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361
2,50 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520
2,60 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,70 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,80 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807
2,90 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861
3,00 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900
3,10 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929
3,20 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950
3,30 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965
3,40 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976
3,50 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983
3,60 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989
3,70 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992
3,80 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995
3,90 0,49995 0,49995 0,49996 0,49996 0,49996 0,49996 0,49996 0,49996 0,49997 0,49997
4,00 0,49997 0,49997 0,49997 0,49997 0,49997 0,49997 0,49998 0,49998 0,49998 0,49998
 observação
Esta tabela foi criada no Microsoft Excel, com a função DIST.NORMP.N
Exemplos:
1. Admitindo que a distribuição de QI dos funcionários do Hospital e Maternidade Baruch de 
Toulouse seja normal, com média 100 pontos e desvio padrão 10 pontos, qual a probabilidade de 
um funcionário, tomado ao acaso, apresentar QI superior a 120 pontos?
Para que possamos utilizar a tabela de distribuição Z, devemos transformar o nosso valor de QI 
em Z, temos x = 100, s=10 e desejamos saber P(X)>120
Z
x x
s
Z= − − = =120 100
10
20
10
2
Portanto, queremos saber: P(X)>120, que se transforma em P(Z)>2
99
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Então, temos: P(x)>120 = P(Z)>2
Vamos então, fazer o esboço da curva normal, gráfico 13:
–5 –4 –3 –2 –1 0 1 2 3 4 5
Figura 80 – Esboço curva normal para z>2
Como queremos apenas a parte do gráfico que está em amarelo, devemos retirar o intervalo de 
0 a 1, da área do gráfico, então:
P(Z) >2 = P(Z>0) – P(0<Z<2)
P(Z>0) é igual a 0,5 ou 50%, e P(0<Z<2), devemos procurar, na tabela de distribuição normal 
reduzida (tabela 2), a intersecção da linha onde se encontra o nº 2,0 e a coluna 0,00, pois o número é 
2,00, obtendo o valor 0,4772.
Substituindo os valores, temos:
P(Z) >2 = 0,5 – 0,4772
P(Z) >2 = 0,0228 x 100
P(Z) >2 = 2,28 %
Então, concluímos que a probabilidade de um funcionário, tomado ao acaso, apresentar QI superior 
a 120 pontos é de 2,28%.
 observação
A Fórmula no Excel, nesse caso, é: =0,5‑(DIST.NORMP.N(2;1)‑0,5)= 
2,28% (não esqueça de formatar o número da célula em que está a fórmula 
para porcentagem).
100
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
2. Admitindo‑se o exemplo anterior, qual a probabilidade de um desses funcionários, tomado ao 
acaso, apresentar QI entre 80 e 115 pontos?
Temos x = 100, s=10 e desejamos saber P(80<X<115)
Z
x x
s
Z Z= − = − = − = − = − = =80 100
10
20
10
2
115 100
10
15
10
152 ,
Então, temos: P(80<X<115) = P(‑2<Z<1,5)
Vamos então, fazer o esboço da curva normal:
2 0 1,5
Figura 81 – Esboço de curva normal para ‑2<Z<1,5
Para obtermos a área total do gráfico que está em amarelo, devemos juntar a área de ‑2 até 0e de 0 até 1,5.
P(‑2<Z<1,5) = P(‑2<Z<0) + P(0<Z<1,5)
Procurando na tabela, temos:
P(‑2<Z<1,5) = P(‑2<Z<0) + P(0<Z<1,5)
P(‑2<Z<1,5) = 0,4772 + 0,4332
P(‑2<Z<1,5) = 0,9104 x 100
P(‑2<Z<1,5) = 91,04%
Então concluímos que a probabilidade de um dos funcionários apresentar QI entre 80 e 115 pontos, 
é de 91,04%.
Portanto, podemos concluir que, com base em grandes amostras, podemos estimar média, variância 
e desvio padrão, e com base na distribuição normal, podemos definir critérios de normalidade e não 
normalidade.
101
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
 observação
A Fórmula no Excel, nesse caso é:
=0,5‑DIST.NORMP.N(‑2;1)+DIST.NORMP.N(1,5;1)‑0,5 =91,04%
 lembrete
Quando desejamos saber a probabilidade da ocorrência de uma 
variável, resultado de uma pesquisa, devemos recorrer à distribuição 
normal de probabilidade.
 saiba mais
Você pode achar mais exemplos com o tema saúde e distribuição normal 
de probabilidades no livro:
PAGANO, M.; GAUVREAU, K. Bioestatística. 2. ed. São Paulo: Thomson 
Learning, 2006.
6 introDução ao teste De HiPóteses
Quando se faz pesquisa, tem‑se por objetivo responder a perguntas, que devem ser transformadas 
em hipóteses, ou hipótese, que é uma pressuposição a respeito de determinado problema.
6.1 conceito de hipótese
Quando formulamos uma hipótese, desejamos comprová‑la por meio de uma amostra e ela não será 
de valor se não pudermos generalizá‑la. Para generalizar uma pesquisa, ou responder a uma hipótese, 
existe, em estatística, um mecanismo chamado teste de hipóteses.
Assim, testar uma hipótese nada mais é do que generalizar um pressuposto e, assim, chegar a 
uma conclusão.
Testar uma hipótese pode ser, então, aceitar ou rejeitar uma afirmação sobre um determinado 
parâmetro. Essa afirmação é chamada de hipótese e denominada de teste de hipótese.
Existem dois tipos de hipóteses em um teste de hipóteses, a hipótese nula, que comumente chamamos 
de H0, e a hipótese alternativa, que comumente chamamos de H1. Então, temos:
102
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Hipótese nula (H0): a hipótese a ser testada.
Hipótese alternativa (H1): a hipótese a ser considerada como uma alternativa à hipótese nula.
A hipótese nula, em um teste de hipótese relacionado com a média de uma população m, deve 
sempre especificar um único valor para aquele parâmetro.
Portanto:
No caso da hipótese nula H0
H0: m = m0
A hipótese alternativa deve refletir o propósito do teste de hipótese em questão. Existem três 
possibilidades para a escolha da hipótese alternativa:
•	 Teste	bilateral: se estivermos preocupados em decidir se a média de uma população é diferente 
de um valor especificado:
H1: m ≠ m0
•	 Teste	unilateral	à	esquerda: se quisermos comprovar que a média de uma população é menor 
que um valor especificado. Neste caso expressamos a hipótese alternativa como:
H1: m<m0
•	 Teste	unilateral	à	direita: se estivermos preocupados em decidir se a média de uma população 
é maior que um valor especificado.
H1: m>m0
Exemplo:
1. O gestor da Maternidade Athena de Toulouse, percebeu que na maioria dos casos de nascimento de 
crianças com baixo peso, as mães utilizavam algum tipo de droga ilícita, portanto, questionou‑se: 
a probabilidade de baixo peso ao nascer é maior quando a mãe faz uso contínuo de drogas ilícitas 
durante a gestação?
Resolução:
Para responder à pergunta, será necessário comparar o peso ao nascer de filhos de dois grupos de 
mães: as que usaram drogas ilícitas durante a gestação e as que não usaram drogas ilícitas durante a 
gestação, o que gerou as seguintes hipóteses:
103
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
H0: a probabilidade de ter filhos com baixo peso ao nascer é a mesma para mães que usaram ou não, 
drogas ilícitas durante a gestação.
H1: a probabilidade de ter filhos com baixo peso ao nascer é maior para mães que usaram drogas 
ilícitas durante a gestação.
 lembrete
Hipótese nula (H0): a hipótese a ser testada.
Hipótese alternativa (H1): a hipótese a ser considerada como uma 
alternativa à hipótese nula.
6.2 aplicação do teste
Após a definição das duas hipóteses, nula e alternativa, utilizar de cálculos que nos permitam 
determinar qual das duas é verdadeira, ou qual das hipóteses iremos rejeitar e qual iremos aceitar.
Devemos, então, escolher uma amostra aleatória da população e fazer uma comparação com 
a hipótese nula. Se os dados da amostra forem consistentes com ela, não rejeitamos a hipótese 
nula, caso não sejam consistentes, rejeitamos a hipótese nula e assumimos que a hipótese 
alternativa é verdadeira.
Por convenção, testa‑se sempre H0. Dessa forma, aceitar H0 implica comprovar a igualdade e rejeitar 
H0 implica comprovar a diferença entre os grupos testados.
6.3 nível de significância
Para confirmar ou rejeitar alguma hipótese, devemos estabelecer o valor da probabilidade tolerável de 
incorrer no erro de rejeitar H0, quando H0 é verdadeira. Esse valor é conhecido como nível de significância 
do teste e é designado pela letra grega a.
É comum adotar um nível de significância de 5%, porém ainda pode ser de 10% ou de 1%. Isto é, 
respectivamente: a = 0,05, a=0,10 ou a = 0,01.
Quando o nível de significância é de 5% significa que há uma confiança de 95% de que a decisão 
tomada foi acertada.
 lembrete
Sempre que desejamos confirmar ou rejeitar hipóteses, devemos 
determinar o nível de significância.
104
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
 observação
Nível de significância do teste é a probabilidade de cometer um erro, 
como rejeitar H0 quando H0 é verdadeira.
6.4 teste para amostras com a média de uma população
Uma amostra é considerada pequena quando apresenta n<30 e grande quando apresenta n>30.
6.4.1 Amostras grandes (n>30)
Devemos, em primeiro lugar, escrever as hipóteses nula e alternativa e, depois, definir o nível de 
confiança, calcular o valor da estatística do teste, rejeitar ou não H0 e concluir.
A estatística do teste
Devemos, em primeiro lugar, determinar a média aritmética da amostra com a fórmula:
x
x
n
= ∑
Depois, vamos determinar o desvio em relação à média, com a fórmula:
σx
S
n
=
Onde:
σx = desvio em relação à média.
S = desvio padrão amostral.
n = raiz quadrada do tamanho da amostra.
Depois devemos determinar o valor relativo ao nível de significância a escolhida, chamado za que se 
encontra na tabela a seguir:
Tabela 3 – Valores críticos de za
a 0,10 0,05 0,025 0,01 0,005
za Z0,10 Z0,05 Z0,025 Z0,01 Z0,005
Valores críticos de za 1,28 1,645 1,96 2,33 2,575
105
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Então, determinamos o valor de z, que chamaremos de zcalc utilizando os valores da pesquisa, por 
meio da fórmula:
Zcalc
x
S
n
= − m
Onde:
Zcalc = estatística do teste.
x = média amostral.
m = média da população.
S = desvio padrão amostral.
n = nº de elementos da amostra.
Uma vez determinado zcalc, devemos decidir por H0 ou H1 por meio do teste da média das amostras, 
conforme figura a seguir:
H0:µ1 = µ2 contra uma das alternativas
H1:µ1 ≠ µ2 (bilateral) ou
H1:µ1>µ2 (unilateral superior) ou
H1:µ1<µ2 (unilateral inferior) ou
Unilateral 
a direita
Unilateral 
a esquerda
Figura 82 – Teste de hipóteses
A decisão é feita por meio da área da calda da curva de Gauss, como mostra a figura seguinte:
Rejeite
H0
Rejeite
H0
α/2 α
‑Zα/2 ‑ZαZα/2 Zα0 00
α/2 α
Não 
rejeite
H0
Não rejeite H0 Não rejeite H0
Bilateral Unilateral à esquerda
µ1 ≠ µ2
Região crítica 
bilateral: Rejeita‑se 
H0 se 
Zcalc<Zα/2 ou
Zcalc>Z(1–α/2)
µ1<µ2
Região crítica 
unilateral à esquerda: 
Rejeita‑se H0 se 
Zcalc<Zα
µ1>µ2
Região crítica 
unilateral à direita: 
Rejeita‑se H0 se 
Zcalc>Z(1–α)
Unilateral à direita
Z ZZ
Rejeite
H0
Rejeite
H0
Figura 83 – Comoaceitar ou rejeitar Ho na curva normal
106
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Exemplos:
1. O gestor do Hospital Baruch Toulouse verificou que, o valor das refeições, em 2014, no restaurante 
que serve funcionários e clientes, que é terceirizado, teve preço médio de R$ 28,44 das refeições. 
Fez, então, uma pesquisa em 40 restaurantes aleatoriamente escolhidos na cidade, e foi obtida a 
média de R$31,75 e desvio‑padrão R$7,35. Os dados fornecidos proporcionam evidência suficiente 
para concluir que o preço médio pesquisado nos restaurantes da cidade é maior em relação ao 
restaurante que serve o hospital? Utilize nível de significância de 1%.
Resolução:
Devemos, em primeiro lugar, escrever as hipóteses:
H0: m = 28,44 (o preço médio não aumentou).
H1: m>28,44 (o preço médio aumentou).
Agora, vamos utilizar a tabela 3, mencionada anteriormente, para determinar za:
Nível de significância 1%: a = 0,01
Z0,01 = 2,33 (valor da tabela, Anexo III)
Cálculo do valor de zcalc:
Dados: x = 31,75, µ = 28,44, s = 7,35, n = 40
Z
x
S
n
calc =
− m
Zcalc =
−3175 28 44
7 35
40
, ,
,
Zcalc = 2,85
Decisão por H0 ou H1:
Temos: Za = 2,33 e Zcalc = 2,85. De acordo com o gráfico a seguir, devemos rejeitar H0 em favor de H1, 
pois o valor de zcalc está à direita de Za, zcalc>za ⇒ rejeita‑se H0, em favor de H1.
107
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Não rejeite H0 Rejeite H0
Z
Área de 0,01
2,330
Figura 84 – Área da cauda, rejeição de Ho
Concluímos, então, que os dados fornecidos proporcionam evidência suficiente para concluir que 
o preço médio pesquisado nos restaurantes da cidade é maior em relação ao restaurante que serve o 
hospital, podendo, assim, o gestor manter os mesmos comerciantes da terceirização.
6.4.2 Teste T de Student, para amostras pequenas (n<30)
Para uma população de amostra normalmente distribuída, pode‑se realizar um teste de hipóteses 
com a hipótese nula (H0: m = m0), empregando a fórmula, agora para t, e utilizando a tabela da distribuição 
T para obter o valor crítico.
Tabela 4 – Tabela de distribuição T de Student
Probabilidade unicaudal de t de Student
Área na cauda superior
 / 0,8 0,9 0,95 0,98 0,99 0,995 0,998 /
gl 0,250 0,1 0,050 0,025 0,01 0,005 0,0025 0,001 0,0005
1 1,00 3,08 6,31 12,71 31,82 63,66 127,32 318,31 636,62
2 0,82 1,89 2,92 4,30 6,96 9,92 14,09 22,33 31,60
3 0,76 1,64 2,35 3,18 4,54 5,84 7,45 10,21 12,92
4 0,74 1,53 2,13 2,78 3,75 4,60 5,60 7,17 8,61
5 0,73 1,48 2,02 2,57 3,36 4,03 4,77 5,89 6,87
6 0,72 1,44 1,94 2,45 3,14 3,71 4,32 5,21 5,96
7 0,71 1,41 1,89 2,36 3,00 3,50 4,03 4,79 5,41
8 0,71 1,40 1,86 2,31 2,90 3,36 3,83 4,50 5,04
9 0,70 1,38 1,83 2,26 2,82 3,25 3,69 4,30 4,78
10 0,70 1,37 1,81 2,23 2,76 3,17 3,58 4,14 4,59
11 0,70 1,36 1,80 2,20 2,72 3,11 3,50 4,02 4,44
12 0,70 1,36 1,78 2,18 2,68 3,05 3,43 3,93 4,32
13 0,69 1,35 1,77 2,16 2,65 3,01 3,37 3,85 4,22
14 0,69 1,35 1,76 2,14 2,62 2,98 3,33 3,79 4,14
15 0,69 1,34 1,75 2,13 2,60 2,95 3,29 3,73 4,07
16 0,69 1,34 1,75 2,12 2,58 2,92 3,25 3,69 4,01
17 0,69 1,33 1,74 2,11 2,57 2,90 3,22 3,65 3,97
18 0,69 1,33 1,73 2,10 2,55 2,88 3,20 3,61 3,92
108
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
19 0,69 1,33 1,73 2,09 2,54 2,86 3,17 3,58 3,88
20 0,69 1,33 1,72 2,09 2,53 2,85 3,15 3,55 3,85
21 0,69 1,32 1,72 2,08 2,52 2,83 3,14 3,53 3,82
22 0,69 1,32 1,72 2,07 2,51 2,82 3,12 3,50 3,79
23 0,69 1,32 1,71 2,07 2,50 2,81 3,10 3,48 3,77
24 0,68 1,32 1,71 2,06 2,49 2,80 3,09 3,47 3,75
25 0,68 1,32 1,71 2,06 2,49 2,79 3,08 3,45 3,73
26 0,68 1,31 1,71 2,06 2,48 2,78 3,07 3,43 3,71
27 0,68 1,31 1,70 2,05 2,47 2,77 3,06 3,42 3,69
28 0,68 1,31 1,70 2,05 2,47 2,76 3,05 3,41 3,67
29 0,68 1,31 1,70 2,05 2,46 2,76 3,04 3,40 3,66
30 0,68 1,31 1,70 2,04 2,46 2,75 3,03 3,39 3,65
 observação
A tabela foi criada no Excel com o comando =INV.T($N$4;M5)*(‑1)
Em primeiro lugar, devemos escrever as hipóteses nula (H0) e a alternativa (H1), definimos, então, 
o nível de significância a e determinamos os valores críticos: para teste bilateral é ±ta/2, para teste 
unilateral à esquerda é ‑ta e para teste unilateral à direita é ta.
Para utilizarmos a tabela de distribuição t‑Student (tabela 4), precisamos calcular os graus de 
liberdade (GL).
Cálculo de GL (Graus de Liberdade):
GL = (número de linhas ‑1) x (número de colunas ‑1)
Simplificando, temos:
gl = (l‑1) x (c‑1)
A decisão é feita por meio da área da calda da curva de Gauss, como mostra a figura a seguir:
109
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Rejeite
H0
Rejeite
H0
α/2 α
‑tα/2 ‑tαtα/2 tα0 00
α/2 α
Não 
rejeite
H0
Não rejeite H0 Não rejeite H0
Bilateral Unilateral à esquerda
µ ≠ 0
Para teste bilateral: 
±tα/2
µ<0
Para teste unilateral à 
esquerda –tα
µ>0
Para teste unilateral à 
direita tα
Unilateral à direita
t tt
Rejeite
H0
Rejeite
H0
Figura 85 – Como aceitar ou rejeitar Ho na curva normal
A estatística do teste é dada pela fórmula:
t
x
s n
= − m0
/
Onde:
t = estatística do teste.
x = média amostral.
µ0 = média da população.
S = desvio padrão amostral.
n = nº de elementos da amostra.
Se o valor da estatística de teste cair na região de rejeição, deve‑se rejeitar H0, caso contrário, não 
rejeitar H0 e fazer a conclusão.
Exemplo:
1. A média de gastos com plano de saúde de todas as famílias de certa região é de R$ 
1123,00 em um determinado ano. Neste mesmo ano, coletando‑se uma amostra aleatória 
de 15 famílias de classe média alta obteve‑se média de R$ 1344,27 e desvio padrão de 
R$ 231,00. Com um nível de significância de 5%, os dados indicam que famílias da classe 
média alta gastam, em média, com plano de saúde, mais do que a média da região? 
Assuma que a distribuição de gastos com planos de saúde das famílias de classe média 
seja normalmente distribuída.
110
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Resolução:
Hipóteses:
Ho: m = 1123 (a média não é maior que a média da região).
H1: m>1123 (a média é maior que a média da região).
Nível de confiança: 5%, a = 0,05, Gl = n‑1
Gl = 15‑1=14
ta = 1,76, como mostra a figura a seguir:
Figura 86 – Como achar o valor na tabela
A tabela completa se encontra mencionada anteriormente, na tabela 4.
Estatística do teste:
Dados: m0 = 1123; n = 15; x = 1344,27; s = 231
t
x
s n
= − m0
/
t = −1344 27 1123
231 15
,
/
111
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
t = 22127
231 3 87
,
/ ,
t = 22127
59 69
,
,
t = 3,710
Temos: t = 3,710 e ta = 1,761
Se temos t>ta, o valor está dentro da região de rejeição, portanto, Rejeita‑se H0, como mostra a figura:
Não rejeite H0
Curva t com
GL = 14
Rejeite H0
t
0,05
1,7610
Figura 87 – Área da cauda, rejeição de Ho
Então, podemos concluir que famílias da classe média alta gastam, em média, com plano de saúde, 
mais do que a média da região.
 lembrete
Temos maneiras diferentes para tratar o teste para amostras com média 
da população, com relação a amostras pequenas e amostras grandes.
6.4.3 Teste de hipóteses para média de duas populações
É utilizado para comparação de duas médias de populações para decidir se existe alguma diferença 
entre elas. A condição para a aplicação desse teste é termos amostras grandes (n>30). As médias das 
amostras são calculadas e comparadas.
A conclusão é dada a partir da comparação, as amostras não são iguais se houver uma diferença 
significativa entre elas.
O procedimento é o mesmo dos outros testes. Primeiro devemos determinar a hipótese nula:
H0: m1 = m2 (as médias são iguais)
112
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Depois, retiramos uma amostra de cada uma das populações e calculamos as médias.
A diferença observada x1 – x2é, agora, a estatística do teste.
Considerando que a distribuição da amostragem é aproximadamente normal, se a hipótese nula 
H0: m1 = m2 é verdadeira, então a média da distribuição das diferenças das médias das amostras deve 
ser zero. Para localizar a estatística de teste na distribuição, necessitamos calcular o desvio‑padrão da 
distribuição, que é dado pela fórmula:
σ σ σx x
n n1 2
2
1
2
2
1 2− = +




Onde:
σx1– x2 = desvio padrão da diferença das médias das populações.
σ1
2
 = variância da população 1.
σ2
2 = variância da população 2.
n1 = nº de elementos da amostra 1.
n2 = nº de elementos da amostra 2.
Como, normalmente, os valores das variâncias das populações não são conhecidos, podemos utilizar 
as variâncias das amostras com os estimadores ou estimativas das variâncias das populações para 
calcular uma estimativa do desvio‑padrão, com a fórmula:
Sx x
S
n
S
n
1 2 1
2
1
2
2
2
− = +




Onde:
S x1– x2 = desvio padrão da diferença das médias das amostras.
S1
2 = variância da amostra 1.
S2
2 = variância da amostra 2.
n1 = nº de elementos da amostra 1.
n2 = nº de elementos da amostra 2.
113
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
A localização da estatística da amostra x1 – x2 relativa à média da distribuição, pode ser encontrada 
calculando‑se o valor de z:
Z
x x
Sx x
=
−( )
−
1 2
1 2
Onde:
z = estatística do teste.
x1 = média da amostra 1.
x2 = média da amostra 2.
S x1– x2 = desvio padrão da diferença das médias das amostras.
Se a estatística do teste cair na região de rejeição, então rejeite H0, caso contrário, não rejeite H0.
A figura a seguir mostra as regiões de rejeição para os valores de z.
Rejeite
H0
Rejeite
H0
α/2 α
‑Zα/2 ‑ZαZα/2 Zα0 00
α/2 α
Não 
rejeite
H0
Não rejeite H0 Não rejeite H0
Bilateral Unilateral à esquerda Unilateral à direita
Z ZZ
Rejeite
H0
Rejeite
H0
Figura 88 – Regiões de rejeição de comparação das médias de duas amostras
Exemplo:
1. O gestor do Hospital Baruch de Toulouse deseja verificar se existe diferença entre os salários 
dos enfermeiros que atuam nos hospitais da capital e dos hospitais do interior por meio 
de um teste de hipóteses. Para isso, selecionou aleatoriamente 30 enfermeiros do hospital 
da capital e, com base em seus salários anuais, determinou‑se a média de seus salários 
como sendo de R$ 46.720,00 com desvio‑padrão de R$ 14.700,00. O mesmo procedimento 
foi adotado para uma amostra de 35 enfermeiros dos hospitais do interior, obtendo‑se 
média de R$ 51.910,00 e desvio‑padrão de R$ 16.200,00. Ele optou por utilizar nível de 
significância de 5%.
114
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Resolução:
Devemos, em primeiro lugar, escrever as hipóteses:
H0: m1 = m2 (as médias de salários são iguais, bilateral).
H1: m1 ≠ m2 (as médias de salários são diferentes).
Os valores críticos de z com nível de significância de 5% a = 0,05 são:
± za/2 = ± z0,05/2 = ± z0,025 = ± 1,96
Como mostra a figura:
Rejeite H0 Rejeite H0Não rejeite H0
α/2 = 0,025α/2 = 0,025
–1,96 0 1,96
Z
Figura 89 – Valores críticos de rejeição
Estatística do teste:
Dados: s1
2 = 14.700,00; s2
2
 = 16.200; n1 = 30; n2 = 35
s
s
n
s
nx x1 2
1
2
1
2
2
2
− = +




Sx x1 2
2 214 700
30
16 200
35−
= +. .
S= 3834,23
z
x x
Sx x
=
−( )
−
1 2
1 2
z = −46 720 51 910
3 843 23
. .
. ,
z = – 1,35
115
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Pela figura 89, percebemos que o valor de z= ‑1,35 não está na área não rejeite H0.
Portanto, com base nos dados da amostra, o gestor do hospital tem evidências suficientes para 
concluir que existe diferença entre as médias salariais dos enfermeiros que atuam nos hospitais da 
capital e dos hospitais do interior.
 lembrete
Para fazer o teste de hipóteses, a pergunta de que está fazendo a 
pesquisa é transformada em duas hipóteses, ou seja, duas afirmativas que 
se contradizem. As hipóteses, em geral, são chamadas de H0 e H1, a primeira 
é chamada de hipótese de nulidade e a segunda de hipótese alternativa.
 saiba mais
O meio de se generalizar os resultados de uma pesquisa e poder responder 
às perguntas para toda uma população são as inferências estatísticas.
Você pode saber mais sobre teste de hipóteses em:
SIEGEL, S.; CASTELLAN JR., N. J. Estatística não paramétrica para as 
ciências do comportamento. São Paulo: Artmed Bookman, 2006.
7 teste De HiPóteses Qui‑QuaDraDo
7.1 teste de associação qui‑quadrado clássico
É utilizado para testar a significância entre duas variáveis qualitativas, ou comparar duas ou 
mais amostras, quando os resultados da variável de resposta estão dispostos em categorias. O teste 
qui‑quadrado clássico é utilizado quando o número total de dados é maior do que 40.
Se a amostra for 20<n<40, o teste de x² só pode ser aplicado se nenhuma frequência esperada for 
menor do que 1.
As variáveis devem ser qualitativas nominais. Para as variáveis qualitativas ordinais, se aplica o teste 
de x² para tendências.
A distribuição de qui‑quadrado, ou x², corresponde à distribuição de probabilidade da soma dos 
quadrados de n variáveis aleatórias independentes, distribuídas normalmente e padronizadas (média 0 
e desvio padrão 1). Ou seja:
x x x xn2 1
2
2
2 2= + �
116
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
A distribuição x2 está associada ao teste x2. O teste x2 é utilizado para comparar os valores observados 
e os esperados.
Exemplo:
Uma experiência genética pode gerar a hipótese de que a próxima geração de plantas exibirá 
determinado conjunto de cores. Comparando os resultados observados com os esperados, você poderá 
decidir se a hipótese original é válida.
O cálculo do teste x² é utilizado para comparar valores observados e valores esperados, isto é, mede 
a distância entre as frequências observadas e as frequências que esperadas, na suposição das variáveis 
serem independentes (H0 verdadeira).
A estatística do teste é calculada com a aplicação das fórmulas:
E
total da linha x total da coluna
total geral
= ( ) ( )( )
Onde:
E = representa a frequência esperada
X
O E
E
i i
ii
r
2
2
1
=
−( )
=
∑
Onde:
x² = valor do qui‑quadrado.
O = representa as frequências observadas.
E = representa as frequências esperadas.
Graus de Liberdade (GL):
GL = (número de linhas ‑1) x (número de colunas ‑1), ou
gl = (l‑1) x (c‑1).
Nível de significância (a)
Nível de significância para qui‑quadrado encontra‑se na tabela a seguir (valores de x², segundo os 
graus de liberdade e o valor de a):
117
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Tabela 5 – Valores de x², segundo os graus de liberdade e o valor de a
Graus de 
Liberdade
a
10% 5% 1%
1 2,7055 3,8415 6,6349
2 4,6052 5,9915 9,2103
3 6,2514 7,8147 11,3449
4 7,7794 9,4877 13,2767
5 9,2364 11,0705 15,0863
6 10,6446 12,5916 16,8119
7 12,0170 14,0671 18,4753
8 13,3616 15,5073 20,0902
9 14,6837 16,9190 21,6660
10 15,9872 18,3070 23,2093
11 17,2750 19,6751 24,7250
12 18,5493 21,0261 26,2170
13 19,8119 22,3620 27,6882
14 21,0641 23,6848 29,1412
15 22,3071 24,9958 30,5779
16 23,5418 26,2962 31,9999
17 24,7690 27,5871 33,4087
18 25,9894 28,8693 34,8053
19 27,2036 30,1435 36,1909
20 28,4120 31,4104 37,5662
21 29,6151 32,6706 38,9322
22 30,8133 33,9244 40,2894
23 32,0069 35,1725 41,6384
24 33,1962 36,4150 42,9798
25 34,3816 37,6525 44,3141
26 35,5632 38,8851 45,6417
27 36,7412 40,1133 46,9629
28 37,9159 41,3371 48,2782
29 39,0875 42,5570 49,5879
30 40,2560 43,7730 50,8922
 observação
A tabela foi criada no Excel, utilizando o comando =INV.QUI(0,1;A3).
118
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Aplica‑se, então a seguinte regra:
Se x2<xt → H0 deve ser aceita
Se x2>xt → H0 deve ser rejeitadaOnde
xt = valor da tabela.
Exemplo:
Foi feita uma pesquisa com uma amostra de 95 funcionários do Hospital e Maternidade Baruch de 
Toulouse, com a intenção de investigar o impacto da utilização dos cursos promovidos pelo método 
de ensino a distância nas gerações x e y desses funcionários. Uma das questões da pesquisa era: “O 
curso promovido pelo método de ensino a distância é mais adequado do que o presencial?” As opções 
de respostas foram formuladas em escala Likert, contemplando cinco categorias, com cinco graus de 
importância em 1, 2, 3, 4 e 5, sendo:
1: não concordo totalmente.
2: não concordo parcialmente.
3: indiferente.
4: concordo parcialmente.
5: concordo totalmente.
O gestor do hospital não achou que a opção três seja uma boa opção para essa resposta, então, 
decidiu testar com o teste qui‑quadrado essa opção, utilizando nível de confiança de 5%
Resolução:
O resultado da pesquisa está exposto na tabela a seguir.
119
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Figura 90 – Dados da pesquisa do Hospital Baruch de Toulouse sobre os cursos a distância
Hipóteses:
H0: A opção de resposta “3: Indiferente” deve ser considerada válida como qualquer outra resposta.
H1: A opção de resposta “3: Indiferente” não deve ser considerada válida como qualquer outra 
resposta.
A estatística do teste:
Cálculo das frequências esperadas:
E
total da linha x total da coluna
total geral
= ( ) ( )( )
A tabela a seguir apresenta o cálculo das frequências esperadas:
Figura 91 – Tabela das respostas esperadas
120
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Cálculo das parcelas do qui‑quadrado:
X
O E
E
i i
ii
r
2
2
1
=
−( )
=
∑
A tabela a seguir apresenta as parcelas do qui‑quadrado:
Figura 92 – Tabela das parcelas do qui‑quadrado para a soma
x2 = 0,540613566 + 0,462882697 + 1,073684211+0,149384774+ 0,015597818 + 0,117826034 + 
0,10088469 + 0,234008097 + 0,03255822 + 0,003399524.
x2 = 2,730839631
ou utilizamos os totais:
x2 = 2,242163066 + 0,488676566
x2 = 2,730839631
Graus de liberdade:
gl= (5–1) x (2‑1)
gl = 4 x 1
gl = 4
A figura a seguir é uma tabela parcial da tabela 5, apresentada anteriormente, com os valores de x², 
segundo os graus de liberdade e o valor de α.
121
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Figura 93 – Tabela parcial x²
Análise:
Se x2<xt → H0 deve ser aceita.
Se x2>xt → H0 deve ser rejeitada.
Onde:
xt = valor da tabela.
O valor encontrado para x² = 2,73
O valor encontrado na tabela é xt = 9,49 (a = 5%)
Decisão:
Se x2<xt → H0 deve ser aceita.
Se x2>xt → H0 deve ser rejeitada.
Portanto, o valor do x2 = 2,73 é menor que o valor crítico da tabela, com 4 graus de liberdade e ao 
nível de 5% de significância, que é de 9,49. Neste caso, não se rejeita H0.
Então, o gestor do Hospital Baruch de Toulouse pode considerar as respostas com a opção “3: 
Indiferente”, que deve ser válida como qualquer outra resposta.
 lembrete
O teste qui‑quadrado clássico é utilizado quando o número total de 
dados é maior do que 40.
122
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
8 correlação e regressão
Correlação é uma medida estatística que testa a relação entre duas variáveis. Talvez seja uma das 
medidas mais importantes, pois variáveis próximas podem ser correlacionadas para que possamos fazer 
previsões a seu respeito.
Exemplo: existe relação entre o fumo e doenças cardíacas?
Para sabermos se as variáveis fumo e a variável doenças cardíacas estão relacionadas, fazemos a 
correlação entre elas.
8.1 Diagrama de dispersão
É a representação gráfica da relação entre duas variáveis.
Cada unidade da amostra fornece dois valores numéricos. Uma se refere à variável x e a outra 
à variável y, portanto, fazermos um gráfico, chamado diagrama de dispersão, que relaciona as duas 
variáveis.
Para fazer esse gráfico, diferentemente dos gráficos estatísticos, devemos considerar os dois eixos do 
sistema de coordenadas cartesianas, e os valores das variáveis x e y serão as coordenadas dos pontos do 
gráfico, formando o par ordenado (x, y).
Assim, podemos responder se existe relação entre as variáveis, qual é o tipo de relação e em que grau 
as variáveis estão correlacionadas.
Portanto, o diagrama de dispersão permite visualizar a relação entre duas variáveis.
Se as variáveis crescem no mesmo sentido, a correlação é dita positiva, se variam em sentidos 
opostos, existe correlação negativa entre as variáveis.
 observação
O gráfico que devemos utilizar no Microsoft Excel para correlação é 
chamado de dispersão, pois é o único que utiliza os dois eixos do sistema 
de coordenadas cartesianas.
Quando a imagem é uma reta ascendente, dizemos que a correlação é linear positiva, isto é, os 
pontos do diagrama têm como “imagem” uma reta ascendente, como mostra o gráfico a seguir.
123
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Figura 94 – Correlação linear positiva
Quando a imagem da reta for descendente, dizemos que a correlação é linear negativa, ou seja, os 
pontos têm como “imagem” uma reta descendente, como mostra o gráfico a seguir.
Figura 95 – Correlação linear negativa
A correlação não é linear, correlação não linear, se os pontos têm como “imagem” uma curva, como 
o gráfico a seguir.
Figura 96 – Correlação não linear
124
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Não existe correlação entre as variáveis quando os pontos se apresentam dispersos, não oferecendo 
uma “imagem” definida, como mostra o gráfico a seguir.
Figura 97 – Correlação nula
8.2 coeficiente de correlação de Pearson (r)
É uma medida para analisar o grau de correlação linear entre duas variáveis numéricas, é representada 
pela letra r e é definida pela fórmula:
r
n xiyi xi yi
n xi xi n yi yi
=
− ( ) ( )
− ( )


⋅ − ( )


∑ ∑∑
∑∑ ∑∑
.
. .2
2 2 2

Onde:
n= nº de observações.
Os valores limites de R são ‑1 e +1, isto é, valor de r pertence ao intervalo numérico [‑1,1].
Assim, a correlação pode ser:
Perfeita e positiva: se a correlação entre duas variáveis for: r = +1.
Perfeita e negativa: se a correlação entre duas variáveis for: r = ‑1.
Não há correlação entre as variáveis, se r = 0.
Para que haja correlação entre as variáveis é necessário que 0,6≤|r|≤1, ou seja, o valor de r deve estar 
entre 0,6, inclusive, e 1.
Se 0,3<|r|<0,6, há correlação relativamente fraca entre as variáveis.
125
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Se 0<|r|<0,3, a correlação é muito fraca e praticamente nada se pode concluir sobre a relação entre 
as variáveis em estudo.
 lembrete
Correlação entre variáveis depende do resultado do coeficiente de 
correlação.
Exemplo:
1. O gestor do Hospital Baruch de Toulouse deseja avaliar o curso que está proporcionando a seus 
colaboradores no sistema de educação a distância. Para os alunos estudarem, existem questionários 
que valem nota. Os colaboradores acessam a plataforma, podem estudar e fazer os questionários. 
Após fazer o questionário, o colaborador obtém a nota relativa aos seus erros ou acertos. Ao final 
do curso, o colaborador faz a sua prova. O gestor deseja saber se existe correlação entre a nota 
dos questionários e a nota da prova, para tanto, colheu uma amostra, por amostragem aleatória 
simples, de 10 colaboradores e obteve os resultados da tabela a seguir.
Figura 98 – Dados das médias dos questionários e provas
Resolução:
Temos então que verificar se existe correlação entre a média das notas dos questionários e a nota 
da prova.
126
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
r
n xiyi xi yi
n xi xi n yi yi
=
− ( )⋅ ( )
⋅ − ( )


⋅ ⋅ − ( )


∑ ∑∑
∑∑∑∑2 2 2 2
Vamos então calcular a correlação dos dados que estão dispostos na tabela já com as colunas 
acrescidas para a fórmula, como na tabela a seguir, na qual acrescentamos uma coluna para o cálculo 
de xiyi, uma coluna para o cálculo do xi² e outra para o cálculo de yi², pois iremos utilizar na fórmula os 
seus somatórios.
Figura 99 – Cálculo dos somatórios para a fórmula
Devemos agora utilizar os dados desta tabela.
Substituímos então os valores na fórmula, para o cálculo de r:
r
n xiyi xi yi
n xi xi n yi yi
=
− ( )⋅ ( )
⋅ − ( )


⋅ ⋅ − ( )


∑ ∑∑
∑∑ ∑∑2 2 2 2
r =
× − ( ) × ( )
× − ( )  × × −
10 730 2 93 2 77 9
10 870 5 93 2 10 618 4 77 92
, , ,
, , , ,(( ) 
2
r = −
−[ ] × −[ ]
7302 7260 28
8705 8686 24 6184 6068 41
,
, ,
127
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
r =
( ) × ( )
4172
18 76 115 59
,
, ,
r = 4172
2168 4684
,
,
r = 4172
46 57
,
,
r = 0,8958
Portanto, podemos dizer que existe correlação entre a média dos questionários e a nota da prova 
dos colaboradores, pois r = 0,89, o que significa uma correlação linear positiva altamente significativa 
entre as variáveis.
 observação
Para o Excel, devemos utilizar a função CORREL (intervalo de dados da 
primeira variável; intervalo de dados da segunda variável). No exemplo, a 
fórmula é: =CORREL(B2:B11;C2:C11) = 0,897.
Gráfico da correlação linear: o gráfico a seguir apresenta os dados da correlação.
Figura 100 – Correlação entre as notas de questionário e nota da prova
No Microsoft Excel, basta selecionarmos os valores das colunas B e C, sem os totais, e escolher inserir 
dispersão, como mostra a figura a seguir.
128
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Figura 101 – Dados, nota de questionário e prova
Portanto, devemos selecionar as células B2 até C11, escolher “inserir”, “gráfico de dispersão somente 
com marcadores” e vamos obter o gráfico a seguir, chamado de diagrama de dispersão:
Figura 102 – Diagrama de dispersão relativo às notas de questionários e provas
Quando olhamos para o conjunto dos pontos obtidos no gráfico, podemos perceber que formam 
uma elipse em diagonal, quanto mais fina for a elipse, mais ela se aproximará de uma reta. Então, 
podemos dizer que a correlação de forma elíptica tem como “imagem” uma reta, e, por isso, é chamada 
de correlação linear. Quanto maior a dispersão dos dados, menor será o grau de correlação entre eles e 
vice‑versa. Veja o gráfico a seguir:
Figura 103 – Diagrama de dispersão com a linha de tendência
129
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
 lembrete
O valor resultante (r) da aplicação da fórmula de correlação linear nos 
indica se existe ou não correlação entre as variáveis.
 observação
Para determinarmos a reta da correlação no Excel, basta, com o gráfico 
selecionado, clicar em “Ferramentas do Gráfico”, “Layout”, “Linha de 
Tendência” e escolher a “Linha de Tendência Linear”.
8.3 coeficiente de determinação (r²)
Determina a proporção em que uma variável é explicada em relação a outra. Quando há relação 
entre as variáveis x e y, se o valor de x aumenta, o valor de y também aumentará, quanto maior for o 
coeficiente de determinação, maior será a força da relação entre as variáveis.
O coeficiente de determinação é dado por r², isto é, o valor de R (correlação) elevado a 2, portanto, 
ele será um valor entre 0 e 1, sendo que, mesmo que a correlação seja negativa, ele nunca o será, pois 
está elevado a 2 (0<R²<1). Se o resultado for 1, é uma correlação linear perfeita, o que significa que 
todas as variações de y estão diretamente relacionadas as variações de x.
No exemplo, temos r = 0,90, R² = 0,7921, então podemos dizer que 79% da variação de y pode ser 
explicada pela relação linear entre x e y, os outros 21% não.
8.4 regressão linear simples
Se existe correlação entre as variáveis, então pode‑se prever resultados futuros, para isso, podemos, 
já que a correlação é linear, determinar a equação que dá origem à reta de regressão.
Como ela é uma correlação linear, a nossa reta será uma função linear, ou seja, uma função de 1º 
grau, que tem a forma:
Y = Ax + B
Onde:
Y = variável dependente.
X = variável independente.
130
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
A = coeficiente de x, se A for positivo, a inclinação da reta será positiva, se A for negativo, a inclinação 
da reta será negativa.
B = termo independente.
Para determinarmos A, a fórmula será:
A
n xy x y
n x x
=
−
− ( )
∑∑∑
∑∑ 2 2
Para determinarmos B, a fórmula será:
B = y – ax
Onde:
y
y
n
e x
x
n
= =∑ ∑
Todos os elementos da fórmula já foram encontrados na tabela a seguir.
Figura 104 – Dados para determinação da equação linear da reta de correlação
131
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Vamos, então, calcular o valor de A:
A
n xy x y
n x x
=
−
− ( )
∑∑∑
∑∑ 2 2
A = × − ×
× −
10 730 2 93 2 77 9
10 870 5 93 22
, , ,
, ,
A = −
−
7302 7260 28
8705 8686 24
,
,
A = 4172
18 76
,
,
A = 2,22
Vamos determinar B:
y
y
n
= = =∑ 77 9
10
7 79
,
,
x
x
n
= = =∑ 93 2
10
9 32
,
,
B = y – ax
B = 7,79 – (2,2) × (9,32)
B = 7,79 – 20,504
B = – 12,714
Portanto, a nossa equação de regressão será:
Y = Ax + B,
Onde:
A= 2,22 e B= ‑12,714
Então, a equação de regressão é:
Y= 2,22x – 12,714
132
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
A equação de regressão nos permite tirar conclusões a respeito de valores que não temos na tabela.
Exemplo:
1. O gestor do hospital deseja saber que nota o colaborador poderia tirar na prova, caso tivesse 
média 6,0 nos questionários.
Resolução:
Devemos então substituir a variável x (média dos questionários) pelo valor 6,0 na equação de 
regressão para determinar qual é o provável valor de y (nota da prova).
Assim temos:
Y= 2,22x – 12,714
Y = 2,22. (6,0) – 12,714
Y = 13,32 – 12,714
Y= 0,6
Y @ 1,0
Portanto, se o colaborador tirar nota 6,0 na média dos questionários, provavelmente ele iria muito 
mal na prova, tendo como nota prevista 1,0. Isso ocorreu porque as notas de questionários e de provas 
foram relativamente altas.
 observação
O Excel faz automaticamente a equação de regressão, assim como o 
coeficiente de determinação. Sempre temos algumas variações pequenas 
de resultados, por conta dos arredondamentos.
 saiba mais
Você pode obter mais informações sobre a utilização do Excel em 
estatística na obra:
LEVINE, D. M. et al. Estatística: teoria e aplicações: usando Microsoft 
Excel em português. Tradução de Teresa Cristina Padilha de Souza. Rio de 
Janeiro: LTC, 2013.
133
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
Para obter a equação e o coeficiente de determinação no Excel, basta pedir para fazer o gráfico 
como exposto. Com o gráfico selecionado, clicamos em “Ferramentas do Gráfico”, “Layout”, “Linha de 
Tendência”, mais opções de Linha de Tendência, escolher “Linear”, marcar as opções “Exibir Equação no 
gráfico” e “Exibir valor de R‑quadrado no gráfico” e, por fim, “Fechar”, como na figura a seguir:
Figura 105 – Formatando linha de tendência no Excel
Então, o gráfico a seguir apresenta a reta de correlação, a equação da reta e o coeficiente de 
determinação.
Figura 106 – Gráfico da correlação com a 
equação de regressão e coeficiente de determinação
Portanto, podemos, por meio do gráfico e da equação, prever valores de Y, atribuindo valores a X.
Utilize de forma correta e coerente os seus conhecimentos e procure sempre se informar, caso tenha 
alguma dúvida, e atualizá‑los.
134
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
 resumo
A Teoria da Probabilidade estuda as possibilidades da ocorrênciade 
um experimento aleatório, ou seja, eventos que, mesmo quando repetidas 
inúmeras vezes, nas mesmas condições, podem apresentar resultados 
diferentes.
Distribuições teóricas de probabilidade para as variáveis discretas 
são utilizadas para especificar todos os resultados possíveis da 
variável aleatória e a probabilidade de sua ocorrência. Quando 
desejamos saber a probabilidade da ocorrência de uma variável, 
resultado de uma pesquisa, devemos recorrer à distribuição normal 
de probabilidade.
Os testes de hipótese são utilizados, em Bioestatística, para 
generalizar uma pesquisa. Um teste de hipóteses admite duas 
hipóteses: a hipótese nula (H0), que é a hipótese a ser testada, e a 
hipótese alternativa (H1), que é a hipótese a ser considerada como 
uma alternativa à hipótese nula.
O teste T de Student é utilizado para amostras pequenas, menores do 
que 30. O teste de hipóteses para média de duas populações é utilizado para 
comparação entre elas para decidir se existe alguma diferença. A condição 
para a aplicação desse teste é termos amostras grandes (n>30). As médias 
das amostras são calculadas e comparadas.
O valor da probabilidade permite decidir, com base nos dados, se há 
evidência suficiente para rejeitar a hipótese de nulidade.
A distribuição de qui‑quadrado, ou x², corresponde à distribuição 
de probabilidade da soma dos quadrados de n variáveis aleatórias 
independentes, distribuídas normalmente e padronizadas (média 0 e 
desvio padrão 1). O cálculo do teste x² é utilizado para comparar valores 
observados e valores esperados, isto é, mede a distância entre as frequências 
observadas e as frequências esperadas, na suposição das variáveis serem 
independentes (H0 verdadeira).
Correlação é uma medida estatística que testa a relação entre duas 
variáveis. Talvez seja uma das medidas mais importantes, pois variáveis 
próximas podem ser correlacionadas para que possamos fazer previsões a 
seu respeito.
135
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
O diagrama de dispersão permite visualizar a relação entre duas 
variáveis. Se as variáveis crescem no mesmo sentido, a correlação é dita 
positiva, se variam em sentidos opostos, existe correlação negativa entre 
as variáveis.
A equação de regressão nos permite prever dados a respeito das 
variáveis, quando estas estão correlacionadas.
O Microsoft Excel é um programa que apresenta todas as funções 
estatísticas. Porém, devemos tomar cuidado, pois essas funções são apenas 
para dados não agrupados. Para dados agrupados, devemos inserir as 
fórmulas para que a resposta seja correta. Com relação a gráficos estatísticos, 
apresenta uma infinidade de modelos. Temos que prestar atenção que o 
modelo de gráfico para correlação deve ser o de dispersão.
A Bioestatística nos permite, então, determinar uma série de dados 
para que possamos chegar a conclusões a respeito de qualquer pesquisa 
que desejamos fazer, devemos apenas seguir a metodologia estatística de 
coleta, organização, tabulação e interpretação dos dados.
 exercícios
Questão 1. O estudo da Teoria das Probabilidades teve início por volta do século XVII, com as análises 
de Fermat e Pascal a respeito da Teoria dos Jogos de Azar. Posteriormente, a probabilidade associou‑se 
também a outros fenômenos naturais, distintos dos jogos de azar, e conseguiu, com isso, uma enorme 
evidência até os dias de hoje. A definição clássica de probabilidade é: dado um espaço amostral S, com 
n(S) elementos, e um evento A de S, com n(A) elementos, a probabilidade do evento A é o número P(A), 
tal que P(A) = n(A) / n(S). Desta forma, se num hospital há 250 pacientes, sendo que destes 120 são 
mulheres, qual a probabilidade de uma enfermeira escolher uma paciente do sexo feminino para ser 
entrevistada para um estudo?
A) 50%
B) 52%
C) 10%
D) 48%
E) 12%
Resposta correta: alternativa D.
136
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Unidade II
Análise das alternativas
A) Alternativa incorreta.
Justificativa: a resposta é incorreta, pois, mesmo não aplicando a fórmula clássica de probabilidades, 
observa‑se pelo caso apresentado que há mais homens do que mulheres no hospital, portanto a 
probabilidade de mulheres serem escolhidas é menor do que a de homens. Desta forma, 50% é uma 
resposta errada.
B) Alternativa incorreta.
Justificativa: a mesma justificativa da alternativa A se aplica para a alternativa B, pois 52% é uma 
resposta incoerente com o que foi apresentado na questão.
C) Alternativa incorreta.
Justificativa: aplicando‑se a fórmula clássica de probabilidades, o resultado encontrado é de 48% e 
não 10%.
Cálculo da probabilidade:
P(A) = ___n(A)______ = 120/250. 100 = 48%
n(S)
D) Alternativa correta.
Justificativa: após a aplicação da fórmula para o cálculo de probabilidades, o resultado corresponde 
a 48%: 120/250 = 0,48, que multiplicado por 100, resulta em 48%.
E) Alternativa incorreta.
Justificativa: o resultado apresentado nesta alternativa não corresponde ao resultado encontrado 
após a aplicação da fórmula.
Questão 2. O estudo da Bioestatística compreende dois aspectos importantes quando da utilização 
da estatística: a descritiva e a indutiva. Com relação à estatística indutiva ou inferencial, um estudo 
importante é o realizado com a aplicação dos chamados testes de hipóteses. Independentemente do 
tipo de teste escolhido, todos eles devem apresentar as hipóteses iniciais (Ho) e as hipóteses alternativas 
(Ha). Analise, então, a seguinte situação: uma pesquisadora se interessou em averiguar se as crianças 
internadas em um hospital estariam sujeitas a apresentar um nível de estresse diferente de 100. Diante 
do exposto, como deve ser representada a hipótese alternativa (Ha) neste caso?
A) Ha: m = 100
137
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
Bioestatística
B) Ha: m<100
C) Ha: m>100
D) Ha: m ≠ 100
E) Ha: m = 50
Resolução	desta	questão	na	plataforma.
138
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
fiGURAS E iLUSTRAçõES
figura 82
COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002. p. 91‑92. Adaptada.
figura 83
COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002. p. 90. Adaptada.
figura 84
COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002. p. 90. Adaptada.
figura 85
COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002. p. 90. Adaptada.
figura 87
COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002. p. 90. Adaptada.
figura 88
COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002. p. 90. Adaptada.
figura 89
COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002. p. 90. Adaptada.
REfERêNciAS
Textuais
ARANGO, H. G. Bioestatística teórica e computacional. 3. ed. Rio de Janeiro: Guanabara Koogan, 2009.
BARBETTA, A. P. Estatística aplicada às ciências sociais. 6. ed. Florianópolis: UFSC, 2006.
CALIXTO, T. Ensino médio é o desafio da educação. A Tribuna, Santos, p. A7, 17 ago. 2014.
CENTRAL de questionários de saúde. Survey Monkey, Califórnia, 1999‑2015. Disponível em: <https://
pt.surveymonkey.com/mp/healthcare‑surveys/>. Acesso em: 26 maio 2015.
COSTA NETO, P. L. D. O. Estatística. 2. ed. São Paulo: Edgard Blucher, 2002.
139
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
COSTA NETO, P. L. D. O.; BEKMAN, O. R. Análise estatística da decisão. 2. ed. São Paulo: Edgard Blucher, 
2009.
CRESPO, A. A. Estatística fácil. 10. ed. São Paulo: Saraiva, 1993.
CURI, A. Z.; MENEZES‑FILHO, N. A. A relação entre o desempenho escolar e os salários no Brasil. In: 
ENCONTRO NACIONAL DE ECONOMIA, 33, 2005, Natal. Trabalhos. Natal: Anpec, 2005.
FEGER, J. E.; NODARI, L. D. T.; LAZZAROTTI, F. Método da correlação de variáveis para a previsão da 
demanda turística: umaaplicação visando o planejamento do desenvolvimento turístico em uma 
região sul brasileira. Caderno Virtual de Turismo, Rio de Janeiro, v. 11, n. 3, p. 294‑307, dez. 2011. 
Disponível em: <http://www.ivt.coppe.ufrj.br/caderno/index.php?journal=caderno&page=article&op=
view&path%5B%5D=580&path%5B%5D=298>. Acesso em: 1 jun. 2015.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Normas de apresentação tabular. 3. ed. 
Rio de Janeiro: IBGE, 1993. Disponível em: <http://biblioteca.ibge.gov.br/visualizacao/livros/liv23907.
pdf>. Acesso em: 26 maio 2015.
JULIÃO, L. Transporte coletivo em Santos é regular, dizem entrevistados. A Tribuna, Santos, p. A7, fev. 
2014.
LEVINE, D. M. et al. Estatística: teoria e aplicações: usando Microsoft Excel em português. Tradução de 
Teresa Cristina Padilha de Souza. Rio de Janeiro: LTC, 2013.
MENESES, A.; MARIANO, F. Noções de estatística para concursos. Rio de Janeiro: Elsevier, 2010.
MORETTIN, L. G. Estatística básica: inferência. São Paulo: Pearson Makron Books, 2000. v. 2.
NA BAIXADA, Ensino médio Preocupa. A Tribuna, Santos, p. A3, 1 abr. 2014.
PAGANO, M.; GAUVREAU, K. Bioestatística. 2. ed. São Paulo: Thomson Learning, 2006.
PEDROSO, D. Região registra alta em roubos, mas homicídios têm queda. A Tribuna, Santos, p. A6, 26 
jul. 2014.
PEIXE sobe, mas público desce. A Tribuna, Santos, p. B1, 3 mar. 2014.
QUEIRÓS, S. Erro do Ipea não esconde situação preocupante. A Tribuna, Santos, p. A6, 6 abr. 2014.
SABESP registra nova queda nos reservatórios de água. A Tribuna, Santos, p. C5, 5 mar. 2014.
SANTOS, M. Homem, 43 anos, casado e investidor de imóvel em Santos. A Tribuna, Santos, p. C1, 16 
mar. 2014.
140
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
SIEGEL, S.; CASTELLAN JR., N. J. Estatística não paramétrica para as ciências do comportamento. São 
Paulo: Artmed Bookman, 2006.
SILVA, I. A. A arte de enfermeiro: Escola de Enfermagem Dr. Ângelo da Fonseca. Coimbra: Imprensa da 
Universidade de Coimbra, 2008.
THADEU, S. Metade dos jovens não usa preservativo em relação. A Tribuna, Santos, p. A7, 27 mar. 2014.
___. Região “cresceu” para quem viaja entre cidades. A Tribuna, Santos, p. A3, 17 mar. 2014.
TRIOLA, M. F. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999.
VIEIRA, S. Estatística básica. São Paulo: Cengage Learning, 2012.
___. Introdução à bioestatística. 4. ed. Rio de Janeiro: Elsevier, 2008.
141
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
142
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
143
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15
144
Re
vi
sã
o:
 R
os
e 
- 
Di
ag
ra
m
aç
ão
: M
ár
ci
o 
- 
05
/0
6/
20
15

Outros materiais