Buscar

Livro_ Cien. Biologicas_Bioestatistica 2 °ed_ Genário sobreira

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 133 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 133 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 133 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Fiel a sua missão de interiorizar o ensino superior no estado Ceará, a UECE, como uma instituição que participa do Sistema Universidade Aberta do Brasil, vem ampliando a oferta de cursos de graduação e pós-graduação 
na modalidade de educação a distância, e gerando experiências e possibili-
dades inovadoras com uso das novas plataformas tecnológicas decorren-
tes da popularização da internet, funcionamento do cinturão digital e 
massificação dos computadores pessoais. 
Comprometida com a formação de professores em todos os níveis e 
a qualificação dos servidores públicos para bem servir ao Estado, 
os cursos da UAB/UECE atendem aos padrões de qualidade 
estabelecidos pelos normativos legais do Governo Fede-
ral e se articulam com as demandas de desenvolvi-
mento das regiões do Ceará. 
Bi
oe
st
atí
sti
ca
Ciências Biológicas
Ciências Biológicas
Genário Sobreira Santiago
Rui Eduardo Brasileiro Paiva
Bioestatística
U
ni
ve
rs
id
ad
e 
Es
ta
du
al
 d
o 
Ce
ar
á 
- U
ni
ve
rs
id
ad
e 
Ab
er
ta
 d
o 
Br
as
il
ComputaçãoQuímica Física Matemática PedagogiaArtes Plásticas
Ciências 
Biológicas
Geografia
Educação 
Física
História
9
12
3
Genário Sobreira Santiago
Rui Eduardo Brasileiro Paiva
Bioestatística
Ciências Biológicas
2ª edição
Fortaleza - Ceará
2015
ComputaçãoQuímica Física Matemática PedagogiaArtes Plásticas
Ciências 
Biológicas
Geografia
Educação 
Física
História
9
12
3
Editora da Universidade Estadual do Ceará – EdUECE
Av. Dr. Silas Munguba, 1700 – Campus do Itaperi – Reitoria – Fortaleza – Ceará
CEP: 60714-903 – Fone: (85) 3101-9893
Internet: www.uece.br – E-mail: eduece@uece.br
Secretaria de Apoio às Tecnologias Educacionais
Fone: (85) 3101-9962
Copyright © 2015. Todos os direitos reservados desta edição à UAB/UECE. Nenhuma parte deste material poderá 
ser reproduzida, transmitida e gravada, por qualquer meio eletrônico, por fotocópia e outros, sem a prévia autori-
zação, por escrito, dos autores.
Presidenta da República
Dilma Vana Rousseff
Ministro da Educação
Renato Janine Ribeiro
Presidente da CAPES
Carlos Afonso Nobre
Diretor de Educação a Distância da CAPES 
Jean Marc Georges Mutzig
Governador do Estado do Ceará
Camilo Sobreira de Santana
Reitor da Universidade Estadual do Ceará
José Jackson Coelho Sampaio
Vice-Reitor
Hidelbrando dos Santos Soares
Pró-Reitora de Graduação
Marcília Chagas Barreto
Coordenador da SATE e UAB/UECE
Francisco Fábio Castelo Branco
Coordenadora Adjunta UAB/UECE
Eloísa Maia Vidal
Direção do CCS/UECE
Glaúcia Posso Lima
Coordenadora da Licenciatura 
em Ciências Biológicas
Germana Costa Paixão
Coordenadora de Tutoria e Docência em Ciências 
Biológicas
Roselita Maria de Souza Mendes
Editor da EdUECE
Erasmo Miessa Ruiz
Coordenadora Editorial
Rocylânia Isidio de Oliveira
Projeto Gráfico e Capa
Roberto Santos
Diagramador
Marcus Lafaiete da Silva Melo
Conselho Editorial
Antônio Luciano Pontes
Eduardo Diatahy Bezerra de Menezes
Emanuel Ângelo da Rocha Fragoso 
Francisco Horácio da Silva Frota
Francisco Josênio Camelo Parente
Gisafran Nazareno Mota Jucá
José Ferreira Nunes
Liduina Farias Almeida da Costa
Lucili Grangeiro Cortez
Luiz Cruz Lima
Manfredo Ramos
Marcelo Gurgel Carlos da Silva
Marcony Silva Cunha
Maria do Socorro Ferreira Osterne
Maria Salete Bessa Jorge
Silvia Maria Nóbrega-Therrien
Conselho Consultivo
Antônio Torres Montenegro (UFPE)
Eliane P. Zamith Brito (FGV)
Homero Santiago (USP)
Ieda Maria Alves (USP)
Manuel Domingos Neto (UFF)
Maria do Socorro Silva Aragão (UFC)
Maria Lírida Callou de Araújo e Mendonça (UNIFOR)
Pierre Salama (Universidade de Paris VIII)
Romeu Gomes (FIOCRUZ)
Túlio Batista Franco (UFF)
Editora Filiada à
S235b Santiago, Genário Sobreira.
Bioestatística / Genário Sobreira Santiago , Rui
Eduardo Brasileiro Paiva. 2. ed. – Fortaleza: EdUECE, 2015.
131 p.: il. ; 20,0cm x 25,5cm. (Ciências Biológicas) 
ISBN: 978-85-78263-40-9
1. Bioestatística . I . Paiva , Rui Eduardo Brasileiro.
II. Título.
 CDD: 312
Dados Internacionais de Catalogação na Publicação
Sistema de Bibliotecas
Biblioteca Central Prof. Antônio Martins Filho
Thelma Marylanda Silva de Melo – CRB-3 / 623
Bibliotecária
Sumário
Apresentação .................................................................................................... 5
Parte 1 – Conceitos Fundamentais................................................................ 7
Capítulo 1 – Elementos de matemática ........................................................ 9
1. Somatório (notação sigma) .............................................................................. 9
2. Fenômenos determinísticos e aleatórios .......................................................10
3. Modelos matemáticos .....................................................................................10
4. Noções sobre conjuntos .................................................................................14
5. Análise combinatória .......................................................................................16
Parte 2 – Descrição das amostras ............................................................... 23
Capítulo 2 – Organização tabular e gráfica dos dados ............................ 25
1. Representação tabular....................................................................................25
2. Representação gráfica ...................................................................................32
Capítulo 3 – Medidas de tendência central ................................................ 39
1. Introdução ........................................................................................................39
2. Média aritmética ( x ) ......................................................................................39
3. Mediana (Md)...................................................................................................42
4. Moda (Mo)........................................................................................................44
Capítulo 4 – Medidas de dispersão ou de variabilidade .......................... 46
1. Importância da variabilidade ...........................................................................46
2. Amplitude total .................................................................................................46
3. Variância ..........................................................................................................47
4. Desvio padrão..................................................................................................48
5. Coeficiente de variação (C.V.) .......................................................................50
Parte 3 – Noções de Probabilidade ............................................................. 57
Capítulo 5 – Probabilidade: conceitos fundamentais .............................. 59
1. Conceito de probabilidade ..............................................................................59
2. Espaço amostral e evento ..............................................................................60
3. Probabilidade: definição e propriedades ........................................................60
4. Adição de probabilidades ................................................................................62
5. Probabilidade condicional ...............................................................................63
6. Teorema da multiplicação ...............................................................................64
Capítulo 6 – Modelos probabilísticos em biologia .................................... 65
1. Modelos probabilísticos ..................................................................................65
2. Modelo (distribuição) binomial ........................................................................65
3. Distribuição de Poisson ..................................................................................69
4. Distribuiçãonormal ..........................................................................................70
Parte 4 – Associação de variáveis ............................................................... 79
Capítulo 7 – Correlação linear simples ....................................................... 81
1. Conceito de correlação ..................................................................................81
2. Diagrama de dispersão ...................................................................................81
3. Coeficientes de correlação linear (r) e de determinação (r2) ......................83
Capítulo 8 – Regressão linear simples ....................................................... 86
1 A ideia de aproximação linear ..........................................................................86
2. Regressão linear simples ................................................................................87
3. Transformações de variáveis..........................................................................89
Parte 5 – Inferência Estatística ...................................................................107
Capítulo 9 – Noções sobre amostragem ..................................................109
1. População e amostra ....................................................................................109
2. Variáveis e escalas e medidas ......................................................................111
3. Amostragem................................................................................................... 112
Capítulo 10 – Noções de inferência estatística ....................................... 115
1. Conceitos introdutórios ................................................................................. 115
2. Distribuições amostrais ................................................................................. 116
3. Estimação ...................................................................................................... 116
4. Testes de hipóteses ....................................................................................... 117
5 Teste da diferença entre duas médias ..........................................................120
6. Teste de diferenças entre frequências observadas e esperadas ..............121
Sobre os autores...........................................................................................128
Anexo 1 ..............................................................................................................129
Apresentação 
Um curso de estatística é considerado sempre penoso para estudantes de 
todas as áreas e, ao mesmo tempo, é indispensável para um bom desempe-
nho do estudante quando ele é convidado a raciocinar sobre fenômenos que 
tratam do estudo de modelos probabilísticos. Em biologia, não é diferente. 
Assim, a variabilidade na ocorrência dos fenômenos e a incerteza associada 
aos mesmos é que constitui o problema central de estatística, de modo que a 
estatística repousa inteiramente na teoria das probabilidades.
Afirmações estatísticas são sempre afirmações sobre a probabilidade 
de ocorrência de certo tipo de fenômeno, a partir de um conjunto de condi-
ções teóricas satisfeitas. Isto é a base de inferência estatística, que, na última 
parte do livro, é tratada de modo elementar, sendo dada maior ênfase à pri-
meira finalidade da estatística: descrever, analisar e representar um grupo de 
dados, utilizando métodos numéricos e gráficos que resumem e apresentam 
a informação contida neles. Isto é o fundamento da estatística descritiva que 
é o cerne deste despretensioso trabalho.
Os autores
Capítulo 1
Procedimentos de ensino
Parte
Conceitos Fundamentais
1
Capítulo
Elementos de matemática
Objetivos
l Compreender e utilizar a notação de somatório (notação sigma).
l Revisar alguns conceitos de análise combinatória.
l Interpretar a equação de uma reta, como modelo linear.
l Compreender algumas idéias básicas sobre conjuntos.
1. Somatório (notação sigma)
Para indicarmos a soma dos valores xi de uma variável x, isto é , 
x1 + x2 + ... + xn usamos o símbolo ∑ (letra maiúscula grega: sigma), denomi-
nado em matemática somatório. Assim, a soma a soma x1 + x2 + ... + xn pode 
ser representada por :
∑
=
5
1i
ix ( lemos : somatório de x índice i, i variando de 1 a 5) isto é
∑
=
5
1i
ix = x1 + x2 + ... + xn
Exemplo 1.1. Escreva sob a forma de somatório
a) x1 + x2 + x3 + x4
b) 1 + 2 + 3 +...+ n
Solução:
a) x1 + x2 + x3 + x4 = ∑
=
4
1i
ix
b) 1 + 2 + 3 +...+ n = ∑
=
n
k
k
1
1
10
SANTIAGO, G. S., PAIVA, R. E. B. 
2. Fenômenos determinísticos e aleatórios
Consideremos as seguintes situações:
a) Um gás perfeito com volume de 10 litros e sob pressão de 4 atmosferas, 
transforma-se, isotermicamente, passando a ocupar um volume de 8 litros. 
Qual a pressão final?
b) A um indivíduo de 50 anos, com pressão diastólica de 12cm/Hg, administra-
ram-se 40mg de um betabloqueador, diariamente. Ao final de 10 dias, que 
valor passa a assumir o referido nível tensional.
Na situação A, pode-se afirmar, com segurança, que a pressão final 
será de 5 atmosferas, aplicando-se a conhecida lei de Boyle Mariotte:
PV=constante; logo: 10.4 = 8.P ⇒ P = 5 atm.
Já na outra situação, é impossível se prever qual será a pressão do indi-
víduo após a administração do medicamento. No máximo, a resposta poderia 
ser em termos de: “provavelmente, pelo que se conhece do medicamento, a 
pressão diastólica baixará, talvez no máximo uns 3 cm/Hg”.
A situação A caracteriza um fenômeno determinístico, que é aquele cujo 
comportamento pode ser previsto com exatidão; ou seja, conhecido o estado 
inicial, fica determinado o estado final. Esses fenômenos pertencem ao do-
mínio das ciências exatas, dos seres idealizados (gases perfeitos, líquidos 
perfeitos, concepções matemáticas).
A situação B refere-se a fenômeno aleatório, de comportamento imprevisí-
vel; o estado final não pode ser exatamente determinado a partir do estado inicial.
3. Modelos matemáticos
O comportamento dos fenômenos determinísticos é estudado, quantitativamen-
te, usando fórmulas matemáticas exatas (lei de Boyle-Mariotte, teorema de Pitá-
goras etc). No entanto, o estudo de fenômenos aleatórios (objeto de estudo as 
estatística), do ponto de vista quantitativo é feito através de fórmulas matemá-
ticas aproximadas, que se conhecem como modelos matemáticos. Assim, um 
modelo matemático é uma descrição matemática (frequentemente por meio 
de uma função ou de uma equação) de um fenômeno do mundo real, tal como 
o tamanho de uma população, a concentração de um fármaco no sangue, a 
expectativa de vida de uma pessoa ou o custo de redução dos poluentes. Um 
esquema básico na elaboração de um modelo é mostrado na Figura 1.1.
11Bioestatística
Figura 1.1 – Esquema básico necessário para a elaboração de um modelo 
(Oliveira e Moreira, 1987).
Na elaboração de modelos, o ponto de partida é a prática (a observa-
ção, a experimentação), ou premissas teóricas sugeridas pela prática. Parâ-
metros são medidas associadas a um dado fenômeno e a inter-relação entre 
parâmetros selecionados constitui um modelo matemático. Resultados espe-
rados são aqueles obtidos pela aplicação de um modelo, em contraposição a 
resultados observados, obtidos diretamente da prática.
3.1. Construção de um modelo matemático simples: um modelo linear
Quando dizemos que y é uma função linear de x, queremos dizer que o gráfi-
co da função é uma reta e, portanto, matematicamente representada por uma 
equação do tipo
y = ax + b
Onde a é a inclinação da reta e b o intercepto em Y. Uma característica 
peculiar das funções lineares é que elas crescem (ou decrescem) a uma taxa 
constante. O exemplo a seguir, modificado de STEWART (2003) é um bom 
exemplo de um modelo linear.
Exemplo 1.2 – A Tabela 1.1 fornece uma lista de níveis médios de dióxido 
de carbono na atmosfera, medidos em partes por milhão no Observatório de 
Mauna Loa, de 1972 a1990. Usando os dados desta tabela vamos encontrar 
um modelo matemático para o nível de dióxido de carbono.
12
SANTIAGO, G. S., PAIVA, R. E. B. 
Tabela 1.1 
VARIAÇÃO DO NÍVEL DE DIÓXIDO DE CARBONO (CO
2
) SEGUNDO O ANO
Ano Níveis reais de CO
2
 (em ppm) Níveis obtidos de CO2 com uso do modelo
1972 327,3 327, 297
1974 330,0 330, 263
1976 332,0 333, 230
1978 335,3 336, 197
1980 338,5 339, 163
1982 341,0 342, 130
1984 344,3 345, 097
1986 347,0 348, 063
1988 351,3 351, 030
1990 354,0 353, 997
Fonte: Modificado de Stewart (2003).
Solução:
Vamos usar os dados da tabela acima para fazer um mapa de dispersão, 
mostrado na Figura 1.2, onde t representa o tempo (em anos) e C representa 
o nível de CO2 (em ppm). 
Figura 1.2 – Mapa de dispersão para o nível médio de CO2 (STEWART, 2003).
Observe que os pontos estão muito próximos de uma linha reta, dessa 
forma, é natural escolher um modelo linear neste caso. Porém, há inúmeras 
possibilidades de retas que aproximam esses pontos; assim, qual deveríamos 
usar? Do gráfico, vemos que uma possibilidade é a reta que passa pelo pri-
meiro e o último ponto dado. A inclinação dessa reta é
13Bioestatística
354,0 327,3 26,7 1,48333
1990 1972 18
−
= ≈
−
E sua equação é
C - 327,3 = 1,48333 (t – 1972)
Ou
C = 1,48333t – 2597,83
Essa equação fornece um modelo linear possível para o nível de CO2, 
cujo gráfico está na Figura 1.3.
Figura 1.3 – Modelo linear através do primeiro e do último ponto dado (STEWART, 2003).
Embora nosso modelo se ajuste razoavelmente aos dados, ele dá valo-
res mais altos do que a maior parte dos níveis reais de CO2. Um modelo linear 
melhor é obtido por meio de um procedimento da estatística chamado de re-
gressão linear (será estudada no capítulo 8). Usando esse recurso estatístico 
chegamos a seguinte equação de regressão
C = 1,496667t – 2624,826667
3.2. Variações absolutas e relativas
Seja um parâmetro, cujo valor inicial designamos por E ( i ) e o final, por E ( f ). 
A variação absoluta é dada por:
∆ = E ( f ) – E ( i )
 
A variação relativa é dada por ∆r = 
)(iE
∆
, geralmente expressa em per-
centagem.
14
SANTIAGO, G. S., PAIVA, R. E. B. 
Exemplo 1.3 – O peso de um paciente variou, de janeiro a dezembro, de 60 
kg a 90 kg. A variação absoluta foi: ∆ = 90 kg – 60 kg = 30 kg e a relativa:
30 1 50%
60 2
kgr
kg
∆ = = =
Exemplo 1.4 – O peso de um paciente aumentou em 20% de janeiro a julho 
e em 10% de julho a dezembro. Qual foi a variação percentual de janeiro a 
dezembro?
É uma tentação responder, de imediato, e errado: 30%! Para resolver 
corretamente, e de forma fácil, problemas envolvendo variações relativas, to-
mamos um início absoluto arbitrário (100, mais cômodo para os cálculos). 
Assim, esquematizando:
Janeiro Julho Dezembro
100 120 132
Logo, a variação relativa de janeiro a dezembro foi
132 100 32 32%
100 100
−
= =
4. Noções sobre conjuntos
Assim como em outros assuntos de matemática, também na teoria dos con-
juntos certas noções são aceitas sem definição (primitivas), a fim de servirem 
como ponto inicial.
 Enquanto na Geometria Euclidiana costuma-se adotar sem definição 
as noções de ponto, reta e plano, na teoria dos conjuntos as noções conside-
radas primitivas são as seguintes:
a) conjunto
b) elemento
c) pertinência entre elemento e conjunto
A palavra conjunto sugere a ideia de coleção, grupo ou lista de elemen-
tos. Tais elementos podem ser objetos, pessoas, nomes, números etc. Um 
conjunto que tem um único elemento é chamado unitário, enquanto aqueles 
sem elemento algum são os vazios. Por convenção os conjuntos são denomi-
nados por letras maiúsculas do nosso alfabeto (com exceção do vazio que é 
representado pela letra grega φ ( fi ). Uma das formas de definir um conjunto é 
colocar todos os seus elementos entre chaves, um após o outro e separados 
por vírgulas, como, por exemplo, o conjunto das vogais é { }edcba ,,,, . 
15Bioestatística
4.1. Principais operações com conjuntos
Dados dois conjuntos A e B, chama-se reunião de A e B o conjunto formado 
pelos elementos que pertencem a A ou a B e escreve-se AB = { x / x∉
A ou x∉B }. Dados dois conjuntos A e B, chama-se intersecção de A e B o 
conjunto formado pelos elementos que pertencem a A e a B, e escreve-se A
B ={ x / x∉A e x∉B }.
Exemplo 1.5 – Faça as operações de soma e intersecção com os conjuntos 
A = { 1,2,3,4 } e B = { 3,4 }
Solução
 a) { 1,2,3,4 } { 3,4 }= { 1,2,3,4 }
b) { 1,2,3,4 } { 3,4 }= { 3,4 }
4.2. Contagem dos elementos de um conjunto
Para expressar a quantidade de elementos de um conjunto qualquer A usa-
mos a notação n(A). Consideremos dois conjuntos não-vazios A e B, e seja 
AB a intersecção desses conjuntos. Para encontramos o número de ele-
mento da união devemos somar os elementos de A com os elementos de B, e 
descontarmos os elementos da intersecção, pois foram contados duas vezes. 
Assim, o número de elementos da união, n (AB) é dado por:
n (AB) = n (A) + n (B) – n (AB)
No caso em que os conjuntos são disjuntos (A B =φ ) a fórmula se reduz a
n (AB) = n (A) + n (B)
Exemplo 1.6 – Foram obtidos dados antropológicos de mil maridos e res-
pectivas esposas. Se em 800 casais os maridos são mais altos, em 700 
são mais pesados e em 660 são tanto mais pesados quanto mais altos, 
pergunta-se: em quantos casais as mulheres excedem os maridos nas duas 
medidas (peso e altura)?
Solução:
Considere o diagrama de Euler-Venn.
16
SANTIAGO, G. S., PAIVA, R. E. B. 
Figura 1.4 – Aplicação do diagrama de Euler-Venn na solução do exemplo 1.6.
n (S) = 1.000; n (A) = 800; n (B) = 700 e n (AB) = 660.
O conjunto dos casais em que o marido excede a esposa em pelo me-
nos uma das dimensões é: (AB).
n (AB) = n (A) + n (B) – n (AB) ∴ n (AB) = 800 + 700 – 660 = 840
O conjunto complementar de (AB), simbolizado por (AB)c, é o con-
junto em que as mulheres predominam em ambas as medidas:
n[(AB)c] = 1000 – 840 = 160, que corresponde a parte hachurada 
da Figura 1.4.
5. Análise combinatória
Serão revistas algumas noções desse assunto em função de sua necessida-
de no estudo de probabilidade (Unidade 03).
5.1. Fatorial
Chama-se fatorial de um número inteiro não negativo n (n≥0), o inteiro que se 
indica por n!, e tal que:
n! = n (n-1) (n-2)...3.2.1 , para n≥2.
Para n = 0 ou n = 1, temos n! = 1
Exemplo 1.7 – Encontre os valores de: a) 5! e b) 7!.
Solução:
a) 5! = 5.4. 3. 2.1 = 120
b) 7! = 7.6.5! = 7.6.5! = 42. 120 = 5040
17Bioestatística
5.2. Números binomiais
Sejam n e k dois inteiros tais que 0 ≤ k ≤ n. Chama-se número binomial de 
numerador n e classe k, o inteiro positivo que se indica por 





k
n
e tal que
 
 ) !(!
!
knk
n
k
n
−
=





Exemplo 1.8. Calcular 





3
8
Solução: 
56
1.2.3
6.7.8
1.2.3.4.5.1.2.3
1.2.3.4.5.6.7.8
3
8
===





56
5.3. Princípio fundamental da contagem
Consideremos o exercício seguinte: ao longo de uma estrada existem 3 cida-
des, A, B e C. Para ir de A a B você dispõe de 2 alternativas de carona e de 
B a C, 3 alternativas. De quantas formas distintas você pode fazer o percurso 
total, de A a C?
Se você achar 2 + 3 = 5, é uma solução errada. O correto é 2x3 = 6 al-
ternativas, como é fácil verificar. Este problema trivial é uma ilustração de um 
importante princípio matemático chamado princípio fundamental da contagem 
(P.F.C), assim enunciado:
Se um:
- Experimento E1 puder ocorrer de n1 maneiras distintas
- Experimento E2 puder ocorrer de n2 maneiras distintas
- Experimento E3 puder ocorrer de n3 maneiras distintas
 . . .
 . . .
 . . .
 - Experimento Ei puder ocorrer de ni maneiras distintas
O experimento E1∩ E2∩E3∩ .........∩Ei poderá ocorrer de:
n1 . n2 . n3.......................ni maneiras distintas
18
SANTIAGO, G. S., PAIVA, R. E. B. 
Síntese da parte
Nesta parte foram revistos conceitos importantesde matemática que são im-
prescindíveis para compreensão satisfatória de alguns capítulos posteriores. 
Iniciamos com o estudo de modelagem matemática, discutindo ideias que 
serão muito úteis no estudo de modelos probabilísticos. Em seguida, foi in-
troduzido o importante conceito de aleatoriedade, de suma importância no 
estudo de probabilidades. Conjuntos, um tema unificador da matemática, foi 
abordado nos seus princípios, onde trabalhamos com as noções sobre ope-
rações entre conjuntos. Por fim fizemos um estudo de alguns aspectos da 
combinatória, que estão muito presentes no estudo de estatística. 
Atividades de avaliação
1. Responda os ítens seguintes:
a) Os fenômenos biológicos são, em geral, determinísticos ou aleatórios? Porque?
b) O resultado de um tratamento, o diagnóstico de uma doença, são fenôme-
nos aleatórios? Por quê?
2. Utilize a notação de somatório para expressar 22622 +++ .
3. Expresse ∑
=
n
i
ixf
1
)(2 sem usar somatório.
4. A respeito de modelagem matemática responda o que pede:
a) São parâmetros da função respiratória: capacidade vital, volume expiratório 
de reserva, CO2 alveolar... Selecionar alguns parâmetros referentes a: fun-
ção renal, função circulatória e fígado humano.
b) Admitindo-se o modelo matemático seguinte, relacionando glicorraquia 
(GL) com glicemia (GS):
 GL = 3
2
GS, qual a glicorraquia esperada para um indivíduo com 
 glicemia 9mg/dL?
c) São mais confiáveis os resultados observados ou os esperados? Por quê?
d) Qual a vantagem dos resultados esperados sobre observados?
e) Qual a importância do confronto entre resultados observados e esperados?
19Bioestatística
5. Responda aos itens abaixo: 
a) Um pesquisador, desejando estimar as populações dos municípios de um 
estado, t anos após 1970, dispõe dos dados:
P1 = população em 1970 (conhecida pelo censo)
P2 = população em 1980 (conhecida pelo censo)
P = população a estimar ( t anos após 1970)
Admitindo a premissa de que a população cresça linearmente, ou seja, em 
progressão aritmética, construa um modelo matemático.
b) Utilizando o modelo do item “a” estime a população para 1985 de um mu-
nicípio onde:
P1 = 243.160 habitantes e P2 = 320.100 habitantes.
c) Modifique o modelo anterior de crescimento, agora admitindo a nova premis-
sa de que o crescimento seja exponencial, isto é, em progressão geométrica.
d) Qual das duas é mais adequada? Por quê?
6. A pressão sistólica de um paciente desceu de 15 cm/Hg para 12 cm/Hg, após 
administração de um medicamento. Determine as variações absoluta e relativa.
7. A glicemia de um diabético aumentou em 40% das 6:00 às 15:00 horas e 
diminuiu 20% das 15:00 às 21:00 horas. Qual a variação relativa das 6:00 
às 21:00 horas?
8. Uma colônia bacteriana aumentou em 80% de t0 a t2, sendo que o aumento 
de t0 a t1 foi de 20%. Qual a variação relativa de t1 a t2? 
9. Uma massa tumoral aumentou em 96% de t0 a t2, sendo que o aumento re-
lativo de t0 a t1 foi igual ao aumento relativo de t1 a t2. Se o valor inicial (em 
t0) do volume era de 8 cm
3, qual o volume em t1?
10. São examinados 1000 resultados de hemogramas, onde se consideram 
apenas os achados de:
a) neutrofilia; b) eosinofilia; c) linfocitose. 
Registram-se as seguintes informações:
525 casos com neutrofilia
312 casos com eosinofilia
470 casos com linfocitose
42 casos com linfócitose e eosinofilia
20
SANTIAGO, G. S., PAIVA, R. E. B. 
147 casos com neutrofilia e linfocitose
86 casos com eosinofilia e linfocitose
25 casos com todas as alterações, simultaneamente.
Verifique se há inconsistência nesses dados.
11. Um pesquisador classificava, histopatologicamente, casos de doença de 
Hodgkin segundo 2 atributos dicotomizados: Eosinófilos (muitos, poucos); 
células de Reed – Sternberg - R.S (muitas, poucas). Assim, tinha 4 cate-
gorias distintas:
 • Casos com muitos eosinófilos e muitas células R-S
 • Casos com poucos eosinófilos e poucas células R-S
 • Casos com muitos eosinófilos e poucas células R-S
 • Casos com poucos eosinófilos e muitas células R-S
Anos depois, em 1978, o mesmo pesquisador considerava os seguintes 
atributos, também dicotomizados: eosinófilos, células R.S; fibrose, necro-
se, histiócitos, mastócitos. Assim sendo, quantas categorias distintas se-
rão agora possíveis?
12. Casos de calazar são classificados segundo os atributos:
Esplenomegalia: +, ++, +++, ++++
Hepatomegalia: 0, +, ++
Anemia: leve, moderna, intensa
Hemorragia: Presente, ausente.
Qual o número de possíveis categorias distintas?
13. Os “loci” homólogos de um par de cromossomos podem ser ocupa-
dos pelos 6 alelos de determinado gen. Qual o número de possíveis 
genótipos distintos?
14. A seguinte expressão é um modelo matemático proposto por DUBOIS 
para estimar a superfície corporal S (cm2), partindo do peso corporal P(kg) 
e da altura A (cm):
0,425 0,72571,84. .S P A=
Estime a superfície corporal de uma pessoa de 60 kg e altura 1,59m.
15. Uma doença se propaga de tal forma que o número de casos aumenta em 
5%, de ano para ano. Em quanto tempo ocorrerá triplicação dos casos?
16. O código genético especifica um aminoácido por uma seqüência de 3 
bases, as quais são: adenina, guanina, citosina e timina. Quantos aminoá-
cidos distintos podem ser codificados?
21Bioestatística
Texto complementar
A matemática e as profissões – geneticista
Ao pesquisar a transmissão de caracteres hereditários na reprodução das ervilhas, 
Mendel valeu-se basicamente do cálculo de probabilidades para formular as leis que 
deram início a esse importante ramo de estudo da biologia: a genética. A utilização 
da matemática nesse campo é, portanto, uma questão de princípio. Sem esse instru-
mento básico de trabalho a genética não existiria.
Glória Maria Duccine Dal Colletto, geneticista doutorada pelo instituto de Ciências 
Biológicas da USP, ressalta o papel essencial da matemática, e em especial o da esta-
tística, na condução de pesquisas genéticas e na análise dos resultados. “O domínio 
do cálculo de probabilidades é indispensável nessa área”, afirma ela. 
A respeito da matemática elementar e de seus principais tópicos, a pesquisadora co-
menta: “Não é muito comum, mas às vezes acontece de usarmos para a resolução de 
alguns problemas em nosso trabalho a trigonometria, as transformações logarítmi-
cas, as matrizes e os sistemas lineares”.
Sobre a matemática de nível superior, Glória menciona o uso frequente de inferência 
estatística (regressão linear simples e múltipla, análise de variância etc), das distribui-
ções normal e binomial, da média e da correlação. A aplicação de testes, segundo ela, é 
imprescindível, destacando-se entre eles o teste do qui-quadrado, o teste de hipóteses 
e o teste t de Student. “A aplicação do conhecimento matemático faz parte, enfim, da 
rotina de trabalho do geneticista.”
Tomando fatos concretos, ligados à prática, a pesquisadora cita um exemplo interes-
sante de como a matemática pode ser utilizada na previsão e prevenção de proble-
mas congênitos quando a combinação entre os elementos de um casal pode resultar 
em algum risco genético. O albinismo é um caso clássico da Genética no qual se re-
corre à utilização de estatística. Digamos que a doença seja causada por um par de 
genes alelos: A (normal /dominante) e a (albino / recessivo). A probabilidade de uma 
pessoa ser ou não Albina, tendo pais normais, porém portadores do alelo a, pode ser 
visualizado no esquema a seguir:
Pais normais Aa x Aa
Combinações possíveis AA Aa aA aa
Probabilidades de ocorrência (%) 25 25 25 25
Fenótipos Normais (75%) Albinos (25%)
“A probabilidade de ocorrência do albinismo desaparece, caso um dos 
pais seja AA.”. O albinismo é causado por um gene recessivo e não se mani-
festa na presença de um gene dominante no par:
22
SANTIAGO, G. S., PAIVA, R. E. B. 
Pais normais AA x Aa
Combinações possíveis AA AA Aa Aa
Probabilidades de ocorrência (%) 25 25 25 25
Fenótipos Normais (100%)
“Como nesse caso do albinismo existem outra situações nas quais a genética, pormeio do recurso à matemática, prever e ajuda a prevenir problemas genéticos”, fina-
liza a geneticista. (Modificado de MACHADO, 1988).
Referências 
ALENCAR FILHO, E. Aritmética dos inteiros. São Paulo: Nobel, 1987. 406 p.
GUELLI, C. A.; IEZZI, G.; DOLCE, O. Conjuntos, funções e inequações. 
São Paulo: Editora Moderna Ltda, 1967. 265 p.
MACHADO, A. S. Matemática: temas e metas. São Paulo: Atual Editora, 1988. 196 p.
OLIVEIRA, E. G.; MOREIRA, O. C. Guia para o ensino introdutório da esta-
tística nos cursos da área de saúde. Fortaleza: UECE, 1987. 149 p.
STEWART, J. Cálculo. São Paulo: Pioneira Thomson, 2003. v. 1, 670 p.
VIEIRA, S. Introdução à bioestatística. Rio de Janeiro: Editora Campus, 
1988. 294 p.
Capítulo 1
Procedimentos de ensino
Parte 2
Descrição das amostras
Capítulo
Organização tabular e 
gráfica dos dados
Objetivos
l Construir tabelas de acordo com algumas regras gerais.
l Estudar associação de variáveis através de tabelas bidimensionadas 2 x 2.
l Estudar associação de variáveis através de tabelas bidimensionadas n x n.
l Construir tabelas de distribuição de freqüências.
l Construir e interpretar os principais tipos de gráficos.
1. Representação tabular
As tabelas constituem uma importante forma de representação dos dados es-
tatísticos, quer pelo seu aspecto meramente descritivo, quer pela maior facili-
dade de análise que propicia, particularmente, nos estudos de associação, tão 
úteis na investigação biomédica. Não existem regras rígidas para a confecção 
de uma tabela, sendo a prática, ainda, a mentora decisiva para uma boa re-
presentação tabular. Alguns itens gerais, no entanto, serão considerados: 
a) As tabelas deverão preencher dois requisitos fundamentais, nem sempre 
fáceis de conciliar: SIMPLICIDADE e CLAREZA.
b) As tabelas deverão ser autossuficientes, no sentido de, para sua compre-
ensão, prescindir de consulta ao texto onde ela está inserida.
c) O título é obrigatório, para se obedecer à condição de auto-suficiência, e 
nele devem se encontrar respostas às perguntas: Qual a natureza do fenô-
meno descrito? Onde ocorreu? Quando ocorreu?
d) O corpo da tabela, onde se encontram as informações numéricas, deve explicitar 
as variáveis apresentadas e as suas unidades; não se deve deixar caselas (locais 
para os números) em branco, utilizando, quando necessário, símbolos como: - : 
não ocorrência do fenômeno;... : ausência de informação; ( ? ) dúvida sobre a 
informação etc... Em geral, só se devem usar para separação dos dados, traços 
horizontais; os traços verticais são antiestéticos, trabalhosos para quem vai fazê-
-los, inúteis, e omitidos, consequentemente na literatura científica.
2
26
SANTIAGO, G. S., PAIVA, R. E. B. 
e) Quando necessário, no rodapé da tabela, devem constar a fonte de infor-
mações (se não forem do próprio pesquisador, ou seja, primárias) e escla-
recimentos sobre chamadas no corpo ( símbolos, legendas...)
Exemplo 1.1 – Esquematize uma tabela adequada para receber dados sobre 
o número de internações hospitalares feitas nos Estados da Região Sul do 
Brasil, em 2008, discriminadas por estado, clínica (cirúrgica, médica e psiqui-
átrica) e clientela (urbana e rural).
Solução:
Tabela 1.1
NÚMERO DE INTERNAÇÕES NA REGIÃO SUL DO BRASIL NO ANO DE 2008, DE ACORDO 
COM O ESTADO, CLÍNICA E CLIENTELA
Estado
Paraná Sta Catarina Rio G. Sul Total
Clientela Urbana Rural Urbana Rural Urbana Rural
Cirúrgica
Clínica Médica
Pediátrica
Total
1.1. Estudo de associação em tabelas bidimensionais 2x2
Um médico, desejando saber se existe uma associação entre câncer de bexi-
ga e o hábito de fumar, examina os arquivos de um grande hospital e verifica 
que, dentre 1.000 casos de câncer vesical, 900 correspondiam a pacientes 
que eram tabagistas.
Considere, agora, que um pesquisador toma, ao acaso, 2 amostras de 
camundongos isogênicos, suscetíveis a determinado vírus; os camundongos 
da 1ª amostra são injetados com uma vacina experimental e 2ª amostra é uti-
lizada como controle. Todos os camundongos são, depois, expostos ao vírus, 
e ao cabo de um período adequado, verificaram-se os sobreviventes em cada 
amostra, obtendo-se os resultados (genéricos) resumidos na tabela 1.2.
Tabela 1.2 
TAXAS DE SOBREVIVÊNCIA DE CAMUNDONGOS SEGUNDO A VACINAÇÃO
Sobreviventes
Vacinados Sim Não Total
Sim A b n
3
Sim D c n
4
Total n
1
n
2
n = n
1
 + n
2
 + n
3
 + n
4
27Bioestatística
No primeiro caso é lícito concluir, ou pelo menos suspeitar, à luz dos 
dados acima, que o hábito de fumar predispõe (ou seja, está associado) à 
referida forma de tumor maligno. No segundo caso, podemos ter uma ideia da 
eficácia da vacina comparando os percentuais de sobrevivência nos dois gru-
pos, porém é mais interessante que tenhamos à disposição uma medida sin-
gular, de limites bem definidos, que nos informe da associação, caso exista.
Para tabelas 1.2, uma medida adequada é o coeficiente de YULE, de-
finido por:
Y = 
ac bd
ac bd
−
+
Na interpretação de YULE, é preciso saber: 
a) O valor de Y está compreendido no intervalo fechado de -1 (menos um) a 
+1 (mais um)
b) Y = -1 corresponde a associação inversa perfeita
c) Y = 0 corresponde a independência perfeita
d) Y = + 1 corresponde a associação direta perfeita
e) Na prática, raramente o YULE assume os valores acima referidos; a regra 
são valores fracionários.
Exemplo 1.2 – Para os dados da Tabela 1.3, calcule e interprete o coeficiente 
de YULE.
Tabela 1.3
TAXAS DE SOBREVIVÊNCIA DE CAMUNDONGOS SEGUNDO A VACINAÇÃO
Sobreviventes
Vacinados Sim Não Total
Sim 130 70 200
Sim 80 160 240
Total 210 230 440
Temos:
Y =
130 160 70 80 20.800 5.600 15.200
130 160 70 80 20.800 5.600 26400
x x
x x
− −
= =
+ +
≅ 0,57
0,57 indica associação direta entre taxa de sobrevivência e vacinação, 
ou seja, sugere que o aumento da sobrevivência caminha na mesma direção 
da vacinação.
28
SANTIAGO, G. S., PAIVA, R. E. B. 
1.2. Estudo de associação em tabelas bidimensionais, m x n 
(variáveis ordenadas)
O YULE é o coeficiente de associação mais simples de calcular e fácil de 
interpretar; apresenta, contudo, o inconveniente de sua aplicação ser restrita 
a tabelas 2 x 2. Um coeficiente de aplicação mais geral é o Gama (G) de 
GOODMAN & KRUSKAL, aplicável a tabelas m x n (m ≥2 ; n ≥2), exigin-
do, contudo que as duas variáveis estudadas possam ser ordenadas, isto 
é , estejam, pelo menos, numa escala ordinal de medidas. A interpretação de 
G é semelhante à de YULE, embora o cálculo seja mais complicado.
Assim temos:
G = 
NM
NM
+
−
Onde:
M (frequência das concordâncias): é o somatório dos produtos de 
cada elemento pela soma dos que lhe estão abaixo e à direita, sen-
do a leitura feita da esquerda para a direita.
N (frequência das disconcordâncias): é o somatório dos produtos 
de cada elemento pela soma dos que lhe estão abaixo e à esquer-
da, sendo agora a leitura feita da direita para a esquerda.
Observação importante: Só são considerados os elementos centrais 
da tabela e nunca os totais.
Exemplo 1.3 – Para os dados da Tabela 1.4 calcule o coeficiente Gama.
Tabela 1.4
ASSOCIAÇÃO ENTRE GLICEMIA E GLICOSÚRIA
Glicemia
Glicosúria Normal Aumentada Total
0 9 1 10
+ 6 6 12
+ + 6 8 14
+ + + 3 17 20
Total 24 32 56
M = 9 ( 6 + 8 + 17) + 6 ( 8 + 17) + 6(17) = 279 + 150 + 102 = 531
N = 1( 6+ 6 + 3) + 6 (6 + 3) + 8 (3) = 15 + 54 + 24 = 93
∴ G = 531 93 438 0,70
531 93 624
−
= =
+
29Bioestatística
Interpretação:
G = 0,70; associação direta entre grau de glicosúria e hiperglicemia, 
ou seja, da amostra estudada, fica sugerido que o aumento da glicosúria se 
desenvolve na mesma direção do aumento da glicemia.
1.3. Distribuição de frequências
É comum, na prática que nos defrontemos com um conjunto de dados numé-
ricos, referentes ao exame de amostras. Se o número dessas informações for 
pequeno, podem-se extrair algumas conclusões a seu respeito, mas quando 
há uma massa considerável de dados (amostras de tamanho a partir de 30), 
seu exame de per si torna-se inviável obrigando a que os valoresnuméricos 
sejam categorizados em classes às quais se fazem corresponder suas res-
pectivas frequências (números de valores em cada classe). Tem-se, assim, 
o que é conhecido como distribuição de frequências. Por exemplo, se temos 
informações sobre as idades de 100 (cem) pacientes, ao invés de considerar, 
isoladamente, cada informação, fazemos uma divisão em classes ou faixas 
etárias; se dispusermos das glicemias de 60 pacientes, é mais prático que se 
estabeleçam classes ou faixas glicêmicas. Naturalmente, tal sumarização tem 
um preço, que é a perda de certa quantidade de informação, mas é um preço 
pequeno diante das vantagens que traz.
1.3.1. Elementos de uma distribuição de frequências
a) Classes: são os intervalos de variação da variável, sendo representados 
por i=1, 2, 3,..., k; onde k é o número total de classes da distribuição.
b) Frequência de uma classe: indica o número de elementos de uma classe, 
isto é, o total de vezes que cada valor entra na constituição de uma classe.
c) Intervalo de classe: é o conjunto de números que constitui o intervalo. É a 
forma mais comum de agrupar os dados.
 Os tipos de intervalo são:
 a) 3 | 5: fechado a esquerda e aberto a direita
 b) 3 | 5: Aberto a esquerda e fechado a direita
 c) 3 || 5: Fechado a esquerda e fechado a direita
 d) 3  5: aberto a direita e aberto a esquerda.
d) Limites de classes: são os extremos de uma classe.
 l – Limite inferior de uma classe
 L – Limite superior de uma classe
30
SANTIAGO, G. S., PAIVA, R. E. B. 
e) Ponto médio de uma classe: chamamos de ponto médio de uma classe, 
ao ponto que divide esse intervalo de classe em duas partes iguais.
1) O ponto médio é denotado por iX , onde i, indica i-ésima classe considerada.
2) O ponto médio de uma classe é determinado pela semi-soma do limite superior 
e limite inferior dessa classe, isto é, a média aritmética dos limites de classe.
2
lLXi
+
= ∀ i = 1, 2, 3, ..., k
3) O ponto médio de uma classe é o seu legítimo representante. Ao ser deter-
minado, faremos a suposição de que todos os elementos pertencentes a 
essa classe, serão iguais ao seu ponto médio 
4) Os pontos médios de uma distribuição estão em progressão aritmética, isto 
é, a diferença entre eles é constante.
f) Amplitude de um intervalo de classe: é a medida do intervalo que define 
a classe. É obtida pela diferença entre os limites superior e inferior dessa 
classe e é indicada por
hi = L – l
Exemplo 1.4 – Elabore uma tabela de distribuição de frequências com dados 
abaixo referentes à iodemia (em microgramas por decilitro), para 30 pessoas 
normais (adaptado de informações do “Journal of Clinical Investigation, 1940).
3,8 5,3 5,8 6,5 7,2
4,3 5,3 5,9 6,5 7,4
4,5 5,4 5,9 6,7 7,9 n = 30 (tamanho da amostra)
5,0 5,5 6,0 6,8 8,4
5,2 5,6 6,5 7,0 8,8 
Primeiro precisamos definir o número de classes ( N ), o qual dependerá 
do tamanho da amostra e de sua homogeneidade (quanto mais homogêneos 
forem os dados, de menos classes necessitaremos). Em geral, N não deve 
ser inferior a 5 (grande perda de informação), nem superior a 15 (prejuízo para 
a simplicidade).
Uma “regra” empírica que alguns autores adotam, respeitadas as obser-
vações do parágrafo anterior é:
N n≅ , dando-se preferência à aproximação ímpar, que facilita a 
apreciação da simetria.
No nosso exemplo: N 30≅ ; escolhemos então N = 5 para o nosso 
número de classes. A amplitude total dos dados é 8,8 – 3,8 = 5,0. Logo, a am-
plitude de cada classe será:
31Bioestatística
C = 0,1
5
0,5
=
A distribuição de frequência desejada pode ser então:
Tabela 1.5
DISTRIBUIÇÃO DE FREQUÊNCIA DA IODEMIA (µg/dL) EM 30 PESSOAS NORMAIS
i Classes Frequência ( f
i 
)
1 3,8 | 4,8 3
2 4,8 | 5,8 9
3 5,8 | 6,8 9
4 6,8 | 7,8 5
5 7,9 | 8,8 5
 Total 30
1.3.2. Tipos de frequências
a) Frequência absoluta simples ( f i ) : indica quantos elementos da amostra 
pertencem a cada classe
b) Frequência relativa ( f r ) : é determinada dividindo-se a frequência absoluta 
simples de cada classe, pela frequência total, isto é, pelo tamanho da amos-
tra (n). Geralmente, expressa como percentagem.
∑
=
i
i
r f
ff
Indica, em percentagem, o número de elementos de cada classe.
c) Frequência absoluta acumulada (faa): é a soma da frequência absoluta de 
uma classe, com as frequências absolutas de todas as classes anteriores.
d) Frequência relativa acumulada (fra): é a soma da frequência relativa de 
uma classe, com as frequências relativas de todas as classes anteriores. 
Exemplo 2.5 – Encontre todas as frequências para os dados da Tabela 1.5.
Solução:
Vamos organizar os dados da Tabela 1.5 para obtermos a Tabela 1.6.
Tabela 1.6
DISTRIBUIÇÃO DE FREQUÊNCIA DA IODEMIA (µg/dL) EM 30 PESSOAS NORMAIS
i Classes f 
a
f 
r
 (%) f 
aa
f 
ra
1 3,8 | 4,8 3 10,00 3 10,00
2 4,8 | 5,8 9 30,00 12 40,00
3 5,8 | 6,8 9 30,00 21 70,00
4 6,8 | 7,8 5 16,66 26 86,66
5 7,8 | 8,8 4 13,33 30 100,00
Total 30 100,00
32
SANTIAGO, G. S., PAIVA, R. E. B. 
2. Representação gráfica
O gráfico estatístico nada mais é do que uma outra forma de apresentação 
dos dados estatísticos. Tem como objetivo fornecer, para quem o analisa, uma 
informação direta e objetiva do fenômeno estudado. Assim, além de sintéticos 
e claros, devem ser capazes de atrair a atenção do leitor, seja pelo apelo pic-
tórico, ou pela visão abrangente e dinâmica dos dados representados, o que 
é mais difícil obter através da representação tabular.
Não se deve esquecer, contudo, que os gráficos são, em geral, mais 
esboços, não encerrando, exatamente, as informações contidas nas tabelas. 
Não obstante, certos gráficos, como os diagramas de dispersão, orientam 
para uma análise estatística mais aprofundada (como será estudado em ca-
pítulos posteriores).
É importante que obedeça algumas características:
 • Simplicidade: deve ser destituído de detalhes supérfluos
 • Clareza: para possibilitar uma fiel interpretação dos valores representativos 
do fato ou fenômeno estudado.
 • Veracidade: deve expressar a verdade sobre o fenômeno em estudo
2.1. Gráficos estatísticos
a) Gráfico de barras: consiste na representação de uma série estatística por 
meio de retângulos dispostos horizontalmente. Os retângulos possuem a 
mesma altura e os seus comprimentos são proporcionais aos respectivos 
dados ou as suas frequências (Figura 1.1).
Figura 1.1 – Freqüências absolutas dos níveis séricos de colesterol para 1067 
homens dos EUA, com idades entre 25 e 34 anos, 1976-1980 (PAGANO e GAU-
VREAU, 2006).
33Bioestatística
b) Gráfico de colunas: é a representação de uma série estatística por meio 
de retângulos dispostos verticalmente. Os retângulos possuem a mesma 
base e as alturas são proporcionais aos respectivos dados ou as suas fre-
quências (Figura 1.2).
Figura 1.2 – Frequências relativas das concentrações de chumbo no sangue (µg/dL) 
de trabalhadores do Canadá em 1987 (Pagano e Gauvreau, 2006).
Se, mediante o gráfico, tentamos comparar várias populações entre si, 
existem outros tipos, como o mostrado na Figura 1.3. Quando os tamanhos 
das duas populações são diferentes, é conveniente utilizar as frequências re-
lativas, já que, em outro caso, as comparações poderiam ser enganosas.
 
34
SANTIAGO, G. S., PAIVA, R. E. B. 
c) Gráfico de setores: são representados por meio de um círculo, onde cada 
classe é representada por um setor circular cujo ângulo é proporcional ao 
tamanho da altura. É utilizado quando se deseja comparar os valores de 
uma série com a sua soma ou total (Tabela 1.5 e Figura 1.4).
Tabela 1.5
ALUNOS MATRICULADOS NA ESCOLA X, NO ANO DE 2009
SÉRIES QUANTIDADE DE ALUNOS
1 ª Série 400
2 ª Série 300
3 ª Série 200
4 ª Série 100
Total 1000
Figura 1.4 – Alunos matriculados na escola X, no ano de 2009.
Observações:
a) As áreas dos setores ou as porcentagens correspondentes aos setores 
são, respectivamente, proporcionais aos dados da série e são obtidos por 
meio de uma simples regra de três.
b) Se você desejar o ângulo dosetor, o TOTAL será representado pelo círculo, 
que corresponde a 360º.
c) Se você desejar a porcentagem correspondente a um dado qualquer, o 
TOTAL será representado por 100%.
Exemplo 1.4 – Usando as informações contidas na Tabela 1.5 e na Figura 
1.4, responda:
35Bioestatística
a) Calcule o ângulo do setor correspondente a 1ª série.
b) Se o ângulo do setor equivalente aos alunos da 3ª série é 72º, determine a 
sua porcentagem correspondente.
c) Se o ângulo do setor equivalente aos alunos da 1ª série é de 144, determine 
a sua porcentagem correspondente.
Solução:
a) 100% → 360º ⇒ X = 144º
 40% → X
b) 360º → 100º ⇒ X = 20%
 72º → X
c) 360º → 100% ⇒ X = 40%
 144 → X
A Figura 1.5 esclarece os cálculos executados.
Figura 1.5 – Apresentação dos cálculos executados no Exemplo 1.4.
d) Representação gráfica de distribuição de frequência simples: faz-se 
através dos histogramas, que são gráficos em colunas justapostas, tais que 
a base de cada coluna é a classe, e a altura a frequência respectiva. Para 
a distribuição de frequência do Exemplo 1.4, o histograma é apresentado 
na Figura 1.6.
36
SANTIAGO, G. S., PAIVA, R. E. B. 
Figura 1.6 – Frequência de iodo no sangue (µg/dL) (Oliveira e Moreira, 1987).
e) Curvas de frequências
O histograma é um gráfico amostral, que nos sugere um gráfico populacio-
nal, chamado curva de frequência. Os mais importantes modelos de curvas 
de frequências são mostrados na Figura 
37Bioestatística
Figura 1.7 – Modelos de curvas de frequências.
f) Frequências acumuladas
Simbolizadas pela letra maiúscula F, ao contrário das frequência simples, 
indicam o número de valores abaixo a cada limite de classe. Para o caso 
das iodemias tem-se a Tabela 1.4 de frequências acumuladas.
38
SANTIAGO, G. S., PAIVA, R. E. B. 
Tabela 1.4
IODEMIAS DE FREQUÊNCIAS ACUMULADAS
Iodemia menor que F Fr (%)
3,8 0 0
4,8 3 10
5,8 12 40
6,8 21 70
7,8 26 87
8,8 30 10
O gráfico representativo de frequências acumuladas é um de linhas, 
chamado Ogiva de Galton (Figura 1.8).
Figura 1.8 – Limites inferiores da iodemia (µg/dL).
Medidas de tendência 
central
1. Introdução
Quando dispomos os dados numa tabela de distribuição de frequência, não 
é possível estabelecer pontos, em torno do quais os dados se distribuem. 
Quando o interesse é apresentar um conjunto de valores, através de um úni-
co número, são usadas as medidas de tendência central ou de posição: média 
aritmética (ou simplesmente média), mediana e moda.
2. Média aritmética ( x )
Média, que representaremos por x , é dada pela soma dos valores de todos 
os dados divididos por n.
n
x
x
n
i
i∑
== 1
Exemplo 2.1 – Seis pacientes foram analisados quanto a glicemia (mg %) 
tendo sido obtidos os seguintes valores 89, 91, 95, 100, 78 e 105. Encontre a 
glicemia média.
Solução:
Temos: 
89 91 95 100 78 105 93
6
x + + + + += =
3Capítulo
40
SANTIAGO, G. S., PAIVA, R. E. B. 
2.1. Características da média
a) É fácil de calcular
b) Representa o valor “provável” de uma variável, por isso, é muitas vezes 
chamado de valor esperado ou esperança matemática quando calculada 
para a população.
c) Dá o valor da abscissa do ponto em torno do qual os dados se distribuem, 
podendo-se imaginar, portanto, a média como o centro de gravidade da 
distribuição. 
Exemplo 2.2 – Considerando que no exemplo 3.1 a glicemia de 89 mg % foi 
substituída por 140 mg %, qual a alteração provocada na média?
Solução:
Temos:
140 91 95 100 78 105 101,5
6
x + + + + += = mg %
Observamos neste exemplo que a média é muito sensível a valores 
extremos da variável. Veja que a média aumentou aproximadamente 10%, de 
modo que não é recomendável para distribuições muito assimétricas.
2.2. Média de dados agrupados
2.2.1. Sem intervalos de classes
Neste caso, como as frequências são números indicadores da intensidade de 
cada valor da variável, elas funcionam como fatores de ponderação, por isso 
é chamada média aritmética ponderada. É dada pela fórmula:
∑
∑=
i
ii
f
fx
x
Exemplo 2.3 – Determine a média da distribuição mostrada na Tabela 2.1.
Tabela 2.1
DISTRIBUIÇÃO DE PACIENTES RENAIS, SEGUNDO A IDADE
Idade (anos) Frequência (f)
26 3
28 10
30 12
32 5
37 20
41Bioestatística
Temos:
Refazendo a Tabela 2.1 obtemos a Tabela 2.2.
Tabela 2.2
DISTRIBUIÇÃO DE PACIENTES RENAIS, SEGUNDO A IDADE
Idade (anos) (x
i
) Frequência ( f
i 
) x
i 
f
i
26 3 78
28 10 280
30 12 360
32 5 160
37 20 740
∑ 50 1618
Então:
1618 32, 4
50
x = =
2.2.2. Com intervalos de classes
Como não podemos operar com classe, representamos cada classe pela mé-
dia entre seus dois limites, e fazemos como no caso anterior.
Exemplo 2.4 – Determine a média da distribuição da Tabela 2.3.
Tabela 2.3
DISTRIBUIÇÃO DE PESOS (KG) DE RECÉM NASCIDOS DO SEXO MASCULINO
Classe f
2,0 | 3,0 2
3,0 | 4,0 15
4,0 | 5,0 23
5,0 | 6,0 2
Total 42
Solução:
Rearranjando a tabela anterior para obtermos a Tabela 2.4.
Tabela 2.4
DISTRIBUIÇÃO DE PESOS (KG) DE RECÉM NASCIDOS DO SEXO MASCULINO
Classe Ponto médio (x
i
) Frequência ( f
i
 ) x
i 
f
i
2,0 | 3,0 2,5 2 5
3,0 | 4,0 3,5 15 52,5
4,0  5,0 4,5 23 103,5
5,0 | 6,0 5,5 2 11
∑ 42 172
42
SANTIAGO, G. S., PAIVA, R. E. B. 
Então: 
172 4,1
42
x = = kg
3. Mediana (Md)
Considerando que uma variável assuma os seguintes valores: 10, 14, 16, 21 e 
390, como já discutimos, em casos como esse, onde existem valores discre-
pantes, a média não vai ser bem representativa da distribuição como um todo, 
pois que será influenciada pelo valor aberrante. Assim é preciso usar outras 
medidas mais adequadas.
Define-se mediana, e indica-se por Md, como o valor tal que metade 
dos dados ou são iguais ou são inferiores a ela.
Exemplo 2.5. Calcular a mediana para o conjunto de pesos de RN (kg): 2,7; 
3,9; 4,1; 4,3; 5,4 e interpretar.
Solução: 
Md = 4,1 kg
Esse valor significa que metade dos RN tem pesos menor ou igual 
a 4,1 kg.
3.1. Propriedades da mediana
Destacamos as seguintes:
1. Como medida descritiva, tem a vantagem de não ser afetada pelas 
observações extremas, por isso é adequada para distribuições as-
simétricas.
2. É de cálculo rápido ou de interpretação fácil.
3. Diferentemente da média, a mediana de uma variável discreta é sempre um 
valor da variável que estudamos (quando o número da observação n é ímpar).
4. Tem a mesma unidade de medida dos dados.
5. Verificamos que, estando ordenado os valores de uma série e sendo n o 
número de elementos, da série, o valor mediano será:
O termo de ordem 
2
1+n
, se n for ímpar.
A medida aritmética dos termos da ordem 
2
n
 e 1
2
+
n
, se n for par.
Exemplo 3.6 –Em uma amostra de 35 medidas de peso, calcule a posição 
da mediana quando os dados forem adequados.
43Bioestatística
Solução: 
Temos: 
1 35 1 18
2 2
nMd + += = =
 
valor da série.
3.2. Mediana de dados agrupados
3.2.1. Sem intervalos de classe
Neste caso, é suficiente identificar a frequência acumulada imediatamente 
superior à metade da soma das frequências. A mediana será aquele valor da 
variável que corresponde a tal frequência acumulada.
Exemplo 3.7 – Determine a mediana da distribuição mostrada na tabela 3.1.
Solução: A partir da Tabela 3.1 obtemos a Tabela 2.5.
Tabela 2.5
DISTRIBUIÇÃO DE PACIENTES RENAIS, SEGUNDO A IDADE
Idade (anos) Frequência Frequência acumulada
26 3 3
28 10 13
30 12 25
32 5 30
37 20 50
∑ 50
Temos:
50 25
2 2
f
= =∑
A menor frequência acumulada que supera este valor é 30, que corres-
ponde ao valor 32 da variável, sendo este o valor mediano. Logo: Md = 32 anos.
3.2.2. Com intervalos de classe
Neste caso, o problema consiste em determinar o ponto do intervalo em que 
está compreendida a mediana. Para tanto, temos inicialmente que determinar 
a classe na qual se acha à mediana: Classe Mediana. Tal classe será, evi-
dentemente, aquela correspondente a frequência acumulada imediatamente 
superior a 
2
∑ f . Vamos considerartambém que os valores se distribuem uni-
formemente em todo o intervalo da classe.
Consideremos agora os dados da Tabela 2.3, acrescentando as frequ-
ências acumuladas e classes de distribuição, para formar a Tabela 2.6.
44
SANTIAGO, G. S., PAIVA, R. E. B. 
Tabela 2.6
DISTRIBUIÇÃO DE PESOS (KG) DE RECÉM NASCIDOS DO SEXO MASCULINO
Classe Peso ( kg ) Frequência Frequência acumulada
1 2,0 | 3,0 2 2
2 3,0 | 4,0 15 17
3 4,0 | 5,0 23 40
4 5,0 | 6,0 2 42
∑ 42
Temos:
 
42 21
2 2
f
= =∑ 
Como há 40 valores incluídos nas 3 primeiras classes de distribuição e 
como desejamos determinar o valor que ocupa o 40º lugar, a partir do início 
da série, vemos que este valor deve estar localizado na terceira classe ( i = 3 
), supondo que as frequências dessas classes estejam uniformemente distri-
buídas. Como há 23 elementos nesta classe e o intervalo de classe é igual a 
1, devemos tomar, a partir do limite inferior a distância 
21 17 41
23 23
−
× =
e a mediana será dada por:
44 4,17
23
Md = + = . Logo, Md = 4, 17 kg.
4. Moda (Mo)
Chama-se moda o valor que ocorre com maior frequência em uma série de 
valores. É a medida de tendência central menos importante. Sua única vanta-
gem é que pode ser utilizada para todas as escalas de medidas, ao contrário 
da média que só pode ser usada para escalas quantitativas (intervalos e ra-
zões) e da mediana que só pode ser usada a partir da escala ordinal.
Exemplo 2.8 – Calcular a moda para idades em que pacientes começaram a 
apresentar presbiopia: 37; 40; 39; 39; 42; 39; 39; 41.
Solução: A idade modal é 39 anos.
45Bioestatística
Exemplo 2.9 B Calcular a moda para as pressões diastólicas (cm / hg) dadas 
na Tabela 2.7.
Tabela 2.7
PRESSÃO DIASTÓLICA (P.D) EM CM/HG
Classe P.D. Frequência
1 5,0 | 6,5 4
2 6,5 | 8,0 8
3 8,0 | 9,5 17
4 9,5 | 12,0 5
5 12,0 | 13,5 2
Total 36
Solução:
No caso de distribuição de frequências, costuma-se usar para estimar a moda 
a fórmula de KING:
c.LM
21
1
0 ∆+∆
∆
+=
Onde:
L – limite inferior da classe modal.
1∆ - diferença entre a frequência modal e a frequência anterior.
2∆ - diferença entre a frequência modal e a frequência posterior.
c – amplitude da classe modal.
Temos então: Como a classe modal é 3 vem:
L = 8,0; 1∆ = 17 – 8 = 9; 2∆ = 17 – 5 = 12; c = 1,5.
Logo, 0
98,0 .1,5 8,6
9 12
M = + =
+
cm/hg.
 
Medidas de dispersão ou 
de variabilidade
1. Importância da variabilidade
A variabilidade é um fator constante e decisivo nos seres vivos tornando possí-
vel a conservação do indivíduo e da espécie. Se não existisse diferença entre 
os indivíduos, qualquer estímulo capaz de eliminar um deles, poderia eliminar 
também toda a população. Assim, pode-se considerar a variabilidade, como 
um dos estudos mais importantes da estatística, bastando dizer que se não 
houvesse variabilidade entre os indivíduos, bastaria descrever um deles para 
que se tivesse um conhecimento de toda a população (PINTO et al., 1981).
Dentre as medidas de variabilidade estudaremos:
a) Amplitude total;
b) Variância;
c) Desvio padrão;
d) Coeficiente de variação.
2. Amplitude total
Por definição, amplitude total é a diferença entre o maior e o menor valor ob-
servado. O seu cálculo é muito simples, o que é uma vantagem. No entanto, 
não é uma boa medida de dispersão, porque seu cálculo se baseia apenas 
nos valores extremos da amostra.
Exemplo 3.1 – Suponhamos três grupos de adultos, do sexo masculino, clas-
sificados segundo o peso (kg) como mostra o Quadro 3.1.
Quadro 3.1
GRUPOS DE ADULTOS SEGUNDO O PESO
Grupo Pesos (kg)
I 60 62 64 66 68 70 72 74 76
II 60 61 62 63 68 73 74 75 76
III 60 65 66 67 68 69 70 71 76
As amplitudes dos 3 grupos é 16 kg, no entanto eles são diferentes, o 
que torna essa medida limitada para descrever a variabilidade.
Capítulo 4
47Bioestatística
3. Variância
A variância mede a dispersão dos dados em torno da média. Seu cálculo é 
relativamente complexo, no entanto, como leva em conta todos os valores 
da variável, é um índice de variabilidade bastante estável e, portanto, um dos 
mais empregados. É expresso pela fórmula:
1
)(
1
2
2
−
−
=
∑
=
n
xx
s
n
i
i
É importante destacar que a variância tem pouca importância como es-
tatística descritiva, porém é extremamente importante na inferência estatísti-
ca, mas seu estudo mais aprofundado foge do escopo deste livro.
Exemplo 3.2 – Encontre a variância para o conjunto de dados a seguir:
Temperaturas (ºC) – 34; 35; 36; 37; 38
Solução:
Inicialmente calculamos a média
5
1 34 35 36 37 38 36
5 5
i
i
x
x = + + + += = =
∑
De posse do valor médio podemos construir a Tabela 4.1.
Tabela 3.1
CALCULO DOS DESVIOS E QUADRADOS DOS DESVIOS
Dados
(xi)
Desvios
)( xxi −
Quadrados dos desvios
)( xxi − 2
34 -2 4
35 -1 1
36 0 0
37 1 1
38 2 4
∑ 180∑ 0 ∑10
Logo,
S2 = 
10 2,5
4
≅
A partir de uma manipulação algébrica podemos expressar a variância 
pela seguinte fórmula alternativa
48
SANTIAGO, G. S., PAIVA, R. E. B. 
1
)( 22
2
−
−
=
∑ ∑
n
n
x
x
s
Vamos aproveitar os mesmos dados do Exemplo 3.2 para usar a nova 
fórmula (Tabela 3.2).
Tabela 3.2
CALCULO DA VARIÂNCIA
X
i
(X
i
)2
34 1156
35 1225
36 1296
37 1369
38 1444
∑ 180 ∑ 6490
Então:
5,2
4
5
)180(6490
2
2 ≅
−
=s
Esta última fórmula além de mais prática é mais precisa. Quando a mé-
dia não é exata e tem que ser arredondada, cada desvio fica afetado ligeira-
mente do erro, devido a esse arredondamento.
4. Desvio padrão
É o protótipo das medidas de dispersão. Sendo simbolizado pela primeira le-
tra da palavra inglesa “standard”, que significa padrão. Define-se como a raiz 
quadrada da variância. É importante observar que tem a mesma unidade de 
medida dos dados.
Exemplo 3.3 – Calcule o desvio padrão para os valores de concentração 
sérica de proteínas (em g/dL).
{6;8;10}
De início temos n=3
6 8 10 8 /
3
x g dL+ += =
49Bioestatística
Daí podemos construir a Tabela 3.3.
Tabela 3.3
CONCENTRAÇÃO SÉRICA DE PROTEÍNAS EM G/DL
X
i
(X
i
)2
6 36
8 64
10 100
 ∑ 24 ∑ 200
Logo: 
2
2
(24)200
3 2
2
s
−
= =
Então:
S = 2 1,41 /g dL≅
Exemplo 3.4 – Calcule o valor do desvio padrão para a distribuição de frequ-
ências da Tabela 3.4.
Tabela 3.4
DISTRIBUIÇÃO DE FREQÜÊNCIA
Classe Frequência
2 | 4 5
4 | 6 6
6 | 8 10
8 | 10 4
10 | 12 5
∑ 30
Adota-se o seguinte dispositivo a semelhança do que cálculo da média, 
para construção da Tabela 3.5.
Tabela 3.5
CALCULO DO DESVIO PADRÃO
Classe
Ponto médio
( x )
Frequência
( f ) fx xx − 2)( xxf −
 2 | 4 3 5 15 -4 80
 4 | 6 5 6 30 -2 24
6 | 8 7 10 70 0 0
 8 | 10 9 4 36 2 16
10 | 12 11 5 55 4 80
∑ 30 206 0 200
50
SANTIAGO, G. S., PAIVA, R. E. B. 
N= 30; 
206 7
30
x = ≅
Temos
2 200
30
s = ∴ 6,2≅s
5. Coeficiente de variação (C.V.)
Considere que foram feitas determinações pondo-estaturais em um conjunto 
de pacientes, obtendo-se os seguintes resultados (Quadro 3.2):
Quadro 3.2
DETERMINAÇÕES PONDO-ESTATURAIS EM UM CONJUNTO DE PACIENTES
CONJUNTO DE PACIENTES
PESO (kg) ALTURA (m)
Média: 58,0
Desvio padrão: 4,5
Média: 1,65
Desvio padrão: 0,08
Pergunta-se: Qual dos dois parâmetros variou mais? O principiante tende a 
responder: “O peso, pois teve um desvio padrão maior”. Ora, de fato, temos que:
4,5 > 0,08, mas é inválida a comparação; pois não podemos comparar 
grandezas de dimensões (ou unidades) heterogêneas. Para contornar essa 
situação o desvio padrão é substituído pela medida adimensional – COEFI-
CIENTE DE VARIAÇÃO (C.V.) dado pela expressão:
C.V. = 
x
s
No caso em estudo, temos
Peso: C.V. = 
4,5 7,7%
58,0
kg
kg
=
Altura: C.V. =
0,08 4,8%
1,65
m
m
≅
Logo, o peso variou mais, não porque teve um desvio padrão maior, 
mas sim maior C.V. Na experimentação biológica, considera-se que há um 
bom controle das variações quando o C.V. não supera os 15%.
Segue-se, agora, a seguinte situação (Quadro 3.3):
Quadro 3.3
MÉDIA E DESVIO PADRÃO DO QUOCIENTE INTELECTUAL DE CRIANÇAS DESNUTRIDASE BEM NUTRIDAS
QUOCIENTE INTELECTUAL (Q.I.)
CRIANÇAS DESNUTRIDAS CRIANÇAS BEM NUTRIDAS
Média: 90
Desvio padrão: 1,5
João: Q.I. = 94
Média: 104
Desvio padrão: 4,0
Ricardo: Q.I. = 108
51Bioestatística
Em termos absolutos, qual a criança melhor situada? Ricardo é claro, 
pois 108 > 94.
Em termos relativos, ou seja, dentro da classe a qual pertence, qual a 
criança melhor situada em termos de Q.I.? Somos tentados a responder que, em 
termos relativos, ambos estão igualmente situados, pois 94 – 90 = 108 – 104 = 4, 
ou seja, a diferença do Q.I. de cada criança para a média do grupo é a mesma. 
Mas, é preciso lembrar que uma mesma diferença se destaca mais em um gru-
po homogêneo (desvio padrão menor) que em um grupo heterogêneo (desvio 
padrão maior). Assim, para situações como essa, em que se deve realçar o valor 
particular de uma variável no contexto da distribuição a qual pertence, utiliza-se 
a importante medida:
Variável reduzida: z = 
s
xx −
Para o nosso problema:
João: z = 
94 90 2,7
1,5
−
≅
Ricardo: z = 0,1
4
104108
=
−
Logo, como 2,7 > 1,0, João está melhor situado, em termos relativos.
Síntese do Capítulo
Nesta parte estudamos a construção de tabelas, com bastante ênfase a as ta-
belas de distribuição de frequências, pela sua grande importância em estatísti-
ca. No capítulo seguinte analisamos as medidas de tendência central (media, 
mediana e moda) destacando as suas principais vantagens e restrições. No 
capítulo posterior foram estudadas as medidas de variabilidade – amplitude 
total, variância e desvio padrão. Vimos que a variância e o desvio padrão são 
medidas mais adequadas que a amplitude total e por isso as mais utilizadas. 
Encerrando o último capítulo desta unidade, analisamos uma importante me-
dida de dispersão relativa, o coeficiente de variação, que nos dá uma boa 
idéia da homogeneidade, traduzindo-se em maior confiabilidade experimental.
52
SANTIAGO, G. S., PAIVA, R. E. B. 
Atividades de avaliação
1. Organize os dados em uma tabela
“Em Minas Gerais ocorreram 9 casos de tracoma, todos na zona urbana. 
No ceará ocorreram 3.633 casos de tracoma, todos na zona urbana. No 
Paraná ocorreram 1913 casos, sendo 1513 na zona rural e os restantes 
na zona urbana. Em Pernambuco, ocorreram 3.016 casos, todos na zona 
urbana” ( Fonte: Superintendência de campanhas de saúde pública).
2. Os dados seguintes são níveis séricos de ferro em adultos (mg/100 mL). 
Organize a distribuição de frequência e calcule os tipos de frequência:
42 45 42 50 51 46
48 46 44 49 50 49
49 47 47 46 43 52
51 49 42 47 43 50
50 52 43 49 45 51
3. Organize a distribuição de frequência e calcule os tipos de frequência para 
dosagem de açúcar em mg % de sangue de 40 indivíduos:
90 110 95 100 83 84 107 109
109 93 96 101 104 105 95 99
91 105 109 98 94 89 108 85
95 90 99 93 95 106 96 98
84 94 97 103 82 97 96 114
4. No seguinte conjunto de dados, são fornecidos os pesos (arredondados em 
quilos) de crianças nascidas em certo intervalo de tempo:
1,8 3,6 1,8 2,7 3,6 2,7 3,2 3,2 3,2 3,6
4,5 4,1 3,2 2,7 4,5 3,6 2,3 4,1 2,7 1,4
3,2 2,7 1,8 3,2 2,3 2,7 4,5 5,0 3,6 2,3
a) Construa uma distribuição de freqüências desses pesos.
b) Encontre as frequências relativas.
c) Encontre as frequências acumuladas.
d) Encontre as frequências relativas acumuladas.
5. Os dados abaixo se referem ao tempo de incubação (em dia) para 70 casos 
de doença:
53Bioestatística
15 16 24 10 5 5 5
2 4 8 4 3 4 6
7 9 17 23 5 7 4
5 5 19 5 5 4 4
8 3 7 6 5 5 7
11 6 2 12 3 3 6
30 7 5 3 7 4 12
18 3 20 3 5 4 3
1 5 13 26 3 7 2
22 2 5 4 6 3 5
a) Organize os dados em um rol.
b) Determine o percentual de casos com período de incubação inferior a 10 
dias.
c) Construa uma distribuição de freqüências e a partir dela determine o per-
centual do item anterior ( b ).
6. Considere a tabela 3.6.
Tabela 3.6
DIAGNÓSTICO DE BIÓPSIAS DE MAMA, FEITAS ENTRE 1963 E 1972, 
INCLUSIVE, NO HOSPITAL DOS SERVIDORES DO ESTADO, RJ
Diagnóstico Frequência
Displasia 1.010
Tumor benigno 344
Tumor maligno 329
Inflamatório 54
Diversos 288
Fonte: Piza et al. (1997) citado por Vieira (1988).
Calcule a percentagem de cada diagnóstico e construa um gráfico:
a) em colunas.
b) em setores.
7. Garcia (1977) citado por Vieira (1988) estudou uma amostra de 820 indiví-
duos residentes em São José do Rio Preto, SP, com relação ao sistema 
ABO. A autora verificou que, desses indivíduos, 417 tinham sangue tipo O, 
292 sangue tipo A, 94 tinham sangue tipo B e 17 tinham sangue tipo AB.
54
SANTIAGO, G. S., PAIVA, R. E. B. 
a) Calcule as frequências relativas.
b) Organize uma tabela que apresente os dados e as frequências relativas.
c) Faça um gráfico de setores.
8. Por que é que é preferível utilizar as frequências relativas, ao invés das 
absolutas, para descrever graficamente as distribuições de frequências?
9. Considere os seguintes dados sobre a distribuição de valores de metabolis-
mo basal (cal/dia) em 35 adolescentes.
910 1280 1220 1120 1040
1070 980 1310 1240 1140
1190 1090 1010 1380 1270
1280 1210 1110 1040 1460
960 1300 1240 1130 1070
1080 1000 1360 1260 1180
1200 1110 1020 1420 1270
Construa a Ogiva de Galton. 
Texto Complementar
A taxa de anormalidade
Define-se taxa de anormalidade, A, como o número relativo de casos cujos valores se 
encontram fora de um intervalo de referência (normalidade) previamente definido.
Deste modo, para um conjunto X de n valores ordenados, (X={x1,x2,...,xn} 
e x1 < x2 < ... < xn ), com os limites do intervalo de referência definidos por 
Li = x3 , Ls = xn -2 e n = 10, o valor de taxa de normalidade pode ser calculado.
n
VA A=
Onde:
VA = número de valores fora do intervalo de normalidade
N = número total de valores do conjunto
E resulta igual a
4 0,4
10
A = =
O que significa que 40% dos valores do conjunto estão fora do padrão de normalidade. 
Evidentemente, o intervalo de variação de A está entre 0 e 1. Ainda, quanto mais próximo 
de 1 for o seu valor, maior será a dispersão do conjunto e vice-versa. Todavia, entende-se 
que, se A=0, não existem valores anormais, embora a dispersão possa existir (não ser nula).
Do ponto de vista conceitual, a taxa de anormalidade difere das outras medidas de 
55Bioestatística
dispersão porque seu cálculo se baseia na ordem dos elementos de um conjunto e não no 
seu valor (como no caso do desvio padrão). Desta forma, a taxa de anormalidade é uma 
medida de variabilidade ordinal. A Taxa de Anormalidade apresenta algumas vantagens e 
algumas desvantagens quando comparada com outras medidas de variabilidade, conforme 
é resumido a seguir.
Restrições:
a) O intervalo que define o valor de referência pode não existir
b) O intervalo nem sempre define um mesmo percentual da população como normal
c) Podem existir, para uma mesma variável, distintas opiniões de normalidade, dependendo 
do local ou da época. Deste modo, a taxa de anormalidade, enquanto medida de variabi-
lidade, está restrita ao tempo e ao local de onde os dados foram coletados.
d) Ao se tentar construir uma medida de variabilidade, imagina-se que, se o resultado desta 
medida for igual a zero, deveria indicar, naturalmente, que a dispersão é nula e, portanto, 
não existe. Entretanto, no caso da Taxa de Anormalidade, A=0, não significa necessaria-
mente ausência de dispersão, ou concentração total dos dados, e sim que não existem 
valores considerados anormais no conjunto. Esta diferença de definição da Taxa de Anor-
malidade deve ser sempre levada em conta para se evitarem erros de conceito.
Vantagens:
a) A visualização do significado de A é imediato e muito forte
b) A informação que carrega, por si só, é muito significativa e auto-explicativa.
c) O processo de cálculo é simples e rápido.
d) A dispersão medida por A não é afetada por valores exorbitantes, pois trabalha com número 
de casos e não o valor desses casos. Desta forma, constitui um indicador de base ordinal.
(Extraído de ARANGO,2005)
Referências 
ARANGO, H. G. Bioestatística: teóricae computacional. Rio de Janeiro: Gua-
nabara Koogan, 2005. 423 p.
BEIGUELMAN, B. Curso Prático de Bioestatística. Ribeirão Preto: Socieda-
de Brasileira de Genética, 1988. x 156 p.
CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto 
Alegre: ARTMED, 2003. 255 p.
DIAZ, F. R.; LÓPEZ, F. J. B. Bioestatística. São Paulo: Thomson, 2007. 284 p.
IEZZI, G.; DOLCE, O.; DEGENSZAJN, D. et al. Matemática: ciência e aplica-
ções. São Paulo: Atual Editora, 2006. v. 3, 95 p.
OLIVEIRA, E. G.; MOREIRA, O. C. Guia para o ensino introdutório da esta-
tística nos cursos da área de saúde. Fortaleza: UECE, 1987.149 p.
PAGANO, M.; GAUVREAU, K. Princípios de bioestatística. São Paulo: 
Thomson, 2004. 506 p.
56
SANTIAGO, G. S., PAIVA, R. E. B. 
PINTO, D.; BRANDÃO, L. L.; NOGUEIRA, M. L. G.; COELHO, M. I. M. 
Estatística para a área de ciências biológicas. Belo Horizonte: Universidade 
Federal de Minas gerais – ICEX, 1981.70 p.
VIEIRA, S. Introdução à bioestatística. Rio de Janeiro: Editora Campus, 
1988. 294 p.
Capítulo 1
Procedimentos de ensino
Parte 3
Noções de Probabilidade
Capítulo
Probabilidade: 
conceitos fundamentais
Objetivos
l Conceituar evento e espaço amostral de um experimento.
l Calcular probabilidades em espaços equiprováveis e finitos.
l Calcular a probabilidade da união de dois eventos.
l Calcular probabilidade condicional e probabilidade de dois eventos simultâneos.
l Reconhecer a independência de dois eventos.
l Calcular probabilidades usando as distribuições binomial, normal e Poisson.
l Estimar as médias e as variâncias desses modelos.
1. Conceito de probabilidade
Há certos fenômenos (ou experimentos) que, embora sejam repetidos muitas 
vezes e sob condições idênticas não apresentam o mesmo resultado. Por 
exemplo, no lançamento de uma moeda perfeita, o resultado é imprevisível; 
Não se pode determiná-lo antes de ser realizado. Não sabemos se sairá “cara” 
ou “coroa”. Aos fenômenos (ou experimentos) desse tipo damos o nome de 
fenômenos aleatórios ou casuais (veja também capítulo 01).
São exemplos de fenômenos aleatórios:
a) Lançamento de um dado;
b) Resultado de um jogo de roleta;
c) Número de pessoas que ganharão na loto.
Pelo fato de não sabermos o resultado exato de um fenômeno aleatório 
é que buscamos os resultados prováveis, as chances, as probabilidades de 
um determinado resultado ocorrer. A teoria das probabilidades é um ramo da 
matemática que cria, elabora e pesquisa modelos para estudar experimentos 
ou fenômenos aleatórios.
5
60
SANTIAGO, G. S., PAIVA, R. E. B. 
2. Espaço amostral e evento
Em um experimento aleatório, o conjunto formado por todos os resultados 
possíveis chama-se Espaço amostral (E). Evento é qualquer subconjunto do 
espaço amostral.
Exemplo 1.1 – Lançamento de um dado e registro do resultado
Espaço amostral: E = {1,2,3,4,5,6}
Evento – ocorrer número ímpar: A = {1,3,5}
2.1. Operações sobre conjuntos
Os eventos, sendo conjuntos, destes compartilham as mesmas operações, 
das quais descreveremos as básicas:
a) União (AB) – significa ocorrência de A ou de B. Lembre-se de que o 
conectivo ou significa: uma coisa ou outra, ou ambas ao mesmo tempo.
b) Interseção (AB) – significa ocorrência de A e também de B
c) Complemento (Ac) – significa a não ocorrência de A
Atenção!
Sendo E o espaço amostral temos:
 i) AAc = E
 ii) AAc = φ
Exemplo 1.2 – No lançamento de um dado, considere o evento A formado 
pelos resultados menores do que 3. O complementar de A (Ac) é formado por 
todos os resultados maiores ou iguais a 3. Isto é:
A = { 1,2}
Ac = {3,4,5,6}
3. Probabilidade: definição e propriedades
3.1. Definição
Seja E um espaço amostral finito e não vazio, e seja A um evento deste espa-
ço. Chama-se probabilidade de A m e indica-se por P(A), o número )(
)(
En
An , onde 
n(A) e n(E) indicam os números de elementos de A e E respectivamente. Isto é:
P(A) = 
)(
)(
En
An
Exemplo 1.3 – Um casal normal para o albinismo tem um filho albino. Qual a 
probabilidade do próximo filho também ser albino?
61Bioestatística
Se o casal é normal, mas já teve um filho albino, isto é indicação segura 
de que são heterozigotos em relação a esse caráter; logo, o espaço amostral 
(G) dos genótipos dos descendentes é dado pelo cruzamento:
Aa X Aa ⇒ G = {(AA), (Aa),(aA),(aa)} e n(G) = 4
O evento correspondente a filho albino é constituído pelo genótipo 
aa, ou seja :
A = {(aa)} ∴n(A) = 1
Então P(A) = 
)(
)(
Gn
An
=
4
1
3.2. Propriedades
Sendo E um espaço amostral finito e não vazio e sendo A um evento de E, 
tem-se que:
I ) P(φ ) = 0
II ) P(E) = 1
III ) 0 ≤P(A) ≤1
IV) P(A) + P(Ac) = 1
De fato:
I . 
( ) 0 0
( ) ( )
n
n E n E
∅
= =
II . P(E) = 
)(
)(
En
En
= 1
III . Sendo A um evento de E, isto é:
A ⊂ E, temos que:
Ø ⊂ A ⊂ E ⇒ n (A) ≤ n(E) ⇒ 0 ≤ n(A) ≤ n(E)
Dividindo cada membro dessa igualdade por n(E),
)(
0
En 
≤
 )(
)(
En
An
 
≤
 )(
)(
En
En
 
⇒
 
 0≤ P(A) ≤1
IV. Já sabemos que AAc = E e AAc = φ . Do princípio aditivo da 
contagem temos:
n (AAc) = n (A) + n (Ac ) – n (AAc ) ∴ n ( E ) = n ( A ) + n ( Ac )
Dividindo por n(E) ambos os membros dessa igualdade, temos que:
)
( )
nE
n E
= 
)(
)(
En
An
 + 
)(
)(
En
An c
 ⇒ P(A) + P(Ac) = 1
62
SANTIAGO, G. S., PAIVA, R. E. B. 
Exemplo 1.4 – Uma urna contém exatamente 10 etiquetas, numeradas de 1 a 
10. Retira-se uma etiqueta da urna. Qual a probabilidade de se obter:
a) Um número maior que 10?
b) Um número menor que 11?
O espaço amostral do experimento é E = {1,2,3,...,10}.
a) O evento que queremos é A = {x∈E / x > 10} = φ ; logo, A é evento 
impossível. Portanto, P(A) =0.
b) O evento que queremos é B = {x∈E / x < 11} = E ; logo, B é evento 
certo, pois B = E. Portanto P(B) = 1
4. Adição de probabilidades
Teorema: Seja E um espaço amostral finito e não vazio. Para quaisquer even-
tos A e B de E, tem-se que P(AB) = P (A) + P(B ) – P(AB ).
Prova: 
Pelo princípio aditivo da contagem n(AB) = n (A) + n(B ) – n(AB )
Dividindo por n (E) ambos os membros da igualdade, obtemos:
)(
)(
)(
)(
)(
)(
)(
)(
En
BAn
En
Bn
En
An
En
BAn 
−+= ∴ P(AB) = P (A) + P(B ) – 
P(AB )
Se AB = φ , ou seja, se é impossível a ocorrência simultânea dos dois 
eventos, o teorema é simplificado a
P(AB) = P (A) + P(B )
Eventos mutuamente exclusivos são aqueles tais que a ocorrência de 
um exclui, automaticamente, a ocorrência de qualquer outro. Podemos gene-
ralizar o teorema da adição para n eventos mutuamente exclusivos:
P(ABC ...N) = P(A) + P(B) + P(C) + ... + P(N).
Exemplo 1.5 – Num cruzamento Aa X Aa, sabemos que as combinações AA, 
Aa e aa são igualmente prováveis, cada uma com probabilidade ¼. Sabemos 
também que Aa e aA não podem ser distinguidas biologicamente. Qual é a 
probabilidade de ocorrer Aa ou aA?
Solução:
P(Aa) = P(aA) = 
4
1
Aa e aA são mutuamente exclusivos, então P(Aa ou aA) = 0, logo:
P(Aa ou aA) = P(Aa  aA) = 
4
1
+
4
1
=
2
1
63Bioestatística
Exemplo 1.6 – Numa população humana a probabilidade de ser mudo é esti-
mada em 0,005, a probabilidade de ser cego é 0,0085 e a probabilidade de ser 
mudo e cego é 0,0006. Qual é a probabilidade de que um indivíduo, tomado 
ao acaso, seja mudo ou cego?
Solução:
Neste caso, “ser mudo” não exclui a probabilidade de “ser cego”, portan-
to os eventos não são mutuamente exclusivos. Logo:
P(ser mudo ou ser cego) = P(A ou B) = P(A) + P(B) – P(AB)
 = 0,0050 + 0,0085 – 0,0006
 = 0,0129
5. Probabilidade condicional
Chama-se probabilidade condicional de um evento B a probabilidade desse 
evento ocorrer considerando-se que já ocorreu um evento A. Indica-se por 
P(B/A) e lê-se: probabilidade de B dado A.
Exemplo 1.7 – Considere como espaço amostral o conjunto de diagnósticos 
num hospital; e sejam os eventos: A – diabetes e B – hipertensão. O símbolo 
P(A/B) significa a probabilidade de um paciente ter

Continue navegando