Buscar

Bioestatistica_LIVRO_WEB

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 222 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 222 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 222 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Biologia
Bioestatística
Lilian Giotto Zaros
Henrique Rocha de Medeiros
Bioestatística
Natal – RN, 2011
Biologia
Bioestatística
Lilian Giotto Zaros
Henrique Rocha de Medeiros
2ª Edição
COORDENAÇÃO DE PRODUÇÃO DE MATERIAIS DIDÁTICOS
Marcos Aurélio Felipe
GESTÃO DE PRODUÇÃO DE MATERIAIS
Luciana Melo de Lacerda
Rosilene Alves de Paiva
PROJETO GRÁFICO
Ivana Lima
REVISÃO DE MATERIAIS
Revisão de Estrutura e Linguagem
Eugenio Tavares Borges
Janio Gustavo Barbosa
Jeremias Alves de Araújo
José Correia Torres Neto
Kaline Sampaio de Araújo
Luciane Almeida Mascarenhas de Andrade
Thalyta Mabel Nobre Barbosa
Revisão de Língua Portuguesa
Camila Maria Gomes
Cristinara Ferreira dos Santos
Emanuelle Pereira de Lima Diniz
Janaina Tomaz Capistrano
Priscila Xavier de Macedo
Rhena Raize Peixoto de Lima
Revisão das Normas da ABNT
Verônica Pinheiro da Silva
EDITORAÇÃO DE MATERIAIS
Criação e edição de imagens
Adauto Harley
Anderson Gomes do Nascimento
Carolina Costa de Oliveira
Dickson de Oliveira Tavares
Leonardo dos Santos Feitoza
Roberto Luiz Batista de Lima
Rommel Figueiredo
Diagramação
Ana Paula Resende
Carolina Aires Mayer
Davi Jose di Giacomo Koshiyama
Elizabeth da Silva Ferreira
Ivana Lima
José Antonio Bezerra Junior
Rafael Marques Garcia
Módulo matemático
Joacy Guilherme de A. F. Filho
IMAGENS UTILIZADAS
Acervo da UFRN
www.depositphotos.com
www.morguefi le.com
www.sxc.hu
Encyclopædia Britannica, Inc.
FICHA TÉCNICA
Catalogação da publicação na fonte. Bibliotecária Verônica Pinheiro da Silva.
Governo Federal
Presidenta da República
Dilma Vana Rousseff
Vice-Presidente da República
Michel Miguel Elias Temer Lulia
Ministro da Educação
Fernando Haddad
Universidade Federal do Rio Grande do Norte – UFRN
Reitora
Ângela Maria Paiva Cruz
Vice-Reitora
Maria de Fátima Freire Melo Ximenes
Secretaria de Educação a Distância (SEDIS)
Secretária de Educação a Distância
Maria Carmem Freire Diógenes Rêgo
Secretária Adjunta de Educação a Distância
Eugênia Maria Dantas
© Copyright 2005. Todos os direitos reservados a Editora da Universidade Federal do Rio Grande do Norte – EDUFRN.
Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorização expressa do Ministério da Educacão – MEC
Zaros, Lilian Giotto.
Bioestatística / Lilian Giotto Zaros e Henrique Rocha de Medeiros. – Natal: EDUFRN, 2011.
214 p.: il.
ISBN 978-85-7273-833-0
Conteúdo: Aula 1 – O que é bioestatística. Aula 2 – Como transformar dados em informações. 
Aula 3 - Descrevendo Sistemas. Aula 4 – Elaborando hipóteses. Aula 5 – Testando hipóteses. Aula 6 
– Análise de variância. Aula 7 – Correlacionando informações. Aula 8 – Análise de regressão. Aula 9 – 
Entendendo os números índices e suas aplicações. Aula 10 – Probabilidade: conceitos e aplicações.
Disciplina ofertada ao curso de Biologia a distância da UFRN.
 1. Bioestatística. 2. Hipóteses. 3. Probabilidade. I. Medeiros, Henrique Rocha de. II. Título. 
CDU 311
 Z38b
Sumário
Apresentação Institucional 5
Aula 1 O que é Bioestatística 7
Aula 2 Como transformar dados em informações 25
Aula 3 Descrevendo Sistemas 43
Aula 4 Elaborando hipóteses 65
Aula 5 Testando hipóteses 83
Aula 6 Análise de variância 101
Aula 7 Correlacionando informações 129
Aula 8 Análise de regressão 147
Aula 9 Entendendo os números índices e suas aplicações 173
Aula 10 Probabilidade:conceitos e aplicações 193
5
Apresentação Institucional
A Secretaria de Educação a Distância – SEDIS da Universidade Federal do Rio Grande do Norte – UFRN, desde 2005, vem atuando como fomentadora, no âmbito local, das Políticas Nacionais de Educação a Distância em parceira com a Secretaria de Educação 
a Distância – SEED, o Ministério da Educação – MEC e a Universidade Aberta do Brasil – 
UAB/CAPES. Duas linhas de atuação têm caracterizado o esforço em EaD desta instituição: a 
primeira está voltada para a Formação Continuada de Professores do Ensino Básico, sendo 
implementados cursos de licenciatura e pós-graduação lato e stricto sensu; a segunda volta-se 
para a Formação de Gestores Públicos, através da oferta de bacharelados e especializações 
em Administração Pública e Administração Pública Municipal.
Para dar suporte à oferta dos cursos de EaD, a Sedis tem disponibilizado um conjunto de 
meios didáticos e pedagógicos, dentre os quais se destacam os materiais impressos que são 
elaborados por disciplinas, utilizando linguagem e projeto gráfi co para atender às necessidades 
de um aluno que aprende a distância. O conteúdo é elaborado por profi ssionais qualifi cados e 
que têm experiência relevante na área, com o apoio de uma equipe multidisciplinar. O material 
impresso é a referência primária para o aluno, sendo indicadas outras mídias, como videoaulas, 
livros, textos, fi lmes, videoconferências, materiais digitais e interativos e webconferências, que 
possibilitam ampliar os conteúdos e a interação entre os sujeitos do processo de aprendizagem.
Assim, a UFRN através da SEDIS se integra o grupo de instituições que assumiram o 
desafi o de contribuir com a formação desse “capital” humano e incorporou a EaD como moda-
lidade capaz de superar as barreiras espaciais e políticas que tornaram cada vez mais seleto o 
acesso à graduação e à pós-graduação no Brasil. No Rio Grande do Norte, a UFRN está presente 
em polos presenciais de apoio localizados nas mais diferentes regiões, ofertando cursos de 
graduação, aperfeiçoamento, especialização e mestrado, interiorizando e tornando o Ensino 
Superior uma realidade que contribui para diminuir as diferenças regionais e o conhecimento 
uma possibilidade concreta para o desenvolvimento local.
Nesse sentido, este material que você recebe é resultado de um investimento intelectual 
e econômico assumido por diversas instituições que se comprometeram com a Educação e 
com a reversão da seletividade do espaço quanto ao acesso e ao consumo do saber E REFLE-
TE O COMPROMISSO DA SEDIS/UFRN COM A EDUCAÇÃO A DISTÂNCIA como modalidade 
estratégica para a melhoria dos indicadores educacionais no RN e no Brasil. 
SECRETARIA DE EDUCAÇÃO A DISTÂNCIA 
SEDIS/UFRN
O que é Bioestatística
1
Aula
Aula 1 Bioestatística 9
Apresentação
Nesta primeira aula, apresentaremos um breve histórico da Estatística, suas subdivisões e como podemos utilizá-la no ramo das Ciências Biológicas. Num segundo momento, abordaremos o conceito de Bioestatística e suas aplicações, partindo para a retomada de 
alguns conceitos vistos na disciplina de Matemática e Realidade. Essa retomada é essencial não 
somente para a compreensão das aulas seguintes, mas também da disciplina como um todo. 
Para compreender os assuntos que serão abordados nesta aula, é necessário que você 
leia atentamente os conceitos, que sempre serão acompanhados de exemplos aplicados às 
Ciências Biológicas.
Ao fi nal de cada tópico principal haverá uma série de exercícios propostos para você 
resolver, além de exercícios já resolvidos. No fi nal da aula, haverá uma autoavaliação para que 
você avalie a sua aprendizagem. Tenha sempre seu caderno em mãos para que você anote 
suas dúvidas e as encaminhe para nós o mais rápido possível.
Objetivos
Conhecer a história da Estatística e identifi car as situações 
onde ela pode ser aplicada.
Conhecer e distinguir as diversas fases do método 
estatístico.
Defi nir o que é Bioestatística. 
Compreender os conceitos fundamentais para 
o entendimento e aplicação da Bioestatística.
Distinguir as técnicas de amostragem para a escolha de 
elementos que irão compor uma amostra. 
1
2
3
4
5
Aula 1 Bioestatística 10
O que é Estatística?
Para alguns, responder a essa pergunta é muito fácil, mas para outros, que nunca ouviram 
falar em estatística, pode parecer algo impossível de entendimento. Mas, mesmo sem saber, 
você já deve ter utilizado a estatística no seu cotidiano. Vamos conferir?
Com a chegada da Copa do Mundo de 2010, muitas lojas irão fazer promoções de 
televisores. Você, consumidor, quer comprar uma TV e para saber qual delas tem o melhor 
preço,inicia sua pesquisa de loja em loja, anotando os valores. Depois, em casa, compara os 
preços, seleciona aquele mais em conta e se dirige até a loja para efetuar a sua compra. Nessa 
situação, a estatística esteve presente quando você coletou os dados, extraiu as informações 
a partir da sua pesquisa e tomou as decisões baseadas na sua coleta de dados. 
Mas, além do cotidiano, a Estatística pode estar presente em qualquer disciplina de 
qualquer curso, inclusive do curso de Ciências Biológicas. 
Mas você deve estar se perguntando: 
“Em quais disciplinas e como?”
Bem, se o professor da disciplina de Biodiversidade pedir para que você faça um levantamento de quais as espécies animais habitantes da caatinga estão ameaçadas de extinção, você estará utilizando um dos princípios da Estatística, ou melhor, do método 
estatístico (que veremos a seguir), que é o da coleta de dados. Mas se ele for mais além, e pedir 
para que você ordene quais os animais mais ameaçados de extinção, aí você terá que fazer 
um levantamento mais aprofundado, checar outras fontes, organizar e interpretar os dados e 
apresentar os resultados ao professor. Nesse momento você ainda estará utilizando a estatística. 
Percebeu como a Estatística toma parte do nosso cotidiano e das disciplinas do Curso 
de Ciências Biológicas, por exemplo? 
A Estatística tem se mostrado um instrumento extremamente útil na organização 
e interpretação dos dados, auxiliando na tomada de decisões, além de proporcionar uma 
avaliação adequada de uma determinada situação, seja ela de origem biológica ou não.
Aula 1 Bioestatística 11
O papel da Estatística quando estabelecida como ciência
Pois bem, inicialmente a Estatística se preocupava em enumerar coisas e pessoas para 
a avaliação das riquezas e cadastramento das propriedades de uma determinada cidade. Isso 
aconteceu há milhares de anos atrás e atualmente acontece no Brasil a cada 10 anos.
Você já deve ter recebido em sua casa um funcionário do Instituto Brasileiro de Geografi a 
e Estatística (IBGE), munido de um questionário para avaliar sua condição de vida. Pois é esse 
questionário, chamado de CENSO, que nos permite adquirir informações sobre cada família 
brasileira, e já era realizado em civilizações muito antigas como a do Império Romano, da China 
e do antigo Egito em 1000 a.C. 
Hoje, com o passar dos anos, podemos constatar que o papel da Estatística vai além de 
organizar e descrever fatos e/ou gerar informações analisando um conjunto de dados coletados, 
mas também auxiliar no:
1) Planejamento, auxiliando na escolha das situações experimentais e na determinação da 
quantidade de indivíduos a serem examinados.
2) Na análise dos dados, indicando técnicas para resumir e apresentar as informações, bem 
como para comparar as situações experimentais ou não.
3) Na elaboração das conclusões, utilizando os vários métodos estatísticos que permitem 
generalizar a partir dos resultados obtidos. 
Fonte: <http://matematiques.sites.uol.com.br/pereirafreitas/1.1.2metodoestati
stico.htm>. Acesso em: 25 fev. 2010.
Estatística é a ciência que tem como objetivo orientar a coleta, o resumo, a 
apresentação, a análise e a interpretação dos dados coletados. E para isso, ela 
se apóia na utilização do método estatístico. O método estatístico é um processo 
para se obter, apresentar e analisar características ou valores numéricos para uma 
melhor tomada de decisão em situações de incerteza.
Aula 1 Bioestatística 12
O método estatístico apresenta as seguintes fases:
Defi nição do problema: Podemos ilustrar essa primeira fase do método estatístico com a 
pergunta: O que pesquisar? Nessa etapa você deve conhecer o problema a ser pesquisado, 
fazer as perguntas às quais quer que sejam respondidas com a sua pesquisa. Por exemplo:
 A altura média dos alunos de cada semestre do Curso de Ciências Biológicas.
Planejamento da pesquisa: Essa segunda etapa pode ser traduzida com a pergunta: Como 
pesquisar? Assim, é essencial que você tenha clareza de como a pesquisa será feita. Deve-se 
também defi nir se você utilizará a população ou apenas uma amostra dessa população, que 
estudaremos logo a seguir. Utilizando o nosso exemplo acima, devemos planejar se vamos 
estudar a altura de todos os alunos do Curso de Ciências Biológicas ou somente dos alunos 
do primeiro semestre, ou somente a altura dos homens.
Coleta dos dados: Podemos perguntar: O que coletar? Nessa etapa você deve obter as 
informações de acordo com o que foi planejado na etapa anterior. Se o objetivo é saber a altura 
dos alunos de cada semestre do Curso de Ciências Biológicas, você deve iniciar as medições de 
cada um dos alunos, anotando os valores obtidos, como exemplifi cados na tabela 1.
Tabela 1 – Altura, em metros, dos alunos do 1º, 2º e 3º semestres do Curso de Ciências Biológicas
Altura dos alunos
do semestre 1 (m)
Altura dos alunos
do semestre 2 (m)
Altura dos alunos
do semestre 3 (m)
1,54 1,67 1,65
1,74 1,87 1,54
1,82 1,88 1,64
1,9 1,89 1,56
1,54 1,78 1,75
3,543,54 1,89 1,56
1,75 1,9 1,6
1,87 1,76 1,64
1,96 1,94 1,65
1,72 1,95 1,6
Alunos do
semestre 1
2
1,9
1,8
1,7
1,6
1,5
1,4
Al
tu
ra
 m
éd
ia
 (m
)
Alunos do
semestre 2
Alunos do
semestre 3
Aula 1 Bioestatística 13
Crítica dos dados: Essa fase é essencial para saber como anda a sua pesquisa. Pode-se lançar 
a seguinte pergunta: Os dados estão coerentes? Você deve observar criticamente os dados 
coletados, para que, se detectado algum erro, este não seja repetido nas coletas futuras. 
Se você está medindo as alturas dos alunos de cada semestre do Curso de Ciências Biológicas 
e encontra uma medida de 3,54m, conforme apresentado em destaque na Tabela 1, pode ter 
certeza que nessa hora, você cometeu algum erro.
Apresentação: Nessa etapa você deverá apresentar os dados coletados após eles serem 
organizados. Uma vez os dados coletados, eles devem ser apresentados, seja através de 
tabelas ou gráfi cos, conforme apresentado no Gráfi co 1, ou por meio de um texto escrito. 
Gráfi co 1 – Altura média (m) dos alunos do primeiro, segundo e terceiro semestre do Curso de Ciências Biológicas
Análise e interpretação dos dados: Essa é a etapa fi nal do método estatístico, mas nem por 
isso, a menos importante. Nessa fase você deve descrever e analisar os dados pesquisados, e 
chegar a uma conclusão, ou seja, responder a sua pergunta inicial. No caso do nosso exemplo, 
constatar qual a altura média dos alunos de cada semestre do Curso de Ciências Biológicas.
As fases do método estatístico, que incluem desde a defi nição do problema até 
a apresentação dos dados, denominam-se Estatística Descritiva, e a análise e 
interpretação dos dados constitui a Estatística Inferencial, que ajuda a concluir 
sobre um conjunto maior de dados (populações) quando apenas parte desse 
conjunto (as amostras) foi estudada. 
Atividade 1
Aula 1 Bioestatística 14
Com base no que você viu até agora sobre o método estatístico, faça uma pesquisa 
na sua casa ou comunidade sobre algo que você gostaria de saber (número de 
pessoas da comunidade, número de pessoas com olhos claros, tipo de árvore da 
sua região, dentre outros) e, à medida que você for organizando sua pesquisa, 
explicite quais as fases do método estatístico que você utilizou.
1
2
Atividade 2
Aula 1 Bioestatística 15
Mas você deve estar se
perguntando: “E a Bioestatística?”
Agora que você já sabe o que é Estatística, você se arriscaria a elaborar uma defi nição para 
Bioestatística? É simples! Considera-se Bioestatística a aplicação dos métodos estatísticos 
para solucionar problemas biológicos.
Pode parecer difícil para um aluno que não tem gosto pela Matemática aprender 
Bioestatística. Mas ele deve adquirir algum conhecimento sobre essa disciplina, pois só assim 
poderá ter um ponto de vista objetivo sobre as técnicas do método científi co empregado nas suas 
pesquisas e saberá avaliar o grau de importância da informação fornecida por essas técnicas.
Aprender Bioestatística também pode proporcionar quevocê se familiarize com alguns 
conceitos mais utilizados na área. Alguns termos do vocabulário comum têm signifi cado técnico 
e específi co quando usados em Bioestatística. E é importante conhecê-los.
Enfi m, sem despender muito tempo com cálculos e demonstrações, pretendemos que 
você adquira os conhecimentos sufi cientes para tornar-se um usuário competente das técnicas 
estatísticas mais comuns que podem ser aplicadas nas Ciências Biológicas. 
Com base no que foi apresentado até aqui, escreva o que você entendeu sobre o que 
é Bioestatística e qual a sua importância.
Procure, no seu cotidiano, duas utilizações da Estatística.
Aula 1 Bioestatística 16
Retomando alguns
conceitos fundamentais
Alguns conceitos fundamentais para o entendimento e aplicação da Bioestatística você 
já viu na disciplina de Matemática e Realidade (Aula 2 – A Estatística: do senso comum ao 
conhecimento científi co. Vamos retomá-los?
Unidade experimental ou Unidade de observação
É a menor unidade a fornecer uma informação. Podem ser pessoas, animais, plantas, 
objetos. São aqueles indivíduos submetidos a uma situação de experimento controlado, como 
por exemplo, ratos de laboratório colocados em um labirinto para estudar o comportamento 
antes e após a administração de uma droga.
População
É o conjunto de “todos” os elementos (pessoas, animais, plantas, objetos) que 
apresentam, pelo menos, uma característica comum e que pode ser observada, como por 
exemplo, a população de árvores de mandacaru do sertão do Rio Grande do Norte. 
Amostra
É qualquer parte retirada de uma população estatística, ou seja, é qualquer subconjunto 
de uma população. Árvores de mandacaru do município de Currais Novos (RN).
Dados
São as informações numéricas ou não obtidas de uma unidade experimental ou de observação. 
Quando se afi rma que as árvores de mandacaru têm 21 espinhos, os dados são “21 espinhos”.
Variável
É alguma característica que pode ser observada (contada ou medida) em uma população 
ou em uma amostra. O número de espinhos do mandacaru, a idade de uma pessoa e seus 
1
Atividade 3
Aula 1 Bioestatística 17
hábitos quanto ao fumo, a estatura de um jogador de basquete, a cor da pelagem dos animais, 
o tipo de folha de uma planta constituem exemplos de variáveis.
Entretanto, as variáveis podem ser classifi cadas em quantitativas e qualitativas:
1) Variáveis quantitativas: são aquelas cujos dados são valores numéricos, como por exemplo, 
a estatura das pessoas, o número de sementes de uma vagem, o nível de colesterol no 
sangue, o número de espinhos do mandacaru. As variáveis quantitativas podem ainda ser:
a) Variáveis quantitativas discretas: são aquelas em que os dados podem apresentar 
somente determinados valores, no geral, números inteiros, como por exemplo, o número 
de fi lhos de um casal, o número de patas de um cavalo e o número de pétalas das fl ores. 
É impossível dizer que um casal tem 2,3 fi lhos.
b) Variáveis quantitativas contínuas: são aquelas em que os dados podem apresentar 
qualquer valor dentro de um intervalo de variação possível, como por exemplo, o peso de 
uma pessoa (56,3 kg) e a altura de uma árvore (1,5 m). 
2) Variáveis qualitativas: são aquelas que fornecem dados de natureza não numérica, ou 
seja, fornecem qualidade à variável, como por exemplo, a cor da semente das ervilhas, a 
raça ou o sexo do animal. As variáveis qualitativas podem ser:
a) Variáveis qualitativas nominais: os níveis de respostas não admitem nenhuma ordem, 
diferenciando uma categoria da outra, apenas pelo nome, por exemplo, o sexo dos animais, 
ou é fêmea ou macho.
b) Variáveis qualitativas ordinais: os níveis de respostas admitem ordem. Não é só 
possível identifi car diferentes categorias, mas também reconhecer graus de intensidade 
entre elas, possibilitando a sua ordenação. A cor da fl or do mandacaru, que pode ser 
de branca à vermelha; o nível de intensidade de dor, que pode ser fraca, média, forte e 
muito forte. 
Explique com suas palavras o que você entendeu por:
a) População:
2
Aula 1 Bioestatística 18
b) Amostra:
c) Variável:
Classifi que as variáveis abaixo:
a) Cor do cabelo:
b) Número de patas de um coelho:
c) Número de células brancas no sangue:
d) Tipo sanguíneo A, B, AB e O:
e) Tipo de folha de uma árvore:
f) Número de colônias de E. coli existente na água mineral:
Aula 1 Bioestatística 19
Utilizando as
amostras de uma população
Os experimentos são realizados com amostras de uma população e não com toda a população e podemos apresentar duas razões para isso: A primeira, porque as populações fi nitas só podem ser estudadas através de amostras, como por exemplo, 
um conjunto de alunos de uma escola em determinando ano, e a segunda, porque essas 
populações são muito grandes. Imagine sabermos o tipo sanguíneo mais frequente dos 
brasileiros? Levaríamos muito tempo e teríamos muito trabalho para realizarmos esses testes. 
Fonte: <martabolshaw.blogspot.com/2008_03_01_archive.html>. Acesso em: 25 fev. 2010.
E se pegássemos apenas uma amostra dessa população? O estudo cuidadoso de uma 
amostra tem mais valor científi co do que o estudo de toda a população. Por exemplo, para 
estudar o efeito do fl úor sobre a prevenção da cárie em crianças, é melhor submeter uma 
amostra de crianças a exames periódicos minuciosos, do que examinar rapidamente todas as 
crianças antes e determinado tempo após o uso do fl úor. Dessa maneira não seria mais fácil, 
e ao mesmo tempo constituiria de uma metodologia correta?
Aula 1 Bioestatística 20
Como fazer para
escolher a amostra correta?
Quando trabalhamos com uma amostra da população, utilizamos as técnicas de 
amostragem, isto é, escolhemos o procedimento que vamos adotar para escolher os elementos 
que irão compor a amostra.
Amostra casual simples
É composta por elementos retirados ao acaso da população. Todo elemento da população 
tem igual probabilidade de ser escolhido para compor a amostra. Vamos ver como?
Vamos supor que você esteja no laboratório de biologia vegetal e quer realizar um 
experimento para avaliar os efeitos de diferentes quantidades de cálcio (1mg, 3mg e 5mg) 
no crescimento da planta. Para a realização desse experimento temos 15 vasos de plantas, 
nas mesmas condições de umidade, luz, temperatura, altura da planta e estado nutricional.
A pergunta é: Quais vasos escolher para receber 1mg, 3mg e 5mg de cálcio? 
Nesse caso, fazemos um sorteio dos vasos, para que todos tenham a mesma chance de serem 
escolhidos para receber diferentes quantidades de cálcio.
Atividade 4
1
2
Aula 1 Bioestatística 21
Amostra sistemática
Os elementos são escolhidos por um sistema. Se no exemplo acima, você escolhesse 
somente os vasos listrados de preto, estaria organizando uma amostragem sistemática. 
Amostra estratifi cada
É composta por todos os elementos originados de todos os estratos da população. 
Por exemplo: A população de Natal (RN) é composta por crianças, jovens, adultos e idosos. 
Uma amostra estratifi cada tem que ter uma representação na mesma proporção das quatro 
categorias acima citadas, ou seja, 10 crianças, 10 jovens, 10 adultos e 10 idosos.
Amostra de conveniência
É formada por elementos que o pesquisador reuniu somente porque dispunha deles. 
Se você utilizar todos os vasos de plantas citados no primeiro exemplo, independente de um 
critério, esta amostra constituirá numa amostra de conveniência. Entretanto, você deve ter 
muito cuidado ao utilizar esse tipo de amostra, pois os dados podem ser tendenciosos, não 
revelando a realidade da situação.
Responda às questões abaixo de acordo com o que você entendeu sobre amostras e 
seus tipos.
Um pesquisador tem dez gaiolas. Cada uma delas contém seis ratos. Como esse 
pesquisador pode selecionar dez ratos para compor sua amostra?
Dada uma população de quarenta cajueiros, descreva uma forma de obter uma 
amostra casual simples composta por seis cajueiros.
3
Aula 1 Bioestatística 22
Organize uma lista com dez nomes de pessoas em ordem alfabética. Depoisdescreva 
uma forma de obter uma amostra sistemática de cinco nomes.
Resumo
Nesta primeira aula, você viu um breve histórico da Estatística e como podemos 
aplicá-la nas Ciências Biológicas. Estudou que, com o passar dos anos, o papel 
da Estatística se modifi cou, indo além de organizar e descrever fatos e/ou 
gerar informações. Você pode perceber que ela vem auxiliando na escolha das 
situações experimentais, na determinação da quantidade de indivíduos a serem 
examinados, na análise dos dados, indicando técnicas para resumir e apresentar 
as informações e na elaboração das conclusões. Você aprendeu a defi nição 
de método estatístico e todas as suas fases, desde a defi nição do problema, 
passando pelo planejamento, coleta e crítica dos dados, até a apresentação, 
análise e interpretação dos dados. Estudou também a Bioestatística, ou seja, 
a aplicação da Estatística nas Ciências Biológicas, e retomou alguns conceitos 
essenciais para o seu entendimento e aplicação, como a defi nição de população, 
amostra e variável. Por fi m, viu que as técnicas de amostragem constituem um 
conjunto de procedimentos que vamos adotar para escolher os elementos que 
irão compor a amostra que queremos analisar.
Autoavaliação
Nesta aula, você deve ter percebido a importância da Estatística e da aplicação dos 
métodos estatísticos para solucionar problemas biológicos. Feito isto, verifi que se você 
consegue responder, de maneira resumida, às seguintes perguntas: 
1
2
Aula 1 Bioestatística 23
Qual a fi nalidade e as fases do método estatístico?
Conceitue população e amostra, exemplifi cando.
Se você conseguiu respondê-las, suas respostas certamente contêm os elementos 
básicos que você deverá ter apreendido deste conteúdo. Caso contrário, retome os textos e 
resolva as questões até que tais conceitos se estabeleçam para você como um conhecimento 
bem estruturado.
Referências
CALLEGARI-JACQUES, Sídia M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2003.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE. Disponível em: <www.ibge.
gov.br>. Acesso em: 25 fev. 2010.
LOPES, Paulo Afonso. Probabilidades e estatística. Rio de Janeiro: Ed. Reichman e Affonso 
Editores, 1999.
SAMPAIO, Ivan Barbosa Machado. Estatística aplicada à experimentação animal. Belo 
Horizonte: Ed. Fundação de Ensino e Pesquisa em Medicina Veterinária e Zootecnia, 1998.
VIEIRA, Sonia. Introdução à bioestatística. Rio de Janeiro: Campus, 1980.
Aula 1 Bioestatística 24
Anotações
Como transformar
dados em informações
2
Aula
1
2
3
4
Aula 2 Bioestatística 27
Apresentação 
Nesta aula, estudaremos o conceito de dados e banco de dados. Veremos como criar 
um banco de dados e, posteriormente, a transformar os dados em informações. Inicialmente 
faremos uma retomada dos principais conceitos vistos na Aula 1 – O que é Bioestatística – para 
depois iniciarmos a apresentação dos novos conceitos sobre os dados. 
Conceituado dados e banco de dados, estudaremos as diferenças entre dados e 
informações e aprenderemos a planejar uma coleta de dados. Por fi m, analisaremos os dados 
coletados para que eles sejam apresentados em forma de tabelas, fi guras ou gráfi cos, de 
acordo com o objetivo da pesquisa.
Tenha em mãos o seu material da Disciplina de Matemática e Realidade, pois faremos a 
revisão utilizando as Aulas 3 (A natureza dos dados estatísticos e sua organização) e 4 (Gráfi cos 
estatísticos: uma síntese dos dados).
Bom estudo!
Objetivos
Conceituar dados e banco de dados. 
Distinguir a diferença entre dados e informações.
Estabelecer critérios para fazer uma coleta de dados.
Analisar os dados coletados.
Aula 2 Bioestatística28
Retomando alguns
conceitos da Aula 1
Antes de iniciarmos a nossa aula, é conveniente você relembrar o que é uma unidade 
experimental, uma variável e como esta pode ser classifi cada (Aula 1– O que é Bioestatística). 
Vamos defi nir o que são os dados? 
Dados são defi nidos como informações numéricas (contínuas ou discretas) ou qualitativas, 
obtidas de uma unidade experimental ou de observação. 
No exemplo da Aula 1, quando se afi rma que as árvores de mandacaru têm 21 espinhos, 
os dados são “21 espinhos”. Podemos também citar o exemplo do consumidor que vai a várias 
lojas para fazer uma pesquisa de preço dos televisores. Nesse caso, os dados são os preços 
das TVs que ele pesquisou.
Se compararmos os exemplos acima, podemos verifi car que os dados podem ainda ser 
classifi cados em:
Dados isolados, como é o caso dos 21 espinhos de mandacaru, obtidos somente de 
uma planta.
Conjunto de dados, como é o caso dos diversos valores pesquisados pelo consumidor 
antes de comprar a televisão. Nesse caso, para que esses dados transmitam alguma informação, 
eles devem ser organizados. 
Como organizar os dados?
Organizar o dado “21 espinhos de mandacaru” é relativamente fácil, sendo possível até 
anotar em um papel e guardar. Pronto, simples assim; desde que eu só queira estudar uma planta.
Mas, qual a relevância deste dado (21 espinhos), se o objetivo do meu trabalho é 
determinar o número médio de espinhos nos mandacarus em um jardim que tem 20 plantas? 
Observe que, nesse caso, teremos que traçar uma estratégia de planejamento e 
organização de trabalho, de modo que se possa ao fi nal:
1) Ter contado ou estimado o número médio de espinhos de todas as plantas.
Unidade Experimetal
É a menor unidade a 
fornecer uma informação. 
Podem ser pessoas, 
animais, plantas, objetos.
Variável 
É alguma característica 
que pode ser observada 
(contada ou medida) em 
uma população ou em 
uma  amostra.
Classifi cação
das variáveis
Quantitativa (discreta ou 
contínua) e qualitativa 
(nominal ou ordinal).
Atividade 1
1
2
Aula 2 Bioestatística 29
2) Conseguir lembrar ou guardar esses números, a fi m de que, se outro indivíduo precisar 
recomeçar ou continuar o trabalho, possa repetir o mesmo e chegar a resultados semelhantes. 
Nesse momento, quando nos deparamos com uma quantidade maior de dados a serem 
coletados para posterior análise, precisamos organizá-los em um banco de dados.
Diferencie dados e banco de dados.
Cite alguns exemplos de dados quantitativos e qualitativos que fazem parte do 
seu cotidiano.
Aula 2 Bioestatística30
Banco de dados
Um banco de dados é um conjunto de registros (de números ou variáveis qualitativas) 
com uma estrutura regular que permite a reorganização e inserção desses registros de 
forma sistemática, com a fi nalidade de se gerar informações. 
Pode ser a agenda do seu telefone celular, a lista telefônica, o seu caderno de anotações 
e até um conjunto de dados organizados em uma planilha de Excel.
Sim, isso mesmo! Mas desde que esses dados sejam organizados de forma sistemática. 
Veja o exemplo a seguir:
Situação problema 1: Como posso fazer a identifi cação das principais espécies 
vegetais de uma área de caatinga na reserva fl orestal do meu município?
Para resolver esse problema, devemos primeiro deixar bem claro:
1) Qual o objetivo da pesquisa?
Identifi car as principais espécies vegetais numa determinada área de reserva 
fl orestal do município onde moro. 
2) O que fazer para alcançar esse objetivo?
Identifi car e contar o número de individuos presentes em cada uma das áreas 
de caatinga do município. Note que no objetivo estão “espécies vegetais”, isto 
inclui árvores, arbustos, cactáceas, gramíneas e leguminosas, independente de 
seu tamanho. 
Feito isso, você pode partir para o próximo passo:
3) Identifi car e classifi car as variáveis a serem estudadas: 
As variáveis são as espécies vegetais. Neste exemplo, trata-se de uma variável 
numérica e discreta, pois serão dados de contagem (Caso haja dúvidas, volte para 
a Aula 1 – O que é Bioestatística – e leia a defi nição de variáveis e seus tipos). 
Agora, como posso defi nir o método de amostragem já que é impossível contar 
todas as espécies vegetais da área? Para isso devemos fazer a seguinte pergunta:
4) Quantas amostras eu vou precisar colher, parafazer essa determinação? 
Existem vários métodos para fazer essa determinação, neste caso o mais 
recomendado é fazer uma revisão de literatura e procurar identifi car o método 
mais adequado. Para este caso específi co do exemplo, podemos defi nir que 
Forma sistemática
Forma organizada de 
dispor os dados, seguindo 
algum critério. Por 
exemplo: ao arrumar suas 
camisetas no armário você 
as ordena pela cor.
Parcela de 4m 2 
contendo todas as 
plantas a serem 
contadas
L 1 L 2 L 3 L 4
L 5 L 6 L 7 L 8
L 9 L 10 L 11 L 12
Aula 2 Bioestatística 31
Figura 1 – Área experimental e respectiva parcela de 4m2
Na Figura 1, em cada subunidade será reservada uma parcela com 4m 2 de área 
para identifi cação e contagem do número de plantas de caatinga.
Depois de coletados os dados, veja, na tabela a seguir, como fi cou a sua organização.
Tabela 1 – Levantamento fi tossociológico de uma área de caatinga
Ordem Nome Popular Espécie Número de indivíduos
1 Angico Piptadenia macrocarpa 4
2 Bambural Hyptis suaveolans (L.) Poit 1375
3 Carrapicho Agulha Bidens sp 37
4 Catingueira Caesalpinia pyramidalis Tul 2
5 Jitirana Merremia aegyptia L. 4
6 Malva Sida cordifolia L. 135
7 Manda Pulão Croton sp. 249
8 Marmeleiro Croton hemiargyreus 8
9 Mata Pasto Senna obtusifolia 13
10 Melosa Ruellia asperula 54
11 Milhã Brachiaria plantaginea 90
12 Mofumbo Combretum leprosum Mart. 13
13 Mororó Bauhinia cheilantha 2
14 Pau Branco Auxemma oncocalyx 4
15 Sabiá Mimosa caesalpiniifolia 1
16 Tiririca Cyperus sp 3
17 Urtiga Fleurya aestuans L. 11
Viu como é fácil? Agora, que tal extrair uma informação desse conjunto de 
dados? Identifi que a espécie vegetal que apresenta o maior número de indivíduos 
(plantas) na área amostrada.
serão avaliados 12 locais diferentes (L1, L2, L3, L4, L5, ... ,L12) e em cada um 
destes locais serão coletadas amostras de parcelas de 4m 2 (Figura 1). Em cada 
parcela, todas as plantas encontradas serão identifi cadas pelo nome comum e 
o científi co e contadas. 
Atividade 2
Aula 2 Bioestatística32
Vamos tomar algumas medidas de biometria com seus conhecidos? Selecione um grupo 
de 25 indivíduos (podem ser pessoas da sua família, amigos, alunos, colegas de trabalho, da 
igreja e/ou de prática de esportes) e organize uma tabela com os seguintes dados: primeiro 
nome, idade, sexo, altura e peso de cada um deles, utilizando a tabela a seguir.
Primeiro nome Idade Sexo Altura Peso
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Biometria
Estudo das características 
biológicas quantitativas de 
uma população.
Aula 2 Bioestatística 33
Diferenciando os conceitos: 
dados x informações
Para discutir o conceito de informações, vamos partir da seguinte situação: 
Uma lista telefônica (seja de celular ou papel) é um conjunto de dados, organizados em 
função de alguma variável como, por exemplo, o nome e/ou endereço. Quando você precisa 
ligar para uma pessoa, cujo telefone não se lembra, o que você faz? Certamente, uma pesquisa/
análise no conjunto de dados da lista a fi m de obter a informação desejada: o telefone da pessoa. 
Analisando essa situação, podemos defi nir informação como: o conhecimento obtido 
através da interpretação do signifi cado dos dados (HOUAISS; VILLAR; FRANCO, 2001). 
Aliás, um dicionário da língua portuguesa nada mais é que um conjunto de dados, organizados 
de forma sistemática (normalmente em ordem alfabética), no qual podemos obter informações 
sobre a ortografi a correta, signifi cados, sinônimos e antônimos de palavras.
Uma curiosidade...
Se, na minha lista telefônica, eu não encontrar o número de telefone da pessoa 
que procuro ou se ele não for o correto, ainda assim isso é uma informação? 
Sim, só que nesse caso o seu banco de dados (agenda do telefone) não serviu 
para responder o seu questionamento. Por esse motivo, a informação obtida foi: 
‘você não tem o número do telefone da pessoa’. 
Neste caso, se realmente desejar falar com ela, você vai precisar conseguir a 
informação correta em outra fonte de dados, que pode ser a lista telefônica, um 
colega, etc. 
Nessa situação é importante para lembrar que nem sempre o nosso conjunto 
de dados vai permitir obter a informação necessária e/ou correta. São vários os 
fatores que podem resultar nesse problema, dentre eles podemos citar problemas 
na amostragem (número insufi ciente e/ou amostras tendenciosas que conduzem 
a conclusões inverídicas) e erros na coleta e/ou no processamento dos dados.
Atividade 3
Aula 2 Bioestatística34
Na tabela construída na Atividade 2, conte o número de pessoas do sexo masculino e do 
feminino que tem mais de 1,55m de altura e pesa mais que 68kg.
Planejando a coleta de dados
Lembra que agora a pouco vimos que há vários fatores que podem resultar no fato de 
um dado não fornecer nenhuma informação ou fornecer informações erradas? Esse fato foi 
exemplifi cado pelo caso de não acharmos o telefone procurado ou acharmos o telefone e este 
estar errado.
Para que isso não ocorra, é importante planejar e traçar uma estratégia para realizar 
a coleta de dados. Essa estratégia de planejamento da Coleta de Dados é composta por:
Observação dos ítens do método estatístico (mencionada na Aula 1): Nessa primeira 
fase você deve seguir as etapas do método estatístico, que são: (1) Identifi cação do problema 
e (2) Formulação de hipóteses. Conhecendo esses dois ítens, entre outras coisas, é possível:
  Identifi car e classifi car as variáveis adequadas e necessárias para a pesquisa. Isso é 
importante para que você possa organizar as tabelas em função do tipo de resposta 
esperada (ex.: sim ou não; presente ou ausente; espaço para número ou texto) para cada 
variável estudada.
  Traçar uma estratégia de ação que permita coletar, organizar e processar os dados de 
forma precisa e correta. Assim, pode-se evitar desperdício de tempo anotanto informações 
que não serão úteis e adequando as condições para coletar os dados e a necessidade do 
trabalho. Desse modo, pode-se evitar erros na anotação ou processamento dos dados. 
Um exemplo disso pôde ser observado na realização do censo agropecuário 2006, no 
qual os entrevistadores utilizaram “palmtops” para coletar os dados. Assim, diminui a chance 
de ocorrer erros durante o processamento dos questionários, por erros de leitura. Entretanto, 
os erros de coleta de dados podem acontecer na hora da anotação dos questionários por 
resposta imprecisa do entrevistado. 
PLANEJAMENTO DA COLETA DE DADOS
Observação das fases do método estatístico
ETAPA OPERACIONAL
• Determinar o número de pessoas da equipe
• Realizar treinamento para a coleta dos dados
• Providenciar material necessário
• Organizar o trabaho no local da coleta
• Verificar o modo de armazenamento e
 transporte do material coletado
Identificação do 
problema
Formulação de 
hipóteses
Aula 2 Bioestatística 35
Além disto, é importante antes de sair para coletar os dados, verifi car:
  Quantas pessoas serão necessárias para realizar o trabalho.
  Se existe material de coleta disponível (por exemplo: lápis e papel, frascos para armazenar 
amostras etc.) para todo o trabalho. 
  Se é necessário realizar treinamento antes de iniciar o trabalho.
  Como as amostras coletadas podem ser armazenadas e transportadas.
  Se a amostra utilizada é representativa da população.
  Como será realizado o trabalho de coleta.
Tendo como exemplo a Tabela 1, para fazer a coleta de dados de quais as espécies vegetais 
e o número de plantas em cada parcela, precisamos de: fi ta métrica para demarcar o perímetro 
da área amostral; lápis e papel para fazer anotar o nome comum (popular), o científi co e 
a quantidade de indivíduos de cada espécie. Além disso, para esse trabalho específi co é 
importante levar na equipe uma pessoa que conheça a fl ora regional e saiba identidicar as 
plantas. Em caso de dúvidas, é interessante também ter recipientes adequados para coletar 
amostras e levar para o biotério, a fi m de fazer identificação correta da espécie.
A Figura 2 reúne as principais etapas do planejamento da coleta de dados.
Figura 2 – Principais etapas do planejamento da coleta de dados
Fonte: Henrique Rocha de Medeiros
Atividade 4
Aula 2 Bioestatística36
Elabore um plano para a coleta de dados idade, peso e altura de todas as pessoas da 
cidade onde você mora. 
Aula 2 Bioestatística 37
A opção de organizar os dados em linhas ou colunas vai depender da preferência defi nida 
antes de iniciar o trabalho de coleta. Todavia, esta deve sempre possibilitar a soma ou contagem 
de dados correspondentes à mesma variável seguindo uma única sequência de linhas ou colunas. 
Além disso, a sistematização das informações em planilhas facilita ainda a elaboração 
de tabelas (ver Tabela 1 – Levantamento fi tossociológico de uma área de caatinga) e gráfi cos 
para análise dos dados. 
Há vários tipos de gráfi cos, e a escolha de qual utilizar vai depender do tipo de dados 
existentes, da necessidade e familiaridade com as informações. Utilizando os dados do nosso 
exemplo, escolhemos apresentá-los em forma de gráfi co de barras, mais adequado para o 
tipo de dados que temos (Figura 4).
Análise gráfi ca de conjunto de dados
Como dito anteriormente, um conjunto de dados só poderá ser transformado em 
informação se, com ele, for possível realizar alguma análise e interpretação dos seus resultados. 
Assim, podemos estabelecer alguns mecanismos de classifi cação para o conjunto de dados. 
Uma das ferramentas que possibilitam essa organização sistematizada são as planilhas 
(Figura 3), isto é, um conjunto de dados organizados em linhas e colunas, que podem ser 
preenchidas manualmente ou em computadores (planilhas eletrônicas). 
Figura 3 – Exemplo da planilha com linhas e colunas feita em computador. Os dados apresentados são referentes 
ao exemplo utilizado na aula
Fonte: Henrique Rocha de Medeiros
Espécies encontradas
N
úm
er
o 
de
 in
di
víd
uo
s 
de
 c
ad
a 
es
pé
ci
e
Angico
Bambural
Carrapicho
Agulha
Catingueira
Jitirana
Malva
Manda
Pulão
Marmeleiro
Mata
Pasto
Melosa
Milhã
Mofumbo
Mororó
Pau
Branco Sabiá Tiririca Urtiga0
200
400
600
800
1000
1200
1400
1600
Número de
indivíduos
Levantamento fitossociológico de espécies encontradas numa área de Caatinga
Aula 2 Bioestatística38
Não existe um tipo mais correto de gráfi co, todavia é importante que eles permitam 
a interpretação rápida e o entendimento dos resultados e, além disso, que respeitem as 
normas para a elaboração de gráfi cos e tabelas, como visto nas Aulas 3 e 4 da disciplina 
Matemática e Realidade.
Exercício resolvido 1
Utilizando as informações da Tabela 1 (Levantamento fi tossociológico de uma área de caatinga), 
indique quantas espécies foram identifi cadas e qual o total de plantas contadas.
Resolução
Nessa tabela, os dados referentes a cada espécie (observe que os nomes 
científi cos não se repetem) estão organizados em linhas. Assim, observando-se 
a tabela pode-se aferir que foram identifi cadas 17 espécies. O número total de 
plantas contadas pode ser obtido somando-se o número de indivíduos de cada 
espécie (4 + 1375+ 37+...+1+3+11 = 2005).
Figura 4 – Identifi cação e quantifi cação das espécies vegetais encontradas numa área de caatinga na Região Nordeste do Brasil
Fonte: Henrique Rocha de Medeiros
Aula 2 Bioestatística 39
Resolução
Observando-se os resultados da tabela pode-se identifi car que o bamburral, o 
manda pulão e a malva, com respectivamente 1.375, 249 e 135 indivíduos cada, 
são as espécies vegetais que têm o maior número de plantas na área estudada. 
Essa mesma resposta pode ser obtida, analisando-se a Figura 4: Identifi cação 
e quantifi cação das espécies vegetais encontradas numa área de caatinda na 
Região Nordeste do Brasil.
Resumo 
Você estudou o conceito de dados e banco de dados e aprendeu como criar 
um banco de dados para, posteriormente, transformá-lo em informações. Você 
retomou os principais conceitos vistos na Aula 1 – O que é Bioestatística – tais 
como, unidade experimental, variável e classifi cação de variáveis. Você estudou 
as diferenças entre dados e informações e aprendeu que, para que dados sejam 
transformados em informações, precisa planejar sua coleta de forma a evitar 
erros. Para isso, utilizou-se as duas primeiras etapas do método estatístico: 
(1) Identifi cação do problema e (2) Formulação de hipóteses. Você estudou 
também algumas ações que fazem parte do planejamento da coleta de 
dados, como conhecer o local da coleta, formar uma equipe de coleta, levar 
material necessário, dentre outros. Aprendeu que os dados coletados podem 
ser organizados em planilhas eletrônicas feitas em computador, o que facilita 
posterior análise e interpretação. Por fi m, relembrou as formas de apresentação 
dos dados, como por exemplo, em tabelas e gráfi cos. 
Nesse caso, a opção pela tabela ou pelo gráfi co se dará em função da necessidade de 
informação. Se o objetivo for apenas identifi car as espécies com maior número de indivíduos, 
possivelmente o gráfi co será a melhor alternativa. Entretanto, se a quantifi cação é necessária, 
a organização da tabela em função do número de indivíduos poderá facilitar o trabalho.
Exercício resolvido 2
Ainda utilizando as informações da Tabela 1, identifi que as três espécies que tem mais 
indivíduos na amostra estudada. Nesse caso, a mesma resposta pode ser obtida analisando a 
tabela ou construindo gráfi cos como pôde ser observado.
1
Aula 2 Bioestatística40
Autoavaliação
A dengue é uma doença grave, que está disseminada em todo o território nacional. 
Então, que tal por em prática os conceitos da aula de hoje, transformando os dados sobre 
essa epidemia em informação? 
Para isto analise os dados que foram retirados de um texto extraído da página da Secretaria 
de Saúde Pública (SESAP/RN) na internet.
<http://www.rn.gov.br/contentproducao/aplicacao/govrn/imprensa/enviados/noticia_detalhe.
asp?nImprensa=0&nCodigoNoticia=17319>: 
A Secretaria Estadual de Saúde Pública, por meio do Programa de Controle da Dengue, 
divulgou nesta segunda-feira (14/12/2009) o boletim de acompanhamento epidemiológico da 
dengue. Desde janeiro deste ano foram notifi cados 3.577 casos da doença no Rio Grande do 
Norte. Destes, 17 foram de Febre Hemorrágica de Dengue (FHD), além de três óbitos ocorridos. 
Em relação ao mesmo período do ano anterior (2008) quando foram notifi cados 43.552, houve 
uma redução nos casos. Na região metropolitana da Capital (que inclui os municípios de Natal, 
Macaíba, São Gonçalo e Extremoz) foram notifi cados 1.724 casos de dengue. Em Natal, foram 
notifi cados 1.235 casos de dengue, dos quais 13 de FHD. Já em Mossoró, 370 pessoas foram 
acometidas por esta enfermidade (dengue) e 07 apresentaram FHD.
Agora, utilizando os dados acima e:
Construa uma tabela com o número de casos notifi cados da doença no ano de 2009 
em todo o estado do Rio Grande do Norte, na Região Metropolitana da capital, em 
Natal e em Mossoró.
2
3
Aula 2 Bioestatística 41
Calcule a porcentagem de casos ocorridos no município de Natal em relação ao 
restante do estado, analisando os dados da tabela elaborada na questão 1.
Analise os dados e calcule a redução do número de casos notifi cados de dengue em 
2009 em relação ao ano anterior (2008), quando foram notifi cados 43.552 casos 
dessa enfermidade. 
Se você conseguiu resolver o exercício acima, parabéns! Caso contrário, entre em contato 
com o seu professor, retorne ao texto da aula, reveja os principais conceitos, volte à atividade 
de autoavaliação e tente quantas vezes forem necessárias.
Referências
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionário 
Houaiss da língua portuguesa. Rio de Janeiro: Editora Objetiva, 2001. 
LOPES, Paulo Afonso. Probabilidades e estatística. Rio de Janeiro: Ed. Reichman e Affonso 
Editores, 1999.
OTT, Lyman; MENDEENHALL, William. Understanding statistics. Boston: PWS-KENT Publishing 
Company, 1990.
SAMPAIO, Ivan BarbosaMachado. Estatística aplicada à experimentação animal. Belo 
Horizonte: FEP MVZ Editora, 1997.
Aula 2 Bioestatística42
Anotações
Descrevendo Sistemas
3
Aula
1
2
3
Aula 3 Bioestatística 45
Apresentação
Nesta aula, estudaremos as aplicações da estatística descritiva nas Ciências Biológicas. Para isto, utilizaremos dados de sistemas biológicos para calcular a média, variância, desvio padrão, moda e mediana e veremos como obter informações com este tipo 
de análise estatística. Desse modo, será importante que você tenha uma boa compreensão 
dos conceitos vistos na Aula 1 – O que é Bioestatística – e Aula 2 – Como transformar 
dados em informações. As análises que aqui serão realizadas terão como base os conceitos 
apreendidos nessas aulas.
Objetivos
Distinguir os conceitos de estatística descritiva e suas 
aplicações em Ciências Biológicas. 
Aplicar a estatística descritiva para realizar análises de 
conjuntos de dados.
Avaliar os resultados da análise dos dados, de modo 
a poder caracterizar corretamente a amostra e poder fazer 
inferências sobre a população.
Aula 3 Bioestatística46
Medidas de tendência central
As medidas de tendência central indicam um ponto, em torno do qual, se distribuem 
ou concentram os números do conjunto de dados. Este tende a estar localizado no centro 
da distribuição dos dados. As principais medidas de tendência central são a média, a moda e 
a mediana, que estudaremos a seguir.
Média
A média de um conjunto de números pode ser defi nida como um valor que representa 
o total desse conjunto, sem alterar as suas características. Esta medida (média) é um valor 
de “equilíbrio” do conjunto de dados. 
Se o conjunto de dados é obtido de uma população, utiliza-se a letra grega “µ” 
(pronuncia-se mi) para representar a média. Quando o conjunto de dados é obtido de uma 
amostra da população, utiliza-se o símbolo “x
_
” (pronuncia-se x barra). 
Calculando médias e suas aplicações
A média aritmética (x
_
) de um conjunto de dados é calculada pela soma de todos os dados 
dividida pelo número deles. A representação matemática do cálculo da média é a seguinte:
x =
∑
x
n
onde:
∑x = somatório de todos os valores de x
n = a quantidade de valores
Exercício resolvido 1
Um aluno tirou as notas: 0, 2, 4, 6 e 10, em cinco provas. Calcule a média das notas 
desse aluno.
Aula 3 Bioestatística 47
Resolução
1) Primeiro devemos somar (∑x) todos os valores da cada prova: 0 + 2 + 4 + 
6 + 10. O resultado é 22.
2) Depois identifi camos o n, ou seja, como são 5 notas, temos n = 5.
3) Por fi m, divide-se a soma 22 por 5 (22/5) e obtém-se a média 4,4.
4) Conclui-se que o aluno teve média 4,4.
Exercício resolvido 2
Calcule a média geral das notas da turma de 25 alunos, de acordo com os dados 
apresentados na Tabela 1.
Tabela 1 – Resultado da avaliação (nota) de uma turma com 25 alunos
Número de alunos Nota
5 5
8 7
9 8
3 10
Resolução
Neste caso, você pode resolver a questão (e encontrar a média geral da turma) 
de duas maneiras:
1) Somando todas as notas (∑x) obtidas pelos alunos (5 + 5 + 5 + 5 + 5 
+ 7 + 7 + 7 + 7 + 7 + 7 + 7 + 7 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 
8 + 8 + 10 + 10 + 10) que dá ∑x = 183 e dividir o valor encontrado pelo 
número (n) de alunos que é n = 25. Assim, o cálculo da média da turma é 
obtido pela divisão 183/25, cujo resultado é 7,32.
2) O mesmo resultado de média (7,32) pode ser obtido se você multiplicar a nota 
pelo número de alunos que tiraram a respectiva nota e fi zer o somatório de 
todos os resultados, da seguinte maneira: (5*5) + (8*7) + (9*8) + (3*10)(3*10) = 183. 
Assim, se dividirmos 183 por 25 obteremos o mesmo resultado para o cálculo 
da média geral da turma, ou seja, 7,32.
(5*5) + (8*7) + (9*8) 
+ (3*13*10)
5*5 = 5+5+5+5+5; 
8*7 = 
7+7+7+7+7+7+7+7; 
9*8 = 
8+8+8+8+8+8+8+8+8 
e 3*10 =10+10+10
Atividade 1
Aula 3 Bioestatística48
Calcule a média para os seguintes conjuntos de dados:
a) A altura (em cm) de plantas submetidas a tratamento com hormônio de 
crescimento: 12,5cm; 12,6cm; 12,9cm; 13,5cm; 13,7cm; 12,7cm; 13,6cm.
b) Número de movimentos respiratórios por minuto (mpm) de cobaias de 
laboratório após a administração de um anestésico intravenoso: 12 mpm; 
14 mpm; 13 mpm; 14 mpm; 15 mpm; 16 mpm; 16 mpm; 15 mpm; 13 mpm.
c) Número de salários mínimos recebidos pelos trabalhadores de um 
laboratório de análises clínicas: 5 salários míninos; 4 salários míninos; 
4,5 salários míninos; 6 salários míninos; 5,5 salários míninos; 8 salários míninos; 
6 salários míninos; 6,5 salários míninos.
Aula 3 Bioestatística 49
Mediana e moda
A análise da média deve refl etir o conjunto de dados. Todavia, este cálculo pode ser afetado por medidas muito discrepantes (muito altas ou muito baixas em relação ao valor médio). Quando isto acontece, a média calculada não representa adequadamente o 
que acontece no conjunto de dados. Para estas situações o cálculo da mediana e/ou da moda 
pode ser uma alternativa adequada para descrever o conjunto de dados.
A mediana (cujo símbolo é md) é o valor que ocupa a posição central; esta medida divide 
o conjunto de dados em duas metades iguais. Para calcular a mediana, organize o seu conjunto 
de dados em ordem crescente e encontre o valor que está no centro da série. 
Quando o número de dados for ímpar a mediana será o valor que está no centro da 
série. Quando o número de dados for par, a mediana será a média dos valores que estão no 
centro da série.
Exercício resolvido 3
Vamos descobrir a mediana do conjunto de dados utilizado para o cálculo das médias 
do Exercício resolvido 2?
Para isso devemos:
1) Organizar o conjunto de dados em ordem crescente. Assim procedendo, obtemos: 
Valor 5 5 5 5 5 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 10 10 10
Posição 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
2) Note que temos 25 números. Esse valor é ímpar, e desse modo, a mediana será o valor 
que divide esse conjunto. Neste caso, a mediana corresponderá ao número que está na 
posição 13 (número 7), pois este dividirá o conjunto de dados em duas metades iguais, 
com 12 dados (números) cada um, como se pode observar abaixo:
Conjunto 1 com os 12 primeiros valores (anteriores a mediana)
Valor 5 5 5 5 5 7 7 7 7 7 7 7
Posição 1 2 3 4 5 6 7 8 9 10 11 12
Mediana
Valor 7
Posição 13
Conjunto 2 com os 12 últimos valores (posteriores a mediana)
Valor 8 8 8 8 8 8 8 8 8 10 10 10
Posição 14 15 16 17 18 19 20 21 22 23 24 25
1
2
Atividade 2
Aula 3 Bioestatística50
É interessante utilizar essa medida quando se estuda um grande conjunto de dados, 
onde existe muita discrepância entre eles. Neste caso, a mediana pode ser uma medida mais 
representativa que a média.
Já a moda (cujo símbolo é mo) representa o valor que ocorre com maior frequência no 
conjunto de dados.
Analisando-se o conjunto de dados do Exercício resolvido 2, observa-se que a nota que 
mais aparece é 8. Neste caso, a moda ou o valor modal é 8. 
Neste exercício, a média, a mediana e a moda apresentam valores bem próximos entre si. 
E, dependendo do conjunto de dados estas três medidas podem até ter o mesmo valor. 
Entretanto, dependendo da variação existente no conjunto de dados, você deverá escolher 
qual dessas medidas de tendência central (média, mediana ou moda) é a mais representativa 
e adequada para ser utilizada.
Calcule a média, a moda e a mediana para o conjunto de dados de uma classe com 
seis alunos, cujas notas foram: 
Aluno A B C D E F
Nota 2,0 5,0 8,0 5,0 7,5 3,5
Analisando o conjunto de dados abaixo, responda:
Aluno A B C D E F G H
Nota 2,0 5,0 7,0 10,0 5,0 6,0 3,0 8,0
a) Quantos alunos têm nota superior à média geral da turma?
Aula 3 Bioestatística 51
Medidas de dispersão
As medidas de dispersão indicam ou permitem ter noção do quanto estão distantes os 
dados entre si. Ou seja, como eles variam em relação à média.
Neste sentido, a descrição de um conjunto de dados sempre se faz com uma medida de 
tendência central (geralmente a média) e uma de dispersão associadas.
Mas,como medir esta variação em relação à média?
Para isto, devemos analisar a amplitude e os desvios em relação à média.
Amplitude
A amplitude corresponde à diferença entre o maior e o menor valor no conjunto de dados. 
Esta medida nos fornece uma noção da dispersão dos dados.
Para explicar este conceito, vamos utilizar dois conjuntos de dados A e B, que representam 
a nota obtida pelos alunos de uma determinada disciplina:
Conjunto de dados A: 4; 6; 4; 6; 5; 5
Conjunto de dados B: 9; 1; 5; 5; 1; 9
b) Calcule a média, a moda e a mediana desta turma.
c) Qual destas três medidas de tendência central, você acha mais adequada para descrever 
o conjunto de dados? Justifi que a sua resposta.
Aula 3 Bioestatística52
Para calcular a amplitude destes dois conjuntos de dados, identifi que, respectivamente, 
o maior e o menor valor em cada um deles.
No conjunto A o maior valor encontrado é 6 e o menor 4. Assim, a amplitude é 6 – 4 = 2. 
Para o conjunto de dados B o maior e o menor valor, são respectivamente 9 e 1, portanto 
a amplitude é 9 – 1 = 8. 
Observe que esta medida permite inferir que a variabilidade do conjunto de dados B é 
maior que o do A.
Quando se trabalha com algumas variáveis de grande instabilidade como, por exemplo, 
contagem de ovos por grama de fezes (OPG) utilizado para diagnóstico de verminose, onde 
se podem determinar valores de amplitude superior a 10000 OPG, esta medida é bastante 
interessante para demonstrar a variabilidade e a dispersão existente.
Estas características podem ser comprovadas nos dados da tabela a seguir (Tabela 2), 
onde temos zero como o menor valor de OPG e 5100 como o maior valor.
Tabela 2 – Contagem de OPG (ovos/g) de um rebanho de ovinos mestiços (½ sangue Somalis × ½ sem raça defi nida) 
mantidos em pastagem nativa naturalmente contaminada por larvas de nematódeos gastrintestinais
Animal Contagem de OPG
1 100
2 0
3 200
4 300
5 0
6 100
7 400
8 100
9 1100
10 1400
11 5100
12 400
13 700
14 300
15 500
16 0
17 700
18 1300
19 200
20 800
21 300
22 2300
Fonte: Zaros et al (2009).
Aula 3 Bioestatística 53
Desvio em relação à media
O desvio em relação à média permite estimar o quanto um determinado valor se afasta 
da média do conjunto. O cálculo do desvio em relação à média é dado pela diferença entre 
o valor medido (observado) e a média do conjunto de dados (calculado previamente). Este é 
representado matematicamente pela fórmula:
Desvio em relação a média = x – x
_
.
Onde:
x = valor medido
x
_
 = valor da média calculada
Para determinar os desvios, precisamos inicialmente calcular as médias de cada conjunto 
de dados. Ainda utilizando os conjuntos A (4; 6; 4; 6; 5; 5) e B (9; 1; 5; 5; 1; 9), vemos que 
a média para ambos é 5. Assim, os desvios em relação à média do conjunto de dados A são:
Valor medido (x) Média (x
_
) x – x
_
4 5 –1
6 5 1
4 5 –1
6 5 1
5 5 0
5 5 0
Total = 0
Os desvios em relação à média para o conjunto B são:
Valor medido (x) Média (x
_
) x – x
_
9 5 4
1 5 – 4
5 5 0
5 5 0
1 5 – 4
9 5 4
Total = 0
Observe que, apesar dos conjuntos de dados A e B possuírem as mesmas médias, 
eles apresentam desvios bem diferentes. No conjunto A, os desvios vão de – 1 a +1 e no B, 
de – 4 a +4.
Você notou que, apesar dos valores diferentes, a soma dos desvios é zero nos dois 
conjuntos? Vamos ver o porquê?
Você pode está se perguntando: Se a soma dos desvios em relação à média é sempre 
zero para qualquer conjunto de dados, como poderei utilizar esta medida? 
Aula 3 Bioestatística54
Neste caso, podemos utilizar um artifício matemático que é elevar o valor de (x – x
_
) 
ao quadrado, transformando-o em (x – x
_
)2, e assim ter sempre um valor positivo para esta 
operação. Assim, sempre que você calcular a soma dos desvios elevada a potência 2, obterá 
um valor positivo e diferente de zero.
Vamos conferir?
Exercício resolvido 4
Calcule a soma dos desvios elevada à potência 2 para os conjuntos de dados A (4; 6; 
4; 6; 5; 5) e B (9; 1; 5; 5; 1; 9).
Resolução
1) Para o conjunto de dados A:
Valor medido (x) Média (x
_
) x – x
_
(x – x
_
)2
4 5 –1 1
6 5 1 1
4 5 –1 1
6 5 1 1
5 5 0 0
5 5 0 0
Total = 0 Total = 4
2) Para o conjunto de dados B:
Valor medido (x) Média (x
_
) x – x
_
(x – x
_
) 2
9 5 4 16
1 5 –4 16
5 5 0 0
5 5 0 0
1 5 –4 16
9 5 4 16
Total = 0 Total = 64
3) Calculados os desvios e elevando-os à potência de 2, eles só terão valor zero, 
se todos os valores x – x
_
 do conjunto forem iguais a 0. Neste caso, não existe 
dispersão e/ou diferença em relação a média.
Atividade 3
Aula 3 Bioestatística 55
Retome os principais conceitos vistos nesta aula e defi na:
a) Média:
b) Mediana:
c) Moda: 
d) Amplitude: 
e) Desvio em relação à média:
Aula 3 Bioestatística56
Variância de uma amostra
Depois de calcular os desvios em relação à média, agora, você já pode calcular a variância 
(s2) de uma amostra. Esta medida de dispersão permite ter noção de quanto variam os dados 
em relação a média e principalmente calcular o desvio padrão de uma média.
A variância de uma amostra é estimada pela fórmula:
S2 =
∑
(x− x)2
n− 1
Onde:
x = valor medido ou observado na amostra
x
_
 = Média calculada para amostra
n = número de dados da amostra
Vamos fazer uma aplicação da variância utilizando os dados do exercício resolvido 4?
Neste caso, para os dois conjuntos de dados, A e B, foram utilizados 6 valores, então 
o valor de n é igual a 6 e, consequentemente, n – 1 = 5.
Utilizando estes conceitos, a variância para o conjunto A é calculada dividindo-se o valor 
de (x – x
_
)2, que é igual a 4, por n – 1, que é igual a 5. Assim, a variância de A é 4/5 ou 0,8.
Da mesma forma, a variância de B é calculada por 64, resultado de (x – x
_
)2, dividido 
por 5, resultado de n – 1. Ou seja, 64/5 que resulta em 12,8.
Observe que a variância é uma medida adimensional.
Agora, conhecendo a variância de um conjunto de dados, eu posso estimar o seu 
desvio padrão.
Desvio padrão
Como a variância é uma medida que estima os quadrados dos desvios em relação a média, esta tem pouca aplicação prática. Visto que as unidades de medida dos dados utilizados no cáculo da variância também são elevadas ao quadrado, o que difi culta a 
interpretação das respostas. Tome-se por exemplo uma medida calculada em: kg ou cm ou m2. 
Neste caso, a variância será expressa em respectivamente: kg 2 ou cm2 ou m4; difi cultando 
a interpretação dos resultados.
Aula 3 Bioestatística 57
Uma forma de resolver este problema é extrair a raiz quadrada da variância, obtendo 
assim o desvio padrão (s).
O desvio padrão (s) de um conjunto de dados é obtido calculando-se a raiz quadrada da 
variância, utilizando a fórmula:
s = ( 2
√
S2)
Onde:
S 2 = variância da amostra
Utilizando este conceito nos mesmos conjuntos de dados A e B, obtemos os seguintes 
valores:
Para o conjunto A: S 2 = 0,8 então, s = 2
√
0, 8 s = 0,894 
Para o conjunto B: S 2 = 12,8 então, s = 2
√
12, 8 s = 3,577
Agora, já que conhecemos a média e o desvio padrão do conjunto de dados e a amplitude, 
podemos utilizar estas informações para descrever os dados analisados neste exemplo.
1) Conjunto A = 5 ± 0,894; menor valor 4; maior valor 6; n = 5.
2) Conjunto B = 5 ± 3,577; menor valor 1; maior valor 9; n = 5.
Você pode, utilizando essas informações, escolher o conjunto de dados A, se preferir 
o que tiver menor desvio em relação à média ou o conjunto de dados B se a opção for pela 
maior amplitude.
Coefi ciente de variação
Agora, o que representa o desvio em relação à média? 
O desvio em relação à média permite avaliar a instabilidade do conjunto de dados. 
Esta medida de dispersão é chamada de coefi ciente de variação (CV).
O CV é calculado dividindo-se o desvio padrão pela média do conjunto de dados.
CV = s/x
_
Onde:
s = Desvio Padrão
x
_ 
= Média aritimética calculada para o conjunto de dados.
Atividade 4
Aula 3 Bioestatística58
Utilizando os dados do Exercício resolvido 4, teremos os seguintes coefi cientesde variação.
1) Conjunto de dados A: 0,894/5 = 0,1788 ou 17,88%
2) Conjunto de dados B : 3,577/5 = 0,7154 ou 71,54%
Este resultado indica que o conjunto de dados A é mais homogêneo e menos instável 
que o B.
Atenção
Não estamos afi rmando que “A” é melhor do que “B” ou vice-versa, mas sim, 
homogêneo. Isto é importante, para se avaliar a representatividade da média em 
relação ao conjunto de dados.
Lembra quando falamos da média de dados de contagem de OPG e que nestes casos, se 
pode ter amplitude superior a 10000?
Este é um caso de variável muito instável, onde a média não tem muita representatividade. 
Nestas situações, trabalhar com a moda ou a mediana é mais interessante que com a média. 
A noção de instabilidade de uma variável e a escolha entre utilizar a média, a moda 
ou a mediana para descrever o conjunto de dados, é uma opção individual do pesquisador. 
Para isto, recomenda-se o bom senso e observar/ler como se publicam estas informações nos 
meios científi cos, jornais e revistas.
Os dados a seguir fornecem a concentração de um determinado poluente (ppm) em 8 
pontos de um afl uente medidos uma hora antes e uma hora depois de um acidente ambiental:
Tabela 3 – Concentração (em ppm) de um determinado poluente nas águas de um rio antes e depois de um 
acidente ambiental
Concentração antes Concentração depois
4,67 5,44
4,97 6,11
5,11 6,49
5,17 6,61
5,33 6,67
6.22 6,67
6,50 6,78
7,0 7,89
Fonte: <http://leg.ufpr.br/~paulojus/CE003/ce003/node2.html>. Acesso em: 12 abr. 2010.
Aula 3 Bioestatística 59
Utilizando o conjunto de dados da Tabela 3, calcule a média, a mediana, a moda, o 
desvio padrão e o coefi ciente de variação da concentração de poluentes antes e depois do 
acidente ambiental.
Leitura complementar
PROJETO de ensino. Aprendendo a fazer estatística. Disponível em: <http://www.des.uem.
br/projetos/Estatistica_Descritiva.pdf>. Acesso em: 12 abr. 2010.
Este texto refere-se aos principais conceitos da Estatística Descritiva vistos na aula de 
hoje. Além disto, sua leitura possibilitará conhecer outros exemplos de aplicações da Estatística 
Descritiva, principalmente para você utilizar em situações de sala de aula tendo como exemplo 
as situações do cotidiano.
Resumo
Aula 3 Bioestatística60
Nesta aula, você estudou as aplicações da estatística descritiva nas Ciências 
Biológicas. Para isto, você teve como exemplo dados de sistemas biológicos para 
calcular a média, variância, desvio padrão, moda e mediana. Você compreendeu 
como obter informações com este tipo de análise estatística e aprendeu a 
realizar uma análise de um conjunto de dados utilizando a estatística descritiva. 
Por fi m, você pôde interpretar os resultados da análise dos dados, de modo a poder 
caracterizar corretamente a amostra e poder fazer inferências sobre a população.
Autoavaliação
Um fazendeiro foi avaliar a produção de leite dos seus animais. Ele anotou os 
dados na tabela a seguir (Tabela 4). Entretanto, fi cou sem saber analisar, fazer 
uma estatística descritiva dos resultados.
Tabela 4 – Produção de leite (Kg/animal/dia)
Produção de leite (kg/animal/dia)
Identifi cação do animal Dia 1 Dia 2 Dia 3 Dia 4
A296 7,4 4 7,2 6,6
A369 6 5,4 8 4,8
A001 8 2,8 3,4 9,4
L061 7,4 9,8 11,2 7
L212 4,6 9 10,2 4
L344 2,8 5 6,2 4
Analise os dados da Tabela 4 e calcule a média, o desvio padrão, a moda, a mediana e 
o coefi ciente de variação da produção de leite do rebanho.
Aula 3 Bioestatística 61
Se você conseguiu resolver o exercício acima, parabéns. Caso contrário, entre em contato 
com o seu professor. Retome o texto da aula, reveja os principais conceitos, volte à atividade 
de Autoavaliação e tente quantas vezes forem necessárias.
Referências
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionário 
Houaiss da língua portuguesa. Rio de Janeiro: Editora Objetiva, 2001. 
LOPES, Paulo Afonso. Probabilidades e estatística. Rio de Janeiro: Ed. Reichman e Affonso 
Editores, 1999.
MAGALHÃES, M. N.; LIMA, A. C. P. de. Noções de probabilidade e estatística. São Paulo: 
IME-USP, 2000.
OTT, Lyman; MENDEENHALL, William. Understanding statistics. Boston: PWS-KENT Publishing 
Company, 1990.
PAGANO, Marcello; GAUVREAU, Kimberlee. Princípios de bioestatística. 2. ed. São Paulo: 
Pioneira Thomson Learning, 2004.
SAMPAIO, Ivan Barbosa Machado. Estatística aplicada à experimentação animal. Belo 
Horizonte: FEP MVZ Editora, 1997.
ZAROS, L. G. et al. Desempenho de ovinos Somalis resistentes e susceptíveis a nematódeos 
gastrintestinais. In: ZOOTEC, 2009, Águas de Lindóia. Anais... Águas de Lindóia, 2009.
Anotações
Aula 3 Bioestatística62
Anotações
Aula 3 Bioestatística 63
Anotações
Aula 3 Bioestatística64
Elaborando hipóteses
4
Aula
1
2
3
Aula 4 Bioestatística 67
Apresentação
 
Nesta aula, apresentaremos o conceito de hipótese, exemplifi cando com situações que fazem parte do seu cotidiano. Num segundo momento, veremos quais os tipos de hipótese e como utilizá-los. Entenderemos o conceito de população amostral e 
referência, os quais serão parte essencial na construção da hipótese. Estudaremos quais os 
tipos de erros existentes ao se aceitar ou rejeitar uma hipótese verdadeira.
Nesta aula, temos exercícios resolvidos que servirão de guia para que você faça as 
atividades propostas após cada assunto abordado. 
Lembre-se: para que você compreenda os conceitos desta aula, é necessário que você 
leia atentamente o texto, fazendo sempre anotações sobre suas dúvidas e questionamentos.
Objetivos
Defi nir hipótese.
Diferenciar os tipos de hipóteses.
Defi nir erro tipo I e tipo II.
Aula 4 Bioestatística68
Fo
nt
e:
 <
ht
tp
://
no
tic
ia
sr
o.
na
fo
to
.n
et
/im
ag
es
/p
ho
to
20
08
10
04
01
48
24
.jp
g>
. 
Ac
es
so
 e
m
: 2
5 
m
ar
. 2
01
0.
Segundo o Dicionário On Line de Português, a palavra hipótese refere-se a uma 
suposição que se faz acerca de uma coisa possível ou não, a qual se tira uma 
consequência; teoria provável, admissível, embora ainda não demonstrada.
Na ilustração anterior, nossa hipótese é que vai chover. Chegamos a essa 
afi rmação, constatando o céu cinzento e carregado de nuvens.
Mas, será que podemos comprovar essa hipótese? Será que essa hipótese pode 
ser rejeitada? Que elementos temos para aceitar ou rejeitar essa hipótese? 
Essas e outras questões serão respondidas no decorrer desta aula.
Se voltarmos um pouco no tempo e relembrarmos algumas disciplinas que você já 
estudou, como Biodiversidade, podemos destacar teorias que foram formuladas a partir de 
uma, duas ou mais hipóteses.
Um exemplo foi a teoria da evolução dos seres vivos. Essa teoria teve várias hipóteses, 
dentre elas a sustentada pelo cientista francês Jean-Baptiste Lamarck, que afi rmava que os 
seres vivos tinham de se transformar para melhor se adaptarem ao ambiente, ou seja, as girafas 
teriam adquirido o pescoço longo ao se esforçarem para ter acesso à comida. Essa hipótese 
não foi aceita pela ciência e foi substituída pelas hipóteses de Darwim, que originaram a Teoria 
da Seleção Natural. 
Uma provável teoria...
Observe a fi gura abaixo e responda a seguinte pergunta: Será que 
vai chover?
Figura 1 – Céu nublado
Atividade 1
Aula 4 Bioestatística 69
Baseado nos conhecimentos que você adquiriu durante o curso de Ciências 
Biológicas, pesquise e descreva outras hipóteses que foram confi rmadas ou 
rejeitadas na história da Biologia.
Figura 2 – Girafas que teriam adquirido pescoço longo ao 
se esforçarem para ter acesso à comida - Hipótese de Lamarck 
Esse é apenas um exemplo de hipóteses que, quando aceitas, tornaram-se fatos, teorias. 
Aula 4 Bioestatística70
Um exemplo nos dias de hoje
Nas Ciências Biológicas, os trabalhos científi cos são realizados com objetivos bem 
estabelecidos, expressos por meio de afi rmações – as hipóteses – que os pesquisadores 
desejam verifi car. 
Veja esta situação: suponha que o pesquisador queira verifi car se o medicamento X, 
utilizado no tratamento do câncer depele apresenta, como efeito colateral, um aumento na 
pressão sanguínea. Nesse caso, o pesquisador elabora duas afi rmações, ou seja, duas hipóteses 
que devem ter sentido contrário uma da outra (igualdade x diferença). Assim, obrigatoriamente, 
ao aceitar uma hipótese, a outra deve ser rejeitada. Isso pode ser visto no exemplo a seguir.
Hipótese 1 (H1): o medicamento X, utilizado no tratamento do câncer de pele, não apresenta 
efeito colateral.
Hipótese 2 (H2): o medicamento X, utilizado no tratamento do câncer de pele, apresenta pelo 
menos um efeito colateral. 
Entretanto, para saber quais das hipóteses são verdadeiras, o pesquisador deverá testá-las, 
ou seja, inicia-se uma pesquisa para responder às suas perguntas. 
No caso do exemplo acima, ele deve selecionar indivíduos, utilizar a medicação X e avaliar 
se ocorre algum efeito colateral nos pacientes. 
Dependendo dos resultados obtidos, o pesquisador aceita ou não a sua hipótese: se ele 
verifi car que os indivíduos apresentaram algum efeito colateral, como, por exemplo, alteração 
na pressão arterial após a administração do medicamento, ele aceitará a hipótese 2; caso 
contrário, deverá aceitar a hipótese 1.
Fonte: <http://frasesilustradas.fi les.wordpress.com/2009/04/hipotese.jpg>. 
Acesso em: 25 mar. 2010.
Atividade 2
Aula 4 Bioestatística 71
Com base no que você leu até aqui, defi na hipótese e construa duas hipóteses 
sobre como será a disciplina de Bioestatística.
Hipóteses e seus tipos
Até o momento, vimos o conceito de hipótese. Agora, vamos conhecer seus tipos?
Há dois tipos principais de hipóteses. Uma que chamamos de Hipótese Científi ca e a 
outra que denominamos de Hipótese Estatística.
A hipótese científi ca é aquela que não menciona o valor do parâmetro. É o caso da nossa 
situação acima, em que as hipóteses formuladas não exprimem valor, ou seja, não se referem 
à média da pressão sanguínea dos indivíduos analisados. 
Já a hipótese estatística menciona o valor do parâmetro. Seria o caso se, no exemplo 
acima, o pesquisador apresentasse o valor médio da pressão sanguínea dos indivíduos 
analisados, como, por exemplo, 128mmHg (milímetros de mercúrio).
O esquema a seguir resume os dois principais tipos de hipóteses com seus respectivos 
exemplos e nos apresenta outros dois subtipos da hipótese estatística, a Hipótese Nula ou de 
Nulidade (H
0
) e a Hipótese Alternativa (Ha).
Valor do parâmetro
Valor do parâmetro: 
é um número, um valor 
que quantifi ca a variável.
HIPÓTESE
Hipótese Científica
O medicamento
apresenta efeito
colateral
Parâmetro 
com valor
Hipótese 
Nula Ho
A média da pressão 
sanguínea é igual para os 
indivíduos que receberam 
o medicamento e para os 
que não receberam
A média da pressão 
sanguínea é diferente para 
os indivíduos que receberam 
o medicamento e para os 
que não receberam
Hipótese
Alternativa Ha
O medicamento
apresenta efeito
colateral sobre a
média de pressão
sanguínea
Hipótese Estatística
Parâmetro 
sem valor
Aula 4 Bioestatística72
Figura 3 – Tipos e subtipos de hipóteses e seus respectivos exemplos
Fonte: Lilian Giotto Zaros.
Vamos nos aprofundar nas hipóteses estatísticas? 
As hipóteses estatísticas sempre comparam dois ou mais parâmetros, afi rmando que 
são iguais ou não, como você pôde ver no esquema acima. Essas hipóteses ainda podem ser:
Hipótese Nula ou de Nulidade (H
0
), que estabelece a ausência de diferenças entre os 
parâmetros. É sempre a primeira a ser formulada.
Ainda utilizando o exemplo anterior, a hipótese de nulidade pode ser:
H
0
, a média da pressão sanguínea da população amostrada (μ
1
), de indivíduos tratados 
com o medicamento X, não difere da média da população tomada como referência (μ
2
), ou 
abreviadamente: 
H
0
 : μ
1
 = μ
2
Se essa hipótese for aceita, a conclusão é de que o medicamento não altera a pressão 
sanguínea.
População 
amostrada (μ
1
)
é a amostra que constitui 
o seu estudo. No caso 
do nosso exemplo, os 60 
indivíduos que tomaram o 
medicamento constituem 
a população amostral ou, 
simplesmente, a amostra.
População tomada 
como referência (μ
2
)
é aquele que serve como 
base ou referência para 
o estudo. No caso do 
exemplo, é a população 
de pessoas que não 
receberam o medicamento. 
O pesquisador não precisa, 
necessariamente, medir 
a pressão de todas as 
pessoas. Ele simplesmente 
pode ter como base 
estudos já realizados que 
constataram que a média 
da pressão arterial 
é de 128mmHg.
Aula 4 Bioestatística 73
Hipótese alternativa
Hipótese Alternativa (Ha ou H1): é a hipótese contrária à hipótese nula. Estabelece a presença 
de diferenças entre os parâmetros. Geralmente, é a que o pesquisador quer ver confi rmada. 
A hipótese alternativa do exemplo acima é:
Ha, a média da pressão sanguínea da população amostrada (μ1), de indivíduos tratados com 
o medicamento X, difere média da população tomada como referência (μ
2
), ou abreviadamente: 
Ha : μ1 ≠ μ2
Se essa hipótese for aceita, a conclusão é de que o medicamento altera a pressão sanguínea.
Exercício resolvido
Formule as hipóteses de nulidade e alternativa para a situação descrita a seguir.
Um pesquisador da Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA) tem se 
dedicado aos estudos de caprinos, tentando identifi car alguns genes que sejam relacionados 
à resistência à verminose. Num dado momento da sua pesquisa, ele notou que vários genes 
aparecem em diferentes proporções nos animais mais resistentes do que nos animais mais 
susceptíveis e outros genes aparecem nas mesmas proporções em ambos os animais. 
Diante dessa observação, o pesquisador precisa formular suas hipóteses para posteriormente 
testá-las. Descreva quais as hipóteses esse pesquisador deve testar.
Resolução
Em primeiro lugar, você deve identifi car qual a população a ser testada. No 
exemplo acima, queremos comparar se os animais resistentes apresentam os 
mesmos genes que os animais susceptíveis. Nesse caso, como iremos testar os 
dois grupos de animais, podemos denominar os animais resistentes de população 
1 (μ
1
) e os animais susceptíveis de população 2 (μ
2
), já que ambos serão testados. 
Uma vez defi nida a população a ser testada, você pode elaborar as hipóteses.
  Hipótese de nulidade (H
0
): a média de expressão gênica dos animais 
resistentes não difere da dos animais susceptíveis. H
0
 : μ
1
 = μ
2
  Hipótese alternativa (Ha): a média de expressão gênica dos animais 
resistentes difere da dos animais susceptíveis. Ha : μ1 ≠ μ2
Entendido? Agora faça o mesmo nas situações abaixo.
Atividade 3
1
2
Aula 4 Bioestatística74
Um pesquisador da Fundação Oswaldo Cruz, no Rio de Janeiro, recebeu 
uma demanda do Governo Federal para testar um novo inseticida contra 
o mosquito Aedes aegipty, transmissor da dengue e da febre amarela 
urbana. Alguns estudos preliminares foram realizados e comprovaram 
que o inseticida tem efeito na diminuição da população desse inseto. 
Entretanto, o que o governo ainda não sabe é se ele atua inibindo a 
eclosão dos ovos, inibindo o desenvolvimento da larva em adulto, ou 
tornando os adultos estéreis. Com base nessas informações, escolha 
uma das três alternativas para o mecanismo de ação do inseticida e 
elabore as hipóteses (H
0
 e Ha) que devem ser testadas para responder 
ao questionamento do Governo Federal.
Antigamente, se pensava que o câncer de mama era uma doença rara 
em mulheres abaixo dos 35 anos. Pesquisas recentes têm mostrado 
que essa incidência não é um evento tão raro como se pensava 
anteriormente. Desse modo, pesquisadores de institutos de saúde vêm 
se questionando se as causas desse tipo de câncer são as mesmas 
em mulheres abaixo de 35 anos, quando comparadas àquelas de 45 
anos ou mais. Suponha que você é um desses pesquisadores que irá 
realizar a pesquisa e elabore as hipóteses (H
0
 e Ha) a serem testadas.
ERRO
Tipo I - erro α
Rejeita H0 quando
ela é verdadeira
Aceita H0 quando
ela é falsa
Afirma-se uma diferença
quando ela efetivamente
não existe
Afirma-se

Outros materiais