Buscar

Fundamentos de Bioestatistica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 70 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 70 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 70 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 Bioestatística Aplicada I
EPR, conceitos e planejamento
 
 
 
 
 
 
hierry R. Gasnier 
l do Amazonas 
 
 
 
 
 
 
 
 
 
 
 
20
11
/1
 
T
Universidade Federa
 
Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
umário 
 
 
Introdução ............................................................................................ 3 
 
1.  Estatística intuitiva e estatística formal ....................................... 5 
1.1  Uma ferramenta muito útil ..................................................... 5 
1.2  Pergunta, coleta, medida, estatística e generalização ........... 6 
1.3  Dois tipos de estatística ........................................................... 8 
1.4  A estatística inferencial e a intuição estatística. .................... 8 
1.5  Hipóteses, erros e grau de rigor. .......................................... 11 
1.6  Considerações complementares. .......................................... 13 
 
2.  Do problema biológico ao estatístico. ......................................... 18 
2.1  Entidades ................................................................................ 18 
2.2  Propriedades .......................................................................... 19 
2.3  Tabelas e gráficos EPR ......................................................... 20 
2.4  Relações .................................................................................. 20 
2.5  A estatística para estabelecer relações. ................................ 21 
 
3.  Conceitos para a escolha e uso de testes e gráficos ................... 23 
3.1  Níveis de medida e tipos de variáveis. .................................. 23 
3.2  Escalas de medidas. ............................................................... 23 
3.3  Premissas dos testes paramétricos ....................................... 25 
3.4  Transformação de dados ....................................................... 29 
3.5  Contrastes com a variável independente categórica .......... 29 
3.6  Número de variáveis em um teste ........................................ 29 
3.7  Balanço ................................................................................... 30 
3.8  A “tabela periódica” dos testes e gráficos com duas 
variáveis. .......................................................................................... 31 
3.9  Considerações complementares. .......................................... 32 
 
 
 
 
 
 
S
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
4.1  Testes unicaudais e testes bicaudais ..................................... 33 
5.6  Escolha a sua abordagem ...................................................... 56 
 
 
 
6.
 
7.
 
Anexo:
sta apostila usada em disciplinas da UFAM continuará em processo de aperfeiçoamento. Versões mais recentes poderão 
r obtidas no site www.intertropi.ufam.edu.br/ docs.html. Neste site também estão as últimas versões das apostilas para 
colha de gráficos e testes e outros anexos. Sugestões poderão ser enviadas para o email tgasnier@ufam.edu.br. Os direi-
s autorais desta apostila pertencem ao autor e à Universidade Federal do Amazonas. É permitida a cópia sem fins lucrati-
s desde que a fonte seja citada 
 
 
 
4.  O poder do teste ........................................................................... 33 
4.2  Testes pareados e testes em blocos ....................................... 34 
4.3  Testes múltiplos ..................................................................... 36 
4.4  Níveis fixos e níveis livres ...................................................... 36 
4.5  Relações retilineares, curvilineares e monotonicidade. ...... 38 
4.6  O poder e os tipos de teste ..................................................... 38 
4.7  O poder e os níveis das variáveis em estudo ........................ 39 
4.8  Perdas voluntárias de poder ................................................. 40 
 
5.  Planejamento Amostral ............................................................... 43 
5.1  Independência entre Unidades Amostrais ........................... 43 
5.2  A coleta parecia apropriada, mas... ..................................... 45 
5.3  Tipos de variáveis dentro de mapas conceituais. ................ 47 
5.4  Aleatório versus “ao acaso” .................................................. 50 
5.5  Controle: tratamento, função e estratégia ........................... 51 
5.7  O experimento como modelo na pesquisa de relações. ....... 57 
5.8  Abordagens quase experimentais. ........................................ 58 
5.9  Abordagens não experimentais ............................................ 59 
5.10 Independência pela distância............................................. 61 
5.11 Seus próximos passos. ........................................................ 63 
  Glossário ....................................................................................... 65 
  Bibliografia citada e recomendada ............................................. 68 
 Chaves e Guias para uso de testes e gráficos 
 
 
*E
se
es
to
vo
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
 
ntrodução 
 
plí qu
 
É an
tís c
ma ic
fis q
tic av
ma ta
pr d
tên pe
st
eiro ou um construtor de instrumentos musi-
co d
me o 
co p
qu rim
pr da
las tõ
dir a
ap da
co r
tís q
co ar
çã m
um e
(engenheiros,
um e a
s). Ainda que muitos livros de bioestatística 
n
05) propõe uma ênfase ainda menor na ma-
 
 envolvidos 
na lógica e na escolha de teses e gráficos; “Pla-
nejamento” é uma introdução ao planejamento 
amostral (também chamado de delineamento, 
plano ou desenho amostral). Além de ajudar na 
definição de problemas estatísticos, a aborda-
utilizando programas diferentes, as apostilas 
gração para a Plataforma R. O último capítulo é 
ento amostral. Embora no cotidi-
ano da pesquisa o planejamento venha antes 
parados para entender o que é planejamento 
amostral. 
. 
I
O título “Bioestatística Aplicada” pede uma justi-
ficativa, afinal, o termo “aplicada” não seria im-
gem EPR é uma forma de ver a ciência como 
 
cito a alquer texto de bioestatística? 
uma atividade em que estamos estabelecendo
relações e a ver a estatística como uma ferra-
impor te se separar dois contextos da esta-
tica, o ontexto da criação e fundamentação 
nossa ênfase é compreender como se estabe-t
menta que ajuda neste trabalho. Por isto, a 
temát a e o contexto da aplicação. Há pro-
lecem relações mais do que saber como funcio-
na a ferramenta. 
sionais ue desenvolvem ferramentas estatís- 
as e aliam suas aplicações e limitações, 
s há mbém pessoas que sabem utilizar os 
A introdução à estatística formal do primeiro 
 
odutos estes profissionais com muita compe-
capítulo pode ser vista como uma introdução ao
estudo das relações que são estabelecidas com 
cia a nas com a base necessária para o 
o da e atística. O primeiro é como um enge-
decisões a partir de um conjunto de dados e de 
critérios pré-estabelecidos. Neste capítulo, a us
nh
cais e o segundo é como um piloto ou um músi-
estatística formal é apresentada como uma 
extensão da estatística intuitiva utilizada no 
. Quan o uma pessoa que conhece a funda-
ã
cotidiano. Embora a estatística intuitiva tenha 
ntaç e a aplicação vai ajudar outra pessoa 
m um roblema estatístico, não se espera 
suas limitações, já dominamos muito da lógica 
 
e a p eira explique noções de cálculo de 
da estatística, e a percepção disto nos ajuda a
perder o medo dela. Nos capítulos 3º e 4º são 
obabilide e faça demonstrações de fórmu-
s
apresentados os conceitos necessários para 
 (que es mecânicas), espera-se que ela vá 
eto ao ssunto e explique qual é a ferramenta 
escolher testes e gráficos em função de carac-
ropria , quais suas premissas e limitações, 
terísticas dos dados, de premissas e de diferen-
ças de poder de testes. Terminada a leitura 
mo se ealiza o teste em um programa esta-
 
destes capítulos, é importante consolidar os 
tico e ual é o gráfico mais apropriado para 
munic os resultados (questões de condu-
conceitos e praticar bastante usando programas 
 
o). É i portante se diferenciar o conteúdo de 
 
estatísticos com o auxílio de guias para testes e
gráficos. Temos usado o programa MYSTAT12, 
 livro d apoio na formação de estatísticos a versão livre do programa SYSTAT12, para o 
 construtores de instrumentos) de 
 livro d poio para usuários (pilotos, músi-
qual as apostilas mostram como os testes e 
gráficos são realizados. Entretanto, mesmo 
co
tenham esta proposta, alguns autores (e.g. 
ac aughton 2002, Magnusson & Mourão 
podem ser utilizadas na determinação de qual 
gráfico ou teste é utilizado em cada situação. M
20
temática e ainda maior nos conceitos associa-
os ao uso da estatística. Esta diferença de 
Em função de uma demanda de maior flexibili-
dade e outras vantagens, iniciaremos uma mi-
d
ênfase justifica o termo “Bioestatística Aplica-
a”. 
sobre planejam
d
 
O subtítulo “EPR, Conceitos e Planejamento” 
resume o conteúdo: “EPR” (Entidade-
Propriedade-Relação) é uma abordagem para 
transformar problemas biológicos em problemas 
estatísticos; “Conceitos” são aqueles
da análise, optei por posicionar este capítulo 
depois dos capítulos 3º e 4º porque acredito que 
os estudantes ganham mais domínio dos con-
ceitos após as aulas práticas, e ficam mais pre-
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
tica intuitiva e es-
a formal 
esquisas e atividades em algumas áreas de 
prender a dirigir é importante, mas a questão 
os carros mudaram muito, quebram menos, são 
is e para preparar melhor os 
studantes para conhecer a diversidade (cres-
. 
1. Estatís
tatístic
 
1.1 Uma ferramenta muito útil 
 
P
atuação do biólogo podem ter pouco uso de 
estatística (e.g. anatomia, taxonomia, direito 
ambiental), mas, na maioria das áreas, o uso da 
estatística é generalizado e algumas vezes 
intenso e complexo. É importante entender que 
a estatística tornou-se parte essencial da for-
mação do biólogo. A boa notícia é que dominar 
as principais análises básicas da estatística hoje 
pode ser bem menos traumático do que era até 
recentemente para quem não tem muita afini-
dade com a matemática. 
 
A estatística serve para ajudar na descrição de 
fenômenos e na tomada de decisões. Por muito 
tempo descrevemos e tomamos decisões na 
ciência sem estatística ou com pouca ajuda da 
estatística. Entretanto, embora a estatística não 
seja critério de cientificidade, ela é uma ferra-
menta poderosa, e neste sentido ela é necessá-
ria ao pesquisador. Entenda por analogia: a 
rigor, não precisamos de carros para nos deslo-
car, entretanto, poucas pessoas fariam longas 
viagens a pé se tiverem um carro à disposição. 
Os pesquisadores de hoje precisam tanto da 
estatística como as pessoas dependem de mei-
os de transporte. Há situações na pesquisa em 
que a estatística é tão inútil como um carro no 
meio de um pântano. Entretanto, é preciso ter 
claro que não se pode deixar de usar estatística 
simplesmente porque não se gosta dela: é a 
situação que define a necessidade. Evitar a 
estatística pode restringir muito seu campo de 
trabalho. 
 
A
é: como se aprende a dirigir? Qual seria a utili-
dade de se ter um curso com ênfase em mecâ-
nica de motores? Qual o interesse de sabermos 
como se monta um carro? Há poucas décadas 
a resposta seria que este conhecimento era 
fundamental, pois os próprios motoristas tinham 
que consertar os carros freqüentemente. Mas 
mais fáceis de serem utilizados e mais difíceis 
de serem consertados. Conseqüentemente, já 
não precisamos saber mecânica e podemos dar 
maior ênfase aos conceitos relacionados com o 
ato de dirigir. Da mesma forma, os cursos de 
estatística precisam se ajustar à nova realidade 
de computadores que realizam os cálculos. 
Com os ajustes nos cursos, haverá mais tempo 
(e paciência de estudantes) para reforçar os 
conceitos essencia
e
cente) dos testes. 
 
Algumas pessoas têm medo de aprender a 
dirigir e outras de aprender estatística. O “me-
do” é uma das maiores barreiras para o apren-
dizado de estatística. Cursos de estatística de-
vem ser ajustados para reduzir este medo. Des-
crever e tomar decisões são atividades intuitivas 
que realizamos em nosso cotidiano com natura-
lidade. Portanto, em um curso de estatística, 
apenas estamos desenvolvendo algo que já 
sabemos. Esta concepção é importante para 
que o uso da estatística torne-se algo tão natu-
ral como dirigir um carro. 
 
O objetivo deste livro é que, ao seu final, você 
sinta-se tão confortável com a estatística como 
uma pessoa se sente em um carro após apren-
der a dirigir e, após um pouco mais de treino, 
que você esteja pronto (a) para enfrentar com 
confiança os caminhos mais difíceis da pesqui-
sa. 
 
Neste capítulo veremos: a) que a aplicação 
correta da estatística é uma das quatro preocu-
pações principais para a confiabilidade de um 
estudo; b) que a estatística pode ser dividida em 
dois tipos; c) que fazemos no cotidiano de forma 
natural e intuitiva o que a estatística formal faz 
na pesquisa, só que somos mais rápidos, me-
nos acurados e menos precisos; d) que a esta-
tística tem a ver com hipóteses, níveis de signi-
ficância e cálculo de probabilidades. Ao final do 
capítulo faremos algumas considerações com-
plementares sobre esta parte introdutória da 
estatística
5 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
i-
damental 
ra ele a-
ender a realizar análises válidas. Entretanto, 
lisamos e discutimos. 
ote que estas partes do trabalho coincidem 
s para estudantes se 
setos capturados em armadilhas como um 
na discussão e na generalização 
dos resultados. 
1.2 Pergunta, coleta, medida, estatíst
ca e generalização 
 
Um treinamento em estatística é fun
na formação de um pesquisador pa
pr
uma análise estatística válida não garante uma 
pesquisa válida. Precisamos também aprender 
a perguntar, coletar, medir e generalizar, pois as 
nossas conclusões só serão convincentes se 
forem validadas em quatro etapas que apresen-
taremos aqui. 
 
Pesquisas começam com perguntas. É impor-
tante conhecer o assunto para fazer perguntas 
relevantes. Depois planejamos uma coleta de 
dados, escolhemos formas de medir variáveis, 
coletamos os dados, ana
N
com as partes de um artigo: Introdução, méto-
dos, resultados e discussão. Em cada uma de-
las podemos cometer erros, por isto, precisa-
mos mostrar que nossas escolhas e nossas 
ações foram válidas. Não abordamos a fase de 
pergunta, pois ela é específica para cada traba-
lho, mas podemos discutir as outras etapas. 
 
1) Validação Interna. A forma como os dados 
foram coletados previne explicações alternati-
vas à conclusão? Se eu pescar sempre muito 
peixe no lago A e você sempre pescar pouco 
peixe no lago B podemos afirmar com seguran-
ça que no lago A tem mais peixes? Quem ga-
rante que nós dois temos a mesma habilidade 
de pescar? Dúvidas deste tipo seriam inaceitá-
veis em uma pesquisa científica. Quando não 
há um planejamento amostral, existe até o risco 
que todos os dados de um estudo precisem ser 
coletados novamente. A validação interna será 
discutida longamente no capítulo 5. 
 
2) Validação da medida. 
 
 
Até que pontoa medida utilizada em nossa 
análise reflete fielmente aquilo que estamos 
discutindo? Quando você mede uma planta 
pequena ou conta ovos em um ninho, normal-
mente não há com que se preocupar. Mas 
quando nós utilizamos um índice de inteligência 
(QI), estamos realmente medindo inteligência? 
Imagine que perguntamo
eles sabem nadar (valores= sim ou não) e nós 
concluímos que os meninos sabem nadar com 
maior freqüência que as meninas. Os meninos 
nadam mais ou mentem mais? O número de 
pegadas de predadores em uma praia pode ser 
considerado um indicador de pressão de preda-
ção sobre ovos de tartaruga? Você usa o peso 
de in
índice de disponibilidade de alimentos para 
lagartos insetívoros, mas este é um bom índice? 
O que acontece se os insetos capturados não 
forem os mesmos que os lagartos consomem? 
A concentração medida de fósforo total no solo 
realmente reflete o fósforo disponível para uma 
planta? Podemos comparar dados de estudos 
de uma variável que é tão difícil de ser medida 
que tem diferentes valores em laboratórios dife-
rentes? Se as incertezas sobre medidas são 
uma fonte de dúvida (e isto é bastante comum), 
seria um erro deixar de detalhar a forma da 
medida e de considerar sua eventual imprecisão 
e acuidade 
6 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
clusão”: A abor-
crever relação com variável de-
ho 
mostral foi determinado considerando-se β). 
outras situações. Se eu concluo que machos da 
borboleta da espécie X são mais ativos que 
fêmeas da mesma espécie na Reserva Ducke 
baseado em coletas feitas em janeiro de 2006, 
o que é razoável se supor?: a) Os machos des-
ta espécie são mais ativos que as fêmeas todos 
os anos? Durante o ano todo?; b) os machos 
são mais ativos que as fêmeas 1, 10, 100 ou 
1000 km dali? c) outras espécies do mesmo 
gênero têm machos mais ativos em janeiro? 
Espécies desta família têm machos mais ativos 
em janeiro? Obviamente, quanto mais distante 
da situação estudada, maior o risco da extrapo-
lação. Outro exemplo, estudos do comporta-
mento desta borboleta feitos em laboratórios 
rva Ducke 
m janeiro de 2006 se não podemos generali-
etar em outras épo-
cas e outros locais, mas isto pode não ser prati-
cável e permaneceria a limitação de não poder 
generalizar além das épocas e locais dos estu-
dos. Portanto, quase todos os estudos generali-
zam seus resultados, a questão é até onde 
podemos generalizar. A validação externa inclui 
argumentos, citações e dados adicionais que 
justifiquem a generalização. 
 
3) Validação “Dados→Con
agem matemático-estatística escolhida é real-d
mente apropriada para a conclusão a que se 
chegou? Aqui entram os livros de estatística. 
Nos capítulos 3 e 4 apresentaremos as bases 
conceituais para a escolha e aplicação de tes-
tes. Exemplos de erro: utilizar testes paramétri-
cos sem considerar as premissas destes testes 
para os dados coletados; desbalanço amostral 
extremo entre os níveis da variável independen-
te; utilização de regressão de mínimos quadra-
os para desd
pendente contínua com “níveis livres”. Concluir 
que “não há relação” ao invés de “não há evi-
dência 
 
de relação ao aceitar Ho (exceto se o taman
 
a
Não efetuar ajustes em testes múltiplos; Base-
ar-se apenas em gráficos de barras ou propor-
ções para concluir algo que exige um teste. 
 
4) Validação Externa. Até que ponto as con-
clusões com base nos dados coletados podem 
ser extrapolados no tempo, no espaço e em 
realmente refletem o que seria o comportamen-
to na natureza? Se restringirmos nossas gene-
ralizações ao universo amostrado e utilizarmos 
medidas diretas, não há problema de validação 
externa. Entretanto, qual é o interesse do com-
portamento de borboletas da Rese
e
zar? Bem, poderíamos col
 
 
Embora as quatro validações sejam importan-
tes, na prática, as duas primeiras são as mais 
críticas. Se você mediu ou coletou os dados de 
forma incorreta, possivelmente terá de medi-los 
novamente. Se você analisou os dados de for-
ma incorreta ou realizou generalizações não 
apropriadas, ainda poderá se corrigir. Por isto, é 
importante ter em mente que o treinamento em 
análise de dados vai além do treinamento em 
estatística. No capítulo 5 discutiremos desenho 
amostral. 
V. dep? Binário 
(Categ. de 2) Categórico 
Ordinal ou 
Quantitativo 
Situação I* 
Quantitativo 
Situação II* 
V. ind.? 
Binário 
(cat. de 2) 
Teste de 2 prop., 
T. Exato de 
Fisher ou T.C. (j) 
Tabela de 
Contingência (TC) 
(k) 
Mann- Whitney 
(l1) 
Teste t (de 2 
grupos) (m) 
Categórico Tabela de Contingência (k) 
Tabela de 
Contingência (k) 
Kruskal-Wallis 
ou Friedman (n)
Análise de 
Variância (o) 
Ordinal Mann- Whitney; Cochrans TLT (l2) 
Dicotomizar VI ou 
VD e usar teste 
apropriado (Max. 
Balanço) (p) 
Correlação de 
Postos (q)/ RNL
Correlação de 
Postos (q)/ RNL
Quantitativo Regressão Logística (r) 
Dicotomizar VI ou 
VD (Max. Balanço) 
(p) 
Correlação de 
Postos (q)/ RNL
Pearson/ 
Regressão 
Linear/ RNL (s) 
7 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
 Estatística pode ser dividida em dois tipos: 
 é estatística descritiva. 
 
A estatística descritiva é a primeira estatística 
que se ensina nos cursos, mas não é necessa-
riamente simples (e.g. modelagem matemática 
associada a estatística inferencial). A base de 
estatística descritiva já é dada no ensino médio, 
incluindo medidas centrais como média e medi-
das de variação como desvio padrão. Por ser 
m conhecimento básico, não trataremos dele 
m-
temos evidência para inferir sobre a população 
de onde a amostra foi tirada (se houver valida-
ção interna) ou para uma população mais ampla 
(dentro das considerações da validação exter-
na). Esta definição técnica ficará mais clara 
adiante. A função da estatística inferencial é 
medir a força da evidência em uma argumenta-
ção (nas situações em que podemos medir 
probabilidades), isto é, medir a força de uma 
iência é con-
encer aos outros (pesquisadores, população) e 
1.3 Dois tipos de estatística 
 
A
Estatística descritiva e Estatística inferencial. A 
estatística descritiva serve para sintetizar dados 
e mostrar formas de relações. Isto pode ser feito 
em diferentes graus de complexidade. Por e-
xemplo, é difícil concluir alguma coisa de duas 
listas de comprimentos de besouros. Com duas 
médias podemos ver uma diferença, mas é uma 
síntese extrema. Podemos ter médias e desvios 
padrões ou erros padrões, o que nos dá uma 
idéia melhor. Podemos ter duas fórmulas de 
curvas de distribuição de comprimentos, que é 
uma descrição mais informativa, ou um gráfico 
com a curva de freqüência dos dados, na qual 
toda a informação poderia ser apresentada. 
Tudo isto
u
aqui, mas você pode fazer uma revisão nos 
primeiros capítulos de livros de estatística (ver 
lista de referências). Abordaremos um aspecto 
de estatística descritiva: a elaboração de gráfi-
cos efetivos. Algumas análises descritivas co
plexas estão sendo utilizadas cada vez mais em 
biologia, principalmente o uso de Análises Mul-
tivariadas em estudos de ecologia de comuni-
dades e de filogenia. Dada a sua complexidade, 
não podem ser incluídas em um texto de fun-
damentos de estatística como este. 
 
Esta separação não é absoluta, pois as duas 
estatísticas são utilizadas juntas e interagem na 
análise de dados. Por exemplo, em um gráfico 
com ume linha de regressão, é a estatística 
inferencial que determina que a reta pode ser 
colocada no gráfico e a descritiva que nos per-
mite desenhar a linha de regressão. Vejamos 
então o que é a estatística inferencial. 
1.4 A estatística inferencial e a intuição 
estatística. 
 
O mundo é feito de idéias.Ter idéias novas é o 
começo na geração do conhecimento, mas para 
decidir quais são verdadeiras temos que olhar 
para o mundo. Nem tudo se decide com uma 
observação, a decisão pode se basear na fre-
qüência com que algo ocorre. 
 
A estatística inferencial é a estatística em que 
você entra com uma hipótese e dados e ela 
responde com um sim ou um não. Tecnicamen-
te, é a estatística da validação de hipóteses 
sobre valores de uma propriedade de uma po-
pulação ou sobre uma relação entre proprieda-
des de entidades de uma população. A partir de 
amostras (dados coletados), verificamos se 
"prova". Um momento crucial da c
v
até a nós próprios sobre a qualidade de uma 
"prova". É por isto que ela é tão importante. 
 
Nem sempre precisamos ou podemos utilizar 
estatística, pois esta não é a única forma de se 
obter provas. Mostrar uma determinada estrutu-
ra em um animal seria uma "prova" que ele 
pertence a certo gênero. Um registro de um 
pesquisador que observou certo animal se ali-
Fig. 1-1- Uma estrutura pode provar que uma espécie é nova 
8 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
a" dentro d
a discussão sobre cadeia alimentar. A foto-
to foi a tripula-
ão de Magalhães com a circunavegação com-
as em um 
upermercado, 
número de pes-
soas (regressão 
a (análise intuitiva de resí-
tuição estatística 
ara 
mentando de outro seria uma "prov
m 
e re
u
grafia de um vírus em uma pesquisa sobre as 
causas da AIDS em um doente seria a prova de 
que a doença seria transmissível por este agen-
te. Cristóvão Colombo teria "provado" que a 
terra era redonda atingindo as Índias viajando 
para Leste, ao invés de ir para Oeste. O cotidia-
no da investigação, da história e da vida envol-
ve provas que não são estatísticas. 
 
Qualquer prova está sujeita a erros. A estrutura 
que seria característica do gênero pode ser 
resultado de uma anomalia rara. O pesquisador 
que fez o depoimento pode ter se enganado. 
Cristóvão Colombo estava certo e errado, a 
terra de fato é redonda, mas ele não atingiu as 
Índias. Quem realmente provou is
ç
pleta. A foto do vírus poderia ter sido um erro 
técnico, ou outro vírus que não fosse da AIDS. 
É possível tomarmos medidas preventivas para 
diminuir a chance de erros, mas é impossível 
calcularmos a probabilidade de um erro deste 
tipo acontecer. 
 
A estatística inferencial é usada para avaliações 
de idéias que dependem de várias observações. 
A estatística inferencial é um aperfeiçoamento 
da intuição estatística. É semelhante à nossa 
matemática intuitiva que usamos no cotidiano. 
Quando atravessamos uma rua: calculamos a 
velocidade do carro que vem e a velocidade que 
podemos correr e, se formos prudentes, che-
gamos a salvo do outro lado. Imagine os cálcu-
los instantâneos que fazemos quando rebate-
mos uma bola durante um jogo de tênis. Quan-
do terminamos de fazer as compr
s
se queremos ir 
logo para casa, 
baseados em 
nossas experiên-
cias anteriores 
de compras, 
escolhemos um 
caixa com menor 
tilinear intuitiva), mas também levamos em 
conta quanto está cheio de mercadorias o carri-
ho de cada pesson
duos). É importante ter consciência que existe 
esta estatística intuitiva, porque uma das dificul-
dades de se aprender estatística está em achar 
que é algo estranho à nossa forma de pensar. 
Não é. A estatística inferencial apenas dá mais 
precisão e poder à nossa forma cotidiana de 
pensar. Vamos apreciar a in
com mais exemplos. 
 
Imagine que Cabral, em 1500, encontra um 
indiozinho de pele mais clara no meio de uma 
aldeia. Ele tinha percebido que o tom da pele 
dos índios era mais escuro que dos portugue-
ses e que o indiozinho era claro demais. Ele 
conclui que homens brancos já estiveram aqui 
antes dele. Então, ele pede para Caminha es-
crever ao rei que mande tropas para vigiar, 
porque outros europeus podem pensar em in-
vadir. Com uma grande visão de futuro, o rei 
resolve transferir a sua corte para o Brasil, que 
cinco séculos depois torna-se a maior potência 
econômica do mundo, etc. Tudo bem, nada 
disto ocorreu. O que importa é que coisas assim 
ocorrem, e Cabral teria utilizado intuição estatís-
tica para decidir que o indiozinho estava fora 
dos padrões (foi um teste Kolmogorov-Smirnov 
de duas amostras associado a um teste t uni-
caudal para uma amostra). Ele teria utilizado o 
gráfico a seguir, sem realmente construí-lo, p
sua conclusão. 
 
Outro exemplo. Seria impressão sua ou a cerve-
ja no bar A tem um sabor estranho? Você toma 
cerveja no bar B e o sabor é melhor. Outro dia, 
novamente a cerveja no bar A parece pior. No 
Fig. 1-2- Representação gráfica da avaliação feita com estatística intuitiva de Cabral. 
Indiozinho
Indios
Portugueses
0 100 200
Concentraç
300 400 500
ão de melanina
9 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
 
 
 
 antropólogo quer avaliar se 
o e fácil de 
aioria 
ó concor-
o é con-
nho 
a 800 
ais que 
te critério, 
e uma proporção 300:500 
eja tão improvável nesta situação. A chance 
bar B está boa. Passam-se semanas e o padrão 
se repete. Ai você finalmente decide que não 
tomará mais cerveja no bar A. O que você fez, 
sem pensar muito, foi uma operação de decisão 
estatística representada na figura a seguir. 
 
 
 
 
 
 
 
 
 
 
 
 
 Em algumas culturas o cuidado aos filhos é 
maior do que o cuidado às filhas. Se as condi-
ções sanitárias forem ruins, isto pode até levar a 
um desvio na razão sexual das crianças. Imagi-
emos, que umn
existe este fenômeno na Amazônia. Ele conta o 
número de meninos e de meninas que ele en-
contra. Em diferentes momentos 
da pesquisa ele encontra os 
resultados da tabela 1. Em que 
momento o pesquisador pode 
concluir que a razão sexual de 
63% de meninos está fora do 
esperado (50%)? (Em sala de 
aula é explicado o cálculo do Qui 
Quadrado, que não é o 
melhor para este caso, 
mas que é válid
compreender.) 
 
Invariavelmente a m
dos estudantes s
da que a conclusã
fiável com um tama
amostral superior 
(alguns exigem m
80.000!). Com es
alguns estudos ia
ser considerados convincentes. O importante 
neste exercício é verificar a semelhança e a 
diferença de decisões com e sem estatística. A 
lógica nos dois casos é a mesma. Estamos 
decidindo se há ou não algo de anormal consi-
derando freqüências esperadas. A estatística 
intuitiva é muito rápida, o que é bom para a 
maioria dos problemas cotidianos, entretanto, 
ela não é apropriada para situações que reque-
rem um pouco mais de precisão e objetividade. 
Não fazemos idéia qu
m levar uma vida inteira para 
s
disto acontecer por acaso é tão baixa que des-
cartamos a possibilidade de ter sido por acaso e 
aceitamos uma interpretação alternativa: há 
uma diferença de fato na população. 
 
 
Tab. 1- Probabilidades no a- estudo imaginário do texto com base em tam
nhos amostrais crescent s-es para uma mesma proporção diferente do e
perado de 1:1. Apesar do poder da estatística intuitiva para muitas ques-
tões cotidianas, vimos em sala de aula que ela varia bastante entre pes-
soas e que a maioria das pessoas subestima o poder do tamanho amos-
tral prendendo-se a porcentagens. O exercício mostra ainda a essência 
dos testes estatísticos: tomar uma decisão calculando a chance de um 
resultado ocorrer ao acaso; se a probabilidade é muito baixa, podemos 
assumir que não foi por acaso e que algum fator determinou o resultado 
observado. 
Tempo Meninas Meninos χ2 Probabilidade 
1 dia 3 5 0.5 0.48 
3 dias 30 50 5 0,0253 
1 mes 300 500 50 1,5x10 -32
1 ano 3000 5000 500 9.5x10-111 
10 anos 30000 50000 5000 ?! 
1 geração 300000 500000 50000 ?!!!!!!!!!! 
A B 
BAR 
0 
1 
2 
3 
4 
Q
ua
lid
ad5 
6 
7 
8 
a 
ce
rv
ej
a 
e 
d
Fig. 1-3 Representação gráfica de uma decisão do cotidiano 
10 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
ntre 
rgunta e hipótese no contexto da estatística 
inferencial. Prefiro a definição “Hipótese é uma 
possibilidade de resposta para uma pergunta 
com duas ou mais alternativas”. Uma caracterís-
tica importante das hipóteses é que elas nunca 
vêm isoladas, pois se não houvesse alternativas 
elas seriam fatos ou tautologias. Quem comeu o 
bolo? Uma hipótese é “foi o gato”. Para cada 
outro suspeito teríamos uma hipótese, ou po-
demos ter outra única hipótese alternativa com-
plementar: “não foi o gato”. 
assemos a um caso biológico: bromélias ab-
orvem fósforo da água que fica acumulada 
ntre suas folhas? A princípio, plantas absor-
em nutrientes pela raiz; seriam as bromélias 
xceções, sendo capazes de absorver pelas 
lhas? A hipótese “da novidade” é chamada 
ipótese alternativa (Ha ou H1), e a hipótese 
ue não há novidade (bromélias também não 
bsorvem nutrientes pelas folhas) é chamada 
ipótese nula (Ho). Da forma como colocamos o 
roblema, uma, e apenas uma, das duas hipó-
arcado na água acumulada e bast a 
nálise da presença de fósforo marcado nos 
 as s 
o. E ia 
tatís ra 
rov -
in 
s
 com 
omélias como controle e 
crescentamos um pouco de fósforo na água de 
também é 
lgo grave, ainda mais se pensarmos que um 
ia poderíamos ser nós mesmo em um banco 
de réus. Por isto, toda pessoa deve ser conside-
in que um
tanto, po elhor qu ja a justiç nun-
 será pe a e há tro resul ssí-
s em u lgamen ) pode ar 
der pess ocent a); 
odem ndar er um a ssino; 
dem tar essoa e 
1.5 Hipóteses, erros e grau de rigor. 
 
A definição comum “Hipótese é uma formulação 
provisória, com intenções de ser posteriormente 
demonstrada” não deixa clara a relação e
pe
 
P
s
e
v
e
fo
h
q
a
h
p
teses está correta. Poderíamos co foro locar fós
m aria um
a
tecidos da planta para provar que
conseguem absorver este fósfor
uma abordagem sem apoio es
responder esta questão (isto é, “p
tese alternativa). Entretanto, imag
tenhamos acesso a esta téc
mos usar uma abordagem e
 
Neste caso, para usar uma 
tica temos de transformar um
Não podemos ver o fósfor
podemos prever que, se ela
mais fósforo na água maior 
(considerando que fósforo co
mento limitante para o cres
criamos a hipótese (Ha) qu
mais fósforo crescem mais. Como nenhuma 
hipótese nasce sozinha, automaticamente nas-
ce também a hipótese nula complementar: as 
plantas com mais fósforo não vão crescer mais. 
Então, sorteamos 20 br
bromélia
sta ser
tico pa
ar” a hipó
e que não
a
outras 20, e passados alguns meses, medimos 
as plantas e verificamos que todas as plantas 
do segundo grupo estão bem maiores que as 
plantas do primeiro grupo. Provamos, certo? 
Mas e se o resultado for menos evidente, diga-
mos que as plantas do primeiro grupo foram em 
média maiores, mas nem tanto assim. Esta 
diferença na média já basta como prova? Qual 
a chance de estarmos cometendo um erro ao 
decidirmos que a hipótese proposta estava cor-
reta? 
 
O julgamento de qual das duas é a hipótese 
correta em pesquisa é análogo ao julgamento 
de um possível assassino em um tribunal. Co-
mo vimos muitos filmes sobre tribunais, deve 
ser mais fácil de entender, vejamos o que ocor-
re. 
 
Um assassino solto é algo ruim e deve ser evi-
tado. Entretanto, um inocente preso, 
a
d s 
nica, então, pode-
tatística. 
abordagem estatís-
 pouco a questão. 
o absorvido, mas 
 absorver, quanto 
será o crescimento 
stuma ser um ele-
cimento). Por isto, 
e as plantas
4) podemos libertar um assassino (impunidade). 
A tabela abaixo resume estas possibilidades. 
 
Realidade Î 
 Inocente Culpado 
rada ocente até haja a evidência real-
mente convincente de que ela é o culpada. En-
tre r m e se a, ela
ca rfeit qua tados po
vei m ju to: 1 mos mand
pren uma oa in e (injustiç
2) P os ma prend ssa
3) Po os liber uma p inocente
Decisão Ð 
Culpado Injustiça Decisão Correta 
Inocente Decisão Correta Impunidade 
11 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
ar 
a as chances de defesa para o réu. Por 
nservadorismo. Os 
ibunais justos devem ser conservadores quan-
 recebe-
m fósforo na água acumulada cresceram mais 
 
 e comparamos este valor com um valor 
). “Extremamente improvável” significa um 
e tentar estimar matematicamente 
o tamanho da amostra para uma chance de erro 
tipo d tretan a-
ções em que o erro tipo II é importante e então 
são os pro s dif
ção 
 
Em rigor c e-
ria s nte ele m a 
intuitiva (a probabilidade das testemunhas não 
estar mentindo) do que estatística formal (e.g. 
A justiça séria deve ser conservadora e d
d sto
outro lado, crimes deixam rastros. O governo 
deve investir dinheiro em uma polícia investiga-
tiva, para obter dados que permitam incriminar 
ou inocentar o réu. É desta forma que podemos 
reduzir os erros ao mínimo possível, reduzindo 
tanto a injustiça quanto a impunidade. De qual-
quer forma, não há como evitar totalmente am-
bos os erros. Se formos conservadores demais 
(em termos de resistir em considerar suficientes 
as evidências de crimes), estaremos cometendo 
impunidades com maior freqüência; se formos 
apressados e aceitarmos provas questionáveis, 
estaremos arriscando mais casos de injustiças. 
Ë uma questão de grau de co
tr
to à inocência, mas não a ponto de ignorar evi-
dências realmente muito convincentes. 
 
O mesmo princípio conservador se aplica na 
pesquisa (em geral, discutiremos exceções 
depois). Ao propor uma nova idéia, cabe ao 
pesquisador (a) encontrar evidências de que a 
idéia é correta, isto é, cabe a ele (a) rejeitar a 
hipótese nula (H0). No exemplo da bromélia, a 
princípio, a planta não absorveria o fósforo da 
água acumulada e o crescimento das bromélias 
dos dois grupos seria semelhante. Note que não 
basta uma diferença nas médias, pois, na au-
sência de efeito, uma das médias seria maior (o 
empate é tão improvável como a chance de 
uma moeda cair em pé), de forma que a chance 
do segundo grupo ser maior é de aproximada-
mente 50%. Ninguém desconfiaria que uma 
moeda está viciada com base em um único 
lance. Entretanto, se o estudo foi conduzido 
cuidadosamente e as 20 bromélias que
ra
que a média e as outras 20 que não receberam, 
cresceram menos que a média, temos uma 
prova indiscutível, pois a chance disto ocorrer 
ao acaso é bem menor que 1 em 1 bilhão (teste 
Exato de Fisher). O erro ainda é possível, e 
neste caso é chamado de erro tipo I, ou falso 
positivo, o erro de rejeitar a hipótese nula quan-
do ela é verdadeira, e nós a rejeitamos porque é 
extremamente improvável. 
 
 
Mas o que concretamente podemos chamar de 
“extremamente improvável”? Difícil dizer quando 
usamos estatística intuitiva, mas somos bem 
precisos quando usamos estatística formal. Nós 
calculamos a probabilidade (P) que certo resul-
tado (nossos dados) pudesse ter ocorrido ao
caso
Realidade Î 
H0 Verdadeira H0 Falsa 
a
pré-estabelecido (a priori) como um limite (por-
que regras tem que ser estabelecidas antes de 
um jogo). Este limite é a “probabilidade de erro 
tipo I e é representado pela letra grega α (e.g. 
α=0,05). Quando expresso como porcentagem, 
ele é chamado de Nível de Significância (e.g. 
%5
“P” calculado além de α, mais improvável que α. 
Se α=0,05, valores como P=0,01 ou P=0,00045 
são extremos; valores como P=0,05 ou P=0,09 
ou P=0,76 não são extremos. 
 
O erro oposto é aceitar a hipótese nula quando 
ela é falsa (erro tipo II ou falso negativo). É im-
portante destacar que o falso negativo não é 
evidência de “inocência”, o efeito pode não tersido detectado por falta de dados. O predomínio 
em pesquisas é de situações análogas às des-
critas acima, nas quais a preocupação maior é 
com o erro tipo I. Normalmente a preocupação 
com erro tipo II restringe-se a tentar controlar 
variáveis de ruído e de se obter uma amostra 
rosseiramente considerada como suficiente g
sem sequer s
 II (β) defini a a priori. En to, há situ
necessári
1.6). 
cedimento erentes (se-
tribunais, o
er) basta
das evidên ias é (ou dev
ais estatísticvado. Há
DecisãoÐ 
Rejeita H0 Erro tipo I Decisão Correta 
Aceita H0 Decisão Correta Erro tipo II 
12 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
tretanto, 
omo vimos no exemplo do antropólogo (seção 
plos: a) Você quer 
rovar que bromélias absorvem fósforo da água 
acumulada entre suas folhas (seção 1.5); 
b) eri e a-
tório destinada a consumo humano está conta-
minada por mercúrio após uma acusação que 
alguém contaminou o reserv
apresentar o resultad xame de sangue 
no a conc elat a 
 anterior, ações 
odem ter de preceder as coletas em problemas 
u ou não mudou. Digamos que a 
cusação foi que um galão de certo produto 
um teste de DNA). Qual é a chance das digitais 
de uma pessoa suspeita coincidirem com digi-
tais de outra pessoa que estavam na arma do 
crime. Embora isto não seja logicamente impos-
sível, é tão improvável que é considerada uma 
prova suficiente. Esta probabilidade dificilmente 
pode ser quantificada, entretanto, jamais foram 
encontradas duas digitais iguais de pessoas 
diferentes. 
 
A pesquisa científica tem a mesma lógica, mas 
tem algumas vantagens. Na investigação cientí-
fica é mais comum encontrarmos situações em 
que podemos aplicar análises estatísticas, es-
pecialmente em experimentos, de forma que 
podemos calcular a chance da hipótese nula 
com precisão. Normalmente o valor de α em 
estudos biológicos é de 0,05 ou 0,01, o que já é 
um critério razoavelmente rigoroso. En
c
1.4), a estatística formal é mais objetiva e ge-
ralmente menos conservadora que a estatística 
intuitiva costuma ser. 
 
1.6 Considerações complementares. 
a) Entre o sim e o não existe um vão. 
Neste capítulo passamos a visão de tomada de 
decisões predominante nas análises estatísticas 
mais comuns em que temos duas opções: o 
“sim” e o “não”, como em um tribunal em que 
uma pessoa é considerada inocente ou culpada. 
Entretanto, nem sempre as decisões são assim. 
Podemos decidir em três categorias: o “sim”, o 
“não” e o “talvez” (indefinido). Podemos ainda 
decidir em mais categorias: o “sim forte”, o “sim 
fraco”, o talvez, o “não fraco” e o “não forte”. 
Para agentes de seguros, estas categorias po-
dem até ser tratadas quantitativamente. Quando 
estamos lidando com duas categorias, “sim” e 
“não”, na realidade este “não” significa “talvez”. 
Aceitar a hipótese nula é um resultado de pouco 
valor na estatística tradicional. Por isto, há a-
bordagens alternativas nos contextos em que é 
importante separar o “talvez” do “não”. 
Considere os seguintes exem
p
você quer v ficar se a água d um reserv
atório; c) você vai 
o de um e
 rqual há um entração ivamente alt
de uma substância que indica câncer. 
Em todos os casos, o princípio que deve nortear 
a análise é o da prudência, mas a ação diverge 
entre estes exemplos. No exemplo A, o erro 
tipo I é considerado o mais grave, porque não 
queremos afirmar coisas novas na ciência sem 
termos evidência forte. Podemos ir mais longe 
neste raciocínio: afirmações extraordinárias 
exigem provas extraordinárias. Por isto, embora 
α padrão seja de 0,05, para afirmar algo que 
contraria uma teoria bem estabelecida com uma 
idéia ousada, podemos exigir um α mais con-
servador (e.g. 0,01 ou 0,001). Devido ao papel 
central do valor de α nesta abordagem, pode-
mos denominá-la “alfacêntrica”. 
No exemplo b, primeiro, pode ser necessária a 
ação preventiva de fechar a fonte para o con-
sumo. Diferente do exemplo
p
desta natureza. Agora pense na análise, se 
você pegar poucas amostras e não obtiver uma 
diferença significativa, você pode decidir que a 
água não está contaminada? Não, claro que 
não. Mas quantas amostras seriam necessá-
rias? Lembre que há mercúrio naturalmente na 
natureza, detectar mercúrio não prova contami-
nação. Como saber se o número de amostras é 
suficiente para comprovar se houve a contami-
nação? Note que o erro tipo II aqui é mais gra-
ve. Realmente não é possível definir se há con-
taminação, a menos que você defina previa-
mente quanto de aumento de mercúrio seria 
evidência de uma contaminação. Só se houver 
razões teóricas ou práticas para definir estes 
níveis não usuais que podemos comprovar que 
algo mudo
a
tóxico foi jogado e que calculamos que isto du-
plicaria a quantidade de mercúrio do lago. Neste 
caso, podemos calcular o tamanho amostral 
necessário para detectar esta diferença consi-
13 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
necessário que você compreenda 
ue em uma situação destas, você precisa ir 
ocorrem ocasionalmente. 
ntretanto, se ele estiver efetivamente com a 
-
se rea-
mer se 
stragada 
pode estar errada se a fome for muita e a toxi-
stá em permitir 
tomar decisões de forma simples e com menor 
derando um β definido a priori. Se não houver 
diferença significativa, então decidimos que não 
há mudança na qualidade de água que indique 
que houve esta contaminação. Há alternativas 
para se tratar a questão, como uma técnica 
chamada amostragem seqüencial ou uma avali-
ação temporal dos níveis de mercúrio. Estas 
abordagens não serão tratadas neste livro, en-
tretanto, é 
q
atrás destas técnicas 
No exemplo c, tanto o erro tipo I como o erro 
tipo II são graves. O falso positivo, que é um 
erro tipo I, é grave porque uma pessoa saudável 
pode ficar extremamente deprimida sem motivo 
real, ou pode iniciar um tratamento inapropriado 
prejudicando sua saúde. O valor obtido no exa-
me pode não ser tão alto para ser considerado 
uma prova da existência de um câncer. Por isto, 
com receio de traumatizar o paciente, você 
poderia não revelar o resultado, afinal, valores 
um pouco mais altos 
E
doença, sua conduta equivaleria a dar um falso 
negativo, que pode adiar o tratamento e com
prometer a possibilidade de cura. O que fazer? 
O procedimento neste caso deve ser de 
lizar novamente o mesmo teste ou um teste de 
outra natureza (e.g. uma radiografia). Desta 
forma, os falsos positivos serão eliminados, mas 
o poder de detecção de doentes em fase inicial 
será aumentado. 
Quando os dois erros são relevantes também 
deveríamos pensar na gravidade e nos riscos 
relativos do erro tipo I e tipo II para nossas deci-
sões. Se você chega de viagem com muita fo-
me, não encontra ninguém em casa e encontra 
um prato de comida na geladeira sem saber a 
quanto tempo está lá, você terá que decidir se 
arrisca comer ou não. A hipótese nula é que as 
bactérias ainda não tornaram a comida tóxica e 
a alternativa é que está tóxica. Com base no 
cheiro você avalia se a comida está estragada. 
A princípio, as decisões corretas seriam a) co-
mer se não estiver tóxica e b) não co
estiver tóxica, o erro tipo I teria como conse-
qüência uma intoxicação e o erro tipo II teria 
como conseqüência a fome desnecessária. 
Entretanto, dependendo do grau da fome, da 
sensibilidade do seu estômago, da chance de 
obter outro alimento antes de morrer de fome, 
do grau de toxidade e dos riscos relacionados 
com a intoxicação, os custos e os prêmios dos 
erros tipos I e II mudam. A decisão será influen-
ciada pelo balanço destes custos e prêmios. Até 
a decisão de não comer a comida e
dade for baixa. De qualquer forma, quanto mais 
informação maior a chance de tomar a melhor 
decisão.É por isto que a natureza nos equipou 
com olfato, paladar e visão como testes com-
plementares na decisão sobre ingerir alimentos. 
Problemas deste tipo dependem de técnicas de 
avaliação de riscos. 
Podemos dizer que na abordagem estatística 
tradicional alfacêntrica a chance de erro tipo II é 
tratada como risco irrelevante. Isto é uma sim-
plificação da avaliação de riscos, em que tanto 
o erro tipo I como o erro tipo II são relevantes. O 
poder da estatística tradicional e
quantidade de informação. Sua limitação é que 
não deveria ser utilizada em casos em que o 
erro tipo II tem conseqüências importantes. 
 
b) Dizer “rejeitou a hipótese nula” é diferente 
de dizer “provou a hipótese alternativa”? 
 
Tradicionalmente, a segunda frase é evitada e 
chega a ser considerada errada por alguns. 
Seria mesmo um erro? A hipótese alternativa é 
complementar à hipótese nula, logo, rejeitar 
uma implica necessariamente em provar a ou-
tra. Então, qual é o problema se “dá na mes-
ma”? Vejamos a origem deste mito na forma de 
expressar resultados estatísticos. 
 
Na estatística nas análises estatísticas mais 
comuns não calculamos diretamente a chance 
da hipótese alternativa ser verdadeira. O cálculo 
é feito com base na probabilidade de obtermos 
um determinado resultado admitindo que a hipó-
tese nula fosse verdadeira. Caso esta probabili-
dade seja pequena (P<α), rejeitamos a hipótese 
nula e ficamos com a alternativa, do contrário, 
aceitamos a hipótese nula. 
14 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
acêntri-
 Ho. Entretanto, se você pode 
 evidências para a existên-
cia de uma relação são significativas. Não te-
eito 
e irrelevante de uma variável so-
Preferir a frase “rejeitou a hipótese nula” é justi-
ficável do ponto de vista didático, pois é o que 
vem primeiro e reforça a essência da forma 
como testes estatísticos tradicionais são feitos. 
Entretanto, considerar errada a frase “provou a 
hipótese alternativa” é querer passar a didática 
por cima da lógica e da semântica, o que gera 
confusão e prejudica a própria didática. 
c) Existe “mais significativo”? 
Descrevemos a estatística tradicional alf
ca e seu número mágico (mais comum) α=0,05 
em que separamos os resultados em dois gru-
pos: quando P≥α aceitamos a hipótese nula e 
quando P≤α rejeitamos Ho. Mas será que 
P=0,04 é um resultado tão significativo quanto 
P=0,0004? E o que fazer quando P=0,051? 
Não há mágica este é apenas um critério para 
se ter objetividade; o que importa é que ele é 
definido a priori. Para ser aprovado em um cur-
so, temos que tirar nota 5,0. Em um curso mais 
rigoroso a exigência poderia ser 7,0. Seria com-
plicado se a nota de corte fosse definida depois 
da prova final. Há sim diferença no significado 
em função da probabilidade obtida, da mesma 
forma como há diferença entre passar no curso 
com 5,0 e passar com 9,5. 
O que fazer se o resultado foi P=0,051? Se 
você não vai coletar mais dados, então não há 
alternativa, você tem que seguir a regra do jogo 
e dizer que aceita
coletar mais dados, a situação muda. Você iria 
terminar uma pesquisa importante aceitando Ho 
com P=0,051? E como fica a sua confiança com 
um mero P=0,049? Não conheço nenhuma 
regra estatística formal para lidar com esta situ-
ação, mas me parece mais razoável coletar 
mais dados se P estiver entre 0,04 e 0,06 do 
que aplicar a regra a ferro e fogo quando temos 
esta opção de coletar mais. Seria suspeito cole-
tar apenas mais um dado, pois estamos em 
uma zona nublosa, eu coletaria mais 10 dados 
para acabar de definir a tendência. 
 
 
 
 
d) Significativo é sinônimo de relevante? 
 
O uso da estatística cresceu e as revistas cientí-
ficas e bancas de avaliação passaram a exigir 
que testes fossem utilizados para mostrar que 
tendências tinham relevância estatística. Esta 
pressão pelo uso da estatística contribuiu para a 
qualidade da pesquisa, mas também levou a 
alguns desvios, como a busca pelo resultado 
significativo independente da questão. Alguns 
acreditam que o “melhor” teste dentro de um 
estudo é aquele que foi mais significativo. 
 
Um aspecto psicologicamente forte no teste de 
hipóteses é que ele responde categoricamente 
(com sim ou não) se
mos um critério semelhante para atribuirmos o 
valor biológico para um teste. É uma questão de 
bom senso. A relação entre tamanho de qual-
quer espécie e seu peso é sempre fortemente 
significativa, mesmo com poucos dados, de 
forma que não é nada surpreendente obter-se 
um P<0,001 para esta relação. Um efeito signi-
ficativo obtido apenas com um tamanho amos-
tral imenso pode significar variáveis de ruído 
interferindo muito ou simplesmente um ef
biologicament
bre outra. O valor calculado de “P” tem relação 
com a “força” da evidência, não tem relação 
com a relevância da questão. 
 
A definição a priori de quais testes serão reali-
zados em um estudo é importante, entre outras 
coisas, para se definir o valor do teste antes de 
realizá-lo, para não cair na tentação de escolher 
como foco do trabalho finalizado os resultados 
que foram mais significativos, o que é uma de-
turpação do uso da estatística. 
 
e) Efeitos específicos e efeitos colaterais. 
 
Em algumas situações, particularmente no de-
senvolvimento de remédios, alimentos ou pro-
dutos que possam oferecer riscos ambientais ou 
à saúde humana, temos de ir além das conside-
rações sobre o erro tipo I e tipo II. Imagine uma 
substância com potencial para diminuir os enjô-
os durante a gravidez. Podemos testar estatisti-
15 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
 contra 
indicações. Um remédio chamado Talidomida 
ntra enjôo na 
eal, 
o os riscos ambien-
camente se o remédio é efetivo fixando o erro 
tipo I e até o erro tipo II, definindo um tamanho 
amostral apropriado com base em coletas pre-
liminares. Esta análise permitirá que se defina 
dentro dos critérios discutidos neste capítulo se 
o remédio é efetivo ou não para reduzir o enjôo. 
Entretanto, este teste só avalia o enjôo, não 
garante que este remédio não tenha
foi usado na década de 1960 co
gravidez e causou mal formações em muitos 
bebês. 
 
Ignorar efeitos colaterais não é cometer um erro 
tipo II, é um erro que extrapola o teste. Pelo 
princípio da prudência temos até que considerar 
provas circunstanciais, como uma amostragem 
sem os rigores de um desenho amostral id
como uma evidência que a atenção deve ser 
redobrada. A análise de efeitos colaterais pode 
ser complexa. Não é possível se obter uma 
garantia que nenhum efeito colateral vá ocorrer, 
mas é essencial que se considere qualquer 
indício de problema e se faça um levantamento 
exaustivo de todas as possibilidades razoáveis 
de efeitos colaterais. Novas tecnologias, como a 
transgenia, já provaram que funcionam, entre-
tanto, um acompanhamento é necessário pois 
ainda não sabemos quais sã
tais e para a saúde. Os farmacêuticos têm muito 
mais trabalho com a análise de cada possível 
efeito colateral do que da comprovação dos 
efeitos positivos. É importante não se confundir 
o poder da estatística em avaliar efeitos especí-
ficos com uma garantia sobre aspectos que 
extrapolam cada teste particular. 
 
16 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
scussão. Em que parte normalmente 
ncontramos cada forma de validação do estu-
dois exemplos de seu cotidiano que não tenham 
sido apresentados nesta apostila. 
1.9- No exemplo do antropólogo: a) houve dife-
rença entre os alunos ao utilizar a estatística 
intuitiva? Por quê?; b) houve muita diferença 
entre a atitude predominante da sala com esta-
tística intuitiva e o esperado com estatística 
formal? Por quê?1.10-Explique, sem utilizar um exemplo do tex-
to, um caso em que o erro tipo II seria mais 
grave que um erro tipo I. 
1.11 O resultado de um teste estatístico foi 
P=0,0067. Considerando se α= 0,01, conclui-se: 
a) A probabilidade limite adotada para se aceitar 
Ho é de 0,01; abaixo disto rejeita-se Ho. 
b) A coleta de dados foi tendenciosa 
c) A coleta de dados foi apropriada. 
d) A chance de erro tipo I seria menor se α= 
0,05. 
e) Aceita-se Ho, desde que a coleta de dados 
tenha sido apropriada. 
1.12- O resultado de um teste estatístico foi 
P=0,09. Considerando se α= 0,05, conclui-
se:(1,5 ponto) 
a) Há uma probabilidade de 9% de aceitarmos 
Ho. 
b) Há uma probabilidade de 9% de rejeitarmos 
Ho 
c) Podemos cometer erro tipo II se aceitarmos 
Ho neste caso. 
d) A chance de erro tipo I é alta 
e) O tamanho da amostra foi suficiente 
1.13- Na seção 1.6 a, foram dados exemplos 
para 3 situações diferentes nas quais a impor-
tância relativa dos erros tipo I e topo II variaram. 
Forneça exemplos diferentes para cada um dos 
três tipos de situação. 
1.14- Por que os estatísticos preferem dizer 
“rejeitou a hipótese nula” a dizer “provou a hipó-
tese alternativa”?; A última frase está errada? 
lguns anos a probabilidade em testes 
era apresentada de forma pouco precisa 
(P<0,05), mas hoje ela é apresentada mais 
frequentemente de forma exata (P=0,041). Ex-
plique a vantagem da apresentação com mais 
precisão. 
1.16- Por que na pesquisa científica predomina 
a abordagem que privilegia a preocupação com 
o erro tipo I? 
1.17- Porque testar efeitos colaterais é mais 
difícil do que testar efeitos específicos? 
Exercícios: 
1.1- O uso da estatística na pesquisa foi compa-
rado com o uso de um carro no cotidiano. Expli-
que a semelhança quanto à necessidade; com-
preensão de detalhes do funcionamento para 
ser um usuário; e necessidade de confiança 
para uma utilização eficiente. 
1.2- Um artigo científico divide-se geralmente 
em Introdução, Materiais e métodos, Resulta-
dos, Di
e
do (Medida, Interna, D->C; Externa). 
1.3- Qual é a diferença entre um problema de 
validação interna e um problema de validação 
externa? 
1.4- Explique um exemplo de pesquisa em que 
as conclusões são suspeitas devido a incerte-
zas na validade das medidas. 
1.5- Por que os problemas de validação da me-
dida e de validação interna são mais graves do 
que problemas de validação “dados-> conclu-
são” e de validação externa quando se está 
redigindo um trabalho? 
1.6- Qual a diferença entre as estatísticas des-
critiva e inferencial? 
1.7- O uso da estatística aumentou de forma 
explosiva nas últimas décadas. Entretanto, isto 
não significa que toda a descoberta científica 
tenha base estatística. Explique. 
1.8- O que é estatística inferencial intuitiva? Cite 1.15- Há a
 
17 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
oblema biológico ao 
s em problemas 
estatísticos. Neste capítulo, abordaremos a 
ald Mac-
naughton (2002). O que este autor mostrou foi 
ra se compreender como se “monta” 
priedades de entidades; 
predição científica. 
s de pensa-
mentos cotidianos em um dado momento, 
deria estar 
pensando em um amigo ou em um compro-
s de montanhas, florestas, 
alcatéias, alunos em uma classe; população; 
conjunto de elementos em um grupo, espé-
cie?*); Objetos imaginários (fadas, universos 
ro, uma 
reunião, um beijo; um casamento; uma viagem, 
” como 
iante) 
tidades têm um papel fundamental no 
concretos reais (monta-
ção, indivíduos, 
unidades 
2. Do pr
estatístico. 
 
Os livros de estatística vêm com exemplos 
prontos de análise. Entretanto, uma das maio-
res dificuldades dos estudantes é a transforma-
ção de problemas biológico
forma de construir tabelas conceituais mais 
apropriada para a aplicação dos testes. 
 
Este capítulo se baseia no no texto “The entity-
property-relationship approach” de Don
que há alguns conceitos tão básicos que pas-
sam despercebidos pelas pessoas, e que são 
chaves pa
um problema antes de se iniciar um planeja-
mento de coleta de dados e a análise dos da-
dos. 
 
Macnaughton trabalha cinco conceitos: (1) Enti-
dades; (2) Propriedades; (3) O papel da pesqui-
sa empírica é predizer e controlar os valores 
das propriedades das entidades; (4) Relações 
entre propriedades são chaves para predizer e 
controlar valores de pro
(5) Técnicas estatísticas servem para o estudo 
das relações entre propriedades de entida-
des, como meio para 
 
2.1 Entidades 
 
Se você prestar atenção ao seu
provavelmente concordará que estamos pen-
sando sobre diversos tipos de “coisas”. Por 
exemplo, neste minuto você po
misso que tem marcado para a tarde. Estas 
“coisas” são exemplos de entidades. Existem 
muitos tipos de entidades: Objetos físicos 
reais simples (montanhas, automóveis, lagos, 
pessoas, árvores, sites da internet, prótons?*) 
ou coletivos (cadeia
paralelos, teorias, conceitos, prótons? espé-
cies?*); Processos/ações um experimento, 
uma reação química, uma peça de teat
a força necessária para levantar certo objeto, 
uma tempestade. (*às vezes é difícil decidir se 
alguns objetos são reais ou imaginários, como 
prótons e espécies. O caso de “Espécie
entidade será discutido novamente ad
 
 
As en
pensamento. Na gramática são sempre subs-
tantivos. Substantivos 
nhas, prótons) ou irreais (fadas) ou substantivos 
abstratos de ação (experimento, beijo, viagem), 
que são qualificáveis (montanha alta; viagem 
emocionante). Trata-se de um conceito tão bá-
sico, que raramente é discutido em metodologia 
e estatística. Entretanto, como veremos, é útil 
deixá-lo explícito. 
 
As entidades também podem ser chamadas de 
casos, membros de uma popula
itens, espécimens, objetos, coisas, 
amostrais, blocos, etc. 
 
Figura 2-1- Entidades são "coisas" em que pensamos, como árvores, 
beijos e Unidades Amostrais, às quais podemos atribuir propriedades
18 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
ada tipo de entidade tem associado a ele uma 
demos 
té não saber o valor, mas ele existe). 
) ou com advérbios interrogativos Quan-
?, Como? Quando? Onde? e Por quê? Os 
e-
adora, isto 
jetivo. Por exemplo, as 
ropriedades origem, local de formação e 
não 
ariam por serem fixas com um único valor es-
belecido a priori entram na descrição dos 
 
2.2 Propriedades 
 
 
C
gama de atributos ou propriedades. Carros têm 
peso, cor e ano de fabricação. Árvores têm 
altura, nome de espécie, posição em um mapa. 
Bandos de passarinhos têm um nome da espé-
cie, um número de indivíduos, uma razão sexu-
al. Cada entidade tem um valor para cada pro-
priedade (não existe carro sem peso, po
a
 
Propriedades também são chamadas de aspec-
tos, atributos, características, fatores, qualida-
des. Os nomes das propriedades na gramática, 
são normalmente substantivos abstratos qualifi-
cadores (localização, cor, beleza, idade, veloci-
dade, quantidade, valor de pH) que substituem 
perguntas com pronomes (qual a cor? etc; 
quem?
to
valores das propriedades são adjetivos (verme-
lho, velho, rápido, grande, brasileiro, estudioso), 
advérbios (aqui, agora, longe, mal, sim, não, 
talvez, muito, pouco), numerais (números com 
funções quantitativas, ordinais ou de rótulo- 
planta no 135 e datas) e às vezes símbolos 
como ♂,☺, ♠ ou O+, e até substantivos. 
 
Quando os valores são substantivos, g
ralmente eles têm função qualific
é, tem papel de ad
p
espécie para a entidade pessoa tem os 
valores Brasil, USP e Homo sapiens que 
substituem os adjetivos brasileiro, “Uspia-
no” e humano. Perceba que as palavras 
“brasileiro” e humano são substantivos nas 
frases “o brasileiro chegou sem documen-
tos” e “os humanosnão conviveram com 
os dinossauros”, mas são adjetivos nas 
frases “ele é brasileiro” e “foram encontra-
dos vestígios humanos numa caverna”. 
Apesar desta fonte de confusão, normal-
mente fica claro no contexto se a palavra 
denota uma entidade ou uma propriedade 
(qualidade). “Espécie” normalmente é pro-
priedade da entidade organismo nos estu-
dos de ecologia ou fisiologia, mas pode ser 
entidade em um estudo sobre filogenia. 
 
Há propriedades de entidades que não variam 
em um estudo, como a espécie de árvores e o 
estágio do desenvolvimento dessas árvores em 
um estudo restrito a plantas adultas desta espé-
cie. Outras, como o tipo de solo e a altura vari-
am entre indivíduos. As propriedades que 
v
ta
métodos do estudo, mas não entram na análise. 
As propriedades que variam são as que entram 
na análise, sendo chamadas de propriedades 
variáveis ou simplesmente “variáveis”. Portan-
to, o termo variável é um sinônimo do termo 
propriedade, mas implica mais fortemente um 
contexto de análise da variação de valores de 
propriedades relacionado com a variação em 
valores de outras propriedades. 
 
 
Figura 2-2- Propriedades são atributos das entidades. 
19 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
icos EPR 
s tabelas ou planilhas EPR são as tabelas com 
eitual que su-
ão re-
resentadas, cada uma delas, por um ponto 
ores 
rola infecções, 
odemos predizer que ela baixa a febre e se 
ntirá melhor se tomar a sub tância y. Isto 
parece banal, mas esta ação aparentemente 
banal de estabelecer relações é um dos pila-
res que sustenta a ciência. A explicação e com-
preensão é outro objetivo da ciência, mas se 
pensarmos bem, elas estão intimamente ligadas 
ao estabelecimento de relações. 
 
Há dois tipos de relação, a relação conseqüen-
te e a relação inconseqüente. Na figura 2.5, 
cada letra indica uma propriedade e as setas 
indicam relações. As relações “R” são conse-
qüentes, pois são o resultado de seqüencias 
causais. A propriedade (A) está seqüencialmen-
te relacionada com todas as outras. As relações 
“r” são inconseqüentes, porque não são se-
qüencialmente causais, mas induzidas. A rela-
ção r1 existe entre (C) e (E) porque tanto (C) 
como (E) são influenciados por (B). À medida 
que muda o valor de (B), tanto (C) como (E) 
mudam, por isto elas covariam, mesmo sem 
uma relação causal entre (C) e (E). Por exem-
plo, a temperatura do dia (B) influi sobre o grau 
do derretimento do asfalto da rua (C) e sobre o 
número de crianças com insolação em hospitais 
(E). Por causa disto, quanto mais derretido esti-
 o número de 
crianças com insolação em hospitais (E). Natu-
2.3 Tabelas e gráf
 
A
nossos dados organizados em entidades (li-
nhas), propriedades (colunas) e valores (células 
da tabela). Em uma tabela EPR cada entidade 
aparece apenas uma vez e as propriedades 
são variáveis que serão relacionadas ou que 
participarão da análise de outra forma. A tabela 
EPR é mais que um local para depositar os 
dados, ela é 
uma tabela con-
c
mariza o plane-
jamento do nos-
so projeto, de 
forma que deve 
ser planejada 
preferencialmen-
te antes da cole-
ta de dados, 
tendo em vista 
as relações que 
queremos veri-
ficar. 
 
 
Os gráficos EPR são gráficos cartesianos cujos 
eixos são propriedades e as entidades s
Tamanho Sexo
12 m
10 m
11 f
11 f
p
situado no gráfico em função dos seus val
das proprieda-
des (e.g. dia-
grama de dis-
persão e “dot 
density”). São 
gráficos mais 
ricos em infor-
mação que mui-
tos gráficos tra-
dicionais utiliza-
dos na apresen-
tação de resul-
tados. 
 
 
2.4 Relações 
 
O papel da pesquisa empírica é predizer e con-
trolar valores de propriedades. Neste lago pega-
remos bastante peixe? Este paciente será cura-
do? A plantação produzirá mais com este adu-
bo? Neste local encontraremos cobras veneno-
sas? Se não sabemos as respostas (pois não 
temos uma máquina de viajar no tempo ou um 
oráculo) e não podemos esperar o futuro para 
tomar decisões, o que fazer? 
 
Se conseguirmos identificar relações entre vari-
áveis, podemos fazer previsões. Se soubermos 
que lagos de água brancos sempre têm muito 
peixe, e que este lago x tem água branca, então 
podemos prever que haverá muito peixe nele 
(previsão). Se soubermos que pessoas que têm 
temperatura alta geralmente estão com infec-
ões, e que o substância y contç
p rá
se s
Figura 2-3- Nas tabelas EPR, as
linhas são entidades e as colunas
são propriedades. 
Ta
m
an
ho
Machos Fêmeas
Janeiro ( ) Julho ( )
Figura 2-4- Nos gráficos EPR
variáveis (propriedades) são
eixos dos gráficos e as entida
são os pontos. Variáveis adicio
, as
 os
des
nais
podem ser apresentadas na 
de cores ou simbolos. 
forma
ver o asfalto na rua (C), maior será
20 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
 asfalto qu
a as crianças a terem insolação. 
estes dados, mas espera-
porque tanto a previsão 
tidos são influenciados pelo 
rico anterior à previsão. 
 as relações conseqüentes 
entes estão associadas com 
item previsões e fazem parte 
tífica. Entretanto, é importante 
 e isto nem sempre é muito 
-
, 
undâncias de 
oindicadores ambientais de 
r a poluição), então não há 
roblema. Entretanto, quando achamos que há 
ausalidade direta entre duas variáveis envolvi-
 
a para estabelecer rela-
ções. 
blemas do cotidi-
no em testes estatísticos e dá mais sentido ao 
 fragmentação 
z o usuário perder a noção que os testes dis-
ralmente, não é o derretimento do
v 
e 2.
le
Se estudarmos o efeito de um fertilizante sobre 
o crescimento de uma planta adicionando fertili-
zante no tratamento comparado a um controle 
sem fertilizante, estamos lidando com uma rela-
ção causal ou conseqüente. Se estivermos veri-
ficando a relação entre as previsões climáticas 
de chuva de um instituto meteorológico e os 
dados climáticos não temos uma relação causal 
conseqüente entre 
mos ter uma relação 
quanto os dados ob
contexto atmosfé
 
Como vemos, tanto
como as inconseqü
causalidade, perm
da pesquisa cien
distinguir entre elas,
simples. Quando e
tamos lidando com 
como em compara
diferentes tipos de bi
poluição (sem medi
stamos conscientes que es
uma relação inconseqüente
ções entre ab
p
c
das em uma relação inconseqüente, então te-
mos uma “relação inconseqüente espúria”. Ve-
remos este assunto novamente no capítulo 5. 
 
 
 
 
5 A estatístic
 
A função da estatística inferencial é nos ajudar 
a decidir sobre a existência de uma relação a 
partir de dados medidos e coletados de forma 
apropriada. A estatística é uma ferramenta po-
derosa para detectar relações. O conceito que a 
estatística serve para ajudar no estabelecimento 
de relações contribui para o estudante compre-
ender como se transforma pro
a
que é um teste. 
 
A abordagem EPR é mais do que uma técnica 
para ajudar a transformar problemas biológicos 
em problemas estatísticos. O conceito da esta-
tística como ferramenta para estabelecer rela-
ções é integrador. Os livros tradicionais de esta-
tística tratam cada tipo de teste em capítulos ou 
seções diferentes e isto passa uma idéia que 
cada teste é algo distinto com uma lógica parti-
cular. As diferenças nos algoritmos matemáticos 
justificam uma separação em capítulos em cur-
sos direcionados à formação de estatísticos. 
Entretanto, em cursos voltados para usuários é 
mais importante tratar os testes de forma unifi-
cada (ver apostila de testes). A
fa
poníveis são complementares e têm a mesma 
finalidade básica: calculam uma probabilidade 
associada a uma relação. 
 
Nos exercícios abaixo vamos treinar a monta-
gem de tabelas EPR a partir de problemas bio-
lógicos.É importante se perceber que não há 
uma única resposta correta para cada um des-
tes exercícios, pois uma pergunta pode ser 
avaliadas de formas diferentes (planilhas EPR 
diferentes). Outra coisa a se perceber é que 
existem imagens de entidades equivalentes em 
alguns casos. Imagens de entidade equivalen-
tes são aquelas que podem ser trocadas sem 
comprometer a interpretação da relação. Por 
exemplo, “tartaruga nº 4”, “ninho nº 4”, “conjunto 
de ovos nº 4” ou “registro nº 4” no segundo e-
xemplo são imagens que representam de forma 
diferente uma mesma coisa cujas propriedades 
serão relacionadas. 
Figura 2-5- As relações entre propriedades podem
ser Conseqüentes (R
linhas diretas de ca
(r1 a r4), qua
direta. 
1 a R5), quando pertencem à
usalidades, ou Inconseqüentes
o há uma relação de causalidadendo nã
21 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
ropriedades 
is os 
mes das entidades e as propriedades em 
 
seus carros costumam realizar maior 
número de contraversões em ambiente 
urbano. 
• A taxa de decomposição da serrapilhei-
ra varia em função do ambiente (Cam-
pinarana, Baixio e Platô) na Amazônia 
Central? 
• A temperatura na sala de aula influi so-
bre o desempenho de estudantes em 
provas? 
la-
de 
• Há dimorfismo sexual de tamanho nas 
borboletas Capronnieria abretia? 
• Bromélias absorvem Fósforo da água 
acumulada entre as suas folhas? 
do que de gafanhotos marrons na 
a na caatinga? 
) Qual é a diferença entre relações conseqüen-
 
Nos primeiros 6 exercícios as p
estão explícitas no enunciado. Nos problemas 
seguintes é necessário se pensar em que pro-
priedades poderíamos medir para responder o 
problema. Por exemplo, no caso de dimorfismo 
sexual, temos que lembrar que dimorfismo em 
tamanho significa machos maiores que fêmeas, 
logo, as propriedades são sexo e tamanho. 
. 
Exercícios: 
 
1) Na lista a seguir há perguntas relacionadas a 
pares de propriedades, responda: a) Qua
no
consideração; b) Monte uma tabela EPR e um 
gráfico para ilustrar como esta relação pode ser; 
c) classifique as relações em conseqüentes ou 
inconsequentes; d) Pense em problemas de 
validação de medida, de validação interna e de 
validação externa que poderiam ocorrer em 
cada caso. 
 
• O comprimento da carapaça de indiví-
duos da espécie de tartarugas Podoc-
nemis expansa influi na taxa reproduti-
va? 
• A temperatura afeta a razão sexual em 
ninhos artificiais de P. expansa ? 
• Motoristas que utilizam isofilme em
• A sobrevivência de gafanhotos verdes é 
maior 
época chuvos
• Cigarro causa câncer? 
• Passar por baixo da escada dá azar? 
• Olho gordo seca pimenteira? 
 
 
2). Construa 3 tabelas EPR com exemplos de 
relações em seu campo de pesquisa e analise 
estas tabelas da mesma forma que fez no exer-
cício anterior. 
 
3
tes e inconseqüentes? Dê um exemplo e utilize 
esquemas para mostrar cada situação. 
• O pH de um locais com água acumu
da de chuva afeta a sobrevivência 
mosquitos? 
 
22 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
3. Conceitos para a escolha 
 
 níveis, pois a precisão da medida 
i de 1mm, o máximo foi 22 e o mínimo foi 4. 
eis quantitativas o núme-
Pode haver níveis quantita-
tivos sem valor entre o mínimo e o máximo. É 
ui um 
não é 
de 0,05. 
nte repre-
elas cujos valo-
i-
xplicativas 
o a iá
das pela letra “X”). Os termos “dependente” e 
o de dependência, o teste e a 
será tratado no capítulo 5, mas vamos utilizar os 
termos “dependente” e “independente” entre 
aspas quando não houver segurança se a rela-
ção em estudo é causal. 
 
Outro tipo de variável envolvida nos estudos de 
relações são as Variáveis de Medidas Repeti-
das (VMR), que existem em estudos com enti-
dades pareadas ou em blocos. Nestes estudos 
temos variáveis dependentes e independentes 
implícitas, mas as relações são estabelecidas a 
partir de diferenças entre os valores medidos 
para um mesmo indivíduo ou objeto. Esta situa-
ção será explicada na seção 4.2. 
 
3.2 Escalas de medidas. 
 
Em função dos valores que uma variável pode 
assumir, elas podem ser divididas em: 
 
Binárias: São um caso especial de variável 
categórica com apenas duas categorias. Por 
exemplo: “sim” ou “não”; presença ou ausência; 
macho ou fêmea; estação seca ou chuvosa em 
2007. Variáveis quantitativas (e.g. a quantidade 
uma substância), que assumem apenas dois 
valores em uma analise (e.g. 1 mg ou 2 mg) 
binárias e quantitativas ao mesmo tempo. 
 
Categóricas: Assumem valores qualitativos 
sem uma ordem ou relação hierárquica com 
sentido relevante para a análise. Por exemplo: 
 
e uso de testes e gráficos 
 
Neste capítulo, abordaremos os conceitos que 
são a base para entender todos os testes do 
curso em conjunto e para entender suas dife-
renças em premissas e aplicações. 
 
1 Níveis de medida e tipos de variá-3.
veis. 
 
Medir é atribuir valor para uma propriedade de 
uma entidade. Os “níveis de medida” são os 
diferentes valores obtidos para uma variável 
dentro de uma base de dados particular ou em 
um estudo. Por exemplo, a variável “cor” das 
canetas da minha mesa no momento em que 
estou escrevendo tem três níveis de medida: 
“azul”, “preta” e “vermelha”. Na figura abaixo, a 
variável mês tem 6 níveis e a variável tamanho 
da aranha 19
fo
Em variáveis categóricas basta contar as cate-
gorias (efetivamente medidas, não todas as 
possíveis) e em variáv
ro de níveis (NN) é calculado com esta fórmula 
simples: NN=(max-min+1)/precisão. No exem-
plo NN= (22-4+1)/1. 
importante tomar cuidado com a verdadeira 
precisão. Se algumas vezes você atrib
valor 4,95, mas ocasionalmente arredonda para 
4,9 ou 5,0, então sua precisão é de 0,1, 
 
As Variáveis Dependentes (ou variáveis res-
posta, variáveis “de saída”, geralme
sentadas pela letra "Y") são aqu
res hipoteticamente variam em resposta a Var
áveis Independentes (ou variáveis e
u v r eis “de entrada”, geralmente represen-v
ta
“independente” são apenas rótulos, não signifi-
cam que já estejamos admitindo que uma influa 
sobre a outra, por isto utilizamos o termo “hipo-
teticamente” acima. Há duas coisas que defini-
o esta relaçãrã
forma de coletar os dados. O teste deve ser 
significativo (P<α) e a coleta deve ser feita de 
forma a garantir que a relação encontrada foi 
causal. O problema da coleta e da causalidade 
 Phoneutria reidyi
 
 Ago Out Jan Abr Ago 
0 
5 
10 
15 
20 
25 
 
Ta
m
nh
 d
a 
ha
(m
m
) 
o
ar
an
Jun 
Meses 1998/9 Figura 3-1- Tamanhos de aranhas coletados em 6 ex-cursões. Há 6 níveis na variável independente e 19
níveis na variável dependente. 
23 
 
 Bioestatística Aplicada 2011/1 
© Thierry R. Gasnier/ Universidade Federal do Amazonas 
 
 
 
s matemáti-
ertencem a outras escalas de medida, mas 
s 
de dependência - coleta; conjunto de coletas 
por uma pessoa; conjunto de coletas por várias 
pessoas). Esta relação pode ser considerada 
irrelevante (como a distribuição espacial e tem-
poral de experimentos com ratos em biotérios 
climatizados), mas se for relevante, esta infor-
mação deve ser considerada na análise. Há 
técnicas (Anova hierárquica; regressão filogené-
tica) utilizadas para lidar com esta situação, 
mas não serão abordadas neste texto. 
 
a 
icas específicas (Zar, 
orrida chegou mais próximo do primeiro ou do 
 de cavalos, a ordem 
e chegada é um nível ranqueado (1º, 2º , 3º 
o 
stada, mesmo 
ue elas ordenem de forma semelhante. Tanto 
nto como nos 
íveis aleatórios, a análise, quando possível, 
de erro 
eria concluir com base em uma pesquisa de 
ções 
e adição podem ser feitas (e.g. o valor

Outros materiais