Buscar

Bioestatistica_Notas_de_Aula_3

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

1 
 
Estatística - Conceitos Básicos. 
(Este arquivo não substitui as referências indicadas no plano de ensino) 
 
A estatística é uma coleção de métodos para planejar experimentos, obter dados e 
organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões. Como se 
pode ver, a estatística abrange muito mais que o simples traçado de gráficos e o cálculo 
de médias. 
 
Definições (TRIOLA, 1999). 
 
População: é uma coleção completa de todos os elementos (valores, pessoas, medidas 
etc.) a serem estudados. 
 
Censo: é uma coleção de dados relativos a todos os elementos de uma população. 
 
Amostra: É uma subcoleção de elementos extraídos de uma população. 
 
Parâmetros: É uma medida numérica que descreve uma característica de uma 
população. 
 
Estatística: É uma medida numérica que descreve uma característica de uma amostra. 
 
Definições (VIEIRA, 1980). 
 
População: é um conjunto de elementos que têm, em comum, determinada 
característica. (população finita e infinita). 
 
Amostra: todo subconjunto não vazio e com menor número de elementos do que a 
população. 
 
Recenseamento: quando são coletadas informações de toda a população. 
 
Censo: conjunto de dados obtidos através de recenseamento. 
 
Amostragem: quando são coletadas informações de apenas parte da população. 
 
Observação: amostra é a parte retirada da população para estudo como também o 
conjunto de dados obtidos nessa parte da população. 
 
Por que usar amostras? 
 
 Populações infinitas só podem ser estudadas por meio de amostras. 
 Populações finitas muito grandes só podem ser estudadas por meio de amostras. 
 O estudo minucioso de uma amostra tem mais valor científico do que o estudo sumário 
de toda uma população. 
 Fatores econômicos. 
 
 
 
2 
 
Natureza dos dados. 
 
Quantitativos: Consistem de números que representam contagens ou medidas. 
Exemplos: Quantidade de colesterol e número de pacientes atendidos no dia. 
 
Qualitativos (ou categóricos ou atributos): Podem ser separados em diferentes 
categorias que se diferenciam por uma característica não-numérica.Também são 
chamados de atributos. Exemplos: Grupo sangüíneo e estado civil. 
 
Os dados quantitativos dividem-se entre os dois tipos seguintes. 
Discretos: Resultam de um conjunto finito de valores possíveis, ou um conjunto 
enumerável de valores (1 ou 2 ou 3 etc). Os dados que representam contagens são 
discretos. Exemplo: Número de pacientes atendidos na semana. 
 
Contínuos (numéricos): Resultam de um número infinito de valores possíveis que 
podem ser associados a pontos em um escala contínua de tal maneira que não haja 
lacunas ou interrupções. Os dados que representam mensurações são contínuos. 
Exemplo: Quantidade de colesterol e litros de cachaça produzidos. 
 
Níveis de Mensuração 
 
Nível nominal de mensuração: É caracterizado por dados que consistem apenas em 
nomes, rótulos ou categorias. Os dados não podem ser dispostos segundo um esquema 
ordenado. Exemplos: Respostas do tipo sim ou não e sexo dos estudantes de um curso e 
 
Nível ordinal de mensuração: São dados que podem dispostos em alguma ordem, mas 
as diferenças entre os valores dos dados não podem ser determinadas, ou não têm 
sentido. Exemplos: Classificação em muito bom ou bom ou regular ou ruim e classificação 
de nadadores ao final de uma competição. 
 
Nível intervalar de mensuração: É análogo ao nível ordinal, com a propriedade adicional 
de que é possível determinar diferenças significativas entre os dados. Todavia, não existe 
um ponto de partida zero inerente, ou natural (em que não haja qualquer quantidade 
presente). Exemplos: Temperaturas médias anuais das capitais brasileiras e os anos 
1962, 1965, 2001 e 2003. 
 
Nível de razão de mensuração: É o nível de intervalo modificado de modo a incluir o 
ponto de partida zero inerente (em que o zero significa nenhuma quantidade presente). 
Para valores nesse nível de mensuração, tanto as diferenças como as razões têm 
significado. Exemplos: Distância percorrida pelos ônibus de uma empresa e tempo de 
execução de uma atividade em minutos. 
 
3 
 
Planejamento de Experimentos 
 
Pontos importantes para o planejamento de um estudo capaz de produzir resultados 
válidos: 
 
1) Identificar com precisão a questão a ser respondida e definir com clareza a população 
de interesse. 
 
2) Estabelecer um plano para coleta de dados. Esse plano deve descrever 
detalhadamente a realização de um estudo observacional ou de um experimento 
(definidos a seguir) e deve ser elaborado cuidadosamente, de modo que os dados 
coletados representem efetivamente a população em questão. 
 
3) Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que 
podem resultar de uma coleta tendenciosa de dados. 
 
4) Analisar os dados e tirar conclusões. Identificar também possíveis fontes de erros. 
 
Definições: 
 
 
Em um estudo observacional, verificamos e medimos características específicas, mas 
não tentamos manipular ou modificar os elementos a serem estudados. 
 
Em um experimento, aplicamos determinado tratamento e passamos então a observar 
seus efeitos sobre os elementos a serem pesquisados. 
 
Técnicas de amostragem 
Procedimento que será adotado para escolher os elementos que irão compor a amostra. 
A seguir serão apresentados os métodos mais comuns. 
 
Amostra aleatória: É composta por elementos retirados ao acaso da população. Todo 
elemento da população tem igual probabilidade de ser escolhido para a amostra. 
Exemplo: sorteio. 
 
Amostra sistemática: Escolhe-se um ponto de partida, e seleciona-se késimo (de 10 em 
10 por exemplo) elemento da população. 
 
Amostra estratificada: Subdivide-se a população em, no mínimo, duas subpopulações 
(ou estratos) que compartilham das mesmas características (sexo por exemplo) e, em 
seguida, seleciona-se uma amostra de cada estrato. 
 
Amostra por conglomerados: Divide-se a área da população em seções (ou 
conglomerados), em seguida escolhe-se algumas destas seções e, finalmente, utiliza-se 
todos os elementos das seções escolhidas. 
 
Amostra de conveniência: Utiliza resultados que já estão disponíveis ou por elementos 
que o pesquisador reuniu porque dispunha deles (estavam ao seu alcance). 
 
4 
 
Observação: Existem muitas restrições ao uso de amostras de conveniência, Entretanto, 
elas são comuns na área de saúde, onde se fazem pesquisas com pacientes de uma só 
clínica ou de um só hospital. Muitas vezes as amostras de conveniência constituem a 
única maneira de estudar determinados problemas. 
 
Pesquisa auto-selecionada: é uma pesquisa em que os próprios entrevistados decidem 
se serão incluídos. 
 
Nas pesquisas auto-selecionadas o que ocorre com frequência é que participam apenas 
aqueles que têm uma opinião firmada e a amostra resultante não é representativa da 
população como um todo. 
 
O trabalho com amostras sempre tem como objetivo fazer inferência, isto é, estender os 
resultados da amostra para toda a população. Daí a importância da caracterização da 
amostra. Os resultados devem ser estendidos apenas para a população de onde a 
amostra proveio. 
 
Definições: 
 
Erro amostral – É a diferença entre um resultado amostral e o verdadeiro resultado 
populacional; tais erros resultam de flutuações amostrais aleatórias. 
 
Erro não amostral – Quando os dados amostrais são coletados, registrados ou 
analisados incorretamente. Resultam de um erro que não seja uma flutuação aleatória, 
como a escolha de uma amostra não-aleatória e tendenciosa, a utilização de um 
instrumento de mensuração defeituoso, uma questão formulada de modo tendencioso, um 
grande número de recusas de resposta ou a cópia incorreta dos dados amostrais. 
 
Medidas de Tendência Central 
 
Uma medida de tendência central é um valor no centro ou no meio de um conjunto de 
dados. São considerados valores típicos ou representativos de um conjunto de dados, 
tentativas de representação de um conjunto de dados a partir da determinação de um 
valor característico.Estudaremos a média aritmética, a mediana, a moda, o ponto médio e 
a média ponderada. 
 
Média Aritmética. 
 
De modo geral é a mais importante de todas as mensurações. É interpretada como o 
centro do conjunto de dados, o ponto de equilíbrio do conjunto. 
 
A média (aritmética) de um conjunto de valores é o valor obtido somando-se todos eles e 
dividindo-se o total pelo número de valores. 
n
x
X

 
 
 - indica o somatório, ou a soma, de todos os valores da variável x. 
n - tamanho da amostra, número de valores em consideração. 
5 
 
 
Exemplo: 
Tabela 1 – Peso, em gramas, de ratos machos da raça Wistar com 30 dias de idade. 
50 62 70 
86 60 64 
66 77 58 
55 82 74 
 
67
12
804
12
748255587766646086706250


X 
Mediana 
 
É o valor do meio de um conjunto de dados, quando os valores estão dispostos em ordem 
crescente (ou decrescente). A mediana é representada por x~ ou Me. 
 
Tem sempre 50% acima e 50% abaixo. Divide a amostra em dois conjuntos com o mesmo 
número de dados. 
 
Amostra constituída por um número ímpar de dados: 
1, 2, 3, 5, 9 
Me = 3 
 
Amostra constituída por um número par de dados: 
1, 2, 3, 4, 7, 9 
A mediana será a média aritmética dos valores. 
Me = (3 + 4)/2 = 3,5 
 
Moda 
 
Representação: Mo 
 
É o valor que ocorre com maior freqüência. 
Exemplo: 3, 4, 5, 7, 7, 7, 9, 9 – Mo = 7 (ocorreu o maior número de vezes). 
 
Existem conjuntos de dados que não apresentam moda e existem conjuntos com duas ou 
mais modas (conjunto bimodal e multimodal). 
 
A moda pode ser obtida mesmo que a variável seja qualitativa. 
Tabela 3 – Indivíduos segundo o tipo de sangue. 
 
Tipo de Sangue Freqüência 
O 547 
A 441 
B 123 
AB 25 
 
A moda é o tipo O. 
 
 
6 
 
Tabela 4 – Pulsação por minuto de 60 alunos da Academia Cançado, 2000. 
 
Pulsação por minuto Número de alunos 
60 a 70 20 
70 a 80 24 
80 a 90 16 
Total 60 
 
Ponto Médio 
 
É o valor que está a meio caminho entre o maior valor e o menor valor. É a média 
aritmética desses valores. 
 
Média de uma Tabela de Distribuição de Freqüências – Média Ponderada. 
 
Quando os dados estão resumidos em uma tabela de distribuição de freqüências, 
podemos aproximar a média substituindo os limites de classe pelos pontos médios das 
classes e supor que todos os elementos da classe se concentrem no ponto médio. A 
tabela indica quantos valores se situam em uma classe, mas não indica os valores 
específicos. 
 



f
pmf
X
).(
 
pm – ponto médio da classe. 
 – freqüência 
 = n 
 
Melhor Medida de Tendência Central 
 
Qual dessas medidas é a melhor? 
 
Não há uma resposta única porque não há critérios objetivos para determinar a mais 
representativa para todos os conjuntos de dados. 
 
Medidas de Dispersão dos Dados ou Medidas de 
Variação. 
 
Amplitude. 
É a diferença entre o maior valor e o menor valor pertencentes ao conjunto de dados. 
 
Em geral não é uma boa medida pois leva em consideração apenas os valores extremos. 
 
Desvio Padrão e Variância. 
De modo geral o desvio padrão é mais útil. 
Consideração todos os valores. 
 
 
7 
 
O desvio padrão (s) é determinado por: 
1
)( 2




n
xx
s 
 
xx  é o desvio em relação á média. A soma dos desvios médios é sempre zero. A 
soma dos desvios médios é sempre zero. 
 
Desvio médio = 
n
xx 
 
 
Processo para determinar o desvio padrão. 
1) Achar a média dos valores (achar x ). 
2) Subtrair a média de cada valor individual ( xx  ). 
3) Elevar ao quadrado cada uma das diferenças obtidas no item 2 (achar 
2)( xx  ). 
4) Somar todos os quadrados obtidos no item 3, obtendo  
2)( xx . 
5) Dividir o total calculado no item 4 pelo número n – 1, isto, o número total de 
observações menos 1. 
6) Extrair a raiz quadrada do resultado do item 5. 
 
Exemplo: Determine o desvio-padrão dos números seguintes: 
6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 
(resposta: 0,48) 
 
Outra fórmula para o desvio-padrão: 
)1(
)()( 22



nn
xxn
s 
 
Significado do Desvio-padrão. 
O desvio-padrão mede a dispersão (ou variação) dos valores ao redor da média. Valores 
próximos resultam em desvio-padrão menor, enquanto que valores muito afastados 
resultam desvio-padrão maior. 
 
Omitindo a etapa 6 (calcular a raiz quadrada) no processo de cálculo de desvio padrão, 
obtem-se a variância, definida pela fórmula. 
 
Coeficiente de Variação (CV). 
 
Quase nunca uma medida de tendência central é suficiente para descrever, de modo 
satisfatório, um conjunto de dados. Não basta saber o valor em torno do qual os dados se 
concentram. É preciso conhecer também o grau de agregação, ou seja, definir e usar 
medidas da dispersão dos dados. O desvio padrão é uma dessas medidas. Mas quando 
que um desvio padrão é grande ou pequeno? É uma questão relevante na avaliação da 
precisão de métodos. Um desvio padrão pode ser considerado grande ou pequeno 
dependendo da ordem de grandeza da variável. Um desvio padrão de 10 pode ser 
insignificante se a observação típica for 10.000, mas será um valor significativo para um 
conjunto de dados cuja observação típica é 100. 
8 
 
 
Portanto, por vezes é conveniente exprimir a dispersão em termos relativos, ou seja, 
expressar a variabilidade dos dados tirando a influência da ordem de grandeza da 
variável. 
 
O Coeficiente de Variação é um índice relativo de dispersão que compara o desvio padrão 
(s) com a média ( x ) e é definido por: 
x
s
CV 
 
 
100100
média
padrãodesvio
X
s
CV

 
 
O CV é adimensional, isto é, um número puro e é usualmente expresso em porcentagem. 
Sua utilidade é fornecer uma medida para a homogeneidade do conjunto de dados. 
Quanto menor o CV, mais homogêneo é o conjunto de dados. 
 
Um valor de CV menor ou igual a 0,25 geralmente indicará que o conjunto de dados é 
razoavelmente homogêneo. Entretanto, esse padrão varia de acordo com a aplicação. 
Uma possível classificação é a seguinte: baixo (inferior a 0,10); médio de (0,10 a 0,20); 
alto (de 0,20 a 0,30) e muito alto (superior a 0,30). 
 
A classificação do CV como baixo, médio, alto ou muito alto pode ser difícil, mas esta 
medida é de bastante utilidade na comparação de duas variáveis ou dois grupos que a 
princípio não são comparáveis (por exemplo, ordem de grandeza das variáveis 
diferentes). 
 
O tempo em (meses) entre a remissão de uma doença e a recidiva de pacientes de uma 
determinada clínica médica foi registrado. Os dados ordenados estão apresentados a 
seguir, separadamente para os sexos masculino (M) e feminino (F): 
 
M 2 4 4 7 9 15 15 18 22 22 
F 3 3 5 7 8 8 10 11 12 18 
 
Qual das amostras é mais homogênea? 
 
Medidas de Posição 
 
Escores z 
Os escores z permitem comparar valores mais facilmente, por intermédio de 
padronização. 
 
Definição: O escore padronizado ou escore z, é o número de desvios padrão pelo qual 
um valor x dista da média (para mais ou para menos). É dado por: 
s
xx
z

 
Obs.: Arredondar para duas casas decimais. 
 
9 
 
A importância dos escores z é de permitir a diferenciação entre os valores usuais, ou 
típicos, e os valores raros, ou incomuns. 
 
Também conhecido como escore padronizado, relaciona a média e o desvio padrão para 
cada indivíduo. A idéia é que, na comparação dos resultados de dois indivíduos, é 
importante a padronização em relação ao grupo. Por exemplo, um aluno que tenha obtido 
nota 7 numa prova em que a média da classe foi 5 apresentou melhor rendimento do que 
numa prova em que tirou 8 mas a média da classe foi 9. Além da comparação da nota 
individual com a média da classe também é importante avaliar se em cada caso a 
variabilidade das notas foi grande ou não. Assim, o desempenho deste aluno que obteve 
nota 7 seria bom se o desvio padrão da classe fosse 2 e apenas razoável se fosse 4. 
 
O escore padronizado (z) é definido pela fórmula: 
s
xx
z

 
Esta medida fornece o número de desvios padrão que a observação dista da média da 
amostra. Esta interpretação justifica o uso do termo desvio padrãocomo a unidade 
segundo a qual os desvios em relação à média devem ser medidos. 
 
Mas quando um escore padronizado pode ser considerado grande? A seguinte regra, 
baseada na Desigualdade de Chebschev, pode ser usada: 
 
Cerca de 75% das observações estão no intervalo centrado na média com 
amplitude de quatro desvios padrão, aproximadamente 89% estão no intervalo de seis 
desvios padrão e raramente há uma observação além de quatro desvios padrão acima ou 
abaixo da média. 
 
 A tabela a seguir apresenta os resultados de exames laboratoriais solicitados a duas 
pacientes, mãe (M) e filha (F), com respectivamente 60 e 40 anos de idade. Também são 
apresentados os resultados padronizados pelo grupo de adultos do sexo feminino. 
 
Exame 
laboratorial 
Resultados para 
adultos 
Resultados 
 Média D. padrão M F 
Glicemia em jejum 85 12,5 90 79 
Ácido úrico 4,2 0,9 3,5 3,1 
Triglicérides 105 30 97 66 
Colesterol total 200 25 251 185 
 
Verifique se as pacientes apresentaram resultados considerados preocupantes. 
 
 
Quartis 
Enquanto a mediana divide os dados em duas partes iguais os dados ordenados, de 
modo crescente, podem ser divididos em quatro partes iguais. Os quartis são denotados 
por Q1, Q2 e Q3. O quartil Q1 separa os 25% inferiores dos 75% superiores dos valores 
ordenados; Q2 é a mediana e Q3 separa os 75% inferiores dos 25% superiores dos 
valores ordenados. 
 
10 
 
Decis 
Existem 9 decis, de D1 a D9, que dividem os dados ordenados 10 grupos com cerca de 
10% em cada grupo. 
 
Percentis 
Existem 99 percentis, de P1 a P99, que dividem os dados ordenados em 100 grupos com 
cerca de 1% em cada grupo. 
 
A mediana é o valor que deixa pelo menos 50% das observações acima de si e pelo 
menos 50% abaixo. A mediana é o percentil 50. De forma geral o percentil de ordem x, 
representado por Px, é o valor que é precedido (maior ou igual) por (xn)/100 dos valores e 
seguido (menor ou igual) por [(100 – x)n]/100. 
 
Os percentis de ordem 25, 50 e 75 são chamados, respectivamente primeiro,segundo e 
terceiro quartis porque dividem a distribuição em 1/4, 2/4 e 3/4. São representados por 
Q1, Q2 e Q3 (Q2 é outra notação para a mediana). 
 
O nível de albumina no sangue, um indicador do estado nutricional, foi medido em um 
grupo de 60 pacientes, obtendo-se os resultados (g/dL) apresentados em forma ordenada 
na tabela seguinte. 
Tabela 1: Nível de albumina no sangue (g/dL) 
4,44 4,47 4,48 4,51 4,54 4,54 4,61 4,64 4,66 4,68 
4,68 4,69 4,71 4,73 4,76 4,76 4,76 4,81 4,86 4,86 
4,87 4,88 4,90 4,90 4,95 4,95 4,96 4,97 4,98 4,98 
4,99 5,00 5,01 5,01 5,01 5,02 5,04 5,05 5,08 5,09 
5,09 5,10 5,11 5,11 5,16 5,17 5,18 5,18 5,19 5,24 
5,24 5,26 5,27 5,27 5,29 5,32 5,35 5,46 5,50 5,85 
 
Determinar, Q1, Q2, Q3, P20 e P80. 
 
 
Apresentação de Dados em Tabelas 
 
1 - COMPONENTES DAS TABELAS. 
 
As tabelas devem conter título, corpo, cabeçalho e coluna indicadora. Cada um destes 
quatro itens tem uma função importante para identificação de uma tabela. Através da 
Tabela 2.1 abaixo iremos definir estes quatro itens. 
 
Tabela 1 – Estudantes dos cursos de graduação do UNI-BH que praticam esportes 
em academias durante pelo menos quatro meses por ano. 
NOME DO CURSO DE GRADUAÇÃO FREQÜÊNCIA 
Educação Física 50 
Engenharia de Alimentos 15 
Nutrição 32 
Fisioterapia 76 
Geografia e Análise Ambiental 10 
 
11 
 
No caso da Tabela 1, apresentada acima, podemos notar as funções de cada uma das 
partes da tabela da seguinte maneira: 
 
 Título: Explica o que a tabela contém. 
 
“Estudantes dos cursos de graduação do UNI-BH que praticam esportes em academias 
durante pelo menos quatro meses por ano”. 
 
Cabeçalho: Especifica o que cada coluna irá apresentar. 
 
NOME DO CURSO DE GRADUAÇÃO Freqüência 
 
Coluna Indicadora: Especifica o conteúdo das linhas que, no caso da Tabela 2.1, indica 
o nome de cada curso. 
 
Nome do Curso de Graduação 
Educação Física 
Engenharia de Alimentos 
Nutrição 
Fisioterapia 
Geografia e Análise Ambiental 
Corpo: Formado pela linha e coluna de dados que, no caso da Tabela 2.1, fornece o 
número de estudantes em cada curso. 
 
Freqüência 
50 
15 
32 
76 
10 
 
Observações Importantes: 
 
1) Toda tabela deve ser delimitada por traços horizontais. 
 
2) Podem ser feitos traços verticais para separar as colunas, mas não devem ser feitos 
traços verticais para delimitar a tabela. 
 
3) O Cabeçalho é separado do corpo por um traço horizontal. 
 
4) As tabela podem apresentar ainda, além das freqüências, as freqüências relativas e o 
total. A freqüência relativa é obtida dividindo-se a freqüência desta categoria pela 
soma das freqüências, exemplifica pela Tabela 2.2. 
 
5) As tabelas podem conter ainda fonte, notas e chamadas. A fonte dá a indicação da 
entidade e/ou pesquisador que forneceu os dados. As notas servem para esclarecer 
aspectos relevantes da apuração de dados e as chamadas são esclarecimentos sobre 
os dados, sempre feitos através de algarismos arábicos escritos entre parênteses. 
 
12 
 
Tabela 2 – Estudantes dos cursos de graduação do UNI-BH que praticam esportes 
em academias durante pelo menos quatro meses por ano. 
NOME DO CURSO DE GRADUAÇÃO FREQÜÊNCIA FREQÜÊNCIA RELATIVA(%) 
Educação Física 50 27,33 
Engenharia de Alimentos 15 8,20 
Nutrição 32 17,44 
Fisioterapia 76 41,53 
Geografia e Análise Ambiental 10 5,46 
Total 183 
Fonte: Professor Flávio Roberto Costa Diniz (2001). 
Nota: Dados fictícios. 
 
2 - TABELAS DE CONTIGÊNCIAS. 
 
Em muitos casos os elementos de uma determinada amostra ou população são 
classificados de acordo com dois fatores. Os dados devem então ser apresentados em 
tabelas com dupla entrada, conhecidas como tabelas de contigências. 
 
As tabelas de contigências podem apresentar freqüências relativas que irão fornecer 
estimativas de riscos. 
 
Como exemplos, consideremos as tabelas 3 e 4 abaixo: 
 
Tabela 3 – Número de clientes na Academia “X”, segundo ano e sexo. 
Ano de Entrada Sexo Total 
 Masculino Feminino 
1998 570 750 1320 
1999 280 456 736 
2000 340 380 720 
Fonte: Professor Flávio Roberto C. Diniz (2001). 
Nota: Dados fictícios. 
 
 Tabela 4 – Avaliação do tempo de Atletas da modalidade atletismo 100m, segundo 
a época do treinamento e seu índice para as eliminatórias das Olimpíadas do Brasil 
em 2010. 
Época do 
Treinamento 
Índice Alcançado 
Acima Abaixo 
Total Freqüência Relativa de 
índice abaixo 
12 meses antes 12 40 52 76,9% 
6 meses antes 21 20 41 48,8% 
Fonte: Professor Flávio Roberto C. Diniz (2001). 
Nota: Dados fictícios. 
 
Fazendo uma análise na tabela 4 podemos observar que o tempo de treinamento é um 
fator de risco na obtenção do índice para as olimpíadas. 
13 
 
 
3 - TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS. 
 
As Tabelas de Distribuição de Freqüência servem para apresentar o conjunto de dados 
dentro de determinadas faixas ou classes onde os mesmos ocorrem. Sua principal função 
é organizá-los para uma fácil leitura. 
 
Suponha que uma preparadora física deseje avaliar em quais período de jogo seu time de 
FUTSAL é mais eficiente na conversão dos arremessos em gols, e para tanto, coleta 
dados por faixas de tempo, aqui definidas como Classes. Durante 10 dias, em jogos-
treinos pela manhã, são obtidos os números apresentados na Tabela 2.5, onde podemos 
notar que o maior número de gols por intervalo de 10 minutos é 5 (cinco) e o menor, 
logicamente, é 0 (zero), ou seja nenhum gol. 
 
As classes poderão então serem definidas a partir de 0 (zero gol) até 5 (cinco gols), por 
exemplo: Classe 1: 0 a 1 gol, Classe 2: 2 a 3 gols, etc. Outra maneira de avaliar dados 
deste tipo seria verificar o número de gols por jogo-treino em classes definidas de 0(zero 
gol) até 12 (doze gols), por exemplo: Classe 1: 0 a 2 gols, etc. 
 
Por não existir um número de classes “ideal”, o pesquisador define o que for conveniente 
para expressar seusdados ou então segue uma fórmula sugestiva dada pela seguinte 
expressão: 
 
k = 1 + 3,222 x logn ou nk  
 
sendo k o número de classes e n o número de dados. 
 
Tabela 5 – Gols por intervalos de tempo de 10 minutos em jogos-treinos. 
Tempo(min) J1 J2 J3 J4 J5 J6 J7 J8 J9 J10 
 10 0 2 0 1 5 1 0 0 0 3 
10  Tempo  20 1 0 3 0 2 0 3 4 1 0 
 30 2 0 3 0 5 2 1 3 0 1 
Total 3 2 6 1 12 3 4 7 1 4 
Fonte: Professor Flávio Roberto C. Diniz 
 
Extremo de classe é a denominação dos limites dos intervalos de classe, que por 
convenção, têm a notação |- significando fechado à esquerda (pertencem à classe os 
valores maiores ou iguais àquele número à esquerda) e aberto à direita (pertencem à 
classe os valores menores que aquele número à direita). Numa tabela de distribuição de 
freqüências podem ser apresentados ainda os pontos médios de classe, que são obtidos 
somando-se os extremos da classe e dividindo o resultado por dois. 
 
Uma tabela típica de distribuição de freqüência tem, então, três colunas, sendo a 1 
Coluna das Classes, a 2 Coluna dos Pontos Médios e a 3 Coluna das Freqüências. Se 
quisermos apresentar os dados contidos na Tabela 5 na forma de uma Tabela de 
Distribuição de Freqüências, poderemos ter várias como, por exemplo: 
 
Opção 1: Número de gols em intervalos de 10 minutos durante todos os jogos-treinos. 
Com seis classes teremos a tabela 2.6. 
14 
 
 
Tabela 6 – Distribuição de Freqüência dos gols 
em intervalos de 10 minutos nos jogos-treinos. 
Classe Ponto Médio Freqüência 
0 |- 1 0.5 12 
1 |- 2 1.5 6 
2 |- 3 2.5 4 
3 |- 4 3.5 5 
4 |- 5 4.5 1 
5 |- 6 5.5 1 
Opção 2: Número de gols por jogo-treino. Com cinco classes teremos a tabela 2.7. 
 
Tabela 7 – Distribuição de Freqüência dos gols em 
jogos-treinos. 
Classe Ponto Médio Freqüência 
0 |- 3 1.5 3 
3 |- 6 4.5 4 
6 |- 9 7.5 3 
9 |- 12 10.5 1 
 
Opção 3: Número de gols por jogo-treino nos primeiros 10 minutos Com cinco classes 
teremos a tabela 8. 
 
Tabela 8 – Distribuição de Freqüência dos gols em 
jogos-treinos nos primeiros dez minutos. 
Classe Ponto Médio Freqüência 
0 |- 1 0.5 5 
1 |- 2 1.5 2 
2 |- 3 2.5 1 
3 |- 4 3.5 1 
4 |- 5 4.5 0 
5 |- 6 5.5 1 
 
Opção 4: Número de gols por jogo-treino, no intervalo entre 10 e 20 minutos. Com cinco 
classes teremos a tabela 9. 
 
Tabela 9 – Distribuição de Freqüência dos gols em 
jogos-treinos entre 10 e 20 minutos. 
Classe Ponto Médio Freqüência 
0 |- 1 0.5 4 
1 |- 2 1.5 2 
2 |- 3 2.5 1 
3 |- 4 3.5 2 
4 |- 5 4.5 1 
5 |- 6 5.5 0 
 
 
15 
 
Opção 5: Número de gols por jogo-treino, nos últimos 10 minutos. Com cinco classes 
teremos a tabela 10. 
 
Tabela 10 – Distribuição de Freqüência dos gols em 
jogos-treinos, nos últimos 10 minutos. 
Classe Ponto Médio Freqüência 
0 |- 1 0.5 3 
1 |- 2 1.5 2 
2 |- 3 2.5 2 
3 |- 4 3.5 2 
4 |- 5 4.5 0 
5 |- 6 5.5 1 
 
Exercícios 
 
1) Monte uma tabela de distribuição de freqüências, com os dados das massas em kg de 
atletas de voleibol que participaram de um torneio de universitários, apresentadas abaixo 
 
77.6 67.9 79.6 87.1 
89.9 78.0 78.9 89.4 
76.7 88.9 90.5 81.8 
89.9 67.7 89.5 74.9 
76.0 89.8 98.3 71.2 
78.3 98.5 78.9 98.7 
98.9 67.8 83.2 65.9 
67.7 87.8 91.2 89.0 
 
2) Em determinada competição esportiva, foram encontradas as seguintes quantidades de 
atletas em cada modalidade. 
 
Natação –230. 
Futebol – 470. 
Voleibol- 200. 
Hóquei- 15. 
Futsal – 78. 
Atletismo – 560. 
Hipismo – 4. 
 
Monte uma tabela indicando a freqüência e freqüência relativa em cada caso e , em 
seguida, indique qual modalidade apresenta menor índice percentual de atletas e qual a 
maior. 
 
3) Suponha que dos 560 atletas do atletismo, 30% sejam mulheres? Como seria possível 
montar uma tabela de contigências neste caso? 
 
 
16 
 
Apresentação de Dados em Gráficos 
 
 As normas nacionais são ditadas pelo IBGE. 
 
 “Título” acima ou abaixo da tabela. 
 
 “Escalas” crescem da esquerda para a direita. 
 
 “Legendas” preferencialmente à direita. 
 
 
1 - GRÁFICOS DE BARRA. 
 
 Apresenta variáveis qualitativas ou ordinais. 
 
 Devem ser Traçados eixos cartesianos primeiramente. 
 
 As “abscissas” definem as categorias. 
 
 As ordenadas definem a altura das barras retangulares. 
 
 Altura = freqüência ou à freqüência relativa. 
 
2 - GRÁFICO DE SETORES 
 
 Apresenta variáveis qualitativas ou ordinais. 
 
 Devem ser traçadas as circunferências, representando 100%. 
 
 Cada categoria deve ser representada pelo seu ângulo e em freqüência relativa. 
 
X= 360xf/100 
 
 
3 – HISTOGRAMA 
 
 Representa dados apresentados em tabelas distribuição de freqüências. 
 
 Os eixos cartesianos, definem os intervalos de classe nas abcissas e as freqüências 
nas ordenadas. 
 
Intervalos de classes iguais: Barras retangulares de mesma base. 
 
Intervalos de classes diferentes: Calcula-se as densidades de freqüência relativa, pela 
fórmula: 
 
d = freqüência relativa/ intervalo de classe. 
 
As bases são iguais aos intervalos de classe. Alturas determinadas pelas respectivas 
densidades. 
17 
 
 
4 - POLÍGONO DE FREQÜÊNCIAS 
 
Representa dados apresentados em tabelas de distribuição de freqüências. 
 
Intervalos de Classe diferentes. 
 
 Abcissas: Iguais aos ponto médios. 
 
 Ordenadas: Respectivas densidades de freqüências relativas. 
 
Intervalos de Classe iguais. 
 Abcissas: Iguais aos ponto médios. 
 
 Ordenadas: Respectivas freqüências. 
 
 Freqüências: Fecha-se o polígono considerando: Os pontos médios de classes 
imediatamente superiores e inferiores à última e primeira. 
 
Exercícios do Capítulo 
 
1) Monte um histograma com os dados acima que representam o número de gols nos 
jogos de Handbol da liga universitária. 
 
77 67 79 87 
89 78 78 89 
76 88 90 81 
89 67 89 74 
76 89 98 71 
78 98 78 98 
98 67 83 65 
67 87 91 89 
 
2) 100 (cem) atletas de 10 (dez) modalidades esportivas se submeteram à 
Hiperventilação Voluntária (HV). Uma pequena parte deste total (361 atletas) apresentou 
diminuição do tempo nos testes de capacidade aeróbica que utiliza corrida em 40 
segundos. O número de atletas em cada modalidade é apresentado abaixo. Construa um 
gráfico de barras de acordo com estes dados. 
 Natação – 33. 
 Futebol – 47. 
 Voleibol - 40. 
 Hóquei - 65. 
 Futsal – 48. 
 Atletismo – 20. 
 Hipismo – 34. 
 Handbol – 22. 
 Ciclismo – 17. 
 Maratona – 35. 
18 
 
 
3) Explique qual é o objetivo de cada uma das opções abaixo. 
 
 Histograma: 
 
 
 
 
 Polígono de Freqüências: 
 
 
 
 
 Gráfico de Barras: 
 
 
 
 
 Gráfico de Setores: 
 
 
 
 Tabela de Contigências: 
 
 
 
 
 
 
Referências 
[1] VIEIRA, S. Introdução à bioestatística. 3a. ed. Rio de Janeiro: Ed. Campus, 1980. 
 
[2] TRIOLA, M. F. Introdução à Estatística. 7a. ed. Rio de Janeiro: LTC Editora, 1999. 
 
[3] DORIA FILHO, U. Introdução à bioestatística para simples mortais. 3a. ed. São Paulo: 
Negócio Editora, 1999.

Outros materiais