A maior rede de estudos do Brasil

Grátis
18 pág.
Bioestatistica_Notas_de_Aula_3

Pré-visualização | Página 2 de 4

Estudaremos a média aritmética, a mediana, a moda, o ponto médio e 
a média ponderada. 
 
Média Aritmética. 
 
De modo geral é a mais importante de todas as mensurações. É interpretada como o 
centro do conjunto de dados, o ponto de equilíbrio do conjunto. 
 
A média (aritmética) de um conjunto de valores é o valor obtido somando-se todos eles e 
dividindo-se o total pelo número de valores. 
n
x
X

 
 
 - indica o somatório, ou a soma, de todos os valores da variável x. 
n - tamanho da amostra, número de valores em consideração. 
5 
 
 
Exemplo: 
Tabela 1 – Peso, em gramas, de ratos machos da raça Wistar com 30 dias de idade. 
50 62 70 
86 60 64 
66 77 58 
55 82 74 
 
67
12
804
12
748255587766646086706250


X 
Mediana 
 
É o valor do meio de um conjunto de dados, quando os valores estão dispostos em ordem 
crescente (ou decrescente). A mediana é representada por x~ ou Me. 
 
Tem sempre 50% acima e 50% abaixo. Divide a amostra em dois conjuntos com o mesmo 
número de dados. 
 
Amostra constituída por um número ímpar de dados: 
1, 2, 3, 5, 9 
Me = 3 
 
Amostra constituída por um número par de dados: 
1, 2, 3, 4, 7, 9 
A mediana será a média aritmética dos valores. 
Me = (3 + 4)/2 = 3,5 
 
Moda 
 
Representação: Mo 
 
É o valor que ocorre com maior freqüência. 
Exemplo: 3, 4, 5, 7, 7, 7, 9, 9 – Mo = 7 (ocorreu o maior número de vezes). 
 
Existem conjuntos de dados que não apresentam moda e existem conjuntos com duas ou 
mais modas (conjunto bimodal e multimodal). 
 
A moda pode ser obtida mesmo que a variável seja qualitativa. 
Tabela 3 – Indivíduos segundo o tipo de sangue. 
 
Tipo de Sangue Freqüência 
O 547 
A 441 
B 123 
AB 25 
 
A moda é o tipo O. 
 
 
6 
 
Tabela 4 – Pulsação por minuto de 60 alunos da Academia Cançado, 2000. 
 
Pulsação por minuto Número de alunos 
60 a 70 20 
70 a 80 24 
80 a 90 16 
Total 60 
 
Ponto Médio 
 
É o valor que está a meio caminho entre o maior valor e o menor valor. É a média 
aritmética desses valores. 
 
Média de uma Tabela de Distribuição de Freqüências – Média Ponderada. 
 
Quando os dados estão resumidos em uma tabela de distribuição de freqüências, 
podemos aproximar a média substituindo os limites de classe pelos pontos médios das 
classes e supor que todos os elementos da classe se concentrem no ponto médio. A 
tabela indica quantos valores se situam em uma classe, mas não indica os valores 
específicos. 
 



f
pmf
X
).(
 
pm – ponto médio da classe. 
 – freqüência 
 = n 
 
Melhor Medida de Tendência Central 
 
Qual dessas medidas é a melhor? 
 
Não há uma resposta única porque não há critérios objetivos para determinar a mais 
representativa para todos os conjuntos de dados. 
 
Medidas de Dispersão dos Dados ou Medidas de 
Variação. 
 
Amplitude. 
É a diferença entre o maior valor e o menor valor pertencentes ao conjunto de dados. 
 
Em geral não é uma boa medida pois leva em consideração apenas os valores extremos. 
 
Desvio Padrão e Variância. 
De modo geral o desvio padrão é mais útil. 
Consideração todos os valores. 
 
 
7 
 
O desvio padrão (s) é determinado por: 
1
)( 2




n
xx
s 
 
xx  é o desvio em relação á média. A soma dos desvios médios é sempre zero. A 
soma dos desvios médios é sempre zero. 
 
Desvio médio = 
n
xx 
 
 
Processo para determinar o desvio padrão. 
1) Achar a média dos valores (achar x ). 
2) Subtrair a média de cada valor individual ( xx  ). 
3) Elevar ao quadrado cada uma das diferenças obtidas no item 2 (achar 
2)( xx  ). 
4) Somar todos os quadrados obtidos no item 3, obtendo  
2)( xx . 
5) Dividir o total calculado no item 4 pelo número n – 1, isto, o número total de 
observações menos 1. 
6) Extrair a raiz quadrada do resultado do item 5. 
 
Exemplo: Determine o desvio-padrão dos números seguintes: 
6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 
(resposta: 0,48) 
 
Outra fórmula para o desvio-padrão: 
)1(
)()( 22



nn
xxn
s 
 
Significado do Desvio-padrão. 
O desvio-padrão mede a dispersão (ou variação) dos valores ao redor da média. Valores 
próximos resultam em desvio-padrão menor, enquanto que valores muito afastados 
resultam desvio-padrão maior. 
 
Omitindo a etapa 6 (calcular a raiz quadrada) no processo de cálculo de desvio padrão, 
obtem-se a variância, definida pela fórmula. 
 
Coeficiente de Variação (CV). 
 
Quase nunca uma medida de tendência central é suficiente para descrever, de modo 
satisfatório, um conjunto de dados. Não basta saber o valor em torno do qual os dados se 
concentram. É preciso conhecer também o grau de agregação, ou seja, definir e usar 
medidas da dispersão dos dados. O desvio padrão é uma dessas medidas. Mas quando 
que um desvio padrão é grande ou pequeno? É uma questão relevante na avaliação da 
precisão de métodos. Um desvio padrão pode ser considerado grande ou pequeno 
dependendo da ordem de grandeza da variável. Um desvio padrão de 10 pode ser 
insignificante se a observação típica for 10.000, mas será um valor significativo para um 
conjunto de dados cuja observação típica é 100. 
8 
 
 
Portanto, por vezes é conveniente exprimir a dispersão em termos relativos, ou seja, 
expressar a variabilidade dos dados tirando a influência da ordem de grandeza da 
variável. 
 
O Coeficiente de Variação é um índice relativo de dispersão que compara o desvio padrão 
(s) com a média ( x ) e é definido por: 
x
s
CV 
 
 
100100
média
padrãodesvio
X
s
CV

 
 
O CV é adimensional, isto é, um número puro e é usualmente expresso em porcentagem. 
Sua utilidade é fornecer uma medida para a homogeneidade do conjunto de dados. 
Quanto menor o CV, mais homogêneo é o conjunto de dados. 
 
Um valor de CV menor ou igual a 0,25 geralmente indicará que o conjunto de dados é 
razoavelmente homogêneo. Entretanto, esse padrão varia de acordo com a aplicação. 
Uma possível classificação é a seguinte: baixo (inferior a 0,10); médio de (0,10 a 0,20); 
alto (de 0,20 a 0,30) e muito alto (superior a 0,30). 
 
A classificação do CV como baixo, médio, alto ou muito alto pode ser difícil, mas esta 
medida é de bastante utilidade na comparação de duas variáveis ou dois grupos que a 
princípio não são comparáveis (por exemplo, ordem de grandeza das variáveis 
diferentes). 
 
O tempo em (meses) entre a remissão de uma doença e a recidiva de pacientes de uma 
determinada clínica médica foi registrado. Os dados ordenados estão apresentados a 
seguir, separadamente para os sexos masculino (M) e feminino (F): 
 
M 2 4 4 7 9 15 15 18 22 22 
F 3 3 5 7 8 8 10 11 12 18 
 
Qual das amostras é mais homogênea? 
 
Medidas de Posição 
 
Escores z 
Os escores z permitem comparar valores mais facilmente, por intermédio de 
padronização. 
 
Definição: O escore padronizado ou escore z, é o número de desvios padrão pelo qual 
um valor x dista da média (para mais ou para menos). É dado por: 
s
xx
z

 
Obs.: Arredondar para duas casas decimais. 
 
9 
 
A importância dos escores z é de permitir a diferenciação entre os valores usuais, ou 
típicos, e os valores raros, ou incomuns. 
 
Também conhecido como escore padronizado, relaciona a média e o desvio padrão para 
cada indivíduo. A idéia é que, na comparação dos resultados de dois indivíduos, é 
importante a padronização em relação ao grupo. Por exemplo, um aluno que tenha obtido 
nota 7 numa prova em que a média da classe foi 5 apresentou melhor rendimento do que 
numa prova em que tirou 8 mas a média da classe foi 9. Além da comparação da nota 
individual com a média da classe também é importante avaliar se em cada caso a 
variabilidade das notas foi grande ou não. Assim, o desempenho deste aluno que obteve 
nota 7 seria bom se o desvio padrão da classe fosse 2 e apenas razoável se fosse 4. 
 
O escore padronizado (z) é definido pela fórmula: 
s
xx
z

 
Esta medida fornece o número de desvios padrão que a observação dista da média da 
amostra. Esta interpretação justifica o uso do termo desvio padrão

Crie agora seu perfil grátis para visualizar sem restrições.