Buscar

bioestatisca primeira área

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ORGANIZAÇÃO DE DADOS QUANTITATIVOS
Uma contribuição importante da estatística no manejo das informações foi a criação de procedimentos para a organização e o resumo de grandes quantidades de dados. Os dados podem ser organizados em tabelas ou gráficos.
Um estudo da quantidade de albumina no plasma de pessoas com determinada doença coleta dados de n = 25 indivíduos:
5.1 5.0 5.2 4.5 4.8 4.9 5.0 5.2 5.4 5.1 4.9 5.0 5.2 5.4 5.1 5.1 5.1 5.3 4.7 5.3 4.7 5.4 5.0 5.5 5.0
O jeito mais fácil de obter conclusões a respeito dos dados é organizando-os em tabelas de frequências, nas quais se indicam os valores obtidos e a frequência com que ocorrem.
TABELA DE FREQUÊNCIA
 
Sendo f a frequência absoluta simples e n é o números de observações analisadas
 fr = frequência relativa simples fr = f/n 
Dividindo f por ∑f ou n, obtem-se a fr, que representa a proporção com que cada valor ocorre.
∑fr = 1 A soma da frequência relativa simples deve ser um, representando os 100%.
 Fr = frequência relativa acumulada
Para saber a proporção de pessoas com taxa de albumina igual ou menor do que uma determinada observação, calcula-se a Fr, obtida pela soma acumulada das fr a partir do valor de interesse.
Qualquer frequência relativa pode ser transformada em frequência percentual, bastando multiplicá-la por 100.
PERCENTIL
A Fr pode ser utilizada para se obter percentis. O percentil de ordem k (PK) é o valor de x precedido por k % dos valores e seguido por (100 - k)% dos valores.
Por exemplo, P25 é o valor de x que é precedido por 25% dos valores (os 25% menores da série) e seguido pelos 75% restantes. Sendo que em P25 os 25% anteriores são ≤ que x.
Os percentis de ordem 25, 50 e 75 dividem o conjunto de dados em quatro parte iguais; por isso, recebem o nome de quartis e são respectivamente os quartis Q1, Q2 e Q3. Neste caso Q2 representa a mediana.
Quando o valor exato não é encontrado nos dado, utilizamos a média entre os valores mais próximos.
Por exemplo o percentil P25 é um valor entre 4,8 e 4,9 estima-se, então, o percentil pela médias entre estes dois números, obtendo-se P25 = 4,85.
NOTA SOBRE A APRESENTAÇÃO DE TABELAS
- A tabela deve der precedida de título claro
- Deve ser limitada por linha superior e inferior. O cabeçalho é separado do corpo por linha horizontal
- Não se usam linhas verticais, apenas espaços
- Abreviações pouco comuns devem ser explicadas no rodapé
- Indica-se a fonte dos dados
GRÁFICOS
Representam os dados de forma visual, além de serem mais fáceis de interpretar que as tabelas e evidenciarem características importantes dos dados.
HISTOGRAMA
São os gráficos mais utilizados para variáveis contínuas. Sua base é o intervalo de classe, e a altura, a frquência relativa.
DIAGRAMA DE BARRAS
Diferentemente do histograma as fr para cada valor de x são representadas por bastões, pois não existe continuidade entre os valores.
BOXPLOT
 
GRAFICO DE VIOLINO
MEDIDAS DE TENÊNCIA CENTRAL OU POSIÇÃO
Um único valor que representa os dados de forma ainda mais condensada que as tabelas.
MÉDIA ARITMÉTICA
Medida de centralidade mais usada representa o centro de massa de uma distribuição.
Para dados que não estão grupados a média é simples. 
A média para dados em grupamento simples calcula-se do seguinte modo: 
Nesta fórmula cada valor de x deve ser multiplicado pelo número de vezes que ele ocorre (f), para depois obter a soma.
 media = 126,5 / 25 = 5,06
MEDIANA
É o valor da série ordenada de x que divide os dados em dois grupos, é um valor tal que tenha igual quantidade de números menores e maiores do que ele. Uma característica da mediana é que ela não é afetada pelos extremos da série.
A mediana é o número de posição (n+1)/2 na sequência ordenada
Exemplo 1: 2 4 8 5 21 em série ordenada 2 4 5 8 21
Quando há um número par de elementos a mediana é calculada como a média dos dois valores centrais da sequência
Exemplo 2: 1 4 5 5 2 7 em série ordenada 1 2 4 5 5 7 mediana = 4.5
A mediana é o percentil 50%, e pode ser obtida das frequências relativas acumuladas, o valor de x para o qual Fr = 0,5 é a mediana.
 mediana = 5.05
Utiliza-se a mediana como medida central quando os dados são altamente assimétricos ou quando os extremos são indefinidos.
A diferença entre os valores da média e da mediana é indicação de assimetria da distribuição. Em distribuições simétricas a média e a mediana são iguais.
MODA
É o valor mais frequente de uma série de valores. Nas representações gráficas a moda aparece como um pico de frequência. Uma distribuição pode ter mais de uma moda.
Seguindo a tabela anterior a Moda = 5.0
Ás vezes, observam-se gráficos com dois picos, ditos como bimodais. Uma distribuição é polimodal quando apresenta mais de dois picos.
MEDIDAS DE DISPERSÃO OU VARIABILIDADE
As medidas de tendência central são insuficientes para representar adequadamente conjuntos de dados, pois nada revelam sobre sua variabilidade. As medidas de dispersão caracterizam o agrupamento e variabilidade dos dados.
AMPLITUDE DOS DADOS
É a medida mais simples de variação, representa a diferença entre os valores máximo e mínimo observados. Dá ideia do intervalo de variação dos dados, porém não de como eles estão distribuídos.
 (IMAGEM 1em azul a amplitude é maior)
(IMAGEM 2 a amplitude é igual nos três gráficos)
VARIÂNCIA
Mede o desvio dos dados em relação a média. Quanto maior a variância, maior a variabilidade (ou dispersão dos dados). Calcula-se a variância, em amostras, do seguinte modo:
Se os dados estiverem grupados:
Há uma fórmula alternativa para a variância que é útil quando a média não é um valor exato.
Para dados não- grupados é:
X
2 
Para dados grupados (tabela de frequência):
f
.X
2
X
2
DESVIO PADRÃO
Uma dificuldade da variância, como medida descritiva da dispersão, é o fato de não poder ser apresentada com a mesma unidade com que a variável foi medida. A solução é extrair a raiz quadrada positiva da variância, obtendo a mesma unidade de medida dos dados. Essa nova medida de variabilidade é chamada de desvio padrão.
Na IMAGEM 1 o desvio padrão é maior no azul.
Na IMAGEM 2 o maior desvio padrão é no azul e o menor é no vermelho.
TABELAS DE GRUPAMENTO POR INTERVALO DE CLASSE
Utilizamos o valor médio de cada intervalo para os cálculos de média e desvio.
O sinal │---- indica que o extremo inferior está incluído no intervalo, mas o superior não. Intervalo aberto à direita
Temos também os intervalos abertos à esquerda ----│ ou fechados em ambos os lados │----│.
DISTRIBUIÇÃO NORMAL
As distribuições de frequências podem apresentar formar variadas. Porém algumas distribuições são equilibradas, os valores centrais são mais frequentes e os mais extremos, mais raros. 
Forma comum: distribuição simétrica com a maioria dos valores concentrados próximo da média.
No histograma a sucessão ascendente e descendente de pequenos ‘’degraus’’ transforma-se em uma linha contínua, com a forma aproximada de um sino. O nome desta linha teórica é curva de distribuição normal.
Propriedade da curva normal:
Forma de sino
Os valores de x podem variar de menos infinito a mais infinito; a curva jamais toca o eixo x
A curva é simétrica em relação à média
A curva é simétrica em relação à média
Área sobre a curva totaliza 1(ou 100%
Probabilidades podem ser calculadas como áreas sob a curva
A distribuição normal tem dois parâmetros: Média e desvio padrão.
* Valores diferentes de média e desvio padrão geram curvas diferentes
A distribuição normal padrão tem média µ=0 e desvio padrão ơ=1
As áreas situadas abaixo da curva estão tabeladas (Tabela A1). A variável desta tabela é o z. 
A Tabela A1 informa áreas entre a média (0) e um valor de z qualquer. Quando z for 1 (isto é igual a ơ) temos um desvio padrão em relação a média e assim sucessivamente.(raro ter mais de 3 desvios)
A curva toda tem área = 1, portanto a área à direita de zero é 0,5.
A distribuição normal tem dois parâmetros: média e desvio padrão. A média é o valor central da distribuição, informa o centro. O desvio padrão indica quão distribuidos (“espalhados”) estão os dados. 
Independente da média ou desvio a área sobre a curva sempre será 1.
TRANSFORMAÇÃO DE UMA VARIÁVEL X EM Z
As variáveis observadas na prática (x) apresentam valores cujas curvas não estão tabeladas. Os valores de x podem ser transformados na variável z e então as áreas sobre a curva podem ser obtidas da tabela da curva normal.
 
Exemplo 1. Um treinador deseja selecionar entre os jovens que prestam serviço militar aqueles com estatura mínima de 180 cm para formar um time de basquete. Que percentágem é esperada de jogadores em potencial sabendo que a estatura tem distribuiçõ normal, e nesses jovens a média é 175 cm e o desvio padrão é 6 cm?
µ = 175 ơ = 6 x = 180
z = 180 – 175 / 6 = 0,83 
Tabela A1 
Z = 0,83 área entre 0 e z = 0,2967 
Para saber a área restante 0,5 – 0,2967 = 0,2033

Outros materiais