Buscar

Conceitos Básicos em Bioestatística

Prévia do material em texto

Laís Kemelly – Medicina 
Habilidades Gerais V 
 
 
Introdução 
Como avaliar se a evidência que estou utilizando é 
de qualidade? 
• Metodologia (desenho do estudo) 
• Bioestatística 
O objetivo é definir qual a exatidão e precisão do 
estudo, bem como localizar possíveis erros 
metodológicos/sistemáticos e aleatórios. 
Inferências Estatísticas 
População x amostra 
 
• População é o grupo que eu quero estudar, 
a amostra é a parcela daquele grupo que eu 
consigo ter acesso. 
• A amostra deve ter as mesmas 
características da população como um todo. 
o Tamanho da amostra 
o Representatividade da amostra 
Ex.: quero estudar sobre complicações na gestação 
em hipertensas. Não vou estudar todas as 
hipertensas do mundo, minha amostra vai ser 
limitada e a partir dos dados desse grupo menor que 
vou estudar, extrapolo os resultados. 
Teste de hipótese 
Hipótese nula → premissa básica, assumindo que o 
resultado não existe 
Hipótese alternativa → aquilo que você espera 
achar 
• Erro tipo I: falso-positivo 
A hipótese nula é rejeitada, apesar de ser 
verdadeira. 
 
 
 
• Erro tipo II: falso-negativo 
A hipótese nula não é rejeitada, apesar de ser falsa. 
Causa comum: amostra pequena. 
Essa aqui ficou confusa então é tipo: você afirmou que o 
resultado que esperava encontrar não existe, mas na realidade 
ele existe sim, só não foi encontrado no seu estudo. 
 
Interprete essa imagem assim: seu estudo vai ser 
estaticamente significante quando trouxer algo novo. Se você 
aceita a hipótese nula (H0), quer dizer que sua ideia 
mirabolante não era verdade. Logo, estaticamente 
insignificante. 
Valor-p 
Determina o nível de significância: qual a 
influência do acaso no meu trabalho? Qual a chance 
de cometer o erro do tipo I? 
• Probabilidade de aceitar ou refutar a 
hipótese nula 
Quanto menor o valor de p, mais “rígido” o 
trabalho. 
P > 0,05 → estaticamente insignificante 
• Aceitou hipótese nula e rejeitou alternativa 
• A diferença entre os grupos foi pelo acaso 
P < 0,05 → estaticamente significante 
• Rejeitou a hipótese nula e aceitou a resposta 
alternativa 
• A diferença entre os grupos não foi pelo 
acaso 
Nem todo estudo < 0,05 é clinicamente relevante. 
• Clinicamente relevante corresponde à 
diferença entre duas terapias, quando essa 
diferença é grande o suficiente para 
justificar a mudança do tratamento padrão 
 
Conceitos Básicos em Bioestatística 
Laís Kemelly – Medicina 
Habilidades Gerais V 
Intervalo de confiança 
Qual a chance de eu encontrar esses mesmos 
resultados se reproduzir o estudo na mesma 
população, só que com outra amostra? 
Quanto menor o IC, maior essa chance 
+ tamanho amostral → - intervalo → + precisão 
nos resultados 
Tipos de Variáveis 
 
Variável qualitativa ou categórica 
• Nominal: não existe ordem 
o (ex. sexo masculino e feminino) 
• Ordinal: existe uma ordem nos resultados 
o ex. classe social: alta, média, baixa 
• Dicotômica: apenas duas opções de 
resposta 
o ex.: sim x não, doente x não doente 
Essas variáveis não podem ser expressas por 
medidas de tendência central (média/mediana), já 
que não se referem a valores. 
Nesse caso, utilizamos números absolutos e 
percentuais. Pode utilizar o intervalo de 
confiança de 95% para estimar a precisão dos 
resultados. Vou colocar uma tabela aqui pra 
entender melhor. 
 
 
 
 
 
 
 
 
Pense aí no tipo de variável. 
• Sexo → categórica nominal 
• Uso de preservativos → categórica 
dicotômica 
Como organizaram a tabela? Quantos “sim”, 
quantos “não” e o que isso representa no total da 
amostra. 
• n → número absoluto 
• percentuais (%) 
O intervalo de confiança é definido por um 
programa. 
Variável quantitativa 
• Discreta → valores inteiros 
o ex.: número de filhos 
• Contínua → valores em intervalos, “entre 
x e y” 
Estatística Descritiva 
Descrever as características de um certo grupo, 
para detalhar as características dos dados coletados. 
Como que eu vou saber se minha amostra 
realmente é compatível com a população do meu 
estudo? Como ter certeza que essa amostra 
corresponde às características da população? 
• Determinar uma medida de tendência 
central 
o Média 
o Mediana 
o Moda 
• Determinar uma medida de dispersão 
o Desvio-padrão 
o Amplitude 
o Intervalo interquartil 
• Escolher a melhor forma de representação 
gráfica 
 
Laís Kemelly – Medicina 
Habilidades Gerais V 
Medidas de Tendência Central 
Um valor único que tenta descrever as 
características de um conjunto de dados. 
 
 
Média 
Medida mais conhecida e mais utilizada. Soma 
tudo e divide pela quantidade. Lembre aí do ensino 
médio. 
Vantagens 
• Reflete todos os valores da amostra 
Limitações 
• É influenciada pelos valores extremos 
Tipo de variável 
• Contínua 
• Discreta 
Mediana 
Valor que ocupa a posição central do conjunto dos 
dados quando estes estão em ordem crescente. 
• Valor par: o que está no meio 
• Valor ímpar: média entre as duas posições 
centrais 
Vantagens 
• Menos sensível a valores extremos 
 
 
Limitações 
• Difícil de ser determinada 
• Não engloba todos os valores da amostra 
Tipo de variável 
• Contínua 
• Discreta 
Moda 
O valor que aparece com maior frequência em uma 
distribuição, seja numérica ou nominal. (aplicável 
para quanti e quali) 
• Amodal → quando não existe moda 
• Unimodal → quando a moda é única 
• Bimodal → quanto existem duas modas 
• Multimodal → + de duas modas 
A moda representa o valor mais frequente, mas não 
possui representatividade e não é utilizada na 
bioestatística. 
Medidas de Dispersão 
Amplitude 
Traz os dois extremos dos dados, o maior valor e o 
menor valor. Não mede a variabilidade. 
Valor máximo – valor mínimo 
Intervalo interquartil 
Está diretamente relacionado à mediana. 
Primeiro de tudo, o que peste é um quartil? 
Pegar os valores, colocar em ordem e dividir em 
quatro partes. 
Os quartis são o espacinho entre essas partes, tá aí 
na imagem como Q1, Q2, Q3. 
 
O cálculo de cada Q é a partir da mediana de cada 
quartil e no final das contas calculamos o intervalo 
assim: 
 
Laís Kemelly – Medicina 
Habilidades Gerais V 
 
Pensando nessa tabela e na fórmula, o intervalo 
pega a diferença entre os dois possíveis extremos 
dos dados. 
Só que diferente da amplitude, ele não pega o 
primeiro número e o último. Ele pega a mediana 
dos termos mais afastados. 
Desvio-padrão 
É uma medida de variabilidade que depende do 
cálculo da variância. 
Variância essa que calcula os desvios de cada 
observação em relação à média. Ou seja, o desvio-
padrão está diretamente relacionado à média. 
 
• O número + - outro número → a média e 
seu desvio padrão 
• O número e um parênteses → a mediana e 
seu intervalo interquartil 
A escolha de usar média ou mediana depende dos 
valores da amostra. Suba lá nas medidas centrais e 
veja as limitações de cada uma. 
• Mediana não sofre influência de valores 
extremos 
De modo geral, você vai usar a medida que mais 
se aproxime das características do grupo. 
 
 
 
 
 
Representações Gráficas 
Repetindo esses gráficos que já coloquei lá em 
cima, vamos associar com as medidas de tendência. 
 
1. Distribuição não-normal ou não 
paramétrica 
2. Distribuição normal ou paramétrica 
3. Distribuição não-normal ou não 
paramétrica 
O gráfico do meio é a curva Gaussiana/curva de 
Gauss, quando os valores são parecidos. Indica que 
a distribuição é normal. As outras duas são 
distorcidas por conta da interferência dos extremos 
(pra mais ou pra menos). 
• Quantidade de dados 
• Características das variáveis analisadas 
Existem testes estatísticos específicos de acordo 
com a distribuição do estudo para a definição do 
valor de p. (lembre que o valor de p determina a 
significância estatística do artigo) 
• Distribuição paramétrica 
• Distribuição não-paramétrica 
Como Avaliar a Normalidade? 
Analisamos dados daestatística descritiva. 
• Observar histograma 
• Observar tamanho do desvio-padrão 
• Observar a diferença entre média e mediana 
• Skewness 
• Kurtosis 
Além disso, podemos usar testes estatísticos para 
avaliar a normalidade. 
Alguns pontos desse checklist vão ser 
destrinchados jaja. 
 
 
Laís Kemelly – Medicina 
Habilidades Gerais V 
Análise da Estatística Descritiva 
Análise de Histograma 
 
Lembrando que essa aqui é a normalidade, 
distribuição paramétrica. Quais as características 
dela? 
• Concentração de valores em torno de um 
valor central 
• Simetria em torno do valor central 
o Os valores menores e maiores 
ocorrem “na mesma frequência” 
• Frequência pequena de valores muito 
extremos 
Compare os histogramas. 
 
Olhe esse primeiro histograma: simétrico, 
bonitinho, não tem extremos que se destacam. 
Distribuição paramétrica. 
O segundo já não tem essas características: existe 
um “desvio” em um dos extremos. É uma 
distribuição não paramétrica. 
Tamanho do Desvio-Padrão 
O que se espera em uma distribuição normal? 
• Desvio-padrão pequeno em relação à média 
• A estimativa é que o DP seja até 50% da 
média 
Ex. média 10, DP aceitável é até 5. 
Proximidade média e mediana 
Aqui não tem um valor definido, vai muito do bom 
senso. Na normalidade, o esperado é que esses 
valores estejam próximos. 
 Skewness (simetria) 
Volte uma página e olhe aquela imagem dos três 
gráficos com carinho. Essa parte da análise diz 
respeito ao “desenho” do gráfico. 
 
1. Simetria normal 
2. Skewness positivo: “cauda para a direita” 
o Mediana > média 
3. Skewness negativo: “cauda para a 
esquerda 
o Média > mediana 
Faixa de normalidade: entre – 5 e + 5 
Se for menor ou maior, você já considera fora da 
normalidade. 
Kurtosis (achatamento) 
Aqui você vai olhar o eixo y com muito amor e 
carinho. É pra olhar o “tamanho” do gráfico. 
• Valor 1: altura perfeita 
• Apiculamento: kurtosis > 1 
• Achatamento: kurtosis < 1 
Tanto esse valor quando o skewness vem descrito 
nos trabalhos, não precisa calcular. Se acalme. 
Faixa de normalidade: entre – 5 e + 5 
Se for menor ou maior, você já considera fora da 
normalidade. 
 
Laís Kemelly – Medicina 
Habilidades Gerais V 
Testes Estatísticos de Normalidade 
• Kolmogorov-Sminorv 
o Quando a amostra for > 50 
• Shapiro-Wilk 
o Quando a amostra for < 50 
A interpretação de um teste estatístico depende da 
análise da hipótese nula. 
Aqui fica um pouco confuso, mas pense que não é 
a hipótese da pergunta de pesquisa. O que 
queremos avaliar aqui é se a amostra está normal 
ou alterada, logo: 
• Hipótese nula: não há variabilidade, 
amostra normal 
• Hipótese alternativa: há variabilidade, 
amostra não normal (p < 0.05) 
Assim como os outros, esses testes vêm descritos 
na metodologia. Quando for analisar, lembre de 
observar o tamanho da amostra para saber qual dos 
dois testes estatísticos você vai utilizar. 
E o Objetivo de Todo Esse Rolê? 
Nesse momento meus dois neurônios 
remanescentes estão pedindo socorro. Vamos 
pensar no motivo pelo qual precisamos analisar 
tudo isso. 
 
Pensando que esses testes estatísticos e a análise 
descritiva vai ser feita em cima dos dados que você 
colheu com sua pesquisa, até agora só discutimos a 
metodologia. A depender da conclusão, vamos usar 
medidas de tendência central e dispersão que 
atendam às necessidades. 
Importante: geralmente os autores não detalham 
todo esse processo no artigo, então quando você 
bater o olho em uma tabela pense assim: 
• Média → amostra normal 
• Mediana → amostra não normal 
Qual gráfico usar? 
Gráfico em boxplot 
 
• Ideal para não-paramétricas. 
Gráfico em barra 
 
• Variáveis categóricas 
• Altura representa a frequência da variável 
Gráfico de pizza 
 
• Demonstra relações proporcionais entre 
categorias 
Histograma 
 
• Distribuição de frequências, permite 
analisar a forma, ponto central e variação de 
distribuição 
• Análise de dados quantitativos 
É nesse aqui que analisamos toooodos aqueles 
parâmetros.

Continue navegando