Buscar

Conceitos Básicos de Bioestatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

O que significa Medicina Baseada em Evidências? MBE se traduz pela prática da medicina em um contexto em 
que a experiência clínica é integrada com a capacidade de analisar criticamente e aplicar de forma racional 
a informação científica de forma a melhorar a qualidade da assistência médica. Na MBE, as dúvidas que 
surgem ao resolver problemas de pacientes são os principais estímulos para que se procure atualizar os 
conhecimentos. A filosofia da MBE guarda similaridades e pode ser integrada com a metodologia de ensino-
aprendizagem denominada Aprendizado Baseado em Problemas. A aquisição de conhecimentos de 
Epidemiologia Clínica, o desenvolvimento do raciocínio científico, atitudes de autoaprendizagem e 
capacidade de integrar conhecimentos de diversas áreas são fundamentais para a prática da MBE. 
Alguém pode ser considerado possuidor das competências necessárias para a prática da MBE quando for 
capaz de: 
1. Identificar os problemas relevantes do paciente; 
2. Converter os problemas em questões que conduzam às respostas necessárias; 
3. Pesquisar eficientemente as fontes de informação; 
4. Avaliar a qualidade da informação e a força da evidência, favorecendo ou negando o valor de uma 
determinada conduta; 
5. Chegar a uma conclusão correta quanto ao significado da informação; 
6. Aplicar as conclusões dessa avaliação na melhoria dos cuidados prestados aos pacientes. 
•Melhor evidência disponível 
•Expectativa do paciente 
•Experiência do Profissional 
 
O que é A Ciência da estatística? 
-É uma ciência que se dedica à coleta, análise e interpretação de dados 
-Bioestatística trata-se das aplicações da Estatística nas Ciências Biológicas e da Saúde. 
A estatística pode responder questões como: 
•Como os pesquisadores testam a eficiência de novas drogas? 
•Como será o comportamento de uma determinada característica daqui a algum tempo? 
Pilares da MBR: 
 
HIPÓTESES 
Hipóteses são conjecturas que os estudos tentam explicar. São respostas possíveis dadas aos problemas postos 
pela ciência ou pelo senso comum. A hipótese, de alguma maneira, orienta e determina a natureza dos dados 
a serem coletados e, portanto, a metodologia da pesquisa. Dados são produzidos para satisfazer um objetivo, 
validar ou afastar a hipótese em questão. 
A pesquisa epidemiológica sempre tenta responder a seguinte hipótese: uma dada variável de exposição 
constitui ou não um fator de risco para uma certa patologia? 
VARIÁVEIS 
Para que a hipótese possa ser testada e que os fenômenos possam ser analisados e compreendidos, as 
diferenças entre seus elementos ‒ as variáveis ‒ devem ser explicadas. Isso é realizado através de operações 
de classificação, contagem ou mensuração da propriedade variável considerada. 
O que são as variáveis? São atributos dos eventos clínicos ou dos pacientes. Na verdade, são “coisas” que 
variam e podem ser medidas. Exemplos: gravidade da doença, peso do paciente, sexo, comorbidades... 
Nos estudos, existem dois principais tipos de variáveis: 
É a causa, ou seja, o risco para determinado agravo. São representadas no eixo x. 
É o agravo pesquisado, ou seja, o desfecho. São representadas no eixo y. 
Vamos entender melhor com o seguinte exemplo: um estudo para a avaliação do efeito do consumo de álcool 
na ocorrência de câncer de pulmão. Neste estudo, utilizou-se como variável de exposição (cujo efeito deseja-
se investigar) o consumo de álcool e como variável de desfecho (variável sobre a qual o efeito é observado) a 
ocorrência da doença. Existem ainda variáveis que interferem na relação entre exposição e desfecho, 
denominadas de variáveis de confundimento. 
Quanto à sua natureza, as variáveis podem ser qualitativas ou quantitativas (contínuas ou discretas). 
São as que se diferenciam apenas pelo grau (quantidade de algo), ou seja, são medidas por valores numéricos. 
Exemplo: peso, altura, idade… 
Podem ser subdivididas em: 
- Contínuas, onde se admitem valores fracionários entre os valores consecutivos, por exemplo: peso, 
temperatura corporal, pressão arterial, etc. 
- Descontínuas ou discretas, onde não se admitem valores fracionários entre os valores consecutivos, por 
exemplo: número de batimentos cardíacos. 
Independente (ou de exposição): 
Independente (ou de desfecho): 
ATENÇÃO! Sempre se define a variável independente como antecedente e a variável dependente como 
consequente. 
Quantitativas: 
 
Representam as características das amostras: sexo, cor, profissão, bairro, etc. 
Se dividem em dois tipos: 
- Ordinais: quando existe uma ordem entre as categorias. Ex.: estadiamento de tumor, escolaridade... 
- Nominais: quando não existe uma ordem entre as categorias. Ex.: sexo, tipo sanguíneo, etnia.. 
O OBJETIVO 
- É derivado da pergunta de investigação. 
- Objetivo responder qual é a chance de que a associação entre uma exposição e um desfecho se deva ao 
acaso. Para que uma associação seja válida precisamos nos assegurar de que as seguintes condições foram 
afastadas: 
- Acaso – erro aleatório 
- Vieses – erro sistemático 
- Confundimento 
- Metodologia inadequada 
- Amostra probabilística 
- Representatividade adequada 
- Problema no poder/precisão da estimativa 
- Tamanho amostral inadequado 
OBS: Quanto maior a minha amostra menor é a chance de cometer erros. 
OS VIESES OU VÍCIOS OU ERROS SISTEMÁTICOS 
São processos que tendem a produzir resultados que se desviam sistematicamente dos valores verdadeiros. A 
maioria dos vícios são: 
- Vícios de seleção: ocorrem quando grupos de comparação não são semelhantes em relação a todas as 
variáveis que determinam o resultado da associação, exceto naquele estudo. 
- Vícios de aferição: ocorrem quando as variáveis são medidas de um modo sistematicamente diferente entre 
os grupos de indivíduos. 
- O Confundimento ocorre quando uma terceira variável (variável confundidora) está associada com a 
exposição e, independente da exposição, é um fator de risco para a doença. 
Qualitativas ou Categóricas: 
Erro Sistemático: 
Erro Aleatório: 
 
- Validade externa (o quanto extrapolo): está relacionado com a pergunta de pesquisa, se foi gerada de forma 
apropriada, está ligada à capacidade de generalização e aplicar os resultados dessa pesquisa em outros 
cenários. Ou seja está relacionado com: aplicabilidade e conhecimento científico 
- Validade interna: Diz respeito se o estudo responde a uma questão de pesquisa de forma apropriada, ou seja, 
livre de vieses. É determinada pela forma com que o delineamento, a coleta de dados e as análises foram 
conduzidas e expostas e todos os vieses. Logo, está relacionado com: randomização, mascaramento, viés de 
segmento, descrição seletivo de desfecho, validade do instrumento, parada precoce do desfecho, exclusão 
(correção análise com intenção de tratar). 
É um desvio do resultado do estudo, a partir dos valores reais ou verdadeiros. É o erro sistemático na estimativa 
de um parâmetro (ex.: média, risco relativo, prevalência, etc.), decorrente de problemas no desenho ou na 
condução de um estudo. O viés pode ocorrer na etapa de seleção dos indivíduos para o estudo ou na 
informação sobre a exposição ou desfecho. 
➔ Viés de Seleção: 
- Consiste em diferenças sistemáticas entre grupos 
- O que minimizar o viés de seleção? R: alocação randômica e sigilo de alocação 
- O sigilo de alocação (mascaramento da entrada do paciente no trial): o método para alocar os participantes 
aos grupos do estudo, que idealmente o investigador não deve conseguir interferir para onde ele será alocado 
até que o participante tenha ingressado no estudo. 
- É o erro mais grave do ECR 
- Impede que o pesquisador saiba para onde o paciente vai. 
➔ Viés de performance: 
- Ocorre quando os envolvidos sabem que está exposto a certa terapia, que ativa ou inativa 
- O que minimiza o viés de performance? R: cegamento/mascaramento do paciente, 
cegamento/mascaramento do avaliador de desfecho 
-Mascaramento(cegamento) de participantes e equipe: corresponde ao paciente e a equipe do estudo 
desconhecer a que grupo o mesmo foi alocado. 
- Mascaramento(cegamento) na avaliação de desfecho: corresponde aos avaliadores desfecho 
desconhecerem a que grupo os participantes foram alocados. 
- O cegamento pode se cego (o participante), duplo ego cego (participantes e o avaliador do desfecho) ou 
triplo cego (participante, investigador e estatístico) 
 
Análise de Risco de viés: 
Tipos de viés: 
 
➔ Viés de detecção: 
- Ocorre quando a exposição condiciona uma maior probabilidade de detecção da doença já existente, 
dando a falsa ideia que a origina. 
- O que minimiza o viés de detecção? R: cegamento/mascaramento do avaliador de desfecho 
➔ Viés de atrito: 
- Desfecho incompleto (perdas de dados dos desfechos) 
- Dados incompletos de desfecho: corresponde a perda de seguimento de participantes do estudo ou missing 
para determinados desfechos avaliados 
- O que minimiza o viés de atrito? R: follow up (relacionado com o tempo de acompanhamento do paciente) e 
Análise de intenção de tratar (análise em que todos os participantes são seguidos até o fim) 
➔ Viés de relato: 
- Corresponde à possibilidade de os autores terem avaliados múltiplos desfechos, mas relatados apenas alguns 
de maior conveniência 
- O que minimiza o Viés de relato? R: todos os desfechos primários e secundários pré-especificados. 
➔ Viés de condução ou execução: 
- Diferença sistemática no cuidado oferecido 
- Participantes que sabem que estão no grupo controle 
- O que minimiza o viés de condução? R: mascaramento 
➔ Viés de mensuração: 
- Diferenças sistemáticas entre os grupos na maneira como são medidos os desfechos. 
- Posso corrigir com mascaramento. 
➔ Viés de informação: 
- São desvios dos resultados que decorrem de erros na mensuração ou aferição da exposição ou do desfecho 
de interesse 
- Os dados devem ser obtidos da mesma forma no grupo controle e intervenção. 
➔ Viés de memória: 
- É um tipo de viés de informação. Ocorre em estudos que dependem de informação retrospectiva. Ex.: em 
estudos de caso-controle, quando os casos tendem a lembrar com mais detalhes de sua história de doença e 
exposições pregressas do que os controles. 
 
 
CONFUNDIMENTO 
A situação de confundimento (confounding) resulta de uma falta de comparabilidade entre os grupos de 
expostos e não expostos em relação ao risco de contrair a doença. Não apenas a exposição influência o risco 
de ter a doença, mas existem outros fatores (fatores de confundimento), presentes tanto nos expostos quanto 
nos não expostos, que influência o status da doença e que estão relacionados com a exposição, por isso, 
provocam o confundimento. 
-Fator de confundimento: É o fator que, associado a outro restritamente, distorce ou confunde o efeito da 
exposição. Para conhecê-lo melhor e isolá-lo, torna-se necessário estratificar a análise. Sendo assim, são 3 as 
propriedades básicas para se considerar a existência de um fator de confundimento,, veja o esquema abaixo: 
 
 
1- Deve ser um fator de risco para a doença, entre os não expostos; 
2- Deve estar associado com a exposição; 
3- Não deve ser variável intermediária na relação causal entre a exposição e o desfecho analisados e nem ser 
uma consequência do desfecho. 
-Como controlar o efeito confundidor? R: randomização, restrição da participação de pessoas com 
características em relação ao fator confundidor, pareamento (de controle e casos semelhantes em relação ao 
potencial fator de confusão). 
RANDOMIZAÇÃO 
No ensaio clínico ideal para se avaliar a eficácia de um tratamento, um grupo de pacientes deveria receber o 
*placebo e ser acompanhado por um período de tempo para se medir a ocorrência de certo evento (Ex: óbito, 
cura). Em seguida, o pesquisador faria o tempo recuar a um momento imediatamente anterior à administração 
do placebo e administraria, a esse mesmo grupo de pacientes, o tratamento que se quer avaliar. O desfecho 
nessa segunda situação seria contabilizado e comparado com aquele observado na primeira situação. Por se 
tratarem dos mesmos pacientes, num mesmo momento de suas vidas, qualquer diferença quanto à ocorrência 
do desfecho (Ex: óbito, cura) nas duas situações poderia ser atribuída, sem qualquer dúvida, à intervenção. 
Como este desenho imaginário não é viável, os pesquisadores realizam uma randomização com intuito de gerar 
grupos comparáveis. Este procedimento consiste em alocar os indivíduos aleatoriamente (ao acaso) nos grupos 
a serem comparados. Com isso, busca-se constituir grupos com características muito semelhantes 
(comparáveis), com exceção das intervenções que se quer avaliar. Com a distribuição equitativa de fatores de 
risco ou de prognóstico, pode-se atribuir as diferenças observadas entre os grupos às intervenções que estão 
sendo comparadas. Embora a randomização não assegure a distribuição homogênea dos fatores nos grupos 
comparados em todas as ocasiões em que é implementada, a probabilidade de que isso ocorra aumenta 
conforme cresce o número de participantes no estudo. 
O ocultamento do processo de randomização é importante para evitar manipulações da alocação que podem 
comprometer a comparabilidade dos grupos. Num ensaio clínico bem conduzido, a decisão de incluir ou não 
um paciente no estudo deve anteceder a sua randomização. 
 
Ainda que a randomização constitua um aspecto central dos ensaios clínicos, não é raro encontrarmos estudos 
nos quais esse procedimento é implementado de forma inadequada. Estratégias de alocação por ordem de 
chegada, numeração corrida e dias da semana não devem ser usadas, pois facilitam a identificação da 
intervenção a que será submetido um paciente selecionado para o estudo. Com isso, o responsável pela 
alocação pode manipular o processo (ainda que inconscientemente), comprometendo a comparabilidade 
dos grupos 
 
POPULAÇÃO X AMOSTRA 
Conjunto de elemento que possui pelo menos uma característica comum. 
É um subconjunto de elementos extraídos de uma população. Para iniciarmos o teste proposto é necessário 
estabelecer as amostras de investigação. Para que os resultados do trabalho sejam válidos é imprescindível que 
a amostra em cada grupo represente, da forma mais fidedigna possível, os diversos matizes da população. 
Entre as características mais relevantes da amostra devemos considerar sua forma de obtenção, tamanho, 
distribuição de suas variáveis e pareamento. Assim, podemos identificar potenciais fontes de viés e escolher a 
melhor metodologia e os melhores testes estatísticos para contorná-los. 
 
 
 
*placebo: 
-Segundo Brissos Lino [06] (pág. 02, 2008), “por placebo entende-se uma substância inerte, ou cirurgia, ou 
terapia “a fingir” usada como controle numa experiência, ou administrada a um paciente tendo em vista 
o seu possível ou provável efeito benéfico”. O tema ainda é objeto de estudo, visto que até o presente 
momento não se chegou a uma resposta objetiva para a eficácia do placebo, existindo assim várias teorias 
para explicar o sucesso do procedimento inerte. 
 -Até então acredita-se que o uso de placebo tem uma resposta de 30% 
População: 
Amostra: 
 
A distribuição da amostra deve ser testada para verificar se ela é ou não paramétrica. Os testes estatísticos são 
altamente dependentes do tipo de distribuição dos valores obtidos na amostra. A distribuição normal ou 
gaussiana (paramétrica) é uma das formas de distribuição mais estudadas em bioestatística. Ela é definida por 
dois parâmetros: a média (μ) e a variância (σ²). Dentre as suas características observamos o formato em sino 
simétrico ao redor do centro, a presença de dois pontos de inflexão, um à direita e outro à esquerda, cuja 
distância do centro corresponde ao desvio padrão ou “sigma” (σ). Com estes dados, é possível calcular as 
probabilidades relacionadas a uma variável contínua com essa distribuição. 
Quandoa amostra é relativamente grande, podemos aplicar o teorema do limite central e inferir a normalidade 
de sua distribuição. Esse teorema afirma que quando o tamanho de uma amostra aumenta, a distribuição 
amostral da sua média aproxima-se cada vez mais de uma distribuição normal. 
 
Entretanto, testes de aderência à normalidade podem ser utilizados. 
Entre eles, temos o teste de Kolmogorov-Smirnov, o teste de Lillefors, 
o teste de Shapiro-Wilk. Este último inicialmente descrito para 
amostras pequenas. Nesses testes busca-se encontrar a hipótese 
nula, na qual não existe diferença entre a distribuição da amostra 
estudada e a distribuição normal. De forma geral, estes testes são 
bastante rigorosos e facilmente rejeitam a hipótese de Normalidade. 
 
Outras ferramentas que podem ser utilizadas são os métodos 
descritivos, como a análise de histogramas (figura 1), coeficientes de 
assimetria e curtose. Quando a normalidade não pode ser inferida podemos utilizar testes não paramétricos ou 
realizar a transformação dos dados. A transformação mais comumente empregada é a transformação 
logarítmica cuja principal indicação é a assimetria dos dados. Outras transformações, como a raiz quadrada 
ou a recíproca também podem ser utilizadas em casos determinados. 
amostras grandes → erros pequenos 
amostras pequenas → erros grandes 
➔ O cálculo amostral tem o objetivo de extrapolar os dados obtidos de uma amostra para uma população, 
sendo assim está relacionado com uma análise inferencial. 
➔ conhecer a população estudada 
➔ conhecer o tratamento que será utilizado 
➔ conhecer os questionários utilizados (preferencialmente em estudo com uma população semelhante à sua) 
➔ para fazer o cálculo amostral é preciso ter um estudo de referência 
➔ para o cálculo amostral é preciso identificação do desfecho do estudo *OBS: se seu estudo é descritivo não 
tem necessidade de fazer um cálculo amostral. 
 
Distribuição da Amostra: 
Tamanho da amostra: 
Cálculo amostral: 
 
O poder de um ensaio clínico pode ser definido como a probabilidade do estudo identificar uma diferença 
entre os tratamentos (efeito), quando esta diferença é real. O poder é influenciado por quatro fatores: a 
natureza do teste estatístico, o nível de significância, o tamanho da amostra e a diferença esperada no efeito 
dos dois tratamentos 
- Quanto maior o poder de estudo maior vai ser a amostra. 
- Estimar proporção ou média? 
- Comparar proporção ou médias entre 2 grupos? 
- Uma análise pareada? 
- Realizar uma correlação? 
- Nível de confiança 
- Qual a provável proporção? pesquisar na literatura 
- Qual a diferença máxima a ser aceitada? 
- Precisão: quanto menor a diferença, maior o número de participantes necessário. 
Para escolhermos o tipo de teste a ser empregado, outra característica da amostra deve também ser 
considerada: se ela é pareada (dependente) ou não-pareada (independente). Um estudo com amostras 
pareadas ocorre quando cada observação no primeiro grupo for pareada com a mesma observação no 
segundo grupo. 
Nos casos não pareados, cada grupo é composto por indivíduos distintos, assim podemos comparar, por 
exemplo, grupos de saudáveis com grupos de portadores de alguma doença. 
É importante ressaltar essa característica da amostra, pois duas observações em um mesmo indivíduo são mais 
prováveis de serem semelhantes que duas observações em dois indivíduos diferentes e, portanto, 
estatisticamente dependentes. Isso deve ser considerado pelo teste empregado para encontrar a validade 
estatística da diferença encontrada entre essas amostras. 
TIPOS DE TESTES 
Os testes estatísticos deverão obedecer às características da amostra citadas anteriormente: distribuição e 
pareamento. 
Entretanto, para escolha do melhor teste a ser empregado devemos considerar a quantidade de grupos ou 
observações. Os principais testes para cada situação estão resumidos no esquema 1. 
 
 
 
 
 
 
 
Poder do estudo: 
Qual o seu objetivo? 
Estimar proporção 
Amostras dependentes e independestes 
 
tabela de análise de paramétrica e não paramétrica visto em aula: 
 
 
INFERÊNCIA ESTATÍSTICA 
• É preciso garantir que a mostra tenha características semelhantes à população. 
• É uma forma de tratamento dos dados 
• É preciso uma margem de erro para mais e para menos, garantindo assim uma faixa de segurança. 
• Precisa de teste de hipóteses 
 
 
DADOS 
-Informações que vem de observações, contagens, medições ou resposta que vão ser aferidas 
Dados primários (coletadas pelo próprio pesquisador- Ex: por meio de questionários aplicado na população): 
- Trabalhoso, caro, demorados 
- Necessita de muito planejamento 
- Coletado para responder os objetivos 
Dados secundários (coletados pelo pesquisador por meio de um banco de dados- Ex: prontuários): 
- Agiliza uma pesquisa 
- Economiza dinheiro, tempo e material 
- Facilita o estudo de grandes populações 
- Sempre se refere ao passado 
- Coleta e critérios não padronizados. 
- Pode não ser perfeitamente apropriado para os objetivos da pesquisa. 
 
ESTATÍSTICA DESCRITIVA 
Os clínicos devem ser capazes de tomar as melhores decisões perante o paciente em sua prática rotineira e a 
aquisição de novo conhecimento somente será possível se eles forem capazes de ler e analisar criticamente os 
artigos publicados em periódicos científicos. A estatística descritiva é uma parte da estatística que auxilia os 
pesquisadores e os leitores a entenderem as informações de dados coletados por meio da sua organização e 
sumarização. A estatística descritiva é a única estatística usada em trabalhos descritivos e em alguns estudos 
epidemiológicos. O uso de dados brutos em artigos científicos, ou seja, dados da forma como foram coletados 
na pesquisa, não é comum e pode prejudicar a sua interpretação e tornar a leitura desinteressante. 
 
A estatística descritiva é usada para a descrição de dados por meio do uso de números ou medidas estatísticas 
que possam melhor representar todos os dados coletados durante a execução de uma pesquisa. É considerada 
um passo inicial para a escolha adequada e o uso dos testes estatísticos de hipóteses. É essencial conhecer 
qual estatística é mais apropriada para os mais diferentes níveis de mensuração. As mais usadas em artigos 
publicados na área de saúde podem ser vistas na tabela 1. 
 
Anotações: 
Diferença intragrupo e intergrupo: 
A diferença intragrupo é a diferença de valores no grupo de estudo 
A diferença intergrupo é a diferença dos valores do grupo de estudo com o grupo controle 
 
A estatística descritiva pode ser dividida em medidas de tendência central e de dispersão. A primeira usa um 
valor que representa o que é mais típico e que pode ser usado para representar todos os demais valores 
coletados numa pesquisa. A segunda usa um valor que revela como os dados variam em torno desse valor que 
é mais típico. As principais medidas de tendência central são: a média, a moda e a mediana. As principais 
medidas de dispersão são a variância, o desvio padrão e a amplitude interquartílica. 
 
A média é uma medida importante porque incorpora o valor de cada participante da pesquisa. Os passos 
necessários ao seu cálculo são: contar o número total de casos, que é conhecido usualmente em estatística 
como “n”; somar todos os valores e dividir pelo número total de casos. Essa vantagem da média também é seu 
problema, pois é afetada por valores discrepantes altos ou baixos que distorcem a informação que se deseja 
transmitir sobre os dados analisados. 
 
A mediana difere da média porque é a posição cujo valor numérico situa-se na metade da distribuição dos 
demais valores quando organizados em ordem crescente. Se tomarmos valores aleatórios 88, 89, 90, 91 e 92, 
teremos como média 90. 
 
A moda é o valor que ocorre mais frequentemente e não providencia uma indicação de todos os valores 
coletados numa pesquisa, mas sim daquele que mais se repetiu. Se tomarmosvalores aleatórios 88, 88, 90, 91 e 
92, teremos como moda 88. 
 
A mediana e os quartis são valores representativos da posição, em escala percentual, dos valores distribuídos 
em ordem crescente. A mediana representa a posição 50% na escala de distribuição.14 Para saber onde está a 
posição da mediana, basta dividir o valor total de casos por 2.Uma forma simples para saber qual é o valor 
numérico é: ordenar os valores em ordem crescente, eliminar gradativamente os valores extremos e no fim 
identificar o valor que ficou no centro. Esse valor será a mediana. Em alguns casos todos os valores das 
extremidades são eliminados e não resta valor central. Quando isso ocorrer, deve-se fazer a média dos dois 
últimos valores e assim calcular o valor central. A mediana não é influenciada pelos valores discrepantes e deve 
ser preferida quando eles estiverem presentes. Se tomarmos valores aleatórios 85, 89, 90, 91 e 97, teremos como 
mediana 90. 
 
As medidas de tendência central têm sua aplicabilidade. A indicação para a aplicação de cada medida pode 
ser vista na tabela 2. Tomando-se dois conjuntos de valores aleatórios, o primeiro 88, 89, 90, 91 e 92 e o segundo 
30 + 70 + 90 + 120 + 140, teremos como média dos dois conjuntos 90. Observando-se exclusivamente a média 
não se percebe a informação sobre o restante dos valores e por isso é preciso recorrer às medidas de dispersão 
para se perceber que os dados dos grupos não são iguais. 
 
Os valores podem ser próximos ou distantes da média e essa distância do valor até a média é conhecida como 
discrepância. A soma de todas as discrepâncias pode ser igual a zero, então para poder usar essas 
discrepâncias é recomendável quadrar cada valor da discrepância antes de usá-lo matematicamente. A 
https://www.scielo.br/scielo.php?pid=S0034-70942017000600619&script=sci_arttext&tlng=pt#B14
 
média desses valores quadrados é conhecida como variância. A unidade de medida da variável analisada 
também fica quadrada, por isso em alguns casos é difícil compreender seu significado. 
 
O desvio padrão é uma das medidas estatísticas mais comumente usadas para demonstrar a variabilidade dos 
dados. É uma medida que estima o grau em que o valor de determinada variável se desvia da média.12 
Matematicamente a raiz quadrada da variância é o desvio padrão. A unidade de medida da variável 
permanece na sua forma original. 
 
A amplitude total é a distância entre os valores mais altos e mais baixos. É calculada pela subtração entre o 
maior e o menor valor de um conjunto de dados. A medida não informa se os valores estão distribuídos 
equitativamente, se há grupos de valores próximos uns dos outros ou se há ausências de grupos de valores entre 
os dados coletados 
 
A amplitude interquartílica é uma medida de posição que se relaciona com a mediana. Os quartis representam 
a posição 25% e 75% na escala, de maneira que o primeiro quartil representa o valor que corresponde ao 
primeiro quarto da distribuição (25% dos valores abaixo dessa posição) e o terceiro quartil representa o valor 
que corresponde ao terço quarto da distribuição (75% dos valores acima dessa posição). 
 
As medidas de dispersão têm sua aplicabilidade. Reanalisando-se os dois conjuntos de valores aleatórios 
anteriores percebe-se que para o primeiro conjunto de dados tem-se média 90; desvio-padrão 1,15 e amplitude 
total de 88-92; o para o segundo tem-se a média 90; desvio-padrão 43,01 e amplitude total de 30-140. Percebe-
se pelo uso das medidas de dispersão que os conjuntos de valores são diferentes. A indicação de onde cada 
medida pode ser empregada pode ser vista na tabela 3. 
 
A média e o desvio padrão são mais bem 
empregados quando os dados têm distribuição 
normal ou simétrica, assim como a mediana e a 
amplitude interquartílica para dados com 
distribuição assimétrica. Uma das formas de 
identificar se ocorre simetria na distribuição dos 
dados é criar o gráfico do histograma e observar sua 
forma. A criação do gráfico começa com a 
distribuição do número de casos no eixo do y e do 
nível da variável analisada no eixo do x (fig. 1). Se a 
forma se assemelhar a um sino, já existe forte 
indicativo para que os dados tenham distribuição 
normal. 
https://www.scielo.br/scielo.php?pid=S0034-70942017000600619&script=sci_arttext&tlng=pt#B12
 
 ESTATÍSTICA INFERENCIAL 
A estatística inferencial é a parte da estatística que é usada para formular conclusões e fazer inferências após 
a análise de dados coletados em pesquisas. A estatística inferencial usa os testes de hipóteses e a estimação 
para fazer as comparações e predições e tirar conclusões que servirão para as populações baseados em dados 
de amostras. As inferências estatísticas podem ser: a análise bivariada e a análise multivariada. A primeira 
analisa a relação entre uma variável dependente e uma independente. A segunda analisa a relação entre 
uma variável dependente e múltiplas variáveis independentes e verifica o potencial de confusão ou 
confundimento dessas sobre aquela. 
A inferência estatística somente é possível após testar as hipóteses estatísticas. A hipótese é uma presunção 
numérica acerca de um parâmetro desconhecido ao pesquisador. As duas hipóteses estatística são: hipóteses 
de nulidade e alternativa. A primeira, hipótese de nulidade estatística, refere-se à ausência de efeito ou de 
associação. A segunda, hipótese alternativa, defende que existe diferença entre pelo menos duas populações 
estudadas e quando positiva diz haver diferença entre os grupos analisados. 
Os pesquisadores podem ter dois erros quando se baseiam nessas duas hipóteses para formular conclusões: 
erros tipo I e II. O erro tipo I refere-se a um resultado falso positivo, ou seja, rejeitar a hipótese nula quando na 
verdade essa é verdadeira. O erro tipo II refere-se a um resultado falso negativo, ou seja, aceitar a hipótese nula 
quando na verdade essa é falsa. 
A probabilidade de ocorrer o erro tipo I é conhecida como nível de significância ou alfa. O nível de significância 
aceitável e mais usado na área de saúde é de 5% (0,05). Os testes estatísticos de hipóteses calculam a 
probabilidade de o evento pesquisado ocorrer assumindo-se que a hipótese nula seja verdadeira. Essa 
probabilidade é conhecida como valor de p. Se o valor de p calculado pelos testes estatísticos for menor do 
que o nível de significância, pode-se rejeitar a hipótese nula e aceitar a hipótese alternativa que diz haver 
diferença ou associação entre os grupos analisados.1 Esse raciocínio se aplica aos ensaios clínicos de 
superioridade. O erro mais comum entre os leitores é acreditar que o valor de p representa a probabilidade de 
a hipótese nula ser verdadeira. Os ensaios clínicos de não inferioridade ou de equivalência testam exatamente 
o contrário, a lógica da interpretação é oposta, já que a hipótese nula representa a diferença entre os valores 
observados. 
 
 
ATENÇÃO! - Permite a comparação, associação e correlações extrapolando para a população fora do 
estudo, através da inferência estatística. 
*Então do ponto de vista metodológico, as pesquisas inferências são mais completas e aplicáveis, 
permitindo extrapolar os dados para as populações fora da pesquisa. 
ATENÇÃO! É mais simples e pretende descrever achados, sem inferências estatísticas. Ou seja, não pode ser 
aplicado a população em geral. 
- Indica a uma realidade da população do estudo, sendo assim, não pode ser comparada ou 
correlacionada com a população fora do estudo. 
- Um exemplo: um estudo de prevalência. 
https://www.scielo.br/scielo.php?pid=S0034-70942017000600619&script=sci_arttext&tlng=pt#B1
 
HIPÓTESES NA ESTATÍSTICA 
• Hipótese Nula (de nulidade), ou H 0 (H zero): 
- Representa a ausência de fatores e julgamentos em relação a hipótese criada 
- É a premissa básica 
- Afirma que não existe diferença entre os grupos (tratamento ou placebo, teste diagnóstico novo ou padrão-
ouro). 
• Hipótese Alternativa,ou H 1 (H hum): 
- Afirma que os grupos são diferentes. Pode simplesmente afirmar que os grupos são diferentes ou dizer que um 
grupo é maior (ou melhor) que outro, quando existe justificativa prévia (clínica ou experimental) para esse tipo 
de expectativa. 
- Refuta a hipótese alternativa 
DICA: sempre usar a palavra diferença para analisar o valor de P. Sendo ela usada na hipótese nula para 
mostrar que não existe e diferença e usado na hipótese alternativa é porque existe diferença. 
• é impossível provar que algo não existe 
• Caso p <0,05 - rejeitamos a hipótese nula e aceitamos a hipótese alternativa 
• O valor de p é resultado de um valor de hipótese. E no estudo sempre testar a hipótese nula 
ATENÇÃO: deve avaliar o valor de p na estatística, mas deve sempre pensar se esse valor de P tem relevância 
clínica! 
Erro do tipo I: 
- Ocorre quando a hipótese nula é rejeitada. Apesar 
de ser verdadeira 
Erro do tipo II: 
- Ocorre quando a hipótese nula não é rejeitada, 
apesar de ser falsa. 
 
 
 
 
- Erro alfa (erro tipo I) – é a probabilidade de se rejeitar a hipótese nula (afirmando que existe diferença 
entre os grupos), quando esta é verdadeira (isto é, na realidade não existe essa diferença). Devemos fixar 
o erro alfa em 5% (0,05). 
- Erro beta (erro tipo II) – é a probabilidade de se aceitar a hipótese nula (afirmando que não existe diferença 
entre os grupos), quando esta é falsa (isto é, na realidade existe diferença). Devemos fixar o erro beta em 
10% (0,10). Alguns estudos fixam o erro beta em 20% (0,20) 
 
INTERVALO DE CONFIANÇA 
O intervalo de confiança define os limites inferior e superior de um conjunto de valores que tem certa 
probabilidade de conter no seu interior o valor verdadeiro do efeito da intervenção em estudo. Desse modo, o 
processo pelo qual um intervalo de confiança de 95% é calculado é tal que ele tem 95% de probabilidade de 
incluir o valor real da eficácia da intervenção em estudo. 
ANÁLISE PARAMÉTRICA E NÃO PARAMÉTRICA 
O teste t de Student é um teste paramétrico que compara a média de duas amostras. O uso desse teste requer 
algumas condições: a população que originou a amostra deve ter distribuição simétrica, as variâncias das 
amostras devem ser iguais ou próximas e as amostras devem ser independentes. A estatística desse teste pode 
ser obtida de acordo com os seguintes passos: calcular as médias amostrais e os respectivos desvios padrões, 
encontrar a diferença entre as duas médias amostrais, calcular o erro padrão e dividir o valor da diferença entre 
as médias pelo valor do erro padrão. Uma vez encontrado o valor de t deve-se consultar uma tabela de valores 
críticos da estatística t de acordo com os graus de liberdade adequados a cada caso. Se o valor de t 
encontrado for maior ou igual ao valor de t tabelado, pode-se rejeitar a hipótese de nulidade. O valor da 
estatística t pode também ser convertido ao valor de p. Se o valor de p for menor do que nível de significância 
adotado para a pesquisa, deve-se rejeitar a hipótese de nulidade. 
As pesquisas médicas geralmente envolvem mais de dois grupos. O teste de Anova é usado para 
simultaneamente testar a igualdade entre mais de dois grupos. As diversas formas desses testes são: Anova um 
fator para uma variável independente, Anova dois fatores para duas variáveis independentes e Anova medidas 
repetidas analisa participantes que servem como controle para eles mesmos. O uso desse teste requer algumas 
condições: a amostra deve ter distribuição simétrica, amostras devem ser escolhidas de forma aleatória e a 
homocedasticidade deve ser avaliada. A variância representa a dispersão dos dados que serão analisados. A 
homocedasticidade representa a homogeneidade das variâncias e é um pressuposto que deve ser observado 
para a execução do teste. 
O teste do qui-quadrado é um teste não paramétrico usado para responder perguntas de pesquisa que 
envolvem taxas, proporções ou frequências. O teste não requer que os dados assumam uma distribuição 
simétrica. Existem dois testes: qui-quadrado de independência e de aderência. O teste de independência é o 
mais usado e avalia a frequência de dados de dois ou mais grupos. O teste de aderência é usado para 
comparar dados amostrais com dados de populações conhecidas. 
A estatística do teste do qui-quadrado para duas amostras pode ser obtida de acordo com os seguintes passos: 
calcular as proporções amostrais, encontrar a diferença entre essas duas proporções, calcular a proporção 
amostral geral que será usada no cálculo do erro padrão, calcular o erro padrão e dividir o valor da diferença 
entre as proporções pelo valor do erro padrão. A hipótese nula pode ser rejeitada se o valor de p for menor do 
que o nível de significância adotado na pesquisa ou se o valor encontrado for maior ou igual a um valor 
tabelado tal qual ocorre com o teste t. 
O uso dos testes estatísticos não paramétricos tem aumentado com o passar dos anos. 
Os métodos não paramétricos são aplicados para dados que tenham distribuição assimétrica ou provenientes 
de escalas ordinais e nominais. Os mais comuns e suas indicações são: qui-quadrado e teste exato de Fisher 
para proporções ou frequências; testes U de Mann-Whitney, Wilcoxon, Kruskal-Wallis e Friedman para dados 
 
ordinais; e Kruskal-Wallis e Friedman para comparações intergrupos. Os dados de amostras com pequeno 
número total de participantes podem ser mais bem avaliados com testes não paramétricos. 
A formação profissional do médico geralmente lhe oferece um conhecimento básico em estatística, porém 
muitos não estão aptos para usar esses conhecimentos na interpretação dos dados. A decisão de qual teste 
usar para cada situação em particular requer o esclarecimento de alguns pontos: escala de medida dos dados; 
número de grupos; relação entre os participantes, ou seja, se os grupos são independentes ou relacionados e 
intenção do pesquisador de estabelecer diferença ou relação entre os grupos. Um exemplo hipotético seria 
analisar complicações em sala de recuperação anestésica. O primeiro passo a se fazer é contar o evento de 
interesse e dividi-lo pelo total de pacientes para achar a proporção e ao se multiplicar essa proporção por 100 
tem-se a porcentagem. Em seguida se pode verificar diferença entre gêneros pelo teste do qui-quadrado ou 
verificar a quantidade de anestésico usada por cada paciente e extrair a média. Um guia geral para a escolha 
dos testes pode ser visto na tabela 4. 
 
 
PRINCIPAL REFERÊNCIA: 
RODRIGUES, C.F. et al. Importância do uso adequado da estatística básica nas pesquisas clínicas. Rev. Bras. 
Anestesiol. 2017. p.619-625. 
LOPES.B. et al. Bioestatística: conceitos fundamentais e aplicações práticas. Rev. Bras. Oftalmol. 2014; p. 16-22 
+ outras fontes. 
 
 
 
 
ATENÇÃO! Para a confecção desse material foram usados livros, artigos científicos, conteúdos de aulas e 
palestras da faculdade UNIME de medicina. Além de conteúdos de aulas e material didático de outras 
plataformas de ensino. Foi utilizado também materiais confeccionados por outros colegas, portanto, não é um 
conteúdo autoral. Ou seja, o conteúdo contido no resumo não é de criação minha, eu apenas compilei o 
material da melhor forma para estudo.

Continue navegando