Unidade 6 Parte 1 Conceitos básicos de inferência estatística

•

UFES

1

0

1

0

Thalita Motta

03/12/2018

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Bioestatisticas

3.922 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

UNIDADE 6: CONCEITOS
BÁSICOS DE INFERÊNCIA
ESTATÍSTICA
UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO
CENTRO DE CIÊNCIAS DA SAÚDE
Professora:
MONICA CATTAFESTA
2017
DELINEAMENTOS DE
PESQUISA
UNIDADE 6: 
CONCEITOS BÁSICOS
DE INFERÊNCIA
ESTATÍSTICA
Classificação dos delineamentos de pesquisa em ciências biomédicas
Estudos observacionais:
Estudos de casos/ série de casos
Estudo transversal / de prevalência / ecológico
Estudo de coorte / de incidência
Estudo de caso/controle
Estudos experimentais:
Experimento laboratorial
Ensaio clínico
ESTUDOS OBSERVACIONAIS
Estudo de casos:
Relato das características mais importantes observadas em um grupo com uma
determinada condição clínica;
Essencialmente para condições clínicas para as quais ainda há escassas
informações;
Número reduzido de pacientes;
Sem grupo controle;
Vantagem: condução relativamente fácil e importante para geração de
hipóteses;
Desvantagem: não representar necessariamente o padrão daquela condição e
não conclusivo.
ESTUDOS OBSERVACIONAIS
Estudo transversal:
O desfecho e a exposição são avaliados simultaneamente em um grupo de
indivíduos “fotografia”;
Causalidade reversa: quando é plausível supor que o desfecho pode provocar
alterações na exposição e vice-versa. Ex.: relação entre assédio sexual e
alcoolismo;
Viés de sobrevivência: prevalência é uma mistura da força de ocorrência de casos
novos na população e da duração da doença. Ex.: novo medicamento que
promove redução da duração da doença. A diminuição da prevalência não foi
devido a nenhum preditor associado.
ESTUDOS OBSERVACIONAIS
Estudo transversal:
Medidas: Prevalência (e não casos incidentes); razão de prevalência (Odds ratio -
razão de chance e Poisson);
Vantagem: fácil condução; rápido; menor custo; geradores de hipóteses;
primeira estratégia de investigação analítica;
Desvantagem: potencial para viés de seleção; não permite esclarecer se a
exposição precedeu o desfecho ou foi determinada por ele (causalidade
reversa); viés de sobrevivência.
ESTUDOS OBSERVACIONAIS
Estudo ecológicos:
Utilidade limitada à descrição dos fenômenos e, no máximo, à geração de
hipóteses que, necessariamente, deveriam ser posteriormente testadas no nível
individual;
Falácia ecológica: Impossibilidade de seus resultados serem extrapolados para
indivíduos, em face da não equivalência entre as medidas de associação
resultantes de suas análises e as correspondentes de nível individual;
Medidas: médias ou proporções que caracterizam o grupo e não o indivíduo e
características dos locais em que cada grupo possui.
ESTUDOS OBSERVACIONAIS
Estudo caso-controle:
O início dá-se a partir do desfecho e investigam-se exposições que ocorreram no
passado RETROSPECTIVO;
Tentativa de identificar as características (fatores de risco) que estejam mais
presentes nos casos (desfecho presente) do que nos controles (desfecho
ausente);
Controles: indivíduos com as mesmas características que não possuem o
desfecho; obtidos a partir da população que deu origem aos casos 
PAREAMENTO;
Exposição anterior  tempo de latência  desfecho
ESTUDOS OBSERVACIONAIS
Estudo caso-controle:
Medida: Odds ratio (OR) ou razão de chances;
Vantagem: úteis no estudo de doenças ou desfechos raros ou que envolvem um
longo período de latência; relativo baixo custo;
Desvantagem: potencial para viés de seleção e a avaliação da exposição
também é propensa a ocorrência de distorções.
ESTUDOS OBSERVACIONAIS
Estudos de coorte:
Seguimento de um grupo de sujeitos que são comparados em subgrupos de
expostos (mais) e não-expostos (menos) quanto à ocorrência de um ou mais
desfechos de interesse PROSPECTIVO;
Os indivíduos devem estar livres do desfecho no momento inicial;
Grupos com exposição especial: altos níveis de exposição a uma substância
particular; pessoas infectadas com um agente; pessoas com alguma
anormalidade em qualquer medida;
Grupos com características comuns: médicos, grupos de seguros de vida, grupos
obstétricos, voluntários, veteranos de guerra, universitários;
Grupos geograficamente definidos: Framingham; Hiroshima; Pelotas.
ESTUDOS OBSERVACIONAIS
Estudos de coorte:
Medidas:
Risco absoluto: indica a probabilidade de um membro do grupo ser acometido por
um dado agravo, em um período especificado;
Risco relativo: é uma razão entre dois coeficientes de incidência (coeficiente de
incidência nos expostos e coeficiente de incidência nos não-expostos);
Risco atribuível: excesso de incidência da doença relacionada à exposição; mede o
efeito absoluto da exposição.
Vantagem: proporcionam o seguimento de indivíduos com exposições raras; excelente
para testar hipóteses;
Desvantagem: custo elevado; demorada execução; perdas de seguimento podem levar
a vício de seleção.
ESTUDOS EXPERIMENTAIS
Experimento laboratorial e ensaio clínico:
Estudo de coorte cuja exposição é determinada pelo investigador 
PROSPECTIVO;
Envolvem tentativa de mudar os determinantes de uma doença, tais como uma
exposição ou comportamento, ou cessar o progresso de uma doença por meio
de um tratamento;
Experimento: controlada em material de laboratório ou animais de
experimentação;
Ensaio: seres humanos;
ESTUDOS EXPERIMENTAIS
Experimento laboratorial e ensaio clínico:
Randomizados: pacientes são alocados de forma aleatória;
Controlados: grupo controle;
Duplo-cegos: nem o paciente, nem o profissional deverão ter conhecimento do
grupo ao qual o paciente pertence (intervenção ou controle)  Efeito Placebo e
influência do pesquisador;
Vantagens: não devem ser influenciados por variáveis de confusão; permitem
estudar a história natural da doença;
Desvantagens: podem ser muito caros; podem não ser generalizáveis; podem
ser eticamente inaceitáveis; muitos pacientes podem desistir do tratamento.
ESTUDOS EXPERIMENTAIS
Experimento laboratorial e ensaio clínico:
TIPO 
OPERATIVO 
POSIÇÃO DO 
INVESTIGADOR 
REFERÊNCIA 
TEMPORAL
DENOMINAÇÕES 
CORRENTES 
AGREGADO OBSERVACIONAL TRANSVERSAL ESTUDOS ECOLÓGICOS
LONGITUDINAL ESTUDOS DE TENDÊNCIA 
OU SÉRIES TEMPORAIS 
INTERVENÇÃO LONGITUDINAL ENSAIOS COMUNITÁRIOS
INDIVIDUADO OBSERVACIONAL TRANSVERSAL INQUÉRITOS OU 
SURVEYS
LONGITUDINAL PROSPECTIVOS 
(COORTES)
RETROSPECTIVOS (CASO-
CONTROLES)
INTERVENÇÃO LONGITUDINAL ENSAIOS CLÍNICOS 
ESTUDOS 
EXPERIMENTAIS
Almeida Filho; Barreto, 2013
DISTRIBUIÇÃO
NORMAL
UNIDADE 6: 
CONCEITOS BÁSICOS
DE INFERÊNCIA
ESTATÍSTICA
DESCRIÇÃO DA CURVA NORMAL
 Distribuição normal de probabilidade, simetria, paramétrico;
 GRÁFICO: curva em forma de sino, simétrica em relação ao ponto de
frequência máxima (média)  Curva de distribuição normal OU Curva de
Gauss;
 Representa a distribuição de frequências da amostra, admitindo-se que o
intervalo da classe seja cada vez menor à medida que aumenta o tamanho da
amostra;
 Vários testes estatísticos que serão examinados adiante, pressupõem que os
dados sejam provenientes de uma distribuição normal;
Representa a distribuição de 
frequências da população
As extremidades da 
curva, em ambos os lados 
da média, se estendem 
cada vez mais próximas 
da linha de base sem 
jamais tocá-las (caudas 
assintóticas)
Curva simétrica em relação à 
média
- ∞ + ∞
50% 50%
100%
 Regra empírica:
 ~ 68% das observações estão entre x ± 1 DP (μ ± σ);
 ~ 95% das observações estão entre x ± 2 DP (μ ± 2σ);
 ~ 99% das observações estão entre x ± 3 DP (μ ± 3σ).
 “Diz-se que uma observação, tirada ao acaso de uma população normal, tem
uma probabilidade igual a 0,95 (95%) de estarcontida no intervalo μ ± 2σ, ou,
que tem uma probabilidade igual a 0,05 (5%) de que seu valor esteja fora
desse intervalo”.
Ex.: Glicemia: μ = 87 e σ = 9,1 mg/dL
87 mg/dL
+ 1 σ- 1 σ
77,9 mg/dL 96,1 mg/dL
+ 1 σ
105,2 mg/dL
- 1 σ
68,8 mg/dL
 Há uma curva para cada valor atribuído de μ e σ:
CURVA NORMAL PADRONIZADA
 Distribuição normal padronizada OU distribuição normal reduzida:
 μ = 0
 σ = 1
 Resultado desta transformação: obtenção de uma nova variável
(denominada z) que mede o afastamento do valor de x em relação a média,
em número de desvios padrão ESCORE Z.
CURVA NORMAL PADRONIZADA
 ESCORE Z:
= x – μ
σ
Z = afastamento dos valores de x em relação à média em número de desvios padrão
x = valor qualquer da variável aleatória
μ = média da distribuição
σ = desvio padrão da distribuição
 68,2% das observações estão entre x ± 1 DP (μ ± σ);
 95% das observações estão entre x ± 2 DP (μ ± 2σ);
 100% das observações estão entre x ± 3 DP (μ ± 3σ).
34,1%34,1%
13,4% 13,4%
2,5%2,5%
VALORES DA TABELA Z
 Os valores da distribuição normal padronizada, referente à área acumulada para
diferentes valores de Z encontram-se em tabelas, não havendo necessidade de
serem calculados;
 Pode-se obter qualquer área sob a curva normal padronizada, entre cada
ponto do eixo horizontal e a média;
 50% da área se encontram de cada lado da média;
Áreas sob a curva 
normal padronizada
Para os valores negativos de 
z as áreas são obtidas por 
simetria
Áreas sob a curva 
normal padronizada
Para os valores negativos de 
z as áreas são obtidas por 
simetria
Ex.: 
Z = 1,55 
↓
0,4394
↓
43,94% da área limitada 
pela curva
Áreas sob a curva 
normal padronizada
Para os valores negativos de 
z as áreas são obtidas por 
simetria
Ex.: 
Z = 1,96 
↓
0,4750
↓
47,5% da área limitada 
pela curva
↓
x 2 = 95% da área total
95% dos valores de uma variável em distribuição 
normal estão entre o intervalo μ ± 1,96σ, enquanto 
5% ficarão fora deste intervalo
Alguns intervalos e áreas correspondentes na curva normal
Percentagens de medidas na 
população normal 
Intervalo
50% μ ± 0,67σ
68,3% μ ± 1σ
95% μ ± 1,96σ
99% μ ± 2,58σ
99,7% μ ± 3σ
99,9% μ ± 3,29σ
 Ex.: Em uma distribuição de valores de glicose de homens entre 30 e 39 anos, a
média observada foi de μ = 100 mg/dL e o σ = 15 mg/dL. O z correspondente a x =
120. Qual a proporção de pessoas com glicose entre 100 e 120 mg/dL?
= x – μ
σ
= 120 – 100
15
= 1,33
Áreas sob a curva 
normal padronizada
Para os valores negativos de 
z as áreas são obtidas por 
simetria
= 1,33
 Ex.: Em uma distribuição de valores de glicose de homens entre 30 e 39 anos, a
média observada foi de μ = 100 mg/dL e o σ = 15 mg/dL. O z correspondente a x =
120. Qual a proporção de pessoas com glicose entre 100 e 120 mg/dL?
= x – μ
σ
= 120 – 100
15
= 1,33 40,82%
100 120
 Qual a proporção de pessoas com glicose entre acima de 120 mg/dL?
120
40,82%
50% - 40,82% = 9,18%
 Qual a proporção de pessoas com glicose entre 80 e 120 mg/dL?
= x – μ
σ
= 80 – 100
15
= - 1,33 - 40,82%
= x – μ
σ
= 120 – 100
15
= 1,33 40,82%
Áreas sob a curva 
normal padronizada
Para os valores negativos de 
z as áreas são obtidas por 
simetria
= - 1,33
 Qual a proporção de pessoas com glicose entre 80 e 120 mg/dL?
= x – μ
σ
= 80 – 100
15
= - 1,33 - 40,82%
100 12080
81,64%
 Qual a proporção de pessoas com glicose entre 95 e 125 mg/dL?
= x – μ
σ
= 95 – 100
15
= - 0,33
= x – μ
σ
= 125 – 100
15
= 1,67
Áreas sob a curva 
normal padronizada
Para os valores negativos de 
z as áreas são obtidas por 
simetria
 Qual a proporção de pessoas com glicose entre 95 e 125 mg/dL?
= x – μ
σ
= 95 – 100
15
= - 0,33
= x – μ
σ
= 125 – 100
15
= 1,66
- 12,93%
45,25%
 Qual a proporção de pessoas com glicose entre 95 e 125 mg/dL?
100 12595
58,18%
VALORES DA TABELA Z
 Sabendo-se como calcular áreas sob uma curva normal, torna-se fácil encontrar a
proporção (probabilidade) de pessoas que apresentam certos valores de colesterol,
pesos ou qualquer outra variável que está normalmente distribuída. Enfim,
conhecendo-se a probabilidade de um dado evento, é possível obter inferências
apropriadas como a ocorrência esperada de um evento.
ELEMENTOS DE
INFERÊNCIA
ESTATÍSTICA
UNIDADE 6: 
CONCEITOS BÁSICOS
DE INFERÊNCIA
ESTATÍSTICA
INTRODUÇÃO
População
Amostra
Inferência 
estatística
“As conclusões 
baseadas em amostras 
estão sempre 
acompanhadas de 
incerteza”.
DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS (DAM)
 Valores de médias de amostras diferentes obtidas de uma mesma população não
são necessariamente iguais entre si.
 Essa variação atribuída às diferenças na composição das amostras aleatórias é
dependente de erro aleatório, também conhecida como erro amostral ou variação
amostral;
 Importante no processo de inferência estatística;
 Tende para uma distribuição normal.
TEOREMA DO LIMITE CENTRAL
 Na medida em que o tamanho da amostra aumenta, a distribuição das médias
amostrais tende para uma distribuição normal independente do tipo de
distribuição da população;
 Logo, a média das médias das amostras poderá ser considerada como a
média da população;
 Porém o desvio padrão será calculado – denominado Erro Padrão da Média:
TEOREMA DO LIMITE CENTRAL
 Para amostras de tamanho n > 30, a
distribuição das médias amostrais pode ser
aproximada satisfatoriamente por uma
distribuição normal;
 A aproximação melhora a medida em que
aumenta o tamanho da amostra;
 Se a população tem distribuição normal, as
médias amostrais terão distribuição normal
para qualquer tamanho amostral n.
SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO
SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO
 Sequência de procedimentos para se determinar a significância de um desvio
entre a média amostral (x) e a média populacional (μ):
1. Escolher inicialmente o critério ou o nível de significância desejado (Ex.: α = 
0,05);
2. Obter o valor crítico de z da tabela (Ex.: zα = z 0,05 = 1,96);
3. Calcular o afastamento entre a média amostral (x) e a média populacional (μ), 
ou seja x - μ, em erros-padrão, usando a fórmula:
 Regra de decisão:
 Se |zcalc| < zα, o desvio é dito “não-significativo”
 Se |zcalc| ≥ zα, o desvio é dito “significativo”
SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO
 Exemplo: Pressão arterial (PA) de cinco executivos do sexo masculino, na faixa de 40
a 44 anos, escolhidos aleatoriamente, obtendo: 135; 143; 149; 128 e 158 mmHg (x =
142,6 mmHg). Na revisão de literatura, o pesquisador, verificou que, nessa
população e faixa etária, a média de PA é 129 mmHg, com σ = 15 mmHg.
 Resolução:
1. Escolher inicialmente o critério ou o nível de significância desejado  α = 
0,05;
2. Obter o valor crítico de z da tabela  zα = z 0,05 = 1,96;
SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO
 Resolução:
3. Calcular o afastamento (erros-padrão):
Conclui-se que a média obtida dos 5 executivos (142,6 mmHg) desvia-se significativamente da 
média da população de homens na mesma faixa etária, estando mais elevada.
TESTE DE HIPÓTESES
 HIPÓTESE ESTATÍSTICA:
 “Afirmação sobre o parâmetro de uma distribuição de probabilidades”;
 Precisa ser formulada de uma maneira que possa ser testada:
 TESTE DE HIPÓTESE:
 “Mecanismo de avaliação para verificar se uma hipótese pode ser
considerada como verdadeira ou falsa”.
COMO FORMULAR UM TESTE DE HIPÓTESE
• HIPÓTESE NULA (H0): μ = μ0• Supõe que as médias populacionais são iguais, ou seja, as duas médias
foram extraídas da mesma população;
• É a hipótese a ser testada;
• HIPÓTESE ALTERNATIVA (H1): μ ≠ μ0
• Supõe que as médias populacionais são diferentes, ou seja, as duas
médias não foram extraídas da mesma população;
• Deve ser adotada quando H0 for rejeitada.
TESTE DE HIPÓTESES
 Exemplo:
 Um determinado medicamento é receitado para pacientes obesos visando
potencializar a perda de peso em 10 Kg no primeiro mês com DP de 3 Kg. Um
pesquisador resolve avaliar a eficácia do medicamento em 20 pacientes do seu
grupo:
 H0: O medicamento causa a perda de 10 Kg em um mês de uso (μ = 10, pois μ =
μ0);
 H1: O medicamento não leva à perda de 10Kg em um mês de uso (μ < 10, pois μ
≠ μ0).
TESTE DE HIPÓTESES
 Exemplo:
 Supondo que H0 seja verdadeira, a média da amostra aleatória de 20 pacientes será
uma variação de peso com média de 10 Kg e desvio padrão σ/√n;
 Sabemos que x é aproximadamente normal, então podemos calcular a
probabilidade de obter-se um valor abaixo de 8 Kg:
Z calc = 8 – 10 
3 
√20
Z calc = -2 
_3_
4,47
Z calc = – 2 
0,67
Z calc = – 2, 98
Áreas sob a curva 
normal padronizada
Para os valores negativos de 
z as áreas são obtidas por 
simetria
TESTE DE HIPÓTESES
 Exemplo:
Z calc = – 2, 98
49,86%
50,0% - 49,86% = 0,14%
Existe a possibilidade de 0,0014 ou 0,14% de que, 
mesmo H0 sendo verdadeira, x assuma um valor 
na região que leva à rejeição de H0 (conforme 
critério adotado).
REGRA DE DECISÃO
• Aceitar H0:
• Quando não houver evidência suficiente para duvidar de sua validade, conclui-
se que μ = μ0;
• Qualquer diferença encontrada foi casual e não representa uma real diferença
entre as médias populacionais.
• Rejeitar H0 e aceita H1:
• Quando houver evidência suficiente para duvidar de sua validade, conclui-se
que μ ≠ μ0 μ pode ser maior ou menor que μ0;
• As diferenças encontradas é grande demais para ser explicada apenas ao acaso
(erro amostral).
REGRA DE DECISÃO
• * A escolha entre o tipo de teste deve ser realizado ANTES da obtenção dos dados
amostrais.
Unicaudal ou 
unilateral
Bicaudal ou 
bilateral
• Avaliação de um novo medicamento para
cefaleia (tempo de ação ~ 100 minutos):
• H0 μ = 100 minutos
• H1 μ ≠ 100 minutos para + ou -
Exemplos:
• Peso ao nascer de filhos de mães usuárias
de drogas ilícitas:
• H0 PN =
• H1 PN <
ERROS DE DECISÃO
•Erro tipo I: Rejeitar H0 quando de fato H0 é verdadeiro.
•Erro tipo II: Não rejeitamos H0 quando de fato H0 é falsa.
Situação Observada
Decisão H0 verdadeira H0 falsa
Aceitar H0 Decisão correta Erro II
Falso-negativo
Rejeitar H0 Erro I 
Falso-positivo
Decisão correta
Dos 20 participantes 
avaliados, a x de peso perdido 
em um mês foi 10Kg e o 
pesquisador rejeitou o uso do 
medicamento
Dos 20 participantes avaliados a 
x de peso perdido em um mês 
foi 8Kg e o pesquisador aceitou 
o uso do medicamento
ERROS DE DECISÃO
•Erro tipo I: Rejeitar H0 quando de fato H0 é verdadeiro.
•Erro tipo II: Não rejeitamos H0 quando de fato H0 é falsa.
ERROS DE DECISÃO
•α: Quantidade máxima de erro do tipo I tolerável;
•β: Limite máximo de erro do tipo II no processo de busca de diferenças
significativas.
•Poder do teste de hipótese = 1 – β
• Probabilidade de se detectar ou rejeitar a H0;
• Também influenciado por α e o tamanho amostral.
PROBABILIDADES DE ERROS DE DECISÃO
• Nível de significância (α):
• Probabilidade máxima de cometer erro do tipo I;
• α = 5%  probabilidade de 0,05 de rejeitar a H0, mesmo ela sendo
verdadeira (Erro do tipo I);
• α = 1%  probabilidade de 0,01 de rejeitar a H0, mesmo ela sendo
verdadeira (Erro do tipo I);
• Deve ser parte integrante do planejamento do estudo.
VALOR DE P
• Valor de P ou valor crítico amostral: probabilidade de se avaliar a ocorrência do
erro do tipo I;
• Valor calculado a partir dos dados obtidos no estudo:
• P ≤ α Rejeita-se H0 e aceita H1 Há diferença entre as médias;
• P > αAceita-se H0Não há diferenças entre as médias.
0 1
0,05
P < 0,05 
Significativo
P > 0,05 Não 
significativo
EXECUÇÃO DO TESTE DE HIPÓTESE
• Passos para o teste da H0:
1. Especificar o nível de significância (α): α 5%, α 1%...
2. Escolher o teste: adequado ao material sob investigação, ao tipo de
variável e a seu nível de medida;
3. Obter o valor crítico: valores críticos descritos em tabelas;
4. Obter o valor calculado do teste: calcular mediante fórmulas ou
softwares estatísticos;
EXECUÇÃO DO TESTE DE HIPÓTESE
• Passos para o teste da H0:
5. Comparar os valores calculados e críticos;
6. Conclusão:
• Valor calculado ≥ valor crítico da tabela Rejeita-se H0 e aceita H1;
• Valor calculado < valor crítico da tabelaAceita-se H0.
TESTE DE HIPÓTESES: ESTATÍSTICA DO TESTE
• A estatística do teste de hipótese depende da distribuição da 
variável na população e das informações disponíveis.
Sim
Dist. Normal
(População)
Não
“Amostra 
Grande”
Sim Não
Teste z Teste t
Sim Não
Testes não 
paramétricos

conhecido?
SIGNIFICÂNCIA ESTATÍSTICA VS RELEVÂNCIA CIENTÍFICA
• “Estatisticamente significante” ≠ “Cientificamente importante”;
• Exemplo: medicamento para controle da Pressão Arterial (PA):
• N = 100.000;
• Medicamento reduziu a PA em 1 mmHg em hipertensos com p = 0,001.
• Há relevância clínica já que foi estatisticamente significante?
REFERÊNCIAS
MOTTA, V. T. Bioestatística. 2. ed. Caxias do Sul: Educs, 2006. 190p.
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier,
2016. 245p.
 monica_cattafesta@hotmail.com