Buscar

Aula 1 de Epidemiologia - Medidas de Tendência Central

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 116 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 116 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 116 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

INTRODUÇÃO À
EPIDEMIOLOGIA
Prof. Dr. Jorge Gustavo VelProf. Dr. Jorge Gustavo Veláásquez Melsquez Melééndezndez
Universidade Federal de Minas GeraisUniversidade Federal de Minas Gerais
Escola de EnfermagemEscola de Enfermagem
Departamento de Enfermagem MaternoDepartamento de Enfermagem Materno--Infantil e SaInfantil e Saúúde Pde Púúblicablica
Epidemiologia é o estudo da distribuição e dos determinantes de doenças/agravos em 
populações específicas e sua aplicação no controle desses problemas. É um método 
científico para resolver problemas usado por “detetives de doença” (profissionais da 
saúde) para chegar à causa dos problemasproblemas de saúde que atingem a uma comunidade, 
seja um problema de surto de sarampo no campus de uma pequena faculdade ou uma 
pandemia de gripe, aumento de homicídios numa única comunidade, uma onda de 
violência, ou o surgimento de qualquer problema de saúde.
Igual a investigadores da cena de um crime, os detetives de doenças 
começam procurando pistas. Eles reúnem, sistematicamente, informações sobre o que 
aconteceu (Quem está doente? Quais são os seus sintomas? Quando eles ficaram 
doentes? Onde eles poderiam ter sido expostos à doença?). Usando análises 
estatísticas, os investigadores estudam as respostas a essas questões para descobrir 
com que um determinado problema particular de saúde esta associado.
Os detetives de doenças usam também o que eles aprenderam para prevenir 
novos casos da doença. 
Por que ensinar 
Epidemiologia?
A Epidemiologia é um método objetivo e científico de resolver 
problemas baseados em análises quantitativas. Pode ser aplicada a 
todo problema, não apenas a surtos de doenças, e relaciona-se a 
muitos dos objetivos de educação em ciência e matemática.
Ensinar epidemiologia:
Aprimora o raciocínio e habilidades de pesquisa e estudantes,
intensifica suas habilidades de análise e solução de problemas 
complexos, e os sensibiliza em boas práticas de saúde.
Em resumo, o aprendizado de Epidemiologia pode dar aos estudantes 
um melhor entendimento da ciência e armá-los com habilidades de 
tomar decisões corretas sobre os cuidados de sua saúde.
VariVariááveis aleatveis aleatóóriasrias
Escalas de MedidasEscalas de Medidas
VariVariááveis aleatveis aleatóóriasrias
 De acordo com a escala
 VARIÁVEL QUALITATIVA
 VARIÁVEL QUANTITATIVA
Classificação funcional
 VARIÁVEL DEPENDENTE
 VARIÁVEL INDEPENDENTE
 Usada para fenômenos que não são 
possíveis de quantificar.
 Os indivíduos são classificados de acordo 
com uma característica que possuem.
 Categorias mutuamente excludentes.
VariVariáável Qualitativavel Qualitativa
 Segundo o tipo de informação são classificadas em:
VARIÁVEIS NOMINAIS
 Classificação que não implica ordem.
 Ex: tipo sanguíneo.
VARIÁVEIS ORDINAIS
 Classificação que atribui ordem ou posição, mas que 
não expressam quantidades numéricas.
 Ex: dor grave ou moderada.
VariVariáável Qualitativavel Qualitativa
VariVariáável Quantitativavel Quantitativa
 Contínua
Assume valores infinitos em um dado intervalo. 
Ex: peso corporal.
 Um tipo especial de variável continua é a variável 
contínua discreta, que assume valores 
associados aos números naturais (1,2,3 ...). 
Ex: número de cigarros fumados por dia.
VariVariáável Dependente e Independentevel Dependente e Independente
 A variável independente (preditora, x) é a suposta 
causa da variável dependente que seria o efeito 
(outcome, y).
 A independente antecede a dependente.
 O pesquisador pode manipular a independente 
usando diversos métodos (pesquisa 
experimental).
 Atenção a possibilidade de que uma variável seja 
independente em um estudo e dependente em 
outro.
ApuraApuraçção de dados qualitativos ão de dados qualitativos 
Veja a seguir dados sobre Veja a seguir dados sobre 
um surto de diarrum surto de diarrééia em ia em 
uma enfermaria A:uma enfermaria A:
de dados quantitativos de dados quantitativos 
ApuraApuraççãoão
DistribuiDistribuiççãoão
A série de números ao lado 
constitui-se em um número de 
observações quaisquer. Pode ser 
o peso de um grupo de pessoas, 
a quantidade de dias que choveu 
durante o ano ou a idade de um 
certo grupo de indivíduos.
O que fazer com esses dados?
Intervalos de ClassesIntervalos de Classes
 Quando a variável assume um número limitado de 
valores (por exemplo, 8 ou 10), geralmente 
listamos os valores individualmente ou fazemos a 
tabela de freqüência.
 Quando a variável assume mais de 10 valores, 
normalmente, agrupamos os valores. Esses 
grupos de valores são denominados intervalos de 
classe.
DistribuiDistribuiçção de Frequênciasão de Frequências
A distribuição de freqüências são tabelas que listam 
os valores que uma variável pode assumir e os 
números de observações de cada valor. Exemplo:
Outra forma de analisar as Outra forma de analisar as 
DISTRIBUIDISTRIBUIÇÇÕES ÕES éé por meio depor meio de
Medidas de Tendência Central e DispersãoMedidas de Tendência Central e Dispersão
Caracteristicas das Distribuições
índice de massa corporal
38,0
36,0
34,0
32,0
30,0
28,0
26,0
24,0
22,0
20,0
18,0
16,0
14,0
12,0
100
80
60
40
20
0
Std. Dev = 3,87 
Mean = 23,0
N = 592,00
peso
102,5
97,5
92,5
87,5
82,5
77,5
72,5
67,5
62,5
57,5
52,5
47,5
42,5
37,5
32,5
27,5
70
60
50
40
30
20
10
0
Std. Dev = 11,04 
Mean = 58,7
N = 593,00
média pad
155,0
145,0
135,0
125,0
115,0
105,0
95,0
85,0
75,0
65,0
55,0
45,0
120
100
80
60
40
20
0
Std. Dev = 15,05 
Mean = 82,5
N = 594,00
média circunferência da cintura
117,5
112,5
107,5
102,5
97,5
92,5
87,5
82,5
77,5
72,5
67,5
62,5
57,5
52,5
80
60
40
20
0
Std. Dev = 10,01 
Mean = 80,8
N = 590,00
1) Tendência central
-Média
-Mediana
-Moda
2) Variação ou dispersão
Intervalo
Variância
Desvio Padrão
3) Perfil
-Simetrica
-Assimetrica
Medidas de Tendência CentralMedidas de Tendência Central
 Um gráfico de uma distribuição de freqüência 
geralmente mostra que grande parte das 
observações se agrupam em torno de um valor 
central. Este agrupamento é denominado 
tendência central da distribuição de freqüência.
 Esse valor pode ser utilizado para caracterizar os 
dados da distribuição.
Medidas de Tendência CentralMedidas de Tendência Central
 Três possíveis medidas de tendência central: 
média aritmética, mediana e moda.
 Outras medidas menos utilizadas são: média 
geométrica e ponto médio de um intervalo.
MMéédia Aritmdia Aritmééticatica
 A média aritmética é a medida de tendência central mais 
conhecida e geralmente é chamada de “média”.
 Em fórmulas, a média aritmética é representada por um x 
com uma barra.
 A fórmula para calcular a média é:
Definição: é a soma dos valores de uma variável, 
dividida pelo número de valores
ÉÉ o valor que indica o centro de equilo valor que indica o centro de equilííbrio de uma brio de uma 
distribuidistribuiçção de freqão de freqüüências de uma variências de uma variáável vel 
quantitativaquantitativa..
MMéédia Aritmdia Aritmééticatica
 O período de incubação de pessoas 
infectadas em um surto de hepatite A foram: 
29, 31, 34, 29, 30 e 25 dias. Calcule a 
média do período de incubação para este 
surto.
A média é mais utilizada porque possui propriedades estatísticas 
importantes. Uma dessas propriedades é a sua centralidade e por 
isso pode ser chamada de “centro da gravidade de uma distribuição 
de freqüência”. “renda da população brasileira?
 Apesar da média ser uma excelente medida para 
resumir um grupo de dados, os dados precisam 
estardistribuidos “normalmente”, pois a média é
altamente sensível a valores extremos.
 Exemplo: 24,25,29,29,30,131.
Média= 44,7
O VALOR ENCONTRADO É POUCO 
REPRESENTATIVO DO GRUPO DE DADOS 
DEVIDO AO VALOR EXTREMOS (131)
MedianaMediana
Mediana significa “meio” e constitui-se no meio de um 
grupo de dados ordenados. É o valor que divide o 
grupo de dados em duas metades.
- É o valor que ocupa a posição central de uma série 
de n observações, quando estas estão ordenadas de 
forma crescente ou decrescente.
Como encontrar a medianaComo encontrar a mediana
1 – Ordene os dados em ordem crescente ou decrescente;
2 – Encontre o meio dos dados com a seguinte forma: (n+1)/2
Se o número de observações for ímpar, a mediana será essa 
observação.
Se o número de observações for par, a mediana estará entre 
duas observações, basta calcular a média aritmética desses 
valores: Ex: 15,7,13,9,10,11
1 – Ordenando os valores: 7,9,10,11,13 e 15
2 – Encontrando o valor do meio: n+1/2 = 6+1/2 = 3,5 
A MEDIANA ESTARÁ ENTRE A TERCEIRA E QUARTA 
OBSERVAÇÃO.
11+10/2 = 10,5
 Encontre a mediana da seguinte série de 
dados: 
0,3,0,7,2,1,0,1,5,2,4,2,8,1,3,0,1,2,1
 Ordene as observações em ordem crescente. 
O meio das 19 observações é a décima 
(10ª).
 Assim: 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 
4, 5, 7, 8, a média é igual a 2 nascimentos.
MMéédia e Medianadia e Mediana
Quando usar média ou mediana:
- Use ambas.
- A média tem uma performance melhor quando temos uma 
distribuição aproximadamente simétrica.
- Se a distribuição é distorcida (assimétrica), use a mediana.
- Lembre-se: a média segue a cauda.
ModaModa
Moda: o valor de maior freqüência no conjunto de 
observações. Ex:
Se todos os valores ocorrem apenas uma vez, a 
distribuição não tem moda. Se dois ou mais 
valores empatarem como o mais repetido, então 
a distribuição tem mais de uma moda.
Moda:1
 Determine a moda dos seguintes dados:
0,3,0,7,2,1,0,1,5,2,4,2,8,1,3,0,1,2,1
Medidas de DispersãoMedidas de Dispersão
 Outra propriedade da distribuição de freqüência é
a variação ou dispersão, ou seja, como a 
distribuição se apresenta em torno do valor 
central.
 Algumas medidas de dispersão utilizada na 
Epidemiologia são: variância, desvio padrão e 
amplitude.
Medidas de dispersãoMedidas de dispersão
A dispersão de uma distribuição de freqüência é
independente do seu ponto central.
Exemplo: Notas de aluno nas provas de Exemplo: Notas de aluno nas provas de 
epidemiologia ao longo do semestreepidemiologia ao longo do semestre
Aluno
A) 5 5 5 5
B) 4 4 6 6 
C) 3 5 7 –
D) 0 5 5 10
E) 0 0 10 10 
Aluno
A) 5 5 5 5
B) 4 4 6 6 
C) 3 5 7 –
D) 0 5 5 10
E) 0 0 10 10 
Média
5
5
5
5
5
MMéédia Aritmdia Aritmééticatica
Como resolver medir a variaComo resolver medir a variaçção de cada ão de cada 
distribuidistribuiçção?ão?
1) Distância de cada valor em rela1) Distância de cada valor em relaçção ão àà media?media?
Ao subtrairmos cada valor de uma série de dados da 
sua média, obteremos valores diversos que quando 
somados resultará em zero. Isso ilustra a centralidade 
que a média possui.
Centralidade da mCentralidade da méédiadia
Exemplo:
• Subtraindo a média de cada observação, a soma das diferenças será
zero. Este conceito de subtração da média de cada observação é a base 
de mais duas medidas de dispersão, a variância e o desvio padrão.
• Para cada medida, o quadrado de cada diferença eliminará os números 
negativos. Então, para encontrar a diferença do quadrado médio calcula-
se a diferença da soma do quadrado e divide por n-1. A média é a 
variância.
• A raiz quadrada da variância é chamada desvio padrão.
Variância e desvio padrão
Fórmulas para calcular a variância e o desvio 
padrão de dados individuais
Observem que para essas fórmulas não é
necessário o valor da média
Compare os dois termos:
O primeiro indica que cada observação deverá ser 
elevada ao quadrado e depois somaremos todos os 
valores encontrados.
O segundo indica que primeiro deveremos encontrar a 
soma das observações e depois elevar a soma ao 
quadrado.
MMéédia e Variânciadia e Variância
Aluno
A) 5 5 5 5
B) 4 4 6 6 
C) 3 5 7 –
D) 0 5 5 10
E) 0 0 10 10 
Variância
0,00
1,33
4,00
16,67
33,33
MMéédia e Desvio Padrãodia e Desvio Padrão
Aluno
A) 5 5 5 5
B) 4 4 6 6 
C) 3 5 7 –
D) 0 5 5 10
E) 0 0 10 10 
Desvio Padrão (DP)
0,00
1,15
2,00
4,80
5,77
A mais importante medida de variação é a de 
variância. Ela é representada por  (sigma) para a 
população e por s2 para a amostra. A variância é
definida pela fórmula:
Variância
recapitulandorecapitulando
O desvio padrão é definido como sendo a raiz 
quadrada da variância, assim:
O desvio padrão expressa o desvio de cada um 
dos elementos, xi em relação à média .
Desvio padrão
- A amplitude de um grupo de dados é a diferença entre o valor 
máximo e o valor mínimo.
- Em estatística a amplitude é representada por um único 
número (diferença entre o valor máximo e o valor mínimo).
- Na Epidemiologia, a amplitude é geralmente representado 
como “de(o mínimo) a (o máximo)”, ou seja, dois números.
- Exemplo: 29,31,24,29,30,25
1-Organize os dados: 24,25,29,29,30,31
2-Valor mínimo=24 Valor máximo=31
3- Calculando a amplitude= máx – mín = 31-24=07
Amplitude, Valor MAmplitude, Valor Míínimo e nimo e 
Valor MValor Mááximoximo
Percentil/Quartil/Intervalo 
Interquartil
-Podemos pensar que um grupo de dados que tem 100% 
das observações, assim é chamado de percentil 100. 
Nessa perspectiva, a mediana esta no percentil 50 e assim 
existem p percentis na distribuição.
-Os percentis mais utilizados além da mediana, são: 
percentil 25 e o percentil 75, sendo que o percentil 25 é o 
limite superior do primeiro quartil; a mediana ou o percentil 
50 limite superior do segundo quartil. O percentil 75 limite 
superior do terceiro quartil.O percentil 100 o limite superior 
do quarto quartil
• A amplitude interquartil representa a porção 
central da distribuição e é calculada com a 
diferença entre o terceiro e o primeiro quartil.
• Essa amplitude inclui aproximadamente a 
metade das observações da distribuição, deixando 
um quarto das observações para cada lado.
Percentil/Quartil/Intervalo 
Interquartil
Percentil/Quartil/Intervalo Interquartil
Box plotBox plot
 Dados de forma resumida
 Linha de base e o topo primeiro e 3º. 
Quartil
 Entre essas linhas está a mediana
 Valor adjacente superior > 
(Q3+1,5(Q3-Q1)
 Valor adjacente inferior<(Q1-1,5(Q3-
Q1)
 Outliers (valores discrepantes ou 
aberrantes)
 Em resumo, medidas de dispersão 
quantificam a distribuição ou variabilidade 
dos valores observados de uma variável 
contínua.
 Para dados distribuídos de forma normal, o 
desvio padrão é utilizado juntamente à
média aritmética. O desvio padrão reflete o 
quão perto os valores observados estão da 
média.
CURVA NORMAL
-- A curva A curva éé uma funuma funçção de x, e o seu domão de x, e o seu domíínio estendenio estende--se se 
de de -- infinito atinfinito atéé + infinito. + infinito. 
-- A curva A curva éé assintassintóótica; isto tica; isto éé, estende, estende--se de se de -- infinito a + infinito a + 
infinito, sem nunca tocar o eixo horizontal, e portanto a infinito, sem nunca tocar o eixo horizontal, e portanto a 
funfunçção de x jamais se anula. ão de x jamais se anula. 
-- A A áárea compreendida pela curva nesse intervalo rea compreendida pela curva nesse intervalo éé
exatamente igual a 1, valor que, em Estatexatamente igual a 1, valor que, em Estatíística, stica, 
corresponde a 100% de probabilidade.corresponde a 100% de probabilidade. 
-- A funA funçção tem um mão tem um mááximo, e esse mximo, e esse mááximo ocorre quando ximo ocorre quando 
x = 0, que corresponde ao seu ponto mx = 0, que corresponde ao seu ponto méédio, ou seja, dio, ou seja, àà
mméédia da distribuidia da distribuiçção. ão. 
-- A distribuiA distribuiçção ão éé simsiméétrica em torno da mtrica em torno da méédia, e como esta dia, e como esta 
éé igual a zero, os valores de x são negativos igual a zero, os valores de x são negativos àà sua sua 
esquerda e positivos esquerda e positivos àà sua direita. sua direita. 
-- A curva tem dois pontos de inflexão, simA curva tem dois pontos de inflexão, siméétricos em tricos em 
relarelaçção ão àà mméédia, que ocorrem quando x = +1 e x = dia, que ocorrem quando x = +1 e x = --1. 1. 
Esses pontos de inflexão são conhecidos, em EstatEsses pontos de inflexão são conhecidos, em Estatíística, stica, 
como o desviocomo o desvio--padrão da distribuipadrão da distribuiçção normal. ão normal. 
-- Graficamente, a curva tem forma de sino, com Graficamente, a curva tem forma de sino, com 
concavidade voltada para baixo entre os pontos de concavidade voltada para baixo entre os pontos de 
inflexão da curva, e convexidade para alinflexão da curva, e convexidade para aléém e aqum e aquéém m 
desses pontos. desses pontos. 
-- Tanto em termos de Probabilidade como em EstatTanto em termos de Probabilidade como em Estatíística, a stica, a 
áárea sob a curva, desde rea sob a curva, desde -- infinito atinfinito atéé um valor qualquer de um valor qualquer de 
x, indica a probabilidade de ocorrência desse valor de x. x, indica a probabilidade de ocorrência desse valor de x. 
GrGrááfico da Distribuifico da Distribuiçção ão 
NormalNormal
CCáálculo de probabilidades associadas lculo de probabilidades associadas 
a curva normal a curva normal 
 Exemplo 1. Qual a área 
correspondente a valores 
de z acima de 1,25?
◦ A curva toda tem área = 1, 
portanto a área a direita de 
zero é 0,5
◦ Na tabela da curva normal, 
verifica-se que a área entre 
z = 0 e z = 1,25 é 0,3944 ou 
39,44%
◦ Ou então a área à direita de 
1,25, seria: 0,5 – 0,3944 = 
0,1056 ou 10,56%
0 1 2 3 4 5 6
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454
0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4161
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279
Figura 10.6: Figura 10.6: Probabilidade de ocorrer valor entre zero e 1,25Probabilidade de ocorrer valor entre zero e 1,25
 Exemplo 2. Qual a área 
compreendida entre z = -
1,5 e z = 1?
◦ Segundo a tabela da curva 
normal, a área entre z = 0 e z 
= -1,5 é 0,4332
◦ A área entre z = 0 e z = 1 é
0,3413
◦ Portanto a área desejada é
0,4332 + 0,3413 = 0,7745
Curva de distribuiCurva de distribuiçção normalão normal
Podemos transformar os valores de qualquer Podemos transformar os valores de qualquer 
distribuidistribuiçção, ão, ““em valores de zem valores de z”” de tal modo a que de tal modo a que 
ao final a mao final a méédia= zero e o dp=1 (tal como na dia= zero e o dp=1 (tal como na 
normal matemnormal matemáática).tica).
Desta forma Os valores de qualquer variDesta forma Os valores de qualquer variáável vel 
podem ser transformados na varipodem ser transformados na variáável vel zz, para , para 
obtenobtençção das ão das ááreas na tabela da curva normal.reas na tabela da curva normal.
Essa transformaEssa transformaçção em valores de z se faz pela ão em valores de z se faz pela 
relarelaççãoão::



xz
A estatura A estatura éé uma uma 
varivariáável com vel com 
distribuidistribuiçção normal ão normal 
sendo em que em uma sendo em que em uma 
populapopulaçção de jovens a ão de jovens a 
mméédia dia éé 175 cm e o 175 cm e o 
desviodesvio--padrão 6 cm. padrão 6 cm. 
Qual a probabilidade Qual a probabilidade 
esperada de jovens esperada de jovens 
com altura acima 180 com altura acima 180 
cm?cm?
Para x = 180, z = (180 Para x = 180, z = (180 ––
175)/6 = 0,83175)/6 = 0,83
VerificaVerifica--se na tabela de se na tabela de 
distribuidistribuiçção da normal que a ão da normal que a 
áárea entre z = 0 e z = 0,83 rea entre z = 0 e z = 0,83 éé
0,2967 e a 0,2967 e a áárea alrea aléém de 0,83 m de 0,83 
éé (0,5 (0,5 –– 0,2967) = 0,2033.0,2967) = 0,2033.
R: Nessa populaR: Nessa populaçção a ão a 
probabilidade de achar jovens probabilidade de achar jovens 
acima de 180 cm acima de 180 cm éé de 20.33%de 20.33%
1)1) Desenhar a curva normal, Desenhar a curva normal, 
hachurandohachurando--se a se a áárea de rea de 
interesseinteresse
2)2) Transformar a variTransformar a variáável vel 
estatura (x) na variestatura (x) na variáável vel 
padronizada zpadronizada z
APLICAAPLICAÇÇÕES DA CURVA ÕES DA CURVA 
NORMALNORMAL
Introdução à Inferência 
Estatística
Como tirar conclusões sobre uma população usando apenas uma 
amostra 
• Calcula-se medidas de 
dispersão para descrever um 
conjunto particular de dados. 
•Quando os dados 
representam uma amostra de 
uma população, e se queremos 
generalizar os resultados para 
a população geral. 
•Há métodos estatísticos que 
permitem isso.
• Quando realizamos inferência 
de uma distribuição de dados, 
baseamos nossas conclusões 
na relação de desvio padrão e 
a média da curva da normal.
Lembrem-se
Se uma variável tem 
distribuição normal. 
Com isso 
assumimos que 95% 
da população ficaria 
situada entre a 
média e + ou - 1,96 
desvios padrão.
Se vSe váárias amostras aleatrias amostras aleatóórias forem obtidas de rias forem obtidas de 
uma populauma populaçção, elas vão diferir relativamente no ão, elas vão diferir relativamente no 
valor mvalor méédio, por tanto em teremos varias mdio, por tanto em teremos varias méédias dias 
amostrais, portanto, teremos uma distribuiamostrais, portanto, teremos uma distribuiçção ão 
das mdas méédias amostrais as quais tambdias amostrais as quais tambéém têm um m têm um 
desvio padrão. desvio padrão. 
O desvio padrão da distribuiO desvio padrão da distribuiçção das mão das méédias de dias de 
amostras, com o mesmo tamanho, obtidas da amostras, com o mesmo tamanho, obtidas da 
mesma populamesma populaçção pode ser estimado usando o ão pode ser estimado usando o 
conceito de erro padrão da mconceito de erro padrão da méédia. Mais dia. Mais 
concretamente, o erroconcretamente, o erro--padrão representa o padrão representa o 
desvdesvííoo--padrão de uma distribuipadrão de uma distribuiçção de amostras.ão de amostras.
Assim um procedimento alternativo ou Assim um procedimento alternativo ou 
complementar da inferência estatcomplementar da inferência estatíística stica 
para estimar o grau de incerteza que ha para estimar o grau de incerteza que ha 
entre os estimadores dos parâmetros entre os estimadores dos parâmetros 
populacionais e o computo de seus populacionais e o computo de seus 
intervalos de confianintervalos de confiançça. a. 
Sua comparaSua comparaçção direta, inclusive, pode ão direta, inclusive, pode 
ser muito informativa para teste de ser muito informativa para teste de 
diferendiferençça de parâmetros.a de parâmetros.
Erro padrão x Desvio padrão
O desvio padrãoé a medida de variabilidade 
de um conjunto de observações sobre a 
média.
O erro padrão da média é a medida de 
variabilidade acerca da média da amostra 
sobre a média da população verdadeira.
Devido a que as estimações variam entre as amostras é importante saber até que 
ponto o valor encontrado na amostra é o da população. É por isso que se calcula o 
intervalo de confiança, ou seja, um conjunto de valores em torno do valor estimado 
e que tenham uma probabilidade especificada de conter o valor verdadeiro da 
população.
INTERVALO DE CONFIANÇA
O intervalo de confianO intervalo de confiançça desse modo construa desse modo construíído indica a posido indica a posiçção em ão em 
que o verdadeiro parâmetro populacional estudado esta contido, cque o verdadeiro parâmetro populacional estudado esta contido, com om 
uma probabilidade conhecida, no caso das formulas 95%uma probabilidade conhecida, no caso das formulas 95%
NNííveis de hemoglobina (g/dl) em veis de hemoglobina (g/dl) em 
criancrianççasas
Prevalência de diabetes em São Paulo = 0,0882 ou 8.82%, n=204Prevalência de diabetes em São Paulo = 0,0882 ou 8.82%, n=204
Prevalência de diabetes em BrasPrevalência de diabetes em Brasíília lia = 0,0558 ou 5.58%, n=556= 0,0558 ou 5.58%, n=556
O IC95% de confianO IC95% de confiançça para a prevalência de diabetes em São Paulo sera para a prevalência de diabetes em São Paulo seráá::
O IC95% de confianO IC95% de confiançça para a prevalência de diabetes em Brasa para a prevalência de diabetes em Brasíília serlia seráá::
LLii = 4,93%; L= 4,93%; Lss = 12,72%= 12,72%
LLii = 3,67%; L= 3,67%; Lss = 7,48%= 7,48%
Pr
ev
al
ên
ci
a 
de
 d
ia
be
te
s
Diabetes em BrasíliaDiabetes em São Paulo
Testes de HipTestes de Hipóótesesteses
 Teste t-sudent
HipHipóótese Estattese Estatíística:stica:
HipHipóótese, em estattese, em estatíística, stica, éé uma suposiuma suposiçção formulada a respeito dos ão formulada a respeito dos 
parâmetros de uma distribuiparâmetros de uma distribuiçção de probabilidade de uma ou mais ão de probabilidade de uma ou mais 
populapopulaçções.ões.
Esta hipEsta hipóótese sertese seráá testada com base em resultados amostrais, sendo testada com base em resultados amostrais, sendo 
aceita ou rejeitada. Ela somente seraceita ou rejeitada. Ela somente seráá rejeitada se o resultado da rejeitada se o resultado da 
amostra for claramente improvamostra for claramente improváável de ocorrer quando a hipvel de ocorrer quando a hipóótese for tese for 
verdadeira.verdadeira.
Consideremos Ho a hipConsideremos Ho a hipóótese nula, e H1 a hiptese nula, e H1 a hipóótese alternativa a ser tese alternativa a ser 
testada (complementar de Ho). O teste pode levar a aceitatestada (complementar de Ho). O teste pode levar a aceitaçção ou ão ou 
rejeirejeiçção de Ho que corresponde, respectivamente ão de Ho que corresponde, respectivamente àà neganegaççãoão
ou afirmaou afirmaçção de H1.ão de H1.
Teste Teste t t -- studentstudent
 Teste usado para comparação de duas 
populações, dois grupos.
 Se a variável em análise tem distribuição normal 
ou aproximadamente normal, aplica-se o teste t
para comparar duas médias.
 Fórmula para comparação de médias e passos 
Teste Teste t t --
studentstudent
Tabela - Perdas de peso, em quilogramas, segundo a dieta
Dieta
1 2
12 15
8 19
15 15
13 12
10 13
12 16
14 15
11
12
13
Fonte: Livro de BioestatFonte: Livro de Bioestatíísticastica
MMéédia 1 = 12 Vardia 1 = 12 Varííância 1 = 4ância 1 = 4
MMéédia 2 = 15 Variância 2 = 5dia 2 = 15 Variância 2 = 5
Variância ponderada = 4,4Variância ponderada = 4,4
tt = 2,918= 2,918
Com ( n1+n2) Com ( n1+n2) --2 = (10+7)2 = (10+7)--2=152=15
tt tabela = 2,13 com tabela = 2,13 com 
Conclusão: A perda de peso Conclusão: A perda de peso 
éé maior em pacientes que maior em pacientes que 
usam a dieta 2 usam a dieta 2 
significativamentesignificativamente
Graus de liberdade 10% 5% 1% 
1 6,31 12,71 63,66 
2 2,92 4,30 9,92 
3 2,35 3,18 5,84 
4 2,13 2,78 4,60 
5 2,02 2,57 4,03 
6 1,94 2,45 3,71 
7 1,90 2,36 3,50 
8 1,86 2,31 3,36 
9 1,83 2,26 3,25 
10 1,81 2,23 3,17 
11 1,80 2,20 3,11 
12 1,78 2,18 3,06 
13 1,77 2,16 3,01 
14 1,76 2,14 2,98 
15 1,75 2,13 2,95 
16 1,75 2,12 2,92 
17 1,74 2,11 2,90 
18 1,73 2,10 2,88 
19 1,73 2,09 2,86 
20 1,73 2,09 2,84 
21 1,72 2,08 2,83 
22 1,72 2,07 2,82 
23 1,71 2,07 2,81 
24 171 2,06 2,80 
25 1,71 2,06 2,79 
26 1,71 2,06 2,78 
27 1,70 2,05 2,77 
28 1,70 2,05 2,76 
29 1,70 2,04 2,76 
30 1,70 2,04 2,75 
40 1,68 2,02 2,70 
60 1,67 2,00 2,66 
120 1,66 1,98 2,62 
 1,64 1,96 2,58 
 
Teste Teste t t -- studentstudent
Tabela - Pesos em quilogramas de 9 pessoas antes e depois da 
dieta para emagrecimento 
Cirurgia
Antes Depois
77 80
62 58
61 61
80 76
90 79
72 69
86 90
59 51
88 81
Fonte: Livro de BioestatFonte: Livro de Bioestatíísticastica
MMéédia das diferendia das diferençças = as = --3,3333,333
Variância das diferenVariância das diferençças = 25as = 25
tt = = --2,02,0
Com nCom n--1 gl, 91 gl, 9--1=8 gl1=8 gl
tt tabela = 2,31 com tabela = 2,31 com 
Que faremos quando se trata de Que faremos quando se trata de 
comparar duas proporcomparar duas proporçções?ões?
A diferenA diferençça entre duas propora entre duas proporçções tem distribuiões tem distribuiçção T quando amostras ão T quando amostras 
grandesgrandes..
TESTE QUITESTE QUI--QUADRADOQUADRADO
No caso de duas variNo caso de duas variááveis categveis categóóricas.ricas.
HipHipóótese nula: as distribuitese nula: as distribuiçções das variões das variááveis são veis são 
independentes umas das outras (ou seja, a independentes umas das outras (ou seja, a 
frequência com que a varifrequência com que a variáável A pertence a uma vel A pertence a uma 
determinada categoria determinada categoria éé igual para todas as igual para todas as 
categorias da varicategorias da variáável B).vel B).
FormulaFormulaçção de Hipão de Hipóótesesteses
Ho: Não existe associaHo: Não existe associaçção entre propoanolol e sobrevidaão entre propoanolol e sobrevida
Ha: o uso de propanolol se associa ao tempo de sobrevidaHa: o uso de propanolol se associa ao tempo de sobrevida
Situação
Se uma moeda não viciada for jogada 100 vezes, espera-se obter 50 caras e 50 coroas, já que a 
probabilidade de cair cara (p) é = ½ e a de 
cair coroa (q) também é = ½. 
Na prática, é muito difícil obter valores observados, idênticos aos esperados, sendo comum 
encontrar valores que se desviam dos teóricos. 
Supondo que uma moeda foi jogada 100 vezes e se obteve 60 caras e 40 coroas.
a. Qual será o valor de x2 ?
b. Como se pode interpretar esse valor?
Resolvendo: 
As frequências esperadas em cada classe são calculadas por: p.N. Portanto: 
E(cara) = ½ .100 e E(coroa) = ½ .100 
Assim, os valores esperados são: cara: 50 e coroa: 50 e os observados são: cara: 60 e coroa: 
40. 
= [(60 – 50)2 / 50] + [(40 – 50)2 / 50] 
a. Valor de x2 = 2 + 2 = 4
Supondo que em vez de lançarmos 100 moedas uma única vez, tivéssemos 
feito inúmeros lançamentos de 100 moedas. Se calcularmos o a cada 100 
lançamentos, e, depois, colocarmos todos os resultados em um gráfico, teria 
sido obtida a figura ao lado.
Nota-se que os valores pequenos de ocorrem mais frequentemente que os 
grandes, pois se um experimento puder ser representado pelo modelo teórico 
proposto, pequenos desvios casuais entre proporções esperadas e 
observadas ocorrerão em maior número do que grandes desvios.
Tomando a área total sob a curva como 100%, sabe-se que o valor 3,841 
delimita 5% dela. Este é o valor crítico de qui quadrado conhecido como . 
Portanto, espera-se em experimentossemelhantes, que valores 
de menores que 3,841 tenham 95% de probabilidade de ocorrência.
Sempre que o valor de for menor que 3,841 aceita-
se a hipótese de igualdade estatística entre os 
números de observados e de esperados (H0). Ou 
seja, admite-se que os desvios não são 
significativos
SOBREVIDA > 1 MÊSSOBREVIDA > 1 MÊS
24246767TotalTotal
4646171729 (63)29 (63)PlaceboPlacebo
45457738 (84)38 (84)PropranololPropranolol
TotalTotalÓÓbitobitoSobreviveSobreviveTT
RR
AA
TT
AA
MM
EE
NN
TT
OO
24246767TotalTotal
12,1312,1333,8733,87
4646171729 (63)29 (63)PlaceboPlacebo
11,4711,4733,1333,13
45457738 (84)38 (84)PropranololPropranolol
TotalTotalÓÓbitobitoSobreviveSobreviveTT
RR
AA
TT
AA
MM
EE
NN
TT
OO
SOBREVIDA > 1 MÊSSOBREVIDA > 1 MÊS
CCÁÁLCULO LCULO 22
025,038,52  p
       
96,170,0272,0
13,12
13,1217
87,33
87,3329
87,11
87,117
13,33
13,3338
2
2222
2











 
 




 

E
EO 22
Formula alternativa simplificada do Formula alternativa simplificada do 
quiqui--quadrado quadrado

Outros materiais