Baixe o app para aproveitar ainda mais
Prévia do material em texto
INTRODUÇÃO À EPIDEMIOLOGIA Prof. Dr. Jorge Gustavo VelProf. Dr. Jorge Gustavo Veláásquez Melsquez Melééndezndez Universidade Federal de Minas GeraisUniversidade Federal de Minas Gerais Escola de EnfermagemEscola de Enfermagem Departamento de Enfermagem MaternoDepartamento de Enfermagem Materno--Infantil e SaInfantil e Saúúde Pde Púúblicablica Epidemiologia é o estudo da distribuição e dos determinantes de doenças/agravos em populações específicas e sua aplicação no controle desses problemas. É um método científico para resolver problemas usado por “detetives de doença” (profissionais da saúde) para chegar à causa dos problemasproblemas de saúde que atingem a uma comunidade, seja um problema de surto de sarampo no campus de uma pequena faculdade ou uma pandemia de gripe, aumento de homicídios numa única comunidade, uma onda de violência, ou o surgimento de qualquer problema de saúde. Igual a investigadores da cena de um crime, os detetives de doenças começam procurando pistas. Eles reúnem, sistematicamente, informações sobre o que aconteceu (Quem está doente? Quais são os seus sintomas? Quando eles ficaram doentes? Onde eles poderiam ter sido expostos à doença?). Usando análises estatísticas, os investigadores estudam as respostas a essas questões para descobrir com que um determinado problema particular de saúde esta associado. Os detetives de doenças usam também o que eles aprenderam para prevenir novos casos da doença. Por que ensinar Epidemiologia? A Epidemiologia é um método objetivo e científico de resolver problemas baseados em análises quantitativas. Pode ser aplicada a todo problema, não apenas a surtos de doenças, e relaciona-se a muitos dos objetivos de educação em ciência e matemática. Ensinar epidemiologia: Aprimora o raciocínio e habilidades de pesquisa e estudantes, intensifica suas habilidades de análise e solução de problemas complexos, e os sensibiliza em boas práticas de saúde. Em resumo, o aprendizado de Epidemiologia pode dar aos estudantes um melhor entendimento da ciência e armá-los com habilidades de tomar decisões corretas sobre os cuidados de sua saúde. VariVariááveis aleatveis aleatóóriasrias Escalas de MedidasEscalas de Medidas VariVariááveis aleatveis aleatóóriasrias De acordo com a escala VARIÁVEL QUALITATIVA VARIÁVEL QUANTITATIVA Classificação funcional VARIÁVEL DEPENDENTE VARIÁVEL INDEPENDENTE Usada para fenômenos que não são possíveis de quantificar. Os indivíduos são classificados de acordo com uma característica que possuem. Categorias mutuamente excludentes. VariVariáável Qualitativavel Qualitativa Segundo o tipo de informação são classificadas em: VARIÁVEIS NOMINAIS Classificação que não implica ordem. Ex: tipo sanguíneo. VARIÁVEIS ORDINAIS Classificação que atribui ordem ou posição, mas que não expressam quantidades numéricas. Ex: dor grave ou moderada. VariVariáável Qualitativavel Qualitativa VariVariáável Quantitativavel Quantitativa Contínua Assume valores infinitos em um dado intervalo. Ex: peso corporal. Um tipo especial de variável continua é a variável contínua discreta, que assume valores associados aos números naturais (1,2,3 ...). Ex: número de cigarros fumados por dia. VariVariáável Dependente e Independentevel Dependente e Independente A variável independente (preditora, x) é a suposta causa da variável dependente que seria o efeito (outcome, y). A independente antecede a dependente. O pesquisador pode manipular a independente usando diversos métodos (pesquisa experimental). Atenção a possibilidade de que uma variável seja independente em um estudo e dependente em outro. ApuraApuraçção de dados qualitativos ão de dados qualitativos Veja a seguir dados sobre Veja a seguir dados sobre um surto de diarrum surto de diarrééia em ia em uma enfermaria A:uma enfermaria A: de dados quantitativos de dados quantitativos ApuraApuraççãoão DistribuiDistribuiççãoão A série de números ao lado constitui-se em um número de observações quaisquer. Pode ser o peso de um grupo de pessoas, a quantidade de dias que choveu durante o ano ou a idade de um certo grupo de indivíduos. O que fazer com esses dados? Intervalos de ClassesIntervalos de Classes Quando a variável assume um número limitado de valores (por exemplo, 8 ou 10), geralmente listamos os valores individualmente ou fazemos a tabela de freqüência. Quando a variável assume mais de 10 valores, normalmente, agrupamos os valores. Esses grupos de valores são denominados intervalos de classe. DistribuiDistribuiçção de Frequênciasão de Frequências A distribuição de freqüências são tabelas que listam os valores que uma variável pode assumir e os números de observações de cada valor. Exemplo: Outra forma de analisar as Outra forma de analisar as DISTRIBUIDISTRIBUIÇÇÕES ÕES éé por meio depor meio de Medidas de Tendência Central e DispersãoMedidas de Tendência Central e Dispersão Caracteristicas das Distribuições índice de massa corporal 38,0 36,0 34,0 32,0 30,0 28,0 26,0 24,0 22,0 20,0 18,0 16,0 14,0 12,0 100 80 60 40 20 0 Std. Dev = 3,87 Mean = 23,0 N = 592,00 peso 102,5 97,5 92,5 87,5 82,5 77,5 72,5 67,5 62,5 57,5 52,5 47,5 42,5 37,5 32,5 27,5 70 60 50 40 30 20 10 0 Std. Dev = 11,04 Mean = 58,7 N = 593,00 média pad 155,0 145,0 135,0 125,0 115,0 105,0 95,0 85,0 75,0 65,0 55,0 45,0 120 100 80 60 40 20 0 Std. Dev = 15,05 Mean = 82,5 N = 594,00 média circunferência da cintura 117,5 112,5 107,5 102,5 97,5 92,5 87,5 82,5 77,5 72,5 67,5 62,5 57,5 52,5 80 60 40 20 0 Std. Dev = 10,01 Mean = 80,8 N = 590,00 1) Tendência central -Média -Mediana -Moda 2) Variação ou dispersão Intervalo Variância Desvio Padrão 3) Perfil -Simetrica -Assimetrica Medidas de Tendência CentralMedidas de Tendência Central Um gráfico de uma distribuição de freqüência geralmente mostra que grande parte das observações se agrupam em torno de um valor central. Este agrupamento é denominado tendência central da distribuição de freqüência. Esse valor pode ser utilizado para caracterizar os dados da distribuição. Medidas de Tendência CentralMedidas de Tendência Central Três possíveis medidas de tendência central: média aritmética, mediana e moda. Outras medidas menos utilizadas são: média geométrica e ponto médio de um intervalo. MMéédia Aritmdia Aritmééticatica A média aritmética é a medida de tendência central mais conhecida e geralmente é chamada de “média”. Em fórmulas, a média aritmética é representada por um x com uma barra. A fórmula para calcular a média é: Definição: é a soma dos valores de uma variável, dividida pelo número de valores ÉÉ o valor que indica o centro de equilo valor que indica o centro de equilííbrio de uma brio de uma distribuidistribuiçção de freqão de freqüüências de uma variências de uma variáável vel quantitativaquantitativa.. MMéédia Aritmdia Aritmééticatica O período de incubação de pessoas infectadas em um surto de hepatite A foram: 29, 31, 34, 29, 30 e 25 dias. Calcule a média do período de incubação para este surto. A média é mais utilizada porque possui propriedades estatísticas importantes. Uma dessas propriedades é a sua centralidade e por isso pode ser chamada de “centro da gravidade de uma distribuição de freqüência”. “renda da população brasileira? Apesar da média ser uma excelente medida para resumir um grupo de dados, os dados precisam estardistribuidos “normalmente”, pois a média é altamente sensível a valores extremos. Exemplo: 24,25,29,29,30,131. Média= 44,7 O VALOR ENCONTRADO É POUCO REPRESENTATIVO DO GRUPO DE DADOS DEVIDO AO VALOR EXTREMOS (131) MedianaMediana Mediana significa “meio” e constitui-se no meio de um grupo de dados ordenados. É o valor que divide o grupo de dados em duas metades. - É o valor que ocupa a posição central de uma série de n observações, quando estas estão ordenadas de forma crescente ou decrescente. Como encontrar a medianaComo encontrar a mediana 1 – Ordene os dados em ordem crescente ou decrescente; 2 – Encontre o meio dos dados com a seguinte forma: (n+1)/2 Se o número de observações for ímpar, a mediana será essa observação. Se o número de observações for par, a mediana estará entre duas observações, basta calcular a média aritmética desses valores: Ex: 15,7,13,9,10,11 1 – Ordenando os valores: 7,9,10,11,13 e 15 2 – Encontrando o valor do meio: n+1/2 = 6+1/2 = 3,5 A MEDIANA ESTARÁ ENTRE A TERCEIRA E QUARTA OBSERVAÇÃO. 11+10/2 = 10,5 Encontre a mediana da seguinte série de dados: 0,3,0,7,2,1,0,1,5,2,4,2,8,1,3,0,1,2,1 Ordene as observações em ordem crescente. O meio das 19 observações é a décima (10ª). Assim: 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 5, 7, 8, a média é igual a 2 nascimentos. MMéédia e Medianadia e Mediana Quando usar média ou mediana: - Use ambas. - A média tem uma performance melhor quando temos uma distribuição aproximadamente simétrica. - Se a distribuição é distorcida (assimétrica), use a mediana. - Lembre-se: a média segue a cauda. ModaModa Moda: o valor de maior freqüência no conjunto de observações. Ex: Se todos os valores ocorrem apenas uma vez, a distribuição não tem moda. Se dois ou mais valores empatarem como o mais repetido, então a distribuição tem mais de uma moda. Moda:1 Determine a moda dos seguintes dados: 0,3,0,7,2,1,0,1,5,2,4,2,8,1,3,0,1,2,1 Medidas de DispersãoMedidas de Dispersão Outra propriedade da distribuição de freqüência é a variação ou dispersão, ou seja, como a distribuição se apresenta em torno do valor central. Algumas medidas de dispersão utilizada na Epidemiologia são: variância, desvio padrão e amplitude. Medidas de dispersãoMedidas de dispersão A dispersão de uma distribuição de freqüência é independente do seu ponto central. Exemplo: Notas de aluno nas provas de Exemplo: Notas de aluno nas provas de epidemiologia ao longo do semestreepidemiologia ao longo do semestre Aluno A) 5 5 5 5 B) 4 4 6 6 C) 3 5 7 – D) 0 5 5 10 E) 0 0 10 10 Aluno A) 5 5 5 5 B) 4 4 6 6 C) 3 5 7 – D) 0 5 5 10 E) 0 0 10 10 Média 5 5 5 5 5 MMéédia Aritmdia Aritmééticatica Como resolver medir a variaComo resolver medir a variaçção de cada ão de cada distribuidistribuiçção?ão? 1) Distância de cada valor em rela1) Distância de cada valor em relaçção ão àà media?media? Ao subtrairmos cada valor de uma série de dados da sua média, obteremos valores diversos que quando somados resultará em zero. Isso ilustra a centralidade que a média possui. Centralidade da mCentralidade da méédiadia Exemplo: • Subtraindo a média de cada observação, a soma das diferenças será zero. Este conceito de subtração da média de cada observação é a base de mais duas medidas de dispersão, a variância e o desvio padrão. • Para cada medida, o quadrado de cada diferença eliminará os números negativos. Então, para encontrar a diferença do quadrado médio calcula- se a diferença da soma do quadrado e divide por n-1. A média é a variância. • A raiz quadrada da variância é chamada desvio padrão. Variância e desvio padrão Fórmulas para calcular a variância e o desvio padrão de dados individuais Observem que para essas fórmulas não é necessário o valor da média Compare os dois termos: O primeiro indica que cada observação deverá ser elevada ao quadrado e depois somaremos todos os valores encontrados. O segundo indica que primeiro deveremos encontrar a soma das observações e depois elevar a soma ao quadrado. MMéédia e Variânciadia e Variância Aluno A) 5 5 5 5 B) 4 4 6 6 C) 3 5 7 – D) 0 5 5 10 E) 0 0 10 10 Variância 0,00 1,33 4,00 16,67 33,33 MMéédia e Desvio Padrãodia e Desvio Padrão Aluno A) 5 5 5 5 B) 4 4 6 6 C) 3 5 7 – D) 0 5 5 10 E) 0 0 10 10 Desvio Padrão (DP) 0,00 1,15 2,00 4,80 5,77 A mais importante medida de variação é a de variância. Ela é representada por (sigma) para a população e por s2 para a amostra. A variância é definida pela fórmula: Variância recapitulandorecapitulando O desvio padrão é definido como sendo a raiz quadrada da variância, assim: O desvio padrão expressa o desvio de cada um dos elementos, xi em relação à média . Desvio padrão - A amplitude de um grupo de dados é a diferença entre o valor máximo e o valor mínimo. - Em estatística a amplitude é representada por um único número (diferença entre o valor máximo e o valor mínimo). - Na Epidemiologia, a amplitude é geralmente representado como “de(o mínimo) a (o máximo)”, ou seja, dois números. - Exemplo: 29,31,24,29,30,25 1-Organize os dados: 24,25,29,29,30,31 2-Valor mínimo=24 Valor máximo=31 3- Calculando a amplitude= máx – mín = 31-24=07 Amplitude, Valor MAmplitude, Valor Míínimo e nimo e Valor MValor Mááximoximo Percentil/Quartil/Intervalo Interquartil -Podemos pensar que um grupo de dados que tem 100% das observações, assim é chamado de percentil 100. Nessa perspectiva, a mediana esta no percentil 50 e assim existem p percentis na distribuição. -Os percentis mais utilizados além da mediana, são: percentil 25 e o percentil 75, sendo que o percentil 25 é o limite superior do primeiro quartil; a mediana ou o percentil 50 limite superior do segundo quartil. O percentil 75 limite superior do terceiro quartil.O percentil 100 o limite superior do quarto quartil • A amplitude interquartil representa a porção central da distribuição e é calculada com a diferença entre o terceiro e o primeiro quartil. • Essa amplitude inclui aproximadamente a metade das observações da distribuição, deixando um quarto das observações para cada lado. Percentil/Quartil/Intervalo Interquartil Percentil/Quartil/Intervalo Interquartil Box plotBox plot Dados de forma resumida Linha de base e o topo primeiro e 3º. Quartil Entre essas linhas está a mediana Valor adjacente superior > (Q3+1,5(Q3-Q1) Valor adjacente inferior<(Q1-1,5(Q3- Q1) Outliers (valores discrepantes ou aberrantes) Em resumo, medidas de dispersão quantificam a distribuição ou variabilidade dos valores observados de uma variável contínua. Para dados distribuídos de forma normal, o desvio padrão é utilizado juntamente à média aritmética. O desvio padrão reflete o quão perto os valores observados estão da média. CURVA NORMAL -- A curva A curva éé uma funuma funçção de x, e o seu domão de x, e o seu domíínio estendenio estende--se se de de -- infinito atinfinito atéé + infinito. + infinito. -- A curva A curva éé assintassintóótica; isto tica; isto éé, estende, estende--se de se de -- infinito a + infinito a + infinito, sem nunca tocar o eixo horizontal, e portanto a infinito, sem nunca tocar o eixo horizontal, e portanto a funfunçção de x jamais se anula. ão de x jamais se anula. -- A A áárea compreendida pela curva nesse intervalo rea compreendida pela curva nesse intervalo éé exatamente igual a 1, valor que, em Estatexatamente igual a 1, valor que, em Estatíística, stica, corresponde a 100% de probabilidade.corresponde a 100% de probabilidade. -- A funA funçção tem um mão tem um mááximo, e esse mximo, e esse mááximo ocorre quando ximo ocorre quando x = 0, que corresponde ao seu ponto mx = 0, que corresponde ao seu ponto méédio, ou seja, dio, ou seja, àà mméédia da distribuidia da distribuiçção. ão. -- A distribuiA distribuiçção ão éé simsiméétrica em torno da mtrica em torno da méédia, e como esta dia, e como esta éé igual a zero, os valores de x são negativos igual a zero, os valores de x são negativos àà sua sua esquerda e positivos esquerda e positivos àà sua direita. sua direita. -- A curva tem dois pontos de inflexão, simA curva tem dois pontos de inflexão, siméétricos em tricos em relarelaçção ão àà mméédia, que ocorrem quando x = +1 e x = dia, que ocorrem quando x = +1 e x = --1. 1. Esses pontos de inflexão são conhecidos, em EstatEsses pontos de inflexão são conhecidos, em Estatíística, stica, como o desviocomo o desvio--padrão da distribuipadrão da distribuiçção normal. ão normal. -- Graficamente, a curva tem forma de sino, com Graficamente, a curva tem forma de sino, com concavidade voltada para baixo entre os pontos de concavidade voltada para baixo entre os pontos de inflexão da curva, e convexidade para alinflexão da curva, e convexidade para aléém e aqum e aquéém m desses pontos. desses pontos. -- Tanto em termos de Probabilidade como em EstatTanto em termos de Probabilidade como em Estatíística, a stica, a áárea sob a curva, desde rea sob a curva, desde -- infinito atinfinito atéé um valor qualquer de um valor qualquer de x, indica a probabilidade de ocorrência desse valor de x. x, indica a probabilidade de ocorrência desse valor de x. GrGrááfico da Distribuifico da Distribuiçção ão NormalNormal CCáálculo de probabilidades associadas lculo de probabilidades associadas a curva normal a curva normal Exemplo 1. Qual a área correspondente a valores de z acima de 1,25? ◦ A curva toda tem área = 1, portanto a área a direita de zero é 0,5 ◦ Na tabela da curva normal, verifica-se que a área entre z = 0 e z = 1,25 é 0,3944 ou 39,44% ◦ Ou então a área à direita de 1,25, seria: 0,5 – 0,3944 = 0,1056 ou 10,56% 0 1 2 3 4 5 6 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4161 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 Figura 10.6: Figura 10.6: Probabilidade de ocorrer valor entre zero e 1,25Probabilidade de ocorrer valor entre zero e 1,25 Exemplo 2. Qual a área compreendida entre z = - 1,5 e z = 1? ◦ Segundo a tabela da curva normal, a área entre z = 0 e z = -1,5 é 0,4332 ◦ A área entre z = 0 e z = 1 é 0,3413 ◦ Portanto a área desejada é 0,4332 + 0,3413 = 0,7745 Curva de distribuiCurva de distribuiçção normalão normal Podemos transformar os valores de qualquer Podemos transformar os valores de qualquer distribuidistribuiçção, ão, ““em valores de zem valores de z”” de tal modo a que de tal modo a que ao final a mao final a méédia= zero e o dp=1 (tal como na dia= zero e o dp=1 (tal como na normal matemnormal matemáática).tica). Desta forma Os valores de qualquer variDesta forma Os valores de qualquer variáável vel podem ser transformados na varipodem ser transformados na variáável vel zz, para , para obtenobtençção das ão das ááreas na tabela da curva normal.reas na tabela da curva normal. Essa transformaEssa transformaçção em valores de z se faz pela ão em valores de z se faz pela relarelaççãoão:: xz A estatura A estatura éé uma uma varivariáável com vel com distribuidistribuiçção normal ão normal sendo em que em uma sendo em que em uma populapopulaçção de jovens a ão de jovens a mméédia dia éé 175 cm e o 175 cm e o desviodesvio--padrão 6 cm. padrão 6 cm. Qual a probabilidade Qual a probabilidade esperada de jovens esperada de jovens com altura acima 180 com altura acima 180 cm?cm? Para x = 180, z = (180 Para x = 180, z = (180 –– 175)/6 = 0,83175)/6 = 0,83 VerificaVerifica--se na tabela de se na tabela de distribuidistribuiçção da normal que a ão da normal que a áárea entre z = 0 e z = 0,83 rea entre z = 0 e z = 0,83 éé 0,2967 e a 0,2967 e a áárea alrea aléém de 0,83 m de 0,83 éé (0,5 (0,5 –– 0,2967) = 0,2033.0,2967) = 0,2033. R: Nessa populaR: Nessa populaçção a ão a probabilidade de achar jovens probabilidade de achar jovens acima de 180 cm acima de 180 cm éé de 20.33%de 20.33% 1)1) Desenhar a curva normal, Desenhar a curva normal, hachurandohachurando--se a se a áárea de rea de interesseinteresse 2)2) Transformar a variTransformar a variáável vel estatura (x) na variestatura (x) na variáável vel padronizada zpadronizada z APLICAAPLICAÇÇÕES DA CURVA ÕES DA CURVA NORMALNORMAL Introdução à Inferência Estatística Como tirar conclusões sobre uma população usando apenas uma amostra • Calcula-se medidas de dispersão para descrever um conjunto particular de dados. •Quando os dados representam uma amostra de uma população, e se queremos generalizar os resultados para a população geral. •Há métodos estatísticos que permitem isso. • Quando realizamos inferência de uma distribuição de dados, baseamos nossas conclusões na relação de desvio padrão e a média da curva da normal. Lembrem-se Se uma variável tem distribuição normal. Com isso assumimos que 95% da população ficaria situada entre a média e + ou - 1,96 desvios padrão. Se vSe váárias amostras aleatrias amostras aleatóórias forem obtidas de rias forem obtidas de uma populauma populaçção, elas vão diferir relativamente no ão, elas vão diferir relativamente no valor mvalor méédio, por tanto em teremos varias mdio, por tanto em teremos varias méédias dias amostrais, portanto, teremos uma distribuiamostrais, portanto, teremos uma distribuiçção ão das mdas méédias amostrais as quais tambdias amostrais as quais tambéém têm um m têm um desvio padrão. desvio padrão. O desvio padrão da distribuiO desvio padrão da distribuiçção das mão das méédias de dias de amostras, com o mesmo tamanho, obtidas da amostras, com o mesmo tamanho, obtidas da mesma populamesma populaçção pode ser estimado usando o ão pode ser estimado usando o conceito de erro padrão da mconceito de erro padrão da méédia. Mais dia. Mais concretamente, o erroconcretamente, o erro--padrão representa o padrão representa o desvdesvííoo--padrão de uma distribuipadrão de uma distribuiçção de amostras.ão de amostras. Assim um procedimento alternativo ou Assim um procedimento alternativo ou complementar da inferência estatcomplementar da inferência estatíística stica para estimar o grau de incerteza que ha para estimar o grau de incerteza que ha entre os estimadores dos parâmetros entre os estimadores dos parâmetros populacionais e o computo de seus populacionais e o computo de seus intervalos de confianintervalos de confiançça. a. Sua comparaSua comparaçção direta, inclusive, pode ão direta, inclusive, pode ser muito informativa para teste de ser muito informativa para teste de diferendiferençça de parâmetros.a de parâmetros. Erro padrão x Desvio padrão O desvio padrãoé a medida de variabilidade de um conjunto de observações sobre a média. O erro padrão da média é a medida de variabilidade acerca da média da amostra sobre a média da população verdadeira. Devido a que as estimações variam entre as amostras é importante saber até que ponto o valor encontrado na amostra é o da população. É por isso que se calcula o intervalo de confiança, ou seja, um conjunto de valores em torno do valor estimado e que tenham uma probabilidade especificada de conter o valor verdadeiro da população. INTERVALO DE CONFIANÇA O intervalo de confianO intervalo de confiançça desse modo construa desse modo construíído indica a posido indica a posiçção em ão em que o verdadeiro parâmetro populacional estudado esta contido, cque o verdadeiro parâmetro populacional estudado esta contido, com om uma probabilidade conhecida, no caso das formulas 95%uma probabilidade conhecida, no caso das formulas 95% NNííveis de hemoglobina (g/dl) em veis de hemoglobina (g/dl) em criancrianççasas Prevalência de diabetes em São Paulo = 0,0882 ou 8.82%, n=204Prevalência de diabetes em São Paulo = 0,0882 ou 8.82%, n=204 Prevalência de diabetes em BrasPrevalência de diabetes em Brasíília lia = 0,0558 ou 5.58%, n=556= 0,0558 ou 5.58%, n=556 O IC95% de confianO IC95% de confiançça para a prevalência de diabetes em São Paulo sera para a prevalência de diabetes em São Paulo seráá:: O IC95% de confianO IC95% de confiançça para a prevalência de diabetes em Brasa para a prevalência de diabetes em Brasíília serlia seráá:: LLii = 4,93%; L= 4,93%; Lss = 12,72%= 12,72% LLii = 3,67%; L= 3,67%; Lss = 7,48%= 7,48% Pr ev al ên ci a de d ia be te s Diabetes em BrasíliaDiabetes em São Paulo Testes de HipTestes de Hipóótesesteses Teste t-sudent HipHipóótese Estattese Estatíística:stica: HipHipóótese, em estattese, em estatíística, stica, éé uma suposiuma suposiçção formulada a respeito dos ão formulada a respeito dos parâmetros de uma distribuiparâmetros de uma distribuiçção de probabilidade de uma ou mais ão de probabilidade de uma ou mais populapopulaçções.ões. Esta hipEsta hipóótese sertese seráá testada com base em resultados amostrais, sendo testada com base em resultados amostrais, sendo aceita ou rejeitada. Ela somente seraceita ou rejeitada. Ela somente seráá rejeitada se o resultado da rejeitada se o resultado da amostra for claramente improvamostra for claramente improváável de ocorrer quando a hipvel de ocorrer quando a hipóótese for tese for verdadeira.verdadeira. Consideremos Ho a hipConsideremos Ho a hipóótese nula, e H1 a hiptese nula, e H1 a hipóótese alternativa a ser tese alternativa a ser testada (complementar de Ho). O teste pode levar a aceitatestada (complementar de Ho). O teste pode levar a aceitaçção ou ão ou rejeirejeiçção de Ho que corresponde, respectivamente ão de Ho que corresponde, respectivamente àà neganegaççãoão ou afirmaou afirmaçção de H1.ão de H1. Teste Teste t t -- studentstudent Teste usado para comparação de duas populações, dois grupos. Se a variável em análise tem distribuição normal ou aproximadamente normal, aplica-se o teste t para comparar duas médias. Fórmula para comparação de médias e passos Teste Teste t t -- studentstudent Tabela - Perdas de peso, em quilogramas, segundo a dieta Dieta 1 2 12 15 8 19 15 15 13 12 10 13 12 16 14 15 11 12 13 Fonte: Livro de BioestatFonte: Livro de Bioestatíísticastica MMéédia 1 = 12 Vardia 1 = 12 Varííância 1 = 4ância 1 = 4 MMéédia 2 = 15 Variância 2 = 5dia 2 = 15 Variância 2 = 5 Variância ponderada = 4,4Variância ponderada = 4,4 tt = 2,918= 2,918 Com ( n1+n2) Com ( n1+n2) --2 = (10+7)2 = (10+7)--2=152=15 tt tabela = 2,13 com tabela = 2,13 com Conclusão: A perda de peso Conclusão: A perda de peso éé maior em pacientes que maior em pacientes que usam a dieta 2 usam a dieta 2 significativamentesignificativamente Graus de liberdade 10% 5% 1% 1 6,31 12,71 63,66 2 2,92 4,30 9,92 3 2,35 3,18 5,84 4 2,13 2,78 4,60 5 2,02 2,57 4,03 6 1,94 2,45 3,71 7 1,90 2,36 3,50 8 1,86 2,31 3,36 9 1,83 2,26 3,25 10 1,81 2,23 3,17 11 1,80 2,20 3,11 12 1,78 2,18 3,06 13 1,77 2,16 3,01 14 1,76 2,14 2,98 15 1,75 2,13 2,95 16 1,75 2,12 2,92 17 1,74 2,11 2,90 18 1,73 2,10 2,88 19 1,73 2,09 2,86 20 1,73 2,09 2,84 21 1,72 2,08 2,83 22 1,72 2,07 2,82 23 1,71 2,07 2,81 24 171 2,06 2,80 25 1,71 2,06 2,79 26 1,71 2,06 2,78 27 1,70 2,05 2,77 28 1,70 2,05 2,76 29 1,70 2,04 2,76 30 1,70 2,04 2,75 40 1,68 2,02 2,70 60 1,67 2,00 2,66 120 1,66 1,98 2,62 1,64 1,96 2,58 Teste Teste t t -- studentstudent Tabela - Pesos em quilogramas de 9 pessoas antes e depois da dieta para emagrecimento Cirurgia Antes Depois 77 80 62 58 61 61 80 76 90 79 72 69 86 90 59 51 88 81 Fonte: Livro de BioestatFonte: Livro de Bioestatíísticastica MMéédia das diferendia das diferençças = as = --3,3333,333 Variância das diferenVariância das diferençças = 25as = 25 tt = = --2,02,0 Com nCom n--1 gl, 91 gl, 9--1=8 gl1=8 gl tt tabela = 2,31 com tabela = 2,31 com Que faremos quando se trata de Que faremos quando se trata de comparar duas proporcomparar duas proporçções?ões? A diferenA diferençça entre duas propora entre duas proporçções tem distribuiões tem distribuiçção T quando amostras ão T quando amostras grandesgrandes.. TESTE QUITESTE QUI--QUADRADOQUADRADO No caso de duas variNo caso de duas variááveis categveis categóóricas.ricas. HipHipóótese nula: as distribuitese nula: as distribuiçções das variões das variááveis são veis são independentes umas das outras (ou seja, a independentes umas das outras (ou seja, a frequência com que a varifrequência com que a variáável A pertence a uma vel A pertence a uma determinada categoria determinada categoria éé igual para todas as igual para todas as categorias da varicategorias da variáável B).vel B). FormulaFormulaçção de Hipão de Hipóótesesteses Ho: Não existe associaHo: Não existe associaçção entre propoanolol e sobrevidaão entre propoanolol e sobrevida Ha: o uso de propanolol se associa ao tempo de sobrevidaHa: o uso de propanolol se associa ao tempo de sobrevida Situação Se uma moeda não viciada for jogada 100 vezes, espera-se obter 50 caras e 50 coroas, já que a probabilidade de cair cara (p) é = ½ e a de cair coroa (q) também é = ½. Na prática, é muito difícil obter valores observados, idênticos aos esperados, sendo comum encontrar valores que se desviam dos teóricos. Supondo que uma moeda foi jogada 100 vezes e se obteve 60 caras e 40 coroas. a. Qual será o valor de x2 ? b. Como se pode interpretar esse valor? Resolvendo: As frequências esperadas em cada classe são calculadas por: p.N. Portanto: E(cara) = ½ .100 e E(coroa) = ½ .100 Assim, os valores esperados são: cara: 50 e coroa: 50 e os observados são: cara: 60 e coroa: 40. = [(60 – 50)2 / 50] + [(40 – 50)2 / 50] a. Valor de x2 = 2 + 2 = 4 Supondo que em vez de lançarmos 100 moedas uma única vez, tivéssemos feito inúmeros lançamentos de 100 moedas. Se calcularmos o a cada 100 lançamentos, e, depois, colocarmos todos os resultados em um gráfico, teria sido obtida a figura ao lado. Nota-se que os valores pequenos de ocorrem mais frequentemente que os grandes, pois se um experimento puder ser representado pelo modelo teórico proposto, pequenos desvios casuais entre proporções esperadas e observadas ocorrerão em maior número do que grandes desvios. Tomando a área total sob a curva como 100%, sabe-se que o valor 3,841 delimita 5% dela. Este é o valor crítico de qui quadrado conhecido como . Portanto, espera-se em experimentossemelhantes, que valores de menores que 3,841 tenham 95% de probabilidade de ocorrência. Sempre que o valor de for menor que 3,841 aceita- se a hipótese de igualdade estatística entre os números de observados e de esperados (H0). Ou seja, admite-se que os desvios não são significativos SOBREVIDA > 1 MÊSSOBREVIDA > 1 MÊS 24246767TotalTotal 4646171729 (63)29 (63)PlaceboPlacebo 45457738 (84)38 (84)PropranololPropranolol TotalTotalÓÓbitobitoSobreviveSobreviveTT RR AA TT AA MM EE NN TT OO 24246767TotalTotal 12,1312,1333,8733,87 4646171729 (63)29 (63)PlaceboPlacebo 11,4711,4733,1333,13 45457738 (84)38 (84)PropranololPropranolol TotalTotalÓÓbitobitoSobreviveSobreviveTT RR AA TT AA MM EE NN TT OO SOBREVIDA > 1 MÊSSOBREVIDA > 1 MÊS CCÁÁLCULO LCULO 22 025,038,52 p 96,170,0272,0 13,12 13,1217 87,33 87,3329 87,11 87,117 13,33 13,3338 2 2222 2 E EO 22 Formula alternativa simplificada do Formula alternativa simplificada do quiqui--quadrado quadrado
Compartilhar