Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística Material Teórico Responsável pelo Conteúdo: Prof.ª Esp. Priscila Bernardo Martins Revisão Textual: Prof. Me. Sidney Silva Santos Bioestatística Aplicada • Utilização da Informática na Bioestatística; • Avaliação Crítica de Artigos Científicos; • Testes Estatísticos; • Diagrama de Dispersão e Teste de Correlação; • Retomando o Assunto “Variáveis”; • A Tabela de Contingência. • Apresentar a identifi cação de testes realizados, a sugestão de testes, a análise crítica de tabelas e gráfi cos de artigos científi cos, bem como o uso de softwares. OBJETIVO DE APRENDIZADO Bioestatística Aplicada Orientações de estudo Para que o conteúdo desta Disciplina seja bem aproveitado e haja maior aplicabilidade na sua formação acadêmica e atuação profissional, siga algumas recomendações básicas: Assim: Organize seus estudos de maneira que passem a fazer parte da sua rotina. Por exemplo, você poderá determinar um dia e horário fixos como seu “momento do estudo”; Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma alimentação saudável pode proporcionar melhor aproveitamento do estudo; No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam- bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua interpretação e auxiliarão no pleno entendimento dos temas abordados; Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus- são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de aprendizagem. Organize seus estudos de maneira que passem a fazer parte Mantenha o foco! Evite se distrair com as redes sociais. Mantenha o foco! Evite se distrair com as redes sociais. Determine um horário fixo para estudar. Aproveite as indicações de Material Complementar. Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma Não se esqueça de se alimentar e de se manter hidratado. Aproveite as Conserve seu material e local de estudos sempre organizados. Procure manter contato com seus colegas e tutores para trocar ideias! Isso amplia a aprendizagem. Seja original! Nunca plagie trabalhos. UNIDADE Bioestatística Aplicada Utilização da Informática na Bioestatística Até este momento, em alguma ocasião, você deve ter ponderado: “Mas eu não gos- to de matemática! Escolhi esse curso para fugir das equações! E até aqui só vi fórmulas e cálculos!”. Na verdade, a matemática e o raciocínio lógico estão presentes em quase tudo o que fazemos na área acadêmica. A tomada de decisão em adotar o tratamento X ou Y dependerá dos resultados obtidos em estudos anteriores, estudos esses que foram embasados em análises estatísticas. Mas, para facilitar a vida de todos, saibam que a informática muito pode contri- buir. Veja o exemplo abaixo, suponha que tenhamos que calcular a média do peso da mochila dos alunos do 3º ano do ensino fundamental. Atualmente, como já foi dito no módulo anterior, temos à disposição vários softwares que ajudam nos cálculos estatísticos. O Excel é um programa presente em boa parte dos computadores e possui essa ferramenta. Vamos fazer o cálculo da média usando esse programa. Tabela 1 Alunos Peso das mochilas (kg) 1 1,2 2 2 3 2,5 4 0,9 5 0,9 6 1,3 7 1,5 8 1,4 9 2 10 2,1 11 1,7 12 1,4 13 1,6 14 1,8 15 2 16 2,3 17 1,9 18 1,5 19 1,1 Figura 1 Fonte: Getty Images 8 9 Essa é uma das formas para calcularmos a média. Veja a primeira etapa: podemos inserir a função e optar pela categoria estatística; lá temos o comando MÉDIA. A seguir, selecionamos a coluna referente aos pesos das mochilas. No quadro, já aparecerá o valor da média. Figura 2 Figura 3 Teremos, então, a obtenção do valor médio das mochilas de 1,63kg. 9 UNIDADE Bioestatística Aplicada Assim como no exemplo anterior, percebemos o quanto a informática facilita a nossa vida. Todos os cálculos básicos de bioestatística podem ser feitos por softwares como o Excel. Avaliação Crítica de Artigos Científicos Um dos objetivos principais da bioestatística é o de contribuir para o melhor entendimento dos dados estatísticos relatados em publicações científicas. A asser- tividade sobre aquilo que é demonstrado na tabela ou na figura dependerá do contexto em que os mesmos são apresentados e da análise crítica dos resultados numéricos. A análise estatística descritiva é muito utilizada e, quando envolve tamanhos amostrais grandes ou uma determinada população, essa análise é capaz de permitir extrapolações dos resultados encontrados. Por outro lado, quando essas condições não ocorrem, a análise estatística analítica contribui para garantir essa extrapola- ção. Além dessa importância, a análise analítica – que usa os testes de compa- ração de médias, que considera o nível de significância, que calcula o valor de p, etc. – viabiliza as tomadas de decisão para considerar um fator de risco que acomete um determinado grupo, para evidenciar o efeito de um tratamento, para visualizar o resultado futuro de uma campanha de prevenção, etc. Vejamos o exemplo a seguir. Na tabela, pode-se observar a relação da variável principal, que é o peso, cujas categorias são sobrepeso e eutrofia (= peso normal) de crianças. Perceba que a tabela apresenta a relação dessa variável com as demais – idade, atividade física e televisão –, cada qual com suas respectivas categorias. O que podemos observar? Tabela 2 – Idade, nível de atividade física e de lazer e tempo em frente à televisão segundo estado nutricional, em crianças da Favela do Fragoso, em Olinda, PE Variáveis Sobrepeso Eutrofia Valor de p n % n % Idade (anos) 0,99 5 6 13 4 10 6 11 23,9 9 22,5 7 10 21,7 9 22,5 8 8 17,3 7 17 9 11 23,9 11 27 Atividade física 0,04 Pouco ativo 34 73,9 21 52,5 Ativo 12 26,1 19 47,5 10 11 Variáveis Sobrepeso Eutrofi a Valor de p n % n % Televisão (h/dia) 0,86 0 a 2 13 28,4 12 30 3 ou mais 33 71,6 28 70 Algumas respostas: 1. Que se trata de uma tabela que mostra a relação da variável principal, que está na coluna, com as demais, que estão nas linhas; 2. Os dados são apresentados na forma de frequência absoluta (n) e relativa (%); 3. Que foram realizados três testes estatísticos e, para cada teste, calculou-se um valor de p; 4. Que os testes utilizados foram o qui-quadrado e o de Fisher, pois são todas variáveis qualitativas; 5. Considerando a primeira análise, percebemos que não houve diferença signifi cativa entre as idades das crianças com sobrepeso e as eutrófi cas, pois o valor de p é maior do que o nível de signifi cância (a = 0,05), o que atesta que não há diferença entre as proporções, isto é, entre as frequên- cias das idades dessas crianças. O que nos leva a concluir que, em termos de idade, as crianças com sobrepeso e eutrófi cas possuem as mesmas distribuições de idade. Tabela 3 Variáveis Sobrepeso Eutrofi a Valor de p n % n % Idade (anos) 0,99 5 6 13 4 10 6 11 23,9 9 22,5 7 10 21,7 9 22,5 8 8 17,3 7 17 9 11 23,9 11 27 6. Na segunda análise, podemos perceber que, quanto à prática de atividade física, as crianças com peso adequado (eutrófi cas) são mais ativas do que as crianças com sobrepeso, que são pouco ativas. Essa afi rmação é possível devido ao valor de p ser menor do que o de a (p < a). No entanto, essa certeza só é válida para a amostra estudada, podendo ser extrapolada para a população da qual se extraiu a mesma. 11 UNIDADE Bioestatística Aplicada Tabela 4 Variáveis Sobrepeso Eutrofia Valor de p n % n % Atividade física 0,04 Pouco ativo 34 73,9 21 52,5 Ativo 12 26,1 19 47,5 7. Na terceira análise da tabela, outro teste estatístico é feito e novamente não observamos diferenças entre os grupos de criançasquanto ao hábito de ver TV, pois o valor de p foi maior do que o nível de significância (p > a). Tabela 5 Variáveis Sobrepeso Eutrofia Valor de p n % n % Televisão (h/dia) 0,86 0 a 2 13 28,4 12 30 3 ou mais 33 71,6 28 70 Esse achado nos permite admitir, exclusivamente para essa amostra, que o há- bito de ver TV não teve relação com a condição de a criança ser (ou estar) com sobrepeso ou peso normal (ambos os grupos assistem a mais de 3 horas de TV por dia!), ainda que saibamos por outros estudos que há uma forte relação de causa e efeito entre as horas gastas para assistir TV e o ganho de peso, seja de adultos ou de crianças. Essa assertiva dada pela tabela vale, exagerando na extrapolação, para a população da qual a amostra foi extraída, considerando que os critérios de seleção (lembra-se das formas de amostragem?) tenham sido adequadas. É essa uma das grandes importâncias da estatística: buscar ser conclusiva para a amostra, diminuindo as chances de que os resultados encontrados tenham sido ocorrências do acaso, da sorte. Dessa forma, fica claro que a compreensão de cada um dos testes é fundamental para melhor compreensão dos dados apresentados em tabelas ou figuras. Tanto para testes que utilizam dados quantitativos, como qualitativos, ou ambos, a regra é sempre a mesma. Se: p > () ( não haverá diferença significante entre as médias ou proporções (frequências) p ≤ () ( haverá diferença significante entre as médias ou proporções (frequências) 12 13 Testes Estatísticos Durante a disciplina, aprendemos que existem testes para serem aplicados em amostras e/ou populações. Esses testes também permitem identificar a relação en- tre duas ou mais variáveis (veja o modelo esquemático abaixo). Caso quiséssemos analisar a relação entre duas variáveis, poderíamos escolher, por exemplo, um dos seguintes testes: Tabela 6 – Exemplo de modelo esquemático para realização de testes estatísticos Tipo da variável Tipo da variável Tipo de resposta obtida Teste estatístico possível de ser realizado Qualitativa · nominal · ordinal Quantitativa · contínua · discreta Quantitativa · Teste T de Student · Anova (Análise de Variância) Qualitativa · nominal · ordinal Qualitativa · nominal · ordinal Qualitativa · Teste de Fisher; · Teste qui-quadrado Quantitativa · contínua · discreta Quantitativa · contínua · discreta Quantitativa · Teste de correlação; · Teste de regressão. A análise estatística descritiva também é importante e, como já disse anterior- mente, se foi estudada a população, os dados serão mais conclusivos se compa- rados aos resultados extraídos de uma amostra. Sua importância poderá ser, no mínimo, a de “descrever” dados, sejam eles relacionados à variável primária ou não. Vejamos o exemplo abaixo: Tabela 7 – Ingestão calórica e estado nutricional das crianças moradoras da Favela do Fragoso, em Olinda, PE Estado nutricional Calorias/dia Média DP Mínimo P50 Máximo RDA ADE (%) Sobrepeso 2250 384 1696 2158 2997 1900 115,7 Eutrofia 1776 259 1110 1818 2313 1900 91,1 Nesse exemplo, temos a descrição das calorias ingeridas pelas crianças com sobrepeso e eutróficas de um determinado local, no caso, uma favela em Olinda. As medidas de resumo e de dispersão foram utilizadas para apresentar esses dados. As conclusões não serão tão conclusivas como aquelas que obtemos com a análise analítica, mas, muitas vezes, o que se quer é a descrição detalhada dos dados, apenas. A Adequação da Amostra Um ponto que merece a nossa atenção durante uma análise crítica é o tama- nho da amostra e a forma de amostragem. Esses aspectos determinarão quanto podemos confiar nas informações obtidas, bem como no poder de extrapolação dos resultados. 13 UNIDADE Bioestatística Aplicada Figura 4 Fonte: Getty Images Vejamos no exemplo abaixo como uma escolha inapropriada dos elementos amos- trais poderia trazer conclusões incorretas a respeito da população da qual foi extraída: Em 1988, Shere Hite levantou, por meio de questionários inseridos em revistas femininas americanas, dados sobre a sexualidade feminina. Esti- ma-se que cerca de 100.000 mulheres foram colocadas em contato com o questionário, mas só 4500 responderam. Mesmo assim, a amostra é grande. Você acha que essa amostra pode dar boa ideia do comporta- mento sexual das mulheres americanas daquela época? (SILVA, 2000) O que você acha dessa condição? Qual a situação perigosa que ocorre nessa situação? Figura 5 Fonte: Getty Images 14 15 Resposta: O comportamento dos voluntários é diferente do comportamento dos não-voluntários. Então – embora seja difícil ou até impossível estudar o comportamento de pessoas que respondem a um questionário –, não se pode concluir que a amostra de respondentes representa toda a popu- lação (incluindo aqueles que não respondem). Conclusões baseadas em amostras de pessoas que, voluntariamente, destacam o encarte da revis- ta, respondem ao questionário e o remetem pelo correio são tendencio- sas. Não se pode fugir à conclusão de que o questionário foi respondido apenas por leitoras da revista e, entre elas, mulheres dispostas a falar sobre sua vida pessoal. (VIEIRA, 2008) Diagrama de Dispersão e Teste de Correlação Para elucidar outra aplicação da bioestatística, consideraremos o seguinte qua- dro de informações: Tabela 8 Sujeitos Idade Quantidade de relações sexuais/mês A 15 8 B 20 8 C 26 8 D 29 8 E 33 10 F 45 5 G 47 8 H 90 2 I 86 1 J 77 3 K 48 5 L 60 3 M 65 3 N 66 4 O 69 2 P 75 2 Q 17 3 R 18 5 S 20 4 T 18 3 U 26 8 15 UNIDADE Bioestatística Aplicada Sujeitos Idade Quantidade de relações sexuais/mês V 90 2 W 92 4 X 97 0 Y 75 2 Z 26 8 AA 28 6 Analisando o quadro, podemos notar que sujeitos mais novos parecem realizar mais relações sexuais por mês quando comparados aos mais velhos. Será que existe alguma relação entre idade e quantidade de relações sexuais, considerando a amostra acima? Usando o software Excel, pode-se selecionar o assistente gráfico e optar pelo gráfico de dispersão para entender um pouco mais. Vejamos o gráfico. Figura 6 No gráfico acima, podemos verificar que parece mesmo existir uma relação, que passaremos a chamar de correlação, entre as duas variáveis quantitativas (quanti- dade de relações sexuais/mês e idade). O teste de correlação de Pearson permite determinar o grau de correlação exis- tente entre duas variáveis quantitativas. Seu valor pode variar de 0,0 a 1,0, sendo que, quanto maior o valor, melhor a correlação. O valor de correlação, comumente representado pela letra “r”, vem acompanhado de um sinal positivo (+) ou negativo (-) que indica se a correlação é diretamente proporcional (+) ou inversamente pro- porcional (-). 16 17 Na situação acima, encontraremos um valor de r = 0,71 e o sinal de negativo (r = – 0,71), pois a correlação é inversamente proporcional, já que, no caso, quanto maior a idade dos sujeitos, menor é a quantidade de relações sexuais/mês. Logo, poderíamos representar o gráfico da seguinte forma: Figura 7 Alguns estatísticos classificam os resultados possíveis quanto ao teste de correla- ção da seguinte forma: Figura 8 Fonte: Getty Images 17 UNIDADE Bioestatística Aplicada Correlação fraca: se o r estiver entre 0,0 e 0,39; Correlação moderada: se o r estiver entre 0,4 e 0,69; Correlação forte: se o r estiver entre 0,7 e 1,0. Obs.: Esses valores estarão sempre acompanhados do sinal de (+) ou (–). Retomando o Assunto “Variáveis” Vimos, nas unidades passadas, o que são variáveis e como essas podem ser classificadas (como qualitativas e quantitativas, por exemplo). No entanto, quando tratamos de análise estatística, ainda podemos classificar as variáveis, indepen- dentemente da natureza da variável, como: Preditoras, Respostas ou de Controle. Vamos defini-las: Variável PREDITORA, EXPLICATIVA OU INDEPENDENTE: permite predizer uma resposta. Exemplo: Fumo e risco de doença coronariana. A variável resposta é FUMO. Variável RESPOSTA OU DEPENDENTE: apontao evento que se pretende estudar. Exemplo: PREVALÊNCIA DE OBESIDADE. Variável de CONTROLE ou de CONFUSÃO: usada para avaliar a repercussão ou influ- ência negativa de um evento/situação sobre os resultados. Exemplo: A influência da escolaridade na estimativa de renda de um adulto. Um outro estudo que esclarece bem o que é uma variável confudidora (ou de confusão): Há alguns anos, um pesquisador concluiu que o consumo de café au- mentava o risco de câncer de pâncreas (a análise estatística mostrava uma associação significante entre as duas variáveis). Quando o trabalho foi re-analisado, concluiu-se que na verdade o fator de risco era o fumo. O que ocorreu foi que os fumantes tomavam mais café. Assim, o café era uma variável de confusão, ou seja, estava associada tanto ao fator de risco verdadeiro (fumantes tomam mais café) como à doença (o consumo de café entre os portadores de câncer de pâncreas era maior do que não população geral). No entanto, não havia relação causa-efeito entre consu- mo de café e câncer de pâncreas. Fonte: Unifesp Virtual. Curso de Introdução à Bioestatística. Aula 1 – Introdução à Bioestatística DEPENDENDO DA PERGUNTA DO ESTUDO, UMA MESMA VARIÁVEL PODE SER PREDITORA, RESPOSTA OU CONTROLE 18 19 A Tabela de Contingência Analise a tabela a seguir: Tabela 9 – Idade, nível de atividade física e de lazer e tempo em frente à televisão segundo nutricional, em crianças da Favela do Fragoso, em Olinda, PE Variáveis Sobrepeso Eutrofi a Valor de p n % n % Idade (anos) 0,99 5 6 13 4 10 6 11 23,9 9 22,5 7 10 21,7 9 22,5 8 8 17,3 7 17 9 11 23,9 11 27 Atividade física 0,04 Pouco ativo 34 73,9 21 52,5 Ativo 12 26,1 19 47,5 Televisão (h/dia) 0,86 0 a 2 13 28,4 12 30 3 ou mais 33 71,6 28 70 É bem provável que você tenha percebido que tabelas com essa estrutura já apa- receram antes, em módulos anteriores, ou até mesmo nessa unidade. Esse tipo de tabela é o que chamamos de Tabela de contingência. Esse tipo de tabela, muitas vezes, não necessita obrigatoriamente de estar acompanhada do resultado de um teste estatístico analítico, como o teste qui-quadrado. A simples apresentação des- sa tabela, mostrando a relação de duas ou mais variáveis, será bem explicativa se comparada à apresentação em separado que essas mesmas variáveis poderiam ter. Vejamos o exemplo acima: 8. Na tabela, percebemos que a variável estado nutricional, cujas categorias são sobrepeso e eutrofi a, é a variável dependente da tabela e, possivel- mente, do estudo; 9. As outras variáveis – idade, atividade física e televisão – são as outras variáveis independentes; 10. Na análise das tabelas de contingência, comumente tiramos conclusões a partir da variável dependente. Nesse caso, poderíamos ter uma conclusão da seguinte forma: considerando o estado nutricional das crianças inves- tigadas no estudo, a maior parte de crianças com eutrofi a (peso normal) foram as crianças com 9 anos de idade; 19 UNIDADE Bioestatística Aplicada Vale destacar que as tabelas de contingência não têm por finalidade determinar causa e consequência, isto é, essas tabelas mostram a relação. Mas pode acontecer de a natureza e o aspecto observados em determinada variável darem a noção de causa e consequência. Estamos finalizando mais uma unidade e esperamos que você tenha compreendido um pouco mais sobre a importância e a aplicabilidade dos conceitos aqui trabalhados. 20 21 Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Leitura A Escolha do Teste Estatístico – um tutorial em forma de apresentação em PowerPoint https://goo.gl/3MZAiS A Escolha do Método Estatístico https://goo.gl/w5h5cd Revisão Sobre Diagramas de Dispersão e Correlação https://goo.gl/Beoc6x Análise de Correlação e Medidas de Associação https://goo.gl/iRQrn7 21 UNIDADE Bioestatística Aplicada Referências ARANGO, H. G. Bioestatística: Teórica e Computacional. 2. ed. Rio de Janeiro: Guanabara Koogan, 2005. IOCHIDA, L. C.; Castro A. A. Projeto de pesquisa (Parte VIII- método estatístico / análise estatística). In: Castro A. A. Planejamento de Pesquisa. São Paulo: 2001. SILVER, M. Estatística para Administração. São Paulo: Atlas, 2000. TRIOLA, M. Introdução à Bioestatística. 9. ed. Rio de Janeiro: LTC, 2005. VIEIRA, S. Introdução à Bioestatística. Rio de Janeiro: Elsevier, 2008. 22
Compartilhar