Baixe o app para aproveitar ainda mais
Prévia do material em texto
Responsável pelo Conteúdo: Prof. Dr. Flavio Cesar Viani Revisão Textual: Prof. Dr. Manoel Francisco Guaranha Bioestatística Vamos iniciar a unidade I da disciplina de Bioestatística chamada “Introdução à Bioestatística”. A pesquisa científica inicia-se com idéias geradas pelos pesquisadores, estas idéias necessitam de um método operacional para mediar os conceitos teóricos a serem pesquisados. Estes atributos a serem medidos chamam-se variáveis e são a base do método estatístico. A coleta das variáveis pode ocorrer em populações inteiras ou em parcelas chamadas de amostra. Assim, nesta unidade estudaremos o método e a ciência, as variáveis e os métodos de amostragem. O conteúdo desta unidade está em “Material Didático”, não se esqueçam de realizar as atividades propostas e que a entrega dos exercícios é obrigatória. Estudem o texto proposto e complemente seus estudos com a bibliografia sugerida. Atenção Para um bom aproveitamento do curso, leia o material teórico atentamente antes de realizar as atividades. É importante também respeitar os prazos estabelecidos no cronograma. Em nossa primeira unidade da disciplina Bioestatística, conceituaremos bioestatística e estatística a partir das necessidades da pesquisa científica. Posteriormente, estudaremos os tipos de variáveis e a necessidade de coletar amostras que reflitam o comportamento de uma população em análise. Nesse momento é importante que você reflita sobre a seguinte questão: - Um pesquisador, após muito pensar na sua área de conhecimento, formula a seguinte questão: “Aumentando a dose de um medicamento seria possível conseguir o efeito em menos tempo?”. Para confirmar esta hipótese o que fazer? Qual o método adequado para tentar provar ou recusar esta hipótese? Devo medir alguma coisa? Como medir este efeito? Uma vez feita esta medida, comparo com o que? Devo fazer este teste em quantos pacientes? Ou faço em toda uma população? Contextualização O Método e a Ciência Pensamento Científico O pensamento científico ocorre a partir de uma linguagem teórica sobre conceitos e hipóteses científicas, porém a comprovação necessita de uma linguagem e método operacional que é a morada das hipóteses estatísticas. Exemplo: Quanto maior o grau de educação de uma pessoa, menor será o preconceito em aceitar uma campanha sanitária. Temos aqui então dois conceitos teóricos: Preconceito: Atitude negativa baseada em um pré - julgamento. Educação: Conjunto de conhecimentos acumulados que permite a uma pessoa um julgamento global do mundo. Como podemos instituir um método operacional para medir estes conceitos teóricos? Preconceito: Atribuir escores, valores ou notas a partir de um questionário sobre o assunto. Educação: Quantidade de anos de estudo escolar. Hipótese estatística: “Quanto maior os anos de escolaridade, menor a sua nota (escore) em uma escala de preconceito”. O que significa dizer que é negativa a correlação em anos de escolaridade e nota em uma escala de preconceito. Caso está afirmação seja a respeito de um grupo de pessoas, por exemplo: JOÃO, MARIA, KÁTIA, JOSÉ E PEDRO, basta somente verificar a veracidade entre eles e pronto. Porém as hipóteses estatísticas são gerais e se relacionam a populações. Após formular uma hipótese, o passo seguinte é testá-la antes de formular uma nova teoria sobre este assunto (Figura-1), portanto, para atingir este objetivo, uma série de passos deve ser seguidos. Estes visam reunir informações seguras para que seja feita uma tomada de decisão e posterior formulação da teoria. São passos a serem seguidos para formular uma nova teoria científica: Material Teórico Formular uma Hipótese Científica, o que chamamos de Inferência dedutiva. É a idéia que surgiu após a pergunta do pesquisador a partir de seu conhecimento prévio e observacional, sem a utilização de métodos comprovatórios. Organizar um plano para coleta dos dados e análise: Onde e como vou conseguir as informações. Estabelecer uma regra de decisão: Após obtenção e análise dos resultados, qual parâmetro vou utilizar para considerar minha hipótese inicial será confirmada ou negada; Coletar os dados: É a busca propriamente dita das informações, por mensurações dos conceitos teóricos pré-estabelecidos. Proceder a análise da hipótese estatística: Estabelecimento de hipótese estatística a partir de um método operacional; Tomar decisões com relação à hipótese: Após a análise dos dados e seguindo a regra de decisão estabelecida anteriormente; A partir da verificação da verdade ou falsidade da hipótese inicial através da análise estatística, induz-se (inferência indutiva) a uma verdade científica correspondente. O método científico http://pro.corbis.com/Enlargement/Enlargement.aspx?id=4 2-21127423&caller=search Hipótese científica PLANEJAMENTO •Hipótese científica •Definição das variáveis •Plano de coleta •Tipo de análise dos dados •Definição das regras de decisão COLETA DOS DADOS ANÁLISE ESTATÍSTICA DOS DADOS ACEITAÇÃO OU REJEIÇÃO DA HIPÓTESE ESTATÍSTICA INFERÊNCIA INDUTIVA Formulação de teoria a respeito da verdade científica Mundo do pesquisador Mundo da estatística Figura -1 O Método Científico: Da hipótese até a formulação de uma nova teoria. Portanto a estatística tem como seu papel na pesquisa científica contribuir junto ao pesquisador: Na formulação de hipóteses estatísticas Fixação de regras de decisão Técnicas para um delineamento da pesquisa Coleta Tabulação e análise dos dados (estatística descritiva) Testes de hipóteses para expressar as incertezas da inferência indutiva em um nível probabilístico. Estatística e Bioestatística A palavra estatística deriva do latim status, significando Estado Político ou a situação de alguma coisa. J.F. Von Bielfel publicou “The elements of universal erudition”em 1770 e um Capítulo chamado Statistics que foi definido como: “A Ciência que nos ensina qual a situação política de todos os estados modernos do nosso mundo”. Após uma série de publicações, a Estatística adquiriu um significado menos amplo: “A exposição das características de um estado através de métodos numéricos”. Em 1834 ocorreu fundação da Royal Statistica Society. Após várias mudanças do significado de Estatística, passou a estudar séries de dados numéricos que operavam e passou-se a falar em: Estatísticas médicas Estatísticas vitais Estatísticas marítimas ... Bérquó, 1981 define em seu livro assim: “Estatística é um ramo do conhecimento científico que consta de um conjunto de processos que têm por objeto a observação, a classificação formal e a análise dos fenômenos coletivos ou de massa (descritivos) e, por fim, investigar a possibilidade de fazer inferências indutivas válidas a partir dos dados observados e buscar métodos capazes de permitir esta inferência (indutiva)” A estatística pode ser dividida em: Geral ou metodológica: Elabora métodos gerais e aplicáveis e estuda as propriedades matemáticas dos fenômenos de massa e a demonstração dos procedimentos e fórmulas Aplicada: ramo do conhecimento que proceda exclusivamente por intermédio de metodologia estatística. E Bioestatística é definida como:A ciência que trata com os planos e métodos de coleta, tabulação e análise de fatos numéricos nas ciências da vida. Conceito de Variáveis Quando estudamos as populações utilizando a óptica da estatística necessitamos então classificar os indivíduos de acordo com características mensuráveis. Estas características são chamadas de variáveis, a identificação e o estudo das variáveis vão permitir a descrição da população e o estabelecimento de comparações entre grupos que constitui então a base da bioestatística. O entendimento do nível de mensuração que se estabelece em uma população vai permitir a escolha de técnicas corretas de demonstração dos dados (tabelas e gráficos), de utilização de medidas comparativas e técnicas de inferência e tomada de decisão. Portanto, reside aqui a base da bioestatística da onde se segue todas as demais teorias. Os Níveis de mensuração Classificação da população de acordo com uma característica nominal Este tipo de classificação pressupõe separar a população em grupos que possuem ou não a característica em estudo, como por exemplos: Sexo, cor de olhos, peso, peso ao nascer, raça etc. As características se expressam nominalmente (ou seja, são dadas por um nome e não por um número), portanto em escala nominal e devem ser: Exaustivas: todos os indivíduos estudados possuem a característica. Mutuamente exclusivas. Cada indivíduo possui somente uma categoria. Classificação da população de acordo com uma característica que se ordena Nesta situação as características possuem um ordenamento natural. A característica é medida então em uma escala ordinal. Nesta mensuração não existe informação sobre a magnitude da característica, veja que embora exista ordem não existe grandeza (número). Se colocarmos a situação de um estudo sobre escolaridade de uma determinada população e decidimos classificar segundo o critério: FUNDAMENTAL, MÉDIO E SUPERIOR, fica claro a ordem natural destes nomes. Classificação por características mensuráveis e com zero arbitrário Nesta escala de mensuração, além da ordenação, pode-se dizer quanto vale exatamente a diferença entre elas. Ex.: A diferença entre 30° e 10° é de exatamente 20°, porém não se pode dizer 30° é três vezes mais quente que 10 °, pois o zero é um ponto arbitrariamente estabelecido e não fruto de uma mensuração objetiva. Neste caso a escala é dita intervalar, ou seja, os intervalos podem ser determinados. Classificação por características mensuráveis e com zero não arbitrário Aqui a característica é mensurável e, portanto, são permitidas as operações aritméticas, pois o zero não é arbitrário como em uma escala de temperatura. Um bom exemplo é quando trabalhamos com a altura de indivíduos. Pode-se dizer que um indivíduo de 2,00 metros é duas vezes maior que um indivíduo de 1,00 metro. Agora se trata de uma escala de razões. Neste tipo de classificação podemos utilizar uma infinidade de operações matemáticas e estabelecer medidas que permitam melhor entender o comportamento da característica. Deve-se perceber então que temos características que podem ser MEDIDAS, como por exemplo, utilizando de um instrumento como régua e geram NÚMEROS e características que são apenas CONTADAS e vai permitir uma quantidade limitada de operações para descrever seu comportamento. Estes atributos (características) que variam entre os indivíduos são chamados de Variáveis que podem ser classificadas em qualitativas: aquelas medidas em escala nominal ou ordinal e quantitativas. As variáveis quantitativas podem ser contínuas ou discretas. Contínuas: assumem qualquer valor. Ex.: peso, altura. Veja que entre a altura de 1,50 e a de 1,55 metros existem uma infinidade de valores possíveis dependendo da precisão do instrumento de medida utilizado. Discretas: assumem valores de um conjunto enumerável. Ex.: número de indivíduos nascidos de cada mãe. Perceba que podemos ter 1, 2, 3, 4, 5...10 filhos mas nunca números fracionados. Entre 1 e 2 filhos não existe nenhum valor possível. Os tipos de variáveis estão resumidos na figura-2. Figura 2: Classificação das variáveis População e Amostra A pesquisa científica, observacional ou experimental, busca dados sobre a tese a ser comprovada e estabelece comparações entre grupos com características distintas. A primeira pergunta do pesquisador no início da pesquisa é se os dados serão coletados de toda uma população ou de uma parcela representativa da população. Para tanto, é necessário definir População e Amostra (Figura 3). Variável Quantitativa Qualitativa Contínua Discreta Nominal Ordinal População: Conjunto de elementos que têm, em comum, determinada característica. Exemplo: Pessoas que vivem em uma determinada região: População da cidade de São Paulo; Animais de uma determinada espécie: Tamanduá mirim; Pessoas com um determinado tumor: Portadores de melanoma. Amostra: Todo subconjunto não vazio e com número menor de elementos da população. Qualquer parcela de indivíduos que pertencem a uma população é uma amostra. Exemplo: 50 pessoas da cidade de São Paulo é uma amostra desta população. Figura 3: População e Amostra Assim, as populações podem ser classificadas como finitas e infinitas: finita: É aquela população com um número total possível de se determinar, como por exemplo o conjunto de alunos de um curso. Infinita: É aquela onde o número de elementos que fazem parte desta população é impossível de se determinar, como por exemplo, o número de vezes que posso jogar os dados. Em alguns casos as populações finitas são tão grandes que podemos considerar infinitas, Exemplo: Pessoas com mais de 18 anos no Brasil. Para acessar os dados para comprovação da tese podemos escolher trabalhar com populações inteiras ou com o estudo de amostras, assim, quando a coleta é feita de toda uma população recebe o nome de Recenseamento e quando é feita de uma parcela da população recebe o nome de Amostragem. A a População Amostra Recenseamento: Coleta de dados de TODA a população, Censo é o conjunto de dados obtidos. Amostragem: Coleta de informações de PARTE da população. Muitas vezes, o estudo CUIDADOSO de uma amostra tem mais valor científico que o estudo sumário de uma população. Por vezes o pesquisador tem a impressão que um conjunto de dados muito grande, como de toda uma população, pode trazer mais informações que uma amostra, porém a dificuldade em analisar estes dados se torna tão grande que as conclusões obtidas são fracas e de pouco valor. Um número limitado de dados provenientes de uma boa amostra permite um estudo detalhado aonde se chega a conclusões mais consistentes. As técnicas de Amostragem A amostra foi definida como qualquer subconjunto de uma população, porém nem toda amostra (ou subconjunto) representa adequadamente uma população a ponto de servir a uma pesquisa. Para que uma amostra seja adequada para um estudo científico, ela deve apresentar características similares a da população para permitir que o resultado de seu estudo seja aplicado à população que a originou. Amostragem é o ato de obter uma amostra de uma população, é o procedimento que será adotado para ESCOLHER os elementos que irão compor a amostra. Amostras obtidas de forma incorreta, ou seja, que representam mal uma população, são chamadas de AMOSTRAS VICIADAS. Apesar do risco sempre presente de uma amostra representar mal uma população, se uso oferece muitas vantagens: Custo Menor: Toda pesquisa envolve custosfinanceiros, quanto menor o número de indivíduos analisados, menor o seu custo. Muitas vezes o custo financeiro é fator limitante para que uma pesquisa ocorra. Menor tempo: Outro fator limitante é o tempo. A utilização de estudos amostrais diminui em muito o tempo de realização de uma pesquisa. Objetivos mais amplos: Imagine que gostaríamos de conhecer profundamente os hábitos alimentares, culturais e financeiros da população brasileira. Para isto seria necessário buscar uma centena de informações. Caso fossemos acessar estas informações em toda a população, seria de se esperar que o número de perguntas fosse minimizado a ponto do trabalho não se tornar logo e exaustivo. Quando limitamos uma amostra, certamente poderíamos alongar os questionamentos e conseguir uma quantidade melhor de informações. Muitas vezes o trabalho com amostras é imperativo e não resta ao pesquisador outra opção, são situações onde isto ocorre: Populações tão grandes que se assemelham a infinitas. Exemplo: Estudo da presença de enzimas séricas na população mundial. Casos onde o processo de investigação da característica é destrutivo. Exemplo: O resultado a ser obtido necessita do sacrifício de animais ou da destruição do objeto de análise. Casos onde existem problemas éticos impeditivos de utilizar toda uma população. Exemplo: testes com drogas ou vacinas. Casos onde a população é hipotética, ou seja: desconhecida, e a amostra é real. Exemplo: Estudo com usuários de drogas de abuso. Feita a opção por estudar uma amostra, segue etapas que devem ser obedecidas: Etapas do levantamento por amostragem 1. Estabelecer os objetivos com clareza. Definir qual a unidade elementar ou de trabalho; 2. Definição da população a ser amostrada; 3. Escolha das variáveis a serem observadas em cada unidade de análise; 4. Especificação do grau de precisão desejado. O grau de incerteza pode ser reduzido tomando-se amostras maiores e empregando melhores técnicas de medição; 5. Escolha dos instrumentos de medida e da forma de abordagem; 6. Escolha da unidade amostral: A menor parte distinta e identificável da população para fins de enumeração e sorteio; 7. Execução de prova experimental, piloto ou pré-teste. Isto orienta os ajustes necessários; 8. Seleção da amostra, depois de decidido o seu tamanho. A próxima questão é: Sabendo que nem toda amostra é adequada e representativa de uma população, qual a metodologia a ser utilizada para que a minha amostra represente a população da melhor maneira possível? Existem algumas técnicas que podem ser utilizadas para diminuir a probabilidade da ocorrência de vício na amostra. As amostras podem ser então obtidas de maneira probabilística ou não probabilística. As amostras probabilísticas somente serão são preteridas na absoluta impossibilidade de utilização, são amostras obtidas sem a utilização de técnicas específicas que nos garantem que todos os elementos da população tiveram a mesma chance de fazer parte da amostra. Se, necessito avaliar o desempenho de um docente a partir de um questionário aplicado aos 1000 alunos que este docente atente, e para isto decido fazer uma amostragem da turma com 50 alunos. Se para a realização da pesquisa, se eu escolho os alunos que vão fazer parte desta pesquisa estou diante de uma amostra não probabilística, pois excluí a possibilidade de vários alunos participarem, porém, se estabeleço um sorteio utilizando o número de matrícula destes alunos, então todos terão a mesma oportunidade de participar e desta maneira faço então uma amostra probabilística. Probabilística: cada unidade amostral tem uma probabilidade conhecida diferente de zero. Não probabilística: não se conhece a probabilidade de cada unidade amostral pertencer à amostra. Algumas unidades terão probabilidade zero de pertencer à amostra. São tipos de amostragem probabilística: Casual simples; Casual simples estratificada; Sistemática. Amostra casual simples sem reposição É a amostra composta por elementos retirados ao acaso da população. Todo elemento tem igual probabilidade de ser escolhido, qualquer subconjunto de n elementos diferentes de uma população de N elementos tem a mesma probabilidade de ser sorteado. Exemplo: O Curso necessita de uma amostra casual simples de cinco de seus alunos para uma avaliação de conhecimentos gerais. O total de alunos é de 100, e todos possuem um número de matrícula de 1 a 100. A partir de bolinhas numeradas de 1 a 100 sorteiam-se ao acaso (ao acaso significa sem nenhum tipo de interferência intencional) uma das bolas com o número dos alunos, sem retornando a bola, por cinco vezes (Tabela 1): Tabela 1: Resultado do sorteio de 5 alunos para uma avaliação Sorteio Número do aluno sorteado 1 005 2 093 3 015 4 100 5 002 Amostra casual simples estratificada É a amostra composta por elementos de todos os diferentes estratos da população. Vamos chamar de estratos todo subconjunto de uma população que possua características comuns e que interfiram no resultado da variável estudada. Exemplo: Na pesquisa eleitoral, as populações de faixa sócio-econômica diferentes possuem opiniões diferentes a respeito dos candidatos. Temos as variáveis sexo, renda, idade, escolaridade e etc. que podem interferir no resultado da pesquisa cujo a pergunta é: Qual o seu candidato? Portanto, para que a amostra não seja viciada, devemos obter uma amostra de cada estrato da sociedade e reunir tudo em uma única amostra. Se uma população é composta de h estratos, defini-se: N= tamanho da população Nh =tamanho de cada estrato populacional n=tamanho total da amostra nh=tamanho da amostra do estrato h Amostragem sistemática Este tipo de amostragem se utiliza da ordenação natural dos elementos de uma dada população. Muitas populações são ordenadas naturalmente como, por exemplo, a população dos pacientes de uma clínica ou qualquer serviço de atendimento à saúde. Os indivíduos pertencentes a esta população, tão logo chegam ao serviço são cadastradas por ordem de entrada. Este cadastramento tem correlação direta com o tempo, sendo que os primeiros números são dos primeiros pacientes e os números mais altos referem-se aos pacientes mais recentes. Sempre que este ordenamento natural for observado, a criação de um sistema para formar a amostragem é conveniente. Exemplo: Ao se desejar estudar uma amostra de 100 elementos da população de 10.000 pacientes cadastrados em uma clínica, retira-se uma ficha a cada mil iniciando-se da primeira. Define-se então: - N: tamanho da população - n: Tamanho da amostras - K: Intervalo de amostragem = N/n , - i: início casual, sorteado entre 1 e k, inclusive - Amostra sorteada é composta pelos elementos: i, i+k, i+2k, ...., i+(n-1)k. Obs: É necessário ter cuidado com a periodicidade dos dados, por exemplo, se for feito sorteio de dia no mês, pode cair sempre em um domingo onde o padrão de ocorrência do evento pode ser diferente. Amostra de conveniência É a amostra não probabilística composta por elementos que o pesquisador reuniu simplesmente por que dispunha deles, sem qualquer tipo de técnica. Existe uma série de restrições estatísticas a esta amostragem, porém é comum na área da saúde, pois por dificuldades de ordem ética nem sempre é possível formar uma amostra probabilística. Imagine a seguinte situação: Um pesquisador deseja conhecer o perfil de usuários de drogas ilícitas, para tanto precisa fazer entrevistas com 100 indivíduos. Qual é a população destesusuários? Esta população se declara? Em situações como esta o pesquisar recorre a uma amostra que encontra como por exemplo, os indivíduos de uma clínica de recuperação. Vício de uma amostra Vício, viés ou tendenciosidade caracteriza-se pela diferença entre a média obtida de todas as possíveis amostras e o verdadeiro valor do parâmetro populacional em estudo. De maneira simples é o erro que a amostra carrega por ser composta por indivíduos com valores distantes do verdadeiro valor que se pesquisa. Voltando a um exemplo anterior onde para avaliar o desempenho de um docente aplica-se um questionário aos alunos, e o docente escolhe a amostra, conclui-se que esta amostra (grupo de alunos) tende a atribuir a este professor uma nota média superior àquela que a média que a turma toda iria conferir. Esta tendência chama-se então de vício da amostra. Dados discrepantes São considerados dados discrepantes os valores aparentemente incompatíveis com os demais valores obtidos em um levantamento de dados. Diz-se aparentemente, pois é impossível para um pesquisador avaliar se existe um dado errado ou incompatível. Veja, se um pesquisador deseja conhecer o tipo físico dos alunos matriculados em uma grande instituição de ensino superior, seguindo nossos critérios, ela vai optar por uma amostra. Se esta instituição tem 10.000 alunos matriculados, ele pode perfeitamente fazer uma amostra casual simples de 100 alunos para aferir altura e peso. Analise esta situação hipotética: Dos 100 alunos sorteados, apareceu um com altura de 1,40m e 100Kg. Este aluno, tipicamente fora do padrão corporal de qualquer população esta representando 1% da amostra. Será que 1% da população, ou seja 100 alunos, possuem este tipo físico? Esta é uma típica situação de dado discrepante. O que fazer com os dados discrepantes? Leve em consideração os pontos abaixo: - Deve-se verificar todo o valor suspeito e descartar se verificar erros em um ou mais pontos do processo. - Os dados discrepantes influenciam os resultados estatísticos. - A inclusão ou exclusão deve ser minuciosamente analisada. Como leitura complementar, sugere-se ler o artigo “Comentário: Eunice Pinho de Castro Silva, o despontar da pesquisa por amostragem na saúde pública brasileira”, encontrado no link a seguir: http://www.scielo.br/pdf/rsp/v40n5/03.pdf Material Complementar Berquó, E.S; Souza, J.M.P.; Gotlieb, S.L.D. Bioestatística. 2º Ed., Editora pedagógica e Universitária, São Paulo, 1981, p.1-6. Vieira, S. Introdução a Bioestatística, 5º. Ed, Editora Campus, 2008, São Paulo, Brasil, p. 1-7. Vieira, S. Bioestatística: tópicos avançados. 2° Ed. Editora Campus, 2003, São Paulo, Brasil. Referências _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ Anotações
Compartilhar