Baixe o app para aproveitar ainda mais
Prévia do material em texto
INTRODUÇÃO À BIOESTATÍSTICA DE ALUNO PARA ALUNO Derick Renan de Castro Gabriel Joyce Quaresma Lopes INTRODUÇÃO À BIOESTATÍSTICA DE ALUNO PARA ALUNO Derick Renan de Castro Gabriel Joyce Quaresma Lopes Estudante do curso de Educação Física no Centro Universitário Fametro – Unifametro, com atuação prática do ano de 2018 até o momento nas modalidades de musculação, natação, hidroginástica e monitora na empresa SSLAB cursos. Tenho feito cursos para me especializar cada vez mais na área do exercício físico e tenho participação na construção deste e-book afim de facilitar o entendimento sobre bioestatística, como ela pode ser interpretada em trabalhos técnico científicos propagando seus dados à pratica Estudante do curso de Educação Física no Centro Universitário Fametro – Unifametro, com atuação prática desde 2019 no treinamento de força e monitor na empresa SSLAB cursos. Tenho feito cursos para me especializar cada vez mais na área do exercício físico e tenho participação na construção deste e-book afim de facilitar o entendimento sobre bioestatística, como ela pode ser interpretada em trabalhos técnico-científicos propagando seus dados à pratica AUTORES Derick Renan de Castro Gabriel Joyce Quaresma Lopes Este ebook tem como objetivo transmitir informações que a bioestatística contempla, desde o conceito da palavra, explanando conceitos básicos e mais profundos da temática. Tem por finalidade proporcionar o entendimento do tema de forma breve, clara e objetiva com organização e direcionamento a uma melhor utilização da estatística e seu entendimento no ambiente acadêmico e científico. RESUMO SUMÁRIO INTRODUÇÃO CONCEITOS BÁSICOS TIPOS DE ESTATÍSTICA POPULAÇÃO E AMOSTRA GRUPO CONTROLE E GRUPO EXPERIMENTAL VARIÁVEIS BIOLÓGICAS MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO DESVIO PADRÃO E VARIÂNCIA COEFICIENTE DE VARIAÇÃO AMPLITUDE TOTAL HIPÓTESE VALOR DE P HOMOCEDASTICIDADE TESTES DE HIPÓTESE CONSIDERAÇÕES FINAIS REFERÊNCIA BIBLIOGRÁFICA INTRODUÇÃO Entender de bioestatística vai além de saber o conceito da palavra em si. Estatística “[...] pode ser considerada a ciência que se preocupa com a coleta, organização, descrição, análise e interpretação de dados” “[...] pode ser usada para simplesmente descrever dados (estatística descritiva), mostrando seus subtipos, sua distribuição, frequência, média etc. [...].” (DORIA U. 7° tiragem, pág 15). Além disso, “A palavra Estatística deriva do latim status, significando Estado Político ou a situação de alguma coisa.” (BERNARDO P. Bioestatística, pág 10). De acordo com o dicionário online de português, a palavra bio significa vida, logo pode-se concluir que bioestatística é “a ciência que trata os planos e os métodos de coleta, tabulação e análise de fatos numéricos nas ciências da vida”. (ROSSI ROBSON M.). Ela objetiva planejar como fazer para coletar os dados, organizar, resumir, analisar e interpreta-los permitindo tirar conclusões biológicas sobre diferentes populações (à depender das características da mesma no trabalho) de seres vivos a partir do estudo de amostras, ou seja, estudo de uma parte da população selecionada no estudo. (ROSSI ROBSON M. pág 3). Com o entendimento acerca da palavra bioestatística é preciso saber quando, como e para quê usá-la e uma das justificativas é que ela permite saber o grau de certeza das conclusões tiradas por meio de testes estatísticos, possibilita interpretar gráficos e tabelas das publicações de forma clara facilitando o entendimento da conclusão, por exemplo, do estudo. Além disso, a bioestatística permite entender sobre os tipos de pesquisas científica, estatísticas e testes, e em adição, soma ao autor realizar a organização, descrição, coleta e interpretação dos dados de forma mais literal do objetivo e métodos do trabalho. CONCEITOS BÁSICOS De acordo com Rossi, Robson M. no material produzido chamado de “Apostila De Bioestatística", a estatística é segmentada em três grandes áreas que atuam em conjunto sendo elas: planejamentos de experimentos e amostragens, estatística descritiva e estatística inferencial. “Amostragem e planejamentos de experimentos é a parte que tem por objetivo planejar a pesquisa e se preocupa com o mecanismo de coleta de dados.” (ROSSI, ROBSON M. pág 3) “A estatística descritiva é a parte que tem por objetivo organizar, apresentar e sintetizar dados observados de determinada população, sem pretensões de tirar conclusões de caráter extensivo” (ROSSI, ROBSON M. pág 3). Já a estatística inferencial também conhecida como indutiva, "é a parte que, baseando-se em estudos realizados sobre os dados de uma amostra, procurar inferir, induzir ou verificar leis de comportamento da população da qual a amostra foi retirada. Estatística inferencial tem sua estrutura fundamentada na teoria matemática das probabilidades. É também definida como um conjunto de métodos para a tomada de decisões" (ROSSI, ROBSON M. pág 3). TIPOS DE ESTATÍSTICA Alguns termos fazem-se necessários para o entendimento dessa temática. Então serão abordados tópicos de alguns desses termos que facilitarão a compreensão e estudo acerca da bioestatística. Duas palavras que são comuns na interpretação de dados é população e amostra as quais tem relação entre si, mas possuem significados distintos. População “é qualquer conjunto de elementos, tendo pelo menos uma variável em comum (que pode ser finita, ou infinita).” (ROSSI ROBSON M. pág 5) e amostra “é qualquer subconjunto da população” (ROSSI ROBSON M. pág 5), logo é a representação de uma população em um trabalho científico. Identificar em um trabalho científico o quê e quem é o grupo da amostra é um dos passos importantes para o início da interpretação do mesmo, fazendo com que o leitor se organize para interpretar os dados e projetar sua leitura para a atuação prática e aplicação dos possíveis resultados positivos do estudo para a prática. (MARCONI MARINA, LAKATOS EVA. 2003). POPULAÇÃO E AMOSTRA POPULAÇÃO: AMOSTRA: IMAGEM RETIRADA DO GOOGLE Grupo controle e grupo experimental, é um conjunto de pessoas que em cada grupo vão ter suas características e classificações. Ou seja, em um trabalho deve existir o grupo experimental, que é aquele o qual vai ser aplicado testes ou questionários (dependendo do tipo de estudo) com o objetivo de coletar dados sobre as hipóteses geradas pelo pesquisador. (MARCONI MARINA, LAKATOS EVA 2003). Já o grupo controle é o conjunto de pessoas que vão estar no estudo como âncora proporcionando uma comparação com os resultados dos dados coletados dos indivíduos da amostra de acordo com o que é buscado na temática do trabalho. (MARCONI MARINA, LAKATOS EVA 2003). De forma mais prática, devemos imaginar determinada situação: o pesquisador tem como objetivo coletar dados sobre uma possível mudança de comportamento/personalidade de indivíduos que fazem uso de determinada droga, logo esse grupo seria o grupo experimental e o grupo controle seria outro conjunto de indivíduos com critérios de seleção iguais ou parecidos com dos indivíduos analisados que não fazem o uso da substância. GRUPO EXPERIMENTAL: GRUPO CONTROLE E GRUPO EXPERIMENTAL NÃO RECEBEU A INTERVENÇÃO GRUPO CONTROLE: RECEBEU A INTERVENÇÃO IMAGEM RETIRADA DO CANVAS VARIÁVEIS BIOLÓGICAS A palavra variável, de forma empírica, pode ser entendida de diversas formas e uma delas é que classifica algo que oscila, que varia, que alterna entre algo. No universo científico, “uma variável pode ser considerada como uma classificação ou medida; uma quantidade que varia; um conceito operacional que contém ou apresenta valores.” Esse conceito operacional pode ser quantitativo e qualitativo. (MARCONI MARINA, LAKATOS EVA, 2003, pág 137). No universo científico existe as variáveis independentes e dependentes, onde a primeira variável citada “é aquela que influencia, determina ou afeta outra variável; é fator determinante, condição oucausa para determinado resultado, efeito ou consequência[...]” (MARCONI MARINA, LAKATOS EVA, 2003, pág 138). Segundo Marconi Marina e Lakatos Eva (2003) a variável dependente sofre alteração no desfecho pela variável independente, ou seja, “consiste naqueles valores (fenômenos, fatores) a serem explicados ou descobertos, em virtude de serem influenciados, determinados ou afetados pela variável independente; é o fator que aparece, desaparece ou varia à medida que o investigador introduz, tira ou modifica a variável independente; a propriedade ou fator que é efeito, resultado, consequência ou resposta a algo que foi manipulado[...]” Um exemplo prático a seguir de como identificar uma variável dependente e independente através da temática da pesquisa: Pesquisa 1 – “O efeito da composição corporal com a ordem do exercício em doze semanas de treinamento concorrente”. A variável independente é aquela que não se altera, ou seja, a ordem o exercício e o treinamento concorrente, que no caso serão prescritos da mesma forma para todas as amostras. Já a variável dependente neste caso é a composição corporal, pois pode variar de indivíduo para indivíduo com a realização das duas variáveis caracterizadas como independentes. Pesquisa 2 –" O efeito da hidroxicloroquina na taxa de mortalidade de pessoas com COVID19”.A variável independente é a droga utilizada, enquanto a dependente é o resultado na taxa de mortalidade de pessoas com determinada doença. As variáveis biológicas se classificam como quantitativas ou numéricas e qualitativas ou categorizadas e estas possuem sub tipos onde as variáveis qualitativas podem ser discretas ou contínuas e as quantitativas podem ser nominal ou ordinal. (VIEIRA SONIA. 2008) O subtipo da variável biológica quantitativa ou numérica nominal é “quando os dados são distribuídos em categorias mutuamente exclusivas, mas não são indicados em qualquer ordem” (VIEIRA SONIA. 2008, pág 24) e o subtipo ordinal é “quando os dados são distribuídos em categorias mutuamente exclusivas que têm ordenação natural.” (VIEIRA SONIA. 2008, pág 24). Já os subtipos da variável biológica qualitativa podem ser discretas ou contínuas. São discretas quando a “a variável pode assumir alguns valores em um dado intervalo de tempo.” (VIEIRA SONIA. 2008, pág 24) e são contínuas quando “assume qualquer valor num dado intervalo.” (VIEIRA SONIA. 2008, pág 24). Segue uma tabela explicando a respeito das variáveis biológicas, seus tipos e subtipos: TABELA INSPIRADA NA OBRA DE VIEIRA SONIA (2008). INTRODUÇÃO À BIOESTATÍSTICA. RIO DE JANEIRO. ELSEVIER MEDIDAS DE TENDÊNCIA CENTRAL Tendo em vista a abordagem apresentada sobre as variáveis biológicas, os seus tipos e os subtipos de como os dados podem ser expostos no universo científico, é existente a possibilidade destes dados serem trabalhados para expressar medidas de tendência central e de dispersão. Medidas de tendência central são a média, mediana e moda da amostra. A média aritmética da amostra “é obtida somando todos os dados e dividindo o resultado pelo número deles” (VIEIRA SONIA. 2008), “representa o ponto de equilíbrio de um conjunto de dados.” (ROSSI, ROBSON M. pág 27). EX: Ana, Pedro e Lucas saíram para beber. Ana bebeu 8 cervejas, enquanto Pedro bebeu 4 e Lucas 6. O calculo será: 8+4+6/3 = 18/3 = 9. A moda “é o valor que ocorre com maior frequência em uma série de dados” (ROSSI, ROBSON M. pág 28), porém, existem séries de dados que não apresentam um quantitativo que apareça com maior frequência, logo o conjunto de dados não existe moda sendo assim chamada de série amodal. (ROSSI, ROBSON M. pág 28). “A moda também pode ser usada para descrever dados qualitativos. Nesse caso, a moda é a categoria que ocorre com maior frequência” (VIEIRA SONIA. 2008, pág 77). Veja como exemplo a imagem abaixo, retirada do livro Introdução à Bioestatística de Sonia Vieira 2008: Já a medida de tendência central mediana “é o valor que ocupa a posição central dos conjuntos dos dados ordenados” (VIEIRA SONIA. 2008, pág 74), é o valor que está no meio. A forma de calcula-la pode variar se o conjunto de observações tem um número par de valores, não agrupados em classes, se o conjunto está agrupados em classes ou se o conjunto tem um número ímpar de valores, não agrupados e classes (ROSSI, ROBSON M. pág 29). MEDIDAS DE DISPERSÃO Dificilmente uma única medida é suficiente para descrever de maneira satisfatória um conjunto de dados. Tomemos como exemplo o caso da média aritmética, e consideremos dois conjuntos de observações: A: 39 45 52 61 68 B: 47 50 53 56 59 Ambos têm a mesma média, 53, porém, percebe-se que o conjunto A demonstra uma dispersão muito maior do que o conjunto B. Torna-se então necessário estabelecer medidas que indiquem o grau de dispersão, ou variabilidade, em relação ao valor central. Para Filho (1999) a medida de dispersão se trata do modo que os dados se posicionam ao redor do ponto central. A dispersão dos dados pode ser avaliada através de métricas como desvio padrão, variância, coeficiente de variação e amplitude total. Essas duas medidas indicam a variabilidade, distância dos valores em torno do valor médio encontrado para um determinado conjunto de dados (valores). Se menores, a variância e o desvio padrão indicam pouca variabilidade dos valores, caracterizando um conjunto de valores mais homogêneo, ou seja, de variabilidade pequena. Para Abreu (2006) O desvio padrão de uma amostra é uma medida da variação dos valores em torno da média. A qual sua fórmula se dá por: Enquanto a fórmula do desvio padrão para a população se Demonstra como: DESVIO PADRÃO E VARIÂNCIA x: MÉDIA DA AMOSTRA n: O NÚMERO DE OBSERVAÇÕES (TAMANHO DA AMOSTRA) N: POPULAÇÃO μ: MÉDIA DA POPULAÇÃO _ ∑: SOMATÓRIA x: O VALOR DE CADA OBSERVAÇÃO IMAGEM RETIRADA DO LIVRO DE ABREU A. M. 2006 IMAGEM RETIRADA DO LIVRO DE ABREU A. M. 2006 O desvio padrão é uma medida de variação de todos os valores da amostra em torno da média O valor do desvio padrão sempre pode aumentar dramaticamente com a inclusão de um ou mais outliers na amostra. As unidades do desvio padrão s são as mesmas dos elementos da amostra. Para Abreu (2006) algumas características a serem destacadas sobre o desvio padrão são: “A variância é uma medida de variação de um conjunto de valores e é igual ao quadrado do desvio padrão.” (ABREU, 2006). O cálculo de variância se demonstra como o quadrado do desvio padrão amostral ou populacional. Definiremos então a variância como a soma dos quadrados dos desvios de cada observação em relação à média, dividida por (n – 1). E desvio padrão como a raiz quadrada da variância. “A magnitude do desvio padrão depende da unidade de medida de uma variável particular e, assim, um desvio padrão medido em dias será numericamente muito maior do que o mesmo desvio medido em meses. O chamado coeficiente de variação -coefficient of variation, expressa o desvio padrão como porcentagem do valor da média.” (FILHO, 1999). O coeficiente de variação (ou CV) de uma amostra, expresso em percentagem, descreve o desvio padrão relativamente à média. É uma medida sem unidades. Seu cálculo se dá por: COEFICIENTE DE VARIAÇÃO x: MÉDIA DA AMOSTRA S: DESVIO PADRÃO DA AMOSTRA σ: DESVIO PADRÃO DA POPULAÇÃO μ: MÉDIA DA POPULAÇÃO _ A amplitude explica a variabilidade de valores, e por isso é considerada uma medida de dispersão. Para Filho (1999) amplitude total é a diferença entre o mais alto e o mais baixo valor observado. Menor, também chamado de mínimo, é o menor valor de um determinado conjunto de valores. Maior, também chamado de máximo, é o maior valor de um determinado conjunto de valores. MAIOR AMPLITUDE TOTAL menor AMPLITUDE HIPÓTESE Estabelecer uma hipótese experimental (H1) Estabelecer uma hipótese nula (H0)Determinar o tamanho da amostra Colher os dados Realizar a análise estatística para determinar a probabilidade de H0 ser ou não verdadeira Rejeitar ou aceitar a H0 Para Filho(1999) hipótese é uma resposta presumida que, de acordo com certos critérios, será ou não rejeitada. O processo de testar uma hipótese deve ocorrer em 6 etapas sequenciais: 1. 2. 3. 4. 5. 6. A hipótese nula demonstra que não há diferenças entre os casos estudados, ex: Se iremos testar a eficácia de uma droga comparando-a com uma droga já inserida no mercado, a H0 (hipótese nula) diz que não haverá diferença entre o uso dessas drogas, enquanto a H1 (hipótese alternativa) demonstrará que há diferença entre elas. Uma hipótese unilateral (ou monocaudal) poderá tentar demonstrar que a droga nova é melhor que a droga já inserida, enquanto uma hipótese bilateral tentará demonstrar que é diferente, sendo para mais ou para menos. VALOR DE P Quando falamos sobre o nível de significância, normalmente utiliza-se até 5% para se aceitar a hipótese nula. Normalmente esse nível de significância é demonstrado como p > 0,05. Para Filho (1999) o valor de p é a probabilidade, que varia de 0 a 1, de encontrar na pesquisa uma diferença igual ou maior que a observada. “Um valor de p não significativo não obrigatoriamente irá demonstrar que a hipótese nula é verdadeira, mas sim que talvez não haja evidências suficientes para rejeitá-la” (FILHO, 1999). Ao testarmos uma hipótese podemos encontrar dois tipos de erro: Erro 1: O pesquisador rejeita a hipótese nula quando ela é verdadeira. Erro 2: O pesquisador aceita a hipótese nula quando deveria rejeitá-la. Quando aceitamos H0 e essa é a hipótese verdadeira, não cometemos erro algum; da mesma maneira quando rejeitamos H0 e essa é a decisão correta. No entanto, quando rejeitamos H0 e a hipótese verdadeira é H0, cometemos um erro que é classificado como do Tipo I; e quando aceitamos H0 e a decisão correta seria rejeitá-lo, cometemos um erro classificado como do Tipo II. HOMOCEDASTICIDADE A suposição de homocedasticidade implica que, condicional às variáveis explicativas, a variância do erro é constante. Para Riboldini e colaboradores, as pressuposições de homocedasticidade e erros não correlacionados em modelos lineares têm vários objetivos, mas essencialmente facilitar a interpretação dos resultados, tornar as técnicas estatísticas mais simples e possibilitar testes de hipóteses. Dentro da homocedasticidade busca-se observar se há normalidade, homogeneidade e esfericidade dos dados. De acordo com Lopes e colaboradores (2014) para normalidade temos o teste de Kolmogorov-Smirnov e o teste de Shapiro- Wilk. Este último inicialmente descrito para amostras pequenas. Para Riboldini e colaboradores, a homogeneidade pode ser mensurada através do teste de Levene (1960), que usa os desvios em relação à média dos grupos. Enquanto o teste de esfericidade se mede com o teste de Mauchly. A partir da descoberta de normalidade, homogeneidade e esfericidade, inicia-se então a utilização dos testes de hipóteses. TESTES DE HIPÓTESES Para Lopes e colaboradores (2014), os testes estatísticos deverão obedecer a características de distribuição e pareamento da amostra. IMAGEM RETIRADA DO LIVRO Bioestatísticas: conceitos fundamentais e aplicações práticas de Lopes B, Ramos ICO, Ribeiro G. A variável deve ser quantitativa; A variável deve ter distribuição normal; A amostra deve ter uma distribuição próxima a normal. Nos testes quantitativos podemos falar sobre teste de T, ANOVA, Wilcoxon, Friedman e Kruskal walls. De acordo com Beiguelman, (1996) utiliza-se o teste de T quando desejamos comparar as médias de duas amostras, sendo elas o mesmo conjunto de indivíduos onde se verifica os valores antes e depois da intervenção; ou entre dois grupos, sendo um tratado e outro o grupo controle. Para aplicarmos o teste de T como um teste de hipótese em sua pesquisa, devem ser seguidas determinadas condições, sendo elas: "Assim, quando não se conhece o desvio-padrão da população, mas sim uma estimativa do mesmo com base no desvio padrão da mostra, a distribuição já não será mais normal e seguirá uma distribuição conhecida como "distribuição t", cuja forma lembra a da distribuição normal, porém com mais área nas caudas.” (FILHO, 1999) Chamamos de Análises de Variância (ANOVA) quando comparamos variáveis quantitativas de dois ou mais tratamentos, ou seja, vários grupos experimentais (BEIGUELMAN, 1996). Quando trabalhamos com uma distribuição normal com mais de 2 grupos, seja ela pareada ou não-pareada, utilizamos então o teste de ANOVA. Para amostras não-normais pareadas utilizamos Wilcoxon rank test para 2 grupos e Friedman para mais grupos. Já para amostras não-pareadas e não-normais, utilizamos Mann-whitney para dois grupos e Kruskal-Walls para mais de dois grupos. Nos testes qualitativos (ou nominais), onde apenas avaliamos coisas que não podem ser mensurados e não necessitam de nenhuma ordem em especial (como cor de cabelo, cor dos olhos, sexo biológico etc) utilizam-se diferentes testes para diferentes números de grupos. De acordo com Filho (1999), já para dados nominais, onde não se há distribuição normal, utiliza-se o teste de qui-quadrado. O teste de qui- quadrado se utiliza com dois grupos, enquanto de acordo com Triola (2005) para testes qualitativos com mais de dois grupos se utiliza o teste de Fisher. CONSIDERAÇÕES FINAIS Durante o processo da construção desse ebook, fomos capazes de nos aprofundar ainda mais na área da bioestatística, observando suas aplicações tanto dentro de nossa área de atuação quanto fora. Além disso, fomos capazes de desenvolver maiores habilidades de pesquisa e escrita científica, propagando aos estudantes da temática o possível despertar para a escrita acadêmica. A criação surgiu a partir de um trabalho acadêmico mas que nos fez perceber parte do nosso potencial de produção, seja de maneira específica ou geral. O ebook foi planejado de maneira que auxilie alunos que estão adentrando nesse meio, mas também com aprofundamento o suficiente para auxiliar os mais experientes na hora de revisar sobre o conteúdo aprendido. A partir de livros de diferentes autores, em diferentes áreas fomos capazes de perceber a bioestatística por vários ângulos, podendo resumi-la e utiliza-la em nosso processo de ensino-aprendizagem. Somos gratos pela oportunidade de criação e esperamos poder colaborar com aqueles que desejam aprender um pouco mais sobre esse conteúdo que é importante e complexo, mas que ao ter acesso a este ebook, terão facilidade na compreensão de forma clara e objetiva. REFERÊNCIAS BIBLIOGRÁFICAS ROSSI, Robson M. Apostila de Bioestatística; VIEIRA SONIA (2008). Introdução à Bioestatística. Rio de Janeiro. Elsevier; MARCONI M., LAKATOS E. (2003). Fundamentos de Metodologia Científica. São Paulo. Atlas S.A. ABREU, A.M. ESTATÍSTICA / BIOESTATÍSTICA /MÉTODOS ESTATÍSTICOS /BIOESTATÍSTICA E EPISTEMOLOGIA DA INVESTIGAÇÃO. TRIOLA, M. F. Introdução à Estatística FILHO, U. D. INTRODUÇÃO À BIOESTATÍSTICA: Para simples mortais. 7.ed.rev. [S. l.]: Campus Elsevier, 1999. ISBN8586014362. LOPES B, RAMOS ICO, RIBEIRO G ET AL. BIOESTATÍSTICAS: CONCEITOS FUNDAMENTAIS E APLICAÇÕES PRÁTICAS. REV BRAS OFTALMOL. 2014; 73 (1): 16-22 RIBOLDI, J. BARBIAN, M. H. KOLOWSKI, A. B. S. PRECISÃO E PODER DE TESTES DE HOMOCEDASTICIDADE PARAMÉTRICOS E NÃO-PARAMÉTRICOS AVALIADOS POR SIMULAÇÃO
Compartilhar