Baixe o app para aproveitar ainda mais
Prévia do material em texto
Profa. Dra. Elaine C Marqueze @EquipeMySete @JessicaJulioti Bioestatística @elaine.marqueze Introdução, População e Amostra, Variáveis Bioestatística • Estatística – latim status (estado). • Ciência que se preocupa com a coleta, organização, descrição, análise e interpretação de dados experimentais. • Pode ser usada para simplesmente descrever dados (estatística descritiva) ou para comparar grupos e fazer generalizações a partir de resultados obtidos (estatística inferencial, indutiva ou analítica). Por que a estatística é necessária? • As pessoas são condescendentes com os dados, especialmente com os próprios. • As diferenças, não raramente, são atribuídas a causas erradas. • As coincidências ocorrem mais frequentemente do que se intui. • Acrescentar polimento às publicações e apresentações. • Para saber o grau de certeza das conclusões tiradas. População x Amostra População x Amostra • População (N): qualquer conjunto de informações que tenham entre si uma característica comum que delimite, inequivocamente, quais elementos pertencem a ela. • Amostra (n): são subconjuntos representativos de uma dada população. A amostra deve ser representativa da população da qual foi extraída, ser parecida com ela (qualitativa e quantitativamente), devendo obedecer a dois princípios básicos: • 1. deve ser suficientemente grande (representatividade); • 2. seus constituintes devem preferencialmente serem selecionados ao acaso. Randomização • Seleção ao acaso – random – significa que cada um dos componentes da população estudada tem a mesma chance de ser incluído na amostra e, além disso, que foi selecionado independentemente. • Isto implica que a inclusão de um particular membro não altera a chance de inclusão dos demais. • Se isso não ocorrer, diz-se que a amostra é não randomizada, podendo ter um viés. • Dados imprecisos, amostras viciadas, populações mal definidas e critérios subjetivos levam a resultados igualmente imprecisos, que a estatística não pode e não deve tentar salvar. Randomização Variáveis Variáveis • Uma das primeiras coisas a serem feitas é caracterizar qual tipo de variável será trabalhada, pois muitas estatísticas são aplicáveis a apenas um tipo de variável mas não são adequadas para outras. • Qualitativas (categóricas) x Quantitativas (numéricas). Variáveis Qualitativas Variáveis nominais: são todos aquelas distribuídas em categorias nominais, sem qualquer ordem. São geralmente apresentadas na forma de diagramas de barras, pizzas e tabelas de contingência. Esses tipos de variáveis são muito fáceis de serem descritas; geralmente, basta apresentar o seu número (valores absolutos) e distribuição (porcentagem por categoria). Descrição das variáveis nominais • Os indivíduos são classificados em categorias segundo uma característica. Ex: sexo (masculino, feminino), hábito de fumar (fumante, não fumante), sobrepeso (sim, não). • Variáveis ordinais: são aquelas que se distribuem por categorias que têm uma ordem. Frequentemente a mediana é usada para descrevê-las mas, também, proporções podem ser utilizadas. • Os indivíduos são classificados em categorias que possuem algum tipo inerente de ordem. Neste caso, uma categoria pode ser "maior" ou "menor" do que outra. Distribuição porcentagem por categoria. EX: nível socioeconômico (A, B, C e D). Variáveis Qualitativas Variáveis Quantitativas • Variáveis quantitativa Discreta: Número de refeições por dia. • Variável quantitativa Contínua: Idade (anos e meses), peso (kg, g), estatura (m, cm), nível de retinol sérico (g/dl), circunferência da cintura (cm, mm). Descrição das variáveis quantitativas • Esse tipo de variável pode ser trabalhada para gerar informações que expressem a tendência central e a dispersão. • Medidas de tendência central: • Média aritmética (𝓍): soma dos valores observados, dividida pelo número de observações. Para variáveis quantitativas contínuas com distribuição normal. • Mediana (Md): aquele valor que, uma vez ordenados todos os resultados, deixa igual número de resultados de cada lado. Numa distribuição assimétrica ela é muito mais representativa da população do que a média. Eventualmente, pode ser usada com dados ordinais. Para variáveis quantitativas contínuas com distribuição não-normal e variáveis quantitativas discretas. • Moda (Mo): o valor mais frequente, o que se repete, podendo ter mais de uma moda em uma mesma amostra. Para variáveis quantitativas contínuas e discretas. Descrição das variáveis quantitativas • Medidas de dispersão: • Desvio-padrão (DP): medida que expressa o grau de dispersão de um conjunto de dados, em que um maior DP, maior a variabilidade entre as observações. Grandes amostras (>100) e correspondente à média aritmética. • Erro-padrão (EP): variabilidade entre a média aritmética e a média que poderia ser encontrada em outras amostras do mesmo tamanho. Amostras pequenas (<100) e correspondente à média aritmética. Descrição das variáveis quantitativas • Intervalo de confiança: indica a confiabilidade de uma estimativa. Intervalo de confiança com nível de confiança de 95% é o mais comum e significa que o resultado está dentro do intervalo de 95 dos 100 estudos hipoteticamente realizados. Correspondente à média aritmética. • Amplitude de variação: diferença entre o maior e o menor valor. Descrição das variáveis quantitativas • Amplitude interquartílica: é calculada com base no cálculo dos quartis, sendo o primeiro quartil (inferior – 25%), o quartil intermediário (mediana – 50%), o terceiro quartil (superior – 75%). Correspondente à mediana. 0% 25% 50% 75% 100% Descrição das variáveis quantitativas Exercício Qual a natureza das variáveis a seguir? - Atividade física (sedentário e ativo); - Nível de colesterol (mg/dl); - Estágio da doença (inicial, intermediário, avançado); - Número de filhos; Exercício Qual a natureza das variáveis a seguir? - Nível de atividade física (sedentário e ativo): Qualitativa nominal. - Nível de colesterol (mg/dl): Quantitativa contínua. - Estágio da doença (inicial, intermediário, avançado): Qualitativa ordinal. - Número de filhos: Quantitativa discreta. O conteúdo desse curso foi oferecido pelo Centro Educacional Sete de Setembro em parceria com o Professora Elaine C. Marqueze Profa. Dra. Elaine C Marqueze @EquipeMySete @JessicaJulioti Bioestatística @elaine.marqueze Apresentação dos dados, Distribuição dos dados Apresentação dos dados Apresentação dos dados • Texto; • Tabela; • Gráfico. Representação gráfica • Um gráfico ou diagrama é uma representação geométrica da relação entre as variáveis. • Facilita a visualização de relações não identificáveis na observação de uma tabela. • Os gráficos mais informativos são relativamente simples e auto- explicativos. Gráfico de barras • Utilizados para exibir uma distribuição de frequências para as variáveis qualitativas nominais e ordinais. • As várias categorias nas quais as observações são classificadas estão apresentadas ao longo de um eixo horizontal. • As barras devem ser de igual largura e separadas uma da outra de modo a não implicar continuidade. Gráfico de barras vertical Histograma • Para apresentar a distribuição de frequências para as variáveis quantitativas discretas e contínuas. • O eixo horizontal exibe os limites verdadeiros dos vários intervalos, que são os pontos que os separam dos outros intervalos em ambos os lados, por isso as barras são unidas. Histogramas Polígonos de frequência • Similar ao histograma – usa os mesmos dois eixos que um histograma. • É construído ao se colocar um ponto no centro de cada um dos intervalos de forma tal que a altura do ponto seja igual à frequência absoluta ou frequência relativa das observações. • Os polígonos de frequência são facilmente superpostos e bons para se comparar dois ou maisconjuntos de dados. Polígonos de frequência Quando os pontos estão interligados significa que representam a mesma pessoa ou conjunto de pessoas. Caso sejam pessoas diferentes, não faça a ligação dos pontos. Polígonos de frequência Box Plots • Gráficos de dispersão unidimensionais – resumo das variáveis quantitativas discretas ou contínuas. • Usado em um único eixo horizontal para exibir a posição relativa de cada um dos pontos dos dados no grupo. Box Plots Box Plots Gráfico de dispersão bidimensional • É usado para mostrar a relação entre duas medidas contínuas distintas. • Cada um dos pontos no gráfico representa um par de valores. • A escala para uma quantidade está marcada no eixo horizontal (eixo x), e a escala da outra no eixo vertical (eixo y). Gráfico de dispersão bidimensional Distribuição dos dados • A maioria dos fenômenos da natureza, em especial os biológicos, apresenta variações dentro de um intervalo definido. • A curva normal ou de Gauss é simétrica e tem forma de sino. • Assume um série de formas mais ou menos achatadas (curtose) em função da dispersão dos dados ao redor do ponto central, no qual coincidem a média aritmética, a moda, assim como a mediana. Distribuição dos dados • A curva normal é próxima ao eixo horizontal, suas caudas aproximam-se dele mas não o tocam jamais, o que significa que a variável pode assumir qualquer valor entre –∞ e + ∞. • Quando a distribuição dos dados é normal (simétrica), a média representa bem a população; quando a distribuição é assimétrica, a mediana é mais representativa. Distribuição dos dados • A distribuição normal se caracteriza por reunir um grande número de valores em torno da média, que diminuem gradualmente de frequência à medida que se afastam dela. Distribuição dos dados Distribuição dos dados • A área subordinada à curva normal representa 100% das frequências. • Em torno da média se determina intervalos com utilização dos DP, conforme abaixo: • 𝓍± DP = 68,26% • 𝓍± 2DP = 95,45% • 𝓍± 3DP = 99,73% Distribuição dos dados Distribuição dos dados - Exemplo • 5.000 pessoas / média = 20 anos / DP = 3 anos. • 𝔁± DP = 20 ± 3, ou seja, entre 17 e 23 anos. • Portanto, 68,26% dos 5.000 indivíduos possuem entre 17 e 23 anos. • Ou seja, 5.000 x 0,6826 = 3.413 indivíduos. Distribuição dos dados - Exemplo • 5.000 pessoas / média = 20 anos / DP = 3 anos • 𝔁± 2DP = 20 ± 6, ou seja, entre 14 e 26 anos. • Portanto, 95,45% dos 5.000 indivíduos possuem entre 14 e 26 anos. • Ou seja, 5.000 x 0,9545 = 4.773 indivíduos. • 𝔁± 3DP = 20 ± 9, ou seja, entre 11 e 29 anos. • Portanto, 99,73% dos 5.000 indivíduos possuem entre 11 e 29 anos. • Ou seja, 5.000 x 0,9973 = 4.987 indivíduos. Distribuição dos dados - Exercício • Uma amostra com 120 adultos, com peso médio de 80 kg e DP de 12 kg. Quantos adultos têm peso entre 𝓍± DP? Distribuição dos dados • Exercício: • Uma amostra com 120 adultos, com peso médio de 80 kg e DP de 12 kg. Quantos adultos têm peso entre 𝓍± DP? • 80 ± 12 / 68 a 92 kg. Deverá haver 68,26% adultos com peso entre 68 e 92 kg, isto é, 82 adultos (120 * 0,6826 = 82). Distribuição dos dados • Estatística paramétrica • Estatística não-paramétrica Distribuição dos dados Latorre, 2009 O conteúdo desse curso foi oferecido pelo Centro Educacional Sete de Setembro em parceria com o Professora Elaine C. Marqueze Profa. Dra. Elaine C Marqueze @EquipeMySete @JessicaJulioti Bioestatística @elaine.marqueze Amostra Amostra Tipos de Amostragem • Amostragem Não-Probabilística: São amostragens em que há uma escolha deliberada dos elementos da amostra. Depende dos critérios e julgamento do pesquisador. • Amostragem Probabilística: São amostragens em que a seleção é aleatória de tal forma que cada elemento da população tem uma probabilidade conhecida de fazer parte da amostra. São métodos rigorosamente científicos. Amostragens não-probabilísticas Tipos de amostragens não-probabilísticas 1. Amostragem por acessibilidade ou por conveniência: • Menos rigoroso; • Seleção de quem se tem acesso. 2. Amostragem intencional: • Seleção baseada nas informações disponíveis para ser representativo de toda população; • Conhecimento da população e do subgrupo selecionado. Tipos de amostragens não-probabilísticas 3. Amostragem por cotas: • Maior rigor; • Utilizada quando não existe um cadastro da população que possibilite o sorteio, mas há informação suficiente sobre o perfil populacional; • Etapas: classificar a população, determinar a proporção da população para cada classe, fixar cotas em observância à proporção das classes consideradas. Amostragens probabilísticas Tipos de amostragens probabilísticas 1. Amostragem aleatória simples (AAS): • Todos os elementos da população tem a mesma probabilidade de pertencer à amostra; • Indicada para populações homogêneas; • A amostragem pode ser com ou sem reposição. Tipos de amostragens probabilísticas 2. Amostragem sistemática: • A população deve ser ordenada de forma que os elementos sejam identificados pela posição; • Indicada para populações homogêneas; Tipos de amostragens probabilísticas 2. Amostragem sistemática: • Determina-se a cota amostral pela fórmula, k=N/n, em que N=População e n=Amostra; • Escolhe-se aleatoriamente um elemento no intervalo; este será o primeiro elemento da amostra; • O segundo elemento será o primeiro mais k, e assim sucessivamente. Exemplo: • N= 4.950 • n= 825 • k= N/n • k= 4.950/825 • k= 6 1º sujeito (aleatório): número sorteado = 10, 2º sujeito: Número sorteado + k = 16, 3º sujeito: Número sorteado + 2k = 22, E assim sucessivamente até chegar a amostra de 825 sujeitos. Tipos de amostragens probabilísticas 3. Amostragem estratificada: • Divide-se a população em subgrupos mais homogêneos (estratos), procedendo-se à amostragem em cada estrato, proporcional ao tamanho do estrato. • Em geral, a retirada das amostras nos estratos é realizada de forma aleatória simples. Exemplo: estratos por idade, renda, ... Para determinar o número de elementos da população no iésimo estrato que irá participar da amostra (ni ) podemos usar a seguinte fórmula: Estrato Renda da População: A (1.238) – B (1.876) – C (835) – D (1.001) nA = n * Ni nA = 825 * 1.238 nA = 0,1666 * 1.238 N 4.950 nA = 206,2508 nA = 206 nB = 313 / nC = 139 / nD = 167 Tipos de amostragens probabilísticas 4. Amostragem por conglomerados: • Divide-se a população em pequenos grupos e sorteia-se um número suficiente desses pequenos grupos (conglomerados); • Este esquema amostral é utilizado quando há uma subdivisão da população em grupos que sejam bastante semelhantes entre si, mas com fortes discrepâncias dentro dos grupos, de modo que cada um possa ser uma pequena representação da população de interesse específico; Tipos de amostragens probabilísticas 4. Amostragem por conglomerados: • A amostragem é realizada em cima dos conglomerados, e não mais sobre os indivíduos da população. Exemplo: um quarteirão de uma cidade, bairros, municípios, regiões. Tamanho da Amostra Algumas razões para o uso de amostras: • Minimização de custos, quando precisão absoluta não é necessária; • Economia de tempo, quando há necessidade de resultados mais rápidos do que seria possível com um censo; • Na indústria, alguns testes são destrutivos e só podem ser feitos com uma amostra de produtos; • Em populações infinitas. Amostragem Tamanho Amostral 1. Nível de confiança (quanto maior o nível de confiança, maior o tamanho da amostra – Erro Beta – representatividade - força da amostra); 2. Erro máximo permitido (quanto menor o erro permitido, maior o tamanho da amostra – Erro Alfa - comparabilidade); 3. Variabilidade do fenômeno que está sendo investigado (quanto maior a variabilidade, maior o tamanho da amostra). Cálculo Amostral N = Tamanho da populaçãoE0 = erro amostral tolerável (erro máximo permitido) n0 = primeira aproximação do tamanho da amostra n = tamanho da amostra n0 = 1 / E0 2 n = N*n0 / N + n0 Barbetta PA. Estatística aplicada às ciências sociais. 5 ed, Florianópolis: UFSC, 2005. Cálculo Amostral N = Tamanho da população = 1.000 E0 = erro amostral tolerável = 5% n0 = primeira aproximação do tamanho da amostra n = tamanho da amostra n0 = 1 / E0 2 = 1/(0,05) 2 = 1/0,0025 = 400 n = N*n0 / N + n0 = 1.000*400/1.000+400 = n = 400.000/1.400 = 285,7 ≅ 286 pessoas Portanto, com um erro amostral tolerável de 5%, a amostra será constituída por 286 pessoas. Cálculo Amostral N = Tamanho da população = 1.000 E0 = erro amostral tolerável = 10% n0 = primeira aproximação do tamanho da amostra n = tamanho da amostra n0 = 1 / E0 2 = 1/(0,10) 2 = 1/0,01 = 100 n = N*n0 / N + n0 = 1.000*100/1.000+100 = n = 100.000/1.100 = 90,9 ≅ 91 pessoas Portanto, com um erro amostral tolerável de 10%, a amostra será constituída por 91 pessoas. Cálculo Amostral • G*Power - Software gratuito usado para calcular o poder amostral. O programa oferece a capacidade de calcular a amostra para uma ampla variedade de testes estatísticos, incluindo testes t, testes F e testes qui-quadrado, entre outros. G*Power – 1º Exemplo • Estudo para comparar a proporção de pessoas sedentárias de acordo com o sexo. Primeiro ver na literatura, qual a proporção encontrada em estudos anteriores (encontrar estudos que sejam semelhantes ao nosso). Supondo que faremos um estudo de base populacional, podemos utilizar a prevalência apresentada pela OMS (2018): prevalência de sedentarismo entre homens de 40,4% e entre mulheres 53,3%. • Primeiro precisaremos selecionar a família do teste (Exact), depois o teste estatístico (Teste de proporção de dois grupos independentes). G*Power - 1º Exemplo • Depois o tipo da análise, e como estamos fazendo o cálculo para saber quantas pessoas devemos pesquisar, escolheremos o “A priori”. • Precisamos preencher os parâmetros para que seja calculada a amostra. • Primeiro escolher se será um teste bicaudal (usado se os desvios do parâmetro estimado em qualquer direção de algum valor de referência serão considerados teoricamente possíveis) ou unicaudal (usado somente se os desvios em uma direção serão considerados possíveis). G*Power - 1º Exemplo • Digitar a proporção dos grupos que foi encontrada anteriormente: P1=0,404 e P2=0,533. • Digitar o Erro Alfa – comparabilidade, que por convenção em estudos epidemiológicos, consideramos 0,05. • Digitar o Erro Beta – representatividade / força da amostra, que no mínimo deve ser 80%, portanto, 0,80. • E por fim, a razão de alocação que automaticamente é atribuído 1. • Assim, precisaremos de n=492, sendo 246 homens e 246 mulheres. G*Power – 2º Exemplo • Estudo para comparar a média de idade entre as pessoas sedentárias e as pessoas ativas. Vamos considerar que o estudo será feito com adultos com idade entre 18 a 40 anos. Supondo que na literatura a idade média das pessoas sedentárias era de 34,5 anos (DP 5,7 anos) e das pessoas ativas 31,3 anos (DP 5,3 anos). • Selecionar a família do teste (t tests), depois o teste estatístico (Teste de diferença de médias de dois grupos independentes). G*Power - 2º Exemplo • Depois o tipo da análise, e como estamos fazendo o cálculo para saber quantas pessoas devemos pesquisar, escolheremos o “A priori”. • Precisamos preencher os parâmetros para que seja calculada a amostra. • Primeiro escolher se será um teste bicaudal (usado se os desvios do parâmetro estimado em qualquer direção de algum valor de referência são considerados teoricamente possíveis) ou unicaudal (usado somente se os desvios em uma direção são considerados possíveis). G*Power - 2º Exemplo • Precisamos calcular o tamanho do efeito. O programa calcula, apenas precisamos colocar os valores médios que encontramos no referencial teórico. Colocar o maior desvio padrão das médias. • Digitar o Erro Alfa – comparabilidade, que por convenção em estudos epidemiológicos, consideramos 0,05. • Digitar o Erro Beta – representatividade / força da amostra, que no mínimo deve ser 80%, portanto, 0,80. • E por fim, a razão de alocação que automaticamente é atribuído 1. • Assim, precisaremos de n=102, sendo 51 sedentários e 51 ativos. O conteúdo desse curso foi oferecido pelo Centro Educacional Sete de Setembro em parceria com o Professora Elaine C. Marqueze Profa. Dra. Elaine C Marqueze @EquipeMySete @JessicaJulioti Bioestatística @elaine.marqueze Coleta de dados e Estatística descritiva Coleta e apuração dos dados Coleta e apuração dos dados • Fontes primárias: • Observação, • Questionário ou entrevista. • Diferença entre um questionário e uma entrevista. Coleta e apuração dos dados • Normas para confecção de um questionário: • Elaborar com clareza as perguntas, • Perguntas que facilitem a memória, • Não realize cálculos, Coleta e apuração dos dados • Não usar palavras técnicas no questionário (Não se deve perguntar: Você usa o ácido acetilsalicílico?), • Não fazer perguntas de intenção ou indução (Não se deve perguntar: Assistiu à missa no domingo?). Coleta e apuração dos dados • Não formular uma pergunta que contenha uma resposta (Não se deve perguntar: Você vai ao menos uma vez por semana ao cinema?), • Evitar erros de tempo (Não se deve perguntar: Desde quando usa tal produto?), • Evitar perguntas sugestivas (Não se deve perguntar: Você não acha que as dimensões desta sala são muito reduzidas?), Coleta e apuração dos dados • Permitir uma resposta adicional (Ex: Sim, Não, Não sei, Não quero responder), • Ordenar as perguntas, • Extensão (tempo de pesquisa), • Tabulação (organizar por categoria), • Dados de controle (número do pesquisado). Coleta e apuração dos dados •Tipos de perguntas: • Perguntas fechadas • Perguntas abertas* • *Tabulação dos dados Coleta e apuração dos dados •Entrevista: • Preparar cuidadosamente as frases de apresentação, para ganhar a confiança do entrevistado, • Identificar-se junto ao entrevistado, • Explicar rápida e claramente o objetivo da pesquisa, Coleta e apuração dos dados •Entrevista: • Explicar sucintamente o que espera da pesquisa, • Tranquilizar o entrevistado sobre o uso das informações, • Termo de Consentimento Livre e Esclarecido - TCLE, • Escolher um lugar tranquilo. Coleta e apuração dos dados • Fontes secundárias. • Processamento de dados: • Entrada de dados, • Processamento de dados, • Saída de dados. Tipos de estatística • Estatística descritiva • Estatística inferencial ou indutiva Estatística descritiva • Utilizando o Jamovi para construir um banco de dados e realizar a estatística descritiva. • https://www.jamovi.org https://www.jamovi.org/ Vamos fazer a estatística descritiva no Jamovi? O conteúdo desse curso foi oferecido pelo Centro Educacional Sete de Setembro em parceria com o Professora Elaine C. Marqueze Profa. Dra. Elaine C Marqueze @EquipeMySete @JessicaJulioti Bioestatística @elaine.marqueze Dúvidas dos alunos “Malu Souza - Eu queria q você explicasse a diferença entre DP e variância” Variância da População : σ2 = Σ(xi - μ)2 / N Desvio-padrão da população (σ) é a raiz quadrada da variância: σ = √ Σ(xi - μ)2 / N Variância da Amostra: s2 = v = Σ(xi – x )2 / n – 1 Desvio-padrão (DP) é a raiz quadrada da variância: DP = √ Σ(xi – x )2 / n – 1 https://www.facebook.com/profile.php?id=100004026862559 “Danaê Malimpensa Excelente! Por favor, quando há experimentos com cultura de células, por exemplo, onde o n certamente é menor do que 100. O mesmo raciocínio também se aplica?” Sim, pois os programas de estatísticas consideram o número de observações, sejam elas pessoas, grupos, células, animais, etc. https://www.facebook.com/danae.malimpensa “Professora, a senhora disse que quando não tivermos um programa de testeestatístico para realizar o cálculo de distribuição normal, podemos inferir que será normal se a média for próxima da mediana. O quão longe é aceitável entre esses valores?” A distribuição normal é simétrica em torno da média o que implica que a média, a mediana e a moda são todas coincidentes (iguais). “Considerando um n previamente calculado com perdas (10%). Caso não haja essas perdas ao longo do estudo, o tamanho amostral "maior" do que o necessário irá interferir no poder dos testes estatísticos das diferenças entre os grupos?” Conforme mostrei no G*Power, quanto maior a amostra, maior o erro Beta, portanto, maior o poder amostral. É importante considerar a questão ética no que refere ao n pesquisado. “Considerando o máximo de erro beta permitido e considerando a impossibilidade de randomizar a amostra. Se trabalharmos com o erro beta de 80% e este erro nos permitir, assim, randomizar a amostra de conveniência devido ao menor número de pessoas participantes necessários, qual ofereceria maior poder de resultados? Preferência pela randomização ou trabalhar com erro beta maior?” Dois dados distintos. O erro beta é para determinar o tamanho da amostra. Se essa amostra será randomizada ou não, é um tipo de amostragem. Tipos de Amostragem • Amostragem Não-Probabilística: São amostragens em que há uma escolha deliberada dos elementos da amostra. Depende dos critérios e julgamento do pesquisador. • Amostragem Probabilística: São amostragens em que a seleção é aleatória de tal forma que cada elemento da população tem uma probabilidade conhecida de fazer parte da amostra. São métodos rigorosamente científicos. “Gabriela Boechat Souza Fiquei um pouco confusa sobre a randomização. Por exemplo, se eu quiser fazer um estudo/artigo com pacientes que tenham Parkinson, meu estudo só poderá ser randomizado se eu tiver acesso a toda população de Parkinson do Brasil? ou de algum Estado? Cidade?” A randomização ocorrerá dentro da sua população, mas entende-se por População (N): “qualquer conjunto de informações que tenham entre si uma característica comum que delimite, inequivocamente, quais elementos pertencem a ela.” https://www.facebook.com/gabriela.boechatsouza.9 https://www.facebook.com/gabriela.boechatsouza.9 “Marcinha Dantas Muito bom, professora! Queria muito outro curso que descrevesse a aplicação dos testes. Professora, o teste F é a mesma coisa que análise de variância?” A análise de variância (ANOVA) é utilizado determinar se as médias de três ou mais grupos são diferentes. A ANOVA usa testes F para testar estatisticamente a igualdade entre médias. Os testes-F recebem seu nome da sua estatística de teste, F, que recebeu seu nome em homenagem a Sir Ronald Fisher. A estatística F é simplesmente uma razão de duas variâncias. As variâncias são uma medida de dispersão, ou até que ponto os dados estão dispersos em relação à sua média. Valores maiores representam maior dispersão. A variância é o quadrado do desvio padrão. Para nós humanos, os desvios padrão são mais fáceis de entender do que as variâncias pois estão nas mesmas unidades que os dados, e não nas unidades quadradas. No entanto, muitas análises realmente usam variâncias em seus cálculos. https://www.facebook.com/marcia.marcinha.9022 https://www.facebook.com/marcia.marcinha.9022 “Professora, quando trata-se de pesquisas com animais difere um pouco no que tange a necessidade de verificar a representativa da amostra na população? Tendo em vista a limitação no uso de animais. A senhora pode esclarecer?” Sim, estudos com modelos animais são diferentes. O que passei nesse curso foi sobre o cálculo de amostra com seres humanos. Portanto, para ensaios com animais, a lógica da amostragem é diferente. “Professora, pra fazer o cálculo de amostra sempre será necessário ter dados de estudos prévios ?” Depende. Eu passei para vocês uma fórmula que não precisa dos dados de prevalência ou incidência do desfecho analisado, mas também mostrei o G*power que pede essa informação. Há outros softwares que calculam o tamanho amostral, e eles são distintos também. Em determinados softwares não precisa, por exemplo, das análises estatísticas que serão empregadas. G*Power – 1º Exemplo • Cálculo da força a amostral a posteriori: • Supondo que foi realizado um estudo para comparar a proporção de pessoas sedentárias de acordo com o sexo, e que foi encontrada uma prevalência de sedentarismo entre homens de 65% e entre mulheres 52%. • Primeiro precisaremos selecionar a família do teste (Exact), depois o teste estatístico (Teste de proporção de dois grupos independentes). G*Power - 1º Exemplo • Depois o tipo da análise, e como estamos fazendo o cálculo para saber a força amostral, escolheremos o “Post hoc”. • Precisamos preencher os parâmetros para que seja calculado o poder amostral. • Primeiro escolher se será um teste bicaudal (usado se os desvios do parâmetro estimado em qualquer direção de algum valor de referência serão considerados teoricamente possíveis) ou unicaudal (usado somente se os desvios em uma direção serão considerados possíveis). G*Power - 1º Exemplo • Digitar a proporção dos grupos que foi encontrada: P1=0,65 e P2=0,52. • Digitar o Erro Alfa – comparabilidade, que por convenção em estudos epidemiológicos, consideramos 0,05. • Digitar o tamanho da amostra pesquisada, a supor grupo 1=246 e grupo 2=220. • Assim, teremos uma amostra com força amostral de 80,6% e um Erro Alfa atual de 0,04. G*Power – 2º Exemplo • Cálculo da força a amostral a posteriori: • Supondo que foi realizado um estudo para comparar a média de idade entre as pessoas sedentárias e as pessoas ativas. Vamos supor que a idade média das pessoas sedentárias foi de 35 anos (DP 3,8 anos) e das pessoas ativas 33 anos (DP 3 anos). • Selecionar a família do teste (t tests), depois o teste estatístico (Teste de diferença de médias de dois grupos independentes). G*Power - 2º Exemplo • Depois o tipo da análise, e como estamos fazendo o cálculo para saber a força amostral, escolheremos o “Post hoc”. • Precisamos preencher os parâmetros para que seja calculado o poder amostral. • Primeiro escolher se será um teste bicaudal (usado se os desvios do parâmetro estimado em qualquer direção de algum valor de referência serão considerados teoricamente possíveis) ou unicaudal (usado somente se os desvios em uma direção serão considerados possíveis). G*Power - 2º Exemplo • Precisamos calcular o tamanho do efeito. O programa calcula, apenas precisamos colocar os valores médios que encontramos. Colocar o maior desvio padrão das médias, grupo 1=35 anos (DP 3,8 anos) e grupo 2=33 anos (DP 3 anos). Tamanho do efeito 0,526. • Digitar o Erro Alfa – comparabilidade, que por convenção em estudos epidemiológicos, consideramos 0,05. • Digitar o tamanho da amostra pesquisada, a supor grupo 1=54 e grupo 2=66. • Assim, teremos uma amostra com força amostral de 81,2%. Indicação de livro O conteúdo desse curso foi oferecido pelo Centro Educacional Sete de Setembro em parceria com o Professora Elaine C. Marqueze
Compartilhar