Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina: Bioestatística Aplicada à Saúde Tutora: Kelin Luana Casagranda UNIDADE 2 ESTATÍSTICA INFERENCIAL TÉCNICAS ESTATÍSTICAS VARIADAS TÉCNICAS DE AMOSTRAGEM E CÁLCULO DE TAMANHO AMOSTRAL TÉCNICAS ESTATÍSTICAS VARIADAS Técnicas estatísticas são métodos e procedimentos utilizados para coletar, organizar, analisar e interpretar dados, com o objetivo de obter informações relevantes e tomar decisões embasadas em evidências CORRELAÇÃO DE DADOS A correlação é uma medida estatística que indica a relação entre duas ou mais variáveis. Essa medida é expressa por um coeficiente que varia de -1 a +1, indicando a direção (positiva ou negativa) e a força da relação entre as variáveis. Quando há uma correlação positiva entre duas variáveis, significa que elas variam juntas na mesma direção, ou seja, quando uma aumenta, a outra também aumenta. Já a correlação negativa indica Os dados são representados em um gráfico cartesiano de pontos, que chamamos de diagrama de dispersão. Cada ponto do gráfico corresponde a um aluno e é marcado segundo seu valor para X e para Y. Figura 1 – Gráfico de dispersão sobre a relação entre desempenho em ciências (x) e tempo de sono (y) Uma correlação dita perfeita é aquela cujos valores tendem a ser observados de forma mais linear; ou seja, quando observamos que, aumentando os valores de x, os valores de y tendem a aumentar. Quando os dados observados passam por cima da equação, ou seja, da linha, dizemos que o ajuste é perfeito (MARTINEZ, 2015). Medidas de correlação O coeficiente de correlação de Pearson é o mais comum e é usado para medir a correlação entre duas variáveis que têm uma relação linear. Ele varia de -1 a 1, onde -1 indica uma correlação negativa perfeita, 0 indica nenhuma correlação e 1 indica uma correlação positiva perfeita. Este coeficiente é sensível a valores extremos e requer que as variáveis tenham uma distribuição normal ou aproximadamente normal. O coeficiente de correlação de Spearman (ρ)- é usado para medir a correlação entre duas variáveis que não têm uma relação linear. Em vez de medir a relação entre os valores brutos das variáveis, ele mede a relação entre os seus valores de classificação. Ele varia de -1 a 1, onde -1 indica uma correlação negativa perfeita, 0 indica nenhuma correlação e 1 indica uma correlação positiva perfeita. O coeficiente de correlação de Spearman é menos sensível a valores extremos e não requer que as variáveis tenham uma distribuição normal. O coeficiente de correlação de Kendall ( de Kendall) é semelhante ao coeficiente de Spearman, mas é usado quando as variáveis são classificadas ordinalmente e há empates nos dados. Ele mede a relação entre os pares de dados que são classificados da mesma forma nas duas variáveis. O coeficiente de Kendall varia de -1 a 1, onde -1 indica uma correlação negativa perfeita, 0 indica nenhuma correlação e 1 indica uma correlação positiva perfeita. Interpretação da correlação Na área da saúde, o coeficiente de correlação pode ser usado para analisar a relação entre diferentes fatores e doenças, como por exemplo, a relação entre a atividade física e a saúde cardíaca,(Relações Positivas). Estudos têm demonstrado que quanto mais ativo fisicamente uma pessoa é, menor é o risco de doenças cardíacas (Relação Negativa). Se o coeficiente de correlação entre a atividade física e a saúde cardíaca for próximo a 1, indica uma forte correlação positiva entre as variáveis, ou seja, quanto mais ativo fisicamente uma pessoa é, menor é o risco de doenças cardíacas. Portanto, os coeficientes de correlação informam a intensidade (utilizando um intervalo entre -1 e 1) e a direção (positiva ou negativa) além da significância (utilizando de valor de p). Exemplo em pesquisa em saúde Correlação e Regressão Simples Só vamos falar de correlação e regressão linear simples, i.e., no caso de uma variável dependente (Y) e uma variável independente (X). Exemplos: 1. Relação entre o peso e a altura de um homem adulto. A variável dependente é o peso e a variável independente a altura. 2. A relação entre o preço do vinho e o montante da colheita em cada ano. Aqui a variável dependente é o preço do vinho e a variável independente o montante da colheita. LINKS VÍDEOS https://www.youtube.com/watch?v=lL ruuh WEBkit=118s https://www.youtube.com/watch?v=tYROiFQazzQ https://www.youtube.com/watch?v=DTF0jt3ROVU&t=320s https://www.youtube.com/watch?v=lLkrCuuhWBk&t=118s https://www.youtube.com/watch?v=tYROiFQazzQ https://www.youtube.com/watch?v=DTF0jt3ROVU&t=320s REGRESSÃO A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente e outras variáveis chamadas variáveis independentes. Este relacionamento é representado por um modelo matemático, i.e., por uma equação que associa a variável dependente com as variáveis independentes A principal função da regressão é estabelecer a relação de causa e efeito entre duas variáveis quantitativas. Seriam elas X (variável dependente do observador e independente no cálculo) e Y (variável independente do observador e na equação): Y é função de X. Sendo assim, Segundo Martinez (2015), os objetivos da regressão linear são: ● Avaliar uma possível dependência de y em relação a x. ● Expressar matematicamente essa relação por meio de uma equação. Tipos de regressão Regressão Linear Simples: é utilizada para modelar a relação entre duas variáveis contínuas, uma variável independente e uma variável dependente. Nessa técnica, é criada uma linha reta que representa a relação entre as duas variáveis. Por exemplo, a regressão linear simples pode ser utilizada para modelar a relação entre o tempo de estudo e a nota obtida em uma prova. A linha de regressão criada pode ser usada para prever a nota obtida em uma prova com base no tempo de estudo. Regressão Linear Múltipla: é usada para modelar a relação entre uma variável dependente e duas ou mais variáveis independentes. Essa técnica é uma extensão da regressão linear simples. Por exemplo, a regressão linear múltipla pode ser utilizada para modelar a relação entre o preço de um imóvel e várias variáveis, como o tamanho do imóvel, o número de quartos, a localização, entre outros. A regressão linear múltipla pode ajudar a entender a importância relativa de cada uma dessas variáveis na determinação do preço do imóvel. Regressão Não-Linear: é usada para modelar a relação entre uma variável dependente e uma ou mais variáveis independentes, quando essa relação não é linear. A regressão não-linear é usada quando a relação entre as variáveis não pode ser representada por uma linha reta. Existem muitos tipos de regressão não-linear, cada um utilizado para diferentes cenários e tipos de dados. Um exemplo de regressão não-linear é a regressão logística, utilizada para modelar a relação entre uma variável dependente binária (por exemplo, sim ou não) e uma ou mais variáveis independentes. A regressão logística é amplamente utilizada em áreas como a medicina e a psicologia para prever o risco de um evento (como uma doença) com base em variáveis como a idade, o sexo e o histórico médico do paciente. EXEMPLOS ● Análise de dados de mercado: a correlação pode ser usada para analisar a relação entre o preço de um produto e a quantidade vendida. Já a regressão pode ser usada para prever a demanda futura de um produto com base no histórico de vendas. ● Análise de dados de saúde: a correlação pode ser usada para analisar a relação entre o índice de massa corporal e o risco de doenças cardíacas. Já a regressão pode ser usada para prever o risco de desenvolver uma doença com base em fatores como idade, sexo e histórico familiar. ● Análise de dados financeiros: a correlação pode ser usada para analisar a relação entre o desempenho de duas ações na bolsa de valores. Já a regressão pode ser usada para prever o retorno de um investimento com base em fatores como taxa de juros e inflação.EXEMPLOS ● Análise de risco: a correlação e a regressão podem ser usadas para avaliar o risco de um determinado investimento ou evento, com base em dados históricos. ● Análise de previsão de vendas: a regressão pode ser usada para prever as vendas futuras de um produto com base em dados de vendas anteriores e fatores externos, como clima e sazonalidade. ● Análise de previsão de demanda: a regressão pode ser usada para prever a demanda futura de um serviço com base em dados históricos e fatores externos, como o crescimento da população e mudanças nas preferências do consumidor. TESTE T •O teste t Student, é o método mais utilizado para se avaliar as diferenças entre as médias entre dois grupos. Por exemplo, pode ser usado para testar o efeito provocado por um programa de atividade física. •Grupo experimental – sujeitos que realizaram o programa; •Grupo controle – sujeitos que não participaram do programa de atividade física. Comparar a média de uma amostra com a de uma população • Averigua se a média da amostra é diferente de um valor de referência ou da média da população. • A hipóteses a serem testadas são: H0 : a média da amostra é igual à média da referência (ou população). H1 : a média da amostra é diferente à média da referência (ou população). Fórmula TÉCNICAS DE AMOSTRAGEM E CÁLCULO DE TAMANHO AMOSTRAL Amostragem A amostra deve ter precisão/poder suficiente/adequado para fazermos inferências válidas. Poder suficiente para detectar diferenças ou efeitos quando estes estiverem presentes; precisão suficiente expressa em termos de magnitude da margem de erro. Universo ou população Indivíduos com os quais obteremos a informação necessária ao alcance dos objetivos de pesquisa. Amostra Parcela da população de interesse selecionada. Estrutura da amostra: listagem de todos os elementos da população. Unidade de análise Do objetivo do estudo. Caracterizar uma variável ainda não investigada na população (estimação). Comparar duas populações em relação a um certo desfecho (teste de hipóteses). Verificar uma possível associação entre duas variáveis (teste de hipóteses). Do tipo de desfecho. Desfechos quantitativos: maiores amostras para dados mais dispersos. Desfechos qualitativos: geralmente exigem amostras maiores que os quantitativos Amostragem probabilística Adota parâmetros estatísticos para garantir que todos os elementos da população terão igual probabilidade de serem selecionados. Amostragem não-probabilística A amostra é selecionada por critérios estabelecidos pelo pesquisador, de acordo com os objetivos do estudo Técnicas de amostragem probabilística • Amostragem probabilística simples – Escolha aleatória dos elementos que comporão a amostra. – Todos os elementos têm igual probabilidade. – Vantagem: resultados podem ser projetados. – Desvantagem: baixa precisão e baixa garantia de representatividade. • Amostragem probabilística sistemática – Elementos são selecionados a partir de uma listagem existente, aleatoriamente, estabelecendo-se um intervalo entre eles. – Ponto de partida aleatório. – Intervalo = tamanho da população / tamanho da amostra. – Vantagem: maior representatividade. – Desvantagem: necessidade de um mailing que sirva de base para seleção dos elementos. Principais conceitos População – População, em termos estatísticos, nada mais é do que a totalidade dos fatores que queremos analisar. Seja o total de pessoas que moram na região do nosso interesse, seja o total de organismos que vivem em determinado ecossistema. Grau de confiança – O termo confiança, dentro das técnicas de amostragem, significa o quanto estamos dispostos a abrir mão de “certeza” para termos uma amostra mais eficiente. Podemos pensar em confiança como um intervalo de probabilidades, onde, quanto maior for o grau de confiança estabelecido, maior será o intervalo de resultados possíveis dentro de uma amostra. Assim, Delimitamos esse intervalo em desvios padrões, ou seja, o quanto a nossa amostra poderá se desviar da verdadeira média da população, com um determinado grau de confiança. Margem de erro – É a diferença entre a média encontrada na amostra para a média da população. Dentro do cálculo de amostragem, a margem de erro entra como um dos parâmetros a serem inseridos. Logo, podemos perceber uma relação inversamente proporcional entre a margem de erro e o tamanho da amostra: quanto menor for a margem de erro máxima desejada, maior terá de ser a amostra. Aleatoriedade – Para termos os resultados mais próximos da verdadeira população, a seleção da nossa amostra deve ser totalmente aleatória.. Cálculo da amostra O tamanho da amostra é determinado pelo nível de confiança desejado, o erro de estimação aceitável e a variância da população. • O cálculo estatístico da amostra pode apresentar uma variância com relação ao parâmetro da população. • Essa diferença é a medida de confiabilidade dos resultados. • A estimação, baseada na estatística da amostra, possui um intervalo que reflete sua variância e o nível de confiança. CÁLCULO AMOSTRAL O que levar em consideração ao calcular o tamanho da amostra Se você quiser uma margem de erro menor, é necessário ter uma amostra de tamanho maior, considerando a mesma população. Quanto maior o nível de confiança da amostra, maior será o tamanho dela. O tamanho da amostra em cada tipo de pesquisa É importante ter uma amostra com tamanho estatisticamente relevante? Em geral, a regra é: quanto maior o tamanho da amostra, maior é a relevância estatística dela, ou seja, menor é a chance de os resultados serem apenas coincidência. Pesquisas em saúde Ao aplicar questionários de saúde, uma amostra com tamanho estatisticamente relevante pode ajudar a descobrir quais problemas de saúde mais preocupam cada paciente. Ela também pode ajudar a chegar a conclusões em pesquisas médicas. No entanto, se você estiver usando questionários de saúde para fins de satisfação do paciente ou para descobrir o atendimento que ele normalmente recebe, uma amostra com tamanho estatisticamente relevante pode não ser tão importante. Ainda é possível obter informações valiosas dos pacientes sobre suas necessidades e experiência sem um tamanho estatisticamente relevante da amostra. https://pt.surveymonkey.com/mp/healthcare-surveys/
Compartilhar