Buscar

Bioestatistica 3

Prévia do material em texto

Disciplina: Bioestatística Aplicada à Saúde
Tutora: Kelin Luana Casagranda
UNIDADE 2 
ESTATÍSTICA INFERENCIAL
TÉCNICAS ESTATÍSTICAS VARIADAS
TÉCNICAS DE AMOSTRAGEM E CÁLCULO 
DE TAMANHO AMOSTRAL
TÉCNICAS ESTATÍSTICAS VARIADAS
Técnicas estatísticas são métodos e procedimentos 
utilizados para coletar, organizar, analisar e interpretar 
dados, com o objetivo de obter informações 
relevantes e tomar decisões embasadas em 
evidências
CORRELAÇÃO DE DADOS
A correlação é uma medida estatística que indica a relação entre duas ou 
mais variáveis. Essa medida é expressa por um coeficiente que varia de -1 a 
+1, indicando a direção (positiva ou negativa) e a força da relação entre as 
variáveis. 
Quando há uma correlação positiva entre duas variáveis, significa que elas 
variam juntas na mesma direção, ou seja, quando uma aumenta, a outra 
também aumenta. Já a correlação negativa indica
Os dados são representados em um gráfico cartesiano de pontos, que chamamos de 
diagrama de dispersão. Cada ponto do gráfico corresponde a um aluno e é marcado segundo 
seu valor para X e para Y.
Figura 1 – Gráfico de dispersão sobre a 
relação entre desempenho em ciências 
(x) e tempo de sono (y)
Uma correlação dita perfeita é aquela cujos valores tendem a ser 
observados de forma mais linear; ou seja, quando observamos que, 
aumentando os valores de x, os valores de y tendem a aumentar. 
Quando os dados observados passam por cima da equação, ou seja, 
da linha, dizemos que o ajuste é perfeito (MARTINEZ, 2015).
 Medidas de correlação
O coeficiente de correlação de Pearson é o mais comum e é usado para medir a correlação entre 
duas variáveis que têm uma relação linear. Ele varia de -1 a 1, onde -1 indica uma correlação 
negativa perfeita, 0 indica nenhuma correlação e 1 indica uma correlação positiva perfeita. Este 
coeficiente é sensível a valores extremos e requer que as variáveis tenham uma distribuição normal 
ou aproximadamente normal.
O coeficiente de correlação de Spearman (ρ)- é usado para medir a correlação entre duas 
variáveis que não têm uma relação linear. Em vez de medir a relação entre os valores brutos das 
variáveis, ele mede a relação entre os seus valores de classificação. Ele varia de -1 a 1, onde -1 
indica uma correlação negativa perfeita, 0 indica nenhuma correlação e 1 indica uma correlação 
positiva perfeita. O coeficiente de correlação de Spearman é menos sensível a valores extremos e 
não requer que as variáveis tenham uma distribuição normal.
O coeficiente de correlação de Kendall ( de Kendall) é semelhante ao coeficiente de Spearman, 
mas é usado quando as variáveis são classificadas ordinalmente e há empates nos dados. Ele 
mede a relação entre os pares de dados que são classificados da mesma forma nas duas variáveis. 
O coeficiente de Kendall varia de -1 a 1, onde -1 indica uma correlação negativa perfeita, 0 indica 
nenhuma correlação e 1 indica uma correlação positiva perfeita.
Interpretação da correlação
Na área da saúde, o coeficiente de correlação pode ser usado para analisar a 
relação entre diferentes fatores e doenças, como por exemplo, a relação entre a 
atividade física e a saúde cardíaca,(Relações Positivas). Estudos têm demonstrado 
que quanto mais ativo fisicamente uma pessoa é, menor é o risco de doenças 
cardíacas (Relação Negativa). 
Se o coeficiente de correlação entre a atividade física e a saúde cardíaca for 
próximo a 1, indica uma forte correlação positiva entre as variáveis, ou seja, quanto 
mais ativo fisicamente uma pessoa é, menor é o risco de doenças cardíacas.
Portanto, os coeficientes de correlação informam a intensidade (utilizando um 
intervalo entre -1 e 1) e a direção (positiva ou negativa) além da significância 
(utilizando de valor de p). 
Exemplo em pesquisa em saúde
Correlação e Regressão Simples 
Só vamos falar de correlação e regressão linear simples, i.e., no 
caso de uma variável dependente (Y) e uma variável independente 
(X). 
Exemplos: 
1. Relação entre o peso e a altura de um homem adulto. A variável 
dependente é o peso e a variável independente a altura. 
2. A relação entre o preço do vinho e o montante da colheita em cada 
ano. Aqui a variável dependente é o preço do vinho e a variável 
independente o montante da colheita. 
LINKS VÍDEOS
https://www.youtube.com/watch?v=lL ruuh WEBkit=118s
https://www.youtube.com/watch?v=tYROiFQazzQ
https://www.youtube.com/watch?v=DTF0jt3ROVU&t=320s
https://www.youtube.com/watch?v=lLkrCuuhWBk&t=118s
https://www.youtube.com/watch?v=tYROiFQazzQ
https://www.youtube.com/watch?v=DTF0jt3ROVU&t=320s
REGRESSÃO
A análise de regressão estuda o relacionamento entre uma variável 
chamada a variável dependente e outras variáveis chamadas 
variáveis independentes. 
Este relacionamento é representado por um modelo matemático, i.e., 
por uma equação que associa a variável dependente com as 
variáveis independentes
A principal função da regressão é estabelecer a relação de causa e 
efeito entre duas variáveis quantitativas. Seriam elas X (variável 
dependente do observador e independente no cálculo) e Y (variável 
independente do observador e na equação): Y é função de X. Sendo 
assim, Segundo Martinez (2015), os objetivos da regressão linear 
são:
● Avaliar uma possível dependência de y em relação a x.
● Expressar matematicamente essa relação por meio de uma 
equação.
Tipos de regressão
Regressão Linear Simples: é utilizada para modelar a relação 
entre duas variáveis contínuas, uma variável independente e uma 
variável dependente. Nessa técnica, é criada uma linha reta que 
representa a relação entre as duas variáveis. Por exemplo, a 
regressão linear simples pode ser utilizada para modelar a relação 
entre o tempo de estudo e a nota obtida em uma prova. A linha de 
regressão criada pode ser usada para prever a nota obtida em uma 
prova com base no tempo de estudo.
Regressão Linear Múltipla: é usada para modelar a relação entre uma variável 
dependente e duas ou mais variáveis independentes. Essa técnica é uma extensão da 
regressão linear simples. Por exemplo, a regressão linear múltipla pode ser utilizada 
para modelar a relação entre o preço de um imóvel e várias variáveis, como o tamanho 
do imóvel, o número de quartos, a localização, entre outros. A regressão linear múltipla 
pode ajudar a entender a importância relativa de cada uma dessas variáveis na 
determinação do preço do imóvel.
Regressão Não-Linear: é usada para modelar a relação entre uma variável dependente 
e uma ou mais variáveis independentes, quando essa relação não é linear. A regressão 
não-linear é usada quando a relação entre as variáveis não pode ser representada por 
uma linha reta. Existem muitos tipos de regressão não-linear, cada um utilizado para 
diferentes cenários e tipos de dados. Um exemplo de regressão não-linear é a regressão 
logística, utilizada para modelar a relação entre uma variável dependente binária (por 
exemplo, sim ou não) e uma ou mais variáveis independentes. A regressão logística é 
amplamente utilizada em áreas como a medicina e a psicologia para prever o risco de 
um evento (como uma doença) com base em variáveis como a idade, o sexo e o 
histórico médico do paciente.
EXEMPLOS
● Análise de dados de mercado: a correlação pode ser usada para 
analisar a relação entre o preço de um produto e a quantidade vendida. 
Já a regressão pode ser usada para prever a demanda futura de um 
produto com base no histórico de vendas.
● Análise de dados de saúde: a correlação pode ser usada para analisar 
a relação entre o índice de massa corporal e o risco de doenças 
cardíacas. Já a regressão pode ser usada para prever o risco de 
desenvolver uma doença com base em fatores como idade, sexo e 
histórico familiar.
● Análise de dados financeiros: a correlação pode ser usada para 
analisar a relação entre o desempenho de duas ações na bolsa de 
valores. Já a regressão pode ser usada para prever o retorno de um 
investimento com base em fatores como taxa de juros e inflação.EXEMPLOS
● Análise de risco: a correlação e a regressão podem ser usadas para 
avaliar o risco de um determinado investimento ou evento, com base em 
dados históricos.
● Análise de previsão de vendas: a regressão pode ser usada para 
prever as vendas futuras de um produto com base em dados de vendas 
anteriores e fatores externos, como clima e sazonalidade.
● Análise de previsão de demanda: a regressão pode ser usada para 
prever a demanda futura de um serviço com base em dados históricos e 
fatores externos, como o crescimento da população e mudanças nas 
preferências do consumidor.
TESTE T
•O teste t Student, é o método mais utilizado para se avaliar as 
diferenças entre as médias entre dois grupos. Por exemplo, pode ser 
usado para testar o efeito provocado por um programa de atividade 
física. 
•Grupo experimental – sujeitos que realizaram o programa; 
•Grupo controle – sujeitos que não participaram do programa de 
atividade física.
Comparar a média de uma amostra com a de uma população 
• Averigua se a média da amostra é diferente de um valor de 
referência ou da média da população. 
• A hipóteses a serem testadas são:
 H0 : a média da amostra é igual à média da referência (ou 
população).
 H1 : a média da amostra é diferente à média da referência (ou 
população).
Fórmula
TÉCNICAS DE AMOSTRAGEM
E CÁLCULO DE TAMANHO AMOSTRAL
Amostragem
A amostra deve ter precisão/poder suficiente/adequado para 
fazermos inferências válidas.
 Poder suficiente para detectar diferenças ou efeitos quando estes 
estiverem presentes; precisão suficiente expressa em termos de 
magnitude da margem de erro.
Universo ou população Indivíduos com os quais obteremos a 
informação necessária ao alcance dos objetivos de pesquisa. 
Amostra Parcela da população de interesse selecionada. Estrutura 
da amostra: listagem de todos os elementos da população. Unidade 
de análise
Do objetivo do estudo. 
Caracterizar uma variável ainda não investigada na população 
(estimação). Comparar duas populações em relação a um certo 
desfecho (teste de hipóteses). Verificar uma possível associação 
entre duas variáveis (teste de hipóteses). 
Do tipo de desfecho. 
Desfechos quantitativos: maiores amostras para dados mais 
dispersos. Desfechos qualitativos: geralmente exigem amostras 
maiores que os quantitativos
Amostragem probabilística 
Adota parâmetros estatísticos para garantir que todos os elementos 
da população terão igual probabilidade de serem selecionados. 
Amostragem não-probabilística
 A amostra é selecionada por critérios estabelecidos pelo 
pesquisador, de acordo com os objetivos do estudo
Técnicas de amostragem probabilística
• Amostragem probabilística simples 
– Escolha aleatória dos elementos que comporão a amostra. – Todos os 
elementos têm igual probabilidade. – Vantagem: resultados podem ser 
projetados. – Desvantagem: baixa precisão e baixa garantia de 
representatividade. 
• Amostragem probabilística sistemática
 – Elementos são selecionados a partir de uma listagem existente, 
aleatoriamente, estabelecendo-se um intervalo entre eles. – Ponto de partida 
aleatório. – Intervalo = tamanho da população / tamanho da amostra. – 
Vantagem: maior representatividade. – Desvantagem: necessidade de um mailing 
que sirva de base para seleção dos elementos.
Principais conceitos
 População – População, em termos estatísticos, nada mais é do que a totalidade 
dos fatores que queremos analisar. Seja o total de pessoas que moram na região 
do nosso interesse, seja o total de organismos que vivem em determinado 
ecossistema.
 Grau de confiança – O termo confiança, dentro das técnicas de amostragem, 
significa o quanto estamos dispostos a abrir mão de “certeza” para termos uma 
amostra mais eficiente.
Podemos pensar em confiança como um intervalo de probabilidades, onde, quanto 
maior for o grau de confiança estabelecido, maior será o intervalo de resultados 
possíveis dentro de uma amostra. Assim, Delimitamos esse intervalo em desvios 
padrões, ou seja, o quanto a nossa amostra poderá se desviar da verdadeira 
média da população, com um determinado grau de confiança.
 Margem de erro – É a diferença entre a média encontrada na amostra para a 
média da população. Dentro do cálculo de amostragem, a margem de erro entra 
como um dos parâmetros a serem inseridos. Logo, podemos perceber uma relação 
inversamente proporcional entre a margem de erro e o tamanho da amostra: 
quanto menor for a margem de erro máxima desejada, maior terá de ser a amostra.
 Aleatoriedade – Para termos os resultados mais próximos da verdadeira 
população, a seleção da nossa amostra deve ser totalmente aleatória..
Cálculo da amostra
O tamanho da amostra é determinado pelo nível de confiança 
desejado, o erro de estimação aceitável e a variância da população. 
• O cálculo estatístico da amostra pode apresentar uma variância 
com relação ao parâmetro da população. 
• Essa diferença é a medida de confiabilidade dos resultados. 
• A estimação, baseada na estatística da amostra, possui um 
intervalo que reflete sua variância e o nível de confiança.
CÁLCULO AMOSTRAL
O que levar em consideração ao calcular o 
tamanho da amostra
 Se você quiser uma margem de erro menor, é necessário ter uma amostra de 
tamanho maior, considerando a mesma população.
 Quanto maior o nível de confiança da amostra, maior será o tamanho dela.
O tamanho da amostra em cada tipo de 
pesquisa
É importante ter uma amostra com tamanho estatisticamente relevante? Em geral, a 
regra é: quanto maior o tamanho da amostra, maior é a relevância estatística dela, 
ou seja, menor é a chance de os resultados serem apenas coincidência.
Pesquisas em saúde
Ao aplicar questionários de saúde, uma amostra com tamanho 
estatisticamente relevante pode ajudar a descobrir quais problemas de 
saúde mais preocupam cada paciente. Ela também pode ajudar a chegar a 
conclusões em pesquisas médicas. No entanto, se você estiver usando 
questionários de saúde para fins de satisfação do paciente ou para 
descobrir o atendimento que ele normalmente recebe, uma amostra com 
tamanho estatisticamente relevante pode não ser tão importante. Ainda é 
possível obter informações valiosas dos pacientes sobre suas 
necessidades e experiência sem um tamanho estatisticamente relevante 
da amostra.
https://pt.surveymonkey.com/mp/healthcare-surveys/

Continue navegando