Prévia do material em texto
BIOESTATÍSTICA Conteúdo: Noções sobre Correlação e Regressão CURSO DE MEDICINA VETERINÁRIA Unidade Curricular: Professora: Gabriela Allein Outubro/2024 NOÇÕES SOBRE CORRELAÇÃO Existem situações nas quais interessa estudar o comportamento conjunto de duas variáveis. Por exemplo, dados peso e estatura de pessoas, pode haver interesse em estabelecer em que medida aumenta o peso, quando a estatura aumenta. O comportamento conjunto de duas variáveis quantitativas pode ser observado através de um gráfico, denominado diagrama de dispersão, e medido através do coeficiente de correlação. DIAGRAMA DE DISPERSÃO Para desenhar um diagrama de dispersão, primeiro se traça o sistema de eixos cartesianos. Depois se representa uma das variáveis no eixo das abscissas e a outra variável no eixo das ordenadas. Colocam-se, então, os valores das variáveis sobre os respectivos eixos e marca-se um ponto para cada par de valores. DIAGRAMA DE DISPERSÃO A variável comprimento foi representada no eixo das abscissas e a variável peso foi representada no eixo das ordenadas. O diagrama mostra que comprimento e peso de cães crescem no mesmo sentido. CORRELAÇÃO POSITIVA E CORRELAÇÃO NEGATIVA Se as variáveis X e Y crescem no mesmo sentido, isto é, se quando X cresce Y em média também cresce, diz-se que as duas variáveis têm correlação positiva. Então, peso e comprimento de cães têm correlação positiva porque, quando uma das variáveis cresce, a outra, em média, também cresce. Se as variáveis X e Y variam em sentidos contrários, isto é, se quando X cresce, Y em média decresce, diz-se que as duas variáveis têm correlação negativa. CORRELAÇÃO POSITIVA E CORRELAÇÃO NEGATIVA É fácil ver que consumo individual diário de proteínas de origem animal e coeficiente de natalidade variam em sentidos contrários. Então essas variáveis têm correlação negativa. Consumo individual diário de proteínas de origem animal e coeficiente de natalidade, em 14 países CORRELAÇÃO POSITIVA E CORRELAÇÃO NEGATIVA É importante deixar claro, aqui, que uma correlação positiva entre duas variáveis mostra apenas que essas variáveis crescem no mesmo sentido. A correlação positiva não indica que aumentos sucessivos em uma das variáveis causam aumentos sucessivos na outra variável. Da mesma forma, uma correlação negativa entre duas variáveis mostra apenas que elas variam em sentidos contrários. A correlação negativa não indica que acréscimos em uma das variáveis causam decréscimos na outra variável. Existe correlação negativa entre consumo individual diário de proteínas de origem animal e coeficiente de natalidade, mas isso não significa que um aumento no consumo de proteínas de origem animal causa redução de fertilidade. A correlação negativa entre as duas variáveis talvez seja explicada pela qualidade de vida. E razoável admitir que a melhoria na qualidade de vida de um país determina tanto um aumento no consumo médio de proteínas como uma diminuição no coeficiente de natalidade. COEFICIENTE DE CORRELAÇÃO Existe uma medida para o grau de correlação entre duas variáveis. Essa medida é o coeficiente de correlação de Pearson, que se representa por r e é definido pela fórmula: COEFICIENTE DE CORRELAÇÃO O coeficiente de correlação varia entre -1 e +1, inclusive, isto é, -1 ≤ r ≤ + 1. Se r assume o valor 1, diz-se que as duas variáveis têm correlação perfeita positiva e ser assume o valor -1, diz-se que as duas variáveis têm correlação perfeita negativa. Se r assume o valor zero, não existe correlação entre as duas variáveis (a correlação é nula). COEFICIENTE DE CORRELAÇÃO Um exemplo prático do uso do coeficiente de correlação na medicina veterinária é o estudo da relação entre o peso corporal de cães e a quantidade de alimento consumido diariamente. Exemplo: Imagine que você quer determinar se há uma relação linear entre o peso de diferentes raças de cães e a quantidade de alimento que eles consomem diariamente. Para isso, você mede o peso de 50 cães e registra a quantidade de alimento consumido por cada um durante um período de observação. COEFICIENTE DE CORRELAÇÃO Objetivo: Calcular o coeficiente de correlação para verificar se há uma relação linear entre o peso dos cães e a quantidade de alimento consumido. Interpretação: Se o coeficiente de correlação for positivo e próximo de 1 (por exemplo, 0,85), isso indica que cães com maior peso tendem a consumir mais alimento. Isso pode ajudar a prever a quantidade de ração que um cão deve consumir com base no seu peso. Se o coeficiente for próximo de 0, isso indicaria que não há uma relação linear clara entre peso e consumo de alimento, sugerindo que outros fatores podem estar influenciando o consumo. Se o coeficiente for negativo, seria um resultado inesperado nesse caso, indicando que, à medida que o peso aumenta, o consumo de alimento diminui, o que provavelmente sinalizaria um problema nos dados ou na saúde dos animais. COEFICIENTE DE CORRELAÇÃO Para entender como se aplica esta fórmula, primeiro observe os exemplos: um de correlação positiva e outro de correlação negativa. COEFICIENTE DE CORRELAÇÃO COEFICIENTE DE CORRELAÇÃO COEFICIENTE DE CORRELAÇÃO COEFICIENTE DE CORRELAÇÃO COEFICIENTE DE CORRELAÇÃO COEFICIENTE DE CORRELAÇÃO EXEMPLOS: 01) Calcule o coeficiente de correlação para os dados apresentados na seguinte tabela e interprete. NOÇÕES SOBRE REGRESSÃO Muitas vezes interessa estudar o comportamento conjunto de duas variáveis, como é o caso da correlação. Outras vezes interessa estudar como uma variável varia em função de outra. Por exemplo, considere a questão de idade e peso das crianças. Sempre existe interesse em estudar como o peso varia em função da idade. Quando se estuda a variação de uma variável Y em função de uma variável X, diz-se que Y é a variável dependente e que X é a variável explanatória. No caso do exemplo, sabe-se que o peso das crianças varia em função da idade. Então peso é a variável dependente e idade é a variável explanatória. GRÁFICO DE LINHAS É possível observar a variação de uma variável em função de outra, através do gráfico de linhas. Para fazer o gráfico de linhas, primeiro se traça o sistema de eixos cartesianos. Depois se representa a variável explanatória no eixo das abscissas e a variável dependente no eixo das ordenadas. Colocam-se então os valores das variáveis sobre os respectivos eixos e marca-se um ponto para cada par de valores. Finalmente, considerando a sequência de valores crescentes de X, unem-se os pontos por segmentos de reta. GRÁFICO DE LINHAS RETA DE REGRESSÃO A ideia de regressão fica bem entendida através de um exemplo. Observe os dados apresentados na Tabela abaixo. É fácil ver que a quantidade de procaína (anestésico local) hidrolisada no plasma humano varia em função do tempo decorrido após sua administração. RETA DE REGRESSÃO Os dados da Tabela estão apresentados em diagrama de dispersão. Note que os pontos estão praticamente sobre uma reta. Logo, a variação da quantidade de procaína hidrolisada no plasma humano em função do tempo decorrido após sua administração pode ser descrita através de uma reta que, em estatística, recebe o nome de reta de regressão. Para ajustar uma regressão linear simples (isto é, a equação de uma reta) aos dados apresentados na Tabela, é preciso obter os coeficientes linear e angular da reta. RETA DE REGRESSÃO O coeficiente angular, que dá a inclinação da reta, é representado por b e é obtido através da fórmula: RETA DE REGRESSÃO O coeficiente linear - que é a ordenada do ponto em que a reta corta o eixo das ordenadas - é representado por a e é obtido através da fórmula: 𝑎 = ത𝑦 − 𝑏 ҧ𝑥 Onde ത𝑦 𝑒 ҧ𝑥 são as médias de Y e X, respectivamente. RETA DE REGRESSÃO Reveja, agora, os dados apresentados na Tabela anterior e faça os cálculos intermediários. 𝐚 = ത𝐲 − 𝒃. ത𝐱 RETA DE REGRESSÃO Para traçar a reta de regressão é preciso dar valores arbitráriospara X e depois calcular os valores de Y. Indicam-se os valores calculados de Y por 𝑌. Fazendo X = 5, tem-se 𝑌 = 9,82 Fazendo X = 15, tem-se 𝑌 = 31,42 Os dois pares de valores (X = 5 e 𝑌 = 9,82) e (X = 15 e 𝑌 = 31,42), colocados no gráfico, permitem traçar a reta de regressão ali apresentada, cuja equação é: 𝑌 = −0,98 + 2,16 𝑋 A equação da reta de regressão permite calcular os valores de 𝑌 para quaisquer valores de X dentro do intervalo estudado, mesmo que esses valores não existam na amostra. Observe que não existe o valor X = 13 nos dados apresentados na tabela, mas, para calcular 𝑌 , basta fazer: 𝑌 = −0,98 + 2,16 . 13 = 27,10 O valor 𝑌 = 27,10 é uma previsão, feita com base na equação da reta de regressão, para a quantidade de procaína que estaria hidrolisada13 minutos após sua administração. RETA DE REGRESSÃO São dois conceitos estatísticos que ajudam a entender a relação entre variáveis, mas têm finalidades e interpretações diferentes. Aqui estão as principais diferenças: Correlação: mede a força e a direção da relação linear entre duas variáveis. O coeficiente de correlação, geralmente representado como r, varia de -1 a +1. Valor do Coeficiente: r = 1: Relação positiva perfeita. r = -1: Relação negativa perfeita. r = 0: Nenhuma relação linear. Objetivo: O principal objetivo da correlação é determinar a força e a direção da associação entre as variáveis, sem assumir que uma variável causa a outra. Não Implica Causalidade: A correlação não implica que uma variável cause a outra. Por exemplo, se a correlação entre o número de horas de estudo e as notas em exames for alta, isso não significa necessariamente que estudar mais causa melhores notas. Aplicação: Útil para exploração inicial de dados e para entender padrões antes de fazer análises mais profundas. CORRELAÇÃO X REGRESSÃO Regressão: analisa a relação funcional entre uma variável dependente (a que se deseja prever ou explicar) e uma ou mais variáveis independentes (as que se usam para fazer a previsão). Modelo: A regressão é frequentemente expressa na forma de uma equação, como 𝑦 = 𝑎 + 𝑏𝑥 onde: Y: variável dependente X: variável independente. a: intercepto (valor de Y quando X=0). b: coeficiente angular (magnitude da mudança em Y para cada unidade de mudança em X). Objetivo: O principal objetivo da regressão é fazer previsões e entender como as variáveis independentes afetam a variável dependente. Implicações de Causalidade: A regressão pode sugerir relações de causalidade, mas ainda assim requer interpretação cuidadosa e considerações adicionais sobre o desenho do estudo. Aplicação: Usada para previsão, modelagem e análise de variáveis em muitos campos, incluindo medicina veterinária, economia e ciências sociais. CORRELAÇÃO X REGRESSÃO Correlação = Medida da relação (força e direção) entre duas variáveis. Regressão = Análise da relação funcional entre variáveis, visando prever uma a partir de outra. CORRELAÇÃO X REGRESSÃO Correlação: Pode-se calcular a correlação entre a quantidade de ração fornecida e o ganho de peso em um grupo de bezerros. Um coeficiente de correlação positivo indicaria que, à medida que a ração aumenta, o ganho de peso também tende a aumentar. Regressão: Usando a mesma situação, a regressão pode modelar a relação específica, permitindo prever o ganho de peso em função da quantidade de ração. A equação resultante pode informar sobre a quantidade de ração necessária para alcançar um ganho de peso desejado. EXEMPLO OBRIGADA PELA PRESENÇA! E-mail: gabriela.allein@unidavi.edu.br REFERÊNCIAS CRESPO, Antônio Arnot. Estatística: fácil. 19. ed. atual. São Paulo: Saraiva, 2010. 218 p. VIEIRA, Sônia. Introdução à bioestatística. 3. ed. Rio de Janeiro: Campus, 2003. 196 p. ISBN 8535202595