Prévia do material em texto
Estatística, técnicas e análise experimental FACULDADE DE JUSSARA CURSO: AGRONOMIA PROFESSORA: Mestra Amanda Oliveira 4° periodo UNIDADE 4 Regressão Linear Ao final desta Unidade de Aprendizagem, você deve apresentar os seguintes aprendizados: Definir regressão linear. Reconhecer a diferença entre regressão e interpolação. Utilizar a regressão linear para ajustar uma reta a um conjunto de dados. APRESENTAÇÃO Estabelecer as relações entre variáveis a fim de prever uma em relação à outra é bastante comum em situações na área da estatística, como ao prever o preço da venda de uma casa em termos de variáveis, como a quantidade de quartos e banheiros. Para isso, deve-se encontrar uma relação entre as variáveis, que pode ser linear, quadrática ou polinomial, por exemplo. Introdução Muitas vezes é de interesse estudar-se um elemento em relação a dois ou mais atributos ou variáveis simultaneamente. Nesses casos presume-se que pelo menos duas observações são feitas sobre cada elemento da amostra. A amostra consistirá, então, de pares de valores, um valor para cada uma das variáveis, designadas, X e Y. Um indivíduo “i” qualquer apresenta o par de valores (Xi ; Yi ). Objetivo visado quando se registra pares de valores (observações) em uma amostra, é o estudo das relações entre as variáveis X e Y. Para a análise de regressão interessam principalmente os casos em que a variação de um atributo é sensivelmente dependente do outro atributo. O problema consiste em estabelecer a função matemática que melhor exprime a relação existente entre as duas variáveis. Simbolicamente a relação é expressa por uma equação de regressão e graficamente por uma curva de regressão. Definição Constitui uma tentativa de estabelecer uma equação matemática linear que descreva o relacionamento entre duas variáveis (uma dependente e outra independente). A equação de regressão tem por finalidade ESTIMAR valores de uma variável, com base em valores conhecidos da outra. Ex.: Peso x Idade; Vendas x Lucro; Nota x Horas de Estudo Conceito Suponha que você tenha dados referentes a duas variáveis, e a partir deles você pode encontrar uma relação ou equação matemática que descreva esses dados, e com isso é possível fazer previsões a respeito de seus dados originais. Essa relação pode ser de diversos tipos, como linear, quadrática ou exponencial, por exemplo, e feita a partir dos gráficos dessas variáveis, assim, é preciso ajustar uma curva aos gráficos. Conceito A Figura 1 mostra um exemplo de aproximação linear a partir da análise da dispersão de dados de peso versus altura e outro de aproximação não-linear a partir da visualização da dispersão de dados de quantidade de apresentações versus tempo. Conceito Conceito A Figura 2 mostra exemplos de equações matemáticas possíveis para os modelos linear e polinomial. As variáveis são denotadas por X e Y, denominadas variáveis independentes e dependentes, respectivamente. Os an são constantes, conhecidos como coeficientes, com n ≥ 0. Conceito A regressão linear se utiliza de um modelo linear para ajustar dados e fazer previsões, as equações lineares: y = a + bx onde a é uma constante que representa o corte da reta no eixo y, também conhecida como intercepto, ou seja, o valor de y quando x = 0; e b é uma constante referente à inclinação da reta (FREUND, 2007). A partir da reta estimada, pode-se fazer previsões, ou seja, dado um valor de x, pertencente aos dados originais, é possível encontrar o valor estimado de y. Regressão e interpolação Observe que na Figura 1, na seção anterior, os pontos são aproximados por determinada função matemática, tornando possível encontrar uma equação que melhor se ajuste aos pontos. Embora a curva encontrada seja a melhor possível, ela não passa necessariamente por todos os pontos dados. Já a interpolação é um método que possibilita a criação de novos dados a partir de dados discretos. Isso significa que o objetivo da interpolação é encontrar os dados “faltantes” entre os pontos dados e, portanto, podem ser criadas funções interpoladoras no conjunto de dados, a fim de conectar os pontos dados (JUSTO et al., 2020). Em relação aos tipos de interpolação, os mais comuns são a linear e polinomial. A Figura 3 mostra exemplos desses tipos de interpolação. exemplos Observe que a interpolação também gera uma aproximação dos pontos, mas ela passa por todos eles obrigatoriamente, gerando curvas de dados. Com ela, também podemos inferir valores de y a partir de valores de x diferentes dos pontos dados iniciais. Assim, pode-se dizer que há duas abordagens para fazer ajustes de curvas (CHAPRA; CANALE, 2016). Na primeira, o dado exibe alto grau de erro ou “ruído”, seu objetivo é encontrar uma curva de tendência, e o método utilizado para isso é denominado regressão por mínimos quadrados. Na segunda, os dados são considerados mais precisos, assim, ajustam-se curvas que passam por todos os pontos, e o método utilizado nesse caso é chamado de interpolação. Caracterizando o assunto Aprofundando o conhecimento Regressão linear simples - Relação entre variáveis Modelo de regressão Modelo de regressão linear simples Método de mínimos quadrados Para determinar estimadores para b0 e b1, normalmente emprega-se o método de mínimos quadrados, que considera a soma dos quadrados dos desvios de Y com relação ao seu valor esperado: Sendo que, de acordo com esse método, os estimadores de b0 e b1 são os valores que minimizam Q. Estimadores de mínimos quadrados Infográfico image1.jpeg image2.jpeg image3.png image4.png image5.jpeg image6.png image7.png image8.png image9.png image10.png image11.png image12.png image13.png image14.png image15.png image16.png image17.png image18.png image19.png image20.png image21.png image22.png image23.png image24.png image25.png image26.png image27.png image28.png image29.png image30.jpeg