Baixe o app para aproveitar ainda mais
Prévia do material em texto
Regressão Linear • A correlação e a regressão são dois aspectos que andam sempre muito ligados. Assim, importa fa zermos a distinção entre eles: ▫ A correlação pode ser definida como o grau de semelhança no sentido das variações entre os valor es correspondentes dos dois caracteres, isto é, a corr elação preocupa‐se com a descrição da relação entre variáveis. ▫ A regressão é usada quando tentamos predizer u ma variável quando conhecemos a outra. REVISÃO - MODELOS LINEARES • O formato geral de uma equação linear simples é: y = a + bx ▫ x é a variável dependente. ▫ y é a variável independente. a é a constante que representa o ponto onde a linha reta corta o eixo y (conhecida como a intercepção). b é uma constante que representa a inclinação da linha reta. Exemplo • Uma empresa de eletricidade cobra uma taxa fixa de R$ 17,50 por mês mais 8 centavos por Kw/h utilizado. Encontre e trace o gráfico de uma equação linear para modelar essa situação para o uso de até 1.500 unidades por mês. • A equação terá a seguinte forma: y = a + bx ▫ y deve ser o valor cobrado pela eletricidade, já que essa é a variável de interesse. ▫ x deve ser o número de unidades utilizadas, já que isso determina os valores cobrados pela eletricidade. Exemplo • Para encontrar a e b, é útil considerar como se compõe o valor cobrado, que ocorre segundo os vários níveis de utilização de energia elétrica. • valor cobrado pela eletricidade = R$ 17,50 + R$ 0,08 unidades utilizadas ou, a notação usual onde y = valor cobrado pela eletricidade (R$) e x = número de unidades utilizadas: y = 17,5 + 0,08x que é um modelo linear que representa os valores cobrados pelo fornecimento de eletricidade em termos de unidades utilizadas. Atividade de revisão • Dois varejistas locais estão oferecendo telefones móveis a diferentes tarifas. A empresa A cobra R$ 15 por mês mais 50 centavos por minuto de ligações, enquanto a B cobra R$ 17,50 pelo aluguel, mas somente 35 centavos por minuto de ligação. (a) Formule equações para as taxas de ligação em cada caso. (b) Produza um único gráfico com os custos de cada opção se entre 0 e 40 minutos de ligação forem feitos por mês. (c) Determine o nível de ligações no qual a tarifa da B torna-se a opção mais barata. (d) Qual é o custo geral por mês nesse nível de ligações? As equações lineares vistas acima são exemplos de um modelo determinístico, isto é, se o uso da eletricidade fosse conhecido, as taxas poderiam ser previstas exatamente sem espaço para variação. Na vida real, normalmente é necessário construir um modelo probabilístico para lidar com a incerteza. A regressão linear simples, técnica que é descrita a seguir, é um exemplo desse último tipo de modelo. REGRESSÃO LINEAR SIMPLES • Considere o Exemplo onde foi estabelecido que existe forte ligação entre a propaganda e as vendas, com um coeficiente de correlação de 0,948. Entretanto, em virtude da variabilidade dos dados, é impossível encontrar um modelo linear exato, como fizemos no Exemplo anterior. Contudo, dados na figura abaixo e o coeficiente de correlação, mostram que há evidência de uma relação linear entre as vendas e os gastos com propaganda. • Portanto, a equação ainda terá o mesmo formato y=a+bx mas o que é necessário é uma forma matemática de determinar a e b. REGRESSÃO LINEAR SIMPLES • A regressão linear simples é uma técnica que foi desenvolvida para fazer isso. Em essência, a meta é encontrar valores para a e b que dêem a linha que se ajusta melhor aos pontos. • Fazer isso exige mais fórmulas matemáticas: • b = nΣxy – Σx Σy nΣx2 – (Σx) 2 • a = Σy – bΣx n n Exemplo • Utilizando os dados anteriores sobre vendas e despesas com propaganda encontre a equação de regressão linear, adicione-a ao gráfico de dispersão original e faça previsões para as vendas, se as despesas com propaganda forem: 1) R$ 700 2) R$ 1.800 Vendas (000) 25 35 29 24 38 12 18 27 17 30 Despesas com propaganda (00) 8 12 11 5 14 3 6 8 4 9 Exemplo • Utilizando os dados anteriores sobre vendas e despesas com propaganda encontre a equação de regressão linear, adicione-a ao gráfico de dispersão original e faça previsões para as vendas, se as despesas com propaganda forem: 1) R$ 700 2) R$ 1.800 Vendas (000) 25 35 29 24 38 12 18 27 17 30 Despesas com propaganda (00) 8 12 11 5 14 3 6 8 4 9 Portanto, b = nΣxy – Σx Σy = (10*2.289) – (80*255) = 22.890 – 20.400 = 2490 = 2,147 nΣx2 – (Σx) 2 (10*756) – (80)2 7.560 – 6.400 1.160 a = Σy – bΣx = 255 - 2,15 * 80 = 25,5 – 17,17 = 8,328 n n 10 10 y = 8,328 + 2,147 x (a) Despesas com propaganda = $ 700. Como os valores utilizados na equação eram dados em centenas, isso significa x = 7; portanto, y = 8,328 + 2,147 * 7 = 23,357 23.357 vendas são previstas. (b) Despesa = $ 1.800, então x = 18. y = 8,328 + 2,147 * 18 = 46,974 46.974 vendas são previstas. Exercícios • o Sr. Carlos é o proprietário de uma loja de presentes em uma pequena cidade. Ele acredita que as vendas da loja estejam relacionadas ao número de ônibus de turistas que param na cidade. Coletou os seguintes dados sobre as vendas e o número de visitas de ônibus em uma seleção de dias recentes. • Determine que conjunto de dados que representa a variável x e a y nessa situação. • Calcule os valores de a e b e escreva a equação de regressão para esses dados. • Faça uma previsão das vendas para os dias em que: ▫ 27 ônibus visitam a cidade. ▫ 55 visitam a idade. Exercícios • A tabela seguinte apresenta 3 conjuntos de dados A, B e C para ilustrar os perigos de calcular medidas sem primeiro representar os dados. Os conjuntos de dados A, B e C têm a mesma correlação e a mesma reta de regressão: ▫ Calcule o coeficiente de correlação e a reta de regressão para cada um dos conjuntos de dados e verifique que são iguais. ▫ Para cada um dos conjuntos de dados faça o diagrama de pontos e represente a reta de regressão. A x 10 8 13 9 11 14 6 4 12 7 5 y 8.04 6.95 7.58 8.81 8.33 9.96 7.24 4.26 10.84 4.82 5.6 B x 10 8 13 9 11 14 6 4 12 7 5 y 9.14 8.14 8.74 8.77 9.26 8.10 6.13 3.10 9.13 7.26 4.74 C x 8 8 12 8 8 8 8 8 8 8 19 y 6.58 5.76 7.71 8.84 8.47 7.04 5.25 5.56 7.91 6.89 12.50 Exercício Um psicólogo está investigando a relação entre o tempo que o indivíduo leva para reagir a um certo estímulo (em segundos) e algumas de suas características, tais como idade (em anos completos) e acuidade visual (medida em porcentagem). Os dados encontram-se a seguir: a) Construa os diagramas de dispersão de Tempo de Reação x Idade e Tempo de Reação x Acuidade Visual. b) Calcule o coeficiente de correlação entre Tempo de Reação e Idade e Tempo de Reação e Acuidade Visual e interprete os valores obtidos. c) Como seria possível prever o tempo de reação de um indivíduo através de sua idade? O aumento de uma unidade na idade aumenta em quanto o tempo médio de reação dos indivíduos? Faça uma previsão do tempo de reação de um indivíduo com 24 anos. d) Obtenha a reta de regressão do tempo de reação em função da acuidade visual. e) Como seria mais razoável prever o tempo de reação de uma pessoa: pela idade ou pela acuidade visual? Por quê?
Compartilhar