Buscar

6 1 Regressão Linear_2020 1

Prévia do material em texto

Regressão Linear
1ª Parte
Regressão: Origem
A ciência estatística possui muitas técnicas de análise de dados. Uma delas é conhecida como análise de regressão. O termo regressão foi primeiramente utilizado por Sir Francis Galton (1822 – 1911), que estudou a relação entre as estaturas de crianças e as estaturas de seus pais.
Regressão: Conceito
“método estatístico que utiliza relação entre duas ou mais variáveis de modo que uma variável pode ser estimada (ou predita) a partir da outra ou das outras” 
Análise de Regressão relação Neter, J. et al. Applied Linear Statistical Models. McGraw Hill, 1996
Exemplos:
Nota de uma prova está relacionada ao tempo de estudo do aluno.
Venda de bolos está relacionada ao número de clientes.
Consumo de energia do ar-condicionado está relacionada a sensação térmica da cidade.
Renda semanal e despesas de consumo.
Regressão Linear: Conceito
De forma resumida, uma regressão serve para você estimar o valor de algo baseado em uma série de outros dados históricos.
Exemplo: Você tem uma base de dados da valorização da sua casa a cada semestre dos últimos 20 anos (2000–2020) e você vai usar essa base histórica para prever quanto sua casa vai valer daqui a 2 anos, ou seja, quanto a sua casa vai custar quando chegar em 2022?
Modelo de regressão linear nos permite estudar as relações entre duas variáveis numéricas contínuas(algo que cresce ou decresce constantemente)
Correlação Linear X Regressão Linear
A correlação e a regressão são duas técnicas que estão muito ligadas. Assim importa fazermos a distinção entre elas:
O coeficiente de correlação de Pearson informa o quão fortemente duas variáveis estão relacionadas.
A  regressão  é  usada  quando  tentamos  predizer  uma  variável    conhecendo  a outra. 
Exemplos:
Nota de uma prova está relacionada ao tempo de estudo do aluno.
Venda de bolos está relacionada ao número de clientes.
Consumo de energia do ar-condicionado está relacionada a sensação térmica da cidade.
Renda semanal e despesas de consumo.
REVISÃO - MODELOS LINEARES
O formato geral de uma equação linear simples é:	y = a + bx
x é a variável independente.
y é a variável dependente.
	a é a constante que representa o ponto onde a linha reta corta o eixo y (conhecida como a intercepção).
	b é uma constante que representa a inclinação da linha reta.
Exemplo
Uma empresa de eletricidade cobra uma taxa fixa de R$ 17,50 por mês mais 8 centavos por Kw/h utilizado. Encontre e trace o gráfico de uma equação linear para modelar essa situação para o uso de até 1.500 unidades por mês.
A equação terá a seguinte forma: y = a + bx
y deve ser o valor cobrado pela eletricidade, já que essa é a variável de interesse.
x deve ser o número de unidades utilizadas, já que isso determina os valores cobrados pela eletricidade.
Exemplo
Para encontrar a e b, é útil considerar como se compõe o valor cobrado, que ocorre segundo os vários níveis de utilização de energia elétrica.
valor cobrado pela eletricidade = R$ 17,50 + R$ 0,08 * unidades utilizadas ou, a notação usual onde y = valor cobrado pela eletricidade (R$) e x = número de unidades utilizadas: y = 17,5 + 0,08*x
	Esse é um modelo linear que representa os valores 
	cobrados pelo fornecimento de eletricidade em 
	termos de unidades utilizadas.
	x	y
	0	17,5
	100	25,5
	1000	97,5
	1500	137,5
0	100	1000	1500	17.5	25.5	97.5	137.5	Unidades de Eletricidade (Kw/h)
Custo Mensal R$
Atividade de revisão
Dois varejistas locais estão oferecendo telefones móveis a diferentes tarifas. A empresa A cobra R$ 15 por mês mais 50 centavos por minuto de ligações, enquanto a B cobra R$ 17,50 pelo aluguel, mas somente 35 centavos por minuto de ligação.
(a) Formule equações para as taxas de ligação em cada caso.
(b) Produza um único gráfico com os custos de cada opção se entre 0 e 40 minutos de ligação forem feitos por mês.
(c) Determine o nível de ligações no qual a tarifa da B torna-se a opção mais barata.
(d) Qual é o custo geral por mês nesse nível de ligações?
As equações lineares vistas acima são exemplos de um modelo determinístico, isto é, se o uso da eletricidade fosse conhecido, as taxas poderiam ser previstas exatamente sem espaço para variação. Na vida real, normalmente é necessário construir um modelo probabilístico para lidar com a incerteza. A regressão linear simples, técnica que é descrita a seguir, é um exemplo desse último tipo de modelo.
Resolução atividade
Empresa A
	 ya = 15,00 + 0,50xa
Empresa B
	 yb = 17,50 + 0,35xb
	x	y
	0	15
	20	25
	40	35
	x	y
	0	17,5
	20	24,5
	40	31,5
y	0	20	40	15	25	35	0	20	40	17.5	24.5	31.5	Tempo (minutos)
Custo R$
Resolução atividade
Determine o nível de ligações no qual a tarifa da B torna-se a opção mais barata.
Nesse ponto Ya = Yb
15 + 0,50 x = 17,50 + 0,35 x
0,50 x – 0,35 x = 17,50 – 15
0,15 x = 2,50
x = 16,67 min
Qual é o custo geral por mês nesse nível de ligações?
Ya = 15 + 0,50 x 
Ya = 15 + 0,50 * 16,67
 Ya = 15 + 8,33
 Ya = R$ 23,33

Continue navegando