Prévia do material em texto
PDF SINTÉTICO ESTATÍSTICA Regressão Linear Livro Eletrônico Presidente: Gabriel Granjeiro Vice-Presidente: Rodrigo Calado Diretor Pedagógico: Erico Teixeira Diretora de Produção Educacional: Vivian Higashi Gerência de Produção de Conteúdo: Magno Coimbra Coordenadora Pedagógica: Élica Lopes Todo o material desta apostila (incluídos textos e imagens) está protegido por direitos autorais do Gran. Será proibida toda forma de plágio, cópia, reprodução ou qualquer outra forma de uso, não autorizada expressamente, seja ela onerosa ou não, sujeitando-se o transgressor às penalidades previstas civil e criminalmente. CÓDIGO: 240123587766 THIAGO CARDOSO Engenheiro eletrônico formado pelo ITA com distinção em Matemática, analista- chefe da Múltiplos Investimentos, especialista em mercado de ações. Professor desde os 19 anos e, atualmente, leciona todos os ramos da Matemática para concursos públicos. O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. 3 de 12gran.com.br PDF SINTÉTICO Regressão Linear Thiago Cardoso SUMÁRIO Apresentação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Regressão Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1. Equação da Regressão Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2. Análise de Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.1. Coeficiente de Determinação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2. Variância do Erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3. Análise dos Resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. https://www.gran.com.br https://www.gran.com.br 4 de 12gran.com.br PDF SINTÉTICO Regressão Linear Thiago Cardoso AAPRESENTAÇÃOPRESENTAÇÃO Fala, meu filho! Faaaaaaaaaaaala, minha filha! Escrever um livro é algo desafiador. Porém, escrever para o público concurseiro torna a tarefa ainda mais árdua. Afinal, há candidatos com diferentes níveis de conhecimento, estudando para seleções de áreas variadas. No entanto, existe algo em comum entre aqueles que se preparam para um concurso público: todos querem a aprovação o mais rápido possível e não têm tempo a perder! Foi pensando nisso que esta obra nasceu. Você tem em suas mãos um material sintético! Isso porque ele não é extenso, para não desperdiçar o seu tempo, que é escasso. De igual modo, não foge da batalha, trazendo tudo o que é preciso para fazer uma boa prova e garantir a aprovação que tanto busca! Também identificará alguns sinais visuais, para facilitar a assimilação do conteúdo. Por exemplo, afirmações importantes aparecerão grifadas em azul. Já exceções, restrições ou proibições surgirão em vermelho. Há ainda destaques em marca-texto. Além disso, abusei de quadros esquemáticos para organizar melhor os conteúdos. Tudo foi feito com muita objetividade, por alguém que foi concurseiro durante muito tempo. Para você me conhecer melhor, comecei a estudar para concursos ainda na adolescência, e sempre senti falta de ler um material que fosse direto ao ponto, que me ensinasse de um jeito mais fácil, mais didático. Enfrentei concursos de nível médio e superior. Fiz desde provas simples, como recenseador do IBGE, até as mais desafiadoras, sendo aprovado para defensor público, promotor de justiça e juiz de direito. Usei toda essa experiência, de 16 anos como concurseiro, e de outros tantos ensinando centenas de milhares de alunos de todo o país para entregar um material que possa efetivamente te atender. A Coleção PDF Sintético era o material que faltava para a sua aprovação! Professor Aragonê Fernandes APRESENTAÇÃO DO PROFESSOR Eu sou o Professor Thiago Cardoso, serei o professor que vai te acompanhar na parte de exatas. Minha trajetória em concursos públicos começou bem cedo, quando eu tinha 16 anos. Nessa época, eu resolvi que queria ser militar e decidi estudar para entrar no ITA (Instituto Tecnológico de Aeronáutica), um dos concursos mais difíceis do país. O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. https://www.gran.com.br https://www.gran.com.br 5 de 12gran.com.br PDF SINTÉTICO Regressão Linear Thiago Cardoso O meu primeiro ano de estudos foi marcado por muita falta de base, especialmente em matemática, e, por isso, tive pouca evolução. No final do ano, fiz a prova e obtive um péssimo resultado. No primeiro momento, achei que seria impossível conseguir meu objetivo. Porém, eu não desisti e resolvi na minha segunda tentativa reforçar a minha base e entender de verdade. No meu segundo ano de estudos, cheguei a enfrentar uma rotina de 12 horas por dia de estudos. Mas, mesmo assim, não obtive êxito. Isso tem muito a ver com ser concurseiro. Não devemos desistir nunca. Somente na minha terceira tentativa, eu consegui a aprovação e entrei para o ITA, instituição em que me formei no ano de 2013. Eu também fui nomeado como analista de controle externo do TCE-PE no concurso realizado no ano de 2017 e leciono exatas para concursos públicos desde esse ano. O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. https://www.gran.com.br https://www.gran.com.br 6 de 12gran.com.br PDF SINTÉTICO Regressão Linear Thiago Cardoso REGRESSÃO LINEARREGRESSÃO LINEAR A regressão linear tem por objetivo estudar o comportamento de uma variável em função da outra. Por exemplo, considere o estudo do salário de pessoas de uma empresa em função da idade delas. No gráfico, temos algumas definições interessantes: • Variável Independente, Regressora, Explicativa ou Preditora: é a variável principal. No caso, é a variável idade, geralmente chamada de X. A variável independente é também chamada de explicativa ou preditora, porque ela é utilizada para explicar o comportamento da variável dependente e prever seus valores futuros. • Variável Dependente ou Resposta: é a variável, cujos valores são observados em função da variável independente. No caso em apreço, é a variável salários, geralmente chamada de Y. O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. https://www.gran.com.br https://www.gran.com.br 7 de 12gran.com.br PDF SINTÉTICO Regressão Linear Thiago Cardoso 1 . EQUAÇÃO DA REGRESSÃO LINEAR1 . EQUAÇÃO DA REGRESSÃO LINEAR A equação geral de um modelo regressão linear é: A estimativa obtida a partir do modelo de regressão linear é: O coeficiente de inclinação pode ser obtido por uma das expressões a seguir: Como o valor esperado é linear, temos que: 2 . ANÁLISE DE VARIÂNCIA2 . ANÁLISEDE VARIÂNCIA A análise de variância busca medir os erros (ou desvios) provocados por um modelo de regressão linear. Para isso, vamos comparar: • : os valores reais da variável resposta; • as estimativas da variável resposta obtida com o modelo de regressão linear; • a média dos valores reais da variável resposta. O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. https://www.gran.com.br https://www.gran.com.br 8 de 12gran.com.br PDF SINTÉTICO Regressão Linear Thiago Cardoso Com base nesses parâmetros, são definidos os seguintes fatores que avaliam a qualidade do modelo de regressão linear. • Soma dos Quadrados Totais SQTot (antes): corresponde aos desvios em relação à média da variável Y, ou seja, antes de se fazer qualquer estimativa de regressão linear. Obs.: Perceba que esse fator é diretamente relacionado ao desvio-padrão (ou à variância SYY) da variável resposta. Utilizamos (N-1) no denominador, pois consideramos a variância amostral, que será o caso da maior parte das questões envolvendo regressão linear. • Soma dos Quadrados dos Erros ou Resíduos, SQRes ou SQEr (depois): é a soma dos quadrados dos erros ou resíduos de estimativa. Corresponde aos desvios em relação às estimativas lineares, ou seja, depois da regressão linear. É natural esperar que a soma dos erros depois da regressão linear seja menor que a soma dos erros antes da regressão linear. Afinal, é para isso que serve essa técnica: melhorar a estimativa da variável Y. Assim, define-se: • Soma dos Quadrados da Regressão SQReg: é a melhoria ou redução dos erros. Tem-se: Pode-se provar que a soma dos quadrados da regressão se relaciona com a variância entre as variáveis. 2 .1 . COEFICIENTE DE DETERMINAÇÃO2 .1 . COEFICIENTE DE DETERMINAÇÃO O coeficiente de determinação (R²) é dado pela razão de melhoria. Isto é, o quanto o modelo de regressão melhorou os erros da variável resposta sobre o quanto os erros eram antes. O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. https://www.gran.com.br https://www.gran.com.br 9 de 12gran.com.br PDF SINTÉTICO Regressão Linear Thiago Cardoso Pode-se demonstrar que o coeficiente de determinação é igual ao quadrado da correlação. 2 .2 . VARIÂNCIA DO ERRO2 .2 . VARIÂNCIA DO ERRO A estimativa de variância do erro é dada por: Na equação acima: • p é o número de variáveis envolvidas na regressão linear – tanto as dependentes como as independentes. Se estivermos falando de uma regressão linear comum, no caso, os salários (Y) pela idade (X) de um grupo de entrevistados, temos duas variáveis. Esse é o caso geral cobrado em questões de prova. • N é o número de elementos na amostra; • SqRes é a soma dos quadrados dos resíduos. 2 .3 . ANÁLISE DOS RESÍDUOS2 .3 . ANÁLISE DOS RESÍDUOS Os resíduos do modelo de regressão linear correspondem aos desvios das estimativas fornecidas pelo modelo em relação ao valor original da variável. O gráfico de resíduos dispõe os resíduos da variável resposta em função da variável explicativa. As características ideais de um gráfico de resíduos saudável deve ser: • não viesado: isto é, a média dos resíduos deve ser igual a zero; • homocedásticos: o desvio padrão dos resíduos é independente da variável aleatória independente. O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. https://www.gran.com.br https://www.gran.com.br 10 de 12gran.com.br PDF SINTÉTICO Regressão Linear Thiago Cardoso Vejamos na Figura 3 um exemplo ideal dessa situação. Figura 3: Exemplo de um gráfico de resíduos sem problemas A seguir, temos alguns problemas comuns nos gráficos de resíduos: • heterocedasticidade: a variância dos erros apresenta um comportamento heterogêneo em função da variável independente (X); • assimetria: a média dos erros não é nula, portanto, o coeficiente de intercepto deve ser ajustado. O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. https://www.gran.com.br https://www.gran.com.br 11 de 12gran.com.br PDF SINTÉTICO Regressão Linear Thiago Cardoso Vejamos a seguir exemplos. Caro(a) aluno(a), Finalizamos mais um conteúdo! Agora, aproveite nossa plataforma de questões para elevar ainda mais seu estudo. Este link irá levá-lo diretamente ao sistema Gran Questões: https://questoes.grancursosonline.com.br/ Por lá, você pode selecionar as questões da disciplina e filtrar pelo assunto e pela banca que organizará seu concurso. A escolha é sua! Treine à vontade, usando o melhor sistema de questões do mercado. O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. https://www.gran.com.br https://www.gran.com.br https://questoes.grancursosonline.com.br Abra caminhos crie futuros gran.com.br O conteúdo deste livro eletrônico é licenciado para Marcel Queiroz Pereira - 02370503742, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal. Sumário Apresentação Regressão Linear 1. Equação da Regressão Linear 2. Análise de Variância 2.1. Coeficiente de Determinação 2.2. Variância do Erro 2.3. Análise dos Resíduos