Baixe o app para aproveitar ainda mais
Prévia do material em texto
Inferência Causal Segundo Semestre de 2017 / Professores: Augusto C. Souza; Ângela M. Coelho; Marcel T. Vieira Revisão Unidade 1 Regressão � Um desejo comum em estatística é predizer o valor de uma variável, �, baseado no valor de uma outra variável, �; � Foi comentado anteriormente que a melhor predição de � baseada em � é dada pela esperança condicional �[�|� = �]; � Isso, supondo que a esperança condicional seja conhecida, ou que possa ser calculada a partir da distribuição conjunta (�, �); � A metodologia da regressão a predição é feita diretamente dos dados. Regressão � O primeiro passo de uma análise de regressão é fazer um gráfico de dispersão; � Por exemplo, pode-se querer estimar o valor final em uma mesa de dados em um cassino: O resultado do lançamento do primeiro dado seria colocado no eixo � e a soma final de ambos os dados no eixo �. Regressão � A reta de mínimos quadrados da regressão é a reta para qual as distâncias verticais dos pontos (do gráfico de dispersão) à reta é mínima; � Ou seja, se existem � pontos (�, �) no gráfico de dispersão, e para qualquer ponto (�� , ��), o valor ��� representa o valor da reta � = � + �� em �� , então a reta de regressão de mínimos quadrados é aquela que minimiza o valor � �� − ��� � � =� �� − � − ��� � � Regressão � Suponha que forma jogados 12 rodadas sucessivas de dados em um cassino, os resultados obtidos são mostrados abaixo: Regressão � Suponha que queiramos predizer a soma � de ambos os dados baseado no valor do dado 1 (�) apenas; � A reta de regressão obtida para os dados observados é dada pela reta tracejada, já a reta de regressão teórica para esse exemplo, obtida ao aumentar o tamanho amostral ao infinito, é dada pela reta sólida. Regressão � Em geral, a equação de regressão de � com relação a � é dada por: � = � + �� � O coeficiente de inclinação � é denotado por ��� e pode ser encontrado em termos da covariância ���, como segue: � = ��� = ��� ��� Regressão Múltipla � Outra possibilidade é utilizar várias variáveis na predição de uma outra; � Suponha que seja desejado predizer o valor da variável � usando os valores das variáveis � e �, pode-se fazer a regressão de � em �, � , e estimar a relação de regressão por: � = �� + � � + ��! � Que representa um plano inclinado definido em um sistema de coordenadas tridimensionais. Regressão Múltipla � � ! � = �� + � � + ��! Regressão Múltipla � A inclinação de � em � quando � é constante é chamada de coeficiente de regressão parcial e é denotada por ���∙# � Existe a possibilidade de ��� ser positivo e de ���∙# ser negativo como pode ser visto no exemplo abaixo: 10 20 30 40 50 C o l e s t e r o l Exercício C o l e s t e r o l Exercício Regressão Múltipla � O cálculo dos coeficientes de regressão parciais � , ��, … é bastante facilitado pela utilização de um teorema que é um dos resultados de maior importância na análise de regressão. � Ele diz: Se escrevermos � como uma combinação linear das variáveis � , ��, … , �% mais um termo de ruído &, � = �� + � � + ���� +⋯+ �%�% + & � então, independentemente das distribuições de �, � , ��, … , �% , os melhores coeficientes de mínimos quadrados são obtidos quando & não tem correlação com nenhuma das variáveis explicativas � , ��, … , �% Regressão Múltipla � Ou seja: ()* &, �� = 0 para , = 1,2, … , /
Compartilhar