Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/ * “método estatístico que utiliza a relação entre duas ou mais variáveis de modo que uma variável pode ser estimada (ou predita) a partir da outra ou das outras” Regressão Linear Simples Análise de Regressão relação Neter, J. et al. Applied Linear Statistical Models. McGraw Hill, 1996 * Relação funcional x Relação estatística As variáveis podem possuir dois tipos de relações: Funcional: a relação é expressa por uma fórmula matemática: Y = f(X) Ex: relação entre o perímetro (P) e o lado de um quadrado (L) Todos os pontos caem na curva da relação funcional * Relação funcional x Relação estatística Estatística: não há uma relação perfeita como no caso da relação funcional. As observações em geral não caem exatamente na curva da relação. Ex: relação entre o peso (P) e a altura (A) de uma pessoa A existência de uma relação estatística entre a variável dependente Y e a variável independente X não implica que Y dependa de X, ou que exista uma relação de causa-efeito entre X e Y. Gráfico1 73 66 64 94 79 72 62 64 90 81 Altura (cm) Peso (kg) Plan1 174 73 73 0.0057471264 73 1.4 73 0.9 73 26 161 66 66 0.0062111801 66 1.7 66 1.2 66 25 170 64 64 0.0058823529 60 1.5 60 1.5 60 21 180 94 94 0.0055555556 94 1 80 0.98 80 25 182 79 79 0.0054945055 79 1.5 79 1.5 78 27 164 72 72 0.006097561 72 1.2 72 1.2 72 28 156 62 62 0.0064102564 62 1.7 62 1 62 23 168 64 78 0.005952381 78 1.1 78 1.1 78 25 176 90 90 0.0056818182 90 1.3 90 1.3 90 21 175 81 81 0.0057142857 81 1.4 81 1.4 81 26 87 1 87 1 88 23 92 1.2 57 1.15 57 21 103 1 90 1 90 20 85 1.5 85 1.5 85 25 99 1.3 58 1.3 58 22 111 1 70 1 70 26 102 0.9 85 0.9 85 23 65 1.4 70 1.4 68 27 72 1.5 72 1.6 62 25 84 1.2 84 1.2 84 24 Plan1 0 0 0 0 0 0 0 0 0 0 Altura (cm) Peso (kg) Plan2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 X Y Plan3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 X Y 26 25 21 25 27 28 23 25 21 26 23 21 20 25 22 26 23 27 25 24 X Y * Medida de Associação Coeficiente de Correlação (de Pearson) mede o grau de relação linear entre X e Y r = 0,9 r = 0,3 r = 0 r = - 0,9 * Coeficiente de Correlação Interpretações errôneas dos coeficientes de correlação Um alto coeficiente de correlação nem sempre indica que a equação de regressão estimada está bem ajustada aos dados. X Y * Coeficiente de Correlação Interpretações errôneas dos coeficientes de correlação Um coeficiente de correlação próximo de zero nem sempre indica que X e Y não são relacionadas. * Análise de Regressão Determinar como duas ou mais variáveis se relacionam. Estimar a função que determina a relação entre as variáveis. Usar a equação ajustada para prever valores da variável dependente. Regressão Linear Simples Yi = 0 + 1Xi + i * Modelo de Regressão Linear Simples X Y b0 1 Coeficiente angular E(Y) = 0 + 1 X * Em geral não se conhece os valores de 0, 1 e 2 Eles podem ser estimados através de dados obtidos por amostras. O método utilizado na estimação dos parâmetros é o método dos mínimos quadrados, o qual considera os desvios dos Yi de seu valor esperado: i = Yi – (0 + 1 Xi) Em particular, o método dos mínimos quadrados requer que consideremos a soma dos n desvios quadrados, denotado por Q: Estimação dos parâmetros * Estimação dos parâmetros De acordo com o método dos mínimos quadrados, os estimadores de 0 e 1 são aqueles, denotados por b0 e b1, que tornam mínimo o valor de Q. Derivando (resíduo) Igualando-se essas equações a zero obtém-se os valores b0 e b1 que minimizam Q: * 1) 2) é mínima 3) 4) A reta de regressão passa sempre pelo ponto Propriedades da equação de regressão * A variância dos erros i,, denotada por 2, é um parâmetro do modelo de regressão, e necessita ser estimada. A variância de uma v.a. qualquer é calculada pela soma dos desvios quadráticos dividido pelo no de graus de liberdade. O cálculo da variância 2 é feito da mesma maneira. É importante notar que a variância dos Yi é também 2. Entretanto, cada Yi vêm de distribuições de probabilidade diferentes, com diferentes médias dependendo do nível de Xi. Estimação da Variância do Erro (2) * Estimação da Variância do Erro (2) Soma de quadrados dos resíduos (SQRes): A soma dos quadrados dos resíduos tem n – 2 graus de liberdade, pois 2 graus de liberdade foram perdidos por estimar b0 e b1. Portanto, o estimador de 2, denominado de Quadrado Médio do Resíduo (QMRes), é dado pela razão entre a soma dos quadrados dos resíduos e (n – 2): Pode ser demonstrado que: * Inferência em Análise de Regressão Considere o modelo: Yi = 0 + 1 Xi + i ~ N(0; 2) e COV (i,j)= 0 se H0 verdadeira E(t) = 0 se H0 falso E(t) <<<< 0 IC para 0 e 1 IC para Ynovo 0 = 0 ? 1 = 0 ? (teste de hipótese) * Abordagem da Análise de Variância na Análise de Regressão X Y SQTo = SQReg + SQRes Coeficiente de determinação 0 R2 1 Interpretação: R2 mede a fração da variação total de Y explicada pela regressão. * Abordagem da Análise de Variância na Análise de Regressão se H0 verdadeiro E(F) = 1 se H0 falso E(F) >>>> 1 * Análise de Regressão no EXCEL OBS: Para regressão linear simples: teste F = teste t bilateral F = t2 * Modelos Linearizáveis Modelo Padrão: Yi = 0 + 1Xi + i exponencial potencial logaritmo potência inverso * Análise de Resíduos * Análise de Resíduos * Análise de Resíduos * Regressão passando pela origem (0 = 0) (R2 pode ser negativo!)
Compartilhar