Vista previa del material en texto
Guía Econometria E-250 Regresión Múltiple: Estimadores MICO, supuestos y propiedades Prof. Verónica Gil y Aldo Lema ECONOMETRÍA REGRESIÓN MULTIPLE Profesores: Verónica Gil Aroztegui Aldo Lema Navarro Marzo 2005 Esta guía está en permanente revisión por lo cual sugerencias o correcciones serán bienvenidas. E-mails: vgila@vtr.net y alema@security.cl Guía Econometria E-250 Regresión Múltiple: Estimadores MICO, supuestos y propiedades Prof. Verónica Gil y Aldo Lema 3. MODELO DE REGRESIÓN MÚLTIPLE 3.1 Estimadores MICO, supuestos y propiedades. Ejercicio 3.1.1 Comente las siguientes afirmaciones a) Si Yi y Xi2 son variables no correlacionadas entre sí, es decir, )X)(XY(Y 2i2i −−∑ = 0, entonces la estimación MICO del coeficiente β2 en el modelo: Yi = β1 + β2 Xi2 + β3 Xi3 +.........+ βk Xik + ui es cero. b) El vector de residuos muestrales es siempre ortogonal a la matriz de variables explicativas del modelo. Sin embargo, no siempre la media de los residuos muestrales es igual a 0. c) Para obtener los estimadores MICO en el modelo de regresión múltiple es necesario suponer que el rango de (X´X) es igual a k. d) La media de los residuos muestrales es siempre 0. Ello por cuanto se ha supuesto que la E(ui) = 0 para todo i. e) El vector de residuos muestrales no siempre es ortogonal a la matriz de variables explicativas del modelo. f) El incumplimiento del supuesto de normalidad respecto a la distribución de los errores invalida la propiedad de que los MICO son de mínima varianza, dentro los estimadores lineales. Sin embargo, no invalida la propiedad de insesgadez. g) Si se agrega una variable adicional a una regresión, el valor estimado de σ2 permanecerá igual o se reducirá. h) A medida que el tamaño muestral aumenta, el test t debería incrementarse. i) Suponga que el coeficiente de una variable de una ecuación es significativamente diferente de cero a un nivel de significación de 20%. Por lo tanto, si se elimina esta variable de la regresión, el R2 y el Rc 2 se reducirán. j) Si n=k en el modelo de regresión múltiple, no podrá obtenerse valores únicos de los estimadores MICO. k) Al minimizar la suma de cuadrados residuales, los estimadores MICO están maximizando simultáneamente el R2. l) En el modelo de regresión lineal general, los residuos son ortogonales a sus variables explicativas. m) Si Yi y Xi2 son variables ortogonales, entonces la estimación MICO del coeficiente β2 en el modelo: Yi = β1 + β2 Xi2 + β3 Xi3 + ui es cero. Comente, justificando su respuesta. n) Si se estima la siguiente regresión Yt=β1+β2 Xt+β3 Zt +ut , se computa el error de estimación et y luego se estima et=α1+α2Zt +vt , los αi estimados serán cero. Ejercicio 3.1.2 Dada la siguiente información: Guía Econometria E-250 Regresión Múltiple: Estimadores MICO, supuestos y propiedades Prof. Verónica Gil y Aldo Lema ( ) , , , , , , X X′ = − − −1 0 78741 0 17961 0 03531 0 06028 0 00515 0 00241 X Y′ = 460 820 9 5227 5 , , Yi 2∑ = 12516 N =20 a) (4 puntos) Estime los parámetros del modelo: Yi = β1 + β2 Xi2 +β3 Xi3 + ui b) (4 puntos) Calcule el R2 y el Rc 2 . c) (4 puntos) Estime el valor de σ2 usando un estimador insesgado de este parámetro. Construya un intervalo de confianza para el mismo. Utilice α = 5%. d) (8 puntos) Testee la significación global del modelo y la significación de β2 y β3 en forma individual. Utilice α = 5%. Ejercicio 3.1.3 Se ha estimado la siguiente función de consumo agregado a partir de 20 observaciones: Ci = -4,16 - 0,23 Ri + 0,8 Yi + ei donde: Ci = logaritmo natural del consumo agregado. Ri = tasa de interés real Yi = logaritmo natural del ingreso esperado ei = residuo Además se sabe que: ( ) , , , , , , X X′ = − − −1 0 78741 0 17961 0 03531 0 06028 0 00515 0 00241 a) (6 puntos) Evalúe la hipótesis nula de que la tasa de interés no afecta al consumo. b) (6 puntos) Evalúe la hipótesis nula de que la elasticidad respecto al ingreso es 1. c) (8 puntos) Construya un intervalo de confianza para la elasticidad respecto al ingreso. d) (5 puntos) Estime el valor de σ2 usando un estimador insesgado de este parámetro. Construya un intervalo de confianza para el mismo. e) (5 puntos) A partir de los datos disponibles explique cuidadosamente los procedimientos necesarios para calcular el R2 de la regresión. En todos los casos usted debe plantear hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilice α = 5%. Ejercicio 3.1.4 Usted tiene dispone de la siguiente estimación de una demanda por dinero en Chile para el período 1970-1994, efectuada en base a datos anuales: ln M/Pi = 1,4 + 1 ln Yi - 015 Ii + ei donde M/P es la cantidad real de dinero, Y es el PIB, I es la tasa de interés nominal de corto plazo y ln significa que las variables están expresadas en logaritmos naturales. Guía Econometria E-250 Regresión Múltiple: Estimadores MICO, supuestos y propiedades Prof. Verónica Gil y Aldo Lema Además usted sabe que el R2 corregido (Rc 2 ) es 0,8 Con la información disponible evalúe la significación global del modelo, planteando la hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilice α = 5%. Ejercicio 3.1.5 Usted tiene el siguiente modelo: Yi = β1 + β2 Ci + ui La variable explicativa sólo puede tomar valores cero o uno. En N1 observaciones tomó el valor cero y en N2 el valor uno. El valor medio de la variable dependiente cuando Xi = 0 fue igual a 2 y cuando Xi = 1 fue cinco. Se pide encontrar los valores de los estimadores de los coeficientes, así como sus varianzas. Ejercicio 3.1.6 En un estudio de 89 empresas la variable dependiente es costo total, Y, y las variables explicativas son: producción (X2), y proporción de ausencias de trabajo (X3). Se dispone de la siguiente información: Y = 0,8 X = 2,92 X = 3,93 y’y = 113,9 x’y = 36 8 39 1 , , x’x = 50 5 66 2 967 1 , , , − a) (8 puntos) Estime los coeficientes de la siguiente regresión: Yi = β1 + β2Xi2 +β3Xi3 + ui b) (8 puntos) Contraste la significación individual de la variable Xi3. Utilice α = 5%. c) (10 puntos) Evalúe la significación global del modelo, planteando la hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilice α = 5%. d) (4 puntos) Calcule el coeficiente de determinación múltiple corregido (Rc 2 ). Ejercicio 3.1.7 Un economista desea examinar los efectos de algunas variables sobre el nivel de educación de un país. A estos efectos especifica la siguiente regresión: Ln Ei = β1+ β2 Ln Yi + β3 TIEi + ui Donde: Ln representa logaritmo natural. Ei es la cantidad de niños escolarizados de un país en el año i. Yi es el ingreso del país en el año i TIE es una variable de tendencia que toma el valor 1 en el primer año, 2 en el segundo, etc. Se obtienen los siguientes resultados (entre paréntesis se reporta el desvío standard de cada coeficiente) Ln Ei = 7,71 + 1,64 Ln Yi + 0,015 TIEi + ui (0,113) (0,605) (0,005) Además: SCE= 123,2 SCR= 21,4 N=60 a) Explique intuitivamente el significado de los coeficientes Guía Econometria E-250 Regresión Múltiple: Estimadores MICO, supuestos y propiedades Prof. Verónica Gil y Aldo Lema b) Pruebe la hipótesis: “ el ingreso no tienen efecto sobre el nivel de educación de un país”. c) Un economista cree que el parámetro asociado a la variable TIE es algo elevado ya que otros estudios han encontrado un valor en torno a 0,01.Dada la estimación presentada, ¿se validaría esta hipótesis? d) Calcule el R2 y el R2 corregido e) Plantee un test de significancia del modelo en su conjunto. En todos los casos usted debe plantear hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Las pruebas se deben realizar utilizando α = 5%. Ejercicio 3.1.8 Sea el modelo Yi = β2 Xi + ui ∀ i (1) Asumiendo que se cumplen los supuestos clásicos se calcula ei = Yi - $β 2 Xi y se estima por MICO Yi = α2 Xi + α3 ei + εi ∀ i (2) a) Definir las matrices en (2) especificando las dimensiones. b) Calcular los estimadores MICO de αi. c) Calcular el vector de residuos de la regresión (2). d) Calcular el R2 de la regresión (2). Se debe resolver en forma matricial. Explique cuidadosamente los resultados. Ejercicio 3.1.9 (Control 2, 2do. Semestre de 1997) La parte deterministica de una regresión donde Yt es siempre la variable dependiente y pueden haber una o dos variables explicativas X2t y X3t, puede especificarse de alguna de las siguientes formas: • Yt= A (X2t)β1(X3t)β2 • Yt=e 1 2 2t+ Xβ β • X2t=β β1 2 Yt • Yt=β1+β2(1/X2t) • Yt=β1+β2X2t+β3 (X2t )2 a. (7.5 puntos) ¿Es necesario hacer alguna transformación para poder estimar por MICO los parámetros de los modelos anteriores?. En caso afirmativo, realice estas transformaciones. b. (7.5 puntos) Interprete los coeficientes en cada uno de los casos, planteando su significado económico. c. (3 puntos) Introduzca el término de aleatoriedad en cada caso. d. (7 puntos) Suponga que la variable X2 se duplica. Discuta qué sucede con el valor del coeficiente asociado a dicha variable en las cuatro primeras especificaciones planteadas. Ejercicio 3.1.10 (Control 2, 2do. Semestre de 1997) Un investigador no tiene claro si la variable Y está explicada por la variable X o por la variable Z. Para elegir cuál es el modelo correcto, realiza una regresión tomando X como variable explicativa, y analiza si el estimador de la pendiente es significativo. Si lo es, decide que este es el modelo correcto. En caso contrario, dice que el modelo correcto es el que incorpora la variable Z como explicativa. d1) ¿Qué defecto teórico tiene este método? d2) Explique para este caso, cuáles serían los errores de tipo I y de tipo II que cometería el investigador. Guía Econometria E-250 Regresión Múltiple: Estimadores MICO, supuestos y propiedades Prof. Verónica Gil y Aldo Lema Ejercicio 3.1.11 (Control 3, 2do. Semestre de 1997) Utilizando algebra matricial: i) Derive los estimadores MICO. ii) Demuestre que son estimadores insesgados. iii) Deduzca la matriz de varianzas-covarianzas de dichos estimadores. Ejercicio 3.1.12 (Control 2, 2do. Semestre de 1998) a) (5 puntos) Explique intuitiva y matemáticamente el concepto de independencia lineal entre las columnas de la matriz X necesario para calcular los estimadores MICO. b) (5 puntos) Explique y defina el concepto de R2 corregido. ¿Por qué no basta con utilizar el R2? Ejercicio 3.1.13 (Control 2, 2do. Semestre de 1998) Utilizando notación matricial demuestre que los estimadores MICO son lineales e insesgados. Calcule su varianza. En cada paso, explicite los supuestos clásicos que está utilizando. Ejercicio 3.1.14 (Prueba 2, 1er. Semestre de 1999) Utilizando algebra matricial demuestre para el modelo de regresión múltiple con k variables que: iv) (un punto) Los estimadores MICO son lineales en Y. v) (2 puntos) Los estimadores MICO son insesgados. vi) (4 puntos) )X'X( )ˆ(V)ˆ(Cov-Var 12 −σ=β=β vii) (17 puntos) Los estimadores MICO son MELI explicitando en cada caso el supuesto clásico requerido. 7 3.2 Análisis de Varianza, Test de hipótesis lineales y cambio estructural. Ejercicio 3.2.1 Un economista desea estimar una función de producción para la economía chilena. Usando datos anuales para el período comprendido entre 1960 y 1991, él estima la siguiente ecuación de regresión: (1) Ln Y = 1,37 + 0,632 Ln K + 0,452 Ln L + ei (0,85) (0,257) (0,219) donde Ln Y es el logaritmo natural del producto, Ln K es el logaritmo natural del stock de capital, y Ln L es el logaritmo natural del trabajo. Los términos entre paréntesis corresponde a los desvíos estándares de los parámetros. La suma de cuadrados explicados fue 109,6 y la suma de cuadrados residuales 18,48. Además la covarianza entre los coeficientes de capital y trabajo fue de 0,055. a) Testee la significancia de cada uno de los coeficientes de la regresión. b) Testee la hipótesis de que la función de producción es homógenea de grado 1. c) Calcule el coeficiente de determinación múltiple sin corregir (R2) y el coeficiente de determinación múltiple corregido (Rc 2 ). d) Testee la hipótesis de que todos los coeficientes son 0, exceptuando la constante. e) Dos regresiones adicionales, basadas en la especificación original de la ecuación (1) fueron estimadas para los subperíodos 1960 a 1975 y 1976 a 1991, produciendo sumas de cuadrados residuales de 9,32 y 7,46 respectivamente. Testee la hipótesis nula que los coeficientes son idénticos en los dos subperíodos. f) Utilizando la información para todo el período, el economista intentando mejorar su estimación introduce una variable de capital humano (Ln H) en la regresión obteniendo la siguiente relación: (2) Ln Y = 1,37 + 0,632 Ln K + 0,452 Ln L + 0,112 Ln H + ei (0,85) (0,257) (0,219) (0,054) R2 = 0,91 SCR = 11,53 A usted se le pide que determine con cual modelo -ecuación (1) o ecuación (2)- el economista realiza una mejor estimación de la función de producción. Fundamente su respuesta. g) Suponga ahora que el economista en vez de plantear un modelo alternativo como el de la ecuación (2), él plantea y estima la siguiente especificación alternativa: (3) Y = 1,37 + 0,632 Ln K + 0,452 Ln L + ei (0,85) (0,257) (0,219) R2 = 0,81 SCR = 19,32 Se le pide a usted que exprese como es posible comparar y elegir el mejor modelo entre el (1) y el (3). Describa todos los pasos necesarios y los supuestos que necesita hacer para ese caso. Nota: En la realización de los test de las preguntas (a), (b), (d) y (e) usted debe señalar: la hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilize un nivel de significancia de 5%. Ejercicio 3.2.2 Un economista desea examinar los efectos del grado de educación y del número de años de experiencia laboral sobre el nivel de remuneraciones. Utilizando datos de corte transversal, obtiene la siguiente estimación a través de usar mínimos cuadrados ordinarios: (1) Ln R = 7,71 + 1,648 E + 2,153 N - 0,0297 N2 + ei (0,113) (0,605) (1,023) (0,0187) SCE= 123.2 SCR= 21,4 N=60 donde el Ln R es el logaritmo natural de las remuneraciones, E es el número de años de educación y N es el número de años de experiencia laboral. Los valores entre paréntesis corresponden a los desvíos estándares de los parámetros. 8 a) Testee la significancia de cada uno de los coeficientes de la regresión. b) Calcule el coeficiente de determinación múltiple sin corregir (R2) y el coeficiente de determinación múltiple corregido (Rc 2 ). Además realize un análisis de la significación global del modelo. c) (i) Suponga ahora que el economista plantea el siguiente modelo: (2) Ln R = 9,21 + 1,648 E + ei (3,234) (0,975) R2 = 0,81 N = 60 A usted se le pide que determine con cual modelo -ecuación (1) o ecuación (2)- el economista realiza una mejor estimación de la función de remuneraciones. Fundamente su respuesta. (ii) Qué sucede si el economista en vez de estimar la ecuación(2), estima la siguiente ecuación: (3) Ln R = 8,71 + 1,976 E + 2,465 N - 0,0342 E2 + ei (4,113) (0,505) (1,214) (0,0203) R2 = 0,88 N = 60 ¿Cómo se modifica la respuesta dada en (i)?. (d) Con la información que se le ha entregado testee la hipótesis “los años de experiencia laboral no tienen efecto en el nivel de remuneraciones”. Nota: En la realización de los test de las preguntas (a), (b), (d) y (e) usted debe señalar: la hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilize un nivel de significancia de 5%. Ejercicio 3.2.3 Una consultora ha estimado dos modelos de previsión de ventas para una empresa química (V), en función de los precios de venta (P) y la calidad de su producto (C), con datos mensuales de los últimos tres años. Los modelos utilizados son: (1) Vi = β1 + β2 Pi +β3 Ci + ui (2) Vi = β1 + β2 (-2Pi + Ci ) + vi donde se ha impuesto la restricción β1= -2β2 Testee dicha restricción sabiendo que las sumas residuales estimadas de ambos modelos son: (1) SCR = 43.75 (2) SCRr = 230 Ejercicio 3.2.4 Demuestre F e e e e R e e N K R R R R N K R R R = − − = − − − ' ' ' 2 2 21 Ejercicio 3.2.5 A partir de la siguiente información 1 X1 X2 Y 1 10 30 40 20 X1 92 119 59 9 X2 163 88 Y 88.2 a) Comprobar que la estimación por MICO es Yi = -13 + Xi2+ 3 Xi3 + ei b) Calcular el R2 y el Rc 2 . c) Testear las siguientes hipotesis: i) H0: β2 = 0 H1: β2 ≠ 0 ii) H0: 3β2 = β3 H1: 3β2 ≠ β3 iii) H0: β2 = β3 = 0 H1: Alguno distinto de 0 Ejercicio 3.2.6 Se tiene la siguiente función de producción estimada para una firma: Q e F F ei i i ei= 10 6314 1 0 80241 2 0 1347, , , donde Q es la cantidad de producto, F1 es la cantidad del factor 1 y F2 es la cantidad del factor 2. Además se sabe que: N=20, ei 2 1270 58=∑ , , ( ) .Y Yi∑ − =2 4364 87 y la matriz de varianza-covarianza de los parametros es la siguiente: V( $ ) , , , , , , , , , β = 0 1134 0 5220 0 8474 0 5220 0 2038 0 1110 0 8474 0 1110 0 0052 a) ¿Explican F1 y F2 de manera significativa los cambios en Q? b) Calcule el R2 y el Rc 2 . c) Calcule una estimación insesgada de la varianza de los errores. d) Desarrolle y evalúe una prueba F para inferir si existen retornos constantes a escala. Ejercicio 3.2.7 (Prueba 1, 1er. Semestre de 1995) Un economista ha estimado una función de producción de la economía chilena para el período 1961-1994, obteniendo los siguientes resultados:. (1) Ln Y = 8,739 + 0,322 Ln K + 0,731Ln L + 0,494 FEC+ ei (1,197) (0,081) (0,092) (0,061) donde Ln Y es el logaritmo natural del producto, Ln K es el logaritmo natural del stock de capital, Ln L es el logaritmo natural del trabajo y FEC es una variable que mide el impacto de las condiciones externas sobre la producción doméstica. Los términos entre paréntesis corresponde a los desvíos estándares de los parámetros. La suma de cuadrados residuales fue de 0,0343, el R2= 0,9871 y la covarianza entre los coeficientes de capital y trabajo fue de -0,0065. a) (6 puntos) Testee la hipótesis de que la elasticidad de producción del trabajo es el doble de la elasticidad de producción del capital. b) (6 puntos) Testee la hipótesis de que la función de producción es homógenea de grado 1. c) (6 puntos) Dos regresiones adicionales, basadas en la especificación original de la ecuación (1) fueron estimadas para los subperíodos 1961 a 1976 y 1977 a 1994, produciendo sumas de cuadrados residuales de 0,00665 y 0,00559, respectivamente.Testee la hipótesis nula que los coeficientes son idénticos en los dos subperíodos. d) (7 puntos) Sabiendo que los R2 de cada período fueron 0,9774 y 0,9944, respectivamente, testee la significación global del modelo en cada uno de ellos. Repita el mismo test para la regresión que cubre todo el período. En todos los casos usted debe plantear hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilice α = 5%. Ejercicio 3.2.8 (Prueba 2, 2do. Semestre de 1995) Un economista que está estudiando los determinantes de las importaciones en Chile para el período 1960-1995, postula la siguiente regresión: 10 ln Mi = β1 + β2 ln Yi + β3 ln TCR i + µi donde M es el nivel de importaciones totales, Y es el PIB y TCR el tipo de cambio real. Este economista presume que la apertura comercial de 1974 y otras reformas económicas provocaron un cambio de parámetros en la función de importaciones. Por lo tanto, tomando en cuenta esta hipótesis, estima los parámetros de dicho modelo para diferentes períodos, encontrando los siguientes resultados: Período 1960-74 β1 = -8,95 β2 = 1,5 β3 = 0,08 σ2 = 0,0048 Período 1975-94 β1 = -10,67 β2 = 1,79 β3 = -0,55 σ2 = 0,0055 Período 1960-94 β1 = -10,66 β2 = 1,72 β3 = -0,32 σ2 = 0,0077 ¿Es posible afirmar que existió cambio estructural? ¿Por qué? Si lo hubiere, ¿cómo haría para detectar en que parámetro(s) se produjo? Si fuera necesario usted debe plantear la hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilice α = 5%. Ejercicio 3.2.9 (Prueba 2, 1er. Semestre de 1996) Se ha postulado la siguiente función de producción de una empresa: ln Qi = β1 + β2 ln Li + β3 K i + µi obteniéndose los siguientes resultados: ln Qi = 0,5 + 0,75 ln Li + 0,20 ln K i + ei (0,71) (0,14) donde Qi es el nivel de producción, L es el nivel de empleo y K es el nivel utilizado de capital (ln significa logaritmo natural). Los términos entre paréntesis corresponden al desvío estándar de cada parámetro. Además se sabe que el tamaño muestral es 23, la covarianza entre los coeficientes de capital y trabajo fue de +0,06, y el R2 = 0,969. a) (10 puntos) Testee la significancia de cada uno de los coeficientes de la regresión y la significancia global del modelo. b) (10 puntos) Testee la hipótesis de que la función de producción es homogénea de grado 1. ¿Puede afirmarse que los requerimientos del factor trabajo en la empresa son el cuádruple de los requerimientos de capital? c) (10 puntos) La estimación de los modelos de regresión simple de la producción de la empresa respecto a la dotación de cada uno de los factores ha producido los siguientes resultados: ln Qi = -5,5 + 1,71 ln Li + ei (0,09) ln Qi = 5,3 + 0,34 ln Ki + ei (0,02) Discuta rigurosamente la aparente contradicción entre los dos tipos de contrastes realizados en el apartado a) a la vista de estos resultados. Si fuera necesario, usted debe plantear la hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilice α = 5%. Ejercicio 3.2.10 (Prueba 2, 1er. Semestre de 1996) 11 a) Explique la secuencia de pasos necesarios para construir un intervalo de predicción. No es necesario realizar demostraciones o cálculos matemáticos, pero si utilizar las fórmulas más importantes. b) Cuando una restricción verdadera se impone a los datos el R2 de la regresión aumenta, mientras que si es falsa el R2 disminuye. c) El error cuadrático medio del estimador de un parámetro de una ecuación que ha sido estimada incorporando una restricción incorrecta entre sus coeficientes será mayor que el obtenido si el modelo es estimado sin restricción. Comente. d) En el modelo de regresión lineal general, el supuesto de normalidad de loserrores es necesario para poder estimar los parámetros del modelo. e) La introducción de una restricción lineal aumentará la suma de cuadrados residuales de una regresión si ella es verdadera y la reducirá si es falsa. Ejercicio 3.2.11 (2do control del Segundo Semestre 96) Se ha estimado la siguiente función de producción: ln Yt = 2.25 + 0.332 ln Kt+ 0.752 ln Lt a) Determine la forma del estadístico F que debería utilizar para testear la hipótesis de que la elasticidad de producción del trabajo es el doble de la elasticidad de producción del capital usando el test Cβ. b) Usted sospecha que hay cambio estructural en el año 1975, explique como testearía su hipótesis a través de la suma de cuadrados residuales (o test de Chow o test de cambio estructural) ¿Cuáles son las ventajas de hacer el mismo test utilizando variables dummies? Ejercicio 3.2.12 (2da prueba del Segundo Semestre 96) El director del Departamento Latinoamericano de Seguridad Aérea (DELSA) está muy preocupado por la cantidad de accidentes aéreos ocurridos en el último año. Él postula que el número de personas que pierden la vida en accidentes aéreos (N) es una función lineal del gasto en control aéreo de los aeropuertos (GCA) y del gasto en mantenimiento de los aviones (GMA). Al estimar por MICO, una regresión con las series mensuales para el período enero de 1986 a diciembre de 1995, se obtienen los siguientes resultados: Nt= 25 -1.0 GCAt -1.2 GMAt (5.0) (0.71) (0.81) (entre paréntesis se presenta el desvío estandar de cada coeficiente) R2= 0.9 (X’X)-1= 10 0 9 11 0 9 0 2 017 11 017 0 26 . . . . . . . . − − Si se amplía la muesta hasta octubre de 1996 se obtiene que la suma de cuadrados residuales es de 200. La suma de cuadrados residuales de la regresión corrida para los 10 meses del año 96 es de 19. a) Analice los resultados de la regresión realizada. ¿Cuál es el problema econométrico que posee esta estimación? ¿Cuáles serían las propiedades de los estimadores MICO obtenidos de esta regresión? De acuerdo a estas propiedades, qué puede usted decir respecto a la utilidad de estos estimadores? b) El Director de DELSA asegura que el presupuesto se distribuye entre los dos tipos de gastos sin desviaciones, por lo que él cree que β2 debe ser igual a β3. ¿ Valida la evidencia su afirmación? ¿Mejoraría su estimación usando esta información? ¿Por qué? c) Evalúe la siguiente afirmación: “ El problema reciente de caída de aviones se debe a que el monto gastado en mantenimiento de aeropuertos y aviones ha disminuido”. Ejercicio 3.2.13 Se ha estimado por MICO el siguiente modelo 12 Yi = β1 + β2 Xi2 + β3 Xi3 + ui ∀ i El R2 de la regresión entre la variable dependiente Y y las variables explicativas X’s es 0,9 mientras que el coeficiente de correlación simple al cuadrado (r2) entre X2 y X3 es 0,95. También se sabe que: y x 2 2 2 1 ∑ ∑ = y x 2 3 2 2 ∑ ∑ = N= 33 a) A partir de estos datos, calcule las varianzas estimadas de los estimadores MICO de β2 y β3 b) Para disminuir las varianzas de los estimadores se sugiere multiplicar las variables explicativas por constantes mayores que 1 (por ejemplo, expresando las unidades en gramos en vez de kilos). ¿Cómo se ven afectadas las varianzas de los estimadores ? ¿y los test t de significancia individuales? Ejercicio 3.2.14. a) El R2 de una regresión múltiple no puede ser alto en el caso en que los coeficientes de las variables explicativas sean individualmente no significativos, porque esto último implica que un gran porcentaje de la variación total queda sin explicar y esto se refleja en R2 bajos. Comente. b) En la estimación de Yi respecto a X1 y X2 no se obtienen los mismos resultados imponiendo la restricción β2+β3 =1 que estimando la regresión de (Yi-X1) respecto a (X2-X1) c)¿Puede ser negativo el R2 corregido? Explicar conceptualmente. Ejercicio 3.2.15. Un agrónomo desea examinar el efecto de distintos tipos de fertilizantes sobre el rendimiento de la tierra. Como es un experimento controlado, aplica cantidades de fertilizantes de forma que las variables explicativas sean ortogonales. El modelo estimado es: yi= $β 2xi2+ $β 3xi3+ $β 4xi4+ei donde las variables están medidas en desvíos respecto a la media. La regresión se hace con 30 datos. Los valores de los test t de significancia de los estimadores de β2, β3 y β4 son 3; 0,5 y 2,3 respectivamente. a) (10 puntos) Cuál es el valor del estadígrafo F para el test de la hipótesis conjunta de que ambos β3 y β4 son iguales a cero? b) (5 puntos) ¿ Aceptaría la hipótesis nula con un 95% de confianza? c) (5 puntos) ¿ Aceptaría que β3 y β4 son ambos cero al hacer los tests individuales? Ejercicio 3.2.16 Un economista cree que inversión trimestral en Chile se puede explicar bien mediante un modelo de aceleración de inversiones. Los resultados que se anexan refieren a la estimación de un modelo que intenta explicar la inversión bruta en capital fijo a nivel trimestral en Chile. Se utiliza como variable dependiente el logaritmo natural de la formación bruta de capital fijo (LFBKF) y como variables independientes el logaritmo natural del PIB (LY), variables dummies estacionales para el primer y segundo trimestre (D1 y D2) y la tasa de interés de captación a un año, rezagada en cuatro períodos (TIRC1(-4)) a) (6 puntos) Interprete cuidadosamente el significado económico de los 6 parámetros estimados del modelo (Anexo 1). b) El economista sospecha que a partir del primer trimestre de 1990, los coeficientes pueden haber cambiado por la influencia de la inversión extranjera. Para eso estima el mismo modelo para dos subperíodos, obteniendo los resultados que se reportan en los Anexos 2 y 3 respectivamente. 13 b.1) (8 puntos) ¿Cuál sería el test a realizar para confirmar la sospecha del economista? Explique claramente cuál es la hipótesis nula a contrastar y el mecanismo de decisión. Aplique el test propuesto. ¿Qué conclusiones obtiene? b.2 (8 puntos) Analizando el coeficiente de la variable explicativa LY, el investigador piensa que la mayor parte del cambio se refleja en esta variable. ¿Qué test realizaría si sólo quiere analizar la estabilidad del coeficiente de la variable explicativa LY? En el caso de que el test anterior resultara que el coeficiente de LY es diferente en los dos subperíodos, ¿Cómo especificaría el modelo? Anexo 1 LS // Dependent Variable is LFBKF Sample: 1986:1 1996:2 Included observations: 42 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C -10.41558 0.514226 -20.25488 0.0000 LY 1.657531 0.037022 44.77150 0.0000 D1 -0.169426 0.018983 -8.925102 0.0000 D2 -0.088311 0.018924 -4.666597 0.0000 TIRC1(-4) -0.021615 0.004426 -4.883468 0.0000 R-squared 0.982086 Mean dependent var 12.50782 Adjusted R-squared 0.980149 S.D. dependent var 0.357112 S.E. of regression 0.050314 F-statistic 507.1030 Sum squared resid 0.093667 Prob(F-statistic) 0.000000 Anexo 2 LS // Dependent Variable is LFBKF Sample: 1986:1 1989:4 Included observations: 16 Variable Coefficient Std. Error t-Statistic Prob. C -16.67928 1.509626 -11.04862 0.0000 LY 2.113605 0.106026 19.93478 0.0000 D1 -0.166028 0.017950 -9.249715 0.0000 D2 -0.099045 0.017934 -5.522610 0.0002 TIRC1(-4) -0.023780 0.009819 -2.421740 0.0339 R-squared 0.987301 Mean dependent var 12.15828 Adjusted R-squared 0.982683 S.D. dependent var 0.222346 S.E. of regression 0.029259 F-statistic 213.7993 Sum squared resid 0.009417 Prob(F-statistic) 0.000000 Anexo 3 LS // Dependent Variable is LFBKF Sample: 1990:1 1996:2 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C -7.711107 1.446052 -5.332523 0.0001 LY 1.467390 0.101138 14.508810.0000 D1 -0.138895 0.023432 -5.927565 0.0000 D2 -0.052892 0.023195 -2.280347 0.0376 TIRC1(-4) -0.024923 0.005076 -4.910341 0.0002 R-squared 0.964750 Mean dependent var 12.64589 Adjusted R-squared 0.955350 S.D. dependent var 0.200139 S.E. of regression 0.042291 F-statistic 102.6320 Sum squared resid 0.026827 Prob(F-statistic) 0.000000 Ejercicio 3.2.17 (Prueba 1, 2do. Semestre de 1997) Un científico está realizando un experimento que intenta medir el efecto de dos medicamento (X2 y X3) sobre el control de una enfermedad. Como es un experimento controlado, aplica cantidades de medicamento de forma que las variables explicativas sean ortogonales ( es decir que la covarianza entre las variables explicativas sea cero). El modelo estimado es: 14 yi= $β 2xi2+ $β 3xi3+ei donde las variables están medidas en desvíos respecto a la media. Se tienen además la siguiente información: x x′ = 10 5 ? ? x y′ = 10 20 Y’Y=190 Y = 3 a) (4 puntos) Calcule $β 2 y $β 3. b) (4 puntos) Calcule el R2 y el R2 corregido. c) (6 puntos) ¿Son los coeficientes significativos? d) (2 puntos) Genere intervalos de confianza para los coeficientes. e) (4 puntos) ¿Puede usted calcular la constante del modelo? Si es posible, hágalo. f) (5 puntos) Presente un test de significancia global del modelo. Si fuera necesario usted debe plantear la hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilice α = 5%. Ejercicio 3.2.18 (Prueba 1, 2do. Semestre de 1997) 1) (4 puntos) ¿Cuáles supuestos deben plantearse para que el test de cambio estructural basado en los residuos sea válido? 2) (6 puntos) Usted está interesado en probar las siguientes hipótesis utilizando el test CB ii) H0: 3β2 = β3 H1: 3β2 ≠ β3 ii) H0: β2 = β3 = β4 = 0 H1: Alguno distinto de 0 iii) H0: β2 + β3 + β4 = 1 H1: β2 + β3 + β4 ≠ 1 Plantee las hipotesis nula y alternativa definiendo en cada caso la forma de la matriz C. Ejercicio 3.2.19 (Prueba 1, 2do. Semestre de 1997) La producción de una empresa está bien representada por una función Cobb-Douglas. Por ello se ha estimado la siguiente función para el período 1981-1995 LS // Dependent Variable is LOG(Q) Sample(adjusted): 1981 1995 Included observations: 15 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 0.500561 4.480023 0.111732 0.9129 LOG(L) 0.757540 0.707328 1.070989 0.3052 LOG(K) 0.188012 0.138675 1.355773 0.2001 R-squared 0.968882 Mean dependent var 7.788604 Adjusted R-squared 0.963696 S.D. dependent var 0.067435 S.E. of regression 0.012849 Sum squared resid 0.001981 F-statistic 186.8157 Prob(F-statistic) 0.000000 15 a. (7 puntos) ¿Cuál es el problema econométrico que posee esta estimación? ¿Cuáles serían las propiedades de los estimadores MICO obtenidos de esta regresión? b. (7 puntos) El investigador sospecha que existen rendimientos constantes a escala en la producción por lo que estima una segunda regresión. (log Q- log K)= β1+ β2 (log L - log K)+ ui cuyos resultados se anexan a continuación. LS // Dependent Variable is LOG(Q)-LOG(K) Sample(adjusted): 1981 1995 Included observations: 15 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 0.072631 0.007843 9.261127 0.0000 LOG(L)-LOG(K) 0.825073 0.020724 39.81167 0.0000 R-squared 0.991865 Mean dependent var 0.357884 Adjusted R-squared 0.991239 S.D. dependent var 0.131936 S.E. of regression 0.012349 Sum squared resid 0.001983 F-statistic 1584.969 Prob(F-statistic) 0.000000 Testee la existencia de rendimientos constantes a escala. ¿Mejoraría su estimación usando esta información? ¿Por qué? c. (7 puntos) Conocidos los datos macroeconómicos correspondientes al año 1996, se estimó la siguiente regresión: LS // Dependent Variable is LOG(Q)-LOG(K) Sample: 1981 1996 Included observations: 16 Variable Coefficient Std. Error t-Statistic Prob. C 0.072631 0.007843 9.261127 0.0000 LOG(L)-LOG(K) 0.825073 0.020724 39.81167 0.0000 D96 -0.056811 0.013488 -4.212096 0.0010 R-squared 0.993255 Mean dependent var 0.343419 Adjusted R-squared 0.992217 S.D. dependent var 0.139981 S.E. of regression 0.012349 Sum squared resid 0.001983 F-statistic 957.1265 Prob(F-statistic) 0.000000 Donde D96 es una variable dummy que toma valor 1 para en el año 1996 y cero en el resto. Interprete el coeficiente, el desvío standar y el test t asociado a D96. En todos los casos que sea necesario usted debe plantear hipótesis nula y alternativa, el test y la distribución utilizada, los grados de libertad y el criterio de aceptación o rechazo. Utilice α = 5%. Ejercicio 3.2.20. (Prueba 2, 2do. Semestre de 1997) 16 Los parámetros del siguiente modelo de regresión han sido estimados por MICO utilizando datos trimestrales de los años comprendidos entre 1968 y 1986 (ambos inclusive). Yt= 2,2+0,104 X2t - 3,48 X3t+ 0,34 X4t+et Además SCR=18,48 y SCE= 109,6 Posteriormente, se han estimado dos nuevas regresiones basadas en el modelo original, con datos trimestrales de 1968 a 1978 y de 1979 a 1986, respectivamente. Las sumas de cuadrados de los residuos obtenidos para cada uno de los subperíodos son 9,32 y 7,46, respectivamente. Si queremos contrastar la hipótesis de estabilidad de los coeficientes del modelo anterior en los dos subperíodos: a) (5 puntos) ¿Cuál sería el test a realizar? Explique claramente cuál es la hipótesis nula a contrastar y el mecanismo de decisión. b) (3 puntos) Aplique el test anterior al ejercicio propuesto. ¿Qué conclusiones obtiene? c) (6 puntos) ¿Qué test realizaría si sólo quiere analizar la estabilidad del coeficiente de la variable explicativa X2? d) (6 puntos) En el caso de que el test anterior resultara que el coeficiente de X2 es diferente en los dos subperíodos, ¿Cómo especificaría el modelo? e) (5 puntos) Testee la presencia de estacionalidad trimestral en el modelo sabiendo que al añadir tres variables ficticias que recogen este efecto la suma de cuadrados explicados es 114,8. Ejercicio 3.2.21 (Control 3, 2do. Semestre de 1997) Describa la prueba de estabilidad estructural basada en los residuos (o test de cambio estructural). Ejercicio 3.2.22 (Control 3, 2do. Semestre de 1997) Explique cuidadosamente cómo utilizar variables dicotómicas (variables dummies) para detectar cambio estructural. ¿Cuáles son sus ventajas respecto a la prueba de estabilidad estructural basada en las sumas de cuadrados residuales? Ejercicio 3.2.23 (Prueba 2, 1er. Semestre de 1998) Se postula el siguiente modelo de demanda por agua en Santiago en base a datos trimestrales: Ln (Ai) = β1 + β2 Ln(Ci) + β3 Ln(POB i) + β4 Ln (Yi )+ β5 Ln (P i ) + β6 Ln (LL i ) + µi donde A es el consumo total de agua, C es el número de casas, Y es el ingreso per cápita, P es el precio del agua y LL es la lluvia del período. Ln indica logaritmo natural. a) (5 puntos) ¿Qué signos esperaría para los coeficientes de los parámetros β2 a β6? 17 Utilizando datos anuales para el período 1962-1997 (ambos años inclusive), los resultados obtenidos fueron los siguientes: Ln (Ai) = 5,3 + 0,33 Ln(Ci) + 0,35 Ln(POB i) – 0,1 Ln (Yi ) - 0,5 Ln (P i ) – 0,25 Ln (LL i ) + ei R2=0,9 b) (3 puntos) ¿Coinciden los signos con los esperados? Si alguno difiere especule una interpretación alternativa a la planteada en a). c) (10 puntos) Testee la significancia de cada uno de los coeficientes de la regresión y la significancia global del modelo. De acuerdo a los resultados que obtuvo, identifiquelas variables candidatas a ser excluidas. d) (12 puntos) Con la información disponible pruebe las siguientes hipótesis: “Un aumento de 1% en la población tiene un efecto similar en términos de variación porcentual de la demanda por agua a un incremento de 1% en el número de casas”. “Un aumento simultáneo de 1% en el número de casas y población no tendría efectos en la demanda de agua si también se incrementan simultáneamente en 1% las lluvias y el precio”. Ejercicio 3.2.24 (Prueba 2, 2do. Semestre ’98) Considerando un modelo de regresión simple, demuestre que los siguientes estadísticos son equivalentes para contrastar la hipótesis de que β2=0: )ˆ(ŜD ˆ t 2 2 β β = aˆ ˆ F 22 2 2 2 σ β = [ ] )2n( e'e R/)rˆC( 'C )X'X(C )'rˆC(F 2 112 −σ −βσ−β = −− Ejercicio 3.2.25 (Prueba 2, 2do. Semestre de 1998) Un economista desea explicar las ventas de su empresa en función del PIB y de la tasa de interés real (r) en base a datos anuales para el período comprendido entre 1974 y 1997. (1) Ln VTAS = -2.78 + 1,12 Ln PIB - 0,065 r + ei −− −− ==− − 010,0 0250,0 010,002,00036,0 00025,00289,0 00015,0020,00121,0 )'(ˆ*)ˆ(ˆ 12 xxOVCVAR σβ 2 2 R1 R)2n(F − − = 18 (0,34) (0,02) (0,01) R2=0,94 y'y = 2,0 Los términos entre paréntesis corresponde a los desvíos estándares de los parámetros. a) (4 puntos) Testee la significancia de cada uno de los coeficientes de la regresión. b) (4 puntos) Realice un test de significancia global del modelo. c) (10 puntos) Dos regresiones adicionales, basadas en la especificación original de la ecuación (1) fueron estimadas para los subperíodos 1974 a 1985 y 1986 a 1997, generando SCR de 0,01 y 0,004, respectivamente. Si queremos contrastar la hipótesis de estabilidad de los coeficientes del modelo anterior en los dos subperíodos, ¿Cuál sería el test a realizar? Explique claramente cuál es la hipótesis nula a contrastar y el mecanismo de decisión. Realice dicho test con la información disponible? ¿Qué conclusiones obtiene? d) (6 puntos) El Instituto de Economía de la Universidad Católica estima que el crecimiento del PIB se ubicaría en torno a 2% durante 1999 y que la tasa de interés real disminuirá en dos puntos porcentuales. Considerando la información disponible ¿cuánto sería la predicción individual de crecimiento de las ventas de esta empresa? ¿Y la predicción media? Considerando los resultados obtenidos en c) ¿la predicción obtenida le genera alguna aprensión? e) (6 puntos) Explique la secuencia de pasos necesarios para construir un intervalo de predicción. No es necesario realizar demostraciones o cálculos matemáticos, pero si utilizar las fórmulas más importantes. Ejercicio 3.2.26 (Prueba 2, 2do. Semestre de 1998) Partiendo de la misma muestra, se han encontrado los siguientes resultados para explicar el comportamiento de la variable Y: (1) Yi = 1,72 + 0,37 Xi + ei para i =1,2, ....n 2 XR = 0,71 (2) Yi = 2,37 + 0,81 Zi + ei para i =1,2, ....n 2 XR = 0,22 a) (15 puntos) Considerando que las variables X y Z no están correlacionadas entre sí, y que la media de la variable dependiente es 20, calcule los valores de los estimadores MICO y el R2 de la siguiente regresión: Yi = β1 + β2Xi + β3Zi3 + µi para i =1,2, ....n b) (5 puntos) ¿Se puede decir que la SCR del modelo (3) es igual a la suma de las SCR de los modelos (1) y (2)? ¿Por qué? Ejercicio 3.2.28 (Control, 2do. Semestre de 1998) Explique por qué en el modelo de regresión múltiple el test de significancia global basado en el estadístico F es más relevante que en el modelo de regresión simple. Explique paso a paso cómo se realiza esta prueba. Ejercicio 3.2.27 Una compañía de viajes ha utilizado un modelo lineal para explicar la demanda de viajes a Europa de sus 50 agencias repartidas por el territorio nacional (Di) en función del ingreso per cápita de la zona en que están situadas (Yi), los gastos de permanencia (Gi) y los precios de transporte (Ti). La regresión estimada fue la siguiente: Di = 1,124 + 8,44Yi - 1,4288 Gi - 1,1008 Ti + ei 19 $σe 2 = 0,193722 ( ' ) , , , , , , , , , X X − = − − − − − 1 0 02 0 0 0024 0 016 0 2 0 04 0 04 0 1312 0 1408 0 1072 a) Se quiere abrir una nueva agencia y nos interesa predecir cuál será la demanda esperada, utilizando para ello la regresión anterior. Calcule dicha demanda esperada sabiendo que YN+1= 200, GN+1= 80 y TN+1 = 40 b) Calcule los intervalos de confianza al 95% y 99% para la predicción puntual esperada. Ejercicio 3.2.28 (Prueba 2, 1er. Semestre de 1999) a) (3 puntos) ¿Por qué se postula kn e'e − como estimador de σ2? b) (3 puntos) ¿Por qué en el test de significación global del modelo de regresión múltiple se excluye el intercepto en el planteo de la hipótesis nula? c) (3 puntos) Para probar test de cambio estructural se requiere que la varianza del error en el primer período sea igual a la varianza del segundo período. ¿Por qué? ¿Qué valida este requerimiento? d) (3 puntos) Dos economistas discuten respecto a la expresión matemática de la función de producción en Chile. El economista “Complicadito” plantea que la producción se rige por una función del tipo: lnYi = β1 + β2 lnLi + β3 lnKi + β4 Li + β5 Ki + β6 Li*Ki +µi El economista “Sencillito” afirma que se la producción sigue una función Cobb-Douglas con retornos constantes a escala. Diseñe el test Cβ (planteando la forma de la matriz C) necesario para probar la hipótesis de “Sencillito”. e) (3 puntos) En un modelo de regresión múltiple con k=3 si el origen se encuentra fuera de la elipse de confianza de los parámetros β2 y β3 puede concluirse que el modelo es significativo en su conjunto. Comente. f) (3 puntos) Explique intuitivamente la forma gráfica que adoptaríua la elipse de confianza de un modelo con dos variables explicativas ortogonales. Ejercicio 3.2.29 (Examen, 1er. Semestre de 1999) Un economista desea testear si existe cambio estructural en la demanda por dinero en un país. A continuación se anexan los graficos de CUSUM CUADRADO y de residuos recursivos de los cuatro parámetros estimados. 20 -4 -2 0 2 4 6 8 10 88 89 90 91 92 93 94 95 96 97 Recursive C(1) Estimates ± 2 S.E. -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 88 89 90 91 92 93 94 95 96 97 Recursive C(2) Estimates ± 2 S.E. -0.06 -0.04 -0.02 0.00 0.02 0.04 0.06 88 89 90 91 92 93 94 95 96 97 Recursive C(3) Estimates ± 2 S.E. 0.2 0.4 0.6 0.8 1.0 1.2 1.4 88 89 90 91 92 93 94 95 96 97 Recursive C(4) Estimates ± 2 S.E. -0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 87 88 89 90 91 92 93 94 95 96 97 CUSUM of Squares 5% Significance Al dividir la muestra en dos subperíodos se obtiene la siguiente información Periodo n SCR 1986:02 1997:12 143 0.289369 1986:02 1992:03 74 0.187473 1992:04 1997:12 69 0.097369 Realice ambos test de cambio estructural comparando los resultados obtenidos. Se le ocurre otra forma adicional de testear cambio estructural? Cuál es y cómo desarrollaría la prueba. Ejercicio 3.2.30 (2da. Prueba, 2do. Semestre de 1999) Suponga que el gráfico que sigue muestra la región de confianza conjunta para β2 y β3 al 95%. 21 3β̂ 2β̂ Comente las siguientes afirmaciones: 1. La covarianza entre 32 ˆ,ˆ ββ es negativa 2. La hipótesis nula Ho) β2=β3=0 H1) Alguno distinto de cero es rechazada al 95% 3. La hipótesis nula: Ho) β2=2 β3=1 H1) Alguno distinto no se puede rechazar al 95% 4. Dibuje una elipse de confianza para el caso en que exista multicolinealidad entre dos variables explicativas, cuyos coeficientes tengan covarianza negativa entre si. Ejercicio 3.2.31 (2da. Prueba, 2do. Semestre de 1999) Considerando que la función de producción32 ββα KLQ = (Cobb-Douglas) representa adecuadamente el comportamiento de la producción de un país, se decidió estimar econométricamente las siguientes ecuaciones: Ecuación 1 Ln Q = β1 + β2lnL + β3lnK + µ Ecuación 2 Ln L = α1 +α2 lnK + µ Ecuación 3 Ln Q = β1 + β2lnL + (1-β2) lnK + µ Donde Q es el producto L es la dotación de trabajo K es la dotación de capital Ecuación 1 Dependent Variable: LOG(Q) Sample(adjusted): 1985 1999 22 Included observations: 15 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 0.500561 4.480023 0.111732 0.9129 LOG(L) 0.757540 0.707328 1.070989 0.3052 LOG(K) 0.188012 0.138675 1.355773 0.2001 R-squared 0.968882 Mean dependent var 7.788604 Adjusted R-squared 0.963696 S.D. dependent var 0.067435 S.E. of regression 0.012849 Sum squared resid 0.001981 F-statistic 186.8157 Prob(F-statistic) 0.000000 Ecuación 2 Dependent Variable: LOG(L) Sample(adjusted): 1985 1999 Included observations: 15 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 6.331099 0.050646 125.0079 0.0000 LOG(K) 0.194510 0.006813 28.54798 0.0000 R-squared 0.984299 Mean dependent var 7.776451 Adjusted R-squared 0.983092 S.D. dependent var 0.038745 S.E. of regression 0.005038 Akaike info criterion -7.620003 Sum squared resid 0.000330 Schwarz criterion -7.525596 Log likelihood 59.15002 F-statistic 814.9870 Durbin-Watson stat 1.698197 Prob(F-statistic) 0.000000 Ecuación 3 Dependent Variable: LOG(Q) Sample(adjusted): 1985 1999 Included observations: 15 after adjusting endpoints LOG(Q) = C(1) + C(2)*LOG(L)+(1-C(2))*LOG(K) Coefficient Std. Error t-Statistic Prob. C(1) 0.072631 0.007843 9.261127 0.0000 C(2) 0.825073 0.020724 39.81167 0.0000 R-squared 0.968859 Mean dependent var 7.788604 Adjusted R-squared 0.966463 S.D. dependent var 0.067435 S.E. of regression 0.012349 Akaike info criterion -5.826859 Sum squared resid 0.001983 Schwarz criterion -5.732452 Log likelihood 45.70144 Durbin-Watson stat 2.091495 a) (5 puntos) Describa los resultados obtenidos en la estimación de la ecuación 1. Identifique las propiedades de los estimadores MICO utilizados. b) (4 puntos) Testee la existencia de retornos constantes a escala en la producción. c) (5 puntos) En base a las tres ecuaciones reportadas, compare los resultados obtenidos en las ecuación 1 y en la ecuación 3. ¿Le parece lógico el proceso seguido? Explique por qué. Explique el resultado de la ecuación 2. d) (4 puntos) Explique las consecuencias de los errores de Tipo I y de Tipo II implícitos en su resultado de la letra b. e) (3 puntos) Discuta el error cuadrático medio de los estimadores en función de la falsedad de la restricción. f) (3 puntos) Suponga que en el año 2000 el empleo estimado es 2386 y el capital es 1717, ¿cuál es el nivel de producción estimado? Justifique. g) (10 puntos) En el año 1993 comenzó un proceso de apertura comercial que puede haber provocado cambio estructural. A continuación se agregan algunas regresiones que le permitan testear esta hipótesis. g1) .Realice un test de Chow de cambio estructural. g2) ¿Hay cambio estructural en la pendiente de la regresión? ¿ y en la constante? Subperíodo 1 LS // Dependent Variable is LOG(Q) Sample: 1975 1983 Included observations: 9 Variable Coefficient Std. Error t-Statistic Prob. 23 C 0.800820 8.044428 0.099550 0.9239 LOG(L) 0.725264 1.267089 0.572386 0.5879 LOG(K) 0.181391 0.245420 0.739105 0.4877 R-squared 0.960625 Mean dependent var 7.794263 Adjusted R-squared 0.947500 S.D. dependent var 0.072555 S.E. of regression 0.016624 Akaike info criterion -7.932561 Sum squared resid 0.001658 Schwarz criterion -7.866820 Log likelihood 25.92608 F-statistic 73.19098 Durbin-Watson stat 1.871164 Prob(F-statistic) 0.000061 Subperíodo 2 LS // Dependent Variable is LOG(Q) Sample(adjusted): 1984 1989 Included observations: 6 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 0.914225 2.974150 0.307390 0.7786 LOG(L) 0.652298 0.471055 1.384760 0.2601 LOG(K) 0.242593 0.093850 2.584909 0.0814 R-squared 0.995959 Mean dependent var 7.780115 Adjusted R-squared 0.993265 S.D. dependent var 0.064543 S.E. of regression 0.005297 Akaike info criterion -10.17438 Sum squared resid 8.42E-05 Schwarz criterion -10.27850 Log likelihood 25.00951 F-statistic 369.6810 Durbin-Watson stat 2.332551 Prob(F-statistic) 0.000257 LS // Dependent Variable is LOG(Q) Sample(adjusted): 1975 1989 Included observations: 15 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 0.800820 6.732891 0.118942 0.9079 LOG(L) 0.725264 1.060507 0.683884 0.5113 LOG(K) 0.181391 0.205408 0.883079 0.4002 DUM84 0.113405 10.31340 0.010996 0.9915 LOG(L)*DUM84 -0.072966 1.629642 -0.044774 0.9653 LOG(K)*DUM84 0.061202 0.320883 0.190730 0.8530 R-squared 0.972631 Mean dependent var 7.788604 Adjusted R-squared 0.957426 S.D. dependent var 0.067435 S.E. of regression 0.013914 Akaike info criterion -8.260539 Sum squared resid 0.001742 Schwarz criterion -7.977319 Log likelihood 46.66996 F-statistic 63.96831 Durbin-Watson stat 2.172432 Prob(F-statistic) 0.000001 Ejercicio 3.2.30 Comente las siguientes afirmaciones, indicando si son verdaderas, falsas o inciertas. a) El estimador MICO es siempre más eficiente que un estimador MICO restringido, en el sentido de tener menor varianza dentro de los lineales e insesgados. b) La introducción de una restricción lineal aumentará el R2 de la regresión si ella es verdadera y lo reducirá si es falsa. c) Cuando una restricción verdadera se impone a los datos el R2 de la regresión aumenta, mientras que si es falsa el R2 disminuye. Ejercicio 3.2.31 (Prueba 2, 1er. Semestre de 2000) Un administrador de inversiones en Chile lo contrata a usted (experto en finanzas y econometría) para formular un portafolio de 5 acciones que replique el comportamiento del IPSA. a) (5 puntos) Postule el modelo teórico a estimar explicitando las condiciones que deberían cumplir los parámetros. Explique en detalle. 24 ECUACIÓN 1 Dependent Variable: RIPSA Method: Least Squares Sample(adjusted): 1991:01 1999:12 Included observations: 108 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C -0.000580 0.002018 -0.287269 0.7745 RENDESA 0.374732 0.025677 14.59437 0.0000 RCTC 0.235836 0.024642 9.570350 0.0000 RCOPEC 0.141741 0.024118 5.876888 0.0000 RIANSA 0.094458 0.020972 4.503915 0.0000 RMASISA 0.055774 0.017067 3.268029 0.0015 R-squared 0.936868 Mean dependent var 0.017523 Adjusted R-squared 0.933743 S.D. dependent var 0.078291 S.E. of regression 0.020153 Akaike info criterion -4.916527 Sum squared resid 0.041019 Schwarz criterion -4.766648 Log likelihood 269.0342 F-statistic 299.7644 Durbin-Watson stat 1.873522 Prob(F-statistic) 0.000000 ECUACIÓN 2 Dependent Variable: RIPSA Method: Least Squares Sample(adjusted): 1991:01 1999:12 Included observations: 108 after adjusting endpoints RIPSA = C(1) + C(2)*RENDESA + C(3)*RCTC + C(4)*RCOPEC + C(5)*RIANSA + (1-C(2)-C(3)-C(4)-C(5))*RMASISA Coefficient Std. Error t-Statistic Prob. C(1) -0.002060 0.002112 -0.975057 0.3318 C(2) 0.394623 0.026826 14.71061 0.0000 C(3) 0.270903 0.024437 11.08599 0.0000 C(4) 0.164237 0.024960 6.579926 0.0000 C(5) 0.125938 0.020613 6.109574 0.0000 R-squared 0.927504 Mean dependent var 0.017523 Adjusted R-squared 0.924661 S.D. dependent var 0.078291 S.E. of regression 0.021489 Akaike info criterion -4.796911 Sum squared resid 0.047103 Schwarz criterion -4.672012 Log likelihood 261.6347 Durbin-Watson stat 1.920349b) (7 puntos) Verifique las condiciones planteadas en a) en los modelos estimados por MICO y presentados anteriormente. ¿Es el modelo planteado en la ecuación 1 globalmente significativo? c) (4 puntos) ¿El R2 de la ecuación 2 podría haber sido mayor que el R2 de la ecuación 1? ¿Y las varianzas de los estimadores de la ecuación 2 podrían haber sido menores que las derivadas en la ecuación 1? ¿Por qué? Explique cuidadosamente. d) (8 puntos) ¿Cómo rechazaría, desde un punto de vista estadístico, la siguiente hipótesis: “el modelo estimado es estadísticamente superior a uno que resulta de asignar igual ponderación a cada uno de los activos”. Detalle dos procedimientos alternativos para probar esta hipótesis. e) (6 puntos) Centrándose en la propiedad de estabilidad de los parámetros ¿qué podría argumentar un “financista” para descartar el método econométrico aquí utilizado en formulación del portafolio? ¿Qué le respondería usted en calidad de “econometrista”? ¿A qué tests recurriría? ¿Cómo los implementaría? Ejercicio 3.2.32(2da. Prueba, 2do. Semestre de 2000) El reciente paper de Cerda, Donoso y Lema sobre fundamentos del tipo de cambio real en Chile intenta determinar los precios de transables que son relevantes en la trayectoria de largo plazo del indice de precios al consumidor (IPC). En dicho paper se establece que el indice de precios domestico se puede representar como un ponderado de precios de transables medidos en pesos chilenos y no transables como indica la ecuación (1) )w1( NT w T P PP −= 25 El precio de transables en pesos chilenos corresponde a la multiplicación del precio de los transables en dolares (PTUS ) por el tipo de cambio (e). (2) PT=e.PTUS El PTUS se construye a partir de los índices de valores unitarios efectivos de exportaciones e importaciones, medidos en dólares norteamericanos (pxUS y pmUS, respectivamente), extraídos de las transacciones comerciales del país. )1( USUSUS PM PXPT θ−θ= donde el hecho que los ponderadores sumen uno está dado por el postulado de homogeneidad. a) (7 puntos) Expresando el modelo en terminos logaritmicos, encuentre una ecuación que refleje la evolución del indice de precios domestico en función de los precio de exportables, de importables, del tipo de cambio y del precio de no transables . Convierta este modelo teórico en un modelo econometrico. ¿Qué restricciones deben cumplir los coeficientes? Se ha estimado la siguiente ecuación: LS // Dependent Variable is LOG(P) Date: 10/24/00 Time: 07:58 Sample: 1986:1 2000:2 Included observations: 58 Variable Coefficient Std. Error t-Statistic Prob. C -0.889503 0.182847 -4.864745 0.0000 LOG(PMUSSA) 0.228750 0.054441 4.201757 0.0001 LOG(PXUSSA) 0.002205 0.027248 0.080923 0.9358 LOG(TC) 0.142875 0.036549 3.909111 0.0003 LOG(PNT) 0.820323 0.018499 44.34432 0.0000 R-squared 0.999260 Mean dependent var 5.586325 Adjusted R-squared 0.999204 S.D. dependent var 0.528187 S.E. of regression 0.014905 Akaike info criterion -8.329867 Sum squared resid 0.011774 Schwarz criterion -8.152243 Log likelihood 164.2677 F-statistic 17881.75 Durbin-Watson stat 0.410901 Prob(F-statistic) 0.000000 b1) (2 puntos) ¿es significativa la contante?. ¿Qué razón se le ocurre para eso? b2) (6 puntos) Interprete los coeficientes estimados en base al modelo teórico planteado en a. ¿Son significativos? b3) (2 puntos) ¿Es significativa la regresión en su conjunto? b4) (4 puntos) Encuentre la ecuación restringida que debería utilizar para probar si las restricciones planteadas por usted en a) son aceptadas para la muestra. ¿Cómo se interpretan los coeficientes de la regresión restringida? b5) (5 puntos) Al estimar el modelo con restricciones sugeridas por usted en b4), se obtuvo que la suma de cuadrados residuales es 0.012636. ¿Se acepta la restricción?. Justifique detalladamente su respuesta. Ejercicio 3.2.33 (2da. Prueba, 2do. Semestre de 2000) En el siguiente modelo de regresión múltiple: iizixi Z X Y µ+β+β+β= se conoce la verdadera varianza del error , V(µi)=5. Tambien se sabe que ∑ = 3x 2i , ∑ = 2z 2i y ∑ −= 1zx ii (las variables en minusculas indican que estan expresadas en desvios respecto a la media). 26 a) (5 puntos) Calcule la varianza de zx ˆ y ˆ ββ b) (5 puntos) Usted sabe que 1 zx =β+β . Calcule la varianza de xˆ β del modelo restringido. c) (5 puntos) Dado que la varianza del modelo restringido es menor que la del modelo libre, siempre es conveniente utilizar el modelo restringido. Comente, justificando cuidadosamente su respuesta. Ejercicio 3.2.34 (2da. Prueba, 2do. Semestre de 2000) (6 puntos) Sea el modelo de regresión iik43i32i21i W Z X Y µ+β+β+β+β= . La teoría indica que se debe cumplir que 1 43 =β+β y que 42 2 β=β . Explique detalladamente como testearía la hipotesis nula de que estas restricciones son validas para la muestra utilizando el test Cβ. (4 puntos) Comente. Al agregar una variable a una regresión, la estimación de sigma se mantiene constante. Ejercicio 3.2.35 (2da. Prueba, 2do. Semestre de 2000) Al expresar las variables del modelo de regresion multiple en desvios respecto a la media, se obtiene β= ˆ x ŷ (3 puntos) Demuestre que µ+β= − 'x)x'x(x x ŷ 1 (7 puntos) Encuentre la esperanza y la varianza de ŷ . ¿Cuál es la distribución de ŷ ? (7 puntos) Demuestre que el R2 de la regresión es igual al cuadrado del coeficiente de correlación entre las variables yi e ŷ i . (4 puntos) Obtenga la distribución del estadistico 2 ŷ'ŷ σ bajo la hipotesis nula de que todas las pendientes del modelo de regresión son iguales a cero. (4 puntos) ¿Como se distribuye 2ˆ 1k ŷ'ŷ σ − ? Pregunta 3.2.36 (2da. Prueba, 1er. Semestre de 2004) Suponga la especificación “translog” para una función de producción cualquiera uLlnKln)K(ln)L(lnKlnLlnyln 6 2 5 2 4321 +β+β+β+β+β+β= a) (5 puntos) ¿Qué test de hipótesis realizaría para comprobar rendimientos marginales decrecientes de los factores? b) (3 puntos) Si al estimar este modelo, β1 resulta ser negativo, se pondría en jaque la lógica económica la producción sería nula cuando el resto de las variables sea cero. c) (3 puntos) Si al estimar este modelo, β3 resulta ser negativo, se pondría en jaque la teoría microeconómica, ya que empíricamente la producción disminuiría al aumentar el capital. Comente. d) Explique detalladamente como testearía las siguientes hipótesis utilizando el test Cβ. i. (6 puntos) El modelo correcto es Y=AK 2α L 3α ii. (7 puntos) El modelo correcto es Y=AK 2α L 3α , hay retornos constantes a escala y la participación del trabajo en el ingreso es el doble de la del capital. Pregunta 3.2.37 (2da. Prueba, 1er. Semestre de 2004) Se presenta el siguiente modelo para explicar el desempeño de 3203 alumnos en la PAA matemática. Dependent Variable: PAAMAT Method: Least Squares Sample: 1 3203 Included observations: 3203 27 Variable Coefficient Std. Error t-Statistic Prob. C 667.9927 8.167137 81.79032 0.0000 DCIENT -47.89766 11.11867 -4.307857 0.0000 DPART 20.22001 2.134100 9.474729 0.0000 EDAD*DSEXO 1.078275 0.088948 12.12252 0.0000 NEM*DCIENT 0.131257 0.011375 11.53950 0.0000 PCECCSS -0.015594 0.002893 -5.389480 0.0000 PCEFISICA 0.026233 0.003406 7.701803 0.0000 PCEMAT 0.101108 0.015368 6.579189 0.0000 DSUBV -7.719790 2.511399 -3.073901 0.0021 DCIENT*PCEMAT -0.051770 0.015498 -3.340377 0.0008 R-squared 0.377966 Mean dependent var 752.9913 Adjusted R-squared 0.376213 S.D. dependent var 54.30201 S.E. of regression 42.88782 Akaike info criterion 10.35817 Sum squared resid 5873094. Schwarz criterion 10.37713 Log likelihood -16578.61 F-statistic 215.5738 Durbin-Watson stat 1.639107 Prob(F-statistic) 0.000000 Donde: DCIENT 0 si colegio es de orientación científica, 1 otra orientaciónDPART 1 colegio particular 0 colegio resto EDAD*DSEXO Edad en años por 1, hombres 0 mujer NEM*DCIENT Promedio de notas en enseñanza media * DCIENT. PCECCSS Resultado en especifica de ciencias sociales PCEFISICA Resultado en prueba específica de física PCEMAT Resultado en prueba específica de matemática DSUBV Colegio Subvencionado 1, resto 0 DCIENT*PCEMAT DCIENT*resultado específica de matemáticas 28 a) (8 puntos) Discuta la bondad del modelo en general y la relevancia estadística de cada una de las variables incorporadas. b) (8 puntos) Discuta los signos esperados e interprete clara y detalladamente el significado de cada una de las sobre la variable dependiente. Incluida la constante. c) (4 puntos) ¿Es posible afirmar que el efecto de un punto adicional en la específica de física es similar a un punto adicional en la específica de matemática? ¿En qué caso lo sería? d) ¿Cómo construiría usted un test para demostrar que sistemáticamente los colegios científicos particulares tiene en promedio un 20% mejor de desempeño en la PAAMAT?. A partir de los coeficientes obtenidos ¿que diferencia muestra el modelo para estos colegios?. e) (5 puntos) Exprese sobre la normalidad de los residuos. ¿Qué consecuencias se derivan para las propiedades de los estimadores? 0 100 200 300 400 -160 -120 -80 -40 0 40 80 120 Series: Residuals Sample 1 3203 Observations 3203 Mean -1.41E-13 Median 4.077266 Maximum 141.2134 Minimum -183.4693 Std. Dev. 41.93179 Skewness -0.536124 Kurtosis 3.768143 Jarque-Bera 232.1855 Probability 0.000000