Vista previa del material en texto
Pontificia Universidad Católica de Chile
Instituto de Economía
Guía No1 de Econometría
Profesor Ricardo Guzmán
2do Semestre de 2006
Tema: Probabilidades y Estadística
1. Julio tiene dos hijos pequeños. Karinna también. Julio y Karinna no están relacionados entre sí. El
hijo mayor de Julio es niño. Al menos uno de los hijos de Karinna es hombre.
a) ¿Cuál es la probabilidad de que los dos hijos de Julio sean hombres?
Respuesta: La probabilidad de que los dos niños sean hombres es igual a la probabilidad de que
el hijo menor de Julio sea hombre, esto es, 1=2.
b) ¿Cuál es la probabilidad de que los dos hijos de Karinna sean hombres?
Respuesta: En general, 2 hijos pueden venir en cuatro �con�guraciones� equiprobables: niño y
niño; niño y niña; niña y niño; niña y niña. En el caso de Karinna, sabemos que la con�guración
�niña y niña� es imposible, ya que al menos uno de sus hijos es hombre. Luego, la probabilidad
de que los ambos hijos de Karinna sean varones es 1=3.
2. Larry, Moe y Curly juegan el siguiente �juego�. Primero Larry arroja al aire una moneda. Si sale cara,
Moe y Curly lo revientan a charchazos. Si sale sello, es el turno de Moe de lanzar la moneda. Si el
resultado es cara, son Larry y Curly quienes dan una tunda a Moe. Si el resultado es sello, le toca
a Curly tirar la moneda: cara signi�ca camotera para Curly; sello, Curly salva el pellejo y entrega la
moneda a Larry, etcétera. El juego prosigue hasta que alguno de los tres hermanos recibe una paliza.
Después de eso, los tres se van felices a tomar unas cervezas al HBH.
Si la probabilidad de obtener cara es �, ¿con qué probabilidad el zurrado será Larry? ¿Moe? ¿Curly?
Respuesta: Sea L la probabilidad de que el zurrado sea Larry, M la probabilidad de que sea Moe y C
la probabilidad de que sea Curly. Entonces:
L = � + (1� �)3 L =) L = �
1� (1� �)3
M = (1� �)L = (1� �)�
1� (1� �)3
C = (1� �)2 C = (1� �)
2
�
1� (1� �)3
3. El profesor Dimitri Trampov y la doctora Elizabeth Replansky organizaron, cada uno por separado,
sendas expediciones al Amazonas. El propósito de ambas expediciones era detectar y catalogar nuevas
especies de escarabajo. Trampov detectó 900 especies nuevas. Replansky descubrió 1100. Un año más
tarde, los dos sabios se encontraron en un congreso de entomología organizado por la Universidad de
Wildstone. Ahí se dieron cuenta (consternados) de que 50 de las nuevas variedades de escarabajo las
habían descubierto ambos simultáneamente. En base a esa información, conteste: ¿Cuántas especies
(aprox.) de escarabajo quedan aún por descubrir en el Amazonas? Suponga que la probabilidad de
que Trampov descubra una especie nueva es independiente de la probabilidad de que Replansky la
descubra.
Respuesta: Llamemos T al número de bichos que quedaban por descubrir antes de las expediciones
de Trampov y Replansky. Sea �a� la probabilidad de que Trampov descubra una especie nueva, y �b�
la probabilidad de que Replansky la descubra. El número de especies nuevas descubiertas por Trampov
es A = 900 � aT ; el número de especies nuevas descubiertas por Replanski es B = 1100 � bT . Usando
1
el supuesto de independencia, el número de especies descubiertas por ambos es C = 50 � abT . Por lo
tanto:
AB
C
=
abT 2
abT
= T:
En conclusión, el número de especies que quedan por descubrir después de las expediciones de Trampov
y Replanski es N � T �A�B + C = 17850.
4. La ciudad de Saltadilla despertó conmocionada. La bóveda del Último Banco Nacional amaneció pelada,
igual que la cabeza del alcalde. Zrillones de dólares se esfumaron. El ciudadano Guaripolo, único testigo
del incidente, a�rma que el responsable del atraco fue un duendecillo de color verde. El Profesor Utonio
ha calculado en su computadora que testigos como el ciudadano Guaripolo dicen la verdad el 80% de
las veces. El profesor Utonio también sabe (porque Burbuja los pintó) que el 85% de los duendecillos
de Saltadilla son azules, mientras que el 15% restante es verde. Dado el testimonio de Guaripolo, ¿cuál
es la probabilidad de que el ladrón sea un duendecillo verde?
Pistas: De�na los siguientes eventos:
DV : �Guaripolo declara que el duende es verde�.
DA: �Guaripolo declara que el duende es azul�.
EV : �El duende es verde�.
EA: �El duende es azul�.
Luego, demuestre que
P(EV jDV ) = P
(DV jEV ) P(EV )
P(DV jEV ) P(EV ) + P(DV jEA) P(EA)
:
Note que, como Guaripolo dice la verdad el 80% de las veces, P(DV jEV ) = 0; 8 y P(DV jEA) = 0; 2.
5. La chiripiolquiasis (conocida vulgarmente como �garrotera�) es una enfermedad espantosa. Aquéllos
que la padecen experimentan convulsiones repentinas e incluso parálisis temporal. Por fortuna la chiri-
piolquiasis es en extremo rara: sólo una en un millón de personas porta el virus que provoca esa
enfermedad.
La doctora Elizabeth Replansky ha desarrolado un examen de laboratorio que permite detectar la
chiripiolquiasis en su fase temprana, antes de que mani�este sus terribles síntomas. Según la doctora,
el examen es un prodigio de exactitud: si un sujeto está enfermo, el examen lo dirá con una probabilidad
de 95% (el examen no detecta la presencia virus un 5% de las veces); en cambio, si el sujeto está sano,
el examen sólo se equivoca (dice que está enfermo) un 0.05% de las veces.
Calcule la probabilidad de que una persona esté enferma dado que así lo indica el test. ¿Es realmente
tan preciso el examen?
6. ¡Felicidades! Usted ha sido seleccionado para participar en el �concurso de tres las puertas�del Festival
de la Una, presentado con el alto auspicio de Sabrosalsa Deyko (que hasta solita es rica). Detrás de una
de las puertas hay escondido un millón de pesos. Detrás de las otras dos puertas hay, respectivamente,
un cálifon Splendid y una guitarra Tizona (la guitarra de los entendidos). Usted debe adivinar cuál de
las tres puertas esconde el premio mayor. Si acierta, se lleva el millón de pesos. Si se equivoca, se lleva
uno de los dos premios de consuelo, ambos avaluados en mucho menos de un millón.
Las reglas del juego son las siguientes. Primero, el concursante elige una puerta. Luego, Enrique Malu-
enda debe abrir una de las otras dos. Por supuesto, Maluenda no quiere revelar la ubicación del millón
de pesos, por lo que siempre abre una puerta sin ese premio. El animador pregunta entonces al con-
cursante si desea quedarse con la puerta que eligió o pre�ere cambiarla por la otra que aún no ha sido
abierta. ¿Debe cambiar de puerta? Justi�que usando probabilidades.
Respuesta: El jugador debe cambiar de puerta, ya que la probabilidad de que el premio se encuentre
tras la puerta que eligió originalmente es 1=3, mientras que la probabilidad de que el premio se encuentre
tras la otra puerta cerrada es 2=3.
2
Primero, una explicación �intuitiva� para este resultado contraintuitivo. Antes de que Maluenda abra
una puerta, es razonable pensar que el millón de pesos se encuentra con igual probabilidad tras cualquiera
de las tres. En particular, la probabilidad de que se encuentre tras la elegida por el concursante es 1=3.
¿Debemos modi�car esa creencia cuando Maluenda abre una de las otras dos puertas? No, porque al
abrir siempre una puerta con premio de consuelo, la jugada de Maluenda no aporta ninguna infor-
mación sobre qué tan acertada fue la decisión original del concursante (note que abrir una puerta sin
millón es una jugada que Maluenda siempre puede hacer, independiente de si el concursante acertó o
no en la primera oportunidad). Como el premio no se encuentra tras la puerta abierta, y se encuentra
con probabilidad 1=3 tras la puerta elegida por el concursante, la probabilidad de que se encuentre tras
la otra puerta cerrada es 2=3. En conclusión, el concursante debe cambiar.
Ahora la solución usando probabilidades: Supongamos, sin pérdida de generalidad, que el concursante
eligió la puerta 1 y luego Maluenda abrió la puerta 2. Llamemos Mi al evento �el millón se encuentra
tras la puerta i� y Ai al evento �Maluenda abre la puerta i�. Los siguientes son hechos de la causa:
P(M1) = P(M2) = P(M3) =
1
3
;
P(A2jM1)=
1
2
;
P(A2jM2) = 0;
P(A2jM3) = 1;
P(M2jA2) = 0:
Usando esa información deducimos lo siguiente:
P(M1jA2) =
P(A2jM1) P(M1)
P(A2jM1) P(M1) + P(A2jM2) P(M2) + P(A2jM3) P(M3)
=
1
3
;
P(M3jA2) = 1� P(M1jA2)� P(M2jA2) =
2
3
:
7. Fantasías Bayesianas de ayer y hoy
En la bóveda de Tío Rico MacPato hay dos tipos de monedas: justas y truchas. Al caer, las monedas
justas muestran cara o sello con igual probabilidad. Las monedas truchas, en cambio, tienen una cara
impresa en ambos lados. La inmensa mayoría de las monedas de MacPato son justas.
Tío Rico elige al azar una moneda de su bóveda, y luego propone el siguiente test para la hipótesis �la
moneda escogida es justa�. Él arrojará la moneda al aire N veces. Si en cada una de las N tiradas el
resultado es cara, rechazará la hipótesis. Si obtiene al menos un sello, no la rechazará.
a) La hipótesis �la moneda escogida es justa�, ¿es nula o alternativa? Justi�que.
b) Cuántas tiradas hay que hacer para que la con�anza del test supere el 95%.
c) Sea N el número de tiradas que usted calculó en la parte b. ¿Qué poder tiene el test?
d) Suponga que tío Rico arrojó N veces la moneda al aire y las N veces obtuvo cara. En consecuencia,
rechaza la hipótesis de que la moneda es justa. Ahora el tío le da este dato: en su bodega, una de
cada 5 millones de monedas es trucha. Condicional en esa información, ¿cuál es la probabilidad
de que la moneda no sea trucha?
e) Compare la probabilidad calculada en d con la probabilidad de cometer error tipo I de la parte
a. ¿Le parece adecuado llamar �con�anza del test�a la cantidad 1� �?
8. Una historia de la vida real
El año 1997, la joven pareja de Cheshire (Reino Unido) formada por Sally y Harry Clark sufrió una
dolorosa pérdida: su hijo de 11 semanas falleció mientras dormía. La autopsia reveló signos de una infec-
ción respiratoria y ninguna señal de maltrato. Con esa información, los médicos forenses establecieron
3
que se trataba de una muerte por causas naturales. Era, en opinión de los expertos, un caso de lo que
usualmente se denomina �muerte súbita�.
Apenas un año más tarde, el segundo hijo del matrimonio Clark falleció a las ocho semanas de nacido.
Nuevamente los médicos catalogaron el caso de �muerte súbita�. Sin embargo, esta vez la pareja fue
arrestada y juzgada por el presunto asesinato de sus hijos. En 1999 �y a pesar de que no existía
evidencia forense que la incriminara�Sally fue hallada culpable de dicho crimen y condenada a cadena
perpetua.
Durante el juicio, el argumento esgrimido por la �scalía fue el siguiente: �La probabilidad de que un bebé
sufra muerte súbita en una familia de las características de la familia Clark es 1=8500. Por lo tanto, la
probabilidad de que los dos niños Clark murieran por esa causa es, aproximadamente, 1 en 72 millones.
En conclusión, la probabilidad de que ambos niños efectivamente murieran por causas naturales es
tan pequeña que la única explicación verosímil para sus muertes es que hayan sido asesinados por sus
propios padres.�
En base a la lectura, responda las siguientes preguntas:
a) �Una persona es inocente mientras no se pruebe que es culpable�. De acuerdo con esa a�rmación,
¿cuál es la hipótesis nula, inocencia o culpabilidad? ¿Cuál es la hipótesis alternativa?
b) La �scalía ha dicho lo siguiente. Sea el evento A1: �el primer niño muere por causas naturales�.
Sea el evento A2: �el segundo niño muere por causas naturales�. Sea el evento A1 \ A2: �ambos
niños mueren por causas naturales�. Entonces,
P (A1 \A2) = P (A1) � P (A2) =
1
72;250;000
¿Qué supuesto hay detrás de los cálculos de la �scalía? ¿Le parece a usted que es un supuesto
razonable?
c) Ray Hill, profesor de matemáticas de la universidad de Salford, revisó las estadísticas propor-
cionadas por la �scalía y concluyó lo siguiente: �La probabilidad de que un niño muera por causas
naturales es, en realidad, 1=1303. La probabilidad de que un niño muera por causas naturales,
dado que su hermano murió por causas naturales, es 1=100�. Con esa información, responda:
¿Cuánto es P (A1)? ¿Cuánto es P (A2)? ¿Cuánto es P (A2jA1)? ¿Cuánto es P(A1 \A2)?
d) Sea B el evento: �ambos niños mueren�. Ahora suponga que sólo hay dos explicaciones posibles
para la muerte de ambos niños: El evento C, �los dos niños fueron asesinados por la madre�, y
el evento A1 \ A2, �Los dos niños murieron por causas naturales�. El argumento de la �scalía se
basa en la siguiente idea: �la probabilidad de que la madre no haya asesinado a los niños es igual
a la probabilidad de que ambos niños murieran por causas naturales.�Ese argumento es falaz.
Explique intuitivamente por qué la probabilidad relevante para descartar la inocencia de la madre
es P(CjB) y no P(A1 \A2).
e) Calcule la probabilidad de que ambos niños estén muertos dado que fueron asesinados, así como
la probabilidad de que ambos niños estén muertos dado que murieron por causas naturales.
f ) El profesor Hill calculó que la probabilidad de que dos niños sean asesinados por su madre es, a
lo sumo, P(C) = 0; 0000046. Calcule P(CjB).
g) Al declarar a Sally culpable de asesinar a sus hijos, ¿con qué probabilidad cometió la corte un
error de tipo I? Si exigiera una con�anza de 90%, ¿rechazaría usted la hipótesis: �Sally Clark es
inocente�?
Epílogo:
Tres años estuvo presa Sally Clark antes de ser liberada en enero de 2003. Durante la apelación se hizo
pública la existencia de evidencia médica que habría exculpado a Sally desde un comienzo.
El médico Sir Roy Meadow, quién declaró en el juicio de Sally que la probabilidad de que los dos bebés
Clark hubieran muerto de causas naturales era 1 en 72 millones, fue juzgado por el General Medical
Council del Reino Unido y declarado culpable de negligencia severa en el año 2005. Se le prohibió de
por vida ejercer la profesión médica. A comienzos del año 2006 dicha prohibición fue revocada por el
máximo tribunal de ese país.
La opinión experta de la Royal Statistical Society jugó un rol fundamental en la liberación de Sally.
4
9. Demuestre que E[E(xjy)] = E(x).
Demostración: E[E(xjy)] =
R
E(xjy)f(y) d y =
R �R
x � f(xjy) dx
f(y) d y =
R nR
x � f(x;y)f(y) dx
o
f(y) d y =R R
x � f(x; y) dxd y =
R R
x � f(x; y) d y dx =
R
x
�R
f(x; y) d y
dx =
R
x � f(x) dx = E(x) . �
10. Sean x e y variables aleatorias, y a, b y c constantes. Usted sabe lo siguiente: E (cx) = cE (x),
var (x) = E(x2) � E (x)2, cov (x; y) = E(xy) � E(x) E(y). A partir de esos resultados, demuestre
que var (ax+ by + c) = a2 var (x) + 2ab cov (x; y) + b2 var (y).
11. La distribución geométrica tiene función de probabilidad P(x) = (1� �)x�1 �, donde x = 1; 2; 3; :::.
Encuentre el estimador máximo verosímil de �.
Respuesta: La función de verosimilitud es:
NY
i=1
(1� �)xi�1 �
Para encontrar el estimador máximo verosímil maximizamos el logaritmo de la función de verosimil-
itud (lo que no cambia el resultado porque logaritmo es una transformación monótona estrictamente
creciente).
m�ax
�
N ln (�) + ln (1� �)
NX
i=1
(xi � 1)
La condición de primer orden del problema es:
N
�
� 1
1� �
NX
i=1
(xi � 1) = 0
Despejando obtenemos el estimador máximo verosímil:
�̂ =
NPN
i=1 xi
12. Determine el estimador máximo verosímil del parámetro � de una distribución binomial: f (x) =
n!
x!(n�x)!�
x (1� �)n�x ;donde x = 0; 1; 2; :::; n.
13. Sea x una variable aleatoria uniforme en el intervalo [0; 1].
a) Encuentre la densidad de la variable aleatoria y = x1+x .
b) Gra�que esa función de densidad.
c) Demuestre que E(y) = 1 + ln 12 .
14. Sea f (x; y) = kxy una función de densidad de�nida sobre el rectángulo 0 � x � 1, 0 � y � 1.
a) Encuentre el valor de la constante k.
b) Encuentre las funciones de densidad marginales de x e y.
c) Encuentre las esperanzas de x e y.
d) Encuentre las varianzas de x e y.
e) Obtenga la función de densidad de x condicionada en y, así como la función de densidad de y
condicionada en x.
15. Suponga que la densidad conjunta de dos variables x e y es la función
f (x; y) =
�e�(�+�)y (�y)
x
x!
;
donde � > 0, � > 0,x = 0; 1; 2; ::: e y 2 R+.
5
a) Demuestre que f(x) =
�
1� ��+�
�x
�
�+� :
Ayuda: De�na S(x) =
R1
0
e��yyx d y, donde � > 0. Pruebe por inducción que S(x) = x!�x+1 ,
x = 0; 1; 2; :::. Recuerde que
R
u d v = uv �
R
v du.
b) Demuestre que f(y) = �e��y.
Ayuda: Recuerde que la expansión de Taylor de una función f(z) alrededor de la constante c es:
f(z) =
1X
n=0
�
f (n)(c)
n!
(z � c)n
�
;
donde f (n)(c) es la derivada n-ésima de f(z) evaluada en c. Use la expansión de Taylor para
probar que ex =
P1
n=0
zn
n! .
c) Demuestre que f (xjy) =. e
��y(�y)x
x! .
d) Encuentre los estimadores máximo verosímiles de � y �, y determine su distribución asintótica
conjunta.
Ayuda: Primero demuestre que E(x) = �� . Ese resultado le será útil para calcular la matriz de
varianza-covarianza asintótica de los estimadores de � y �.
16. Considere una muestra de 500 observaciones extraídas de una distribución normal con media � y
varianza �2. El 35% de las observaciones toma valores menores que 2; 1 y el 55% valores menores que
3; 6. Estime � y �2.
17. Si x distribuye como normal con media 1 y desviación estándar 3, ¿cuál es el valor de P (x > �1jx < 1; 5)?
18. Sea fxi; yigNi=1 una muestra de N pares independientes e idénticamente distribuidos (i.e. todos los pares
tienen la misma distribución conjunta y dos pares distintos son independientes entre sí). Suponga que
cada par sigue una distribución normal bivariada:�
yi
xi
�
� N
��
�x
�y
�
;
�
�2x �yx
�xy �
2
y
��
:
a) ¿Qué condiciones debe cumplir la matriz de varianza de [yi xi]
0 para ser bien comportada? Ex-
plique.
b) Demuestre que xi e yi cumplen la relación yi = a+ bxi+ "i, donde "i es una perturbación normal
y E ("i jxi) = 0. Ayuda: Calcule a y b suponiendo que E ("i jxi) = 0.
19. Sea x una variable aleatoria normal con media � y varianza �2.
a) Demuestre que E [exp(x)] = exp(�+ �2=2).
Ayuda: La densidad de una normal con media � y varianza �2 es � (x) = exp[�(x��)
2=(2�2)]p
2��2
b) Demuestre que var [exp(x)] = exp(2�+ �2)[exp(�2)� 1].
c) Demuestre que E(xjx > c) = � + � �(
c��
� )
1��( c��� )
, donde � (y) y �(y) son la función densidad y la
función de probabilidad acumulada de una normal estandarizada.
d) Calcule E[m�axfx; cg].
20. Suponga que x sigue una distribución exponencial, cuya densidad está dada por f(x) = �e��x.
a) Demuestre que E (x) = 1� .
b) Demuestre que var (x) = 1
�2
.
c) Demuestre que x no tiene memoria, esto es, que f (xjx � ~x) = f (x� ~x), con x � ~x.
d) Encuentre el estimador máximo verosímil de �.
6
21. Los caballeros no tienen memoria
Olivia Olivo tiene dos pretendientes: Popeye y Bruto. Ella no sabe bien a cuál pre�ere, por lo que ha
decidido entregar su corazón al primero en llamarla por teléfono. El tiempo hasta el llamado de Popeye
sigue una distribuición exponencial con parámetro �. El tiempo hasta el llamado de Bruto también es
exponencial, y su parámetro es �. Tanto � como � están medidos en días�1.
a) Demuestre que la probabilidad de que el primero en llamar sea Popeye es ��+� .
Pista: Llame x al tiempo hasta el llamado de Popeye e y al tiempo hasta el llamado de Bruto.
Pr (x < y) =
1Z
0
yZ
0
�e��x�e��y dxd y
Calcule la integral.
b) Demuestre que el tiempo hasta el primer llamado distribuye exponencial con parámetro � + �.
Demostración: Sea t = m��n fx; yg el tiempo hasta el primer llamado. Por lo tanto, la probabili-
dad acumulada de t hasta T es
Pr (t � T ) = 1� Pr (m��n fx; yg > T ) = 1� Pr (x > T ^ y > T )
= 1� Pr (x > T ) Pr (y > T ) = 1� e��T e��T
= 1� e�(�+�)T :
Como 1� e�(�+�)T es la acumulada de una exponencial con parámetro � + �, t distribuye expo-
nencial con parámetro � + �. �
c) Olivia ha esperado una larga semana junto al teléfono, sin que sus pretendientes den señales de
vida. ¿Cuánto más deberá esperar?
Respuesta: Como el tiempo hasta la primera llamada distribuye exponencial, y la distribución
exponencial no tiene memoria, Olivia deberá esperar lo mismo que al comienzo: 1�+� días.
22. Los siguientes datos proceden de una distribución normal con media � y desviación típica �2:
x = 1; 3; 2; 1; 0; 4; 1;3; 0; 5; 0; 2; 1;8; 2; 5; 1; 9; 3; 2:
En base a esa información, contraste la hipótesis: � � 2.
23. Usted dispone de dos muestras i.i.d: fxig30i=1 e fyig
40
i=1. A partir de las muestras usted calculó lo
siguiente: P30
i=1 xi = 6;28
P40
i=1 yi = 11;73P30
i=1 x
2
i = 21;75
P40
i=1 y
2
i = 44;34
Tanto x como y son normales, y tienen la misma varianza. Contraste la hipótesis de que las medias
poblacionales de x e y son iguales con un 99% de con�anza.
24. Es común escuchar que las estaturas de las personas siguen una distribución normal. De hecho, si usted
toma las estaturas de una población cualquiera, es probable que un contraste de normalidad (como,
por ejemplo, el contraste de Jarque-Bera) no pueda rechazar la hipótesis nula de que las estaturas son
normales. Explique por qué las estaturas humanas no pueden seguir una distribución normal, y por
eso es preciso rechazar la hipótesis nula independiente del resultado del test.
25. Un estudio del profesor Dimitri Trampov demuestra que, en el lejano reino de Guzmania, las mujeres
ganan un 20% menos por hora que los hombres. Sin embargo, cuando uno compara entre trabajos
similares, los salarios de hombres y mujeres son prácticamente iguales. Proponga una explicación.
La paradoja se produce porque en Guzmania (que es un país en extremo atrasado) las mujeres es-
tán sobre-representadas en los trabajos peor remunerados y sub-representadas en los trabajos mejor
remunerados.
Este problema ilustra el riesgo de extraer conclusiones a partir de promedios.
7