Logo Studenta

TEOREMALIM

¡Este material tiene más páginas!

Vista previa del material en texto

Capítulo 1
Teoremas de límites
V.K ROHATGI capitulo 6
1.1 Introducción
Se estudia las propiedades de las sucesiones de variables aleatorias. Se demues-
tran los resultados de tres tipos de límites, las dos leyes de los grandes números
y el Teorema Central del Límite, que son de suma importancia en el estudio
de probabilidades y en la estadística, precisamente como se hace en análisis
matemático, se distinguen entre varios tipos de convergencias.
1.2 Modos de convergencia
Se considera varios modos de convergencia y se investiga sus relaciones. Se
inicia estudiando la convergencia más débil:
Definición 1. Sea {Fn} una sucesión de funciones de distribuciones. Si existe
una fd F tal que, cuando n→∞
Fn(x) −→ F (x) (1)
en todo punto x en la cual F es continua, se dice que Fn converge en ley (
converge débilmente) para F y se escribe Fn(x)
w−→ F (x).
1
2 Teoremas de límites
Notación: Fn(x)
w−→ F (x)
Definición 2. Si {Xn} es una sucesión de variables aleatorias y {Fn} son las
correspondientes sucesiones funciones de distribuciones (fd’s), se dice que Xn
converge en distribución (o ley) para X si existe una variable aleatoria X con
fd F tal que Fn(x)
w−→ F (x). Se escribe Xn
L−→ X.
Notación: Xn
L−→ X
Es muy posible que una sucesión dada de funciones de distribuciones converja
para una función que no sea una función de distribución (fd).
Ejemplo 1. Considere la sucesión de funciones de distribuciones
Fn(x) =
{
0, x < n
1, x ≥ n
Aquí Fn(x) es la función de distribución de la v.a. Xn degenerado en x = n.
Tenga en cuenta que Fn(x) converge para una función F que es idénticamente
igual a 0, esto es, F (x) = 0, y en consecuencia no es una fd.
Ejemplo 2. Sea X1, X2, . . . , Xn variables aleatorias iid. con función de densi-
dad común
f(x) =
{
1
θ ; 0 < x < θ, (0 < θ <∞).
0; c.c
SeaX(n) = max{X1, . . . , Xn}. Entonces la función de densidad de probabilidad
de X(n) es
fX(n)(x) =
{
nθ−nxn−1 si 0 < x < θ,
0 si c.c
y la función de distribución de X(n) es
Fn(x) =

0 si x < 0,(
x
θ
)n si 0 ≤ x < θ
1 si x ≥ θ
se observa que
lim
n→∞
Fn(x) = F (x) =
{
0, si x < θ,
1, si x ≥ θ
la cual es una función de distribución. Así
Fn
w−→ F.
Modos de convergencia 3
El siguiente ejemplo muestra que la convergencia en distribución no implica
convergencia de momentos.
Ejemplo 3. Sea Fn una sucesión de fd’s. definida por
Fn(x) =

0, si x < 0
1− 1n , si 0 ≤ x < n
1, si n ≤ x
vemos que
lim
n−→∞
Fn(x) =
{
0 si x < 0
1 si x ≥ 0
es decir Fn(x) −→ F (x) =
{
0 si x < 0
1 si x ≥ 0
Notamos que Fn es la fd. de la variable aleatoria Xn con función de probabili-
dad
P (Xn = 0) = 1−
1
n
, P (Xn = n) =
1
n
y F es la función de distribución de la variable aleatoria X degenerada en
x = 0. Tenemos
E(Xrn) = 0
rP (Xn = 0) + n
rP (Xn = n)
= 0 + nr
1
n
= nr−1
donde r es un entero positivo. También tenemos
E(Xr) = 0rP (X = 0) = 0.1 = 0
De modo que
E(Xrn) 9 E(Xr)para cualquierr.
ya que
lim
n−→∞
E(Xrn) = lim
n−→∞
nr−1 =
(
lim
n−→∞
n
)r−1
=∞.
En el siguiente ejemplo se muestra que la convergencia débil de funciones de
distribución no implica las convergencias de las correspondientes funciones de
probabilidades o funciines de densidades de probabilidad.
4 Teoremas de límites
Ejemplo 4. Sea {Xn} una sucesión de variables aleatorias con función de
probabilidad (fp.)
fn(x) = P (Xn = x) =
{
1 si x = 2 + 1n
0 si c.c.
tenga en cuenta que ninguna de las funciones de densidades (f ′ns) asigna alguna
probabilidad al punto x = 2. Resulta que
fn(x) −→ f(x) cuando n −→∞
donde f(x) = 0∀x. Sin embargo la sucesión de funciones de distribuciones de
la variables aleatorias Xn converge para la función
F (x) =
{
0 si x < 2
1 si x ≥ 2
en todo punto de continuidad de F . Como F es la función de densidad de la
variable aleatoria degenerada en x = 2, Fn
w−→ F
Teorema 1.2.1. Sean X1,X2,. . . , y X variables aleatoria que toman solamente
valores 0, 1, 2, . . ., y sean Pn(k) = P (Xn = k), para k = 0, 1, 2, . . . las funciones
de probabilidades de Xn para n = 1, 2, . . ., y f(k) = P (X = k) la función de
probabilidad de la v.a. X. Entonces
Xn
D−→ X ⇐⇒ Pn(k) −→ P (k).
cuando n→∞,∀k = 0, 1, 2 . . .
Pueba. Los puntos x = 12 ,
3
2 ,
5
2 , . . . son puntos de continuidad de FX . Por
consiguiente, si Xn
D−→ X, entonces
FXn(k +
1
2
) −→ Fx(k +
1
2
)cuando n −→∞ para k = 0, 1, 2, . . .
y
Pn(k) = FXn(k +
1
2
)− FXn(x−
1
2
) −→
n−→∞
FX(k +
1
2
)− FX(k −
1
2
) = P (k)
k = 0, 1, 2, . . . (cuando k = 0 tenemos FXn(− 12 ) = FX(−
1
2 ) = 0).
⇐) Recíprocamente, si Pn(k) −→ P (k)∀k, entonces
FXn(x) −→ FX(x)para todox ∈ R, ya que six ≥ 0,
Modos de convergencia 5
tenemos
FXn(x) =
[x]∑
k=0
Pn(k) −→
n−→∞
[x]∑
k=0
P (k) = FX(k),
donde [x] es la parte entera de x (si x < 0, entonces FXn(x) = FX(x) = 0).
Nota. En caso general, cuando k es substituido por xk, la condición del teo-
rema 1.2.1, aun es suficiente, es decir, si Pn(xk) −→
n−→∞
P (xk)∀k ⇒ Xn
D−→ X.
Es necesaria si los valores posibles de las varaiables Xn y X son aislados. No
es necesaria en el caso general: para un contra ejemplo, sea Xn = 1n , X = 0
Ejemplo 5. (Convergencia de la distribución hipergeométrica a la binomial)
Sea XN una variables aleatoria con distribución hipergeométrica con función
de probabilidad.
P (XN = k) =
(
D
k
)(
N−D
n−k
)(
N
n
) k = 0, 1, . . . , n,
donde N,D y n son enteros no negativos, D ≤ N y n ≤ N recuerde que
(
D
k
)
= 0
si k > D. Tal distribución sirve de modelo, por ejemplo, para el número de
ítems defectuosos en una muestra de tamaño n, extraída sin reposición de un
lote de N ítem conteniendo D ítem defectuosos.
Cuando D y N −D son grandes y n es pequeño, XN tiene aproximadamente
distribución binomial, b(n, DN ). Este resultado es intuitivo, porque en esas
condiciones las extraciones son “casi” independientes. De hecho si Suponemos
que n sea fijo y D depende N de modo que limN−→∞ DN = θ, donde 0 < θ < 1.
En este caso Xn
D−→ b(n, θ), como se verifica en seguida. Para k = 0, 1, 2, . . . , n,
P (XN = k) =
D!
k!(D − k!)
.
(N −D)!
(n− k)!(N −D − n+ k)!
.
n!(N − n)!
N !
=
=
(n
k
)D(D − 1) . . . (D − k + 1)(N −D)(N −D − 1) . . . (N −D − n+ k + 1)
N(N − 1) . . . (N − n+ 1)
=
=
(n
k
) D
N
(
D
N −
1
N
)
. . .
(
D
N −
k−1
N
) (
1− DN
) (
1− D+1N
)(
1− D+n−k−1N
)
1.
(
1− 1N
)
. . .
(
1− n−1N
)
como DN −→ θ y n es fijo, tenemos
lim
N−→∞
P (XN = k) =
(
n
k
)
θk(1− θ)n−k, k = 0, 1, 2, . . . , n,
esto es
P (XN = k) −→
n−→∞
(
n
k
)
θk(1− θ)n−k, k = 0, 1, 2, . . . , n.
6 Teoremas de límites
Luego XN
D−→ b(n, θ).
Teorema 1.2.2. (Teorema de Scheffé) Sean X1, X2, . . . , X variables aleatorias
con densidades f1, f2, . . . y f respectivamente. Si fn(x) −→ f(x) cuando n −→
∞ para casi todo x relativamente a la medida de Lebesgue, entonces Xn
D−→ X.
Nota. La condición fn(x) −→ f(x) para casi todo x, o fn −→ f en casi toda
parte significa que el conjunto {x : fn(x) 9 f(x)} tiene medida de Lebesgue
nula, es decir longitud cero.
Prueba. Se omite (usa conceptos de la teoría de la medida, el lector puede ver
por ejemplo, Lehmann[13] pág. 351).
Ejemplo 6. Suponga que Xn ∼ N(un, σ2n), n = 1, 2, . . .. Si un −→ u y σ2n −→
σ2 cuando n −→ ∞, donde u ∈ R y 0 < σ2 < ∞ entonces Xn
D−→ N(u;σ2).
Es consecuencia inmediata del teorema de Scheffé, ya que
fn(x) =
1√
2πσn
e
− 1
2σ2n
(x−un)2
,
entonces
lim
n−→∞
fn(x) =
1√
2π
lim
n−→∞
1
σn
e
− 1
2σ2n
(x−un)2
=
1√
2π
1
σ
e−
1
2σ2
(x−u)2
luego
fn(x) =
1√
2πσn
e
− 1
2σ2n
(x−un)2 −→
n−→∞
1√
2πσ
e−
1
2σ2
(x−u)2 .
Teorema 1.2.3. Sea {Xn}una sucesión de variables aleatorias tal que Xn
D−→
X, y sea c una constante. Entonces
(a) Xn + c
D−→ X + c,
(b) cXn
D−→ cX, c 6= 0.
Un concepto un poco más fuerte de convergencia se define por la convergencia
en probabilidad.
Definición 3. Sea {Xn} una sucesión de variables aleatorias definidas en algún
espacio de probabilidad (Ω,A , P ). Se dice que la sucesión {Xn} converge en
Modos de convergencia 7
probabilidad para la variable aleatoria X si, ∀ε > 0,
P (|Xn −X| > ε)−→ 0 cuando n −→∞ (2)
o matemáticamente,
lim
n−→∞
P (|Xn −X| > ε) = 0
Notación: Xn
P−→ X
Observación 1. Hacemos hincapié que la definición no dice nada sobre la
convergencia de las variables aleatorias Xn para la variable aleatoria X en el
sentido en que se extiende en el análisis real. Por tanto Xn
P−→ X no implica
que, dado ε > 0, podemos encontrar un N tal que |Xn −X| < ε para n ≥ N .
La definición 3 solo habla de la convergencia de la sucesión de probabilidades
P (|Xn −X| > ε) para 0.
Ejemplo 7. Sea {Xn} una sucesión de variables aleatorias con función de
probabilidad
P (Xn = 1) =
1
n
, P (Xn = 0) = 1−
1
n
.
Entonces, si {Xn} converge a alguna variable aleatoria convergerá a la variable
aleatoria X = 0.
Xn
P−→ X ⇐⇒ ∀ε > 0 lim
n−→∞
P (|Xn − x| > ε) = 0
veamos lo siguiente
Si ε ≥ 1⇒ P (|Xn − 0| > ε) = P (|Xn| > ε) = 0 ya que Xn solo puede tomar 0
o 1, entonces • Si ε > 1, tenemos,
lim
n−→∞
P (|Xn − 0| > ε) = lim
n−→∞
P (|Xn| > ε)
= lim
n−→∞
0
= 0.
8 Teoremas de límites
• Si ε ∈ (0, 1)
lim
n−→∞
P (|Xn| − 0 > ε) = lim
n−→∞
P (|Xn| > ε)
= lim
n−→∞
P (Xn = 1)
= lim
n−→∞
1
n
= 0.
De modo P (|Xn| > ε) −→ 0 cuando n −→∞, y se concluye que Xn
P−→ 0.
Se puede demostrar fácilmente la verdad de las siguientes afirmaciones
1. Xn
P−→ X ⇐⇒ Xn −X
P−→ 0.
2. Xn
P−→ X,Yn
P−→ Y =⇒ P (X = Y ) = 1,
para P (|X − Y | > c) ≤ P (|Xn −X| > c2 ) + P (|Xn − Y | >
c
2 ),
y se deduce que P (|X − Y | > c) = 0 para todo c > 0
3. Xn
P−→ X =⇒ Xn
P−→ Xm −→ 0, cuando n.m −→∞, para
P (|Xn −Xm| > ε) ≤ P (|Xn −X| >
ε
2
) + P (|Xm −X| >
ε
2
).
4. Xn
P−→ X,Yn
P−→ Y =⇒ Xn ± Yn −→ X ± Y .
5. Xn
P−→ X, k constante =⇒ kXn
P−→ kX.
6. Xn
P−→ k =⇒ X2k
P−→ k2.
7. Xn
P−→ a, Yn
P−→ b, a, b constante =⇒ XnYn
P−→ ab
por
XnYn =
(Xn + Yn)
2 − (Xn − Yn)2
4
−→ (a+ b)
2 − (a− b)2
4
= a.b
8. Xn
P−→ 1 =⇒ X−1n
P−→ 1
Modos de convergencia 9
por
P (| 1
Xn
− 1| ≥ ε) = P ( 1
Xn
≥ 1 + ε) + P ( 1
Xn
≤ 1− �)
= P (
1
Xn
≥ 1 + ε) + P ( 1
Xn
≤ 0)+
+ P (0 <
1
Xn
≤ 1− ε)
y cada uno de los tres términos en el lado derecho tienden para 0 cuando
n −→∞.
9. Xn
P−→ a, Yn
P−→ b, a, b constantes, b 6= 0 =⇒ XnY −1n = ab−1
10. Xn
P−→ X y Yn −→ es una v.a. =⇒ XnY
P−→ XY .
Note que Y es una v.a. de modo que, dado δ > 0 existe un k > 0 tal que
P (|Y | > k) < δ2 . Por tanto
P (|XnY −XY | > ε) = P (|Xn −X||Y | > ε, |Y | > k)
+ P (|Xn −X||Y | > ε, |Y | ≤ k)
δ
2
+ P (|Xn −X| >
ε
k
)
11. Xn
P−→ X,Yn −→ Y =⇒ XnYn −→ XY
por
(Xn −X)(Yn − Y )
P−→ 0
El resultado se concluye en la multiplicación, utilizando el resultado nú-
mero 10.
Teorema 1.2.4. Sea Xn
P−→ X, y g una función continua definida en R.
Entonces g(Xn)
P−→ g(X) cuando n −→∞.
Prueba. Como X es una v.a., dado ε > 0, se puede encontrar una constante
k = k(ε) tal que
P (|X| > k) < ε
2
.
También, g es continua en R, de modo que g es uniformemente continua en
[−k, k]. Se concluye que existe un δ = δ(ε, k) tal que
|g(xn)− g(x)| < ε
10 Teoremas de límites
en toda parte donde |x| < k y |xn − x| < δ. Sean
A = {|Xn| ≤ k}, B = {|Xn −X| < δ}, C = {|g(Xn)− g(X)| < ε}
Entonces w ∈ A ∩B =⇒ w ∈ C, de modo que
A ∩B ⊆ C
Resulta que
P (Cc) ≤ P (Ac) + P (Bc),
Esto es,
P (|g(Xn)− g(X)| ≥ δ) ≤ P (|Xn −X| ≥ δ) + P (|X| > k) < ε
para n ≥ N(ε, δ, k), donde N(ε, δ, k) se escoge de modo que se cumpla
P (|Xn −X| ≥ δ) <
ε
2
para n ≥ N(ε, δ, k).
Corolario 1.2.1. Xn
P−→ c, donde c es una constante ⇒ g(Xn)
P−→ g(c),
siendo g una función continua.
Recuerde que un resultado más general que el teorema 1.2.4 es verdadero y
establece sin demostración (ver Rao [97],104): Xn
D−→ X, y g es continua en
R =⇒ g(Xn)
D−→ g(X).
Los siguientes dos teoremas explican la relación entre convergencia débil y la
convergencia en probabilidad
Teorema 1.2.5. Xn
P−→ X =⇒ Xn
D−→ X
Prueba. Sean Fn y F , respectivamente, funciones de distribuciones de Xn y de
X. Se tiene
{w : X(w) ≤ x′} = {w : Xn(w) ≤ x,X(w) ≤ x′} ∪ {w : Xn(w) > x,X(w) ≤
x′} ⊆ {Xn ≤ x} ∪ {Xn > x,X ≤ x′}
de lo que se concluye que
F (x′) ≤ Fn(x) + P (Xn > x,X ≤ x′)
Modos de convergencia 11
Como Xn −X
P−→ 0, se tiene para x′ < x
P (Xn > x,X ≤ x′) ≤ P (|Xn −X| > x− x′) −→ 0 cuando n −→∞.
Por tanto F (x′) ≤ lim
n−→∞
Fn(x), x
′ < x.
⇐) similarmente, intercambiando X por Xn y x por x′, obtenemos
lim
n−→∞
Fn(x) ≤ F (x′′), x ≤ x′′
Así para x′ < x < x′′, se tiene
F (x′) ≤ limFn(x) ≤ limFn(x) ≤ F (x′′)
Puesto que F tiene solamente un número de puntos de discontinuidad, se se-
lecciona x como el punto de continuidad de F , y haciendo x′′ ↓ x y x′ ↑ x se
concluye que,
F (x) = lim
n−→∞
Fn(x)
en todo punto de continuidad de F
Teorema 1.2.6. Sea k una constante. Entonces
Xn
L−→ k =⇒ Xn
P−→ K
Prueba. La prueba es dejado como ejercicio.
Corolario 1.2.2. Sea k una constante. Entonces
Xn
L−→ K ⇐⇒ Xn
P−→ K
Observación 2. Hacemos hincapié que no podemos mejorar el resultado ante-
rior reemplazando K por una variable aleatoria; esto es Xn
D−→ X en general,
no implica Xn
P−→ X, por ejemplo sean, X,X1, X2, . . . variables aleatorias
idénticamente distribuidas, y sea la distribución conjunta de (Xn, X) como
sigue:
X
Xn
0 1
0 0 12
1 1/2 1
12 Teoremas de límites
Claramente, Xn
D−→ X. Pero
P (|Xn −X| >
1
2
) ≥ P (|Xn −X| = 1)
= P (Xn = 0, X = 1) + P (Xn = 1, X = 0)
=
1
2
+
1
2
= 1 9 0
En consecuencia Xn
P9 X, pero Xn
D−→ X.
Observación 3. En el ejemplo 3, se demuestra que Xn
P−→ X no implica
E(Xkn) −→ E(Xk) para cualquier k > 0, k
Definición 4. Sea {Xn} una sucesión de variables aleatorias tal que E(Xrn) <
∞, para algún r > 0. Se dice que Xn converge en la r-ésima media para una
variable aleatoria X si E(|X|r) <∞ y
E(|Xn −X|r) −→ 0 cuando n −→∞ (2)
Notación: Xn
r−→ X.
Ejemplo 8. Sea {Xn} una sucesión de variables aleatorias definidas pro
P (Xn = 0) =
1
n
, P (Xn = 1) =
1
n
, n = 1, 2, . . . ,
Entonces
E(|Xn|2) = 0P (Xn = 0) + 1P (Xn = 1)
=
1
n
; n = 1, 2, . . . ,
lim
n−→∞
E(|Xn|2) = 0
Por tanto E(|Xn|2) = 1n −→ 0 cuando n −→ ∞ y se observa que Xn
2−→ X,
donde la v.a. X es degenerada en 0.
Teorema 1.2.7. Sea Xn
r−→ X para algún r > 0. Entonces Xn
P−→ X,
Prueba. La prueba se deja como un ejercicio.
Ejemplo 9. Sea {Xn} una sucesión de variables aleatorias definidas por
P (Xn = 0) = 1−
1
n
r, P (Xn = n) =
1
nr
, r > 0, n = 1, 2, . . . ,
Modos de convergencia 13
Entonces
E(|Xn|r) = 0rP (Xn = 0) + nrP (Xn = n)
= nr.
1
nr
= 1
así
lim
n−→∞
E(|Xn|r) = 1, de modo queXn
r9 0.
Demostremos que Xn
P−→ 0.
P (|Xn| > ε) =
{
P (Xn = n) si ε < n
0 si ε > n
}
−→ 0
cuando n −→∞
Teorema 1.2.8. Sea {Xn} una sucesión de variables aleatorias tales que
Xn
2−→ X. Entonces
E(Xn) −→ E(X) y E(X2n) −→ E(X2) cuando n −→∞
Prueba. Tenemos
|E(Xn −X)| ≤ E(|Xn −X|) ≤
√
E(|Xn −X|)2 −→ 0,
cuando n −→∞.
Para ver E(X2n) −→ E(X2) (ver el teorema 1.2.11), escribimos
E(X2n) = E(Xn −X +X)2
= E[(Xn −X)2 + 2(Xn −X)X +X2]
= E(Xn −X)2 + 2XE(Xn −X) + E(X2)
= E(Xn −X)2 + 2E(X(Xn −X)) + E(X2)
y note que |E(X(Xn − X))| ≤
√
E(X2)E(Xn −X)2 por la desigualdad de
Cauchy-Schwarz. El resultado se concluye pasando al límite.
Se obtiene, en adición, que Xn
2−→ X implica que
V ar(Xn) −→ V ar(X).
14 Teoremas de límites
Corolario 1.2.3. Sean {Xm}, {Yn} dos sucesiones de variables aleatorias tales
que Xm
2−→ X, Yn
2−→ Y . Entonces E(XmYn) −→ E(XY ) cuando m,n −→
∞
Prueba. La prueba se deja como ejercicio para el lector.
Como una consecuencia simple del teorema 1.2.8 y su corolario vemos que
Xm
2−→ X,Yn
2−→ Y juntos implican que Cov(Xm, Yn) −→ Cov(X,Y ).
Para comprender los teoremas posteriores establecemos los teoremas más im-
portantes sobre desigualdades de esperanzas.
Teorema 1.2.9. (Desigualdad de Hölder) Suponga que p, q > 1 satisfacen
1
p
+
1
q
= 1. (3)
Entonces
E[|XY |] ≤ E[|X|p]1/pE[|Y |q]1/q (4)
Prueba. para todo a, b > 0, se cumple
ab ≤ a
p
p
+
bq
q
.
Sustituyendo a = |X|
E[|X|p]1/p y b =
|Y |
E[|Y |q ]1/q resulta
|XY |
E[|X|p]1/pE[|Y |q]1/q
≤ |X|
p
pE[|X|p]
+
|Y |q
qE[|Y |q]
(5)
y tomando la esperanza matemática en la desigualdad (5)se obtiene
|XY |
E[|X|p]1/pE[|Y|q]1/q
≤ 1
p
+
1
q
= 1 (6)
luego finalmente se tiene
E[|XY |] ≤ E[|X|p]1/pE[|Y |q]1/q
Teorema 1.2.10. (Desigualdad de Minkowski) Para p ≥ 1
E[|X + Y |p]1/p ≤ E[|X|p]1/p + E[|Y |p]1/p (7)
Modos de convergencia 15
Prueba. Para p = 1, la desigualdad es inmediata por la desigualdad triangu-
lar. Para p > 1, sea q = p/(p−1)de modo que se completa igualdad(3). Luego.
por la desigualdad triangular seguido por la desigualdad de hölder (4) resulta,
E[|X + Y |p] ≤ [E|X + Y |p−1|X|] + E[|X + Y |(p−1)|Y |]
≤ E[|X|p]1/pE[|X + Y |(p−1)q]1/q
≤ +E[|Y |p]1/pE[|X + Y |(p−1)q]1/q
= E[|X + Y |p]1/q
(
E[|X|p]1/pE[|Y |p]1/p
)
,
donde en la última etapa se ha usado el hecho de que q(p − 1) = p. Entonces
la desigualdad (7) resulta dividiendo ambos lados de la última expresión por
E[|X + Y |p]1/q y usando la propiedad que 1− 1q =
1
p
Teorema 1.2.11. Si Xn
r−→ X, entonces E(|Xn|r) −→ E(|X|r).
Prueba. Sea 0 < r ≤ 1. Entonces
E(|Xn|r) = E(|Xn −X +X|r)
de modo que
E(|Xn|r)− E(|X|r) ≤ E(|Xn −X|r).
Intercambiando Xn por X, se obtiene
E(|X|r)− E(|Xn|r) ≤ E(|Xn −X|r).
Resulta que
|E(|X|r)− E(|Xn|r)| ≤ E(|Xn −X|r) −→ 0,
cuando n −→∞.
Para r > 1, usamos la desigualdad de Minkowski y se obtiene
[ r
√
E(|Xn|r)] ≤ [E|Xn −X|r]
1
r + [E|X|r] 1r
y
[E|X|r]1/r ≤ [E|Xn −X|r]
1
r + [E|Xn|r]
1
r .
16 Teoremas de límites
Resulta que
|E1/r|Xn|r − E1/r|X|r| ≤ E1/r|Xn −X|r −→ 0 cuando n −→∞.
Este completa la prueba.
Teorema 1.2.12. (Desigualdad de Lyapunov) Sea βn = E|X|n < ∞.
Entonces para k arbitrario, 2 ≤ k ≤ n, se tiene
β
1
1−k
k−1 ≤ β
1
k
k .
Prueba. Considere la forma cuadrática
Q(u, v) =
∫ ∞
−∞
(
u|x|(k−1/2) + v|x|(k+1)/2
)2
f(x)dx,
donde se ha asumido que X es una variable aleatoria continua con función de
densidad de probabilidad f . Se tiene
q(u, v) = u2βk−1 + 2uvβk + βk+1v
2.
Es evidente que Q ≥ 0 para todo u, v real. Resulta que∣∣∣∣∣βk−1 βkβk βk+1
∣∣∣∣∣ ≥ 0,
implicando que
β2kk ≤ βkk−1βkk+1.
Así
β21 ≤ β10β12 , β42 ≤ β21β23 , . . . , β
2(n−1)
n−1 ≤ β
n−1
n−2β
n−1
n
donde β0 = 1. Multiplicando sucesivamente (k − 1) de estos, se obtiene
βkk−1 ≤ βk−1k o β
1/(k−1)
k−1 ≤ β
1/k
k
Resulta que
β1 ≤ β1/22 ≤ β
1/3
3 ≤ · · · ≤ β1/nn .
La igualdad se cumple si y solo si
β
1/k
k = β
1/(k+1)
k+1 para k = 1, 2, . . . ,
Modos de convergencia 17
esto es, {β1/kk } es una sucesión de números constantes, que sucede si y solo si
|X| es una variable aleatoria degenerada.
Teorema 1.2.13. Sea r > s. Entonces Xn
r−→ X =⇒ Xn
s−→ X.
Prueba. Por el teorema de la desigualdad de Lyapunov se tiene que, para
s < r
E|Xn −X|s ≤ [E|Xn −X|r]
s
r −→ 0 cuando n −→∞
puesto que Xn
r−→ X.
Observación 4. Evidentemente el recíproco para el teorema 1.2.13 no puede
cumplirse, puesto que E|X|s <∞ para s < r no implica que E|X|r <∞.
Observación 5. Teniendo en cuenta el teorema 1.2.11, se sigue que
Xn
r−→ X =⇒ E|Xn|s −→ E|X|s para s ≤ r.
Definición 5. Sea {Xn} una sucesión de variables aleatorias. Se dice que Xn
converge casi seguramente (a.s.) para una v.a. X si y solo si
P (w : Xn(w) −→ X(w) cuando n −→∞) = 1, (8)
Notación: Xn
a.s.−→ X o Xn −→ X con probabilidad 1.
El siguiente resultado aclara la Definición 5.
Teorema 1.2.14. Xn
a.s−→ X ⇔ lim
n−→∞
P ( sup
m≥n
|Xm −X| > ε) = 0 para todo
ε > 0.
Prueba. Como Xn
a.s−→ X =⇒ Xn −X
a.s−→ 0, y será suficiente demostrar la
equivalencia de
(a) Xn
a.s−→ 0 y (b) lim
n−→∞
P ( sup
m≥n
|Xm| > ε) = 0.
Suponga que el item (a) se cumple. Sea ε > 0, y escribamos
An(ε) = { sup
m≥n
|Xn| > ε} y C = { lim
n−→∞
Xn = 0}.
18 Teoremas de límites
También escribimos Bn(ε) = C ∩ An(ε), y note que Bn+1(ε) ⊂ Bn(ε), y el
conjunto límite es
⋂∞
n=1Bn(ε) = ∅. Reulta que
lim
n−→∞
P (Bn(ε)) = P ( lim
n−→∞
Bn(ε)) = P (
∞⋂
n=1
Bn(ε)) = 0.
Como P (C) = 1, P (Cc) = 0, y se tiene
P (Bn(ε)) = P (An ∩ C) = 1− P (Cc ∪Acn)
= 1− P (Cc)− P (Acn) + P (Cc ∩Acn)
= P (An) + P (C
c ∩Acn)
= P (An)
Resulta que el ítem (b) se cumple.
Recíprocamente, sea lim
n−→∞
P (An(ε)) = 0, y escribimos
D(ε) =
{
lim
n−→∞
|Xn| > ε > 0
}
Como D(ε) ⊂ An(ε) para n = 1, 2, . . ., resulta que P (D(ε)) = 0. También,
Cc = { lim
n−→∞
Xn 6= 0} ⊂
∞⋃
k=1
{ lim
n−→∞
|Xn| >
1
k
},
De modo que
1− P (C) ≤
∞∑
k=1
P (D(
1
k
)) = 0
y el ítem (a) se cumple.
Observación 6. Por tanto Xn
a.s.−→ 0 significa que, para
ε > 0, η > 0 arbitrario, se puede encontrar n0 tal que
P ( sup
n≥n0
|Xn| > ε) < η. (9)
De hecho podemos escribir equivalentemente, que
lim
n0−→∞
P (∪n≥n0{|Xn| > ε}) = 0. (10)
Modos de convergencia 19
Teorema 1.2.15. Xn
a.s.−→ X =⇒ Xn
P−→ X
Prueba. Por la observación 6, Xn
a.s.−→ X implica que, para ε > 0, η > 0
arbitrarios, se puede seleccionar un n0 = n0(ε, η) tal que
P (
∞⋂
n=n0
{|Xn −X| ≤ ε}) ≥ 1− η.
Evidentemente
∞⋂
n=n0
{|Xn −X| ≤ ε} ⊂ {|Xn −X| ≤ ε} para n ≥ n0
Resulta que para n ≥ n0
P (|Xn −X| ≤ ε) ≥ P (
∞⋂
n=n0
{|Xn −X| ≤ ε}) ≥ 1− η,
esto es
P (|Xn −X| > ε) < η para n ≥ n0,
lo cual es lo mismo decir que Xn
P−→ X.
El recíproco del teorema 1.2.15 no se cumple se demuestra en el siguiente ejem-
plo.
Ejemplo 10. Para cada entero positivo n existen enteros m y k (únicamente
determinados) tal que
n = 2k +m, 0 ≤ m < 2k, k = 0, 1, 2, . . .
Así, para n = 1, k = 0,m = 0;n = 5, k = 2,m = 1; así sucesivamente.
Definimos las variables aleatorias Xn, para n = 1, 2, . . . en Ω = [0, 1] como
sigue
Xn(w) =
{
2k si m
2k
≤ w < m+1
2k
,
0 si c.c.
Sea la distribución de probabilidades de Xn dado por p(I) =longitud del inter-
valo I ⊆ Ω. Así
P (Xn = 2
k) =
1
2k
, P (Xn = 0) = 1−
1
2k
.
20 Teoremas de límites
El límite, limn−→∞Xn(w) no existe para ningún w ∈ Ω, de modo que Xn no
converge casi seguramente. Pero
P (|Xn| > ε) = P (Xn > ε) =
{
0 si ε ≥ 2k
1
2k
si 0ε < 2k
vemos que
lim
n−→∞
P (|Xn| > ε) = 0 cuando n (y en consecuencia k) −→∞.
Teorema 1.2.16. Sea {Xn} una sucesión estrictamente decrecientes de varia-
bles aleatorias positivas, y suponga que Xn
P−→ 0. Entonces Xn
a.s.−→ 0
Prueba. Se omite la prueba
Ejemplo 11. Sea {Xn} una sucesión de variables aleatorias independientes
definidas por
P (Xn = 0) = 1−
1
n
, P (Xn = 1) =
1
n
, n = 1, 2, . . .
Entonces calculemos E|Xn − 0|2 como sigue
E|Xn − 0|2 = E|Xn|2 = 02P (Xn = 0) + 12P (Xn = 1) =
1
n
Por tanto lim
n−→∞
E|Xn|2 = 0 y Xn
2−→ 0. También
P (Xn = 0 para todo m ≤ n ≤ n0)
=
n0∏
n=m
(1− 1
n
) =
m− 1
n0
que diverge para cero cuando n0 →∞ para todos los valores de m. Así Xn no
converge a cero con probabilidad 1.
Ejemplo 12. Sea {Xn} una sucesión de variables aleatorias definidas por
P (Xn = 0) = 1−
1
nr
P (Xn = 1) =
1
nr
, r ≥ 2, n = 1, 2, . . .
Modos de convergencia 21
Entonces
P (Xn = 0para m ≤ n ≤ n0) =
n0∏
n=m
(1− 1
nr
).
Cuando n0 →∞, el producto infinito converge para alguna cantidad diferente
de cero la cual a su vez converge a 1 cuando m → ∞. Así Xn
a.s→ 0. Sin
embargo, E(|Xn|r) = 1 y Xn
r9 0 cuando n→∞
Ejemplo 13. Sea {Xn} una sucesión de variables aleatorias con P (Xn =
±1/n) = 1n . Entonces E(|Xn|
r) = 1/nr → 0 cuando n→∞, y Xn
r→ 0. Para
j < k, |Xj | > |Xk|, de modo que se cumpla {|Xk| > ε} ⊂ {|Xj | > ε}. Resulta
que
∞⋃
j=n
{|Xj | > ε} = {|Xn| > ε}.
Escogiendo n > 1/ε, se observa que
P [
∞⋃
j=n
{|Xj | > ε}] = P ({|Xn| > ε}) ≤ P ({|Xn| >
1
n
}) = 0,
y la igualdad (10) implica que Xn
a.s.→ 0.
Teorema 1.2.17. Sean {Xn, Yn}, n = 1, 2, . . . una sucesión de variables alea-
torias. Entonces
|Xn − Yn|
P−→ 0 y Yn
L−→ Y =⇒ Xn
L−→ Y.
Prueba. Sea x un punto de continuidad de la función de distribución de Y y
ε > 0. Entonces
P (Xn ≤ x) = P (Yn ≤ x+ Yn −Xn)
= P (Yn ≤ x+ Yn −Xn;Yn −Xn ≤ ε)
+ P (Yn ≤ x+ Yn −Xn;Yn −Xn ≥ ε)
≤ P (Yn ≤ x+ ε) + P (Xn −Xn > ε)
De ello se deduce que
lim
n→∞
P (Xn ≤ x) ≤ lim
n→∞
P (Yn ≤ x+ ε).
22 Teoremas de límites
similarmente
lim
n→∞
P (Xn ≤ x) ≥ lim
n→∞
P (Yn ≤ x− ε).
Como ε > 0 es arbitrario y x es un punto de continuidad de P (Y ≤ x),
obtenemos el resultado al permitir que ε→ 0.
Corolario 1.2.4. Xn
P−→ X =⇒ Xn
L−→ X
Teorema 1.2.18. (Cramer [18],254) Sea (Xn, Yn), n = 1, 2, . . ., una sucesión
de pares de variablesaleatorias, y sea c una constante. Entonces
(a) Xn
L−→ X, Yn
P−→ c =⇒ Xn ± Yn
L−→ X ± c
(b) Xn
L−→ X, Yn
P−→ c =⇒
{
XnYn
L−→ cX si c 6= 0
XnYn
P−→ 0 si c = 0
(c) Xn
L−→ X, Yn
P−→ c =⇒ XnYn
L−→ Xc si c 6= 0
Prueba. La prueba se realiza por cada uno de los ítems
(a) Xn
L−→ X ⇒ Xn±
L−→ X ± c (por Teorema 1.2.3). También
Yn − c = (Yn ±Xn)∓ (Xn ± c)
P→ 0.
Usando el Teorema 1.2.17 se demuestra que
Xn ± Yn
L→ X ± c.
(b) Primero consideremos el caso donde c = 0. Para cualquier número k > 0
fijo tenemos,
P (|XnYn|) = P (|XnYn| > ε, |Yn| ≤
ε
k
) + P (|XnYn| > ε, |Yn| >
ε
k
)
≤ P (|Xn| > k) + P (|Yn| >
ε
k
)
Como Yn
P→ 0 y Yn
L→ X, resulta que, para cualquier número k > 0 fijo
lim
n→∞
P (|XnYn| > ε) ≤ P (|X| > k).
Puesto que k es es un número arbitrario, podemos hacer P (|X| > k) tan
pequeño como queramos eligiendo k grande. Resulta que
XnYn
P→ 0
Modos de convergencia 23
Ahora, consideremos que c 6= 0. Entonces
XnYn − cXn = Xn(Yn − c)
y , como Xn
L→ X,Yn
P→ c,Xn(Yn − c)
P→ 0. Usando el Teorema 1.2.17,
obtenemos el resultado que
XnYn
L→ cX
(c) Yn
L→ c y c 6= 0⇒ Y −1n
P→ c−1. Resulta que Xn
L→ X,
Yn
P→ c⇒ XnY −1n
L→ c−1X, y la prueba del Teorema es completa.
Como una aplicación del Teorema 1.2.18 se presenta el siguiente ejemplo.
Ejemplo 14. Sean X1, X2, . . . una sucesión de v. aleatorias iid N(0, 1). ¿Cuál
es la distribución límite de la variable aleatoria
wn =
√
n
X1 +X2 + · · ·+Xn
X21 +X
2
2 + · · ·X2n
?
Solución:
Sea Un =
1√
n
(X1 +X2 + · · ·+Xn) y Vn =
X21 +X
2
2 + · · ·+X2n
n
Entonces
Wn =
Un
Vn
Hallamos la función característica de Un
ΦUn(t) = E(e
itUn) = E(e
it 1√
n
∑n
j=1Xj )
= E
 n∏
j=1
e
it
Xj√
n
 = n∏
j=1
ΦX(
t√
n
)
=
n∏
j=1
e−
1
2 (
t2
n ) = e−
1
2 t
2
,
de modo que por el Teorema de la unicidad de la función característica con-
cluimos que Un ∼ N (0, 1). Y como
lim
n→∞
ΦUn(t) = lim
n→∞
e−
1
2 t
2
= e−
1
2 t
2
= ΦX(t)
24 Teoremas de límites
donde ΦX(t) es la función característica de una variable aleatoria que se distri-
buye en forma normal estándar, X ∼ N (0, 1); por el corolario (b) del Teorema
de continuidad de Paul Lévy se concluye que Un
L→ X, donde X ∼ N (0, 1). En
cuanto a Vn observamos que cada X2i se distribuye en forma de una distribución
de una variable χ2 con 1 grado de libertad. Luego la función característica de
Vn será
ΦVn(t) = E(e
itVn) = E
[
eit
∑n
j=1
X2j
n
]
= E
 n∏
j=1
eit
X2j
n

=
n∏
j=1
ΦX1
(
t
n
)
=
n∏
j=1
(
1− 2it
n
)− 12
=
(
1− 2it
n
)−n2
=
(
1− itn
2
)−n2
por lo tanto, por el Teorema de la unicidad de la función característica Vn ∼
Γ(n2 ,
n
2 ); es decir, vn es una variable aleatoria que se distribuye según la distri-
bución gamma, con parámetros α = n/2 y β = n/2. De esta manera la función
de densidad de Vn está dada por
fVn(v) =

(n2 )
n
2
Γ(n2 )
v
n
2−1e−
n
2 v v > 0
0 c.c
siendo la E(Vn) = 1 y V ar(Vn) = 2n
Ahora probemos que Vn
P−→ 1
P (|Vn − 1| > ε) ≤
V ar(Vn)
ε2
P (|Vn − 1| > ε) ≤
2
nε2
lim
n−→∞
P (|Vn − 1| > ε) ≤ 0
por lo tanto Vn
P−→ 1
Luego se deduce por el teorema 1.2.18(c) que
Wn =
Un
Vn
L−→ X ∼ N(0, 1).
La ley débil de los grandes números 25
1.3 La ley débil de los grandes números
Sea {Xn}n≥1 una sucesión de variables aleatorias. Consideremos la sucesión
{Sn}n≥1 definida por Sn =
∑n
i=1Xi,n = 1, 2, . . .. En esta sección se responde
afirmativamente la siguiente pregunta: ¿Existen sucesiones de constantes An y
Bn > 0, Bn −→∞, cuando n −→∞ tal que la sucesión de variables aleatorias
(Sn −An)
Bn
P−→ 0 cuando n −→∞?
Definición 6. Sea {Xn}n≥1 una sucesión de variables aleatorias, y sea Sn =∑n
i=1Xi,n = 1, 2, . . .. Se dice que la sucesión {Xn} cumple la ley débil
de los grandes números (LDGN) con respecto a la sucesión de constantes
{Bn}, Bn > 0, Bn ↑ ∞, si existe una sucesión de constantes de números reales
An tal que
(Sn −An)
Bn
P−→ 0, cuando n −→∞. Las An son llamadas constantes
de centralización y los Bn constantes de normalización.
Teorema 1.3.1. Sea {Xn}n≥1 una sucesión de pares de variables aleatorias no
correlacionadas con E(Xi) = µi y Var(Xi) = σ2i , i = 1, 2, . . .. Si
∑n
i=1 σ
2
i −→
∞ cuando n −→∞, se puede elegir An =
∑n
i=1 µi y Bn =
∑n
i=1 σ
2
i , tal que
n∑
i=1
(Xi − µi)∑n
i=1 σ
2
i
P−→ 0 cuando n −→∞
Prueba. Aplicando la definición de la convergencia en probabilidad y la de-
26 Teoremas de límites
sigualdad de Chebychev tenemos,
P
(∣∣∣∣∣
n∑
i=1
(Xi − µi)∑n
i=1 σ
2
i
− 0
∣∣∣∣∣ > �
)
= P
(∣∣∣∣∑ni=1(Xi − µi)∑n
i=1 σ
2
i
− 0
∣∣∣∣ > �)
= P
(∣∣∣∣∑ni=1(Xi − µi)∑n
i=1 σ
2
i
∣∣∣∣ > �)
= P
(∣∣∑n
i=1(Xi − µi)
∣∣∣∣∑n
i=1 σ
2
i
∣∣ > �
)
= P
(∣∣∣∣∣
n∑
i=1
(Xi − µi)
∣∣∣∣∣ > �
n∑
i=1
σ2i
)
= P
(∣∣∣∣∣Sn −
n∑
i=1
µi
∣∣∣∣∣ > �
n∑
i=1
σ2i
)
≤
E
[∑n
i=1(Xi − µi)
]2
ε2
(∑n
i=1 σ
2
i
)2
=
1
ε2
∑n
i=1 σ
2
i
−→ 0 cuando n −→∞
Corolario 1.3.1. Si las variables aleatoriasXn se distribuyen de forma idéntica
y son pares no correlacionadas con E(Xi) = µ y Var(Xi) = σ2 <∞, se puede
seleccionar An = nµ y Bn = nσ2
Corolario 1.3.2. En el Teorema 1.3.1, se puede elegir Bn = n, supuesto que
n∑
i=1
σ2i
n2
−→ 0 cuando n −→∞.
Corolario 1.3.3. En el corolario 1.3.1, se puede tomar An = nµ y Bn = n
puesto que
nσ2
n2
−→ 0 cuando n −→∞.
Por consiguiente, si {Xn} son pares de variables aleatorias no correlacionadas
idénticamente distribuidas con varianza finita,
Sn
n
P−→ µ.
Ejemplo 15. Sea X1, X2, . . . , Xn . . . variables aleatorias iid con ley común
b(1, θ). Entonces E(Xi) = θ, Var(Xi) = θ(1 − θ), y por el corolario 1.3.1
La ley débil de los grandes números 27
tenemos.
Sn
n
P−→ θ cuandon −→∞
Nota: Snn es la proporción de éxitos en n pruebas.
En lo sucesivo, nos interesaremos principalmente en el caso de que Bn = n.
Cuando decimos que la sucesión, {Xn} cumple con la Ley Débil de los Grandes
Números (LDGN), esto es así con respecto a la secuencia {n}.
Teorema 1.3.2. Sea {Xn} cualquier sucesión de variables aleatorias. Sea
E(Xn) = µn, n = 1, 2, . . ., y sea Yn = 1n
∑n
i=1(Xi − µi). Una condición
necesaria y suficiente para que la sucesión {Xn} satisfaga la ley débil de los
grandes números es que
E
(
Y 2n
1 + Y 2n
)
−→ 0 cuando n −→∞. (11)
Prueba. En la prueba utilizamos el siguiente resultado matemático: para dos
números positivos cualesquiera, a, b tal que a ≥ b > 0, se tiene(
a
1 + a
)(
1 + b
b
)
≥ 1. (12)
Ahora, consideremos A = {|Yn| ≥ ε}. Entonces ω ∈ A ⇒ {|Yn|2 ≥ �2 > 0}.
Utilizando la ecuación (1.5.1), se deduce que ω ∈ A implica
Y 2n
1 + Y 2n
1 + �2
�2
≥ 1.
Entonces resulta que,
P(A) ≤ P
(
Y 2n
1 + Y 2n
1 + �2
�2
≥ 1
)
P(A) ≤ P
(
Y 2n
1 + Y 2n
≥ �
2
1 + �2
)
y por desigualdad de Markov tenemos que
P(A) ≤ P
(
Y 2n
1 + Y 2n
≥ 1 + ε
2
ε2
)
≤ E
(
|Y 2n /(1 + Y 2n )|
�2/(1 + �2)
)
y
E
(
|Y 2n /(1 + Y 2n )|
ε2/(1 + �2)
)
→ 0 cuando n→∞.
28 Teoremas de límites
Esto es
Yn
P→ 0 cuando n→∞.
Recíprocamente, demostraremos que para todo � > 0
P(|Yn| ≥ �) ≥ E
(
Y 2n
1 + Y 2n
)
− �2. (13)
Probaremos la ecuación (1.5.2) para el caso en la que las variables Yn son
de tipo continuo. Siendo el caso discreto similar, dejando al lector para que
complete la prueba. Si Yn tiene fdp f(y), entonces
E
[
Y 2
1 + Y 2
]
=
∫ ∞
−∞
y2
1 + y2
f(y)dy =
(∫
|y|>�
+
∫
|y|≤�
)
y2
1 + y2
f(y)dy
=
∫
|y|>�
y2
1 + y2
f(y)dy +
∫
|y|≤�
y2
1 + y2
f(y)dy
≤ P (|Yn| > �) +
∫ �
−�
(
1− 1
1 + y2
)
f(y)dy
≤ P (|Yn| > �) +
�2
1 + �2
≤ P (|Yn| > �) + �2,
la cual es la ecuación (1.5.2).
Ejemplo 16. Sean (X1, . . . , Xn) variables aleatorias conjuntamente distribui-
das en forma normal con E(X1) = 0, E(X21 ) = 1 para todo i, y Cov(Xi, Xj) = ρ
si |j − i| = 1 y 0 caso contrario;estoes:
Cov(Xi, Xj) =
{
ρ si |j − i| = 1
0 si c.c.
Pruebe que Snn
P−→ 0
Solución:
Del enunciado del problema se concluye que Sn =
∑n
i=1Xi ∼ N(0, σ2), donde
σ2 = Var(Sn) = n + 2(n− 1)ρ
La ley débil de los grandes números 29
Luego tenemos,
Yn =
1
n
n∑
i=1
(Xi − 0) =
1
n
n∑
i=1
Xi =
Sn
n
Y 2n
1 + Y 2n
=
S2n
n2
1 +
S2n
n2
=
S2n
n2
n2+S2n
n2
Y 2n
1 + Y 2n
=S2n
n2 + S2n
⇒ E
(
Y 2n
1 + Y 2n
)
= E
(
S2n
n2 + S2n
)
Tenemos entonces,
E
(
S2n
n2 + S2n
)
=
∫ ∞
−∞
x2
n2 + x2
fSn(x)dx
=
∫ ∞
−∞
x2
n2 + x2
1
σ
√
2π
e−
1
2σ2
x2dx
=
2
σ
√
2π
∫ ∞
0
x2
n2 + x2
e−
1
2σ2
x2
Sn =
∑
Xi =⇒ Var(Sn) =
∑n
i=1 Var(Xi)
Haciendo cambio de variable y = xσ =⇒ x = σy, x
2 = σ2y2, dx = σdy
=
2
σ
√
2π
∫ ∞
0
σ2y2
n2 + σ2y2
e−
y2
2 σdy
=
2√
2π
∫ ∞
0
y2(n + 2(n− 1)ρ)
n2 + y2(n + 2(n− 1)ρ)
e−
1
2y
2
dy
≤ 2(n + 2(n− 1)ρ)√
2πn2
∫ ∞
0
y2dy
≤ n + 2(n− 1)ρ
n2
∫ ∞
0
2y2√
2π
e−
1
2y
2
dy −→ 0, cuando n −→∞
Resulta del teorema 1.3.2 que
Sn
n
P−→ 0
Teorema 1.3.3. (Teorema de Khintchine) Sea {Xn} una sucesión de variables
aleatorias iid. con media común µ = E(X1) finita. Entonces
Sn
n
P−→ µ cuando n −→∞.
30 Teoremas de límites
Ejemplo 17. Sean X1, X2, . . . v. aleatorias iid con E(|X1|k) <∞ para algún
número entero positivo k. Entonces∑n
j=1X
k
j
n
P−→ E(Xk1 ) cuando n −→∞
Así si E(X21 ) <∞, entonces
∑n
j=1X
2
j
n
P−→ E(X21 ); y en como(∑n
j=1Xj
n
)2
P−→ (E(X1))2
resulta que ∑
X2j
n
−
(∑
Xj
n
)2
P−→ Var(X1).
1.4 La ley fuerte de los grandes números
Se obtiene una forma fuerte de la ley débil de los grandes números desarrollados
en la sección anterior. Sean {Xn}n≥1 una sucesión de variables aleatorias
definidas en un espacio de probabilidad, (Ω,A ,P).
Definición 7. Se dice que la sucesión de variables aleatorias, {Xn}n≥1, cumple
la ley fuerte de los grandes número (LFGN) con respecto a las constantes de
normalización {Bn} si existe una sucesión de constantes de centralización {An}
tal que
(Sn −An)
Bn
c.s.−→ 0 cuando n −→∞ (14)
aquí Bn > 0 y Bn −→∞ cuando n −→∞.
Obtendremos condiciones suficientes para que la sucesión {Xn} obedezca a
la ley fuerte de los grandes números. En lo que sigue, estaremos interesados
principalmente en el caso en que Bn = n. De hecho, cuando hablamos de la
ley fuerte de los grandes números asumiremos que estamos hablando de las
constantes de normalización Bn = n, a menos que se especifique lo contrario.
Comenzamos con el lema de Borel -Cantelli, que es una de las herramientas
más útiles en teoría de la probabilidad y una pieza importante en la prueba de
la ley de los grandes números.
Sucesión de eventos y el Lema de Borel -Cantelli 31
1.5 Sucesión de eventos y el Lema de Borel -
Cantelli
Sea {An}n≥1 una sucesión de eventos, es decir, si An ⊂ Ω para n = 1, 2, . . ., el
límite superior de la sucesión es definida por
lim sup
n→∞
An =
∞⋂
n=1
∞⋃
k=n
Ak; (15)
el límite inferior es por definición
lim inf
n→∞
An =
∞⋃
n=1
∞⋂
k=n
Ak (16)
Por conveniencia se suele indicar esos límites por lim supAn y lim inf An, de-
jando implícito el calificativo “n→∞′′.
El evento lim supAn es el evento “ocurrencia de un número infinito de los An”,
por el siguiente argumento:
si w ∈ lim supAn =⇒ w ∈
⋃∞
k=nAk,∀n. Como w ∈
⋃∞
k=1Ak =⇒ w ∈ Ak1
para algún k1. Pero w ∈
⋃∞
k=k1+1
Ak =⇒ w ∈ Ak2 para algún k2 > k1.
Continuando, tenemos w ∈
⋃∞
k=k2+1
Ak =⇒ w ∈ Ak3 , para algún k3 > k2,
etc. De esta manera se obtiene una sucesión creciente de números enteros
positivos k1 < k2 < k3 < · · · , que dependen de w, tales que w ∈ Akn ,∀n. Por
consiguiente, w pertenece a un número infinito de los An.
Recíprocamente, si w pertenece a un número infinito de los An, entonces w ∈⋃∞
k=nAk,∀n, de modo que w ∈ lim supAn. En consecuencia se concluye que
w pertenece a un número infinito de los An.
Notación: lim supAn = [An infinitas veces]. (aclaración: el evento “An infi-
nitas veces” es el evento “ocurrencia de un número infinito de los An”. Cada
An ocurre o no, por lo tanto es importante no caer en el error de pensar en
infinitas ocurrencias de, por ejemplo A1.)
El evento lim inf An también tiene una interpretación intuitiva: es el evento
“ocurrencia de An para todo n suficientemente grande”. Para ver esto, notemos
32 Teoremas de límites
que w ∈ lim inf An ⇐⇒ w ∈
⋂∞
k=n0
Ak para algún n0 = n0(w), o sea, w ∈ Ak
para todo k suficientemente grande (k ≥ n0).
Cuando lim supAn = lim inf An
def
= A, este evento se llama límite de An y se
escribe A = lim
n−→∞
An o An −→ A. En este caso, P(An) converge para P(A),
si los eventos son aleatorios, de modo que la probabilidad es continua no solo
para sucesiones monótonas, sino también para sucesiones convergentes en el
sentido más general.
Teorema 1.5.1. (Lema de Borel-Cantelli) Sean A1, A2, . . . eventos aleatorios
en ((Ω,A ,P)), es decir An ∈ A ∀n.
(a) Si
∞∑
n=1
P(An) <∞, entonces P(An infinitas veces) = 0
(b) Si
∞∑
n=1
P(An) =∞ y losAn son independientes, entonces P(An infinitas veces) =
1
Prueba. (a) Sea
A = lim sup
n→∞
An =
∞⋂
n=1
∞⋃
k=n
Ak
entonces
P(A) = P
(
lim sup
n→∞
An
)
= P
( ∞⋂
n=1
∞⋃
k=n
Ak
)
Haciendo Bn =
∞⋃
k=n
Ak, se observa que {Bn} es una sucesión decreciente;
por lo que resulta
lim
n→∞
Bn =
∞⋂
n=1
Bn =
∞⋂
n=1
∞⋃
k=n
Ak
en consecuencia se tiene
P(A) = P
(
lim
n→∞
∞⋃
k=n
Ak
)
= lim
n→∞
P
( ∞⋃
k=n
Ak
)
≤
≤ lim
n→∞
∞∑
k=n
P(Ak) = 0
Sucesión de eventos y el Lema de Borel -Cantelli 33
(b) Tenemos
Ac =
(
lim sup
n→∞
An
)c
=
( ∞⋂
n=1
∞⋃
k=n
Ak
)c
=
∞⋃
n=1
∞⋂
k=n
Ack
Haciendo en este caso, Bn =
∞⋂
k=n
Ack, se observa que {Bn} es una sucesión
creciente; de modo que
P(Ac) = P
(
lim
n→∞
∞⋂
k=n
Ack
)
= lim
n→∞
P
( ∞⋂
k=n
Ack
)
Para n0 > n, se observa que
∞⋂
k=n
Ack ⊂
n0⋂
k=n
Ack, de modo que
P
( ∞⋂
k=n
Ack
)
≤ lim
n0→∞
P
(
n0⋂
k=n
Ack
)
= lim
n0→∞
n0∏
k=n
(1−P(Ak)) ,
debido a que {An} es una sucesión de eventos independientes. Ahora
utilizamos la siguiente desigualdad
1− exp
− n0∑
j=n
αj
 ≤ 1− n0∏
j=n
(1− αj) ≤
n0∑
j=n
αj ,
donde n0 > n, 0 ≤ αj ≤ 1, para concluir que
P
( ∞⋂
k=n
Ack
)
≤ lim
n0→∞
exp
− n0∑
j=n
αj

Como la serie
∑∞
n=1 P(An) es divergente, resulta que P(A
c) = 0 o
P(A) = 1
34 Teoremas de límites
Corolario 1.5.1. Consideremos una sucesión de ensayos de Bernoulli indepen-
dientes con probabilidad de éxito igual a θn en el n-ésimo ensayo (0 < θn < 1).
Sea Xn = 1 si el n-ésimo ensayo es un éxito, Xn = 0 si es fracaso; esto es
Xn =
{
1 si el n-ésimo ensayo es un éxito
0 si el n-ésimo ensayo es un fracaso
Entonces valen la siguientes afirmaciones:
sí
∞∑
n=1
θn = +∞ =⇒ P
( ∞∑
n=1
Xn =∞
)
= 1
por otro lado
sí
∞∑
n=1
θn <∞ =⇒ P
( ∞∑
n=1
Xn <∞
)
= 1.
En otras palabras∑
θn <∞ =⇒ un número finito de éxitos, casi ciertamente,∑
θn =∞ =⇒ un número infinito de éxito casi ciertamente.
Prueba. Sea An el evento “éxito en el n -ensayo” = [Xn = 1]. Entonces
P(An) = θn y los An son independientes. Por el Lema de Borel -Cantelli,
resulta ∑
n
Pn <∞ =⇒ P(Aninfinitas veces) = 0 (ítem (a))∑
n
Pn =∞ =⇒ P(Aninfinitas veces) = 1 (ítem (b)).
Pero [An Infinitas veces]=“un número infinitos de éxitos entre todos los ensayos”
y [An Infinitas veces]c =“solo un número finito de éxitos entre todos los los
ensayos”. por consiguiente resulta
[AnInfinitas veces] =
[∑
n
Xn =∞
]
[AnInfinitas veces]c =
[∑
n
Xn <∞
]
Sucesión de eventos y el Lema de Borel -Cantelli 35
Ejemplo 18. Sea {Xn}n≥1 de variables aleatorias independientes é idéntica-
mente distribuidas con Xn ∼ exp(1) es,
FXn(x) =
{
0 si x < 0
1− e−x si x ≥ 0
sea Yn = Xnlnn para n > 1.
Entonces Yn
P→ 0 para todo � > 0, tenemos por definición de convergencia en
probabilidad.
P (|Yn − 0| ≥ �) = P (|Yn| ≥ �) = P (Yn ≥ �) = P
(
Xn
ln n
≥ �
)
= P (Xn ≥ � ln n) = P (Xn ≥ ln n�) = 1−P (Xn ≤ ln n�)
= 1− FXn(ln n�) = e−� lnn =
1
n�
→ 0
Luego Yn converge en probabilidad para cero.
Para probar que Yn 9 0 casi ciertamente,es suficiente verificar que P(Yn ≥
� infinitas veces) = 1 para algún � > 0, ya que en este caso, tendremos Yn ≥ �
infinitas veces, con probabilidad 1, y este evento implica que Yn no converge
para cero. (Formalmente, sea An = [Yn ≥ �]. Sí ω ∈ [Aninfinitas veces],
entonces Yn(ω) ≥ � para un número infinitos de los n, luego Yn(ω) no converge
para cero. Si probaramos P(Yn ≥ � infinitas veces) = 1, tendremos P(Yn 9
0) = 1.)
Los eventos [Yn] son independientes,ya lasvariables Yn son independientes, y∑
P(Yn ≥ �) =
∑
P(Xn ≥ � ln n) =
∞∑
n=1
e−� lnn =
∞∑
n=1
1
n�
=∞,
si 0 < � ≤ 1. Por el ítem(b) del lema de Borel -Cantelli, P(Yn ≥ � infinitas veces) =
1, sí 0 < � ≥ 1.
Como una aplicación simple del lema de Borel Cantelli se obtiene una versión
de la Ley Fuerte de los grandes Números.
Teorema 1.5.2. Si {Xn}n≥1 es una sucesión de variables aleatorias iid con
media común µ y cuarto momento finito, entonces
P
(
lim
n−→∞
Sn
n
= µ
)
= 1,
(
Sn
n
=
∑
Xi
n
c.s.−→ µ
)
36 Teoremas de límites
Prueba. Tenemos,
E[
n∑
i=1
(Xi − µ)]4 = nE(Xi − µ)4 + 6
(
n
2
)
σ4 ≤ Cn2.
Por la desigualdad de Markov resulta,
P
(∣∣∣∣∣
n∑
i=1
(Xi − µ)
∣∣∣∣∣ ≥ n�
)
≤
E[
∑n
i=1(Xi − µ)]4
(n�)4
≤ Cn
2
(n�)4
=
C ′
n2
Por consiguiente,
∞∑
n=1
P (|Sn − nµ| ≥ n�) <∞,
y resulta por el lema de Borel -Cantelli que con probabilidad 1 solo finitamente
muchos de los eventos {ω ∈ Ω : |Sn−µ| > �} ocurren, esto es P(A�) = 0, donde
A� = lim
n→∞
sup
{∣∣∣∣Snn − µ
∣∣∣∣ > �} .
Los conjuntos A� crecen, cuando � → 0, al conjunto ω en la cual Sn/n 9 µ.
Considerando �→ 0 a través de un conjunto contable de valores, tenemos
P
(
Sn
n
− µ9 0
)
= P
(⋃
k
A1/k
)
= 0.
Corolario 1.5.2. Si X1, X2, . . . son variables aleatorias iid tal que P(|Xn| <
K) = 1 ∀n, donde K es una constante positiva, entonces
Sn
n
c.s.−→ µ.
Teorema 1.5.3. Sea X1, X2, . . . una sucesión de variables aleatorias indepen-
dientes. Entonces
Xn
a.s−→ 0 ⇐⇒
∞∑
n=1
P (|Xn| > ε) <∞ ∀ε > 0
Teorema 1.5.4. Si
∑∞
n=1 Var(Xn) <∞, entonces
∞∑
n=1
(X − E(Xn))converge casi seguramente.
Sucesión de eventos y el Lema de Borel -Cantelli 37
Corolario 1.5.3. Sea {Xn} una sucesión de v. aleatorias independientes. Si
∞∑
k=1
Var(Xk)
B2k
<∞, Bn ↑ ∞,
entonces
Sn −E(Sn)
Bn
a.s.−→ 0
Teorema 1.5.5. (Primera ley fuerte de Kolmogorov) SeanX1, X2. . . . variables
aleatorias independientes e integrables, y suponga que
∞∑
n=1
Var(Xn)
n2
< +∞.
Entonces {Xn} obedece la Ley Fuerte de los Grandes Números, es decir
Sn −E(Sn)
n
c.s.−→ 0
Corolario 1.5.4. Toda sucesión {Xn} de variables aleatorias independientes
con varianzas uniformemente limitadas obedece la LFGN
LFGN
Teorema 1.5.6. (la ley fuerte de Kolmogorov) Sean X1, X2, . . . variables alea-
torias independientes e idénticamente distribuidas tales que P (Xn = 1) =
θ, P (Xn = 0) = 1− θ. Entonces
Sn
n
c.s−→ θ donde Sn =
n∑
i=1
Xi.
	Teoremas de límites
	Introducción
	Modos de convergencia
	La ley débil de los grandes números
	La ley fuerte de los grandes números
	Sucesión de eventos y el Lema de Borel -Cantelli

Continuar navegando

Otros materiales