Prévia do material em texto
1111111111111111111111 1111111111111 !
BIBLIOTECA CENTRAL !
------ ---,,-
11-
tercera edición inglesa de
Julian
Pedro
Figueiras
Ramos
L B R o S
EDICIONES
Traslation from the English language edition:
Proofs /rom THE BOOK by Martin Aigner, Günter M. Ziegler
Copyright © Springer-Verlag Berlin Heidelberg 1998,2001,2004
Springer is a part of Springer Science+Business Media
All Rights Reserved
1 a edición en castellano: junio de 2005
Imagen de cubierta: Detalle de paramento de La Alhambra (Archivo NIVOLA).
© Martín Aigner, Günter M. Ziegler, 2005
© NIVOLA libros y ediciones, S.L.
Apartado de Correos 113. 28760 Tres Cantos
Te\.: 918045817. Fax: 9180493 17
www.nivola.com
correo electrónico: contacto@nivola.com
ISBN: 84-95599-95-3
Depósito legal: M-25.892-2005
Impreso en España
Sin la autorización escrita de los titulares del copyright, queda rigurosamente
prohibida la reproducción parcial o total de esta obra por cualquier medio
o procedimiento, comprendidos la reprografía y el tratamiento informático.
De acuerdo con la acertada afirmación de G. H. Hardy que reza que no hay
lugar permanente para las matemáticas feas, a Paul Erd6s le gustaba hablar
de El Libro, en el que Dios recopila demostraciones perfectas de los teoremas
matemáticos. Erd6s también decía que, si eres matemático, no es necesario
que seas creyente, pero sí que creas en El Libro. Hace unos años le sugerimos
escribir una primera y modesta versión de El Libro. Estaba encantado con la
idea y empezó a trabajar inmediatamente con su entusiasmo habitual, llenando
páginas y páginas de sugerencias. Estaba previsto que este libro se publicara
en marzo de 1998, como regalo en el día que Erdos cumpliese ochenta y cinco
años. Su desafortunada muerte en el verano de 1996 ha hecho que dediquemos
este libro a su memoria, en lugar de que él mismo aparezca como autor.
No tenemos una definición que caracterice las demostraciones de El Libro:
todo lo que ofrecemos es una colección de ejemplos, que hemos seleccio-
nado con la esperanza de que nuestros lectores puedan compartir nuestro en-
tusiasmo cuando nos encontramos ante ideas brillantes, maneras geniales de
acercarse a un problema, o bonitas y precisas observaciones. También es-
peramos que los lectores puedan disfrutar a pesar de las imperfecciones que
pudiera tener nuestra exposición. La selección de los temas está muy influida
por Paul Erdos: una buena parte de ellos fueron sugeridos por él mismo, y
además de las demostraciones que llevan su firma, muchas otras fueron ini-
ciadas gracias a su suprema cualidad para formular la pregunta precisa o dar
con la conjetura adecuada. De modo que, en gran parte, este libro refleja el
punto de vista de Paul Erdos respecto a lo que debería ser una demostración
de El Libro.
Uno de los factores que nos han limitado en la selección de los contenidos
ha sido que todas las demostraciones que se incluyen en este libro deberían
resultar accesibles para cualquier lector con un dominio modesto de técni-
cas y conceptos matemáticos. Un poco de álgebra lineal, análisis y teoría de
números y un buen puñado de conceptos elementales de matemática discreta
deberían ser suficientes para comprender y disfrutar la lectura.
Hacemos público nuestro agradecimiento más profundo a muchas personas
que nos han ayudado y brindado su apoyo en este proyecto, y entre ellas a
los estudiantes de un seminario en el que discutimos una versión peliminar, a
Benno Artmann, Stephan Brandt, Stefan Felsner, Eli Goodman, Torsten Held-
mann, y Hans Mielke. Agradecemos también a Margrit Barrett, Christian
Bressler, Ewgenij Gawrilow, Michael Joswig, Elke Pose, y Jbrg Rambau por
su ayuda técnica en la composición del libro, a Tom Trotter que leyó el original
desde la primera a la última página, a Karl H. Hofmann por sus maravillosos
dibujos y, sobre todo, a Paul Erdos.
Berlín, marzo de 1998 Martin Aigner . Günter M. Ziegler
Paul Erdos
El Libro
La primera edición de este libro tuvo una estupenda acogida y recibimos un
número inusual de cartas que contenían comentarios, correcciones, pasos más
abreviados en algunas ocasiones, demostráciones alternativas y nuevos temas
para considerar. (Aunque intentamos recoger demostraciones peifectas, nues-
tra exposición no lo es.)
Esta segunda edición nos brinda la oportunidad de presentar una nueva ver-
sión: hemos incluido tres capítulos adicionales, revisiones sustanciales y nue-
vas demostraciones, además de algunas mejoras y enmiendas menores, mu-
chas de ellas basadas en las sugerencias que hemos recibido. Hemos supri-
mido también uno de los capítulos antiguos, "sobre el problema de las trece
esferas," cuya demostración necesitaba introducir algunos arreglos que no po-
dían ser completados de forma que resultara una demostración breve y ele-
gante.
Gracias a todos los lectores que nos escribieron y nos ayudaron, entre ellos,
Stephan Brandt, Christian Elsholtz, Jürgen Elstrodt, Daniel Grieser, Roger
Heath-Brown, Lee L. Keener, Christian Lebceuf, Hanfried Lenz, Nicolas Puech,
John Scholes, Bernulf WeiBbach, y muchos otros. Gracias de nuevo por su
ayuda y apoyo a Ruth Allewelt y Karl-Friedrich Koch de la editorial Springer
en Heidelberg, a Christoph Eyrich y Torsten Heldmann en Berlín, y a Karl H.
Hofmann por los nuevos e igualmente estupendos dibujos.
Berlín, septiembre de 2000 Martin Aigner . Günter M. Ziegler
Nunca hubiéramos soñado con el éxito que ha alcanzado este libro mientras
preparábamos su primera edición en 1.998. Ha sido traducido a una gran can-
tidad de idiomas y contamos con las respuestas entusiasmadas de muchos lec-
tores que han aportado sugerencias interesantes para su mejora, adendas y
nuevos temas, que nos podrían mantener ocupados aún unos cuantos años.
En esta tercera edición aparecen dos nuevos capítulos, el primero acerca de las
identidades de Euler para particiones y el segundo sobre diferentes estrategias
de barajar un mazo de naipes. Hemos incluido a lo largo del libro algunas
mejoras, como el método de Calkin, Wilf y N ewman en la enumeración de los
racionales, y en un capítulo independiente tres demostraciones de las series de
Euler. Por ahora, eso es todo.
Expresamos nuestro agradecimiento a quienes han apoyado este proyecto en
los últimos cinco años y cuya implicación ha marcado la diferencia en esta
nueva edición. Gracias a David Bevan, Anders Bjorner, Dietrich Braess,
John Cosgrave, Hubert Kalf, Günter Pickert, Alistair Sinclair, y Herb Wilf.
Berlín, julio de 2003 Martin Aigner . Günter M. Ziegler
____________________________ 1
1. Seis demostraciones de la infinidad de números primos .............. 3
2. El postulado de Bertrand .......................................... 7
3. Los coeficientes binomiales casi nunca son potencias ............... 13
4. Representación de enteros como suma de dos cuadrados ............ 17
5. Cualquier anillo de división finito es un cuerpo ..................... 23
6. Algunos números irracionales .................................... 27
7. Tres veces 1f2/6 ................................................ 35
8. El tercer problema de Hilbert: descomposición de poliedros ......... 45
9. Rectas en el plano y descomposición de grafos ..................... 53
10. El problema de la pendiente ...................................... 59
11. Tres aplicaciones de la fórmula de Euler ........................... 65
12. El teorema de rigidez de Cauchy ................................. 71
13. Símplices en contacto ........................................... 75
14. Cualquier conjunto con muchos puntos tiene un ángulo obtuso ...... 79
15. La conjetura de Borsuk .......................................... 85
16. Conjuntos, funciones y la hipótesis del continuo ................... 93
17. Aquellas maravillosas desigualdades ............................. 109
18. Un teorema de Pólya sobre polinomios ........................... 117
19. Sobre un lemade Littlewood y Offord ........................... 123
20. La cotangente y el truco de Herglotz ............................. 127
21. La aguja de Buffon ............................................ 133
~ ___________________________ 1
22. El principio del palomar y el doble recuento ...................... 139
23. Tres teoremas famosos sobre conjuntos finitos .................... 151
24. Barajando el mazo ............................................. 157
25. Caminos, retículas y determinantes .............................. 167
26. La fórmula de Cayley para el número de árboles .................. 173
27. Completando cuadrados latinos ................................. 179
28. El problema de Dinitz .......................................... 185
29. Identidades y biyecciones ....................................... 191
_____________________________ 1
30. Cinco-coloración de grafos planos ............................... 199
31. Cómo vigilar un museo ......................................... 203
32. El teorema de Turán ............................................ 207
33. Comunicar sin errores .......................................... 213
34. Sobre amigos y políticos ....................................... 223
35. La probabilidad nos 10 pone fácil (a veces) ....................... 227
Sobre
índice temático _______________________ _
1
Seis demostraciones de la
infinidad de números primos 3
2
El postulado de Bertrand 7
3
Los coeficientes binomiales
casi nunca son potencias 13
4
Representación de enteros
como suma de dos cuadrados 17
5
Cualquier anillo de división finito
es un cuerpo 23
6
Algunos números irracionales 27
7
Tres veces Jr2/6 35
"La irracionalidad y Jr"
Es natural que comencemos estas páginas con la que probablemente es la más
antigua de las demostraciones de El Libro, que se atribuye a Euclides (Ele-
mentos 20). Demuestra que la sucesión de números primos es infinita .
• La demostración de Euclides. Para cualquier conjunto finito {PI, ... ,Pr }
de números primos, consideramos el número n = PIP2 ... Pr + l. Este n tiene
un divisor primo p. Pero P no es uno de los Pi; de otro modo, P sería un divisor
de n y del producto PIP2 ... Pr, Y en consecuencia también de la diferencia
n - PIP2 ... Pr = 1, lo cual es imposible. Por lo tanto, un conjunto finito
{PI, ... ,Pr } no puede recoger todos los números primos. D
Antes de continuar, acordaremos qué notación utilizaremos en adelante: para
el conjunto de los numero s naturales escribiremos N = {1, 2, 3, ... }, para el
de los números enteros Z = { ... , -2, -1, O, 1, 2, ... }, y lP' = {2, 3, 5, 7, ... }
denotará el conjunto de los números primos.
A continuación exponemos algunas otras demostraciones (de las muchas que
existen) y que esperamos que agraden a los lectores tanto como a nosotros.
Aunque utilizan diferentes puntos de vista, la siguiente idea es común a todas
ellas: los números naturales crecen más alla de todo límite, y todo número
natural n :::: 2 tiene un divisor primo. Estos dos hechos tomados conjunta-
mente obligan a que el conjunto lP' sea infinito. La siguiente demostración es
de Christian Goldbach (en una carta a Leonhard Euler en 1730); la tercera es
anónima y muy popular; la cuarta es del mismo Euler; la quinta fue propuesta
por Harry Fürstenberg y la última es de Paul Erdos .
• Segunda demostración. Fijémonos en primer lugar en los números de
Fermat Fn = 22n + 1 para n = 0,1,2, .... Demostraremos que cualesquiera
dos números de Fermat son primos entre sí; de aquí se deduce que debe haber
infinitos números primos. Para ello, comprobaremos que se verifica
n-I
(n:::: 1),
k=ü
a partir de lo cual nuestra afirmación se demuestra de manera inmediata. En
efecto, si m es un divisOf, digamos de Fk Y Fn (k < n), entonces m es divisor
de 2, y deducimos que m = 1 ó m = 2. Pero la opción m = 2 es imposible
ya que todos los números de Fermat son impares.
1
Fo 3
F I 5
F2 17
F3 257
F4 65537
Fs 641 . 6700417
Los primeros números de Fermat
1
4
Teorema de
Si G es un grupo multiplicativo
finito y U un subgnlpo, entonces I UI
divide a IGI.
• Demostración. Consideramos la
relación binaria
a ~ b: {==} ba- 1 E U.
A partir de los axiomas de grupo se
sigue que ~ es una relación de equi-
valencia. La clase de equivalencia
que contiene a un elemento a es pre~
cisamente la clase
Ua={xa:xEU}.
Puesto que I U al IUI, encon-
tramos que G se descompone en
clases de equivalencia, todas de
tamaño IUI, de donde deducimos
que IUI divide a IGI. O
En el caso esencial en el que
U sea un subgrupo cíclico
{a,a2 , .•. ,a"'}, resulta que
m (el más pequeño de los enteros
positivos tales qne am = 1, llamado
el orden de a) divide al cardinallGI
del grupo.
1 2 n n+l
Escalera superior para f ( t) = t
Seis demostraciones de la infinidad de números primos
Probamos la recursión por inducción sobre n. Para n = 1 tenemos Fo = 3 Y
Fl - 2 = 3. Por inducción concluimos
n n-l
Fk = ( Fk )Fn = (Fn - 2)Fn
k=O k=O
= (2 2n _1)(22n + 1) = 22n+l - 1 = Fn+1 - 2. O
• Tercera demostración. Supongamos que lP' es finito y P es el mayor de to-
dos los números primos. Consideraremos los llamados números de Mersenne
2P - 1 Y demostraremos que cualquier factor primo q de 2P - 1 es mayor
que p, lo cual nos conducirá a la conclusión deseada. Sea q un divisor primo
de 2P - 1, por lo tanto tenemos 2P == 1 (mod q).
Puesto que p es primo, el elemento 2 tiene orden p en el grupo multiplicativo
Zq \ {O} del cuerpo Zq. Este grupo tiene q - 1 elementos. Por el teorema de
Lagrange (ver el margen), sabemos que el orden de cualquier elemento.divide
al cardinal del grupo, esto es, p I q - 1, Y de aquí que p < q. O
La demostración que presentamos a continuación utiliza cálculo elemental.
• Cuarta demostración. Sea 7r(x) := #{p ~ x : p E lP'} el cardinal
del conjunto de números primos que son menores o iguales que el número
real x. Enumeramos los primos lP' = {Pl,P2,P3, ... } en orden creciente.
Consideramos el logaritmo neperiano log x, definido como log x = J; tdt.
Comparando el área bajo la gráfica de f(t) = t con una función escalera
superior (véase también el apéndice en la página 10 para más información
sobre este método), concluimos que para n ~ x < n + 1 se tiene que
logx
1 1 1 1
< 1+-+-+ ... +--+-
2 3 n-l n
< ¿ ~, donde la suma se extiende sobre todos los m E N
m que sólo tienen divisores primos p ~ x.
Puesto que cualquiera de estos m puede escribirse de manera única como
producto de la forma n pkp , deducimos que esta última suma es
p~X
rr (¿--\:).
pElP' k;:O:O P
p~X
La suma en el interior del paréntesis es una serie geométrica de razón ~, con
lo cual sabemos que
logx <
Ahora es claro que Pk 2: k + 1, Y en consecuencia
1f(X)
Pk
Pk -1
k=l
Pk 1 1 k + 1
--=1+--<1+-= k
~-1 ~-1 - k
Seis demostraciones de la infinidad de números primos 5
----------------------------------------------------
por tanto
lr(X) k + 1
logx < -k- = 1f(x) + l.
k=l
De todos es sabido que log x no está acotado, y por tanto concluimos que 1f(.T)
tampoco está acotado, así que existe un número infinito de primos. O
• demostración. Después del análisis ... ¡le toca el turno a la topo-
logía! Consideramos una curiosa topología en el conjunto Z de los números
enteros. Para a, b E Z, b > O, sea
Na,b = {a + nb : n E Z}.
Cada conjunto Na,b es una progresión aritmética infinita en los dos sentidos.
Un conjunto O <;;; Z es abierto si, o bien O es vacío, o si para todo a E O
existe algún b > O tal que Na,b <;;; O. Es evidente que la unión de abiertos
es un abierto. Si 0 1 , O2 son abiertos, y a E 0 1 n O2 con Na,b 1 <;;; 0 1 Y
N a,b2 <;;; O2 , entonces a E N a,b1 b2 <;;; 0 1 n O2 . Por tanto, podemos concluir
que la intersección finita de abiertos es abierto. Así, esta familia de conjuntos
abiertos induce una topología en Z.
Nótese que se verifican las afirmaciones siguientes:
(A) Cualquier conjunto abiertono vacío es infinito.
(B) Cualquier conjunto Na,b también es cerrado.
Efectivamente, la primera afirmación se sigue inmediatamente de la defini-
ción. Para la segunda, observamos que
b-1
Na,b = .z \ U Na+i,b,
i=l
lo cual prueba que Na,b es el complementario de un conjunto abierto, y por
tanto es cerrado.
Hasta ahora, los números primos todavía no han entrado en escena -- pero
ya llegan. Puesto que cualquier número n distinto de 1 y -1 tiene un divisor
primo p, y por lo tanto está contenido en No,p, concluimos que
.z \ {1, -1} = U No,p'
pElP'
Ahora, si lP' fuera finito, entonces UpElP' No,p sería unión finita de cerrados
(por (B)), y por lo tanto, cerrado. En consecuencia, {1, -1} debería ser un
conjunto abierto, lo que contradice (A). O
• Sexta demostración. Nuestra última demostración va considerablemente
más allá de la existencia de infinitos números primos, ya que además demues-
tra que la serie ¿PElP' i diverge. La primera demostración de este importante
resultado fue dada por Euler (y es interesante en sí misma), pero la que pre-
sentamos aquí, elaborada por Erd6s, tiene un atractivo especial.
"Hacer la rana, hasta el infinito"
8
n
Teorema
El número n! contiene el factor
primo p exactamente
veces.
Demostración. Exactamente
de los factores de
p
n! 1 . 2 . 3 ..... n son
divisibles entre p, de dond.e se
obtienen l ~ J p-factores. Además
l ;Z J de los factores de n! son
incluso divisibles entre p2, lo que
aumenta nuestro contador en [.I!:.-J _p2
factores primos p de ni, etc. O
El postulado de Bertrand
A continuación probamos que
p :::; 4x~1 para todo x 2: 2 real, (1)
donde nuestra notación - aquí y en lo que sigue - quiere decir que el pro-
ducto se toma sobre todos los primos p ~ x. Demostraremos este hecho por
inducción sobre el número de estos primos. No está tomada del trabajo origi-
nal de Erd6s, pero también se debe a él (véanse sus apuntes en el margen), y
es realmente una demostración tomada de El Libro. En primer lugar, nótese
que si q es el mayor número primo con q :::; x, entonces
p = p Y 4q - 1 :::; 4x - 1 .
p<:;x p<:;q
Por tanto, es suficiente comprobar (1) para el caso en el que x = q es primo.
Para q = 2 obtenemos "2 :::; 4," de modo que procedemos a considerar primos
impares q = 2m+ 1. (Aquí podemos suponer, por inducción, que (1) es válido
para todos los enteros x en el conjunto {2, 3, ... , 2m}.) Para q = 2m + 1
desarrollamos el producto y calculamos
p = p' P :::; 4m Cmm+1) :::; 4m 22m = 42m.
p<2m+l p::;m+l m+l<p<:;2m+l
Es fácil verificar paso a paso esa cadena de desigualdades. De hecho,
se verifica por inducción. La inecuación
rr P <
m+l<p<:;2m+l
es cierta porque (2~+1) = ~~0~t:{;! es un entero, en el cual los primos que
estamos considerando son todos factores del numerador (2m + 1)!, pero no
del denominador m!(m + 1)! . Finalmente, se verifica
Cmm+ 1) :::; 22m
ya que
Cmm+ 1) yademás C: :11)
son dos sumandos (iguales) que aparecen en
(3) Del teorema de Legendre (véase el margen) obtenemos que (2:) = ~~i
contiene el factor primo p exactamente
El postulado de Bertrand
veces. cada sumando es a lo sumo 1, ya que satisface
< 2n _ 2 (~ - 1) = 2,
pk . pk
y es un entero. Aún más, los sumandos se anulan siempre que pk > 2n.
De e:) contiene p exactamente
veces. Por tanto, la mayor potencia de p que divide a (2:) no es mayor que 2n.
En particular, los primos p > V2ií aparecen en e:) a lo sumo una vez.
Más aún, - y esto, según Erd6s, es la clave de la demostración - ¡los pri-
mos p que satisfacen ~n < p :::; n no dividen a (2:)! De hecho, 3p > 2n
implica (para n ~ 3, Y por tanto p ~ 3) que p y 2p son los únicos múltiplos
de p que aparecen como factores en el numerador de ~~i, mientras que en el
denominador hay exactamente dos factores p.
Ahora ya podemos estimar e:). Para n ~ 3, utilizando una estimación de
la página 12 para la cota inferior, obtenemos
4
n
(2n) - < < 2n 2n - n -
p-:;.ffn
p p
y por tanto, como no hay más de V2ií primos p :::; V2ií,
p rr p para n ~ 3. (2)
n<p-:;'2n
(5) Asumimos ahora que no hay ningún primo p con n < p :::; 2n, de modo
que el segundo producto en (2) es 1. Substituyendo (1) en (2) obtenemos
4n < (2n)Hffn 4~n
o
(3)
una desigualdad que no es cierta para n suficientemente grande. De hecho,
es tan falsa que (para n ~ 4000) lo podemos ver sin siquiera utilizar una
calculadora: Utilizando a + 1 < 2a (lo cual se verifica por inducción para
todo a ~ 2), obtenemos
y de aquí, para n ~ 50 (y por tanto 18 < 2V2ií) obtenemos de (3) y (4) que
Esto implica (2n)1/3 < 20, Y por tanto n < 4000. o
9
Ejemplos tales como
G~) = 23 . 52 . 7 . 17 . 19 . 23
G:) = 23 . 33 . 52 . 17 . 19 . 23
(~~) = 24 . 32 . 5 . 17· 19 . 23 . 29
ilustran que primos "muy pequeños"
p < ffn pueden aparecer elevados a
las potencias más grandes en (2:), que
factores primos "pequeños" que verifi-
can ffn < p ::; ~n aparecen a lo
sumo una vez, mientras que factores en
el hueco ~n < p ::; n no aparecen.
10
n
El postulado de Bertrand
Es posible sacar más de este de estimaciones: a de (2)
obtenerse con los mismos métodos que
1
P 2': 23ü n para n 2': 4000,
y por tanto existen al menos
1 n
30 10g2 n + 1
primos entre n y 2n.
Esta estimación no es excesivamente mala: el "verdadero" número de primos
en ese rango es aproximadamente del orden de ni log n. Esto se sigue del
"teorema! de los números primos," que dice que el límite
existe, y es igual a 1.
l
. #{p ~ n : p es primo}
1m
n--+oo ni log n
Este famoso resultado fue demostrado por primera vez por Hadamard y de la
Vallée-Poussin en 1896; Selberg y Erd6s dieron una demostración elemental
(sin utilizar herramientas de análisis complejo, aunque larga y complicada) en
1948.
En lo que se refiere al teorema de los números primos parece que aún no se ha
dicho la última palabra: por ejemplo, una demostración de la hipótesis de Rie-
mann (véase la página 41), uno de los problemas no resueltos más importante
en matemáticas, nos proporcionaría una mejora importante para el teorema de
los números primos. Pero también para el postulado de Bertrand podrían es-
perarse mejoras sustanciales. De hecho, el siguiente problema, de Opperman
(1882), está aún sin resolver:
¿Existe siempre algún número primo entre n 2 y (n + 1)2?
Pata más información, véase [3, p. 19] Y [4, pp. 248, 257].
Estimación mediante integrales
Existe un método muy sencillo pero efectivo para estimar sumas utilizando
integrales (tal y como ya se vio en la página 4). Para estimar los números
armónicos
n 1
Hn = I:: k
k=l
dibujamos la figura del margen, y deducimos de ella que
logn,
El postulado de Bertrand
comparando el área bajo la gráfica de f(t) = t (1 ::; t ::; n) con el área de los
rectángulos sombreados en oscuro. Además obtenemos que
. 1 n-l 1 in 1
H - - = ~ - > -- dt = log.n
n n ~ k t '
k=l 1
esta vez con el área de los rectángulos grandes (incluyendo las
partes más claras). En conjunto, esto conduce a que
1
logn+ - < Hn < logn + l.
n
En particular lim· Hn ---+ 00, y el orden de crecimiento de Hn viene dado por
n---+oo
lim JHn = l. Pero se conocen estimaciones mucho mejores, tales como
n-+oo ogn
1 1 1 (1) Hn = log n + ry + 2n - 12n2 + 120n4 + O n 6 '
donde ry ~ 0.5772 es la "constante de Euler" (véase [2]).
Estimación factorial - la fórmula de Stirling
El mismo método aplicado a
log(n!) = log2+log3+ ... +logn
proporciona
n
2:log k
k=2
log((n - 1)!) < ¡n logtdt < log(n!),
donde la integral puede calcularse fácilmente:
¡n logtdt = [tlogt _ t[ = nlogn - n + l.
. Así que obtenemos una cota inferior para n! de
n! > enJogn-n+l
y al mismo tiempo una cota superior
n! = n (n -1)! < nenJogn-n+l = en(~) n.
En este punto se necesita una análisis más cuidadoso para describir el com-
portamiento asintótico de ni, tal y como viene dado en lafórmula de Stirling
n! rv v27Tn (~r
y de nuevo existen versiones aún más precisas, tales como
n!= v27Tn (12)n (1 + _1 + _1_ _ 139 + O (~)) .
e 12n 288n2 5140n3 n4
Estimación mediante coeficientes binomiales
A partir de la definición del coeficiente binomial G) como el número de sub-
conjuntos de cardinal k de un conjunto de tamaño n, sabemos que la sucesión
(Z), G), ... , (~) de coeficientes binomiales
1
Aquí O (~6) denota una función f (n)
tal que f ( n) ::; e ~6 se verifica para al-
guna constante c.
Aquí f(n) rv g(n) signifca que
lim f(n) = 1.
n-Hexo g(n)
12
1
1 1
1 2
1 3 3
1 4 6
1 5 10 10
1 6 15 20
1 7 21 35 35
Triángulo de Pascal
1
1
4 1
5 1
15 6 1
21 7 1
n
iD tiene como suma :s (~) = 2n
k=O
. ,. (n) (n)
@ es slmetnca: k = n-k .
El postulado de Bertrand
De la ecuación funcional (~) = n-~+l C;,::l) se deduce fácilmente que, para
todo n, los coeficientes binomiales (~) forman una sucesión que es simétrica y
unimodal: se incrementa hasta la mitad, de manera que los coeficientes bino-
miales centrales son los más grandes de la sucesión:
Aquí, Lx J y IX l denotan, respectivamente, el número x redondeado inferior
y superiormente al entero más cercano.
A partir de las fórmulas asintóticas para los factoriales que se mencionaron
antes, pueden obtenerse fácilmente estimaciones muy precisas para el tamaño
de los coeficientes binomiales. Sin embargo, en este libro necesitaremos úni-
camente ~otas muy débiles, como la siguiente: G) ::: 2n para todo k, mientras
que para n 2:: 2 tenemos
(Ln~2J) 2:: 2~)
dándose la igualdad sólo para n = 2. En particular, para n 2:: 1,
(
2n) 2:: 4
n
.
n 2n
Esto se verifica porque (L n /2 J)' un coeficiente binomial central, es el mayor
en la sucesión G) + (~) (~) G) ... ) (n::l)' cuya suma es 2n, y cuya media
es por tanto 2: .
Por otra parte, la siguiente cota superior para los coeficientes binomiales es
razonablemente buena para coeficientes "pequeños" en la cola de la sucesión,
cuando n es grande en comparación con k.
n(n-1) ... (n-k+1) n k n k
k! < k! < 2k - 1 '
[1] P. ERD6s: Beweis eines Satzes von Tschebyschef, Acta Sci. Math. (Szeged) 5
(1930-32), 194-198.
[2] R. L. GRAHAM, D. E. KNUTH & O. PATASHNIK: Concrete Mathematics.
A Foundationfor Computer Science, Addison-Wesley, Reading MA 1989.
[3] G. H. HARDY & E. M. WRIGHT: An lntroduction to the Theory ofNumbers, fifth
edition, Oxford University Press 1979.
[4] P. RIBENBOIM: The New Book of Prime Number Records, Springer-Verlag, New
York 1989.
Existe un epílogo del postulado de Bertrand que conduce a un bonito resul-
tado sobre coeficientes binomiales. En 1892 Sylvester reforzó el postulado de
Bertrand de la siguiente manera:
Si n 2' 2k, entonces al menos uno de los números n, n - 1, ... , n-k + 1
tiene un divisor primo p mayor que k.
Nótese que para n = 2k obtenemos precisamente el postulado de Bertrand.
En 1934, Erd6s dio una breve y elemental demostración del resultado de Syl-
vester digna de estar en El Libro, análoga a su demostración del postulado de
Bertrand. Hay una manera equivalente de formular el teorema de Sylvester:
El coeficiente binomial
(
n) = n(n-1) .. ·(n-k+1)
k k!
(n 2' 2k)
tiene siempre un factor primo p > k.
Sin perder de vista esta observación, volvamos a otra de las joyas de Erd6s:
¿cuando es (~) igual a una potencia mJl.? Es fácil ver que existen infinitas
soluciones para k = R = 2, es decir, para la ecuación (~) = m 2 . De hecho,
si G) es un cuadrado, entonces también lo es ((2n;1)2). Para ver esto, sea
n(n 1) =2m2. Se sigue que .
(2n - 1)2((2n - 1)2 - 1) = (2n - 1?4n(n - 1) = 2(2m(2n - 1))2,
y de aquí
C2n ~ 1)2) = (2m(2n _ 1))2.
Así pues, comenzando con (;) = 62 obtenemos infinitas soluciones - el
siguiente es (2~9) = 2042. Sin embargo, este procedimiento no proporciona
todas las soluciones. Por ejemplo, (52°) = 352 y C6282 ) = 11892 son el
( ) 2 (53°) = 140
2
comienzo de series diferentes. Para k = 3 se sabe que ~ = m tiene la
solución única n = 50, m = 140, pero ahora ya hemos llegado al límite. Para es la única solución para k = 3, g = 2
k 2' 4 y cualquier R 2' 2 no existen soluciones, y esto es lo que probó Erdos
utilizando un ingenioso argumento.
Teorema. La ecuación (~)
R2'2 y 4::;k::;n-4.
mE no tiene soluciones enteras con
14 Los coeficientes binomiales casi nunca son potencias
Nótese en primer lugar que podemos suponer sin pérdida
de generalidad que n 2: 2k, porque G) = (n~k)' Supongamos que el teorema
es falso y que (~) = m C• La demostración, hasta llegar a una contradicción,
se desarrolla en cuatro pasos.
(1) Por el teorema de Sylvester, existe un factor primo p de (~) mayor que k,
ya que pC divide a n(n-1) ... (n-k+ 1). Claramente, sólo uno de los factores
n - i puede ser múltiplo de p (ya que p > k), y concluimos que pC I n i, y
por lo tanto
(2) Consideremos cualquier factor n - j del numerador y escribámoslo de la
forma n-j = ajmj, donde aj no es divisible entre una potencia no trivial de fJ..
Nótese por (1) que aj sólo tiene divisores primos que son menores o iguales
que k. Queremos demostrar ahora que ai i- aj para i i- j. Suponemos, por
contra, que ai = aj para algún i < j. Entonces mi 2: mj + 1 y
k > (n - i) (n j) = aj(mf - m]) 2: aj((mj + l)c - mj)
> ajfJ.m~-l > fJ.(ajmj?/2 2: fJ.(n - k + 1)1/2
> fJ.(:g: + 1)1/2 > n 1/2,
lo cual contradice n > k 2 .
(3) A continuación probamos que los ai son los enteros 1,2, ... ,k ordenados
de alguna manera. (De acuerdo con Erdos, este es el quid de la demostración.)
Como ya sabemos que todos los ai son distintos, basta probar que
aOa1 ... ak-l divide a k!.
Substituyendo n - j = ajmj en la ecuación (~) = mC, se obtiene
aOa1'" ak-l(mOm1'" mk_dc = k! mC.
Simplificando los factores comunes de mo ... mk-l Y m se obtiene
aOal ... ak-l uC = k! vC
con mcd( u, v) = 1. Falta por demostrar que v = 1. Si no es así, entonces v
contiene un dividor primo p. Puesto que mcd( u, v) = 1, p ha de ser un divisor
primo de aOal ... ak-l Y por tanto es menor o igual que k. Por el teorema
de Legendre (ver página 8) sabemos que k! contiene a p elevado a la potencia
¿i>ll4 J. Ahora estimamos el exponente de p en n( n - 1) ... (n - k + 1). - p
Sea i un entero positivo, y sean b1 < b2 < ... < bs los múltiplos de pi que
hay entre los factores n, n - 1, ... , n-k + 1. Entonces bs = b1 + (3 - 1 )pi,
Y de aquí
(3 - l)pi k -1,
lo cual implica
s < lk;lJ+1 < l;J+1.
Los coeficientes binomiales casi nunca son potencias
Así que para cada i el número de de que entre n, ... , n-k+ 1,
Y por tanto entre los aj, está acotado por l-:!r J + l. Esto implica que el expo-
nente de p en aOal ... ak-l es a lo sumo
según el razonamiento que utilizamos para probar el teorema de Legendre en
el capítulo 2. la única diferencia es que esta vez la suma se detiene en i = .e-l,
ya que los aj no contienen potencias de.e.
Considerando ambos cálculos de manera conjunta, obtenemos que el expo-
nente de p en v R es a lo sumo
y ya hemos obtenido la contradicción buscada, ya que vR es una potencia de.e.
Esto ya es suficiente para concluir el caso .e = 2. De hecho, ya que k 2: 4, uno
de los ai tiene que ser igual a 4, pero los ai no contienen ningún cuadrado.
Por tanto, suponemos a partir de ahora que .e 2: 3.
(4) Como k 2: 4, debe ser ail = 1, ai2 = 2, ai3 = 4 para algunos i1, i 2 , i3,
esto es,
Afirmamos que (n-i2)2 =} (n-i 1 )(n-i3 ). En caso contrario, sea b = n-i2
y n - i1 = b - x, n - i3 = b + y, donde 0< Ixl, Iyl < k. De aquí
b2 =(b-x)(b+y) ó (y-x)b=xy,
donde x = y es obviamente imposible. Ahora, según la parte (1), tenemos:
Ixyl = bly - xl 2: b > n-k > (k - 1)2 2: Ixyl,
lo cual es absurdo.
Así, m~ =} mlm3, donde suponemos m~ > mlm3 (el otro caso es análogo),
y hemos llegado a nuestra última cadena de desigualdades. Obtenemos
2(k-l)n > n2 -(n-k+l)2 > (n-i2)2_(n-i1 )(n-i3 )
4[m~R - (mlm3)R] > 4[(mlm3 + l)R - (mlm3)R]
> 4.e <:-1 R-l mI m 3 .
Como.e 2: 3 y n > kR 2: k3 > 6k, tenemos que
2(k - 1)nmlm3 > 4.emim~ = .e(n - i1)(n - i3 )
> .e(n-k+l)2 > 3(n-~)2> 2n2.
15
Vemos que nuestro análisis hasta este
punto concuerda con (53°) = 1402, ya
que
50 = 2.52
49 = 1· 72
48=3.42
Y 5 . 7 . 4 = 140.
16 Los coeficientes binomiales casi nunca son potencias
Ahora, puesto que mi :S nI/e :S n I / 3 obtenemos finalmente
Ó k3 > n. Con esta contradicción se completa la demostración. D
[1] P. ERD6s: A theorem of Sylvester and Schur; J. London Math. Soco 9 (1934),
282-288.
[2] P. ERDÓS: On a diophantine equation, J. London Math. Soco 26 (1951),
176-178.
[3] J. J. SYLVESTER: On arithmetical series, Messenger of Math. 21 (1892), 1-19,
87-120; Collected Mathematical Papers Vol. 4,1912,687-731.
¿ Qué enteros se escribir como suma de dos cuadrados?
Esta pregunta es tan antigua como la teoría de números, y su solución es un
clásico del área. La parte "difícil" de la respuesta es comprobar que todo
número primo de la forma 4m + 1 es suma de dos cuadrados. G. H. Hardy
escribió que este teorema de los dos cuadrados de Fermat "es considerado,
con toda justicia, como uno de los más bellos de la aritmética." Sin embargo,
una de nuestras demostraciones de El Libro es bastante reciente.
Comencemos con algunos preliminares. En primer lugar, hemos de distinguir
el primo P = 2 de los primos de la forma P = 4m + 1 Y de los primos de
la forma P = 4m + 3. Todo número primo es de uno de estos tres tipos. En
este punto, se puede observar (siguiendo la idea de Euclides) que hay infinitos
primos de la forma 4m + 3. En efecto, si hubiera sólo un número finito,
podríamos tomar el mayor de ellos y llamarlo Pk. Haciendo
N k := 2
2 . 3 . 5· .. Pk - 1
(donde PI = 2, P2 = 3, P3 = 5, " . denota la secuencia de todos los primos),
observamos que N k es congruente con 3 (mod4) y, por tanto, debe tener un
factor primo de la forma 4m + 3. Como dicho factor primo es mayor que Pb
hemos obtenido una contradicción. Al final de este capítulo demostraremos,
que también hay infinitos primos de la forma P = 4m + 1.
Nuestro primer lema es un caso particular de la famosa "ley de reciprocidad":
caracteriza los primos para los cuales -1 es un cuadrado en el cuerpo Zp (del
que se presenta un resumen en el recuadro de la página siguiente).
Lema 1. La ecuación 8 2 == -1 (mod p) tiel!e exactamente dos soluciones
8 E {1, 2, ... , p-1 } para los números primos P = 4m + 1, una solución para
P = 2 Y ninguna solución para los primos de la forma P = 4m + 3 .
• Demostración. Para P = 2 tomamos 8 = 1. Si P es impar, consideramos el
conjunto {1, 2, ... ,p -1} Y construimos la relación de equivalencia generada
al identificar cada elemento con sus inversos aditivo y multiplicativo en Zp.
Por tanto, la clase de equivalencia "genérica" tiene cuatro elementos
{x, -x, x, -x},
ya que este conjunto contiene los inversos de todos sus elementos. No obs-
tante, hay clases de equivalencia con menos elementos si algunos de los miem-
bros son iguales:
1 12 + 02
2 12 + 12
3 ??
4 22 + 02
5 22 + 12
6 ??
7
8
9
10
11
Pierre de Fermat
18
Para p = 11 las clases de equivalencia
son {1, lO}, {2, 9, 6, 5}, {3, 8, 4, 7};
para p = 13 son
{1,12},{2,11,7,6},{3,10,9,4},
{5, 8}: el par {5, 8} proporciona las
dos soluciones de 3 2 == -1 mod 13.
+ O 1 2 3 4
O O 1 2 3 4
1 1 2 3 4 O
2 2 3 4 O 1
3 3 4 O 1 2
4 4 O 1 2 3
O 1 2 3 4
O O O O O O
1 O 1 2 3 4
2 O 2 4 1 3
3 O 3 1 4 2
4 O 4 3 2 1
Suma y multiplicación en :35
Representación de enteros como suma de dos cuadrados
• x == -x es imposible si pes
• x == x es equivalente a X2 == 1. Esta ecuación tiene dos soluciones, x = 1
Y x = P - 1, lo que da lugar a la clase de equivalencia {1, p - 1 }, con dos
elementos.
11 x == -x es equivalente a x2 == -1. Esta ecuación puede no tener solución
o tener dos soluciones distintas, xo, p - xo. En este último caso, la clase
de equivalencia es {xo,p - xo}.
El conjunto {1, 2, ... ,p - 1} tiene p - 1 elementos y lo hemos dividido en
4-uplas (las clases de equivalencia de cardinal 4), más uno o dos pares (las
clases de cardinal 2). Para p - 1 = 4m + 2 existe sólo el par {1, p - 1} Y
el resto son 4-uplas y, por tanto, 8 2 == -1 (mod p) no tiene solución. Para
p - 1 = 4m debe haber un segundo par que contiene las dos soluciones de la
ecuación 8 2 == -1 que estamos buscando. . O
Si p es primo, el conjunto Zp = {O, 1, ... ,p 1} con la suma y mul-
tiplicación definidas "módulo p" es un cuerpo finito. Necesitaremos las
siguientes propiedades:
• Para x E Zp, x =1- 0, el inverso aditivo (que denotaremos -x) es
p - x E {1, 2, ... ,p 1}. Sip > 2, entonces x y -x son elementos
distintos de Zp.
<11 Cada x E Zp \ {O} tiene un único inverso multiplicativo x E Zp \ {O} .
tal que xx == 1 (modp).
De la definición de número primo se deduce que la aplicación Zp ---*
Zp, Z f--+ xz es inyectiva si x =1- O. Por tanto, en el conjunto finito
Zp \ {O} debe ser también sobreyectiva, y para cada x debe existir un
único x =1- O tal que xx == 1 (modp).
<11 Los cuadrados 02 ,12 ,22 , ... ,h2 son elementos de distintos para
h = l~J.
Esto es así porque x2 == y2 (o (x + y) (x - y) == O) implica que x == y
o que x -y. Los 1 + l~J elementos 02 ,12 , ... , h2 se denominan
los cuadrados de Zp.
Mencionemos aquí que para todos los números primos existen soluciones de
X2 + y2 == -1 (modp). De hecho, hay l~J + 1 cuadrados distintos X2 en Zp,
en tanto que hay l~J + 1 elementos distintos de la forma -(1 + y2). Como
Zp tiene p elementos, estos dos conjuntos son demasiado grandes para ser
disjuntos, y deben existir x e y tales que x2 == -(1 + y2) (modp).
Lema 2. Ningún número n = 4m + 3 es suma de dos cuadrados.
111 Demostración. El cuadrado de un número par es (2k)2 = 4k2 == O (mod 4)
y el de un número impar (2k + 1)2 = 4(k2 + k) + 1 == 1 (mod4). Por tanto,
la suma de dos cuadrados es congruente con O, 1 ó 2 (mod4). O
Representación de enteros como suma de dos cuadrados
Ahora que sabemos que los de la fonna p = 4m -1- 3 son " nos
ocuparemos de las "buenas" propiedades de los primos de la fonna
p = 4m -1- 1. Presentamos el resultado clave previo al teorema principal.
Proposición. Todo número primo de la forma p = 4m -1- 1 es suma de dos
cuadrados, es decir, se puede escribir como p = x2 -1- y2 para ciertos números
naturales x, y E N.
Presentaremos dos demostraciones de este resultado, ambas elegantes y sor-
prendentes. En la primera se combinan hábilmente el "principio del palomar"
(que ya hemos empleado "de pasada" antes del Lema 2; en el capítulo 22 se
pueden encontrar más ejemplos), y los argumentos "modulo p". La idea se
debe al matemático noruego, especialista en teoría de números, Axel Thue .
• Demostración. Consideremos los pares (x', y') de enteros que verifica que
O :::;; x', y' :::;; yIP, es decir, x', y' E {O, 1, ... , l ylPJ}. El número total de pares
de este tipo es (l ylPJ -1- 1)2. Utilizando la estimación lx J -1- 1 > x para
x = yIP, vemos que hay más de p tales pares. Por tanto, para cualquier s E Z,
es imposible que todos los valores x' - sy' generados por los pares (x', y')
sean distintos módulo p, de donde se deduce que para cualquier s hay dos
pares distintos
(X',y'), (X",y") E {O,1, ... ,lJPj}2
tales que
x' - sy' =:: x" - sy" (modp).
Restando se tiene que x' - x" =:: S(y' - y") (modp). Si definimos
x := Ix' - x"I, y:= Iy' - y"l,
se deduce que
(x,y) E {O,1,· .. ,lJPj}2 con x=::±sy(modp).
También sabemos que x e y no pueden ser ambos cero, ya que los pares (x', y')
Y (x", y") son distintos.
Sea s una solución de S2 =:: -1 (mod p), cuya existencia está asegurada por el
Lema 1. Como x2 =:: s2y2 =:: _y2 (mod p) hemos construido
(x,y)EZ2 talque O<x2 -1- y2<2p y x2 -1-y2=::O(modp).
Como p es el único número entre O y 2p que es divisible por p, se deduce que
x2 -1- y2 = p, y hemos tenninado. O
La segunda demostración de la proposición - también una demostración de
El Libro - fue encontrada por Roger Heath-Brown en 1971 y publicada tan
solo en 1984. (Don Zagier dio una versión "resumida en una frase".)Es tan
elemental que no necesitaremos utilizar el Lema 1.
El argumento de Heath-Brown utiliza tres involuciones lineales: una que es
bastante obvia, otra oculta y una última, trivial, que pone la guinda al pastel.
La segunda involución, sorprendente, corresponde a una estructura oculta en
el conjunto de soluciones enteras de la ecuación 4xy -1- Z2 = p.
19
Para p = 13, lv'PJ = 3 considera-
mos x', y' E {O, 1, 2, 3}. Para s = 5,
la suma x' - sy' (mod 13) toma los si-
guientes valores:
y'
O 1 2 3 x'
O O 8 3 11
1 1 9 4 12
2 2 10 5 O
3 3 11 6 1
20
T
f
u
~.
Representación de enteros como suma de dos cuadrados
• Demostración. Estudiaremos el conjunto
S := {(X,y,Z) E Z3: 4xY+Z2 =p, x> O, y> O}.
Este conjunto es finito. De hecho, como x ~ 1 e y ~ 1 se deduce que y ~ ~
y x ~ ~. Por tanto, hay un número finito de posibles valores de x e y y, para
cada uno de ellos, hay como mucho dos valores de z.
1. La primera involución lineal viene dada por
f : S ----+ S, (x, y, z) 1--+ (y, x, -z),
es decir, "se permutan x e y, y se cambia el signo a z." Es evidente que esta
transformación envía S sobre sí mismo y que es una involución: aplicada dos
veces, resulta la identidad. Obsérvese que f no tiene puntos fijos, ya que z = O
implicaría que p = 4xy. Además, f envía los puntos de
T:= {(x,y,z)ES:Z>O}
a los puntos de S\T, que satisfacen z < O. Como f cambia los signos de
x - y y de z, manda los puntos de
U := {(X,y,Z)ES:(X-y)+z>O}
a los puntos de S\U. Obsérvese que no pueden existir puntos de S tales que
(x-y)+z = Oyaque,enesecaso,setendríap = 4xY+Z2 = 4xy+(x-y)2 =
(x + y)2.
¿Qué se obtiene del estudio de f? La principal observación es que, como f
envía los conjuntos T y U a sus complementarios, también intercambia los
puntos de T\U con los de U\T. Por tanto, hay el mismo número de puntos
en U que no están en T que puntos en T que no están en U - por tanto, T
y U tienen el mismo cardinal.
2. La segunda transformación que estudiamos es una involución en U:
g: U ----+ U, (x, y, z) 1--+ (x - Y + z, y, 2y - z).
Veamos, en primer lugar, que 9 está bien definida: si (x, y, z) E U, entonces
x - y + z > O, y> O y 4(x - y + z)y + (2y - z)2 = 4xy + i 2, por lo que
g(x, y, z) E S. Como (x - y + z) - y + (2y - z) = x > O se deduce que
g(x, y, z) E U.
Además, 9 es una involución: 9 (x, y, z) = (x - y + z, y, 2y - z) se transforma
en ((x - y + z) - y + (2y - z), y, 2y - (2y - z)) = (x, y, z).
Finalmente, 9 tiene exactamente un punto fijo:
(x,y,z) = g(x,y,z) = (x-y+z,y,2y-z)
se verifica si y sólo si y = z y, en tal caso, p = 4xy + y2 = (4x + y)y, cuya
única solución es y = 1 = z Y x = p~l .
Pero si 9 es una involución en U que tiene exactamente un punto fijo, entonces
el cardinal de U es impar.
Representación de enteros como suma de dos cuadrados
3~ La tercera involución que estudiamos es trivial y consiste en intercambiar
x ey:
h: T ----t T, (x, y, z) 1----+ (y, x, z).
Es evidente que esta aplicación está bien definida y que es una involución.
Ahora combinamos los hechos deducidos de las otras dos involuciones: el
cardinal de T es igual al cardinal de U, que es impar. Pero si h es una involu-
ción en un conjunto finito de cardinal impar, entonces tiene algún punto fijo:
existe un punto (x, y, z) E T tal que x = y, es decir, una solución de
o
Obsérvese que esta demostración dice más - el número de representaciones
de p de la formap = X2 + (2y)2 es impar para todos los números primos de
la forma p = 4m + 1. (De hecho, la representación es única, véase [3].) Ob-
sérvese también que ninguna de las demostraciones es constructiva: ¡intente
encontrar x e y para un número primo de diez dígitos! En [1] y [7] se estu-
dian formas eficientes de encontrar tales representaciones como suma de dos
cuadrados.
El siguiente teorema responde de forma definitiva a la pregunta con la que
comenzó este capítulo.
Teorema. Un número natural n se puede representar como suma de dos
cuadrados si y sólo si todos los factores primos de la forma p = 4m + 3
aparecen con exponente par en la factorización de n .
• Demostración. Diremos que un número n es representable si es la suma
de dos cuadrados, es decir, si n = x2 + y2 para ciertos x, y E No. El teorema
es una consecuencia de los cinco hechos siguientes.
(1) 1 = 12 + 02 Y 2 = 12 + 12 son representables. Todo número primo de la
forma p = 4m + 1 es representable.
(2) El producto de dos números representables nI = xi + YI y n2 = x~ + y~
es representable: nln2 = (XIX2 + YlY2)2 + (XIY2 - x2Yd 2.
(3) Si n es representable, n = x2 +y2, entonces nz2 también es representable,
ya que nz2 = (XZ)2 + (yz)2.
Los hechos (1), (2) Y (3) proporcionan la parte "si" del teorema.
(4) Si p = 4m + 3 es un primo divisor de un número representable
n = X2 + y2, entonces p es divisor de x y de y, por lo que p2 es divi-
sor de n. De hecho, si x =t O (mod p), existiría x tal que xx == 1 (mod p),
y multiplicando la ecuación X2 + y2 == O por x2 obtendríamos la relación
1 + y2J;2 = 1 + (xy)2 == O (modp), lo que es imposible según el Lema 1
ya que p = 4m + 3.
(5) Si n es representable y p = 4m + 3 es un divisor de n, entonces p2 es
divisor de n y n/p2 es representable. Esto se deduce de (4) y completa la
demostración. O
21
En un conjunto finito de cardinal impar
toda involución tiene al menos un punto
fijo.
22 Representación de enteros como suma de dos cuadrados
Como veamos que existen infinitos números de la forma
P = 4m + 1. Para ello, supongamos que hay un número finito y denotemos
por Pk al mayor de ellos. Consideremos
que es congruente con 1 (mod4). Todos sus factores primos son mayores
que Pk y, según el hecho (4) de la demostración precedente, no tiene factores
primos de la forma 4m + 3. Por tanto, M k tiene un factor primo de la forma
4m + 1 que es mayor que Pk.
Concluimos con dos observaciones:
11' Si a y b son dos números naturales que son primos entre sí, entonces hay
infinitos números primos de la forma am+b Cm E N) - este es un famoso
(y difícil) teorema de Dirichlet. De forma más precisa, se puede demostrar
que la cantidad de números primos P :S x de la forma P = am + b viene
dada de forma muy aproximada si x es grande por la función 'Pea) lo~ x,
donde cp(a) denota el número de primos relativos con a que son menores
que a. (Esto es una mejora sustancial del teorema de los números primos,
que tratamos en la página 10.)
11' Esto quiere decir que los números primos para a fijo y b variable aparecen
esencialmente en igual cantidad. Sin embargo, por ejemplo para a = 4, se
puede observar una sutil, pero perceptible y persistente tendencia a "más"
primos de la forma 4m + 3: si observamos un valor de x grande al azar, es
probable que haya más primos P :S x de la forma P = 4m + 3 que de la
forma P = 4m + l. Este efecto se conoce como "desviación de Chebyshev";
véase Riesel [4] y Rubinstein y Sarnak [5].
[1] F. W. CLARKE, W. N. EVERITT, L. L. LITTLEJOHN & S. J. R. VORSTER: H. J.
S. Smith and the Fennat Two Squares Theorem, Amer. Math. Month1y 106 (1999),
652-665.
[2] D. R. HEATH-BROWN: Fermat's two squares theorem, Invariant (1984),2-5.
[3] I. NrvEN & H. S. ZUCKERMAN: An Introduction to the Theory ofNumbers, Fifth
edition, Wiley, New York 1972.
[4] H. RIESEL: Prime Numbers and Computer Methods for Factorization, Second
edition, Progress in Mathematics 126, Birkhauser, Boston MA 1994.
[5] M. RUBINSTEIN & P. SARNAK: Chebyshev's bias, Experimental Mathematics 3
(1994), 173-197.
[6] A. THUE: Et par antydninger til en taltheoretisk metode, Kra, Vidensk. Selsk.
Forh. 7 (1902), 57-75.
[7] S. WAGON: Editor's comer: The Euclidean algorithm strikes again, Amer. Math.
Monthly 97 (1990), 125-129.
[8] D. ZAGIER: A one-sentence proofthat every prime p == 1 (mod4) is a sum oftwo
squares, Amer. Math. Monthly 97 (1990), 144.
Los anillos son estructuras importantes en el álgebra moderna. Si un anillo R
tiene elemento neutro para la multiplicación y cualquierelemento distinto de
cero tiene inverso para la multiplicación, entonces R es un anillo de división.
Así pues, todo lo que le falta a R para ser un cuerpo es la conmutatividad
de la multiplicacion. El ejemplo mejor conocido de un anillo de división no
conmutativo es el de los cuaterniones, descubierto por Hamilton. Pero, tal
y como dice el título del capítulo, cualquier anillo de este tipo ha de ser ne-
cesariamente infinito. Si R es finito, entonces los axiomas fuerzan a que la
multiplicación sea conmutativa.
Este resultado, ya un clásico, ha cautivado la imaginación de muchos mate-
máticos porque, como escribe Herstein, "es una inesperada interrelación entre
dos cosas aparentemente no relacionadas como son el número de elementos
en un sistema algebraico determinado y la multiplicación en ese sistema."
Teorema. Cualquier anillo de división R es conmutativo.
Este bonito teorema, habitualmente atribuido a MacLagan Wedderburn, ha
sido probado de diferentes maneras, utilizando una gran variedad de ideas. El
mismo Wedderburn dio tres demostraciones en 1905, y Leonard E. Dickson
dio otra en el mismo año. Emil Artin, Hans Zassenhaus, Nicolas Bourbaki,
y muchos otros encontraron posteriormente nuevas demostraciones. Una de
ellas destaca por su simplicidad y elegancia. Fue hecha pública por Ernst Witt
en 1931 y combina dos ideas elementales que conducen a un glorioso final.
• Demostración..
Nuestro primer ingrediente está tomado de una combinación de álgebra lineal
y teoría de grupos básica. Para un elemento arbitrario s E R, sea Cs el con-
junto {x E R : xs = sx} de elementos que conmutan con s; Cs se llama el
centralizador de s. Claramente, Cs contiene al O y all, y es un subanillo de
división de R.
El centro Z es el conjunto de elementos que conmutan con todos los elemen-
tos de R, esto es, Z = nsER Cs. En particular, todos los elementos de Z
commutan, O yI están en Z, y por tanto Z es un cuerpo finito. Sea IZI = q.
(Se puede demostrar que q debe ser una potencia de un número primo.)
Podemos considerar R y Cs como espacios vectoriales sobre el cuerpo Z y de-
ducir que IRI = qn, donde n es la dimensión del espacio vectorial R sobre Z,
y de manera similar ICsl = qns para enteros apropiados ns :::: 1.
Ahora, suponemos que R no es un cuerpo. Esto significa que para algún s E R
el centralizador Cs no es todo R, o lo que es lo mismo, ns < n.
EmstWitt
24 Cualquier anillo de división finito es un cuerpo
En el conjunto R* := R\ {O} consideramos la relación
:~ r ' = x-1rx para algún x E R*.
Es fácil comprobar que ~ es una relación de equivalencia. Sea
la clase de equivalencia que contiene a 8. Nótese que se cumple lAs 1 = 1
precisamente cuando 8 está en el centro Z. Así, por nuestra suposición, existen
clases As con 1 2: 2. Consideramos ahora para 8 E R* la aplicación
f8 : x f---+ X- 18X de R* en As. Para x, y E R* tenemos
X- 18X = y-1 8y ~ (YX- 1)8 = s(yx-1)
~ yx- 1 EO; ~ yEO;x,
donde hemos definido O; := Os \{O}, y O;x {zx: Z E O;} tiene car-
dinal 10; l. De aquí, cualquier elemento x-1 sx es la imagen de precisamente
10; 1 = qns - 1 elementos en R* bajo la aplicación f8, y deducimos que
1 R* 1 = 1 As 110; l· En particular, nótese que
IR*I n 1
q = lAs 1 es un entero para todo s. 10;1 qns - 1
Sabemos que las clases de equivalencia son una partición de R*. Ahora agru-
pamos los elementos del centro Z* y denotamos por Al, ... , At las clases de
equivalencia que contienen más de un elemento. Por nuestra suposición, sabe-
mos que t 2: 1. Como IR* 1 = IZ* 1 + ¿;~=1 IAk 1, hemos probado la llamada
fórmula de clases
t n 1
n ¿ q -q -1 = q-l+
nk -1'
k=l q
n 1
donde tenemos 1 < qªn. k --1 E N para todo k.
(1)
Con (1) hemos dejado el álgebra abstracta y vuelto a los números naturales.
Ahora veremos que qnk -1 1 qn -1 implica que nk 1 n. De hecho, si escribimos
n = ank + r con O :s; r < nk, entonces qnk - 11 qank+r - 1 implica
y por tanto qnk - 11 q(a-1)nk+T - 1, ya que qnk y qnk - 1 son primos .entre
sí. Continuando de esta manera se tiene qnk - 11 qT - 1 con O :s; r < nk, que
sólo es posible para r = O, esto es, nk 1 n. En resumen, nótese que
nk 1 n para todo k. (2)
Ahora viene el segundo ingrediente: los números complejos C. Consideramos
el polinomio xn - 1. Sus raíces en C son las raíces n-ésimas de la unidad.
Como An = 1, todas estas raíces A tienen IAI = 1, Y por lo tanto son puntos
de la circunferencia unidad en el plano complejo. De hecho, son precisamente
los números Ak = e
2
';.,"i = cos(2k1r/n) + isen(2k7r/n), O < k < n 1
Cualquier anillo de división finito es un cuerpo
el recuadro en esta de las raíces A satisfacen A d = 1
para d < n; por ejemplo, la raíz A = -1 satisface A2 = 1. Para una raíz A,
sea d el exponente positivo más pequeño con A d = 1, esto es, d es el orden
de A en el grupo .de las raíces de la unidad. Entonces d I n, por el teorema de
Lagrange ("el orden de cualquier elémento de un grupo divide al orden del
grupo" - véase el recuadro en el capítulo 1). Existen raíces de orden n, tales
como Al = e 2~i .
Cualquier número "nrnr\lp,
como
z = x + iy puede escribirse en forma
z rép = r(cosso + i sen SO),
donde r = I z I = .J X2 + y2 es la distancia de z al origen y SO es el
ángulo medido en sentido positivo desde el eje de abscisas. Las raíces
n-ésimas de la unidad son de la forma
Ak = e2 k;;i = cos(2k1f/n) + isen(2k1r/n), o:::; k:::; n -1,
ya que para todo k
Ah = e2k'lCi = cos(2k1r) + isen(2k1f) = 1.
Obtenemos estas raíces geométricamente al inscribir un n-ágono regular
en la circunferencia unidad. Nótese que Ak (k para todo k, donde
( = e 2~i. Por tanto, las raíces n-ésimas de la unidad forman un grupo
cíclico {(, (2, ... ,(n-l, (n = 1} de orden n.
Ahora agrupamos todas las raíces de orden d y ponemos
TI (X-A).
A de orden d
Nótese que la definición de ePd (x) es independiente de n. Puesto que cualquier
raíz tiene algún orden d, concluimos que
(3)
dln
Aquí viene la observación crucial: los coeficientes de los polinomios ePn (x)
son enteros (esto es, ePn(X) E Z[x] para todo n) y además el término indepen-
diente es o bien 1 ó -1.
Verifiquemos con cuidado esta afirmación. Para n = 1 tenemos 1 como única
raíz, y por tanto ePI (x) = x -1. Ahora procedemos por inducción, suponiendo
que ePd(X) E Z[x] para todo d < n, y que el término independiente de ePd(X)
es 1 ó -1. Por (3),
(4)
e n-e
dondep(x)= ¿PjXj , ePn(x) = ¿akxk, conpo=1opo=-1.
j=O k=O
25
x = reos SO
-1
Raíces de la unidad para n = 6
26
Iq - ¡.ti > Iq - 11
Cualquier anillo de división finito es un cuerpo
Puesto que -1 = poao, vemos que ao E {1, -1}. Supongamos que ya sabe-
mos que ao, al, ... , ak-1 E Z. Calculando el coeficiente de Xk a ambos lados
de (4) obtenemos
k k
2:.Pj ak-j 2:.Pjak-j + POak E Z.
j=o j=l
Por hipótesis, todos los ao, ... ,ak-1 (y todos los Pj) están en Z. Por tanto
POak es entero, y en consecuencia ak también, ya que Po es 1 ó -l.
Ahora ya estamos listos para el golpe de gracia. Sea nk 1 n uno de los números
que aparecen en (1). Entonces
rr
di n di n, dfnk, d#n
Concluimos que en Z tenemos las relaciones de divisibilidad
qn -1
cfJn (q) I qnk _ 1 . (5) y
Ya que (5) se verifica para todo k, deducimos de la fórmula de clases (1) que
pero esto no puede ser. ¿Por qué? Sabemos que cfJn(x) = IJ(x - A) donde A
recorre todas las raíces de xn - 1 que tienen orden 3. Sea A = a + ib una de
esas raíces. Como n > 1 (ya que R ::J Z) tenemos A ::J 1, lo cual implica que
la parte real a es menor que 1. Ahora 1>:1 2 = a 2 + b2 = 1, Y de aquí
Iq - a - ibl 2 = (q - a)2 + b2
q2 _ 2aq + a2 + b2 = q2 - 2aq + 1
> (porque a < 1)
y también Iq - >:1 > q - 1 se verifica para todas las raÍCes de orden n. Esto
implica
A
lo cual significa que cfJn(q) no puede ser un divisor de q - 1, que es una con-
tradicción y pone fin a la demostración. O
[1] L. E. DrCKSON: Onfinite algebras, Nachrichten der Alead. Wissenschaften Got-
tingen Math.-Phys. Klasse (1905),1-36; Collected Mathematica1 Papers Vol. III,
Che1sea Publ. Comp, The Bronx, NY 1975, 539-574.
[2] J. H. M. WEDDERBURN: A theorem onfinite algebras, Trans. Amer. Math. Soco
6 (1905), 349-352.
[3] E. WITT: Über die Kommutativitiit endlicher Schiefkorper, Abh. Math. Sem. Univ.
Hamburg 8 (1931), 413.
"Jr es irracional"
Este resultado se remonta a Aristóteles, quien supuestamente afirmó que el
diámetro y la longitud de una circunferencia no son conmensurables. La pri-
mera demostración de este hecho fundamental fue dada por Johann Heinrich
Lambert en 1766. La demostración de El Libro que presentamos se debe a
Ivan Niven y data de 1947: es un argumento muy elegante de una sola página
que únicamente hace uso de cálculo elemental. Su idea es potente y puede
ser utilizada para obtener más resultados, como muestran los resultados de
Iwamoto y Koksma, respectivamente:
Jr2 es irracional y
El eT es irracio.nal si r i=- O es racio.nal.
El método. de Niven tiene alguno.s precedentes: se puede seguir su rastro hasta
el artículo. clásico. de Charles Herrnite de 1873, do.nde se demo.stró po.r primera
vez que e es trascendente, es decir, que e no. es raíz de ningún po.lino.mio. co.n
co.eficientes racio.nales.
Antes de estudiar Jr no.s o.cuparemos de e y sus po.tencias, y demo.straremo.s
que so.n irracio.nales. Esto. es mucho. más sencillo., y además nos permitirá
respetar el orden histórico de o.btención de lo.s resultados.
Para co.menzar, es bastante sencillo. ver, al igual que hizo Fo.urier en 1815, que
e = "2::\>0 tr es irracional. De hecho, si se tuviera e = T; para ciertos enteros
a y b > 0, ento.nces se o.btendría
n!be = n!a
para todo n 2: O. Pero esto. no puede ser cierto, ya que la parte derecha de la
igualdad es un entero, en tanto que la parte izquierda, con
se descompo.ne en una parte entera
I( 1 1 1) bn. 1 + I + I + ... + I 1. 2. n.
y una segunda parte
(
1 1 1 )
b n+l + (n+l)(n+2) + (n+l)(n+2)(n+3) + .,.
Charles Hermite
e .- 1 + t + ~ + i + :h + ...
2.718281828 ...
28
Serie gec)m,etrlca
Para la serie geométrica infinita
Q=i+ +q\+'"
con q > 1 se tiene que
qQ = 1 + i + q\ + ... = 1 + Q
y, por tanto,
1
Q
q-l
1,92. JOURNAL DE MATHÉMATIQUES
SUR L'lRRATIONNALlTÉ DU NOMBRE
PAn J. LIOUVILLE.
On prouve dans les éléments que le nombre e J base des logarithmes
népériens, n'a pas une valenr rationnelle, Gn de'Tait, ce me semble,
ajouter que la melle m~thode pro uve aussi que e ue peut pas etre ra-
cine d'une équation du second degré a coefficients rationne1s, en sarte
que l'on ne peutpas avoir ae+ ~ = e, a étantun entier positifetb, e,
des entiers positifs DU négatifs. En effet, si l'on remplace dans eette
équation e et :; DU e-1 par le~rs développements deduits de celui dee",
puia qu' on multiplie les deux membres par J. 2..3. , . n, 00 trouvera
aisément
"~, (,+"~,+ ... )± ".!-,(' ,-"~, +.)=!"
¡.t étant un entier. 00 peut toujours faire en 50rte que le facteur
+~ -"+1
soit positif¡ i1 suffil'ade supposer npairsi b est <o etn impail' si b est
>0 ¡ en pl'enant de plus n tres grand) J'équation que nous venoos
d'écril'e conduira des lol's a une absurdité; cal' son pl'emier membre
étant essentiellement positif et tres petit, sera compris entre o et r,
.et ne pourra pas étre égal a un entiel' 0. Done, etc.
Artículo de Liouville
Algunos números irracionales
que es aproximadamente ~ y, por tanto, para n grande no puede ser entero: es
mayor que n! 1 y menor que ~, según se puede comprobar comparando con
la serie geométrica:
1 -- <
n+1
<
111
--+ + + ...
n+1 (n+1)(n+2) "(n+1)(n+2)(n+3)
1 1 1 1
n+1+(n+1)2+(n+1)3+'" =;;;,'
En este punto el lector se habrá dado cuenta de que este simple truco de "mul-
tiplicar por n!" no es suficiente para demostrar que e2 es irracional. Este úl-
timo resultado es más fuerte: V2 es un ejemplo de un número irracional cuyo
cuadrado es racional.
John Cosgrave observó que con dos bellas observaciones (nosotros las llama-
remos "trucos") se puede llegar dos pasos más allá: cada uno de los trucos
es suficiente para demostrar que e2 es irracional, y la combinación de los dos
permite demostrar que é también es irracional. El primer truco se puede en-
contrar en un artículo de una página de J. Liouville de 1840 - Y el segundo
en una adenda de dos páginas que Liouville publicó a continuación.
¿Por qué es irracional e2 ? ¿Qué se puede deducir de e2 = %? Según Liouville,
deberíamos escribir esta igualdad como
be = ae-1 ,
sustituir las series
e
y
ya continuación multiplicar por ni, para algún número par n suficientemente
grande. Entonces se tiene que n!be es casi un entero:
(
1 1 1 1) n!b 1 + - + - + - + ... + -,
1 2 6 n.
es un entero, y el resto
es aproximadamente ~, ya que es mayor que n!l pero menor que ~, como
hemos visto anteriormente.
Al mismo tiempo, n!ae- 1 es también casi entero: de nuevo, obtenemos una
parte entera grande, y un resto
( )n+l, (1 1 1 ) -1 n.a (n+l)!-(n+2)!+(n+3)!:::¡:""
Algunos números irracionales
que es (_l)n+l~. De manera más para un número
par 71 el resto es mayor que - ~, pero menor que
_a(_l __ e 1 _ 1 _ ) ___ a_ (1-~) < O.
71+1 (71+1.)2 (71+1)3 oo' - 71+1 71
Esto es imposible, ya que para un número par 71 suficientemente grande se
tendría que n!ae-1 es un poco menor que un entero, mientras que n!be es
un poco mayor que un entero y, en consecuencia, no se puede cumplir que
n!ae- 1 = n!be. O
Para demostrar que é es irracional, nos armamos de valor para suponer que
é = ~ es racional, y escribimos esta igualdad así:
be2 = ae- 2 .
Podríamos intentar multiplicar por n! para algún 71 grande y agrupar los su-
mandos no enteros, pero esta idea no produce ningún resultado útil: la suma
de los restantes términos sería b2n:
1
para el lado izquierdo y (_1)n+la
2n
:
1
para el lado derecho, y ambos serían grandes si 71 se hace grande.
Por tanto, es preciso estudiar la situación cuidadosamente y realizar dos pe-
queños retoques en la estrategia: en primer lugar, no tomaremos un 71 grande
arbitrario, sino una potencia de dos grande, 71 = 2m ; en segundo lugar, no
multiplicaremos por ni, sino por 2:~1' Necesitamos ahora un pequeño lema,
un caso especial del teorema de Legendre (véase la página 8): para cualquier
entero 71 2: 1, n! contiene el factor primo 2 como mucho 71 - 1 veces - la
igualdad se da si (y sólo si) 71 es potencia de dos, 71 = 2m .
Este lema no es nada difícil de demostrar: L ~ J de los factores de ni son pares,
L :¡ J de ellos son divisibles por 4, y así sucesivamente. Por tanto, si 2k es la
mayor potencia de dos que satisface 2k :::: 71, entonces n! contiene el factor
primo 2 exactamente
l~J+l¡J+ ... +l;J < ~+¡+ ... +; = n(1-21k):::: 71-1
veces, donde las dos desigualdades se convierten en igualdades sólo cuando
71 = 2k .
Volvamos a be2 = ae-2 . Estamos estudiando
y sustituimos las series
y
b
n! 2 --e 2n - 1
n! -2 a--e 2n - 1
248 1+-+-+-+ 126 2
r +,+ ... r.
Para r :::: 71 obtenemos sumandos enteros en ambos lados, a saber
(1)
29
30
La estimación n! > e ( :;;- ) n nos da,
de forma explícita, un n que es "sufi-
cientemente grande."
Algunos números irracionales
donde para r > O el denominador r! contiene el factor 2 como mucho
r - 1 veces, en tanto que n! lo contiene exactamente n - 1 veces. (Por tanto,
para r > O los sumandos son pares.)
Como n es par (hemos tomado n
r 2: n + 1 son
2m ), las series que obtenemos para
(
2 4 8 )
2b n+1 + (n+1)(n+2) + (n+1)(n+2)(n+3) + ...
y
(
2 4 8 )
2a - n+1 + (n+l)(n+2) - (n+1)(n+2)(n+3) ± ....
Si n es grande, estas series suman, aproximadamente, ~ y - ~ , respectiva-
mente, como se puede comprobar comparando con la serie geométrica. Para
n = 2m grande, esto quiere decir que el término de la izquierda de (1) es un
poco mayor que un entero, en tanto que el término de la derecha es un poco
menor - y esta es la contradicción buscada. D
Hemos demostrado que é es irracional. Para demostrar queé, é etc. tam-
bién son irracionales necesitamos herramientas más potentes (en concreto, un
poco más de cálculo infinitesimal) y una nueva idea - originalmente debida
a Charles Hermite, cuya esencia está contenida en este sencillo lema.
Lema. Sea n 2: 1 fijo y consideremos
2n
(i) Lafunción f(x) es un polinomio de laforma f(x) = ~ :~=>ixi,
n ..
donde los coeficientes Ci son enteros. 2=n
(ii) Para O < x < 1 se tiene que 0< f(x) < ~. n.
(iii) Las derivadas f(k)(O) y f(k)(l) son enteros para todo k 2: O .
• Demostración. Las partes (i) y (ii) son evidentes.
Para demostrar (iii), obsérvese que, según (i), la k-ésima derivada f(k) se anula
en x = O excepto si n ::; k ::; 2n y, para estos valores de k, f(k) (O) = ~Ck es
un entero. Def(x) = f(l-x) se deduce que f(k)(x) = (-l)kf(k)(1-x)
para todo x y, por tanto, f(k) (1) = (-l)k f(k) (O), que es un entero. D
Teorema 1. eT es irracional para todo r E Q\ {O}.
• Demostración. Es suficiente demostrar que eS no puede ser racional para
ningún número natural s (si et fuera racional, entonces (et) t = eS también
lo sería). Supongamos que eS = % para ciertos enteros a, b > O, Y sea n lo
suficientemente grande como para que n! > as2n+1 . Sea
donde f (x) es la función del lema anterior.
Algunos números irracionales
F(x) se escribir también como una suma infinita
F(x) =. s2n f(x) - s2n-l j'(x) + s2n-2 f"(x):::¡= ... ,
ya que las derivadas f(k) (x) se anulan para k > 2n. De aquí se deduce que el
polinomio F (x) satisface la ecuación
F'(x) = -3 F(x) + s2n+l f(x).
Utilizando esta igualdad se obtiene que
d
- [e SX F(x)] = sesx F(x) + eSx F'(x)
dx
y por tanto,
N := b !al s2n+lesx f(x)dx = b [e SX F(x)]~ = aF(l) - bF(O).
Esta expresión es un entero, ya que la parte (iii) del lema asegura que F(O)
y F(l) son enteros. Sin embargo, la parte (ii) del lema proporciona cotas
superiores e inferiores para N,
11 1 as
2n+l
O < N = b s2n+l esx f(x)dx < bs2n+l es _ = --- < 1,
o n! n!
lo que demuestra que N no puede ser un entero, y he aquí la contradic-
ción. D
Como hemos utilizado este truco con éxito, lo ponemos en práctica una vez
más.
Teorema 2. 7f2 es irracional .
• Demostración. Supongamos que 7f2 = % para ciertos enteros a, b > O.
Consideremos el polinomio
F(x) := bn (7f2n f(x) - 7f2n-2 f(2) (x) + 7f2n-4 f(4) (x) :::¡= . " ),
que verifica la ecuación FI! (x) = _7f2 F(x) + bn7f2n+2 f(x).
De la parte (iii) del lema se obtiene que F(O) y F(l) son enteros. Derivando
obtenemos que
d
dx [F'(x) sen 7fX - 7fF(x) COS7fx]
y, por tanto,
N := 7f !al an f(x) sen 7fX dx
(FI! (x) + 7f2 F (x) ) sen 7fX
bn7f2n+2 f(x) sen 7fX
7f2an f(x) sen 7fX,
[~F'(x) sen7fx - F(x) COS7fx]:
F(O) + F(l),
que es un entero. Además, N es positivo ya que está definido como la
31
1[' no es racional, pero tiene "buenas
aproximaciones" por números raciona-
les - algunas de ellas son conocidas
desde la antigüedad:
~ 3.142857142857 .. .
i{~ 3.141592920353 .. .
104348
33215
1['
3.141592653921.. .
3.141592653589 ...
32 Algunos números irracionales
integral de una función positiva (excepto en los extremos). Sin embargo, si
escogemos n suficientemente grande para que 7ral
n
< 1, de la parte (ii) del n.
lema se deduce que
o < N = 7r 11 an f(x)sen7rxdx < < 1,
lo cual es una contradicción. D
Finalmente presentamos nuestro último resultado sobre números irracionales.
Teorema 3. Para todo entero impar n 2: 3, el número
A(n) := ~ arccos ()n)
es irracional.
Necesitaremos este resultado para el tercer problema de Hilbert (véase el ca-
pítulo 8) en los casos n = 3 Y n = 9. Para n = 2 Y n = 4 se tiene que
A(2) = ~ y A(4) = !, lo que demuestra que la restricción a valores impares
de n es esencial. Es sencillo ver que la afirmación "~ arccos (Jn) es irra-
cional" es equivalente, en la figura del margen, a que la poligonal construida
1 a partir de Jn y tal que todos sus lados tienen la misma longitud, nunca se
cierra.
Proponemos como ejercicio para el lector demostrar que A( n) es racional
solamente para n E {1, 2, 4}. Como indicación, distínganse los casos en que
n = 2T del resto.
11 Demostración. Utilizamos la identidad trigonométrica
cos CIé + cos (3 = 2 cos a!i3 cos a;i3
que, para CIé = (k + l)ep Y (3 = (k - l)ep, nos proporciona la expresión
cos (k + l)ep = 2 cos ep cos kep - cos (k - l)ep. (2)
Para el ángulo epn = arce os (Jn), definido por cos epn = Jn y O ::; epn ::; 7r,
obtenemos una representación de la forma
donde Ak es un entero no divisible por n, para todo k 2: O. De hecho, dicha
representación para k = 0,1 se tiene con Ao = Al = 1 y, por inducción sobre
k y utilizando (2), obtenemos que para k 2: 1
De esta expresión se deduce que A k+1 = 2Ak - nAk-1. Si n 2: 3 es impar y
Ak no es divisible por n, entonces Ak+1 tampoco puede ser divisible por n.
Algunos números irracionales
U¡'_H--'u¡o;aULVC> ahora que
A(n) =
k
g
es racional (donde k,.€ > O son enteros). Haciendo .€'Pn = br se obtiene que
AR
±1 = cos br = --r
,¡n
R Por tanto,,¡n = ±AR es un entero, con.€ ~ 2, de donde se deduce que
n I ,¡nR. Como ,¡nR I AR se deduce que n es un divisor de AR, Y hemos llegado
a una contradicción. O
[1) C. HERMITE: Sur lafonction exponentielle, Comptes rendus de l'Académie des
Sciences (Paris) 77 (1873), 18-24; CEuvres de Charles Hermite, Vol. rn, Gauthier-
Villars, Paris 1912, pp. 150-181.
[2) Y. IWAMOTO: A proof that -¡¡-2 is irrational, J. Osaka Institute of Science and
Technology 1 (1949),147-148.
[3) J. F. KOKSMA: On Niven's proof that -¡¡- is irrational, Nieuw Archief voor Wis-
kunde (2) 23 (1949), 39.
[4) J. LIOUVILLE: Sur l'irrationalité du nombre e = 2,718 ... , Joumal de Mathé-
matiques Pures et Appl. (1) 5 (1840), 192; Addition, 193-194.
[5) I. NIVEN: A simple proof that -¡¡- is irrational, Bulletin Amer. Math. Soco 53
(1947),509.
33
/
Sabemos que la serie infinita ¿n>l ~ no converge. Es más, en el capítulo 1
hemos visto que incluso la serie I:PElP' ~ diverge.
Sin embargo, la suma de los recíprocos de los números cuadrados converge
(muy despacio, como veremos) a un valor interesante.
La serie de Euler.
Esto es un resultado clásico, conocido e importante, que demostró Leonhard
Euler en 1734. Una de sus interpretaciones clave es que proporciona el primer
valor no trivial ((2) de la función zeta de Riemann (ver el apéndice en la
página 41). Como vimos en el capítulo 6, este valor es irracional.
Este resultado comparte su lugar tan destacado en la historia de la matemáti-
cas con algunas demostraciones muy elegantes que se dieron de él. En algunos
casos la alegría del hallazgo fue compartida por muchos matemáticos. Presen-
taremos a continuación tres de estas demostraciones.
• Demostración. La primera demostración aparece como ejercicio en e11i-
bro de teoría de números de William 1. LeVeque del año 1956. Pero él mismo
afirma: "No tengo la menor idea del origen de este problema, pero estoy bas-
tante convencido de que no lo encontré yo."
La prueba consiste en evaluar de dos maneras diferentes la integral doble
1 1
1 := JJ_1-dXdY. 1- xy
o o
Para la primera, desarrollamos l!XY como serie geométrica, descomponemos
los sumandos como productos, e integramos:
1 1 1 1
1 J J2~)xytdXdY = L J J xnyndxdy
o o n~O n~Oo o
1.000000
1.250000
1.361111
1.423611
1.463611
1.491388
1.644934.
36
1
"2
1
v
x
u
1
Tres veces ]f2 /6
Esta evaluación también demuestra que esta integral doble (de una función
positiva con un polo en x = y = 1) es finita. Asimismo, nótese que el
cómputo se puede efectuar al revés, de manera que la evaluación de ((2) lleva
a la integral doble J.
Le segunda manera de evaluar J parte de un cambio de coordenadas: En las
coordenadas nuevas u := ytx y v := y;x el dominio de integración es un
cuadrado de arista ~ y2, que se obtiene a partir del dominio antiguo primero
rotando 45° y después reduciendo según el factor de escala de y2. Sustitu-
yendo x = u - v e y = u+ v nos da
1
1- xy
1
1- u 2 + v2 '
Para transformar la integral tenemos que reemplazar dx dy por 2 du dv, para
compensar el hecho de que nuestra transformación de coordenadas reduce el
área según el factor constante 2 (el jacobiano de la transformación; véase el
recuadro en la página siguiente). Tanto el nuevo dominio de integración como
la función a integrar son simétricos respecto del eje u, por tanto sólo nos hace
falta calcular la integral sobre la mitad superior del nuevo dominio, y tener en
cuenta un factor adicional de 2. Descomponemos esta integral en dos partes
de manera más natural:
J dv )d 1- u2 + v2 u.
J dx 1 x Usando 2 2 = - aretan - + e, obtenemos a +x a a
1/2
J 4 J ~ aretan (~) du 1- u2 1- u2
o
+ 4J1 ~arctan(~)du.
1- u2 1- u2
1/2
Podríamos evaluar estas integrales sustituyendo u = sen e y u = cos e,
respectivamente. Pero procederemos de manera más directa, usando que la
derivada de g(u) := aretan C/1~u2) es g'(u) = v'1~u2' y que la derivada de
h( u) := arctan (v'~-=-:2) = aretan (Vi+~) es h' (u) = - ~ v'1~u2' De la
relación J: f'(x)f(x)dx = [~f(x)2l~ = V(b)2 - V(a)2 resulta
J 4 r1 / 2 g'(u)g(u) du + 41,1 -2h'(u)h(u) du
Jo 1/2
2[9(u)2]:/2 - 4[h(u)2]:/2
2g(~)2 _ 2g(0)2 - 4h(1)2 + 4h(~)2
2(~)2_0_0+4(~)2 = 7[62 • O
Tres veces 1T 2 /6
En esta demostración hemos calculado el valor de la serie de Euler a de
una integral, usando un sencillo cambio de coordenadas. Una demostración
ingeniosa de este tipo, pero con un cambio de coordenadas decididamente no
trivial, fue descubierto más tarde por Beukers, Calabi y Kolk. Su punto de
partida es separar la suma ¿n>l ;2 en sus términos pares e impares. Los
términos pares 212 + 12 + l2 +--: .. =¿k2:1 (2k)2 claramente suman ~((2),
1 ' .. 1 1 1 _"\, 1 Y por tanto os termmos Impares ]2 + 32 + 52 + ... - L..-,k2:0 (2k+l)2 suman
las tres cuartas partes de la suma total ((2). Queda por demostrar pues que
1
k2:0 (2k + 1)2 8
11 Demostración. Como antes, podemos expresarlo como una integral doble:
1 1
J = J J 1 _ ~2y2 dx dy = L (2k: 1)2'
o o k2:0
Para calcular esta integral J, Beukers, Calabi y Kolk propusieron pasar a las
coordenadas nuevas
~
-X2
u := arccos 1 2 2
-xy {§/;_Y2 v := arccos 1 2 2' -xy
Para efectar el cálculo, ignoramos la frontera del dominio y consideramos x, y
en los intervalos O < x < 1 Y O < Y < 1. Entonces u, v estarán en el
triángulo u > O, v > O, u + v < 1T /2. Se puede invertir esta transformación
de coordenadas de manera explícita, llegando a la substitución
sen u
x = --
cosv
and
sen v
Y - ---- . cosu
Es fácil comprobar que estas fórmulas definen una transformación biyectiva
entre el interior del cuadrado unidad S = {(x, y) : O :s: x, y :S 1} Y el interior
del tnángulo T = {(u,v) : u,v:::: O, u + v:S: 1T/2}.
Ahora tenemos que calcular el jacobiano de esta transformación, y como por
arte de magia resulta ser
(
cosu
det cosv
sen u sen v
cos2 u
sen u sen v )
cos2 V
cosv
cosu
Pero esto significa que la integral que buscamos se transforma en
7r /2 7r /2-u
J ¡JI dudv,
o o
que es justo el área ~ (~)2 = ~2 del triángulo T. D
La
Para evaluar una integral doble
1 = J f(x,y)dxdy.
s
37
podemos efectuar una sustitución de
variables
x=x(u,v) y=y(u,v),
si la correspondencia de (u, v) E T
a (x, y) E S es biyectiva y derivable
con derivada continua. En este caso,
1 es
J \d(X,y) I f(x( u, v), y( u, v» de u, v) du dv,
T
donde d(x,y) es eIJ'acobiano:
d(u,v)
d(x, y) = det ( ~~
d(u, v) ~;
y
1
S
x
1
v
7r
"2
T
dx ) -
dv
dy .
dv
u
7r
"2
38
Para m = 1,2,3, esto resulta en
cot2 :¡¡: = i
cot2 ~ + cot2 2; = 2
cot2 2': + cot2 271" + cot2 3" = 5
7 7 7
Tres veces 1T2 /6
Maravilloso - y más porque el mismo método se extiende al cálculo de (( 2k )
en términos de una integral 2k-dimensional, para todo k > 1.
Nos referimos al artículo original de Beuker, Calabi y Kolk [2], y al capí-
tulo 20, donde llegaremos a lo mismo por un camino diferente, usando el
truco de Herglotz y la idea original de Euler.
Después de ver estas dos demostraciones via transformadas de coordenadas,
no podemos resistir la tentación de presentar otra, completamente diferente y
elemental, del hecho que Ln>l ';'2 = ~2. Aparece en una secuencia de ejer-
cicios del libro de problemas de los hermanos gemelos Akiva y Isaak Yaglom,
cuyo edición original rusa data de 1954. Algunas versiones de la demostración
original fueron redescubiertas y presentadas por F. Holme (1970), I. Papadi-
mitriou (1973) y Ransford (1982), quien la atribuyó a 10hn Scholes .
• Demostración.. El primer paso consiste en establecer una relación entre
valores de la función "cotangente al cuadrado". Para todo m ~ 1, se tiene
(1)
Para establecer este resultado, empezamos con la relación
cos nx + i sen nx = ( cos x + i sen x) n
y nos fijamos en su parte imaginaria
sennx = (~)senxcosn-lx- (~)sen3xcosn-3x±... (2)
Ahora ponemos n = 2m + 1, mientras que para x consideramos los m valores
diferentes x = 2~~1' para r = 1,2, ... ,m. Para cada uno de estos valores
tenemos nx = r1T, y por tanto sen nx = O, mientras que O < x < ~ implica
que para sen x tenemos m valores positivos diferentes.
En particular, podemos dividir (2) entre senn x, y obtenemos
esto es,
para cada uno de los m valores distintos de x. Del polinomio de grado m
p(t)
conocemos m raíces distintas
ar cot
2 (2~~1) for r = 1,2, ... , m.
Por tanto, el polinomio coincide con
Tres veces 1T2 /6
comp1anmdlo los coeficientes de trn - 1 en p( t) deducimos que la suma
de los raíces es
lo cu",l demuestra
2rn(2rn-1)
6
También necesitamos una segunda identidad del mismo tipo,
2 ( 1[") 2 ( 21[" ) 2 ( rn1[" ) _ 2m(2m+2) ese 2rn+1 + ese 2m+1 + ... + ese 2m+1 - 6 '
para la función cosecante ese x = se~ x. Pero
2 1 eos2 x+sen2x 2
ese x = -- = 2 = eot x + 1,
sen2 x sen x
(3)
y podemos deducir (3) de (1) sumando m a ambos miembros de la ecuación.
Ahora ya tenemos todas las herramientas a mano, y podemos encajar las piezas
de la demostración. Usaremos que para O < Y < "i se cumple
O < sen y < y < tgy,
y por tanto
O < eoty < 1. y < esey,
lo cual implica que
eot2 y < 1 < ese2 y. y2
Ahora aplicamos esta desigualdad doble a cada uno de los m distintos valores
de x, y sumamos los resultados. Empleando (1) para el término a la izquierda
y (3) para el término de la derecha, obtenemos
2m(2m-1)
6
esto es,
1["2 2m 2rn-1 1 1 1
62rn+12rn+1 < 12 + 22 + ... + m 2
2m(2m+2)
6
2
Tanto el término de la derecha como el de la izquierda convergen a ~ para
m --+ 00: final de la demostración. O
¿Cómo de rápido converge ¿ ~2 a 1T2 /6? Para responder a esta pregunta
hemos de estimar la diferencia
6
rn 1
Ln2
n=l
00
1 L 2· n
n=m+1
Comparación de coeficientes:
Si p(t) = c(t - al) ... (t - am ),
entonces el coeficiente de t m - l es
-c(al + ... + a=).
O<a<b<c
implica
0<1.<1.<1.
e b a
39
1
(m+1)2
40
f(t) = :b
t
Tres veces 712 /6
Esto resulta muy fácil mediante la técnica de con una , que
ya hemos visto en el apéndice al capítulo 2 (página 10). Nos da
00 1 100 1 1
"""' < -dt = -
~ n2 m t 2 m
n=m+1
como cota superior y
1 1
00 1
> ?dt =
m+1 t~ m+ 1
como cota inferior para los "sumandos restantes" - o incluso
00 1 100 1 1 - > -dt - --¿ n2 1 t 2 - m + .1
n=m+l m+" 2
si efectuamos la estimación con algo más de cuidado, utilizando el hecho de
que la función f (t) = :b es convexa.
Esto quiere decir que nuestra serie no converge muy rápidamente. Si sumamos
los primeros mil sumandos, esperamos un error en el tercer dígito después de
la coma, y para la suma del primer millón de sumandos (m = 1000000) un
error en el sexto dígito, y efectivamente eso es lo que obtenemos. Pero ahora
viene una gran sorpresa: hasta los primeros 45 dígitos,
1.644934066848226436472415166646025189218949901,
1.644933066848726436305748499979391855885616544.
Efectivamente, el sexto dígito decimal es falso (esuna unidad mayor), pero
¡los seis dígitos siguientes son correctos! Y después hay un dígito equivocado
(es cinco unidades más grande), y luego hay cinco correctos. Este descubri-
miento sorprendente es bastante reciente: lo hizo Roy D. North de Colorado
Springs en 1988. (En 1982, Martin R. Powell, un maestro de Amersham, Bu-
cks (Inglaterra), no llegó a notar todo este efecto por razón de los insuficientes
recursos de cálculo que tenía entonces.) Es demasiado extraño para ser una
coincidencia. .. Fijémonos en el error de la aproximación: hasta los primeros
45 dígitos es
= 0.000000999999500000166666666666633333333333357,
y claramente hay algún patrón. Se puede escribir este número como
+10-6 - ~1O-12 + i lO- 18 - 310 10- 30 + 12 10- 42 + ...
donde los coeficientes (1, ~,i, O, -lo, o, 412) de 1O-6i son el principio de la
sucesión de los números de Bernoulli que volveremos a ver en el capítulo 20.
El lector interesado puede consultar el artículo original de Borwein, Borwein
y Dilcher [3] para más "coincidencias" extrañas - y para demostraciones.
Tres veces ]f2 /6
Lafunción zeta de Riemann (( 8) se define para números reales 8 > 1 mediante
1
((8) := ~-. 6 n s
n2:1
Nuestras estimaciones para Hn (ver página 10) implican que la serie ((1)
diverge, pero ((8) sí converge para cualquier número real 8 > 1. La función
zeta tiene una continuación canónica al todo el plano complejo (con un polo
simple en 8 = 1), que se puede construir mediante expansiones en series de
potencias. La función compleja que resulta es de máxima importancia para la
teoría de los números primos. Mencionaremos tres conexiones:
(1) Euler halló la identidad notable
Codifica el hecho fundamental que cualquier número natural tiene una des-
composición única (!) en factores primos; usando este hecho, la identidad de
Euler es una consecuencia sencilla de la serie geométrica
1 1 1 1
= 1+-+-2-+-3-+", pS P s P s 1- p-s
(2) La ubicación de los ceros complejos de la función zeta de Riemann es
el tema de la "hipótesis de Riemann", una de las conjeturas más famosas e
importantes sin resolver de toda la Matemática. Afirma que todos los ceros no
triviales 8 E re de la función zeta satisfacen Re( 8) = ~. (La función zeta se
anula en todos los enteros negativos, que se llaman los "ceros triviales".)
Muy recientemente, Jeff Lagarias demostró que, de manera bastante sorpren-
dente, la hipótesis de Riemann es equivalente al siguiente enunciado elemen-
tal: Para todo n 2: 1,
L d < Hn + exp(Hn ) 10g(Hn ),
dln
con igualdad sólo para n = 1, donde Hn es como antes el n-ésimo número
harmónico.
(3) Se sabe desde hace mucho que (( 8) es un múltiplo racional de ]fs, y por
tanto irracional, si 8 es un entero par 8 2: 2; ver capítulo 20. En cambio, la
irracionalidad de ((3) fue probada por Roger Apéry sólo en 1979. A pesar de
notables esfuerzos nuestros conocimientos sobre (( 8) para los demás enteros
impares 8 = 2t + 1 2: 5 son bastante incompletos. Muy recientemente,
Keith Ball y Tanguy Rivoal demostraron que hay un número infinito de valores
irracionales de ((2t+ 1). Es más, aunque no se puede afirmar la irracionalidad
de (( 8) para ningún valor impar 8 2: 5 concreto, Wadim Zudilin ha conseguido
demostrar que por lo menos uno de los cuatro valores ((5), ((7), ((9) y ((11)
es irracional. Referimos el lector al bonito artículo de revisión de Fischler [4].
41
42 Tres veces 7f2 /6
[1] K. BALL & T. RIVOAL: ¡rrationalité d'une infinité de valeurs de lafonetion zeta
aux entiers impairs, Inventiones math. 146 (2001),193-207.
[2] F. BEUKERS, J. A. C. KOLK & E. CALABI: Sums ofgeneralized harmonie series
and volumes, Nieuw Archief voor Wiskunde (4) 11 (1993), 217-224.
[3] J. M. BORWEIN, P. B. BORWEIN & K. DILCHER: Pi, Eulernumbers, andasymp-
totie expansions, Amer. Math. Month1y 96 (1989),681-687.
[4] S. FISCHLER: ¡rrationalité de valeurs de zeta (d'apres Apéry, Rivoal, ... ),
Bourbaki Serninar, No. 910, November 2002; to appear in Astérisque; Preprint
arXiv: math. NT /0303066, March 2003, 45 pages.
[5] J. C. LAGARIAS: An elementary problem equivalent to the Riemann hypothesis,
Amer. Math. Monthly 109 (2002), 534-543.
[6] W. J. LEVEQUE: Topies in Number Theory, Vol. I, Addison-Wesley, Reading MA
1956.
[7] A. M. YAGLOM & l. M. YAGLOM: Challenging mathematieal problems with
elementary solutions, Vol. n, Holden-Day, Inc., San Francisco, CA 1967.
[8] W. ZUDILIN: Arithmetic of linear forms involving odd zeta values, Preprint~ Au-
gust 2001,42 pages; arXi v: math. NT /0206176.
a
El tercer problema de Hilbert:
descomposición de poliedros 45
9
Rectas en el plano
y descomposición de grafos 53
10
El problema de la pendiente 59
11
Tres aplicaciones
de la fórmula de.Euler 65
12
El teorema de rigidez
de Cauchy 71
13
Símplices en contacto 75
14
Cualquier conjunto con muchos
puntos tiene un ángulo obtuso 79
15
La conjetura de Borsuk 85
"Los sólidos platónicos,
¡un juego de niños!"
En su famosa conferencia en el Congreso Internacional de Matemáticos en
París en 1900, David Hilbert propuso, como tercero de sus 23 problemas,
encontrar
"dos tetraedros de igual base e igual altura que ser descom-
puestos en tetraedros congruentes, ni tampoco combinados con otros
tetraedros congruentes para formar dos poliedros que a su vez puedan
descomponerse en tetraedros congruentes."
El origen de este problema se remonta a dos cartas de Carl Friedrich Gauss
fechadas en 1844 (publicadas en 1900 en las obras completas de Gauss). Si
dos tetraedos del mismo volumen pudieran ser descompuestos en dos piezas
congruentes, estaríamos ante una demostración "elemental" del teorema XII 5
de Euclides, que afirma que dos pirámides de igual base e igual altura tienen
el mismo volumen. Por lo tanto, proporcionaría una definición elemental del
volumen de un poliedro (que no se basaría en el análisis, y por tanto tampoco
en argumentos de continuidad). Una afirmación similar es cierta en geometría David Hilbert
plana: El teorema de Bolyai-Gerwien [1, Sect 2.7] afirma que dos polígonos
planos cualesquiera son a la vez equidescomponibles (pueden ser descom-
puestos en triángulos congruentes) y equicompletables (pueden convertirse en
congruentes añadiéndoles triángulos congruentes) si y sólo si tienen la misma
área.
La cruz es equicompletable con un cua-
drado de la misma área.
De hecho, son incluso equidescomponibles.
46 El tercer problema de Hilbert: descomposición de poliedros
Como se ver a de su formulación del Hilbert
que no se verificase un teorema análogo en dimensión 3, y estaba en lo cierto.
El problema fue resuelto por su estudiante Max Dehn en dos trabajos. En el
primero, que se publicó en 1902, mostraba tetraedros equidescomponibles de
igual base y altura; sin embargo, los trabajos de Dehn no son de fácil compren-
sión, y es difícil saber si no cayó en la misma trampa que otros: Bricard (¡en
1896t), Meschowski (1960) y probablemente otros propusieron demostracio-
nes muy elegantes, pero desafortunadamente incorrectas. Afortunadamente,
la demostración de Dehn fue revisada y elaborada de nuevo, y después del
esfuerzo conjunto de V. F. Kagan (1903/1930), Hugo Hadwiger (1949/54) y
Vladimir G. Boltianskii, podemos exponer en este capítulo una demostración
de El Libro. (El apéndice proporciona algunos conceptos básicos sobre polie-
dros.)
(1) Unas nociones de álgebra lineal
Para cualquier conjunto finito de números reales M = {mI, . .. ,mk} <;;; lR,
definimos V(M) como el conjunto de todas las combinaciones lineales de
números en M con coeficientes racionales, esto es,
k
V(M) := { L qimi : qi E Q} <;;; lR.
i=1
La primera observación (trivial, pero importante) es que V(M) es un espa-
cio vectorial finito sobre el cuerpo Q de los números racionales. De hecho,
V(M) es cerrado bajo sumas y multiplicaciones por racionales, y los axio-
mas de cuerpo para lR hacen de V(l\!I) un espacio vectorial. La dimensión de
V(M) es el cardinal de cualquierconjunto minimal de generadores. Puesto
que por definición M genera a V (M), ha de contener un conjunto minimal de
generadores. De aquí,
dimQ V(M) ~ k = IMI.
En adelante, utilizaremos funciones lineales sobre Q
j : V(M) --+ Q,
es decir, aplicaciones lineales entre Q-espacios vectoriales. La propiedad
clave es que para cualquier relación de dependencia lineal 2:7=1 qimi = O
con qi E Q, se ha de verificar que 2:7=1 qd(mi) = j(O) = O.
Este sencillo lema será esencial para la resolución del problema de Hilbert:
Lema. Para dos subconjuntos M <;;; M' finitos de lR cualesquiera, el Q-
espacio vectorial V(M) es un subespacio de V(M'). Por tanto, cualquier
función Q-lineal j : V (M) --+ Q puede ser extendida a una función Q-lineal
j' : V(M') --+ Q tal que j'(m) = j(m) para todo m E M .
• Demostración. Cualquier función Q-lineal V(M) --+ Q queda determi-
nada al fijar las imágenes de una Q-base de V(M). El lema es una conse-
cuencia de que cualquier base de V (M) puede ser extendida a una base de
V(M' ). D
El tercer problema de Hilbert: descomposición de poliedros
Invariantes Dehn
Para un poliedro tridimensional P, sea M p el conjunto de todos los ángulos
entre caras adyacentes (ángulos diedros), junto con el número 1T. Por ejem-
plo, para un cubo C tenemos Me = {~,1T},mientras que para un prisma
ortogonal Q sobre un triángulo equilátero obtenemos M Q = {~, ~, 1T}.
Dado cualquier conjunto finito M <;;; IR que contenga a M p , y cualquier fun-
ción Q-lineal
j : V(M) ---+ Q
que satisfaga j(1T) = O, definimos el invariante de Dehn de P (con respecto
a f) como el número real
Df(P) := I:: /!(e) . j(a(e)),
eEP
donde la suma se extiende sobre todas las aristas e del poliedro, /!( e) es la
longitud de e, y a( e) el ángulo diedro entre dos caras incidentes a e.
Calcularemos más adelante algunos invariantes de Dehn. Por ahora, fijémonos
simplemente en que j (~) = ~ j (1T) = O tiene que verificarse para cualquier
función Q-lineal j, y por tanto
Df(C) = O,
es decir, el invariante de Dehn de un cubo es cero respecto de cualquier j.
(3) Teorema de Dehn-Hadwiger
Como antes, llamaremos a dos poliedros P, Q equidescomponibles si pueden
descomponerse en un conjunto finito de poliedros PI, ... , Pn Y Q1, ... , Qn
tales que Pi y Qi son congruentes para todo i (1 :S i :S n). Dos poliedros
son equicompletables si existen poliedros PI, ... ,P m Y Q1, ... , Qm tales que
los interiores de los Pi son disjuntos dos a dos y disjuntos de P, y de manera
similar para los Qi y Q; además, Pi ha de ser congruente con Qi para todo i, y
P := PUP1 UP2 U . " UPm y Q := QUQ1 UQ2 U '" UQm han de ser equi-
descomponibles. Un teorema demostrado por Gerling en 1844 implica que no
influye si se admiten o no reflexiones a la hora de considerar congruencias.
Es claro que poliedros equidescomponibles son equicompletables, pero el re-
cíproco no es evidente. El siguiente teorema de Hadwiger (en la versión de
Boltianskii) proporciona una herramienta para encontrar - tal y como pro-
puso Hilbert - tetraedros de igual volumen que no son equicompletables, y
por tanto tampoco equidescomponibles.
Teorema. Sean P y Q poliedros con ángulos diedros al, ... , a p y 131, ... ,Pq
respectivamente, y sea M un conjunto finito de los números reales tal que
Si j : V (M) ---+ Q es cualquier función Q-lineal con j (1T) = O Y tal que
Df(P) -¡. Df(Q),
entonces P y Q no son equicompletables.
47
48
f---/-----{/
D
e
B
El tercer problema de Hilbert: descomposición de poliedros
• Demostración. La demostración tiene dos
Si un poliedro P puede descomponerse en un número finito de poliedros
PI, . .. ,Pn , Y si todos los ángulos diedros de estos PI, . .. ,Pn están conteni-
dos en el conjunto NI, entonces para cada función CQl-lineal j : V(M) ---+ CQl,
los invariantes de Dehn se suman y resulta
Para verlo, asociamos a cada parte de cualquier arista de un poliedro una masa:
Si el <::.; e es una parte de una arista e de P, entonces su masa es
mj(e/) :=e(e/) j(a(e/)),
su longitud multiplicada por el valor que toma j en su ángulo diedro.
Si P se descompone en PI, ... , P n, consideraremos todas las aristas de todas
las piezas. Comprobamos que la suma de los ángulos diedros de las piezas a
lo largo de el es el ángulo diedro de P en el, y por lo tanto lo mismo se cumple
para las masas.
Para cualquier otra arista el! de algún Pi, contenida en el interior de P o de
una de sus caras, la suma de los ángulos diedros es 1f Ó 21f. Así, la suma de
los valores de j en todos los ángulos de todas las piezas es o bien j(1f) = O,
o bien j(21f) = O. En consecuencia, para la suma de las masas obtenemos el
mismo valor que se había asignado a estas aristas en P, es decir, O.
(2) Suponiendo que P y Q son equicompletables, podemos extender M a
un conjunto mayor MI que también incluya todos los ángulos diedros que
aparecen en cualquiera de las piezas involucradas. MI es finito, ya que sólo
consideramos descomposiciones finitas. Por lo tanto, el lema que se expuso
anteriormente nos permite extender j a l' : V(MI ) ---+ CQl, y de la parte (1) se
desprende una ecuación del tipo
donde D J' (Pi) = D J' (Qi) ya que Pi y Qi son congruentes. Concluimos pues
que Dj(P) = Df(Q), lo cual es una contradicción. O
Ejemplo 1. Para un tetraedro regular To cuyas aristas miden f unidades de
longitud, calculamos el ángulo diedro apoyándonos en el dibujo. El punto
medio M de la base del triángulo divide a la altura AE de la base en dos
segmentos en razón 1:2. Puesto que IAEI = IDEI, se tiene cos a = !, y por
tanto
_ 1
a - arccos 3'
Haciendo M := {a, 1f} observamos que la razón
1 1 - arceos-
1f 3
es irracional, según el teorema 3 del capítulo 6 (tomando n = 9). Por tanto,
el CQl-espaeio vectorial V(M) tiene dimensión 2; una base es M, y existe una
función CQl-lineal j : V(M) ---+ CQl tal que
j(a) := 1, j(1f) := O.
El tercer problema de Hilbert: descomposición de poliedros
Para esta f tenemos
Df(To) = 61:f(a) = 61: i= O,
y por tanto un tetraedro regular no es ni equidescomponible ni equicomple-
table con un cubo, ya que el invariante de Dehn de un cubo se anula para
cualquier f.
~_.~ ... " •. ~ 2. Sea TI un tetraedro determinado por tres aristas ortogonales AB,
Ae, AD de longitud u. Este tetraedro tiene como ángulos diedros tres ángulos
rectos, y otros tres más de igual amplitud tp, que calculamos a partir del dibujo:
IAEI ~V2u 1
cbs tp
IDEI ~\1'3 V2u \1'3'
Se sigue que
1
tp= arccos \1'3'
Para M : = {i, arccos Js, 1f}, el CQl-espacio vectorial V (M) tiene dimensión
2: primero, V(M) = V( {arccos Js, 1f}), ya que 1f y i son linealmente
dependientes. Además, no hay ninguna relación con coeficientes racionales
entre arccos Js y 1f; esto es equivalente a que ~ arccos Js es irracional, tal y
como se probó en el capítulo 6 (con n = 3 en el teorema 3).
De este modo, podemos construir una aplicación CQl-lineal f haciendo
f(1f) := O y f( arccos Js) := 1,
de la cual obtenemos f ( i) = O, y de aquí que
Df(TI ) = 3uf(i) +3(V2u)f(arccosJs) = 3V2u i= O.
Esto prueba que TI no es equidescomponible ni equicompletable con un cubo e
del mismo volumen, ya que se verifica D f (e) = O para cualquier f.
Ejemplo 3. Finalmente, sea T2 un tetraedro con tres aristas consecutivas AB,
Be y e D que son ortogonales entre sí y de igual longitud u.
No calcularemos los ángulos de un tetraedro de este tipo (son i, ~ y :f), sino
que argumentaremos - utilizando los puntos medios de las aristas y caras, y
el centro - que un cubo cuya arista tiene longitud u puede ser descompuesto
en 6 de estos tetraedros (3 copias congruentes y sus respectivas imágenes es-
peculares) .
Todos estos tetraedros tienen el mismo invariante de Dehn, y por lo tanto, para
cualquier función f apropiada, obtenemos
1
Df (T2 ) = 6Df(e) = O,
i así que todos los invariantes de Dehn se anulan en este tipo de tetraedros!
Esto resuelve el tercer problema de Hilbert, ya que hemos construido otro
tetraedro TI;ambos tienen bases congruentes e igual altura, y D f (Td i= O.
Por el teorema de Dehn-Hadwiger, TI y T2 no son equidescomponibles, y ni
siquiera equicompletables.
49
D
e
B
D
u
e
A
50 El tercer problema de Hilbert: descomposición de poliedros
y
Un politopo convexo en ]Rd es el cierre convexo de cualquier conjunto finito
S = {SI, ... , Sn}, es decir, un conjunto de la forma
n n
P = conv(S) := {I>'iSi:Ai20, I:Ai=l}.
i=1 i=1
Los politopos resultan ser objetos familiares. Ejemplos paradigmáticos son
los polígonos convexos (politopos convexos en 2 dimensiones) y los poliedros
convexos (politopos convexos en dimensión 3).
Hay algunos tipos de poliedros que pueden generalizarse a dimensiones ma-
yores de manera natural. Por ejemplo, si S es un conjunto formado por d + 1
puntos afínmente independientes, entonces conv(S) es un símplice de dimen-
sión d (o d-símplice). Para el caso d = 2 se trata de un triángulo, y para d = 3
obtenemos un tetraedro. De forma similar, los cuadrados y los cubos son ca-
sos particulares de los cubos de dimensión d, como también lo es en general
el d-cubo unidad Cd = [O, l]d ~ ]Rd.
Los politopos generales son uniones finitas de politopos convexos. En este
libro, los poliedros no convexos aparecerán relacionados con el teorema de
rigidez de Cauchy en el capítulo 12, y los polígonos no convexos en relación
con la fórmula de Pick, en el capítulo 11, y de nuevo cuando discutamos el
teorema de la galería del arte en el capítulo 31.
Los poli topos convexos pueden ser definidos, de manera equivalente, como
conjuntos acotados de soluciones de un sistema finito de inecuaciones lineales.
Por tanto, cada politopo convexo P ~ ]Rd admite una representación de la
forma
P = {x E ]Rd : Ax :s; b}
para alguna matriz A E ]Rmxd y un vector b E ]Rm. En otras palabras, P es el
conjunto de soluciones de un sistema de m inecuaciones lineales af x :s; bi ,
donde af es la i-ésima fila de A. Recíprocamente, todo conjunto acotado de
soluciones de un sistema de este tipo es un politopo convexo y en consecuencia
puede ser representado como el cierre convexo de un conjunto finito de puntos.
Algunos politopos comunes: tetraedro, Para polígonos y poliedros utilizamos conceptos familiares como vértices,
cubo y permutaedro aristas, y caras de dimensión 2. Podemos definir las caras de un politopo
convexo en dimensión mayor de la manera siguiente: Una cara de P es un
subconjunto F ~ P de la forma P n {x E ]Rd : aT x = b}, donde aT x :s; b
es una desigualdad lineal válida para todos los puntos x E P.
Todas las caras de un politopo son, a su vez, politopos. El conjunto V de vérti-
ces (cara de dimensión O) de un politopo convexo es también el conjunto más
pequeño tal que conv(V) = P. Suponiendo que P ~ ]Rd es un poUtopo con-
vexo de dimensión d, las facetas (caras de dimensión (d-l) determinan un
conjunto mínimo de hiperplanos, y por tanto, de semiespacios que contienen
a P, y cuya intersección es P. En particular, esto implica algo que necesitare-
mos más adelante: Sea F una faceta de P; HF el hiperplano que determina,
y Hj; Y H;; los dos semiespacios cerrados y acotados por HF . Entonces uno
de estos dos semiespacios contiene a P (y el otro no).
El tercer problema de Hilbert: descomposición de poliedros 51
.~---------------------------------------------
El del convexo P viene dado por el V de vérti-
ces del politopo y por un conjunto E de aristas, que son las caras de dimensión
1 de P. Si P tiene dimensión 3, este grafo es planar, y se verifica la conocida
"fórmula de Euler" (véase el capítulo 1
Dos politopos P, pI c::: lRd son congruentes si existe alguna aplicación afín
que conserva las distancias y que transforma P en PI. Tal aplicación puede
invertir la orientación del espacio, como hace por ejemplo la reflexión en un
hiperplano, que transforma P en su imagen especular. Se dice que los polito-
pos son combinatoriamente equivalentes si existe una biyección de las caras
de P en las caras de pI que conserva la dimensión y la relación de inclusión
entre las caras. Esta noción de equivalencia es mucho más débil que la de
congruencia; por ejemplo, la figura del margen muestra un cubo unidad y otro
deformado. Los dos politopos son combinatoriamente equivalentes (por tanto,
podríamos llamar "cubo" a cualquiera de ellas), pero evidentemente no son
congruentes.
Un politopo (o en general un subconjunto cualquiera de lRd ) tiene simetría
central si existe algún punto Xo E lR d tal que
Xo + x E P ~ Xo - x E P.
En esta situación, Xo se llama el centro de P.
[1] V. G. BOLTIANSKII: Hilbert's Third Problem, V. H. Winston & Sons (Halsted
Press, John Wiley & Sons), Washington DC 1978.
[2] M. DEHN: Ueber raumgleiche Polyeder, Nachrichten von der Konigl. Gesells-
chaft der Wissenschaften, Mathematisch-physikalische Klasse (1900), 345-354.
[3] M. DEHN: Ueber den Rauminhalt, Mathematische Annalen 55 (1902),
465-478.
[4] C. F. GAUSS: "Congruenz und Symmetrie": Briefwechsel mit Gerling,
pp. 240-249 en: Werke, Band VIII, Konigl. Gesellschaft der Wissenschaften zu
Gottingen; B. G. Teubner, Leipzig 1900.
[5] D. HILBERT: Mathematical Problems, Lecture delivered at the Intemational Con-
gress of Mathematicians at Paris in 1900, Bulletin Amer. Math. Soco 8 (1902),
437-479.
[6] G. M. ZIEGLER: Lectures on Polytopes, Graduate Texts in Mathematics 152,
Springer-Verlag, New York 1995/1998.
Dos politopos no congruentes, pero
combinatoriamente equivalentes
El problema tal vez más conocido sobre configuraciones de rectas fue pro-
por Sylvester en 1893 en una columna sobre matemáticos
de la revista Educational Times.
No está claro si el propio Sylvester tenía una demostración - en cualquier
caso, la solución que se publicó en la Educational Times no tiene mucho sen-
tido. Unos 40 años más tarde, Tibor Gallai [Grünwald] dio una solución co-
rrecta. Por ello se atribuye el siguiente teorema comúnmente a ambos. Des-
pués de la demostración de Gallai aparecieron otras, pero la siguiente, de L.
M. Kelly, puede considerarse "simplemente la mejor."
Teorema 1. En cualquier configuración de n puntos no alineados en el plano,
existe una recta que contiene exactamente dos de los puntos.
Demostración. Sea P el conjunto de puntos dado y considérese el conjunto
L de todas las rectas que pasan por al menos dos puntos de P. Entre todos los
pares (P, R) tales que P no está sobre R, elegimos un par (Po, Ro) tal que Po
tenga distancia mínima a Ro. Llamaremos Q al punto más cercano a Po sobre
la recta Ro (esto es, en la perpendicular a Ro por Po).
¡tr,m{irCl!')n. ¡Esta recta Ro verifica el teorema! Ro
De otro modo, Ro contiene al menos tres puntos de p, y por tanto dos de
ellos, pongamos P1 y P2 , están al mismo lado de Q. Suponemos que P1 está
entre Q y P2 , donde P1 puede coincidir con Q (véase el margen). Se sigue
que la distancia de P1 a la recta R 1 que determinan Po Y P2 es menor que la
distancia de Po a Ro, Y esto contradice nuestra elección de Ro Y Po. O
En la demostración hemos utilizado axiomas métricos (la distancia más corta)
y axiomas de orden (P1 está entre Q y P2 ) en el plano real. ¿Necesitamos
realmente estas propiedades, más allá de los axiomas habituales de incidencia
de puntos y rectas? Alguna condición adicional sí hace falta, como demuestra
el famoso plano de Fano dibujado en el margen. Aquí P = {l, 2, .. " 7}
Y L está formado por las 7 rectas por tres puntos que se indican en la figura,
incluyendo la "recta" {4, 5, 6}. Cualesquiera dos puntos determinan una única
recta, de modo que se satisfacen los axiomas de incidencia, pero no existe
ninguna recta que pase por dos puntos. Por tanto, el teorema de Sylvester-
Gallai muestra que la configuración de Fano no puede ser dibujada en el plano
real de manera que los 7 tripletes colineales estén sobre rectas reales: ha de
haber siempre una recta "quebrada". 1
J. J. Sylvester
Po
Q
3
6 2
54 Rectas en el plano y descomposición de grafosSin Coxeter demostró que los axiomas de orden son suficientes para
una demostración del teorema de Sylvester-Gallai. Por tanto, puede darse
una demostración que no utilice propiedades métricas - véase también la
demostración que darnos en el capítulo 11, utilizando la fórmula de EuJer.
El teorema de Sylvester-Gallai implica directamente otro famoso resultado
sobre puntos y rectas en el plano, debido a Paul Erdos y Nicolaas G. de Bruijn.
Pero este otro resultado se verifica de manera general para configuraciones
arbitrarias de puntos y rectas, tal y como observaron Erdos y de Bruijn. En
breve veremos este resultado más general.
Teorema 2. Sea P un conjunto de n 2" 3 puntos no alineados en el plano.
Entonces el conjunto 1: de rectas que pasan por al menos dos puntos contiene
al menos n rectas .
• Demostración. Para n = 3 no hay nada que demostrar. Ahora procedemos
por inducción sobre n. Sea IPI = n + 1. Por el teorema anterior, existe una
recta Ro E 1: que contiene exactamente dos puntos P y Q de P. Consideramos
el conjunto P' = P\ {Q} y el conjunto 1:' de rectas determinado por P'. Si
los puntos de P' no están alineados, entonces por inducción 11:' 1 2" n y de aquí
que 11:1 2" n + 1, por la recta adicional Ro en 1:. Por otra parte, si los puntos
de P' están todos alineados, entonces tenemos el "abanico" de la figura, el
cual nos da exactamente n + 1 rectas. D
Ahora, como prometimos, probaremos el resultado general, que se puede apli-
car a "geometrías de incidencia" mucho más generales.
Teorema 3. Sea X un conjunto de n 2" 3 elementos, y sean Al, ... , Am
subconjuntos propios de X, tales que cualquier par de elementos de X está
contenido precisamente en uno de los conjuntos Ai. Entonces m 2" n .
• Demostración.
La siguiente demostración, atribuida tanto a Motzkin como a Conway, es muy
corta y verdaderamente digna de mención. Para todo x E X sea 'r x el número
de conjuntos Ai que contienen a x. (Nótese que por hipótesis, 2 :S 'rx < m.)
Ahora, si x ti:. A i , entonces 'rx 2" IAi 1 porque los IAil conjuntos que contienen
a x y a un elemento de Ai han de ser distintos. Supongamos que m < n;
entonces mlAil < n'rx y por tanto m(n - 1) > n(m - 'rx ) para x ~ Ai'
Pero ahora nos encontramos con que
lo cual es absurdo. D
Hay otra demostración muy breve de este teorema que utiliza álgebra lineal.
Sea B la matriz de incidencia de (X; Al,' .. , A m ). Esto quiere decir que
etiquetamos las filas en B mediante los elementos de X, y las columnas según
Al, ... , Am; además, tenemos que
si x E A
si x ti:. A.
Consideramos el producto BBT . Para x el x' tenemos (BBT)xxf = 1, ya
que x y x' están contenidos precisamente en un conjunto A i , de modo que
Rectas en el plano y descomposición de grafos
o
o
1
1
1 ; 1
donde T x se define como antes. Como la plimera matliz es definida positiva
(tiene únicamente autovalores positivos) y la segunda es semidefinida positiva
(tiene como autovalores n y O), deducimos que BBT es definida positiva; en
particular, es invertible, y el rango de BBT es n. Se sigue que el rango de la
matriz B, de dimensiones (n x m), es al menos n, y concluimos que, de hecho,
n :::; m, ya que el rango no puede ser mayor que el número de columnas.
Vayamos un poco más allá y volvamos a la teoría de grafos. (Hacemos una
revisión de los conceptos básicos de teoría de grafos al final de este capítulo.)
Un momento de reflexión basta para comprobar que la siguiente afirmación es
en realidad la misma que la que enuncia el teorema 3:
Si descomponemos un grafo completo Kn en m subgrafos comple-
tos diferentes de Kn. de tal modo que cada arista esté en un único
subgrafo completo, entonces m;::: n.
De hecho, si hacemos corresponder X con el conjunto de vértices de Kn y
los conjuntos Ai con los conjuntos de vértices de los sub grafos completos,
entonces las afirmaciones son idénticas.
Nuestra próxima tarea es descomponer Kn en grafos completos bipartitos de
tal modo que de nuevo cada arista esté exactamente en uno de esos grafos.
Para ello, numeramos los vértices {1, 2, ... , n}, y unimos 1 con el resto de
los vértices. Así obtenemos el grafo bipartito completo KI,n-1 (una estre-
lla). Luego unimos 2 con 3, ... ,n para obtener una estrella K I ,n-2; al seguir
de esta manera, Kn queda descompuesto en una selie de estrellas KI,n-l,
K I ,n-2, ... , KI,I, es decir, en n - 1 grafos bipartitos completos.
¿Será posible hacerlo mejor, utilizando menos grafos? El siguiente resultado,
de Ron Graham y Henry O. Pollak, asegura que no:
Teorema 4. Si se descompone Kn en grafos bipartitos completos H I, ... , Hm,
entonces m ;::: n - 1.
Lo interesante es que, en contraste con el teorema de Erd6s-de Bruijn, nadie
ha sabido dar una demostración combinatolia para este resultado. Todas las
que conocemos utilizan álgebra lineal de una u otra manera. De todas las ideas
más o menos equivalentes, veremos la demostración de Tverberg, que puede
que sea la más transparente.
Demostración. Sean {1, ... , n} el conjunto de vértices de K n y sean
L j , Rj los conjuntos de vértices que definen el grafo bipartito completo Hj,
para j = 1, ... , m. A cada vértice i asociamos una variable Xi. Como Kn
está descompuesto en H I , ... ,Hm, tenemos
(1)
Ahora supongamos que el teorema es falso y que, por tanto, m < n - 1.
55
Descomposición de K5 en 4 subgrafos
bipartitos completos.
56
G:
Un grafo G con 7 vértices y 11 aristas.
Tiene un bucle, una arista doble y una
arista triple.
Los grafos completos Kn de n vértices
y G) aristas
Los grafos bipartitos completos Km,n
con m + n vértices y mn aristas
Rectas en el plano y descomposición de grafos
Entonces el sistema de equaciones lineales
Xl + ... + x n O,
O (k=l, ... ,m)
tiene menos ecuaciones que variables, y por tanto existe una solución no trivial
cl, ... ,cn · Por (1) inferimos que
¿CíCj O.
i<j
Pero esto implica
n
¿C7 > O,
í=l í<j i=l
una contradicción, y la demostración está completa. o
Los grafos están entre las estructuras más básicas de las matemáticas. En con-
secuencia, pueden tener apariencia, representaciones y formas muy diversas.
De manera abstracta, un grafo es un par G = (V, E), donde Ves el conjunto
de vértices, E es el conjunto de aristas, y cada arista e E E "conecta" dos
vértices v, w E V. Consideramos únicamente grafos finitos, es decir, que V y
E son finitos.
Normalmente trabajamos con grafos simples, en los que no se admiten bucles,
es decir, aristas en las cuales los extremos coinciden, ni tampoco aristas múl-
tiples, que tienen el mismo conjunto de extremos. Los vértices de un grafo se
llaman adyacentes o vecinos si están en los extremos de una arista. Un vértice
y una arista se llaman incidentes si la arista tiene a ese vértice como extremo.
A continuación mostramos una pequeña galería de grafos simples importantes:
@I @I
K~ K~ Kl,l
K 2 ,2
~
K 2 ,3
K 3 ,3 ~
Rectas en el plano y descomposición de grafos
Dos grafos G = (V, E) Y G' = (V', E') se consideran isomorfos si existen
biyecciones V -+V' y E -+ E' que conservan la incidencia entre aristas y sus
extremos. (Si existe o no un método eficiente para decidir si dos grafos dados
son equivalentes es un problema aún sin resolver.) Esta noción de isomorfismo
nos permite hablar de el grafo completo K5 de S vértices, etc.
Un grafo G' = (V', E') es un subgrafo de G = (V, E) si V' C;;; E' C;;; E,
Y cualquier arista e E E' tiene los mismos extremos en G' y en G. G' es un
subgrafo inducido si, además, todas las aristas de G que conectan vértices de
G' son también aristas de G' .
Muchas nociones sobre grafos son muy intuitivas. Por ejemplo, un grafo es
conexo si a cualesquiera dos vértices distintos les une un camino en G, o lo
que es equivalente, si G no puede descomponerse en dos sub grafos no vaCÍos
cuyos conjuntos de vértices sean disjuntos.
Finalizamos esta revisión de conceptos básicos de grafos con un poco de ter-
minología: Un conjunto independienteen G es un subgrafo inducido sin aris-
tas, esto es, un subconjunto del conjunto de vértices tal que no hay dos que
estén conectados por una arista de G. Un grafo es un bosque si no contiene
ciclos. Un árbol es un bosque conexo. Finalmente, G = (V, E) es un grafo
bipartito si es isomorfo a un sub grafo de un grafo completo bipartito, esto
es, si sus vértices pueden escribirse como una uníon V = VI U V2 de dos
conjuntos independientes.
[1] N. G. DE BRUIJN & P. ERDÓS: On a combinatorial problem, Proc. Kon. Ned.
Akad. Wetensch. 51 (1948), 1277-1279.
[2] H. S. M. COXETER: A problem of collinear points, Amer. Math. Month1y 55
(1948),26-28 (contains Kelly's proof).
[3] P. ERDÓS: Problem 4065 - Three point collinearity, Amer. Math. Month1y 51
(1944),169-171 (contains Gallai's proof).
[4] R. L. GRAHAM & H. O. POLLAK: On the addressing problemfor loop switching,
Bell System Tech. J. 50 (1971), 2495-2519.
[5] J. J. SYLVESTER: Mathematical Question 11851, The Educationa1 Times 46
(1893), 156.
[6] H. TVERBERG: On the decomposition of Kn into complete bipartite graphs, J.
Graph Theory 6 (1982), 493-494.
57
Los caminos Pn con n vértices
Los ciclos en con n vértices
es un sub grafo de
Intente usted mismo -antes de continuar leyendo- construir configuraciones
de puntos en el plano que determinen "relativamente pocas" pendientes. Para
ello suponemos, por supuesto, que los n 2: 3 puntos que se utilicen no están
alineados.
Recuérdese del capítulo 9 sobre "rectas en el plano" el teorema de Erd6s y
de Bruijn: los n puntos determinarán al menos n rectas diferentes; pero, por
supuesto, muchas de estas rectas pueden ser paralelas y tendrán la misma pen-
diente.
n=3 n=4 n=5 n=6 n=7
3 pendientes 4 pendientes 4 pendientes 6 pendientes 6 pendientes
ó
n=3 n=4 n=5 n=6 n=7
3 pendientes 4 pendientes 4 pendientes 6 pendientes 6 pendientes
Después de unos cuantos intentos con algunas configuraciones, usted podría
conjeturar - tal y como hizo Scott en 1970 - el siguiente teorema.
Teorema. Si n 2: 3 puntos en el plano no están alineados, enton-
ces determinan al menos n - 1 pendientes diferentes, verificándose la
igualdad sólo si n es impar y n 2: 5.
Los ejemplos de arriba -los dibujos representan las primeras configuraciones
en dos sucesiones infinitas de ejemplos- nos muestran que el enunciado del
teorema, tal y como aparece aquí, es el mejor posible: para cualquier impar
n 2: 5 existe una configuración con n puntos que determina exactamente n - 1
pendientes diferentes, y para cualquier otro n 2: 3 tenemos una configuración
con exactamente n pendientes.
El análisis de algunos casos particulares
para n pequeño probablemente le con-
ducirá a una de las sucesiones que se
muestran aquí.
60
., ., ., ., .,
., ., ., .,
., ., ., ., ., ., ., .,
., ., ., ., ., ., ., .,
., ., ., ., .,
.,
., ., .,
Tres bonitos ejemplos esporádicos to-
mados del catálogo de Jamison-Hill
2
Esta configuración de n = 6 puntos
detennina t = 6 pendientes diferentes.
1
•
2 .,
3
•
•
4 5 6
•
1 2 3 456
Aquí, 7fo = 123456 representa una di-
rección vertical.
El problema de la pendiente
Sin embargo, las que hemos más arriba no son, ni
mucho menos, las únicas. Por ejemplo, Jamison y Hill describieron cuatro
familias infinitas de configuraciones con un número n impar de puntos que
determinan sólo n - 1 pendientes ("configuraciones críticas de pendientes") .
Aún más, dieron una lista de 102 ejemplos "esporádicos" -la mayoría de
ellos encontrados mediante búsquedas exhaustivas con ordenadores- que no
parecen ajustarse a ninguna familia infinita .
El saber convencional diría que los problemas extremales suelen ser muy difí-
ciles de resolver si configuraciones extremas son tan diversas e irregulares. De
hecho, es mucho lo que puede decirse de la estructura de configuraciones crí-
ticas de pendientes (véase [2]), pero llegar a una clasificación parece ser algo
inalcanzable. Sin embargo, el teorema que hemos expuesto arriba admite una
demostración sencilla, con dos ingredientes principales: la reducción a un mo-
delo combinatorio eficaz (debida a Eli Goodman y Ricky Pollack), y un bonito
argumento en este modelo con el cual Peter Ungar completó la demostración
en 1982 .
• Demostración. (1) En primer lugar, nótese que es suficiente probar que
cualquier conjunto de puntos en el plano de cardinal par determina al menos
n pendientes. Esto es así, ya que el caso n = 3 es trivial, y para cualquier
conjunto de n = 2m + 1 2: 5 puntos (no alineados) podemos encontrar un
subconjunto de n 1 = 2m puntos, no todos alineados, que ya determinan
n - 1 pendientes. Por tanto, en lo que sigue consideraremos configuraciones
de n = 2m puntos en el plano que determinan t 2: 2 pendientes diferentes.
(2) El modelo combinatorio se obtiene construyendo una sucesión periódica
de permutaciones. Para ello, comenzamos con alguna dirección en el plano
que no sea una de las pendientes de la configuración, y numeramos los puntos
1, ... , n según el orden en el que aparecen si los proyectamos en esta direc-
ción. Así, la permutación 7fa = 123 ... n representa el orden de los puntos
respecto de nuestra dirección de partida .
A continuación, movemos la dirección en sentido contrario a las agujas del
reloj y observamos cómo cambian la proyección y su permutación. El orden
de los puntos proyectados cambia exactamente cuando la dirección coincide
con una de las pendientes de la configuración.
Pero los cambios están lejos de ser aleatorios o arbitrarios: tomando una rota-
ción de 1800 de la dirección, obtenemos una sucesión de permutaciones
1fa --+ 1fl --+ 1f2 --+ ... --+ 1ft-l --+ 1ft
que tiene las siguientes propiedades especiales:
La sucesión comienza con 1fa = 123 ... n y termina con 1ft = n . .. 321.
iII La longitud t de la sucesión es el número de pendientes de la configura-
ción de puntos.
iII En el trancurso de la sucesión, cada par i < j se intercambia exactamente
una vez. Esto significa que en el camino que lleva de 1fa = 123 ... n a
1ft = n . .. 321, sólo se intercambian las subcadenas crecientes.
iII Cada movimiento consiste en la inversión de una o más subcadenas cre-
cientes (que corresponden a una o más rectas que tienen como pendiente
la dirección por la cual pasamos en ese punto).
El problema de la pendiente
7f6 = 654321
tt t t t 7f5 = 652341
/ IIIII
4
1 6
7fo = 123456
~ 7f4 = 625314
~
~ 7f3 = 265314
~
~
~
~ 7f2 = 213564
7f1 = 213546
Continuando con el movimiento circular alrededor de la configuración de pun-
tos, podemos interpretar la sucesión como parte de una sucesión infinita y
periódica de permutaciones:
... --+ 7f-1 --+ 7fo --+ ... --+ 7ft --+ 7ft+1 --+ ... --+ 7f2t --+ ...
Aquí 7fi+t es la inversa de 7fi para todo i, y de aquí 7fi+2t = 7fi para todo i E Z.
Demostraremos que toda sucesión con las propiedades anteriores (y t 2: 2) ha
de tener longitud t 2: n.
(3) La clave de la demostración es dividir cada permutación en una "mitad
izquierda" y una "mitad derecha" de la misma longitud m = ~, y contar las
letras que cruzan la barrera imaginaria entre la parte izquierda y la derecha.
Llamaremos a 7fi --+ 7fi+1 un movimiento de cruce si una de las subcadenas
que invierten el sentido contiene letras de ambos lados de la barrera. En movi-
miento de cruce tiene orden d si mueve 2d letras al otro lado de la barrera, es
decir, si la cadena que cruza tiene exactamente d letras en un lado y las otras
d en el otro. Así, en nuestro ejemplo
es un cruce de orden d = 2 (mueve 1,3,5,6 al otro lado de la barrera, lo que
señalamos con ":"); el movimiento
652:341 --+ 654:321
es un cruce de orden d = 1, mientras que
625:314 --+ 652:341
no es un movimiento de cruce.
61
De este dibujo obtenemos la sucesión de
permutaciones de nuestro ejemplo
1 6
Un movimiento de cruce
265314
~
~
213564
62
4
1
652341
/ 625314
~
6
Un movimiento de toque
4
1 6
~
~ 213564
213546Un movimieto ordinario
El problema de la pendiente
En el transcurso de la sucesión 1To ---+ 1Tl ---+ ... ---+ 1Tt, cada una de las letras
1,2, ... ,n ha de cruzar la barrera al menos una vez. Esto implica que, si los
órdenes de los movimientos de cruce son dI, d2 , ... , de, entonces se verifica
e
L 2dí = #{letras que cruzan la barrera} ;::: n.
í=1
Esto implica también que tenemos al menos dos movimientos de cruce, ya
que un movimiento que cumpla 2dí = n se da únicamente si todos los puntos
están alineados, es decir, cuando t = 1. Geométricamente, un movimiento
de cruce corresponde a la dirección de una recta de la configuración que deja
menos de m puntos a cada lado.
(4) Un movimiento de toque es un movimiento que invierte el sentido de alguna
cadena adyacente a la barrera central, pero no la cruza. Por ejemplo,
es un movimiento de toque. Visto de manera geométrica, un movimiento de
toque corresponde a la pendiente de una recta de la configuración que deja
exactamente m puntos a un lado, y por tanto, como mucho m - 2 puntos al
otro.
Llamaremos ordinarios a los movimentos que no son ni toques ni cruces. Un
ejemplo es
1TI = 213:546 --+ 213:564 = 1T2.
Así, cualquier movimiento es un cruce, un toque, o un movimiento ordinario,
y utilizaremos las letras O, T, ° para referimos a ellos. O(d) denotará un
cruce de orden d. Así, en nuestro pequeño ejemplo obtenemos
T O 0(2) O T 0(1)
1To --+ 1TI --+ 1T2 --+ 1T3 --+ 1T4 --+ 1T5 --+ 1T6,
o incluso en una forma más corta, podemos referimos a esta sucesión como
T, 0,0(2),0, T, 0(1).
(5) Para completar la demostración necesitamos los siguientes dos hechos:
Entre cualesquiera dos cruces existe al menos un toque.
Entre cualquier cruce de orden d y el siguiente toque, existen al me-
nos d - 1 movimientos ordinarios.
En efecto, después de un cruce de orden d, la barrera está contenida en una
subcadena simétrica decreciente de longitud 2d, con d letras en cada lado de
la barrera. Para el siguiente cruce la barrera central debe desplazarse dentro de
una subcadena creciente de longitud al menos 2. Pero sólo los movimientos
de toque tienen influencia en que la barrera esté o no en una cadena creciente.
Para el segundo hecho, nótese que con cada movimiento ordinario (que in-
vierte algunas subcadenas crecientes), la cadena decreciente de longitud 2d
puede acortarse únicamente por una letra en cada lado. Además, mientras la
cadena decreciente tenga al menos 4 letras, un toque es imposible. De aquí se
sigue el segundo hecho.
El problema de la pendiente
Si construimos la sucesión de de manera que comenzamos con
la misma proyección inicial, pero usamos una rotación en el sentido horario,
entonces obtenemos la sucesión de permutaciones inversa. Así, la sucesión
que habíamos apuntado debe satisfacer también el opuesto de nuestro segundo
hecho, es decir
E?1tre un toque y el siguiente cruce, de orden d, existen al menos d-1
movimientos ordinarios.
El patrón T -O-C de la sucesión infinita de permutaciones, tal y como
se deriva de (2), se obtiene repitiendo una y otra vez el patrón T-O-C de
longitud t de la sucesión 1fo -----+ ... -----+ 1ft. Así, con los hechos de (5) vemos
que en la sucesión infinita de movimientos, cada cruce de orden d forma parte
de un patrón T -O-C del tipo
T,O,O, ... , O,C(d),O,O, ... ,0,
~~
2: d-l 2: d-l
de longitud 1 + (d - 1) + 1 + (d - 1) = 2d.
En la sucesión infinita, consideramos un segmento finito de longitud t que co-
mienza con un toque. Este segmento está formado por subcadenas del tipo (*)
y posiblemente de otras del tipo T. Esto implica que su longitud t satisface
e
t ~ ¿2di > n,
i=l
lo cual completa la demostración. o
[1] J. E. GOODMAN & R. POLLACK: A combinatorial perspective on sorne
problems in geometry, Congressus Numerantium 32 (1981), 383-394.
[2] R. E. JAMISON & D. HILL: A catalogue of slope-critical configurations,
Congressus Numerantium 40 (1983),101-125.
[3] P. R. SCOTT: On the sets of directions determined by n points, Amer.
Math. Monthly 77 (1970), 502-505.
[4] P. UNGAR: 2N noncollinear points determine at least 2N directions, J.
Combinatorial Theory, Ser. A 33 (1982), 343-347.
63
Un grafo es planar si puede dibujarse en el plano ffi.2 sin aristas que se crucen
(o de manera equivalente, en la esfera 2-dimensional 8 2). Decimos que un
grafo es plano si ese dibujo viene ya dado y fijado. Cualquier dibujo de este
tipo descompone el plano o la esfera en un número finito de regiones conexas,
incluyendo la región exterior (no acotada), a las que nos referimos como caras.
La fórmula de Euler descubre una bella relación entre el número de vértices,
aristas y caras, que es válida para cualquier grafo plano. Euler mencionó
este resultado por primera vez en una carta a su amigo Goldbach en 1750,
pero en aquel entonces no tenía una demostración completa. Entre las muchas
demostraciones de la fórmula de Euler, presentamos una bonita y "auto-dual"
que no necesita inducción y se remonta a 1847, cuando aparece en el libro
"Geometrie der Lage" de Karl Georg Christian von Staudt.
Fórmula de Euler. Si G es un grafo conexo con n I/P¡e/u'p\,
e aristas y f caras, entonces
n- e+ f = 2 .
• Demostración. Sea T ~ E el conjunto de aristas de un árbol generador
de G, esto es, un sub grafo minimal que conecta todos los vértices de G. Este
grafo no contiene ciclos por la suposición de minimalidad.
Ahora necesitamos el grafo dual G* de G: para construirlo, ponemos un vér-
tice en el interior de cada cara de G, y para cada arista de G que separa dos
caras conectamos los vértices correspondientes de G* mediante una arista. Si
dos caras de G comparten varias aristas en su frontera, conectaremos los vér-
tices correspondientes del grafo dual mediante más de una arista. (Así pues,
G* puede tener aristas múltiples incluso si el grafo original G es simple.)
Consideramos la colección T* ~ E* de aristas en el grafo dual que se corres-
ponden a las aristas en E\T. Las aristas en T* conectan todas las caras, ya
que T no tiene ciclos; pero T* tampoco contiene ciclos, pues de otra manera
separaría algunos de los vértices de G dentro del ciclo de los de fuera (y esto
no puede ser, ya que T es un sub grafo generador, y las aristas de T* no se
intersecan). Así pues, T* es un árbol generador para G*.
Para cada árbol, el número de vértices es uno más que el número de aristas.
Para verlo, elegimos un vértice como raíz y dirigimos todas las aristas "hacia
la raíz". Esto conduce a una biyección entre los vértices que no son raíz y las
aristas, haciendo corresponder cada arista con el vértice desde el cual sale.
Aplicado al árbol T esto conduce a que n = eT + 1, mientras que para el
árbol T* obtenemos f = eT* + 1. Sumando ambas ecuaciones obtenemos la
relación n + f = (eT + 1) + (eT* + 1) = e + 2. O
Leonhard Euler
Un grafo plano G: n = 6, e = 10, f = 6
Árboles generadores duales en G y
enG*
66
Los cinco sólidos platónicos
2
2 2
Aquí escribimos el grado alIado de cada
vértice. Contando los vértices de un
grado dado, se tiene n2 = 3, n3 = O,
n4 = 1, n5 = 2.
2
Hemos escrito el número de lados den-
. tro de cada región. Contando las ca-
ras con un determinado número de la-
dos obtenemos JI = 1, h = 3, J4 = 1,
fg = 1, Y Ji = O en los demás casos.
Tres aplicaciones de lafórmula de Euler
La fórmula de Euler produce una conclusión numérica inesperada a partir de
una situación métrico-topológica: El número de vértices, aristas y caras de un
grafo finito G satisface n-e + f = 2 siempre que el grafo esté o pueda estar
dibujado-en el plano o sobre una esfera.
De la fórmula de Euler se derivan muchas consecuencias conocidas, algunas
de ellas clásicas. Entre ellas figuran la clasificación de los poliedros regula-
res convexos (los sólidos platónicos), el hecho de que los grafos K5 y K 3 ,3
no son planares (véase más adelante), y el teorema de los cinco colores, que
afirma que cada mapa planar puede ser coloreadousando como máximo cinco
colores, de manera que dos regiones adyacentes no tengan el mismo color. Sin
embargo, para este último resultado tenemos una demostración mucho mejor,
que no necesita la fórmula de Euler - véase el capítulo 30.
En este capítulo incluimos otras tres bellas demostraciones que dependen de
manera esencial de la fórmula de Euler. Las dos primeras - una demostración
del teorema de Sylvester-Gallai, y un teorema sobre configuraciones de puntos
coloreados con dos colores - utilizan la fórmula de Euler en una inteligente
combinación con otras relaciones aritméticas entre los parámetros básicos de
un grafo. Veamos primero cuáles son estos parámetros.
El grado de un vértice es el número de aristas que terminan en él, contando
cada bucle dos veces. Sea ni el número de vértices de grado i en G. Contando
los vértices de acuerdo con sus grados, obtenemos
(1)
Por otro lado, toda arista tiene dos extremos, de manera que contribuye con 2
a la suma de todos los grados. Por tanto,
(2)
Esta identidad puede interpretarse como si se contara de dos maneras los ex-
tremos de las aristas, esto es, las incidencias entre aristas y vértices. El grado
medio d de los vértices es, en consecuencia,
- 2e
d = -.
n
Ahora contamos las caras de un grafo plano de acuerdo con su número de
lados: Una k-cara es una cara delimitada por k aristas (¡hay que contar dos
veces cada arista que delimita la misma cara por los dos lados!) Sea fk el
número de k-caras. Contando todas las caras obtenemos
f = JI + h + fs + f4 + ... (3)
Contando las aristas de acuerdo con las caras de las cuales son lados, obtene-
mos
(4)
Como antes, podemos interpretar esto como si contáramos las incidencias en-
tre aristas y caras de dos maneras distintas. Nótese que el número medio de
lados de las caras viene dado por
2e
J"
Tres aplicaciones de lafórmula de Euler
A de esto, con la fórmula de se deduce que el
y el grafo completo bipartito K 3 ,3 no son planares. Para un dibujo plano
de K5 se tendría n = 5, e = (~) = 10, por tanto f = e + 2 - n = 7
Y 1 = 2; = 27° <3. Pero si el número medio de lados es menor que 3,
entonces el dibujo hipotético tendría una cara con dos lados como máximo, lo
cual es imposible.
De manera similar, para K 3,3 obtenemos n = 6, e = 9, Y f = e + 2 - n = 5,
Y por tanto 1 = 2; = 158 < 4. Esto es imposible, ya que K3,3 es simple
y bipartito, y por lo tanto la longitud de cualquiera de sus ciclos es por lo
menos 4.
No es coincidencia, por tanto, que las ecuaciones (3) y (4) para los fi se pa-
rezcan tanto a las ecuaciones (1) y (2) para los ni. Se pueden transformar unas
en las otras pasando del grafo G al grafo dual G* .
De las fórmulas para contar incidencias obtenemos las siguientes importantes
consecuencias de la fórmula de Euler.
pr,op'OSJCl()ll. Sea G cualquier grafo plano simple con n > 2 vértices. Enton-
ces
(A) G tiene un vértice de grado a lo sumo 5.
(B) G tiene a lo sumo 3n - 6 aristas.
(C) Si coloreamos las aristas de G con dos colores, hay un vértice de G de
manera que al leer las aristas incidentes a él en orden cíclico, vemos a
lo sumo dos cambios de color.
• Demostración. Para todos los enunciados podemos suponer G conexo.
(A) Cada cara tiene por lo menos 3 aristas (ya que G es simple), con lo cual
(3) y (4) nos dan
f h + f4 + f5 + .. .
2e 3h + 4f4 + 5f5 + .. .
y por tanto 2e 3f ~ O.
Si cada vértice tiene grado por lo menos 6, entonces (1) y (2) implican que
n n6 + n7 + ns + .. .
2e 6n6 + 7n7 + 8n8 + .. .
y por tanto 2e - 6n ~ O.
Juntando ambas desigualdades obtenemos
6(e-n-f) = (2e-6n)+2(2e-3f) > O
y por tanto e ~ n + f, contradiciendo la fórmula de Euler.
(B) Igual que en el primer paso del apartado (A), obtenemos 2e - 3f ~ O y,
aplicando la fórmula de Euler, que
3n - 6 = 3e - 3f > e.
67
Un dibujo de K5 con un cruce
Un dibujo de K 3 ,3 con un cruce
68
Las flechas señalan esquinas con un
cambio de color.
.. v ..
"
Tres aplicaciones de la fórmula de Euler
(C) Sea c el número de donde un cambio de color.
que el enunciado es falso. Entonces hay c 2': 4n esquinas con cambios de
color, ya que en cada vértice hay un número par de cambios. Ahora, cada
cara con 2k ó 2k + 1 lados tiene como mucho 2k tales esquinas, de lo cual
concluimos que
4n < c < 2h + 414 + 415 + 616 + 617 + 818 + ...
< 2h + 414 + 615 + 816 + 1017 + .. .
2(3h + 414 + 515 + 616 + 717 + ... )
-4(h + 14 + 15 + 16 + 17 + ... )
4e - 41,
donde hemos vuelto a usar (3) y (4). Por tanto, tenemos e 2': n + 1, otra vez
en contradicción con la fónnula de Euler. O
1. vez
Parece ser que Nonnan Steenrod fue el primero en darse cuenta de que el
apartado (A) de la proposición nos da una demostración extraordinariamente
sencilla del teorema de Sylvester-Gallai (véase el capítulo 9).
El teorema de Sylvesíer-Gallai. Dado cualquier conjunto de n 2': 3
puntos en el plano, no todos alineados, siempre hay una recta que
contiene exactamente dos de los puntos .
• Demostración. (Sylvester-Gallai vía Euler)
Si situamos el plano JR2 dentro de JR3 y cercano a la esfera unidad S2 como
indica la figura, cada punto de JR2 se corresponde con una pareja de puntos
antipodales en S2, y las rectas en JR2 se corresponden con circunferencias
máximas en S2. Por tanto, el teorema de Sylvester-Gallai dice lo siguiente:
Dado cualquier conjunto de n 2': 3 parejas de puntos antipodales en
la esfera, no todos en una circunferencia máxima, siempre hay una
circunferencia máxima que contiene exactamente dos de las parejas.
Ahora pasamos a la versión dual, reemplazando cada pareja de puntos con la
correspondiente circunferencia máxima en la esfera. Dicho de otra manera, en
vez de puntos ±v E S2 consideramos las circunferencias ortogonales dadas
por Cv := {x E S2 : (x, v) = O}. (Este Cv es el ecuador si consideramos v
como polo norte de la esfera.)
El problema de Sylvester-Gallai nos pide demostrar:
Dada cualquier colección de n 2': 3 circunferencias máximas en S2,
no todos pasando por el mismo punto, siempre hay un punto conte-
nido en exactamente dos de los círculos.
Pero el arreglo de circunferencias máximas se puede interpretar como un grafo
plano simple en S2, cuyos vértices son los puntos de intersección de dos de
las circunferencias, y cuyas aristas los arcos de circunferencias entre los vér-
tices. El grado de todos los vértices es par, y además por lo menos 4 - por
construcción. Por tanto, el apartado (A) de la proposición nos da la existencia
de un vértice de grado 4. ¡Ya está! CJ
Tres aplicaciones de la fórmula de Euler
La siguiente demostración de una versión "coloreada" del teorema de Sylvester-
Gallai se debe a Don Chakerian.
Teorema. Dado cualquier configuración de puntos "negros" y "blancos" en
el plano, hay siempre por lo menos una recta "monocromática ", es decir, una
recta que contiene al menos dos puntos de un color y ninguno del otro .
• Demostración. Igual que en el problema de Sylvester-Gallai, llevamos el
problema a la esfera unidad y aplicamos dualidad. Tenemos que demostrar,
pues:
Dado cualquier colección de circunferencias máximas "blancos" y
"negros" en la esfera unidad, no todos pasando por el mismo punto,
siempre existe un punto de intersección que o bien sólo está en circun-
ferencias blancas, o bien sólo en circunferencias negras.
La solución queda clara a partir de la parte (C) de la proposición, ya que en
cada vértice que es intersección de circunferencias con diferentes colores, hay
por lo menos 4 esquinas con cambio de color. O
El teorema de Pick del año 1899 es un resultado bello y sorprendente por
sí mismo, pero también es una consecuencia clásica de la fórmula de Euler.
Diremos que un polígono convexo P ~ ffi.2 es elemental si sus vértices son
enteras (es decir, están contenidos en la retícula Z'?), pero no contiene más
puntos de la retícula.
Lema. Cada triángulo elemental 6. = conv{PO,PI,P2} ~ ffi.2 tiene área
A(6.) = ~.
Demostración. Tanto el paralelogramoP que tiene como vértices Po, PI'
P2, PI + P2 - Po, como la retícula 'Z'} , son simétricos respecto de la aplicación
cr: X 1--+ PI + P2 - x,
que es la reflexión con respecto al centro del segmento de PI a P2' Por tanto,
el paralelogramo P = 6. U cr(6.) también es elemental, y sus traslaciones con
vectores de coordenadas enteras teselan el plano. Por tanto, {PI -Po, P2 -Po}
es una base de la retícula Z2, la matriz correspondiente tiene determinante ±1,
P es un paralelogramo de área 1 y 6. tiene área ~. (Explicamos estos términos
en el recuadro de arriba.) O
Teorema. El área de cualquier polígono Q ~ ffi.2, no necesariamente con-
vexo, pero con vértices enteros, viene dada por
A(Q) =
1
nint + 2nfr - 1,
.10nde nint Y nfr son, respectivamente, el número de puntos con coordenadas
enteras en el interior yen lafrontera de Q.
69
PI + P2 - Po
~ • • •
P2
• l1li l1li ..
• • • l1li PI
• • l1li •
Po
l1li • • • • • •
• • •
• • •
• • •
• • • • • • •
nin, = 11 Y nlr = 8, portanto A = 14
70 Tres aplicaciones de la fórmula de Euler
Una base de 7!} es un par de vectores linealmente H""v~'vU~',U'v" el, e2
tal que
Z2 = {Alel + A2e2 : Al, A2 E Z}.
Sean el = m y e2 = (~), entonces el área del que
determinan el Y e2 es A(el, e2) = I det(el, e2)1 I det (~~)I. Si
= (:) y (D es otra base, entonces existe una matriz invertible
con elementos enteros Q tal que (; ~) = (~~) Ya que
(¿ ~), y los determinantes son enteros, se sigue que I det Q I = 1, y
por tanto I det(f l' f 2) I I det( el, e2) l· Concluimos que todos los
paralelogramos que se corresponden a una base tienen la misma área 1,
ya que A ( @, (~)) = 1.
111 Demostración. Cualquier polígono Q con las características del teorema
puede triangularse usando todos los nint puntos de la retícula en su interior, y
todos los nft· puntos de la retícula en su frontera. (Esto no es obvio del todo,
sobre todo si no pedimos que Q sea convexo, pero lo demuestra el argumento
del capítulo 31 sobre el problema de la galería de arte.)
Ahora interpretamos la triangulación como un grafo plano que subdivide el
plano en una cara no acotada, más f - 1 triángulos de área ~, de manera que
A(Q) = ~(f - 1).
Todo triángulo tiene tres lados, y cada uno de los eint lados interiores separa
dos triángulos, mientras que los ejr lados en la frontera sólo aparecen en un
único triángulo cada uno. Por tanto, 3(f - 1) = 2eint + ejr, y por tanto
f = 2 (e - f) - efr + 3. Además, el numero de aristas y vértices en la frontera
es el mismo, efr = njr. Estos dos hechos, junto con la fórmula de Euler, dan
f 2(e-f)-efr+ 3
2(n - 2) - nfr + 3 = 2nint + nfr - 1,
y por tanto
A(Q) ~(f - 1) D
[1] G. D. CHAKERIAN: Sylvester's problem on collinear points and a relative, Amer.
Math. Monthly77 (1970),164-167.
[2] G. PIeK: Geometrisches zur Zahlenlehre, Sitzungsberichte Lotos (Prag), Natur-
medo Verein für Bóhmen 19 (1899), 311-319.
[3] K. G. C. VON STAUDT: Geometrie der Lage, Verlag der Fr. Korn'schen
Buchhandlung, Nürnberg 1847.
[4] N. E. STEENROD: Solution 4065/Editorial Note, Amer. Math. Monthly 51 (1944),
170-171.
Un famoso resultado que depende de la fórmula de Euler (en concreto, en la
parte (C) de la proposición del capítulo anterior) es el teorema de rigidez de
Cauchy para poliedros tridimensionales.
Para las nociones de congruencia y equivalencia combinatoria que utilizamos a
continuaci.ón, el lector se puede dirigir al apéndice sobre politopos y poliedros
del capítulo en el que tratamos el tercer problema de Hilbert, en la página 50.
Teorema. Si dos poliedros convexos tridimensionales P y p' son
combinatoriamente equivalentes y las caras correspondientes son con-
gruentes, entonces los ángulos entre los correspondientes pares de ca-
ras son iguales (y, por tanto, P y son congruentes).
La figura del margen muestra dos poliedros tridimensionales combinatoria-
mente equivalentes, y tales que las caras correspondientes son congruentes.
Sin embargo, no son congruentes, y sólo uno de ellos es convexo. Por tanto,
¡la hipótesis de convexidad es esencial en el teorema de Cauchy!
• Demostración. Lo que presentamos a continuación es, esencialmente, la
demostración original de Cauchy. Supongamos que tenemos dos poliedros
convexos p y p' con caras congruentes. Coloreamos las aristas de P de la
siguiente forma: una arista es negra (o "positiva") si el ángulo interior entre
las caras adyacentes es mayor en p' que en P; es blanca (o "negativa") si el
ángulo es menor en p' que en P.
El conjunto de aristas blancas y negras de P forma un grafo plano 2-coloreado
en la superficie de P que, mediante una proyección central con origen en un
punto interior de P, podemos considerar en la superficie de la esfera unidad.
Si P Y p' tienen ángulos distintos entre caras correspondientes, el grafo es no
vacío. Utilizando la parte (C) de la proposición del capítulo anterior, deduci-
mos que existe un vértice p que es adyacente al menos a una arista blanca o
negra, y tal que hay como mucho dos cambios entre aristas blancas y negras
(considerando el orden cíclico).
Consideremos ahora la intersección del poliedro P con una esfera pequeña SE
(de radio E) centrada en el vértice p, y la intersección de p' con una esfera S~
del mismo radio E centrada en el vértice correspondiente p'. En SE y S~ se
obtienen polígonos esféricos Q y Q', convexos, tales que los arcos correspon-
dientes tienen la misma longitud, ya que las caras correspondientes de P y p'
son congruentes y hemos utilizado el mismo radio E.
Ahora marcamos con un + los ángulos de Q para los que el ángulo corres-
1
Augustin Cauchy
72
Q: +
Q':
El teorema de rigidez de Cauchy
pondiente en es mayor, y con un - los ángulos para los que el ángulo
correspondiente en Q' es menor. Por tanto, cuando nos movemos de Q a Q',
los ángulos marcados con + se "abren" y los ángulos marcados con - se
"cierran", en tanto que las longitudes de las aristas y el resto de los ángulos
permanecen constantes.
De acuerdo con la elección de p, sabemos que existe algún signo + o -, y que
en el orden cíclico hay, como mucho, dos cambios +/ -. Si sólo hay signos de
un tipo, el lema que presentamos a continuación produce una contradicción,
pues asegura que alguna arista debe cambiar de longitud. Si hay signos de los
dos tipos, entonces (como hay sólo dos cambios de signo) existe una "recta de
separación" que une los puntos medios de dos aristas y separa los signos + de
los signos -. De nuevo obtenemos una contradicción utilizando el lema que
presentarnos a continuación, ya que la recta de separación no puede ser a la
vez más larga y más corta en Q' que en Q. O
Lema de la poligon.al de Cauchy.
Si Q y Q' son n-ágonos convexos (planos o esféricos) etiquetados como en la
figura,
003 q2 oon-l _____
Q~... qn-l
002
ql qn
de tal manera que las longitudes de las aristas correspondientes verifican
qiqi+l = q~q~+l para 1 ~ i ~ n -1, y los ángulos correspondientes verifican
OOi ~ oo~ para 2 ~ i < n - 1, entonces la longitud de la arista "restante"
verifica
qlqn ~ q~ q~,
y la igualdad se da si y sólo si OOi = oo~ para todo i.
Aquí es interesante mencionar que la demostración original de Cauchy no era
correcta: un movimiento continuo que hace crecer los ángulos y mantiene
constantes las longitudes de los lados puede destruir la convexidad - ¡véase
la figura! Además, tanto el lema como la demostración presentada aquí, apa-
recidos en una carta de I. J. Schoenberg a S. K. Zaremba, son válidos tanto
para polígonos planos como esféricos.
111 Demostración.. Razonarnos por inducción sobre n. El caso n = 3 resulta
sencillo: si en un triángulo aumenta el ángulo I entre dos lados de longitudes
fijas a y b, entonces la longitud c del tercer lado también aumenta, según
demuestra el teorema del coseno
en el caso plano, y el resultado análogo
cos e = cos a cos b + sen a sen b cos I
El teorema de rigidez de Cauchy
en trigonometría esférica. Las a, b, e semiden en la de la
esfera de radio 1 y, por tanto, toman valores, en el intervalo [O, 7r].
Consideremos ahora n 2: 4. Si para algún i E {2, ... , n - 1} se verifica que
Oói = Oó~, el vértice correspondiente se puede eliminar insertando las diago-
1 d d "'fi ' , na es e qi-l a qi+l y e qi-l a qi+l' que ven can qi-l qi+l= qi-l qi+l' Y
podemos utilizar la hipótesis de inducción. Por tanto, podemos suponer que
Oói < Oó~ para 2 :::; i :::; n - 1.
Construimos un nuevo polígono Q* a partir de Q cambiando Oón-l por el ma-
yor ángulo posible Oó~_l :::; Oó~-l de fonna que Q* siga siendo convexo. Para
ello, reemplazamos qn por q~, manteniendo el resto de vértices qi' longitudes
de aristas y ángulos de Q.
Si se puede escoger Oó~_l = Oó~_l de manera que Q* siga siendo convexo,
se obtiene ql qn < ql q::' :::; q~ q~, utilizando el caso n = 3 para la primera
desigualdad e inducción, como anterionnente, para la segunda.
Si esto no es posible, después de un movimiento para el que se tiene
(1)
quedamos "bloqueados" en una situación en que q2' ql Y q~ son colineales, de
fonnaque
q2ql + ql q::' = q2q::,·
Comparando Q* y Q' obtenemos
q q* < q2' qn' 2 n
por inducción sobre n (ignorando los vértices ql y qD. Por tanto,
(2)
(3)
donde (*) es la desigualdad triangular y el resto de las desigualdades han sido
deducidas anterionnente. O
Hemos visto un ejemplo que demuestra que el teorema de Cauchy no es cierto
para poliedros no convexos. La característica especial del ejemplo es, eviden-
temente, un salto discontinuo que lleva un poliedro al otro, manteniendo las
caras congruentes mientras los ángulos diedros "saltan." Se puede preguntar
algo más:
¿Puede para algún poliedro no convexo, una deformación con-
tinua que mantenga las caras planas y congruentes?
Se había conjeturado que ninguna superficie triangulada, convexa o no, ad-
mitía tal movimiento. Por eso fue una gran sorpresa que en 1977 - más
de 160 años después del trabajo de Cauchy - Robert Connelly presentara
contraejemplos: esferas cerradas y trianguladas inmersas en ]Et3 (sin auto-
intersecciones) que son flexibles, con un movimiento continuo que mantiene
constantes las longitudes de las aristas y, por tanto, las caras triangulares con-
gruentes.
73
Q0
ql t qn
Q*:~ Oón - 1
--
ql q~
74
Un precioso ejemplo de superficie flexi-
ble construido por Klaus Steffen: las lí-
neas discontinuas representan las aristas
no convexas en este desarrollo del po-
liedro. Doble las líneas continuas como
"montañas" y las discontinuas como
"valles". Las aristas del modelo tienen
longitudes 5, 10, 11, 12 Y 17 unidades.
/
/
/
, /
"""-, '
Y-, /\- -,
,/' \ -----.
,
\
\ ,
\
\
El teorema de rigidez de Cauchy
-'---
La teoría de rigidez de superficies tiene todavía más sorpresas: recientemente
Idjad Sabitov consiguió demostrar que cuando estas superficies flexibles se
mueven, el volumen que encierran debe permanecer constante. Su demostra-
ción hace un uso muy elegante de herramientas algebraicas (fuera del alcance
de este libro).
[1] A. CAUCHY: Sur les polygones et les polyedres, seconde mémoire, J. École Poly-
technique XVle Cahier, Tome IX (1813), 87-98; CEuvres Completes, He Série,
Vol. 1, Paris 1905,26-38.
[2] R. CONNELLY: A counterexample to the rigidity conjecture for polyhedra, Inst.
Haut. Etud. Sci., Publ. Math. 47 (1978), 333-338.
[3] R. CONNELLY: The rigidity of polyhedral surfaces, Mathematics Magazine 52
(1979),275-283.
[4] I. KH. SABITOV: The volume as a metric invariant ofpolyhedra, Discrete Com-
put. Geometry 20 (1998), 405-425.
[5] 1. SCHOENBERG & S.K. ZAREMBA: On Cauchy's lemma conceming convex
polygons, Canadian J. Math. 19 (1967), 1062-1071.
¿ Cuántos en ]Rd de ma-
nera que en contacto dos a es que todas las intersec-
ciones dos a dos tengan dimensión (d - 1)?
Esta es una cuestión antigua y muy natural. Sea f (d) la solución de este
problema, y anotamos f(l) = 2. Para d = 2 la configuración de los cuatro
triángulos en el margen muestra que f(2) ?::: 4. No existe una configuración
similar con cinco triángulos, ya que la construcción dual de ésta - que en
nuestro ejemplo de los cuatro triángulos conduce a un dibujo plano de K4 -
proporcionaría un dibujo plano de K 5 , algo imposible (véase la página 67).
Por tanto, tenemos
f(2) = 4.
En tres dimensiones es fácil ver que f(3) ?::: 8. Para ello, utilizamos la confi-
guración de ocho triángulos que aparece a la derecha.
Los cuatro triángulos sombreados están unidos a un punto x por debajo del
'plano del dibujo", proporcionando cuatro tetraedros que tocan el plano desde
abajo. De manera similar, los cuatro triángulos blancos están unidos a un
punto y por encima del plano del dibujo. Por tanto, obtenemos una configura-
ción de ocho tetraedros en contacto en ]R3, esto es, f(3) ?::: 8.
f(2) 2: 4
En 1965, Baston escribió un libro en el que probaba que f(3) :::; 9, yen 1991 f(3) 2: 8
Zaks tuvo que escribir otro libro para establecer que
f(3) = 8.
Con f(l) = 2, f(2) = 4 Y f(3) = 8, no es necesaria mucha inspiración para
llegar a la siguiente conjetura, que formuló Bagemihl en 1956:
Conjetura. En una configuración de símplices de dimensión d en ]Rd, el
número máximo de pares en contacto es
La cota inferior, f (d) ?::: 2d , es fácil de verificar - si lo hacemos bien. Esto
nos conduce a usar reiteradamente transformaciones afines y un razonamiento
por inducción sobre la dimensión que establece el siguiente resultado, más
fuerte, que se debe a Joseph Zaks [4]:
Teorema 1. Para cada d ?::: 2, existe una familia de 2d símplices que están
en contacto dos a dos en ]Rd, junto con una recta transversal que interseca el
interior de cada uno de los símplices individuales. "Símplices en contacto"
76
(-l,l)T
---
(-1, -l)T (O, _l)T
: ,
,
A',
Símplices en contacto
• Demostración. Para d = 2 la familia de cuatro triángulos que habíamos
considerado tiene, efectivamente, dicha recta transversal.
Ahora consideremos cualquier configuración d-dimensional de símplices en
contacto y que tiene una recta transversal f!. Cualquier otra paralela cercana f!1
es también una recta transversal. Si elegimos f!1 y f! paralelas y suficientemente
cercanas, entonces cada uno de los símpliées ha de contener un intervalo orto-
gonal (más corto) que conecta ambas rectas.
Sólo una parte acotada de las rectas f! y f!1 está contenida en los símplices de la
configuración, y podemos añadir dos segmentos que las conecten fuera de la
configuración, de tal manera que el rectángulo determinado por los segmentos
extremos, es decir, su cierre convexo, contenga todos los demás segmentos
que conectan las rectas. De este modo, hemos colocado una "escalera", de
manera que cada símplice de la configuración tiene uno de los peldaños en su
interior, mientras que sus cuatro extremos quedan fuera de la configuración.
Ahora, el paso principal es llevar a cabo una tranformación (afín) de jRd en
jRd, Y que lleve el rectángulo que forma la escalera al rectángulo (la mitad de
un cuadrado, como se muestra en la figura) dado por
R1 = {(X1,X2,0, ... ,of:-1:S;X1:S;0;-1:S;X2:S;1}.
Por tanto, la configuración de símplices en contacto ~1 en jRd que obtenemos
tiene el eje Xl corno recta transversal, y está colocada de tal manera que cada
uno de los símplices contiene un segmento
en su interior (para algún a con -1 < a < O), mientras que el origen O queda
fuera de todos los símplices.
Ahora obtenemos una segunda copia ~2 de esta configuración reflejando la
primera respecto del hiperplano dado por Xl = X2. Esta segunda configu-
ración tiene al eje X2 como recta transversal, y cada símplice contiene un
segmento
S2({3) = {(X1,{3,0, ... ,0)T:-1:S;X1:S;1}
en su interior, con -1 < {3 < O. Pero cada segmento SI ( a) interseca a cada
segmento S2 ({3), y por tanto el interior de cada símplice de ~1 interseca a cada
símplice de ~2 en su interior. En consecuencia, si añadimos una coordenada
(d + l)-ésima, Xd+1, Y escogemos~ como
{conv(Pi U {-ed+1}) : Pi E ~1} U {conv(Pj U {ed+d): Pj E ~2},
obtenemos una configuración de (d + 1) símplices en contacto en jRd+ 1. Aún
más, la diagonal
A = {(x,-x,O, ... ,Of:XEjR} ~ jRd
interseca todos los segmentos SI ( a) y S2 ({3). Podernos "inclinarlo" un poco,
y obtener una recta
LE; = {(x, -x, 0, ... ,0, éX)T : X E jR} ~ jRd+l,
que para todo é > ° suficientemente pequeño interseca a todos los símplices
de ~. Esto completa el paso de inducción. D
Símplices en contacto
En contraste con esta cota infelior es más difícil encontrar cotas
superiores ajustadas.
Un argumento ingenuo por inducción (que considera por separado todos los
hiperplanos que contienen a facetas en una configuración en contacto) conduce
únicamente a
f(d) :::; ~(d + 1)!,
Y esto queda bastante lejos de la cota inferior del teorema 1. Sin embargo, Mi-
cha Perles encontró una demostración "mágica" para una cota mucho mejor:
Teorema 2. Para todo d 2: 1, se tiene f(d) < 2d+1 .
Demostración. Dada una configuración de r símplices de dimensión d
PI, P2 , ... ,Pr en contacto en ffi. d, enumeramos primero todos los diferentes
hiperplanos H I , H 2 , •.. , H s determinados por facetas de Pi. Para cada uno
de ellos escogemos de manera arbitraria un lado positivo H: ' y llamamos H i-
al otro lado.
Por ejemplo, la configuración 2-dimensional de r = 4 triángulos que aparece
a la derecha define s = 6 tales hiperplanos (que son rectas para d = 2).
A partir de estos datos, construimos la B -matriz, una matriz (r x s) con en-
tradas en { + 1, -1, O}, de la manera siguiente:
si Pi tiene una faceta en Hj , Y Pi ~ Ht,
si Pi tiene una faceta en H j , Y Pi ~ H j-,
si Pi no tiene una faceta en Hj.
Por ejemplo, la configuración 2-dimensional del margen da lugar a la matriz
(
-i B= -1
O
O
-1
1
-1
1
1
O
-1
O
O
1
O
1
O
O
O
Son dignas de mención tres de las propiedades de la B-matriz: en primer lugar,
puesto que cualquier símplice de dimensión d tiene d + 1 facetas, encontramos
que cualquier fila de B tiene exactamente d + 1 entradas distintas de cero, y
por tanto tiene exactamente s - (d + 1) entradas nulas. En segundo lugar,
estamos tratando con una configuración de símplices que están en contacto
dos a dos, y de ahí que para cada par de filas existe una columna en la cual una
de las filas tiene un + 1, mientras que en la otra fila tiene un -1. Esto es, las
filas son diferentes incluso si dejamos de considerar sus entradas nulas. En
tercer lugar, las filas de B "representan" los símplices Pi mediante
n n
Ahora, obtenemos a partir de B una nueva matriz e en la cual cada fila de B
queda reemplazada por todos los vectores fila que pueden generarse a partir
de ella cambiando todos los ceros por + 1 ó -1. Ya que cada fila de B tiene
s - d - 1 ceros, y B tiene r filas, la matriz e tiene 2s - d - I r filas.
77
78
La primera fila de la matriz e repre-
senta el triángulo sombreado, mientras
que la segunda fila corresponde a una in-
tersección vacía de los semiespacios. El
punto x lleva al vector
(1 -1 1 1 -1 1 )
que no aparece en la matriz e
Símplices en contacto
Para nuestro ejemplo, esta matriz C es una matriz (32 x 6) que comienza
1 1 1 1 1 1
1 1 1 1 1 -1
1 1 1 -1 1 1
1 1 1 -1 1 -1
1 -1 1 1 1 1
C= 1
-1 1 1 1 -1
1 -1 1 -1 1 1
1 -1 1 -1 1 -1
-1 -1 1 1 1 1
-1 -1 1 1 1 -1
donde las primeras ocho filas de C se derivan de la primera fila de B, las
segundas ocho columnas provienen de la segunda fila de B, etc. Ahora, la
cuestión es que todas las filas de C son diferentes: Si dos filas se derivan de
la misma fila de B, entonces son diferentes ya que sus ceros han sido reem-
plazados de manera diferente; si derivan de filas diferentes de B, entonces son
diferentes, sin importar cómo hayan sido reemplazados los ceros.
Pero las filas de C son vectores de longitud s con entradas ±1, y existen
únicamente 28 vectores diferentes de este tipo. Por tanto, y ya que las filas
de C son distintas, la matriz C puede tener a lo sumo 28 filas, es decir,
28 - d - 1r ~ 28 .
Sin embargo, en C no aparecen todos los (±1)-vectores, lo cual conduce a una
desigualdad estricta 28-d-1 r < 28 , Y portanto r < 2 d+1 . Para ver esto, nótese
que cada fila de C representa una intersección de semi espacios - exactamente
como para las filas de B en el caso anterior, mediante la fórmula (*).
Esta intersección es un subconjunto del símplice Pi, que vino dado mediante
la correspondiente fila de B. Tomemos un punto x E lR.d que no esté en
ninguno de los hiperplanos H j , y tampoco en ninguno de los símplices Pi. A
partir de este x obtenemos un vector con entradas ±1 que indica para cada j si
x E Ht o x E H j-. Este (±1 )-vector no aparece en C, porque la intersec-
ción correspondiente de semiespacios contiene a x, de acuerdo con (*), y por
tanto no está contenido en ningún símplice Pi. O
[1] F. BAGEMIHL: A conjecture conceming neighboring tetrahedra, Amer. Math.
Monthly 63 (1956) 328-329.
[2] V. J. D. BASTON: Some Properties of Polyhedra in Euclidean Space, Pergamon
Press, Oxford 1965.
[3] M. A. PERLES: At most 2d+1 neighborly simplices in E d , Annals of Discrete
Math. 20 (1984), 253-254.
[4] J. ZAKS: Neighborly families of 2d d-simplices in E d , Geometriae Dedicata 11
(1981),279-296.
[5] J. ZAKS: No Nine Neighborly Tetrahedra Exist, Memoirs Amer. Math. Soco
No. 447, Vol. 91, 1991.
Alrededor de 1950 Paul Erd6s conjeturó que cualquier conjunto de más de 2d
puntos en R d determina al menos un ángulo obtuso, es decir, un ángulo mayor
que ~. En otras palabras, si un conjunto de puntos en R d tiene sólo ángulos
agudos y rectos, entonces tiene como mucho 2d puntos. Este problema fue
propuesto en un concurso por la Dutch Mathematical Society - pero sólo se
recibieron soluciones para d = 2 Y d = 3.
Para d = 2 el problema es sencillo: los cinco puntos pueden determinar un
pentágono convexo, que siempre tiene un ángulo obtuso (de hecho, al menos
un ángulo de al menos 108°). En otro caso, existe un punto contenido en
el triángulo que definen otros tres, y dicho punto "ve" a las tres aristas del
triángulo según tres ángulos que suman 360° , por lo que alguno de ellos es al
menos de 120°. (El segundo caso incluye las configuraciones con tres puntos
colineales y, por tanto, con un ángulo de 180°.)
De manera independiente, Victor Klee preguntó poco después - y Erd6s di-
fundió la pregunta - cuántos puntos puede tener un conjunto de R d mante-
niendo la siguiente "propiedad antipodal": para cualquier par de puntos en el
conjunto existe una banda (acotada por dos hiperplanos paralelos) que con-
tiene al conjunto, y que tiene a los dos puntos en hiperplanos distintos.
En 1962, Ludwig Danzer y Branko Grünbaum consiguieron resolver los dos
problemas simultáneamente: encerraron los dos tamaños máximos en una ca-
dena de desigualdades, que comienza y termina en 2d . Por tanto, la respuesta
es 2d tanto para el problema de Erd6s como para el de Klee.
En lo que sigue consideramos conjuntos (finitos) de puntos contenidos en
Sr;;;; Rd , sus envolventes convexas conv(S) y, en general, politopos convexos
Q r;;;; R d. (Véase el apéndice sobre politopos en la página 50 para un resumen
de los conceptos básicos). Suponemos que los conjuntos tienen dimensión d,
es decir, no están contenidos en un hiperplano. Dos conjuntos convexos se
tocan si tienen al menos un punto de la frontera en común, pero sus interiores
son disjuntos. Para un conjunto Q r;;;; R d y un vector s E R d denotamos por
Q + s la imagen de Q por la traslación que envía O a s. De manera similar,
Q - s es el conjunto que se obtiene al aplicar a Q la traslación que lleva s al
origen.
No se asuste: este capítulo es una excursión a la geometría d-dimensional,
sin embargo los argumentos que utilizaremos no necesitan ninguna "intuición
d-dimensional" ya que todos ellos pueden ser seguidos, visualizados (y, por
tanto, comprendidos) en dimensión tres, e incluso en elplano. Por tanto, los
dibujos ilustrarán la demostración para d = 2 (donde un "hiperplano" es sen-
cillamente una recta), y el lector podrá hacer sus propios dibujos para d = 3
(donde un "hiperplano" es un plano).
1
o- --
80 Cualquier conjunto con muchos puntos tiene un ángulo obtuso
Teorema 1. La siguiente cadena de desigualdades se verifica para cualquier
dimensión d:
(2) { ::; max #8
(3) max{ #8
8 <;;; ]Rd tales que para cualquier par de puntos}
{Si,Sj} <;;; S existe una banda S(i,j) que contiene
a 8 y que tiene a Si y Sj en hiperplanos distintos de
lafrontera de S( i, j).
8 <;;; ]Rd tales que los trasladados P - Si, Si E 8, de}
la envolvente convexa P := conv(8) tienen un punto
en común, pero sólo se tocan.
(4) { 18 <;;; ]Rd tales que los trasladados Q + Si de algÚn}
< max #8 politopo convexo d-dimensional Q <;;; ]Rd se tocan dos
a dos.
(5) { = max #8
(6) d
::;2
8 <;;; ]Rd tales que los trasladados Q* + Si de algÚn}
politopo convexo d-dimensional y centralmente simé-
trico Q* <;;; lEtd se tocan dos a dos.
• Demostración. Tenemos que comprobar un total de seis igualdades y des-
igualdades. Comencemos.
(1) Sea 8 := {O, l}d el conjunto de vértices del cubo unitario en ]Rd, y con-
sideremos Si, S j , S k E 8. Por simetría, podemos suponer que s j = O es el
vector nulo. Por tanto, el ángulo está determinado por
( )
(Si, Sk)
cos<l Si,Sj,Sk = 1 .11 l'
S~ .Sk
que es claramente mayor o igual que cero. En consecuencia, 8 es un conjunto
de cardinal 2d que no tiene ángulos obtusos.
(2) Para Si, Sj E S consideramos el hiperplano Hij que pasa por el origen y
es ortogonal a la arista [Si, Sj], es decir, Hij = {x E]Rd : (x, Si-Sj) = O}
Y denotamos por Hij + S j el hiperplano paralelo que pasa por S j, es decir,
Hij + Sj = {x + Sj : x E H ij }. Por tanto, Hij + Si Y Hij + Sj son hiper-
planos paralelos que pasan por Si y Sj, respectivamente, y son ortogonales a
la arista [Si, Sj]. Obsérvese que la banda delimitada por Hij + Si Y Hij + Sj
contiene, además de los puntos Si y Sj, exactamente todos los puntos x E ]Rd
tales que los ángulos <l(Si,Sj,X) y <r(Sj,Si,X) no son obtusos. Podemos
concluir entonces que si 8 no contiene ángulos agudos, la banda limitada por
los hiperplanos Hij + Si Y Hij + Sj contiene todos los puntos de 8.
(3) P está contenido en el semiespacio definido por Hij + S j que contiene a
Si si y sólo si P - Sj está contenido en el semiespacio definido por Hij que
contiene a Si - S j: la propiedad "un objeto está contenido en un semiespacio"
no cambia si el objeto y el semiespacio sufren la misma traslación (en este
caso, de vector -Sj). De manera similar, P está contenido en el semiespacio
definido por Hij + Si que contiene a S j si y sólo si P Si está contenido en
el semiespacio definido por Hij que contiene a S j - Si.
Cualquier conjunto con muchos puntos tiene un ángulo obtuso
Combinando ambos vemos que un P está contenido en la
banda definida por Hij + Si Y Hij + Sj si y sólo si P - Si Y P - Sj están en
lados diferentes del hiperplano Hij.
La figura del margen ilustra esta correspondencia.
Además, de Si E P = conv(S) se deduce que el origen está contenido en
todos los trasladados P - Si (Si E S). Por tanto, los conjuntos P - Si se
intersecan en el origen, pero sólo se tocan: los interiores son disjuntos dos a
dos, ya que están en lados distintos del correspondiente hiperplano Hij.
Esto es inmediato: "los trasladados se tocan dos a dos" es una afirmación
más débil que "se intersecan en un punto, pero sólo se tocan." De manera simi-
lar, podemos relajar la condición permitiendo que P sea un politopo convexo
arbitrario de JP;.d y reemplazar S por -S.
(5) Aquí "2" es trivial, pero no es el resultado que nos interesa. Debemos
comenzar con una configuración S ~ JP;.d Y cualquier politopo d-dimensional
Q ~ JP;.d tal que los trasladados Q + Si (Si E S) se tocan dos a dos. Veamos
que en esta situación podemos utilizar
Q* := g(x - y) E JP;.d : x, y E Q}
en lugar de Q. No es difícil: en primer lugar, Q* es d-dimensional, convexo
y centralmente simétrico. Se puede comprobar que Q* es un politopo (sus
vértices son de la forma ~ (qi - qj)' donde qi' qj son vértices de Q), pero esto
no es importante para nosotros.
A continuación demostraremos que Q + Si Y Q + Sj se tocan si y sólo si
Q* + Si Y Q* + Sj se tocan. Para ello, observamos, siguiendo los pasos de
Minkowski, que
(Q*+Si) n (Q* + Sj) #- 0
:3 I " I " Q. 1 (1 ") _ 1 (1 ") -{==? qi' qi' qj' qj E . 2" qi - qi + Si - 2" qj - qj + Sj
"Cl I " I " Q. 1 (1 ") _ 1 (1 ") -{==? ::J qi) qi ,qj) qj E . 2" qi + qj + Si - 2" qj + qi + Sj
-{==? :3qi) qj E Q : qi + Si = qj + Sj
donde en la tercera (y crucial) equivalencia "-{==?" hemos utilizado que todo
q E Q se puede escribir como q = ~ (q + q) para obtener "~", y que Q es
t t I ( I + ") 1 ( I + ") Q bt "" convexo y, por an o, 2" qi qj' 2" qj qi E para o ener =?- .
Por tanto, el paso de Q a Q* (conocido como simetrización de Minkowski)
conserva la propiedad de que dos trasladados Q + Si Y Q + S j se intersecan.
Es decir, hemos demostrado que para cualquier convexo Q, dos trasladados
Q + Si Y Q + Sj se intersecan si y sólo si los trasladados Q* + Si Y Q* + Sj
se intersecan.
La siguiente caracterización demuestra que la simetrización de Minkowski
también conserva la propiedad de que dos trasladados se tocan:
Q + Si Y Q + Sj se tocan si y sólo si se intersecan; además, Q + Si
Y Q + Sj + E(Sj - Si) no se intersecan para ningún E> O.
81
82
Factordeescala~, vol(Pj) = ivo1(p)
Cualquier conjunto con muchos puntos tiene un ángulo obtuso
Supongamos que Q* + Si Y
intersección
se tiene que
+ Sj se tocan. Para cualquier punto de la
x - Si E Q* y x - Sj E Q*,
por tanto, como Q* es centralm:ente simétrico,
y, como Q* es convexo,
Hemos demostrado que ~ (Si + Sj) está contenido en Q* + Sj para todo i. Por
tanto, para P := conv(S) obtenemos
Pj := ~(P + Sj) = conv g(Si + Sj) : Si E S} ~ Q* + Sj,
de donde se deduce que los conjuntos Pj = ~ (P + S j) sólo se pueden tocar.
Finalmente, los conjuntos Pj están contenidos en P, ya que los puntos Si, Sj
y ~ (Si + S j) están en P por ser P convexo. Los conjuntos Pj son copias
trasladadas y escaladas de P, contenidas en P. El factor de escala es ~, de
donde se deduce que 1
vol(Pj) = 2dvo1(P),
ya que se trata de conjuntos de dimensión d. Esto quiere decir que en P caben,
como mucho, 2d conjuntos P j y, por tanto, ISI :::; 2d .
Con esto terminamos la demostración, ya que hemos cerrado la cadena de
desigualdades. O
... pero la historia no termina aquí. Danzer y Grünbaum hicieron la siguiente
pregunta natural:
¿ Qué ocurre si se pide que todos los ángulos sean en lugar
de no obtusos, es decir, si se prohíben también los ángulos rectos?
Danzer y Grünbaum construyeron configuraciones de 2d - 1 puntos en IFtd
que sólo tenían ángulos agudos, y conjeturaron que éste era el mayor tamaño
posible. Grünbaum demostró que esto es cierto para d :::; 3. Pero veintiún años
después, en 1983, Paul Erdos y Zoltan Füredi demostraron que la conjetura es
falsa - ¡por mucho, si la dimensión es alta! Su demostración es todo un
ejemplo magnífico de la potencia de los argumentos probabilísticos; véase el
capítulo 35 para una introducción al "método probabilístico." Nuestra versión
de la demostración utiliza pequeñas mejoras en la elección de los parámetros
debidas a nuestro lector David Bevan.
Teorema 2. Para todo d ::::: 2 existe un conjunto S ~ {O, l}d de 2l v;: (~) d J
puntos en IFtd (vertices del cubo unitario d-dimensional) que determinan sólo
ángulos agudos.
En particular, en dimensión d = 34 existe un conjunto de 72 > 2·34 - 1
puntos que sólo tiene ángulos agudos.
Cualquier conjunto con muchos puntos tiene un ángulo obtuso
• Demostración. Sea m : = l V; ( ~ ) d J y obtengamos 3m vectores
x(l), x(2), . .. , x(3m) E {O, l}d
seleccionando sus coordenadas del conjunto {O, 1}, de manera aleatoria e
independiente y conprobabilidad ~ para cada alternativa. (Se puede tirar una
moneda 3md veces para ello; sin embargo, si d es grande esto puede resultar
un poco aburrido.).
Hemos visto anteriormente que todos los ángulos determinados por vecto-
res 0/1 no son obtusos. Por otra parte, tres vectores x(i), x(j), x(k) for-
man un ángulo recto con vértice en x(j) si y sólo si el producto escalar
(x(i) - x(j), x(k) - x(j)) se anula, es decir, si se tiene que
x(i)g - x(j)g = O o x(k)g - x(j)g = O para cada coordenada f!.
Llamamos a (i,j, k) una terna mala si esto ocurre. (Si x(i) = x(j) ó
x(j) = x(k), el ángulo no está definido pero la tema (i,j, k) es claramente
mala.)
La probabilidad de que una tema fija sea mala es exactamente (~) d: la tema
será buena si y sólo si para una de las d coordenadas f! se tiene
bien
o bien
x(i)g = x(k)g = O,
x(i)g = x(k)g = 1,
x(j)g = 1,
x(j)g = O.
Esto nos deja un total de seis posibilidades malas de un total de ocho igual-
mente probables, y una tema será mala si y sólo si ocurre una de las opciones
malas (con probabilidad ~) para cada una de las d coordenadas.
El número de temas que tenemos que considerar es 3 e;;n), ya que hay e;;n)
conjuntos de tres vectores y en cada uno de ellos tenemos tres posibles vérti-
ces. Por supuesto, las probabilidades de que distintas temas sean malas no son
independientes, pero la linealidad de la esperanza (que es lo que se obtiene
al hacer el promedio entre todas las posibles selecciones, véase el apéndice)
dice que la esperanza del número de temas malas es exactamente 3 (3;;n) (~) d.
Esto quiere decir - y es en este punto cuando el método probabilístico mues-
tra su potencia - que hay alguna elección de los 3m vectores para la que hay
como mucho 3 (3;;n) (~)d temas malas, donde
de acuerdo con nuestra elección de m.
Pero si no hay más de m temas malas, podemos eliminar m de los 3m vectores
x (i) de forma que los restantes 2m vectores no contengan ninguna tema mala,
es decir, determinen sólo ángulos agudos. O
La "construcción probabilística" de un conjunto grande de puntos con coor-
denadas 0/1 Y sin ángulos rectos se puede implementar fácilmente, utilizando
un generador de números aleatorios para "tirar la moneda." David Bevan ha
construido de esta forma un conjunto de 31 puntos en dimensión d = 15 que
sólo determina ángulos agudos.
83
84 Cualquier conjunto con muchos puntos tiene un ángulo obtuso
Presentamos aquí tres herramientas básicas de la teoría de la probabilidad dis-
creta que aparecerán en varias ocasiones: las variables aleatorias, la linealidad
de la esperanza y la desigualdad de Markov.
Sea (D, p) un espacio de probabilidad finito, es decir, D es un conjunto finito y
p = Prob es una aplicación de D en el intervalo [0,1] tal que ¿wESl p(w) = 1.
Una variable aleatoria X en D es una aplicación X : D -----+ R Un espacio de
probabilidad sobre el conjunto X(D) se construye definiendo
p(X = x) := ¿X(w)=xp(w). Un ejemplo sencillo es un dado equilibrado (es
decir, p(w) = i) con X = "el número obtenido cuando se tira el dado."
La esperanza EX de X es el promedio, es decir,
EX = L p(w)X(w).
wESl
Si X e Y son dos variables aleatorias en D, la suma X + Y es también una
variable aleatoria, y se tiene que
E(X + Y) LP(w)(X(w) + Y(w))
w
LP(w)X(w) + p(w)Y(w) = EX + EY.
w w
Esta propiedad se puede extender fácilmente a cualquier combinación lineal
finita de variables aleatorias - propiedad conocida como linealidad de la
esperanza. Obsérvese que no es preciso que las variables aleatorias sean "in-
dependientes" en ningún sentido.
La tercera herramienta es válida para variables aleatorias X que toman sólo
valores no negativos, lo que escribimos como X ;::: O. Sea
Prob(X;::: a) = L p(w)
w:X(w)2:a
la probabilidad de que X sea mayor o igual que cierto a > O. Entonces
EX L p(w)X(w) + L p(w)X(w) > a L p(w),
w:X(w)2:a w:X(w)<a
y hemos demostrado la desigualdad de Markov
EX
Prob(X ;::: a) :::::
a
w:X(w)2:a
[1] L. DANZER & B. GRÜNBAUM: Über zwei Probleme bezüglich konvexer Korper
von P. Erdos und von V. L. Klee, Math. Zeitschrift 79 (1962), 95-99.
[2) P. ERDÓS & Z. FÜREDI: The greatest angle among n points in the
d-dimensional Euclidean space, Annals of Discrete Math. 17 (1983), 275-283.
[3) H. MINKOWSKI: Dichteste gitterformige Lagerung kongruenter Korper, Nachri-
chten Ges. Wiss. Géittingen, Math.-Phys. Klasse 1904, 311-355.
El artículo que Karol Borsuk publicó en 1933, con el título "Three theorems on
the n-dimensional euclidean sphere", tiene bastante fama porque contiene un
importante resultado (conjeturado por Stanislaw Ulam) que ahora se conoce
como el teorema de Borsuk-Ulam:
Cualquier aplicación continua f : Sd --+ ]R.d lleva dos puntos antipo-
dales de la esfera Sd al mismo punto en rn;d.
El mismo artículo también es famoso por un problema propuesto al final, que
se conoce como la conjetura de Borsuk:
Para S ~ ]R.d de diámetro acotado diam(S) > O,
¿puede encontrarse una partición en, a lo sumo, d + 1 partes
de menor diámetro?
La cota d + 1 es la menor posible: si S es un símplice regular de dimensión d,
o sencillamente el conjunto de sus d + 1 vértices, entonces ningún conjunto
de una partición que reduzca el diámetro puede contener más de un vértice.
Siendo f(d) el menor número tal que cualquier conjunto acotado S c:: ]R.d
admite una particion en f (d) partes de menor diámetro, el símplice regular
demuestra que f (d) 2 d + 1.
La conjetura de Borsuk fue probada para el caso en que S es una esfera (por el
mismo Borsuk), para cuerpos lisos (usando el teorema de Borsuk-Ulam), para
d :S 3, ... pero el caso general permanecía abierto. La mejor cota superior
para f (d) fue dada por Oded Schramm, quien demostró que
f(d) :S (1.23)d
para d suficientemente grande. Esta cota parece débil en comparación con la
conjetura "f(d) = d + 1", pero en 1993 de pronto se convirtió en razonable
cuando Jeff Kahn y Gil Kalai refutaron la conjetura de Borsuk de manera muy
sorprendente. Sesenta años tras la publicación del artículo de Borsuk, Kahn y
Kalai probaron que f(d) 2 (1.2)Vd para d suficientemente grande.
Una versión de El Libro de la demostración de Kahn y Kalai fue dada por
A. Nilli. De manera breve, y sin hacer referencia a otros teoremas, proporciona
un contraejemplo explícito de la conjetura de Borsuk en dimensión d = 946.
Presentamos una modificación de esta demostración, dada conjuntamente por
Andrei M. Raigorodskii y Bernulf WeiBbach, que reduce la dimensión hasta
d = 561 (y se puede llegar incluso a d = 560). El "récord" actual es d = 298,
conseguido por Aicke Hinrichs y Christian Richter en el 2002.
Karol Borsuk
Cualquier símplice de dimensión d
puede descomponerse en d + 1 partes,
todas ellas de menor diámetro.
86
A. Nilli
X
T (1 -1 -1 1
(
1 -1 -1 1
-1 1 1-1
xxT = -1 1 1-1
1 -1 -1 1
-1 1 1-1
-1)
-i)
-1
1
La conjetura de Borsuk
Teorema. Sea q = pm la de un n := - 2, Y d := G) =
(2q - 1)(4q 3). Entonces existe un conjunto S <:;;; {+1, -l}d de 2n- 2
puntos en lRd tal que cualquier partición de S en partes de menor diámetro
que S tiene, al menos,
partes. Para q = 9 se sigue que la conjetura de Borsuk es falsa en dimensión
d = 561. Aún más, f(d) > (1.2)01 para d suficientemente grande.
11 Demostración. El conjunto S se construye en cuatro pasos.
Sean q la potencia de un primo, n = 4q - 2 y
Q := {x E {+l,-l}n: xl = 1, #{i: Xi = -l}espar},
un conjunto de 2n - 2 vectores enlRn . Veremos que (x, y) == 2 (mod4) se veri-
fica para todos los vectores x, y E Q. Diremos que x, y son casi-ortogonales
si I(x, 1= 2, Y probaremos que cualquier Q' <:;;; Q que no contiene vectores
casi-ortogonales es "pequeño": IQ'I S ¿;::;g (n~l).
(2) A partir de Q, construimos el conjunto
R := {xxT:XEQ}
de 2n-2 matrices simétricas n x n de rango 1. Las interpretamos como
vectores de n 2 componentes, R <:;;; lRn2 . Probaremos que entre estos vecto-
res sólo hay ángulos agudos: tienen productos escalarespositivos (cuyo valor
al menos es 4). Además, si R' <:;;; R no contiene dos vectores cuyo producto
escalar es 4, entonces IR'I es "pequeño": IR'I S ¿;::;g (n~l).
y
En nuestra notación, los vectores x, y, ... son vectores columna y los
vectores transpuestos x T , yT, ... son vectores fila. El producto de ma-
trices xxT es una matriz de rango 1, con (XXT)ij = XiXj.
Si x, y son vectores columna, entonces su producto escalar es
(x,y) = LXiYi =
También necesitaremos productos escalares para matrices X, Y E
lRnxn que se pueden interpretar como vectores de longitud n 2 . Por
tanto, su producto escalar es
(X, Y) .- L XijYij'
i,j
La conjetura de Borsuk
A partir de R, obtenemos el conjunto de puntos en lR. G) cuyas coordenadas
son las "entradas subdiagonales" de las matrices correspondientes:
De nuevo, el conjunto S tiene 2n - 2 puntos. La distancia máxima entre estos
puntos se obtiene precisamente para los vectores casi-ortogonales x, y E Q.
Concluimos que un subconjunto S' c::; S de menor diámetro que S ha de ser
"pequeño": IS'I :S ¿i~g (n~l).
Del apartado (3) deducimos que cualquier partición de S que reduzca el
diámetro necesita al menos
g(q) .-
partes. En consecuencia,
f(d) 2 max{g(q) , d + 1} para d = (2q - 1)(4q - 3).
Por tanto, si 9 (q) > (2q - 1) (4q - 3) + 1, entonces existe un contraejemplo
para la conjetura de Borsuk en dimensión d = (2q - 1) ( 4q - 3). En particular,
g(9) > 56210 proporciona para d = 561. Además, veremos que
e (27)q
g(q) > 64q2 16 '
lo cual lleva a la cota asintótica f( d) > (1.2) Vd para d suficientemente grande.
Detalles de (1): Empezamos con unas consideraciones sobre divisibilidad.
Lema. Lafunción P(z) := (~:::;) es un polinomio de grado q - 2 cuyo valor
numérico es entero para todo entero z. El entero P(z) es divisible entre p si y
sólo si z no es congruente con O o con 1 módulo q .
• Demostración. Escribimos el coeficiente binomial P(z) de la forma
P(z) = (
z - 2) =
q-2
(z - 2)(z - 3) ..... (z - q + 1)
(q-2)(q-3)· ...... ·2·1
y comparamos el número de veces que aparece el factor p en el denominador
y en el numerador. En el denominador aparece el mismo número de veces que
en (q - 2)!, o en (q -1)!, ya que q -1 no es divisible entre p. Es más, según la
afirmación del margen, en cualquier producto de q -1 enteros, escogidos cada
uno de una clase diferente de residuos módulo q distinta de cero, el factor p
aparece el mismo número de veces.
Si z es congruente con O ó 1 (modq), entonces también lo es el numerador:
Todos los factores en el producto pertenecen a clases de residuos diferentes, y
las únicas clases que no aparecen son la clase del O (los múltiplos de q) y la
clase, o bien del -1, o del +1, pero ni +1 ni -1 son divisibles entre p. Por
tanto, el factor p aparece el mismo número de veces en el denominador y en
el numerador, y de aquí que el cociente no sea divisible entre p.
87
Afirmación. Si a == b -=¡É O (modq), en-
tonces el factor p aparece en a y b el
mismo número de veces.
111 Demostración. Por congruencia, se
verifica que a = b + spm, donde b no
es divisible entre pm = q. Por lo tanto,
podemos afirmar que cualquier potencia
pk que divide a b verifica que k < m, y
en consecuencia también divide a a. Lo
mismo es cierto si intercambiamos los
papeles de a y b. D
88 La conjetura de Borsuk
Por otra parte, si z t=- O, 1 (mod q), entonces en el numerador de (*) aparece
un factor que es divisible entre q = pm. Al mismo tiempo, en este producto
faltan factores de dos clases de residuos adyacentes no nulas: uno representa a
números que no contienen ningún factor p, y el otro tiene menos factores p que
q = pm. Por tanto, hay más factores p en el numerador que en el denominador,
y el cociente resulta ser divisible entre p. . D
Ahora consideremos cualquier subconjunto Q' ~ Q que no contenga vectores
casi-ortogonales. Queremos llegar a que Q' ha de ser "pequeño".
Tlrlrnacw'n 1. Si x, y son vectores distintos de Q, entonces i ((x, y) + 2)
es un entero que satisface
-(q-2) :::; ~((x,y)+2) :::; q-1.
Tanto x como y tienen un número par de componentes -1, de modo que el
número de componentes en las cuales difieren también es par. Por tanto,
(x, y) = (4q - 2) - 2#{i : Xi -=1- Yi} == -2 (mod4)
para todo x, y E Q, es decir, ~((x, y) + 2) es un entero.
Puesto que x, y E {+1, _1}4q -2, sabemos que -(4q-2) :::; (x, y) :::; 4q-2,
esto es, -(q-1):::; i((x,y) +2):::; q. Nunca se dala igualdad de la cota
inferior, ya que Xl = Yl = 1 implica que x -=1- -y. La igualdad en la cota
superior sólo se da si x = y.
Afirmación 2. Para cualquier y E Q', el polinomio de grado q - 2
en n variables Xl, ... , X n dado por
Fy(x) := p(~((x,y)+2)) = (~((X,Y)+2)-2)
q-2
cumple que Fy(x) es divisible entre p para cada x E Q'\{y}, pero
no para x = y.
Los valores del polinomio F y (x) son siempre enteros, ya que viene expresado
por un coeficiente binomial. Para x = y, obtenemos Fy(Y) = 1. Para x -=1- y,
dellema se deduce que Fy (x) no es divisible entre p si y sólo si ~ ( (x, y) + 2)
es congruente con O ó 1 (modq). Por la afirmación 1, esto ocurre sólo si
~ ((x, y) + 2) es O ó 1, esto es, si (x, y) E {-2, +2}. Para ello, x e y han de
ser casi-ortogonales, lo cual contradice la definición de Q'.
Afirmación 3. Lo mismo es cierto para los polinomios F y (x) en
las n - 1 variables X2, ... ,Xn obtenidos como sigue: Se expande
Fy (x) en monomios, se elimina Xl. y se reducen todas las potencias
superiores de las demás variables substituyendo Xl = 1 Y x; = 1
para i > 1. El grado de F y (x) es, como máximo, q - 2.
Los vectores x E Q ~ {+ 1, _l}n satisfacen Xl = 1 Y x; = 1. Por tanto, las
substituciones no cambian los valores de F y (x) en el conjunto Q. Tampoco
aumentan el grado, con lo cual el grado de F y (x) es a lo sumo q - 2.
Afirmación 4. No existe ninguna relación lineal (con coeficientes
racionales) entre los polinomios F y(x) para y E Q', es decir, son
linealmente independientes sobre 1Ql. En particular, son distintos.
La conjetura de Borsuk
Supongamos que exista una relación de la forma ¿YEQ' ayF y (x) = O tal
que no todos los coeficientes ay son cero. Tras multiplicar por un escalar
apropiado, podemos suponer que los coeficientes son enteros, pero no todos
ellos divisibles entre p. En este caso, para todo y E Q' la evaluación en
x := y conduce a que ayF y(y) es divisible entre p, y de aquí que haya de
serlo ay, ya que F y(y) no lo es.
j"fl'w,'lu~i¡iln 5. IQ'I está acotado por el número de monomios libres
de cuadrados en n - 1 variables y de grado a lo sumo q - 2, es decir,
por ¿¡::g (n~l).
Por construcción, los polinomios F y son libres de cuadrados: ninguno de
sus monomios contiene una variable de grado mayor que 1. Por tanto, cada
F y (x) es una combinación lineal de monomios libres de cuadrados de grado
a lo sumo q - 2 en las n - 1 variables X2, . .. , X n . Puesto que los polinomios
F y (x) son linealmente independientes, su número (que es I Q'I) no puede ser
mayor que el número de monomios en cuestión.
Detalles de (2): La primera columna de xxT es x. Por tanto, para distintos
x E Q obtenemos matrices distintas M(x) := xxT . Interpretamos estas
matrices como vectores de longitud n2 de componentes XiXj. El cálculo
n n
(M(x),M(y)) :L 'L,(XiXj) (YiYj)
i=l j=l
(x, y)2 > 4
muestra que el producto escalar de M (x) Y M (y) se minimiza si y sólo si
x, y E Q son casi-ortogonales.
Detalles de (3): Sea U (x) E {+ 1, -1 } d el vector cuyas componentes son
las entradas que aparecen por debajo de la diagonal en M (x). Puesto que la
matriz M (x) = xxT es simétrica y los valores de la diagonal son + 1, vemos
que M(x) =1= M(y) implica U(x) =1= U(y). Aún más,
4 ~ (M(x), M(y)) = 2(U(x), U(y)) + n,
esto es, n
(U(x), U(y)) ~ -"2 + 2,
y la igualdad se da si y sólo si x e y son casi-ortogonales. Puesto que todos
los vectores U(x) E S tienen la misma longitud V(U(x), U(x)) = Iff),
la distancia máxima entre puntos U (x), U (y) E S sealcanza exactamente
cuando x e y son casi-ortogonales.
Detalles de (4): Para q = 9 tenemos g(9) :=::ó 758.31, que es mayor que
d + 1 = e24) + 1 = 562.
Con el fin de obtener una cota general para d grande, usamos la monotonía y
unimodalidad de los coeficientes binomiales, y las estimaciones n! > e( -;)n
89
M(x) ~ ~1
90 La conjetura de Borsuk
y n! < en(:;;-)n (véase apéndice del capítulo 2) para deducir que
( 4q) ! e 4q (~) 4q
= q q!(3q)! < q e (;)q e en3q = 4q2 (256) q. e 27
De aquí concluimos que
f(d) 2 g(q)
A partir de esto y usando
d = (2q 1)(4q-3) = 5q2+(q-3)(3q-1) 25q2 paraq23,
q = ~ + V~ + l4 > [j, y (i~)V1 > 1.2032,
obtenemos
f(d) > 1;d(1.2032)v'd > (1.2)v'd parad suficientemente grande. O
Un contraejemplo en dimensión 560 se obtiene observando que para q = 9
el cociente g(q) R:ó 758 es mucho más grande que la dimensión d(q) = 561.
Por tanto, se obtiene un contraejemplo para d = 560 tomando únicamente los
"tres cuartos" de los puntos en S que satisfacen X21 + X31 + X32 = -1.
Se sabe que la conjetura de Borsuk es cierta para d ::; 3, pero no ha sido
verificada en ninguna dimensión mayor. En contraste, la conjetura sí es cierta
hasta dimensión d = 8 si nos restringimos a subconjuntos S ~ {1, _l}d como
los construidos aquí (véase [8]). En cualquier caso, es muy posible que puedan
encontrarse contraejemplos en dimensiones razonablemente pequeñas.
Referencias
[1] K. BORSUK: Drei Satze über die n-dimensionale euklidische Sphiire, Fundamenta
Math. 20 (1933),177-190.
[2] A. HINRICHS & C. RICHTER: New sets with large Borsuk numbers, Preprint,
February 2002,10 pages; Discrete Math., to appear.
[3] J. KAHN & G. KALAI: A counterexample to Borsuk's conjecture, Bulletin Amer.
Math. Soc. 29 (1993), 60-62.
[4] A. NILLI: On Borsuk's problem, in: "Jerusalem Combinatorics '93" (H. Barcelo
and G. Kalai, eds.), Contemporary Mathematics 178, Amer. Math. Soc. 1994,
209-210.
[5] A. M. RAIGORODSKII: On the dimension in Borsuk's problem, Russian Math.
Surveys (6) 52 (1997), 1324-1325.
[6] O. SCHRAMM: Illuminating sets of constant width, Mathematika 35 (1988),180-
199.
[7] B. WEISSBACH: Sets with large Borsuk number, Beitrage zur Algebra und
Geometrie/Contributions to Algebra and Geometry 41 (2000), 417-423.
[8] G. M. ZIEGLER: Coloring Hamming graphs, optimal binary codes, and the 0/1-
Borsuk problem in low dimensions, Lecture Notes in Computer Science 2122,
Springer-Verlag 2001,164-175.
Ii '" I
16
Conjuntos, funciones
y la hipótesis del continuo 93
17
Aquellas maravillosas
desigualdades 1 09
18
Un teorema de Pólya
sobre polinomios 117
19
Sobre un lema
de Littlewood y Offord 123
20
La cotangente
y el truco de Herglotz 127
21
La aguja de Buffon 133
"El hotel de Hilbert junto al mar"
La teoría de conjuntos, fundada por Georg Cantor en la segunda mitad del
siglo ha transformado profundamente las matemáticas, de fonna que en
la actualidad no tendrían sentido sin el concepto de conjunto o, en palabras
de David Hilbert: "Nadie nos hará salir del paraíso (de la teoría de conjuntos)
que Cantor ha creado para nosotros."
Uno de los conceptos básicos definidos por Cantor fue el tamaño o cardinal
de un conjunto M, denotado por INII. Para conjuntos finitos la definición no
presenta dificultades: se cuentan los elementos y se dice que M tiene cardi-
nal n si contiene n elementos. Por tanto, dos conjuntos finitos M y N tienen
igual cardinal si tienen el mismo número de elementos.
Para definir el concepto de igual tamaño para conjuntos infinitos, hacemos
el siguiente experimento mental para conjuntos finitos. Supongamos que un
grupo de personas quieren subir a un autobús. ¿Cuándo diremos que el nú-
mero de personas es el mismo que el número de asientos libres? Sencillo:
dejamos que las personas se sienten; si todas encuentran un asiento, y ningún
asiento queda vacío, entonces (y sólo entonces) diremos que los conjuntos (de
personas y de asientos) tienen igual tamaño. En otras palabras, el tamaño es
el mismo si existe una biyección entre los dos conjuntos. Georg Cantor
Esta es por tanto nuestra definición: se dice que dos conjuntos cualesquiera
M y N (finitos o infinitos) tienen el mismo tamaño o cardinal si y sólo si
existe una biyección entre M y N. Es evidente que la noción de igual tamaño
es una relación de equivalencia y, por tanto, podemos asociar un número, lla-
mado cardinal, a cada clase de conjuntos del mismo tamaño. Por ejemplo,
para conjuntos finitos obtenemos los cardinales O, 1, 2, ... ,n, ... donde n de-
nota la clase de los conjuntos de n elementos y, en particular, O denota al
conjunto vacío 0. Obsérvese que, evidentemente, un subconjunto propio de
un conjunto finito M tiene siempre tamaño menor que M.
La teoría se vuelve mucho más interesante (y bastante contraria a la intui-
ción) cuando damos el salto a conjuntos infinitos. Consideremos el conjunto
N = {l, 2, 3, ... } de los números naturales. Diremos que un conjunto M
es numerable si se puede establecer una biyección entre M y N. En otras
palabras, M es numerable si se pueden escribir sus elementos en una lista
mI, m2, m3, . .. Nos encontramos ahora con un fenómeno extraño. Suponga-
mos que añadimos.a N un nuevo elemento x. Entonces, N U {x} sigue siendo
numerable y, por tanto, ¡del mismo tamaño que N!
El "hotel de Hilbert" es una ilustración muy atractiva de este hecho. Supon-
gamos que un hotel tiene una cantidad numerable de habitaciones, llamadas
1,2,3, ... , de forma que el cliente Ci ocupa la habitación i; por tanto, el hotel
está completo. Llega un nuevo cliente x en busca de habitación y el director
1
94
x
Conjuntos, funciones y la hipótesis del continuo
del hotel le dice: Lo siento, todas las habitaciones están ocupadas. No hay
problema, le contesta el recién llegado, cambie al cliente Cl a la habitación 2,
a C2 a la 3, a C3 a la 4, y así sucesivamente, y yo me quedaré con la 1. Ante la
sorpresa del director (que no es matemático) la idea funciona; sigue pudiendo
alojar a todos los clientes, ¡más el recién llegado x!
Ahora está claro que también podemos alojar a un nuevo cliente y, y a otro z,
y así sucesivamente. Por tanto, al contrario que en el caso de conjuntos finitos,
puede ocurrir que un subconjunto propio de un conjunto infinito M tenga el
mismo tamaño que M. De hecho, como veremos, esta propiedad caracteriza
el tamaño infinito: un conjunto es infinito si y sólo si tiene el mismo tamaño
que alguno de sus subconjuntos propios.
Abandonemos el hotel de Hilbert y volvamos a nuestros familiares conjuntos
de números. El conjunto Z de los enteros también es numerable, ya que po-
demos ponerlo de la forma Z = {O, 1, -1,2, -2, 3, -3, ... }. Puede resultar
más sorprendente que el conjunto de los números racionales también se puede
enumerar de una forma similar.
Teorema 1. El conjunto Ql de los números racionales es numerable .
• Demostración. Enumerando el conjunto Ql+ de los racionales positivos
como sugiere la figura del margen, omitiendo los ya encontrados, vemos que
Ql+ es numerable y, por tanto, también lo es Ql si ponemos el O al principio y
- ~ inmediatamente después de ~. Con esta estrategia, obtenemos
Ql = {O, 1, -1, 2, -2,~, -~'!' -!, 3, -3,4, -4,~, -~, ... }. O
Otra forma de interpretar la figura es la siguiente afirmación:
La unión de una cantidad numerable de conjuntos numerables M n es
también numerable.
Si M n = {anl, an 2, a n3, ... } hacemos
00
U M n = {an, a21, a12, a13, a22, a31, a41, a32, a23, a14,··· }
n=l
exactamente igual que antes.
Detengámonos un poco más en el proceso de enumeración de Cantor de los
racionales positivos. Directamente de la figura obtenemos la sucesión
121 1 2 3 432 1 1 2 345
l' l' 2' 3' 2' l' l' 2' 3' 4' 5' 4' 3' 2' l' .,.
y después tenemos que eliminar los números repetidos, como ~ = t ó % = ~.
Hay una enumeración que es todavía más elegante y sistemática, y que no
contiene repeticiones - encontrada recientemente porNeil Calkin y Herbert
Wilf. La lista comienza de la siguiente forma:
1 121 3 2 3 143 5 2 534
l' 2' l' 3' 2' 3' l' 4' 3' 5' 2' 5' 3' 4' l'
El denominador del n-ésimo número racional es igual al numerador del
(n+ l)-ésimo. En otras palabras, la fracción n-ésima es b(n)jb(n + 1), donde
(b( n) ) n2':0 es una sucesión que comienza con
(1, 1, 2, 1, 3, 2, 3, 1,4,3, 5, 2, 5, 3, 4, 1,5, ... ).
Conjuntos, funciones y la hipótesis del continuo
Esta sucesión fue estudiada por vez por el matemático alemán Moritz
Abraham Stem, en un artículo de 1858, y es conocida como la "serie diatómica
de Stem." ¿Cómo se obtiene esta sucesión y, por tanto, la enumeración de
Calkin-Wilf de los racionales positivos? Consideremos el árbol binario infinito
del margen. Es fácil encontrar su definición recursiva:
} es el primer nodo del árbol
I!I todo nodo :Y tiene dos hijos: el de la izquierda es i!j y el de la derecha es
i+j
J
Las siguientes propiedades se pueden demostrar fácilmente:
(1) Todas las fracciones que aparecen en el árbol son irreducibles, es decir, si
~ aparece en el árbol, entonces r y s son primos entre sí.
Esto es cierto para el nodo t y para el resto lo demostramos por inducción
hacia abajo. Si r y s son primos entre sí, tanto r y r + s como s y r + s lo son.
(2) Toda fracción irreducible ~ > O aparece en el árbol.
Procedemos por inducción sobre la suma r + s. El menor valor es r + s = 2, es
decir, ~ = t, que aparece en el primer nodo. Si r > s, entonces r-:;s aparece
en el árbol por la hipótesis de inducción y, por tanto, ~ es su hijo derecho.
De manera similar, si r < s, entonces s:r aparece en el árbol y ~ es su hijo
izquierdo.
(3) Todas las fracciones irreducibles aparecen exactamente una vez.
El argumento es similar. Si ~ aparece más de una vez, entonces r -=1= s, ya
que todos los nodos del árbol, excepto el primero, son de la forma i!j < 1 ó
i+j > 1. Finalmente, si r > s ó r < s, seguimos el mismo argumento por
J
inducción que anteriormente.
Todos los números racionales positivos aparecen exactamente una vez en el
árbol y, por tanto, podemos enumerarlos escribiendo los números por niveles,
de izquierda a derecha. Esto nos proporciona el comienzo de la sucesión de
Calkin-Wilf mostrado anteriormente.
(4) El denominador de la n-ésima fracción de la lista es igual al numerador
de la (n + 1 )-ésima.
Esto es claramente cierto para n = O y cuando la fracción n-ésima es un hijo
izquierdo. Supongamos que la fracción n-ésima ~ es un hijo derecho. Si ~
está en la frontera de la derecha, entonces s = 1 y el siguiente término de la
sucesión está en la frontera izquierda y tiene numerador 1. Finalmente, si ~
está en el interior y ~ es el siguiente término de la sucesión, entonces ~ es
el hijo derecho de r-:;s, ~ es el hijo izquierdo de s/~rl y, por inducción, el
denQminador de r-:;s es el numerador de s/~rl y, por tanto, s = r'.
Bonito, pero todavía hay más. Nos podemos plantear dos preguntas naturales:
- ¿Tiene algún "significado" la sucesión (b( n) ) n:;::O ?
95
1
1
/I~
2
"2 1
1\ 1\
1 3 2 3
3 "2 3 1
r1 r1 r1 r1
1 4 3 5 2 5 3 4
4: 3 5" "2 5" 3 4: 1
r1r1r1r1r1r1r1r1
1
5"
r-s r l
s s'-r'
\ 1
T.. r l
s Sí
96
Por ejemplo, h(6) = 3, Y las represen-
taciones hiperbinarias son
6=4+2
6=4+1+1
6=2+2+1+1.
o
~I
1
"5
Conjuntos, funciones y la hipótesis del continuo
- Dado ~,¿es sencillo encontrar el término siguiente en la enumeración?
Para responder a la primera pregunta, observemos que el nodo b( n) jb( n + 1)
tiene como hijos a b(2n + 1)jb(2n + 2) Y b(2n + 2)jb(2n + 3). Reuniendo
los tres obtenemos las recursiones
b(2n + 1) = b(n) y b(2n + 2) = b(n) + b(n + 1). (1)
Haciendo b(O) = 1, la sucesión (b(n))n>O está determinada por (l).
¿Existe alguna sucesión "conocida" y "elegante" que satisfaga la misma recUf-
sión? Sí, la hay. Sabemos que cualquier número n se puede escribir de forma
única como suma de potencias de 2 distintas - obteniendo la representación
binaria usual de n. Una representación hiperbinaria de n es una representa-
ción de n como suma de potencias de 2 donde cada potencia 2k aparece a lo
sumo dos veces. Sea h(n) el número de tales representaciones de n. El lector
queda invitado a comprobar que la sucesión h( n) satisface la recursión (1) y,
por tanto, b( n) = h( n) para todo n.
Por cierto, hemos demostrado un hecho sorprendente: si ~ es una fracción
irreducible, existe exactamente un entero n tal que 'r = h(n) y s = h(n + 1).
Veamos ahora la segunda pregunta. En nuestro árbol se tiene
es decir, con x := ~,
x
l+x
x
x+1
Utilizamos esto para generar un árbol binario infinito (sin raíz) de la siguiente
forma:
o
1
o
1
Conjuntos, funciones y la hipótesis del continuo
En este árbol todas las filas son y en ellas aparece la enumeración de
Calkin-Wilf de los racionales positivos (con un ~ adicional al principio).
Ahora bien, ¿cómo se construye el siguiente racional a uno dado? Para res-
ponder a esta pregunta, recordemos que dado un racional x, su hijo derecho es
x + 1, su "nieto" derecho es x + 2, y su k-descendiente derecho es x + k. De
manera similar, el hijo izquierdo de x es l~x' cuyo hijo izquierdo es 1;2x y
así sucesivamente: el k-descendiente izquierdo x es l;kx'
Para determinar cómo obtener el número racional f (x) que va "a continua-
ción" de ~ = x en la enumeración, tenemos que analizar la situación mos-
trada en el margen. De hecho, cualquier racional no negativo x en nuestro
árbol binario infinito es el k-descendiente derecho del hijo izquierdo de un
racional y ~ O (para algún k ~ O), en tanto que f (x) es el k-descendiente
izquierdo del hijo derecho del mismo y. Por tanto, de las fórmulas para los
k-descendientes izquierdo y derecho se deduce que
y
x = 1 + Y + k,
como se afirma en la figura del margen. Aquí, k = Lx J es la parte entera de x,
mientras que l¡y = {x} es la parte decimal. De esto se deduce que
y+1
f(x) = 1 + k(y + 1)
1
Y!l + k
1 1
k + 1- Y¡l LxJ+1-{x}'
Por tanto, hemos determinado una bonita expresión para el sucesor f (x) de x,
encontrada muy recientemente por Moshe Newman:
La función
1
x 1----+ f(x) = LxJ+1-{x}
genera la sucesión de Calkin-Wilf
lJ---+lJ---+~J---+lJ---+.:?J---+.:?J---+.:?J---+lJ---+i!J---+
1 2 1 3 2 3 1 4 3
que contiene todos los racionales positivos exactamente una vez.
La forma de Calkin-Wilf-Newman de enumerar los racionales positivos tiene
otras propiedades notables. Por ejemplo, nos podemos preguntar por una ma-
nera rápida de determinar la n-ésima fracción de la sucesión, por ejemplo para
n = 106 . Aquí está:
Para encontrar la fracción n-ésima de la sucesión de Calkin-Wilf, escriba
n en binario, n = (bkbk-l".blbo)2 y, a continuación, siga el camino
en el árbol de CaIkin-Wilf determinado por sus dígitos, comenzando por
t = ~, de la siguiente forma: bi = 1 significa "escoja el hijo derecho," es
decir, "sume el denominador al numerador," mientras que bi = O significa
"escoja el hijo izquierdo," es decir, "sume el numerador al denominador."
La figura del margen muestra el camino resultante para n = 25 = (llOOlh:
por tanto, el término 25" de la sucesión de Calkin-Wilf es ~. El lector puede
1
"2
l+k(y+1)
1\
97
98
° 1
Una biyección f : (0,1] ---+ (0,1)
Conjuntos, funciones y la hipótesis del continuo
encontrar fácilmente un método similar para calcular, dada una fracción % (y
su representación binaria), el lugar que ocupa en la sucesión de Calkin-Wilf.
Pasemos al conjunto de números reales R ¿Es también numerable? No, no
lo es, y el método de la demostración - el proceso de diagonalización de
Cantor - no es sólo de importancia fundamental en toda la teona de conjun-
tos, sino que entra en El Libro como un golpe de ingenio inusual.
Teorema 2. El conjunto lR. de los números reales no es numerable.
11 Demostración. Cualquier subconjunto N de un conjunto numerable
M = {mI, m2, m3, ... } es como mucho numerable (es decir, finito o nume-rable). Sencillamente, se enumeran los elementos de N tal y como aparecen
en M. Por tanto, si podemos encontrar un subconjunto de lR. que no sea nume-
rable, entonces IR no puede ser numerable. El subconjunto M de lR. que vamos
a estudiar es el intervalo (0,1] de los números reales positivos T tales que ° < T S; 1. Supongamos que M es numerable, y sea M = {TI, T2, T3, ... }
una enumeración de M. Escribimos la única expresión decimal infinita de T n
sin una sucesión infinita de ceros al final:
donde ani E {O, 1, ... ,9} para todo n e i. Por ejemplo, 0.7
Consideremos ahora la lista doblemente infinita
TI 0.aUaI2aI3···
T2 0.a2Ia22a23···
0.6999 ...
Para todo n, elegimos bn E {1, ... , 8} distinto de ann ; es evidente que esto
es posible. Entonces b = 0.b I b2 b3 ... bn ... es un número real de M y, por tanto,
debe aparecer en la lista anterior. Pero es imposible que b = Tk, ya que bk es
distinto de akk. ¡Yeso es todo! O
Continuemos un poco más con los números reales. Obsérvese que los cua-
tro tipos de intervalos (0,1), (O, 1]' [O, 1) Y [0,1] tienen el mismo cardinal.
Como ejemplo, lo vamos a comprobar para (0,1] Y (0,1). La aplicación
f: (0,1] ----+ (0,1), x 1----+ y definida por
¡ 2. x 2 2.- x y:= ~ s-x para para para ~ < x S; 1, I < I 4 < x - 2' I < I S < X - 4'
sirve para este propósito ya que es biyectiva: en la primera línea el rango de y
es ~ S; y < 1, en la segunda línea i S; y < ~, en la tercera línea ~ S; y < i,
y así sucesivamente.
Conjuntos, funciones y la hipótesis del continuo
A continuación observar que cualesquiera dos intervalos (de lon-
gitud finita y no nula) tienen el mismo cardinal considerando la proyección
central de la figura. Todavía más: todo intervalo (de longitud no nula) tiene
el mismo cardinal que la recta real R Para ver esto, recurrimos al intervalo
abierto (O, 1) doblado de la figura y lo proyectamos en l8I. desde el punto S.
En conclusión, cualquier intervalo abierto, semiabierto o cerrado (finito o infi-
nito) de longitud no nula tiene el mismo cardinal, y dicho cardinal es denotado
por e, de continuo (un nombre utilizado a veces para el intervalo [0,1]).
Que los intervalos finitos e infinitos tengan el mismo cardinal puede resultar
razonable tras algo de reflexión, pero he aquí otro hecho que seguramente
resulte más contrario a nuestra intuición.
Teorema 3. El conjunto l8I.2 de todos los pares ordenados de números reales
(es decir, el plano real) tiene el mismo cardinal que R
• Demostración. Para ver esto, es suficiente demostrar que el conjunto de
los pares (x, y), O < x, y ~ 1, se puede poner en correspondencia biyectiva
con el intervalo (O, 1]. La demostración es otra vez de El Libro .. Consideremos
el par (x, y) y escribamos x e y en su única expresión decimal infinita, como
en el siguiente ejemplo:
x 0.3 01 2 007 08
Y 0.009 2 05 1 0008
Obsérvese que hemos separado los dígitos de x e y en grupos, de forma que
en cada grupo hay exactamente un dígito distinto de cero que aparece en la
posición de la derecha. Ahora asociamos a cada (x, y) el número z E (0,1]
que se obtiene al escribir el primer grupo de la x, a continuación el primer
grupo de la y, después el segundo grupo de la x, y así sucesivamente. En
nuestro ejemplo se obtiene
z = 0.3009 01 2 2 05 007 1 08 0008
Como ni la expresión de x ni la de y terminan con una cadena infinita de ceros,
la expresión de z tampoco lo hace. Recíprocamente, a partir de la expresión
de z podemos obtener de forma inmediata su imagen inversa (x, y), lo que
demuestra que la aplicación es biyectiva, y así termina la demostración. O
Como (x, y) f-----7 X + iy es una biyección entre l8I.2 y los números comple-
jos e, concluimos que ICI = Il8I.l = e. ¿Por qué nos resulta tan inesperado el
resultado Il8I.2 1 = Il8I.l? Porque va contra nuestra intuición de dimensión. Este
resultado dice que el plano 2-dimensional l8I.2 (y, en general, por inducción, el
espacio n-dimensional l8I.n ) se puede poner en correspondencia biyectiva con
la recta l-dimensional R Por tanto, la dimensión no se conserva al aplicar
transformaciones biyectivas. Si, además, requerimos que la aplicación y su
inversa sean continuas, entonces la dimensión sí se conserva, como demostró
Luitzen Brouwer.
Avancemos un poco más. Hasta ahora hemos desarrollado la noción de igual
cardinal. ¿Cuándo diremos que M no es más grande que N? La respuesta
viene dada de nuevo por las aplicaciones. Diremos que el cardinal m es menor
o igual que n si para dos conjuntos M y N tales que IMI = m y INI = n,
99
S
100
N
"Schroder y Bernstein pintando"
N
M
Conjuntos,junciones y la hipótesis del continuo
existe una de NI en N. Es evidente que la relación m ::;
es independiente de los conjuntos NI y N elegidos. Si los conjuntos son finitos
esto se corresponde con la noción intuitiva: un conjunto con m elementos es
menor o igual que un conjunto de n elementos si y sólo si m ::; n.
Nos enfrentamos ahora a un problema fundamental. Nos gustaría que las pro-
piedades usuales de las desigualdades siguieran siendo válidas para los car-
dinales. Pero, ¿es esto cierto para los cardinales infinitos? Por ejemplo, ¿es
cierto que m ::; TI Y TI ::; m implica que m = TI? Esto no es en absoluto
evidente: tenemos conjuntos infinitos NI y N Y aplicaciones j : NI ---+ N
Y 9 : N ---+ M que son inyectivas pero no necesmiamente sobreyectivas.
Esto sugiere construir una biyección enviando algunos elementos m E M a
j (m) EN, Y algunos elementos n E N a 9 (n) E M. Pero no está claro cómo
se pueden coordinar las distintas elecciones para que "encajen bien."
La respuesta es afirmativa y viene dada por el famoso teorema de Schri:ider-
Bernstein, que anunció Cantor en 1883. Las primeras demostraciones fueron
dadas por Friedrich SchrOder y Felix Bernstein algún tiempo después. La
demostración que presentamos apareció en un pequeño libro de uno de los gi-
gantes de la teoría de conjuntos del siglo XX, Paul Cohen, famoso por resolver
la hipótesis del continuo (sobre la que hablaremos posteriormente).
Teorema 4. Si existen aplicaciones inyectivas de M a N y de N a M, enton-
ces existe una biyección entre M y N, es decir, IMI = INI .
• Demostración. Podemos suponer que M y N son disjuntos - en caso
contrario, reemplazamos N por una nueva copia.
Las aplicaciones inyectivas j y 9 mandan elementos de jlv! a elementos de
N, y viceversa. Una forma de clarificar esta situación potencialmente confusa
es alinear M U N en cadenas de elementos: tomamos un elemento arbitrario
mo E M, Y desde él formamos una cadena de elementos aplicando j, des-
pués g, a continuación de nuevo j, otra vez g, y así sucesivamente. La cadena
se puede cerrar (éste es el caso 1) si mo aparece de nuevo en el proceso, o
puede continuar indefinidamente con elementos distintos. (Por ser las apli-
caciones inyectivas, el primer elemento "repetido" de la cadena no puede ser
distinto de mo).
Si la cadena prosigue indefinidamente, tratamos de recorrerla en orden in-
verso: de mo a g-l(mo) si ffio está en la imagen de g, a continuación a
continuo
J-l (mo)) si (mo) está J, y así sucesivamente.
Pueden aparecer otros tres casos: el proceso de recorrer la cadena hacia atrás
continuar indefinidamente detenerse en un elemento de
NI que no está en la de 9 parar en un elemento de N
que no está en la de J
De esta forma, Iv! U N de cuyos ele-
mentos se
Caso l. Cadena finita de 2k + 2 elementos distintos (k 2: O)
f 9 J J
mo ~ no -----311-- mI ~ mk~nk
~ 9 ~
Caso 2. Cadena doblemente infinita de elementos distintos
J 9 J 9 f
... ~ mo -----311-- no ~ mI -----311-- nI ~ m2-----311--
Caso 3. Cadena infinita de elementos distintos que empieza en el elemento
mo E NI\g(N)
f 9 f 9 f
mo ~ no -----311-- mI ~ nI -----311-- m2 ~
Caso 4. Cadena infinita de elementos distintos que empieza en el elemento
no E N\f(NI)
9 f 9 f
no ~ mo -----311-- nI ~ mI -----311-- o
¿Qué ocurre con el resto de de las desigualdades? Como de cos-
tumbre,se dice que m < n si m < pero m 7=. n. Acabamos de ver
que para dos cardinales cualesquiera se verifica como mucho una de estas tres
posibilidades
m < n, m = n, tU > n
y, según la teoría de los cardinales, se sabe que siempre se cumple exactamente
una. (Véase la proposición 2 en el apéndice de este capítulo).
Además, el teorema de Schroder-Bernstein asegura que la relación < es tran-
sltlva, es m < n y <.J;! que m < .J;!. Por tanto, el conjunto
de los cardinales está totalmente ordenado, comenzando con los cardinales
finitos 0, 1,2,3, .... Recurriendo a los axiomas de Zermelo-Fraenkel (en par-
ticular, al axioma de elección) se deduce fácilmente que cualquier conjunto
infinito NI contiene un subconjunto numerable: 1\11 contiene un elemento mI;
el conjunto NI \ {mI} es no vacío que es y, por tanto, contiene un
elemento m2; considerando el conjunto NI\ {mI, m2} se asegura la existencia
de m3, Y así sucesivamente. Por tanto, el cardinal de un conjunto numerable
es el menor cardinal infinito, denotado usualmente por ~o (que se lee "aleph
sub-cero"). "El menor cardinal infinito"
102
También hemos demostrado un resul-
tado anunciado anteriormente:
Todo conjunto infinito tiene el mismo ta-
maño que alguno de sus subconjuntos
propios.
Conjuntos, funciones y la hipótesis del continuo
Como un corolario de No ::; m para cardinal infinito m, IJV\JICUIVc>
demostrar el resultado del "hotel de Hilbert" para cualquier cardinal infinito
m, es decir, se tiene que 1 M U {x} 1 = 1 M 1 para cualquier conjunto infinito
M. En efecto, M contiene un subconjunto N = {mI, m2, m3, .. . }. Ahora
mandamos x a mI, mI a m2, Y así sucesivamente, dejando fijos los elementos
de M\N. Esto nos proporciona la biyección requerida.
Otra consecuencia del teorema de Schroder-Bemstein que podemos demos-
trar es que el conjunto P(N) de todos los subconjuntos de N tiene cardi-
nal c. Tal y como hemos observado anteriormente, es suficiente demostrar que
IP(N)\{0}1 = 1(0,1]1. Un ejemplo de aplicación inyectiva es
f:P(N)\{0} ---+ (0,1],
en tanto que
g: (0,1] ---+ P(N) \ {0},
define una aplicación inyectiva en la otra dirección.
Hasta ahora conocemos los números cardinales 0, 1, 2, ... , No, Y sabemos que
el cardinal c de lR es mayor que No. El paso de CQl con ICQlI = No a lR con
IlRl = c sugiere de manera inmediata la siguiente pregunta:
¿ Es c = IlRl el siguiente cardinal infinito tras No?
Por supuesto, nos encontramos con el problema de si siquiera existe el cardinal
siguiente o, en otras palabras, si NI tiene sentido. Lo tiene - daremos un
esquema de la demostración de este hecho en el apéndice de este capítulo.
La afirmación c = NI es conocida como la hipótesis del continuo. La pregunta
de si la hipótesis del continuo es cierta fue durante décadas uno de los mayores
retos de las matemáticas. La respuesta nos lleva a los límites de la lógica: Kurt
Godel y Paul Cohen demostraron que la afirmación c = NI es independiente
de los axiomas de Zermelo-Fraenkel, de la misma forma que el axioma de las
paralelas es independiente del resto de los axiomas de la geometría euclídea.
Existen modelos en los que se verifica c = NI Y existen otros modelos de la
teoría de conjuntos donde se verifica c i- NI.
A la vista de este hecho, es interesante preguntar si existen otras condiciones
(por ejemplo, del análisis) que sean equivalentes a la hipótesis del continuo.
Es natural preguntar por un ejemplo del análisis, ya que históricamente las
primeras aplicaciones importantes de la teoría de conjuntos de Cantor se die-
ron en este campo, más concretamente en la teoría de funciones complejas. A
continuación presentamos uno de estos ejemplos junto con la solución, extre-
madamente simple y elegante, encontrada por Paul Erd6s. En 1962, Wetzel
hizo la siguiente pregunta:
Sea { fa} un conjunto de funciones analíticas distintas dos a dos defini-
das sobre e tales que para cada z E e el conjunto de valores {fa (z)}
es como mucho numerablé (es decir, es finito o numerable); llamemos
a esta propiedad (Po).
¿Es cierto que el conjunto es, a lo sumo, numerable?
Conjuntos, funciones y la hipótesis del continuo
poco después, Erdos demostró que, SOIlJfI~ncienternellte, la respuesta de-
pende de la hipótesis del continuo.
Teorema 5. Si e > N1, entonces toda familia {joJ que satisface (Po) es
numerable. Si, por el contrario, e = N1, existe alguna familia {f oJ con la
propiedad (Po) que tiene tamaño c.
Para presentar la demostración necesitamos algunos hechos básicos sobre nú-
meros cardinales y ordinales. Los lectores poco familiarizados con estos con-
ceptos pueden encontrar un resumen de los resultados necesarios en el apén-
dice del final del capítulo.
111 Demostración del teorema 5. Supongamos que e> N1 . Demostraremos
que para cualquier familia {fa} de cardinal N1 de funciones analíticas existe
un número complejo Zo tal que todos los N1 valores fa (zo) son distintos. Por
tanto, si una familia de funciones satisface (Po), debe ser numerable.
Para ver esto, hacemos uso de nuestro conocimiento de los números ordina-
les. En primer lugar, ordenamos la familia {fa} de acuerdo con el ordinal
inicial W1 de N1 . Según la proposición 1 del apéndice, esto quiere decir que
el conjunto de índices recorre los números ordinales a menores que W1. A
continuación mostramos que el conjunto de pares (a, (3), a < (3 < W1, tiene
cardinal N1 . Como todo (3 < W1 es un ordinal numerable, el conjunto de pares
(a, (3), 00< (3, es numerable para cualquier (3 fijo. Tomando la unión sobre los
N1 elementos (3, deducimos de la proposición 6 del apéndice que el conjunto
de todos los pares (a, (3), a < (3, tiene cardinal N 1.
Para cada par a < (3 consideramos el conjunto
8(00, (3) = {Z E ce : fa(z) = f(3(z)}.
Veamos que cada conjunto 8( a, (3) es numerable. En efecto, consideremos los
círculos Ck de radio k = 1,2,3, ... centrados en el origen del plano complejo.
Si fa y f (3 son iguales en infinitos puntos de algún Cko entonces fa y f (3 son
idénticas según un conocido resultado sobre funciones analíticas. Por tanto,
fa y f (3 son iguales en un número finito de puntos de cada Ck y, por tanto,
en una cantidad como mucho numerable de puntos en todo el plano. Ahora
definimos 8 := Ua<(3 8(00, (3). De nuevo, según la proposición 6, se tiene que
8 tiene cardinal N1 , ya que cada conjunto 8(00, (3) es numerable. Llegamos
ahora al punto clave: como ce tiene cardinal e y, por hipótesis, e es mayor que
N1 , existe un número complejo Zo que no está en 8 y, para Zo los N1 valores
fa (zo) son distintos.
Supongamos ahora que e = N 1. Consideremos el conjunto D S;;; ce de números
complejos p + iq con parte real e imaginaria racional. Como para cada p
el conjunto {p + iq : q E Q} es numerable, sabemos que D es numerable.
Además, D es un conjunto denso en ce: cualquier disco abierto del plano
complejo contiene puntos de D. Sea {za : O ::; a < W1} un buen orden de ce.
Construiremos una familia {f(3 : O ::; (3 < W1} de N1 funciones analíticas
distintas tales que
!(3(Za) E D siempre que a < (3. (1)
103
104
"Una leyenda sobre San Agustín cuenta
que, mientras caminaba por una playa y
contemplaba el infinito, vio un niño que
intentaba vaciar el océano con una pe-
queña concha . .. "
Conjuntos, funciones y la hipótesis del continuo
Una familia tal satisface la condición (Po). En cada Z E re tiene
un índice, digamos Z = Zú' Ahora bien, para todo (3 > a los valores {f¡3(zú)}
están en el conjunto numerable D. Como a es un ordinal numerable, las fun-
ciones f ¡3 tales que (3 :S a contribuirán a lo sumo con una cantidad numerable
de valores f¡3(zú) y, por tanto, el conjunto de todos los valores {j¡3(zú)} es
también como mucho numerable. Por tanto, si construimos una familia {f¡3}
que verifique (1), habremos concluido la demostración.
La construcción de {f ¡3} utiliza inducción transfinita. Para fa podemos tomar
cualquier función analítica, por ejemplo fa = constante. Supongamos que
yahemos construido f ¡3 para todo (3 < r' Como r es un ordinal numerable,
podemos reordenar {f ¡3 : O :S (3 < r} en una sucesión gl, g2, g3, . . .. La
misma reordenación de {Za : O :S a < r} nos proporciona una sucesión
W1, W2, W3, .... A continuación construimos una función f-y que satisface para
todo n las condiciones
y (2)
La segunda condición nos asegura que todas las funciones f'Y (O :S r < W1)
son distintas, y la primera es exactamente (1), lo que implica (Po) como hemos
visto anteriormente. Obsérvese que la condición f'Y ( wn) -=1=- gn ( wn) es una vez
más un argumento de diagonalización.
Para construir f'Y escribimos
f'Y(z) ca + c1(Z - wd + c2(Z - wd(z - W2)
+ c3(Z - wd(z - W2)(Z - W3) + ....
Si r es un ordinal finito, entonces f'Y es un polinomio y, por tanto, analítica, y
podemos escoger números Ci para los que se satisfaga (2). Si r es un ordinal
numerable, entonces
00
f'Y (z) L cn(z - W1)'" (z - wn ). (3)
n=O
Obsérvese que los valores de Cm (m 2: n) no influyen en el valor f'Y(wn) y,
por tanto, podemos elegir los Cn paso a paso. Si la sucesión (cn) tiende a O su-
ficientemente rápido, entonces (3) define una función analítica.
Finalmente, como D es un conjunto denso, podemos elegir la sucesión (cn)
de forma que f'Y verifique las condiciones de (2), lo que completa la demos-
tración. D
y
Comenzaremos preguntando si para cada número cardinal existe un siguiente.
Como primer paso veamos que, dado un cardinal m, siempre existe un cardi-
nal n mayor que m. Para ello utilizamos de nuevo una versión del proceso de
diagonalización de Cantor.
Sea M un conjunto. Veamos que el conjunto P(M) de todos los subconjun-
tos de M tiene cardinal mayor que M. La aplicación que envía m E M a
{ m} E P (M) demuestra que M se puede poner en correspondencia biyectiva
con un subconjunto de P(M), que es la definición de que ¡M¡ :S ¡P(M)¡.
Conjuntos, funciones y la hipótesis del continuo
Nos por demostrar que no existe entre P(IIIr) y un
subconjunto de M. Supongamos que esto es falso y sea cp : --+ P(M)
una biyección de N c;: M en P(M). Consideremos el subconjunto U c;: N
de todos los elementos de N que no están contenidos en su imagen por cp, es
decir, U == {m E N : m ti- cp(m)}. Como cp es una biyección, existe u E N
tal que cp(u) = U. Pero ahora ¡tanto u E U como u ti- U resultan imposibles!
En si u E U, entonces u ti- cp ( u) = U según la definición de U, en
tanto que si u ti- U = cp ( u), entonces u E U, Y llegamos a una contradicción.
Es probable que el lector haya visto este argumento anteriormente. Es el viejo
enigma del barbero: "Existe un barbero que afeita a todos los hombres que no
se afeitan a sí mismos. ¿Se afeita el barbero a sí mismo?"
Para continuar señalamos algunas otras importantes ideas debidas a Cantor:
los conceptos de conjuntos ordenados y números ordinales. Un conjunto M
está ordenado por < si la relación < es transitiva y, para cualesquiera dos
elementos a i=- b de M, se tiene que a < b o que b < a. Por ejemplo, podemos
ordenar N de la forma usual, N = {l, 2, 3, 4, ... }, pero, por supuesto, también
podemos ordenar N al revés, N = { ... , 4, 3, 2, l}, o enumerar primero los
números impares y después los pares, N = {l, 3, 5, ... , 2, 4, 6, ... }.
He aquí el concepto clave. Se dice que un conjunto ordenado M está bien
ordenado si todo subconjunto no vacío de M tiene un primer elemento. Por
tanto, los órdenes primero y tercero de N considerados anteriormente son bue-
nos órdenes, pero el segundo no lo es. El importante teorema del buen orden,
que es una consecuencia de los axiomas (incluido el axioma de elección), dice
que todo conjunto M admite un buen orden. En adelante, sólo consideraremos
conjuntos en los que se ha definido un buen orden.
Diremos que dos conjuntos bien ordenados M y N son similares (o del mismo
tipo de orden) si existe una biyección cp de M en N que respeta la ordenación,
es decir, tal que m <!VI n implica que cp(m) <N cp(n). Obsérvese que
cualquier conjunto ordenado que es similar a un conjunto bien ordenado está
también bien ordenado.
La similaridad es obviamente una relación de equivalencia y, por tanto, pode-
mos hablar del número ordinal a definido por una clase de conjuntos similares.
Para conjuntos finitos, dos órdenes cualesquiera son buenos órdenes similares,
y utilizamos de nuevo el número ordinal n para la clase de los conjuntos con
n elementos. Obsérvese que, por definición, dos conjuntos similares tienen
igual cardinal. Por tanto, tiene sentido hablar del cardinallal de un número
ordinal a. Obsérvese también que cualquier subconjunto de un conjunto bien
ordenado está bien ordenado según el orden inducido.
Igual que hicimos con los números cardinales, ahora comparamos dos núme-
ros ordinales. Sea M un conjunto bien ordenado y m E M. Llamamos a
Mm = {X E M : X < m} el segmento (inicial) de M determinado por m; N
es un segmento de M si N = Nlm para algún m. En particular, Mm es el con-
junto vacío cuando m es el primer elemento de M. Consideremos ahora los
números ordinales f.1> y v de los conjuntos bien ordenados M y N. Se dice que
f.1> es menor que v, f.1> < v, si M es similar a un segmento de N. Aquí también
se tiene la propiedad transitiva y f.1> < v, v < 1f implica que f.1> < 1f, ya que una
aplicación que respeta el orden transforma un segmento en un segmento.
105
Estos dos conjuntos bien orde-
nados, N {l, 2, 3, 4, .. .} y
N {1,3,5, ... ,2,4,6, ... } no
son similares: el primer orden tiene
un solo elemento que carece de uno
inmediatamente anterior, en tanto que
el segundo tiene dos.
El número ordinal de {l, 2, 3, ... }
es menor que el número ordinal de
{l, 3, 5, ... ,2,4,6, ... }.
106 Conjuntos, funciones y la hipótesis del continuo
Es evidente que, para conjuntos finitos, m < n conserva su sentido usual.
Sea W el número ordinal de N = {l, 2, 3, 4, ... } con la ordenación usual.
Considerando el segmento Nn +1 se deduce que n < w para todo n finito.
Veamos que w :::; a para todo número ordinal infinito a. En efecto, si el
conjunto infinito bien ordenado M tiene número ordinal a, entonces M con-
tiene un primer elemento mI, el conjunto NI\ { mI} contiene un primer ele-
mento m2, M\ {mI, m2} contiene un primer elemento m3. De esta forma
se construye la sucesión mI < m2 < m3 < ... de elementos de NI. Si
M = {mI, m2, m3, ... }, entonces M es similar a N y, por tanto, a = w. Si,
por el contrario, M\ {mI, m2, ... } es no vacío, contiene un primer elemento
m, de donde se deduce que N es similar al segmento Mm, que es la definición
dew < a.
Presentamos ahora (sin incluir las demostraciones, que no son difíciles) tres
resultados básicos sobre números ordinales. El primero dice que cualquier
número ordinal p tiene un conjunto bien ordenado W,u como representante
"canónico" .
Proposición 1. Sea p un número ordinal y sea W,u el conjunto de números
ordinales menores que p. Entonces se verifica que:
(i) Los elementos de W,u son comparables dos a dos.
(ii) Si ordenamos W,u de acuerdo al tamaño, entonces W,u está bien ordenado
y tiene número ordinal p.
Proposición 2. Dos números ordinales cualesquiera p y v verifican una y
sólo una de las relaciones p < v, p = v Ó p > v.
Proposición 3. Todo conjunto de números ordinales (ordenado de acuerdo al
tamaño) está bien ordenado.
Tras esta excursión a los números ordinales volvemos a los números cardina-
les. Sea m un número cardinal y sea Om el conjunto de los números ordinales
p tales que Ipl = m. De acuerdo con la proposición 3, existe un menor nú-
mero ordinal Wm en Om, al que llamamos número ordinal inicial de m. Como
ejemplo, w es el número ordinal inicial de ~o. Tras estos preparativos, ya po-
demos demostrar un resultado básico para este capítulo.
Proposición 4. Para todo número cardinal m existe cierto número cardinal
siguiente mayor que m .
• Demostración. Ya sabemos que existe algún número cardinal mayor n.
Sea JC el conjunto de los números cardinales mayores que m y menoreso
iguales que n. A cada,p E JC le asociamos su número ordinal inicial wp. De
entre estos números iniciales elegimos el menor (el cual sabemos que existe
por la proposición 3), y el correspondiente número cardinal es el menor de JC
y, por tanto, el número cardinal siguiente a m que buscábamos. D
Proposición 5. Sea M un conjunto infinito de cardinal m y bien ordenado con
respecto al número ordinal inicial wm. Entonces M no tiene último elemento.
Conjuntos, funciones y la hipótesis del continuo
• Demostración. En efecto, si M tuviera un último elemento m, entonces el
segmento Mm tendría un número ordinal IL < Wm tal que IILI = m, lo que
contradice la definición de Wm. O
Para terminar, lo que necesitamos es una ampliación considerable del resul-
tado de que la unión de una cantidad numerable de conjuntos numerables es
tamLién numerable. En el siguiente resultado consideramos familias arbitra-
rias de conjuntos numerables.
Proposición 6. Supongamos que {A,,} es una familia de tamaño m de con-
juntos numerables Aa> donde m es un cardinal infinito. Entonces, la unión
U Aa tiene tamaño menor o igual que m.
a
• Demostración. Podemos suponer que los conjuntos Aa son disjuntos dos
a dos, ya que esto sólo puede aumentar el tamaño de la unión. Sea NI tal que
IMI = m el conjunto de índices y consideremos su buen orden de acuerdo
al número ordinal inicial Wm. A continuación reemplazamos cada a E NI
por un conjunto numerable Ba~ {ba1 = a,ba2 ,ba3 , ... }, ordenado con
respecto a w, y denotamos por M al conjunto obtenido. Entonces, M es de
nuevo un conjunto bien ordenado si definimos bai < bf!L cuando a < (3 y
bai < baj cuando i < j. Sea ¡L el número ordinal de M. Como M es un
subconjunto de M, se tie~ que IL :::; ¡L según el argumento anterior. Si IL = ¡L,
entonces M e~imilar a NI, en tanto que si IL < ¡L, entonces M es similar a un
segmento de M. Ahora bien, como la ordenación Wm de NI no tiene último
elemento (proposición 5) vemos que, en ambos casos, M es similar a la unión
de conjuntos numerables B{3 y, por tanto, tiene el mismo cardinal.
El resto es sencillo. Sea r.p : U B{3 ---+ M una biyección y supongamos que
r.p(B{3) = {al,a2,a3,.··}. Reemplazamos cada ai por Aai y considera-
mos la unión U Aai' Como U Aai es la unión de una cantidad numerable de
conjuntos (y, por tanto, numerable), se tiene que B{3 tiene el mismo tamaño
que U Aai' En otras palabras, existe una biyección entre B {3 y U Aai para
todo (3 y, por tanto, una biyección 'Ij; entre U B{3 y U Aa. Finalmente, 'lj;r.p-l
es la biyección buscada entre M y U A", con lo que I U Aa I = m. O
[1] L. E. J. BROUWER: Beweis der Invarianz der Dimensionszahl, Math. Annalen 70
(1911), 161-165.
[2] N. CALKIN & H. WILF: Recounting the rationals, Amer. Math. Monthly 107
(2000),360-363.
[3] P. COHEN: Set Theory and the Continuum Hypothesis, W. A. Benjamin, New York
1966.
[4] P. ERDOS: An interpolation problem associated with the continuum hypo-
thesis, Michigan Math. J. 11 (1964), 9-10.
[5] E. KAMKE: Theory of Sets, Dover Books 1950.
[6] M. A. STERN: Ueber eine zahlentheoretische Funktion, Journal für die reine und
angewandte Mathematik 55 (1858), 193-220.
107
108 del continuo
"Una infinidad más de cardinales"
En el ámbito del análisis abundan las desigualdades, como bien se refleja en el
famoso libro de Littlewood y Pólya, que lleva precisamente por título
"Desigualdades". Veremos dos de las más básicas, con dos aplicaciones para
cada una, y conoceremos la opinión de George Pólya (colaborador de honor
en El Libro) sobre cuáles son las demostraciones más apropiadas.
Nuestra primera desigualdad se atribuye tanto a Cauchy como a Schwarz, e
incluso a Buniakowski:
TeoremaI
Sea b)
[a[2 :=
~ .... ,,.~;~ ... "'~'" de L~m(~!'n'-SchwlliJ'Z
un producto interno en un espacio vectorial real V (con norma
a)). Entonces
se cumple para todos los vectores a, b E V. La igualdad se da si y sólo si a y
b son linealmente dependientes .
• Demostración. La siguiente demostración, de origen desconocido, es qui-
zás la más corta. Consideremos la función cuadrática
en la variable x. Podemos suponer que a i=- O. Si b = Aa, entonces es
claro que (a, b)2 = [a[2[b[2. Si en cambio los vectores a y b son linealmente
independientes, entonces se verifica que [xa+b[2 > O para todo x, y por tanto
el discriminante (a, b)2 - [a[2[b[2 es menor que O. . O
Nuestro segundo ejemplo es la conocida desigualdad para las medias armó-
nica, geométrica y aritmética:
Teorema 11 \.LVJU"U"'" armónica, geométrica y aritmética)
Sean al, ... , an números reales positivos. Entonces
n
<
En ambos casos, se da la igualdad si y sólo si todos los ai son iguales .
• Demostración. La siguiente demostración, bella y singular, se atribuye a
Cauchy (véase [7]). Sea P(n) el enunciado de la segunda desigualdad, escrito
en la forma
(
al+ ... +an)n
al a2 ... an :S n .
Para n = 2, tenemos al a2 :S (al !a2 )2 ~ (al - a2)2 2: O, lo cual es cierto.
A continuación procedemos en dos pasos:
110 Aquellas maravillosas desigualdades
P(n) =? P(n - 1)
(E) P(n) y P(2) =? P(2n),
lo cual claramente implica el resultado.
n-l
Para demostrar (A), sea A:= I.: na~l' Entonces
k=l
n-l
P(n)
<
y por tanto TI ak < An - l
k=l
Para (E), vemos que
P(n)
<
La condición para la igualdad se concluye con la misma facilidad.
La desigualdad izquierda, entre la media armónica y geométrica, se sigue al
considerar l, ... , ~. O
al a n
111 Otra demostración. De las muchas demostraciones de la desigualdad en-
tre las medias aritmética y geométrica (la monografía [2] contiene más de 50),
resaltaremos una particularmente impactante, la de Alzer, de fecha reciente.
De hecho, esta demostración proporciona la desigualdad más fuerte
para cualquier al, ... , an , PI, ... ,Pn positivos tales que I.:~=l Pi = 1. En
adelante, denotaremos por G la expresión de la izquierda, y por A la de la
derecha. Podemos suponer que al :s; .. , :s; ano Claramente al :s; G :s; an,
por tanto debe existir algún k con ak :s; G :s; ak+!. Concluimos que
(1)
ya que todos los integrandos son 2: O. Al reescribir (1) obtenemos
Aquellas maravillosas desigualdades
donde el primer miembro es a
~ ai- G
~P'-
i=l 2 G
A
- -1
G '
y el segundo miembro es igual a
n n
LPi(log ai -log G) = log afi -log G = O.
i=l i=l
Por tanto, é - 1 :::o: 0, es decir, A :::o: G. En el caso de igualdad, todas las
integrales en (1) deben anularse, lo cual implica al = ... = an = G. D
Nuestra primera aplicación es un bonito resultado de Laguerre (véase [7])
acerca de la ubicación de raíces de polinomios.
Teorema 1. Supongamos que todas las raíces de xn + an_lXn- 1 + ... + ao
son reales. Entonces estas raíces están contenidas en el intervalo de extremos
• Demostración. Sea y una de las raíces e Yl, ... ,Yn-l las otras. Enton-
ces el polinomio es (x - y) (x - Yl) ... (x - Yn-l). Por tanto, comparando
coeficientes,
y obtenemos
y + Yl + ... + Yn-l,
Y(Yl + ... + Yn-d + LYiYj,
22 2 an-l - an-2 - Y =
i<j
n-l
LY;'
i=l
Al aplicar la desigualdad de Cauchy a (Yl,' .. , Yn-d y (1, ... ,1) resulta
n-l
< (n - 1) LY; = (n - l)(a;_l - 2an-2 - y2),
i=l
o
2 2an -l 2(n - 1) n - 2 2
Y + --y + an-2 - --an-l :s; O. n n n
En consecuencia, y (y por tanto todos los Yi) están entre las dos raíces de la
función cuadrática, y estas raíces son precisamente nuestras cotas. D
Nuestra segunda aplicación parte de una conocida propiedad elemental de las
parábolas. Consideramos la parábola descrita por f (x) = 1-X2 entre x = -1
Y x = 1. Asociamos a f (x) el triángulo tangencial y el rectángulo tangencial
de la figura.
11
(0,2)
(-1, O) o (1,0)
112
-1 ' v
2
Mathematical Reviews
Erd8s, P. and
roota. Ano,
Es seij(x)
, 1
f(-l)~f(I)~O, o <f(.);g¡;¡(P) für -1<x<l,
wobei -1<~<1, so dilSS p. d¡e SteIle des Maximums von
¡(x) im IntervaU (-1, 1) bedeutet. Dann ist
21'(1)1'(-1) l'
~---;g¡; !(x)dx;g¡;!·2!(.),
1'(1)-}'(-I) -,Aquellas maravillosas desigualdades
Nos encontramos con que el área sombreada A = J~l (1 - x2)dx es igual a
t, y las áreas T y R del triángulo y del rectángulo son ambas iguales a 2. Por
T 3 R 3
tanto A = "2 Y A = "2'
En un artÍCulo muy bonito, Paul Erd6s y Tibor Gallai .preguntaron qué pasa
cuando f (x) es un polinomio real arbitrario de grado n, con f (x) > O para
-1 < x < 1 Y f( -1) = f(l) = O. El área A es en este caso J~l f(x)dx.
Supongamos que en el intervalo (-1, 1) el polinomio f (x) alcanza su valor
máximo en b, de manera que R = 2f(b). Al calcular las tangentes en -1 y 1,
se verifica fácilmente (véase el recuadro) que
T = 21'(1)1'(-1)
1'(1) - 1'( -1)'
respectivamente T = O para f' (1) = l' ( -1) = O.
LU"'UFiLUV tangencial es precisamente Yo, donde (xo, Yo)
es el punto de intersección entre las dos tangentes. Las ecuaciones de
dichas tangentes son Y = 1'( -l)(x + 1) e Y = 1'(l)(x - 1), por tanto
f'(l) + 1'(-1)
xo = f'(l) f'( -1)'
y en consecuencia
, (1'(1) + 1'( -1) )
Yo = f (1) f'(l) f'(_l)-l
2 1'(1)1'(-1)
f'(l) - f'(-l)"
(2)
En general, no hay cotas no triviales para 3i y ~. Para darse cuenta de ello,
basta tomar f (x) = 1- x2n. Entonces T = 2n, A = 2~~ 1 ' Y en consecuencia
3i > n. De manera similar, R = 2 y ~ = 23~1, que se acerca tanto como
queramos a 1 cuando n tiende a infinito.
Sin embargo, tal y como demostraron Erd6s y Gallai, sí existen mejores cotas
para polinomios que sólo tienen raíces reales.
Teorema 2. Sea f (x) un polinomio real de grado n 2: 2 que sólo tiene raíces
reales, y tal que f(x) > O para -1 < x < 1 Y f( -1) = f(l) = O.
Entonces
2 2
-T < A < -R
3 - - 3 '
Y en ambos casos se cumple la igualdad solamente para n = 2.
Erd6s y Gallai establecieron este resultado mediante una compleja demostra-
ción por inducción. En una reseña del trabajo, que apareció en 1940 en la
primera página de la primera edición de los Mathematical Reviews, George
Pólya explicó cómo demostrar la primera desigualdad usando la desigualdad
entre la media aritmética y la media geométrica - un ejemplo muy bello de
una reseña hecha con mucho detalle, que al mismo tiempo proporciona una .
demostración de El Libro.
Aquellas maravillosas desigualdades
• Demostración de :::; A. Dado que f (x) sólo tiene raÍCes nin-
guna de ellas en el intervalo abierto ( -1, 1), se puede escribir de la forma
'--- x) + x) (3)
j
con Oí 2" 1, (3j 2" 1 - no teniendo en cuenta un factor constante positivo que
al final se cancelará. Por tanto,
- x) + x)dx.
j
Al sustituir x f-----+ -x, nos encontramos con que también
+ x) II ((3j - x)dx,
j
yen consecuencia, por la desigualdad entre la media aritmética y la geométrica
(nótese que todos los factores son 2" O)
1
A = J ~[ (1-x 2)II(aí- x)II((3j+x) +
-1 ' J
(1- X2) II(ai + x) II((3j - x) ]dx
i j
1
> J (1 - x2) (II (a; - x2) II ((3; - x2) r/2 dx
-1 • J
1
> J (1- X2) (II (a; - 1) II ((3; - 1) r/2 dx
-1 ' J
= ~ (II(a; -1) II((3; -1)) 1/2.
i j
Calculemos f'(l) Y f'(-l). (Podemos suponer que f'(-1), 1'(1) -=J O, ya
que de otra manera T = O y la desigualdad ~ T :S A se vuelve trivial.) Por (3)
vemos que
f'(1) = -2
y de manera similar que
Por ende, podemos concluir que
-1) II((3j + 1),
j
-1) .
j
A > ~(-f'(1)f'(-1))1/2 3 .
113
114
i
o
'----v,----'
di
Aquellas maravillosas desigualdades
Al aplicar ahora la desigualdad entra la media aritmética y la media geométrica
a - l' (1) Y JI (1), llegamos por medio de (2) a la conclusión
2 2
A ~ - 1 1
3 -f'(1) + f'(-I)
4 1'(1)1'(-1)
31'(1) - 1'(-1)
2
-T
3 '
que es lo que queríamos demostrar. Analizando el caso de igualdad en todas
las desigualdades, el lector puede verificar fácilmente la última afirmación del
teorema. O
Queremos invitar al lector a que busque una demostración igualmente bonita
de la segunda desigualdad del teorema 2.
Era de esperar que en el análisis abundasen las desigualdades, pero he aquí un
ejemplo de la teoría de grafos donde su uso surge de manera muy inesperada.
Más adelante, en el capítulo 32, hablaremos del teorema de Turán, que en el
caso más sencillo afirma lo siguiente:
Teorema 3. Sea G un grafo con n vértices y sin triángulos. Entonces G tiene
2
como mucho ~ aristas, y se da la igualdad solamente si n es par y G es el
grafo bipartito completo K n/ 2,n/2 .
• Primera demostración. Esta demostración, que saca buen partido de la
desigualdad de Cauchy, se debe a Mantel. Sea V = {1, ... , n} el conjunto de
vértices y E el conjunto de aristas de G. Denotamos por di el grado de i, de
donde ¿iEV di = 21EI (véase la página 143 del capítulo 22). Supongamos
que ij es una arista. Dado que G no tiene triángulos, nos encontramos con
que di + d j ~ n, ya que ningún vértice es vecino a la vez de i y j.
Se sigue que
L (di + d j ) ~ nlEI·
ijEE
Nótese que di aparece exactamente di veces en la suma, de manera que
ijEE iEV
Y al aplicar la desigualdad de Cauchy a los vectores (dI, ... , dn ) y (1, ... , 1),
se obtiene
nlEI ~ L d; ~ (¿ di )2 = 41E12,
n n
iEV
de donde se sigue el resultado. En el caso de la igualdad vemos que di = d j
para todo i,j, y además que di = ~ (ya que di + dj = n). Puesto que G no
tiene triángulos, de manera inmediata se sigue que G = Kn/2,n/2. O
• Segunda demostración. La siguiente demostración del teorema 3, que
usa la desigualdad entre la media aritmética y la geométrica, es realmente una
demostración de El Libro, y a pesar de su popularidad no está claro a quién
atribuirla.
Sea a el cardinal de un conjunto independiente máximo A, y f3 = n-a.
Puesto que G no tiene triángulos, los vecinos de un vértice i forman un con-
junto independiente, de donde se deduce que di ~ a para todo i.
Aquellas maravillosas desigualdades
El conjunto B = de cardinal f3 es incidente con cada arista de G. Al
contar las aristas de G según sus vértices extremos en B, obtenemos la relación
IEI :::; ¿iEB di. La desigualdad entre la media aritmética y la geométrica
ahora da
y de nuevo el caso de igualdad puede estudiarse fácilmente. o
[1] H. ALZER: A proof of the arithmetic mean-geometric mean inequality, Amer.
Math. Monthly 103 (1996), 585.
[2] P. S. BULLEN, D. S. MITRINOVICS & P. M. VASlé: Means and their Inequali-
ties, Reidel, Dordrecht 1988.
[3] P. ERDOS & T. GRÜNWALD: On polynomials with only real roots, Annals Math.
40 (1939), 537-548.
[4] G. H. HARDY, J. E. LITTLEWOOD & G. PÓLYA: Inequalities, Cambridge Uni-
versity Press, Cambridge 1952.
[5] W. MANTEL: Problem 28, Wiskundige Opgaven 10 (1906), 60-61.
[6] G. PÓLYA: Review of [3], Mathematical Reviews 1 (1940), 1.
[7] G. PÓLYA & G. SZEGO: Problems and Theorems in Analysis, Vol. 1, Springer-
Verlag, Berlin Heidelberg New York 1972/78; Reprint 1998.
115
Entre las muchas contribuciones de George Pólya al análisis, la siguiente ha
sido siempre la favorita de Erd6s, tanto por lo sorprendente del resultado como
por la belleza de la demostración. Supongamos que
es un polinomio complejo de grado n ::::: 1 con coeficiente director 1. Asocia-
mos a f(z) el conjunto
e := {z E re : If(z)1 :::; 2},
es decir, e es el conjunto de puntos cuya imagen por f está dentro del círculo
de radio 2 y centro en el origen del plano complejo. Por tanto, para n = 1 el
conjunto e es un círculo de diámetro 4.
Utilizando un argumento asombrosamente simple, Pólya demostró la siguiente
preciosa propiedad del conjunto e:
Tomemos cualquier recta L del plano complejo y consideremos la
proyección ortogonal eL del conjunto e en L. Entonces, la longitud
total de dicha proyección es siempre menor o igual que 4.
¿ Qué quiere decir que la longitud total de la proyección eLes menor o igual
que 4? Veremos que eLes una unión finita de intervalos disjuntos h, ... , Jt
y, por tanto, la condición significa que C(h) + ... + C(Jt ) :::; 4, donde C(Jj ) es
la longitud usual de un intervalo.
Haciendo un giro del plano, vemos que es suficiente considerar el caso en que
L es el eje realdel plano complejo. Teniendo en cuenta estos comentarios,
veamos el resultado de pólya.
Teorema 1. Sea f(z) un polinomio complejo de grado mayor o igual que 1 y
con coeficiente director 1. Sea e = {z E re : If(z)1 :::; 2} y sea R laproyec-
ción ortogonal de e sobre el eje real. Entonces, existen intervalos h, ... , Jt
de la recta real cuya unión recubre R y que satisfacen
C(h) + ... + C(It) :::; 4.
Es claro que la cota de 4 del teorema se alcanza para n = 1. Con el fin
de ganar intuición sobre el problema veamos qué ocurre con el polinomio
f(z) = z2 - 2, que también alcanza la cota de 4. Si z = x + iy es un número
complejo, entonces x es su proyección ortogonal sobre la recta real. Por tanto,
R = {x E IR : x + i Y E e para algún y}.
George Pólya
L
18
y
x
Pavnuty Chebyshev en un sello sovié-
tico de 1946
Un teorema de Pólya sobre polinomios
El lector demostrar fácilmente que para el ~V'HR'UJLI"V f (z) = Z2 - 2 se
tiene x + iy E e si y sólo si
De aquí se deduce que x4 ::; (X2 + y2)2 ::; 4X2 y, por tanto, x2 ::; 4, es decir,
Ixl ::; 2. Por otra parte, todo z = x E ~ tal que Ixl ::; 2 verifica IZ2 - 21 ::; 2,
de donde se deduce que n es el intervalo 2] de longitud 4.
Como primer paso escribimos f(z) = (z - el) ... (z - en) con ek = ak +
ibk , Y consideramos el polinomio real p(x) = (x - ad··· (x - an ). Para
z = x + iy E e, según el teorema de Pitágoras
y, por tanto, Ix - akl ::; Iz - ekl para todo k, es decir,
Hemos visto que n está contenido en el conjunto P = {x E ~ : Ip( x) I ::; 2},
y si podemos demostrar que este conjunto está contenido en una familia de
intervalos de longitud total menor o igual que 4, habremos tenninado. Así,
nuestro resultado principal (teorema 1) será una consecuencia del siguiente
resultado.
Teorema 2. Sea p( x) un polinomio real de grado n ;::: 1 con coeficiente direc-
tor 1 y tal que todas sus raíces son reales. Entonces el conjunto
P = {x E ~ : Ip( x) I ::; 2} está contenido en un conjunto de intervalos
de longitud total menor o igual que 4.
Como Pólya demuestra en su artículo [2], el teorema 2 es, a su vez, una con-
secuencia del siguiente resultado, debido a Chebyshev. Para que este capítulo
sea autocontenido hemos incluido una demostración en el apéndice (siguiendo
una bonita exposición de Pólya y Szeg6).
Teorema de
Todo polinomio real p( x) de grado n ;::: 1 con coeficiente director 1 verifica
1
_~';~llp(x)1 ;::: 2n - l ·
Observemos la siguiente consecuencia inmediata.
Corolario. Sea p( x) un polinomio real de grado n ;::: 1 con coeficiente
director 1, y supongamos que Ip(x) I ::; 2 para todo x en el intervalo [a, b].
Entonces b - a ::; 4.
11 Demostración. Considérese el cambio de variable y = b~a (x a) -1. Si
x E [a, b], entonces y E 1,1]. El polinomio correspondiente
q(y) = p(b;a(y+1)+a)
tiene como coeficiente director (b;a)n y verifica
max Iq(y)1 = max Ip(x)l·
-l~y~l a~x~b
Un teorema de Pólya sobre polinomios
Del teorema de se deduce que
y, por tanto, b - a :S: 4, como queríamos demostrar. O
Este corolario nos deja muy cerca del resultado del teorema 2. Si el conjunto
p = {x : Ip( x) I :S: 2} es un intervalo, la longitud de P es menor o igual
que 4. Sin embargo, el conjunto P puede no ser un intervalo, como en el
ejemplo mostrado en la figura, en el que P está formado por dos intervalos.
¿Qué podemos decir sobre P? Como p(x) es una función continua, sabemos
inmediatamente que P es una unión de intervalos cerrados disjuntos 11 , h, ... ,
y que p( x) toma los valores 2 ó -2 en cada extremo de un intervalo 1j. De
aquí se deduce que hay un número finito de intervalos h, ... , ft, ya que p( x)
sólo puede tomar un valor dado un número finito de veces.
La maravillosa idea de Pólya fue construir otro polinomio f5( x) de grado n,
también con coeficiente director 1, Y tal que 15 = {x : 1f5( x ) I :S: 2} es un
intervalo de longitud al menos f(h) + ... + C(1t). Entonces, el corolario
demuestra que f(h) + ... + C(1t) :S: C(15) :S: 4, y hemos terminado .
• Demostración. del teorema 2. Consideremos p( x) = (x - al) ... (x - an )
con P = {x E lR : Ip(x)1 :S: 2} = hU ... U ft, donde hemos ordenado los
intervalos 1j de forma que h es el primero por la izquierda e 1t es el primero
por la derecha. La primera observación es que cualquier intervalo 1j contiene
alguna raíz de p( x ). En efecto, sabemos que p( x) toma los valores 2 ó -2 en
los extremos de 1j. Si un valor es 2 y el otro -2, debe haber una raíz en 1j.
Supongamos que p( x) = 2 en ambos extremos (el caso -2 es análogo). Sea
b E 1j un punto donde p( x) alcanza su mínimo en 1j. Entonces pi (b) = O
y p"(b) ;::: O. Si p"(b) = O, entonces b es una raíz múltiple de p'(X) y,
por tanto, una raíz de p( x) según la observación 1 del recuadro de la página
siguiente. Si, por el contrario, p" (b) > O, entonces se tiene que p(b) :S: O
según la observación 2 del mismo recuadro. Por tanto, o bien p(b) = O, Y
hemos encontrado la raíz, o bien p(b) < O, y tenemos una raíz en el intervalo
entre b y cualquiera de los dos extremos de 1j.
He aquí la idea final de la demostración. Sean 11 , ... ,1t los intervalos consi-
derados anteriormente, y supongamos que el primer intervalo por la derecha,
ft, contiene m raíces de p( x), contadas según su multiplicidad. Si m = n, en-
tonces 1t es el único intervalo (según lo que acabamos de demostrar), y hemos
terminado. Supongamos que m < n y sea d la distancia entre 1t - l e 1t (como
en la figura).
Sean bl , ... , bm las raíces de p( x) contenidas en 1t y el, ... en-m el resto de
las raíces. Escribimos p(x) = q(x )r(x), donde q(x) = (x - bl ) ... (x - bm )
y r(x) = (x - el)'" (x - en-m), y definimos Pl(X) = q(x + d)r(x). El
polinomio PI (x) es también de grado n y tiene un 1 como coeficiente director.
Para x E hU ... U 1t - l se tiene Ix + d - bil < Ix - bil para todo i y, por
tanto, Iq(x + d)1 < Iq(x)l. De aquí se sigue que
para xEhu ... U1t - l .
19
Para el polinomio p( x) = x2 (x - 3) se
tieneP = [1-V3, l]U[l+V3, ~ 3.2]
h ... 1t-l 1t
. !
120 Un teorema de Pólya sobre polinomios
Si, por el contrario, x E entonces Ir(x - d)1 :::; Ir(x)1 y, por tanto,
Ipl(X d)1 = Iq(x)llr(x d)1 :::; Ip(x)1 :::; 2,
loquesignificaqueIt -d<;;;P1 ={x: Ipl(X)1 :::;2}.
En resumen, hemos visto que PI contiene a hU ... UIt-l u( It -d) y, por tanto,
su longitud es mayor o igual que la de P. Obsérvese que en el paso de p( x) a
Pl(X) los intervalos It-l e It - d se unen en un solo intervalo. Concluimos
que los intervalos h, ... , Js de PI (x) que forman PI tienen longitud al menos
f(h) + ... + f(It), y que el primer intervalo por la derecha, J s , contiene más
de m raíces de PI (x). Repitiendo este procedimiento como mucho t - 1 veces,
obtenemos un polinomio p(x) tal que 15 = {x : Ip(x)1 :::; 2} es un intervalo
de longitud f(15) 2: f(h) + ... f(It ), lo que completa la demostración. O
con
Sea p( x) un polinomio no constante que sólo tiene raíces reales.
Hecho 1. Si b es una raíz múltiple de pi (x), también es raíz de p(x).
11 Demostración. Sean b1 , ... , br las raíces de p( x) con multi-
plicidades respectivas SI, ... , S,.., donde 2::;=1 Sj = n. Como
p(x) = (x - bj )Sj h(x), se tiene que bj es una raíz de pi (x) si Sj 2: 2 y
que la multiplicidad de bj en pi (x) es Sj - 1. Además, existe una raíz
de pi ( x) entre b1 y b2 , otra raíz entre b2 y b3 , ••. , y una entre br - 1 Y br ,
y todas ellas deben ser raíces simples, ya que 2::;=1 (Sj - 1) + ('1' - 1)
suma n - 1, el grado de p'(X). Por tanto, las raíces múltiples de p'(X)
son necesariamente raíces de p( x). O
Hecho 2. Se tiene p'(x? 2: p(X)p"(X) para todo x E lIt
11 Demostración. Si x = ai es una raíz de p( x), entonces no hay nada
que demostrar. Supongamos que x no es una raíz. La regla de derivación
del producto dice que
n p(x) pi (x) n 1
p'(X) , es decir,
p(x) ¿~. x-ak k=l k=l
Derivando de nuevo se obtiene
p"(x)p(x) - p'(X)2 n 1
p(x)2 k=l (x - ak)2
< O. O
Un teorema de Pólya sobre polinomiosTeorema. Sea p(i) un polinomio real de grado n 2': 1 con coeficiente direc-
tor 1. Entonces .
1
_~';~llp(x)1 2': 2n- 1'
Antes de comenzar, veamos algunos ejemplos donde se da la igualdad. En
el margen se muestran las gráficas de los polinomios de grado 1, 2 Y 3 que
alcanzan la igualdad. De hecho, veremos que hay exactamente un polinomio
en cada grado que alcanza la igualdad en el teorema de Chebyshev .
• Demostración. Sea p(x) = xn + an_1Xn- 1 + ... + aa un polinomio
real y con coeficiente director 1 . Como estamos interesados en el intervalo
-1 :S x :S 1, hacemos x = cos {} y llamamos g( {}) := p( cos {}) al polinomio
resultante en cos {},
(1)
Los dos siguientes pasos de la demostración son a la vez resultados clásicos e
interesantes en sí mismos.
(A) Expresamos g( {}) como un polinomio en coseno, es decir, un polinomio
de la forma
g( {}) = bn cos n{} + bn - 1 cos( n - 1){} + ... + b1 COS {} + ba (2)
donde bk E IR., Y demostramos que el coeficiente director es bn = 2}-1'
(H) Dado cualquier polinomio en coseno h( {}) de grado n (es decir, tal que An
es el último coeficiente no nulo)
h({}) = Ancosn{}+An_lcos(n-1){}+ ... +Aa, (3)
demostramos que IAnl :S max Ih({})I, lo que, al aplicarlo a g({}), concluirá la
demostración del teorema.
Demostración de (A). Para conseguir (2) a partir de (1), tenemos que expresar
las potencias (cos {})k como polinomios en coseno. Por ejemplo, de la fórmula
para el coseno del ángulo doble
cos 2{} = cos2 {} - sen2 {} = 2 cos2 {} - 1,
se deduce que cos2 {} = ~ cos 2{} + ~. Para hacer esto con una potencia
arbitraria (cos {}) k introducimos los números complejos mediante la relación
eix = cos x + i sen x. Los números eix son los complejos de módulo 1 (véase
el recuadro sobre raíces complejas de la unidad de la página 25). En particular,
esto proporciona la igualdad
eim9 = cos n{} + i sen n{}. (4)
Por otra parte,
(5)
121
1 ........... .
Los polinomios Pl (x) = X, P2 (x)
X2 - ~ y P3(X) = x3 - ~x alcanzan la
igualdad en el teorema de Chebyshev.
122
Lk2:0 (2~) = 2n - 1 se verifica para
todo n > O: todo subconjunto de
{l, 2, ... , n - l} se puede asociar a un
subconjunto de {l, 2, ... ,n} de tamaño
par si se añade el elemento n "cuando
sea necesario."
Un teorema de Pólya sobre polinomios
Igualando las partes reales de (4) y (5) se obtiene, utilizando que i 4H2 =
i 4f = 1 Y que sen2 e = 1 - cos2 e,
cos mJ L: (:e) (cos 19t-4f (1 - cos2 'l9)2f
f?:O
-L:( n )(cOS'l9)n-4e-2(I_Cos2 'l9)2Hl.
e?:o 4,(i + 2
Por tanto, cos n'l9 es un polinomio en cos 'l9,
cos n'l9 = cn( cos 'l9)n + Cn-l (cos 'l9)n-l + ... + Co.
A partir de (6) se obtiene que el coeficiente director es
Cn = L: (:e) + L: (4,(i:2) 2n - 1 .
e?:o e?:o
(6)
(7)
Ahora le damos un giro total a nuestro argumento. Suponiendo por inducción
que, para k < n, (cos 'l9)k se puede expresar como un polinomio en coseno de
grado k, deducimos de (7) que (cos 'l9) n se puede escribir como un polinomio
en coseno de grado n con coeficiente director bn = 2nl_l'
Demostración de (B). Sea h( 'l9) un polinomio en coseno de grado n como
en (3) y supongamos, sin pérdida de generalidad, que An > O. Definiendo
m( 'l9) := An cos n'l9 se tiene que
m(~7r) = (-llAn parak=O,l, ... ,n.
Para llegar a una contradicción, supongamos que max I h( 'l9) I < An. Entonces
m(~7r) - h(~7r) = (_l)k An - h(~7r)
es positivo si k es par y negativo si k es impar en el intervalo O S; k S; n. Se
concluye que m( 'l9) - h( 'l9) tiene al menos n raíces en el intervalo [O, 7r]. Pero
esto es imposible ya que m( 'l9) - h( 'l9) es un polinomio en coseno de grado
n - 1, que se puede escribir como en (1) y que tiene, por tanto, como mucho
n - 1 raíces.
Esto concluye la demostración de (B) y del teorema de Chebyshev. D
Ahora es fácil completar el análisis, demostrando que gn ('l9) := 2nl_l COS n'l9
es el único polinomio en coseno de grado n y con coeficiente director 1 que
alcanza la igualdad max Ig( 'l9) I = 2nl_l'
Los polinomios T n (x) = cos n 'l9, x = cos 'l9, se conocen como polinomios de
Chebyshev (de primera especie); por tanto, 2nl_l Tn(x) es el único polinomio
de grado n con coeficiente director 1 que alcanza la igualdad en el teorema de
Chebyshev.
[1] P. L. CEBYCEV: (Euvres, Vol. l, Acad. Imperiale des Sciences, St. Peters-
burg 1899, pp. 387-469.
[2] G. PÓLYA: Beitrag zur Verallgerneinerung des Verzerrungssatzes auf rnehifach
zusarnrnenhiingenden Gebieten, Sitzungsber. Preuss. Akad. Wiss. Berlin (1928),
228-232; Collected Papers Vol. l, MIT Press 1974,347-351.
[3] G. PÓLYA & G. SZEGO: Problerns and Theorerns in Analysis, Vol. 1I, Springer-
Verlag, Berlin Heidelberg New York 1976; Reprint 1998.
En 1943, Littlewood y Offord demostraron el siguiente resultado mientras tra-
bajaban en la distribución de raÍCes de ecuaciones algebraicas:
Sean al, a2, ... ,an números complejos con I ai I 2: 1 para todo i,
y consideremos los 2n combinaciones lineales 2:7=1 Eiai tales que
Ei E {1, -1}. Entonces el número de sumas 2:7=1 Eiai contenidas
en el interior de cualquier circunferencia de radio 1 no es mayor que
2n
e fo log n para alguna constante e > O.
Unos años más tarde, Paul Erd6s mejoró esta cota eliminando el término log n,
pero lo que aún es más interesante, pudo demostrar que esta afirmación es una
sencilla consecuencia del teorema de Spemer (véase página 151).
Para hacerse una idea de este argumento, consideremos el caso en el que todos
los ai son reales. Podemos incluso suponer que todos ellos son positivos,
cambiando ai por -ai Y Ei por -Ei cuando ai < O. Suponemos ahora que un
conjunto de combinaciones 2: Eiai está contenido en el interior de un intervalo John E. Littlewood
de longitud 2. Sea N = {1, 2, ... ,n} el conjunto total de índices. Para cada
2: Eiai ponemos 1 := {i E N : Ei = 1}. Ahora, si 1 ~ I' para dos de estos
conjuntos, concluimos que
¿E~ai - ¿Eiai = 2 ¿ ai 2: 2,
iEI'\I
una cóntradicción. Por tanto, los conjuntos 1 forman una anticadena, y por el
teorema de Spemer hay como mucho (Ln/2J) de aquellas combinaciones. De
la fórmula de Stirling (véase página 11) se sigue que
para algún e > O.
Si n es par y todos los ai = 1, obtenemos (n/2) combinaciones 2:7=1 Eiai
que suman O. Fijándonos en el intervalo ( -1, 1), concluimos que este número
binomial nos da la cota exacta.
En el mismo artículo, Erd6s conjeturó que (L n/2 J) era la cota correcta también
para números complejos (sólo consiguió demostrar e 2nn-1/2 para alguna
constante e), y además que la misma cota es válida para vectores al, ... , a n
con lail 2: 1 en un espacio de Hilbert real, si reemplazamos la circunferencia
de radio 1 por una bola abierta de radio l.
Erd6s estaba en lo cierto, pero tuvieron que pasar veinte años hasta que tanto
Gyula Katona como Daniel Kleitman dieran, de manera independiente, con
El teorema de "'I""AlI""'. El tamaño de
cualquier anticadena de subconjuntos
de un conjunto de n elementos es como
mucho (Ln/2J)'
124 Sobre un lema de Littlewood y Offord
una demostración para los números complejos (o, lo que es lo mismo, para el
plano ]R2). Sus demostraciones usaron de manera explícita que el plano tiene
dimensión 2, y no quedaba claro en absoluto cómo extender su resultado para
el caso de espacios vectoriales reales de dimensión finita.
Entonces, en 1970 Kleitman demostró toda la conjetura en espacios de Hilbert
mediante un argumento de asombrosa sencillez. De hecho, demostró aún más.
Su argumento es un todo un ejemplo de lo que se puede conseguir con la
hipótesis de inducción adecuada.
Unas palabras de ánimo para los lectores que no están familiarizados con los
espacios de Hilbert: No los necesitamos realmente. Ya que sólo trataremos
con un número finito de vectores aí, basta considerar el espacio vectorial
real]Rd con el producto escalar usual. He aquí el resultado de Kleitman.
Teorema. Sean al, ... , a n vectores en ]Rd, cada uno de longitud por
lo menos 1, y consideremos k regiones abiertasR l , ... , Rk de ]Rd,
de manera que Ix yl < 2 para cualesquiera x, y contenidos en la
misma región Rí.
Entonces el número de combinaciones lineales I:7=l Siai, de modo
que Si E {1, -1}, que pueden estar dentro de la unión Ui Ri de las
regiones es como mucho la suma de los k mayores coeficientes bino-
miales (~).
En particular, para k = 1 obtenemos la cota (Ln/2J).
Antes de pasar a la demostración, notaremos que la cota es ajustada para la
elección de vectores
al = ... = a n = a = (l,O, ... ,O)T.
En efecto, para n par obtenemos (n/2) sumas igual a O, (n/~-l) sumas igual
a (-2)a, (n/~+1) sumas igual a 2a, y así sucesivamente. Eligiendo bolas de
radio 1 alrededor de
(-2)a, 0, 2a, 2l k;l Ja,
obtenemos
sumas contenidas en estas k bolas. Esta es la expresión que buscamos, ya que
los coeficientes binomials mayores se hallan en el centro (véase página 12).
Podemos razonar de manera similar para n impar .
• Demostración.. Podemos suponer sin pérdida de generalidad que todas las
regiones Ri son disjuntas, y esto es lo que haremos a continuación. La clave de
la demostración es la recursión característica de los coeficientes binomiales, ya
que nos proporciona una relación entre los mayores coeficientes binomiales de
n y n - 1. Para verlo, ponemos r = l n-~+1 J y s = l n+~-l J, de manera que
Sobre un lema de Littlewood y Offord
(~), (r~l)' ... , G) son los k mayores coeficientes para n. Ahora la recursión
G) = (n~l) + G~;) implica que
t(n~l)+t(~~n
1,=7' 'l,=T
~ (n ~ 1) + .I 1 (n -1) (1)
itl (n ~ 1) + ~ (n ~ 1),
y un cálculo fácil nos muestra que la primera expresión suma los k+ 1 mayores
coeficientes binomiales (n~ 1), y la segunda los k - 1 mayores.
La demostración de Kleitman sigue un razonamiento por inducción sobre n,
siendo el caso n = 1 trivial. Teniendo en cuenta (1), para el paso de inducción
sólo tenemos que demostrar que las combinaciones lineales de al, ... , a n
que están en k regiones disjuntas se corresponden de manera biyeetiva con
combinaciones de al, ... ,an-l que están en k + 1 ó k - 1 regiones.
nr.m{j!czórm. Por lo menos una de las regiones trasladadas Rj - a n
es disjunta de todas las regiones trasladadas Rl + an, ... ,Rk + an0
Para verlo, consideramos el hiperplano H = {x : (an , x) = e} ortogonal
a an, que contiene a todas las regiones trasladadas Ri + a n en el lado dado
por (an , x) ~ e, y que está en contacto con la adherencia de alguna región,
por ejemplo Rj + an0 Tal hiperplano existe porque las regiones son acotadas.
Ahora se cumple Ix - yl < 2 para cualquier x E Rj e yen la adherencia
de Rj, porque Rj es abierta. Queremos demostrar que Rj - a n está en el lado
contrario de H. Supongamos, por el c~ntrario, que (an , x - an) ~ e para
algún x E Rj, esto es, (an , x) ~ lan l2 + e.
Sea y + a n un punto donde H está en contacto con Rj + a n . Entonces y está
en la adherencia de R j , y (an , y + an) = e, esto es, (an , -y) = lan l2 - C.
Por tanto
(an , x - y) ~ 21an12,
y deducimos de la desigualdad de Cauchy-Schwarz que
Obtenemos pues (usando lanl ~ 1) que 2 :S 21an l :S Ix - yl, lo cual es
una contradicción.
Lo demás es fácil. Clasificamos las combinaciones ¿ Eiai que están en la
unión Rl U ... U Rk de la manera siguiente. En la clase 1 agrupamos a to-
das las sumas ¿~=l Eiai con En = -1 Y todas las sumas ¿~=l Eiai con
En = 1 que están en Rj, Y en la clase 2 agrupamos las demás combinaciones
¿~=l Eiai con En = 1 que no están en Rj. Concluimos que las combinacio-
nes ¿~:ll Eiai de la clase 1 están contenidas en las k + 1 regiones disjuntas
Rl + a n , . .. , Rk + a n y Rj - an, y que las combinaciones ¿~:ll Eiai de
125
H
126 Sobre un lema de Littlewood y Offord
la clase 2 están en las k - 1 regiones disjuntas Rl - an, ... ,Rk - a n sin
Rj - an' Por inducción, la clase 1 contiene como mucho 2:::=r~l (n~l)
combinaciones, mientras que la clase 2 contiene como mucho 2::::::; (n~l)
combinaciones - y por (1) esto ya es toda la demostración, tal y como está
recogido en El Libro. D .
[1] P. ERDOS: On a lemma of Littlewood and Offord, Bulletin Amer. Math. Soco 51
(1945), 898-902.
[2] G. KATONA: On a conjecture of Erdffs and a stronger form of Sperner's
theorem, Studia Sci. Math. Hungar. 1 (1966), 59-63.
[3] D. KLEITMAN: On a lemma of Littlewood and Offord on the distribution of cer-
tain sums, Math. Zeitschrift 90 (1965), 251-259.
[4] D. KLEITMAN: On a lemma ofLittlewood and Offord on the distributions oflinear
combinations ofvectors, Advances Math. 5 (1970),155-157.
[5] J. E. LITTLEWOOD & A. C. OFFORD: On the number of real roots of a
random algebraic equation 1Il, Mat. USSR Sb. 12 (1943), 277-285.
¿Cuál es la fórmula más interesante que involucra funciones elementales? En
su bonito artículo [2], cuya exposición seguiremos bastante de cerca, Jürgen
Elstrodt nos propone como un primer candidato el desarrollo en fracciones
parciales de la función cotangente:
1 00 1 1
'ircot'irX = - + (-- + --)
X n=l X + n x-n
(x E ffi.\Z).
Esta fórmula tan elegante fue probada por Euler en el § 178 de su Introductio
in Analysin Injinitorum del año 1748, y ciertamente es uno de sus hallazgos
más bellos. Se puede escribir de manera todavía más elegante como
'ir cot 'irX
N 1
lim "" --
N-+oo L-,¡ X + n
n=-N
(1)
pero hay que tener en cuenta que la evaluación de la suma ¿nEZ x~n es un
tanto delicada, ya que tan solo es condicionalmente convergente. Por tanto, su
valor depende del orden en que se sume. Gustav Herglotz
Deduciremos (1) mediante un argumento asombrosamente sencillo, que se
atribuye a Gustav Herglotz - el "truco de Herglotz." Para empezar, ponemos !
f(x) := 'ir cot 'ir X , g(x) :=
N 1
lim "" --
N -+00 L-,¡ X + n'
n=-N
e intentamos demostrar que estas funciones tienen tantas propiedades en común
que en realidad deben coincidir.
CA) Las funciones f y g están definidas para todos los valores no enteros, y
en ellos son continuas.
Para la función f (x) = 'ir cot 'irX = 'ir ~~~ ;~ , esto es claro (véase la figura).
Para g(x), primero usamos la identidad _+1 + _1_ = - }x 2 para reescribir x n x-n n -x
la fórmula de Euler como
'ir cot 'irX
1 00 2x
; - L n 2 x2·
n=l
Por tanto, para CA) tenemos que demostrar que para todo x ~ Z, la serie
00 1
L n 2 -x2
n=l
converge de manera uniforme en un entorno de x.
(2)
f(x)
La función f (x) = 'ir cot 7TX
x
jli
11'1
ii
1 I
II
¡I
1'1
1 I
i
l'
1
l'
1' I li
1
1:
1
128
Fórmulas de adición:
sen(x + y) = senx cosy + cosx seny
cos(x + y) = cosxcosy - senxseny
===} sen(x + ~) = cos x
cos(x+~) = -senx
sen x = 2 sen ~ cos ~
cosx = cos2 ~ - sen2 ~.
La cotangente y .el truco de Herglotz
No hay ningún problema para el primer término n = 1, o para los términos
con 2n - 1 ::; x 2 , ya que sólo hay un número finito de ellos. Por otro lado,
para n 2: 2 Y 2n -1> x 2 , esto es n 2 - X2 > (n - 1)2 > O, los sumandos
están acotados por
O <
1 1
< (n-1)2'
cota que no es válida sólo para x, sino también para valores en un entorno de x.
Finalmente, el hecho de que ¿ (n-=1)2 converge (a ~2, véase la página 35)
proporciona la convergencia uniforme que necesitarnos para demostrar (A).
(B) Tanto f como 9 son funciones periódicas de periodo 1, lo cual quiere
decir que f(x + 1) = f(x) Y g(x + 1) = g(x) para todo x E ffi.\Z.
Ya que la cotangente tiene periodo 7T, vemos que f tiene periodo 1 (véase otra
vez la figura de arriba). Para 9 argumentaremos como sigue. Sea
entonces
N 1
L x+n'
n=-N
N 1
L x+1+n
n=-N
N+1 1
L x+n
n=-N+l
1 1
gN-l (x) + -x-+-N- + -x-+-N-+-1
Por tanto, g(x + 1) = lim gN (x + 1) = lim gN-l (x) = g(x).
N-+oo N-+oo
(C) Tanto f como 9 son funciones impares, lo cual quiere decir que tenemos
f(-x) = -f(x) y g(-x) = -g(x) para todo x E ffi.\Z.
La función f obviamente tiene esta propiedad, y para ver que 9 también la
tiene basta observar que 9 N (-x) = -gN (x).
Las últimas dos afirmaciones constituyen el truco de Herglotz: Primero vemosque f y 9 satisfacen la misma ecuación funcional, y en segundo lugar que
h := f - 9 se puede extender de manera continua a todo IR..
(D) Las dos funciones f y 9 satisfacen la misma ecuación funcional:
f(~)+f(X!1)=2f(x) y g(~)+g(xtl)=2g(x).
Para f (x) esto se sigue de los teoremas de adición para el seno y coseno:
f(~) + f(xt 1 ) 7T [COS 1r2X _ sen 1f2X ] sen 1r
2
X cos 1r
2
X
cos(1rX + 1rX)
27r 2 2
sen (1r
2
X + 1r
2
X)
La ecuación funcional para 9 se sigue de
2 f(x).
La cotangente y el truco de Herglotz
lo cual a su vez es consecuencia de
1 1 -_. + --;-c;---
3'. + n x+I + n
2 2
Ahora examinaremos la función
( 1 1) 2 --+ . x + 2n x + 2n + 1
h(x) = f(x) - g(x) (
1 ¿oo__ 2x )
= JrcotJrX - - - .
x n 2 - x2
n=l
(3)
Llegados a este punto, ya sabemos que h es una función continua en ffi.\Z que
satisface las propiedades ¿Qué le pasa en los valores enteros? A
partir de los desarrollos del seno y del coseno, o aplicando dos veces la regla
de l'Hospital, hallamos que
lim (cotx -~)
x->O X
y por tanto también
x cosx - senx
lim
x->O xsenx
1 ( ;;
1) = O. im Jr cot JrX -
x->O
o,
Pero puesto que la suma L~=I n}::x2 en (3) converge a O si x -----+ O, tenemos
de hecho que lim h( x) = O, Y por tanto por la periodicidad que
x->O
lim h(x) = O para todo n E Z.
x->n
Resumiendo, hemos demostrado lo siguiente:
(E) Al definir h(x) := O para x E Z, la función h es continua en todo ffi. y
tiene las propiedades (B), (e) Y (D).
Ya estamos en posición de dar el golpe de gracia. Puesto que h es una función
periódica y continua, tiene un máximo m. Sea Xo un punto en [0,1] tal que
h(xo) = m. De (D) deducimos que
h( x
2
0) + h( XOiI) = 2m,
y por tanto que h( X20) = m. Iterando, obtenemos h( ~~) = m para todo n, y
por tanto h(O) = m por continuidad. Pero h(O) = O, Y por tanto m = O, esto
es, h(x) .:::; O para todo x E R Ya que h(x) es una función impar, h(x) < O
es imposible, y por ende h(x) = O para todo x E ffi., Y hemos demostrado el
teorema de Euler. O
Entre los muchos corolarios que son consecuencia de (1), los más famosos son
los que tratan de los valores de la función zeta de Riemann en enteros pares
positivos (véase el apéndice al capítulo 6),
00 1
((2k) = ¿ 2:k
n=l n
(k E N). (4)
. Para acabar nuestra historia, veremos de qué manera trató Euler - unos años
más tarde, en 1755 -la serie (4). Empezamos con la fórmula (2). Al multi-
plicar (2) por x y poner y = JrX encontramos para Iyl < Jr que
129
x 3 ::r;5 x 7
sen x = x - 3T + 5T - 7! ± ...
130 La cotangente y el truco de Herglotz
ycoty
00 y2 1
1 - 2 0 -7f2-n-2 -1 -_-(-y-)--;'-2 .
n-l 7rn
El último factor es la suma de una serie geométrica, y por tanto
ycoty
00 00 2k
1-2~~ (:n) "
n=lk=l
~ ( 1 ~ 1 ) 2k 1 - 2 L-, 7f2k L-, n 2k y ,
k=l n=l
y hemos demostrado el siguiente resultado notable:
Para todo k E N, el coeficiente de y2k en el desarrollo en serie de potencias
de y coty es
[
2k] 2 ~ 1 2 Y ycoty = -2f L-, 2f = -2f((2k).
7f n=l n 7f
(5)
Hay otra manera, mucho más "canónica", de obtener un desarrollo en serie de
y cot y. Sabemos del análisis que e iy = cos y + i sen y, y por tanto
eiy + e-iy
cosy
2
lo cual conduce a
y cot y iy
eiy + e-iy
eiY - e-iy
Ahora sustituimos z = 2iy, Y obtenemos
z eZ + 1
ycoty = ---
2 eZ -1
é y e-iy
sen y =
2i
e2iy + 1
~y
e2iy - 1
z z - +
2 ez -1
(6)
Por tanto, todo lo que nos hace falta es una expansión en serie de potencias de
la función e'=-l; nótese que esta función está definida y es continua en todo lPI.
(para z = O usamos la serie de la función exponencial, o de manera alternativa
la regla de l'Hospital, lo cual nos da el valor 1). Escribimos
(7)
Los coeficientes Bn son conocidos como los números de Bernoulli. El primer
miembro de (6) es una función par (esto es, f(z) = f( -z)), y por tanto vemos
que Bn = O para n 2:: 3 impar, mientras que B 1 = - ~ corresponde al término
de ~ en (6). De
z
La cotangente y el truco de Herglotz
obtenemos al comparar coeficientes para zn que
n-1
'\:-:-' Bk = { 01
6 k!(n - k)!
ck=O
paran = 1,
para ni- 1. (8)
A partir de (8) podemos calcular los números de Bemoulli de manera recur-
siva. El valor n = 1 nos da Bo = 1, el siguiente valor n = 2 nos proporciona
la relación ~o + B 1 = O, de donde B 1 = -~, y así sucesivamente.
Ahora casi hemos terminado: Al combinar (6) y (7) obtenemos
00 (2iy)2k 00 (_1)k22k B 2k 2k
ycoty = ¿B2k (2k)! = ¿ (2k)! y,
k=O k=O
y de aquí se deduce, con (5), la fórmula de Euler para ((2k):
00 1 (_1)k-122k-1B2k 2k
~ n 2k = (2k)! 7'1 (k E N). (9)
De nuestra tabla de los números de Bemoulli obtenemos así otra vez la suma
L ;2 = ~2 del capítulo 6, y además las relaciones
00 1 6917'112
¿ n 12 = 638512875'
n=l
El número de Bemoulli BlO = 656' que proporciona el valor de ((10), parece
bastante inofensivo, pero el siguiente valor B 12 = - 2
6
i3
1
0' que necesitamos
para ((12), contiene el número primo bastante grande 691 en el numerador.
Euler había calculado unos cuantos valores (( 2k ), pero sin darse cuenta de
la conexión con los números de Bemoulli - sólo la aparición del extraño
primo 691 le puso sobre aviso.
Dicho sea de paso, puesto que ((2k) converge a 1 si k ---+ 00, la ecuación (9)
nos dice que los números I B 2k I crecen muy deprisa - algo que no es evidente
a la vista de los primeros valores.
Por otra parte, sabemos muy poco sobre los valores de la función zeta de
Riemann en los enteros impares k 2: 3; véase la página 41.
[1] S. BOCHNER: Book review of "Gesammelte Schriften" by Gustav Herglotz, Bu-
lletin Amer. Math. Soco 1 (1979), 1020-1022.
[2] J. ELSTRODT: Partialbruchzerlegung des Kotangens, Herglotz-Trick und die
Weierstraj3sche stetige, nirgends differenzierbare Funktion, Math. Semesterberi-
chte 45 (1998), 207-220.
[3] L. EULER: lntroductio in Analysin lnfinitorum, Tomus Primus, Lausanne 1748;
Opera Omnia, Ser. 1, Vol. 8. In English: lntroduction to Analysis of the lnfinite,
BookI (translated by J. D. Blanton), Springer-Verlag, New York 1988.
[4] L. EULER: lnstitutiones calculi differentialis cum ejus usu in analysifinitorum ac
doctrina serierum, Petersburg 1755; Opera Omnia, Ser. 1, Vol. 10.
131
n012345678
Bn 1 - ~ i O - 310 O 12 O - 310
Los primeros números de Bernoulli
iCios Potefiarum ipfius;r
continuare licuit, quod
R ".
darÍus perrpída~
commodiori modo
artificio
adjurud,
La página 131 de la "Introductio in
Analysin Infinitorum" de Euler del año
1748
Se dice que un noble francés, Georges Louis Leclerc, Conde de Buffon, pro-
puso el siguiente problema en 1777:
¡JUJ'Jurll!u:rrtLIS que se lanza una aguja corta en
es la de que la
una de las lineas?
La probabilidad depende de la distancia d entre las líneas y también de la
longitud R, de la aguja. De manera más precisa, depende sólo de la razón ~.
Para nuestro objetivo, una aguja corta es una de longitud R, ::; d, es decir
que no puede cruzar dos líneas a la vez (y la probabilidad de que toque dos
líneas es cero). La solución al problema de la aguja de Buffon puede resultar
sorprendente, ya que involucra el número H.
Teorema ("Problema de la aguja de Buffon")
Si se lanza una aguja corta de longitud R, sobre un papel pautado con líneas
equidistantes a distancia d 2: R" entonces la probabilidad de que la aguja
caiga en una posición tal que cruce una de las líneas es
2R,
p = --o
Hd
Como consecuencia de este resultado, podemos obtener valores aproximados
de H mediante un experimento: Si lanzamos una aguja N veces, y resulta éxito
(una intersección) en P casos, entonces ~ debería ser aproximadamente ~ ~,
es decir, el número 2Jj'! debería ser una aproximación de H. Quizás el expe-
rimento más largo (y exhaustivo) fue llevado a cabo en 1901 por Lazzarini,
quien supuestamente llegó incluso a construir una máquina para lanzar una
aguja 3408 veces (con ~ = ~). Se encontró con que la aguja cruzaba una lí-
nea en 1808 ocasiones. Después de hacerlas cuentas, llegó a la aproximación
H :=::; 2 . ~ f~g~ = 3.1415929 .... , que es correcta hasta el sexto dígito de H,
¡y demasiado bonita para ser verdad! (Los valores elegidos por Lazzarini con-
ducen a la conocida aproximación H :=::; ~i~, que apareció en la página 31.
Esto explica las más que sospechosas elecciones de 3408 y ~, cuyo producto
es un múltiplo de 355. Véase [5] para una discusión del engaño de Lazzarini.)
El problema de la aguja puede resolverse evaluando una integral. Lo haremos
más adelante, y así también resolveremos el problema para una aguja "larga".
Pero la demostración de El Libro, presentada por E. Barbier en 1860, no ne-
cesita integrales. Simplemente lanza una aguja diferente ...
El conde de Buffon
/ \ ~ \
\ ~~ ,\ td I ,
I /
" . ----- ,/ ""'-- ,/
7
,
~//
\
\ \ IR,
134
OOO(JO
La aguja de Buffon
Si se lanza cualquier aguja, corta o
cruces será
entonces el número de
E = PI + 2P2 + 3P3 + ... ,
donde PI es la probabilidad de que la aguja cruce exactamente una línea, P2 es
la probabilidad de que cruce dos, P3 la de que cruce tres, etc. Por lo tanto, la
probabilidad de que obtengamos por lo menos un cruce, que es la que se pide
en el problema de Buffon, es
P = PI + P2 + P3 + ...
(Los sucesos en los cuales la aguja cae exactamente sobre una línea, o con
un extremo en una de ellas, tienen probabilidad cero; por tanto, pueden ser
ignorados a lo largo de la discusión del problema.)
Por otro lado, si la aguja es corta, entonces la probabilidad de obtener más
de un cruce es cero, P2 = P3 = ... = O, Y de aquí se obtiene E = p: la
probabilidad que buscamos es precisamente el número esperado de cruces.
Esta reformulación del problema es extremadamente útil, ya que ahora puede
utilizarse la linealidad de la esperanza (véase la página 84). Escribiremos E (e)
para el número esperado de cruces que se obtienen al lanzar una aguja recta
de longitud e. Si esta longitud es e = x + y, y consideramos por separado
su "parte de delante", de longitud x, y su "parte de detrás", de longitud y,
entonces obtenemos
E(x + y) = E(x) + E(y),
ya que cualquier cruce siempre se produce o bien por la parte de delante o bien
por la parte de detrás.
Por inducción sobre n, esta "ecuación funcional" implica que E(nx) = nE(x)
para todo n E N, y por tanto que mE(~x) = E(m~x) = E(nx) = nE(x).
Así, se verifica E (rx) = rE (x) para todo racional r E Q. Además, E (x) es
claramente monótona en x 2: O, de lo cual obtenemos que E(x) = ex para
todo x 2: O, donde e = E(l) es alguna constante.
Pero, ¿cuál es esta constante?
Para hallar la respuesta usaremos agujas de diferente forma. Lancemos pues
una aguja "poligonal" de longitud total e formada por segmentos de recta. El
número de cruces que se producen es (con probabilidad 1) la suma del número
de cruces que se producen en cada una de sus partes. De aquí se deduce que
el número esperado de cruces es, de nuevo,
E = ce,
por la linealidad de la esperanza. ¡Para este resultado ni siquiera importa si los
segmentos de recta están unidos de manera rígida o flexible!
La clave para la solución de Barbier al problema de la aguja de Buffon es
considerar una aguja que sea una circunferencia perfecta e de diámetro d,
cuya longitud es x = dlr. Si se lanza esta aguja sobre un papel pautado,
produce siempre dos intersecciones.
La circunferencia puede aproximarse mediante polígonos. hnagínese que
junto a la aguja circular e lanzamos un polígono inscrito Pn , y otro polígono
La aguja de Buffon
circunscrito pn. Cualquier línea que a Pn también intersecará a e,
y si una línea interseca a e entonces también cortará a pn . Por lo tanto, los
números esperados de intersecciones satisfacen
Tanto Pn como pn son polígonos, de manera que el número esperado de
cruces es "e multiplicado por la longitud" en ambos casos, mientras que para e
es 2. Por tanto,
cf!(Pn) :::; 2 :::; cf!(pn).
Ahora, Pn y pn aproximan e para n ---+ oo. En particular,
lim f!.(Pn) = d7r = lim f!.(pn),
n-+oo n-+oo
y por tanto para n ---+ 00 deducimos de (1) que
e d7r :::; 2 :::; e d7r,
lo cual conduce a que e = ~ ~.
(1)
o
Pero también podríamos haberlo hecho utilizando cálculo. La clave para ob-
tener una integral "sencilla" es considerar en primer lugar la pendiente de la
aguja. Supongamos que la aguja cae formando un ángulo a con la horizon-
tal, con a variando en el intervalo O :::; a :::; ~. (Ignoraremos el caso en el
que la aguja cae con pendiente negativa, ya que este caso es simétrico al de
la pendiente positiva y tiene la misma probabilidad.) Una aguja que cae con
ángulo a tiene altura f!. sen a, y la probabilidad de que cruce una de las líneas
horizontales separadas por una distancia d es Ji s':in a. De aquí obtenemos la
probabilidad calculando la media sobre los posibles valores de a:
1r/2
p ~ J f!.sena da = ~~ [- cosa] 1r/2 = ~~.
7r d 7rd o 7rd
o
Para una aguja larga obtenemos la misma probabilidad Jis':in a miel!tras que se
verifique f!. sen a :::; d, esto es, en el intervalo O :::; a :::; arcsen ~. Sin embargo,
para ángulos a más grandes la aguja tiene que cruzar una línea y por lo tanto
la probabilidad es 1. De aquí calcularnos, para f!. ;:::: d, que
p
1r /2
2 (¡arCSen(d/Ji) f!. sen a J )
- --da + Ida
7r o d
arcsen( d/ Ji)
2(f!.[ ]arCSen(d/Ji) (7r d)) ;: d - cos a o + 2" - arcsen f
I + ~ (~ ( I - VI - ~:) - arcsen ~) .
La respuesta no ha resultado tan bonita para una aguja larga, pero en cam-
bio nos proporciona un problema interesante: Demuéstrese que la fórmula
da como resultado ~ en el caso f!. = d, que es estrictamente creciente como
función de f!., y que tiende a I para f!. ---+ oo.
135
Q o
()
o
\
\
\
/
/
I
I
136
111 :
,11,
"¿ Tiene algún problema?"
La aguja de Buffon
[1] E. BARBIER: Note sur le problhne de l'aiguille et le jeu dujoint couvert, J. Mat-
hématiques Pures et Appliquées (2) 5 (1860), 273-286.
[2] L. BERGGREN, J. BORWEIN & P. BORWEIN, EDS.: Pi: A Source Book, Springer-
Verlag, New York 1997.
[3] G. L. LECLERC, COMTE DE BUFFON: Essai d'arithmétique morale, Appendix
to "HistoÍre naturelle générale et particuliere," Vol. 4, 1777.
[4] D. A. KLAIN & G.-C. ROTA: Introduction to Geometric Probability, "Lezioni
Lincee," Cambridge University Press 1997.
[5] T. H. O'BEIRNE: Puzzles and Paradoxes, Oxford University Press, London 1965.
I
.. ..
I I
22
El principio del palomar
y el doble recuento 139
23
Tres teoremas famosos
sobre conjuntos finitos 151
24
Barajando el mazo 157
25
Caminos, retículas
y determinantes 167
26
La fórmula de Cayley
para el número de árboles 173
27
Completando cuadrados
latinos 179
28
El problema de Dinitz 185
29
Identidades y biyecciones 191
"Un cuadrado latino melancólico"
Algunos principios matemáticos, como los dos que ilustraremos en este capí-
tulo, son tan obvios que podría pensarse que sólo pueden producir resultados
igualmente obvios. Para convencerle de que esto no siempre es cierto los
ilustramos con algunos ejemplos cuya inclusión en el Libro fue sugerida por
Paul Erd6s. En capítulos posteriores encontraremos más aplicaciones de estos
principios.
Principio del pallJm~u:.
Si colocamos n objetos en r cajas y r < n, entonces al menos una de
las cajas contiene más de un objeto.
Esto es tan evidente que no hay nada que demostrar. En el lenguaje de las
aplicaciones el principio dice lo siguiente: sean N y R dos conjuntos finitos
tales que
INI = n > r = IRI,
y sea f : N ---+ R una aplicación. Entonces existe algún a E R tal que
If~l(a)1 2: 2. Es posible incluso escribir una desigualdad más fuerte: existe
algún a E R tal que
(1)
En efecto, en otro caso tendríamos If~l(a)1 < !f: para todo a y, por tanto,
n = L If~l(a)1 < r!f: = n, lo que es imposible.
1.
aER
Consideremos el conjunto 1,2,3, ... , 2n y tomemos
n + 1 cualesquiera. Entre ellos hay dos que son primos entre sí.
De nuevo, esto es evidente. Debe haber dos númerosconsecutivos, y por tanto
primos entre sí.
Ahora démosle la vuelta a la afirmación.
Sea A <:;: {1, 2, ... , 2n} tal que IAI = n + 1. Existen
dos números de A tales que uno es divisor del otro.
Esto ya no es tan evidente. Según nos contó Erd6s, él propuso la cuestión al
joven Lajos Posa durante una cena, y para cuando acabaron de comer Lajos
tenía la respuesta. Se convirtió en una de las preguntas favoritas de Erd6s
"El palomar a vista de pájaro"
, "
,1
j' I
140
Ninguno de estos dos resultados si-
gue siendo cierto al reemplazar n+ 1
por n: para ver esto, basta conside-
rar los dos conjuntos {2, 4, 6, ... , 2n}
y {n+l, n+2, ... , 2n}.
El principio del palomar y el doble recuento
de "iniciación" a las matemáticas. El del la
respuesta (afirmativa) al problema. Escribamos cada número a E A de la
forma a = 2k m, donde m es un número impar entre 1 y 2n - 1. Como hay
n + 1 números en pero sólo n partes impares distintas, debe haber dos
números en A con la misma parte impar. Por tanto, uno de ellos debe ser
múltiplo del otro. O
Este es otro de los problemas favoritos de Erdéís, que aparece en un artÍCulo
de Erdéís y Szekeres sobre problemas de Ramsey.
En cualquier sucesión al, a2," ., aTnn+l de mn + 1
números reales distintos hay una subsucesión creciente
de longitud m + 1, o una subsucesión decreciente
de longitud n + 1, o ambas.
En esta ocasión la aplicación del principio del palomar no es inmediata. Aso-
ciemos a cada término ai el número ti, que es la longitud de la sub sucesión
creciente más larga que comienza en ai. Si ti 2': m + 1 para algún i, en-
tonces tenemos una subsucesión creciente de longitud m + 1. Supongamos,
por tanto, que ti S; m para todo i. La función f : ai f----+ ti, que transforma
{al, ... , amn+l} en {1, ... , m} nos dice, según (1), que existe algún valor
s E {1,. " ,m} tal que f(ai) = s para ":' + 1 = n + 1 términos ai. Sean
aj1' aj2' ... ,ajn+1 (JI < ... < jn+l) tales números. Analicemos dos térmi-
nos consecutivos aji' aji+1' Si aji < aji+1 obtenemos una subsucesión de
longitud s que comienza en aji+1 y, por tanto, una sub sucesión creciente de
El lector puede divertirse demostrando longitud s + 1 que comienza en aji' lo que es imposible, pues f (aji) = s. De
que para mn números la afirmación ya esta forma obtenemos una subsucesióndecreciente ajl > ajz > ... > ajn+l
no es cierta. de longitud n + 1. O
Este resultado de apariencia sencilla sobre subsucesiones monótonas tiene
consecuencias nada triviales en el concepto de dimensión de un grafo. No
necesitamos aquí la noción de dimensión para un grafo general, sino sólo
para el grafo completo Kn. Se puede enunciar de la siguiente forma. Sea
N = {1, ... , n}, n 2': 3, y consideremos m permutaciones 1l"1, ... , 1l" m de N.
Se dice que las permutaciones 1l"i representan Kn si para cualesquiera tres nú-
meros distintos i, j, k existe una permutación 1l" en la que k aparece después
de i y j. La dimensión de Kn es el menor entero m para el que existe una
representación 1l"1, ... ,1l"Tn'
Como ejemplo, dim(K3) = 3 ya que los tres números deben aparecer en úl-
timo lugar, como en 7fl = (1,2,3), 7f2 = (2,3,1), 7f3 = (3,1,2). ¿Qué ocurre
con K4? Obsérvese, en primer lugar, que dim(Kn ) S; dim(Kn+l): sólo hay
El principio del palomar y el doble recuento
que eliminar n + 1 en una o Por tanto, dim(K4) 2': 3
y, de dim(K4) = 3 tomando
7rl = 0(1, 2, 3, 4), 7r2 = (2,4,3,1), 7r3 = (1,4,3,2).
No es tan sencillo demostrar que dim(K5 ) = 4; para valores mayores de n,
de forma sorprendente, la dimensión de Kn sigue siendo 4 hasta n = 12,
en tanto que dim(K13) = 5. Parece que dim(Kn) es una función bastante
extraña ... pero no es así. Cuando n tiende a infinito, dim(Kn) es, de hecho,
una función bien conocida - y la clave para encontrar una cota inferior es el
principio del palomar. Veamos que
(2)
Como hemos visto que dim(Kn) es una función monótona con respecto a n,
es suficiente demostrar (2) para n = 22P + 1, es decir, tenemos que demostrar
que
Supongamos, por el contrario, que dim(Kn) :S p, y sean 7rl, ... ,7r P las per-
mutaciones que representan a N = {1, 2, ... ,22P + 1}. Ahora utilizamos
el resultado sobre sub sucesiones monótonas p veces. En 7rl existe alguna
sub sucesión monótona Al de longitud 22P-
1 + 1, que puede ser creciente o
decreciente. Fijémonos en este conjunto Al en 7r2. Utilizando de nuevo el
resultado, encontramos en 7r2 alguna sub sucesión monótona A2 e Al de lon-
gitud 22P -
2 + 1, Y A2 es, por supuesto, también monótona en 7rl. Continuando
de esta misma forma, encontramos una sub sucesión Ap de tamaño 22° + 1 = 3
que es monótona en todas las permutaciones 7ri. Si Ap = (a, b, e), entonces o
bien a < b < e, o bien a > b > e en toda 7ri. Pero esto es imposible, ya que
debe existir una permutación en la que b aparece después de a y c. O
El comportamiento asintótico correcto fue determinado por Joel Spencer (cota
superior) y por Erd6s, Szemerédi y Trotter (cota inferior):
1
dim(Kn) = log2 log2 n + (2" + 0(1)) 10g2log210g2 n.
Sin embargo, la historia no termina aquí: muy recientemente, Morris y Ho§ten
encontraron un método que, en principio, puede determinar el valor exacto de
dim(Kn). Utilizando su resultado y un ordenador se pueden obtener los valo-
res que mostramos al margen. ¡Esto es verdaderamente asombroso! Por ejem-
plo, piénsese en el número de permutaciones de 1422564 elementos. ¿Cómo
se determina si hacen falta 7 u 8 de ellas para representar K1422564?
Paul Erd6s atribuye a Andrew V ázsonyi y Marta Sved la siguiente atractiva
aplicación del principio del palomar:
Consideremos n enteros al, ... ,an , no necesariamente
distintos. Entonces, existe siempre un conjunto de elementos conse-
cutivos ak+l, ak+2,· .. ,ae cuya suma I:;=k+l ai es múltiplo de n.
141
7rl: 1 2 3 5 6 7 8 91011 12 4
7r2: 2 3 4 8 7 6 5121110 9 1
7r3: 3 4 11112 910 6 5 8 7 2
7r4: 4 1 210 91211 7 8 5 6 3
Estas cuatro permutaciones represen-
tan K1 2
dim(Kn) ::; 4 ~ n::; 12
dim(Kn) ::; 5 ~ n ::; 81
dim(Kn) ::; 6 ~ n::; 2646
dim(Kn) ::; 7 ~ n::; 1422564
142
e 1 2 3 4 5 6 R
1 1 1 1 1 1 1
2 1 1 1
3 1 1
4 1
5 1
6 1
7
8
7 8
1 1
1
1
1
1
El principio del palomar y el doble recuento
Para demostrar este hecho definimos los N = {O, 1, ... ,n} y
R = {O, 1, ... , n - 1} Y consideramos la aplicación f : N ---+ R, donde
f(m) es el resto de dividir la suma al + . " + am entre n. Puesto que
INI = n + 1 > n = IRI, podemos asegurar la existencia de dos sumas
al + ... + ak Y al + ... + ac (k < .e) que proporcionan el mismo resto, donde
la primera suma puede ser la vacía, denotada por O. Por tanto,
i=l i=l
tiene resto O, lo que concluye la demostración. o
Pasemos ahora al segundo principio: contar de dos formas. De manera más
formal, podemos presentarlo aSÍ.
Doble recuento.
Supongamos que tenemos dos conjuntos finitos R y e y un subconjunto
S ~ R x e. Decimos que p y q son incidentes siempre que (p, q) E S.
Si r p denota el número de elementos incidentes a p E R, y cq denota el
número de elementos incidentes a q E e, entonces
I: cq • (3)
qEC
De nuevo, no hay nada que demostrar. La primera suma clasifica los pares
de S de acuerdo con su primera componente, en tanto que la segunda clasifica
los mismos pares de acuerdo con su segunda componente.
Podemos dibujar el conjunto S de una manera útil. Consideremos la matriz
A = (apq ), la matriz de incidencia de S, cuyas filas y columnas se correspon-
den con los elementos de R y e, respectivamente, donde
apq={~ si (p, q) E S
si (p,q) tJ. S.
Con esta definición, r p es la suma de la fila p-ésima de A y cq es la suma de
la columna q-ésima. Por tanto, el primer término de (3) suma los elementos
de A (es decir, cuenta los elementos de S) por filas, en tanto que el segundo
término los suma por columnas.
El siguiente ejemplo terminará de aclarar esta correspondencia. Pongamos
R = e = {1, 2, ... , 8}, Y escogemos S = {(i,j) : i divide aj}. Se obtienela matriz del margen, en la cual sólo mostramos los unos.
El principio del palomar y el doble recuento
Obsérvese la tabla de la izquierda. La cantidad de unos en la columna j es
exactamente e1llúmero de divisores de j; denotemos este número por t(j).
Nos podemos preguntar cómo es t(j) en media cuando j toma los valores
entre 1 y n. Es decir, nos preguntamos por
_ 1 n
t(n) = ; L t(j).
j=l
¿Cómo de grande es t(n) para un n arbitrario? A primera vista, esta pregunta
puede parecer muy complicada. Para los números primos t(p) = 2, en tanto
que para 2k se tiene un término grande, t(2k ) = k + 1. Por tanto, t(n) es una
función que oscila salvajemente, y podríamos conjeturar que algo parecido es
cierto para t(n). Pues no, nada más lejos de la realidad. El doble recuento
proporciona una respuesta sencilla y sorprendente.
Consideremos la matriz A (igual que antes) para los enteros de 1 a n. Con-
tando por columnas obtenemos ¿7=1 t(j). ¿Cuántos unos hay en la fila i?
Evidentemente, los unos corresponden a los múltiplos de i: li, 2i, ... , y el
mayor múltiplo menor o igual que n es l T Ji. Por tanto,
_ In lnn lnn nI
t(n) = - ""' tU) = - L l---:-J ~ - ""' ---:- = L-;-' nL..t n z nL..t z z
j=l i=l i=l i=l
donde el error en cada sumando al pasar de l T J a T es menor que 1. Como
la última suma es el n-ésimo número armónico Hn, obtenemos la acotación
Hn -1 < t(n) < Hn que, junto con las estimaciones para Hn de la página 11
nos proporciona
logn-l < Hn-l-.!. < t(n) < Hn < 10gn+1.
n
Hemos demostrado un resultado notable: aunque t( n) es totalmente errática,
la media t( n) se comporta muy bien: difiere de log n en menos de l.
Sea G un grafo simple finito y sean V y E los conjuntos de sus vértices y
aristas, respectivamente. Ya definimos en el capítulo 11 el grado d( v) de
un vértice v como el número de aristas que tienen a v como extremo. En
el ejemplo de la figura, los vértices 1,2, ... ,7 tienen grados 3,2,4,3,3,2,3,
respectivamente.
Casi todos los libros de teoría de grafos comienzan con el siguiente resultado
(con el que ya nos encontramos en los capítulos 11 y 17):
L d(v) = 2\E\. (4)
vEV
Para demostrarlo, consideremos S ~ V x E, donde S es el conjunto de pares
( v, e) tales que v E V es un extremo de e E E. El doble recuento de S
proporciona, por una parte, ¿vEV d( v), ya que cada vértice contribuye con
d( v) al recuento y, por otra, 2\E\, ya que cada arista tiene dos extremos. O
n 12345678
t(n) I 3 5 "2 :3 2 2
7 16 5
:3 '7 "2
Los primeros valores de t(n)'
143
I 6
2<Q :(]
3 7
144 El principio del palomar y el doble recuento
Este sencillo resultado tiene
les serán presentadas posteriormente. Queremos destacar en esta sección la
siguiente hermosa aplicación a un problema extremal en grafos. Aquí está:
Supongamos que G = (V, E) tiene n y no contiene ciclos de lon-
gitud 4 (que denotaremos por C4 ), es decir, ningún subgrafo
¿ Cuántas aristas puede tener G como máximo?
Como ejemplo, el grafo del margen tiene 5 vértices, no contiene ningún 4-ciclo
y tiene 6 aristas. Es sencillo demostrar que si el número de vértices es 5
entonces el número máximo de aristas es 6 y que, de hecho, éste es el único
grafo de 5 vértices con 6 aristas que no contiene ningún 4-ciclo.
Pasemos ahora al problema general. Sea G un grafo con n vértices y sin nin-
gún 4-ciclo. Como antes, denotamos por d( u) el grado de u. Ahora hacemos
doble recuento en el conjunto 8 de pares (u, {v, w } ), donde u es adyacente
a v y a w, de forma que v -1- w. En otras palabras, contamos las veces que
aparece
Sumando en u se tiene que 181 = I:uEV (d~u)). Por otra parte, todo par
{v, w} tiene como mucho un vecino común (debido a la ausencia de C4 ). Por
tanto, 181 :s; G), y se concluye que
o
2: d(u)2 :s; n(n - 1) + 2: d(u). (5)
uEV
A continuación, como es típico en esta clase de problemas extremales, aplica-
mos la desigualdad de Cauchy-Schwarz a los vectores (d(Ul)"'" d(un )) y
(1,1, ... ,1), de donde obtenemos
(l:d(u)/ < nl:d(u)2,
uEV uEV
y, según (5),
(2: d(u) / < n2(n - 1) + n 2: d(u).
uEV uEV
Utilizando (4) se deduce que
o
IEI2 - ~IEI- n
2
(n
4
- 1) :s; O.
Resolviendo esta ecuación de segundo grado obtenemos el siguiente resultado,
debido a Istvan Reiman.
El principio del palomar y el doble recuento
Teorema. Si un graÍo G de n vértices no contiene entonces
(6)
Para n = 5 se obtiene IEI :::; 6, Y el grafo que apareció anteriormente muestra
que laigualdad es posible.
El doble recuento nos ha proporcionado, de forma sencilla, una cota superior
para el número de aristas. Pero, ¿cómo de ajustada es la cota (6) en general?
Este precioso ejemplo [2] [3] [6] muestra que es casi justa. Como ocurre fre-
cuentemente en este tipo de problemas, la geometría finita muestra el camino.
Al presentar el ejemplo suponemos que el lector está familiarizado con el
cuerpo finito ::Zp de los enteros módulo un número primo p (véase la pá-
gina 18). Consideremos el espacio vectorial tridimiensional X sobre ::Zp. A
partir de X construimos el siguiente grafo Gp . Los vértices de Gp son los
subespacios de dimensión 1 [v] := {Av I A E ::Zp}, donde O i= v E X, Y dos
de estos subespacios [v], [w] están conectados por una arista si
(v, w) = V1Wl + V2W2 + V3W3 = O.
Obsérvese que no importa qué vector i= O escojamos del subespacio. En
lenguaje geométrico, los vértices son los puntos del plano proyectivo sobre ::Zp,
y [w] es adyacente a [v] si w está en la recta polar de v.
Como ejemplo, el grafo G2 no contiene 4-ciclos y tiene 9 aristas, cerca de la
cota de 10 dada por (6). Veamos que esto es cierto para cualquier primo p.
En primer lugar demostraremos que Gp no tiene ningún C4 . Si [u] es un
vecino común de [v] y [w], entonces u es solución del sistema lineal
Vl x + V2 Y + V3 Z = °
W1X + W2Y + W3Z = O.
Como v y w son linealmente independientes, sabemos que el subespacio de
soluciones tiene dimensión 1 y, por tanto, que el vecino común [u] es único.
Nos preguntamos ahora cuántos vértices tiene Gp , y hacemos otra vez doble
recuento. X contiene p3 - 1 vectores i= O. Como cualquier subespacio de
dimensión uno contiene p - 1 vectores i= O, deducimos que X tiene un total
de p:~; = p2 + p + 1 subespacios de dimensión uno, es decir, Gp tiene
n = p2 + p + 1 vértices. De forma similar, cualquier subespacio de dimensión
dos contiene p2 - 1 vectores i= O y, por tanto, P:~ll = p + 1 subespacios de
dimensión uno.
Nos falta por determinar el número de aristas de Gp o, lo que es equivalente
gracias a (4), los grados de los vértices. Según la construcción de Gp , los
vértices adyacentes a [u] son las soluciones de la ecuación
(7)
El conjunto de soluciones de (7) es un subespacio de dimensión dos y, por
tanto, hay p + 1 vértices adyacentes a [u]. Pero cuidado, es posible que el
mismo u sea solución de (7) y, en tal caso, hay sólo p vértices adyacentes
a [u].
145
(0,0,1)
(1,0, O) (1,1,0) (0,1, O)
El grafo G2 : sus vértices son las siete
temas (x, y, z) no nulas.
146
o 1 1 1 O O
1 O 1 O 1 O
1 1 O O O 1
A= 1 O O 1 O O
O 1 O O 1 O
O O 1 O O 1
O O O 1 1 1
La matriz de G2
O
O
O
1
1
1
O
El principio del palomar y el doble recuento
En resumen, hemos obtenido el siguiente resultado: si u está en la cónica
dada por x2 + y2 + Z2 = O, entonces d([u]) = p, y en el resto de los casos
d([u]) = p + 1. Por tanto, debemos detenmnar la cantidad de subespacios de
dimensión uno que hay en la cónica
X2 + y2 + Z2 = O.
Demostraremos el siguiente resultado dentro de un momento.
Afirmación. Hay exactamente p2 soluciones (x, y, z) de la ecuación
x2 +y2 + Z2 = O y, por tanto, ignorando la solución (O, O, O), exacta-
mente ~~} = p + 1 vértices de grado p en Gp .
Esto nos penmte completar el análisis de Gp . Hay p + 1 vértices de grado p y,
por tanto, (p2 + p + 1) - (p + 1) = p2 vértices de grado p + 1. Utilizando (4)
obtenemos
IEI
(p + l)p p2(p + 1) (p + 1)2p
2 + 2 = 2
(p + l)p (1 + (2p + 1)) = p2+ P(1 + V 4p2 + 4p + 1).
44.
Haciendo n = p2 + p + 1, la última ecuación queda
n-1 IEI = -4- (1 + v4n - 3),
que está muy cerca de la cota de (6).
Vamos ahora con la demostración de la afirmación. El siguiente argumento
es una hermosa aplicación del álgebra lineal que involucra a las matrices si-
métricas y sus autovalores. Nos encontraremos con el mismo método en el
capítulo 34, y no por casualidad: las dos demostraciones proceden del mismo
artículo de Erd6s, Rényi y Sós.
Igual que antes, representamos los subespacios de dimensión uno de X por
vectores VI, V2, ... , V p 2+p +I, de forma que dos cualesquiera de ellos son
linealmente independientes. De manera similar, podemos representar los sub-
espacios de dimensión dos con el mismo conjunto de vectores, de forma que
el subespacio correspondiente a u = (UI, U2, U3) es el conjunto de soluciones
de la ecuación UIX + U2Y + U3Z = O igual que en (7). (Por supuesto, esto
es simplemente el principio de dualidad en álgebra lineal.) Por tanto, según
(7), un subespacio de dimensión uno representado por Vi está contenido en el
sub espacio de dimensión dos representado por V j si y sólo si (Vi, V j) = O.
Consideremos la matriz A = (aij) de tamaño (p2 + p + 1) X (p2 + p + 1),
definida de la siguiente forma: las filas y columnas de A corresponden a
VI, ... , V p2+p+l, utilizando la misma numeración para filas y columnas, y
a .. . = {1 si (Vi,Vj) =0,
'J . O en otro caso.
Por tanto, A es una matriz real simétrica y aii = 1 si (Vi, Vi) = O, es decir,
precisamente cuando Vi está en la cónica x 2 + y2 + z2 = O. Ahora todo lo
que queda por demostrar es que
traza A p+l.
El principio del palomar y el doble recuento
Del álgebra lineal sabemos que la traza es a la suma de los autovalores.
y aquí viene el truco: aunque A parece complicada, la matriz A 2 es fácil de
analizar. Nos serán útiles las siguientes observaciones:
e Todas las filas de A tienen exactamente p + 1 unos. De aquí se deduce que
p + 1 es un autovalor de A, ya que Al = (p + 1)1, donde 1 es el vector
formado por unos.
@ Para dos filas cualesquiera Vi, Vj hay exactamente una columna con un 1
en ambas filas (la columna conespondiente al único subespacio generado
por Vi, Vj).
Utilizando estas observaciones obtenemos
1
p+1
pI + J,
donde I es la matriz identidad y J es la matriz formada enteramente por unos.
Ahora bien, J tiene los autovalores p2 + p + 1, de multiplicidad 1, y O, de
multiplicidad p2 + p. De aquí se deduce que los autovalores de la matriz A 2
son p2 + 2p + 1 = (p + 1)2 con multiplicidad 1 y p con multiplicidad p2 + p.
Como A es real y simétrica, es diagonalizable y, por tanto, A tiene el autovalor
p + 1 ó -(p + 1) Y p2 + p autovalores ±y'P. Según la observación 1 anterior,
el primer autovalor debe ser p + 1. Supongamos que y'P tiene multiplicidad
T y que -y'P tiene multiplicidad s, entonces
traza A = (p + 1) + Ty'P - sy'P.
y hemos terminado: como la traza es un entero, debe ocurrir que T = S y, por
tanto, traza A = p + 1. O
En 1911, Luitzen Brouwer publicó su famoso teorema del punto fijo:
Toda función continua f: En ------7 En de una bola n-dimensional en
sí misma tiene un punto fijo (algún x E En tal que f (x) = x).
Para dimensión 1, es decir, para un intervalo, este resultado es una conse-
cuencia sencilla del teorema de Bolzano, pero para dimensiones superiores la
demostración de Brouwer necesita henamientas más sofisticadas. La sorpresa
fue general cuando en 1928 el joven Emanuel Spemer (tenía entonces 23 años)
encontró un sencillo resultado combinatorio del que se pueden deducir tanto
el teorema del punto fijo de Brouwer como la invariancia de la dimensión bajo
aplicaciones biyectivas continuas. Más aún, el ingenioso lema de Spemer vino
acompañado de una demostración igualmente hermosa - simplemente doble
recuento.
Presentamos el lema de Spemer, y el teorema de Brouwer que se deduce de
él, para el primer caso interesante, es decir, para dimensión n = 2. El lector
147
148
3
Los triángulos que tienen los vértices de
tres colores distintos aparecen sombrea-
dos
3
El principio del palomar y el doble recuento
no debería tener dificultades para extender las demostraciones a dimensión
arbitraria (por inducción sobre la dimensión).
Lema de 'n." .... ''' ..
Supongamos que un triángulo "grande" con vértices V2, V3 es triangu-
lado (es decir, descompuesto en un número finito de triángulos "pequeños"
pegados por sus aristas).
Supongamos que asociamos a cada vértice de la triangulación un "color" del
conjunto {1, 2, 3} de forma que Vi recibe el color i (para cada i), y que sólo
los colores i y j son utilizados para los vértices de la arista que va de a
Vi (para i i= j), mientras que los vértices interiores son coloreados de forma
arbitraria con 1, 2 o 3.
Entonces en la triangulación debe encontrarse algún triángulo pequeño "tres-
coloreado ", es decir, que tiene los tres vértices de colores distintos.
• Demostración. Probaremos un resultado aún más fuerte: el número de
triángulos tres-coloreados no sólo es distinto de cero, sino que es siempre im-
par. Para ello, consideremos el grafo dual de la triangulación, pero no toma-
mos todas sus aristas, sino sólo las que cruzan una arista que tiene extremos
con los colores (distintos) 1 y 2. De esta forma, obtenemos un "grafo dual
parcial" que tiene grado 1 en todos los vértices que corresponden a triángulos
tres-coloreados, grado 2 en los que corresponden a triángulos en los que sólo
aparecen los colores 1 y 2, Y grado O en los que corresponden a triángulos
en los que falta alguno de los colores 1 y 2. Por tanto, sólo los triángulos
tres-coloreados dan lugar a vértices de grado impar (de grado 1).
Sin embargo, el vértice del grafo dual que corresponde al exterior de la trian-
gulación tiene grado impar: en efecto, a lo largo de la arista completa que va
de V1 a V2 hay un número impar de cambios entre 1 y 2. Pero entonces hay un
/ ---0-------
2 número impar de aristas del grafo dual parcial que cruzan esta arista, mientras
que en las otras aristas del triángulo grande no pueden aparecer los colores 1
y 2 a la vez.
Como el número de vértices de grado impar en cualquier grafo finito es par
(según la ecuación (4», hemos demostrado que el número de triángulos pe-
queños que tienen tres colores distintos (y que corresponden a los vértices
interiores del grafo dual de grado impar) es impar. O
Utilizando este lema es sencillo demostrar el teorema de Brouwer .
• Demostración del teorema del punto fijo de Brouwe:r n = 2). Sea
6. el triángulo de ]R3 con vértices el = (1, O, O), e2 = (0,1, O) Y
e3 = (O, 0,1). Es suficiente demostrar que cualquier aplicación continua
f: 6. -+ 6. tiene un punto fjo, ya que 6. es homeomorfo a la bola de dimen-
sión dos, B 2 .
Sea 6 (T) la longitud de la arista más larga en una triangulación T. Es sencillo
construir una sucesión infinita de triangulaciones 'h, 72, ... de 6. tales que la
sucesión 15(~) tiene límite O. Una sucesión así se puede construir explícita-
mente o utilizando inducción, tomando por ejemplo ~+l como la subdivisión
baricéntrica de ~.
Para cada una de estas triangulaciones, definimos una 3-coloración de sus vér-
tices v haciendo A(V) := min{i : f(V)i < Vi}, es decir, A(V) es el menor
El principio del palomar y el doble recuento
índice i tal que la i-ésima coordenada de f ( v) - v es Suponiendo
que f no tiene puntos fijos, esta coloración está bien definida. Para ver esto,
obsérvese que todo v E ,0,. está en el plano Xl + X2 + X3 = 1 y, por tanto,
¿i Vi = 1. Entonces, si f ( v) =1= v, al menos una de las coordenadas de
f (v) - v debe ser negativa (y al menos una debe ser positiva).
Veamos que esta coloración verifica las condiciones del lema de Spemer. En
primer lugar, hay que asignar el color i al vértice ei, ya que la única compo-
nente de f ( ei) - ei que puede ser negativa es la i-ésima. Además, si v está en
la arista opuesta a ei, entonces Vi = O y, por tanto,la i-ésima componente de
f ( v) - v no puede ser negativa, de donde se deduce que a v no se le asigna el
color i.
El lema de Spemer dice ahora que en cada triangulación ~ hay un trián-
gulo 3-coloreado, es decir, existe un triángulo {V k :l , V k :2 , v k :3 } para el que
A( v k :i ) = i. La sucesión de puntos (v k :l h>l puede no ser convergente, pero
del hecho que el símplice ,0,. es compacto podemos deduir que existe alguna
subsucesión convergente. Tras reemplazar la sucesión de triangulaciones ~
por la subsucesión correspondiente (a la que, por simplicidad, también deno-
tamos por ~) sabemos que que (V k :l h converge a un punto v E ,0,.. Ahora
bien, la distancia de v k :2 y V k :3 a v k :l es menor o igual que el tamaño de la
triangulación o(~), que tiende a O. Por tanto, las sucesiones (V k :2 ) y (v k :3 )
convergen al mismo punto v.
¿Qué sabemos de f( v)? La primera coordenada f( v k :l ) es menor que la de
v k :l para todo k. Como f es continua, se deduce que la primera coordenada
de f ( v) es menor o igual que la de v. El mismo razonamiento es válido para
la segunda y tercera coordenadas. Por tanto, ninguna de las coordenadas de
f ( v) - v es positiva - y ya hemos visto que esto entra en contradicción con
la suposición de que f ( v) =1= v. D
[1] L. E. J. BROUWER: Über Abbildungen von Mannigfaltigkeiten, Math. Annalen
71 (1912), 97-115.
[2] W. G. BROWN: On graphs that do not contain a Thomsen graph, Canadian Math.
Bull. 9 (1966), 281-285.
[3] P. ERDÓS, A. RÉNYI & V. SÓS: On a problem ofgraph theory, Studia Sci. Math.
Hungar. 1 (1966), 215-235.
[4] P. ERDÓS & G. SZEKERES: A combinatorial problem in geometry, Compositio
Math. (1935), 463-470.
[5] s. HO~TEN & W. D. MORRIS: The order dimension ofthe complete graph, Dis-
crete Math. 201 (1999), 133-139.
[6] 1. REIMAN: Über ein Problem von K. Zarankiewicz, Acta Math. Acad. Sci. Hun-
gar. 9 (1958), 269-273.
[7] J. SPENCER: Minimal scrambling sets of simple orders, Acta Math. Acad. Sci.
Hungar. 22 (1971), 349-353.
[8] E. SPERNER: Neuer Beweis für die lnvarianz der Dimensionszahl und des
Gebietes, Abh. Math. Sem. Hamburg 6 (1928), 265-272.
[9] W. T. TROTTER: Combinatorics and Partially Ordered Sets: Dimension
Theory, John Hopkins University Press, Baltimore and London 1992.
149
En este capítulo nos ocupamos de un tema básico de la combinatoria, en con-
creto de las propiedades y tamaños de familias especiales F de subconjuntos
de un conjunto finito N = {l, 2, ... , n}. Comencemos con dos clásicos del
área: los teoremas de Spemer y de Erdos-Ko-Rado. Estos resultados tienen en
común que fueron demostrados de nuevo muchas veces, y cada uno de ellos
dio origen a una nueva rama de la teoría de conjuntos combinatoria. Para am-
bos, la inducción parece ser el método natural, pero los argumentos que vamos
a presentar son bastante distintos, y verdaderamente geniales.
En al año 1928 Emanuel Spemer planteó y respondió la siguiente pregunta:
supongamos que tenemos un conjunto N = {l, 2, ... , n}. Se dice que una
familia F de subconjuntos de N es una anticadena si ningún conjunto de F
contiene a otro conjunto de la familia F. ¿Cuál es el tamaño de la anticadena
más grande? Claramente, la familia Fk de todos los conjuntos de cardinal k
es una anticadena, y IFk I = G). Considerando el máximo de los coeficien-
tes binomiales (véase la página 12) concluimos que existe una anticadena de
tamaño (Ln/2j) = maXk (~). El teorema de Spemer asegura que no existen
anticadenas más largas.
Teorema 1. El tamaño de la anticadena más grande de un conjunto de n Emanuel Spemer
elementos es (Ln/2j)'
• Demostración. Entre las muchas demostraciones existentes, la siguiente,
debida a David Lubell, es probablemente la más corta y elegante. Sea F una
anticadena arbitraria. Tenemos que demostrar que IFI :S (Ln/2j)' Para ello,
la idea clave es considerar cadenas de subconjuntos 0 = Go e G1 e ... e
Gn = N, donde IGil = i para i = O, ... , n. ¿Cuántas cadenas hay? Es
claro que obtenemos una cadena añadiendo uno a uno los elementos de N y,
por tanto, existen tantas cadenas como permutaciones de N, es decir, nI. A
continuación, dado un conjunto A E F nos preguntamos en cuántas de estas
cadenas aparece. De nuevo, la respuesta es sencilla. Para ir desde 0 hasta A
hay que añadir de uno en uno los elementos de A, y para ir desde A hasta N
tenemos que añadir los elementos restantes. Por tanto, si A tiene k elemen-
tos, considerando todos estos pares de cadenas concatenadas vemos que hay
k! (n - k)! cadenas que contienen a A. Obsérvese que ninguna cadena puede
contener dos conjuntos distintos A y B de F, ya que F es una anticadena.
Para terminar la demostración, sea mk el número de subconjuntos de k ele-
mentos en F. Entonces, IFI = I:~=o mk. De la discusión precedente, se
deduce que el número de cadenas que contienen algún elemento de F es
n
L mkk!(n-k)!,
k=O
152
Invitamos al lector a comprobar que la
familia de todos los subconjuntos de
~ elementos, cuando n es par, y las
dos familias de todos los subconjuntos
de n;-l elementos y de todos los sub-
conjuntos de n~l elementos, cuando n
es impar, son las únicas anticadenas que
alcanzan el tamaño máximo.
punto
\
arista
I
Una circunferencia e para n = 6. Los
segmentos en negrita forman un arco de
longitud 3.
Tres teoremas famosos sobre conjuntos finitos
y esta expresión no puede superar a ni, la cantidad total de cadenas. Por tanto,
se concluye que
~ k!(n - k)!
.L.- mk I n.
k=O
< 1, o
n
~mk
.L.- < 1.
k=O G)
Reemplazando los denominadores por el coeficiente binomial mayor se ob-
tiene
es decir,
y hemos terminado la demostración. o
Nuestro segundo resultado es de naturaleza completamente distinta. De nuevo
consideramos el conjunto N = {1, ... , n}. Decimos que una familia F de
subconjuntos es unafamilia entrecruzada si dos conjuntos cualesquiera de F
tienen al menos un elemento en común. Es casi inmediato que el tamaño
de la mayor familia entrecruzada es 2n-l. Si A E F, el complementario
AC = N\A tiene intersección vacía con A y, por tanto, no puede estar en F.
De aquí se concluye que una familia entrecruzada contiene como mucho la
mitad de los 2n subconjuntos de N, es decir, IFI :S: 2n-l. Por otra parte, si
consideramos la familia de todos los conjuntos que contienen un elemento fijo,
por ejemplo la familia Fl de todos los conjuntos que contienen all, entonces
IFll = 2n- 1 , y el problema está resuelto.
Pero ahora nos hacemos la siguiente pregunta: ¿De qué tamaño puede ser una
familia entrecruzada F si todos los conjuntos de F tienen el mismo número de
elementos, digamos k? Llamaremos a tales familias familias k-entrecruzadas.
Para evitar situaciones triviales, suponemos que n ;::o: 2k, ya que en otro caso
dos conjuntos de tamaño k cualesquiera tienen intersección no vacía, y no hay
nada que demostrar. Recuperando la idea anterior, consideramos la familia Fl
de todos los subconjuntos de k elementos que contienen al 1. Es evidente
que los conjuntos de Fl se obtienen añadiendo al 1 todos los subconjuntos de
(k - 1) elementos del conjunto {2, 3, ... ,n} y, por tanto, IFll = (~=i). ¿Se
puede mejorar esto? No - y esta es la afirmación del teorema de Erdos-Ko-
Rado.
Teorema 2. El mayor tamaño de una familia k-entrecruzada en un conjunto
de n elementos es (~=i), cuando n ;::o: 2k.
Paul Erdos, Chao Ko y Richard Rado demostraron este resultado en 1938,
pero no fue publicado hasta 23 años después. Desde entonces se han encon-
trado muchas demostraciones y variantes pero el siguiente argumento, debido
a Gyula Katona, es especialmente elegante .
• Demostración. La idea clave de la demostración es el siguiente lema, que a
primera vista no parece en absoluto relacionado con nuestro problema. Consi-
deremos una circunferencia e dividida por n puntos en n segmentos. Decimos
que un arco de longitud k está formado por k + 1 puntos consecutivos y los k
segmentos entre ellos.
Tres teoremas famosos sobreconjuntos finitos
Lema. Sea n :2:: 2k Y " , arcos distintos de k tales que dos
cualesquiera tienen un segmento en común Entonces t :s; k,
Para demostrar el lema, obsérvese en primer lugar que cualquier punto de O
es extremo de a 'lo más un arco, En efecto, si Ai y Aj tuvieran un extremo
común v, entonces tendrían que comenzar en direcciones distintas (ya que son
distintos). Pero entonces no podrían tener un segmento en común, ya que
n :2:: 2k, Consideremos el arco Al, Como cualquier (i:2:: 2) tiene un
segmento en común con Al, uno de los extremos de es un punto interior de
Al. Pero acabamos de ver que estos extremos deben ser distintos, y como Al
contiene k - 1 puntos interiores, se deduce que hay como mucho k - 1 arcos
adicionales y, por tanto, como mucho k arcos en totaL D
Vayamos ahora con la demostración del teorema de Erd6s-Ko-Rado, Sea F
una familia k-entrecruzada, Consideramos una circunferencia O con n pun-
tos y n segmentos en las condiciones del lema y una permutación cíclica
1f = (al, a2" .. , an ), y escribimos los números ai en sentido horario alIado
de los segmentos de O, ¿Cuántos conjuntos A E F aparecen como k núme-
ros consecutivos en O? Como F es una familia entrecruzada, según el lema
puede haber a lo sumo k conjuntos, Ahora bien, esto es cierto para cualquier
permutación cíclica, y como hay (n -1)! permutaciones cíclicas, de esta forma
generamos como mucho
k(n - 1)!
conjuntos de F que aparecen de forma consecutiva en alguna permutación cí-
clica. ¿Cuántas veces contamos cada conjunto A E F? Muy sencillo: A apa-
rece en 1f si los k elementos de A aparecen de forma consecutiva en algún
orden, Como hay k! formas de ordenar los elementos de A, y (n k)! formas
de ordenar los restantes elementos, concluimos que un conjunto A aparece
exactamente en k!(n - k)! permutaciones cíclicas, de donde se deduce que
k (n - 1) 1 (n - 1)! (n - 1)
I FI :s; k! (n _ k)! = (k - 1)! (n - 1 - (k - 1))! = k _ l' D
De nuevo, podemos preguntarnos si las familias que contienen un elemento
fijo son, las únicas familias k-entrecruzadas, Claramente, esto no es cierto
para n = 2k. Por ejemplo, para n = 4 Y k = 2la familia {1, 2}, {1, 3}, {2, 3}
también tiene tamaño (~) = 3, En general, para n = 2k obtenemos las
familias k-entrecruzadas maximales, de tamaño H~) = G=D, incluyendo,
para cada par de conjuntos formado por un conjunto A con k elementos y
su complementario N\A, uno cualquiera de los dos, Pero para n > 2k las
familias que contienen un elemento fijo son, de hecho, las únicas, Invitamos
al lector a intentar demostrarlo,
Finalmente nos ocupamos del tercer resultado, que puede ser presentado, con
bastante fundamento, como el teorema básico más importante de la teoría de
conjuntos finitos, el "teorema del matrimonio", demostrado por Philip Hall
en 1935, Con él comienza lo que hoy se conoce como teoría de empareja-
mientos, con amplias aplicaciones, algunas de las cuales se mostrarán a conti-
nuación.
Una familia entrecruzada para n
k=2
153
4,
154
"Una boda múltiple"
c
E
{B, C, D} es una familia crítica
Tres teoremas famosos sobre conjuntos finitos
Consideremos un finito X y una familia Al, . .. , de
tos de X (no necesariamente distintos). Diremos que una sucesión Xl, . .. ,Xn
es un sistema de representantes distintos de {Al,." ,An} si los Xi son ele-
mentos distintos de X, y si Xi E Ai para todo i. Por supuesto, tal sistema,
que abreviaremos como SRD, puede no existir (por ejemplo, si uno de los
conjuntos Ai es vacío). El teorema de Hall presenta condiciones necesarias y
suficientes para que exista un SRD.
Antes de presentar el resultado veamos la interpretación por la que es cono-
cido como teorema del matrimonio: consideremos un conjunto {1, ... ,n} de
chicas y un conjunto X de chicos. Siempre que X E la chica i y el chico X
tienen tendencia a casarse y, por tanto, Ai es el conjunto de posibles parejas
de la chica i. Un SRD es una boda múltiple en la que cada chica se casa con
un chico que le gusta.
De vuelta a los conjuntos, éste es el resultado.
Teorema 3. Sea Al, ... , An una familia de subconjuntos de un conjunto fi-
nito X. Existe un sistema de representantes distintos si y sólo si la unión de
cualesquiera m conjuntos Ai contiene al menos m elementos, para
1 ~ m ~ n.
Es evidente que la condición es necesaria: si m conjuntos Ai tienen en total
menos de m elementos, entonces estos m conjuntos no pueden ser representa-
dos por elementos distintos. Lo sorprendente es que esta condición es también
suficiente (esta parte es la que origina multitud de aplicaciones). La demos-
tración original de Hall es bastante complicada, y posteriormente se han en-
contrado muchas pruebas distintas, de entre las cuales la siguiente (debida a
Easterfield y redescubierta por Halmos y Vaughan) parece la más natural.
• Demostración. Utilizamos inducción sobre n. Para n = 1 no hay nada
que demostrar. Sea n > 1, Y supongamos que {Al, ... , An} satisface la
condición del teorema, que abreviamos como (H). Diremos que una familia
de f! conjuntos Ai con 1 ~ f! < n es una familia crítica si su unión tiene f!
elementos. Hay que distinguir dos casos.
Caso 1: No existe ninguna familia crítica.
Escogemos un elemento X E An. Eliminamos X de X y consideramos la
familia A~, ... ,A~_l' donde A~ = Ai \ {x}. Como no existe ninguna fami-
lia crítica, la unión de cualesquiera m conjuntos de los A~ contiene al me-
nos m elementos. Por tanto, según la hipótesis de inducción existe un SRD
Xl, ... , Xn-l de {A~, ... , A~_l} que, junto con x n = x, proporciona un
SRD para la familia original.
Caso 2: Existe alguna familia crítica.
Después de reordenar los conjuntos podemos suponer que {Al, ... , Ac} es
una familia crítica. Entonces, U;=l Ai = X, con IXI = f!. Como f! < n,
aplicando indu~ción vemos que existe un SRD para Al, ... ,Ac, es decir, los
elementos de X se pueden etiquetar como Xl, ... , Xc, de forma que Xi E Ai
para todo i ~ f!.
Consideremos ahora los restantes conjuntos AC+I ," ., A n , y escojamos m
cualesquiera de ellos. Como la unión de Al, ... ,Ac y estos m conjuntos
Tres teoremas famosos sobre conjuntos finitos
contiene al menos e + m elementos según la condición se deduce que los
m conjuntos tienen al menos m elementos que no pertenecen a X. En otras
palabras, la familia
satisface la condición (H).
La inducción nos proporcio~a ahora un SRD de AH l, ... ,An formado por
elementos que no están en X. Combinándolos con Xl, ... ,XC obtenemos un
SRD para todos los conjuntos Ai. Esto completa la demostración. O
Como hemos mencionado, el teorema de Hall fue el comienzo de la ahora
ampliamente desarrollada teoría de emparejamientos [6]. Una de las muchas
variantes nos permite enunciar un resultado particularmente atractivo, que el
lector queda invitado a demostrar:
Supongamos que los conjuntos Al, ... , An tienen todos tamaño
k 2 1 Y supongamos además que ningún elemento está contenido
en más de k conjuntos. Entonces existen k sistemas de representantes
distintos tales que, para cualquier i, los k representantes de Ai son
distintos y forman, por tanto, el conjunto Ai.
Un hermoso resultado que debería abrir nuevos horizontes a las posibilidades
de matrimonio.
[1] T. E. EASTERFIELD: A combinatorial algorithm, J. London Math. Soco 21 (1946),
219-226.
[2] P. ERDÓS, C. Ko & R. RADO: Intersection theoremsfor systems offinite sets,
Quart. J. Math. (Oxford), Ser. (2) 12 (1961), 313-320.
[3] P. HALL: On representatives of subsets, J. London Math. Soco 10 (1935),
26-30.
[4] P. R. HALMOS & H. E. VAUGHAN: The marriage problem, Amer. J. Math. 72
(1950),214-215.
[5] G. KATONA: A simple proof of the Erdffs-Ko-Rado theorem, J. Combinatorial
Theory, Ser. B 13 (1972), 183-184.
[6] L. LovÁsz & M. D. PLUMMER: Matching Theory, Akadémiai Kiadó, Budapest
1986.
[7] D. LUBELL: A short proof of Sperner's theorem, J. Combinatorial Theory 1
(1966), 299.
[8] E. SPERNER: Ein Satz über Untermengen einer endlichenMenge, Math. Zeitsch-
rift 27 (1928), 544-548.
155
¿ Cuántas veces ha de barajarse un mazo de
de las cartas sea aleatorio?
para que el orden
Analizar procesos aleatorios es una tarea común, tanto en la vida cotidiana
("¿Cuánto se tarda en llegar al aeropuerto un viernes a las seis de la tarde?")
como en las matemáticas. Sin embargo, no se puede esperar obtener respuestas
sensatas sin antes formular una pregunta más precisa. En el caso de barajar un
mazo de naipes, es necesario especificar:
* el tamaño del mazo (por ejemplo, n = 52 cartas),
* cómo se baraja (empezaremos analizando mezclas en las que se coloca la
carta más alta en un sitio aleatorio, y después trataremos las más realistas
y efectivas mezclas por imbricación (riffle shuffles, en inglés), y
• qué se entiende por "aleatorio" o "casi aleatorio".
En este capítulo describiremos un análisis de la baraje por imbricación he-
cho por Edgar N. Gilbert y Claude Shannon (1955, sin publicar) y Jim Reeds
(1981, sin publicar). Seguiremos los pasos del estadístico David Aldous y el
antes mago y ahora matemático Persi Diaconis [1]. No llegaremos al resul-
tado final y preciso de que al cabo de 7 mezclas por imbricación una baraja
de n = 52 cartas es casi aleatoria, mientras que 6 no son suficientes - pero
sí obtendremos una cota superior de 12, y de paso veremos unas ideas muy
bellas: las "reglas de detención" y el "tiempo fuertemente uniforme", el lema
que enuncia que el tiempo fuertemente uniforme es una cota para la distancia
de variación, el lema de inversión de Reeds y, en consecuencia, la interpreta-
ción de un baraje como una "ordenación al revés". Al final, reduciremos todo
a dos problemas combinatorios muy clásicos, la paradoja de los cumpleaños y
el problema del coleccionista. ¡Empecemos pues con ellos!
La los cumpleaños
Escogemos n personas al azar, por ejemplo los asistentes de una clase o de
un seminario. ¿Cuál es la probabilidad de que todos cumplen años en días
diferentes? Con las simplificaciones usuales (el año tiene 365 días, no hay
variación estacional, no hay gemelos), esta probabilidad es
La tarjeta de visita de Persi Diaconis
cuando era mago. En una entrevista pos-
terior dijo: "Si dices que eres profesor
en Stanford, la gente te trata con respeto.
Si dices que te dedicas a inventar trucos
de magia, no te quieren presentar a su
hija."
158
I: x S - 1 (1 - X)S =
s~l
I: X s - 1 S - I: XSS
s~l s~l
s~O S~O
1
1- x'
donde en el último paso se suma una se-
rie geométrica (ver página 28).
Barajando el mazo
lo cual es menor que ~ para n = 23 (ésta es precisamente la "paradoja de los
cumpleaños"), menor que 9% para n = 42, Y exactamente O para n > 365
(según el principio del palomar; véase el capítulo 22). La formula es fácil
de demostrar - escogiendo a las personas en un orden fijo: Si las primeras
i personas cumplen años en días diferentes, la probabilidad de que la persona
(i + 1) -ésima también lo haga es 1 - 3~5' ya que hay todavía 365 - i días
disponibles.
De manera similar, al meter n bolas en K cajas de manera independiente y
aleatoria, la probabilidad de que ninguna caja reciba más de una bola es
n-l .
p(n,K) = rr (1- ~).
i=l
El problema del coleccionista
Los niños coleccionan cromos de estrellas de música (o de fútbol), pero como
se venden en sobres cerrados no saben de antemano cuál les tocará. Si hay
n cromos diferentes, ¿cuál es el número esperado de sobres que tiene que
comprar un niño hasta tener al menos un ejemplar de cada cromo?
De manera equivalente, si se seleccionan bolas al azar de una urna que con-
tiene n bolas etiquetadas del 1 al n, y cada vez se vuelven a meter en la urna
y se mezclan bien, ¿cuántas bolas hay que tomar en promedio hasta que cada
bola haya sido escogida por lo menos una vez?
Si en un momento dado ya se han seleccionado k bolas diferentes, entonces la
probabilidad de no escoger a continuación una bola nueva es ~. Por tanto, la
probabilidad de tener que seleccionar exactamente s bolas hasta dar con una
nueva es (~)S-l(l - ~). En consecuencia, el número esperado de veces que
hay que seleccionar una bola hasta dar con una nueva es
(k)S-l( k) 1 L - 1-- s = --k' n n 1--
s~l n
(véase el margen). Por tanto, el número esperado de bolas que hay que selec-
cionar para dar con cada una de las n bolas por lo menos una vez es
n-l 1 n n n n L --k = - + -- + ... + - + - = nHn ~ nlogn, 1-- n n-1 2 1
k=O n
usando las cotas para los números armónicos obtenidas en la página 11. Por
tanto, la respuesta al problema del coleccionista es que en promedio se habrán
de seleccionar aproximadamente n log n bolas.
A continuación necesitaremos estimar la probabilidad de que haya que selec-
cionar un número de bolas significativamente mayor que n log n. Si Vn denota
el número de selecciones necesarias (Vn es la variable aleatoria cuyo valor es-
perado es E[Vnl ~ n log n) entonces, para n 2 1 Y e 2 O, la probabilidad de
tener que seleccionar más de m : = In lag n + en 1 bolas es
Barajando el mazo
En si denota el suceso que en las nrimp.TCl
escoge nunca la bola con el número i, entonces
Prob[UAi ]
i
n(l- ~)m <
m selecciones no se
< -e _ e .
Empecemos ahora con un mazo de n cartas. Las numeramos del 1 al n en el
orden en el que están en el mazo, de manera que la carta con el número 1 está
por encima de todas, y la "n" por debajo. Denotaremos además al conjunto
de todas las permutaciones de 1, ... , n por <5n . Barajar el mazo equivale a
aplicar ciertas permutaciones aleatorias al orden de las cartas. En un caso
ideal, esto podría significar que aplicamos permutaciones arbitrarias 7f E <5n
a nuestro orden inicial (1,2, ... , n), cada una con la misma probabilidad 10,. n.
Por tanto, después de hacerlo una sola vez ya tendríamos el mazo en el orden
7f = (7f(1), 7f(2), ... , 7f( n)), y este orden sería perfectamente aleatorio. Pero
eso no es lo que pasa en la realidad. Cuando barajamos un mazo solamente
aplicamos "ciertas" permutaciones, a lo mejor ni siquiera todas con la misma
probabilidad, y esto se repite un "cierto" número de veces. Después de esto,
tenemos la esperanza de que el mazo esté en un orden por lo menos "casi
aleatorio" .
Estrategia 1: primera carta a un sitio aleatorio
Hacemos lo siguiente: se escoge la carta más alta del mazo, y se inserta en
uno de los n posibles sitios, cada uno con probabilidad ;. Aplicamos pues
una de las permutaciones siguientes
i
J-
Ti = (2,3, ... ,i,1,i+1, ... ,n),
para 1 :::; i :::; n. Después de barajar una vez, el mazo aún no será aleatorio, y
159
Se puede demostrar que (1 - ~) n es
una función creciente en n que converge
a l/e. Por tanto, (1 - ~r < ~ se
cumple para todo n 2': 1.
de hecho habrá que barajar de esta forma muchas veces hasta que sí lo sea. La primera carta a un sitio aleatorio
Una sucesión típica de barajes según esta estrategia podría ser (para n = 5):
1
I~
2 I~ 3 1\ 2 I~I 2 2 I I 3 I 2 I I 4 I I 4 3 I I 4 I 4 I I 1 I I 1
4 I I 1 I 1 I I 5 I I 5
5 I I 5 I 5 I I 3 I I 3
¿De qué manera podríamos expresar matemáticamente que el mazo es "casi
aleatorio"? Un medida bastante severa del grado de aleatoridad con la que
han dado los probabilistas ella "distancia de variación". Para definirla, em-
pezamos fijándonos en la distribución de probabilidad de las n! ordenaciones
diferentes del mazo, o de manera equivalente de las nl diferentes permuta-
ciones (J E <5n que dan lugar a estas ordenaciones.
1\1 4 I~ I I 1 I
I I 5 I
I I 3 I
I I 2 I
160
Para los jugadores de cartas, la pre-
gunta esencial no es "¿cómo de aleato-
rio será el mazo después de barajarlo
un millón de veces? ", sino "¿ bastará
con 7?"
(Aldous & Diaconis [1])
d(k)
1+---......
ka
Barajando el mazo
Dos ejemplos son nuestra distribución de E, dada por
E(id) 1,
E( 1T) O en caso contrario,
y la distribución unifonne U dada por
U(1T) = rb para toda 1T E 6 n .
La distancia de variación entre dos distribuciones 01y 02 se define como
1101 - 0211 := ~ L 101(1T) - 02(1T)1·
1l"E6n
Definiendo S := {1T E 6 n : 01 (1T) > 02 (1T)} Y utilizando que ¿7r 01 (1T) =
¿7r 02(1T) = 1, esta expresión se puede escribir como
donde Oi(S) := ¿7rES Oi(1T). Es claro que O ::; 1101 - 0211 ::; 1. En lo
que sigue, interpretaremos "ser casi aleatorio" como "tener una distancia de
variación pequeña a la distribución unifonne." En nuestro caso, la distancia
de variación entre la distribución del inicio y la unifonne es casi 1:
IIE - UII = 1-~. n.
Después de barajar una vez la aleatoridad del mazo no ha mejorado mucho:
IITop - UII = 1 - (n~l)!'
Llamaremos Top*k a la distribución de probabilidad en 6 n obtenida al in-
sertar k veces la primera carta en un sitio aleatorio. ¿Cómo se comporta
IITop*k - U 11 cuando aumenta k, eso es, si barajamos más veces? ¿Y si usamos
una estrategia diferente para barajar? La teoría general (en particular, cadenas
de Markov en grupos finitos; véase por ejemplo Behrends [3]) implica que
para k grande la distancia de variación d(k) := IITop*k - UII se aproxima
a O a velocidad exponencial, pero no es capaz de predecir el cambio brusco
observado en la práctica: Después de barajar un cierto número ka de veces,
"de pronto" d(k) decrece muy deprisa (véase al margen).
Reglas de detención fuertemente uniformes
Nuestro análisis se basa en la idea brillante de las reglas de detención fuerte-
mente unifonnes de Aldous y Diaconis. Imaginemos que el director de un ca-
sino vigila el proceso de barajar, analizando las pennutaciones que se aplican
al mazo, y después de un número de pasos que depende de las pennutaciones
que haya visto dice "¡Pare!". En esencia, tiene una regla de detención que
finaliza el proceso de barajar y que únicamente depende de las pennutaciones
(aleatorias) aplicadas hasta el momento. La regla de detención es fuertemente
uniforme si se cumple para todo k ::::: O que:
Si el baraje se detiene tras k pasos, entonces las permutaciones resultan-
tes del mazo se distribuyen (¡exactamente!) de manera uniforme.
Barajando el mazo
El número T de pasos que se dan hasta que el su
de detención, diga "¡Pare!" es una variable aleatoria. De manera similar, la
ordenación del mazo después de barajar k veces viene dada por una varia-
ble aleatoria X k (con valores en 6 n ). La regla de detención es fuertemente
uniforme si para todos los valores de k se cumple que
1
Prob [Xk = 1T I T = k] = - para todo 1T E 6 n . n!
Hay tres razones por las cuales estas reglas son interesantes y útiles:
l. Efectivamente existen reglas de detención fuertemente uniformes. Es más,
en muchos ejemplos son bastante sencillas.
2. Se pueden analizar, y al intentar determinar Prob[T > k] a menudo surgen
interesantes problemas combinatorios.
3. Dan cotas superiores efectivas para las distancias de variación, como por
ejemplo d(k) = IITop*k - UII.
Por ejemplo, para la estrategia de insertar la primera carta en un sitio aleatorio,
una regla de detención fuertemente uniforme es:
"PARAR después de que la carta que al principio estuvo debajo del
todo (con la etiqueta n) se haya insertado en el mazo por primera vez."
En efecto, si seguimos a la carta n mientras barajamos, vemos que durante
1 3 2
2
3
4
T1
todo el proceso el orden de las cartas por debajo de ella es totalmente uni-
forme. Por tanto, después de que la carta n haya ascendido hasta arriba y se
haya vuelto a insertar, el mazo está distribuido uniformemente; la única pega
es que no sabemos exactamente cuándo pasa eso (pero el director del casino
sí).
Sea ahora Ti la variable aleatoria que cuenta el número de veces que se baraja
hasta que haya por primera vez i cartas por debajo de la carta n. Por tanto,
tenemos que determinar la distribución de
T = T1 + (T2 - Td + ... + (Tn_1 - Tn- 2 ) + (T - Tn-d.
Cada sumando corresponde a un problema del coleccionista: Ti - Ti- 1 es el
tiempo hasta que la carta de arriba se inserta en un posible lugar por debajo de
la carta n. Por tanto, también es el tiempo que tarda el coleccionista desde que
adquiere el cromo (n - i)-ésimo hasta el (n - i + 1 )-ésimo. Sea Vi el numero
de cromos comprados hasta que el coleccionista tenga i cromos diferentes.
Entonces
161
La probabilidad condicionada
Prob[AIBl
es la probabilidad del suceso A sa-
biendo que el suceso B ocurre. Es la
probabilidad de que los dos sucesos
ocurran, dividido entre la probabili-
dad de que ocurra el suceso B, esto
es,
Prob[A I Bl
4
Prob[A /\ Bl
Prob[B]
162 Barajando el mazo
Hemos visto que Prob[Ti - Ti - 1 = j] = Prob[Vn -i+l - Vn - i = j] para todo
i y j. Por ende, el coleccionista y la persona que baraja el mazo según esta
estrategia llevan a cabo procesos aleatorios independientes, pero equivalentes;
eso sí, en orden inverso (para el coleccionista, finalizar es lo más difícil). Por
tanto, la probabilidad de que con esta regla de detención fuertemente uniforme
se tarde más de k = In lag n + en l pasos es pequeña:
y esto significa a su vez que, después de barajar insertando la primera carta
k = In lag n + en l veces, el mazo es "casi aleatorio" con
Esta última conclusión se sigue del siguiente lema, sencillo pero crucial.
Lema. Sea Q : <5n --------+ lR cualquier distribución de probabilidad que define
un proceso de barajar Q*k con una regla de detenciónjuertemente uniforme
cuyo tiempo de detención es T. Entonces, para todo k 2 0,
• Demostración. Si X es una variable aleatoria con valores en <5n Y Q su
distribución de probabilidad, podemos escribir Q (5) para la probabilidad de
que X tome un valor en 5 ~ <5n . Así, Q(5) = Prob[X E 5], Y en el caso
Q = U obtenemos
U(5) = Prob[X E 5] = ~.
n.
Para cualquier subconjunto 5 ~ <5n> la probabilidad de que al cabo de k
pasos el mazo esté ordenado según una permutación en 5 es
Q*k(5) = Prob[Xk E 5]
I:: Prob[Xk E 5 /\ T = j] + Prob[Xk E 5 /\ T > k]
j9
I:: U(5) Prob[T = j] + Prob[Xk E 5 I T > k] . Prob[T > k]
j~k
U(5) (1- Prob[T > k]) + Prob[Xk E 5 I T > k]· Prob[T > k]
U(5) + (Prob[Xk E 5 I T > k]- U(5)) . Prob[T > k].
Por tanto,
IQ*k(5) - U(5)1 :S Prob[T> k]
ya que
Prob[Xk E 5 I T > k] - U(5)
es una diferencia de probabilidades, y su valor absoluto es como mucho l. O
Esto completa nuestro análisis de la estrategia de insertar la carta de arriba
en un sitio aleatorio. Hemos demostrado la siguiente cota superior para el
número de mezclas necesarias hasta que el mazo sea "casi aleatorio".
Barajando el mazo
Teorema 1. Sea e 2 O Y k := In log n + en l. de insertar
la primera carta k veces en un sitio aleatorio de un mazo con n cartas, la
distancia de variación desde la distribución uniforme cumple
Asimismo, se podría verificar que la distancia de variación d(k) sigue siendo
grande si barajamos un número significativamente menor de n log n veces con
esta estrategia. La razón es que un número más pequeño no bastará para alterar
el orden relativo en las cartas más bajas del mazo.
Por supuesto, esta estrategia de barajar es muy ineficaz - usando la cota de
nuestra teorema, tenemos que barajar aproximadamente n log n ~ 205 veces
hasta mezclar bien un mazo de n = 52 cartas. Por tanto, ahora nos fijaremos
en un modelo mucho más interesante y realista de barajar.
Mezclas por imbricación shuffles)
Esto es lo que el crupier hace en un casino: Toma la baraja, corta en dos partes,
y a continuación las entrelaza, por ejemplo dejando caer las partes inferiores
de los dos medios mazos de alguna manera irregular.
Como antes, esto produce cierta permutación en las cartas del mazo, que su-
ponemos inicialmente etiquetadas del 1 al n, siendo la 1 la de arriba. Las
mezclas por imbricación se corresponden exactamente con las permutaciones
7r E 6 n que verifican que la sucesión
(7r(1),7r(2), ... ,7r(n))
está formada por dos sucesiones crecientes entrelazadas (solamente en el caso
de la permutación identidad hay una sola permutación), y hay exactamente
2n - n mezclas por imbricacióndistintas en un mazo de n cartas.
01 1 1
1 01 O 1
01 1
1
I~
2
11 O 2
IX
3
1 3 I~ 11 4
1 4 1 11
3 01 2
11 1 5 1
4 11 5
11 5
En efecto, si se parte el mazo cogiendo las t cartas superiores con la mano
derecha (O :::; t :::; n) y las n - t cartas restantes con la izquierda, entonces
hay (~) maneras de entrelazar las dos manos, y todas ellas generan permuta-
ciones distintas - excepto que para cada t hay una posibilidad de obtener la
permutación identidad.
No está claro qué distribución de probabilidad se debería asignar a las mezclas
por imbricación - no hay una respuesta única, ya que los aficionados y los
profesionales barajarán de manera diferente. Sin embargo, el modelo que ex-
pondremos a continuación, que fue desarrollado primero por Edgar N. Gilbert
y Claude Shannon en 1955 (entonces en el mítico departamento de "Matemá-
ticas de la Comunicación" de los laboratorios Bell), tiene algunas ventajas:
163
Una mezcla por imbricación
IJI
164
Las mezclas por imbricación inversas
se corresponden con las permutaciones
71" = (71"(1), ... ,7I"(n)) crecientes, con
excepción de a lo sumo un "descenso".
(Solamente la permutación identidad no
tiene ningún descenso.)
Barajando el mazo
es elegante, sencillo y parece
e modeliza con fidelidad la manera de barajar de un no profesional
y lo podemos analizar.
He aquí tres descripciones - todas ellas de la misma distribución de probabi-
lidad Bric en €'in:
1. Bric: €'in ----+ JR; se define mediante
{
n+l
2""
Bric(7I"):= ~~
si n = id,
si n consiste de dos sucesiones crecientes,
en caso contrario.
2. Se toman t cartas del mazo en la mano derecha, con probabilidad 2~ (~),
y el resto del mazo en la mano izquierda. Ahora, si se tienen r cartas en
la mano derecha y 12 en la mano izquierda, se deja caer la carta más baja
de la mano derecha con probabilidad r~R' y de la mano izquierda con
probabilidad r!R' A continuación se repite el proceso.
3. En una mezcla inversa, se quitaría un conjunto de cartas del mazo, y se las
colocaría encima del resto - respetando el orden relativo en las dos partes
del mazo. Tal proceso viene determinado por el subconjunto de cartas que
se quitan, eligiéndose todos los subconjuntos con la misma probabilidad.
De manera equivalente, se asigna una etiqueta "O" ó "1" a cada carta,
aleatoria e independientemente con probabilidad ~, y se mueven las cartas
con la etiqueta "O" arriba.
Es fácil ver que estas reglas describen la misma distribución de probabilidad.
Para (1) ~ (3) obsérvese que obtenemos la permutación identidad justo en
el caso en que todas las cartas "O" están por encima de todas las cartas ''1''.
Ya hemos definido el modelo. Pero, ¿cómo analizarlo? ¿Cuántas mezclas por
imbricación hacen falta para tener un mazo casi aleatorio? No obtendremos la
respuesta más precisa posible, pero sí una bastante buena, siguiendo estos tres
pasos:
(1) Analizar mezclas por imbricación inversas,
(2) describir una regla de detención fuertemente uniforme para ellas,
(3) y demostrar que la clave para su análisis es ¡la paradoja del cumpleaños!
Teorema 2. Después de k mezclas por imbricación en un mazo de n cartas,
la distancia de variación desde una distribución uniforme cumple
IIBric*k - UII ~ 1- TI (1- 2ik )'
• Demostración. (1) Analizaremos mezclas por imbricación inversas para
ver con qué rapidez nos llevan desde la distribución inicial hacia (o cerca de)
la distribución uniforme. Estas mezclas por imbricación inversas se corres-
ponden con la distribución de probabilidad dada por Bric(n) := Bric( n-1 ).
Barajando el mazo
Del hecho que toda permutación
U(1T- 1 ), se obtenemos
IIBric*k - UII
(Esto es el lema de inversión de Reeds.)
una inversa y de que U(1T)
-.-*k
11 Bric - UII·
En cada mezcla por imbricación inversa, a cada carta se le asocia un dí-
gitoOó1:
o 1 1 1 O :=1 ==1====:1 1 1
01:= ::::::4====:1 ~ O 1 4 1 :=1 ==2====:
112 I~ I 1~:=1==3====:
11 3 1 1 2 I~I 4
11 5 1 11 3 l. :=1 =5====:
1 1 5. L-......."-----'
Si recordamos estos dígitos - por ejemplo, escribiéndolos en las cartas - en-
tonces, después de k mezclas por imbricación inversas, en cada carta aparece
una cadena ordenada de k dígitos. Nuestra regla de detención es:
"PARAR cuando todas las cartas tengan asignadas cadenas distintas."
Cuando esto suceda, las cartas del mazo habrán sido ordenadas según los
números binarios bkbk-l ... b2 bl. donde bí es el bit que la carta ha adquirido
en la i-ésima mezcla por imbricación inversa. Como estos bits son totalmente
aleatorios e independientes, esta regla de detención es fuertemente uniforme.
En el siguiente ejemplo para n = 5 cartas, necesitamos T = 3 mezclas inver-
sas hasta parar:
0001 4 001 4 01 1 1 1
0011 2 011 2 1 01 4 1 1 2
0101 1 -<f--- 011 5 I-<f---ll 2 I-<f---I 3
1011 5 101 1 1 11 3 1 1 4
1111 3 111 3 1 11 5 1 1 5
(3) El tiempo esperado T hasta parar usando esta regla de detención se distri-
buye como en la paradoja del cumpleaños, para K = 2k: ponemos dos cartas
en la misma caja si tienen la misma etiqueta bkbk- 1 ... b2h E {O,1}k. Por
tanto, hay K = 2k cajas, y la probabilidad de que una caja contenga más de
una carta es
Prob[T> k] = 1 - TI (1- 2ik ) ,
lo cual, como hemos visto, acota la distancia de variación 11 Bric*k - U 11
--*k
11 Bric - UII. O
¿Cuántas veces tenemos que barajar? Para n grande son aproximadamente
k = 2Iog2 (n) veces: poniendo k := 210g2 (cn) para algún e 2: 1 hallamos
(usando técnicas del análisis) que P[T > k] R::i 1 - e~ R::i 2~2.
165
166
k d(k)
1 1.000
2 1.000
3 1.000
4 1.000
5 0.952
6 0.614
7 0.334
8 0.167
9 0.085
10 0.043
La distancia de variación después de k
mezclas por imbricación, según [2]
d(k)
1 7 10
¿ Suficentemente aleatorio?
Barajando el mazo
Por ejemplo, para n = 52 cartas, las cotas superiores dadas por el teorema 2
son d(10) ~ 0.73, d(12) ~ 0.28, d(14) ~ 0.08 - con lo cual, k = 12
tendría que ser "suficientemente aleatorio" para fines prácticos. Pero en la
práctica no barajamos 12 veces - ni hace falta, como muestra un análisis más
detallado (véase al margen). El análisis de las mezclas por imbricación es parte
de un debate actual y muy vivo acerca del significado de "suficientemente .
aleatorio". Diaconis [4] puede servir de guía de los últimos acontecimientos.
¿Es importante este análisis? En efecto, lo es: aún después de tres buenas
mezclas por imbricación de una baraja de 52 cartas, el mazo parece bastante
aleatorio ... pero no lo es. Martín Gardner [5, capítulo 7] describe algunos
impresionantes trucos de cartas basados en el orden escondido en tal mazo.
[1] D. ALDOUS & P. DIACONIS: Shuffling cards and stopping times, Amer. Math.
Monthly 93 (1986), 333-348.
[2] D. BAYER & P. DIACONIS: Trailing the dovetail shuffle to its lair, Annals Applied
Probability 2 (1992),294-313.
[3] E. BEHRENDS: Introduction to Markov Chains, Vieweg, Braunschweig/
Wiesbaden 2000.
[4] P. DIACONIS: Mathematical developments from the analysis oi riffle shuffling,
in: "Groups, Combinatorics and Geometry. Durham 2001" (A. A. Ivanov, M. W.
Liebeck and J. Saxl, eds.), World Scientific, Singapore 2003, pp. 73-97.
[5] M. GARDNER: Mathematical Magic Show, Knopf, New York/Allen & Unwin,
London 1977.
[6] E. N. GILBERT: Theory oi Shuffling, Technical Memorandum, Bell Laboratories,
Murray Hill NJ, 1955.
Lo esencial de las matemáticas es demostrar teoremas - y por tanto, a ello se
dedican los matemáticos: demuestran teoremas. Pero, a decir verdad, lo que
realmente quieren demostrar, por lo menos una vez en su vida, es un lema:
como el de Fatou en análisis, el lema de Gauss en la teoría de números o el
lema de Bumside-Frobenius en combinatoria.
Ahora, ¿qué convierte una afirmación matemática en un verdadero lema? En
primer lugar, debería ser aplicable a una gran variedad de circunstancias, in-
cluso a problemas sin conexión aparente. En segundo lugar, la afirmación
debería ser completamente obvia- una vez vista. Al lector hasta le podría
dar una leve envidia: ¿por qué yo no he observado esto antes? Y por último,
en un nivel estético, ¡tanto el lema como su demostración deberían ser bellos!
Aquí veremos un ejemplo de razonamiento matemático de estas característi-
cas, un lema de recuento que apareció por primera vez en 1972, en un artículo
de Bemt Lindstrbm. Aunque en ese entonces pasó desapercibido, en 1985 se
convirtió de golpe en un clásico, cuando Ira Gessel y Gerard Viennot lo re-
descubrieron y demostraron en un artículo maravilloso cómo puede aplicarse
a una gran diversidad de difíciles problemas de enumeración combinatoria.
Partimos de la representación del determinante de una matriz mediante permu-
taciones. Sea M = (mij) una matriz n x n con elementos reales. Entonces
det M = L sign (J" mlo-(l) m2o-(2) ... mnu(n) , (1)
o-
donde (J" recorre todas las permutaciones de {1, 2, ... , n}, y la signatura de (J"
es 1 ó -1, dependiendo de si (J" es el producto de un número par o impar de
transposiciones.
Ahora construimos un grafo, más exactamente un grafo bipartito dirigido con
pesos. Este grafo tendrá vértices Al, ... ,An representando las filas de M,
Y vértices El, ... ,En para las columnas. Para cada par (i, j) dibujamos una
flecha de Ai a E j , Y le damos el peso mij (véase la figura).
En términos de este grafo, la fórmula (1) tiene la siguiente interpretación:
€II El primer miembro es el determinante de la matriz de caminos M, cuya
entrada (i, j) es el peso del (único) camino dirigido de Ai a Ej.
€II El segundo miembro es la suma ponderada (con signo) sobre todas las
familias de caminos disjuntos en vértices desde A = {Al, ... , An} hasta
B = {El, ... , En}. Tal familia Po- viene dada por los caminos
m1l
m nn
168
Un grafo dirigido acíclico
retículas y determinantes
y el peso de la familia de caminos Pu es el Prc)ducto de los pesos de los
caminos individuales:
Mediante esta interpretación, podemos escribir (1) como
detM = L signCTw(Pu )'
y ¿cuál es el resultado de Gessel y Viennot? Es la generalización natural
de (1) de grafos bipartitos a grafos arbitrarios. Es exactamente este paso el
que permite aplicar el lema en tantos contextos distintos - y su demostración
es sumamente sencilla y elegante.
Empecemos revisando los conceptos necesarios. El objeto básico es un grafo
finito dirigido acíclico G = (V, E), lo cual quiere decir que en G no hay
ciclos dirigidos. En particular, entre dos vértices cualesquiera A y B sólo
hay un número finito de caminos dirigidos, donde también consideramos los
caminos triviales A -+ A de longitud O. Cada arista e tiene el peso w(e).
Si P es un camino dirigido de A a B, que escribiremos P : A -+ B, se define
el peso de P como
w(P) := w(e).
eEP
Si P es un camino de longitud O, se define que w(P) = 1.
Denotamos ahora por A = {Al, ... , An} Y B = {Bl, ... , Bn} dos conjuntos
de n vértices, donde A y B no son necesariamente disjuntos. Asociamos a A
y B la matriz de caminos M = (mij) con
L w(P).
P:Ai--+Bj
Una familia de caminos P de A a B está formado por una permutación CT junto
con n caminos Pi : Ai -+ Bu(i), para i = 1, ... , n; además, escribiremos
sign P = sign CT . El peso de P es el producto de los pesos de los caminos,
n
w(P) = rr w(Pi ), (2)
i=l
es decir, el producto de los pesos de todas las aristas de la familia de caminos.
Finalmente, diremos que la familia de caminos P = (Pi, ... ,Pn ) es disjunta
en vértices si, para cada par de caminos en P, sus conjuntos de vértices son
disjuntos.
Lema. Sea G = (V, E) un grafo finito dirigido acíclico y ponderado, y sean
A = {Al, ... , An} y B = {B l , ... , Bn} dos conjuntos de n vértices y M la
matriz de caminos de A a B. Entonces
detM
P familia de caminos
disjuntos en vértices
signP w(P). (3)
um",u'~, retículas y determinantes 169
_Demostración. Unsumando dedet(M) es sign(J mlo-(l)'" mno-(n),
lo cual se puede escribir como
Sumando sobre (J podemos deducir de (2) que
det M = L sign P w(P),
P
donde P recorre todos las familias de caminos de A a E, sean disjuntos en
vértices o no. Por tanto, para llegar a (3), sólo hace falta demostrar que
L signP w(P) = O, (4)
PEN
donde N es el conjunto de todos las familias de carninos no disjuntos en vér-
tices, y ello lo lograremos mediante un argumento de singular belleza. Dare-
mos una involución 1T : N ----; N (sin puntos fijos) tal que para P y 1TP
W(1TP) = w(P) y sign 1TP = -sign P .
Claramente, esto implicará (4), y por tanto la fórmula (3) del lema.
La involución 1T se define de manera muy natural. Sea P E N con caminos
Pi :Ai ----; Bo-(i)' Por definición, algunos pares de caminos se intersecarán.
@ Sea io el mínimo índice tal que Pio tiene un vértice en común con algún
otro camino.
@! Sea X el primero de tales vértices en el camino P io '
@! Sea jo el mínimo índice (jo> i o) tal que Pjo tiene el vértice X en común
con Pio'
Construimos la nueva familia 1TP = (Pi, . , . ,P~) de la manera siguiente:
@! Sea P~ = Pk para todo k =1- io, jo.
@ El nuevo camino Pio va de Aio a X pasando por P io ' Y a continuación
sigue a Bo-(jo) a lo largo de P jo . De manera similar, Pjo va desde Ajo
hasta X a lo largo de P jo y sigue hasta Bo-(io) a lo largo de Pio'
Claramente 1T(1TP) = P, ya que el índice i o, el vértice X, y el índice jo son
los mismos que antes. En otras palabras, al aplicar 1T dos veces volvemos a
los caminos Pi de antes. Ahora, ya que 1TP y P usan exactamente las mis-
mas aristas, tenemos ciertamente que W(1TP) = w(P). Y por último, puesto
que la nueva permutación (JI se obtiene componiendo (J con la transposición
(io, jo), deducimos que sign 1TP = -sign P , y hemos terminado la demos-
tración. D
Se puede usar el lema de Gessel-Viennot para deducir todas las propiedades
básicas de los determinantes, simplemente estudiando los grafos apropiados.
Consideremos a continuación un ejemplo especialmente llamativo, la fórmula
de Binet-Cauchy, que proporciona una generalización muy útil de la regla del
producto para determinantes.
170
Pil
Pik
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6
1 7 21 35 35 21
a=3
b=4
1
7 1
nw"m,l<' retículas y determinantes
Teorema. Sean r ::; s, P una matriz r x s y Q una matriz s x T, entonces
det(PQ) = ~)detPz)(detQz),
z
donde Pz es la submatriz (r x r) de P cuyas columnas están indexadas por el
conjunto Z, y Q z la submatriz (r x r) deQ cuyas filas están indexadas por Z.
• Demostración. Como antes, haremos corresponder a la matriz P el grafo
bipartito en A y B, Y de manera similar a Q el grafo bipartito en B y C. Con-
sideramos ahora el grafo concatenado de la figura de la izquierda. Podemos
observar que la entrada mij de la matriz M de caminos desde A hasta C es
precisamente mij = I: k Pik qkj ; por tanto, M = PQ.
Las familias de caminos disjuntos en vértices desde A hasta C en el grafo
concatenado se corresponden con pares de familias desde A hasta Z, y desde
Z hasta C. Por tanto, el resultado se sigue de manera inmediata del lema,
observando que sign (en) = (sign a") (sign T). O
El lema de Gessel-Viennot da lugar a muchos resultados que relacionan los
determinantes con propiedades enumerativas. La receta es siempre la misma:
hay que interpretar a la matriz M como una matriz de caminos, e intentar
calcular el segundo miembro de (3). Como ilustración, he aquí el problema
original estudiado por Gessel y Viennot, que les llevó a su lema:
Sean al < az < ... < a n y bt < b2 < ... < bn dos sucesiones
de números naturales. Se pide calcular el determinante de la matriz
M = (mij), donde mij es el coeficiente binomial (~i).
J
Dicho de otro modo, Gessel y Viennot consideraron los determinantes de todas
las submatrices cuadradas del triángulo de Pascal, por ejemplo de la matriz
(
(i)
det (i)
(~)
@
(~)
(~)
(~) )
(!)
(~)
1
4
20
~ ) ,
15
definida por las entradas en negrita del triángulo de Pascal del margen.Como primer paso para resolver este problema recordaremos un resultado
conocido que relaciona los coeficientes binomiales con los caminos en una
retícula. Consideramos una retícula a x b como en el margen. Entonces, el
número de caminos desde la esquina inferior izquierda hasta la esquina su-
perior derecha, donde los únicos pasos permitidos son hacia arriba (norte) y
hacia la derecha (este), es (a!b).
La demostración de este hecho es fácil: cada camino está formado por una
sucesión arbitraria de b pasos hacia el "este" y a pasos hacia el "norte", y por
tanto se puede representar por una sucesión de la forma NENEEEN, que está
formado por a + b letras, de las cuales haya letras N y b letras E. El número
de tales cadenas es el número de maneras de elegir a posiciones de letras N de
un total de a + b posiciones, lo cual es (a!b) = (atb).
-'u,w.","' .... retículas y determinantes
Ahora consideramos la de la uv'.vvuu, en la cual está en el
(O, -ai) Y Ej en el punto (b j , -bj ).
El número de caminos de Ai hasta Bj en esta retícula que usan solamente
pasos al norte y 'al este es, como hemos visto, (bj+(~~-bj)) = (~i). Dicho de Al
J. J
otra manera, la matriz de coeficientes binomiales M es exactamente la matriz
de caminos de A a B en el grafo reticular dirigido en el cual todas las aristas
tienen peso 1, y están dirigidas al norte o al este. Por tanto, podemos aplicar el
lema de Gessel-Viennot para calcular det M. Una breve reflexión muestra que
toda familia de caminos disjunto en vértices P de A a B está necesariamente
compuesta de caminos Pi : Ai ---+ Ei para todo i. En consecuencia, la única
permutación posible es la identidad, que tiene signatura 1. Hemos obtenido el
bello resultado de que
det ( (~;)) = # familias de caminos disjuntos en vértices de A a B.
En particular, de esto se sigue el hecho no trivial que det M es siempre no
negativo, ya que el segundo miembro de la igualdad cuenta algo. Además,
el lema de Gessel-Viennot implica que det M = O si Y sólo si ai < bi para
algún i.
En n~estro ejemplo de antes tenemos
~~
det (
(D G) m
) familias de 3 (i) (i) (!) # caminos disjuntos 4 m m m en vértices en
~3
~4
~
6
,)
Ai
An
~ ~ ~
~ lO lO
"Caminos en retículas"
171
~
Bn
~ ~
172 Lu:rrunu,,'. retículas y detenninantes
[1] l. M. GESSEL & G. VIENNOT: Binomial determinants, paths, and hook length
formulae, Advances in Math. 58 (1985), 300-321.
[2] B. LINDSTRÓM: On the vector representation ofinduced matroids, Bulletin Lon-
don Math. Soco 5 (1973), 85-90.
Una de las fórmulas más bellas de toda la combinatoria enumerativa es la del
número de árboles etiquetados. Consideramos el conjunto N = {1, 2, ... ,n}.
¿Cuántos árboles diferentes podemos construir usando estos vértices? Sea Tn
su número. La enumeración "a mano" nos da T1 = 1, T2 = 1, T3 = 3 Y
T4 = 16, Y mostramos estos árboles a continuación:
1
•
1 2
3
1 212
3
1 2
3
1 2 1 2 1 2
343 4 3 4 3 4 3 4 3 4 3 434
1 2 1 2 1 212 1 2 1 2 1 2
3 4 343 4 3 4 3 4 3 4 3 434
Nótese que consideramos árboles etiquetados. Por tanto, aunque solamente
hay un árbol con tres vértices en el sentido de isomorfismo de grafos, al marcar
el vértice interior con 1, 2 ó 3 obtenemos tres árboles etiquetados distintos.
Para n = 5 hay tres árboles no isomorfos (sin etiquetar):
5
Para el primer árbol es claro que hay 5 etiquetados diferentes, y para el se-
gundo y tercero hay %l = 60 etiquetados - con lo cual n = 125. Esto ya
tendría que ser suficiente para conjeturar que Tn = nn-2, y este es precisa-
mente el resultado de Cayley.
Teorema. Hay nn-2 árboles etiquetados diferentes con n vértices.
Esta fórmula tan bella da lugar a demostraciones igualmente bellas, que usan
gran variedad de técnicas algebraicas y combinatorias. Esbozaremos tres de
ellas antes de presentar la demostración que hasta la fecha sigue siendo la más
bonita de todas .
• Primera demostración (Biyección). El método más clásico y directo es en-
contrar una biyección del conjunto de todos los árboles con n vértices con otro
Arthur Cayley
174
Los cuatro árboles de T2
7 4 9
~ 1-------tl---~lO
e-___ -----. 6
2
6
La fórmula de Cayley para el número de árboles
conjunto del cual se sabe que tiene nn-2 elementos. De manera pode-
mos pensar en el conjunto de todas las sucesiones ordenadas (al, ... , an -2)
con 1 ::; ai ::; n. Por tanto, queremos codificar unívocamente a cada árbol
T por una sucesión (al . .. ,an -2). Tal codificación fue hallada por Prüfer, y
aparece en la mayoría de los libros sobre teoría de grafos.
AquÍ queremos presentar otra demostracÍón por biyección, encontrada por Jo-
yal, que es menos conocida pero de igual elegancia y sencillez. Para ello, no
consideramos solamente árboles t con vértices en N = {l, ... , n}, sino tales
árboles junto con dos vértices distinguidos, el extremo izquierdo O y el ex-
tremo derecho O, que pueden coincidir. Sea In = {(t; O, O)} este nuevo
conjunto. Entonces, claramente, IInI = n 2Tn .
Nuestra meta es por tanto probar que IIn I = n n. Ahora, hay un conjunto cuyo
tamaño sabemos que es nn, el conjunto NN de todas las aplicaciones de N
en N. Podemos pues probar nuestra fórmula si encontramos una biyección
entre NN y 4,.
Sea 1 : N ------+ N cualquier aplicación. Dibujando flechas de i a l(i), pode-
mos representar 1 como un grafo dirigido a J.
Por ejemplo, representamos la aplicación
1 = ( ~ 2 5
3
5
4
9
5
1
6
2
por el grafo dirigido que aparece al margen.
7
5
8
8
9
4 l~ )
Fijémonos en una componente conexa de OJ. Ya que hay exactamente una
arista que sale de cada vértice, la componente contiene el mismo número de
vértices y aristas, y por tanto exactamente un ciclo. Sea NI ~ N la unión de
los conjuntos de vértices de dichos ciclos. Un momento de reflexión muestra
que M es el único subconjunto maximal de N tal que la restricción de 1 a M
es una biyección en M. Escribimos 11M = (l(a) ltb) l(z) ),
de manera que los números a, b, ... , z en la primera fila aperecen en su orden
natural. Esto proporciona una ordenación l(a), l(b), ... , l(z) del conjunto
M = {a, b, ... ,z} de acuerdo con la segunda fila, en la cual el extremo iz-
quierdo es 1 (a) y el extremo derecho 1 (z).
Podemos construir el árbol t correspondiente a la aplicacion 1 como sigue:
Dibujamos 1 (a), ... , 1 (z) en este orden como camino desde 1 (a) hasta 1 (z),
y rellenamos los demás vértices como indica OJ (suprimiendo las flechas).
En nuestro ejemplo anterior obtenemos M = {l, 4, 5, 7, 8, 9},
y por tanto el árbol t del margen.
5
1
7 8
5 8
Es inmediato cómo invertir esta correspondencia: Dado un árbol t, nos fijamos
en el único camino P del extremo izquierdo al extremo derecho. Esto nos da
el conjunto M y la aplicación 1 1M. Las demás correspondencias i -+ 1 (i) se
determinan de acuerdo con los caminos únicos entre i y P. O
Lafórmula de Cayley para el número de árboles
Segunda demostración Podemos pensar en como el
número de árboles generadores del grafo completo Kn. Ahora nos fijamos
en un grafo arbitrario conexo y simple G en V = {1, 2, ... , n}, y denotamos
por t(G) el número de árboles generadores; de esta manera, Tn = t(Kn ). El
resultado siguiente es el célebre teorema matricial de los árboles de Kirchhoff
(véase [1]). Consideramos la matriz de incidencia B = (bie ) de G, cuyas filas
y columnas están etiquetadas, respectivamente, por V y E. Ponemos bie = 1
Ó O según i E e o i ti- e. Nótese que IEI 2: n -1, ya que G es conexo. En cada
columna reemplazamos de forma arbitraria alguno de los dos '1' por' -1' (en
otras palabras, orientamos G de forma arbitraria), y llamamos C a la nueva
matriz. Entonces M = C C T es una matriz simétrica (n x n) que contiene los
grados dI, ... , dn en su diagonal principal.
Proposición. Se cumple que t( G) = det M ii para todo i = 1, ... , n, donde
M ii se obtiene de M suprimiendo la fila i-ésima y la columna i-ésima .
• Demostración. La clave de la demostraciónes el teorema de Binet-Cauchy
que demostramos en el capítulo anterior: Si P es una matriz (r x 8) y Q una
matriz (8 x r), con r :::; 8, entonces det(PQ) es igual a la suma de los produc-
tos de los determinantes de todas las submatrices correspondientes de tamaño
(r x r), donde "correspondiente" quiere decir que escogemos los mismos ín-
dices para las r columnas de P y las r filas de Q.
Para M ii , esto quiere decir que
det M ii = L N det N . det N T = L N (det N)2 ,
donde N recorre todas las submatrices (n - 1) x (n - 1) de C\ {fila i}. Las
n - 1 columnas de N corresponden a un subgrafo de G con n - 1 aristas y n
vértices, y nos queda por demostrar que
det N = {±01 si estas aristas forman un árbol
en otro caso.
Supongamos que las n - 1 aristas no forman un árbol. Entonces existe una
componente que no contiene a i. Ya que las filas que le corresponden suman O,
sabemos que son linealmente dependientes, y por tanto det N = O.
175
Supongamos ahora que las columnas de N engendran un árbol. Entonces "Un método no estándar para contar
existe un vértice JI =1 i de grado 1; sea el la arista incidente. Al suprimir árboles: Coloque un gato en cada ár-
jI, el obtenemos un árbol con n - 2 aristas. Otra vez, hay un vértice 12 =1 i bol, pasee su perro, y cuente cuántas ve-
de grado 1 con arista incidente e2. Continuamos de esta manera hasta que ces ladra."
hayamos determinado jI, j2, ... ,jn-l Y el, e2, ... , en-l con ji E ei. Ahora
permutamos filas y columnas para llevar j k a la fila k-ésima, y ek a la columna
k-ésima. Puesto que por construcción jk ~ ee para k < R, vemos que la
nueva matriz N' es triangular inferior, y que todos los elementos de la diagonal
principal son ±l. Por tanto, det N = ±det N' = ±1, y hemos terminado.
Para el caso especial G = Kn es claro que
M
ii
= ( n ~/ n ~\
-1 -1
-1 ) -1
. ,
n~1
y un cálculo fácil muestra que det Mii = n n-2 . D
176 Lafónnula de Cayley para el número de árboles
Por ejemplo, T4,2 = 8 para A = {l, 2}
1 2 3 k
~
•
• Tercera demostración Otro método clásico en combinatoria
enumerativa es establecer una relación de recurrencia, que después se resuelve
por inducción. La siguiente idea se debe esencialmente a Riordan y Rényi.
Para encontrar la recursión apropiada, consideramos un problema más general
(que ya aperece en el artículo de Cayley). Sea A un subconjunto arbitrario
de los vértices con k elementos. Denotamos por Tn,k el número de bosques
(etiquetados) con vértices {l, ... ,n} que están formados por k árboles, yen
los cuales los vértices de A aparecen en árboles diferentes. Es claro que sólo
importa el cardinal del conjunto A, no sus elementos. Nótese que Tn ,l = Tn .
1 2 1 2 1 2 1 2
KL:~II
3 4 3 4 3 4 3 4 3 4 3 4 3 4
Consideremos un tal bosque B con A = {1, 2, ... ,k}, y supongamos que 1 es
adyacente con í vértices, tal y como se ilustra en el margen. Suprimiendo ell,
los í vecinos, junto con 2, ... , k, dan lugar a un vértice cada uno en las com-
ponentes de un bosque de k - 1 + í árboles. Ya que podemos (re)construir B
fijando primero í, después eligiendo los í vecinos de 1, y a continuación el
bosque F\l, tenemos que·
n-k ( )
Tn,k = L n ~ k Tn - 1,k-1+i
.=0
para todo n 2: k 2: 1, donde definimos To,o = 1 y Tn,o
Nótese que To,o = 1 es necesario para asegurar Tn,n = 1.
Proposición. Se verifica
y por tanto, en particular,
T k n-k-1 n,k = n
(1)
o para n > O.
(2)
• Demostración. Por (1), y usando inducción, encontramos que
n-k ( k)
Tn,k = 8 n ~ (k - 1 + í)(n - 1)n-1-k-i
nn-k _ (n _ k) ~ (n ~ ~ ~ k}n _ 1)i-1
nn-k _ (n _ k) n%r (n - ~ - k) (n _ l)i
nn-k _ (n - k)nn-1-k = knn- 1- k.
(í--;n-k-í)
o
La fórmula de Cayley para el número de árboles
• Cuada demostraci6n Obtenemos la fórmula de
y su generalización (2), a partir de una idea genial de Jim Pitman sin inducción
o biyección - sólo contando astutamente de dos maneras.
Un bosque con raíz con vértices en {1, ... ,n} es un bosque junto con una
elección de raíz en cada árbol. Sea :Fn,k el conjunto de todos los bosques con
raíz que están formados por k árboles con raíz. Por tanto, :Fn,l es el conjunto
de todos los árboles con raíz.
Nótese que l:Fn,ll = nTn , ya que en cada árbol hay n elecciones para la
raíz. Ahora pensamos en Fn,k E :Fn,k como un grafo dirigido con todas las
aristas "alejándose" de la raíz. Diremos que un bosque F contiene a otro
bosque F' si F contiene a F' como grafo dirigido. Claramente, si F contiene
a F' propiamente, entonces F tiene menos componentes que F'. La figura
muestra dos bosques de este tipo, con las raÍCes en la parte de arriba.
He aquí la idea crucial. Decimos que una sucesión F 1 , ... , F k de bosques una
sucesión refinadora si Fi E :Fn,i y Fi contiene a Fi+l para todo i.
Sea ahora Fk un bosque fijo en :Fn,k, y denotamos
G por N(Fk) el número de árboles con raíz que contienen a Fk, y
G por N* (Fk) el número de sucesiones refinadoras que acaban en Fk.
Contamos N* (Fk ) de dos maneras distintas, primero empezando en un árbol,
yen segundo lugar empezando en Fk. Supongamos que Fl E :Fn,l contiene
a Fk. Ya que podemos borrar las k - 1 aristas de Fl \Fk en cualquier orden
posible para obtener una sucesión refinadora de Fl a Fk, vemos que
(3)
Empecemos ahora por el otro lado. Para llegar a un Fk-l desde Fk, tenemos
que añadir una arista dirigida desde cualquier vértice a hasta cualquiera de las
k - 1 raíces de los árboles que no contienen a a (véase la figura a la derecha,
donde pasamos de F3 a F2 añadiendo la arista 3~... ~7). Por tanto, tenemos
n( k - 1) elecciones. De manera similar, para Fk-l podemos añadir una arista
dirigida desde cualquier vértice b a cualquiera de las k - 2 raíces de los árboles
que no contienen a b. Para ello tenemos n(k - 2) posibilidades de elección.
Continuando de esta manera, llegamos a
(4)
y con ello obtenemos, usando (3), la relación tan inesperadamente sencilla
para cualquier Fk E :Fn,k'
Para k = n, el bosque Fn está formado de n vértices aislados. Por tanto,
N(Fn) cuenta el número de todos los árboles con raíz, y hemos obtenido el
resultado l:Fn,ll = nn-l, y por tanto la fórmula de Cayley. O
Pero podemos sacar aún más partido de esta demostración. Del caso k = n de
la fórmula (4) resulta que
# { sucesiones refinadoras (F1 , F 2 , ... , F n) } (5)
177
2
9
F2 contiene a F3
8 4 7
2 1: 1 9 F3 10
-]lo>-- _
8 ,/ 4 7
/\l 1: 9 2 3 1
F3 ----t F2 10
178 Lafónnula de Cayley para el número de árboles
Para Fk E J"n,b sea N** (Fk) el número de sucesiones refinadoras , ... , Fn
cuyo término k-ésimo es Fk. Claramente este número es N* (Fk) multiplicado
por el número de maneras de elegir (Fk+1 , ... ,Fn ). Pero este último número
es (n - k)!, ya que podemos borrar las n-k aristas de Fk en cualquier orden.
Por tanto,
Puesto que este número no depende de la elección de F k , el resultado de la
división de (5) entre (6) proporciona el número de bosques con raíz con k
árboles:
Ya que podemos elegir las k raíces de (~) maneras distintas, hemos vuelto a
demostrar la fórmula Tn,k = knn-k-l sin necesidad de inducción.
Acabaremos con una nota histórica. Carl W. Borchardt publicó un artículo en
1860 anticipándose a Cayley, que publicaría su trabajo en 1889; este hecho
fue reconocido por el propio Cayley. Un resultado equivalente apareció aún
antes, en un trabajo de James J. Sylvester (1857), véase [2, capítulo 3]. La
novedad en el artículo de Cayley fue el uso de la terminología de la teoría de
grafos, y el teorema lleva su nombre desde entonces.
[1] M. AIGNER: Combinatorial Theory, Springer-Verlag, Berlin Heidelberg New
York 1979; Reprint 1997.
[2] N. L. BIGGs, E. K. LLOYD & R. J. WILSON: Graph Theory 1736-1936, Cla-
rendon Press, Oxford 1976.
[3] A. CAYLEY: A theorem on trees, Quart. J. Pure Appl. Math. 23 (1889), 376-378;
Collected Mathematical Papers Vol. 13, Cambridge University Press 1897, 26-28.
[4] A. J OYAL: Une théorie combinatoire des séries formelles, Advancesin Math. 42
(1981),1-82.
[5] J. PITMAN: Coalescent random forests, J. Combinatorial Theory, Ser. A 85
(1999),165-193.
[6] H. PRÜFER: Neuer Beweis eines Satzes über Permutationen, Archiv der Math. u.
Physik (3) 27 (1918), 142-144.
[7] A. RÉNYI: Some remarks on the theory oftrees. MTA Mat. Kut. Inst. Kozl. (Publ.
math. Inst. Hungar. Acad. Sci.) 4 (1959), 73-85; Selected Papers Vol. 2, Akadé-
miai Kiadó, Budapest 1976, 363-374.
[8] J. RIORDAN: Forests of labeled trees, J. Combinatorial Theory 5 (1968),
90-103.
Entre los objetos combinatorios más antiguos se encuentran los Cuadrados
latinos, que aparentemente se estudian desde tiempos inmemoriales. Para ob-
tener un cuadrado latino, se han de rellenar las n 2 casillas de un cuadrado
(n x n) con los niimeros 1,2, ... ,n de manera que cada número aparezca
exactamente una vez en cada fila y cada columna. En otras palabras, cada una
de las filas y columnas representan permutaciones del conjunto {1, ... ,n}.
Nos referiremos a n como el orden del cuadrado latino.
He aquí el problema que nos interesa discutir: Alguien comienza a rellenar
las celdas con los números {1, 2, ... ,n}. En algún momento se detiene y nos
pide continuar hasta obtener un cuadrado latino. ¿En qué condiciones será
posible hacerlo? Para que no sea imposible, supondremos que al comenzar
nuestra tarea cada elemento aparece a lo sumo una vez en cada fila y en cada
columna. Demos un nombre a esta situación: Hablaremos de un cuadrado
latino parcial de orden n si algunas celdas de un cuadrado (n x n) están
rellenas con números del conjunto {1, ... , n}, de tal manera que cada número
aparece como máximo una vez en cada fila y en cada columna. Hecho esto,
nuestro problema es el siguiente:
¿ En qué condiciones puede completarse un cuadrado latino parcial
para obtener un cuadrado latino del mismo orden?
Veamos unos cuantos ejemplos. Supongamos las n-1 primeras filas rellenas y
la última vacía. En esta situación podemos completar la última fila fácilmente:
Cada elemento aparece n 1 veces en el cuadrado latino parcial, y de aquí
que esté ausente exactamente de una columna. Basta por tanto escribir cada
elemento bajo dicha columna y habremos completado el cuadrado.
En cambio, si sólo está rellena la primera fila, es fácil completar el cuadrado
rotando los elementos cíclicamente en las filas siguientes.
De este modo, mientras que en el primero de los ejemplos existe una única
manera de completar el cuadrado, para el segundo existen muchas posibilida-
des. En general, cuantas menos celdas estén rellenas de partida, más libertad
deberíamos tener a la hora de completar el cuadrado.
Sin embargo, en el margen se muestra un ejemplo de cuadrado parcial en el
que sólo aparecen rellenas n celdas y que no puede ser completado, puesto que
no hay manera de rellenar la esquina superior derecha sin violar la condición
impuesta a la fila o a la columna.
Si el número de filas que aparecen rellenas en una malla (n x n) es
menor que n, ¿puede siempre completarse para obtener un cuadrado
latino?
1 2 3 4
2 1 4 3
4 3 1 2
3 4 2 1
Un cuadrado latino de orden 4
1 4 2 5 3
4 2 5 3 1
2 5 3 1 4
5 3 1 4 2
3 1 4 2 5
Un cuadrado latino cíclico
1 2 ... n-1
n
Un cuadrado latino parcial que no puede
ser completado
180
1 3 2
2 1 3
3 2 1
F: 1 1 1 2 2 2 3 3 3
c: 1 23 1 23 1 23
E: 1 3 2 2 1 3 3 2 1
Si permutamos cíclicamente las líneas
del ejemplo anterior,
F ---> C ---> E ---> F, entonces
obtenemos el cuadrado latino y la
disposición siguientes:
1 2 3
3 1 2
2 3 1
F: 1 3 2 2 1 3 3 2 1
C: 1 1 1 2 2 2 3 3 3
E: 1 23 1 2 3 1 2 3
Completando cuadrados latinos
Esta pregunta fue por Trevor Evans in 1960, y la de que
es posible se difundió rápidamente como la "conjetura de Evans." Por su-
puesto, uno trataría de demostrarlo por inducción, y así es como finalmente
fue resuelto el problema por Bohdan Smetaniuk en 1981. Sin embargo, su
trabajo ilustra cuánta sutileza puede llegar a precisarse en una demostración
por inducción. Más aún, su prueba es constructiva, y permite completar explí-
citamente el cuadrado a partir de cualquier configuración parcial.
Antes de comenzar con la demostración, exploraremos los cuadrados latinos
en general con un poco de detalle. De manera alternativa, podemos referimos
a un cuadrado latino utilizando una disposición de tamaño (3 x n2 ), que en
adelante llamaremos disposición en lineas del cuadrado latino. El margen
muestra un cuadrado latino de orden 3 y su disposición en líneas asociada,
donde F, e y E denotan, respectivamente, filas, columnas y elementos.
La condición de cuadrado latino es equivalente a decir que en dos líneas cua-
lesquiera de esta disposición aparecen todos los n 2 pares ordenados (y por
tanto que cada par aparece exactamente una vez). Por tanto, podemos per-
mutar los símbolos de cada línea de manera arbitraria (lo cual corresponde
a permutar filas, columnas o elementos) y obtener de nuevo un cuadrado la-
tino. Pero la condición nos dice más: los elementos no juegan ningún papel
especial. Podemos permutar las líneas (como un todo), preservando las con-
diciones de la disposición en líneas, y por tanto del cuadrado latino.
Llamamos conjugados a los cuadrados latinos conectados por tales permuta-
ciones. La siguiente observación será muy útil: A todo cuadrado latino parcial
le corresponde una disposición parcial en líneas (cada par aparece a lo sumo
una vez en dos líneas cualesquiera), y todo conjugado de un cuadrado latino
parcial es, de nuevo, un cuadrado latino parcial. En particular, un cuadrado
latino parcial puede completarse si y sólo si puede serlo cualquier conjugado
(basta completar el conjugado e invertir la permutación de las tres líneas).
Necesitamos dos resultados, debidos a Herbert J. Ryser ya Charles C. Lindner,
y que eran conocidos con anterioridad al teorema de Smetaniuk. Si en un
cuadrado latino las primeras r filas aparecen completas y el resto de las celdas
están vacías, hablamos de un rectángulo latino de dimensión (r x n).
Lema 1. Cualquier rectángulo latino de dimensiones (r x n), r < n, puede
extenderse a un rectángulo latino (( r + 1) x n), y por tanto puede completarse
para obtener un cuadrado latino .
• Demostración.. Aplicamos el teorema de Hall (véase capítulo 23). Sea
Aj el conjunto de números que no aparecen en la columna j. Para que una
fila sea admisible como (r + l)-ésima ha de corresponder a un sistema de
representantes distintos para la colección Al, ... , An. Para demostrar el lema,
por tanto, hemos de verificar la condición de Hall (H). Cualquier conjunto Aj
tiene tamaño n - r, y cada elemento está precisamente en n - r conjuntos Aj
(ya que aparece r veces en el rectángulo). Cualesquiera m de los conjuntos Aj
contienen en total m( n - r) elementos, y por tanto al menos m diferentes, lo
cual es precisamente la condición (H). O
Lema 2. Sea P un cuadrado latino parcial de orden n con, a lo sumo, n - 1
casillas rellenas y como máximo ~ elementos distintos. Entonces P puede
completarse para obtener un cuadrado latino de orden n.
Completando cuadrados latinos
• Demostración. En transfonnamos el en otro más
conveniente. Según el principio de congujación que discutimos anteriormente,
podemos reemplazar la condición "a lo sumo ~ elementos distintos" por la
condición de que las entradas aparezcan en, a lo sumo, ~ filas, y suponer in-
cluso que estas filas son las superiores. Por tanto, supongamos que las filas
que tienen sus celdas ocupadas son las celdas 1, 2, ... , r, con fi casillas re-
llenas en la fila i, siendo r ::::: ~ y L~=l fi ::::: n - 1. Pennutando las filas,
podemos asumir que h 2': 12 2': '" 2': fr. A continuación completamos las
filas 1, ... , r paso a paso hasta obtener un rectángulo de dimensiones (r x n),
el cual puede completarse hasta obtener un cuadrado latino por el lema l.
Supongamos ya rellenas las filas 1,2, ... ,f! - 1. En la fila f! hay fe casillas
rellenas quepodemos suponer que son las inferiores. Esta situación se muestra
en la figura del margen, ella que se han sombreado las casillas rellenas.
Se consigue completar la fila f! mediante otra aplicación del teorema de Hall,
aunque esta vez la aplicación es más sutil. Sea X el conjunto de elementos que
no aparecen en la fila f!, por tanto IXI = n-fe. Para j = 1, ... , n - h, sea
Aj el conjunto de aquellos elementos de X que no aparecen en la columna j
(ni por encima ni por debajo de la fila f!). De aquí, para completar la fila f!
debemos verificar la condición (H) para la colección Al, ... , An- fg'
En primer lugar afinnamos que
n-fe-f!+l > f!-1+fH1+···+fr·
El caso f! = 1 es claro. En otro caso, de L~=l fi < n, h >
1 < f! ::::: r se deduce que
r
n > ¿fi 2': (f!-1)fe-1+fe+···+fr'
i=l
(1)
> fr y
Ahora, o bien h-1 2': 2 (en cuyo caso se verifica (1)) o fe-1 = 1. En el último
caso, (1) se reduce a n > 2(f! - 1) + r - f! + 1 = r + f! - 1, lo cual es cierto
porque!! ::::: r ::::: ~.
Tomemos ahora m conjuntos Aj, 1::::: m ::::: n- fe, y sea B su unión. Debemos
demostrar que IBI 2': m. Consideremos el número e de casillas en las m
columnas que corresponden a los Aj que contienen elementos de X. Existen
a lo sumo (f! - l)m celdas de este tipo por encima de la fila f! y a lo sumo
fH1 + ... + fr por debajo. De ahí que
e ::::: (f!-1)m+fH1+"'+fr.
Por otro lado, cada elemento x E X\B aparece en cada una de las m colum-
nas, y de aquí que 2': m(IXI - IBI), y por tanto (con IXI = n - h),
IBI 2': IXI-~c 2': n-h-(f!-1)-~(fH1+.·.+fr)'
Se sigue que IBI 2': m si
n-h-(f!-1)-~(fH1+ ... +fr) > m-1,
esto es, si
m(n-fe-f!+2-m) > fH1+"'+fr. (2)
La desigualdad (2) es cierta para m = 1 Y para m = n - h - f! + 1 por (l).
181
Una situación para n = 8, con f! = 3,
fl = h = h = 2, f4 = 1. Las celdas
más oscuras representan las que apare-
cían rellenas previamente; las más cla-
ras muestran las que han sido rellenadas
en el proceso.
182
2
5
4
"
2 7
•
4 5
4
2 3 4
5 6 1
1 2 3
6 4 5
3 1 6
4 5 2
7
4
5
•
•
5
1 6
4 2
6 5
2 3
5 4
3 1
•
•
5
3
4
1
2
6
Completando cuadrados latinos
Por tanto, la desigualdad es cierta para todo m entre 1 y n-iR - e + 1, ya que
la mitad del primer miembro es una función cuadrática en m con coeficiente
principal -1. El caso que falta es m > n-iR - e + 1. Puesto que cualquier
elemento x de X está contenido en, a lo sumo, e - 1 + JC+l + ... + Jr filas,
también puede aparecer en, a lo sumo, el mismo número de columnas. De
nuevo por (1), deducimos que x está en algún conjunto Aj, de modo que en
este caso B = X, IBI = n-iR .:::: m, y la demostración queda completa. O
Por último, demostraremos el teorema de Smetaniuk.
Teorema. Cualquier cuadrado latino parcial de orden n con a lo sumo n - 1
casillas rellenas puede completarse a un cuadrado latino del mismo orden.
• Demostración. Utilizamos inducción sobre n, siendo trivial el caso de base
n ::; 2. Partimos pues de un cuadrado latino parcial de orden n .:::: 3 con a lo
sumo n - 1 casillas rellenas. Utilizando la notación anterior, estas celdas
están situadas en r ::; n - 1 filas diferentes que numeramos SI, . .. ,Sr> Y que
contienen ah, ... ,ir > O casillas rellenas, donde ¿~=1 Ji ::; n - 1.
Según el lema 2, podemos suponer que existen más de ~ elementos diferen-
tes. Por tanto, existe un elemento que aparece una sola vez; es más, después
de permutar las filas (si es necesario), podemos suponer que el elemento n
aparece una sola vez, y que esto ocurre en la fila SI.
En el paso siguiente queremos permutar las filas y columnas del cuadrado la-
tino parcial de tal manera que, después de llevar a cabo las permutaciones,
todas las casillas rellenas queden por debajo de la diagonal- excepto para la
casilla con n, que acabará en ella. (La diagonal está formada por las casillas
(k, k) con 1 ::; k ::; n.) Veamos cómo se puede conseguir esto. En primer
lugar permutamos la fila SI hasta la posición h. Permutando las columnas
movemos todas las casillas rellenas hacia la izquierda, de manera que n apa-
rezca como el último elemento de su fila sobre la diagonal. A continuación
movemos la fila S2 hasta la posición 1 + h + 12, y las casillas rellenas tantas
posiciones a la izquierda como sea posible.
En general, movemos la fila Si hasta la posición 1 + h + 12 + ... + Ji, para
1 < i ::; r, y las casillas rellenas tantas posiciones a la izquierda como sea
posible. El dibujo de la izquierda muestra un ejemplo, con n = 7: las filas
SI = 2, S2 = 3, S3 = 5 Y S4 = 7 con h = 12 = 2 Y h = J4 = 1 se mueven
hasta las filas numeradas como 2, 5, 6 Y 7, Y las columnas se permutan "hacia
la izquierda" de manera que, al final, todas las entradas excepto la 7 están
situadas por debajo de la diagonal, que se ha señalado mediante "",".
Para poder aplicar inducción, quitamos la entrada n de la diagonal e ignoramos
la primera fila y la última columna (que no tienen ninguna casilla rellena). Por
tanto, estamos frente a un cuadrado latino parcial de orden n - 1 que tiene a
lo sumo n - 2 casillas rellenas, el cual puede completarse por inducción hasta
obtener un cuadrado latino de orden n -1. Una de las muchas posibilidades de
hacerlo en nuestro ejemplo se muestra en la figura del margen. Las entradas
originales se han marcado en negrita. Éstas son ya entradas finales, al igual
que los elementos en casillas sombreadas. Del resto de las entradas, algunas
cambiarán a continuación para poder completar el cuadrado latino de orden n.
En el paso siguiente queremos mover los elementos de la diagonal del cua-
drado hasta la última columna y reemplazarlos por entradas n. Sin embargo,
Completando cuadrados latinos
no hacerlo en ya que los elementos de la no tienen
porqué ser distintos. Por tanto, procedemos con más cuidado y efectuamos,
para k = 2,3, ... ,n - 1 (en este orden), la operación siguiente:
Colocamos el valor n en la casilla (k, n). Esto conduce a un cuadrado latino
parcial correcto. A continuación intercambiamos el valor Xk en la casilla
diagonal (k, k) con el valor n en la casilla (k, n) de la última columna.
Si el valor Xk no aparecía anteriormente en la última columna, entonces nues-
tro trabajo para el valor k ha concluido. Después de hacer esto, los elementos
que aparecen en la columna k-ésima no se cambiarán más.
En nuestro ejemplo, este método funciona sin problemas para k = 2, 3 Y 4, Y
los elementos correspondientes en la diagonal se mueven a la última columna.
Los siguientes diagramas muestran las operaciones correspondientes.
.------- --------- ---
2 3"
r-
4 1 6 5""-C>-7 2 7 4 1 JL 5 3 --- -- -- ---o
5 6 1 4 2 3 5 6 1 4 2 3 7
1 2 3 6 5 4 1 2 3 6 5 4
6 4 5 2 3 1 6 4 5 2 3 1
3 1 6 5 4 2 3 1 6 5 4 2
4 5 2 3 1 6 4 5 2 3 1 6
Ahora hemos de tratar el caso en que ya existe un elemento Xk en la última
columna. En este caso procederemos de la manera siguiente:
Si ya existe un elemento Xk en una casilla (j, n) con 2 :::; j < k, entonces
intercambiamos en la fila j el elemento Xk de la n-ésima columna con el
elemento x~ en la k-ésima columna. Si el elemento x~ también aparece en una
casilla (jI, n), entonces: intercambiamos también en la fila j' los elementos de
la columna n-ésima y k-ésima, y así sucesivamente.
Si continuamos de esta manera no obtendremos nunca dos entradas iguales en
una fila. Nuestro proceso de intercambio asegura que nunca coincidirán dos
elementos iguales en una columna. Por tanto, sólo tenemos que verificar que
el proceso de intercambio entre las columnas k-ésima y n-ésima no lleva a un
bucle infinito. Esto puede verse a partir del siguiente grafo bipartito Gk : Sus
vértices corresponden a las casillas (i, k) y (j, n) con 2 :::; i, j :::; k, cuyos
elementos pueden intercambiarse. Existe una arista entre (i, k) y (j, n) si
estas dos casillas están en la misma fila (esto es, para i = j), o si las casillas
contienen el mismo elemento antes del intercambio (lo cual implicai i= j).
En nuestro esbozo, las aristas para i = j aparecen punteadas, las otras no.
Todos los vértices en G k tienen grado 1 ó 2. La casilla (k, n) corresponde a
un vértice de grado l. Este vértice es el comienzo de un camino que lleva a la
columna k sobre una arista horizontal, luego posiblemente de vuelta otra vez
a la columna n sobre una arista inclinada, luego de vuelta horizontalmente
hasta la columna k y así sucesivamente. El camino acaba en la columna k
en un valor que no aparece en la columna n. Así pues, las operaciones de
intercambio acabarán con un paso en el cual llevamos un elemento nuevo a la
183
2 7 4 1 6 5 3
5 6 7 4 2 3 1 . - .. - .......
1 2 3 6? 5 4 7
6 4 5 2 3 1
3 1 6 5 4 2
4 5 2 3 1 6
k n
x~ Xk J
x" k x~ j'
Xk n k
184
2 7 4 1 3 5 6
5 6 7 4 2 3 1
1 2 3 7 6 4 5
6 4 5 2 7 1 Íl" .. 3 . .j;
3 1 6 5 4 2 7
4 5 2 3 1 6
Completando cuadrados latinos
última columna. Así tennina el con la colmlli1a k, y los elementos de
las celdas (i, k) para i 2: 2 no variarán en adelante.
En nuestro ejemplo, estos intercambios se dan para k = 5: El elemento X5 = 3
ya aparece en la última columna, de modo que esa entrada ha de ser devuelta a
la columna k = 5. Pero el elemento intercambiable x~ = 6 tampoco es nuevo,
así que se intercambia con x~ = 5, Y esté sí es nuevo .
. -------.
2 7 4 1 6 5 3 2 7 4 1 3 5 6
5 6 7 4 2 3 1 5 6 7 4 2 3 1
.- -.
1 2 3 7 5 4 6 1 2 3 7 6 4 5
.-------.
6 4 5 2 3 1 7 6 4 5 2 7 1 3
3 1 6 5 4 2 3 1 6 5 4 2
4 5 2 3 1 6 4 5 2 3 1 6
Por último, el intercambio para k = 6 = n - 1 no es ningún problema, y
después de esto el cuadrado latino se completa de manera única:
7 3 1 6 4 2 4
2 7 4 1 3 5 6 2 7 4 1 3 5 6
5 6 7 4 2 3 1 5 6 7 4 2 3 1
1 2 3 7 6 4 5 1 2 3 7 6 4 5
6 4 5 2 7 1 3 6 4 5 2 7 1 3
3 1 6 5 4 7 2 3 1 6 5 4 7 2
4 5 2 3 1 6 4 5 2 3 1 6 7
... y lo mismo ocurre en general: Colocamos un elemento n en la celda (n, n),
y después de hacerlo la primera fila puede completarse con los elementos que
faltan de las respectivas columnas (ver lema 1), terminándose así la demostra-
ción. Para completar de manera explícita el cuadrado latino parcial original de
orden n, únicamente hemos de invertir las permutaciones de elementos, filas
y columnas en los primeros dos pasos de la demostración. O
[1] T. EVANS: Embedding incomplete Latin squares, Amer. Math. Monthly 67
(1960),958-961.
[2] C. C. LINDNER: On completing Latin rectangles, Canadian Math. Bulletin 13
(1970),65-68.
[3] H. J. RYSER: A combinatorial theorem with an application to Latin rectangles,
Proc. Amer. Math. Soco 2 (1951), 550-552.
[4] B. SMETANIUK: A new construction on Latín squares 1: A proof of the Evans
conjecture, Ars Combinatoria 11 (1981), 155-172.
El problema de los cuatro colores dio un impulso decisivo para que la teoría
de grafos se desarrollara tal y como la conocemos hoy en día. En general, los
problemas de coloreado están todavía entre los más interesantes para quienes
se dedican a la teoría de grafos. Uno de estos problemas, sencillo en aparencia,
fue planteado por Jeff Dinitz en 1978, y sin embargo se resistió a todos los
intentos de demostración hasta que quince años después Fred Galvin dio con
una solución sorprendentemente sencilla.
Se consideran n2 celdas ordenadas en un cuadrado (n x n), y se es-
cribe (í, j) para la celda en lafila i y columna j. Supóngase que cada
celda (í,j) tiene asignado un conjunto C(í,j) de n colores.
siempre posible colorear la matriz completa eligiendo para cada
celda (i, j) un color del conjunto C( i, j), de manera que los colores
que aparecen en cada fila y columna sean distintos?
Para comenzar, consideremos el caso en el que todos los conjuntos de colores
C( i, j) son iguales, por ejemplo {l, 2, ... ,n}. Entonces el problema de Dinitz
se reduce a rellenar el cuadrado (n x n) con los números 1, 2, ... , n de manera
que en cada fila y columna no haya dos números iguales. En otras palabras,
cualquier coloración corresponde a un cuadrado latino, tal y como se discutió
en el capítulo anterior. Así pues, en este caso la respuesta al problema es "sí".
Este caso era sencillo, de manera que vayamos al caso general, en el cual el
conjunto C := Ui,j C(i, j) contiene más de n colores. La dificultad ahora de-
riva del hecho de que no todos los colores de C son válidos para cada celda.
Por ejemplo, mientras que en el caso del cuadrado latino podemos elegir ar-
bitrariamente una permutación de colores para la primera fila, esto ya no es
posible en el caso general. El caso de n = 2 ya ilustra esta dificultad.
Supongamos dados los conjuntos de colores que se indican en la figura. Si
elegimos los colores 1 y 2 para la primera fila, ya tenemos un problema, puesto
que tendríamos que elegir el color 3 para ambas celdas en la segunda fila.
Antes de abordar el problema de Dinitz, traduzcamos la situación al lenguaje
de la teoría de grafos. Como es habitual, consideramos grafos G = (V, E)
sin bucles ni aristas múltiples. Sea x( G) el número cromático del grafo, esto
es, el menor número de colores que pueden asignarse a sus vértices de manera
que vértices adyacentes reciban colores distintos.
En otras palabras, colorear el grafo requiere una partición de V en clases (colo-
readas con el mismo color) de manera que no haya aristas entre vértices de una
clase. Si llamamos independiente a un conjunto A <;;; V en una partición de
este tipo, vemos que el número cromático es el menor número de conjuntos
independientes que da lugar a una partición del conjunto de vértices V.
{l, 2} {2, 3}
{l, 3} {2, 3}
J
1
C(i,j)
~
+--
186
El grafo S3
{1,3}
{1,2}
{1,4}
{3,4}
{2,3}
{2,4}
El problema de Dinitz
En 1976 Y tres años más tarde y estudiaron
la siguiente variante, que nos conduce directamente al problema de Dinitz:
Supóngase que en el grafo G = (V, E) tenemos asignado un conjunto C (v)
de colores para cada vértice v. Una coloración por listas es una coloración
e : V --+ UvEV C( v) donde c( v) E C( v) para cada v E V. La definición
del número cromático por listas Xi! (G) debería estar ahora clara: es el menor
número k de modo que para cualquier lista de conjuntos de colores C (v) con
IC(v)1 = k para todo v E existe siempre una coloración por listas. Por
supuesto, Xi! (G) :::: IVI (nunca se nos acaban los colores). Ya que cualquier
coloración ordinmia es el caso especial de una coloración por listas cuando
todos los conjuntos C (v) son iguales, obtenemos pm-a cualquier grafo G
X(G) :::: Xi!(G).
Volviendo al problema de Dinitz, considérese el grafo Sn, que tiene como
conjunto de vértices las n 2 celdas de nuestra matriz (n x n), y dos celdas son
adyacentes si y sólo si están en la misma fila o columna.
Puesto que cualesquiera n celdas en una fila son adyacentes dos a dos, son
necesarios al menos n colores. Más aún, cualquier coloración con n colores
corresponde a un cuadrado latino en el que las celdas ocupadas por un mismo
número de colores dan lugar a una clase de color. Como los cuadrados lati-
nos, tal y como hemos visto, existen, podemos inferir que X(Sn) = n, y el
problema de Dinitz puede enunciarse de manera sucinta así:
¿Xi!(Sn) = n?
Uno podría pensar que tal vez se verifica X( G) = Xi! (G) para cualquier grafo,
pero nada más lejos de la verdad. Considérese el grafo G = K 2,4. Su número
cromático es 2, ya que podemos usar un color para los dos vértices de la iz-
quierda y un segundo color para los vértices de la derecha. Pero supongamos
que nos dan los conjuntos de colores indicados en la figura.
Para colorear los vértices de la izquierda tenemos las cuatro posibilidades 113,
114, 213 Y 214, pero cualquiera de estos pares aparece como un conjunto de
colores en la parte de la derecha, de modo que no es posible una coloración con
lista. De aquí que Xc (G) ~ 3, Y el lector puede encontrar divertido comprobar
que Xc (G) = 3 - ¡no hay necesidad de probar todas las combinaciones!
Generalizando este ejemplo,no es difícil encontrar grafos G en los cuales
X( G) = 2, pero Xc (G) es arbitrariamente grande. Así pues, el problema de la
coloración por listas no es tan fácil como parece a primera vista_
Volvamos al problema de Dinitz_ Un paso importante hacia la solución fue
dado por Jeanette Janssen en 1992, cuando demostró que Xc (Sn) :::: n + 1, Y
Fred Galvin dio el golpe de gracia combinando ingeniosamente dos resultados
que ya se conocían desde hacía mucho. Discutiremos a continuación ambos
resultados y veremos que implican la igualdad Xc (Sn) = n.
Nos hace falta un poco de notación. Si v es un vértice del grafo G, entonces
denotamos por d ( v) el grado de v. En nuestro grafo cuadrado Sn cada vértice
tiene grado 2n - 2, ya que hay otros n - 1 vértices en la misma fila y en la
misma columna.
Para un subconjunto A c:;: V denotamos por G A el sub grafo que tiene a A
como conjunto de vértices y que contiene todas las aristas de G entre los vér-
El problema de Dinitz 187
tices de A. Llamamos a G A el inducido por y decimos que H es
un subgrafo inducido de G si H = G A para algún A.
Nuestro primer resultado trata de grafos dirigidos e = (V, E), es decir, grafos
en los que cada arista e tiene una orientacion. La notación e = (u, v) signi-
fica que existe un arco e, denotado también u --+ v, cuyos vértices inicial y
final son, respectivamente, u y v. Tiene sentido por tanto hablar del grado
de salida d+ ( v) y grado de entrada d~ ( v ), donde d+ ( v) cuenta el número
de aristas con v como vértice inicial, y análogamente para d~ (v); aún más,
d+(v) + d~(v) = d(v). Cuando escribimos G, nos referimos al grafo e sin
las orientationes.
El siguiente concepto surgió del análisis de juegos y tendrá un papel clave en
la discusión que nos ocupa.
Definición 1. Sea e = (V, E) un grafo dirigido. Un núcleo K C;;; V es un
subconjunto de los vértices tal que
(i) K es independiente en G, y
(ii) para cada u ti- K existe un vértice v E K con una arista u --+ v.
Observemos el ejemplo de la figura. El conjunto {b, e, f} constituye un nú-
cleo, pero el sub grafo inducido por {a, e, e} no tiene ningún núcleo, ya que
las tres aristas constituyen un cíclo entre los vértices.
Ahora ya estamos listos para enunciar el primer resultado.
Lema 1. Sea e = (V, E) un grafo dirigido, y supongamos que para cada
vértice v E V tenemos un conjunto de colores e (v) con más elementos que
su grado de salida, le (v) I 2:: d+ (v) + 1. Si cada subgrafo inducido de e
tiene un núcleo, entonces existe una coloración por listas de G con un color
de e(v) para cada v.
11 Demostración. Procederemos por inducción sobre IVI. Si IVI = 1 no hay
nada que probar. Elegimos un color c E e = UvEV e(v) y un conjunto
A(c) := {v E V: e E e(v)}.
Por hipótesis, el sub grafo inducido G A( e) tiene un núcleo K (e). Ahora colo-
reamos todos los v E K (e) con el color e (esto es posible, ya que K (c) es
independiente), y eliminamos K(c) de G y e de e. Sea G I el de G subgrafo
inducido por V\K (e) con el (v) = e (v) \ e como la nueva lista de colores.
Nótese que para cada v E A(e)\K(e), el grado exterior d+(v) se reduce al
menos en 1 (por la condición (ii) de ser núcleo). Así que d+ (v) + 1 :::; I el (v) I
se verifica aún en el. La misma condición también se verifica para los vértices
que no pertenecen a A (e), ya que en este caso el conjunto de colores e ( v) no
varía. El nuevo grafo GI contiene menos vértices que G, y el resultado se
obtiene por inducción. O
El método para resolver el problema de Dinitz resulta ahora obvio: Hemos de
encontrar una orientación del grafo Sn con grados exteriores d+ ( v) :::; n - 1
para todo v y que asegure la existencia de un núcleo para todos los sub grafos
inducidos. Esto se logra mediante nuestro segundo resultado.
a
f
d
188
x y
Un grafo bipartito G = (X U Y, E) con
un emparejamiento.
Las aristas en negrita constituyen un
emparejamiento estable. En cada lista
de prioridades, la elección que conduce
a un emparejamiento estable está im-
presa en negrita.
El problema de
De nuevo necesitamos algunos Recuérdese 9) que
un grafo bipartito G = (X U Y, E) es un grafo con la siguiente propiedad:
El conjunto de vértices V se puede dividir en dos partes, X e Y, tales que
cada arista tiene un extremo en X y el otro en Y. En otras palabras, los grafos
bipartitos son precisamente los que pueden colorearse con dos colores (uno
para X y otro para Y).
Ahora veamos otro concepto importante, el de los "emparejamientos esta-
bles", que tiene una sencilla interpretación. Un emparejamiento M en un
grafo bipartito G = (X U Y, E) es un conjunto de aristas que no contiene dos
aristas con extremos comunes. En el grafo del dibujo las aristas en negrita
forman un emparejamiento.
Supongamos que X es un conjunto de hombres e Y un conjunto de mujeres, e
interpretemos uv E E como la posibilidad de que u y v se casen. Un empare-
jamiento sería entonces una boda multitudinaria en la que ninguna persona es
bígama. Para nuestro propósito, necesitamos una versión más refinada (¿y más
realista?) de los emparejamientos, que sugirieron David Gale y Lloyd S. Sha-
pley. Es evidente que en la vida real cada persona tiene sus preferencias, y
esto es lo que hemos de tener en cuenta. En G = (X U Y, E) suponemos que
para cada v E X U Y existe una valoración del conjunto N ( v) de vértices ad-
yacentes a v, N ( v) = {Zl > Z2 > ... > Zd( v)}. Así, Zl es la mejor elección
para v, después Z2, Y así sucesivamente.
Definición 2. Un emparejamiento M de G = (X U Y, E) se llama estable si
se verifica la siguiente condición: Siempre que uv E E\M, u E X, v E Y
entonces, o bien, uy E M con y> ven N(u), o bien xv E M con x> u en
N ( v), o se verifican ambas.
En nuestra interpretación, un conjunto de matrimonios es estable si nunca su-
cede que u y v no están casados pero u preferiría tener como pareja a v antes
que a la suya propia (si es que tiene) y v preferiría a u en lugar de la suya (si
es que tiene), lo cual crearía evidentemente una situción de inestabilidad.
Antes de probar nuestro segundo resultado, observemos el ejemplo siguiente:
{A >C} a A {e> d> a}
{C >D > B} b B {b}
{A >D} e C {a> b}
{A} d D {e> b}
En este ejemplo existe un único emparejamiento máximo M con cuatro aris-
tas, M = {aC, bB, eD, dA}, pero M no es estable (considérese eA).
Lema 2. Siempre existe un emparejamiento estable .
• Demostración. Consideremos el siguiente algoritmo. En el primer paso,
todos los hombres u E X se declaran a su primera elección. Si una mujer
recibe más de una proposición, elige a quien más le gusta y apunta su nombre,
y si recibe una única, apunta el nombre de aquél pretendiente. El resto de
los hombres son rechazados y pasan a formar parte de la reserva R. En el
El problema de Dinitz
paso, todos los hombres hacen su Las
comparan las proposiciones (junto con la que ya tienen apuntada, si es que
tienen alguna), eligen a su favorito y se lo apuntan. El resto son rechazados
y forman el nuevo conjunto R. Ahora, los hombres de R se declaran a su
siguiente elección, y así sucesivamente. Un hombre que se haya declarado a
su última elección y sea rechazado deja de ser tenido en cuenta (incluso deja
de fo.~mar parte de la reserva). Es evidente que en algún momento la reserva R
queda vacía, y en este momento se detiene el algoritmo.
¡mma!cum. Cuando el algoritmo se detiene, los hombres apuntados,
junto con las mujeres correspondientes, forman un emparejamiento
estable.
Nótese en primer lugar que el orden en el cual una mujer concreta apunta a
sus hombres está de acuerdo con sus preferencias, ya que en cada paso ella
compara al nuevo pretendiente con su pareja actual y elige a su favorito. Por
ello, si uv E E pero uv ti- M, entonces o bien u nunca se declara a v, (en
cuyo caso él encontró una pareja mejor antes de cortejar a v, lo cual implica
uy E M con y > ven N(u)), o u se declaró a v pero fue rechazado (lo cual
implica xv E M con x > u en N (v)). Pero