El_Libro_de_las_Demostraciones_Martin_Aigne_Günter_M_Ziegler

UCE

Estudiante l
em 09/04/2025
Conteúdos escolhidos para você

125 pág.
Iniciación al Estudio del Álgebra Carmen Sessa - Ronnie Tiburon

232 pág.
La matemática del siglo XX - Piergiorgio Odifreddi

UTC
151 pág.
12 Introduccion al algebra - Lewin, Renato(Author)

481 pág.
Cálculo I - Oncina

31 pág.
LG_3_17

UNC
Perguntas dessa disciplina

3) A interpolação polinomial é utilizada quando se deseja aproximar uma função a partir de valores tabelados, como dados experimentais em laboratórios

UNOPAR
O ensino de frações nos anos iniciais do Ensino Fundamental é essencial para o desenvolvimento do pensamento matemático das crianças. Nesse período, o

UNICESUMAR
No avançar dos anos, os estudantes têm de romper com várias formas de pensar para seguir aprendendo Matemática. Eles devem entender, por exemplo, que,

Anhanguera
Conforme explica Freund e Simon (2000), é possível expressar uma relação entre grandezas conhecidas, ou dados observados, a partir de uma equação m...

FMU
Pergunta 1. A multiplicação de matrizes é fundamental em diversas áreas de conhecimento, pois permite a manipulação de dados complexos de forma eficie

UNISA
Material
Conteúdos escolhidos para você

125 pág.
Iniciación al Estudio del Álgebra Carmen Sessa - Ronnie Tiburon

232 pág.
La matemática del siglo XX - Piergiorgio Odifreddi

UTC
151 pág.
12 Introduccion al algebra - Lewin, Renato(Author)

481 pág.
Cálculo I - Oncina

31 pág.
LG_3_17

UNC
Perguntas dessa disciplina

3) A interpolação polinomial é utilizada quando se deseja aproximar uma função a partir de valores tabelados, como dados experimentais em laboratórios

UNOPAR
O ensino de frações nos anos iniciais do Ensino Fundamental é essencial para o desenvolvimento do pensamento matemático das crianças. Nesse período, o

UNICESUMAR
No avançar dos anos, os estudantes têm de romper com várias formas de pensar para seguir aprendendo Matemática. Eles devem entender, por exemplo, que,

Anhanguera
Conforme explica Freund e Simon (2000), é possível expressar uma relação entre grandezas conhecidas, ou dados observados, a partir de uma equação m...

FMU
Pergunta 1. A multiplicação de matrizes é fundamental em diversas áreas de conhecimento, pois permite a manipulação de dados complexos de forma eficie

UNISA
Prévia do material em texto
1111111111111111111111 1111111111111 ! 
BIBLIOTECA CENTRAL ! 
------ ---,,-
11-
tercera edición inglesa de 
Julian 
Pedro 
Figueiras 
Ramos 
L B R o S 
EDICIONES 
Traslation from the English language edition: 
Proofs /rom THE BOOK by Martin Aigner, Günter M. Ziegler 
Copyright © Springer-Verlag Berlin Heidelberg 1998,2001,2004 
Springer is a part of Springer Science+Business Media 
All Rights Reserved 
1 a edición en castellano: junio de 2005 
Imagen de cubierta: Detalle de paramento de La Alhambra (Archivo NIVOLA). 
© Martín Aigner, Günter M. Ziegler, 2005 
© NIVOLA libros y ediciones, S.L. 
Apartado de Correos 113. 28760 Tres Cantos 
Te\.: 918045817. Fax: 9180493 17 
www.nivola.com 
correo electrónico: contacto@nivola.com 
ISBN: 84-95599-95-3 
Depósito legal: M-25.892-2005 
Impreso en España 
Sin la autorización escrita de los titulares del copyright, queda rigurosamente 
prohibida la reproducción parcial o total de esta obra por cualquier medio 
o procedimiento, comprendidos la reprografía y el tratamiento informático. 
De acuerdo con la acertada afirmación de G. H. Hardy que reza que no hay 
lugar permanente para las matemáticas feas, a Paul Erd6s le gustaba hablar 
de El Libro, en el que Dios recopila demostraciones perfectas de los teoremas 
matemáticos. Erd6s también decía que, si eres matemático, no es necesario 
que seas creyente, pero sí que creas en El Libro. Hace unos años le sugerimos 
escribir una primera y modesta versión de El Libro. Estaba encantado con la 
idea y empezó a trabajar inmediatamente con su entusiasmo habitual, llenando 
páginas y páginas de sugerencias. Estaba previsto que este libro se publicara 
en marzo de 1998, como regalo en el día que Erdos cumpliese ochenta y cinco 
años. Su desafortunada muerte en el verano de 1996 ha hecho que dediquemos 
este libro a su memoria, en lugar de que él mismo aparezca como autor. 
No tenemos una definición que caracterice las demostraciones de El Libro: 
todo lo que ofrecemos es una colección de ejemplos, que hemos seleccio-
nado con la esperanza de que nuestros lectores puedan compartir nuestro en-
tusiasmo cuando nos encontramos ante ideas brillantes, maneras geniales de 
acercarse a un problema, o bonitas y precisas observaciones. También es-
peramos que los lectores puedan disfrutar a pesar de las imperfecciones que 
pudiera tener nuestra exposición. La selección de los temas está muy influida 
por Paul Erdos: una buena parte de ellos fueron sugeridos por él mismo, y 
además de las demostraciones que llevan su firma, muchas otras fueron ini-
ciadas gracias a su suprema cualidad para formular la pregunta precisa o dar 
con la conjetura adecuada. De modo que, en gran parte, este libro refleja el 
punto de vista de Paul Erdos respecto a lo que debería ser una demostración 
de El Libro. 
Uno de los factores que nos han limitado en la selección de los contenidos 
ha sido que todas las demostraciones que se incluyen en este libro deberían 
resultar accesibles para cualquier lector con un dominio modesto de técni-
cas y conceptos matemáticos. Un poco de álgebra lineal, análisis y teoría de 
números y un buen puñado de conceptos elementales de matemática discreta 
deberían ser suficientes para comprender y disfrutar la lectura. 
Hacemos público nuestro agradecimiento más profundo a muchas personas 
que nos han ayudado y brindado su apoyo en este proyecto, y entre ellas a 
los estudiantes de un seminario en el que discutimos una versión peliminar, a 
Benno Artmann, Stephan Brandt, Stefan Felsner, Eli Goodman, Torsten Held-
mann, y Hans Mielke. Agradecemos también a Margrit Barrett, Christian 
Bressler, Ewgenij Gawrilow, Michael Joswig, Elke Pose, y Jbrg Rambau por 
su ayuda técnica en la composición del libro, a Tom Trotter que leyó el original 
desde la primera a la última página, a Karl H. Hofmann por sus maravillosos 
dibujos y, sobre todo, a Paul Erdos. 
Berlín, marzo de 1998 Martin Aigner . Günter M. Ziegler 
Paul Erdos 
El Libro 
La primera edición de este libro tuvo una estupenda acogida y recibimos un 
número inusual de cartas que contenían comentarios, correcciones, pasos más 
abreviados en algunas ocasiones, demostráciones alternativas y nuevos temas 
para considerar. (Aunque intentamos recoger demostraciones peifectas, nues-
tra exposición no lo es.) 
Esta segunda edición nos brinda la oportunidad de presentar una nueva ver-
sión: hemos incluido tres capítulos adicionales, revisiones sustanciales y nue-
vas demostraciones, además de algunas mejoras y enmiendas menores, mu-
chas de ellas basadas en las sugerencias que hemos recibido. Hemos supri-
mido también uno de los capítulos antiguos, "sobre el problema de las trece 
esferas," cuya demostración necesitaba introducir algunos arreglos que no po-
dían ser completados de forma que resultara una demostración breve y ele-
gante. 
Gracias a todos los lectores que nos escribieron y nos ayudaron, entre ellos, 
Stephan Brandt, Christian Elsholtz, Jürgen Elstrodt, Daniel Grieser, Roger 
Heath-Brown, Lee L. Keener, Christian Lebceuf, Hanfried Lenz, Nicolas Puech, 
John Scholes, Bernulf WeiBbach, y muchos otros. Gracias de nuevo por su 
ayuda y apoyo a Ruth Allewelt y Karl-Friedrich Koch de la editorial Springer 
en Heidelberg, a Christoph Eyrich y Torsten Heldmann en Berlín, y a Karl H. 
Hofmann por los nuevos e igualmente estupendos dibujos. 
Berlín, septiembre de 2000 Martin Aigner . Günter M. Ziegler 
Nunca hubiéramos soñado con el éxito que ha alcanzado este libro mientras 
preparábamos su primera edición en 1.998. Ha sido traducido a una gran can-
tidad de idiomas y contamos con las respuestas entusiasmadas de muchos lec-
tores que han aportado sugerencias interesantes para su mejora, adendas y 
nuevos temas, que nos podrían mantener ocupados aún unos cuantos años. 
En esta tercera edición aparecen dos nuevos capítulos, el primero acerca de las 
identidades de Euler para particiones y el segundo sobre diferentes estrategias 
de barajar un mazo de naipes. Hemos incluido a lo largo del libro algunas 
mejoras, como el método de Calkin, Wilf y N ewman en la enumeración de los 
racionales, y en un capítulo independiente tres demostraciones de las series de 
Euler. Por ahora, eso es todo. 
Expresamos nuestro agradecimiento a quienes han apoyado este proyecto en 
los últimos cinco años y cuya implicación ha marcado la diferencia en esta 
nueva edición. Gracias a David Bevan, Anders Bjorner, Dietrich Braess, 
John Cosgrave, Hubert Kalf, Günter Pickert, Alistair Sinclair, y Herb Wilf. 
Berlín, julio de 2003 Martin Aigner . Günter M. Ziegler 
____________________________ 1 
1. Seis demostraciones de la infinidad de números primos .............. 3 
2. El postulado de Bertrand .......................................... 7 
3. Los coeficientes binomiales casi nunca son potencias ............... 13 
4. Representación de enteros como suma de dos cuadrados ............ 17 
5. Cualquier anillo de división finito es un cuerpo ..................... 23 
6. Algunos números irracionales .................................... 27 
7. Tres veces 1f2/6 ................................................ 35 
8. El tercer problema de Hilbert: descomposición de poliedros ......... 45 
9. Rectas en el plano y descomposición de grafos ..................... 53 
10. El problema de la pendiente ...................................... 59 
11. Tres aplicaciones de la fórmula de Euler ........................... 65 
12. El teorema de rigidez de Cauchy ................................. 71 
13. Símplices en contacto ........................................... 75 
14. Cualquier conjunto con muchos puntos tiene un ángulo obtuso ...... 79 
15. La conjetura de Borsuk .......................................... 85 
16. Conjuntos, funciones y la hipótesis del continuo ................... 93 
17. Aquellas maravillosas desigualdades ............................. 109 
18. Un teorema de Pólya sobre polinomios ........................... 117 
19. Sobre un lemade Littlewood y Offord ........................... 123 
20. La cotangente y el truco de Herglotz ............................. 127 
21. La aguja de Buffon ............................................ 133 
~ ___________________________ 1 
22. El principio del palomar y el doble recuento ...................... 139 
23. Tres teoremas famosos sobre conjuntos finitos .................... 151 
24. Barajando el mazo ............................................. 157 
25. Caminos, retículas y determinantes .............................. 167 
26. La fórmula de Cayley para el número de árboles .................. 173 
27. Completando cuadrados latinos ................................. 179 
28. El problema de Dinitz .......................................... 185 
29. Identidades y biyecciones ....................................... 191 
_____________________________ 1 
30. Cinco-coloración de grafos planos ............................... 199 
31. Cómo vigilar un museo ......................................... 203 
32. El teorema de Turán ............................................ 207 
33. Comunicar sin errores .......................................... 213 
34. Sobre amigos y políticos ....................................... 223 
35. La probabilidad nos 10 pone fácil (a veces) ....................... 227 
Sobre 
índice temático _______________________ _ 
1 
Seis demostraciones de la 
infinidad de números primos 3 
2 
El postulado de Bertrand 7 
3 
Los coeficientes binomiales 
casi nunca son potencias 13 
4 
Representación de enteros 
como suma de dos cuadrados 17 
5 
Cualquier anillo de división finito 
es un cuerpo 23 
6 
Algunos números irracionales 27 
7 
Tres veces Jr2/6 35 
"La irracionalidad y Jr" 
Es natural que comencemos estas páginas con la que probablemente es la más 
antigua de las demostraciones de El Libro, que se atribuye a Euclides (Ele-
mentos 20). Demuestra que la sucesión de números primos es infinita . 
• La demostración de Euclides. Para cualquier conjunto finito {PI, ... ,Pr } 
de números primos, consideramos el número n = PIP2 ... Pr + l. Este n tiene 
un divisor primo p. Pero P no es uno de los Pi; de otro modo, P sería un divisor 
de n y del producto PIP2 ... Pr, Y en consecuencia también de la diferencia 
n - PIP2 ... Pr = 1, lo cual es imposible. Por lo tanto, un conjunto finito 
{PI, ... ,Pr } no puede recoger todos los números primos. D 
Antes de continuar, acordaremos qué notación utilizaremos en adelante: para 
el conjunto de los numero s naturales escribiremos N = {1, 2, 3, ... }, para el 
de los números enteros Z = { ... , -2, -1, O, 1, 2, ... }, y lP' = {2, 3, 5, 7, ... } 
denotará el conjunto de los números primos. 
A continuación exponemos algunas otras demostraciones (de las muchas que 
existen) y que esperamos que agraden a los lectores tanto como a nosotros. 
Aunque utilizan diferentes puntos de vista, la siguiente idea es común a todas 
ellas: los números naturales crecen más alla de todo límite, y todo número 
natural n :::: 2 tiene un divisor primo. Estos dos hechos tomados conjunta-
mente obligan a que el conjunto lP' sea infinito. La siguiente demostración es 
de Christian Goldbach (en una carta a Leonhard Euler en 1730); la tercera es 
anónima y muy popular; la cuarta es del mismo Euler; la quinta fue propuesta 
por Harry Fürstenberg y la última es de Paul Erdos . 
• Segunda demostración. Fijémonos en primer lugar en los números de 
Fermat Fn = 22n + 1 para n = 0,1,2, .... Demostraremos que cualesquiera 
dos números de Fermat son primos entre sí; de aquí se deduce que debe haber 
infinitos números primos. Para ello, comprobaremos que se verifica 
n-I 
(n:::: 1), 
k=ü 
a partir de lo cual nuestra afirmación se demuestra de manera inmediata. En 
efecto, si m es un divisOf, digamos de Fk Y Fn (k < n), entonces m es divisor 
de 2, y deducimos que m = 1 ó m = 2. Pero la opción m = 2 es imposible 
ya que todos los números de Fermat son impares. 
1 
Fo 3 
F I 5 
F2 17 
F3 257 
F4 65537 
Fs 641 . 6700417 
Los primeros números de Fermat 
1 
4 
Teorema de 
Si G es un grupo multiplicativo 
finito y U un subgnlpo, entonces I UI 
divide a IGI. 
• Demostración. Consideramos la 
relación binaria 
a ~ b: {==} ba- 1 E U. 
A partir de los axiomas de grupo se 
sigue que ~ es una relación de equi-
valencia. La clase de equivalencia 
que contiene a un elemento a es pre~ 
cisamente la clase 
Ua={xa:xEU}. 
Puesto que I U al IUI, encon-
tramos que G se descompone en 
clases de equivalencia, todas de 
tamaño IUI, de donde deducimos 
que IUI divide a IGI. O 
En el caso esencial en el que 
U sea un subgrupo cíclico 
{a,a2 , .•. ,a"'}, resulta que 
m (el más pequeño de los enteros 
positivos tales qne am = 1, llamado 
el orden de a) divide al cardinallGI 
del grupo. 
1 2 n n+l 
Escalera superior para f ( t) = t 
Seis demostraciones de la infinidad de números primos 
Probamos la recursión por inducción sobre n. Para n = 1 tenemos Fo = 3 Y 
Fl - 2 = 3. Por inducción concluimos 
n n-l 
Fk = ( Fk )Fn = (Fn - 2)Fn 
k=O k=O 
= (2 2n _1)(22n + 1) = 22n+l - 1 = Fn+1 - 2. O 
• Tercera demostración. Supongamos que lP' es finito y P es el mayor de to-
dos los números primos. Consideraremos los llamados números de Mersenne 
2P - 1 Y demostraremos que cualquier factor primo q de 2P - 1 es mayor 
que p, lo cual nos conducirá a la conclusión deseada. Sea q un divisor primo 
de 2P - 1, por lo tanto tenemos 2P == 1 (mod q). 
Puesto que p es primo, el elemento 2 tiene orden p en el grupo multiplicativo 
Zq \ {O} del cuerpo Zq. Este grupo tiene q - 1 elementos. Por el teorema de 
Lagrange (ver el margen), sabemos que el orden de cualquier elemento.divide 
al cardinal del grupo, esto es, p I q - 1, Y de aquí que p < q. O 
La demostración que presentamos a continuación utiliza cálculo elemental. 
• Cuarta demostración. Sea 7r(x) := #{p ~ x : p E lP'} el cardinal 
del conjunto de números primos que son menores o iguales que el número 
real x. Enumeramos los primos lP' = {Pl,P2,P3, ... } en orden creciente. 
Consideramos el logaritmo neperiano log x, definido como log x = J; tdt. 
Comparando el área bajo la gráfica de f(t) = t con una función escalera 
superior (véase también el apéndice en la página 10 para más información 
sobre este método), concluimos que para n ~ x < n + 1 se tiene que 
logx 
1 1 1 1 
< 1+-+-+ ... +--+-
2 3 n-l n 
< ¿ ~, donde la suma se extiende sobre todos los m E N 
m que sólo tienen divisores primos p ~ x. 
Puesto que cualquiera de estos m puede escribirse de manera única como 
producto de la forma n pkp , deducimos que esta última suma es 
p~X 
rr (¿--\:). 
pElP' k;:O:O P 
p~X 
La suma en el interior del paréntesis es una serie geométrica de razón ~, con 
lo cual sabemos que 
logx < 
Ahora es claro que Pk 2: k + 1, Y en consecuencia 
1f(X) 
Pk 
Pk -1 
k=l 
Pk 1 1 k + 1 
--=1+--<1+-= k 
~-1 ~-1 - k 
Seis demostraciones de la infinidad de números primos 5 
----------------------------------------------------
por tanto 
lr(X) k + 1 
logx < -k- = 1f(x) + l. 
k=l 
De todos es sabido que log x no está acotado, y por tanto concluimos que 1f(.T) 
tampoco está acotado, así que existe un número infinito de primos. O 
• demostración. Después del análisis ... ¡le toca el turno a la topo-
logía! Consideramos una curiosa topología en el conjunto Z de los números 
enteros. Para a, b E Z, b > O, sea 
Na,b = {a + nb : n E Z}. 
Cada conjunto Na,b es una progresión aritmética infinita en los dos sentidos. 
Un conjunto O <;;; Z es abierto si, o bien O es vacío, o si para todo a E O 
existe algún b > O tal que Na,b <;;; O. Es evidente que la unión de abiertos 
es un abierto. Si 0 1 , O2 son abiertos, y a E 0 1 n O2 con Na,b 1 <;;; 0 1 Y 
N a,b2 <;;; O2 , entonces a E N a,b1 b2 <;;; 0 1 n O2 . Por tanto, podemos concluir 
que la intersección finita de abiertos es abierto. Así, esta familia de conjuntos 
abiertos induce una topología en Z. 
Nótese que se verifican las afirmaciones siguientes: 
(A) Cualquier conjunto abiertono vacío es infinito. 
(B) Cualquier conjunto Na,b también es cerrado. 
Efectivamente, la primera afirmación se sigue inmediatamente de la defini-
ción. Para la segunda, observamos que 
b-1 
Na,b = .z \ U Na+i,b, 
i=l 
lo cual prueba que Na,b es el complementario de un conjunto abierto, y por 
tanto es cerrado. 
Hasta ahora, los números primos todavía no han entrado en escena -- pero 
ya llegan. Puesto que cualquier número n distinto de 1 y -1 tiene un divisor 
primo p, y por lo tanto está contenido en No,p, concluimos que 
.z \ {1, -1} = U No,p' 
pElP' 
Ahora, si lP' fuera finito, entonces UpElP' No,p sería unión finita de cerrados 
(por (B)), y por lo tanto, cerrado. En consecuencia, {1, -1} debería ser un 
conjunto abierto, lo que contradice (A). O 
• Sexta demostración. Nuestra última demostración va considerablemente 
más allá de la existencia de infinitos números primos, ya que además demues-
tra que la serie ¿PElP' i diverge. La primera demostración de este importante 
resultado fue dada por Euler (y es interesante en sí misma), pero la que pre-
sentamos aquí, elaborada por Erd6s, tiene un atractivo especial. 
"Hacer la rana, hasta el infinito" 
8 
n 
Teorema 
El número n! contiene el factor 
primo p exactamente 
veces. 
Demostración. Exactamente 
de los factores de 
p 
n! 1 . 2 . 3 ..... n son 
divisibles entre p, de dond.e se 
obtienen l ~ J p-factores. Además 
l ;Z J de los factores de n! son 
incluso divisibles entre p2, lo que 
aumenta nuestro contador en [.I!:.-J _p2 
factores primos p de ni, etc. O 
El postulado de Bertrand 
A continuación probamos que 
p :::; 4x~1 para todo x 2: 2 real, (1) 
donde nuestra notación - aquí y en lo que sigue - quiere decir que el pro-
ducto se toma sobre todos los primos p ~ x. Demostraremos este hecho por 
inducción sobre el número de estos primos. No está tomada del trabajo origi-
nal de Erd6s, pero también se debe a él (véanse sus apuntes en el margen), y 
es realmente una demostración tomada de El Libro. En primer lugar, nótese 
que si q es el mayor número primo con q :::; x, entonces 
p = p Y 4q - 1 :::; 4x - 1 . 
p<:;x p<:;q 
Por tanto, es suficiente comprobar (1) para el caso en el que x = q es primo. 
Para q = 2 obtenemos "2 :::; 4," de modo que procedemos a considerar primos 
impares q = 2m+ 1. (Aquí podemos suponer, por inducción, que (1) es válido 
para todos los enteros x en el conjunto {2, 3, ... , 2m}.) Para q = 2m + 1 
desarrollamos el producto y calculamos 
p = p' P :::; 4m Cmm+1) :::; 4m 22m = 42m. 
p<2m+l p::;m+l m+l<p<:;2m+l 
Es fácil verificar paso a paso esa cadena de desigualdades. De hecho, 
se verifica por inducción. La inecuación 
rr P < 
m+l<p<:;2m+l 
es cierta porque (2~+1) = ~~0~t:{;! es un entero, en el cual los primos que 
estamos considerando son todos factores del numerador (2m + 1)!, pero no 
del denominador m!(m + 1)! . Finalmente, se verifica 
Cmm+ 1) :::; 22m 
ya que 
Cmm+ 1) yademás C: :11) 
son dos sumandos (iguales) que aparecen en 
(3) Del teorema de Legendre (véase el margen) obtenemos que (2:) = ~~i 
contiene el factor primo p exactamente 
El postulado de Bertrand 
veces. cada sumando es a lo sumo 1, ya que satisface 
< 2n _ 2 (~ - 1) = 2, 
pk . pk 
y es un entero. Aún más, los sumandos se anulan siempre que pk > 2n. 
De e:) contiene p exactamente 
veces. Por tanto, la mayor potencia de p que divide a (2:) no es mayor que 2n. 
En particular, los primos p > V2ií aparecen en e:) a lo sumo una vez. 
Más aún, - y esto, según Erd6s, es la clave de la demostración - ¡los pri-
mos p que satisfacen ~n < p :::; n no dividen a (2:)! De hecho, 3p > 2n 
implica (para n ~ 3, Y por tanto p ~ 3) que p y 2p son los únicos múltiplos 
de p que aparecen como factores en el numerador de ~~i, mientras que en el 
denominador hay exactamente dos factores p. 
Ahora ya podemos estimar e:). Para n ~ 3, utilizando una estimación de 
la página 12 para la cota inferior, obtenemos 
4
n 
(2n) - < < 2n 2n - n -
p-:;.ffn 
p p 
y por tanto, como no hay más de V2ií primos p :::; V2ií, 
p rr p para n ~ 3. (2) 
n<p-:;'2n 
(5) Asumimos ahora que no hay ningún primo p con n < p :::; 2n, de modo 
que el segundo producto en (2) es 1. Substituyendo (1) en (2) obtenemos 
4n < (2n)Hffn 4~n 
o 
(3) 
una desigualdad que no es cierta para n suficientemente grande. De hecho, 
es tan falsa que (para n ~ 4000) lo podemos ver sin siquiera utilizar una 
calculadora: Utilizando a + 1 < 2a (lo cual se verifica por inducción para 
todo a ~ 2), obtenemos 
y de aquí, para n ~ 50 (y por tanto 18 < 2V2ií) obtenemos de (3) y (4) que 
Esto implica (2n)1/3 < 20, Y por tanto n < 4000. o 
9 
Ejemplos tales como 
G~) = 23 . 52 . 7 . 17 . 19 . 23 
G:) = 23 . 33 . 52 . 17 . 19 . 23 
(~~) = 24 . 32 . 5 . 17· 19 . 23 . 29 
ilustran que primos "muy pequeños" 
p < ffn pueden aparecer elevados a 
las potencias más grandes en (2:), que 
factores primos "pequeños" que verifi-
can ffn < p ::; ~n aparecen a lo 
sumo una vez, mientras que factores en 
el hueco ~n < p ::; n no aparecen. 
10 
n 
El postulado de Bertrand 
Es posible sacar más de este de estimaciones: a de (2) 
obtenerse con los mismos métodos que 
1 
P 2': 23ü n para n 2': 4000, 
y por tanto existen al menos 
1 n 
30 10g2 n + 1 
primos entre n y 2n. 
Esta estimación no es excesivamente mala: el "verdadero" número de primos 
en ese rango es aproximadamente del orden de ni log n. Esto se sigue del 
"teorema! de los números primos," que dice que el límite 
existe, y es igual a 1. 
l
. #{p ~ n : p es primo} 
1m 
n--+oo ni log n 
Este famoso resultado fue demostrado por primera vez por Hadamard y de la 
Vallée-Poussin en 1896; Selberg y Erd6s dieron una demostración elemental 
(sin utilizar herramientas de análisis complejo, aunque larga y complicada) en 
1948. 
En lo que se refiere al teorema de los números primos parece que aún no se ha 
dicho la última palabra: por ejemplo, una demostración de la hipótesis de Rie-
mann (véase la página 41), uno de los problemas no resueltos más importante 
en matemáticas, nos proporcionaría una mejora importante para el teorema de 
los números primos. Pero también para el postulado de Bertrand podrían es-
perarse mejoras sustanciales. De hecho, el siguiente problema, de Opperman 
(1882), está aún sin resolver: 
¿Existe siempre algún número primo entre n 2 y (n + 1)2? 
Pata más información, véase [3, p. 19] Y [4, pp. 248, 257]. 
Estimación mediante integrales 
Existe un método muy sencillo pero efectivo para estimar sumas utilizando 
integrales (tal y como ya se vio en la página 4). Para estimar los números 
armónicos 
n 1 
Hn = I:: k 
k=l 
dibujamos la figura del margen, y deducimos de ella que 
logn, 
El postulado de Bertrand 
comparando el área bajo la gráfica de f(t) = t (1 ::; t ::; n) con el área de los 
rectángulos sombreados en oscuro. Además obtenemos que 
. 1 n-l 1 in 1 
H - - = ~ - > -- dt = log.n 
n n ~ k t ' 
k=l 1 
esta vez con el área de los rectángulos grandes (incluyendo las 
partes más claras). En conjunto, esto conduce a que 
1 
logn+ - < Hn < logn + l. 
n 
En particular lim· Hn ---+ 00, y el orden de crecimiento de Hn viene dado por 
n---+oo 
lim JHn = l. Pero se conocen estimaciones mucho mejores, tales como 
n-+oo ogn 
1 1 1 (1) Hn = log n + ry + 2n - 12n2 + 120n4 + O n 6 ' 
donde ry ~ 0.5772 es la "constante de Euler" (véase [2]). 
Estimación factorial - la fórmula de Stirling 
El mismo método aplicado a 
log(n!) = log2+log3+ ... +logn 
proporciona 
n 
2:log k 
k=2 
log((n - 1)!) < ¡n logtdt < log(n!), 
donde la integral puede calcularse fácilmente: 
¡n logtdt = [tlogt _ t[ = nlogn - n + l. 
. Así que obtenemos una cota inferior para n! de 
n! > enJogn-n+l 
y al mismo tiempo una cota superior 
n! = n (n -1)! < nenJogn-n+l = en(~) n. 
En este punto se necesita una análisis más cuidadoso para describir el com-
portamiento asintótico de ni, tal y como viene dado en lafórmula de Stirling 
n! rv v27Tn (~r 
y de nuevo existen versiones aún más precisas, tales como 
n!= v27Tn (12)n (1 + _1 + _1_ _ 139 + O (~)) . 
e 12n 288n2 5140n3 n4 
Estimación mediante coeficientes binomiales 
A partir de la definición del coeficiente binomial G) como el número de sub-
conjuntos de cardinal k de un conjunto de tamaño n, sabemos que la sucesión 
(Z), G), ... , (~) de coeficientes binomiales 
1 
Aquí O (~6) denota una función f (n) 
tal que f ( n) ::; e ~6 se verifica para al-
guna constante c. 
Aquí f(n) rv g(n) signifca que 
lim f(n) = 1. 
n-Hexo g(n) 
12 
1 
1 1 
1 2 
1 3 3 
1 4 6 
1 5 10 10 
1 6 15 20 
1 7 21 35 35 
Triángulo de Pascal 
1 
1 
4 1 
5 1 
15 6 1 
21 7 1 
n 
iD tiene como suma :s (~) = 2n 
k=O 
. ,. (n) (n) 
@ es slmetnca: k = n-k . 
El postulado de Bertrand 
De la ecuación funcional (~) = n-~+l C;,::l) se deduce fácilmente que, para 
todo n, los coeficientes binomiales (~) forman una sucesión que es simétrica y 
unimodal: se incrementa hasta la mitad, de manera que los coeficientes bino-
miales centrales son los más grandes de la sucesión: 
Aquí, Lx J y IX l denotan, respectivamente, el número x redondeado inferior 
y superiormente al entero más cercano. 
A partir de las fórmulas asintóticas para los factoriales que se mencionaron 
antes, pueden obtenerse fácilmente estimaciones muy precisas para el tamaño 
de los coeficientes binomiales. Sin embargo, en este libro necesitaremos úni-
camente ~otas muy débiles, como la siguiente: G) ::: 2n para todo k, mientras 
que para n 2:: 2 tenemos 
(Ln~2J) 2:: 2~) 
dándose la igualdad sólo para n = 2. En particular, para n 2:: 1, 
(
2n) 2:: 4
n
. 
n 2n 
Esto se verifica porque (L n /2 J)' un coeficiente binomial central, es el mayor 
en la sucesión G) + (~) (~) G) ... ) (n::l)' cuya suma es 2n, y cuya media 
es por tanto 2: . 
Por otra parte, la siguiente cota superior para los coeficientes binomiales es 
razonablemente buena para coeficientes "pequeños" en la cola de la sucesión, 
cuando n es grande en comparación con k. 
n(n-1) ... (n-k+1) n k n k 
k! < k! < 2k - 1 ' 
[1] P. ERD6s: Beweis eines Satzes von Tschebyschef, Acta Sci. Math. (Szeged) 5 
(1930-32), 194-198. 
[2] R. L. GRAHAM, D. E. KNUTH & O. PATASHNIK: Concrete Mathematics. 
A Foundationfor Computer Science, Addison-Wesley, Reading MA 1989. 
[3] G. H. HARDY & E. M. WRIGHT: An lntroduction to the Theory ofNumbers, fifth 
edition, Oxford University Press 1979. 
[4] P. RIBENBOIM: The New Book of Prime Number Records, Springer-Verlag, New 
York 1989. 
Existe un epílogo del postulado de Bertrand que conduce a un bonito resul-
tado sobre coeficientes binomiales. En 1892 Sylvester reforzó el postulado de 
Bertrand de la siguiente manera: 
Si n 2' 2k, entonces al menos uno de los números n, n - 1, ... , n-k + 1 
tiene un divisor primo p mayor que k. 
Nótese que para n = 2k obtenemos precisamente el postulado de Bertrand. 
En 1934, Erd6s dio una breve y elemental demostración del resultado de Syl-
vester digna de estar en El Libro, análoga a su demostración del postulado de 
Bertrand. Hay una manera equivalente de formular el teorema de Sylvester: 
El coeficiente binomial 
(
n) = n(n-1) .. ·(n-k+1) 
k k! 
(n 2' 2k) 
tiene siempre un factor primo p > k. 
Sin perder de vista esta observación, volvamos a otra de las joyas de Erd6s: 
¿cuando es (~) igual a una potencia mJl.? Es fácil ver que existen infinitas 
soluciones para k = R = 2, es decir, para la ecuación (~) = m 2 . De hecho, 
si G) es un cuadrado, entonces también lo es ((2n;1)2). Para ver esto, sea 
n(n 1) =2m2. Se sigue que . 
(2n - 1)2((2n - 1)2 - 1) = (2n - 1?4n(n - 1) = 2(2m(2n - 1))2, 
y de aquí 
C2n ~ 1)2) = (2m(2n _ 1))2. 
Así pues, comenzando con (;) = 62 obtenemos infinitas soluciones - el 
siguiente es (2~9) = 2042. Sin embargo, este procedimiento no proporciona 
todas las soluciones. Por ejemplo, (52°) = 352 y C6282 ) = 11892 son el 
( ) 2 (53°) = 140
2 
comienzo de series diferentes. Para k = 3 se sabe que ~ = m tiene la 
solución única n = 50, m = 140, pero ahora ya hemos llegado al límite. Para es la única solución para k = 3, g = 2 
k 2' 4 y cualquier R 2' 2 no existen soluciones, y esto es lo que probó Erdos 
utilizando un ingenioso argumento. 
Teorema. La ecuación (~) 
R2'2 y 4::;k::;n-4. 
mE no tiene soluciones enteras con 
14 Los coeficientes binomiales casi nunca son potencias 
Nótese en primer lugar que podemos suponer sin pérdida 
de generalidad que n 2: 2k, porque G) = (n~k)' Supongamos que el teorema 
es falso y que (~) = m C• La demostración, hasta llegar a una contradicción, 
se desarrolla en cuatro pasos. 
(1) Por el teorema de Sylvester, existe un factor primo p de (~) mayor que k, 
ya que pC divide a n(n-1) ... (n-k+ 1). Claramente, sólo uno de los factores 
n - i puede ser múltiplo de p (ya que p > k), y concluimos que pC I n i, y 
por lo tanto 
(2) Consideremos cualquier factor n - j del numerador y escribámoslo de la 
forma n-j = ajmj, donde aj no es divisible entre una potencia no trivial de fJ.. 
Nótese por (1) que aj sólo tiene divisores primos que son menores o iguales 
que k. Queremos demostrar ahora que ai i- aj para i i- j. Suponemos, por 
contra, que ai = aj para algún i < j. Entonces mi 2: mj + 1 y 
k > (n - i) (n j) = aj(mf - m]) 2: aj((mj + l)c - mj) 
> ajfJ.m~-l > fJ.(ajmj?/2 2: fJ.(n - k + 1)1/2 
> fJ.(:g: + 1)1/2 > n 1/2, 
lo cual contradice n > k 2 . 
(3) A continuación probamos que los ai son los enteros 1,2, ... ,k ordenados 
de alguna manera. (De acuerdo con Erdos, este es el quid de la demostración.) 
Como ya sabemos que todos los ai son distintos, basta probar que 
aOa1 ... ak-l divide a k!. 
Substituyendo n - j = ajmj en la ecuación (~) = mC, se obtiene 
aOa1'" ak-l(mOm1'" mk_dc = k! mC. 
Simplificando los factores comunes de mo ... mk-l Y m se obtiene 
aOal ... ak-l uC = k! vC 
con mcd( u, v) = 1. Falta por demostrar que v = 1. Si no es así, entonces v 
contiene un dividor primo p. Puesto que mcd( u, v) = 1, p ha de ser un divisor 
primo de aOal ... ak-l Y por tanto es menor o igual que k. Por el teorema 
de Legendre (ver página 8) sabemos que k! contiene a p elevado a la potencia 
¿i>ll4 J. Ahora estimamos el exponente de p en n( n - 1) ... (n - k + 1). - p 
Sea i un entero positivo, y sean b1 < b2 < ... < bs los múltiplos de pi que 
hay entre los factores n, n - 1, ... , n-k + 1. Entonces bs = b1 + (3 - 1 )pi, 
Y de aquí 
(3 - l)pi k -1, 
lo cual implica 
s < lk;lJ+1 < l;J+1. 
Los coeficientes binomiales casi nunca son potencias 
Así que para cada i el número de de que entre n, ... , n-k+ 1, 
Y por tanto entre los aj, está acotado por l-:!r J + l. Esto implica que el expo-
nente de p en aOal ... ak-l es a lo sumo 
según el razonamiento que utilizamos para probar el teorema de Legendre en 
el capítulo 2. la única diferencia es que esta vez la suma se detiene en i = .e-l, 
ya que los aj no contienen potencias de.e. 
Considerando ambos cálculos de manera conjunta, obtenemos que el expo-
nente de p en v R es a lo sumo 
y ya hemos obtenido la contradicción buscada, ya que vR es una potencia de.e. 
Esto ya es suficiente para concluir el caso .e = 2. De hecho, ya que k 2: 4, uno 
de los ai tiene que ser igual a 4, pero los ai no contienen ningún cuadrado. 
Por tanto, suponemos a partir de ahora que .e 2: 3. 
(4) Como k 2: 4, debe ser ail = 1, ai2 = 2, ai3 = 4 para algunos i1, i 2 , i3, 
esto es, 
Afirmamos que (n-i2)2 =} (n-i 1 )(n-i3 ). En caso contrario, sea b = n-i2 
y n - i1 = b - x, n - i3 = b + y, donde 0< Ixl, Iyl < k. De aquí 
b2 =(b-x)(b+y) ó (y-x)b=xy, 
donde x = y es obviamente imposible. Ahora, según la parte (1), tenemos: 
Ixyl = bly - xl 2: b > n-k > (k - 1)2 2: Ixyl, 
lo cual es absurdo. 
Así, m~ =} mlm3, donde suponemos m~ > mlm3 (el otro caso es análogo), 
y hemos llegado a nuestra última cadena de desigualdades. Obtenemos 
2(k-l)n > n2 -(n-k+l)2 > (n-i2)2_(n-i1 )(n-i3 ) 
4[m~R - (mlm3)R] > 4[(mlm3 + l)R - (mlm3)R] 
> 4.e <:-1 R-l mI m 3 . 
Como.e 2: 3 y n > kR 2: k3 > 6k, tenemos que 
2(k - 1)nmlm3 > 4.emim~ = .e(n - i1)(n - i3 ) 
> .e(n-k+l)2 > 3(n-~)2> 2n2. 
15 
Vemos que nuestro análisis hasta este 
punto concuerda con (53°) = 1402, ya 
que 
50 = 2.52 
49 = 1· 72 
48=3.42 
Y 5 . 7 . 4 = 140. 
16 Los coeficientes binomiales casi nunca son potencias 
Ahora, puesto que mi :S nI/e :S n I / 3 obtenemos finalmente 
Ó k3 > n. Con esta contradicción se completa la demostración. D 
[1] P. ERD6s: A theorem of Sylvester and Schur; J. London Math. Soco 9 (1934), 
282-288. 
[2] P. ERDÓS: On a diophantine equation, J. London Math. Soco 26 (1951), 
176-178. 
[3] J. J. SYLVESTER: On arithmetical series, Messenger of Math. 21 (1892), 1-19, 
87-120; Collected Mathematical Papers Vol. 4,1912,687-731. 
¿ Qué enteros se escribir como suma de dos cuadrados? 
Esta pregunta es tan antigua como la teoría de números, y su solución es un 
clásico del área. La parte "difícil" de la respuesta es comprobar que todo 
número primo de la forma 4m + 1 es suma de dos cuadrados. G. H. Hardy 
escribió que este teorema de los dos cuadrados de Fermat "es considerado, 
con toda justicia, como uno de los más bellos de la aritmética." Sin embargo, 
una de nuestras demostraciones de El Libro es bastante reciente. 
Comencemos con algunos preliminares. En primer lugar, hemos de distinguir 
el primo P = 2 de los primos de la forma P = 4m + 1 Y de los primos de 
la forma P = 4m + 3. Todo número primo es de uno de estos tres tipos. En 
este punto, se puede observar (siguiendo la idea de Euclides) que hay infinitos 
primos de la forma 4m + 3. En efecto, si hubiera sólo un número finito, 
podríamos tomar el mayor de ellos y llamarlo Pk. Haciendo 
N k := 2
2 . 3 . 5· .. Pk - 1 
(donde PI = 2, P2 = 3, P3 = 5, " . denota la secuencia de todos los primos), 
observamos que N k es congruente con 3 (mod4) y, por tanto, debe tener un 
factor primo de la forma 4m + 3. Como dicho factor primo es mayor que Pb 
hemos obtenido una contradicción. Al final de este capítulo demostraremos, 
que también hay infinitos primos de la forma P = 4m + 1. 
Nuestro primer lema es un caso particular de la famosa "ley de reciprocidad": 
caracteriza los primos para los cuales -1 es un cuadrado en el cuerpo Zp (del 
que se presenta un resumen en el recuadro de la página siguiente). 
Lema 1. La ecuación 8 2 == -1 (mod p) tiel!e exactamente dos soluciones 
8 E {1, 2, ... , p-1 } para los números primos P = 4m + 1, una solución para 
P = 2 Y ninguna solución para los primos de la forma P = 4m + 3 . 
• Demostración. Para P = 2 tomamos 8 = 1. Si P es impar, consideramos el 
conjunto {1, 2, ... ,p -1} Y construimos la relación de equivalencia generada 
al identificar cada elemento con sus inversos aditivo y multiplicativo en Zp. 
Por tanto, la clase de equivalencia "genérica" tiene cuatro elementos 
{x, -x, x, -x}, 
ya que este conjunto contiene los inversos de todos sus elementos. No obs-
tante, hay clases de equivalencia con menos elementos si algunos de los miem-
bros son iguales: 
1 12 + 02 
2 12 + 12 
3 ?? 
4 22 + 02 
5 22 + 12 
6 ?? 
7 
8 
9 
10 
11 
Pierre de Fermat 
18 
Para p = 11 las clases de equivalencia 
son {1, lO}, {2, 9, 6, 5}, {3, 8, 4, 7}; 
para p = 13 son 
{1,12},{2,11,7,6},{3,10,9,4}, 
{5, 8}: el par {5, 8} proporciona las 
dos soluciones de 3 2 == -1 mod 13. 
+ O 1 2 3 4 
O O 1 2 3 4 
1 1 2 3 4 O 
2 2 3 4 O 1 
3 3 4 O 1 2 
4 4 O 1 2 3 
O 1 2 3 4 
O O O O O O 
1 O 1 2 3 4 
2 O 2 4 1 3 
3 O 3 1 4 2 
4 O 4 3 2 1 
Suma y multiplicación en :35 
Representación de enteros como suma de dos cuadrados 
• x == -x es imposible si pes 
• x == x es equivalente a X2 == 1. Esta ecuación tiene dos soluciones, x = 1 
Y x = P - 1, lo que da lugar a la clase de equivalencia {1, p - 1 }, con dos 
elementos. 
11 x == -x es equivalente a x2 == -1. Esta ecuación puede no tener solución 
o tener dos soluciones distintas, xo, p - xo. En este último caso, la clase 
de equivalencia es {xo,p - xo}. 
El conjunto {1, 2, ... ,p - 1} tiene p - 1 elementos y lo hemos dividido en 
4-uplas (las clases de equivalencia de cardinal 4), más uno o dos pares (las 
clases de cardinal 2). Para p - 1 = 4m + 2 existe sólo el par {1, p - 1} Y 
el resto son 4-uplas y, por tanto, 8 2 == -1 (mod p) no tiene solución. Para 
p - 1 = 4m debe haber un segundo par que contiene las dos soluciones de la 
ecuación 8 2 == -1 que estamos buscando. . O 
Si p es primo, el conjunto Zp = {O, 1, ... ,p 1} con la suma y mul-
tiplicación definidas "módulo p" es un cuerpo finito. Necesitaremos las 
siguientes propiedades: 
• Para x E Zp, x =1- 0, el inverso aditivo (que denotaremos -x) es 
p - x E {1, 2, ... ,p 1}. Sip > 2, entonces x y -x son elementos 
distintos de Zp. 
<11 Cada x E Zp \ {O} tiene un único inverso multiplicativo x E Zp \ {O} . 
tal que xx == 1 (modp). 
De la definición de número primo se deduce que la aplicación Zp ---* 
Zp, Z f--+ xz es inyectiva si x =1- O. Por tanto, en el conjunto finito 
Zp \ {O} debe ser también sobreyectiva, y para cada x debe existir un 
único x =1- O tal que xx == 1 (modp). 
<11 Los cuadrados 02 ,12 ,22 , ... ,h2 son elementos de distintos para 
h = l~J. 
Esto es así porque x2 == y2 (o (x + y) (x - y) == O) implica que x == y 
o que x -y. Los 1 + l~J elementos 02 ,12 , ... , h2 se denominan 
los cuadrados de Zp. 
Mencionemos aquí que para todos los números primos existen soluciones de 
X2 + y2 == -1 (modp). De hecho, hay l~J + 1 cuadrados distintos X2 en Zp, 
en tanto que hay l~J + 1 elementos distintos de la forma -(1 + y2). Como 
Zp tiene p elementos, estos dos conjuntos son demasiado grandes para ser 
disjuntos, y deben existir x e y tales que x2 == -(1 + y2) (modp). 
Lema 2. Ningún número n = 4m + 3 es suma de dos cuadrados. 
111 Demostración. El cuadrado de un número par es (2k)2 = 4k2 == O (mod 4) 
y el de un número impar (2k + 1)2 = 4(k2 + k) + 1 == 1 (mod4). Por tanto, 
la suma de dos cuadrados es congruente con O, 1 ó 2 (mod4). O 
Representación de enteros como suma de dos cuadrados 
Ahora que sabemos que los de la fonna p = 4m -1- 3 son " nos 
ocuparemos de las "buenas" propiedades de los primos de la fonna 
p = 4m -1- 1. Presentamos el resultado clave previo al teorema principal. 
Proposición. Todo número primo de la forma p = 4m -1- 1 es suma de dos 
cuadrados, es decir, se puede escribir como p = x2 -1- y2 para ciertos números 
naturales x, y E N. 
Presentaremos dos demostraciones de este resultado, ambas elegantes y sor-
prendentes. En la primera se combinan hábilmente el "principio del palomar" 
(que ya hemos empleado "de pasada" antes del Lema 2; en el capítulo 22 se 
pueden encontrar más ejemplos), y los argumentos "modulo p". La idea se 
debe al matemático noruego, especialista en teoría de números, Axel Thue . 
• Demostración. Consideremos los pares (x', y') de enteros que verifica que 
O :::;; x', y' :::;; yIP, es decir, x', y' E {O, 1, ... , l ylPJ}. El número total de pares 
de este tipo es (l ylPJ -1- 1)2. Utilizando la estimación lx J -1- 1 > x para 
x = yIP, vemos que hay más de p tales pares. Por tanto, para cualquier s E Z, 
es imposible que todos los valores x' - sy' generados por los pares (x', y') 
sean distintos módulo p, de donde se deduce que para cualquier s hay dos 
pares distintos 
(X',y'), (X",y") E {O,1, ... ,lJPj}2 
tales que 
x' - sy' =:: x" - sy" (modp). 
Restando se tiene que x' - x" =:: S(y' - y") (modp). Si definimos 
x := Ix' - x"I, y:= Iy' - y"l, 
se deduce que 
(x,y) E {O,1,· .. ,lJPj}2 con x=::±sy(modp). 
También sabemos que x e y no pueden ser ambos cero, ya que los pares (x', y') 
Y (x", y") son distintos. 
Sea s una solución de S2 =:: -1 (mod p), cuya existencia está asegurada por el 
Lema 1. Como x2 =:: s2y2 =:: _y2 (mod p) hemos construido 
(x,y)EZ2 talque O<x2 -1- y2<2p y x2 -1-y2=::O(modp). 
Como p es el único número entre O y 2p que es divisible por p, se deduce que 
x2 -1- y2 = p, y hemos tenninado. O 
La segunda demostración de la proposición - también una demostración de 
El Libro - fue encontrada por Roger Heath-Brown en 1971 y publicada tan 
solo en 1984. (Don Zagier dio una versión "resumida en una frase".)Es tan 
elemental que no necesitaremos utilizar el Lema 1. 
El argumento de Heath-Brown utiliza tres involuciones lineales: una que es 
bastante obvia, otra oculta y una última, trivial, que pone la guinda al pastel. 
La segunda involución, sorprendente, corresponde a una estructura oculta en 
el conjunto de soluciones enteras de la ecuación 4xy -1- Z2 = p. 
19 
Para p = 13, lv'PJ = 3 considera-
mos x', y' E {O, 1, 2, 3}. Para s = 5, 
la suma x' - sy' (mod 13) toma los si-
guientes valores: 
y' 
O 1 2 3 x' 
O O 8 3 11 
1 1 9 4 12 
2 2 10 5 O 
3 3 11 6 1 
20 
T 
f 
u 
~. 
Representación de enteros como suma de dos cuadrados 
• Demostración. Estudiaremos el conjunto 
S := {(X,y,Z) E Z3: 4xY+Z2 =p, x> O, y> O}. 
Este conjunto es finito. De hecho, como x ~ 1 e y ~ 1 se deduce que y ~ ~ 
y x ~ ~. Por tanto, hay un número finito de posibles valores de x e y y, para 
cada uno de ellos, hay como mucho dos valores de z. 
1. La primera involución lineal viene dada por 
f : S ----+ S, (x, y, z) 1--+ (y, x, -z), 
es decir, "se permutan x e y, y se cambia el signo a z." Es evidente que esta 
transformación envía S sobre sí mismo y que es una involución: aplicada dos 
veces, resulta la identidad. Obsérvese que f no tiene puntos fijos, ya que z = O 
implicaría que p = 4xy. Además, f envía los puntos de 
T:= {(x,y,z)ES:Z>O} 
a los puntos de S\T, que satisfacen z < O. Como f cambia los signos de 
x - y y de z, manda los puntos de 
U := {(X,y,Z)ES:(X-y)+z>O} 
a los puntos de S\U. Obsérvese que no pueden existir puntos de S tales que 
(x-y)+z = Oyaque,enesecaso,setendríap = 4xY+Z2 = 4xy+(x-y)2 = 
(x + y)2. 
¿Qué se obtiene del estudio de f? La principal observación es que, como f 
envía los conjuntos T y U a sus complementarios, también intercambia los 
puntos de T\U con los de U\T. Por tanto, hay el mismo número de puntos 
en U que no están en T que puntos en T que no están en U - por tanto, T 
y U tienen el mismo cardinal. 
2. La segunda transformación que estudiamos es una involución en U: 
g: U ----+ U, (x, y, z) 1--+ (x - Y + z, y, 2y - z). 
Veamos, en primer lugar, que 9 está bien definida: si (x, y, z) E U, entonces 
x - y + z > O, y> O y 4(x - y + z)y + (2y - z)2 = 4xy + i 2, por lo que 
g(x, y, z) E S. Como (x - y + z) - y + (2y - z) = x > O se deduce que 
g(x, y, z) E U. 
Además, 9 es una involución: 9 (x, y, z) = (x - y + z, y, 2y - z) se transforma 
en ((x - y + z) - y + (2y - z), y, 2y - (2y - z)) = (x, y, z). 
Finalmente, 9 tiene exactamente un punto fijo: 
(x,y,z) = g(x,y,z) = (x-y+z,y,2y-z) 
se verifica si y sólo si y = z y, en tal caso, p = 4xy + y2 = (4x + y)y, cuya 
única solución es y = 1 = z Y x = p~l . 
Pero si 9 es una involución en U que tiene exactamente un punto fijo, entonces 
el cardinal de U es impar. 
Representación de enteros como suma de dos cuadrados 
3~ La tercera involución que estudiamos es trivial y consiste en intercambiar 
x ey: 
h: T ----t T, (x, y, z) 1----+ (y, x, z). 
Es evidente que esta aplicación está bien definida y que es una involución. 
Ahora combinamos los hechos deducidos de las otras dos involuciones: el 
cardinal de T es igual al cardinal de U, que es impar. Pero si h es una involu-
ción en un conjunto finito de cardinal impar, entonces tiene algún punto fijo: 
existe un punto (x, y, z) E T tal que x = y, es decir, una solución de 
o 
Obsérvese que esta demostración dice más - el número de representaciones 
de p de la formap = X2 + (2y)2 es impar para todos los números primos de 
la forma p = 4m + 1. (De hecho, la representación es única, véase [3].) Ob-
sérvese también que ninguna de las demostraciones es constructiva: ¡intente 
encontrar x e y para un número primo de diez dígitos! En [1] y [7] se estu-
dian formas eficientes de encontrar tales representaciones como suma de dos 
cuadrados. 
El siguiente teorema responde de forma definitiva a la pregunta con la que 
comenzó este capítulo. 
Teorema. Un número natural n se puede representar como suma de dos 
cuadrados si y sólo si todos los factores primos de la forma p = 4m + 3 
aparecen con exponente par en la factorización de n . 
• Demostración. Diremos que un número n es representable si es la suma 
de dos cuadrados, es decir, si n = x2 + y2 para ciertos x, y E No. El teorema 
es una consecuencia de los cinco hechos siguientes. 
(1) 1 = 12 + 02 Y 2 = 12 + 12 son representables. Todo número primo de la 
forma p = 4m + 1 es representable. 
(2) El producto de dos números representables nI = xi + YI y n2 = x~ + y~ 
es representable: nln2 = (XIX2 + YlY2)2 + (XIY2 - x2Yd 2. 
(3) Si n es representable, n = x2 +y2, entonces nz2 también es representable, 
ya que nz2 = (XZ)2 + (yz)2. 
Los hechos (1), (2) Y (3) proporcionan la parte "si" del teorema. 
(4) Si p = 4m + 3 es un primo divisor de un número representable 
n = X2 + y2, entonces p es divisor de x y de y, por lo que p2 es divi-
sor de n. De hecho, si x =t O (mod p), existiría x tal que xx == 1 (mod p), 
y multiplicando la ecuación X2 + y2 == O por x2 obtendríamos la relación 
1 + y2J;2 = 1 + (xy)2 == O (modp), lo que es imposible según el Lema 1 
ya que p = 4m + 3. 
(5) Si n es representable y p = 4m + 3 es un divisor de n, entonces p2 es 
divisor de n y n/p2 es representable. Esto se deduce de (4) y completa la 
demostración. O 
21 
En un conjunto finito de cardinal impar 
toda involución tiene al menos un punto 
fijo. 
22 Representación de enteros como suma de dos cuadrados 
Como veamos que existen infinitos números de la forma 
P = 4m + 1. Para ello, supongamos que hay un número finito y denotemos 
por Pk al mayor de ellos. Consideremos 
que es congruente con 1 (mod4). Todos sus factores primos son mayores 
que Pk y, según el hecho (4) de la demostración precedente, no tiene factores 
primos de la forma 4m + 3. Por tanto, M k tiene un factor primo de la forma 
4m + 1 que es mayor que Pk. 
Concluimos con dos observaciones: 
11' Si a y b son dos números naturales que son primos entre sí, entonces hay 
infinitos números primos de la forma am+b Cm E N) - este es un famoso 
(y difícil) teorema de Dirichlet. De forma más precisa, se puede demostrar 
que la cantidad de números primos P :S x de la forma P = am + b viene 
dada de forma muy aproximada si x es grande por la función 'Pea) lo~ x, 
donde cp(a) denota el número de primos relativos con a que son menores 
que a. (Esto es una mejora sustancial del teorema de los números primos, 
que tratamos en la página 10.) 
11' Esto quiere decir que los números primos para a fijo y b variable aparecen 
esencialmente en igual cantidad. Sin embargo, por ejemplo para a = 4, se 
puede observar una sutil, pero perceptible y persistente tendencia a "más" 
primos de la forma 4m + 3: si observamos un valor de x grande al azar, es 
probable que haya más primos P :S x de la forma P = 4m + 3 que de la 
forma P = 4m + l. Este efecto se conoce como "desviación de Chebyshev"; 
véase Riesel [4] y Rubinstein y Sarnak [5]. 
[1] F. W. CLARKE, W. N. EVERITT, L. L. LITTLEJOHN & S. J. R. VORSTER: H. J. 
S. Smith and the Fennat Two Squares Theorem, Amer. Math. Month1y 106 (1999), 
652-665. 
[2] D. R. HEATH-BROWN: Fermat's two squares theorem, Invariant (1984),2-5. 
[3] I. NrvEN & H. S. ZUCKERMAN: An Introduction to the Theory ofNumbers, Fifth 
edition, Wiley, New York 1972. 
[4] H. RIESEL: Prime Numbers and Computer Methods for Factorization, Second 
edition, Progress in Mathematics 126, Birkhauser, Boston MA 1994. 
[5] M. RUBINSTEIN & P. SARNAK: Chebyshev's bias, Experimental Mathematics 3 
(1994), 173-197. 
[6] A. THUE: Et par antydninger til en taltheoretisk metode, Kra, Vidensk. Selsk. 
Forh. 7 (1902), 57-75. 
[7] S. WAGON: Editor's comer: The Euclidean algorithm strikes again, Amer. Math. 
Monthly 97 (1990), 125-129. 
[8] D. ZAGIER: A one-sentence proofthat every prime p == 1 (mod4) is a sum oftwo 
squares, Amer. Math. Monthly 97 (1990), 144. 
Los anillos son estructuras importantes en el álgebra moderna. Si un anillo R 
tiene elemento neutro para la multiplicación y cualquierelemento distinto de 
cero tiene inverso para la multiplicación, entonces R es un anillo de división. 
Así pues, todo lo que le falta a R para ser un cuerpo es la conmutatividad 
de la multiplicacion. El ejemplo mejor conocido de un anillo de división no 
conmutativo es el de los cuaterniones, descubierto por Hamilton. Pero, tal 
y como dice el título del capítulo, cualquier anillo de este tipo ha de ser ne-
cesariamente infinito. Si R es finito, entonces los axiomas fuerzan a que la 
multiplicación sea conmutativa. 
Este resultado, ya un clásico, ha cautivado la imaginación de muchos mate-
máticos porque, como escribe Herstein, "es una inesperada interrelación entre 
dos cosas aparentemente no relacionadas como son el número de elementos 
en un sistema algebraico determinado y la multiplicación en ese sistema." 
Teorema. Cualquier anillo de división R es conmutativo. 
Este bonito teorema, habitualmente atribuido a MacLagan Wedderburn, ha 
sido probado de diferentes maneras, utilizando una gran variedad de ideas. El 
mismo Wedderburn dio tres demostraciones en 1905, y Leonard E. Dickson 
dio otra en el mismo año. Emil Artin, Hans Zassenhaus, Nicolas Bourbaki, 
y muchos otros encontraron posteriormente nuevas demostraciones. Una de 
ellas destaca por su simplicidad y elegancia. Fue hecha pública por Ernst Witt 
en 1931 y combina dos ideas elementales que conducen a un glorioso final. 
• Demostración.. 
Nuestro primer ingrediente está tomado de una combinación de álgebra lineal 
y teoría de grupos básica. Para un elemento arbitrario s E R, sea Cs el con-
junto {x E R : xs = sx} de elementos que conmutan con s; Cs se llama el 
centralizador de s. Claramente, Cs contiene al O y all, y es un subanillo de 
división de R. 
El centro Z es el conjunto de elementos que conmutan con todos los elemen-
tos de R, esto es, Z = nsER Cs. En particular, todos los elementos de Z 
commutan, O yI están en Z, y por tanto Z es un cuerpo finito. Sea IZI = q. 
(Se puede demostrar que q debe ser una potencia de un número primo.) 
Podemos considerar R y Cs como espacios vectoriales sobre el cuerpo Z y de-
ducir que IRI = qn, donde n es la dimensión del espacio vectorial R sobre Z, 
y de manera similar ICsl = qns para enteros apropiados ns :::: 1. 
Ahora, suponemos que R no es un cuerpo. Esto significa que para algún s E R 
el centralizador Cs no es todo R, o lo que es lo mismo, ns < n. 
EmstWitt 
24 Cualquier anillo de división finito es un cuerpo 
En el conjunto R* := R\ {O} consideramos la relación 
:~ r ' = x-1rx para algún x E R*. 
Es fácil comprobar que ~ es una relación de equivalencia. Sea 
la clase de equivalencia que contiene a 8. Nótese que se cumple lAs 1 = 1 
precisamente cuando 8 está en el centro Z. Así, por nuestra suposición, existen 
clases As con 1 2: 2. Consideramos ahora para 8 E R* la aplicación 
f8 : x f---+ X- 18X de R* en As. Para x, y E R* tenemos 
X- 18X = y-1 8y ~ (YX- 1)8 = s(yx-1) 
~ yx- 1 EO; ~ yEO;x, 
donde hemos definido O; := Os \{O}, y O;x {zx: Z E O;} tiene car-
dinal 10; l. De aquí, cualquier elemento x-1 sx es la imagen de precisamente 
10; 1 = qns - 1 elementos en R* bajo la aplicación f8, y deducimos que 
1 R* 1 = 1 As 110; l· En particular, nótese que 
IR*I n 1 
q = lAs 1 es un entero para todo s. 10;1 qns - 1 
Sabemos que las clases de equivalencia son una partición de R*. Ahora agru-
pamos los elementos del centro Z* y denotamos por Al, ... , At las clases de 
equivalencia que contienen más de un elemento. Por nuestra suposición, sabe-
mos que t 2: 1. Como IR* 1 = IZ* 1 + ¿;~=1 IAk 1, hemos probado la llamada 
fórmula de clases 
t n 1 
n ¿ q -q -1 = q-l+ 
nk -1' 
k=l q 
n 1 
donde tenemos 1 < qªn. k --1 E N para todo k. 
(1) 
Con (1) hemos dejado el álgebra abstracta y vuelto a los números naturales. 
Ahora veremos que qnk -1 1 qn -1 implica que nk 1 n. De hecho, si escribimos 
n = ank + r con O :s; r < nk, entonces qnk - 11 qank+r - 1 implica 
y por tanto qnk - 11 q(a-1)nk+T - 1, ya que qnk y qnk - 1 son primos .entre 
sí. Continuando de esta manera se tiene qnk - 11 qT - 1 con O :s; r < nk, que 
sólo es posible para r = O, esto es, nk 1 n. En resumen, nótese que 
nk 1 n para todo k. (2) 
Ahora viene el segundo ingrediente: los números complejos C. Consideramos 
el polinomio xn - 1. Sus raíces en C son las raíces n-ésimas de la unidad. 
Como An = 1, todas estas raíces A tienen IAI = 1, Y por lo tanto son puntos 
de la circunferencia unidad en el plano complejo. De hecho, son precisamente 
los números Ak = e
2
';.,"i = cos(2k1r/n) + isen(2k7r/n), O < k < n 1 
Cualquier anillo de división finito es un cuerpo 
el recuadro en esta de las raíces A satisfacen A d = 1 
para d < n; por ejemplo, la raíz A = -1 satisface A2 = 1. Para una raíz A, 
sea d el exponente positivo más pequeño con A d = 1, esto es, d es el orden 
de A en el grupo .de las raíces de la unidad. Entonces d I n, por el teorema de 
Lagrange ("el orden de cualquier elémento de un grupo divide al orden del 
grupo" - véase el recuadro en el capítulo 1). Existen raíces de orden n, tales 
como Al = e 2~i . 
Cualquier número "nrnr\lp, 
como 
z = x + iy puede escribirse en forma 
z rép = r(cosso + i sen SO), 
donde r = I z I = .J X2 + y2 es la distancia de z al origen y SO es el 
ángulo medido en sentido positivo desde el eje de abscisas. Las raíces 
n-ésimas de la unidad son de la forma 
Ak = e2 k;;i = cos(2k1f/n) + isen(2k1r/n), o:::; k:::; n -1, 
ya que para todo k 
Ah = e2k'lCi = cos(2k1r) + isen(2k1f) = 1. 
Obtenemos estas raíces geométricamente al inscribir un n-ágono regular 
en la circunferencia unidad. Nótese que Ak (k para todo k, donde 
( = e 2~i. Por tanto, las raíces n-ésimas de la unidad forman un grupo 
cíclico {(, (2, ... ,(n-l, (n = 1} de orden n. 
Ahora agrupamos todas las raíces de orden d y ponemos 
TI (X-A). 
A de orden d 
Nótese que la definición de ePd (x) es independiente de n. Puesto que cualquier 
raíz tiene algún orden d, concluimos que 
(3) 
dln 
Aquí viene la observación crucial: los coeficientes de los polinomios ePn (x) 
son enteros (esto es, ePn(X) E Z[x] para todo n) y además el término indepen-
diente es o bien 1 ó -1. 
Verifiquemos con cuidado esta afirmación. Para n = 1 tenemos 1 como única 
raíz, y por tanto ePI (x) = x -1. Ahora procedemos por inducción, suponiendo 
que ePd(X) E Z[x] para todo d < n, y que el término independiente de ePd(X) 
es 1 ó -1. Por (3), 
(4) 
e n-e 
dondep(x)= ¿PjXj , ePn(x) = ¿akxk, conpo=1opo=-1. 
j=O k=O 
25 
x = reos SO 
-1 
Raíces de la unidad para n = 6 
26 
Iq - ¡.ti > Iq - 11 
Cualquier anillo de división finito es un cuerpo 
Puesto que -1 = poao, vemos que ao E {1, -1}. Supongamos que ya sabe-
mos que ao, al, ... , ak-1 E Z. Calculando el coeficiente de Xk a ambos lados 
de (4) obtenemos 
k k 
2:.Pj ak-j 2:.Pjak-j + POak E Z. 
j=o j=l 
Por hipótesis, todos los ao, ... ,ak-1 (y todos los Pj) están en Z. Por tanto 
POak es entero, y en consecuencia ak también, ya que Po es 1 ó -l. 
Ahora ya estamos listos para el golpe de gracia. Sea nk 1 n uno de los números 
que aparecen en (1). Entonces 
rr 
di n di n, dfnk, d#n 
Concluimos que en Z tenemos las relaciones de divisibilidad 
qn -1 
cfJn (q) I qnk _ 1 . (5) y 
Ya que (5) se verifica para todo k, deducimos de la fórmula de clases (1) que 
pero esto no puede ser. ¿Por qué? Sabemos que cfJn(x) = IJ(x - A) donde A 
recorre todas las raíces de xn - 1 que tienen orden 3. Sea A = a + ib una de 
esas raíces. Como n > 1 (ya que R ::J Z) tenemos A ::J 1, lo cual implica que 
la parte real a es menor que 1. Ahora 1>:1 2 = a 2 + b2 = 1, Y de aquí 
Iq - a - ibl 2 = (q - a)2 + b2 
q2 _ 2aq + a2 + b2 = q2 - 2aq + 1 
> (porque a < 1) 
y también Iq - >:1 > q - 1 se verifica para todas las raÍCes de orden n. Esto 
implica 
A 
lo cual significa que cfJn(q) no puede ser un divisor de q - 1, que es una con-
tradicción y pone fin a la demostración. O 
[1] L. E. DrCKSON: Onfinite algebras, Nachrichten der Alead. Wissenschaften Got-
tingen Math.-Phys. Klasse (1905),1-36; Collected Mathematica1 Papers Vol. III, 
Che1sea Publ. Comp, The Bronx, NY 1975, 539-574. 
[2] J. H. M. WEDDERBURN: A theorem onfinite algebras, Trans. Amer. Math. Soco 
6 (1905), 349-352. 
[3] E. WITT: Über die Kommutativitiit endlicher Schiefkorper, Abh. Math. Sem. Univ. 
Hamburg 8 (1931), 413. 
"Jr es irracional" 
Este resultado se remonta a Aristóteles, quien supuestamente afirmó que el 
diámetro y la longitud de una circunferencia no son conmensurables. La pri-
mera demostración de este hecho fundamental fue dada por Johann Heinrich 
Lambert en 1766. La demostración de El Libro que presentamos se debe a 
Ivan Niven y data de 1947: es un argumento muy elegante de una sola página 
que únicamente hace uso de cálculo elemental. Su idea es potente y puede 
ser utilizada para obtener más resultados, como muestran los resultados de 
Iwamoto y Koksma, respectivamente: 
Jr2 es irracional y 
El eT es irracio.nal si r i=- O es racio.nal. 
El método. de Niven tiene alguno.s precedentes: se puede seguir su rastro hasta 
el artículo. clásico. de Charles Herrnite de 1873, do.nde se demo.stró po.r primera 
vez que e es trascendente, es decir, que e no. es raíz de ningún po.lino.mio. co.n 
co.eficientes racio.nales. 
Antes de estudiar Jr no.s o.cuparemos de e y sus po.tencias, y demo.straremo.s 
que so.n irracio.nales. Esto. es mucho. más sencillo., y además nos permitirá 
respetar el orden histórico de o.btención de lo.s resultados. 
Para co.menzar, es bastante sencillo. ver, al igual que hizo Fo.urier en 1815, que 
e = "2::\>0 tr es irracional. De hecho, si se tuviera e = T; para ciertos enteros 
a y b > 0, ento.nces se o.btendría 
n!be = n!a 
para todo n 2: O. Pero esto. no puede ser cierto, ya que la parte derecha de la 
igualdad es un entero, en tanto que la parte izquierda, con 
se descompo.ne en una parte entera 
I( 1 1 1) bn. 1 + I + I + ... + I 1. 2. n. 
y una segunda parte 
( 
1 1 1 ) 
b n+l + (n+l)(n+2) + (n+l)(n+2)(n+3) + .,. 
Charles Hermite 
e .- 1 + t + ~ + i + :h + ... 
2.718281828 ... 
28 
Serie gec)m,etrlca 
Para la serie geométrica infinita 
Q=i+ +q\+'" 
con q > 1 se tiene que 
qQ = 1 + i + q\ + ... = 1 + Q 
y, por tanto, 
1 
Q 
q-l 
1,92. JOURNAL DE MATHÉMATIQUES 
SUR L'lRRATIONNALlTÉ DU NOMBRE 
PAn J. LIOUVILLE. 
On prouve dans les éléments que le nombre e J base des logarithmes 
népériens, n'a pas une valenr rationnelle, Gn de'Tait, ce me semble, 
ajouter que la melle m~thode pro uve aussi que e ue peut pas etre ra-
cine d'une équation du second degré a coefficients rationne1s, en sarte 
que l'on ne peutpas avoir ae+ ~ = e, a étantun entier positifetb, e, 
des entiers positifs DU négatifs. En effet, si l'on remplace dans eette 
équation e et :; DU e-1 par le~rs développements deduits de celui dee", 
puia qu' on multiplie les deux membres par J. 2..3. , . n, 00 trouvera 
aisément 
"~, (,+"~,+ ... )± ".!-,(' ,-"~, +.)=!" 
¡.t étant un entier. 00 peut toujours faire en 50rte que le facteur 
+~ -"+1 
soit positif¡ i1 suffil'ade supposer npairsi b est <o etn impail' si b est 
>0 ¡ en pl'enant de plus n tres grand) J'équation que nous venoos 
d'écril'e conduira des lol's a une absurdité; cal' son pl'emier membre 
étant essentiellement positif et tres petit, sera compris entre o et r, 
.et ne pourra pas étre égal a un entiel' 0. Done, etc. 
Artículo de Liouville 
Algunos números irracionales 
que es aproximadamente ~ y, por tanto, para n grande no puede ser entero: es 
mayor que n! 1 y menor que ~, según se puede comprobar comparando con 
la serie geométrica: 
1 -- < 
n+1 
< 
111 
--+ + + ... 
n+1 (n+1)(n+2) "(n+1)(n+2)(n+3) 
1 1 1 1 
n+1+(n+1)2+(n+1)3+'" =;;;,' 
En este punto el lector se habrá dado cuenta de que este simple truco de "mul-
tiplicar por n!" no es suficiente para demostrar que e2 es irracional. Este úl-
timo resultado es más fuerte: V2 es un ejemplo de un número irracional cuyo 
cuadrado es racional. 
John Cosgrave observó que con dos bellas observaciones (nosotros las llama-
remos "trucos") se puede llegar dos pasos más allá: cada uno de los trucos 
es suficiente para demostrar que e2 es irracional, y la combinación de los dos 
permite demostrar que é también es irracional. El primer truco se puede en-
contrar en un artículo de una página de J. Liouville de 1840 - Y el segundo 
en una adenda de dos páginas que Liouville publicó a continuación. 
¿Por qué es irracional e2 ? ¿Qué se puede deducir de e2 = %? Según Liouville, 
deberíamos escribir esta igualdad como 
be = ae-1 , 
sustituir las series 
e 
y 
ya continuación multiplicar por ni, para algún número par n suficientemente 
grande. Entonces se tiene que n!be es casi un entero: 
( 
1 1 1 1) n!b 1 + - + - + - + ... + -, 
1 2 6 n. 
es un entero, y el resto 
es aproximadamente ~, ya que es mayor que n!l pero menor que ~, como 
hemos visto anteriormente. 
Al mismo tiempo, n!ae- 1 es también casi entero: de nuevo, obtenemos una 
parte entera grande, y un resto 
( )n+l, (1 1 1 ) -1 n.a (n+l)!-(n+2)!+(n+3)!:::¡:"" 
Algunos números irracionales 
que es (_l)n+l~. De manera más para un número 
par 71 el resto es mayor que - ~, pero menor que 
_a(_l __ e 1 _ 1 _ ) ___ a_ (1-~) < O. 
71+1 (71+1.)2 (71+1)3 oo' - 71+1 71 
Esto es imposible, ya que para un número par 71 suficientemente grande se 
tendría que n!ae-1 es un poco menor que un entero, mientras que n!be es 
un poco mayor que un entero y, en consecuencia, no se puede cumplir que 
n!ae- 1 = n!be. O 
Para demostrar que é es irracional, nos armamos de valor para suponer que 
é = ~ es racional, y escribimos esta igualdad así: 
be2 = ae- 2 . 
Podríamos intentar multiplicar por n! para algún 71 grande y agrupar los su-
mandos no enteros, pero esta idea no produce ningún resultado útil: la suma 
de los restantes términos sería b2n:
1 
para el lado izquierdo y (_1)n+la
2n
:
1 
para el lado derecho, y ambos serían grandes si 71 se hace grande. 
Por tanto, es preciso estudiar la situación cuidadosamente y realizar dos pe-
queños retoques en la estrategia: en primer lugar, no tomaremos un 71 grande 
arbitrario, sino una potencia de dos grande, 71 = 2m ; en segundo lugar, no 
multiplicaremos por ni, sino por 2:~1' Necesitamos ahora un pequeño lema, 
un caso especial del teorema de Legendre (véase la página 8): para cualquier 
entero 71 2: 1, n! contiene el factor primo 2 como mucho 71 - 1 veces - la 
igualdad se da si (y sólo si) 71 es potencia de dos, 71 = 2m . 
Este lema no es nada difícil de demostrar: L ~ J de los factores de ni son pares, 
L :¡ J de ellos son divisibles por 4, y así sucesivamente. Por tanto, si 2k es la 
mayor potencia de dos que satisface 2k :::: 71, entonces n! contiene el factor 
primo 2 exactamente 
l~J+l¡J+ ... +l;J < ~+¡+ ... +; = n(1-21k):::: 71-1 
veces, donde las dos desigualdades se convierten en igualdades sólo cuando 
71 = 2k . 
Volvamos a be2 = ae-2 . Estamos estudiando 
y sustituimos las series 
y 
b 
n! 2 --e 2n - 1 
n! -2 a--e 2n - 1 
248 1+-+-+-+ 126 2
r +,+ ... r. 
Para r :::: 71 obtenemos sumandos enteros en ambos lados, a saber 
(1) 
29 
30 
La estimación n! > e ( :;;- ) n nos da, 
de forma explícita, un n que es "sufi-
cientemente grande." 
Algunos números irracionales 
donde para r > O el denominador r! contiene el factor 2 como mucho 
r - 1 veces, en tanto que n! lo contiene exactamente n - 1 veces. (Por tanto, 
para r > O los sumandos son pares.) 
Como n es par (hemos tomado n 
r 2: n + 1 son 
2m ), las series que obtenemos para 
( 
2 4 8 ) 
2b n+1 + (n+1)(n+2) + (n+1)(n+2)(n+3) + ... 
y 
( 
2 4 8 ) 
2a - n+1 + (n+l)(n+2) - (n+1)(n+2)(n+3) ± .... 
Si n es grande, estas series suman, aproximadamente, ~ y - ~ , respectiva-
mente, como se puede comprobar comparando con la serie geométrica. Para 
n = 2m grande, esto quiere decir que el término de la izquierda de (1) es un 
poco mayor que un entero, en tanto que el término de la derecha es un poco 
menor - y esta es la contradicción buscada. D 
Hemos demostrado que é es irracional. Para demostrar queé, é etc. tam-
bién son irracionales necesitamos herramientas más potentes (en concreto, un 
poco más de cálculo infinitesimal) y una nueva idea - originalmente debida 
a Charles Hermite, cuya esencia está contenida en este sencillo lema. 
Lema. Sea n 2: 1 fijo y consideremos 
2n 
(i) Lafunción f(x) es un polinomio de laforma f(x) = ~ :~=>ixi, 
n .. 
donde los coeficientes Ci son enteros. 2=n 
(ii) Para O < x < 1 se tiene que 0< f(x) < ~. n. 
(iii) Las derivadas f(k)(O) y f(k)(l) son enteros para todo k 2: O . 
• Demostración. Las partes (i) y (ii) son evidentes. 
Para demostrar (iii), obsérvese que, según (i), la k-ésima derivada f(k) se anula 
en x = O excepto si n ::; k ::; 2n y, para estos valores de k, f(k) (O) = ~Ck es 
un entero. Def(x) = f(l-x) se deduce que f(k)(x) = (-l)kf(k)(1-x) 
para todo x y, por tanto, f(k) (1) = (-l)k f(k) (O), que es un entero. D 
Teorema 1. eT es irracional para todo r E Q\ {O}. 
• Demostración. Es suficiente demostrar que eS no puede ser racional para 
ningún número natural s (si et fuera racional, entonces (et) t = eS también 
lo sería). Supongamos que eS = % para ciertos enteros a, b > O, Y sea n lo 
suficientemente grande como para que n! > as2n+1 . Sea 
donde f (x) es la función del lema anterior. 
Algunos números irracionales 
F(x) se escribir también como una suma infinita 
F(x) =. s2n f(x) - s2n-l j'(x) + s2n-2 f"(x):::¡= ... , 
ya que las derivadas f(k) (x) se anulan para k > 2n. De aquí se deduce que el 
polinomio F (x) satisface la ecuación 
F'(x) = -3 F(x) + s2n+l f(x). 
Utilizando esta igualdad se obtiene que 
d 
- [e SX F(x)] = sesx F(x) + eSx F'(x) 
dx 
y por tanto, 
N := b !al s2n+lesx f(x)dx = b [e SX F(x)]~ = aF(l) - bF(O). 
Esta expresión es un entero, ya que la parte (iii) del lema asegura que F(O) 
y F(l) son enteros. Sin embargo, la parte (ii) del lema proporciona cotas 
superiores e inferiores para N, 
11 1 as
2n+l 
O < N = b s2n+l esx f(x)dx < bs2n+l es _ = --- < 1, 
o n! n! 
lo que demuestra que N no puede ser un entero, y he aquí la contradic-
ción. D 
Como hemos utilizado este truco con éxito, lo ponemos en práctica una vez 
más. 
Teorema 2. 7f2 es irracional . 
• Demostración. Supongamos que 7f2 = % para ciertos enteros a, b > O. 
Consideremos el polinomio 
F(x) := bn (7f2n f(x) - 7f2n-2 f(2) (x) + 7f2n-4 f(4) (x) :::¡= . " ), 
que verifica la ecuación FI! (x) = _7f2 F(x) + bn7f2n+2 f(x). 
De la parte (iii) del lema se obtiene que F(O) y F(l) son enteros. Derivando 
obtenemos que 
d 
dx [F'(x) sen 7fX - 7fF(x) COS7fx] 
y, por tanto, 
N := 7f !al an f(x) sen 7fX dx 
(FI! (x) + 7f2 F (x) ) sen 7fX 
bn7f2n+2 f(x) sen 7fX 
7f2an f(x) sen 7fX, 
[~F'(x) sen7fx - F(x) COS7fx]: 
F(O) + F(l), 
que es un entero. Además, N es positivo ya que está definido como la 
31 
1[' no es racional, pero tiene "buenas 
aproximaciones" por números raciona-
les - algunas de ellas son conocidas 
desde la antigüedad: 
~ 3.142857142857 .. . 
i{~ 3.141592920353 .. . 
104348 
33215 
1[' 
3.141592653921.. . 
3.141592653589 ... 
32 Algunos números irracionales 
integral de una función positiva (excepto en los extremos). Sin embargo, si 
escogemos n suficientemente grande para que 7ral
n 
< 1, de la parte (ii) del n. 
lema se deduce que 
o < N = 7r 11 an f(x)sen7rxdx < < 1, 
lo cual es una contradicción. D 
Finalmente presentamos nuestro último resultado sobre números irracionales. 
Teorema 3. Para todo entero impar n 2: 3, el número 
A(n) := ~ arccos ()n) 
es irracional. 
Necesitaremos este resultado para el tercer problema de Hilbert (véase el ca-
pítulo 8) en los casos n = 3 Y n = 9. Para n = 2 Y n = 4 se tiene que 
A(2) = ~ y A(4) = !, lo que demuestra que la restricción a valores impares 
de n es esencial. Es sencillo ver que la afirmación "~ arccos (Jn) es irra-
cional" es equivalente, en la figura del margen, a que la poligonal construida 
1 a partir de Jn y tal que todos sus lados tienen la misma longitud, nunca se 
cierra. 
Proponemos como ejercicio para el lector demostrar que A( n) es racional 
solamente para n E {1, 2, 4}. Como indicación, distínganse los casos en que 
n = 2T del resto. 
11 Demostración. Utilizamos la identidad trigonométrica 
cos CIé + cos (3 = 2 cos a!i3 cos a;i3 
que, para CIé = (k + l)ep Y (3 = (k - l)ep, nos proporciona la expresión 
cos (k + l)ep = 2 cos ep cos kep - cos (k - l)ep. (2) 
Para el ángulo epn = arce os (Jn), definido por cos epn = Jn y O ::; epn ::; 7r, 
obtenemos una representación de la forma 
donde Ak es un entero no divisible por n, para todo k 2: O. De hecho, dicha 
representación para k = 0,1 se tiene con Ao = Al = 1 y, por inducción sobre 
k y utilizando (2), obtenemos que para k 2: 1 
De esta expresión se deduce que A k+1 = 2Ak - nAk-1. Si n 2: 3 es impar y 
Ak no es divisible por n, entonces Ak+1 tampoco puede ser divisible por n. 
Algunos números irracionales 
U¡'_H--'u¡o;aULVC> ahora que 
A(n) = 
k 
g 
es racional (donde k,.€ > O son enteros). Haciendo .€'Pn = br se obtiene que 
AR 
±1 = cos br = --r 
,¡n 
R Por tanto,,¡n = ±AR es un entero, con.€ ~ 2, de donde se deduce que 
n I ,¡nR. Como ,¡nR I AR se deduce que n es un divisor de AR, Y hemos llegado 
a una contradicción. O 
[1) C. HERMITE: Sur lafonction exponentielle, Comptes rendus de l'Académie des 
Sciences (Paris) 77 (1873), 18-24; CEuvres de Charles Hermite, Vol. rn, Gauthier-
Villars, Paris 1912, pp. 150-181. 
[2) Y. IWAMOTO: A proof that -¡¡-2 is irrational, J. Osaka Institute of Science and 
Technology 1 (1949),147-148. 
[3) J. F. KOKSMA: On Niven's proof that -¡¡- is irrational, Nieuw Archief voor Wis-
kunde (2) 23 (1949), 39. 
[4) J. LIOUVILLE: Sur l'irrationalité du nombre e = 2,718 ... , Joumal de Mathé-
matiques Pures et Appl. (1) 5 (1840), 192; Addition, 193-194. 
[5) I. NIVEN: A simple proof that -¡¡- is irrational, Bulletin Amer. Math. Soco 53 
(1947),509. 
33 
/ 
Sabemos que la serie infinita ¿n>l ~ no converge. Es más, en el capítulo 1 
hemos visto que incluso la serie I:PElP' ~ diverge. 
Sin embargo, la suma de los recíprocos de los números cuadrados converge 
(muy despacio, como veremos) a un valor interesante. 
La serie de Euler. 
Esto es un resultado clásico, conocido e importante, que demostró Leonhard 
Euler en 1734. Una de sus interpretaciones clave es que proporciona el primer 
valor no trivial ((2) de la función zeta de Riemann (ver el apéndice en la 
página 41). Como vimos en el capítulo 6, este valor es irracional. 
Este resultado comparte su lugar tan destacado en la historia de la matemáti-
cas con algunas demostraciones muy elegantes que se dieron de él. En algunos 
casos la alegría del hallazgo fue compartida por muchos matemáticos. Presen-
taremos a continuación tres de estas demostraciones. 
• Demostración. La primera demostración aparece como ejercicio en e11i-
bro de teoría de números de William 1. LeVeque del año 1956. Pero él mismo 
afirma: "No tengo la menor idea del origen de este problema, pero estoy bas-
tante convencido de que no lo encontré yo." 
La prueba consiste en evaluar de dos maneras diferentes la integral doble 
1 1 
1 := JJ_1-dXdY. 1- xy 
o o 
Para la primera, desarrollamos l!XY como serie geométrica, descomponemos 
los sumandos como productos, e integramos: 
1 1 1 1 
1 J J2~)xytdXdY = L J J xnyndxdy 
o o n~O n~Oo o 
1.000000 
1.250000 
1.361111 
1.423611 
1.463611 
1.491388 
1.644934. 
36 
1 
"2 
1 
v 
x 
u 
1 
Tres veces ]f2 /6 
Esta evaluación también demuestra que esta integral doble (de una función 
positiva con un polo en x = y = 1) es finita. Asimismo, nótese que el 
cómputo se puede efectuar al revés, de manera que la evaluación de ((2) lleva 
a la integral doble J. 
Le segunda manera de evaluar J parte de un cambio de coordenadas: En las 
coordenadas nuevas u := ytx y v := y;x el dominio de integración es un 
cuadrado de arista ~ y2, que se obtiene a partir del dominio antiguo primero 
rotando 45° y después reduciendo según el factor de escala de y2. Sustitu-
yendo x = u - v e y = u+ v nos da 
1 
1- xy 
1 
1- u 2 + v2 ' 
Para transformar la integral tenemos que reemplazar dx dy por 2 du dv, para 
compensar el hecho de que nuestra transformación de coordenadas reduce el 
área según el factor constante 2 (el jacobiano de la transformación; véase el 
recuadro en la página siguiente). Tanto el nuevo dominio de integración como 
la función a integrar son simétricos respecto del eje u, por tanto sólo nos hace 
falta calcular la integral sobre la mitad superior del nuevo dominio, y tener en 
cuenta un factor adicional de 2. Descomponemos esta integral en dos partes 
de manera más natural: 
J dv )d 1- u2 + v2 u. 
J dx 1 x Usando 2 2 = - aretan - + e, obtenemos a +x a a 
1/2 
J 4 J ~ aretan (~) du 1- u2 1- u2 
o 
+ 4J1 ~arctan(~)du. 
1- u2 1- u2 
1/2 
Podríamos evaluar estas integrales sustituyendo u = sen e y u = cos e, 
respectivamente. Pero procederemos de manera más directa, usando que la 
derivada de g(u) := aretan C/1~u2) es g'(u) = v'1~u2' y que la derivada de 
h( u) := arctan (v'~-=-:2) = aretan (Vi+~) es h' (u) = - ~ v'1~u2' De la 
relación J: f'(x)f(x)dx = [~f(x)2l~ = V(b)2 - V(a)2 resulta 
J 4 r1 / 2 g'(u)g(u) du + 41,1 -2h'(u)h(u) du 
Jo 1/2 
2[9(u)2]:/2 - 4[h(u)2]:/2 
2g(~)2 _ 2g(0)2 - 4h(1)2 + 4h(~)2 
2(~)2_0_0+4(~)2 = 7[62 • O 
Tres veces 1T 2 /6 
En esta demostración hemos calculado el valor de la serie de Euler a de 
una integral, usando un sencillo cambio de coordenadas. Una demostración 
ingeniosa de este tipo, pero con un cambio de coordenadas decididamente no 
trivial, fue descubierto más tarde por Beukers, Calabi y Kolk. Su punto de 
partida es separar la suma ¿n>l ;2 en sus términos pares e impares. Los 
términos pares 212 + 12 + l2 +--: .. =¿k2:1 (2k)2 claramente suman ~((2), 
1 ' .. 1 1 1 _"\, 1 Y por tanto os termmos Impares ]2 + 32 + 52 + ... - L..-,k2:0 (2k+l)2 suman 
las tres cuartas partes de la suma total ((2). Queda por demostrar pues que 
1 
k2:0 (2k + 1)2 8 
11 Demostración. Como antes, podemos expresarlo como una integral doble: 
1 1 
J = J J 1 _ ~2y2 dx dy = L (2k: 1)2' 
o o k2:0 
Para calcular esta integral J, Beukers, Calabi y Kolk propusieron pasar a las 
coordenadas nuevas 
~
-X2 
u := arccos 1 2 2 
-xy {§/;_Y2 v := arccos 1 2 2' -xy 
Para efectar el cálculo, ignoramos la frontera del dominio y consideramos x, y 
en los intervalos O < x < 1 Y O < Y < 1. Entonces u, v estarán en el 
triángulo u > O, v > O, u + v < 1T /2. Se puede invertir esta transformación 
de coordenadas de manera explícita, llegando a la substitución 
sen u 
x = --
cosv 
and 
sen v 
Y - ---- . cosu 
Es fácil comprobar que estas fórmulas definen una transformación biyectiva 
entre el interior del cuadrado unidad S = {(x, y) : O :s: x, y :S 1} Y el interior 
del tnángulo T = {(u,v) : u,v:::: O, u + v:S: 1T/2}. 
Ahora tenemos que calcular el jacobiano de esta transformación, y como por 
arte de magia resulta ser 
( 
cosu 
det cosv 
sen u sen v 
cos2 u 
sen u sen v ) 
cos2 V 
cosv 
cosu 
Pero esto significa que la integral que buscamos se transforma en 
7r /2 7r /2-u 
J ¡JI dudv, 
o o 
que es justo el área ~ (~)2 = ~2 del triángulo T. D 
La 
Para evaluar una integral doble 
1 = J f(x,y)dxdy. 
s 
37 
podemos efectuar una sustitución de 
variables 
x=x(u,v) y=y(u,v), 
si la correspondencia de (u, v) E T 
a (x, y) E S es biyectiva y derivable 
con derivada continua. En este caso, 
1 es 
J \d(X,y) I f(x( u, v), y( u, v» de u, v) du dv, 
T 
donde d(x,y) es eIJ'acobiano: 
d(u,v) 
d(x, y) = det ( ~~ 
d(u, v) ~; 
y 
1 
S 
x 
1 
v 
7r 
"2 
T 
dx ) -
dv 
dy . 
dv 
u 
7r 
"2 
38 
Para m = 1,2,3, esto resulta en 
cot2 :¡¡: = i 
cot2 ~ + cot2 2; = 2 
cot2 2': + cot2 271" + cot2 3" = 5 
7 7 7 
Tres veces 1T2 /6 
Maravilloso - y más porque el mismo método se extiende al cálculo de (( 2k ) 
en términos de una integral 2k-dimensional, para todo k > 1. 
Nos referimos al artículo original de Beuker, Calabi y Kolk [2], y al capí-
tulo 20, donde llegaremos a lo mismo por un camino diferente, usando el 
truco de Herglotz y la idea original de Euler. 
Después de ver estas dos demostraciones via transformadas de coordenadas, 
no podemos resistir la tentación de presentar otra, completamente diferente y 
elemental, del hecho que Ln>l ';'2 = ~2. Aparece en una secuencia de ejer-
cicios del libro de problemas de los hermanos gemelos Akiva y Isaak Yaglom, 
cuyo edición original rusa data de 1954. Algunas versiones de la demostración 
original fueron redescubiertas y presentadas por F. Holme (1970), I. Papadi-
mitriou (1973) y Ransford (1982), quien la atribuyó a 10hn Scholes . 
• Demostración.. El primer paso consiste en establecer una relación entre 
valores de la función "cotangente al cuadrado". Para todo m ~ 1, se tiene 
(1) 
Para establecer este resultado, empezamos con la relación 
cos nx + i sen nx = ( cos x + i sen x) n 
y nos fijamos en su parte imaginaria 
sennx = (~)senxcosn-lx- (~)sen3xcosn-3x±... (2) 
Ahora ponemos n = 2m + 1, mientras que para x consideramos los m valores 
diferentes x = 2~~1' para r = 1,2, ... ,m. Para cada uno de estos valores 
tenemos nx = r1T, y por tanto sen nx = O, mientras que O < x < ~ implica 
que para sen x tenemos m valores positivos diferentes. 
En particular, podemos dividir (2) entre senn x, y obtenemos 
esto es, 
para cada uno de los m valores distintos de x. Del polinomio de grado m 
p(t) 
conocemos m raíces distintas 
ar cot
2 (2~~1) for r = 1,2, ... , m. 
Por tanto, el polinomio coincide con 
Tres veces 1T2 /6 
comp1anmdlo los coeficientes de trn - 1 en p( t) deducimos que la suma 
de los raíces es 
lo cu",l demuestra 
2rn(2rn-1) 
6 
También necesitamos una segunda identidad del mismo tipo, 
2 ( 1[") 2 ( 21[" ) 2 ( rn1[" ) _ 2m(2m+2) ese 2rn+1 + ese 2m+1 + ... + ese 2m+1 - 6 ' 
para la función cosecante ese x = se~ x. Pero 
2 1 eos2 x+sen2x 2 
ese x = -- = 2 = eot x + 1, 
sen2 x sen x 
(3) 
y podemos deducir (3) de (1) sumando m a ambos miembros de la ecuación. 
Ahora ya tenemos todas las herramientas a mano, y podemos encajar las piezas 
de la demostración. Usaremos que para O < Y < "i se cumple 
O < sen y < y < tgy, 
y por tanto 
O < eoty < 1. y < esey, 
lo cual implica que 
eot2 y < 1 < ese2 y. y2 
Ahora aplicamos esta desigualdad doble a cada uno de los m distintos valores 
de x, y sumamos los resultados. Empleando (1) para el término a la izquierda 
y (3) para el término de la derecha, obtenemos 
2m(2m-1) 
6 
esto es, 
1["2 2m 2rn-1 1 1 1 
62rn+12rn+1 < 12 + 22 + ... + m 2 
2m(2m+2) 
6 
2 
Tanto el término de la derecha como el de la izquierda convergen a ~ para 
m --+ 00: final de la demostración. O 
¿Cómo de rápido converge ¿ ~2 a 1T2 /6? Para responder a esta pregunta 
hemos de estimar la diferencia 
6 
rn 1 
Ln2 
n=l 
00 
1 L 2· n 
n=m+1 
Comparación de coeficientes: 
Si p(t) = c(t - al) ... (t - am ), 
entonces el coeficiente de t m - l es 
-c(al + ... + a=). 
O<a<b<c 
implica 
0<1.<1.<1. 
e b a 
39 
1 
(m+1)2 
40 
f(t) = :b 
t 
Tres veces 712 /6 
Esto resulta muy fácil mediante la técnica de con una , que 
ya hemos visto en el apéndice al capítulo 2 (página 10). Nos da 
00 1 100 1 1 
"""' < -dt = -
~ n2 m t 2 m 
n=m+1 
como cota superior y 
1 1
00 1 
> ?dt = 
m+1 t~ m+ 1 
como cota inferior para los "sumandos restantes" - o incluso 
00 1 100 1 1 - > -dt - --¿ n2 1 t 2 - m + .1 
n=m+l m+" 2 
si efectuamos la estimación con algo más de cuidado, utilizando el hecho de 
que la función f (t) = :b es convexa. 
Esto quiere decir que nuestra serie no converge muy rápidamente. Si sumamos 
los primeros mil sumandos, esperamos un error en el tercer dígito después de 
la coma, y para la suma del primer millón de sumandos (m = 1000000) un 
error en el sexto dígito, y efectivamente eso es lo que obtenemos. Pero ahora 
viene una gran sorpresa: hasta los primeros 45 dígitos, 
1.644934066848226436472415166646025189218949901, 
1.644933066848726436305748499979391855885616544. 
Efectivamente, el sexto dígito decimal es falso (esuna unidad mayor), pero 
¡los seis dígitos siguientes son correctos! Y después hay un dígito equivocado 
(es cinco unidades más grande), y luego hay cinco correctos. Este descubri-
miento sorprendente es bastante reciente: lo hizo Roy D. North de Colorado 
Springs en 1988. (En 1982, Martin R. Powell, un maestro de Amersham, Bu-
cks (Inglaterra), no llegó a notar todo este efecto por razón de los insuficientes 
recursos de cálculo que tenía entonces.) Es demasiado extraño para ser una 
coincidencia. .. Fijémonos en el error de la aproximación: hasta los primeros 
45 dígitos es 
= 0.000000999999500000166666666666633333333333357, 
y claramente hay algún patrón. Se puede escribir este número como 
+10-6 - ~1O-12 + i lO- 18 - 310 10- 30 + 12 10- 42 + ... 
donde los coeficientes (1, ~,i, O, -lo, o, 412) de 1O-6i son el principio de la 
sucesión de los números de Bernoulli que volveremos a ver en el capítulo 20. 
El lector interesado puede consultar el artículo original de Borwein, Borwein 
y Dilcher [3] para más "coincidencias" extrañas - y para demostraciones. 
Tres veces ]f2 /6 
Lafunción zeta de Riemann (( 8) se define para números reales 8 > 1 mediante 
1 
((8) := ~-. 6 n s 
n2:1 
Nuestras estimaciones para Hn (ver página 10) implican que la serie ((1) 
diverge, pero ((8) sí converge para cualquier número real 8 > 1. La función 
zeta tiene una continuación canónica al todo el plano complejo (con un polo 
simple en 8 = 1), que se puede construir mediante expansiones en series de 
potencias. La función compleja que resulta es de máxima importancia para la 
teoría de los números primos. Mencionaremos tres conexiones: 
(1) Euler halló la identidad notable 
Codifica el hecho fundamental que cualquier número natural tiene una des-
composición única (!) en factores primos; usando este hecho, la identidad de 
Euler es una consecuencia sencilla de la serie geométrica 
1 1 1 1 
= 1+-+-2-+-3-+", pS P s P s 1- p-s 
(2) La ubicación de los ceros complejos de la función zeta de Riemann es 
el tema de la "hipótesis de Riemann", una de las conjeturas más famosas e 
importantes sin resolver de toda la Matemática. Afirma que todos los ceros no 
triviales 8 E re de la función zeta satisfacen Re( 8) = ~. (La función zeta se 
anula en todos los enteros negativos, que se llaman los "ceros triviales".) 
Muy recientemente, Jeff Lagarias demostró que, de manera bastante sorpren-
dente, la hipótesis de Riemann es equivalente al siguiente enunciado elemen-
tal: Para todo n 2: 1, 
L d < Hn + exp(Hn ) 10g(Hn ), 
dln 
con igualdad sólo para n = 1, donde Hn es como antes el n-ésimo número 
harmónico. 
(3) Se sabe desde hace mucho que (( 8) es un múltiplo racional de ]fs, y por 
tanto irracional, si 8 es un entero par 8 2: 2; ver capítulo 20. En cambio, la 
irracionalidad de ((3) fue probada por Roger Apéry sólo en 1979. A pesar de 
notables esfuerzos nuestros conocimientos sobre (( 8) para los demás enteros 
impares 8 = 2t + 1 2: 5 son bastante incompletos. Muy recientemente, 
Keith Ball y Tanguy Rivoal demostraron que hay un número infinito de valores 
irracionales de ((2t+ 1). Es más, aunque no se puede afirmar la irracionalidad 
de (( 8) para ningún valor impar 8 2: 5 concreto, Wadim Zudilin ha conseguido 
demostrar que por lo menos uno de los cuatro valores ((5), ((7), ((9) y ((11) 
es irracional. Referimos el lector al bonito artículo de revisión de Fischler [4]. 
41 
42 Tres veces 7f2 /6 
[1] K. BALL & T. RIVOAL: ¡rrationalité d'une infinité de valeurs de lafonetion zeta 
aux entiers impairs, Inventiones math. 146 (2001),193-207. 
[2] F. BEUKERS, J. A. C. KOLK & E. CALABI: Sums ofgeneralized harmonie series 
and volumes, Nieuw Archief voor Wiskunde (4) 11 (1993), 217-224. 
[3] J. M. BORWEIN, P. B. BORWEIN & K. DILCHER: Pi, Eulernumbers, andasymp-
totie expansions, Amer. Math. Month1y 96 (1989),681-687. 
[4] S. FISCHLER: ¡rrationalité de valeurs de zeta (d'apres Apéry, Rivoal, ... ), 
Bourbaki Serninar, No. 910, November 2002; to appear in Astérisque; Preprint 
arXiv: math. NT /0303066, March 2003, 45 pages. 
[5] J. C. LAGARIAS: An elementary problem equivalent to the Riemann hypothesis, 
Amer. Math. Monthly 109 (2002), 534-543. 
[6] W. J. LEVEQUE: Topies in Number Theory, Vol. I, Addison-Wesley, Reading MA 
1956. 
[7] A. M. YAGLOM & l. M. YAGLOM: Challenging mathematieal problems with 
elementary solutions, Vol. n, Holden-Day, Inc., San Francisco, CA 1967. 
[8] W. ZUDILIN: Arithmetic of linear forms involving odd zeta values, Preprint~ Au-
gust 2001,42 pages; arXi v: math. NT /0206176. 
a 
El tercer problema de Hilbert: 
descomposición de poliedros 45 
9 
Rectas en el plano 
y descomposición de grafos 53 
10 
El problema de la pendiente 59 
11 
Tres aplicaciones 
de la fórmula de.Euler 65 
12 
El teorema de rigidez 
de Cauchy 71 
13 
Símplices en contacto 75 
14 
Cualquier conjunto con muchos 
puntos tiene un ángulo obtuso 79 
15 
La conjetura de Borsuk 85 
"Los sólidos platónicos, 
¡un juego de niños!" 
En su famosa conferencia en el Congreso Internacional de Matemáticos en 
París en 1900, David Hilbert propuso, como tercero de sus 23 problemas, 
encontrar 
"dos tetraedros de igual base e igual altura que ser descom-
puestos en tetraedros congruentes, ni tampoco combinados con otros 
tetraedros congruentes para formar dos poliedros que a su vez puedan 
descomponerse en tetraedros congruentes." 
El origen de este problema se remonta a dos cartas de Carl Friedrich Gauss 
fechadas en 1844 (publicadas en 1900 en las obras completas de Gauss). Si 
dos tetraedos del mismo volumen pudieran ser descompuestos en dos piezas 
congruentes, estaríamos ante una demostración "elemental" del teorema XII 5 
de Euclides, que afirma que dos pirámides de igual base e igual altura tienen 
el mismo volumen. Por lo tanto, proporcionaría una definición elemental del 
volumen de un poliedro (que no se basaría en el análisis, y por tanto tampoco 
en argumentos de continuidad). Una afirmación similar es cierta en geometría David Hilbert 
plana: El teorema de Bolyai-Gerwien [1, Sect 2.7] afirma que dos polígonos 
planos cualesquiera son a la vez equidescomponibles (pueden ser descom-
puestos en triángulos congruentes) y equicompletables (pueden convertirse en 
congruentes añadiéndoles triángulos congruentes) si y sólo si tienen la misma 
área. 
La cruz es equicompletable con un cua-
drado de la misma área. 
De hecho, son incluso equidescomponibles. 
46 El tercer problema de Hilbert: descomposición de poliedros 
Como se ver a de su formulación del Hilbert 
que no se verificase un teorema análogo en dimensión 3, y estaba en lo cierto. 
El problema fue resuelto por su estudiante Max Dehn en dos trabajos. En el 
primero, que se publicó en 1902, mostraba tetraedros equidescomponibles de 
igual base y altura; sin embargo, los trabajos de Dehn no son de fácil compren-
sión, y es difícil saber si no cayó en la misma trampa que otros: Bricard (¡en 
1896t), Meschowski (1960) y probablemente otros propusieron demostracio-
nes muy elegantes, pero desafortunadamente incorrectas. Afortunadamente, 
la demostración de Dehn fue revisada y elaborada de nuevo, y después del 
esfuerzo conjunto de V. F. Kagan (1903/1930), Hugo Hadwiger (1949/54) y 
Vladimir G. Boltianskii, podemos exponer en este capítulo una demostración 
de El Libro. (El apéndice proporciona algunos conceptos básicos sobre polie-
dros.) 
(1) Unas nociones de álgebra lineal 
Para cualquier conjunto finito de números reales M = {mI, . .. ,mk} <;;; lR, 
definimos V(M) como el conjunto de todas las combinaciones lineales de 
números en M con coeficientes racionales, esto es, 
k 
V(M) := { L qimi : qi E Q} <;;; lR. 
i=1 
La primera observación (trivial, pero importante) es que V(M) es un espa-
cio vectorial finito sobre el cuerpo Q de los números racionales. De hecho, 
V(M) es cerrado bajo sumas y multiplicaciones por racionales, y los axio-
mas de cuerpo para lR hacen de V(l\!I) un espacio vectorial. La dimensión de 
V(M) es el cardinal de cualquierconjunto minimal de generadores. Puesto 
que por definición M genera a V (M), ha de contener un conjunto minimal de 
generadores. De aquí, 
dimQ V(M) ~ k = IMI. 
En adelante, utilizaremos funciones lineales sobre Q 
j : V(M) --+ Q, 
es decir, aplicaciones lineales entre Q-espacios vectoriales. La propiedad 
clave es que para cualquier relación de dependencia lineal 2:7=1 qimi = O 
con qi E Q, se ha de verificar que 2:7=1 qd(mi) = j(O) = O. 
Este sencillo lema será esencial para la resolución del problema de Hilbert: 
Lema. Para dos subconjuntos M <;;; M' finitos de lR cualesquiera, el Q-
espacio vectorial V(M) es un subespacio de V(M'). Por tanto, cualquier 
función Q-lineal j : V (M) --+ Q puede ser extendida a una función Q-lineal 
j' : V(M') --+ Q tal que j'(m) = j(m) para todo m E M . 
• Demostración. Cualquier función Q-lineal V(M) --+ Q queda determi-
nada al fijar las imágenes de una Q-base de V(M). El lema es una conse-
cuencia de que cualquier base de V (M) puede ser extendida a una base de 
V(M' ). D 
El tercer problema de Hilbert: descomposición de poliedros 
Invariantes Dehn 
Para un poliedro tridimensional P, sea M p el conjunto de todos los ángulos 
entre caras adyacentes (ángulos diedros), junto con el número 1T. Por ejem-
plo, para un cubo C tenemos Me = {~,1T},mientras que para un prisma 
ortogonal Q sobre un triángulo equilátero obtenemos M Q = {~, ~, 1T}. 
Dado cualquier conjunto finito M <;;; IR que contenga a M p , y cualquier fun-
ción Q-lineal 
j : V(M) ---+ Q 
que satisfaga j(1T) = O, definimos el invariante de Dehn de P (con respecto 
a f) como el número real 
Df(P) := I:: /!(e) . j(a(e)), 
eEP 
donde la suma se extiende sobre todas las aristas e del poliedro, /!( e) es la 
longitud de e, y a( e) el ángulo diedro entre dos caras incidentes a e. 
Calcularemos más adelante algunos invariantes de Dehn. Por ahora, fijémonos 
simplemente en que j (~) = ~ j (1T) = O tiene que verificarse para cualquier 
función Q-lineal j, y por tanto 
Df(C) = O, 
es decir, el invariante de Dehn de un cubo es cero respecto de cualquier j. 
(3) Teorema de Dehn-Hadwiger 
Como antes, llamaremos a dos poliedros P, Q equidescomponibles si pueden 
descomponerse en un conjunto finito de poliedros PI, ... , Pn Y Q1, ... , Qn 
tales que Pi y Qi son congruentes para todo i (1 :S i :S n). Dos poliedros 
son equicompletables si existen poliedros PI, ... ,P m Y Q1, ... , Qm tales que 
los interiores de los Pi son disjuntos dos a dos y disjuntos de P, y de manera 
similar para los Qi y Q; además, Pi ha de ser congruente con Qi para todo i, y 
P := PUP1 UP2 U . " UPm y Q := QUQ1 UQ2 U '" UQm han de ser equi-
descomponibles. Un teorema demostrado por Gerling en 1844 implica que no 
influye si se admiten o no reflexiones a la hora de considerar congruencias. 
Es claro que poliedros equidescomponibles son equicompletables, pero el re-
cíproco no es evidente. El siguiente teorema de Hadwiger (en la versión de 
Boltianskii) proporciona una herramienta para encontrar - tal y como pro-
puso Hilbert - tetraedros de igual volumen que no son equicompletables, y 
por tanto tampoco equidescomponibles. 
Teorema. Sean P y Q poliedros con ángulos diedros al, ... , a p y 131, ... ,Pq 
respectivamente, y sea M un conjunto finito de los números reales tal que 
Si j : V (M) ---+ Q es cualquier función Q-lineal con j (1T) = O Y tal que 
Df(P) -¡. Df(Q), 
entonces P y Q no son equicompletables. 
47 
48 
f---/-----{/ 
D 
e 
B 
El tercer problema de Hilbert: descomposición de poliedros 
• Demostración. La demostración tiene dos 
Si un poliedro P puede descomponerse en un número finito de poliedros 
PI, . .. ,Pn , Y si todos los ángulos diedros de estos PI, . .. ,Pn están conteni-
dos en el conjunto NI, entonces para cada función CQl-lineal j : V(M) ---+ CQl, 
los invariantes de Dehn se suman y resulta 
Para verlo, asociamos a cada parte de cualquier arista de un poliedro una masa: 
Si el <::.; e es una parte de una arista e de P, entonces su masa es 
mj(e/) :=e(e/) j(a(e/)), 
su longitud multiplicada por el valor que toma j en su ángulo diedro. 
Si P se descompone en PI, ... , P n, consideraremos todas las aristas de todas 
las piezas. Comprobamos que la suma de los ángulos diedros de las piezas a 
lo largo de el es el ángulo diedro de P en el, y por lo tanto lo mismo se cumple 
para las masas. 
Para cualquier otra arista el! de algún Pi, contenida en el interior de P o de 
una de sus caras, la suma de los ángulos diedros es 1f Ó 21f. Así, la suma de 
los valores de j en todos los ángulos de todas las piezas es o bien j(1f) = O, 
o bien j(21f) = O. En consecuencia, para la suma de las masas obtenemos el 
mismo valor que se había asignado a estas aristas en P, es decir, O. 
(2) Suponiendo que P y Q son equicompletables, podemos extender M a 
un conjunto mayor MI que también incluya todos los ángulos diedros que 
aparecen en cualquiera de las piezas involucradas. MI es finito, ya que sólo 
consideramos descomposiciones finitas. Por lo tanto, el lema que se expuso 
anteriormente nos permite extender j a l' : V(MI ) ---+ CQl, y de la parte (1) se 
desprende una ecuación del tipo 
donde D J' (Pi) = D J' (Qi) ya que Pi y Qi son congruentes. Concluimos pues 
que Dj(P) = Df(Q), lo cual es una contradicción. O 
Ejemplo 1. Para un tetraedro regular To cuyas aristas miden f unidades de 
longitud, calculamos el ángulo diedro apoyándonos en el dibujo. El punto 
medio M de la base del triángulo divide a la altura AE de la base en dos 
segmentos en razón 1:2. Puesto que IAEI = IDEI, se tiene cos a = !, y por 
tanto 
_ 1 
a - arccos 3' 
Haciendo M := {a, 1f} observamos que la razón 
1 1 - arceos-
1f 3 
es irracional, según el teorema 3 del capítulo 6 (tomando n = 9). Por tanto, 
el CQl-espaeio vectorial V(M) tiene dimensión 2; una base es M, y existe una 
función CQl-lineal j : V(M) ---+ CQl tal que 
j(a) := 1, j(1f) := O. 
El tercer problema de Hilbert: descomposición de poliedros 
Para esta f tenemos 
Df(To) = 61:f(a) = 61: i= O, 
y por tanto un tetraedro regular no es ni equidescomponible ni equicomple-
table con un cubo, ya que el invariante de Dehn de un cubo se anula para 
cualquier f. 
~_.~ ... " •. ~ 2. Sea TI un tetraedro determinado por tres aristas ortogonales AB, 
Ae, AD de longitud u. Este tetraedro tiene como ángulos diedros tres ángulos 
rectos, y otros tres más de igual amplitud tp, que calculamos a partir del dibujo: 
IAEI ~V2u 1 
cbs tp 
IDEI ~\1'3 V2u \1'3' 
Se sigue que 
1 
tp= arccos \1'3' 
Para M : = {i, arccos Js, 1f}, el CQl-espacio vectorial V (M) tiene dimensión 
2: primero, V(M) = V( {arccos Js, 1f}), ya que 1f y i son linealmente 
dependientes. Además, no hay ninguna relación con coeficientes racionales 
entre arccos Js y 1f; esto es equivalente a que ~ arccos Js es irracional, tal y 
como se probó en el capítulo 6 (con n = 3 en el teorema 3). 
De este modo, podemos construir una aplicación CQl-lineal f haciendo 
f(1f) := O y f( arccos Js) := 1, 
de la cual obtenemos f ( i) = O, y de aquí que 
Df(TI ) = 3uf(i) +3(V2u)f(arccosJs) = 3V2u i= O. 
Esto prueba que TI no es equidescomponible ni equicompletable con un cubo e 
del mismo volumen, ya que se verifica D f (e) = O para cualquier f. 
Ejemplo 3. Finalmente, sea T2 un tetraedro con tres aristas consecutivas AB, 
Be y e D que son ortogonales entre sí y de igual longitud u. 
No calcularemos los ángulos de un tetraedro de este tipo (son i, ~ y :f), sino 
que argumentaremos - utilizando los puntos medios de las aristas y caras, y 
el centro - que un cubo cuya arista tiene longitud u puede ser descompuesto 
en 6 de estos tetraedros (3 copias congruentes y sus respectivas imágenes es-
peculares) . 
Todos estos tetraedros tienen el mismo invariante de Dehn, y por lo tanto, para 
cualquier función f apropiada, obtenemos 
1 
Df (T2 ) = 6Df(e) = O, 
i así que todos los invariantes de Dehn se anulan en este tipo de tetraedros! 
Esto resuelve el tercer problema de Hilbert, ya que hemos construido otro 
tetraedro TI;ambos tienen bases congruentes e igual altura, y D f (Td i= O. 
Por el teorema de Dehn-Hadwiger, TI y T2 no son equidescomponibles, y ni 
siquiera equicompletables. 
49 
D 
e 
B 
D 
u 
e 
A 
50 El tercer problema de Hilbert: descomposición de poliedros 
y 
Un politopo convexo en ]Rd es el cierre convexo de cualquier conjunto finito 
S = {SI, ... , Sn}, es decir, un conjunto de la forma 
n n 
P = conv(S) := {I>'iSi:Ai20, I:Ai=l}. 
i=1 i=1 
Los politopos resultan ser objetos familiares. Ejemplos paradigmáticos son 
los polígonos convexos (politopos convexos en 2 dimensiones) y los poliedros 
convexos (politopos convexos en dimensión 3). 
Hay algunos tipos de poliedros que pueden generalizarse a dimensiones ma-
yores de manera natural. Por ejemplo, si S es un conjunto formado por d + 1 
puntos afínmente independientes, entonces conv(S) es un símplice de dimen-
sión d (o d-símplice). Para el caso d = 2 se trata de un triángulo, y para d = 3 
obtenemos un tetraedro. De forma similar, los cuadrados y los cubos son ca-
sos particulares de los cubos de dimensión d, como también lo es en general 
el d-cubo unidad Cd = [O, l]d ~ ]Rd. 
Los politopos generales son uniones finitas de politopos convexos. En este 
libro, los poliedros no convexos aparecerán relacionados con el teorema de 
rigidez de Cauchy en el capítulo 12, y los polígonos no convexos en relación 
con la fórmula de Pick, en el capítulo 11, y de nuevo cuando discutamos el 
teorema de la galería del arte en el capítulo 31. 
Los poli topos convexos pueden ser definidos, de manera equivalente, como 
conjuntos acotados de soluciones de un sistema finito de inecuaciones lineales. 
Por tanto, cada politopo convexo P ~ ]Rd admite una representación de la 
forma 
P = {x E ]Rd : Ax :s; b} 
para alguna matriz A E ]Rmxd y un vector b E ]Rm. En otras palabras, P es el 
conjunto de soluciones de un sistema de m inecuaciones lineales af x :s; bi , 
donde af es la i-ésima fila de A. Recíprocamente, todo conjunto acotado de 
soluciones de un sistema de este tipo es un politopo convexo y en consecuencia 
puede ser representado como el cierre convexo de un conjunto finito de puntos. 
Algunos politopos comunes: tetraedro, Para polígonos y poliedros utilizamos conceptos familiares como vértices, 
cubo y permutaedro aristas, y caras de dimensión 2. Podemos definir las caras de un politopo 
convexo en dimensión mayor de la manera siguiente: Una cara de P es un 
subconjunto F ~ P de la forma P n {x E ]Rd : aT x = b}, donde aT x :s; b 
es una desigualdad lineal válida para todos los puntos x E P. 
Todas las caras de un politopo son, a su vez, politopos. El conjunto V de vérti-
ces (cara de dimensión O) de un politopo convexo es también el conjunto más 
pequeño tal que conv(V) = P. Suponiendo que P ~ ]Rd es un poUtopo con-
vexo de dimensión d, las facetas (caras de dimensión (d-l) determinan un 
conjunto mínimo de hiperplanos, y por tanto, de semiespacios que contienen 
a P, y cuya intersección es P. En particular, esto implica algo que necesitare-
mos más adelante: Sea F una faceta de P; HF el hiperplano que determina, 
y Hj; Y H;; los dos semiespacios cerrados y acotados por HF . Entonces uno 
de estos dos semiespacios contiene a P (y el otro no). 
El tercer problema de Hilbert: descomposición de poliedros 51 
.~---------------------------------------------
El del convexo P viene dado por el V de vérti-
ces del politopo y por un conjunto E de aristas, que son las caras de dimensión 
1 de P. Si P tiene dimensión 3, este grafo es planar, y se verifica la conocida 
"fórmula de Euler" (véase el capítulo 1 
Dos politopos P, pI c::: lRd son congruentes si existe alguna aplicación afín 
que conserva las distancias y que transforma P en PI. Tal aplicación puede 
invertir la orientación del espacio, como hace por ejemplo la reflexión en un 
hiperplano, que transforma P en su imagen especular. Se dice que los polito-
pos son combinatoriamente equivalentes si existe una biyección de las caras 
de P en las caras de pI que conserva la dimensión y la relación de inclusión 
entre las caras. Esta noción de equivalencia es mucho más débil que la de 
congruencia; por ejemplo, la figura del margen muestra un cubo unidad y otro 
deformado. Los dos politopos son combinatoriamente equivalentes (por tanto, 
podríamos llamar "cubo" a cualquiera de ellas), pero evidentemente no son 
congruentes. 
Un politopo (o en general un subconjunto cualquiera de lRd ) tiene simetría 
central si existe algún punto Xo E lR d tal que 
Xo + x E P ~ Xo - x E P. 
En esta situación, Xo se llama el centro de P. 
[1] V. G. BOLTIANSKII: Hilbert's Third Problem, V. H. Winston & Sons (Halsted 
Press, John Wiley & Sons), Washington DC 1978. 
[2] M. DEHN: Ueber raumgleiche Polyeder, Nachrichten von der Konigl. Gesells-
chaft der Wissenschaften, Mathematisch-physikalische Klasse (1900), 345-354. 
[3] M. DEHN: Ueber den Rauminhalt, Mathematische Annalen 55 (1902), 
465-478. 
[4] C. F. GAUSS: "Congruenz und Symmetrie": Briefwechsel mit Gerling, 
pp. 240-249 en: Werke, Band VIII, Konigl. Gesellschaft der Wissenschaften zu 
Gottingen; B. G. Teubner, Leipzig 1900. 
[5] D. HILBERT: Mathematical Problems, Lecture delivered at the Intemational Con-
gress of Mathematicians at Paris in 1900, Bulletin Amer. Math. Soco 8 (1902), 
437-479. 
[6] G. M. ZIEGLER: Lectures on Polytopes, Graduate Texts in Mathematics 152, 
Springer-Verlag, New York 1995/1998. 
Dos politopos no congruentes, pero 
combinatoriamente equivalentes 
El problema tal vez más conocido sobre configuraciones de rectas fue pro-
por Sylvester en 1893 en una columna sobre matemáticos 
de la revista Educational Times. 
No está claro si el propio Sylvester tenía una demostración - en cualquier 
caso, la solución que se publicó en la Educational Times no tiene mucho sen-
tido. Unos 40 años más tarde, Tibor Gallai [Grünwald] dio una solución co-
rrecta. Por ello se atribuye el siguiente teorema comúnmente a ambos. Des-
pués de la demostración de Gallai aparecieron otras, pero la siguiente, de L. 
M. Kelly, puede considerarse "simplemente la mejor." 
Teorema 1. En cualquier configuración de n puntos no alineados en el plano, 
existe una recta que contiene exactamente dos de los puntos. 
Demostración. Sea P el conjunto de puntos dado y considérese el conjunto 
L de todas las rectas que pasan por al menos dos puntos de P. Entre todos los 
pares (P, R) tales que P no está sobre R, elegimos un par (Po, Ro) tal que Po 
tenga distancia mínima a Ro. Llamaremos Q al punto más cercano a Po sobre 
la recta Ro (esto es, en la perpendicular a Ro por Po). 
¡tr,m{irCl!')n. ¡Esta recta Ro verifica el teorema! Ro 
De otro modo, Ro contiene al menos tres puntos de p, y por tanto dos de 
ellos, pongamos P1 y P2 , están al mismo lado de Q. Suponemos que P1 está 
entre Q y P2 , donde P1 puede coincidir con Q (véase el margen). Se sigue 
que la distancia de P1 a la recta R 1 que determinan Po Y P2 es menor que la 
distancia de Po a Ro, Y esto contradice nuestra elección de Ro Y Po. O 
En la demostración hemos utilizado axiomas métricos (la distancia más corta) 
y axiomas de orden (P1 está entre Q y P2 ) en el plano real. ¿Necesitamos 
realmente estas propiedades, más allá de los axiomas habituales de incidencia 
de puntos y rectas? Alguna condición adicional sí hace falta, como demuestra 
el famoso plano de Fano dibujado en el margen. Aquí P = {l, 2, .. " 7} 
Y L está formado por las 7 rectas por tres puntos que se indican en la figura, 
incluyendo la "recta" {4, 5, 6}. Cualesquiera dos puntos determinan una única 
recta, de modo que se satisfacen los axiomas de incidencia, pero no existe 
ninguna recta que pase por dos puntos. Por tanto, el teorema de Sylvester-
Gallai muestra que la configuración de Fano no puede ser dibujada en el plano 
real de manera que los 7 tripletes colineales estén sobre rectas reales: ha de 
haber siempre una recta "quebrada". 1 
J. J. Sylvester 
Po 
Q 
3 
6 2 
54 Rectas en el plano y descomposición de grafosSin Coxeter demostró que los axiomas de orden son suficientes para 
una demostración del teorema de Sylvester-Gallai. Por tanto, puede darse 
una demostración que no utilice propiedades métricas - véase también la 
demostración que darnos en el capítulo 11, utilizando la fórmula de EuJer. 
El teorema de Sylvester-Gallai implica directamente otro famoso resultado 
sobre puntos y rectas en el plano, debido a Paul Erdos y Nicolaas G. de Bruijn. 
Pero este otro resultado se verifica de manera general para configuraciones 
arbitrarias de puntos y rectas, tal y como observaron Erdos y de Bruijn. En 
breve veremos este resultado más general. 
Teorema 2. Sea P un conjunto de n 2" 3 puntos no alineados en el plano. 
Entonces el conjunto 1: de rectas que pasan por al menos dos puntos contiene 
al menos n rectas . 
• Demostración. Para n = 3 no hay nada que demostrar. Ahora procedemos 
por inducción sobre n. Sea IPI = n + 1. Por el teorema anterior, existe una 
recta Ro E 1: que contiene exactamente dos puntos P y Q de P. Consideramos 
el conjunto P' = P\ {Q} y el conjunto 1:' de rectas determinado por P'. Si 
los puntos de P' no están alineados, entonces por inducción 11:' 1 2" n y de aquí 
que 11:1 2" n + 1, por la recta adicional Ro en 1:. Por otra parte, si los puntos 
de P' están todos alineados, entonces tenemos el "abanico" de la figura, el 
cual nos da exactamente n + 1 rectas. D 
Ahora, como prometimos, probaremos el resultado general, que se puede apli-
car a "geometrías de incidencia" mucho más generales. 
Teorema 3. Sea X un conjunto de n 2" 3 elementos, y sean Al, ... , Am 
subconjuntos propios de X, tales que cualquier par de elementos de X está 
contenido precisamente en uno de los conjuntos Ai. Entonces m 2" n . 
• Demostración. 
La siguiente demostración, atribuida tanto a Motzkin como a Conway, es muy 
corta y verdaderamente digna de mención. Para todo x E X sea 'r x el número 
de conjuntos Ai que contienen a x. (Nótese que por hipótesis, 2 :S 'rx < m.) 
Ahora, si x ti:. A i , entonces 'rx 2" IAi 1 porque los IAil conjuntos que contienen 
a x y a un elemento de Ai han de ser distintos. Supongamos que m < n; 
entonces mlAil < n'rx y por tanto m(n - 1) > n(m - 'rx ) para x ~ Ai' 
Pero ahora nos encontramos con que 
lo cual es absurdo. D 
Hay otra demostración muy breve de este teorema que utiliza álgebra lineal. 
Sea B la matriz de incidencia de (X; Al,' .. , A m ). Esto quiere decir que 
etiquetamos las filas en B mediante los elementos de X, y las columnas según 
Al, ... , Am; además, tenemos que 
si x E A 
si x ti:. A. 
Consideramos el producto BBT . Para x el x' tenemos (BBT)xxf = 1, ya 
que x y x' están contenidos precisamente en un conjunto A i , de modo que 
Rectas en el plano y descomposición de grafos 
o 
o 
1 
1 
1 ; 1 
donde T x se define como antes. Como la plimera matliz es definida positiva 
(tiene únicamente autovalores positivos) y la segunda es semidefinida positiva 
(tiene como autovalores n y O), deducimos que BBT es definida positiva; en 
particular, es invertible, y el rango de BBT es n. Se sigue que el rango de la 
matriz B, de dimensiones (n x m), es al menos n, y concluimos que, de hecho, 
n :::; m, ya que el rango no puede ser mayor que el número de columnas. 
Vayamos un poco más allá y volvamos a la teoría de grafos. (Hacemos una 
revisión de los conceptos básicos de teoría de grafos al final de este capítulo.) 
Un momento de reflexión basta para comprobar que la siguiente afirmación es 
en realidad la misma que la que enuncia el teorema 3: 
Si descomponemos un grafo completo Kn en m subgrafos comple-
tos diferentes de Kn. de tal modo que cada arista esté en un único 
subgrafo completo, entonces m;::: n. 
De hecho, si hacemos corresponder X con el conjunto de vértices de Kn y 
los conjuntos Ai con los conjuntos de vértices de los sub grafos completos, 
entonces las afirmaciones son idénticas. 
Nuestra próxima tarea es descomponer Kn en grafos completos bipartitos de 
tal modo que de nuevo cada arista esté exactamente en uno de esos grafos. 
Para ello, numeramos los vértices {1, 2, ... , n}, y unimos 1 con el resto de 
los vértices. Así obtenemos el grafo bipartito completo KI,n-1 (una estre-
lla). Luego unimos 2 con 3, ... ,n para obtener una estrella K I ,n-2; al seguir 
de esta manera, Kn queda descompuesto en una selie de estrellas KI,n-l, 
K I ,n-2, ... , KI,I, es decir, en n - 1 grafos bipartitos completos. 
¿Será posible hacerlo mejor, utilizando menos grafos? El siguiente resultado, 
de Ron Graham y Henry O. Pollak, asegura que no: 
Teorema 4. Si se descompone Kn en grafos bipartitos completos H I, ... , Hm, 
entonces m ;::: n - 1. 
Lo interesante es que, en contraste con el teorema de Erd6s-de Bruijn, nadie 
ha sabido dar una demostración combinatolia para este resultado. Todas las 
que conocemos utilizan álgebra lineal de una u otra manera. De todas las ideas 
más o menos equivalentes, veremos la demostración de Tverberg, que puede 
que sea la más transparente. 
Demostración. Sean {1, ... , n} el conjunto de vértices de K n y sean 
L j , Rj los conjuntos de vértices que definen el grafo bipartito completo Hj, 
para j = 1, ... , m. A cada vértice i asociamos una variable Xi. Como Kn 
está descompuesto en H I , ... ,Hm, tenemos 
(1) 
Ahora supongamos que el teorema es falso y que, por tanto, m < n - 1. 
55 
Descomposición de K5 en 4 subgrafos 
bipartitos completos. 
56 
G: 
Un grafo G con 7 vértices y 11 aristas. 
Tiene un bucle, una arista doble y una 
arista triple. 
Los grafos completos Kn de n vértices 
y G) aristas 
Los grafos bipartitos completos Km,n 
con m + n vértices y mn aristas 
Rectas en el plano y descomposición de grafos 
Entonces el sistema de equaciones lineales 
Xl + ... + x n O, 
O (k=l, ... ,m) 
tiene menos ecuaciones que variables, y por tanto existe una solución no trivial 
cl, ... ,cn · Por (1) inferimos que 
¿CíCj O. 
i<j 
Pero esto implica 
n 
¿C7 > O, 
í=l í<j i=l 
una contradicción, y la demostración está completa. o 
Los grafos están entre las estructuras más básicas de las matemáticas. En con-
secuencia, pueden tener apariencia, representaciones y formas muy diversas. 
De manera abstracta, un grafo es un par G = (V, E), donde Ves el conjunto 
de vértices, E es el conjunto de aristas, y cada arista e E E "conecta" dos 
vértices v, w E V. Consideramos únicamente grafos finitos, es decir, que V y 
E son finitos. 
Normalmente trabajamos con grafos simples, en los que no se admiten bucles, 
es decir, aristas en las cuales los extremos coinciden, ni tampoco aristas múl-
tiples, que tienen el mismo conjunto de extremos. Los vértices de un grafo se 
llaman adyacentes o vecinos si están en los extremos de una arista. Un vértice 
y una arista se llaman incidentes si la arista tiene a ese vértice como extremo. 
A continuación mostramos una pequeña galería de grafos simples importantes: 
@I @I 
K~ K~ Kl,l 
K 2 ,2 
~ 
K 2 ,3 
K 3 ,3 ~ 
Rectas en el plano y descomposición de grafos 
Dos grafos G = (V, E) Y G' = (V', E') se consideran isomorfos si existen 
biyecciones V -+V' y E -+ E' que conservan la incidencia entre aristas y sus 
extremos. (Si existe o no un método eficiente para decidir si dos grafos dados 
son equivalentes es un problema aún sin resolver.) Esta noción de isomorfismo 
nos permite hablar de el grafo completo K5 de S vértices, etc. 
Un grafo G' = (V', E') es un subgrafo de G = (V, E) si V' C;;; E' C;;; E, 
Y cualquier arista e E E' tiene los mismos extremos en G' y en G. G' es un 
subgrafo inducido si, además, todas las aristas de G que conectan vértices de 
G' son también aristas de G' . 
Muchas nociones sobre grafos son muy intuitivas. Por ejemplo, un grafo es 
conexo si a cualesquiera dos vértices distintos les une un camino en G, o lo 
que es equivalente, si G no puede descomponerse en dos sub grafos no vaCÍos 
cuyos conjuntos de vértices sean disjuntos. 
Finalizamos esta revisión de conceptos básicos de grafos con un poco de ter-
minología: Un conjunto independienteen G es un subgrafo inducido sin aris-
tas, esto es, un subconjunto del conjunto de vértices tal que no hay dos que 
estén conectados por una arista de G. Un grafo es un bosque si no contiene 
ciclos. Un árbol es un bosque conexo. Finalmente, G = (V, E) es un grafo 
bipartito si es isomorfo a un sub grafo de un grafo completo bipartito, esto 
es, si sus vértices pueden escribirse como una uníon V = VI U V2 de dos 
conjuntos independientes. 
[1] N. G. DE BRUIJN & P. ERDÓS: On a combinatorial problem, Proc. Kon. Ned. 
Akad. Wetensch. 51 (1948), 1277-1279. 
[2] H. S. M. COXETER: A problem of collinear points, Amer. Math. Month1y 55 
(1948),26-28 (contains Kelly's proof). 
[3] P. ERDÓS: Problem 4065 - Three point collinearity, Amer. Math. Month1y 51 
(1944),169-171 (contains Gallai's proof). 
[4] R. L. GRAHAM & H. O. POLLAK: On the addressing problemfor loop switching, 
Bell System Tech. J. 50 (1971), 2495-2519. 
[5] J. J. SYLVESTER: Mathematical Question 11851, The Educationa1 Times 46 
(1893), 156. 
[6] H. TVERBERG: On the decomposition of Kn into complete bipartite graphs, J. 
Graph Theory 6 (1982), 493-494. 
57 
Los caminos Pn con n vértices 
Los ciclos en con n vértices 
es un sub grafo de 
Intente usted mismo -antes de continuar leyendo- construir configuraciones 
de puntos en el plano que determinen "relativamente pocas" pendientes. Para 
ello suponemos, por supuesto, que los n 2: 3 puntos que se utilicen no están 
alineados. 
Recuérdese del capítulo 9 sobre "rectas en el plano" el teorema de Erd6s y 
de Bruijn: los n puntos determinarán al menos n rectas diferentes; pero, por 
supuesto, muchas de estas rectas pueden ser paralelas y tendrán la misma pen-
diente. 
n=3 n=4 n=5 n=6 n=7 
3 pendientes 4 pendientes 4 pendientes 6 pendientes 6 pendientes 
ó 
n=3 n=4 n=5 n=6 n=7 
3 pendientes 4 pendientes 4 pendientes 6 pendientes 6 pendientes 
Después de unos cuantos intentos con algunas configuraciones, usted podría 
conjeturar - tal y como hizo Scott en 1970 - el siguiente teorema. 
Teorema. Si n 2: 3 puntos en el plano no están alineados, enton-
ces determinan al menos n - 1 pendientes diferentes, verificándose la 
igualdad sólo si n es impar y n 2: 5. 
Los ejemplos de arriba -los dibujos representan las primeras configuraciones 
en dos sucesiones infinitas de ejemplos- nos muestran que el enunciado del 
teorema, tal y como aparece aquí, es el mejor posible: para cualquier impar 
n 2: 5 existe una configuración con n puntos que determina exactamente n - 1 
pendientes diferentes, y para cualquier otro n 2: 3 tenemos una configuración 
con exactamente n pendientes. 
El análisis de algunos casos particulares 
para n pequeño probablemente le con-
ducirá a una de las sucesiones que se 
muestran aquí. 
60 
., ., ., ., ., 
., ., ., ., 
., ., ., ., ., ., ., ., 
., ., ., ., ., ., ., ., 
., ., ., ., ., 
., 
., ., ., 
Tres bonitos ejemplos esporádicos to-
mados del catálogo de Jamison-Hill 
2 
Esta configuración de n = 6 puntos 
detennina t = 6 pendientes diferentes. 
1 
• 
2 ., 
3 
• 
• 
4 5 6 
• 
1 2 3 456 
Aquí, 7fo = 123456 representa una di-
rección vertical. 
El problema de la pendiente 
Sin embargo, las que hemos más arriba no son, ni 
mucho menos, las únicas. Por ejemplo, Jamison y Hill describieron cuatro 
familias infinitas de configuraciones con un número n impar de puntos que 
determinan sólo n - 1 pendientes ("configuraciones críticas de pendientes") . 
Aún más, dieron una lista de 102 ejemplos "esporádicos" -la mayoría de 
ellos encontrados mediante búsquedas exhaustivas con ordenadores- que no 
parecen ajustarse a ninguna familia infinita . 
El saber convencional diría que los problemas extremales suelen ser muy difí-
ciles de resolver si configuraciones extremas son tan diversas e irregulares. De 
hecho, es mucho lo que puede decirse de la estructura de configuraciones crí-
ticas de pendientes (véase [2]), pero llegar a una clasificación parece ser algo 
inalcanzable. Sin embargo, el teorema que hemos expuesto arriba admite una 
demostración sencilla, con dos ingredientes principales: la reducción a un mo-
delo combinatorio eficaz (debida a Eli Goodman y Ricky Pollack), y un bonito 
argumento en este modelo con el cual Peter Ungar completó la demostración 
en 1982 . 
• Demostración. (1) En primer lugar, nótese que es suficiente probar que 
cualquier conjunto de puntos en el plano de cardinal par determina al menos 
n pendientes. Esto es así, ya que el caso n = 3 es trivial, y para cualquier 
conjunto de n = 2m + 1 2: 5 puntos (no alineados) podemos encontrar un 
subconjunto de n 1 = 2m puntos, no todos alineados, que ya determinan 
n - 1 pendientes. Por tanto, en lo que sigue consideraremos configuraciones 
de n = 2m puntos en el plano que determinan t 2: 2 pendientes diferentes. 
(2) El modelo combinatorio se obtiene construyendo una sucesión periódica 
de permutaciones. Para ello, comenzamos con alguna dirección en el plano 
que no sea una de las pendientes de la configuración, y numeramos los puntos 
1, ... , n según el orden en el que aparecen si los proyectamos en esta direc-
ción. Así, la permutación 7fa = 123 ... n representa el orden de los puntos 
respecto de nuestra dirección de partida . 
A continuación, movemos la dirección en sentido contrario a las agujas del 
reloj y observamos cómo cambian la proyección y su permutación. El orden 
de los puntos proyectados cambia exactamente cuando la dirección coincide 
con una de las pendientes de la configuración. 
Pero los cambios están lejos de ser aleatorios o arbitrarios: tomando una rota-
ción de 1800 de la dirección, obtenemos una sucesión de permutaciones 
1fa --+ 1fl --+ 1f2 --+ ... --+ 1ft-l --+ 1ft 
que tiene las siguientes propiedades especiales: 
La sucesión comienza con 1fa = 123 ... n y termina con 1ft = n . .. 321. 
iII La longitud t de la sucesión es el número de pendientes de la configura-
ción de puntos. 
iII En el trancurso de la sucesión, cada par i < j se intercambia exactamente 
una vez. Esto significa que en el camino que lleva de 1fa = 123 ... n a 
1ft = n . .. 321, sólo se intercambian las subcadenas crecientes. 
iII Cada movimiento consiste en la inversión de una o más subcadenas cre-
cientes (que corresponden a una o más rectas que tienen como pendiente 
la dirección por la cual pasamos en ese punto). 
El problema de la pendiente 
7f6 = 654321 
tt t t t 7f5 = 652341 
/ IIIII 
4 
1 6 
7fo = 123456 
~ 7f4 = 625314 
~ 
~ 7f3 = 265314 
~ 
~ 
~ 
~ 7f2 = 213564 
7f1 = 213546 
Continuando con el movimiento circular alrededor de la configuración de pun-
tos, podemos interpretar la sucesión como parte de una sucesión infinita y 
periódica de permutaciones: 
... --+ 7f-1 --+ 7fo --+ ... --+ 7ft --+ 7ft+1 --+ ... --+ 7f2t --+ ... 
Aquí 7fi+t es la inversa de 7fi para todo i, y de aquí 7fi+2t = 7fi para todo i E Z. 
Demostraremos que toda sucesión con las propiedades anteriores (y t 2: 2) ha 
de tener longitud t 2: n. 
(3) La clave de la demostración es dividir cada permutación en una "mitad 
izquierda" y una "mitad derecha" de la misma longitud m = ~, y contar las 
letras que cruzan la barrera imaginaria entre la parte izquierda y la derecha. 
Llamaremos a 7fi --+ 7fi+1 un movimiento de cruce si una de las subcadenas 
que invierten el sentido contiene letras de ambos lados de la barrera. En movi-
miento de cruce tiene orden d si mueve 2d letras al otro lado de la barrera, es 
decir, si la cadena que cruza tiene exactamente d letras en un lado y las otras 
d en el otro. Así, en nuestro ejemplo 
es un cruce de orden d = 2 (mueve 1,3,5,6 al otro lado de la barrera, lo que 
señalamos con ":"); el movimiento 
652:341 --+ 654:321 
es un cruce de orden d = 1, mientras que 
625:314 --+ 652:341 
no es un movimiento de cruce. 
61 
De este dibujo obtenemos la sucesión de 
permutaciones de nuestro ejemplo 
1 6 
Un movimiento de cruce 
265314 
~ 
~ 
213564 
62 
4 
1 
652341 
/ 625314 
~ 
6 
Un movimiento de toque 
4 
1 6 
~ 
~ 213564 
213546Un movimieto ordinario 
El problema de la pendiente 
En el transcurso de la sucesión 1To ---+ 1Tl ---+ ... ---+ 1Tt, cada una de las letras 
1,2, ... ,n ha de cruzar la barrera al menos una vez. Esto implica que, si los 
órdenes de los movimientos de cruce son dI, d2 , ... , de, entonces se verifica 
e 
L 2dí = #{letras que cruzan la barrera} ;::: n. 
í=1 
Esto implica también que tenemos al menos dos movimientos de cruce, ya 
que un movimiento que cumpla 2dí = n se da únicamente si todos los puntos 
están alineados, es decir, cuando t = 1. Geométricamente, un movimiento 
de cruce corresponde a la dirección de una recta de la configuración que deja 
menos de m puntos a cada lado. 
(4) Un movimiento de toque es un movimiento que invierte el sentido de alguna 
cadena adyacente a la barrera central, pero no la cruza. Por ejemplo, 
es un movimiento de toque. Visto de manera geométrica, un movimiento de 
toque corresponde a la pendiente de una recta de la configuración que deja 
exactamente m puntos a un lado, y por tanto, como mucho m - 2 puntos al 
otro. 
Llamaremos ordinarios a los movimentos que no son ni toques ni cruces. Un 
ejemplo es 
1TI = 213:546 --+ 213:564 = 1T2. 
Así, cualquier movimiento es un cruce, un toque, o un movimiento ordinario, 
y utilizaremos las letras O, T, ° para referimos a ellos. O(d) denotará un 
cruce de orden d. Así, en nuestro pequeño ejemplo obtenemos 
T O 0(2) O T 0(1) 
1To --+ 1TI --+ 1T2 --+ 1T3 --+ 1T4 --+ 1T5 --+ 1T6, 
o incluso en una forma más corta, podemos referimos a esta sucesión como 
T, 0,0(2),0, T, 0(1). 
(5) Para completar la demostración necesitamos los siguientes dos hechos: 
Entre cualesquiera dos cruces existe al menos un toque. 
Entre cualquier cruce de orden d y el siguiente toque, existen al me-
nos d - 1 movimientos ordinarios. 
En efecto, después de un cruce de orden d, la barrera está contenida en una 
subcadena simétrica decreciente de longitud 2d, con d letras en cada lado de 
la barrera. Para el siguiente cruce la barrera central debe desplazarse dentro de 
una subcadena creciente de longitud al menos 2. Pero sólo los movimientos 
de toque tienen influencia en que la barrera esté o no en una cadena creciente. 
Para el segundo hecho, nótese que con cada movimiento ordinario (que in-
vierte algunas subcadenas crecientes), la cadena decreciente de longitud 2d 
puede acortarse únicamente por una letra en cada lado. Además, mientras la 
cadena decreciente tenga al menos 4 letras, un toque es imposible. De aquí se 
sigue el segundo hecho. 
El problema de la pendiente 
Si construimos la sucesión de de manera que comenzamos con 
la misma proyección inicial, pero usamos una rotación en el sentido horario, 
entonces obtenemos la sucesión de permutaciones inversa. Así, la sucesión 
que habíamos apuntado debe satisfacer también el opuesto de nuestro segundo 
hecho, es decir 
E?1tre un toque y el siguiente cruce, de orden d, existen al menos d-1 
movimientos ordinarios. 
El patrón T -O-C de la sucesión infinita de permutaciones, tal y como 
se deriva de (2), se obtiene repitiendo una y otra vez el patrón T-O-C de 
longitud t de la sucesión 1fo -----+ ... -----+ 1ft. Así, con los hechos de (5) vemos 
que en la sucesión infinita de movimientos, cada cruce de orden d forma parte 
de un patrón T -O-C del tipo 
T,O,O, ... , O,C(d),O,O, ... ,0, 
~~ 
2: d-l 2: d-l 
de longitud 1 + (d - 1) + 1 + (d - 1) = 2d. 
En la sucesión infinita, consideramos un segmento finito de longitud t que co-
mienza con un toque. Este segmento está formado por subcadenas del tipo (*) 
y posiblemente de otras del tipo T. Esto implica que su longitud t satisface 
e 
t ~ ¿2di > n, 
i=l 
lo cual completa la demostración. o 
[1] J. E. GOODMAN & R. POLLACK: A combinatorial perspective on sorne 
problems in geometry, Congressus Numerantium 32 (1981), 383-394. 
[2] R. E. JAMISON & D. HILL: A catalogue of slope-critical configurations, 
Congressus Numerantium 40 (1983),101-125. 
[3] P. R. SCOTT: On the sets of directions determined by n points, Amer. 
Math. Monthly 77 (1970), 502-505. 
[4] P. UNGAR: 2N noncollinear points determine at least 2N directions, J. 
Combinatorial Theory, Ser. A 33 (1982), 343-347. 
63 
Un grafo es planar si puede dibujarse en el plano ffi.2 sin aristas que se crucen 
(o de manera equivalente, en la esfera 2-dimensional 8 2). Decimos que un 
grafo es plano si ese dibujo viene ya dado y fijado. Cualquier dibujo de este 
tipo descompone el plano o la esfera en un número finito de regiones conexas, 
incluyendo la región exterior (no acotada), a las que nos referimos como caras. 
La fórmula de Euler descubre una bella relación entre el número de vértices, 
aristas y caras, que es válida para cualquier grafo plano. Euler mencionó 
este resultado por primera vez en una carta a su amigo Goldbach en 1750, 
pero en aquel entonces no tenía una demostración completa. Entre las muchas 
demostraciones de la fórmula de Euler, presentamos una bonita y "auto-dual" 
que no necesita inducción y se remonta a 1847, cuando aparece en el libro 
"Geometrie der Lage" de Karl Georg Christian von Staudt. 
Fórmula de Euler. Si G es un grafo conexo con n I/P¡e/u'p\, 
e aristas y f caras, entonces 
n- e+ f = 2 . 
• Demostración. Sea T ~ E el conjunto de aristas de un árbol generador 
de G, esto es, un sub grafo minimal que conecta todos los vértices de G. Este 
grafo no contiene ciclos por la suposición de minimalidad. 
Ahora necesitamos el grafo dual G* de G: para construirlo, ponemos un vér-
tice en el interior de cada cara de G, y para cada arista de G que separa dos 
caras conectamos los vértices correspondientes de G* mediante una arista. Si 
dos caras de G comparten varias aristas en su frontera, conectaremos los vér-
tices correspondientes del grafo dual mediante más de una arista. (Así pues, 
G* puede tener aristas múltiples incluso si el grafo original G es simple.) 
Consideramos la colección T* ~ E* de aristas en el grafo dual que se corres-
ponden a las aristas en E\T. Las aristas en T* conectan todas las caras, ya 
que T no tiene ciclos; pero T* tampoco contiene ciclos, pues de otra manera 
separaría algunos de los vértices de G dentro del ciclo de los de fuera (y esto 
no puede ser, ya que T es un sub grafo generador, y las aristas de T* no se 
intersecan). Así pues, T* es un árbol generador para G*. 
Para cada árbol, el número de vértices es uno más que el número de aristas. 
Para verlo, elegimos un vértice como raíz y dirigimos todas las aristas "hacia 
la raíz". Esto conduce a una biyección entre los vértices que no son raíz y las 
aristas, haciendo corresponder cada arista con el vértice desde el cual sale. 
Aplicado al árbol T esto conduce a que n = eT + 1, mientras que para el 
árbol T* obtenemos f = eT* + 1. Sumando ambas ecuaciones obtenemos la 
relación n + f = (eT + 1) + (eT* + 1) = e + 2. O 
Leonhard Euler 
Un grafo plano G: n = 6, e = 10, f = 6 
Árboles generadores duales en G y 
enG* 
66 
Los cinco sólidos platónicos 
2 
2 2 
Aquí escribimos el grado alIado de cada 
vértice. Contando los vértices de un 
grado dado, se tiene n2 = 3, n3 = O, 
n4 = 1, n5 = 2. 
2 
Hemos escrito el número de lados den-
. tro de cada región. Contando las ca-
ras con un determinado número de la-
dos obtenemos JI = 1, h = 3, J4 = 1, 
fg = 1, Y Ji = O en los demás casos. 
Tres aplicaciones de lafórmula de Euler 
La fórmula de Euler produce una conclusión numérica inesperada a partir de 
una situación métrico-topológica: El número de vértices, aristas y caras de un 
grafo finito G satisface n-e + f = 2 siempre que el grafo esté o pueda estar 
dibujado-en el plano o sobre una esfera. 
De la fórmula de Euler se derivan muchas consecuencias conocidas, algunas 
de ellas clásicas. Entre ellas figuran la clasificación de los poliedros regula-
res convexos (los sólidos platónicos), el hecho de que los grafos K5 y K 3 ,3 
no son planares (véase más adelante), y el teorema de los cinco colores, que 
afirma que cada mapa planar puede ser coloreadousando como máximo cinco 
colores, de manera que dos regiones adyacentes no tengan el mismo color. Sin 
embargo, para este último resultado tenemos una demostración mucho mejor, 
que no necesita la fórmula de Euler - véase el capítulo 30. 
En este capítulo incluimos otras tres bellas demostraciones que dependen de 
manera esencial de la fórmula de Euler. Las dos primeras - una demostración 
del teorema de Sylvester-Gallai, y un teorema sobre configuraciones de puntos 
coloreados con dos colores - utilizan la fórmula de Euler en una inteligente 
combinación con otras relaciones aritméticas entre los parámetros básicos de 
un grafo. Veamos primero cuáles son estos parámetros. 
El grado de un vértice es el número de aristas que terminan en él, contando 
cada bucle dos veces. Sea ni el número de vértices de grado i en G. Contando 
los vértices de acuerdo con sus grados, obtenemos 
(1) 
Por otro lado, toda arista tiene dos extremos, de manera que contribuye con 2 
a la suma de todos los grados. Por tanto, 
(2) 
Esta identidad puede interpretarse como si se contara de dos maneras los ex-
tremos de las aristas, esto es, las incidencias entre aristas y vértices. El grado 
medio d de los vértices es, en consecuencia, 
- 2e 
d = -. 
n 
Ahora contamos las caras de un grafo plano de acuerdo con su número de 
lados: Una k-cara es una cara delimitada por k aristas (¡hay que contar dos 
veces cada arista que delimita la misma cara por los dos lados!) Sea fk el 
número de k-caras. Contando todas las caras obtenemos 
f = JI + h + fs + f4 + ... (3) 
Contando las aristas de acuerdo con las caras de las cuales son lados, obtene-
mos 
(4) 
Como antes, podemos interpretar esto como si contáramos las incidencias en-
tre aristas y caras de dos maneras distintas. Nótese que el número medio de 
lados de las caras viene dado por 
2e 
J" 
Tres aplicaciones de lafórmula de Euler 
A de esto, con la fórmula de se deduce que el 
y el grafo completo bipartito K 3 ,3 no son planares. Para un dibujo plano 
de K5 se tendría n = 5, e = (~) = 10, por tanto f = e + 2 - n = 7 
Y 1 = 2; = 27° <3. Pero si el número medio de lados es menor que 3, 
entonces el dibujo hipotético tendría una cara con dos lados como máximo, lo 
cual es imposible. 
De manera similar, para K 3,3 obtenemos n = 6, e = 9, Y f = e + 2 - n = 5, 
Y por tanto 1 = 2; = 158 < 4. Esto es imposible, ya que K3,3 es simple 
y bipartito, y por lo tanto la longitud de cualquiera de sus ciclos es por lo 
menos 4. 
No es coincidencia, por tanto, que las ecuaciones (3) y (4) para los fi se pa-
rezcan tanto a las ecuaciones (1) y (2) para los ni. Se pueden transformar unas 
en las otras pasando del grafo G al grafo dual G* . 
De las fórmulas para contar incidencias obtenemos las siguientes importantes 
consecuencias de la fórmula de Euler. 
pr,op'OSJCl()ll. Sea G cualquier grafo plano simple con n > 2 vértices. Enton-
ces 
(A) G tiene un vértice de grado a lo sumo 5. 
(B) G tiene a lo sumo 3n - 6 aristas. 
(C) Si coloreamos las aristas de G con dos colores, hay un vértice de G de 
manera que al leer las aristas incidentes a él en orden cíclico, vemos a 
lo sumo dos cambios de color. 
• Demostración. Para todos los enunciados podemos suponer G conexo. 
(A) Cada cara tiene por lo menos 3 aristas (ya que G es simple), con lo cual 
(3) y (4) nos dan 
f h + f4 + f5 + .. . 
2e 3h + 4f4 + 5f5 + .. . 
y por tanto 2e 3f ~ O. 
Si cada vértice tiene grado por lo menos 6, entonces (1) y (2) implican que 
n n6 + n7 + ns + .. . 
2e 6n6 + 7n7 + 8n8 + .. . 
y por tanto 2e - 6n ~ O. 
Juntando ambas desigualdades obtenemos 
6(e-n-f) = (2e-6n)+2(2e-3f) > O 
y por tanto e ~ n + f, contradiciendo la fórmula de Euler. 
(B) Igual que en el primer paso del apartado (A), obtenemos 2e - 3f ~ O y, 
aplicando la fórmula de Euler, que 
3n - 6 = 3e - 3f > e. 
67 
Un dibujo de K5 con un cruce 
Un dibujo de K 3 ,3 con un cruce 
68 
Las flechas señalan esquinas con un 
cambio de color. 
.. v .. 
" 
Tres aplicaciones de la fórmula de Euler 
(C) Sea c el número de donde un cambio de color. 
que el enunciado es falso. Entonces hay c 2': 4n esquinas con cambios de 
color, ya que en cada vértice hay un número par de cambios. Ahora, cada 
cara con 2k ó 2k + 1 lados tiene como mucho 2k tales esquinas, de lo cual 
concluimos que 
4n < c < 2h + 414 + 415 + 616 + 617 + 818 + ... 
< 2h + 414 + 615 + 816 + 1017 + .. . 
2(3h + 414 + 515 + 616 + 717 + ... ) 
-4(h + 14 + 15 + 16 + 17 + ... ) 
4e - 41, 
donde hemos vuelto a usar (3) y (4). Por tanto, tenemos e 2': n + 1, otra vez 
en contradicción con la fónnula de Euler. O 
1. vez 
Parece ser que Nonnan Steenrod fue el primero en darse cuenta de que el 
apartado (A) de la proposición nos da una demostración extraordinariamente 
sencilla del teorema de Sylvester-Gallai (véase el capítulo 9). 
El teorema de Sylvesíer-Gallai. Dado cualquier conjunto de n 2': 3 
puntos en el plano, no todos alineados, siempre hay una recta que 
contiene exactamente dos de los puntos . 
• Demostración. (Sylvester-Gallai vía Euler) 
Si situamos el plano JR2 dentro de JR3 y cercano a la esfera unidad S2 como 
indica la figura, cada punto de JR2 se corresponde con una pareja de puntos 
antipodales en S2, y las rectas en JR2 se corresponden con circunferencias 
máximas en S2. Por tanto, el teorema de Sylvester-Gallai dice lo siguiente: 
Dado cualquier conjunto de n 2': 3 parejas de puntos antipodales en 
la esfera, no todos en una circunferencia máxima, siempre hay una 
circunferencia máxima que contiene exactamente dos de las parejas. 
Ahora pasamos a la versión dual, reemplazando cada pareja de puntos con la 
correspondiente circunferencia máxima en la esfera. Dicho de otra manera, en 
vez de puntos ±v E S2 consideramos las circunferencias ortogonales dadas 
por Cv := {x E S2 : (x, v) = O}. (Este Cv es el ecuador si consideramos v 
como polo norte de la esfera.) 
El problema de Sylvester-Gallai nos pide demostrar: 
Dada cualquier colección de n 2': 3 circunferencias máximas en S2, 
no todos pasando por el mismo punto, siempre hay un punto conte-
nido en exactamente dos de los círculos. 
Pero el arreglo de circunferencias máximas se puede interpretar como un grafo 
plano simple en S2, cuyos vértices son los puntos de intersección de dos de 
las circunferencias, y cuyas aristas los arcos de circunferencias entre los vér-
tices. El grado de todos los vértices es par, y además por lo menos 4 - por 
construcción. Por tanto, el apartado (A) de la proposición nos da la existencia 
de un vértice de grado 4. ¡Ya está! CJ 
Tres aplicaciones de la fórmula de Euler 
La siguiente demostración de una versión "coloreada" del teorema de Sylvester-
Gallai se debe a Don Chakerian. 
Teorema. Dado cualquier configuración de puntos "negros" y "blancos" en 
el plano, hay siempre por lo menos una recta "monocromática ", es decir, una 
recta que contiene al menos dos puntos de un color y ninguno del otro . 
• Demostración. Igual que en el problema de Sylvester-Gallai, llevamos el 
problema a la esfera unidad y aplicamos dualidad. Tenemos que demostrar, 
pues: 
Dado cualquier colección de circunferencias máximas "blancos" y 
"negros" en la esfera unidad, no todos pasando por el mismo punto, 
siempre existe un punto de intersección que o bien sólo está en circun-
ferencias blancas, o bien sólo en circunferencias negras. 
La solución queda clara a partir de la parte (C) de la proposición, ya que en 
cada vértice que es intersección de circunferencias con diferentes colores, hay 
por lo menos 4 esquinas con cambio de color. O 
El teorema de Pick del año 1899 es un resultado bello y sorprendente por 
sí mismo, pero también es una consecuencia clásica de la fórmula de Euler. 
Diremos que un polígono convexo P ~ ffi.2 es elemental si sus vértices son 
enteras (es decir, están contenidos en la retícula Z'?), pero no contiene más 
puntos de la retícula. 
Lema. Cada triángulo elemental 6. = conv{PO,PI,P2} ~ ffi.2 tiene área 
A(6.) = ~. 
Demostración. Tanto el paralelogramoP que tiene como vértices Po, PI' 
P2, PI + P2 - Po, como la retícula 'Z'} , son simétricos respecto de la aplicación 
cr: X 1--+ PI + P2 - x, 
que es la reflexión con respecto al centro del segmento de PI a P2' Por tanto, 
el paralelogramo P = 6. U cr(6.) también es elemental, y sus traslaciones con 
vectores de coordenadas enteras teselan el plano. Por tanto, {PI -Po, P2 -Po} 
es una base de la retícula Z2, la matriz correspondiente tiene determinante ±1, 
P es un paralelogramo de área 1 y 6. tiene área ~. (Explicamos estos términos 
en el recuadro de arriba.) O 
Teorema. El área de cualquier polígono Q ~ ffi.2, no necesariamente con-
vexo, pero con vértices enteros, viene dada por 
A(Q) = 
1 
nint + 2nfr - 1, 
.10nde nint Y nfr son, respectivamente, el número de puntos con coordenadas 
enteras en el interior yen lafrontera de Q. 
69 
PI + P2 - Po 
~ • • • 
P2 
• l1li l1li .. 
• • • l1li PI 
• • l1li • 
Po 
l1li • • • • • • 
• • • 
• • • 
• • • 
• • • • • • • 
nin, = 11 Y nlr = 8, portanto A = 14 
70 Tres aplicaciones de la fórmula de Euler 
Una base de 7!} es un par de vectores linealmente H""v~'vU~',U'v" el, e2 
tal que 
Z2 = {Alel + A2e2 : Al, A2 E Z}. 
Sean el = m y e2 = (~), entonces el área del que 
determinan el Y e2 es A(el, e2) = I det(el, e2)1 I det (~~)I. Si 
= (:) y (D es otra base, entonces existe una matriz invertible 
con elementos enteros Q tal que (; ~) = (~~) Ya que 
(¿ ~), y los determinantes son enteros, se sigue que I det Q I = 1, y 
por tanto I det(f l' f 2) I I det( el, e2) l· Concluimos que todos los 
paralelogramos que se corresponden a una base tienen la misma área 1, 
ya que A ( @, (~)) = 1. 
111 Demostración. Cualquier polígono Q con las características del teorema 
puede triangularse usando todos los nint puntos de la retícula en su interior, y 
todos los nft· puntos de la retícula en su frontera. (Esto no es obvio del todo, 
sobre todo si no pedimos que Q sea convexo, pero lo demuestra el argumento 
del capítulo 31 sobre el problema de la galería de arte.) 
Ahora interpretamos la triangulación como un grafo plano que subdivide el 
plano en una cara no acotada, más f - 1 triángulos de área ~, de manera que 
A(Q) = ~(f - 1). 
Todo triángulo tiene tres lados, y cada uno de los eint lados interiores separa 
dos triángulos, mientras que los ejr lados en la frontera sólo aparecen en un 
único triángulo cada uno. Por tanto, 3(f - 1) = 2eint + ejr, y por tanto 
f = 2 (e - f) - efr + 3. Además, el numero de aristas y vértices en la frontera 
es el mismo, efr = njr. Estos dos hechos, junto con la fórmula de Euler, dan 
f 2(e-f)-efr+ 3 
2(n - 2) - nfr + 3 = 2nint + nfr - 1, 
y por tanto 
A(Q) ~(f - 1) D 
[1] G. D. CHAKERIAN: Sylvester's problem on collinear points and a relative, Amer. 
Math. Monthly77 (1970),164-167. 
[2] G. PIeK: Geometrisches zur Zahlenlehre, Sitzungsberichte Lotos (Prag), Natur-
medo Verein für Bóhmen 19 (1899), 311-319. 
[3] K. G. C. VON STAUDT: Geometrie der Lage, Verlag der Fr. Korn'schen 
Buchhandlung, Nürnberg 1847. 
[4] N. E. STEENROD: Solution 4065/Editorial Note, Amer. Math. Monthly 51 (1944), 
170-171. 
Un famoso resultado que depende de la fórmula de Euler (en concreto, en la 
parte (C) de la proposición del capítulo anterior) es el teorema de rigidez de 
Cauchy para poliedros tridimensionales. 
Para las nociones de congruencia y equivalencia combinatoria que utilizamos a 
continuaci.ón, el lector se puede dirigir al apéndice sobre politopos y poliedros 
del capítulo en el que tratamos el tercer problema de Hilbert, en la página 50. 
Teorema. Si dos poliedros convexos tridimensionales P y p' son 
combinatoriamente equivalentes y las caras correspondientes son con-
gruentes, entonces los ángulos entre los correspondientes pares de ca-
ras son iguales (y, por tanto, P y son congruentes). 
La figura del margen muestra dos poliedros tridimensionales combinatoria-
mente equivalentes, y tales que las caras correspondientes son congruentes. 
Sin embargo, no son congruentes, y sólo uno de ellos es convexo. Por tanto, 
¡la hipótesis de convexidad es esencial en el teorema de Cauchy! 
• Demostración. Lo que presentamos a continuación es, esencialmente, la 
demostración original de Cauchy. Supongamos que tenemos dos poliedros 
convexos p y p' con caras congruentes. Coloreamos las aristas de P de la 
siguiente forma: una arista es negra (o "positiva") si el ángulo interior entre 
las caras adyacentes es mayor en p' que en P; es blanca (o "negativa") si el 
ángulo es menor en p' que en P. 
El conjunto de aristas blancas y negras de P forma un grafo plano 2-coloreado 
en la superficie de P que, mediante una proyección central con origen en un 
punto interior de P, podemos considerar en la superficie de la esfera unidad. 
Si P Y p' tienen ángulos distintos entre caras correspondientes, el grafo es no 
vacío. Utilizando la parte (C) de la proposición del capítulo anterior, deduci-
mos que existe un vértice p que es adyacente al menos a una arista blanca o 
negra, y tal que hay como mucho dos cambios entre aristas blancas y negras 
(considerando el orden cíclico). 
Consideremos ahora la intersección del poliedro P con una esfera pequeña SE 
(de radio E) centrada en el vértice p, y la intersección de p' con una esfera S~ 
del mismo radio E centrada en el vértice correspondiente p'. En SE y S~ se 
obtienen polígonos esféricos Q y Q', convexos, tales que los arcos correspon-
dientes tienen la misma longitud, ya que las caras correspondientes de P y p' 
son congruentes y hemos utilizado el mismo radio E. 
Ahora marcamos con un + los ángulos de Q para los que el ángulo corres-
1 
Augustin Cauchy 
72 
Q: + 
Q': 
El teorema de rigidez de Cauchy 
pondiente en es mayor, y con un - los ángulos para los que el ángulo 
correspondiente en Q' es menor. Por tanto, cuando nos movemos de Q a Q', 
los ángulos marcados con + se "abren" y los ángulos marcados con - se 
"cierran", en tanto que las longitudes de las aristas y el resto de los ángulos 
permanecen constantes. 
De acuerdo con la elección de p, sabemos que existe algún signo + o -, y que 
en el orden cíclico hay, como mucho, dos cambios +/ -. Si sólo hay signos de 
un tipo, el lema que presentamos a continuación produce una contradicción, 
pues asegura que alguna arista debe cambiar de longitud. Si hay signos de los 
dos tipos, entonces (como hay sólo dos cambios de signo) existe una "recta de 
separación" que une los puntos medios de dos aristas y separa los signos + de 
los signos -. De nuevo obtenemos una contradicción utilizando el lema que 
presentarnos a continuación, ya que la recta de separación no puede ser a la 
vez más larga y más corta en Q' que en Q. O 
Lema de la poligon.al de Cauchy. 
Si Q y Q' son n-ágonos convexos (planos o esféricos) etiquetados como en la 
figura, 
003 q2 oon-l _____ 
Q~... qn-l 
002 
ql qn 
de tal manera que las longitudes de las aristas correspondientes verifican 
qiqi+l = q~q~+l para 1 ~ i ~ n -1, y los ángulos correspondientes verifican 
OOi ~ oo~ para 2 ~ i < n - 1, entonces la longitud de la arista "restante" 
verifica 
qlqn ~ q~ q~, 
y la igualdad se da si y sólo si OOi = oo~ para todo i. 
Aquí es interesante mencionar que la demostración original de Cauchy no era 
correcta: un movimiento continuo que hace crecer los ángulos y mantiene 
constantes las longitudes de los lados puede destruir la convexidad - ¡véase 
la figura! Además, tanto el lema como la demostración presentada aquí, apa-
recidos en una carta de I. J. Schoenberg a S. K. Zaremba, son válidos tanto 
para polígonos planos como esféricos. 
111 Demostración.. Razonarnos por inducción sobre n. El caso n = 3 resulta 
sencillo: si en un triángulo aumenta el ángulo I entre dos lados de longitudes 
fijas a y b, entonces la longitud c del tercer lado también aumenta, según 
demuestra el teorema del coseno 
en el caso plano, y el resultado análogo 
cos e = cos a cos b + sen a sen b cos I 
El teorema de rigidez de Cauchy 
en trigonometría esférica. Las a, b, e semiden en la de la 
esfera de radio 1 y, por tanto, toman valores, en el intervalo [O, 7r]. 
Consideremos ahora n 2: 4. Si para algún i E {2, ... , n - 1} se verifica que 
Oói = Oó~, el vértice correspondiente se puede eliminar insertando las diago-
1 d d "'fi ' , na es e qi-l a qi+l y e qi-l a qi+l' que ven can qi-l qi+l= qi-l qi+l' Y 
podemos utilizar la hipótesis de inducción. Por tanto, podemos suponer que 
Oói < Oó~ para 2 :::; i :::; n - 1. 
Construimos un nuevo polígono Q* a partir de Q cambiando Oón-l por el ma-
yor ángulo posible Oó~_l :::; Oó~-l de fonna que Q* siga siendo convexo. Para 
ello, reemplazamos qn por q~, manteniendo el resto de vértices qi' longitudes 
de aristas y ángulos de Q. 
Si se puede escoger Oó~_l = Oó~_l de manera que Q* siga siendo convexo, 
se obtiene ql qn < ql q::' :::; q~ q~, utilizando el caso n = 3 para la primera 
desigualdad e inducción, como anterionnente, para la segunda. 
Si esto no es posible, después de un movimiento para el que se tiene 
(1) 
quedamos "bloqueados" en una situación en que q2' ql Y q~ son colineales, de 
fonnaque 
q2ql + ql q::' = q2q::,· 
Comparando Q* y Q' obtenemos 
q q* < q2' qn' 2 n 
por inducción sobre n (ignorando los vértices ql y qD. Por tanto, 
(2) 
(3) 
donde (*) es la desigualdad triangular y el resto de las desigualdades han sido 
deducidas anterionnente. O 
Hemos visto un ejemplo que demuestra que el teorema de Cauchy no es cierto 
para poliedros no convexos. La característica especial del ejemplo es, eviden-
temente, un salto discontinuo que lleva un poliedro al otro, manteniendo las 
caras congruentes mientras los ángulos diedros "saltan." Se puede preguntar 
algo más: 
¿Puede para algún poliedro no convexo, una deformación con-
tinua que mantenga las caras planas y congruentes? 
Se había conjeturado que ninguna superficie triangulada, convexa o no, ad-
mitía tal movimiento. Por eso fue una gran sorpresa que en 1977 - más 
de 160 años después del trabajo de Cauchy - Robert Connelly presentara 
contraejemplos: esferas cerradas y trianguladas inmersas en ]Et3 (sin auto-
intersecciones) que son flexibles, con un movimiento continuo que mantiene 
constantes las longitudes de las aristas y, por tanto, las caras triangulares con-
gruentes. 
73 
Q0 
ql t qn 
Q*:~ Oón - 1 
--
ql q~ 
74 
Un precioso ejemplo de superficie flexi-
ble construido por Klaus Steffen: las lí-
neas discontinuas representan las aristas 
no convexas en este desarrollo del po-
liedro. Doble las líneas continuas como 
"montañas" y las discontinuas como 
"valles". Las aristas del modelo tienen 
longitudes 5, 10, 11, 12 Y 17 unidades. 
/ 
/ 
/ 
, / 
"""-, ' 
Y-, /\- -, 
,/' \ -----. 
, 
\ 
\ , 
\ 
\ 
El teorema de rigidez de Cauchy 
-'---
La teoría de rigidez de superficies tiene todavía más sorpresas: recientemente 
Idjad Sabitov consiguió demostrar que cuando estas superficies flexibles se 
mueven, el volumen que encierran debe permanecer constante. Su demostra-
ción hace un uso muy elegante de herramientas algebraicas (fuera del alcance 
de este libro). 
[1] A. CAUCHY: Sur les polygones et les polyedres, seconde mémoire, J. École Poly-
technique XVle Cahier, Tome IX (1813), 87-98; CEuvres Completes, He Série, 
Vol. 1, Paris 1905,26-38. 
[2] R. CONNELLY: A counterexample to the rigidity conjecture for polyhedra, Inst. 
Haut. Etud. Sci., Publ. Math. 47 (1978), 333-338. 
[3] R. CONNELLY: The rigidity of polyhedral surfaces, Mathematics Magazine 52 
(1979),275-283. 
[4] I. KH. SABITOV: The volume as a metric invariant ofpolyhedra, Discrete Com-
put. Geometry 20 (1998), 405-425. 
[5] 1. SCHOENBERG & S.K. ZAREMBA: On Cauchy's lemma conceming convex 
polygons, Canadian J. Math. 19 (1967), 1062-1071. 
¿ Cuántos en ]Rd de ma-
nera que en contacto dos a es que todas las intersec-
ciones dos a dos tengan dimensión (d - 1)? 
Esta es una cuestión antigua y muy natural. Sea f (d) la solución de este 
problema, y anotamos f(l) = 2. Para d = 2 la configuración de los cuatro 
triángulos en el margen muestra que f(2) ?::: 4. No existe una configuración 
similar con cinco triángulos, ya que la construcción dual de ésta - que en 
nuestro ejemplo de los cuatro triángulos conduce a un dibujo plano de K4 -
proporcionaría un dibujo plano de K 5 , algo imposible (véase la página 67). 
Por tanto, tenemos 
f(2) = 4. 
En tres dimensiones es fácil ver que f(3) ?::: 8. Para ello, utilizamos la confi-
guración de ocho triángulos que aparece a la derecha. 
Los cuatro triángulos sombreados están unidos a un punto x por debajo del 
'plano del dibujo", proporcionando cuatro tetraedros que tocan el plano desde 
abajo. De manera similar, los cuatro triángulos blancos están unidos a un 
punto y por encima del plano del dibujo. Por tanto, obtenemos una configura-
ción de ocho tetraedros en contacto en ]R3, esto es, f(3) ?::: 8. 
f(2) 2: 4 
En 1965, Baston escribió un libro en el que probaba que f(3) :::; 9, yen 1991 f(3) 2: 8 
Zaks tuvo que escribir otro libro para establecer que 
f(3) = 8. 
Con f(l) = 2, f(2) = 4 Y f(3) = 8, no es necesaria mucha inspiración para 
llegar a la siguiente conjetura, que formuló Bagemihl en 1956: 
Conjetura. En una configuración de símplices de dimensión d en ]Rd, el 
número máximo de pares en contacto es 
La cota inferior, f (d) ?::: 2d , es fácil de verificar - si lo hacemos bien. Esto 
nos conduce a usar reiteradamente transformaciones afines y un razonamiento 
por inducción sobre la dimensión que establece el siguiente resultado, más 
fuerte, que se debe a Joseph Zaks [4]: 
Teorema 1. Para cada d ?::: 2, existe una familia de 2d símplices que están 
en contacto dos a dos en ]Rd, junto con una recta transversal que interseca el 
interior de cada uno de los símplices individuales. "Símplices en contacto" 
76 
(-l,l)T 
---
(-1, -l)T (O, _l)T 
: , 
, 
A', 
Símplices en contacto 
• Demostración. Para d = 2 la familia de cuatro triángulos que habíamos 
considerado tiene, efectivamente, dicha recta transversal. 
Ahora consideremos cualquier configuración d-dimensional de símplices en 
contacto y que tiene una recta transversal f!. Cualquier otra paralela cercana f!1 
es también una recta transversal. Si elegimos f!1 y f! paralelas y suficientemente 
cercanas, entonces cada uno de los símpliées ha de contener un intervalo orto-
gonal (más corto) que conecta ambas rectas. 
Sólo una parte acotada de las rectas f! y f!1 está contenida en los símplices de la 
configuración, y podemos añadir dos segmentos que las conecten fuera de la 
configuración, de tal manera que el rectángulo determinado por los segmentos 
extremos, es decir, su cierre convexo, contenga todos los demás segmentos 
que conectan las rectas. De este modo, hemos colocado una "escalera", de 
manera que cada símplice de la configuración tiene uno de los peldaños en su 
interior, mientras que sus cuatro extremos quedan fuera de la configuración. 
Ahora, el paso principal es llevar a cabo una tranformación (afín) de jRd en 
jRd, Y que lleve el rectángulo que forma la escalera al rectángulo (la mitad de 
un cuadrado, como se muestra en la figura) dado por 
R1 = {(X1,X2,0, ... ,of:-1:S;X1:S;0;-1:S;X2:S;1}. 
Por tanto, la configuración de símplices en contacto ~1 en jRd que obtenemos 
tiene el eje Xl corno recta transversal, y está colocada de tal manera que cada 
uno de los símplices contiene un segmento 
en su interior (para algún a con -1 < a < O), mientras que el origen O queda 
fuera de todos los símplices. 
Ahora obtenemos una segunda copia ~2 de esta configuración reflejando la 
primera respecto del hiperplano dado por Xl = X2. Esta segunda configu-
ración tiene al eje X2 como recta transversal, y cada símplice contiene un 
segmento 
S2({3) = {(X1,{3,0, ... ,0)T:-1:S;X1:S;1} 
en su interior, con -1 < {3 < O. Pero cada segmento SI ( a) interseca a cada 
segmento S2 ({3), y por tanto el interior de cada símplice de ~1 interseca a cada 
símplice de ~2 en su interior. En consecuencia, si añadimos una coordenada 
(d + l)-ésima, Xd+1, Y escogemos~ como 
{conv(Pi U {-ed+1}) : Pi E ~1} U {conv(Pj U {ed+d): Pj E ~2}, 
obtenemos una configuración de (d + 1) símplices en contacto en jRd+ 1. Aún 
más, la diagonal 
A = {(x,-x,O, ... ,Of:XEjR} ~ jRd 
interseca todos los segmentos SI ( a) y S2 ({3). Podernos "inclinarlo" un poco, 
y obtener una recta 
LE; = {(x, -x, 0, ... ,0, éX)T : X E jR} ~ jRd+l, 
que para todo é > ° suficientemente pequeño interseca a todos los símplices 
de ~. Esto completa el paso de inducción. D 
Símplices en contacto 
En contraste con esta cota infelior es más difícil encontrar cotas 
superiores ajustadas. 
Un argumento ingenuo por inducción (que considera por separado todos los 
hiperplanos que contienen a facetas en una configuración en contacto) conduce 
únicamente a 
f(d) :::; ~(d + 1)!, 
Y esto queda bastante lejos de la cota inferior del teorema 1. Sin embargo, Mi-
cha Perles encontró una demostración "mágica" para una cota mucho mejor: 
Teorema 2. Para todo d 2: 1, se tiene f(d) < 2d+1 . 
Demostración. Dada una configuración de r símplices de dimensión d 
PI, P2 , ... ,Pr en contacto en ffi. d, enumeramos primero todos los diferentes 
hiperplanos H I , H 2 , •.. , H s determinados por facetas de Pi. Para cada uno 
de ellos escogemos de manera arbitraria un lado positivo H: ' y llamamos H i-
al otro lado. 
Por ejemplo, la configuración 2-dimensional de r = 4 triángulos que aparece 
a la derecha define s = 6 tales hiperplanos (que son rectas para d = 2). 
A partir de estos datos, construimos la B -matriz, una matriz (r x s) con en-
tradas en { + 1, -1, O}, de la manera siguiente: 
si Pi tiene una faceta en Hj , Y Pi ~ Ht, 
si Pi tiene una faceta en H j , Y Pi ~ H j-, 
si Pi no tiene una faceta en Hj. 
Por ejemplo, la configuración 2-dimensional del margen da lugar a la matriz 
( 
-i B= -1 
O 
O 
-1 
1 
-1 
1 
1 
O 
-1 
O 
O 
1 
O 
1 
O 
O 
O 
Son dignas de mención tres de las propiedades de la B-matriz: en primer lugar, 
puesto que cualquier símplice de dimensión d tiene d + 1 facetas, encontramos 
que cualquier fila de B tiene exactamente d + 1 entradas distintas de cero, y 
por tanto tiene exactamente s - (d + 1) entradas nulas. En segundo lugar, 
estamos tratando con una configuración de símplices que están en contacto 
dos a dos, y de ahí que para cada par de filas existe una columna en la cual una 
de las filas tiene un + 1, mientras que en la otra fila tiene un -1. Esto es, las 
filas son diferentes incluso si dejamos de considerar sus entradas nulas. En 
tercer lugar, las filas de B "representan" los símplices Pi mediante 
n n 
Ahora, obtenemos a partir de B una nueva matriz e en la cual cada fila de B 
queda reemplazada por todos los vectores fila que pueden generarse a partir 
de ella cambiando todos los ceros por + 1 ó -1. Ya que cada fila de B tiene 
s - d - 1 ceros, y B tiene r filas, la matriz e tiene 2s - d - I r filas. 
77 
78 
La primera fila de la matriz e repre-
senta el triángulo sombreado, mientras 
que la segunda fila corresponde a una in-
tersección vacía de los semiespacios. El 
punto x lleva al vector 
(1 -1 1 1 -1 1 ) 
que no aparece en la matriz e 
Símplices en contacto 
Para nuestro ejemplo, esta matriz C es una matriz (32 x 6) que comienza 
1 1 1 1 1 1 
1 1 1 1 1 -1 
1 1 1 -1 1 1 
1 1 1 -1 1 -1 
1 -1 1 1 1 1 
C= 1 
-1 1 1 1 -1 
1 -1 1 -1 1 1 
1 -1 1 -1 1 -1 
-1 -1 1 1 1 1 
-1 -1 1 1 1 -1 
donde las primeras ocho filas de C se derivan de la primera fila de B, las 
segundas ocho columnas provienen de la segunda fila de B, etc. Ahora, la 
cuestión es que todas las filas de C son diferentes: Si dos filas se derivan de 
la misma fila de B, entonces son diferentes ya que sus ceros han sido reem-
plazados de manera diferente; si derivan de filas diferentes de B, entonces son 
diferentes, sin importar cómo hayan sido reemplazados los ceros. 
Pero las filas de C son vectores de longitud s con entradas ±1, y existen 
únicamente 28 vectores diferentes de este tipo. Por tanto, y ya que las filas 
de C son distintas, la matriz C puede tener a lo sumo 28 filas, es decir, 
28 - d - 1r ~ 28 . 
Sin embargo, en C no aparecen todos los (±1)-vectores, lo cual conduce a una 
desigualdad estricta 28-d-1 r < 28 , Y portanto r < 2 d+1 . Para ver esto, nótese 
que cada fila de C representa una intersección de semi espacios - exactamente 
como para las filas de B en el caso anterior, mediante la fórmula (*). 
Esta intersección es un subconjunto del símplice Pi, que vino dado mediante 
la correspondiente fila de B. Tomemos un punto x E lR.d que no esté en 
ninguno de los hiperplanos H j , y tampoco en ninguno de los símplices Pi. A 
partir de este x obtenemos un vector con entradas ±1 que indica para cada j si 
x E Ht o x E H j-. Este (±1 )-vector no aparece en C, porque la intersec-
ción correspondiente de semiespacios contiene a x, de acuerdo con (*), y por 
tanto no está contenido en ningún símplice Pi. O 
[1] F. BAGEMIHL: A conjecture conceming neighboring tetrahedra, Amer. Math. 
Monthly 63 (1956) 328-329. 
[2] V. J. D. BASTON: Some Properties of Polyhedra in Euclidean Space, Pergamon 
Press, Oxford 1965. 
[3] M. A. PERLES: At most 2d+1 neighborly simplices in E d , Annals of Discrete 
Math. 20 (1984), 253-254. 
[4] J. ZAKS: Neighborly families of 2d d-simplices in E d , Geometriae Dedicata 11 
(1981),279-296. 
[5] J. ZAKS: No Nine Neighborly Tetrahedra Exist, Memoirs Amer. Math. Soco 
No. 447, Vol. 91, 1991. 
Alrededor de 1950 Paul Erd6s conjeturó que cualquier conjunto de más de 2d 
puntos en R d determina al menos un ángulo obtuso, es decir, un ángulo mayor 
que ~. En otras palabras, si un conjunto de puntos en R d tiene sólo ángulos 
agudos y rectos, entonces tiene como mucho 2d puntos. Este problema fue 
propuesto en un concurso por la Dutch Mathematical Society - pero sólo se 
recibieron soluciones para d = 2 Y d = 3. 
Para d = 2 el problema es sencillo: los cinco puntos pueden determinar un 
pentágono convexo, que siempre tiene un ángulo obtuso (de hecho, al menos 
un ángulo de al menos 108°). En otro caso, existe un punto contenido en 
el triángulo que definen otros tres, y dicho punto "ve" a las tres aristas del 
triángulo según tres ángulos que suman 360° , por lo que alguno de ellos es al 
menos de 120°. (El segundo caso incluye las configuraciones con tres puntos 
colineales y, por tanto, con un ángulo de 180°.) 
De manera independiente, Victor Klee preguntó poco después - y Erd6s di-
fundió la pregunta - cuántos puntos puede tener un conjunto de R d mante-
niendo la siguiente "propiedad antipodal": para cualquier par de puntos en el 
conjunto existe una banda (acotada por dos hiperplanos paralelos) que con-
tiene al conjunto, y que tiene a los dos puntos en hiperplanos distintos. 
En 1962, Ludwig Danzer y Branko Grünbaum consiguieron resolver los dos 
problemas simultáneamente: encerraron los dos tamaños máximos en una ca-
dena de desigualdades, que comienza y termina en 2d . Por tanto, la respuesta 
es 2d tanto para el problema de Erd6s como para el de Klee. 
En lo que sigue consideramos conjuntos (finitos) de puntos contenidos en 
Sr;;;; Rd , sus envolventes convexas conv(S) y, en general, politopos convexos 
Q r;;;; R d. (Véase el apéndice sobre politopos en la página 50 para un resumen 
de los conceptos básicos). Suponemos que los conjuntos tienen dimensión d, 
es decir, no están contenidos en un hiperplano. Dos conjuntos convexos se 
tocan si tienen al menos un punto de la frontera en común, pero sus interiores 
son disjuntos. Para un conjunto Q r;;;; R d y un vector s E R d denotamos por 
Q + s la imagen de Q por la traslación que envía O a s. De manera similar, 
Q - s es el conjunto que se obtiene al aplicar a Q la traslación que lleva s al 
origen. 
No se asuste: este capítulo es una excursión a la geometría d-dimensional, 
sin embargo los argumentos que utilizaremos no necesitan ninguna "intuición 
d-dimensional" ya que todos ellos pueden ser seguidos, visualizados (y, por 
tanto, comprendidos) en dimensión tres, e incluso en elplano. Por tanto, los 
dibujos ilustrarán la demostración para d = 2 (donde un "hiperplano" es sen-
cillamente una recta), y el lector podrá hacer sus propios dibujos para d = 3 
(donde un "hiperplano" es un plano). 
1 
o- --
80 Cualquier conjunto con muchos puntos tiene un ángulo obtuso 
Teorema 1. La siguiente cadena de desigualdades se verifica para cualquier 
dimensión d: 
(2) { ::; max #8 
(3) max{ #8 
8 <;;; ]Rd tales que para cualquier par de puntos} 
{Si,Sj} <;;; S existe una banda S(i,j) que contiene 
a 8 y que tiene a Si y Sj en hiperplanos distintos de 
lafrontera de S( i, j). 
8 <;;; ]Rd tales que los trasladados P - Si, Si E 8, de} 
la envolvente convexa P := conv(8) tienen un punto 
en común, pero sólo se tocan. 
(4) { 18 <;;; ]Rd tales que los trasladados Q + Si de algÚn} 
< max #8 politopo convexo d-dimensional Q <;;; ]Rd se tocan dos 
a dos. 
(5) { = max #8 
(6) d 
::;2 
8 <;;; ]Rd tales que los trasladados Q* + Si de algÚn} 
politopo convexo d-dimensional y centralmente simé-
trico Q* <;;; lEtd se tocan dos a dos. 
• Demostración. Tenemos que comprobar un total de seis igualdades y des-
igualdades. Comencemos. 
(1) Sea 8 := {O, l}d el conjunto de vértices del cubo unitario en ]Rd, y con-
sideremos Si, S j , S k E 8. Por simetría, podemos suponer que s j = O es el 
vector nulo. Por tanto, el ángulo está determinado por 
( ) 
(Si, Sk) 
cos<l Si,Sj,Sk = 1 .11 l' 
S~ .Sk 
que es claramente mayor o igual que cero. En consecuencia, 8 es un conjunto 
de cardinal 2d que no tiene ángulos obtusos. 
(2) Para Si, Sj E S consideramos el hiperplano Hij que pasa por el origen y 
es ortogonal a la arista [Si, Sj], es decir, Hij = {x E]Rd : (x, Si-Sj) = O} 
Y denotamos por Hij + S j el hiperplano paralelo que pasa por S j, es decir, 
Hij + Sj = {x + Sj : x E H ij }. Por tanto, Hij + Si Y Hij + Sj son hiper-
planos paralelos que pasan por Si y Sj, respectivamente, y son ortogonales a 
la arista [Si, Sj]. Obsérvese que la banda delimitada por Hij + Si Y Hij + Sj 
contiene, además de los puntos Si y Sj, exactamente todos los puntos x E ]Rd 
tales que los ángulos <l(Si,Sj,X) y <r(Sj,Si,X) no son obtusos. Podemos 
concluir entonces que si 8 no contiene ángulos agudos, la banda limitada por 
los hiperplanos Hij + Si Y Hij + Sj contiene todos los puntos de 8. 
(3) P está contenido en el semiespacio definido por Hij + S j que contiene a 
Si si y sólo si P - Sj está contenido en el semiespacio definido por Hij que 
contiene a Si - S j: la propiedad "un objeto está contenido en un semiespacio" 
no cambia si el objeto y el semiespacio sufren la misma traslación (en este 
caso, de vector -Sj). De manera similar, P está contenido en el semiespacio 
definido por Hij + Si que contiene a S j si y sólo si P Si está contenido en 
el semiespacio definido por Hij que contiene a S j - Si. 
Cualquier conjunto con muchos puntos tiene un ángulo obtuso 
Combinando ambos vemos que un P está contenido en la 
banda definida por Hij + Si Y Hij + Sj si y sólo si P - Si Y P - Sj están en 
lados diferentes del hiperplano Hij. 
La figura del margen ilustra esta correspondencia. 
Además, de Si E P = conv(S) se deduce que el origen está contenido en 
todos los trasladados P - Si (Si E S). Por tanto, los conjuntos P - Si se 
intersecan en el origen, pero sólo se tocan: los interiores son disjuntos dos a 
dos, ya que están en lados distintos del correspondiente hiperplano Hij. 
Esto es inmediato: "los trasladados se tocan dos a dos" es una afirmación 
más débil que "se intersecan en un punto, pero sólo se tocan." De manera simi-
lar, podemos relajar la condición permitiendo que P sea un politopo convexo 
arbitrario de JP;.d y reemplazar S por -S. 
(5) Aquí "2" es trivial, pero no es el resultado que nos interesa. Debemos 
comenzar con una configuración S ~ JP;.d Y cualquier politopo d-dimensional 
Q ~ JP;.d tal que los trasladados Q + Si (Si E S) se tocan dos a dos. Veamos 
que en esta situación podemos utilizar 
Q* := g(x - y) E JP;.d : x, y E Q} 
en lugar de Q. No es difícil: en primer lugar, Q* es d-dimensional, convexo 
y centralmente simétrico. Se puede comprobar que Q* es un politopo (sus 
vértices son de la forma ~ (qi - qj)' donde qi' qj son vértices de Q), pero esto 
no es importante para nosotros. 
A continuación demostraremos que Q + Si Y Q + Sj se tocan si y sólo si 
Q* + Si Y Q* + Sj se tocan. Para ello, observamos, siguiendo los pasos de 
Minkowski, que 
(Q*+Si) n (Q* + Sj) #- 0 
:3 I " I " Q. 1 (1 ") _ 1 (1 ") -{==? qi' qi' qj' qj E . 2" qi - qi + Si - 2" qj - qj + Sj 
"Cl I " I " Q. 1 (1 ") _ 1 (1 ") -{==? ::J qi) qi ,qj) qj E . 2" qi + qj + Si - 2" qj + qi + Sj 
-{==? :3qi) qj E Q : qi + Si = qj + Sj 
donde en la tercera (y crucial) equivalencia "-{==?" hemos utilizado que todo 
q E Q se puede escribir como q = ~ (q + q) para obtener "~", y que Q es 
t t I ( I + ") 1 ( I + ") Q bt "" convexo y, por an o, 2" qi qj' 2" qj qi E para o ener =?- . 
Por tanto, el paso de Q a Q* (conocido como simetrización de Minkowski) 
conserva la propiedad de que dos trasladados Q + Si Y Q + S j se intersecan. 
Es decir, hemos demostrado que para cualquier convexo Q, dos trasladados 
Q + Si Y Q + Sj se intersecan si y sólo si los trasladados Q* + Si Y Q* + Sj 
se intersecan. 
La siguiente caracterización demuestra que la simetrización de Minkowski 
también conserva la propiedad de que dos trasladados se tocan: 
Q + Si Y Q + Sj se tocan si y sólo si se intersecan; además, Q + Si 
Y Q + Sj + E(Sj - Si) no se intersecan para ningún E> O. 
81 
82 
Factordeescala~, vol(Pj) = ivo1(p) 
Cualquier conjunto con muchos puntos tiene un ángulo obtuso 
Supongamos que Q* + Si Y 
intersección 
se tiene que 
+ Sj se tocan. Para cualquier punto de la 
x - Si E Q* y x - Sj E Q*, 
por tanto, como Q* es centralm:ente simétrico, 
y, como Q* es convexo, 
Hemos demostrado que ~ (Si + Sj) está contenido en Q* + Sj para todo i. Por 
tanto, para P := conv(S) obtenemos 
Pj := ~(P + Sj) = conv g(Si + Sj) : Si E S} ~ Q* + Sj, 
de donde se deduce que los conjuntos Pj = ~ (P + S j) sólo se pueden tocar. 
Finalmente, los conjuntos Pj están contenidos en P, ya que los puntos Si, Sj 
y ~ (Si + S j) están en P por ser P convexo. Los conjuntos Pj son copias 
trasladadas y escaladas de P, contenidas en P. El factor de escala es ~, de 
donde se deduce que 1 
vol(Pj) = 2dvo1(P), 
ya que se trata de conjuntos de dimensión d. Esto quiere decir que en P caben, 
como mucho, 2d conjuntos P j y, por tanto, ISI :::; 2d . 
Con esto terminamos la demostración, ya que hemos cerrado la cadena de 
desigualdades. O 
... pero la historia no termina aquí. Danzer y Grünbaum hicieron la siguiente 
pregunta natural: 
¿ Qué ocurre si se pide que todos los ángulos sean en lugar 
de no obtusos, es decir, si se prohíben también los ángulos rectos? 
Danzer y Grünbaum construyeron configuraciones de 2d - 1 puntos en IFtd 
que sólo tenían ángulos agudos, y conjeturaron que éste era el mayor tamaño 
posible. Grünbaum demostró que esto es cierto para d :::; 3. Pero veintiún años 
después, en 1983, Paul Erdos y Zoltan Füredi demostraron que la conjetura es 
falsa - ¡por mucho, si la dimensión es alta! Su demostración es todo un 
ejemplo magnífico de la potencia de los argumentos probabilísticos; véase el 
capítulo 35 para una introducción al "método probabilístico." Nuestra versión 
de la demostración utiliza pequeñas mejoras en la elección de los parámetros 
debidas a nuestro lector David Bevan. 
Teorema 2. Para todo d ::::: 2 existe un conjunto S ~ {O, l}d de 2l v;: (~) d J 
puntos en IFtd (vertices del cubo unitario d-dimensional) que determinan sólo 
ángulos agudos. 
En particular, en dimensión d = 34 existe un conjunto de 72 > 2·34 - 1 
puntos que sólo tiene ángulos agudos. 
Cualquier conjunto con muchos puntos tiene un ángulo obtuso 
• Demostración. Sea m : = l V; ( ~ ) d J y obtengamos 3m vectores 
x(l), x(2), . .. , x(3m) E {O, l}d 
seleccionando sus coordenadas del conjunto {O, 1}, de manera aleatoria e 
independiente y conprobabilidad ~ para cada alternativa. (Se puede tirar una 
moneda 3md veces para ello; sin embargo, si d es grande esto puede resultar 
un poco aburrido.). 
Hemos visto anteriormente que todos los ángulos determinados por vecto-
res 0/1 no son obtusos. Por otra parte, tres vectores x(i), x(j), x(k) for-
man un ángulo recto con vértice en x(j) si y sólo si el producto escalar 
(x(i) - x(j), x(k) - x(j)) se anula, es decir, si se tiene que 
x(i)g - x(j)g = O o x(k)g - x(j)g = O para cada coordenada f!. 
Llamamos a (i,j, k) una terna mala si esto ocurre. (Si x(i) = x(j) ó 
x(j) = x(k), el ángulo no está definido pero la tema (i,j, k) es claramente 
mala.) 
La probabilidad de que una tema fija sea mala es exactamente (~) d: la tema 
será buena si y sólo si para una de las d coordenadas f! se tiene 
bien 
o bien 
x(i)g = x(k)g = O, 
x(i)g = x(k)g = 1, 
x(j)g = 1, 
x(j)g = O. 
Esto nos deja un total de seis posibilidades malas de un total de ocho igual-
mente probables, y una tema será mala si y sólo si ocurre una de las opciones 
malas (con probabilidad ~) para cada una de las d coordenadas. 
El número de temas que tenemos que considerar es 3 e;;n), ya que hay e;;n) 
conjuntos de tres vectores y en cada uno de ellos tenemos tres posibles vérti-
ces. Por supuesto, las probabilidades de que distintas temas sean malas no son 
independientes, pero la linealidad de la esperanza (que es lo que se obtiene 
al hacer el promedio entre todas las posibles selecciones, véase el apéndice) 
dice que la esperanza del número de temas malas es exactamente 3 (3;;n) (~) d. 
Esto quiere decir - y es en este punto cuando el método probabilístico mues-
tra su potencia - que hay alguna elección de los 3m vectores para la que hay 
como mucho 3 (3;;n) (~)d temas malas, donde 
de acuerdo con nuestra elección de m. 
Pero si no hay más de m temas malas, podemos eliminar m de los 3m vectores 
x (i) de forma que los restantes 2m vectores no contengan ninguna tema mala, 
es decir, determinen sólo ángulos agudos. O 
La "construcción probabilística" de un conjunto grande de puntos con coor-
denadas 0/1 Y sin ángulos rectos se puede implementar fácilmente, utilizando 
un generador de números aleatorios para "tirar la moneda." David Bevan ha 
construido de esta forma un conjunto de 31 puntos en dimensión d = 15 que 
sólo determina ángulos agudos. 
83 
84 Cualquier conjunto con muchos puntos tiene un ángulo obtuso 
Presentamos aquí tres herramientas básicas de la teoría de la probabilidad dis-
creta que aparecerán en varias ocasiones: las variables aleatorias, la linealidad 
de la esperanza y la desigualdad de Markov. 
Sea (D, p) un espacio de probabilidad finito, es decir, D es un conjunto finito y 
p = Prob es una aplicación de D en el intervalo [0,1] tal que ¿wESl p(w) = 1. 
Una variable aleatoria X en D es una aplicación X : D -----+ R Un espacio de 
probabilidad sobre el conjunto X(D) se construye definiendo 
p(X = x) := ¿X(w)=xp(w). Un ejemplo sencillo es un dado equilibrado (es 
decir, p(w) = i) con X = "el número obtenido cuando se tira el dado." 
La esperanza EX de X es el promedio, es decir, 
EX = L p(w)X(w). 
wESl 
Si X e Y son dos variables aleatorias en D, la suma X + Y es también una 
variable aleatoria, y se tiene que 
E(X + Y) LP(w)(X(w) + Y(w)) 
w 
LP(w)X(w) + p(w)Y(w) = EX + EY. 
w w 
Esta propiedad se puede extender fácilmente a cualquier combinación lineal 
finita de variables aleatorias - propiedad conocida como linealidad de la 
esperanza. Obsérvese que no es preciso que las variables aleatorias sean "in-
dependientes" en ningún sentido. 
La tercera herramienta es válida para variables aleatorias X que toman sólo 
valores no negativos, lo que escribimos como X ;::: O. Sea 
Prob(X;::: a) = L p(w) 
w:X(w)2:a 
la probabilidad de que X sea mayor o igual que cierto a > O. Entonces 
EX L p(w)X(w) + L p(w)X(w) > a L p(w), 
w:X(w)2:a w:X(w)<a 
y hemos demostrado la desigualdad de Markov 
EX 
Prob(X ;::: a) ::::: 
a 
w:X(w)2:a 
[1] L. DANZER & B. GRÜNBAUM: Über zwei Probleme bezüglich konvexer Korper 
von P. Erdos und von V. L. Klee, Math. Zeitschrift 79 (1962), 95-99. 
[2) P. ERDÓS & Z. FÜREDI: The greatest angle among n points in the 
d-dimensional Euclidean space, Annals of Discrete Math. 17 (1983), 275-283. 
[3) H. MINKOWSKI: Dichteste gitterformige Lagerung kongruenter Korper, Nachri-
chten Ges. Wiss. Géittingen, Math.-Phys. Klasse 1904, 311-355. 
El artículo que Karol Borsuk publicó en 1933, con el título "Three theorems on 
the n-dimensional euclidean sphere", tiene bastante fama porque contiene un 
importante resultado (conjeturado por Stanislaw Ulam) que ahora se conoce 
como el teorema de Borsuk-Ulam: 
Cualquier aplicación continua f : Sd --+ ]R.d lleva dos puntos antipo-
dales de la esfera Sd al mismo punto en rn;d. 
El mismo artículo también es famoso por un problema propuesto al final, que 
se conoce como la conjetura de Borsuk: 
Para S ~ ]R.d de diámetro acotado diam(S) > O, 
¿puede encontrarse una partición en, a lo sumo, d + 1 partes 
de menor diámetro? 
La cota d + 1 es la menor posible: si S es un símplice regular de dimensión d, 
o sencillamente el conjunto de sus d + 1 vértices, entonces ningún conjunto 
de una partición que reduzca el diámetro puede contener más de un vértice. 
Siendo f(d) el menor número tal que cualquier conjunto acotado S c:: ]R.d 
admite una particion en f (d) partes de menor diámetro, el símplice regular 
demuestra que f (d) 2 d + 1. 
La conjetura de Borsuk fue probada para el caso en que S es una esfera (por el 
mismo Borsuk), para cuerpos lisos (usando el teorema de Borsuk-Ulam), para 
d :S 3, ... pero el caso general permanecía abierto. La mejor cota superior 
para f (d) fue dada por Oded Schramm, quien demostró que 
f(d) :S (1.23)d 
para d suficientemente grande. Esta cota parece débil en comparación con la 
conjetura "f(d) = d + 1", pero en 1993 de pronto se convirtió en razonable 
cuando Jeff Kahn y Gil Kalai refutaron la conjetura de Borsuk de manera muy 
sorprendente. Sesenta años tras la publicación del artículo de Borsuk, Kahn y 
Kalai probaron que f(d) 2 (1.2)Vd para d suficientemente grande. 
Una versión de El Libro de la demostración de Kahn y Kalai fue dada por 
A. Nilli. De manera breve, y sin hacer referencia a otros teoremas, proporciona 
un contraejemplo explícito de la conjetura de Borsuk en dimensión d = 946. 
Presentamos una modificación de esta demostración, dada conjuntamente por 
Andrei M. Raigorodskii y Bernulf WeiBbach, que reduce la dimensión hasta 
d = 561 (y se puede llegar incluso a d = 560). El "récord" actual es d = 298, 
conseguido por Aicke Hinrichs y Christian Richter en el 2002. 
Karol Borsuk 
Cualquier símplice de dimensión d 
puede descomponerse en d + 1 partes, 
todas ellas de menor diámetro. 
86 
A. Nilli 
X
T (1 -1 -1 1 
( 
1 -1 -1 1 
-1 1 1-1 
xxT = -1 1 1-1 
1 -1 -1 1 
-1 1 1-1 
-1) 
-i) 
-1 
1 
La conjetura de Borsuk 
Teorema. Sea q = pm la de un n := - 2, Y d := G) = 
(2q - 1)(4q 3). Entonces existe un conjunto S <:;;; {+1, -l}d de 2n- 2 
puntos en lRd tal que cualquier partición de S en partes de menor diámetro 
que S tiene, al menos, 
partes. Para q = 9 se sigue que la conjetura de Borsuk es falsa en dimensión 
d = 561. Aún más, f(d) > (1.2)01 para d suficientemente grande. 
11 Demostración. El conjunto S se construye en cuatro pasos. 
Sean q la potencia de un primo, n = 4q - 2 y 
Q := {x E {+l,-l}n: xl = 1, #{i: Xi = -l}espar}, 
un conjunto de 2n - 2 vectores enlRn . Veremos que (x, y) == 2 (mod4) se veri-
fica para todos los vectores x, y E Q. Diremos que x, y son casi-ortogonales 
si I(x, 1= 2, Y probaremos que cualquier Q' <:;;; Q que no contiene vectores 
casi-ortogonales es "pequeño": IQ'I S ¿;::;g (n~l). 
(2) A partir de Q, construimos el conjunto 
R := {xxT:XEQ} 
de 2n-2 matrices simétricas n x n de rango 1. Las interpretamos como 
vectores de n 2 componentes, R <:;;; lRn2 . Probaremos que entre estos vecto-
res sólo hay ángulos agudos: tienen productos escalarespositivos (cuyo valor 
al menos es 4). Además, si R' <:;;; R no contiene dos vectores cuyo producto 
escalar es 4, entonces IR'I es "pequeño": IR'I S ¿;::;g (n~l). 
y 
En nuestra notación, los vectores x, y, ... son vectores columna y los 
vectores transpuestos x T , yT, ... son vectores fila. El producto de ma-
trices xxT es una matriz de rango 1, con (XXT)ij = XiXj. 
Si x, y son vectores columna, entonces su producto escalar es 
(x,y) = LXiYi = 
También necesitaremos productos escalares para matrices X, Y E 
lRnxn que se pueden interpretar como vectores de longitud n 2 . Por 
tanto, su producto escalar es 
(X, Y) .- L XijYij' 
i,j 
La conjetura de Borsuk 
A partir de R, obtenemos el conjunto de puntos en lR. G) cuyas coordenadas 
son las "entradas subdiagonales" de las matrices correspondientes: 
De nuevo, el conjunto S tiene 2n - 2 puntos. La distancia máxima entre estos 
puntos se obtiene precisamente para los vectores casi-ortogonales x, y E Q. 
Concluimos que un subconjunto S' c::; S de menor diámetro que S ha de ser 
"pequeño": IS'I :S ¿i~g (n~l). 
Del apartado (3) deducimos que cualquier partición de S que reduzca el 
diámetro necesita al menos 
g(q) .-
partes. En consecuencia, 
f(d) 2 max{g(q) , d + 1} para d = (2q - 1)(4q - 3). 
Por tanto, si 9 (q) > (2q - 1) (4q - 3) + 1, entonces existe un contraejemplo 
para la conjetura de Borsuk en dimensión d = (2q - 1) ( 4q - 3). En particular, 
g(9) > 56210 proporciona para d = 561. Además, veremos que 
e (27)q 
g(q) > 64q2 16 ' 
lo cual lleva a la cota asintótica f( d) > (1.2) Vd para d suficientemente grande. 
Detalles de (1): Empezamos con unas consideraciones sobre divisibilidad. 
Lema. Lafunción P(z) := (~:::;) es un polinomio de grado q - 2 cuyo valor 
numérico es entero para todo entero z. El entero P(z) es divisible entre p si y 
sólo si z no es congruente con O o con 1 módulo q . 
• Demostración. Escribimos el coeficiente binomial P(z) de la forma 
P(z) = (
z - 2) = 
q-2 
(z - 2)(z - 3) ..... (z - q + 1) 
(q-2)(q-3)· ...... ·2·1 
y comparamos el número de veces que aparece el factor p en el denominador 
y en el numerador. En el denominador aparece el mismo número de veces que 
en (q - 2)!, o en (q -1)!, ya que q -1 no es divisible entre p. Es más, según la 
afirmación del margen, en cualquier producto de q -1 enteros, escogidos cada 
uno de una clase diferente de residuos módulo q distinta de cero, el factor p 
aparece el mismo número de veces. 
Si z es congruente con O ó 1 (modq), entonces también lo es el numerador: 
Todos los factores en el producto pertenecen a clases de residuos diferentes, y 
las únicas clases que no aparecen son la clase del O (los múltiplos de q) y la 
clase, o bien del -1, o del +1, pero ni +1 ni -1 son divisibles entre p. Por 
tanto, el factor p aparece el mismo número de veces en el denominador y en 
el numerador, y de aquí que el cociente no sea divisible entre p. 
87 
Afirmación. Si a == b -=¡É O (modq), en-
tonces el factor p aparece en a y b el 
mismo número de veces. 
111 Demostración. Por congruencia, se 
verifica que a = b + spm, donde b no 
es divisible entre pm = q. Por lo tanto, 
podemos afirmar que cualquier potencia 
pk que divide a b verifica que k < m, y 
en consecuencia también divide a a. Lo 
mismo es cierto si intercambiamos los 
papeles de a y b. D 
88 La conjetura de Borsuk 
Por otra parte, si z t=- O, 1 (mod q), entonces en el numerador de (*) aparece 
un factor que es divisible entre q = pm. Al mismo tiempo, en este producto 
faltan factores de dos clases de residuos adyacentes no nulas: uno representa a 
números que no contienen ningún factor p, y el otro tiene menos factores p que 
q = pm. Por tanto, hay más factores p en el numerador que en el denominador, 
y el cociente resulta ser divisible entre p. . D 
Ahora consideremos cualquier subconjunto Q' ~ Q que no contenga vectores 
casi-ortogonales. Queremos llegar a que Q' ha de ser "pequeño". 
Tlrlrnacw'n 1. Si x, y son vectores distintos de Q, entonces i ((x, y) + 2) 
es un entero que satisface 
-(q-2) :::; ~((x,y)+2) :::; q-1. 
Tanto x como y tienen un número par de componentes -1, de modo que el 
número de componentes en las cuales difieren también es par. Por tanto, 
(x, y) = (4q - 2) - 2#{i : Xi -=1- Yi} == -2 (mod4) 
para todo x, y E Q, es decir, ~((x, y) + 2) es un entero. 
Puesto que x, y E {+1, _1}4q -2, sabemos que -(4q-2) :::; (x, y) :::; 4q-2, 
esto es, -(q-1):::; i((x,y) +2):::; q. Nunca se dala igualdad de la cota 
inferior, ya que Xl = Yl = 1 implica que x -=1- -y. La igualdad en la cota 
superior sólo se da si x = y. 
Afirmación 2. Para cualquier y E Q', el polinomio de grado q - 2 
en n variables Xl, ... , X n dado por 
Fy(x) := p(~((x,y)+2)) = (~((X,Y)+2)-2) 
q-2 
cumple que Fy(x) es divisible entre p para cada x E Q'\{y}, pero 
no para x = y. 
Los valores del polinomio F y (x) son siempre enteros, ya que viene expresado 
por un coeficiente binomial. Para x = y, obtenemos Fy(Y) = 1. Para x -=1- y, 
dellema se deduce que Fy (x) no es divisible entre p si y sólo si ~ ( (x, y) + 2) 
es congruente con O ó 1 (modq). Por la afirmación 1, esto ocurre sólo si 
~ ((x, y) + 2) es O ó 1, esto es, si (x, y) E {-2, +2}. Para ello, x e y han de 
ser casi-ortogonales, lo cual contradice la definición de Q'. 
Afirmación 3. Lo mismo es cierto para los polinomios F y (x) en 
las n - 1 variables X2, ... ,Xn obtenidos como sigue: Se expande 
Fy (x) en monomios, se elimina Xl. y se reducen todas las potencias 
superiores de las demás variables substituyendo Xl = 1 Y x; = 1 
para i > 1. El grado de F y (x) es, como máximo, q - 2. 
Los vectores x E Q ~ {+ 1, _l}n satisfacen Xl = 1 Y x; = 1. Por tanto, las 
substituciones no cambian los valores de F y (x) en el conjunto Q. Tampoco 
aumentan el grado, con lo cual el grado de F y (x) es a lo sumo q - 2. 
Afirmación 4. No existe ninguna relación lineal (con coeficientes 
racionales) entre los polinomios F y(x) para y E Q', es decir, son 
linealmente independientes sobre 1Ql. En particular, son distintos. 
La conjetura de Borsuk 
Supongamos que exista una relación de la forma ¿YEQ' ayF y (x) = O tal 
que no todos los coeficientes ay son cero. Tras multiplicar por un escalar 
apropiado, podemos suponer que los coeficientes son enteros, pero no todos 
ellos divisibles entre p. En este caso, para todo y E Q' la evaluación en 
x := y conduce a que ayF y(y) es divisible entre p, y de aquí que haya de 
serlo ay, ya que F y(y) no lo es. 
j"fl'w,'lu~i¡iln 5. IQ'I está acotado por el número de monomios libres 
de cuadrados en n - 1 variables y de grado a lo sumo q - 2, es decir, 
por ¿¡::g (n~l). 
Por construcción, los polinomios F y son libres de cuadrados: ninguno de 
sus monomios contiene una variable de grado mayor que 1. Por tanto, cada 
F y (x) es una combinación lineal de monomios libres de cuadrados de grado 
a lo sumo q - 2 en las n - 1 variables X2, . .. , X n . Puesto que los polinomios 
F y (x) son linealmente independientes, su número (que es I Q'I) no puede ser 
mayor que el número de monomios en cuestión. 
Detalles de (2): La primera columna de xxT es x. Por tanto, para distintos 
x E Q obtenemos matrices distintas M(x) := xxT . Interpretamos estas 
matrices como vectores de longitud n2 de componentes XiXj. El cálculo 
n n 
(M(x),M(y)) :L 'L,(XiXj) (YiYj) 
i=l j=l 
(x, y)2 > 4 
muestra que el producto escalar de M (x) Y M (y) se minimiza si y sólo si 
x, y E Q son casi-ortogonales. 
Detalles de (3): Sea U (x) E {+ 1, -1 } d el vector cuyas componentes son 
las entradas que aparecen por debajo de la diagonal en M (x). Puesto que la 
matriz M (x) = xxT es simétrica y los valores de la diagonal son + 1, vemos 
que M(x) =1= M(y) implica U(x) =1= U(y). Aún más, 
4 ~ (M(x), M(y)) = 2(U(x), U(y)) + n, 
esto es, n 
(U(x), U(y)) ~ -"2 + 2, 
y la igualdad se da si y sólo si x e y son casi-ortogonales. Puesto que todos 
los vectores U(x) E S tienen la misma longitud V(U(x), U(x)) = Iff), 
la distancia máxima entre puntos U (x), U (y) E S sealcanza exactamente 
cuando x e y son casi-ortogonales. 
Detalles de (4): Para q = 9 tenemos g(9) :=::ó 758.31, que es mayor que 
d + 1 = e24) + 1 = 562. 
Con el fin de obtener una cota general para d grande, usamos la monotonía y 
unimodalidad de los coeficientes binomiales, y las estimaciones n! > e( -;)n 
89 
M(x) ~ ~1 
90 La conjetura de Borsuk 
y n! < en(:;;-)n (véase apéndice del capítulo 2) para deducir que 
( 4q) ! e 4q (~) 4q 
= q q!(3q)! < q e (;)q e en3q = 4q2 (256) q. e 27 
De aquí concluimos que 
f(d) 2 g(q) 
A partir de esto y usando 
d = (2q 1)(4q-3) = 5q2+(q-3)(3q-1) 25q2 paraq23, 
q = ~ + V~ + l4 > [j, y (i~)V1 > 1.2032, 
obtenemos 
f(d) > 1;d(1.2032)v'd > (1.2)v'd parad suficientemente grande. O 
Un contraejemplo en dimensión 560 se obtiene observando que para q = 9 
el cociente g(q) R:ó 758 es mucho más grande que la dimensión d(q) = 561. 
Por tanto, se obtiene un contraejemplo para d = 560 tomando únicamente los 
"tres cuartos" de los puntos en S que satisfacen X21 + X31 + X32 = -1. 
Se sabe que la conjetura de Borsuk es cierta para d ::; 3, pero no ha sido 
verificada en ninguna dimensión mayor. En contraste, la conjetura sí es cierta 
hasta dimensión d = 8 si nos restringimos a subconjuntos S ~ {1, _l}d como 
los construidos aquí (véase [8]). En cualquier caso, es muy posible que puedan 
encontrarse contraejemplos en dimensiones razonablemente pequeñas. 
Referencias 
[1] K. BORSUK: Drei Satze über die n-dimensionale euklidische Sphiire, Fundamenta 
Math. 20 (1933),177-190. 
[2] A. HINRICHS & C. RICHTER: New sets with large Borsuk numbers, Preprint, 
February 2002,10 pages; Discrete Math., to appear. 
[3] J. KAHN & G. KALAI: A counterexample to Borsuk's conjecture, Bulletin Amer. 
Math. Soc. 29 (1993), 60-62. 
[4] A. NILLI: On Borsuk's problem, in: "Jerusalem Combinatorics '93" (H. Barcelo 
and G. Kalai, eds.), Contemporary Mathematics 178, Amer. Math. Soc. 1994, 
209-210. 
[5] A. M. RAIGORODSKII: On the dimension in Borsuk's problem, Russian Math. 
Surveys (6) 52 (1997), 1324-1325. 
[6] O. SCHRAMM: Illuminating sets of constant width, Mathematika 35 (1988),180-
199. 
[7] B. WEISSBACH: Sets with large Borsuk number, Beitrage zur Algebra und 
Geometrie/Contributions to Algebra and Geometry 41 (2000), 417-423. 
[8] G. M. ZIEGLER: Coloring Hamming graphs, optimal binary codes, and the 0/1-
Borsuk problem in low dimensions, Lecture Notes in Computer Science 2122, 
Springer-Verlag 2001,164-175. 
Ii '" I 
16 
Conjuntos, funciones 
y la hipótesis del continuo 93 
17 
Aquellas maravillosas 
desigualdades 1 09 
18 
Un teorema de Pólya 
sobre polinomios 117 
19 
Sobre un lema 
de Littlewood y Offord 123 
20 
La cotangente 
y el truco de Herglotz 127 
21 
La aguja de Buffon 133 
"El hotel de Hilbert junto al mar" 
La teoría de conjuntos, fundada por Georg Cantor en la segunda mitad del 
siglo ha transformado profundamente las matemáticas, de fonna que en 
la actualidad no tendrían sentido sin el concepto de conjunto o, en palabras 
de David Hilbert: "Nadie nos hará salir del paraíso (de la teoría de conjuntos) 
que Cantor ha creado para nosotros." 
Uno de los conceptos básicos definidos por Cantor fue el tamaño o cardinal 
de un conjunto M, denotado por INII. Para conjuntos finitos la definición no 
presenta dificultades: se cuentan los elementos y se dice que M tiene cardi-
nal n si contiene n elementos. Por tanto, dos conjuntos finitos M y N tienen 
igual cardinal si tienen el mismo número de elementos. 
Para definir el concepto de igual tamaño para conjuntos infinitos, hacemos 
el siguiente experimento mental para conjuntos finitos. Supongamos que un 
grupo de personas quieren subir a un autobús. ¿Cuándo diremos que el nú-
mero de personas es el mismo que el número de asientos libres? Sencillo: 
dejamos que las personas se sienten; si todas encuentran un asiento, y ningún 
asiento queda vacío, entonces (y sólo entonces) diremos que los conjuntos (de 
personas y de asientos) tienen igual tamaño. En otras palabras, el tamaño es 
el mismo si existe una biyección entre los dos conjuntos. Georg Cantor 
Esta es por tanto nuestra definición: se dice que dos conjuntos cualesquiera 
M y N (finitos o infinitos) tienen el mismo tamaño o cardinal si y sólo si 
existe una biyección entre M y N. Es evidente que la noción de igual tamaño 
es una relación de equivalencia y, por tanto, podemos asociar un número, lla-
mado cardinal, a cada clase de conjuntos del mismo tamaño. Por ejemplo, 
para conjuntos finitos obtenemos los cardinales O, 1, 2, ... ,n, ... donde n de-
nota la clase de los conjuntos de n elementos y, en particular, O denota al 
conjunto vacío 0. Obsérvese que, evidentemente, un subconjunto propio de 
un conjunto finito M tiene siempre tamaño menor que M. 
La teoría se vuelve mucho más interesante (y bastante contraria a la intui-
ción) cuando damos el salto a conjuntos infinitos. Consideremos el conjunto 
N = {l, 2, 3, ... } de los números naturales. Diremos que un conjunto M 
es numerable si se puede establecer una biyección entre M y N. En otras 
palabras, M es numerable si se pueden escribir sus elementos en una lista 
mI, m2, m3, . .. Nos encontramos ahora con un fenómeno extraño. Suponga-
mos que añadimos.a N un nuevo elemento x. Entonces, N U {x} sigue siendo 
numerable y, por tanto, ¡del mismo tamaño que N! 
El "hotel de Hilbert" es una ilustración muy atractiva de este hecho. Supon-
gamos que un hotel tiene una cantidad numerable de habitaciones, llamadas 
1,2,3, ... , de forma que el cliente Ci ocupa la habitación i; por tanto, el hotel 
está completo. Llega un nuevo cliente x en busca de habitación y el director 
1 
94 
x 
Conjuntos, funciones y la hipótesis del continuo 
del hotel le dice: Lo siento, todas las habitaciones están ocupadas. No hay 
problema, le contesta el recién llegado, cambie al cliente Cl a la habitación 2, 
a C2 a la 3, a C3 a la 4, y así sucesivamente, y yo me quedaré con la 1. Ante la 
sorpresa del director (que no es matemático) la idea funciona; sigue pudiendo 
alojar a todos los clientes, ¡más el recién llegado x! 
Ahora está claro que también podemos alojar a un nuevo cliente y, y a otro z, 
y así sucesivamente. Por tanto, al contrario que en el caso de conjuntos finitos, 
puede ocurrir que un subconjunto propio de un conjunto infinito M tenga el 
mismo tamaño que M. De hecho, como veremos, esta propiedad caracteriza 
el tamaño infinito: un conjunto es infinito si y sólo si tiene el mismo tamaño 
que alguno de sus subconjuntos propios. 
Abandonemos el hotel de Hilbert y volvamos a nuestros familiares conjuntos 
de números. El conjunto Z de los enteros también es numerable, ya que po-
demos ponerlo de la forma Z = {O, 1, -1,2, -2, 3, -3, ... }. Puede resultar 
más sorprendente que el conjunto de los números racionales también se puede 
enumerar de una forma similar. 
Teorema 1. El conjunto Ql de los números racionales es numerable . 
• Demostración. Enumerando el conjunto Ql+ de los racionales positivos 
como sugiere la figura del margen, omitiendo los ya encontrados, vemos que 
Ql+ es numerable y, por tanto, también lo es Ql si ponemos el O al principio y 
- ~ inmediatamente después de ~. Con esta estrategia, obtenemos 
Ql = {O, 1, -1, 2, -2,~, -~'!' -!, 3, -3,4, -4,~, -~, ... }. O 
Otra forma de interpretar la figura es la siguiente afirmación: 
La unión de una cantidad numerable de conjuntos numerables M n es 
también numerable. 
Si M n = {anl, an 2, a n3, ... } hacemos 
00 
U M n = {an, a21, a12, a13, a22, a31, a41, a32, a23, a14,··· } 
n=l 
exactamente igual que antes. 
Detengámonos un poco más en el proceso de enumeración de Cantor de los 
racionales positivos. Directamente de la figura obtenemos la sucesión 
121 1 2 3 432 1 1 2 345 
l' l' 2' 3' 2' l' l' 2' 3' 4' 5' 4' 3' 2' l' .,. 
y después tenemos que eliminar los números repetidos, como ~ = t ó % = ~. 
Hay una enumeración que es todavía más elegante y sistemática, y que no 
contiene repeticiones - encontrada recientemente porNeil Calkin y Herbert 
Wilf. La lista comienza de la siguiente forma: 
1 121 3 2 3 143 5 2 534 
l' 2' l' 3' 2' 3' l' 4' 3' 5' 2' 5' 3' 4' l' 
El denominador del n-ésimo número racional es igual al numerador del 
(n+ l)-ésimo. En otras palabras, la fracción n-ésima es b(n)jb(n + 1), donde 
(b( n) ) n2':0 es una sucesión que comienza con 
(1, 1, 2, 1, 3, 2, 3, 1,4,3, 5, 2, 5, 3, 4, 1,5, ... ). 
Conjuntos, funciones y la hipótesis del continuo 
Esta sucesión fue estudiada por vez por el matemático alemán Moritz 
Abraham Stem, en un artículo de 1858, y es conocida como la "serie diatómica 
de Stem." ¿Cómo se obtiene esta sucesión y, por tanto, la enumeración de 
Calkin-Wilf de los racionales positivos? Consideremos el árbol binario infinito 
del margen. Es fácil encontrar su definición recursiva: 
} es el primer nodo del árbol 
I!I todo nodo :Y tiene dos hijos: el de la izquierda es i!j y el de la derecha es 
i+j 
J 
Las siguientes propiedades se pueden demostrar fácilmente: 
(1) Todas las fracciones que aparecen en el árbol son irreducibles, es decir, si 
~ aparece en el árbol, entonces r y s son primos entre sí. 
Esto es cierto para el nodo t y para el resto lo demostramos por inducción 
hacia abajo. Si r y s son primos entre sí, tanto r y r + s como s y r + s lo son. 
(2) Toda fracción irreducible ~ > O aparece en el árbol. 
Procedemos por inducción sobre la suma r + s. El menor valor es r + s = 2, es 
decir, ~ = t, que aparece en el primer nodo. Si r > s, entonces r-:;s aparece 
en el árbol por la hipótesis de inducción y, por tanto, ~ es su hijo derecho. 
De manera similar, si r < s, entonces s:r aparece en el árbol y ~ es su hijo 
izquierdo. 
(3) Todas las fracciones irreducibles aparecen exactamente una vez. 
El argumento es similar. Si ~ aparece más de una vez, entonces r -=1= s, ya 
que todos los nodos del árbol, excepto el primero, son de la forma i!j < 1 ó 
i+j > 1. Finalmente, si r > s ó r < s, seguimos el mismo argumento por 
J 
inducción que anteriormente. 
Todos los números racionales positivos aparecen exactamente una vez en el 
árbol y, por tanto, podemos enumerarlos escribiendo los números por niveles, 
de izquierda a derecha. Esto nos proporciona el comienzo de la sucesión de 
Calkin-Wilf mostrado anteriormente. 
(4) El denominador de la n-ésima fracción de la lista es igual al numerador 
de la (n + 1 )-ésima. 
Esto es claramente cierto para n = O y cuando la fracción n-ésima es un hijo 
izquierdo. Supongamos que la fracción n-ésima ~ es un hijo derecho. Si ~ 
está en la frontera de la derecha, entonces s = 1 y el siguiente término de la 
sucesión está en la frontera izquierda y tiene numerador 1. Finalmente, si ~ 
está en el interior y ~ es el siguiente término de la sucesión, entonces ~ es 
el hijo derecho de r-:;s, ~ es el hijo izquierdo de s/~rl y, por inducción, el 
denQminador de r-:;s es el numerador de s/~rl y, por tanto, s = r'. 
Bonito, pero todavía hay más. Nos podemos plantear dos preguntas naturales: 
- ¿Tiene algún "significado" la sucesión (b( n) ) n:;::O ? 
95 
1 
1 
/I~ 
2 
"2 1 
1\ 1\ 
1 3 2 3 
3 "2 3 1 
r1 r1 r1 r1 
1 4 3 5 2 5 3 4 
4: 3 5" "2 5" 3 4: 1 
r1r1r1r1r1r1r1r1 
1 
5" 
r-s r l 
s s'-r' 
\ 1 
T.. r l 
s Sí 
96 
Por ejemplo, h(6) = 3, Y las represen-
taciones hiperbinarias son 
6=4+2 
6=4+1+1 
6=2+2+1+1. 
o 
~I 
1 
"5 
Conjuntos, funciones y la hipótesis del continuo 
- Dado ~,¿es sencillo encontrar el término siguiente en la enumeración? 
Para responder a la primera pregunta, observemos que el nodo b( n) jb( n + 1) 
tiene como hijos a b(2n + 1)jb(2n + 2) Y b(2n + 2)jb(2n + 3). Reuniendo 
los tres obtenemos las recursiones 
b(2n + 1) = b(n) y b(2n + 2) = b(n) + b(n + 1). (1) 
Haciendo b(O) = 1, la sucesión (b(n))n>O está determinada por (l). 
¿Existe alguna sucesión "conocida" y "elegante" que satisfaga la misma recUf-
sión? Sí, la hay. Sabemos que cualquier número n se puede escribir de forma 
única como suma de potencias de 2 distintas - obteniendo la representación 
binaria usual de n. Una representación hiperbinaria de n es una representa-
ción de n como suma de potencias de 2 donde cada potencia 2k aparece a lo 
sumo dos veces. Sea h(n) el número de tales representaciones de n. El lector 
queda invitado a comprobar que la sucesión h( n) satisface la recursión (1) y, 
por tanto, b( n) = h( n) para todo n. 
Por cierto, hemos demostrado un hecho sorprendente: si ~ es una fracción 
irreducible, existe exactamente un entero n tal que 'r = h(n) y s = h(n + 1). 
Veamos ahora la segunda pregunta. En nuestro árbol se tiene 
es decir, con x := ~, 
x 
l+x 
x 
x+1 
Utilizamos esto para generar un árbol binario infinito (sin raíz) de la siguiente 
forma: 
o 
1 
o 
1 
Conjuntos, funciones y la hipótesis del continuo 
En este árbol todas las filas son y en ellas aparece la enumeración de 
Calkin-Wilf de los racionales positivos (con un ~ adicional al principio). 
Ahora bien, ¿cómo se construye el siguiente racional a uno dado? Para res-
ponder a esta pregunta, recordemos que dado un racional x, su hijo derecho es 
x + 1, su "nieto" derecho es x + 2, y su k-descendiente derecho es x + k. De 
manera similar, el hijo izquierdo de x es l~x' cuyo hijo izquierdo es 1;2x y 
así sucesivamente: el k-descendiente izquierdo x es l;kx' 
Para determinar cómo obtener el número racional f (x) que va "a continua-
ción" de ~ = x en la enumeración, tenemos que analizar la situación mos-
trada en el margen. De hecho, cualquier racional no negativo x en nuestro 
árbol binario infinito es el k-descendiente derecho del hijo izquierdo de un 
racional y ~ O (para algún k ~ O), en tanto que f (x) es el k-descendiente 
izquierdo del hijo derecho del mismo y. Por tanto, de las fórmulas para los 
k-descendientes izquierdo y derecho se deduce que 
y 
x = 1 + Y + k, 
como se afirma en la figura del margen. Aquí, k = Lx J es la parte entera de x, 
mientras que l¡y = {x} es la parte decimal. De esto se deduce que 
y+1 
f(x) = 1 + k(y + 1) 
1 
Y!l + k 
1 1 
k + 1- Y¡l LxJ+1-{x}' 
Por tanto, hemos determinado una bonita expresión para el sucesor f (x) de x, 
encontrada muy recientemente por Moshe Newman: 
La función 
1 
x 1----+ f(x) = LxJ+1-{x} 
genera la sucesión de Calkin-Wilf 
lJ---+lJ---+~J---+lJ---+.:?J---+.:?J---+.:?J---+lJ---+i!J---+ 
1 2 1 3 2 3 1 4 3 
que contiene todos los racionales positivos exactamente una vez. 
La forma de Calkin-Wilf-Newman de enumerar los racionales positivos tiene 
otras propiedades notables. Por ejemplo, nos podemos preguntar por una ma-
nera rápida de determinar la n-ésima fracción de la sucesión, por ejemplo para 
n = 106 . Aquí está: 
Para encontrar la fracción n-ésima de la sucesión de Calkin-Wilf, escriba 
n en binario, n = (bkbk-l".blbo)2 y, a continuación, siga el camino 
en el árbol de CaIkin-Wilf determinado por sus dígitos, comenzando por 
t = ~, de la siguiente forma: bi = 1 significa "escoja el hijo derecho," es 
decir, "sume el denominador al numerador," mientras que bi = O significa 
"escoja el hijo izquierdo," es decir, "sume el numerador al denominador." 
La figura del margen muestra el camino resultante para n = 25 = (llOOlh: 
por tanto, el término 25" de la sucesión de Calkin-Wilf es ~. El lector puede 
1 
"2 
l+k(y+1) 
1\ 
97 
98 
° 1 
Una biyección f : (0,1] ---+ (0,1) 
Conjuntos, funciones y la hipótesis del continuo 
encontrar fácilmente un método similar para calcular, dada una fracción % (y 
su representación binaria), el lugar que ocupa en la sucesión de Calkin-Wilf. 
Pasemos al conjunto de números reales R ¿Es también numerable? No, no 
lo es, y el método de la demostración - el proceso de diagonalización de 
Cantor - no es sólo de importancia fundamental en toda la teona de conjun-
tos, sino que entra en El Libro como un golpe de ingenio inusual. 
Teorema 2. El conjunto lR. de los números reales no es numerable. 
11 Demostración. Cualquier subconjunto N de un conjunto numerable 
M = {mI, m2, m3, ... } es como mucho numerable (es decir, finito o nume-rable). Sencillamente, se enumeran los elementos de N tal y como aparecen 
en M. Por tanto, si podemos encontrar un subconjunto de lR. que no sea nume-
rable, entonces IR no puede ser numerable. El subconjunto M de lR. que vamos 
a estudiar es el intervalo (0,1] de los números reales positivos T tales que ° < T S; 1. Supongamos que M es numerable, y sea M = {TI, T2, T3, ... } 
una enumeración de M. Escribimos la única expresión decimal infinita de T n 
sin una sucesión infinita de ceros al final: 
donde ani E {O, 1, ... ,9} para todo n e i. Por ejemplo, 0.7 
Consideremos ahora la lista doblemente infinita 
TI 0.aUaI2aI3··· 
T2 0.a2Ia22a23··· 
0.6999 ... 
Para todo n, elegimos bn E {1, ... , 8} distinto de ann ; es evidente que esto 
es posible. Entonces b = 0.b I b2 b3 ... bn ... es un número real de M y, por tanto, 
debe aparecer en la lista anterior. Pero es imposible que b = Tk, ya que bk es 
distinto de akk. ¡Yeso es todo! O 
Continuemos un poco más con los números reales. Obsérvese que los cua-
tro tipos de intervalos (0,1), (O, 1]' [O, 1) Y [0,1] tienen el mismo cardinal. 
Como ejemplo, lo vamos a comprobar para (0,1] Y (0,1). La aplicación 
f: (0,1] ----+ (0,1), x 1----+ y definida por 
¡ 2. x 2 2.- x y:= ~ s-x para para para ~ < x S; 1, I < I 4 < x - 2' I < I S < X - 4' 
sirve para este propósito ya que es biyectiva: en la primera línea el rango de y 
es ~ S; y < 1, en la segunda línea i S; y < ~, en la tercera línea ~ S; y < i, 
y así sucesivamente. 
Conjuntos, funciones y la hipótesis del continuo 
A continuación observar que cualesquiera dos intervalos (de lon-
gitud finita y no nula) tienen el mismo cardinal considerando la proyección 
central de la figura. Todavía más: todo intervalo (de longitud no nula) tiene 
el mismo cardinal que la recta real R Para ver esto, recurrimos al intervalo 
abierto (O, 1) doblado de la figura y lo proyectamos en l8I. desde el punto S. 
En conclusión, cualquier intervalo abierto, semiabierto o cerrado (finito o infi-
nito) de longitud no nula tiene el mismo cardinal, y dicho cardinal es denotado 
por e, de continuo (un nombre utilizado a veces para el intervalo [0,1]). 
Que los intervalos finitos e infinitos tengan el mismo cardinal puede resultar 
razonable tras algo de reflexión, pero he aquí otro hecho que seguramente 
resulte más contrario a nuestra intuición. 
Teorema 3. El conjunto l8I.2 de todos los pares ordenados de números reales 
(es decir, el plano real) tiene el mismo cardinal que R 
• Demostración. Para ver esto, es suficiente demostrar que el conjunto de 
los pares (x, y), O < x, y ~ 1, se puede poner en correspondencia biyectiva 
con el intervalo (O, 1]. La demostración es otra vez de El Libro .. Consideremos 
el par (x, y) y escribamos x e y en su única expresión decimal infinita, como 
en el siguiente ejemplo: 
x 0.3 01 2 007 08 
Y 0.009 2 05 1 0008 
Obsérvese que hemos separado los dígitos de x e y en grupos, de forma que 
en cada grupo hay exactamente un dígito distinto de cero que aparece en la 
posición de la derecha. Ahora asociamos a cada (x, y) el número z E (0,1] 
que se obtiene al escribir el primer grupo de la x, a continuación el primer 
grupo de la y, después el segundo grupo de la x, y así sucesivamente. En 
nuestro ejemplo se obtiene 
z = 0.3009 01 2 2 05 007 1 08 0008 
Como ni la expresión de x ni la de y terminan con una cadena infinita de ceros, 
la expresión de z tampoco lo hace. Recíprocamente, a partir de la expresión 
de z podemos obtener de forma inmediata su imagen inversa (x, y), lo que 
demuestra que la aplicación es biyectiva, y así termina la demostración. O 
Como (x, y) f-----7 X + iy es una biyección entre l8I.2 y los números comple-
jos e, concluimos que ICI = Il8I.l = e. ¿Por qué nos resulta tan inesperado el 
resultado Il8I.2 1 = Il8I.l? Porque va contra nuestra intuición de dimensión. Este 
resultado dice que el plano 2-dimensional l8I.2 (y, en general, por inducción, el 
espacio n-dimensional l8I.n ) se puede poner en correspondencia biyectiva con 
la recta l-dimensional R Por tanto, la dimensión no se conserva al aplicar 
transformaciones biyectivas. Si, además, requerimos que la aplicación y su 
inversa sean continuas, entonces la dimensión sí se conserva, como demostró 
Luitzen Brouwer. 
Avancemos un poco más. Hasta ahora hemos desarrollado la noción de igual 
cardinal. ¿Cuándo diremos que M no es más grande que N? La respuesta 
viene dada de nuevo por las aplicaciones. Diremos que el cardinal m es menor 
o igual que n si para dos conjuntos M y N tales que IMI = m y INI = n, 
99 
S 
100 
N 
"Schroder y Bernstein pintando" 
N 
M 
Conjuntos,junciones y la hipótesis del continuo 
existe una de NI en N. Es evidente que la relación m ::; 
es independiente de los conjuntos NI y N elegidos. Si los conjuntos son finitos 
esto se corresponde con la noción intuitiva: un conjunto con m elementos es 
menor o igual que un conjunto de n elementos si y sólo si m ::; n. 
Nos enfrentamos ahora a un problema fundamental. Nos gustaría que las pro-
piedades usuales de las desigualdades siguieran siendo válidas para los car-
dinales. Pero, ¿es esto cierto para los cardinales infinitos? Por ejemplo, ¿es 
cierto que m ::; TI Y TI ::; m implica que m = TI? Esto no es en absoluto 
evidente: tenemos conjuntos infinitos NI y N Y aplicaciones j : NI ---+ N 
Y 9 : N ---+ M que son inyectivas pero no necesmiamente sobreyectivas. 
Esto sugiere construir una biyección enviando algunos elementos m E M a 
j (m) EN, Y algunos elementos n E N a 9 (n) E M. Pero no está claro cómo 
se pueden coordinar las distintas elecciones para que "encajen bien." 
La respuesta es afirmativa y viene dada por el famoso teorema de Schri:ider-
Bernstein, que anunció Cantor en 1883. Las primeras demostraciones fueron 
dadas por Friedrich SchrOder y Felix Bernstein algún tiempo después. La 
demostración que presentamos apareció en un pequeño libro de uno de los gi-
gantes de la teoría de conjuntos del siglo XX, Paul Cohen, famoso por resolver 
la hipótesis del continuo (sobre la que hablaremos posteriormente). 
Teorema 4. Si existen aplicaciones inyectivas de M a N y de N a M, enton-
ces existe una biyección entre M y N, es decir, IMI = INI . 
• Demostración. Podemos suponer que M y N son disjuntos - en caso 
contrario, reemplazamos N por una nueva copia. 
Las aplicaciones inyectivas j y 9 mandan elementos de jlv! a elementos de 
N, y viceversa. Una forma de clarificar esta situación potencialmente confusa 
es alinear M U N en cadenas de elementos: tomamos un elemento arbitrario 
mo E M, Y desde él formamos una cadena de elementos aplicando j, des-
pués g, a continuación de nuevo j, otra vez g, y así sucesivamente. La cadena 
se puede cerrar (éste es el caso 1) si mo aparece de nuevo en el proceso, o 
puede continuar indefinidamente con elementos distintos. (Por ser las apli-
caciones inyectivas, el primer elemento "repetido" de la cadena no puede ser 
distinto de mo). 
Si la cadena prosigue indefinidamente, tratamos de recorrerla en orden in-
verso: de mo a g-l(mo) si ffio está en la imagen de g, a continuación a 
continuo 
J-l (mo)) si (mo) está J, y así sucesivamente. 
Pueden aparecer otros tres casos: el proceso de recorrer la cadena hacia atrás 
continuar indefinidamente detenerse en un elemento de 
NI que no está en la de 9 parar en un elemento de N 
que no está en la de J 
De esta forma, Iv! U N de cuyos ele-
mentos se 
Caso l. Cadena finita de 2k + 2 elementos distintos (k 2: O) 
f 9 J J 
mo ~ no -----311-- mI ~ mk~nk 
~ 9 ~ 
Caso 2. Cadena doblemente infinita de elementos distintos 
J 9 J 9 f 
... ~ mo -----311-- no ~ mI -----311-- nI ~ m2-----311--
Caso 3. Cadena infinita de elementos distintos que empieza en el elemento 
mo E NI\g(N) 
f 9 f 9 f 
mo ~ no -----311-- mI ~ nI -----311-- m2 ~ 
Caso 4. Cadena infinita de elementos distintos que empieza en el elemento 
no E N\f(NI) 
9 f 9 f 
no ~ mo -----311-- nI ~ mI -----311-- o 
¿Qué ocurre con el resto de de las desigualdades? Como de cos-
tumbre,se dice que m < n si m < pero m 7=. n. Acabamos de ver 
que para dos cardinales cualesquiera se verifica como mucho una de estas tres 
posibilidades 
m < n, m = n, tU > n 
y, según la teoría de los cardinales, se sabe que siempre se cumple exactamente 
una. (Véase la proposición 2 en el apéndice de este capítulo). 
Además, el teorema de Schroder-Bernstein asegura que la relación < es tran-
sltlva, es m < n y <.J;! que m < .J;!. Por tanto, el conjunto 
de los cardinales está totalmente ordenado, comenzando con los cardinales 
finitos 0, 1,2,3, .... Recurriendo a los axiomas de Zermelo-Fraenkel (en par-
ticular, al axioma de elección) se deduce fácilmente que cualquier conjunto 
infinito NI contiene un subconjunto numerable: 1\11 contiene un elemento mI; 
el conjunto NI \ {mI} es no vacío que es y, por tanto, contiene un 
elemento m2; considerando el conjunto NI\ {mI, m2} se asegura la existencia 
de m3, Y así sucesivamente. Por tanto, el cardinal de un conjunto numerable 
es el menor cardinal infinito, denotado usualmente por ~o (que se lee "aleph 
sub-cero"). "El menor cardinal infinito" 
102 
También hemos demostrado un resul-
tado anunciado anteriormente: 
Todo conjunto infinito tiene el mismo ta-
maño que alguno de sus subconjuntos 
propios. 
Conjuntos, funciones y la hipótesis del continuo 
Como un corolario de No ::; m para cardinal infinito m, IJV\JICUIVc> 
demostrar el resultado del "hotel de Hilbert" para cualquier cardinal infinito 
m, es decir, se tiene que 1 M U {x} 1 = 1 M 1 para cualquier conjunto infinito 
M. En efecto, M contiene un subconjunto N = {mI, m2, m3, .. . }. Ahora 
mandamos x a mI, mI a m2, Y así sucesivamente, dejando fijos los elementos 
de M\N. Esto nos proporciona la biyección requerida. 
Otra consecuencia del teorema de Schroder-Bemstein que podemos demos-
trar es que el conjunto P(N) de todos los subconjuntos de N tiene cardi-
nal c. Tal y como hemos observado anteriormente, es suficiente demostrar que 
IP(N)\{0}1 = 1(0,1]1. Un ejemplo de aplicación inyectiva es 
f:P(N)\{0} ---+ (0,1], 
en tanto que 
g: (0,1] ---+ P(N) \ {0}, 
define una aplicación inyectiva en la otra dirección. 
Hasta ahora conocemos los números cardinales 0, 1, 2, ... , No, Y sabemos que 
el cardinal c de lR es mayor que No. El paso de CQl con ICQlI = No a lR con 
IlRl = c sugiere de manera inmediata la siguiente pregunta: 
¿ Es c = IlRl el siguiente cardinal infinito tras No? 
Por supuesto, nos encontramos con el problema de si siquiera existe el cardinal 
siguiente o, en otras palabras, si NI tiene sentido. Lo tiene - daremos un 
esquema de la demostración de este hecho en el apéndice de este capítulo. 
La afirmación c = NI es conocida como la hipótesis del continuo. La pregunta 
de si la hipótesis del continuo es cierta fue durante décadas uno de los mayores 
retos de las matemáticas. La respuesta nos lleva a los límites de la lógica: Kurt 
Godel y Paul Cohen demostraron que la afirmación c = NI es independiente 
de los axiomas de Zermelo-Fraenkel, de la misma forma que el axioma de las 
paralelas es independiente del resto de los axiomas de la geometría euclídea. 
Existen modelos en los que se verifica c = NI Y existen otros modelos de la 
teoría de conjuntos donde se verifica c i- NI. 
A la vista de este hecho, es interesante preguntar si existen otras condiciones 
(por ejemplo, del análisis) que sean equivalentes a la hipótesis del continuo. 
Es natural preguntar por un ejemplo del análisis, ya que históricamente las 
primeras aplicaciones importantes de la teoría de conjuntos de Cantor se die-
ron en este campo, más concretamente en la teoría de funciones complejas. A 
continuación presentamos uno de estos ejemplos junto con la solución, extre-
madamente simple y elegante, encontrada por Paul Erd6s. En 1962, Wetzel 
hizo la siguiente pregunta: 
Sea { fa} un conjunto de funciones analíticas distintas dos a dos defini-
das sobre e tales que para cada z E e el conjunto de valores {fa (z)} 
es como mucho numerablé (es decir, es finito o numerable); llamemos 
a esta propiedad (Po). 
¿Es cierto que el conjunto es, a lo sumo, numerable? 
Conjuntos, funciones y la hipótesis del continuo 
poco después, Erdos demostró que, SOIlJfI~ncienternellte, la respuesta de-
pende de la hipótesis del continuo. 
Teorema 5. Si e > N1, entonces toda familia {joJ que satisface (Po) es 
numerable. Si, por el contrario, e = N1, existe alguna familia {f oJ con la 
propiedad (Po) que tiene tamaño c. 
Para presentar la demostración necesitamos algunos hechos básicos sobre nú-
meros cardinales y ordinales. Los lectores poco familiarizados con estos con-
ceptos pueden encontrar un resumen de los resultados necesarios en el apén-
dice del final del capítulo. 
111 Demostración del teorema 5. Supongamos que e> N1 . Demostraremos 
que para cualquier familia {fa} de cardinal N1 de funciones analíticas existe 
un número complejo Zo tal que todos los N1 valores fa (zo) son distintos. Por 
tanto, si una familia de funciones satisface (Po), debe ser numerable. 
Para ver esto, hacemos uso de nuestro conocimiento de los números ordina-
les. En primer lugar, ordenamos la familia {fa} de acuerdo con el ordinal 
inicial W1 de N1 . Según la proposición 1 del apéndice, esto quiere decir que 
el conjunto de índices recorre los números ordinales a menores que W1. A 
continuación mostramos que el conjunto de pares (a, (3), a < (3 < W1, tiene 
cardinal N1 . Como todo (3 < W1 es un ordinal numerable, el conjunto de pares 
(a, (3), 00< (3, es numerable para cualquier (3 fijo. Tomando la unión sobre los 
N1 elementos (3, deducimos de la proposición 6 del apéndice que el conjunto 
de todos los pares (a, (3), a < (3, tiene cardinal N 1. 
Para cada par a < (3 consideramos el conjunto 
8(00, (3) = {Z E ce : fa(z) = f(3(z)}. 
Veamos que cada conjunto 8( a, (3) es numerable. En efecto, consideremos los 
círculos Ck de radio k = 1,2,3, ... centrados en el origen del plano complejo. 
Si fa y f (3 son iguales en infinitos puntos de algún Cko entonces fa y f (3 son 
idénticas según un conocido resultado sobre funciones analíticas. Por tanto, 
fa y f (3 son iguales en un número finito de puntos de cada Ck y, por tanto, 
en una cantidad como mucho numerable de puntos en todo el plano. Ahora 
definimos 8 := Ua<(3 8(00, (3). De nuevo, según la proposición 6, se tiene que 
8 tiene cardinal N1 , ya que cada conjunto 8(00, (3) es numerable. Llegamos 
ahora al punto clave: como ce tiene cardinal e y, por hipótesis, e es mayor que 
N1 , existe un número complejo Zo que no está en 8 y, para Zo los N1 valores 
fa (zo) son distintos. 
Supongamos ahora que e = N 1. Consideremos el conjunto D S;;; ce de números 
complejos p + iq con parte real e imaginaria racional. Como para cada p 
el conjunto {p + iq : q E Q} es numerable, sabemos que D es numerable. 
Además, D es un conjunto denso en ce: cualquier disco abierto del plano 
complejo contiene puntos de D. Sea {za : O ::; a < W1} un buen orden de ce. 
Construiremos una familia {f(3 : O ::; (3 < W1} de N1 funciones analíticas 
distintas tales que 
!(3(Za) E D siempre que a < (3. (1) 
103 
104 
"Una leyenda sobre San Agustín cuenta 
que, mientras caminaba por una playa y 
contemplaba el infinito, vio un niño que 
intentaba vaciar el océano con una pe-
queña concha . .. " 
Conjuntos, funciones y la hipótesis del continuo 
Una familia tal satisface la condición (Po). En cada Z E re tiene 
un índice, digamos Z = Zú' Ahora bien, para todo (3 > a los valores {f¡3(zú)} 
están en el conjunto numerable D. Como a es un ordinal numerable, las fun-
ciones f ¡3 tales que (3 :S a contribuirán a lo sumo con una cantidad numerable 
de valores f¡3(zú) y, por tanto, el conjunto de todos los valores {j¡3(zú)} es 
también como mucho numerable. Por tanto, si construimos una familia {f¡3} 
que verifique (1), habremos concluido la demostración. 
La construcción de {f ¡3} utiliza inducción transfinita. Para fa podemos tomar 
cualquier función analítica, por ejemplo fa = constante. Supongamos que 
yahemos construido f ¡3 para todo (3 < r' Como r es un ordinal numerable, 
podemos reordenar {f ¡3 : O :S (3 < r} en una sucesión gl, g2, g3, . . .. La 
misma reordenación de {Za : O :S a < r} nos proporciona una sucesión 
W1, W2, W3, .... A continuación construimos una función f-y que satisface para 
todo n las condiciones 
y (2) 
La segunda condición nos asegura que todas las funciones f'Y (O :S r < W1) 
son distintas, y la primera es exactamente (1), lo que implica (Po) como hemos 
visto anteriormente. Obsérvese que la condición f'Y ( wn) -=1=- gn ( wn) es una vez 
más un argumento de diagonalización. 
Para construir f'Y escribimos 
f'Y(z) ca + c1(Z - wd + c2(Z - wd(z - W2) 
+ c3(Z - wd(z - W2)(Z - W3) + .... 
Si r es un ordinal finito, entonces f'Y es un polinomio y, por tanto, analítica, y 
podemos escoger números Ci para los que se satisfaga (2). Si r es un ordinal 
numerable, entonces 
00 
f'Y (z) L cn(z - W1)'" (z - wn ). (3) 
n=O 
Obsérvese que los valores de Cm (m 2: n) no influyen en el valor f'Y(wn) y, 
por tanto, podemos elegir los Cn paso a paso. Si la sucesión (cn) tiende a O su-
ficientemente rápido, entonces (3) define una función analítica. 
Finalmente, como D es un conjunto denso, podemos elegir la sucesión (cn) 
de forma que f'Y verifique las condiciones de (2), lo que completa la demos-
tración. D 
y 
Comenzaremos preguntando si para cada número cardinal existe un siguiente. 
Como primer paso veamos que, dado un cardinal m, siempre existe un cardi-
nal n mayor que m. Para ello utilizamos de nuevo una versión del proceso de 
diagonalización de Cantor. 
Sea M un conjunto. Veamos que el conjunto P(M) de todos los subconjun-
tos de M tiene cardinal mayor que M. La aplicación que envía m E M a 
{ m} E P (M) demuestra que M se puede poner en correspondencia biyectiva 
con un subconjunto de P(M), que es la definición de que ¡M¡ :S ¡P(M)¡. 
Conjuntos, funciones y la hipótesis del continuo 
Nos por demostrar que no existe entre P(IIIr) y un 
subconjunto de M. Supongamos que esto es falso y sea cp : --+ P(M) 
una biyección de N c;: M en P(M). Consideremos el subconjunto U c;: N 
de todos los elementos de N que no están contenidos en su imagen por cp, es 
decir, U == {m E N : m ti- cp(m)}. Como cp es una biyección, existe u E N 
tal que cp(u) = U. Pero ahora ¡tanto u E U como u ti- U resultan imposibles! 
En si u E U, entonces u ti- cp ( u) = U según la definición de U, en 
tanto que si u ti- U = cp ( u), entonces u E U, Y llegamos a una contradicción. 
Es probable que el lector haya visto este argumento anteriormente. Es el viejo 
enigma del barbero: "Existe un barbero que afeita a todos los hombres que no 
se afeitan a sí mismos. ¿Se afeita el barbero a sí mismo?" 
Para continuar señalamos algunas otras importantes ideas debidas a Cantor: 
los conceptos de conjuntos ordenados y números ordinales. Un conjunto M 
está ordenado por < si la relación < es transitiva y, para cualesquiera dos 
elementos a i=- b de M, se tiene que a < b o que b < a. Por ejemplo, podemos 
ordenar N de la forma usual, N = {l, 2, 3, 4, ... }, pero, por supuesto, también 
podemos ordenar N al revés, N = { ... , 4, 3, 2, l}, o enumerar primero los 
números impares y después los pares, N = {l, 3, 5, ... , 2, 4, 6, ... }. 
He aquí el concepto clave. Se dice que un conjunto ordenado M está bien 
ordenado si todo subconjunto no vacío de M tiene un primer elemento. Por 
tanto, los órdenes primero y tercero de N considerados anteriormente son bue-
nos órdenes, pero el segundo no lo es. El importante teorema del buen orden, 
que es una consecuencia de los axiomas (incluido el axioma de elección), dice 
que todo conjunto M admite un buen orden. En adelante, sólo consideraremos 
conjuntos en los que se ha definido un buen orden. 
Diremos que dos conjuntos bien ordenados M y N son similares (o del mismo 
tipo de orden) si existe una biyección cp de M en N que respeta la ordenación, 
es decir, tal que m <!VI n implica que cp(m) <N cp(n). Obsérvese que 
cualquier conjunto ordenado que es similar a un conjunto bien ordenado está 
también bien ordenado. 
La similaridad es obviamente una relación de equivalencia y, por tanto, pode-
mos hablar del número ordinal a definido por una clase de conjuntos similares. 
Para conjuntos finitos, dos órdenes cualesquiera son buenos órdenes similares, 
y utilizamos de nuevo el número ordinal n para la clase de los conjuntos con 
n elementos. Obsérvese que, por definición, dos conjuntos similares tienen 
igual cardinal. Por tanto, tiene sentido hablar del cardinallal de un número 
ordinal a. Obsérvese también que cualquier subconjunto de un conjunto bien 
ordenado está bien ordenado según el orden inducido. 
Igual que hicimos con los números cardinales, ahora comparamos dos núme-
ros ordinales. Sea M un conjunto bien ordenado y m E M. Llamamos a 
Mm = {X E M : X < m} el segmento (inicial) de M determinado por m; N 
es un segmento de M si N = Nlm para algún m. En particular, Mm es el con-
junto vacío cuando m es el primer elemento de M. Consideremos ahora los 
números ordinales f.1> y v de los conjuntos bien ordenados M y N. Se dice que 
f.1> es menor que v, f.1> < v, si M es similar a un segmento de N. Aquí también 
se tiene la propiedad transitiva y f.1> < v, v < 1f implica que f.1> < 1f, ya que una 
aplicación que respeta el orden transforma un segmento en un segmento. 
105 
Estos dos conjuntos bien orde-
nados, N {l, 2, 3, 4, .. .} y 
N {1,3,5, ... ,2,4,6, ... } no 
son similares: el primer orden tiene 
un solo elemento que carece de uno 
inmediatamente anterior, en tanto que 
el segundo tiene dos. 
El número ordinal de {l, 2, 3, ... } 
es menor que el número ordinal de 
{l, 3, 5, ... ,2,4,6, ... }. 
106 Conjuntos, funciones y la hipótesis del continuo 
Es evidente que, para conjuntos finitos, m < n conserva su sentido usual. 
Sea W el número ordinal de N = {l, 2, 3, 4, ... } con la ordenación usual. 
Considerando el segmento Nn +1 se deduce que n < w para todo n finito. 
Veamos que w :::; a para todo número ordinal infinito a. En efecto, si el 
conjunto infinito bien ordenado M tiene número ordinal a, entonces M con-
tiene un primer elemento mI, el conjunto NI\ { mI} contiene un primer ele-
mento m2, M\ {mI, m2} contiene un primer elemento m3. De esta forma 
se construye la sucesión mI < m2 < m3 < ... de elementos de NI. Si 
M = {mI, m2, m3, ... }, entonces M es similar a N y, por tanto, a = w. Si, 
por el contrario, M\ {mI, m2, ... } es no vacío, contiene un primer elemento 
m, de donde se deduce que N es similar al segmento Mm, que es la definición 
dew < a. 
Presentamos ahora (sin incluir las demostraciones, que no son difíciles) tres 
resultados básicos sobre números ordinales. El primero dice que cualquier 
número ordinal p tiene un conjunto bien ordenado W,u como representante 
"canónico" . 
Proposición 1. Sea p un número ordinal y sea W,u el conjunto de números 
ordinales menores que p. Entonces se verifica que: 
(i) Los elementos de W,u son comparables dos a dos. 
(ii) Si ordenamos W,u de acuerdo al tamaño, entonces W,u está bien ordenado 
y tiene número ordinal p. 
Proposición 2. Dos números ordinales cualesquiera p y v verifican una y 
sólo una de las relaciones p < v, p = v Ó p > v. 
Proposición 3. Todo conjunto de números ordinales (ordenado de acuerdo al 
tamaño) está bien ordenado. 
Tras esta excursión a los números ordinales volvemos a los números cardina-
les. Sea m un número cardinal y sea Om el conjunto de los números ordinales 
p tales que Ipl = m. De acuerdo con la proposición 3, existe un menor nú-
mero ordinal Wm en Om, al que llamamos número ordinal inicial de m. Como 
ejemplo, w es el número ordinal inicial de ~o. Tras estos preparativos, ya po-
demos demostrar un resultado básico para este capítulo. 
Proposición 4. Para todo número cardinal m existe cierto número cardinal 
siguiente mayor que m . 
• Demostración. Ya sabemos que existe algún número cardinal mayor n. 
Sea JC el conjunto de los números cardinales mayores que m y menoreso 
iguales que n. A cada,p E JC le asociamos su número ordinal inicial wp. De 
entre estos números iniciales elegimos el menor (el cual sabemos que existe 
por la proposición 3), y el correspondiente número cardinal es el menor de JC 
y, por tanto, el número cardinal siguiente a m que buscábamos. D 
Proposición 5. Sea M un conjunto infinito de cardinal m y bien ordenado con 
respecto al número ordinal inicial wm. Entonces M no tiene último elemento. 
Conjuntos, funciones y la hipótesis del continuo 
• Demostración. En efecto, si M tuviera un último elemento m, entonces el 
segmento Mm tendría un número ordinal IL < Wm tal que IILI = m, lo que 
contradice la definición de Wm. O 
Para terminar, lo que necesitamos es una ampliación considerable del resul-
tado de que la unión de una cantidad numerable de conjuntos numerables es 
tamLién numerable. En el siguiente resultado consideramos familias arbitra-
rias de conjuntos numerables. 
Proposición 6. Supongamos que {A,,} es una familia de tamaño m de con-
juntos numerables Aa> donde m es un cardinal infinito. Entonces, la unión 
U Aa tiene tamaño menor o igual que m. 
a 
• Demostración. Podemos suponer que los conjuntos Aa son disjuntos dos 
a dos, ya que esto sólo puede aumentar el tamaño de la unión. Sea NI tal que 
IMI = m el conjunto de índices y consideremos su buen orden de acuerdo 
al número ordinal inicial Wm. A continuación reemplazamos cada a E NI 
por un conjunto numerable Ba~ {ba1 = a,ba2 ,ba3 , ... }, ordenado con 
respecto a w, y denotamos por M al conjunto obtenido. Entonces, M es de 
nuevo un conjunto bien ordenado si definimos bai < bf!L cuando a < (3 y 
bai < baj cuando i < j. Sea ¡L el número ordinal de M. Como M es un 
subconjunto de M, se tie~ que IL :::; ¡L según el argumento anterior. Si IL = ¡L, 
entonces M e~imilar a NI, en tanto que si IL < ¡L, entonces M es similar a un 
segmento de M. Ahora bien, como la ordenación Wm de NI no tiene último 
elemento (proposición 5) vemos que, en ambos casos, M es similar a la unión 
de conjuntos numerables B{3 y, por tanto, tiene el mismo cardinal. 
El resto es sencillo. Sea r.p : U B{3 ---+ M una biyección y supongamos que 
r.p(B{3) = {al,a2,a3,.··}. Reemplazamos cada ai por Aai y considera-
mos la unión U Aai' Como U Aai es la unión de una cantidad numerable de 
conjuntos (y, por tanto, numerable), se tiene que B{3 tiene el mismo tamaño 
que U Aai' En otras palabras, existe una biyección entre B {3 y U Aai para 
todo (3 y, por tanto, una biyección 'Ij; entre U B{3 y U Aa. Finalmente, 'lj;r.p-l 
es la biyección buscada entre M y U A", con lo que I U Aa I = m. O 
[1] L. E. J. BROUWER: Beweis der Invarianz der Dimensionszahl, Math. Annalen 70 
(1911), 161-165. 
[2] N. CALKIN & H. WILF: Recounting the rationals, Amer. Math. Monthly 107 
(2000),360-363. 
[3] P. COHEN: Set Theory and the Continuum Hypothesis, W. A. Benjamin, New York 
1966. 
[4] P. ERDOS: An interpolation problem associated with the continuum hypo-
thesis, Michigan Math. J. 11 (1964), 9-10. 
[5] E. KAMKE: Theory of Sets, Dover Books 1950. 
[6] M. A. STERN: Ueber eine zahlentheoretische Funktion, Journal für die reine und 
angewandte Mathematik 55 (1858), 193-220. 
107 
108 del continuo 
"Una infinidad más de cardinales" 
En el ámbito del análisis abundan las desigualdades, como bien se refleja en el 
famoso libro de Littlewood y Pólya, que lleva precisamente por título 
"Desigualdades". Veremos dos de las más básicas, con dos aplicaciones para 
cada una, y conoceremos la opinión de George Pólya (colaborador de honor 
en El Libro) sobre cuáles son las demostraciones más apropiadas. 
Nuestra primera desigualdad se atribuye tanto a Cauchy como a Schwarz, e 
incluso a Buniakowski: 
TeoremaI 
Sea b) 
[a[2 := 
~ .... ,,.~;~ ... "'~'" de L~m(~!'n'-SchwlliJ'Z 
un producto interno en un espacio vectorial real V (con norma 
a)). Entonces 
se cumple para todos los vectores a, b E V. La igualdad se da si y sólo si a y 
b son linealmente dependientes . 
• Demostración. La siguiente demostración, de origen desconocido, es qui-
zás la más corta. Consideremos la función cuadrática 
en la variable x. Podemos suponer que a i=- O. Si b = Aa, entonces es 
claro que (a, b)2 = [a[2[b[2. Si en cambio los vectores a y b son linealmente 
independientes, entonces se verifica que [xa+b[2 > O para todo x, y por tanto 
el discriminante (a, b)2 - [a[2[b[2 es menor que O. . O 
Nuestro segundo ejemplo es la conocida desigualdad para las medias armó-
nica, geométrica y aritmética: 
Teorema 11 \.LVJU"U"'" armónica, geométrica y aritmética) 
Sean al, ... , an números reales positivos. Entonces 
n 
< 
En ambos casos, se da la igualdad si y sólo si todos los ai son iguales . 
• Demostración. La siguiente demostración, bella y singular, se atribuye a 
Cauchy (véase [7]). Sea P(n) el enunciado de la segunda desigualdad, escrito 
en la forma 
(
al+ ... +an)n 
al a2 ... an :S n . 
Para n = 2, tenemos al a2 :S (al !a2 )2 ~ (al - a2)2 2: O, lo cual es cierto. 
A continuación procedemos en dos pasos: 
110 Aquellas maravillosas desigualdades 
P(n) =? P(n - 1) 
(E) P(n) y P(2) =? P(2n), 
lo cual claramente implica el resultado. 
n-l 
Para demostrar (A), sea A:= I.: na~l' Entonces 
k=l 
n-l 
P(n) 
< 
y por tanto TI ak < An - l 
k=l 
Para (E), vemos que 
P(n) 
< 
La condición para la igualdad se concluye con la misma facilidad. 
La desigualdad izquierda, entre la media armónica y geométrica, se sigue al 
considerar l, ... , ~. O 
al a n 
111 Otra demostración. De las muchas demostraciones de la desigualdad en-
tre las medias aritmética y geométrica (la monografía [2] contiene más de 50), 
resaltaremos una particularmente impactante, la de Alzer, de fecha reciente. 
De hecho, esta demostración proporciona la desigualdad más fuerte 
para cualquier al, ... , an , PI, ... ,Pn positivos tales que I.:~=l Pi = 1. En 
adelante, denotaremos por G la expresión de la izquierda, y por A la de la 
derecha. Podemos suponer que al :s; .. , :s; ano Claramente al :s; G :s; an, 
por tanto debe existir algún k con ak :s; G :s; ak+!. Concluimos que 
(1) 
ya que todos los integrandos son 2: O. Al reescribir (1) obtenemos 
Aquellas maravillosas desigualdades 
donde el primer miembro es a 
~ ai- G 
~P'-
i=l 2 G 
A 
- -1 
G ' 
y el segundo miembro es igual a 
n n 
LPi(log ai -log G) = log afi -log G = O. 
i=l i=l 
Por tanto, é - 1 :::o: 0, es decir, A :::o: G. En el caso de igualdad, todas las 
integrales en (1) deben anularse, lo cual implica al = ... = an = G. D 
Nuestra primera aplicación es un bonito resultado de Laguerre (véase [7]) 
acerca de la ubicación de raíces de polinomios. 
Teorema 1. Supongamos que todas las raíces de xn + an_lXn- 1 + ... + ao 
son reales. Entonces estas raíces están contenidas en el intervalo de extremos 
• Demostración. Sea y una de las raíces e Yl, ... ,Yn-l las otras. Enton-
ces el polinomio es (x - y) (x - Yl) ... (x - Yn-l). Por tanto, comparando 
coeficientes, 
y obtenemos 
y + Yl + ... + Yn-l, 
Y(Yl + ... + Yn-d + LYiYj, 
22 2 an-l - an-2 - Y = 
i<j 
n-l 
LY;' 
i=l 
Al aplicar la desigualdad de Cauchy a (Yl,' .. , Yn-d y (1, ... ,1) resulta 
n-l 
< (n - 1) LY; = (n - l)(a;_l - 2an-2 - y2), 
i=l 
o 
2 2an -l 2(n - 1) n - 2 2 
Y + --y + an-2 - --an-l :s; O. n n n 
En consecuencia, y (y por tanto todos los Yi) están entre las dos raíces de la 
función cuadrática, y estas raíces son precisamente nuestras cotas. D 
Nuestra segunda aplicación parte de una conocida propiedad elemental de las 
parábolas. Consideramos la parábola descrita por f (x) = 1-X2 entre x = -1 
Y x = 1. Asociamos a f (x) el triángulo tangencial y el rectángulo tangencial 
de la figura. 
11 
(0,2) 
(-1, O) o (1,0) 
112 
-1 ' v 
2 
Mathematical Reviews 
Erd8s, P. and 
roota. Ano, 
Es seij(x) 
, 1 
f(-l)~f(I)~O, o <f(.);g¡;¡(P) für -1<x<l, 
wobei -1<~<1, so dilSS p. d¡e SteIle des Maximums von 
¡(x) im IntervaU (-1, 1) bedeutet. Dann ist 
21'(1)1'(-1) l' 
~---;g¡; !(x)dx;g¡;!·2!(.), 
1'(1)-}'(-I) -,Aquellas maravillosas desigualdades 
Nos encontramos con que el área sombreada A = J~l (1 - x2)dx es igual a 
t, y las áreas T y R del triángulo y del rectángulo son ambas iguales a 2. Por 
T 3 R 3 
tanto A = "2 Y A = "2' 
En un artÍCulo muy bonito, Paul Erd6s y Tibor Gallai .preguntaron qué pasa 
cuando f (x) es un polinomio real arbitrario de grado n, con f (x) > O para 
-1 < x < 1 Y f( -1) = f(l) = O. El área A es en este caso J~l f(x)dx. 
Supongamos que en el intervalo (-1, 1) el polinomio f (x) alcanza su valor 
máximo en b, de manera que R = 2f(b). Al calcular las tangentes en -1 y 1, 
se verifica fácilmente (véase el recuadro) que 
T = 21'(1)1'(-1) 
1'(1) - 1'( -1)' 
respectivamente T = O para f' (1) = l' ( -1) = O. 
LU"'UFiLUV tangencial es precisamente Yo, donde (xo, Yo) 
es el punto de intersección entre las dos tangentes. Las ecuaciones de 
dichas tangentes son Y = 1'( -l)(x + 1) e Y = 1'(l)(x - 1), por tanto 
f'(l) + 1'(-1) 
xo = f'(l) f'( -1)' 
y en consecuencia 
, (1'(1) + 1'( -1) ) 
Yo = f (1) f'(l) f'(_l)-l 
2 1'(1)1'(-1) 
f'(l) - f'(-l)" 
(2) 
En general, no hay cotas no triviales para 3i y ~. Para darse cuenta de ello, 
basta tomar f (x) = 1- x2n. Entonces T = 2n, A = 2~~ 1 ' Y en consecuencia 
3i > n. De manera similar, R = 2 y ~ = 23~1, que se acerca tanto como 
queramos a 1 cuando n tiende a infinito. 
Sin embargo, tal y como demostraron Erd6s y Gallai, sí existen mejores cotas 
para polinomios que sólo tienen raíces reales. 
Teorema 2. Sea f (x) un polinomio real de grado n 2: 2 que sólo tiene raíces 
reales, y tal que f(x) > O para -1 < x < 1 Y f( -1) = f(l) = O. 
Entonces 
2 2 
-T < A < -R 
3 - - 3 ' 
Y en ambos casos se cumple la igualdad solamente para n = 2. 
Erd6s y Gallai establecieron este resultado mediante una compleja demostra-
ción por inducción. En una reseña del trabajo, que apareció en 1940 en la 
primera página de la primera edición de los Mathematical Reviews, George 
Pólya explicó cómo demostrar la primera desigualdad usando la desigualdad 
entre la media aritmética y la media geométrica - un ejemplo muy bello de 
una reseña hecha con mucho detalle, que al mismo tiempo proporciona una . 
demostración de El Libro. 
Aquellas maravillosas desigualdades 
• Demostración de :::; A. Dado que f (x) sólo tiene raÍCes nin-
guna de ellas en el intervalo abierto ( -1, 1), se puede escribir de la forma 
'--- x) + x) (3) 
j 
con Oí 2" 1, (3j 2" 1 - no teniendo en cuenta un factor constante positivo que 
al final se cancelará. Por tanto, 
- x) + x)dx. 
j 
Al sustituir x f-----+ -x, nos encontramos con que también 
+ x) II ((3j - x)dx, 
j 
yen consecuencia, por la desigualdad entre la media aritmética y la geométrica 
(nótese que todos los factores son 2" O) 
1 
A = J ~[ (1-x 2)II(aí- x)II((3j+x) + 
-1 ' J 
(1- X2) II(ai + x) II((3j - x) ]dx 
i j 
1 
> J (1 - x2) (II (a; - x2) II ((3; - x2) r/2 dx 
-1 • J 
1 
> J (1- X2) (II (a; - 1) II ((3; - 1) r/2 dx 
-1 ' J 
= ~ (II(a; -1) II((3; -1)) 1/2. 
i j 
Calculemos f'(l) Y f'(-l). (Podemos suponer que f'(-1), 1'(1) -=J O, ya 
que de otra manera T = O y la desigualdad ~ T :S A se vuelve trivial.) Por (3) 
vemos que 
f'(1) = -2 
y de manera similar que 
Por ende, podemos concluir que 
-1) II((3j + 1), 
j 
-1) . 
j 
A > ~(-f'(1)f'(-1))1/2 3 . 
113 
114 
i 
o 
'----v,----' 
di 
Aquellas maravillosas desigualdades 
Al aplicar ahora la desigualdad entra la media aritmética y la media geométrica 
a - l' (1) Y JI (1), llegamos por medio de (2) a la conclusión 
2 2 
A ~ - 1 1 
3 -f'(1) + f'(-I) 
4 1'(1)1'(-1) 
31'(1) - 1'(-1) 
2 
-T 
3 ' 
que es lo que queríamos demostrar. Analizando el caso de igualdad en todas 
las desigualdades, el lector puede verificar fácilmente la última afirmación del 
teorema. O 
Queremos invitar al lector a que busque una demostración igualmente bonita 
de la segunda desigualdad del teorema 2. 
Era de esperar que en el análisis abundasen las desigualdades, pero he aquí un 
ejemplo de la teoría de grafos donde su uso surge de manera muy inesperada. 
Más adelante, en el capítulo 32, hablaremos del teorema de Turán, que en el 
caso más sencillo afirma lo siguiente: 
Teorema 3. Sea G un grafo con n vértices y sin triángulos. Entonces G tiene 
2 
como mucho ~ aristas, y se da la igualdad solamente si n es par y G es el 
grafo bipartito completo K n/ 2,n/2 . 
• Primera demostración. Esta demostración, que saca buen partido de la 
desigualdad de Cauchy, se debe a Mantel. Sea V = {1, ... , n} el conjunto de 
vértices y E el conjunto de aristas de G. Denotamos por di el grado de i, de 
donde ¿iEV di = 21EI (véase la página 143 del capítulo 22). Supongamos 
que ij es una arista. Dado que G no tiene triángulos, nos encontramos con 
que di + d j ~ n, ya que ningún vértice es vecino a la vez de i y j. 
Se sigue que 
L (di + d j ) ~ nlEI· 
ijEE 
Nótese que di aparece exactamente di veces en la suma, de manera que 
ijEE iEV 
Y al aplicar la desigualdad de Cauchy a los vectores (dI, ... , dn ) y (1, ... , 1), 
se obtiene 
nlEI ~ L d; ~ (¿ di )2 = 41E12, 
n n 
iEV 
de donde se sigue el resultado. En el caso de la igualdad vemos que di = d j 
para todo i,j, y además que di = ~ (ya que di + dj = n). Puesto que G no 
tiene triángulos, de manera inmediata se sigue que G = Kn/2,n/2. O 
• Segunda demostración. La siguiente demostración del teorema 3, que 
usa la desigualdad entre la media aritmética y la geométrica, es realmente una 
demostración de El Libro, y a pesar de su popularidad no está claro a quién 
atribuirla. 
Sea a el cardinal de un conjunto independiente máximo A, y f3 = n-a. 
Puesto que G no tiene triángulos, los vecinos de un vértice i forman un con-
junto independiente, de donde se deduce que di ~ a para todo i. 
Aquellas maravillosas desigualdades 
El conjunto B = de cardinal f3 es incidente con cada arista de G. Al 
contar las aristas de G según sus vértices extremos en B, obtenemos la relación 
IEI :::; ¿iEB di. La desigualdad entre la media aritmética y la geométrica 
ahora da 
y de nuevo el caso de igualdad puede estudiarse fácilmente. o 
[1] H. ALZER: A proof of the arithmetic mean-geometric mean inequality, Amer. 
Math. Monthly 103 (1996), 585. 
[2] P. S. BULLEN, D. S. MITRINOVICS & P. M. VASlé: Means and their Inequali-
ties, Reidel, Dordrecht 1988. 
[3] P. ERDOS & T. GRÜNWALD: On polynomials with only real roots, Annals Math. 
40 (1939), 537-548. 
[4] G. H. HARDY, J. E. LITTLEWOOD & G. PÓLYA: Inequalities, Cambridge Uni-
versity Press, Cambridge 1952. 
[5] W. MANTEL: Problem 28, Wiskundige Opgaven 10 (1906), 60-61. 
[6] G. PÓLYA: Review of [3], Mathematical Reviews 1 (1940), 1. 
[7] G. PÓLYA & G. SZEGO: Problems and Theorems in Analysis, Vol. 1, Springer-
Verlag, Berlin Heidelberg New York 1972/78; Reprint 1998. 
115 
Entre las muchas contribuciones de George Pólya al análisis, la siguiente ha 
sido siempre la favorita de Erd6s, tanto por lo sorprendente del resultado como 
por la belleza de la demostración. Supongamos que 
es un polinomio complejo de grado n ::::: 1 con coeficiente director 1. Asocia-
mos a f(z) el conjunto 
e := {z E re : If(z)1 :::; 2}, 
es decir, e es el conjunto de puntos cuya imagen por f está dentro del círculo 
de radio 2 y centro en el origen del plano complejo. Por tanto, para n = 1 el 
conjunto e es un círculo de diámetro 4. 
Utilizando un argumento asombrosamente simple, Pólya demostró la siguiente 
preciosa propiedad del conjunto e: 
Tomemos cualquier recta L del plano complejo y consideremos la 
proyección ortogonal eL del conjunto e en L. Entonces, la longitud 
total de dicha proyección es siempre menor o igual que 4. 
¿ Qué quiere decir que la longitud total de la proyección eLes menor o igual 
que 4? Veremos que eLes una unión finita de intervalos disjuntos h, ... , Jt 
y, por tanto, la condición significa que C(h) + ... + C(Jt ) :::; 4, donde C(Jj ) es 
la longitud usual de un intervalo. 
Haciendo un giro del plano, vemos que es suficiente considerar el caso en que 
L es el eje realdel plano complejo. Teniendo en cuenta estos comentarios, 
veamos el resultado de pólya. 
Teorema 1. Sea f(z) un polinomio complejo de grado mayor o igual que 1 y 
con coeficiente director 1. Sea e = {z E re : If(z)1 :::; 2} y sea R laproyec-
ción ortogonal de e sobre el eje real. Entonces, existen intervalos h, ... , Jt 
de la recta real cuya unión recubre R y que satisfacen 
C(h) + ... + C(It) :::; 4. 
Es claro que la cota de 4 del teorema se alcanza para n = 1. Con el fin 
de ganar intuición sobre el problema veamos qué ocurre con el polinomio 
f(z) = z2 - 2, que también alcanza la cota de 4. Si z = x + iy es un número 
complejo, entonces x es su proyección ortogonal sobre la recta real. Por tanto, 
R = {x E IR : x + i Y E e para algún y}. 
George Pólya 
L 
18 
y 
x 
Pavnuty Chebyshev en un sello sovié-
tico de 1946 
Un teorema de Pólya sobre polinomios 
El lector demostrar fácilmente que para el ~V'HR'UJLI"V f (z) = Z2 - 2 se 
tiene x + iy E e si y sólo si 
De aquí se deduce que x4 ::; (X2 + y2)2 ::; 4X2 y, por tanto, x2 ::; 4, es decir, 
Ixl ::; 2. Por otra parte, todo z = x E ~ tal que Ixl ::; 2 verifica IZ2 - 21 ::; 2, 
de donde se deduce que n es el intervalo 2] de longitud 4. 
Como primer paso escribimos f(z) = (z - el) ... (z - en) con ek = ak + 
ibk , Y consideramos el polinomio real p(x) = (x - ad··· (x - an ). Para 
z = x + iy E e, según el teorema de Pitágoras 
y, por tanto, Ix - akl ::; Iz - ekl para todo k, es decir, 
Hemos visto que n está contenido en el conjunto P = {x E ~ : Ip( x) I ::; 2}, 
y si podemos demostrar que este conjunto está contenido en una familia de 
intervalos de longitud total menor o igual que 4, habremos tenninado. Así, 
nuestro resultado principal (teorema 1) será una consecuencia del siguiente 
resultado. 
Teorema 2. Sea p( x) un polinomio real de grado n ;::: 1 con coeficiente direc-
tor 1 y tal que todas sus raíces son reales. Entonces el conjunto 
P = {x E ~ : Ip( x) I ::; 2} está contenido en un conjunto de intervalos 
de longitud total menor o igual que 4. 
Como Pólya demuestra en su artículo [2], el teorema 2 es, a su vez, una con-
secuencia del siguiente resultado, debido a Chebyshev. Para que este capítulo 
sea autocontenido hemos incluido una demostración en el apéndice (siguiendo 
una bonita exposición de Pólya y Szeg6). 
Teorema de 
Todo polinomio real p( x) de grado n ;::: 1 con coeficiente director 1 verifica 
1 
_~';~llp(x)1 ;::: 2n - l · 
Observemos la siguiente consecuencia inmediata. 
Corolario. Sea p( x) un polinomio real de grado n ;::: 1 con coeficiente 
director 1, y supongamos que Ip(x) I ::; 2 para todo x en el intervalo [a, b]. 
Entonces b - a ::; 4. 
11 Demostración. Considérese el cambio de variable y = b~a (x a) -1. Si 
x E [a, b], entonces y E 1,1]. El polinomio correspondiente 
q(y) = p(b;a(y+1)+a) 
tiene como coeficiente director (b;a)n y verifica 
max Iq(y)1 = max Ip(x)l· 
-l~y~l a~x~b 
Un teorema de Pólya sobre polinomios 
Del teorema de se deduce que 
y, por tanto, b - a :S: 4, como queríamos demostrar. O 
Este corolario nos deja muy cerca del resultado del teorema 2. Si el conjunto 
p = {x : Ip( x) I :S: 2} es un intervalo, la longitud de P es menor o igual 
que 4. Sin embargo, el conjunto P puede no ser un intervalo, como en el 
ejemplo mostrado en la figura, en el que P está formado por dos intervalos. 
¿Qué podemos decir sobre P? Como p(x) es una función continua, sabemos 
inmediatamente que P es una unión de intervalos cerrados disjuntos 11 , h, ... , 
y que p( x) toma los valores 2 ó -2 en cada extremo de un intervalo 1j. De 
aquí se deduce que hay un número finito de intervalos h, ... , ft, ya que p( x) 
sólo puede tomar un valor dado un número finito de veces. 
La maravillosa idea de Pólya fue construir otro polinomio f5( x) de grado n, 
también con coeficiente director 1, Y tal que 15 = {x : 1f5( x ) I :S: 2} es un 
intervalo de longitud al menos f(h) + ... + C(1t). Entonces, el corolario 
demuestra que f(h) + ... + C(1t) :S: C(15) :S: 4, y hemos terminado . 
• Demostración. del teorema 2. Consideremos p( x) = (x - al) ... (x - an ) 
con P = {x E lR : Ip(x)1 :S: 2} = hU ... U ft, donde hemos ordenado los 
intervalos 1j de forma que h es el primero por la izquierda e 1t es el primero 
por la derecha. La primera observación es que cualquier intervalo 1j contiene 
alguna raíz de p( x ). En efecto, sabemos que p( x) toma los valores 2 ó -2 en 
los extremos de 1j. Si un valor es 2 y el otro -2, debe haber una raíz en 1j. 
Supongamos que p( x) = 2 en ambos extremos (el caso -2 es análogo). Sea 
b E 1j un punto donde p( x) alcanza su mínimo en 1j. Entonces pi (b) = O 
y p"(b) ;::: O. Si p"(b) = O, entonces b es una raíz múltiple de p'(X) y, 
por tanto, una raíz de p( x) según la observación 1 del recuadro de la página 
siguiente. Si, por el contrario, p" (b) > O, entonces se tiene que p(b) :S: O 
según la observación 2 del mismo recuadro. Por tanto, o bien p(b) = O, Y 
hemos encontrado la raíz, o bien p(b) < O, y tenemos una raíz en el intervalo 
entre b y cualquiera de los dos extremos de 1j. 
He aquí la idea final de la demostración. Sean 11 , ... ,1t los intervalos consi-
derados anteriormente, y supongamos que el primer intervalo por la derecha, 
ft, contiene m raíces de p( x), contadas según su multiplicidad. Si m = n, en-
tonces 1t es el único intervalo (según lo que acabamos de demostrar), y hemos 
terminado. Supongamos que m < n y sea d la distancia entre 1t - l e 1t (como 
en la figura). 
Sean bl , ... , bm las raíces de p( x) contenidas en 1t y el, ... en-m el resto de 
las raíces. Escribimos p(x) = q(x )r(x), donde q(x) = (x - bl ) ... (x - bm ) 
y r(x) = (x - el)'" (x - en-m), y definimos Pl(X) = q(x + d)r(x). El 
polinomio PI (x) es también de grado n y tiene un 1 como coeficiente director. 
Para x E hU ... U 1t - l se tiene Ix + d - bil < Ix - bil para todo i y, por 
tanto, Iq(x + d)1 < Iq(x)l. De aquí se sigue que 
para xEhu ... U1t - l . 
19 
Para el polinomio p( x) = x2 (x - 3) se 
tieneP = [1-V3, l]U[l+V3, ~ 3.2] 
h ... 1t-l 1t 
. ! 
120 Un teorema de Pólya sobre polinomios 
Si, por el contrario, x E entonces Ir(x - d)1 :::; Ir(x)1 y, por tanto, 
Ipl(X d)1 = Iq(x)llr(x d)1 :::; Ip(x)1 :::; 2, 
loquesignificaqueIt -d<;;;P1 ={x: Ipl(X)1 :::;2}. 
En resumen, hemos visto que PI contiene a hU ... UIt-l u( It -d) y, por tanto, 
su longitud es mayor o igual que la de P. Obsérvese que en el paso de p( x) a 
Pl(X) los intervalos It-l e It - d se unen en un solo intervalo. Concluimos 
que los intervalos h, ... , Js de PI (x) que forman PI tienen longitud al menos 
f(h) + ... + f(It), y que el primer intervalo por la derecha, J s , contiene más 
de m raíces de PI (x). Repitiendo este procedimiento como mucho t - 1 veces, 
obtenemos un polinomio p(x) tal que 15 = {x : Ip(x)1 :::; 2} es un intervalo 
de longitud f(15) 2: f(h) + ... f(It ), lo que completa la demostración. O 
con 
Sea p( x) un polinomio no constante que sólo tiene raíces reales. 
Hecho 1. Si b es una raíz múltiple de pi (x), también es raíz de p(x). 
11 Demostración. Sean b1 , ... , br las raíces de p( x) con multi-
plicidades respectivas SI, ... , S,.., donde 2::;=1 Sj = n. Como 
p(x) = (x - bj )Sj h(x), se tiene que bj es una raíz de pi (x) si Sj 2: 2 y 
que la multiplicidad de bj en pi (x) es Sj - 1. Además, existe una raíz 
de pi ( x) entre b1 y b2 , otra raíz entre b2 y b3 , ••. , y una entre br - 1 Y br , 
y todas ellas deben ser raíces simples, ya que 2::;=1 (Sj - 1) + ('1' - 1) 
suma n - 1, el grado de p'(X). Por tanto, las raíces múltiples de p'(X) 
son necesariamente raíces de p( x). O 
Hecho 2. Se tiene p'(x? 2: p(X)p"(X) para todo x E lIt 
11 Demostración. Si x = ai es una raíz de p( x), entonces no hay nada 
que demostrar. Supongamos que x no es una raíz. La regla de derivación 
del producto dice que 
n p(x) pi (x) n 1 
p'(X) , es decir, 
p(x) ¿~. x-ak k=l k=l 
Derivando de nuevo se obtiene 
p"(x)p(x) - p'(X)2 n 1 
p(x)2 k=l (x - ak)2 
< O. O 
Un teorema de Pólya sobre polinomiosTeorema. Sea p(i) un polinomio real de grado n 2': 1 con coeficiente direc-
tor 1. Entonces . 
1 
_~';~llp(x)1 2': 2n- 1' 
Antes de comenzar, veamos algunos ejemplos donde se da la igualdad. En 
el margen se muestran las gráficas de los polinomios de grado 1, 2 Y 3 que 
alcanzan la igualdad. De hecho, veremos que hay exactamente un polinomio 
en cada grado que alcanza la igualdad en el teorema de Chebyshev . 
• Demostración. Sea p(x) = xn + an_1Xn- 1 + ... + aa un polinomio 
real y con coeficiente director 1 . Como estamos interesados en el intervalo 
-1 :S x :S 1, hacemos x = cos {} y llamamos g( {}) := p( cos {}) al polinomio 
resultante en cos {}, 
(1) 
Los dos siguientes pasos de la demostración son a la vez resultados clásicos e 
interesantes en sí mismos. 
(A) Expresamos g( {}) como un polinomio en coseno, es decir, un polinomio 
de la forma 
g( {}) = bn cos n{} + bn - 1 cos( n - 1){} + ... + b1 COS {} + ba (2) 
donde bk E IR., Y demostramos que el coeficiente director es bn = 2}-1' 
(H) Dado cualquier polinomio en coseno h( {}) de grado n (es decir, tal que An 
es el último coeficiente no nulo) 
h({}) = Ancosn{}+An_lcos(n-1){}+ ... +Aa, (3) 
demostramos que IAnl :S max Ih({})I, lo que, al aplicarlo a g({}), concluirá la 
demostración del teorema. 
Demostración de (A). Para conseguir (2) a partir de (1), tenemos que expresar 
las potencias (cos {})k como polinomios en coseno. Por ejemplo, de la fórmula 
para el coseno del ángulo doble 
cos 2{} = cos2 {} - sen2 {} = 2 cos2 {} - 1, 
se deduce que cos2 {} = ~ cos 2{} + ~. Para hacer esto con una potencia 
arbitraria (cos {}) k introducimos los números complejos mediante la relación 
eix = cos x + i sen x. Los números eix son los complejos de módulo 1 (véase 
el recuadro sobre raíces complejas de la unidad de la página 25). En particular, 
esto proporciona la igualdad 
eim9 = cos n{} + i sen n{}. (4) 
Por otra parte, 
(5) 
121 
1 ........... . 
Los polinomios Pl (x) = X, P2 (x) 
X2 - ~ y P3(X) = x3 - ~x alcanzan la 
igualdad en el teorema de Chebyshev. 
122 
Lk2:0 (2~) = 2n - 1 se verifica para 
todo n > O: todo subconjunto de 
{l, 2, ... , n - l} se puede asociar a un 
subconjunto de {l, 2, ... ,n} de tamaño 
par si se añade el elemento n "cuando 
sea necesario." 
Un teorema de Pólya sobre polinomios 
Igualando las partes reales de (4) y (5) se obtiene, utilizando que i 4H2 = 
i 4f = 1 Y que sen2 e = 1 - cos2 e, 
cos mJ L: (:e) (cos 19t-4f (1 - cos2 'l9)2f 
f?:O 
-L:( n )(cOS'l9)n-4e-2(I_Cos2 'l9)2Hl. 
e?:o 4,(i + 2 
Por tanto, cos n'l9 es un polinomio en cos 'l9, 
cos n'l9 = cn( cos 'l9)n + Cn-l (cos 'l9)n-l + ... + Co. 
A partir de (6) se obtiene que el coeficiente director es 
Cn = L: (:e) + L: (4,(i:2) 2n - 1 . 
e?:o e?:o 
(6) 
(7) 
Ahora le damos un giro total a nuestro argumento. Suponiendo por inducción 
que, para k < n, (cos 'l9)k se puede expresar como un polinomio en coseno de 
grado k, deducimos de (7) que (cos 'l9) n se puede escribir como un polinomio 
en coseno de grado n con coeficiente director bn = 2nl_l' 
Demostración de (B). Sea h( 'l9) un polinomio en coseno de grado n como 
en (3) y supongamos, sin pérdida de generalidad, que An > O. Definiendo 
m( 'l9) := An cos n'l9 se tiene que 
m(~7r) = (-llAn parak=O,l, ... ,n. 
Para llegar a una contradicción, supongamos que max I h( 'l9) I < An. Entonces 
m(~7r) - h(~7r) = (_l)k An - h(~7r) 
es positivo si k es par y negativo si k es impar en el intervalo O S; k S; n. Se 
concluye que m( 'l9) - h( 'l9) tiene al menos n raíces en el intervalo [O, 7r]. Pero 
esto es imposible ya que m( 'l9) - h( 'l9) es un polinomio en coseno de grado 
n - 1, que se puede escribir como en (1) y que tiene, por tanto, como mucho 
n - 1 raíces. 
Esto concluye la demostración de (B) y del teorema de Chebyshev. D 
Ahora es fácil completar el análisis, demostrando que gn ('l9) := 2nl_l COS n'l9 
es el único polinomio en coseno de grado n y con coeficiente director 1 que 
alcanza la igualdad max Ig( 'l9) I = 2nl_l' 
Los polinomios T n (x) = cos n 'l9, x = cos 'l9, se conocen como polinomios de 
Chebyshev (de primera especie); por tanto, 2nl_l Tn(x) es el único polinomio 
de grado n con coeficiente director 1 que alcanza la igualdad en el teorema de 
Chebyshev. 
[1] P. L. CEBYCEV: (Euvres, Vol. l, Acad. Imperiale des Sciences, St. Peters-
burg 1899, pp. 387-469. 
[2] G. PÓLYA: Beitrag zur Verallgerneinerung des Verzerrungssatzes auf rnehifach 
zusarnrnenhiingenden Gebieten, Sitzungsber. Preuss. Akad. Wiss. Berlin (1928), 
228-232; Collected Papers Vol. l, MIT Press 1974,347-351. 
[3] G. PÓLYA & G. SZEGO: Problerns and Theorerns in Analysis, Vol. 1I, Springer-
Verlag, Berlin Heidelberg New York 1976; Reprint 1998. 
En 1943, Littlewood y Offord demostraron el siguiente resultado mientras tra-
bajaban en la distribución de raÍCes de ecuaciones algebraicas: 
Sean al, a2, ... ,an números complejos con I ai I 2: 1 para todo i, 
y consideremos los 2n combinaciones lineales 2:7=1 Eiai tales que 
Ei E {1, -1}. Entonces el número de sumas 2:7=1 Eiai contenidas 
en el interior de cualquier circunferencia de radio 1 no es mayor que 
2n 
e fo log n para alguna constante e > O. 
Unos años más tarde, Paul Erd6s mejoró esta cota eliminando el término log n, 
pero lo que aún es más interesante, pudo demostrar que esta afirmación es una 
sencilla consecuencia del teorema de Spemer (véase página 151). 
Para hacerse una idea de este argumento, consideremos el caso en el que todos 
los ai son reales. Podemos incluso suponer que todos ellos son positivos, 
cambiando ai por -ai Y Ei por -Ei cuando ai < O. Suponemos ahora que un 
conjunto de combinaciones 2: Eiai está contenido en el interior de un intervalo John E. Littlewood 
de longitud 2. Sea N = {1, 2, ... ,n} el conjunto total de índices. Para cada 
2: Eiai ponemos 1 := {i E N : Ei = 1}. Ahora, si 1 ~ I' para dos de estos 
conjuntos, concluimos que 
¿E~ai - ¿Eiai = 2 ¿ ai 2: 2, 
iEI'\I 
una cóntradicción. Por tanto, los conjuntos 1 forman una anticadena, y por el 
teorema de Spemer hay como mucho (Ln/2J) de aquellas combinaciones. De 
la fórmula de Stirling (véase página 11) se sigue que 
para algún e > O. 
Si n es par y todos los ai = 1, obtenemos (n/2) combinaciones 2:7=1 Eiai 
que suman O. Fijándonos en el intervalo ( -1, 1), concluimos que este número 
binomial nos da la cota exacta. 
En el mismo artículo, Erd6s conjeturó que (L n/2 J) era la cota correcta también 
para números complejos (sólo consiguió demostrar e 2nn-1/2 para alguna 
constante e), y además que la misma cota es válida para vectores al, ... , a n 
con lail 2: 1 en un espacio de Hilbert real, si reemplazamos la circunferencia 
de radio 1 por una bola abierta de radio l. 
Erd6s estaba en lo cierto, pero tuvieron que pasar veinte años hasta que tanto 
Gyula Katona como Daniel Kleitman dieran, de manera independiente, con 
El teorema de "'I""AlI""'. El tamaño de 
cualquier anticadena de subconjuntos 
de un conjunto de n elementos es como 
mucho (Ln/2J)' 
124 Sobre un lema de Littlewood y Offord 
una demostración para los números complejos (o, lo que es lo mismo, para el 
plano ]R2). Sus demostraciones usaron de manera explícita que el plano tiene 
dimensión 2, y no quedaba claro en absoluto cómo extender su resultado para 
el caso de espacios vectoriales reales de dimensión finita. 
Entonces, en 1970 Kleitman demostró toda la conjetura en espacios de Hilbert 
mediante un argumento de asombrosa sencillez. De hecho, demostró aún más. 
Su argumento es un todo un ejemplo de lo que se puede conseguir con la 
hipótesis de inducción adecuada. 
Unas palabras de ánimo para los lectores que no están familiarizados con los 
espacios de Hilbert: No los necesitamos realmente. Ya que sólo trataremos 
con un número finito de vectores aí, basta considerar el espacio vectorial 
real]Rd con el producto escalar usual. He aquí el resultado de Kleitman. 
Teorema. Sean al, ... , a n vectores en ]Rd, cada uno de longitud por 
lo menos 1, y consideremos k regiones abiertasR l , ... , Rk de ]Rd, 
de manera que Ix yl < 2 para cualesquiera x, y contenidos en la 
misma región Rí. 
Entonces el número de combinaciones lineales I:7=l Siai, de modo 
que Si E {1, -1}, que pueden estar dentro de la unión Ui Ri de las 
regiones es como mucho la suma de los k mayores coeficientes bino-
miales (~). 
En particular, para k = 1 obtenemos la cota (Ln/2J). 
Antes de pasar a la demostración, notaremos que la cota es ajustada para la 
elección de vectores 
al = ... = a n = a = (l,O, ... ,O)T. 
En efecto, para n par obtenemos (n/2) sumas igual a O, (n/~-l) sumas igual 
a (-2)a, (n/~+1) sumas igual a 2a, y así sucesivamente. Eligiendo bolas de 
radio 1 alrededor de 
(-2)a, 0, 2a, 2l k;l Ja, 
obtenemos 
sumas contenidas en estas k bolas. Esta es la expresión que buscamos, ya que 
los coeficientes binomials mayores se hallan en el centro (véase página 12). 
Podemos razonar de manera similar para n impar . 
• Demostración.. Podemos suponer sin pérdida de generalidad que todas las 
regiones Ri son disjuntas, y esto es lo que haremos a continuación. La clave de 
la demostración es la recursión característica de los coeficientes binomiales, ya 
que nos proporciona una relación entre los mayores coeficientes binomiales de 
n y n - 1. Para verlo, ponemos r = l n-~+1 J y s = l n+~-l J, de manera que 
Sobre un lema de Littlewood y Offord 
(~), (r~l)' ... , G) son los k mayores coeficientes para n. Ahora la recursión 
G) = (n~l) + G~;) implica que 
t(n~l)+t(~~n 
1,=7' 'l,=T 
~ (n ~ 1) + .I 1 (n -1) (1) 
itl (n ~ 1) + ~ (n ~ 1), 
y un cálculo fácil nos muestra que la primera expresión suma los k+ 1 mayores 
coeficientes binomiales (n~ 1), y la segunda los k - 1 mayores. 
La demostración de Kleitman sigue un razonamiento por inducción sobre n, 
siendo el caso n = 1 trivial. Teniendo en cuenta (1), para el paso de inducción 
sólo tenemos que demostrar que las combinaciones lineales de al, ... , a n 
que están en k regiones disjuntas se corresponden de manera biyeetiva con 
combinaciones de al, ... ,an-l que están en k + 1 ó k - 1 regiones. 
nr.m{j!czórm. Por lo menos una de las regiones trasladadas Rj - a n 
es disjunta de todas las regiones trasladadas Rl + an, ... ,Rk + an0 
Para verlo, consideramos el hiperplano H = {x : (an , x) = e} ortogonal 
a an, que contiene a todas las regiones trasladadas Ri + a n en el lado dado 
por (an , x) ~ e, y que está en contacto con la adherencia de alguna región, 
por ejemplo Rj + an0 Tal hiperplano existe porque las regiones son acotadas. 
Ahora se cumple Ix - yl < 2 para cualquier x E Rj e yen la adherencia 
de Rj, porque Rj es abierta. Queremos demostrar que Rj - a n está en el lado 
contrario de H. Supongamos, por el c~ntrario, que (an , x - an) ~ e para 
algún x E Rj, esto es, (an , x) ~ lan l2 + e. 
Sea y + a n un punto donde H está en contacto con Rj + a n . Entonces y está 
en la adherencia de R j , y (an , y + an) = e, esto es, (an , -y) = lan l2 - C. 
Por tanto 
(an , x - y) ~ 21an12, 
y deducimos de la desigualdad de Cauchy-Schwarz que 
Obtenemos pues (usando lanl ~ 1) que 2 :S 21an l :S Ix - yl, lo cual es 
una contradicción. 
Lo demás es fácil. Clasificamos las combinaciones ¿ Eiai que están en la 
unión Rl U ... U Rk de la manera siguiente. En la clase 1 agrupamos a to-
das las sumas ¿~=l Eiai con En = -1 Y todas las sumas ¿~=l Eiai con 
En = 1 que están en Rj, Y en la clase 2 agrupamos las demás combinaciones 
¿~=l Eiai con En = 1 que no están en Rj. Concluimos que las combinacio-
nes ¿~:ll Eiai de la clase 1 están contenidas en las k + 1 regiones disjuntas 
Rl + a n , . .. , Rk + a n y Rj - an, y que las combinaciones ¿~:ll Eiai de 
125 
H 
126 Sobre un lema de Littlewood y Offord 
la clase 2 están en las k - 1 regiones disjuntas Rl - an, ... ,Rk - a n sin 
Rj - an' Por inducción, la clase 1 contiene como mucho 2:::=r~l (n~l) 
combinaciones, mientras que la clase 2 contiene como mucho 2::::::; (n~l) 
combinaciones - y por (1) esto ya es toda la demostración, tal y como está 
recogido en El Libro. D . 
[1] P. ERDOS: On a lemma of Littlewood and Offord, Bulletin Amer. Math. Soco 51 
(1945), 898-902. 
[2] G. KATONA: On a conjecture of Erdffs and a stronger form of Sperner's 
theorem, Studia Sci. Math. Hungar. 1 (1966), 59-63. 
[3] D. KLEITMAN: On a lemma of Littlewood and Offord on the distribution of cer-
tain sums, Math. Zeitschrift 90 (1965), 251-259. 
[4] D. KLEITMAN: On a lemma ofLittlewood and Offord on the distributions oflinear 
combinations ofvectors, Advances Math. 5 (1970),155-157. 
[5] J. E. LITTLEWOOD & A. C. OFFORD: On the number of real roots of a 
random algebraic equation 1Il, Mat. USSR Sb. 12 (1943), 277-285. 
¿Cuál es la fórmula más interesante que involucra funciones elementales? En 
su bonito artículo [2], cuya exposición seguiremos bastante de cerca, Jürgen 
Elstrodt nos propone como un primer candidato el desarrollo en fracciones 
parciales de la función cotangente: 
1 00 1 1 
'ircot'irX = - + (-- + --) 
X n=l X + n x-n 
(x E ffi.\Z). 
Esta fórmula tan elegante fue probada por Euler en el § 178 de su Introductio 
in Analysin Injinitorum del año 1748, y ciertamente es uno de sus hallazgos 
más bellos. Se puede escribir de manera todavía más elegante como 
'ir cot 'irX 
N 1 
lim "" --
N-+oo L-,¡ X + n 
n=-N 
(1) 
pero hay que tener en cuenta que la evaluación de la suma ¿nEZ x~n es un 
tanto delicada, ya que tan solo es condicionalmente convergente. Por tanto, su 
valor depende del orden en que se sume. Gustav Herglotz 
Deduciremos (1) mediante un argumento asombrosamente sencillo, que se 
atribuye a Gustav Herglotz - el "truco de Herglotz." Para empezar, ponemos ! 
f(x) := 'ir cot 'ir X , g(x) := 
N 1 
lim "" --
N -+00 L-,¡ X + n' 
n=-N 
e intentamos demostrar que estas funciones tienen tantas propiedades en común 
que en realidad deben coincidir. 
CA) Las funciones f y g están definidas para todos los valores no enteros, y 
en ellos son continuas. 
Para la función f (x) = 'ir cot 'irX = 'ir ~~~ ;~ , esto es claro (véase la figura). 
Para g(x), primero usamos la identidad _+1 + _1_ = - }x 2 para reescribir x n x-n n -x 
la fórmula de Euler como 
'ir cot 'irX 
1 00 2x 
; - L n 2 x2· 
n=l 
Por tanto, para CA) tenemos que demostrar que para todo x ~ Z, la serie 
00 1 
L n 2 -x2 
n=l 
converge de manera uniforme en un entorno de x. 
(2) 
f(x) 
La función f (x) = 'ir cot 7TX 
x 
jli 
11'1 
ii 
1 I 
II 
¡I 
1'1 
1 I 
i 
l' 
1 
l' 
1' I li 
1 
1: 
1 
128 
Fórmulas de adición: 
sen(x + y) = senx cosy + cosx seny 
cos(x + y) = cosxcosy - senxseny 
===} sen(x + ~) = cos x 
cos(x+~) = -senx 
sen x = 2 sen ~ cos ~ 
cosx = cos2 ~ - sen2 ~. 
La cotangente y .el truco de Herglotz 
No hay ningún problema para el primer término n = 1, o para los términos 
con 2n - 1 ::; x 2 , ya que sólo hay un número finito de ellos. Por otro lado, 
para n 2: 2 Y 2n -1> x 2 , esto es n 2 - X2 > (n - 1)2 > O, los sumandos 
están acotados por 
O < 
1 1 
< (n-1)2' 
cota que no es válida sólo para x, sino también para valores en un entorno de x. 
Finalmente, el hecho de que ¿ (n-=1)2 converge (a ~2, véase la página 35) 
proporciona la convergencia uniforme que necesitarnos para demostrar (A). 
(B) Tanto f como 9 son funciones periódicas de periodo 1, lo cual quiere 
decir que f(x + 1) = f(x) Y g(x + 1) = g(x) para todo x E ffi.\Z. 
Ya que la cotangente tiene periodo 7T, vemos que f tiene periodo 1 (véase otra 
vez la figura de arriba). Para 9 argumentaremos como sigue. Sea 
entonces 
N 1 
L x+n' 
n=-N 
N 1 
L x+1+n 
n=-N 
N+1 1 
L x+n 
n=-N+l 
1 1 
gN-l (x) + -x-+-N- + -x-+-N-+-1 
Por tanto, g(x + 1) = lim gN (x + 1) = lim gN-l (x) = g(x). 
N-+oo N-+oo 
(C) Tanto f como 9 son funciones impares, lo cual quiere decir que tenemos 
f(-x) = -f(x) y g(-x) = -g(x) para todo x E ffi.\Z. 
La función f obviamente tiene esta propiedad, y para ver que 9 también la 
tiene basta observar que 9 N (-x) = -gN (x). 
Las últimas dos afirmaciones constituyen el truco de Herglotz: Primero vemosque f y 9 satisfacen la misma ecuación funcional, y en segundo lugar que 
h := f - 9 se puede extender de manera continua a todo IR.. 
(D) Las dos funciones f y 9 satisfacen la misma ecuación funcional: 
f(~)+f(X!1)=2f(x) y g(~)+g(xtl)=2g(x). 
Para f (x) esto se sigue de los teoremas de adición para el seno y coseno: 
f(~) + f(xt 1 ) 7T [COS 1r2X _ sen 1f2X ] sen 1r
2
X cos 1r
2
X 
cos(1rX + 1rX) 
27r 2 2 
sen (1r
2
X + 1r
2
X) 
La ecuación funcional para 9 se sigue de 
2 f(x). 
La cotangente y el truco de Herglotz 
lo cual a su vez es consecuencia de 
1 1 -_. + --;-c;---
3'. + n x+I + n 
2 2 
Ahora examinaremos la función 
( 1 1) 2 --+ . x + 2n x + 2n + 1 
h(x) = f(x) - g(x) (
1 ¿oo__ 2x ) 
= JrcotJrX - - - . 
x n 2 - x2 
n=l 
(3) 
Llegados a este punto, ya sabemos que h es una función continua en ffi.\Z que 
satisface las propiedades ¿Qué le pasa en los valores enteros? A 
partir de los desarrollos del seno y del coseno, o aplicando dos veces la regla 
de l'Hospital, hallamos que 
lim (cotx -~) 
x->O X 
y por tanto también 
x cosx - senx 
lim 
x->O xsenx 
1 ( ;;
1) = O. im Jr cot JrX -
x->O 
o, 
Pero puesto que la suma L~=I n}::x2 en (3) converge a O si x -----+ O, tenemos 
de hecho que lim h( x) = O, Y por tanto por la periodicidad que 
x->O 
lim h(x) = O para todo n E Z. 
x->n 
Resumiendo, hemos demostrado lo siguiente: 
(E) Al definir h(x) := O para x E Z, la función h es continua en todo ffi. y 
tiene las propiedades (B), (e) Y (D). 
Ya estamos en posición de dar el golpe de gracia. Puesto que h es una función 
periódica y continua, tiene un máximo m. Sea Xo un punto en [0,1] tal que 
h(xo) = m. De (D) deducimos que 
h( x
2
0) + h( XOiI) = 2m, 
y por tanto que h( X20) = m. Iterando, obtenemos h( ~~) = m para todo n, y 
por tanto h(O) = m por continuidad. Pero h(O) = O, Y por tanto m = O, esto 
es, h(x) .:::; O para todo x E R Ya que h(x) es una función impar, h(x) < O 
es imposible, y por ende h(x) = O para todo x E ffi., Y hemos demostrado el 
teorema de Euler. O 
Entre los muchos corolarios que son consecuencia de (1), los más famosos son 
los que tratan de los valores de la función zeta de Riemann en enteros pares 
positivos (véase el apéndice al capítulo 6), 
00 1 
((2k) = ¿ 2:k 
n=l n 
(k E N). (4) 
. Para acabar nuestra historia, veremos de qué manera trató Euler - unos años 
más tarde, en 1755 -la serie (4). Empezamos con la fórmula (2). Al multi-
plicar (2) por x y poner y = JrX encontramos para Iyl < Jr que 
129 
x 3 ::r;5 x 7 
sen x = x - 3T + 5T - 7! ± ... 
130 La cotangente y el truco de Herglotz 
ycoty 
00 y2 1 
1 - 2 0 -7f2-n-2 -1 -_-(-y-)--;'-2 . 
n-l 7rn 
El último factor es la suma de una serie geométrica, y por tanto 
ycoty 
00 00 2k 
1-2~~ (:n) " 
n=lk=l 
~ ( 1 ~ 1 ) 2k 1 - 2 L-, 7f2k L-, n 2k y , 
k=l n=l 
y hemos demostrado el siguiente resultado notable: 
Para todo k E N, el coeficiente de y2k en el desarrollo en serie de potencias 
de y coty es 
[ 
2k] 2 ~ 1 2 Y ycoty = -2f L-, 2f = -2f((2k). 
7f n=l n 7f 
(5) 
Hay otra manera, mucho más "canónica", de obtener un desarrollo en serie de 
y cot y. Sabemos del análisis que e iy = cos y + i sen y, y por tanto 
eiy + e-iy 
cosy 
2 
lo cual conduce a 
y cot y iy 
eiy + e-iy 
eiY - e-iy 
Ahora sustituimos z = 2iy, Y obtenemos 
z eZ + 1 
ycoty = ---
2 eZ -1 
é y e-iy 
sen y = 
2i 
e2iy + 1 
~y 
e2iy - 1 
z z - + 
2 ez -1 
(6) 
Por tanto, todo lo que nos hace falta es una expansión en serie de potencias de 
la función e'=-l; nótese que esta función está definida y es continua en todo lPI. 
(para z = O usamos la serie de la función exponencial, o de manera alternativa 
la regla de l'Hospital, lo cual nos da el valor 1). Escribimos 
(7) 
Los coeficientes Bn son conocidos como los números de Bernoulli. El primer 
miembro de (6) es una función par (esto es, f(z) = f( -z)), y por tanto vemos 
que Bn = O para n 2:: 3 impar, mientras que B 1 = - ~ corresponde al término 
de ~ en (6). De 
z 
La cotangente y el truco de Herglotz 
obtenemos al comparar coeficientes para zn que 
n-1 
'\:-:-' Bk = { 01 
6 k!(n - k)! 
ck=O 
paran = 1, 
para ni- 1. (8) 
A partir de (8) podemos calcular los números de Bemoulli de manera recur-
siva. El valor n = 1 nos da Bo = 1, el siguiente valor n = 2 nos proporciona 
la relación ~o + B 1 = O, de donde B 1 = -~, y así sucesivamente. 
Ahora casi hemos terminado: Al combinar (6) y (7) obtenemos 
00 (2iy)2k 00 (_1)k22k B 2k 2k 
ycoty = ¿B2k (2k)! = ¿ (2k)! y, 
k=O k=O 
y de aquí se deduce, con (5), la fórmula de Euler para ((2k): 
00 1 (_1)k-122k-1B2k 2k 
~ n 2k = (2k)! 7'1 (k E N). (9) 
De nuestra tabla de los números de Bemoulli obtenemos así otra vez la suma 
L ;2 = ~2 del capítulo 6, y además las relaciones 
00 1 6917'112 
¿ n 12 = 638512875' 
n=l 
El número de Bemoulli BlO = 656' que proporciona el valor de ((10), parece 
bastante inofensivo, pero el siguiente valor B 12 = - 2
6
i3
1
0' que necesitamos 
para ((12), contiene el número primo bastante grande 691 en el numerador. 
Euler había calculado unos cuantos valores (( 2k ), pero sin darse cuenta de 
la conexión con los números de Bemoulli - sólo la aparición del extraño 
primo 691 le puso sobre aviso. 
Dicho sea de paso, puesto que ((2k) converge a 1 si k ---+ 00, la ecuación (9) 
nos dice que los números I B 2k I crecen muy deprisa - algo que no es evidente 
a la vista de los primeros valores. 
Por otra parte, sabemos muy poco sobre los valores de la función zeta de 
Riemann en los enteros impares k 2: 3; véase la página 41. 
[1] S. BOCHNER: Book review of "Gesammelte Schriften" by Gustav Herglotz, Bu-
lletin Amer. Math. Soco 1 (1979), 1020-1022. 
[2] J. ELSTRODT: Partialbruchzerlegung des Kotangens, Herglotz-Trick und die 
Weierstraj3sche stetige, nirgends differenzierbare Funktion, Math. Semesterberi-
chte 45 (1998), 207-220. 
[3] L. EULER: lntroductio in Analysin lnfinitorum, Tomus Primus, Lausanne 1748; 
Opera Omnia, Ser. 1, Vol. 8. In English: lntroduction to Analysis of the lnfinite, 
BookI (translated by J. D. Blanton), Springer-Verlag, New York 1988. 
[4] L. EULER: lnstitutiones calculi differentialis cum ejus usu in analysifinitorum ac 
doctrina serierum, Petersburg 1755; Opera Omnia, Ser. 1, Vol. 10. 
131 
n012345678 
Bn 1 - ~ i O - 310 O 12 O - 310 
Los primeros números de Bernoulli 
iCios Potefiarum ipfius;r 
continuare licuit, quod 
R ". 
darÍus perrpída~ 
commodiori modo 
artificio 
adjurud, 
La página 131 de la "Introductio in 
Analysin Infinitorum" de Euler del año 
1748 
Se dice que un noble francés, Georges Louis Leclerc, Conde de Buffon, pro-
puso el siguiente problema en 1777: 
¡JUJ'Jurll!u:rrtLIS que se lanza una aguja corta en 
es la de que la 
una de las lineas? 
La probabilidad depende de la distancia d entre las líneas y también de la 
longitud R, de la aguja. De manera más precisa, depende sólo de la razón ~. 
Para nuestro objetivo, una aguja corta es una de longitud R, ::; d, es decir 
que no puede cruzar dos líneas a la vez (y la probabilidad de que toque dos 
líneas es cero). La solución al problema de la aguja de Buffon puede resultar 
sorprendente, ya que involucra el número H. 
Teorema ("Problema de la aguja de Buffon") 
Si se lanza una aguja corta de longitud R, sobre un papel pautado con líneas 
equidistantes a distancia d 2: R" entonces la probabilidad de que la aguja 
caiga en una posición tal que cruce una de las líneas es 
2R, 
p = --o 
Hd 
Como consecuencia de este resultado, podemos obtener valores aproximados 
de H mediante un experimento: Si lanzamos una aguja N veces, y resulta éxito 
(una intersección) en P casos, entonces ~ debería ser aproximadamente ~ ~, 
es decir, el número 2Jj'! debería ser una aproximación de H. Quizás el expe-
rimento más largo (y exhaustivo) fue llevado a cabo en 1901 por Lazzarini, 
quien supuestamente llegó incluso a construir una máquina para lanzar una 
aguja 3408 veces (con ~ = ~). Se encontró con que la aguja cruzaba una lí-
nea en 1808 ocasiones. Después de hacerlas cuentas, llegó a la aproximación 
H :=::; 2 . ~ f~g~ = 3.1415929 .... , que es correcta hasta el sexto dígito de H, 
¡y demasiado bonita para ser verdad! (Los valores elegidos por Lazzarini con-
ducen a la conocida aproximación H :=::; ~i~, que apareció en la página 31. 
Esto explica las más que sospechosas elecciones de 3408 y ~, cuyo producto 
es un múltiplo de 355. Véase [5] para una discusión del engaño de Lazzarini.) 
El problema de la aguja puede resolverse evaluando una integral. Lo haremos 
más adelante, y así también resolveremos el problema para una aguja "larga". 
Pero la demostración de El Libro, presentada por E. Barbier en 1860, no ne-
cesita integrales. Simplemente lanza una aguja diferente ... 
El conde de Buffon 
/ \ ~ \ 
\ ~~ ,\ td I , 
I / 
" . ----- ,/ ""'-- ,/ 
7 
, 
~// 
\ 
\ \ IR, 
134 
OOO(JO 
La aguja de Buffon 
Si se lanza cualquier aguja, corta o 
cruces será 
entonces el número de 
E = PI + 2P2 + 3P3 + ... , 
donde PI es la probabilidad de que la aguja cruce exactamente una línea, P2 es 
la probabilidad de que cruce dos, P3 la de que cruce tres, etc. Por lo tanto, la 
probabilidad de que obtengamos por lo menos un cruce, que es la que se pide 
en el problema de Buffon, es 
P = PI + P2 + P3 + ... 
(Los sucesos en los cuales la aguja cae exactamente sobre una línea, o con 
un extremo en una de ellas, tienen probabilidad cero; por tanto, pueden ser 
ignorados a lo largo de la discusión del problema.) 
Por otro lado, si la aguja es corta, entonces la probabilidad de obtener más 
de un cruce es cero, P2 = P3 = ... = O, Y de aquí se obtiene E = p: la 
probabilidad que buscamos es precisamente el número esperado de cruces. 
Esta reformulación del problema es extremadamente útil, ya que ahora puede 
utilizarse la linealidad de la esperanza (véase la página 84). Escribiremos E (e) 
para el número esperado de cruces que se obtienen al lanzar una aguja recta 
de longitud e. Si esta longitud es e = x + y, y consideramos por separado 
su "parte de delante", de longitud x, y su "parte de detrás", de longitud y, 
entonces obtenemos 
E(x + y) = E(x) + E(y), 
ya que cualquier cruce siempre se produce o bien por la parte de delante o bien 
por la parte de detrás. 
Por inducción sobre n, esta "ecuación funcional" implica que E(nx) = nE(x) 
para todo n E N, y por tanto que mE(~x) = E(m~x) = E(nx) = nE(x). 
Así, se verifica E (rx) = rE (x) para todo racional r E Q. Además, E (x) es 
claramente monótona en x 2: O, de lo cual obtenemos que E(x) = ex para 
todo x 2: O, donde e = E(l) es alguna constante. 
Pero, ¿cuál es esta constante? 
Para hallar la respuesta usaremos agujas de diferente forma. Lancemos pues 
una aguja "poligonal" de longitud total e formada por segmentos de recta. El 
número de cruces que se producen es (con probabilidad 1) la suma del número 
de cruces que se producen en cada una de sus partes. De aquí se deduce que 
el número esperado de cruces es, de nuevo, 
E = ce, 
por la linealidad de la esperanza. ¡Para este resultado ni siquiera importa si los 
segmentos de recta están unidos de manera rígida o flexible! 
La clave para la solución de Barbier al problema de la aguja de Buffon es 
considerar una aguja que sea una circunferencia perfecta e de diámetro d, 
cuya longitud es x = dlr. Si se lanza esta aguja sobre un papel pautado, 
produce siempre dos intersecciones. 
La circunferencia puede aproximarse mediante polígonos. hnagínese que 
junto a la aguja circular e lanzamos un polígono inscrito Pn , y otro polígono 
La aguja de Buffon 
circunscrito pn. Cualquier línea que a Pn también intersecará a e, 
y si una línea interseca a e entonces también cortará a pn . Por lo tanto, los 
números esperados de intersecciones satisfacen 
Tanto Pn como pn son polígonos, de manera que el número esperado de 
cruces es "e multiplicado por la longitud" en ambos casos, mientras que para e 
es 2. Por tanto, 
cf!(Pn) :::; 2 :::; cf!(pn). 
Ahora, Pn y pn aproximan e para n ---+ oo. En particular, 
lim f!.(Pn) = d7r = lim f!.(pn), 
n-+oo n-+oo 
y por tanto para n ---+ 00 deducimos de (1) que 
e d7r :::; 2 :::; e d7r, 
lo cual conduce a que e = ~ ~. 
(1) 
o 
Pero también podríamos haberlo hecho utilizando cálculo. La clave para ob-
tener una integral "sencilla" es considerar en primer lugar la pendiente de la 
aguja. Supongamos que la aguja cae formando un ángulo a con la horizon-
tal, con a variando en el intervalo O :::; a :::; ~. (Ignoraremos el caso en el 
que la aguja cae con pendiente negativa, ya que este caso es simétrico al de 
la pendiente positiva y tiene la misma probabilidad.) Una aguja que cae con 
ángulo a tiene altura f!. sen a, y la probabilidad de que cruce una de las líneas 
horizontales separadas por una distancia d es Ji s':in a. De aquí obtenemos la 
probabilidad calculando la media sobre los posibles valores de a: 
1r/2 
p ~ J f!.sena da = ~~ [- cosa] 1r/2 = ~~. 
7r d 7rd o 7rd 
o 
Para una aguja larga obtenemos la misma probabilidad Jis':in a miel!tras que se 
verifique f!. sen a :::; d, esto es, en el intervalo O :::; a :::; arcsen ~. Sin embargo, 
para ángulos a más grandes la aguja tiene que cruzar una línea y por lo tanto 
la probabilidad es 1. De aquí calcularnos, para f!. ;:::: d, que 
p 
1r /2 
2 (¡arCSen(d/Ji) f!. sen a J ) 
- --da + Ida 
7r o d 
arcsen( d/ Ji) 
2(f!.[ ]arCSen(d/Ji) (7r d)) ;: d - cos a o + 2" - arcsen f 
I + ~ (~ ( I - VI - ~:) - arcsen ~) . 
La respuesta no ha resultado tan bonita para una aguja larga, pero en cam-
bio nos proporciona un problema interesante: Demuéstrese que la fórmula 
da como resultado ~ en el caso f!. = d, que es estrictamente creciente como 
función de f!., y que tiende a I para f!. ---+ oo. 
135 
Q o 
() 
o 
\ 
\ 
\ 
/ 
/ 
I 
I 
136 
111 : 
,11, 
"¿ Tiene algún problema?" 
La aguja de Buffon 
[1] E. BARBIER: Note sur le problhne de l'aiguille et le jeu dujoint couvert, J. Mat-
hématiques Pures et Appliquées (2) 5 (1860), 273-286. 
[2] L. BERGGREN, J. BORWEIN & P. BORWEIN, EDS.: Pi: A Source Book, Springer-
Verlag, New York 1997. 
[3] G. L. LECLERC, COMTE DE BUFFON: Essai d'arithmétique morale, Appendix 
to "HistoÍre naturelle générale et particuliere," Vol. 4, 1777. 
[4] D. A. KLAIN & G.-C. ROTA: Introduction to Geometric Probability, "Lezioni 
Lincee," Cambridge University Press 1997. 
[5] T. H. O'BEIRNE: Puzzles and Paradoxes, Oxford University Press, London 1965. 
I 
.. .. 
I I 
22 
El principio del palomar 
y el doble recuento 139 
23 
Tres teoremas famosos 
sobre conjuntos finitos 151 
24 
Barajando el mazo 157 
25 
Caminos, retículas 
y determinantes 167 
26 
La fórmula de Cayley 
para el número de árboles 173 
27 
Completando cuadrados 
latinos 179 
28 
El problema de Dinitz 185 
29 
Identidades y biyecciones 191 
"Un cuadrado latino melancólico" 
Algunos principios matemáticos, como los dos que ilustraremos en este capí-
tulo, son tan obvios que podría pensarse que sólo pueden producir resultados 
igualmente obvios. Para convencerle de que esto no siempre es cierto los 
ilustramos con algunos ejemplos cuya inclusión en el Libro fue sugerida por 
Paul Erd6s. En capítulos posteriores encontraremos más aplicaciones de estos 
principios. 
Principio del pallJm~u:. 
Si colocamos n objetos en r cajas y r < n, entonces al menos una de 
las cajas contiene más de un objeto. 
Esto es tan evidente que no hay nada que demostrar. En el lenguaje de las 
aplicaciones el principio dice lo siguiente: sean N y R dos conjuntos finitos 
tales que 
INI = n > r = IRI, 
y sea f : N ---+ R una aplicación. Entonces existe algún a E R tal que 
If~l(a)1 2: 2. Es posible incluso escribir una desigualdad más fuerte: existe 
algún a E R tal que 
(1) 
En efecto, en otro caso tendríamos If~l(a)1 < !f: para todo a y, por tanto, 
n = L If~l(a)1 < r!f: = n, lo que es imposible. 
1. 
aER 
Consideremos el conjunto 1,2,3, ... , 2n y tomemos 
n + 1 cualesquiera. Entre ellos hay dos que son primos entre sí. 
De nuevo, esto es evidente. Debe haber dos númerosconsecutivos, y por tanto 
primos entre sí. 
Ahora démosle la vuelta a la afirmación. 
Sea A <:;: {1, 2, ... , 2n} tal que IAI = n + 1. Existen 
dos números de A tales que uno es divisor del otro. 
Esto ya no es tan evidente. Según nos contó Erd6s, él propuso la cuestión al 
joven Lajos Posa durante una cena, y para cuando acabaron de comer Lajos 
tenía la respuesta. Se convirtió en una de las preguntas favoritas de Erd6s 
"El palomar a vista de pájaro" 
, " 
,1 
j' I 
140 
Ninguno de estos dos resultados si-
gue siendo cierto al reemplazar n+ 1 
por n: para ver esto, basta conside-
rar los dos conjuntos {2, 4, 6, ... , 2n} 
y {n+l, n+2, ... , 2n}. 
El principio del palomar y el doble recuento 
de "iniciación" a las matemáticas. El del la 
respuesta (afirmativa) al problema. Escribamos cada número a E A de la 
forma a = 2k m, donde m es un número impar entre 1 y 2n - 1. Como hay 
n + 1 números en pero sólo n partes impares distintas, debe haber dos 
números en A con la misma parte impar. Por tanto, uno de ellos debe ser 
múltiplo del otro. O 
Este es otro de los problemas favoritos de Erdéís, que aparece en un artÍCulo 
de Erdéís y Szekeres sobre problemas de Ramsey. 
En cualquier sucesión al, a2," ., aTnn+l de mn + 1 
números reales distintos hay una subsucesión creciente 
de longitud m + 1, o una subsucesión decreciente 
de longitud n + 1, o ambas. 
En esta ocasión la aplicación del principio del palomar no es inmediata. Aso-
ciemos a cada término ai el número ti, que es la longitud de la sub sucesión 
creciente más larga que comienza en ai. Si ti 2': m + 1 para algún i, en-
tonces tenemos una subsucesión creciente de longitud m + 1. Supongamos, 
por tanto, que ti S; m para todo i. La función f : ai f----+ ti, que transforma 
{al, ... , amn+l} en {1, ... , m} nos dice, según (1), que existe algún valor 
s E {1,. " ,m} tal que f(ai) = s para ":' + 1 = n + 1 términos ai. Sean 
aj1' aj2' ... ,ajn+1 (JI < ... < jn+l) tales números. Analicemos dos térmi-
nos consecutivos aji' aji+1' Si aji < aji+1 obtenemos una subsucesión de 
longitud s que comienza en aji+1 y, por tanto, una sub sucesión creciente de 
El lector puede divertirse demostrando longitud s + 1 que comienza en aji' lo que es imposible, pues f (aji) = s. De 
que para mn números la afirmación ya esta forma obtenemos una subsucesióndecreciente ajl > ajz > ... > ajn+l 
no es cierta. de longitud n + 1. O 
Este resultado de apariencia sencilla sobre subsucesiones monótonas tiene 
consecuencias nada triviales en el concepto de dimensión de un grafo. No 
necesitamos aquí la noción de dimensión para un grafo general, sino sólo 
para el grafo completo Kn. Se puede enunciar de la siguiente forma. Sea 
N = {1, ... , n}, n 2': 3, y consideremos m permutaciones 1l"1, ... , 1l" m de N. 
Se dice que las permutaciones 1l"i representan Kn si para cualesquiera tres nú-
meros distintos i, j, k existe una permutación 1l" en la que k aparece después 
de i y j. La dimensión de Kn es el menor entero m para el que existe una 
representación 1l"1, ... ,1l"Tn' 
Como ejemplo, dim(K3) = 3 ya que los tres números deben aparecer en úl-
timo lugar, como en 7fl = (1,2,3), 7f2 = (2,3,1), 7f3 = (3,1,2). ¿Qué ocurre 
con K4? Obsérvese, en primer lugar, que dim(Kn ) S; dim(Kn+l): sólo hay 
El principio del palomar y el doble recuento 
que eliminar n + 1 en una o Por tanto, dim(K4) 2': 3 
y, de dim(K4) = 3 tomando 
7rl = 0(1, 2, 3, 4), 7r2 = (2,4,3,1), 7r3 = (1,4,3,2). 
No es tan sencillo demostrar que dim(K5 ) = 4; para valores mayores de n, 
de forma sorprendente, la dimensión de Kn sigue siendo 4 hasta n = 12, 
en tanto que dim(K13) = 5. Parece que dim(Kn) es una función bastante 
extraña ... pero no es así. Cuando n tiende a infinito, dim(Kn) es, de hecho, 
una función bien conocida - y la clave para encontrar una cota inferior es el 
principio del palomar. Veamos que 
(2) 
Como hemos visto que dim(Kn) es una función monótona con respecto a n, 
es suficiente demostrar (2) para n = 22P + 1, es decir, tenemos que demostrar 
que 
Supongamos, por el contrario, que dim(Kn) :S p, y sean 7rl, ... ,7r P las per-
mutaciones que representan a N = {1, 2, ... ,22P + 1}. Ahora utilizamos 
el resultado sobre sub sucesiones monótonas p veces. En 7rl existe alguna 
sub sucesión monótona Al de longitud 22P-
1 + 1, que puede ser creciente o 
decreciente. Fijémonos en este conjunto Al en 7r2. Utilizando de nuevo el 
resultado, encontramos en 7r2 alguna sub sucesión monótona A2 e Al de lon-
gitud 22P -
2 + 1, Y A2 es, por supuesto, también monótona en 7rl. Continuando 
de esta misma forma, encontramos una sub sucesión Ap de tamaño 22° + 1 = 3 
que es monótona en todas las permutaciones 7ri. Si Ap = (a, b, e), entonces o 
bien a < b < e, o bien a > b > e en toda 7ri. Pero esto es imposible, ya que 
debe existir una permutación en la que b aparece después de a y c. O 
El comportamiento asintótico correcto fue determinado por Joel Spencer (cota 
superior) y por Erd6s, Szemerédi y Trotter (cota inferior): 
1 
dim(Kn) = log2 log2 n + (2" + 0(1)) 10g2log210g2 n. 
Sin embargo, la historia no termina aquí: muy recientemente, Morris y Ho§ten 
encontraron un método que, en principio, puede determinar el valor exacto de 
dim(Kn). Utilizando su resultado y un ordenador se pueden obtener los valo-
res que mostramos al margen. ¡Esto es verdaderamente asombroso! Por ejem-
plo, piénsese en el número de permutaciones de 1422564 elementos. ¿Cómo 
se determina si hacen falta 7 u 8 de ellas para representar K1422564? 
Paul Erd6s atribuye a Andrew V ázsonyi y Marta Sved la siguiente atractiva 
aplicación del principio del palomar: 
Consideremos n enteros al, ... ,an , no necesariamente 
distintos. Entonces, existe siempre un conjunto de elementos conse-
cutivos ak+l, ak+2,· .. ,ae cuya suma I:;=k+l ai es múltiplo de n. 
141 
7rl: 1 2 3 5 6 7 8 91011 12 4 
7r2: 2 3 4 8 7 6 5121110 9 1 
7r3: 3 4 11112 910 6 5 8 7 2 
7r4: 4 1 210 91211 7 8 5 6 3 
Estas cuatro permutaciones represen-
tan K1 2 
dim(Kn) ::; 4 ~ n::; 12 
dim(Kn) ::; 5 ~ n ::; 81 
dim(Kn) ::; 6 ~ n::; 2646 
dim(Kn) ::; 7 ~ n::; 1422564 
142 
e 1 2 3 4 5 6 R 
1 1 1 1 1 1 1 
2 1 1 1 
3 1 1 
4 1 
5 1 
6 1 
7 
8 
7 8 
1 1 
1 
1 
1 
1 
El principio del palomar y el doble recuento 
Para demostrar este hecho definimos los N = {O, 1, ... ,n} y 
R = {O, 1, ... , n - 1} Y consideramos la aplicación f : N ---+ R, donde 
f(m) es el resto de dividir la suma al + . " + am entre n. Puesto que 
INI = n + 1 > n = IRI, podemos asegurar la existencia de dos sumas 
al + ... + ak Y al + ... + ac (k < .e) que proporcionan el mismo resto, donde 
la primera suma puede ser la vacía, denotada por O. Por tanto, 
i=l i=l 
tiene resto O, lo que concluye la demostración. o 
Pasemos ahora al segundo principio: contar de dos formas. De manera más 
formal, podemos presentarlo aSÍ. 
Doble recuento. 
Supongamos que tenemos dos conjuntos finitos R y e y un subconjunto 
S ~ R x e. Decimos que p y q son incidentes siempre que (p, q) E S. 
Si r p denota el número de elementos incidentes a p E R, y cq denota el 
número de elementos incidentes a q E e, entonces 
I: cq • (3) 
qEC 
De nuevo, no hay nada que demostrar. La primera suma clasifica los pares 
de S de acuerdo con su primera componente, en tanto que la segunda clasifica 
los mismos pares de acuerdo con su segunda componente. 
Podemos dibujar el conjunto S de una manera útil. Consideremos la matriz 
A = (apq ), la matriz de incidencia de S, cuyas filas y columnas se correspon-
den con los elementos de R y e, respectivamente, donde 
apq={~ si (p, q) E S 
si (p,q) tJ. S. 
Con esta definición, r p es la suma de la fila p-ésima de A y cq es la suma de 
la columna q-ésima. Por tanto, el primer término de (3) suma los elementos 
de A (es decir, cuenta los elementos de S) por filas, en tanto que el segundo 
término los suma por columnas. 
El siguiente ejemplo terminará de aclarar esta correspondencia. Pongamos 
R = e = {1, 2, ... , 8}, Y escogemos S = {(i,j) : i divide aj}. Se obtienela matriz del margen, en la cual sólo mostramos los unos. 
El principio del palomar y el doble recuento 
Obsérvese la tabla de la izquierda. La cantidad de unos en la columna j es 
exactamente e1llúmero de divisores de j; denotemos este número por t(j). 
Nos podemos preguntar cómo es t(j) en media cuando j toma los valores 
entre 1 y n. Es decir, nos preguntamos por 
_ 1 n 
t(n) = ; L t(j). 
j=l 
¿Cómo de grande es t(n) para un n arbitrario? A primera vista, esta pregunta 
puede parecer muy complicada. Para los números primos t(p) = 2, en tanto 
que para 2k se tiene un término grande, t(2k ) = k + 1. Por tanto, t(n) es una 
función que oscila salvajemente, y podríamos conjeturar que algo parecido es 
cierto para t(n). Pues no, nada más lejos de la realidad. El doble recuento 
proporciona una respuesta sencilla y sorprendente. 
Consideremos la matriz A (igual que antes) para los enteros de 1 a n. Con-
tando por columnas obtenemos ¿7=1 t(j). ¿Cuántos unos hay en la fila i? 
Evidentemente, los unos corresponden a los múltiplos de i: li, 2i, ... , y el 
mayor múltiplo menor o igual que n es l T Ji. Por tanto, 
_ In lnn lnn nI 
t(n) = - ""' tU) = - L l---:-J ~ - ""' ---:- = L-;-' nL..t n z nL..t z z 
j=l i=l i=l i=l 
donde el error en cada sumando al pasar de l T J a T es menor que 1. Como 
la última suma es el n-ésimo número armónico Hn, obtenemos la acotación 
Hn -1 < t(n) < Hn que, junto con las estimaciones para Hn de la página 11 
nos proporciona 
logn-l < Hn-l-.!. < t(n) < Hn < 10gn+1. 
n 
Hemos demostrado un resultado notable: aunque t( n) es totalmente errática, 
la media t( n) se comporta muy bien: difiere de log n en menos de l. 
Sea G un grafo simple finito y sean V y E los conjuntos de sus vértices y 
aristas, respectivamente. Ya definimos en el capítulo 11 el grado d( v) de 
un vértice v como el número de aristas que tienen a v como extremo. En 
el ejemplo de la figura, los vértices 1,2, ... ,7 tienen grados 3,2,4,3,3,2,3, 
respectivamente. 
Casi todos los libros de teoría de grafos comienzan con el siguiente resultado 
(con el que ya nos encontramos en los capítulos 11 y 17): 
L d(v) = 2\E\. (4) 
vEV 
Para demostrarlo, consideremos S ~ V x E, donde S es el conjunto de pares 
( v, e) tales que v E V es un extremo de e E E. El doble recuento de S 
proporciona, por una parte, ¿vEV d( v), ya que cada vértice contribuye con 
d( v) al recuento y, por otra, 2\E\, ya que cada arista tiene dos extremos. O 
n 12345678 
t(n) I 3 5 "2 :3 2 2 
7 16 5 
:3 '7 "2 
Los primeros valores de t(n)' 
143 
I 6 
2<Q :(] 
3 7 
144 El principio del palomar y el doble recuento 
Este sencillo resultado tiene 
les serán presentadas posteriormente. Queremos destacar en esta sección la 
siguiente hermosa aplicación a un problema extremal en grafos. Aquí está: 
Supongamos que G = (V, E) tiene n y no contiene ciclos de lon-
gitud 4 (que denotaremos por C4 ), es decir, ningún subgrafo 
¿ Cuántas aristas puede tener G como máximo? 
Como ejemplo, el grafo del margen tiene 5 vértices, no contiene ningún 4-ciclo 
y tiene 6 aristas. Es sencillo demostrar que si el número de vértices es 5 
entonces el número máximo de aristas es 6 y que, de hecho, éste es el único 
grafo de 5 vértices con 6 aristas que no contiene ningún 4-ciclo. 
Pasemos ahora al problema general. Sea G un grafo con n vértices y sin nin-
gún 4-ciclo. Como antes, denotamos por d( u) el grado de u. Ahora hacemos 
doble recuento en el conjunto 8 de pares (u, {v, w } ), donde u es adyacente 
a v y a w, de forma que v -1- w. En otras palabras, contamos las veces que 
aparece 
Sumando en u se tiene que 181 = I:uEV (d~u)). Por otra parte, todo par 
{v, w} tiene como mucho un vecino común (debido a la ausencia de C4 ). Por 
tanto, 181 :s; G), y se concluye que 
o 
2: d(u)2 :s; n(n - 1) + 2: d(u). (5) 
uEV 
A continuación, como es típico en esta clase de problemas extremales, aplica-
mos la desigualdad de Cauchy-Schwarz a los vectores (d(Ul)"'" d(un )) y 
(1,1, ... ,1), de donde obtenemos 
(l:d(u)/ < nl:d(u)2, 
uEV uEV 
y, según (5), 
(2: d(u) / < n2(n - 1) + n 2: d(u). 
uEV uEV 
Utilizando (4) se deduce que 
o 
IEI2 - ~IEI- n
2
(n
4 
- 1) :s; O. 
Resolviendo esta ecuación de segundo grado obtenemos el siguiente resultado, 
debido a Istvan Reiman. 
El principio del palomar y el doble recuento 
Teorema. Si un graÍo G de n vértices no contiene entonces 
(6) 
Para n = 5 se obtiene IEI :::; 6, Y el grafo que apareció anteriormente muestra 
que laigualdad es posible. 
El doble recuento nos ha proporcionado, de forma sencilla, una cota superior 
para el número de aristas. Pero, ¿cómo de ajustada es la cota (6) en general? 
Este precioso ejemplo [2] [3] [6] muestra que es casi justa. Como ocurre fre-
cuentemente en este tipo de problemas, la geometría finita muestra el camino. 
Al presentar el ejemplo suponemos que el lector está familiarizado con el 
cuerpo finito ::Zp de los enteros módulo un número primo p (véase la pá-
gina 18). Consideremos el espacio vectorial tridimiensional X sobre ::Zp. A 
partir de X construimos el siguiente grafo Gp . Los vértices de Gp son los 
subespacios de dimensión 1 [v] := {Av I A E ::Zp}, donde O i= v E X, Y dos 
de estos subespacios [v], [w] están conectados por una arista si 
(v, w) = V1Wl + V2W2 + V3W3 = O. 
Obsérvese que no importa qué vector i= O escojamos del subespacio. En 
lenguaje geométrico, los vértices son los puntos del plano proyectivo sobre ::Zp, 
y [w] es adyacente a [v] si w está en la recta polar de v. 
Como ejemplo, el grafo G2 no contiene 4-ciclos y tiene 9 aristas, cerca de la 
cota de 10 dada por (6). Veamos que esto es cierto para cualquier primo p. 
En primer lugar demostraremos que Gp no tiene ningún C4 . Si [u] es un 
vecino común de [v] y [w], entonces u es solución del sistema lineal 
Vl x + V2 Y + V3 Z = ° 
W1X + W2Y + W3Z = O. 
Como v y w son linealmente independientes, sabemos que el subespacio de 
soluciones tiene dimensión 1 y, por tanto, que el vecino común [u] es único. 
Nos preguntamos ahora cuántos vértices tiene Gp , y hacemos otra vez doble 
recuento. X contiene p3 - 1 vectores i= O. Como cualquier subespacio de 
dimensión uno contiene p - 1 vectores i= O, deducimos que X tiene un total 
de p:~; = p2 + p + 1 subespacios de dimensión uno, es decir, Gp tiene 
n = p2 + p + 1 vértices. De forma similar, cualquier subespacio de dimensión 
dos contiene p2 - 1 vectores i= O y, por tanto, P:~ll = p + 1 subespacios de 
dimensión uno. 
Nos falta por determinar el número de aristas de Gp o, lo que es equivalente 
gracias a (4), los grados de los vértices. Según la construcción de Gp , los 
vértices adyacentes a [u] son las soluciones de la ecuación 
(7) 
El conjunto de soluciones de (7) es un subespacio de dimensión dos y, por 
tanto, hay p + 1 vértices adyacentes a [u]. Pero cuidado, es posible que el 
mismo u sea solución de (7) y, en tal caso, hay sólo p vértices adyacentes 
a [u]. 
145 
(0,0,1) 
(1,0, O) (1,1,0) (0,1, O) 
El grafo G2 : sus vértices son las siete 
temas (x, y, z) no nulas. 
146 
o 1 1 1 O O 
1 O 1 O 1 O 
1 1 O O O 1 
A= 1 O O 1 O O 
O 1 O O 1 O 
O O 1 O O 1 
O O O 1 1 1 
La matriz de G2 
O 
O 
O 
1 
1 
1 
O 
El principio del palomar y el doble recuento 
En resumen, hemos obtenido el siguiente resultado: si u está en la cónica 
dada por x2 + y2 + Z2 = O, entonces d([u]) = p, y en el resto de los casos 
d([u]) = p + 1. Por tanto, debemos detenmnar la cantidad de subespacios de 
dimensión uno que hay en la cónica 
X2 + y2 + Z2 = O. 
Demostraremos el siguiente resultado dentro de un momento. 
Afirmación. Hay exactamente p2 soluciones (x, y, z) de la ecuación 
x2 +y2 + Z2 = O y, por tanto, ignorando la solución (O, O, O), exacta-
mente ~~} = p + 1 vértices de grado p en Gp . 
Esto nos penmte completar el análisis de Gp . Hay p + 1 vértices de grado p y, 
por tanto, (p2 + p + 1) - (p + 1) = p2 vértices de grado p + 1. Utilizando (4) 
obtenemos 
IEI 
(p + l)p p2(p + 1) (p + 1)2p 
2 + 2 = 2 
(p + l)p (1 + (2p + 1)) = p2+ P(1 + V 4p2 + 4p + 1). 
44. 
Haciendo n = p2 + p + 1, la última ecuación queda 
n-1 IEI = -4- (1 + v4n - 3), 
que está muy cerca de la cota de (6). 
Vamos ahora con la demostración de la afirmación. El siguiente argumento 
es una hermosa aplicación del álgebra lineal que involucra a las matrices si-
métricas y sus autovalores. Nos encontraremos con el mismo método en el 
capítulo 34, y no por casualidad: las dos demostraciones proceden del mismo 
artículo de Erd6s, Rényi y Sós. 
Igual que antes, representamos los subespacios de dimensión uno de X por 
vectores VI, V2, ... , V p 2+p +I, de forma que dos cualesquiera de ellos son 
linealmente independientes. De manera similar, podemos representar los sub-
espacios de dimensión dos con el mismo conjunto de vectores, de forma que 
el subespacio correspondiente a u = (UI, U2, U3) es el conjunto de soluciones 
de la ecuación UIX + U2Y + U3Z = O igual que en (7). (Por supuesto, esto 
es simplemente el principio de dualidad en álgebra lineal.) Por tanto, según 
(7), un subespacio de dimensión uno representado por Vi está contenido en el 
sub espacio de dimensión dos representado por V j si y sólo si (Vi, V j) = O. 
Consideremos la matriz A = (aij) de tamaño (p2 + p + 1) X (p2 + p + 1), 
definida de la siguiente forma: las filas y columnas de A corresponden a 
VI, ... , V p2+p+l, utilizando la misma numeración para filas y columnas, y 
a .. . = {1 si (Vi,Vj) =0, 
'J . O en otro caso. 
Por tanto, A es una matriz real simétrica y aii = 1 si (Vi, Vi) = O, es decir, 
precisamente cuando Vi está en la cónica x 2 + y2 + z2 = O. Ahora todo lo 
que queda por demostrar es que 
traza A p+l. 
El principio del palomar y el doble recuento 
Del álgebra lineal sabemos que la traza es a la suma de los autovalores. 
y aquí viene el truco: aunque A parece complicada, la matriz A 2 es fácil de 
analizar. Nos serán útiles las siguientes observaciones: 
e Todas las filas de A tienen exactamente p + 1 unos. De aquí se deduce que 
p + 1 es un autovalor de A, ya que Al = (p + 1)1, donde 1 es el vector 
formado por unos. 
@ Para dos filas cualesquiera Vi, Vj hay exactamente una columna con un 1 
en ambas filas (la columna conespondiente al único subespacio generado 
por Vi, Vj). 
Utilizando estas observaciones obtenemos 
1 
p+1 
pI + J, 
donde I es la matriz identidad y J es la matriz formada enteramente por unos. 
Ahora bien, J tiene los autovalores p2 + p + 1, de multiplicidad 1, y O, de 
multiplicidad p2 + p. De aquí se deduce que los autovalores de la matriz A 2 
son p2 + 2p + 1 = (p + 1)2 con multiplicidad 1 y p con multiplicidad p2 + p. 
Como A es real y simétrica, es diagonalizable y, por tanto, A tiene el autovalor 
p + 1 ó -(p + 1) Y p2 + p autovalores ±y'P. Según la observación 1 anterior, 
el primer autovalor debe ser p + 1. Supongamos que y'P tiene multiplicidad 
T y que -y'P tiene multiplicidad s, entonces 
traza A = (p + 1) + Ty'P - sy'P. 
y hemos terminado: como la traza es un entero, debe ocurrir que T = S y, por 
tanto, traza A = p + 1. O 
En 1911, Luitzen Brouwer publicó su famoso teorema del punto fijo: 
Toda función continua f: En ------7 En de una bola n-dimensional en 
sí misma tiene un punto fijo (algún x E En tal que f (x) = x). 
Para dimensión 1, es decir, para un intervalo, este resultado es una conse-
cuencia sencilla del teorema de Bolzano, pero para dimensiones superiores la 
demostración de Brouwer necesita henamientas más sofisticadas. La sorpresa 
fue general cuando en 1928 el joven Emanuel Spemer (tenía entonces 23 años) 
encontró un sencillo resultado combinatorio del que se pueden deducir tanto 
el teorema del punto fijo de Brouwer como la invariancia de la dimensión bajo 
aplicaciones biyectivas continuas. Más aún, el ingenioso lema de Spemer vino 
acompañado de una demostración igualmente hermosa - simplemente doble 
recuento. 
Presentamos el lema de Spemer, y el teorema de Brouwer que se deduce de 
él, para el primer caso interesante, es decir, para dimensión n = 2. El lector 
147 
148 
3 
Los triángulos que tienen los vértices de 
tres colores distintos aparecen sombrea-
dos 
3 
El principio del palomar y el doble recuento 
no debería tener dificultades para extender las demostraciones a dimensión 
arbitraria (por inducción sobre la dimensión). 
Lema de 'n." .... ''' .. 
Supongamos que un triángulo "grande" con vértices V2, V3 es triangu-
lado (es decir, descompuesto en un número finito de triángulos "pequeños" 
pegados por sus aristas). 
Supongamos que asociamos a cada vértice de la triangulación un "color" del 
conjunto {1, 2, 3} de forma que Vi recibe el color i (para cada i), y que sólo 
los colores i y j son utilizados para los vértices de la arista que va de a 
Vi (para i i= j), mientras que los vértices interiores son coloreados de forma 
arbitraria con 1, 2 o 3. 
Entonces en la triangulación debe encontrarse algún triángulo pequeño "tres-
coloreado ", es decir, que tiene los tres vértices de colores distintos. 
• Demostración. Probaremos un resultado aún más fuerte: el número de 
triángulos tres-coloreados no sólo es distinto de cero, sino que es siempre im-
par. Para ello, consideremos el grafo dual de la triangulación, pero no toma-
mos todas sus aristas, sino sólo las que cruzan una arista que tiene extremos 
con los colores (distintos) 1 y 2. De esta forma, obtenemos un "grafo dual 
parcial" que tiene grado 1 en todos los vértices que corresponden a triángulos 
tres-coloreados, grado 2 en los que corresponden a triángulos en los que sólo 
aparecen los colores 1 y 2, Y grado O en los que corresponden a triángulos 
en los que falta alguno de los colores 1 y 2. Por tanto, sólo los triángulos 
tres-coloreados dan lugar a vértices de grado impar (de grado 1). 
Sin embargo, el vértice del grafo dual que corresponde al exterior de la trian-
gulación tiene grado impar: en efecto, a lo largo de la arista completa que va 
de V1 a V2 hay un número impar de cambios entre 1 y 2. Pero entonces hay un 
/ ---0-------
2 número impar de aristas del grafo dual parcial que cruzan esta arista, mientras 
que en las otras aristas del triángulo grande no pueden aparecer los colores 1 
y 2 a la vez. 
Como el número de vértices de grado impar en cualquier grafo finito es par 
(según la ecuación (4», hemos demostrado que el número de triángulos pe-
queños que tienen tres colores distintos (y que corresponden a los vértices 
interiores del grafo dual de grado impar) es impar. O 
Utilizando este lema es sencillo demostrar el teorema de Brouwer . 
• Demostración del teorema del punto fijo de Brouwe:r n = 2). Sea 
6. el triángulo de ]R3 con vértices el = (1, O, O), e2 = (0,1, O) Y 
e3 = (O, 0,1). Es suficiente demostrar que cualquier aplicación continua 
f: 6. -+ 6. tiene un punto fjo, ya que 6. es homeomorfo a la bola de dimen-
sión dos, B 2 . 
Sea 6 (T) la longitud de la arista más larga en una triangulación T. Es sencillo 
construir una sucesión infinita de triangulaciones 'h, 72, ... de 6. tales que la 
sucesión 15(~) tiene límite O. Una sucesión así se puede construir explícita-
mente o utilizando inducción, tomando por ejemplo ~+l como la subdivisión 
baricéntrica de ~. 
Para cada una de estas triangulaciones, definimos una 3-coloración de sus vér-
tices v haciendo A(V) := min{i : f(V)i < Vi}, es decir, A(V) es el menor 
El principio del palomar y el doble recuento 
índice i tal que la i-ésima coordenada de f ( v) - v es Suponiendo 
que f no tiene puntos fijos, esta coloración está bien definida. Para ver esto, 
obsérvese que todo v E ,0,. está en el plano Xl + X2 + X3 = 1 y, por tanto, 
¿i Vi = 1. Entonces, si f ( v) =1= v, al menos una de las coordenadas de 
f (v) - v debe ser negativa (y al menos una debe ser positiva). 
Veamos que esta coloración verifica las condiciones del lema de Spemer. En 
primer lugar, hay que asignar el color i al vértice ei, ya que la única compo-
nente de f ( ei) - ei que puede ser negativa es la i-ésima. Además, si v está en 
la arista opuesta a ei, entonces Vi = O y, por tanto,la i-ésima componente de 
f ( v) - v no puede ser negativa, de donde se deduce que a v no se le asigna el 
color i. 
El lema de Spemer dice ahora que en cada triangulación ~ hay un trián-
gulo 3-coloreado, es decir, existe un triángulo {V k :l , V k :2 , v k :3 } para el que 
A( v k :i ) = i. La sucesión de puntos (v k :l h>l puede no ser convergente, pero 
del hecho que el símplice ,0,. es compacto podemos deduir que existe alguna 
subsucesión convergente. Tras reemplazar la sucesión de triangulaciones ~ 
por la subsucesión correspondiente (a la que, por simplicidad, también deno-
tamos por ~) sabemos que que (V k :l h converge a un punto v E ,0,.. Ahora 
bien, la distancia de v k :2 y V k :3 a v k :l es menor o igual que el tamaño de la 
triangulación o(~), que tiende a O. Por tanto, las sucesiones (V k :2 ) y (v k :3 ) 
convergen al mismo punto v. 
¿Qué sabemos de f( v)? La primera coordenada f( v k :l ) es menor que la de 
v k :l para todo k. Como f es continua, se deduce que la primera coordenada 
de f ( v) es menor o igual que la de v. El mismo razonamiento es válido para 
la segunda y tercera coordenadas. Por tanto, ninguna de las coordenadas de 
f ( v) - v es positiva - y ya hemos visto que esto entra en contradicción con 
la suposición de que f ( v) =1= v. D 
[1] L. E. J. BROUWER: Über Abbildungen von Mannigfaltigkeiten, Math. Annalen 
71 (1912), 97-115. 
[2] W. G. BROWN: On graphs that do not contain a Thomsen graph, Canadian Math. 
Bull. 9 (1966), 281-285. 
[3] P. ERDÓS, A. RÉNYI & V. SÓS: On a problem ofgraph theory, Studia Sci. Math. 
Hungar. 1 (1966), 215-235. 
[4] P. ERDÓS & G. SZEKERES: A combinatorial problem in geometry, Compositio 
Math. (1935), 463-470. 
[5] s. HO~TEN & W. D. MORRIS: The order dimension ofthe complete graph, Dis-
crete Math. 201 (1999), 133-139. 
[6] 1. REIMAN: Über ein Problem von K. Zarankiewicz, Acta Math. Acad. Sci. Hun-
gar. 9 (1958), 269-273. 
[7] J. SPENCER: Minimal scrambling sets of simple orders, Acta Math. Acad. Sci. 
Hungar. 22 (1971), 349-353. 
[8] E. SPERNER: Neuer Beweis für die lnvarianz der Dimensionszahl und des 
Gebietes, Abh. Math. Sem. Hamburg 6 (1928), 265-272. 
[9] W. T. TROTTER: Combinatorics and Partially Ordered Sets: Dimension 
Theory, John Hopkins University Press, Baltimore and London 1992. 
149 
En este capítulo nos ocupamos de un tema básico de la combinatoria, en con-
creto de las propiedades y tamaños de familias especiales F de subconjuntos 
de un conjunto finito N = {l, 2, ... , n}. Comencemos con dos clásicos del 
área: los teoremas de Spemer y de Erdos-Ko-Rado. Estos resultados tienen en 
común que fueron demostrados de nuevo muchas veces, y cada uno de ellos 
dio origen a una nueva rama de la teoría de conjuntos combinatoria. Para am-
bos, la inducción parece ser el método natural, pero los argumentos que vamos 
a presentar son bastante distintos, y verdaderamente geniales. 
En al año 1928 Emanuel Spemer planteó y respondió la siguiente pregunta: 
supongamos que tenemos un conjunto N = {l, 2, ... , n}. Se dice que una 
familia F de subconjuntos de N es una anticadena si ningún conjunto de F 
contiene a otro conjunto de la familia F. ¿Cuál es el tamaño de la anticadena 
más grande? Claramente, la familia Fk de todos los conjuntos de cardinal k 
es una anticadena, y IFk I = G). Considerando el máximo de los coeficien-
tes binomiales (véase la página 12) concluimos que existe una anticadena de 
tamaño (Ln/2j) = maXk (~). El teorema de Spemer asegura que no existen 
anticadenas más largas. 
Teorema 1. El tamaño de la anticadena más grande de un conjunto de n Emanuel Spemer 
elementos es (Ln/2j)' 
• Demostración. Entre las muchas demostraciones existentes, la siguiente, 
debida a David Lubell, es probablemente la más corta y elegante. Sea F una 
anticadena arbitraria. Tenemos que demostrar que IFI :S (Ln/2j)' Para ello, 
la idea clave es considerar cadenas de subconjuntos 0 = Go e G1 e ... e 
Gn = N, donde IGil = i para i = O, ... , n. ¿Cuántas cadenas hay? Es 
claro que obtenemos una cadena añadiendo uno a uno los elementos de N y, 
por tanto, existen tantas cadenas como permutaciones de N, es decir, nI. A 
continuación, dado un conjunto A E F nos preguntamos en cuántas de estas 
cadenas aparece. De nuevo, la respuesta es sencilla. Para ir desde 0 hasta A 
hay que añadir de uno en uno los elementos de A, y para ir desde A hasta N 
tenemos que añadir los elementos restantes. Por tanto, si A tiene k elemen-
tos, considerando todos estos pares de cadenas concatenadas vemos que hay 
k! (n - k)! cadenas que contienen a A. Obsérvese que ninguna cadena puede 
contener dos conjuntos distintos A y B de F, ya que F es una anticadena. 
Para terminar la demostración, sea mk el número de subconjuntos de k ele-
mentos en F. Entonces, IFI = I:~=o mk. De la discusión precedente, se 
deduce que el número de cadenas que contienen algún elemento de F es 
n 
L mkk!(n-k)!, 
k=O 
152 
Invitamos al lector a comprobar que la 
familia de todos los subconjuntos de 
~ elementos, cuando n es par, y las 
dos familias de todos los subconjuntos 
de n;-l elementos y de todos los sub-
conjuntos de n~l elementos, cuando n 
es impar, son las únicas anticadenas que 
alcanzan el tamaño máximo. 
punto 
\ 
arista 
I 
Una circunferencia e para n = 6. Los 
segmentos en negrita forman un arco de 
longitud 3. 
Tres teoremas famosos sobre conjuntos finitos 
y esta expresión no puede superar a ni, la cantidad total de cadenas. Por tanto, 
se concluye que 
~ k!(n - k)! 
.L.- mk I n. 
k=O 
< 1, o 
n 
~mk 
.L.- < 1. 
k=O G) 
Reemplazando los denominadores por el coeficiente binomial mayor se ob-
tiene 
es decir, 
y hemos terminado la demostración. o 
Nuestro segundo resultado es de naturaleza completamente distinta. De nuevo 
consideramos el conjunto N = {1, ... , n}. Decimos que una familia F de 
subconjuntos es unafamilia entrecruzada si dos conjuntos cualesquiera de F 
tienen al menos un elemento en común. Es casi inmediato que el tamaño 
de la mayor familia entrecruzada es 2n-l. Si A E F, el complementario 
AC = N\A tiene intersección vacía con A y, por tanto, no puede estar en F. 
De aquí se concluye que una familia entrecruzada contiene como mucho la 
mitad de los 2n subconjuntos de N, es decir, IFI :S: 2n-l. Por otra parte, si 
consideramos la familia de todos los conjuntos que contienen un elemento fijo, 
por ejemplo la familia Fl de todos los conjuntos que contienen all, entonces 
IFll = 2n- 1 , y el problema está resuelto. 
Pero ahora nos hacemos la siguiente pregunta: ¿De qué tamaño puede ser una 
familia entrecruzada F si todos los conjuntos de F tienen el mismo número de 
elementos, digamos k? Llamaremos a tales familias familias k-entrecruzadas. 
Para evitar situaciones triviales, suponemos que n ;::o: 2k, ya que en otro caso 
dos conjuntos de tamaño k cualesquiera tienen intersección no vacía, y no hay 
nada que demostrar. Recuperando la idea anterior, consideramos la familia Fl 
de todos los subconjuntos de k elementos que contienen al 1. Es evidente 
que los conjuntos de Fl se obtienen añadiendo al 1 todos los subconjuntos de 
(k - 1) elementos del conjunto {2, 3, ... ,n} y, por tanto, IFll = (~=i). ¿Se 
puede mejorar esto? No - y esta es la afirmación del teorema de Erdos-Ko-
Rado. 
Teorema 2. El mayor tamaño de una familia k-entrecruzada en un conjunto 
de n elementos es (~=i), cuando n ;::o: 2k. 
Paul Erdos, Chao Ko y Richard Rado demostraron este resultado en 1938, 
pero no fue publicado hasta 23 años después. Desde entonces se han encon-
trado muchas demostraciones y variantes pero el siguiente argumento, debido 
a Gyula Katona, es especialmente elegante . 
• Demostración. La idea clave de la demostración es el siguiente lema, que a 
primera vista no parece en absoluto relacionado con nuestro problema. Consi-
deremos una circunferencia e dividida por n puntos en n segmentos. Decimos 
que un arco de longitud k está formado por k + 1 puntos consecutivos y los k 
segmentos entre ellos. 
Tres teoremas famosos sobreconjuntos finitos 
Lema. Sea n :2:: 2k Y " , arcos distintos de k tales que dos 
cualesquiera tienen un segmento en común Entonces t :s; k, 
Para demostrar el lema, obsérvese en primer lugar que cualquier punto de O 
es extremo de a 'lo más un arco, En efecto, si Ai y Aj tuvieran un extremo 
común v, entonces tendrían que comenzar en direcciones distintas (ya que son 
distintos). Pero entonces no podrían tener un segmento en común, ya que 
n :2:: 2k, Consideremos el arco Al, Como cualquier (i:2:: 2) tiene un 
segmento en común con Al, uno de los extremos de es un punto interior de 
Al. Pero acabamos de ver que estos extremos deben ser distintos, y como Al 
contiene k - 1 puntos interiores, se deduce que hay como mucho k - 1 arcos 
adicionales y, por tanto, como mucho k arcos en totaL D 
Vayamos ahora con la demostración del teorema de Erd6s-Ko-Rado, Sea F 
una familia k-entrecruzada, Consideramos una circunferencia O con n pun-
tos y n segmentos en las condiciones del lema y una permutación cíclica 
1f = (al, a2" .. , an ), y escribimos los números ai en sentido horario alIado 
de los segmentos de O, ¿Cuántos conjuntos A E F aparecen como k núme-
ros consecutivos en O? Como F es una familia entrecruzada, según el lema 
puede haber a lo sumo k conjuntos, Ahora bien, esto es cierto para cualquier 
permutación cíclica, y como hay (n -1)! permutaciones cíclicas, de esta forma 
generamos como mucho 
k(n - 1)! 
conjuntos de F que aparecen de forma consecutiva en alguna permutación cí-
clica. ¿Cuántas veces contamos cada conjunto A E F? Muy sencillo: A apa-
rece en 1f si los k elementos de A aparecen de forma consecutiva en algún 
orden, Como hay k! formas de ordenar los elementos de A, y (n k)! formas 
de ordenar los restantes elementos, concluimos que un conjunto A aparece 
exactamente en k!(n - k)! permutaciones cíclicas, de donde se deduce que 
k (n - 1) 1 (n - 1)! (n - 1) 
I FI :s; k! (n _ k)! = (k - 1)! (n - 1 - (k - 1))! = k _ l' D 
De nuevo, podemos preguntarnos si las familias que contienen un elemento 
fijo son, las únicas familias k-entrecruzadas, Claramente, esto no es cierto 
para n = 2k. Por ejemplo, para n = 4 Y k = 2la familia {1, 2}, {1, 3}, {2, 3} 
también tiene tamaño (~) = 3, En general, para n = 2k obtenemos las 
familias k-entrecruzadas maximales, de tamaño H~) = G=D, incluyendo, 
para cada par de conjuntos formado por un conjunto A con k elementos y 
su complementario N\A, uno cualquiera de los dos, Pero para n > 2k las 
familias que contienen un elemento fijo son, de hecho, las únicas, Invitamos 
al lector a intentar demostrarlo, 
Finalmente nos ocupamos del tercer resultado, que puede ser presentado, con 
bastante fundamento, como el teorema básico más importante de la teoría de 
conjuntos finitos, el "teorema del matrimonio", demostrado por Philip Hall 
en 1935, Con él comienza lo que hoy se conoce como teoría de empareja-
mientos, con amplias aplicaciones, algunas de las cuales se mostrarán a conti-
nuación. 
Una familia entrecruzada para n 
k=2 
153 
4, 
154 
"Una boda múltiple" 
c 
E 
{B, C, D} es una familia crítica 
Tres teoremas famosos sobre conjuntos finitos 
Consideremos un finito X y una familia Al, . .. , de 
tos de X (no necesariamente distintos). Diremos que una sucesión Xl, . .. ,Xn 
es un sistema de representantes distintos de {Al,." ,An} si los Xi son ele-
mentos distintos de X, y si Xi E Ai para todo i. Por supuesto, tal sistema, 
que abreviaremos como SRD, puede no existir (por ejemplo, si uno de los 
conjuntos Ai es vacío). El teorema de Hall presenta condiciones necesarias y 
suficientes para que exista un SRD. 
Antes de presentar el resultado veamos la interpretación por la que es cono-
cido como teorema del matrimonio: consideremos un conjunto {1, ... ,n} de 
chicas y un conjunto X de chicos. Siempre que X E la chica i y el chico X 
tienen tendencia a casarse y, por tanto, Ai es el conjunto de posibles parejas 
de la chica i. Un SRD es una boda múltiple en la que cada chica se casa con 
un chico que le gusta. 
De vuelta a los conjuntos, éste es el resultado. 
Teorema 3. Sea Al, ... , An una familia de subconjuntos de un conjunto fi-
nito X. Existe un sistema de representantes distintos si y sólo si la unión de 
cualesquiera m conjuntos Ai contiene al menos m elementos, para 
1 ~ m ~ n. 
Es evidente que la condición es necesaria: si m conjuntos Ai tienen en total 
menos de m elementos, entonces estos m conjuntos no pueden ser representa-
dos por elementos distintos. Lo sorprendente es que esta condición es también 
suficiente (esta parte es la que origina multitud de aplicaciones). La demos-
tración original de Hall es bastante complicada, y posteriormente se han en-
contrado muchas pruebas distintas, de entre las cuales la siguiente (debida a 
Easterfield y redescubierta por Halmos y Vaughan) parece la más natural. 
• Demostración. Utilizamos inducción sobre n. Para n = 1 no hay nada 
que demostrar. Sea n > 1, Y supongamos que {Al, ... , An} satisface la 
condición del teorema, que abreviamos como (H). Diremos que una familia 
de f! conjuntos Ai con 1 ~ f! < n es una familia crítica si su unión tiene f! 
elementos. Hay que distinguir dos casos. 
Caso 1: No existe ninguna familia crítica. 
Escogemos un elemento X E An. Eliminamos X de X y consideramos la 
familia A~, ... ,A~_l' donde A~ = Ai \ {x}. Como no existe ninguna fami-
lia crítica, la unión de cualesquiera m conjuntos de los A~ contiene al me-
nos m elementos. Por tanto, según la hipótesis de inducción existe un SRD 
Xl, ... , Xn-l de {A~, ... , A~_l} que, junto con x n = x, proporciona un 
SRD para la familia original. 
Caso 2: Existe alguna familia crítica. 
Después de reordenar los conjuntos podemos suponer que {Al, ... , Ac} es 
una familia crítica. Entonces, U;=l Ai = X, con IXI = f!. Como f! < n, 
aplicando indu~ción vemos que existe un SRD para Al, ... ,Ac, es decir, los 
elementos de X se pueden etiquetar como Xl, ... , Xc, de forma que Xi E Ai 
para todo i ~ f!. 
Consideremos ahora los restantes conjuntos AC+I ," ., A n , y escojamos m 
cualesquiera de ellos. Como la unión de Al, ... ,Ac y estos m conjuntos 
Tres teoremas famosos sobre conjuntos finitos 
contiene al menos e + m elementos según la condición se deduce que los 
m conjuntos tienen al menos m elementos que no pertenecen a X. En otras 
palabras, la familia 
satisface la condición (H). 
La inducción nos proporcio~a ahora un SRD de AH l, ... ,An formado por 
elementos que no están en X. Combinándolos con Xl, ... ,XC obtenemos un 
SRD para todos los conjuntos Ai. Esto completa la demostración. O 
Como hemos mencionado, el teorema de Hall fue el comienzo de la ahora 
ampliamente desarrollada teoría de emparejamientos [6]. Una de las muchas 
variantes nos permite enunciar un resultado particularmente atractivo, que el 
lector queda invitado a demostrar: 
Supongamos que los conjuntos Al, ... , An tienen todos tamaño 
k 2 1 Y supongamos además que ningún elemento está contenido 
en más de k conjuntos. Entonces existen k sistemas de representantes 
distintos tales que, para cualquier i, los k representantes de Ai son 
distintos y forman, por tanto, el conjunto Ai. 
Un hermoso resultado que debería abrir nuevos horizontes a las posibilidades 
de matrimonio. 
[1] T. E. EASTERFIELD: A combinatorial algorithm, J. London Math. Soco 21 (1946), 
219-226. 
[2] P. ERDÓS, C. Ko & R. RADO: Intersection theoremsfor systems offinite sets, 
Quart. J. Math. (Oxford), Ser. (2) 12 (1961), 313-320. 
[3] P. HALL: On representatives of subsets, J. London Math. Soco 10 (1935), 
26-30. 
[4] P. R. HALMOS & H. E. VAUGHAN: The marriage problem, Amer. J. Math. 72 
(1950),214-215. 
[5] G. KATONA: A simple proof of the Erdffs-Ko-Rado theorem, J. Combinatorial 
Theory, Ser. B 13 (1972), 183-184. 
[6] L. LovÁsz & M. D. PLUMMER: Matching Theory, Akadémiai Kiadó, Budapest 
1986. 
[7] D. LUBELL: A short proof of Sperner's theorem, J. Combinatorial Theory 1 
(1966), 299. 
[8] E. SPERNER: Ein Satz über Untermengen einer endlichenMenge, Math. Zeitsch-
rift 27 (1928), 544-548. 
155 
¿ Cuántas veces ha de barajarse un mazo de 
de las cartas sea aleatorio? 
para que el orden 
Analizar procesos aleatorios es una tarea común, tanto en la vida cotidiana 
("¿Cuánto se tarda en llegar al aeropuerto un viernes a las seis de la tarde?") 
como en las matemáticas. Sin embargo, no se puede esperar obtener respuestas 
sensatas sin antes formular una pregunta más precisa. En el caso de barajar un 
mazo de naipes, es necesario especificar: 
* el tamaño del mazo (por ejemplo, n = 52 cartas), 
* cómo se baraja (empezaremos analizando mezclas en las que se coloca la 
carta más alta en un sitio aleatorio, y después trataremos las más realistas 
y efectivas mezclas por imbricación (riffle shuffles, en inglés), y 
• qué se entiende por "aleatorio" o "casi aleatorio". 
En este capítulo describiremos un análisis de la baraje por imbricación he-
cho por Edgar N. Gilbert y Claude Shannon (1955, sin publicar) y Jim Reeds 
(1981, sin publicar). Seguiremos los pasos del estadístico David Aldous y el 
antes mago y ahora matemático Persi Diaconis [1]. No llegaremos al resul-
tado final y preciso de que al cabo de 7 mezclas por imbricación una baraja 
de n = 52 cartas es casi aleatoria, mientras que 6 no son suficientes - pero 
sí obtendremos una cota superior de 12, y de paso veremos unas ideas muy 
bellas: las "reglas de detención" y el "tiempo fuertemente uniforme", el lema 
que enuncia que el tiempo fuertemente uniforme es una cota para la distancia 
de variación, el lema de inversión de Reeds y, en consecuencia, la interpreta-
ción de un baraje como una "ordenación al revés". Al final, reduciremos todo 
a dos problemas combinatorios muy clásicos, la paradoja de los cumpleaños y 
el problema del coleccionista. ¡Empecemos pues con ellos! 
La los cumpleaños 
Escogemos n personas al azar, por ejemplo los asistentes de una clase o de 
un seminario. ¿Cuál es la probabilidad de que todos cumplen años en días 
diferentes? Con las simplificaciones usuales (el año tiene 365 días, no hay 
variación estacional, no hay gemelos), esta probabilidad es 
La tarjeta de visita de Persi Diaconis 
cuando era mago. En una entrevista pos-
terior dijo: "Si dices que eres profesor 
en Stanford, la gente te trata con respeto. 
Si dices que te dedicas a inventar trucos 
de magia, no te quieren presentar a su 
hija." 
158 
I: x S - 1 (1 - X)S = 
s~l 
I: X s - 1 S - I: XSS 
s~l s~l 
s~O S~O 
1 
1- x' 
donde en el último paso se suma una se-
rie geométrica (ver página 28). 
Barajando el mazo 
lo cual es menor que ~ para n = 23 (ésta es precisamente la "paradoja de los 
cumpleaños"), menor que 9% para n = 42, Y exactamente O para n > 365 
(según el principio del palomar; véase el capítulo 22). La formula es fácil 
de demostrar - escogiendo a las personas en un orden fijo: Si las primeras 
i personas cumplen años en días diferentes, la probabilidad de que la persona 
(i + 1) -ésima también lo haga es 1 - 3~5' ya que hay todavía 365 - i días 
disponibles. 
De manera similar, al meter n bolas en K cajas de manera independiente y 
aleatoria, la probabilidad de que ninguna caja reciba más de una bola es 
n-l . 
p(n,K) = rr (1- ~). 
i=l 
El problema del coleccionista 
Los niños coleccionan cromos de estrellas de música (o de fútbol), pero como 
se venden en sobres cerrados no saben de antemano cuál les tocará. Si hay 
n cromos diferentes, ¿cuál es el número esperado de sobres que tiene que 
comprar un niño hasta tener al menos un ejemplar de cada cromo? 
De manera equivalente, si se seleccionan bolas al azar de una urna que con-
tiene n bolas etiquetadas del 1 al n, y cada vez se vuelven a meter en la urna 
y se mezclan bien, ¿cuántas bolas hay que tomar en promedio hasta que cada 
bola haya sido escogida por lo menos una vez? 
Si en un momento dado ya se han seleccionado k bolas diferentes, entonces la 
probabilidad de no escoger a continuación una bola nueva es ~. Por tanto, la 
probabilidad de tener que seleccionar exactamente s bolas hasta dar con una 
nueva es (~)S-l(l - ~). En consecuencia, el número esperado de veces que 
hay que seleccionar una bola hasta dar con una nueva es 
(k)S-l( k) 1 L - 1-- s = --k' n n 1--
s~l n 
(véase el margen). Por tanto, el número esperado de bolas que hay que selec-
cionar para dar con cada una de las n bolas por lo menos una vez es 
n-l 1 n n n n L --k = - + -- + ... + - + - = nHn ~ nlogn, 1-- n n-1 2 1 
k=O n 
usando las cotas para los números armónicos obtenidas en la página 11. Por 
tanto, la respuesta al problema del coleccionista es que en promedio se habrán 
de seleccionar aproximadamente n log n bolas. 
A continuación necesitaremos estimar la probabilidad de que haya que selec-
cionar un número de bolas significativamente mayor que n log n. Si Vn denota 
el número de selecciones necesarias (Vn es la variable aleatoria cuyo valor es-
perado es E[Vnl ~ n log n) entonces, para n 2 1 Y e 2 O, la probabilidad de 
tener que seleccionar más de m : = In lag n + en 1 bolas es 
Barajando el mazo 
En si denota el suceso que en las nrimp.TCl 
escoge nunca la bola con el número i, entonces 
Prob[UAi ] 
i 
n(l- ~)m < 
m selecciones no se 
< -e _ e . 
Empecemos ahora con un mazo de n cartas. Las numeramos del 1 al n en el 
orden en el que están en el mazo, de manera que la carta con el número 1 está 
por encima de todas, y la "n" por debajo. Denotaremos además al conjunto 
de todas las permutaciones de 1, ... , n por <5n . Barajar el mazo equivale a 
aplicar ciertas permutaciones aleatorias al orden de las cartas. En un caso 
ideal, esto podría significar que aplicamos permutaciones arbitrarias 7f E <5n 
a nuestro orden inicial (1,2, ... , n), cada una con la misma probabilidad 10,. n. 
Por tanto, después de hacerlo una sola vez ya tendríamos el mazo en el orden 
7f = (7f(1), 7f(2), ... , 7f( n)), y este orden sería perfectamente aleatorio. Pero 
eso no es lo que pasa en la realidad. Cuando barajamos un mazo solamente 
aplicamos "ciertas" permutaciones, a lo mejor ni siquiera todas con la misma 
probabilidad, y esto se repite un "cierto" número de veces. Después de esto, 
tenemos la esperanza de que el mazo esté en un orden por lo menos "casi 
aleatorio" . 
Estrategia 1: primera carta a un sitio aleatorio 
Hacemos lo siguiente: se escoge la carta más alta del mazo, y se inserta en 
uno de los n posibles sitios, cada uno con probabilidad ;. Aplicamos pues 
una de las permutaciones siguientes 
i 
J-
Ti = (2,3, ... ,i,1,i+1, ... ,n), 
para 1 :::; i :::; n. Después de barajar una vez, el mazo aún no será aleatorio, y 
159 
Se puede demostrar que (1 - ~) n es 
una función creciente en n que converge 
a l/e. Por tanto, (1 - ~r < ~ se 
cumple para todo n 2': 1. 
de hecho habrá que barajar de esta forma muchas veces hasta que sí lo sea. La primera carta a un sitio aleatorio 
Una sucesión típica de barajes según esta estrategia podría ser (para n = 5): 
1 
I~ 
2 I~ 3 1\ 2 I~I 2 2 I I 3 I 2 I I 4 I I 4 3 I I 4 I 4 I I 1 I I 1 
4 I I 1 I 1 I I 5 I I 5 
5 I I 5 I 5 I I 3 I I 3 
¿De qué manera podríamos expresar matemáticamente que el mazo es "casi 
aleatorio"? Un medida bastante severa del grado de aleatoridad con la que 
han dado los probabilistas ella "distancia de variación". Para definirla, em-
pezamos fijándonos en la distribución de probabilidad de las n! ordenaciones 
diferentes del mazo, o de manera equivalente de las nl diferentes permuta-
ciones (J E <5n que dan lugar a estas ordenaciones. 
1\1 4 I~ I I 1 I 
I I 5 I 
I I 3 I 
I I 2 I 
160 
Para los jugadores de cartas, la pre-
gunta esencial no es "¿cómo de aleato-
rio será el mazo después de barajarlo 
un millón de veces? ", sino "¿ bastará 
con 7?" 
(Aldous & Diaconis [1]) 
d(k) 
1+---...... 
ka 
Barajando el mazo 
Dos ejemplos son nuestra distribución de E, dada por 
E(id) 1, 
E( 1T) O en caso contrario, 
y la distribución unifonne U dada por 
U(1T) = rb para toda 1T E 6 n . 
La distancia de variación entre dos distribuciones 01y 02 se define como 
1101 - 0211 := ~ L 101(1T) - 02(1T)1· 
1l"E6n 
Definiendo S := {1T E 6 n : 01 (1T) > 02 (1T)} Y utilizando que ¿7r 01 (1T) = 
¿7r 02(1T) = 1, esta expresión se puede escribir como 
donde Oi(S) := ¿7rES Oi(1T). Es claro que O ::; 1101 - 0211 ::; 1. En lo 
que sigue, interpretaremos "ser casi aleatorio" como "tener una distancia de 
variación pequeña a la distribución unifonne." En nuestro caso, la distancia 
de variación entre la distribución del inicio y la unifonne es casi 1: 
IIE - UII = 1-~. n. 
Después de barajar una vez la aleatoridad del mazo no ha mejorado mucho: 
IITop - UII = 1 - (n~l)!' 
Llamaremos Top*k a la distribución de probabilidad en 6 n obtenida al in-
sertar k veces la primera carta en un sitio aleatorio. ¿Cómo se comporta 
IITop*k - U 11 cuando aumenta k, eso es, si barajamos más veces? ¿Y si usamos 
una estrategia diferente para barajar? La teoría general (en particular, cadenas 
de Markov en grupos finitos; véase por ejemplo Behrends [3]) implica que 
para k grande la distancia de variación d(k) := IITop*k - UII se aproxima 
a O a velocidad exponencial, pero no es capaz de predecir el cambio brusco 
observado en la práctica: Después de barajar un cierto número ka de veces, 
"de pronto" d(k) decrece muy deprisa (véase al margen). 
Reglas de detención fuertemente uniformes 
Nuestro análisis se basa en la idea brillante de las reglas de detención fuerte-
mente unifonnes de Aldous y Diaconis. Imaginemos que el director de un ca-
sino vigila el proceso de barajar, analizando las pennutaciones que se aplican 
al mazo, y después de un número de pasos que depende de las pennutaciones 
que haya visto dice "¡Pare!". En esencia, tiene una regla de detención que 
finaliza el proceso de barajar y que únicamente depende de las pennutaciones 
(aleatorias) aplicadas hasta el momento. La regla de detención es fuertemente 
uniforme si se cumple para todo k ::::: O que: 
Si el baraje se detiene tras k pasos, entonces las permutaciones resultan-
tes del mazo se distribuyen (¡exactamente!) de manera uniforme. 
Barajando el mazo 
El número T de pasos que se dan hasta que el su 
de detención, diga "¡Pare!" es una variable aleatoria. De manera similar, la 
ordenación del mazo después de barajar k veces viene dada por una varia-
ble aleatoria X k (con valores en 6 n ). La regla de detención es fuertemente 
uniforme si para todos los valores de k se cumple que 
1 
Prob [Xk = 1T I T = k] = - para todo 1T E 6 n . n! 
Hay tres razones por las cuales estas reglas son interesantes y útiles: 
l. Efectivamente existen reglas de detención fuertemente uniformes. Es más, 
en muchos ejemplos son bastante sencillas. 
2. Se pueden analizar, y al intentar determinar Prob[T > k] a menudo surgen 
interesantes problemas combinatorios. 
3. Dan cotas superiores efectivas para las distancias de variación, como por 
ejemplo d(k) = IITop*k - UII. 
Por ejemplo, para la estrategia de insertar la primera carta en un sitio aleatorio, 
una regla de detención fuertemente uniforme es: 
"PARAR después de que la carta que al principio estuvo debajo del 
todo (con la etiqueta n) se haya insertado en el mazo por primera vez." 
En efecto, si seguimos a la carta n mientras barajamos, vemos que durante 
1 3 2 
2 
3 
4 
T1 
todo el proceso el orden de las cartas por debajo de ella es totalmente uni-
forme. Por tanto, después de que la carta n haya ascendido hasta arriba y se 
haya vuelto a insertar, el mazo está distribuido uniformemente; la única pega 
es que no sabemos exactamente cuándo pasa eso (pero el director del casino 
sí). 
Sea ahora Ti la variable aleatoria que cuenta el número de veces que se baraja 
hasta que haya por primera vez i cartas por debajo de la carta n. Por tanto, 
tenemos que determinar la distribución de 
T = T1 + (T2 - Td + ... + (Tn_1 - Tn- 2 ) + (T - Tn-d. 
Cada sumando corresponde a un problema del coleccionista: Ti - Ti- 1 es el 
tiempo hasta que la carta de arriba se inserta en un posible lugar por debajo de 
la carta n. Por tanto, también es el tiempo que tarda el coleccionista desde que 
adquiere el cromo (n - i)-ésimo hasta el (n - i + 1 )-ésimo. Sea Vi el numero 
de cromos comprados hasta que el coleccionista tenga i cromos diferentes. 
Entonces 
161 
La probabilidad condicionada 
Prob[AIBl 
es la probabilidad del suceso A sa-
biendo que el suceso B ocurre. Es la 
probabilidad de que los dos sucesos 
ocurran, dividido entre la probabili-
dad de que ocurra el suceso B, esto 
es, 
Prob[A I Bl 
4 
Prob[A /\ Bl 
Prob[B] 
162 Barajando el mazo 
Hemos visto que Prob[Ti - Ti - 1 = j] = Prob[Vn -i+l - Vn - i = j] para todo 
i y j. Por ende, el coleccionista y la persona que baraja el mazo según esta 
estrategia llevan a cabo procesos aleatorios independientes, pero equivalentes; 
eso sí, en orden inverso (para el coleccionista, finalizar es lo más difícil). Por 
tanto, la probabilidad de que con esta regla de detención fuertemente uniforme 
se tarde más de k = In lag n + en l pasos es pequeña: 
y esto significa a su vez que, después de barajar insertando la primera carta 
k = In lag n + en l veces, el mazo es "casi aleatorio" con 
Esta última conclusión se sigue del siguiente lema, sencillo pero crucial. 
Lema. Sea Q : <5n --------+ lR cualquier distribución de probabilidad que define 
un proceso de barajar Q*k con una regla de detenciónjuertemente uniforme 
cuyo tiempo de detención es T. Entonces, para todo k 2 0, 
• Demostración. Si X es una variable aleatoria con valores en <5n Y Q su 
distribución de probabilidad, podemos escribir Q (5) para la probabilidad de 
que X tome un valor en 5 ~ <5n . Así, Q(5) = Prob[X E 5], Y en el caso 
Q = U obtenemos 
U(5) = Prob[X E 5] = ~. 
n. 
Para cualquier subconjunto 5 ~ <5n> la probabilidad de que al cabo de k 
pasos el mazo esté ordenado según una permutación en 5 es 
Q*k(5) = Prob[Xk E 5] 
I:: Prob[Xk E 5 /\ T = j] + Prob[Xk E 5 /\ T > k] 
j9 
I:: U(5) Prob[T = j] + Prob[Xk E 5 I T > k] . Prob[T > k] 
j~k 
U(5) (1- Prob[T > k]) + Prob[Xk E 5 I T > k]· Prob[T > k] 
U(5) + (Prob[Xk E 5 I T > k]- U(5)) . Prob[T > k]. 
Por tanto, 
IQ*k(5) - U(5)1 :S Prob[T> k] 
ya que 
Prob[Xk E 5 I T > k] - U(5) 
es una diferencia de probabilidades, y su valor absoluto es como mucho l. O 
Esto completa nuestro análisis de la estrategia de insertar la carta de arriba 
en un sitio aleatorio. Hemos demostrado la siguiente cota superior para el 
número de mezclas necesarias hasta que el mazo sea "casi aleatorio". 
Barajando el mazo 
Teorema 1. Sea e 2 O Y k := In log n + en l. de insertar 
la primera carta k veces en un sitio aleatorio de un mazo con n cartas, la 
distancia de variación desde la distribución uniforme cumple 
Asimismo, se podría verificar que la distancia de variación d(k) sigue siendo 
grande si barajamos un número significativamente menor de n log n veces con 
esta estrategia. La razón es que un número más pequeño no bastará para alterar 
el orden relativo en las cartas más bajas del mazo. 
Por supuesto, esta estrategia de barajar es muy ineficaz - usando la cota de 
nuestra teorema, tenemos que barajar aproximadamente n log n ~ 205 veces 
hasta mezclar bien un mazo de n = 52 cartas. Por tanto, ahora nos fijaremos 
en un modelo mucho más interesante y realista de barajar. 
Mezclas por imbricación shuffles) 
Esto es lo que el crupier hace en un casino: Toma la baraja, corta en dos partes, 
y a continuación las entrelaza, por ejemplo dejando caer las partes inferiores 
de los dos medios mazos de alguna manera irregular. 
Como antes, esto produce cierta permutación en las cartas del mazo, que su-
ponemos inicialmente etiquetadas del 1 al n, siendo la 1 la de arriba. Las 
mezclas por imbricación se corresponden exactamente con las permutaciones 
7r E 6 n que verifican que la sucesión 
(7r(1),7r(2), ... ,7r(n)) 
está formada por dos sucesiones crecientes entrelazadas (solamente en el caso 
de la permutación identidad hay una sola permutación), y hay exactamente 
2n - n mezclas por imbricacióndistintas en un mazo de n cartas. 
01 1 1 
1 01 O 1 
01 1 
1 
I~ 
2 
11 O 2 
IX 
3 
1 3 I~ 11 4 
1 4 1 11 
3 01 2 
11 1 5 1 
4 11 5 
11 5 
En efecto, si se parte el mazo cogiendo las t cartas superiores con la mano 
derecha (O :::; t :::; n) y las n - t cartas restantes con la izquierda, entonces 
hay (~) maneras de entrelazar las dos manos, y todas ellas generan permuta-
ciones distintas - excepto que para cada t hay una posibilidad de obtener la 
permutación identidad. 
No está claro qué distribución de probabilidad se debería asignar a las mezclas 
por imbricación - no hay una respuesta única, ya que los aficionados y los 
profesionales barajarán de manera diferente. Sin embargo, el modelo que ex-
pondremos a continuación, que fue desarrollado primero por Edgar N. Gilbert 
y Claude Shannon en 1955 (entonces en el mítico departamento de "Matemá-
ticas de la Comunicación" de los laboratorios Bell), tiene algunas ventajas: 
163 
Una mezcla por imbricación 
IJI 
164 
Las mezclas por imbricación inversas 
se corresponden con las permutaciones 
71" = (71"(1), ... ,7I"(n)) crecientes, con 
excepción de a lo sumo un "descenso". 
(Solamente la permutación identidad no 
tiene ningún descenso.) 
Barajando el mazo 
es elegante, sencillo y parece 
e modeliza con fidelidad la manera de barajar de un no profesional 
y lo podemos analizar. 
He aquí tres descripciones - todas ellas de la misma distribución de probabi-
lidad Bric en €'in: 
1. Bric: €'in ----+ JR; se define mediante 
{ 
n+l 
2"" 
Bric(7I"):= ~~ 
si n = id, 
si n consiste de dos sucesiones crecientes, 
en caso contrario. 
2. Se toman t cartas del mazo en la mano derecha, con probabilidad 2~ (~), 
y el resto del mazo en la mano izquierda. Ahora, si se tienen r cartas en 
la mano derecha y 12 en la mano izquierda, se deja caer la carta más baja 
de la mano derecha con probabilidad r~R' y de la mano izquierda con 
probabilidad r!R' A continuación se repite el proceso. 
3. En una mezcla inversa, se quitaría un conjunto de cartas del mazo, y se las 
colocaría encima del resto - respetando el orden relativo en las dos partes 
del mazo. Tal proceso viene determinado por el subconjunto de cartas que 
se quitan, eligiéndose todos los subconjuntos con la misma probabilidad. 
De manera equivalente, se asigna una etiqueta "O" ó "1" a cada carta, 
aleatoria e independientemente con probabilidad ~, y se mueven las cartas 
con la etiqueta "O" arriba. 
Es fácil ver que estas reglas describen la misma distribución de probabilidad. 
Para (1) ~ (3) obsérvese que obtenemos la permutación identidad justo en 
el caso en que todas las cartas "O" están por encima de todas las cartas ''1''. 
Ya hemos definido el modelo. Pero, ¿cómo analizarlo? ¿Cuántas mezclas por 
imbricación hacen falta para tener un mazo casi aleatorio? No obtendremos la 
respuesta más precisa posible, pero sí una bastante buena, siguiendo estos tres 
pasos: 
(1) Analizar mezclas por imbricación inversas, 
(2) describir una regla de detención fuertemente uniforme para ellas, 
(3) y demostrar que la clave para su análisis es ¡la paradoja del cumpleaños! 
Teorema 2. Después de k mezclas por imbricación en un mazo de n cartas, 
la distancia de variación desde una distribución uniforme cumple 
IIBric*k - UII ~ 1- TI (1- 2ik )' 
• Demostración. (1) Analizaremos mezclas por imbricación inversas para 
ver con qué rapidez nos llevan desde la distribución inicial hacia (o cerca de) 
la distribución uniforme. Estas mezclas por imbricación inversas se corres-
ponden con la distribución de probabilidad dada por Bric(n) := Bric( n-1 ). 
Barajando el mazo 
Del hecho que toda permutación 
U(1T- 1 ), se obtenemos 
IIBric*k - UII 
(Esto es el lema de inversión de Reeds.) 
una inversa y de que U(1T) 
-.-*k 
11 Bric - UII· 
En cada mezcla por imbricación inversa, a cada carta se le asocia un dí-
gitoOó1: 
o 1 1 1 O :=1 ==1====:1 1 1 
01:= ::::::4====:1 ~ O 1 4 1 :=1 ==2====: 
112 I~ I 1~:=1==3====: 
11 3 1 1 2 I~I 4 
11 5 1 11 3 l. :=1 =5====: 
1 1 5. L-......."-----' 
Si recordamos estos dígitos - por ejemplo, escribiéndolos en las cartas - en-
tonces, después de k mezclas por imbricación inversas, en cada carta aparece 
una cadena ordenada de k dígitos. Nuestra regla de detención es: 
"PARAR cuando todas las cartas tengan asignadas cadenas distintas." 
Cuando esto suceda, las cartas del mazo habrán sido ordenadas según los 
números binarios bkbk-l ... b2 bl. donde bí es el bit que la carta ha adquirido 
en la i-ésima mezcla por imbricación inversa. Como estos bits son totalmente 
aleatorios e independientes, esta regla de detención es fuertemente uniforme. 
En el siguiente ejemplo para n = 5 cartas, necesitamos T = 3 mezclas inver-
sas hasta parar: 
0001 4 001 4 01 1 1 1 
0011 2 011 2 1 01 4 1 1 2 
0101 1 -<f--- 011 5 I-<f---ll 2 I-<f---I 3 
1011 5 101 1 1 11 3 1 1 4 
1111 3 111 3 1 11 5 1 1 5 
(3) El tiempo esperado T hasta parar usando esta regla de detención se distri-
buye como en la paradoja del cumpleaños, para K = 2k: ponemos dos cartas 
en la misma caja si tienen la misma etiqueta bkbk- 1 ... b2h E {O,1}k. Por 
tanto, hay K = 2k cajas, y la probabilidad de que una caja contenga más de 
una carta es 
Prob[T> k] = 1 - TI (1- 2ik ) , 
lo cual, como hemos visto, acota la distancia de variación 11 Bric*k - U 11 
--*k 
11 Bric - UII. O 
¿Cuántas veces tenemos que barajar? Para n grande son aproximadamente 
k = 2Iog2 (n) veces: poniendo k := 210g2 (cn) para algún e 2: 1 hallamos 
(usando técnicas del análisis) que P[T > k] R::i 1 - e~ R::i 2~2. 
165 
166 
k d(k) 
1 1.000 
2 1.000 
3 1.000 
4 1.000 
5 0.952 
6 0.614 
7 0.334 
8 0.167 
9 0.085 
10 0.043 
La distancia de variación después de k 
mezclas por imbricación, según [2] 
d(k) 
1 7 10 
¿ Suficentemente aleatorio? 
Barajando el mazo 
Por ejemplo, para n = 52 cartas, las cotas superiores dadas por el teorema 2 
son d(10) ~ 0.73, d(12) ~ 0.28, d(14) ~ 0.08 - con lo cual, k = 12 
tendría que ser "suficientemente aleatorio" para fines prácticos. Pero en la 
práctica no barajamos 12 veces - ni hace falta, como muestra un análisis más 
detallado (véase al margen). El análisis de las mezclas por imbricación es parte 
de un debate actual y muy vivo acerca del significado de "suficientemente . 
aleatorio". Diaconis [4] puede servir de guía de los últimos acontecimientos. 
¿Es importante este análisis? En efecto, lo es: aún después de tres buenas 
mezclas por imbricación de una baraja de 52 cartas, el mazo parece bastante 
aleatorio ... pero no lo es. Martín Gardner [5, capítulo 7] describe algunos 
impresionantes trucos de cartas basados en el orden escondido en tal mazo. 
[1] D. ALDOUS & P. DIACONIS: Shuffling cards and stopping times, Amer. Math. 
Monthly 93 (1986), 333-348. 
[2] D. BAYER & P. DIACONIS: Trailing the dovetail shuffle to its lair, Annals Applied 
Probability 2 (1992),294-313. 
[3] E. BEHRENDS: Introduction to Markov Chains, Vieweg, Braunschweig/ 
Wiesbaden 2000. 
[4] P. DIACONIS: Mathematical developments from the analysis oi riffle shuffling, 
in: "Groups, Combinatorics and Geometry. Durham 2001" (A. A. Ivanov, M. W. 
Liebeck and J. Saxl, eds.), World Scientific, Singapore 2003, pp. 73-97. 
[5] M. GARDNER: Mathematical Magic Show, Knopf, New York/Allen & Unwin, 
London 1977. 
[6] E. N. GILBERT: Theory oi Shuffling, Technical Memorandum, Bell Laboratories, 
Murray Hill NJ, 1955. 
Lo esencial de las matemáticas es demostrar teoremas - y por tanto, a ello se 
dedican los matemáticos: demuestran teoremas. Pero, a decir verdad, lo que 
realmente quieren demostrar, por lo menos una vez en su vida, es un lema: 
como el de Fatou en análisis, el lema de Gauss en la teoría de números o el 
lema de Bumside-Frobenius en combinatoria. 
Ahora, ¿qué convierte una afirmación matemática en un verdadero lema? En 
primer lugar, debería ser aplicable a una gran variedad de circunstancias, in-
cluso a problemas sin conexión aparente. En segundo lugar, la afirmación 
debería ser completamente obvia- una vez vista. Al lector hasta le podría 
dar una leve envidia: ¿por qué yo no he observado esto antes? Y por último, 
en un nivel estético, ¡tanto el lema como su demostración deberían ser bellos! 
Aquí veremos un ejemplo de razonamiento matemático de estas característi-
cas, un lema de recuento que apareció por primera vez en 1972, en un artículo 
de Bemt Lindstrbm. Aunque en ese entonces pasó desapercibido, en 1985 se 
convirtió de golpe en un clásico, cuando Ira Gessel y Gerard Viennot lo re-
descubrieron y demostraron en un artículo maravilloso cómo puede aplicarse 
a una gran diversidad de difíciles problemas de enumeración combinatoria. 
Partimos de la representación del determinante de una matriz mediante permu-
taciones. Sea M = (mij) una matriz n x n con elementos reales. Entonces 
det M = L sign (J" mlo-(l) m2o-(2) ... mnu(n) , (1) 
o-
donde (J" recorre todas las permutaciones de {1, 2, ... , n}, y la signatura de (J" 
es 1 ó -1, dependiendo de si (J" es el producto de un número par o impar de 
transposiciones. 
Ahora construimos un grafo, más exactamente un grafo bipartito dirigido con 
pesos. Este grafo tendrá vértices Al, ... ,An representando las filas de M, 
Y vértices El, ... ,En para las columnas. Para cada par (i, j) dibujamos una 
flecha de Ai a E j , Y le damos el peso mij (véase la figura). 
En términos de este grafo, la fórmula (1) tiene la siguiente interpretación: 
€II El primer miembro es el determinante de la matriz de caminos M, cuya 
entrada (i, j) es el peso del (único) camino dirigido de Ai a Ej. 
€II El segundo miembro es la suma ponderada (con signo) sobre todas las 
familias de caminos disjuntos en vértices desde A = {Al, ... , An} hasta 
B = {El, ... , En}. Tal familia Po- viene dada por los caminos 
m1l 
m nn 
168 
Un grafo dirigido acíclico 
retículas y determinantes 
y el peso de la familia de caminos Pu es el Prc)ducto de los pesos de los 
caminos individuales: 
Mediante esta interpretación, podemos escribir (1) como 
detM = L signCTw(Pu )' 
y ¿cuál es el resultado de Gessel y Viennot? Es la generalización natural 
de (1) de grafos bipartitos a grafos arbitrarios. Es exactamente este paso el 
que permite aplicar el lema en tantos contextos distintos - y su demostración 
es sumamente sencilla y elegante. 
Empecemos revisando los conceptos necesarios. El objeto básico es un grafo 
finito dirigido acíclico G = (V, E), lo cual quiere decir que en G no hay 
ciclos dirigidos. En particular, entre dos vértices cualesquiera A y B sólo 
hay un número finito de caminos dirigidos, donde también consideramos los 
caminos triviales A -+ A de longitud O. Cada arista e tiene el peso w(e). 
Si P es un camino dirigido de A a B, que escribiremos P : A -+ B, se define 
el peso de P como 
w(P) := w(e). 
eEP 
Si P es un camino de longitud O, se define que w(P) = 1. 
Denotamos ahora por A = {Al, ... , An} Y B = {Bl, ... , Bn} dos conjuntos 
de n vértices, donde A y B no son necesariamente disjuntos. Asociamos a A 
y B la matriz de caminos M = (mij) con 
L w(P). 
P:Ai--+Bj 
Una familia de caminos P de A a B está formado por una permutación CT junto 
con n caminos Pi : Ai -+ Bu(i), para i = 1, ... , n; además, escribiremos 
sign P = sign CT . El peso de P es el producto de los pesos de los caminos, 
n 
w(P) = rr w(Pi ), (2) 
i=l 
es decir, el producto de los pesos de todas las aristas de la familia de caminos. 
Finalmente, diremos que la familia de caminos P = (Pi, ... ,Pn ) es disjunta 
en vértices si, para cada par de caminos en P, sus conjuntos de vértices son 
disjuntos. 
Lema. Sea G = (V, E) un grafo finito dirigido acíclico y ponderado, y sean 
A = {Al, ... , An} y B = {B l , ... , Bn} dos conjuntos de n vértices y M la 
matriz de caminos de A a B. Entonces 
detM 
P familia de caminos 
disjuntos en vértices 
signP w(P). (3) 
um",u'~, retículas y determinantes 169 
_Demostración. Unsumando dedet(M) es sign(J mlo-(l)'" mno-(n), 
lo cual se puede escribir como 
Sumando sobre (J podemos deducir de (2) que 
det M = L sign P w(P), 
P 
donde P recorre todos las familias de caminos de A a E, sean disjuntos en 
vértices o no. Por tanto, para llegar a (3), sólo hace falta demostrar que 
L signP w(P) = O, (4) 
PEN 
donde N es el conjunto de todos las familias de carninos no disjuntos en vér-
tices, y ello lo lograremos mediante un argumento de singular belleza. Dare-
mos una involución 1T : N ----; N (sin puntos fijos) tal que para P y 1TP 
W(1TP) = w(P) y sign 1TP = -sign P . 
Claramente, esto implicará (4), y por tanto la fórmula (3) del lema. 
La involución 1T se define de manera muy natural. Sea P E N con caminos 
Pi :Ai ----; Bo-(i)' Por definición, algunos pares de caminos se intersecarán. 
@ Sea io el mínimo índice tal que Pio tiene un vértice en común con algún 
otro camino. 
@! Sea X el primero de tales vértices en el camino P io ' 
@! Sea jo el mínimo índice (jo> i o) tal que Pjo tiene el vértice X en común 
con Pio' 
Construimos la nueva familia 1TP = (Pi, . , . ,P~) de la manera siguiente: 
@! Sea P~ = Pk para todo k =1- io, jo. 
@ El nuevo camino Pio va de Aio a X pasando por P io ' Y a continuación 
sigue a Bo-(jo) a lo largo de P jo . De manera similar, Pjo va desde Ajo 
hasta X a lo largo de P jo y sigue hasta Bo-(io) a lo largo de Pio' 
Claramente 1T(1TP) = P, ya que el índice i o, el vértice X, y el índice jo son 
los mismos que antes. En otras palabras, al aplicar 1T dos veces volvemos a 
los caminos Pi de antes. Ahora, ya que 1TP y P usan exactamente las mis-
mas aristas, tenemos ciertamente que W(1TP) = w(P). Y por último, puesto 
que la nueva permutación (JI se obtiene componiendo (J con la transposición 
(io, jo), deducimos que sign 1TP = -sign P , y hemos terminado la demos-
tración. D 
Se puede usar el lema de Gessel-Viennot para deducir todas las propiedades 
básicas de los determinantes, simplemente estudiando los grafos apropiados. 
Consideremos a continuación un ejemplo especialmente llamativo, la fórmula 
de Binet-Cauchy, que proporciona una generalización muy útil de la regla del 
producto para determinantes. 
170 
Pil 
Pik 
1 
1 1 
1 2 1 
1 3 3 1 
1 4 6 4 1 
1 5 10 10 5 1 
1 6 15 20 15 6 
1 7 21 35 35 21 
a=3 
b=4 
1 
7 1 
nw"m,l<' retículas y determinantes 
Teorema. Sean r ::; s, P una matriz r x s y Q una matriz s x T, entonces 
det(PQ) = ~)detPz)(detQz), 
z 
donde Pz es la submatriz (r x r) de P cuyas columnas están indexadas por el 
conjunto Z, y Q z la submatriz (r x r) deQ cuyas filas están indexadas por Z. 
• Demostración. Como antes, haremos corresponder a la matriz P el grafo 
bipartito en A y B, Y de manera similar a Q el grafo bipartito en B y C. Con-
sideramos ahora el grafo concatenado de la figura de la izquierda. Podemos 
observar que la entrada mij de la matriz M de caminos desde A hasta C es 
precisamente mij = I: k Pik qkj ; por tanto, M = PQ. 
Las familias de caminos disjuntos en vértices desde A hasta C en el grafo 
concatenado se corresponden con pares de familias desde A hasta Z, y desde 
Z hasta C. Por tanto, el resultado se sigue de manera inmediata del lema, 
observando que sign (en) = (sign a") (sign T). O 
El lema de Gessel-Viennot da lugar a muchos resultados que relacionan los 
determinantes con propiedades enumerativas. La receta es siempre la misma: 
hay que interpretar a la matriz M como una matriz de caminos, e intentar 
calcular el segundo miembro de (3). Como ilustración, he aquí el problema 
original estudiado por Gessel y Viennot, que les llevó a su lema: 
Sean al < az < ... < a n y bt < b2 < ... < bn dos sucesiones 
de números naturales. Se pide calcular el determinante de la matriz 
M = (mij), donde mij es el coeficiente binomial (~i). 
J 
Dicho de otro modo, Gessel y Viennot consideraron los determinantes de todas 
las submatrices cuadradas del triángulo de Pascal, por ejemplo de la matriz 
(
(i) 
det (i) 
(~) 
@ 
(~) 
(~) 
(~) ) 
(!) 
(~) 
1 
4 
20 
~ ) , 
15 
definida por las entradas en negrita del triángulo de Pascal del margen.Como primer paso para resolver este problema recordaremos un resultado 
conocido que relaciona los coeficientes binomiales con los caminos en una 
retícula. Consideramos una retícula a x b como en el margen. Entonces, el 
número de caminos desde la esquina inferior izquierda hasta la esquina su-
perior derecha, donde los únicos pasos permitidos son hacia arriba (norte) y 
hacia la derecha (este), es (a!b). 
La demostración de este hecho es fácil: cada camino está formado por una 
sucesión arbitraria de b pasos hacia el "este" y a pasos hacia el "norte", y por 
tanto se puede representar por una sucesión de la forma NENEEEN, que está 
formado por a + b letras, de las cuales haya letras N y b letras E. El número 
de tales cadenas es el número de maneras de elegir a posiciones de letras N de 
un total de a + b posiciones, lo cual es (a!b) = (atb). 
-'u,w.","' .... retículas y determinantes 
Ahora consideramos la de la uv'.vvuu, en la cual está en el 
(O, -ai) Y Ej en el punto (b j , -bj ). 
El número de caminos de Ai hasta Bj en esta retícula que usan solamente 
pasos al norte y 'al este es, como hemos visto, (bj+(~~-bj)) = (~i). Dicho de Al 
J. J 
otra manera, la matriz de coeficientes binomiales M es exactamente la matriz 
de caminos de A a B en el grafo reticular dirigido en el cual todas las aristas 
tienen peso 1, y están dirigidas al norte o al este. Por tanto, podemos aplicar el 
lema de Gessel-Viennot para calcular det M. Una breve reflexión muestra que 
toda familia de caminos disjunto en vértices P de A a B está necesariamente 
compuesta de caminos Pi : Ai ---+ Ei para todo i. En consecuencia, la única 
permutación posible es la identidad, que tiene signatura 1. Hemos obtenido el 
bello resultado de que 
det ( (~;)) = # familias de caminos disjuntos en vértices de A a B. 
En particular, de esto se sigue el hecho no trivial que det M es siempre no 
negativo, ya que el segundo miembro de la igualdad cuenta algo. Además, 
el lema de Gessel-Viennot implica que det M = O si Y sólo si ai < bi para 
algún i. 
En n~estro ejemplo de antes tenemos 
~~ 
det ( 
(D G) m 
) familias de 3 (i) (i) (!) # caminos disjuntos 4 m m m en vértices en 
~3 
~4 
~ 
6 
,) 
Ai 
An 
~ ~ ~ 
~ lO lO 
"Caminos en retículas" 
171 
~ 
Bn 
~ ~ 
172 Lu:rrunu,,'. retículas y detenninantes 
[1] l. M. GESSEL & G. VIENNOT: Binomial determinants, paths, and hook length 
formulae, Advances in Math. 58 (1985), 300-321. 
[2] B. LINDSTRÓM: On the vector representation ofinduced matroids, Bulletin Lon-
don Math. Soco 5 (1973), 85-90. 
Una de las fórmulas más bellas de toda la combinatoria enumerativa es la del 
número de árboles etiquetados. Consideramos el conjunto N = {1, 2, ... ,n}. 
¿Cuántos árboles diferentes podemos construir usando estos vértices? Sea Tn 
su número. La enumeración "a mano" nos da T1 = 1, T2 = 1, T3 = 3 Y 
T4 = 16, Y mostramos estos árboles a continuación: 
1 
• 
1 2 
3 
1 212 
3 
1 2 
3 
1 2 1 2 1 2 
343 4 3 4 3 4 3 4 3 4 3 434 
1 2 1 2 1 212 1 2 1 2 1 2 
3 4 343 4 3 4 3 4 3 4 3 434 
Nótese que consideramos árboles etiquetados. Por tanto, aunque solamente 
hay un árbol con tres vértices en el sentido de isomorfismo de grafos, al marcar 
el vértice interior con 1, 2 ó 3 obtenemos tres árboles etiquetados distintos. 
Para n = 5 hay tres árboles no isomorfos (sin etiquetar): 
5 
Para el primer árbol es claro que hay 5 etiquetados diferentes, y para el se-
gundo y tercero hay %l = 60 etiquetados - con lo cual n = 125. Esto ya 
tendría que ser suficiente para conjeturar que Tn = nn-2, y este es precisa-
mente el resultado de Cayley. 
Teorema. Hay nn-2 árboles etiquetados diferentes con n vértices. 
Esta fórmula tan bella da lugar a demostraciones igualmente bellas, que usan 
gran variedad de técnicas algebraicas y combinatorias. Esbozaremos tres de 
ellas antes de presentar la demostración que hasta la fecha sigue siendo la más 
bonita de todas . 
• Primera demostración (Biyección). El método más clásico y directo es en-
contrar una biyección del conjunto de todos los árboles con n vértices con otro 
Arthur Cayley 
174 
Los cuatro árboles de T2 
7 4 9 
~ 1-------tl---~lO 
e-___ -----. 6 
2 
6 
La fórmula de Cayley para el número de árboles 
conjunto del cual se sabe que tiene nn-2 elementos. De manera pode-
mos pensar en el conjunto de todas las sucesiones ordenadas (al, ... , an -2) 
con 1 ::; ai ::; n. Por tanto, queremos codificar unívocamente a cada árbol 
T por una sucesión (al . .. ,an -2). Tal codificación fue hallada por Prüfer, y 
aparece en la mayoría de los libros sobre teoría de grafos. 
AquÍ queremos presentar otra demostracÍón por biyección, encontrada por Jo-
yal, que es menos conocida pero de igual elegancia y sencillez. Para ello, no 
consideramos solamente árboles t con vértices en N = {l, ... , n}, sino tales 
árboles junto con dos vértices distinguidos, el extremo izquierdo O y el ex-
tremo derecho O, que pueden coincidir. Sea In = {(t; O, O)} este nuevo 
conjunto. Entonces, claramente, IInI = n 2Tn . 
Nuestra meta es por tanto probar que IIn I = n n. Ahora, hay un conjunto cuyo 
tamaño sabemos que es nn, el conjunto NN de todas las aplicaciones de N 
en N. Podemos pues probar nuestra fórmula si encontramos una biyección 
entre NN y 4,. 
Sea 1 : N ------+ N cualquier aplicación. Dibujando flechas de i a l(i), pode-
mos representar 1 como un grafo dirigido a J. 
Por ejemplo, representamos la aplicación 
1 = ( ~ 2 5 
3 
5 
4 
9 
5 
1 
6 
2 
por el grafo dirigido que aparece al margen. 
7 
5 
8 
8 
9 
4 l~ ) 
Fijémonos en una componente conexa de OJ. Ya que hay exactamente una 
arista que sale de cada vértice, la componente contiene el mismo número de 
vértices y aristas, y por tanto exactamente un ciclo. Sea NI ~ N la unión de 
los conjuntos de vértices de dichos ciclos. Un momento de reflexión muestra 
que M es el único subconjunto maximal de N tal que la restricción de 1 a M 
es una biyección en M. Escribimos 11M = (l(a) ltb) l(z) ), 
de manera que los números a, b, ... , z en la primera fila aperecen en su orden 
natural. Esto proporciona una ordenación l(a), l(b), ... , l(z) del conjunto 
M = {a, b, ... ,z} de acuerdo con la segunda fila, en la cual el extremo iz-
quierdo es 1 (a) y el extremo derecho 1 (z). 
Podemos construir el árbol t correspondiente a la aplicacion 1 como sigue: 
Dibujamos 1 (a), ... , 1 (z) en este orden como camino desde 1 (a) hasta 1 (z), 
y rellenamos los demás vértices como indica OJ (suprimiendo las flechas). 
En nuestro ejemplo anterior obtenemos M = {l, 4, 5, 7, 8, 9}, 
y por tanto el árbol t del margen. 
5 
1 
7 8 
5 8 
Es inmediato cómo invertir esta correspondencia: Dado un árbol t, nos fijamos 
en el único camino P del extremo izquierdo al extremo derecho. Esto nos da 
el conjunto M y la aplicación 1 1M. Las demás correspondencias i -+ 1 (i) se 
determinan de acuerdo con los caminos únicos entre i y P. O 
Lafórmula de Cayley para el número de árboles 
Segunda demostración Podemos pensar en como el 
número de árboles generadores del grafo completo Kn. Ahora nos fijamos 
en un grafo arbitrario conexo y simple G en V = {1, 2, ... , n}, y denotamos 
por t(G) el número de árboles generadores; de esta manera, Tn = t(Kn ). El 
resultado siguiente es el célebre teorema matricial de los árboles de Kirchhoff 
(véase [1]). Consideramos la matriz de incidencia B = (bie ) de G, cuyas filas 
y columnas están etiquetadas, respectivamente, por V y E. Ponemos bie = 1 
Ó O según i E e o i ti- e. Nótese que IEI 2: n -1, ya que G es conexo. En cada 
columna reemplazamos de forma arbitraria alguno de los dos '1' por' -1' (en 
otras palabras, orientamos G de forma arbitraria), y llamamos C a la nueva 
matriz. Entonces M = C C T es una matriz simétrica (n x n) que contiene los 
grados dI, ... , dn en su diagonal principal. 
Proposición. Se cumple que t( G) = det M ii para todo i = 1, ... , n, donde 
M ii se obtiene de M suprimiendo la fila i-ésima y la columna i-ésima . 
• Demostración. La clave de la demostraciónes el teorema de Binet-Cauchy 
que demostramos en el capítulo anterior: Si P es una matriz (r x 8) y Q una 
matriz (8 x r), con r :::; 8, entonces det(PQ) es igual a la suma de los produc-
tos de los determinantes de todas las submatrices correspondientes de tamaño 
(r x r), donde "correspondiente" quiere decir que escogemos los mismos ín-
dices para las r columnas de P y las r filas de Q. 
Para M ii , esto quiere decir que 
det M ii = L N det N . det N T = L N (det N)2 , 
donde N recorre todas las submatrices (n - 1) x (n - 1) de C\ {fila i}. Las 
n - 1 columnas de N corresponden a un subgrafo de G con n - 1 aristas y n 
vértices, y nos queda por demostrar que 
det N = {±01 si estas aristas forman un árbol 
en otro caso. 
Supongamos que las n - 1 aristas no forman un árbol. Entonces existe una 
componente que no contiene a i. Ya que las filas que le corresponden suman O, 
sabemos que son linealmente dependientes, y por tanto det N = O. 
175 
Supongamos ahora que las columnas de N engendran un árbol. Entonces "Un método no estándar para contar 
existe un vértice JI =1 i de grado 1; sea el la arista incidente. Al suprimir árboles: Coloque un gato en cada ár-
jI, el obtenemos un árbol con n - 2 aristas. Otra vez, hay un vértice 12 =1 i bol, pasee su perro, y cuente cuántas ve-
de grado 1 con arista incidente e2. Continuamos de esta manera hasta que ces ladra." 
hayamos determinado jI, j2, ... ,jn-l Y el, e2, ... , en-l con ji E ei. Ahora 
permutamos filas y columnas para llevar j k a la fila k-ésima, y ek a la columna 
k-ésima. Puesto que por construcción jk ~ ee para k < R, vemos que la 
nueva matriz N' es triangular inferior, y que todos los elementos de la diagonal 
principal son ±l. Por tanto, det N = ±det N' = ±1, y hemos terminado. 
Para el caso especial G = Kn es claro que 
M
ii 
= ( n ~/ n ~\ 
-1 -1 
-1 ) -1 
. , 
n~1 
y un cálculo fácil muestra que det Mii = n n-2 . D 
176 Lafónnula de Cayley para el número de árboles 
Por ejemplo, T4,2 = 8 para A = {l, 2} 
1 2 3 k 
~ 
• 
• Tercera demostración Otro método clásico en combinatoria 
enumerativa es establecer una relación de recurrencia, que después se resuelve 
por inducción. La siguiente idea se debe esencialmente a Riordan y Rényi. 
Para encontrar la recursión apropiada, consideramos un problema más general 
(que ya aperece en el artículo de Cayley). Sea A un subconjunto arbitrario 
de los vértices con k elementos. Denotamos por Tn,k el número de bosques 
(etiquetados) con vértices {l, ... ,n} que están formados por k árboles, yen 
los cuales los vértices de A aparecen en árboles diferentes. Es claro que sólo 
importa el cardinal del conjunto A, no sus elementos. Nótese que Tn ,l = Tn . 
1 2 1 2 1 2 1 2 
KL:~II 
3 4 3 4 3 4 3 4 3 4 3 4 3 4 
Consideremos un tal bosque B con A = {1, 2, ... ,k}, y supongamos que 1 es 
adyacente con í vértices, tal y como se ilustra en el margen. Suprimiendo ell, 
los í vecinos, junto con 2, ... , k, dan lugar a un vértice cada uno en las com-
ponentes de un bosque de k - 1 + í árboles. Ya que podemos (re)construir B 
fijando primero í, después eligiendo los í vecinos de 1, y a continuación el 
bosque F\l, tenemos que· 
n-k ( ) 
Tn,k = L n ~ k Tn - 1,k-1+i 
.=0 
para todo n 2: k 2: 1, donde definimos To,o = 1 y Tn,o 
Nótese que To,o = 1 es necesario para asegurar Tn,n = 1. 
Proposición. Se verifica 
y por tanto, en particular, 
T k n-k-1 n,k = n 
(1) 
o para n > O. 
(2) 
• Demostración. Por (1), y usando inducción, encontramos que 
n-k ( k) 
Tn,k = 8 n ~ (k - 1 + í)(n - 1)n-1-k-i 
nn-k _ (n _ k) ~ (n ~ ~ ~ k}n _ 1)i-1 
nn-k _ (n _ k) n%r (n - ~ - k) (n _ l)i 
nn-k _ (n - k)nn-1-k = knn- 1- k. 
(í--;n-k-í) 
o 
La fórmula de Cayley para el número de árboles 
• Cuada demostraci6n Obtenemos la fórmula de 
y su generalización (2), a partir de una idea genial de Jim Pitman sin inducción 
o biyección - sólo contando astutamente de dos maneras. 
Un bosque con raíz con vértices en {1, ... ,n} es un bosque junto con una 
elección de raíz en cada árbol. Sea :Fn,k el conjunto de todos los bosques con 
raíz que están formados por k árboles con raíz. Por tanto, :Fn,l es el conjunto 
de todos los árboles con raíz. 
Nótese que l:Fn,ll = nTn , ya que en cada árbol hay n elecciones para la 
raíz. Ahora pensamos en Fn,k E :Fn,k como un grafo dirigido con todas las 
aristas "alejándose" de la raíz. Diremos que un bosque F contiene a otro 
bosque F' si F contiene a F' como grafo dirigido. Claramente, si F contiene 
a F' propiamente, entonces F tiene menos componentes que F'. La figura 
muestra dos bosques de este tipo, con las raÍCes en la parte de arriba. 
He aquí la idea crucial. Decimos que una sucesión F 1 , ... , F k de bosques una 
sucesión refinadora si Fi E :Fn,i y Fi contiene a Fi+l para todo i. 
Sea ahora Fk un bosque fijo en :Fn,k, y denotamos 
G por N(Fk) el número de árboles con raíz que contienen a Fk, y 
G por N* (Fk) el número de sucesiones refinadoras que acaban en Fk. 
Contamos N* (Fk ) de dos maneras distintas, primero empezando en un árbol, 
yen segundo lugar empezando en Fk. Supongamos que Fl E :Fn,l contiene 
a Fk. Ya que podemos borrar las k - 1 aristas de Fl \Fk en cualquier orden 
posible para obtener una sucesión refinadora de Fl a Fk, vemos que 
(3) 
Empecemos ahora por el otro lado. Para llegar a un Fk-l desde Fk, tenemos 
que añadir una arista dirigida desde cualquier vértice a hasta cualquiera de las 
k - 1 raíces de los árboles que no contienen a a (véase la figura a la derecha, 
donde pasamos de F3 a F2 añadiendo la arista 3~... ~7). Por tanto, tenemos 
n( k - 1) elecciones. De manera similar, para Fk-l podemos añadir una arista 
dirigida desde cualquier vértice b a cualquiera de las k - 2 raíces de los árboles 
que no contienen a b. Para ello tenemos n(k - 2) posibilidades de elección. 
Continuando de esta manera, llegamos a 
(4) 
y con ello obtenemos, usando (3), la relación tan inesperadamente sencilla 
para cualquier Fk E :Fn,k' 
Para k = n, el bosque Fn está formado de n vértices aislados. Por tanto, 
N(Fn) cuenta el número de todos los árboles con raíz, y hemos obtenido el 
resultado l:Fn,ll = nn-l, y por tanto la fórmula de Cayley. O 
Pero podemos sacar aún más partido de esta demostración. Del caso k = n de 
la fórmula (4) resulta que 
# { sucesiones refinadoras (F1 , F 2 , ... , F n) } (5) 
177 
2 
9 
F2 contiene a F3 
8 4 7 
2 1: 1 9 F3 10 
-]lo>-- _ 
8 ,/ 4 7 
/\l 1: 9 2 3 1 
F3 ----t F2 10 
178 Lafónnula de Cayley para el número de árboles 
Para Fk E J"n,b sea N** (Fk) el número de sucesiones refinadoras , ... , Fn 
cuyo término k-ésimo es Fk. Claramente este número es N* (Fk) multiplicado 
por el número de maneras de elegir (Fk+1 , ... ,Fn ). Pero este último número 
es (n - k)!, ya que podemos borrar las n-k aristas de Fk en cualquier orden. 
Por tanto, 
Puesto que este número no depende de la elección de F k , el resultado de la 
división de (5) entre (6) proporciona el número de bosques con raíz con k 
árboles: 
Ya que podemos elegir las k raíces de (~) maneras distintas, hemos vuelto a 
demostrar la fórmula Tn,k = knn-k-l sin necesidad de inducción. 
Acabaremos con una nota histórica. Carl W. Borchardt publicó un artículo en 
1860 anticipándose a Cayley, que publicaría su trabajo en 1889; este hecho 
fue reconocido por el propio Cayley. Un resultado equivalente apareció aún 
antes, en un trabajo de James J. Sylvester (1857), véase [2, capítulo 3]. La 
novedad en el artículo de Cayley fue el uso de la terminología de la teoría de 
grafos, y el teorema lleva su nombre desde entonces. 
[1] M. AIGNER: Combinatorial Theory, Springer-Verlag, Berlin Heidelberg New 
York 1979; Reprint 1997. 
[2] N. L. BIGGs, E. K. LLOYD & R. J. WILSON: Graph Theory 1736-1936, Cla-
rendon Press, Oxford 1976. 
[3] A. CAYLEY: A theorem on trees, Quart. J. Pure Appl. Math. 23 (1889), 376-378; 
Collected Mathematical Papers Vol. 13, Cambridge University Press 1897, 26-28. 
[4] A. J OYAL: Une théorie combinatoire des séries formelles, Advancesin Math. 42 
(1981),1-82. 
[5] J. PITMAN: Coalescent random forests, J. Combinatorial Theory, Ser. A 85 
(1999),165-193. 
[6] H. PRÜFER: Neuer Beweis eines Satzes über Permutationen, Archiv der Math. u. 
Physik (3) 27 (1918), 142-144. 
[7] A. RÉNYI: Some remarks on the theory oftrees. MTA Mat. Kut. Inst. Kozl. (Publ. 
math. Inst. Hungar. Acad. Sci.) 4 (1959), 73-85; Selected Papers Vol. 2, Akadé-
miai Kiadó, Budapest 1976, 363-374. 
[8] J. RIORDAN: Forests of labeled trees, J. Combinatorial Theory 5 (1968), 
90-103. 
Entre los objetos combinatorios más antiguos se encuentran los Cuadrados 
latinos, que aparentemente se estudian desde tiempos inmemoriales. Para ob-
tener un cuadrado latino, se han de rellenar las n 2 casillas de un cuadrado 
(n x n) con los niimeros 1,2, ... ,n de manera que cada número aparezca 
exactamente una vez en cada fila y cada columna. En otras palabras, cada una 
de las filas y columnas representan permutaciones del conjunto {1, ... ,n}. 
Nos referiremos a n como el orden del cuadrado latino. 
He aquí el problema que nos interesa discutir: Alguien comienza a rellenar 
las celdas con los números {1, 2, ... ,n}. En algún momento se detiene y nos 
pide continuar hasta obtener un cuadrado latino. ¿En qué condiciones será 
posible hacerlo? Para que no sea imposible, supondremos que al comenzar 
nuestra tarea cada elemento aparece a lo sumo una vez en cada fila y en cada 
columna. Demos un nombre a esta situación: Hablaremos de un cuadrado 
latino parcial de orden n si algunas celdas de un cuadrado (n x n) están 
rellenas con números del conjunto {1, ... , n}, de tal manera que cada número 
aparece como máximo una vez en cada fila y en cada columna. Hecho esto, 
nuestro problema es el siguiente: 
¿ En qué condiciones puede completarse un cuadrado latino parcial 
para obtener un cuadrado latino del mismo orden? 
Veamos unos cuantos ejemplos. Supongamos las n-1 primeras filas rellenas y 
la última vacía. En esta situación podemos completar la última fila fácilmente: 
Cada elemento aparece n 1 veces en el cuadrado latino parcial, y de aquí 
que esté ausente exactamente de una columna. Basta por tanto escribir cada 
elemento bajo dicha columna y habremos completado el cuadrado. 
En cambio, si sólo está rellena la primera fila, es fácil completar el cuadrado 
rotando los elementos cíclicamente en las filas siguientes. 
De este modo, mientras que en el primero de los ejemplos existe una única 
manera de completar el cuadrado, para el segundo existen muchas posibilida-
des. En general, cuantas menos celdas estén rellenas de partida, más libertad 
deberíamos tener a la hora de completar el cuadrado. 
Sin embargo, en el margen se muestra un ejemplo de cuadrado parcial en el 
que sólo aparecen rellenas n celdas y que no puede ser completado, puesto que 
no hay manera de rellenar la esquina superior derecha sin violar la condición 
impuesta a la fila o a la columna. 
Si el número de filas que aparecen rellenas en una malla (n x n) es 
menor que n, ¿puede siempre completarse para obtener un cuadrado 
latino? 
1 2 3 4 
2 1 4 3 
4 3 1 2 
3 4 2 1 
Un cuadrado latino de orden 4 
1 4 2 5 3 
4 2 5 3 1 
2 5 3 1 4 
5 3 1 4 2 
3 1 4 2 5 
Un cuadrado latino cíclico 
1 2 ... n-1 
n 
Un cuadrado latino parcial que no puede 
ser completado 
180 
1 3 2 
2 1 3 
3 2 1 
F: 1 1 1 2 2 2 3 3 3 
c: 1 23 1 23 1 23 
E: 1 3 2 2 1 3 3 2 1 
Si permutamos cíclicamente las líneas 
del ejemplo anterior, 
F ---> C ---> E ---> F, entonces 
obtenemos el cuadrado latino y la 
disposición siguientes: 
1 2 3 
3 1 2 
2 3 1 
F: 1 3 2 2 1 3 3 2 1 
C: 1 1 1 2 2 2 3 3 3 
E: 1 23 1 2 3 1 2 3 
Completando cuadrados latinos 
Esta pregunta fue por Trevor Evans in 1960, y la de que 
es posible se difundió rápidamente como la "conjetura de Evans." Por su-
puesto, uno trataría de demostrarlo por inducción, y así es como finalmente 
fue resuelto el problema por Bohdan Smetaniuk en 1981. Sin embargo, su 
trabajo ilustra cuánta sutileza puede llegar a precisarse en una demostración 
por inducción. Más aún, su prueba es constructiva, y permite completar explí-
citamente el cuadrado a partir de cualquier configuración parcial. 
Antes de comenzar con la demostración, exploraremos los cuadrados latinos 
en general con un poco de detalle. De manera alternativa, podemos referimos 
a un cuadrado latino utilizando una disposición de tamaño (3 x n2 ), que en 
adelante llamaremos disposición en lineas del cuadrado latino. El margen 
muestra un cuadrado latino de orden 3 y su disposición en líneas asociada, 
donde F, e y E denotan, respectivamente, filas, columnas y elementos. 
La condición de cuadrado latino es equivalente a decir que en dos líneas cua-
lesquiera de esta disposición aparecen todos los n 2 pares ordenados (y por 
tanto que cada par aparece exactamente una vez). Por tanto, podemos per-
mutar los símbolos de cada línea de manera arbitraria (lo cual corresponde 
a permutar filas, columnas o elementos) y obtener de nuevo un cuadrado la-
tino. Pero la condición nos dice más: los elementos no juegan ningún papel 
especial. Podemos permutar las líneas (como un todo), preservando las con-
diciones de la disposición en líneas, y por tanto del cuadrado latino. 
Llamamos conjugados a los cuadrados latinos conectados por tales permuta-
ciones. La siguiente observación será muy útil: A todo cuadrado latino parcial 
le corresponde una disposición parcial en líneas (cada par aparece a lo sumo 
una vez en dos líneas cualesquiera), y todo conjugado de un cuadrado latino 
parcial es, de nuevo, un cuadrado latino parcial. En particular, un cuadrado 
latino parcial puede completarse si y sólo si puede serlo cualquier conjugado 
(basta completar el conjugado e invertir la permutación de las tres líneas). 
Necesitamos dos resultados, debidos a Herbert J. Ryser ya Charles C. Lindner, 
y que eran conocidos con anterioridad al teorema de Smetaniuk. Si en un 
cuadrado latino las primeras r filas aparecen completas y el resto de las celdas 
están vacías, hablamos de un rectángulo latino de dimensión (r x n). 
Lema 1. Cualquier rectángulo latino de dimensiones (r x n), r < n, puede 
extenderse a un rectángulo latino (( r + 1) x n), y por tanto puede completarse 
para obtener un cuadrado latino . 
• Demostración.. Aplicamos el teorema de Hall (véase capítulo 23). Sea 
Aj el conjunto de números que no aparecen en la columna j. Para que una 
fila sea admisible como (r + l)-ésima ha de corresponder a un sistema de 
representantes distintos para la colección Al, ... , An. Para demostrar el lema, 
por tanto, hemos de verificar la condición de Hall (H). Cualquier conjunto Aj 
tiene tamaño n - r, y cada elemento está precisamente en n - r conjuntos Aj 
(ya que aparece r veces en el rectángulo). Cualesquiera m de los conjuntos Aj 
contienen en total m( n - r) elementos, y por tanto al menos m diferentes, lo 
cual es precisamente la condición (H). O 
Lema 2. Sea P un cuadrado latino parcial de orden n con, a lo sumo, n - 1 
casillas rellenas y como máximo ~ elementos distintos. Entonces P puede 
completarse para obtener un cuadrado latino de orden n. 
Completando cuadrados latinos 
• Demostración. En transfonnamos el en otro más 
conveniente. Según el principio de congujación que discutimos anteriormente, 
podemos reemplazar la condición "a lo sumo ~ elementos distintos" por la 
condición de que las entradas aparezcan en, a lo sumo, ~ filas, y suponer in-
cluso que estas filas son las superiores. Por tanto, supongamos que las filas 
que tienen sus celdas ocupadas son las celdas 1, 2, ... , r, con fi casillas re-
llenas en la fila i, siendo r ::::: ~ y L~=l fi ::::: n - 1. Pennutando las filas, 
podemos asumir que h 2': 12 2': '" 2': fr. A continuación completamos las 
filas 1, ... , r paso a paso hasta obtener un rectángulo de dimensiones (r x n), 
el cual puede completarse hasta obtener un cuadrado latino por el lema l. 
Supongamos ya rellenas las filas 1,2, ... ,f! - 1. En la fila f! hay fe casillas 
rellenas quepodemos suponer que son las inferiores. Esta situación se muestra 
en la figura del margen, ella que se han sombreado las casillas rellenas. 
Se consigue completar la fila f! mediante otra aplicación del teorema de Hall, 
aunque esta vez la aplicación es más sutil. Sea X el conjunto de elementos que 
no aparecen en la fila f!, por tanto IXI = n-fe. Para j = 1, ... , n - h, sea 
Aj el conjunto de aquellos elementos de X que no aparecen en la columna j 
(ni por encima ni por debajo de la fila f!). De aquí, para completar la fila f! 
debemos verificar la condición (H) para la colección Al, ... , An- fg' 
En primer lugar afinnamos que 
n-fe-f!+l > f!-1+fH1+···+fr· 
El caso f! = 1 es claro. En otro caso, de L~=l fi < n, h > 
1 < f! ::::: r se deduce que 
r 
n > ¿fi 2': (f!-1)fe-1+fe+···+fr' 
i=l 
(1) 
> fr y 
Ahora, o bien h-1 2': 2 (en cuyo caso se verifica (1)) o fe-1 = 1. En el último 
caso, (1) se reduce a n > 2(f! - 1) + r - f! + 1 = r + f! - 1, lo cual es cierto 
porque!! ::::: r ::::: ~. 
Tomemos ahora m conjuntos Aj, 1::::: m ::::: n- fe, y sea B su unión. Debemos 
demostrar que IBI 2': m. Consideremos el número e de casillas en las m 
columnas que corresponden a los Aj que contienen elementos de X. Existen 
a lo sumo (f! - l)m celdas de este tipo por encima de la fila f! y a lo sumo 
fH1 + ... + fr por debajo. De ahí que 
e ::::: (f!-1)m+fH1+"'+fr. 
Por otro lado, cada elemento x E X\B aparece en cada una de las m colum-
nas, y de aquí que 2': m(IXI - IBI), y por tanto (con IXI = n - h), 
IBI 2': IXI-~c 2': n-h-(f!-1)-~(fH1+.·.+fr)' 
Se sigue que IBI 2': m si 
n-h-(f!-1)-~(fH1+ ... +fr) > m-1, 
esto es, si 
m(n-fe-f!+2-m) > fH1+"'+fr. (2) 
La desigualdad (2) es cierta para m = 1 Y para m = n - h - f! + 1 por (l). 
181 
Una situación para n = 8, con f! = 3, 
fl = h = h = 2, f4 = 1. Las celdas 
más oscuras representan las que apare-
cían rellenas previamente; las más cla-
ras muestran las que han sido rellenadas 
en el proceso. 
182 
2 
5 
4 
" 
2 7 
• 
4 5 
4 
2 3 4 
5 6 1 
1 2 3 
6 4 5 
3 1 6 
4 5 2 
7 
4 
5 
• 
• 
5 
1 6 
4 2 
6 5 
2 3 
5 4 
3 1 
• 
• 
5 
3 
4 
1 
2 
6 
Completando cuadrados latinos 
Por tanto, la desigualdad es cierta para todo m entre 1 y n-iR - e + 1, ya que 
la mitad del primer miembro es una función cuadrática en m con coeficiente 
principal -1. El caso que falta es m > n-iR - e + 1. Puesto que cualquier 
elemento x de X está contenido en, a lo sumo, e - 1 + JC+l + ... + Jr filas, 
también puede aparecer en, a lo sumo, el mismo número de columnas. De 
nuevo por (1), deducimos que x está en algún conjunto Aj, de modo que en 
este caso B = X, IBI = n-iR .:::: m, y la demostración queda completa. O 
Por último, demostraremos el teorema de Smetaniuk. 
Teorema. Cualquier cuadrado latino parcial de orden n con a lo sumo n - 1 
casillas rellenas puede completarse a un cuadrado latino del mismo orden. 
• Demostración. Utilizamos inducción sobre n, siendo trivial el caso de base 
n ::; 2. Partimos pues de un cuadrado latino parcial de orden n .:::: 3 con a lo 
sumo n - 1 casillas rellenas. Utilizando la notación anterior, estas celdas 
están situadas en r ::; n - 1 filas diferentes que numeramos SI, . .. ,Sr> Y que 
contienen ah, ... ,ir > O casillas rellenas, donde ¿~=1 Ji ::; n - 1. 
Según el lema 2, podemos suponer que existen más de ~ elementos diferen-
tes. Por tanto, existe un elemento que aparece una sola vez; es más, después 
de permutar las filas (si es necesario), podemos suponer que el elemento n 
aparece una sola vez, y que esto ocurre en la fila SI. 
En el paso siguiente queremos permutar las filas y columnas del cuadrado la-
tino parcial de tal manera que, después de llevar a cabo las permutaciones, 
todas las casillas rellenas queden por debajo de la diagonal- excepto para la 
casilla con n, que acabará en ella. (La diagonal está formada por las casillas 
(k, k) con 1 ::; k ::; n.) Veamos cómo se puede conseguir esto. En primer 
lugar permutamos la fila SI hasta la posición h. Permutando las columnas 
movemos todas las casillas rellenas hacia la izquierda, de manera que n apa-
rezca como el último elemento de su fila sobre la diagonal. A continuación 
movemos la fila S2 hasta la posición 1 + h + 12, y las casillas rellenas tantas 
posiciones a la izquierda como sea posible. 
En general, movemos la fila Si hasta la posición 1 + h + 12 + ... + Ji, para 
1 < i ::; r, y las casillas rellenas tantas posiciones a la izquierda como sea 
posible. El dibujo de la izquierda muestra un ejemplo, con n = 7: las filas 
SI = 2, S2 = 3, S3 = 5 Y S4 = 7 con h = 12 = 2 Y h = J4 = 1 se mueven 
hasta las filas numeradas como 2, 5, 6 Y 7, Y las columnas se permutan "hacia 
la izquierda" de manera que, al final, todas las entradas excepto la 7 están 
situadas por debajo de la diagonal, que se ha señalado mediante "",". 
Para poder aplicar inducción, quitamos la entrada n de la diagonal e ignoramos 
la primera fila y la última columna (que no tienen ninguna casilla rellena). Por 
tanto, estamos frente a un cuadrado latino parcial de orden n - 1 que tiene a 
lo sumo n - 2 casillas rellenas, el cual puede completarse por inducción hasta 
obtener un cuadrado latino de orden n -1. Una de las muchas posibilidades de 
hacerlo en nuestro ejemplo se muestra en la figura del margen. Las entradas 
originales se han marcado en negrita. Éstas son ya entradas finales, al igual 
que los elementos en casillas sombreadas. Del resto de las entradas, algunas 
cambiarán a continuación para poder completar el cuadrado latino de orden n. 
En el paso siguiente queremos mover los elementos de la diagonal del cua-
drado hasta la última columna y reemplazarlos por entradas n. Sin embargo, 
Completando cuadrados latinos 
no hacerlo en ya que los elementos de la no tienen 
porqué ser distintos. Por tanto, procedemos con más cuidado y efectuamos, 
para k = 2,3, ... ,n - 1 (en este orden), la operación siguiente: 
Colocamos el valor n en la casilla (k, n). Esto conduce a un cuadrado latino 
parcial correcto. A continuación intercambiamos el valor Xk en la casilla 
diagonal (k, k) con el valor n en la casilla (k, n) de la última columna. 
Si el valor Xk no aparecía anteriormente en la última columna, entonces nues-
tro trabajo para el valor k ha concluido. Después de hacer esto, los elementos 
que aparecen en la columna k-ésima no se cambiarán más. 
En nuestro ejemplo, este método funciona sin problemas para k = 2, 3 Y 4, Y 
los elementos correspondientes en la diagonal se mueven a la última columna. 
Los siguientes diagramas muestran las operaciones correspondientes. 
.------- --------- ---
2 3" 
r-
4 1 6 5""-C>-7 2 7 4 1 JL 5 3 --- -- -- ---o 
5 6 1 4 2 3 5 6 1 4 2 3 7 
1 2 3 6 5 4 1 2 3 6 5 4 
6 4 5 2 3 1 6 4 5 2 3 1 
3 1 6 5 4 2 3 1 6 5 4 2 
4 5 2 3 1 6 4 5 2 3 1 6 
Ahora hemos de tratar el caso en que ya existe un elemento Xk en la última 
columna. En este caso procederemos de la manera siguiente: 
Si ya existe un elemento Xk en una casilla (j, n) con 2 :::; j < k, entonces 
intercambiamos en la fila j el elemento Xk de la n-ésima columna con el 
elemento x~ en la k-ésima columna. Si el elemento x~ también aparece en una 
casilla (jI, n), entonces: intercambiamos también en la fila j' los elementos de 
la columna n-ésima y k-ésima, y así sucesivamente. 
Si continuamos de esta manera no obtendremos nunca dos entradas iguales en 
una fila. Nuestro proceso de intercambio asegura que nunca coincidirán dos 
elementos iguales en una columna. Por tanto, sólo tenemos que verificar que 
el proceso de intercambio entre las columnas k-ésima y n-ésima no lleva a un 
bucle infinito. Esto puede verse a partir del siguiente grafo bipartito Gk : Sus 
vértices corresponden a las casillas (i, k) y (j, n) con 2 :::; i, j :::; k, cuyos 
elementos pueden intercambiarse. Existe una arista entre (i, k) y (j, n) si 
estas dos casillas están en la misma fila (esto es, para i = j), o si las casillas 
contienen el mismo elemento antes del intercambio (lo cual implicai i= j). 
En nuestro esbozo, las aristas para i = j aparecen punteadas, las otras no. 
Todos los vértices en G k tienen grado 1 ó 2. La casilla (k, n) corresponde a 
un vértice de grado l. Este vértice es el comienzo de un camino que lleva a la 
columna k sobre una arista horizontal, luego posiblemente de vuelta otra vez 
a la columna n sobre una arista inclinada, luego de vuelta horizontalmente 
hasta la columna k y así sucesivamente. El camino acaba en la columna k 
en un valor que no aparece en la columna n. Así pues, las operaciones de 
intercambio acabarán con un paso en el cual llevamos un elemento nuevo a la 
183 
2 7 4 1 6 5 3 
5 6 7 4 2 3 1 . - .. - ....... 
1 2 3 6? 5 4 7 
6 4 5 2 3 1 
3 1 6 5 4 2 
4 5 2 3 1 6 
k n 
x~ Xk J 
x" k x~ j' 
Xk n k 
184 
2 7 4 1 3 5 6 
5 6 7 4 2 3 1 
1 2 3 7 6 4 5 
6 4 5 2 7 1 Íl" .. 3 . .j; 
3 1 6 5 4 2 7 
4 5 2 3 1 6 
Completando cuadrados latinos 
última columna. Así tennina el con la colmlli1a k, y los elementos de 
las celdas (i, k) para i 2: 2 no variarán en adelante. 
En nuestro ejemplo, estos intercambios se dan para k = 5: El elemento X5 = 3 
ya aparece en la última columna, de modo que esa entrada ha de ser devuelta a 
la columna k = 5. Pero el elemento intercambiable x~ = 6 tampoco es nuevo, 
así que se intercambia con x~ = 5, Y esté sí es nuevo . 
. -------. 
2 7 4 1 6 5 3 2 7 4 1 3 5 6 
5 6 7 4 2 3 1 5 6 7 4 2 3 1 
.- -. 
1 2 3 7 5 4 6 1 2 3 7 6 4 5 
.-------. 
6 4 5 2 3 1 7 6 4 5 2 7 1 3 
3 1 6 5 4 2 3 1 6 5 4 2 
4 5 2 3 1 6 4 5 2 3 1 6 
Por último, el intercambio para k = 6 = n - 1 no es ningún problema, y 
después de esto el cuadrado latino se completa de manera única: 
7 3 1 6 4 2 4 
2 7 4 1 3 5 6 2 7 4 1 3 5 6 
5 6 7 4 2 3 1 5 6 7 4 2 3 1 
1 2 3 7 6 4 5 1 2 3 7 6 4 5 
6 4 5 2 7 1 3 6 4 5 2 7 1 3 
3 1 6 5 4 7 2 3 1 6 5 4 7 2 
4 5 2 3 1 6 4 5 2 3 1 6 7 
... y lo mismo ocurre en general: Colocamos un elemento n en la celda (n, n), 
y después de hacerlo la primera fila puede completarse con los elementos que 
faltan de las respectivas columnas (ver lema 1), terminándose así la demostra-
ción. Para completar de manera explícita el cuadrado latino parcial original de 
orden n, únicamente hemos de invertir las permutaciones de elementos, filas 
y columnas en los primeros dos pasos de la demostración. O 
[1] T. EVANS: Embedding incomplete Latin squares, Amer. Math. Monthly 67 
(1960),958-961. 
[2] C. C. LINDNER: On completing Latin rectangles, Canadian Math. Bulletin 13 
(1970),65-68. 
[3] H. J. RYSER: A combinatorial theorem with an application to Latin rectangles, 
Proc. Amer. Math. Soco 2 (1951), 550-552. 
[4] B. SMETANIUK: A new construction on Latín squares 1: A proof of the Evans 
conjecture, Ars Combinatoria 11 (1981), 155-172. 
El problema de los cuatro colores dio un impulso decisivo para que la teoría 
de grafos se desarrollara tal y como la conocemos hoy en día. En general, los 
problemas de coloreado están todavía entre los más interesantes para quienes 
se dedican a la teoría de grafos. Uno de estos problemas, sencillo en aparencia, 
fue planteado por Jeff Dinitz en 1978, y sin embargo se resistió a todos los 
intentos de demostración hasta que quince años después Fred Galvin dio con 
una solución sorprendentemente sencilla. 
Se consideran n2 celdas ordenadas en un cuadrado (n x n), y se es-
cribe (í, j) para la celda en lafila i y columna j. Supóngase que cada 
celda (í,j) tiene asignado un conjunto C(í,j) de n colores. 
siempre posible colorear la matriz completa eligiendo para cada 
celda (i, j) un color del conjunto C( i, j), de manera que los colores 
que aparecen en cada fila y columna sean distintos? 
Para comenzar, consideremos el caso en el que todos los conjuntos de colores 
C( i, j) son iguales, por ejemplo {l, 2, ... ,n}. Entonces el problema de Dinitz 
se reduce a rellenar el cuadrado (n x n) con los números 1, 2, ... , n de manera 
que en cada fila y columna no haya dos números iguales. En otras palabras, 
cualquier coloración corresponde a un cuadrado latino, tal y como se discutió 
en el capítulo anterior. Así pues, en este caso la respuesta al problema es "sí". 
Este caso era sencillo, de manera que vayamos al caso general, en el cual el 
conjunto C := Ui,j C(i, j) contiene más de n colores. La dificultad ahora de-
riva del hecho de que no todos los colores de C son válidos para cada celda. 
Por ejemplo, mientras que en el caso del cuadrado latino podemos elegir ar-
bitrariamente una permutación de colores para la primera fila, esto ya no es 
posible en el caso general. El caso de n = 2 ya ilustra esta dificultad. 
Supongamos dados los conjuntos de colores que se indican en la figura. Si 
elegimos los colores 1 y 2 para la primera fila, ya tenemos un problema, puesto 
que tendríamos que elegir el color 3 para ambas celdas en la segunda fila. 
Antes de abordar el problema de Dinitz, traduzcamos la situación al lenguaje 
de la teoría de grafos. Como es habitual, consideramos grafos G = (V, E) 
sin bucles ni aristas múltiples. Sea x( G) el número cromático del grafo, esto 
es, el menor número de colores que pueden asignarse a sus vértices de manera 
que vértices adyacentes reciban colores distintos. 
En otras palabras, colorear el grafo requiere una partición de V en clases (colo-
readas con el mismo color) de manera que no haya aristas entre vértices de una 
clase. Si llamamos independiente a un conjunto A <;;; V en una partición de 
este tipo, vemos que el número cromático es el menor número de conjuntos 
independientes que da lugar a una partición del conjunto de vértices V. 
{l, 2} {2, 3} 
{l, 3} {2, 3} 
J 
1 
C(i,j) 
~ 
+--
186 
El grafo S3 
{1,3} 
{1,2} 
{1,4} 
{3,4} 
{2,3} 
{2,4} 
El problema de Dinitz 
En 1976 Y tres años más tarde y estudiaron 
la siguiente variante, que nos conduce directamente al problema de Dinitz: 
Supóngase que en el grafo G = (V, E) tenemos asignado un conjunto C (v) 
de colores para cada vértice v. Una coloración por listas es una coloración 
e : V --+ UvEV C( v) donde c( v) E C( v) para cada v E V. La definición 
del número cromático por listas Xi! (G) debería estar ahora clara: es el menor 
número k de modo que para cualquier lista de conjuntos de colores C (v) con 
IC(v)1 = k para todo v E existe siempre una coloración por listas. Por 
supuesto, Xi! (G) :::: IVI (nunca se nos acaban los colores). Ya que cualquier 
coloración ordinmia es el caso especial de una coloración por listas cuando 
todos los conjuntos C (v) son iguales, obtenemos pm-a cualquier grafo G 
X(G) :::: Xi!(G). 
Volviendo al problema de Dinitz, considérese el grafo Sn, que tiene como 
conjunto de vértices las n 2 celdas de nuestra matriz (n x n), y dos celdas son 
adyacentes si y sólo si están en la misma fila o columna. 
Puesto que cualesquiera n celdas en una fila son adyacentes dos a dos, son 
necesarios al menos n colores. Más aún, cualquier coloración con n colores 
corresponde a un cuadrado latino en el que las celdas ocupadas por un mismo 
número de colores dan lugar a una clase de color. Como los cuadrados lati-
nos, tal y como hemos visto, existen, podemos inferir que X(Sn) = n, y el 
problema de Dinitz puede enunciarse de manera sucinta así: 
¿Xi!(Sn) = n? 
Uno podría pensar que tal vez se verifica X( G) = Xi! (G) para cualquier grafo, 
pero nada más lejos de la verdad. Considérese el grafo G = K 2,4. Su número 
cromático es 2, ya que podemos usar un color para los dos vértices de la iz-
quierda y un segundo color para los vértices de la derecha. Pero supongamos 
que nos dan los conjuntos de colores indicados en la figura. 
Para colorear los vértices de la izquierda tenemos las cuatro posibilidades 113, 
114, 213 Y 214, pero cualquiera de estos pares aparece como un conjunto de 
colores en la parte de la derecha, de modo que no es posible una coloración con 
lista. De aquí que Xc (G) ~ 3, Y el lector puede encontrar divertido comprobar 
que Xc (G) = 3 - ¡no hay necesidad de probar todas las combinaciones! 
Generalizando este ejemplo,no es difícil encontrar grafos G en los cuales 
X( G) = 2, pero Xc (G) es arbitrariamente grande. Así pues, el problema de la 
coloración por listas no es tan fácil como parece a primera vista_ 
Volvamos al problema de Dinitz_ Un paso importante hacia la solución fue 
dado por Jeanette Janssen en 1992, cuando demostró que Xc (Sn) :::: n + 1, Y 
Fred Galvin dio el golpe de gracia combinando ingeniosamente dos resultados 
que ya se conocían desde hacía mucho. Discutiremos a continuación ambos 
resultados y veremos que implican la igualdad Xc (Sn) = n. 
Nos hace falta un poco de notación. Si v es un vértice del grafo G, entonces 
denotamos por d ( v) el grado de v. En nuestro grafo cuadrado Sn cada vértice 
tiene grado 2n - 2, ya que hay otros n - 1 vértices en la misma fila y en la 
misma columna. 
Para un subconjunto A c:;: V denotamos por G A el sub grafo que tiene a A 
como conjunto de vértices y que contiene todas las aristas de G entre los vér-
El problema de Dinitz 187 
tices de A. Llamamos a G A el inducido por y decimos que H es 
un subgrafo inducido de G si H = G A para algún A. 
Nuestro primer resultado trata de grafos dirigidos e = (V, E), es decir, grafos 
en los que cada arista e tiene una orientacion. La notación e = (u, v) signi-
fica que existe un arco e, denotado también u --+ v, cuyos vértices inicial y 
final son, respectivamente, u y v. Tiene sentido por tanto hablar del grado 
de salida d+ ( v) y grado de entrada d~ ( v ), donde d+ ( v) cuenta el número 
de aristas con v como vértice inicial, y análogamente para d~ (v); aún más, 
d+(v) + d~(v) = d(v). Cuando escribimos G, nos referimos al grafo e sin 
las orientationes. 
El siguiente concepto surgió del análisis de juegos y tendrá un papel clave en 
la discusión que nos ocupa. 
Definición 1. Sea e = (V, E) un grafo dirigido. Un núcleo K C;;; V es un 
subconjunto de los vértices tal que 
(i) K es independiente en G, y 
(ii) para cada u ti- K existe un vértice v E K con una arista u --+ v. 
Observemos el ejemplo de la figura. El conjunto {b, e, f} constituye un nú-
cleo, pero el sub grafo inducido por {a, e, e} no tiene ningún núcleo, ya que 
las tres aristas constituyen un cíclo entre los vértices. 
Ahora ya estamos listos para enunciar el primer resultado. 
Lema 1. Sea e = (V, E) un grafo dirigido, y supongamos que para cada 
vértice v E V tenemos un conjunto de colores e (v) con más elementos que 
su grado de salida, le (v) I 2:: d+ (v) + 1. Si cada subgrafo inducido de e 
tiene un núcleo, entonces existe una coloración por listas de G con un color 
de e(v) para cada v. 
11 Demostración. Procederemos por inducción sobre IVI. Si IVI = 1 no hay 
nada que probar. Elegimos un color c E e = UvEV e(v) y un conjunto 
A(c) := {v E V: e E e(v)}. 
Por hipótesis, el sub grafo inducido G A( e) tiene un núcleo K (e). Ahora colo-
reamos todos los v E K (e) con el color e (esto es posible, ya que K (c) es 
independiente), y eliminamos K(c) de G y e de e. Sea G I el de G subgrafo 
inducido por V\K (e) con el (v) = e (v) \ e como la nueva lista de colores. 
Nótese que para cada v E A(e)\K(e), el grado exterior d+(v) se reduce al 
menos en 1 (por la condición (ii) de ser núcleo). Así que d+ (v) + 1 :::; I el (v) I 
se verifica aún en el. La misma condición también se verifica para los vértices 
que no pertenecen a A (e), ya que en este caso el conjunto de colores e ( v) no 
varía. El nuevo grafo GI contiene menos vértices que G, y el resultado se 
obtiene por inducción. O 
El método para resolver el problema de Dinitz resulta ahora obvio: Hemos de 
encontrar una orientación del grafo Sn con grados exteriores d+ ( v) :::; n - 1 
para todo v y que asegure la existencia de un núcleo para todos los sub grafos 
inducidos. Esto se logra mediante nuestro segundo resultado. 
a 
f 
d 
188 
x y 
Un grafo bipartito G = (X U Y, E) con 
un emparejamiento. 
Las aristas en negrita constituyen un 
emparejamiento estable. En cada lista 
de prioridades, la elección que conduce 
a un emparejamiento estable está im-
presa en negrita. 
El problema de 
De nuevo necesitamos algunos Recuérdese 9) que 
un grafo bipartito G = (X U Y, E) es un grafo con la siguiente propiedad: 
El conjunto de vértices V se puede dividir en dos partes, X e Y, tales que 
cada arista tiene un extremo en X y el otro en Y. En otras palabras, los grafos 
bipartitos son precisamente los que pueden colorearse con dos colores (uno 
para X y otro para Y). 
Ahora veamos otro concepto importante, el de los "emparejamientos esta-
bles", que tiene una sencilla interpretación. Un emparejamiento M en un 
grafo bipartito G = (X U Y, E) es un conjunto de aristas que no contiene dos 
aristas con extremos comunes. En el grafo del dibujo las aristas en negrita 
forman un emparejamiento. 
Supongamos que X es un conjunto de hombres e Y un conjunto de mujeres, e 
interpretemos uv E E como la posibilidad de que u y v se casen. Un empare-
jamiento sería entonces una boda multitudinaria en la que ninguna persona es 
bígama. Para nuestro propósito, necesitamos una versión más refinada (¿y más 
realista?) de los emparejamientos, que sugirieron David Gale y Lloyd S. Sha-
pley. Es evidente que en la vida real cada persona tiene sus preferencias, y 
esto es lo que hemos de tener en cuenta. En G = (X U Y, E) suponemos que 
para cada v E X U Y existe una valoración del conjunto N ( v) de vértices ad-
yacentes a v, N ( v) = {Zl > Z2 > ... > Zd( v)}. Así, Zl es la mejor elección 
para v, después Z2, Y así sucesivamente. 
Definición 2. Un emparejamiento M de G = (X U Y, E) se llama estable si 
se verifica la siguiente condición: Siempre que uv E E\M, u E X, v E Y 
entonces, o bien, uy E M con y> ven N(u), o bien xv E M con x> u en 
N ( v), o se verifican ambas. 
En nuestra interpretación, un conjunto de matrimonios es estable si nunca su-
cede que u y v no están casados pero u preferiría tener como pareja a v antes 
que a la suya propia (si es que tiene) y v preferiría a u en lugar de la suya (si 
es que tiene), lo cual crearía evidentemente una situción de inestabilidad. 
Antes de probar nuestro segundo resultado, observemos el ejemplo siguiente: 
{A >C} a A {e> d> a} 
{C >D > B} b B {b} 
{A >D} e C {a> b} 
{A} d D {e> b} 
En este ejemplo existe un único emparejamiento máximo M con cuatro aris-
tas, M = {aC, bB, eD, dA}, pero M no es estable (considérese eA). 
Lema 2. Siempre existe un emparejamiento estable . 
• Demostración. Consideremos el siguiente algoritmo. En el primer paso, 
todos los hombres u E X se declaran a su primera elección. Si una mujer 
recibe más de una proposición, elige a quien más le gusta y apunta su nombre, 
y si recibe una única, apunta el nombre de aquél pretendiente. El resto de 
los hombres son rechazados y pasan a formar parte de la reserva R. En el 
El problema de Dinitz 
paso, todos los hombres hacen su Las 
comparan las proposiciones (junto con la que ya tienen apuntada, si es que 
tienen alguna), eligen a su favorito y se lo apuntan. El resto son rechazados 
y forman el nuevo conjunto R. Ahora, los hombres de R se declaran a su 
siguiente elección, y así sucesivamente. Un hombre que se haya declarado a 
su última elección y sea rechazado deja de ser tenido en cuenta (incluso deja 
de fo.~mar parte de la reserva). Es evidente que en algún momento la reserva R 
queda vacía, y en este momento se detiene el algoritmo. 
¡mma!cum. Cuando el algoritmo se detiene, los hombres apuntados, 
junto con las mujeres correspondientes, forman un emparejamiento 
estable. 
Nótese en primer lugar que el orden en el cual una mujer concreta apunta a 
sus hombres está de acuerdo con sus preferencias, ya que en cada paso ella 
compara al nuevo pretendiente con su pareja actual y elige a su favorito. Por 
ello, si uv E E pero uv ti- M, entonces o bien u nunca se declara a v, (en 
cuyo caso él encontró una pareja mejor antes de cortejar a v, lo cual implica 
uy E M con y > ven N(u)), o u se declaró a v pero fue rechazado (lo cual 
implica xv E M con x > u en N (v)). Pero
El_Libro_de_las_Demostraciones_Martin_Aigne_Günter_M_Ziegler

UCE

Ferramentas de estudo

Conteúdos escolhidos para você

Iniciación al Estudio del Álgebra Carmen Sessa - Ronnie Tiburon

La matemática del siglo XX - Piergiorgio Odifreddi

12 Introduccion al algebra - Lewin, Renato(Author)

Cálculo I - Oncina

LG_3_17

Perguntas dessa disciplina

3) A interpolação polinomial é utilizada quando se deseja aproximar uma função a partir de valores tabelados, como dados experimentais em laboratórios

O ensino de frações nos anos iniciais do Ensino Fundamental é essencial para o desenvolvimento do pensamento matemático das crianças. Nesse período, o

No avançar dos anos, os estudantes têm de romper com várias formas de pensar para seguir aprendendo Matemática. Eles devem entender, por exemplo, que,

Conforme explica Freund e Simon (2000), é possível expressar uma relação entre grandezas conhecidas, ou dados observados, a partir de uma equação m...

Pergunta 1. A multiplicação de matrizes é fundamental em diversas áreas de conhecimento, pois permite a manipulação de dados complexos de forma eficie

Conteúdos escolhidos para você

Iniciación al Estudio del Álgebra Carmen Sessa - Ronnie Tiburon

La matemática del siglo XX - Piergiorgio Odifreddi

12 Introduccion al algebra - Lewin, Renato(Author)

Cálculo I - Oncina

LG_3_17

Perguntas dessa disciplina

3) A interpolação polinomial é utilizada quando se deseja aproximar uma função a partir de valores tabelados, como dados experimentais em laboratórios

O ensino de frações nos anos iniciais do Ensino Fundamental é essencial para o desenvolvimento do pensamento matemático das crianças. Nesse período, o

No avançar dos anos, os estudantes têm de romper com várias formas de pensar para seguir aprendendo Matemática. Eles devem entender, por exemplo, que,

Conforme explica Freund e Simon (2000), é possível expressar uma relação entre grandezas conhecidas, ou dados observados, a partir de uma equação m...

Pergunta 1. A multiplicação de matrizes é fundamental em diversas áreas de conhecimento, pois permite a manipulação de dados complexos de forma eficie

Mais conteúdos dessa disciplina