El origen de la teoría de conjuntos

Tabla de contenido

Posiblemente pienses que crear una teoría donde agrupas objetos con características similares y defines conceptos básicos de pertenencia e inclusión podría ser intuitivo a primera vista por su simplicidad y que a su vez siempre ha existido en la mente de las personas, pero el origen de la teoría de conjuntos es más complejo e impactante de lo que crees.

La teoría de conjuntos que estudiamos comúnmente en cursos básicos de matemática —con sus diagramas de Venn, operaciones de unión e intersección, el cómodo conjunto universal, entre otros— es extraordinariamente útil y necesaria. Con ella podemos definir relaciones, funciones, estructuras algebraicas y prácticamente todo el edificio de la matemática moderna.

Pero, ¿por qué se creó esta teoría en primer lugar? Georg Cantor no la inventó por capricho. Tres problemas concretos lo obligaron a desarrollarla:

Matematizar el infinito. Cantor necesitaba conjuntos infinitos bien definidos como entidades completas — no como meros procesos sin fin — para resolver problemas avanzados en análisis matemático, como la estructura de los conjuntos derivados de series trigonométricas.
Superar la paradoja de Galileo. Ya en el siglo XVII, Galileo había notado algo perturbador: los números naturales $ (1, 2, 3, 4, \ldots) $ y sus cuadrados perfectos $ (1, 4, 9, 16, \ldots) $ se pueden emparejar uno a uno, a pesar de que los cuadrados son «solo una parte» de los naturales. Esto contradecía la intuición de que «el todo es mayor que la parte». Cantor, en lugar de huir de esta rareza, la convirtió en definición: un conjunto es infinito precisamente cuando puede ponerse en correspondencia con un subconjunto propio de sí mismo.
Descubrir la jerarquía de infinitos. Cantor demostró que no todos los infinitos son iguales: existen diferentes «tamaños» de infinito (los números transfinitos). El conjunto de los números reales es estrictamente «más grande» que el de los naturales, un resultado que cambió para siempre nuestra comprensión del infinito.

Sin embargo, esta teoría tiene límites. La versión original — conocida como teoría elemental (o «ingenua») — contenía grietas lógicas que eventualmente obligaron a los matemáticos a reconstruir los cimientos desde cero para salvar su teoría (que tu y yo conocemos) desde ese entonces.

Este artículo cuenta esa historia completa: de dónde venía la idea de infinito, como le ayudó el infinito a construir su teoría, qué hizo Cantor para que su teoría fuera aceptada, las paradojas que la destruyeron, hasta dónde sirve hoy la versión elemental, y cómo los axiomas formales (ZFC, NBG) la repararon.

El infinito antes de Cantor: dos mil años de cautela

Antes de desarrollar los motivos de Cantor para crear esta teoría, es fundamental entender el contexto de como los matematicos veían el infinito desde ese entonces: si escudriñamos en el pasado, encontramos una tradición de más de dos milenios que trataba al infinito con profunda desconfianza. El infinito no siempre fue un objeto de estudio; durante siglos fue, a lo sumo, un proceso — y en el peor de los casos, un tabú.

El veto de Aristóteles (siglo IV a.C.)

La historia comienza con Aristóteles, quien introdujo una distinción que dominaría el pensamiento occidental durante más de 2000 años en esta resumida tabla:

	Infinito potencial	Infinito actual
Qué es	Un proceso que nunca termina	Una totalidad completa
Ejemplo	«Siempre puedo sumar 1 más»	«El conjunto de todos los naturales»
Existe como…	Posibilidad, tendencia	Objeto terminado
Estatus para Aristóteles	✔ Aceptable	✘ Rechazado

Aristóteles necesitaba esta distinción para responder a las paradojas de Zenón de Elea, como la famosa paradoja de Aquiles y la tortuga: si una distancia contiene infinitos puntos «ya existentes», ¿cómo es posible recorrerla en un tiempo finito?

La solución de Aristóteles fue ingeniosa: una línea es divisible infinitamente (potencialmente), pero nunca está «ya dividida» en infinitas partes porque es un acto imposible de realizar, es decir, siempre hay más segmentos de línea por dividir. El infinito existe como capacidad creciente, no como realidad.

Analogía: Es como decir «siempre puedo partir un pastel por la mitad» frente a «aquí tengo infinitas rebanadas de un pastel». Lo primero es un proceso; lo segundo, un objeto completo y aceptado — y Aristóteles solo aceptaba lo primero porque lo segundo era imposible e ilógico de realizar.

La Edad Media: el infinito como atributo divino

Durante la Edad Media, el infinito actual no desapareció del todo — se refugió en la teología. Filósofos escolásticos como Santo Tomás de Aquino sostenían que:

Solo Dios, siendo infinito, podía captar una totalidad infinita de forma simultánea.
La mente humana, siendo finita, solo podía comprender procesos que se extienden sin fin (infinito potencial).
Tratar el infinito como un objeto matemático terminado se consideraba casi una blasfemia — un intento de la razón finita por usurpar un atributo exclusivamente divino.

Esta postura mantuvo al infinito actual «bajo llave» durante siglos: existía, pero solo en la mente de Dios, fuera del alcance de la matemática.

El cálculo infinitesimal: «tendiendo a…» (siglos XVII–XVIII)

Cuando Newton y Leibniz desarrollaron el cálculo infinitesimal, usaron «infinitésimos» (cantidades infinitamente pequeñas) e «infinitos» (cantidades que crecen sin límite). Pero siempre bajo el paraguas del infinito potencial:

El método de exhausción (usado desde Arquímedes) que consiste en aproximar el área de un círculo usando polígonos incrementando el número de lados. Nunca se decía «el círculo es un polígono de infinitos lados», sino «al aumentar los lados, la diferencia tiende a cero».
Las variables «tienden a infinito» ($ x \to \infty $): crecen más allá de cualquier cantidad finita asignada, pero se mantienen dentro del terreno de lo potencial. Nunca «llegan».

Por tanto, el infinito era una dirección, no un destino al cual llegar.

El horror de Gauss (1831)

Incluso en los albores de la matemática moderna, los más grandes genios rechazaron el infinito actual. En 1831, Carl Friedrich Gauss — el «Príncipe de los Matemáticos» — escribió en una carta célebre:

«Protesto contra el uso de una cantidad infinita como algo consumado, lo cual nunca está permitido en matemáticas. El infinito es solo una forma de hablar… se trata de un límite al que ciertas razones se acercan tanto como se desee.» — C. F. Gauss, carta a Schumacher (1831)

Para Gauss, $ \infty $ era una abreviatura conveniente, no un número real ni un objeto legítimo.

El infinito como verbo

En resumen, durante más de dos milenios el consenso fue claro:

Época	Figura clave	Postura ante el infinito
Antigüedad	Aristóteles	Solo existe como proceso (potencial)
Edad Media	Tomás de Aquino	Atributo exclusivo de Dios
Siglos XVII–XVIII	Newton, Leibniz	Herramienta de cálculo, nunca una totalidad
Siglo XIX (antes de Cantor)	Gauss	Explícitamente prohibido como objeto terminado

Antes de Cantor, el infinito era un verbo (algo que está sucediendo). Después de Cantor, se convertiría también en un sustantivo (un objeto que se puede estudiar directamente).

Cantor y la revolución del infinito

Todo cambió con Georg Cantor (1845–1918). A finales del siglo XIX, Cantor se atrevió a hacer lo que Gauss había prohibido: tratar el infinito como un objeto completo y terminado.

El infinito actual: la apuesta de Cantor

Cantor propuso que podemos considerar la colección completa de los números naturales $ \{1, 2, 3, 4, \ldots\} $ como un objeto matemático acabado, y trabajar con él como si fuera una «cosa». Esto es el infinito actual.

Analogía: Considera un hotel imaginario con infinitas habitaciones (el famoso Hotel de Hilbert). El infinito potencial dice «siempre puedo construir otra habitación». El infinito actual dice «el hotel ya tiene todas las habitaciones, y asumir que todos están numericamente contados».

No todos los infinitos son iguales

El descubrimiento más asombroso de Cantor fue que hay infinitos más grandes que otros. Demostró que:

$ \mathbb{N} $ (los naturales) y $ \mathbb{Q} $ (los racionales) tienen la misma cardinalidad (número de elementos): $ \aleph_0 $. Ambos son infinitos numerables (se pueden poner en correspondencia uno a uno con los naturales).
$ \mathbb{R} $ (los reales) tiene una cardinalidad estrictamente mayor: $ 2^{\aleph_0} $. Es un infinito no numerable.

Haciendo un parentesis, ¿Cuál es la diferencia entre $ \infty $ y $ \aleph_0 $? Estos simbolos a pesar de representar al infinito, difieren en algunos detalles importantes:

$ \infty $ $ \aleph_0 $
¿Qué es? Un símbolo de dirección: «crecer sin límite» Un número cardinal concreto: el tamaño de $ \mathbb{N} $
¿Dónde se usa? En cálculo y análisis ($ \lim_{x \to \infty} $, $ \sum_{n=1}^{\infty} $) En teoría de conjuntos (cardinalidad)
¿Es un número? No — es una idea de «sin límite» Sí — es el primer número transfinito
Tipo de infinito Potencial («nunca llega») Actual («ya está completo»)

En resumen: el símbolo $ \infty $ nos dice que «esto sigue creciendo sin límite» y $ \aleph_0 $ nos dice que «esto ya tiene exactamente esta cantidad de elementos completos». Básicamente, Cantor inventó $ \aleph_0 $ precisamente para diferenciarse de $ \infty $, ya que $ \infty $ no era el símbolo adecuado para comparar los tamaños de conjuntos infinitos explicado en la tabla anterior.

	\( \infty \)	\( \aleph_0 \)
¿Qué es?	Un símbolo de dirección: «crecer sin límite»	Un número cardinal concreto: el tamaño de \( \mathbb{N} \)
¿Dónde se usa?	En cálculo y análisis (\( \lim_{x \to \infty} \), \( \sum_{n=1}^{\infty} \))	En teoría de conjuntos (cardinalidad)
¿Es un número?	No — es una idea de «sin límite»	Sí — es el primer número transfinito
Tipo de infinito	Potencial («nunca llega»)	Actual («ya está completo»)

Volviendo al tema. Para demostrar que los reales no era numerable, Cantor inventó su célebre argumento diagonal. Mediante una contradicción, muestra que cualquier lista numerable de números reales entre 0 y 1 omite al menos un número mientras cambiaba los dígitos a lo largo de la diagonal de la lista (metodo que explicaremos en detalle en proximas publicaciones). Esto probaba que el conjunto de los números reales es estrictamente mayor que el de los números naturales. La siguiente tabla ilustra de forma referencial (sin explicación) la idea central del argumento de Cantor:

Naturales	Conjunto (0-1)
1	0.26549874495010086…
2	0.08755531372264108…
3	0.40052195295295490…
4	0.72157637954770104…
5	0.84880125940120761…
6	0.92651926519702301…
7	0.21222469637354102…
8	0.17050000232864141…
$⋮$ ⋮	$⋮$ ⋮

Lista infinita de Cantor

Nota: El argumento diagonal de Cantor es un resultado profundo que será desarrollado con todo el rigor necesario en un tema posterior dedicado a los números reales y la aritmética de los cardinales transfinitos. Por ahora, basta con retener la conclusión: no todos los infinitos tienen el mismo tamaño.

La oposición: Kronecker contra Cantor

No todo el mundo aceptó estas ideas. Leopold Kronecker, uno de los matemáticos más influyentes de la época (y antiguo profesor de Cantor), se opuso ferozmente. Kronecker era constructivista: creía que solo debían aceptarse objetos matemáticos que pudieran construirse en un número finito de pasos — esencialmente, la postura de Gauss llevada al extremo.

Su frase célebre resume su postura:

«Dios hizo los números enteros; todo lo demás es obra del hombre.» — Leopold Kronecker

Kronecker calificó las ideas de Cantor de «locura matemática», bloqueó la publicación de sus artículos en el influyente Journal de Crelle y lo difamó públicamente, llamándolo «charlatán» y «corruptor de la juventud estudiosa». Esta persecución, sumada a la incomprensión general de la comunidad académica, tuvo un impacto devastador en la salud mental de Cantor, quien sufrió episodios de depresión durante el resto de su vida.

Incluso después de la muerte de Kronecker, la resistencia continuó. A principios del siglo XX, L.E.J. Brouwer lideró el movimiento intuicionista, que intentó devolver la matemática al infinito potencial: como no podemos «terminar de construir» un conjunto infinito en nuestra mente, este no puede considerarse «realizado».

A pesar de todo, la historia le dio la razón a Cantor. Pero esto no sucedió de la noche a la mañana.

De «charlatanería» a base de la matemática: cómo fue aceptada la teoría de Cantor

La transición de la teoría de conjuntos — de idea rechazada a fundamento universal — fue un proceso que tomó décadas y requirió aliados estratégicos, aplicaciones prácticas inesperadas y, finalmente, un relevo generacional.

El apoyo de los «pesos pesados»

Cantor tuvo la fortuna de contar con aliados influyentes en un momento en que las críticas amenazaban con sepultar su trabajo:

Richard Dedekind: Más que un colega, fue un colaborador intelectual. Dedekind publicó trabajos paralelos que ayudaron a definir con rigor qué es un «conjunto infinito», validando la intuición de Cantor con herramientas formales.
David Hilbert: El matemático más influyente de su generación, Hilbert elevó la teoría de Cantor a un nivel casi sagrado. Su defensa fue tanto política como técnica: incluyó los problemas de Cantor (como la Hipótesis del Continuo de Cantor que lo veremos más adelante) en su célebre lista de los 23 problemas para el siglo XX (1900), obligando a toda la comunidad matemática a trabajar en ellos. Su frase al respecto se volvió un lema:

«Nadie nos expulsará del paraíso que Cantor ha creado para nosotros.» — David Hilbert (1926)

De la metafísica a la utilidad práctica

El gran problema de Cantor era que hablar de infinitos «más grandes que otros» sonaba a teología, no a matemática. Pero la teoría se volvió indispensable por razones eminentemente prácticas:

Análisis real: Los matemáticos estaban atascados intentando comprender las series trigonométricas y los puntos de discontinuidad en funciones. La teoría de conjuntos permitió «clasificar» y «medir» estos conjuntos de puntos complejos de una manera que antes era imposible.
La medida de Lebesgue: Henri Lebesgue utilizó las ideas de Cantor para revolucionar el concepto de integral. Sin la teoría de conjuntos, gran parte del cálculo avanzado que se usa hoy en física e ingeniería no existiría.

La búsqueda de un lenguaje universal

A finales del siglo XIX, las matemáticas eran un archipiélago de islas separadas: la geometría por un lado, la aritmética por otro, el álgebra por un tercero.

Se descubrió que casi cualquier objeto matemático — un número, una línea, una función, una relación — podía definirse como un conjunto. Esto prometía una verdadera «Teoría del Todo» de las matemáticas, al aceptar los conjuntos de Cantor. Los matemáticos finalmente disponían de un lenguaje unificado donde todo encajaba.

La axiomatización: el control de daños

El rechazo inicial que no estaban de acuerdo con esta teoría, tenía una base legítima: la teoría original de Cantor desde ese entonces (la teoría «ingenua») permitía paradojas devastadoras, como la de Russell (que veremos más adelante). Para salvar la teoría sin renunciar a su poder:

Zermelo y Fraenkel establecieron reglas claras (axiomas) que prohibían la formación de conjuntos «demasiado grandes» o contradictorios.
Al ponerle límites precisos, la teoría dejó de ser inconsistente. Pasó de ser una idea incompleta a un sistema de reglas lógicas impecables: el llamado sistema ZFC, que es el estándar que usamos hasta hoy en día en teorías matemáticas mucha más avanzadas que la teoría elemental de conjuntos no logra resolver, pero hasta ahora útil en áreas más básicas de las matemáticas.

Veremos en detalle estos fallos y sus correcciones en las secciones siguientes.

El cambio generacional y la caída de Kronecker

La oposición a Cantor no fue solo intelectual — fue una guerra de poder e influencia académica.

El desenlace: Cuando Kronecker murió en 1891, el muro de contención desapareció. Los nuevos talentos — como Felix Klein y el propio Hilbert — no compartían los prejuicios filosóficos de la generación anterior. Vieron en el trabajo de Cantor una libertad creativa (lo que Cantor mismo llamó «la libertad de las matemáticas») que sus predecesores les negaban.
Con el tiempo, la teoría de conjuntos pasó de ser una curiosidad combatida a ser el cimiento invisible sobre el que se construye toda la matemática moderna.

Las paradojas de la teoría elemental

La teoría ingenua de Cantor descansaba en una regla aparentemente inofensiva llamada Principio de Comprensión Irrestricta: para cualquier propiedad $ P(x) $, se puede formar el conjunto de todos los objetos que la cumplen, $ \{x \mid P(x)\} $, sin restricción alguna. Este principio funciona perfectamente con propiedades «normales» (como «ser número primo»). Pero cuando la propiedad se refiere al propio conjunto, todo se derrumba — como muestran las tres paradojas siguientes.

La Paradoja de Russell (1901)

Bertrand Russell formuló la contradicción más famosa y devastadora de la teoría elemental. Su razonamiento es asombrosamente simple.

Dijo: ¿Puede un conjunto contenerse a sí mismo como elemento?

El conjunto de todos los libros de una biblioteca no es un libro, así que no se contiene a sí mismo.
Pero si definimos $ T = \{\text{todos los conjuntos que tienen más de 3 elementos}\} $, y $ T $ resulta tener más de 3 elementos, entonces $ T \in T $. ¡Se contiene a sí mismo!

Ahora Russell define un conjunto especial:

\[ R = \{x \mid x \notin x\} \]

Es decir, $ R $ es «el conjunto de todos los conjuntos que no se contienen a sí mismos».

Según el Principio de Comprensión, este conjunto debería existir. Pero al preguntarnos si $ R $ pertenece a sí mismo, llegamos a una contradicción:

Suposición	Consecuencia	Resultado
$ R \in R $	Entonces $ R $ cumple $ x \notin x $, así que $ R \notin R $	Contradicción
$ R \notin R $	Entonces $ R $ satisface la propiedad, así que $ R \in R $	Contradicción

Nos queda: $ R \in R \iff R \notin R $. Un absurdo lógico.

La Paradoja del Barbero (versión cotidiana de la misma idea):

En un pueblo hay un único barbero que afeita a todos los hombres que no se afeitan a sí mismos, y solamente a ellos.

Pregunta: ¿El barbero se afeita a sí mismo?

Si se afeita → no debería afeitarse (solo afeita a los que no se afeitan solos).

Si no se afeita → debería afeitarse (él afeita a todos los que no se afeitan solos).

Conclusión: Tal barbero no puede existir. Y de la misma manera, tal conjunto $ R $ no puede existir. Pero el Principio de Comprensión dice que debe existir. Eso significa que el principio es defectuoso.

La Paradoja de Burali-Forti (1897)

Incluso antes que Russell, el matemático italiano Cesare Burali-Forti detectó una anomalía con los números ordinales. Mientras que los cardinales miden «cuántos» elementos tiene un conjunto, los ordinales miden «en qué posición» se encuentra cada elemento dentro de una secuencia bien ordenada: 1°, 2°, 3°, …, y más allá del infinito: $ \omega $ (el primer ordinal infinito), $ \omega + 1 $, $ \omega + 2 $, y así sucesivamente.

Si formamos el «conjunto de todos los ordinales» $ \Omega $, este tendría su propio ordinal (llamémoslo $ \alpha $), que por definición sería mayor que cualquier ordinal en $ \Omega $. Pero $ \Omega $ contiene todos los ordinales, así que $ \alpha $ debería estar dentro de $ \Omega $. Esto obliga a que $ \alpha < \alpha $, lo cual es absurdo.

En lenguaje simple: Los ordinales forman una escalera infinita. Si tratas de ponerlos todos en una caja, la propia caja genera un escalón nuevo que debería haber estado dentro, pero no puede estarlo.

La Paradoja de Cantor (irónica, ¿no?)

El propio Cantor descubrió una paradoja con el teorema del conjunto potencia, el mismo teorema que le dio fama. Recordemos que el conjunto potencia $ \mathcal{P}(A) $ es el conjunto de todos los subconjuntos de $ A $. Por ejemplo, si $ A = \{1, 2\} $, entonces $ \mathcal{P}(A) = \{\emptyset, \{1\}, \{2\}, \{1,2\}\} $ — tiene 4 elementos, más que los 2 originales. El teorema generaliza esto:

Teorema de Cantor: Para cualquier conjunto $ A $: $ |\mathcal{P}(A)| > |A| $. Es decir, el conjunto potencia siempre es estrictamente más grande que el conjunto original.

Si existiera un «conjunto universal» $ U $ que contiene absolutamente todo, entonces $ \mathcal{P}(U) $ sería una colección de conjuntos, así que $ \mathcal{P}(U) \subset U $, lo que implicaría $ |\mathcal{P}(U)| \leq |U| $. Pero el teorema de Cantor dice que $ |\mathcal{P}(U)| > |U| $. Contradicción.

En lenguaje simple: No puede existir un «conjunto de todo» porque siempre se podría construir algo más grande usando el conjunto potencia. No hay un infinito supremo.

Resumen de las paradojas

Paradoja	Año	Mecanismo	Qué demuestra
Burali-Forti	1897	Conjunto de todos los ordinales	No puede haber un ordinal máximo
Cantor	~1899	Conjunto universal + potencia	No existe un «conjunto de todo»
Russell	1901	Autorreferencia + negación	El Principio de Comprensión es inconsistente

¿Hasta dónde funciona la teoría elemental?

A pesar de estas fallas, la teoría elemental sigue siendo perfectamente válida en la gran mayoría de las aplicaciones. ¿Cuándo podemos usarla con confianza y cuándo no?

Campo	Nivel de riesgo	¿Basta la teoría elemental?
Educación básica y media	Nulo	✔ Totalmente suficiente
Ingeniería y computación	Bajo	✔ Modelos finitos y acotados
Análisis real y probabilidad	Medio	✔ Con convenciones implícitas
Lógica matemática	Muy alto	✘ Requiere axiomas formales (ZFC)
Teoría de categorías	Crítico	✘ Requiere clases o universos

Regla práctica: Si trabajas con subconjuntos de un universo fijo y bien definido (como $ \mathbb{R} $, o los alumnos de una escuela, o los bits de un programa), la teoría elemental es segura. Los problemas solo aparecen cuando intentas hablar del «conjunto de todos los conjuntos» o de colecciones autorreferenciales.

Lo que la teoría elemental no puede resolver

Más allá de las paradojas clásicas, hay problemas contemporáneos que muestran los límites de la teoría elemental:

La Hipótesis del Continuo

¿Qué es la cardinalidad?

Antes de enunciar la hipótesis, necesitamos una idea clave: la cardinalidad de un conjunto es, informalmente, su «tamaño» — la cantidad de elementos que contiene. Para conjuntos finitos es sencillo: $ \{a, b, c\} $ tiene cardinalidad 3. Pero para conjuntos infinitos, las cosas se ponen extrañas.

La intuición nos dice que un conjunto «más amplio» debería ser «más grande». Sin embargo, Cantor demostró que esta intuición es profundamente engañosa con los infinitos:

Conjunto	Intuición ingenua	Cardinalidad real
$ \mathbb{N} = \{1, 2, 3, 4, \ldots\} $	La referencia base	$ \aleph_0 $
$ \mathbb{Z} = \{\ldots, -2, -1, 0, 1, 2, \ldots\} $	«Debería ser el doble» (incluye negativos)	$ \aleph_0 $ — la misma
$ \mathbb{Q} $ (los racionales)	«Debería ser mucho mayor» (hay infinitos entre 0 y 1)	$ \aleph_0 $ — la misma
$ \mathbb{R} $ (los reales)	«Obvio que es más grande»	$ 2^{\aleph_0} $ — estrictamente mayor

Es contraintuitivo: entre 0 y 1 hay infinitos números racionales ($ 1/2, 1/3, 2/5, 7/11, \ldots $), lo que hace parecer que $ \mathbb{Q} $ es «enormemente mayor» que $ \mathbb{N} $. Sin embargo, Cantor demostró que los racionales se pueden enumerar — es decir, poner en correspondencia uno a uno con los naturales — usando una ingeniosa técnica de recorrido en zigzag que lo veremos en próximas publicaciones. Lo mismo ocurre con los enteros $ \mathbb{Z} $: aunque incluyen los negativos, también son numerables.

Lección fundamental: El «tamaño» de un conjunto infinito no se mide por cuán «denso» o «extenso» parece, sino por si se puede establecer una correspondencia biunívoca con los naturales. Si se puede, tiene cardinalidad $ \aleph_0 $ (es numerable). Si no se puede — como ocurre con $ \mathbb{R} $ — entonces es estrictamente mayor.

La conjetura de Cantor

Con este contexto, la Hipótesis del Continuo se formula así: Cantor conjeturó que no existe ningún cardinal entre $ \aleph_0 $ (los naturales) y $ 2^{\aleph_0} $ (los reales). Es decir: el «siguiente» infinito después de los numerables sería directamente el de los reales, sin nada en medio.

Esta pregunta resultó ser indecidible: no se puede demostrar ni refutar con los axiomas estándar de la matemática.

Kurt Gödel (1938): Demostró que la Hipótesis del Continuo no se puede refutar en ZFC.
Paul Cohen (1963): Demostró que tampoco se puede probar.

Analogía: Los axiomas de ZFC son como las reglas del ajedrez. La Hipótesis del Continuo es una posición en el tablero donde las reglas no permiten determinar si ganas o pierdes. Puedes agregar una regla nueva que la declare verdadera, o una que la declare falsa, y el juego sigue siendo coherente en ambos casos.

Esto revela que la teoría de conjuntos, incluso en su versión axiomática, no es un sistema completo: hay verdades sobre el infinito que están más allá de su alcance.

La Teoría de Categorías y las colecciones «demasiado grandes»

Existe una rama avanzada de la matemática — la teoría de categorías — que necesita incluir ciertas colecciones como «todos los conjuntos» o «todos los grupos». Pero como acabamos de ver, colecciones de ese tamaño recrean exactamente las paradojas de Cantor y Russell. Esto obligó a desarrollar extensiones de ZFC capaces de manejar estas colecciones «gigantes» sin contradicciones. Veremos la principal de estas soluciones — el sistema NBG — en proximas secciones.

La solución: teorías formales de conjuntos

Zermelo-Fraenkel con Elección (ZFC)

Para eliminar las paradojas, los matemáticos reemplazaron el Principio de Comprensión Irrestricta por un sistema de axiomas cuidadosamente diseñados. El sistema dominante hoy es ZFC (Zermelo-Fraenkel con el Axioma de Elección), compuesto por 9 axiomas. Cada uno cumple un rol específico:

Los 9 axiomas de ZFC

Grupo 1 — Las reglas fundamentales (qué es un conjunto y cómo se comparan):

#	Axioma	Qué dice (intuitivamente)	Qué problema resuelve
1	Extensionalidad	Dos conjuntos son iguales si y solo si tienen exactamente los mismos elementos.	Define cuándo dos conjuntos son «el mismo». Sin esto, no habría forma de comparar conjuntos.
2	Conjunto vacío	Existe al menos un conjunto: el conjunto vacío $ \emptyset $.	Garantiza que la teoría no habla sobre la nada — hay un punto de partida.
3	Regularidad (Fundamento)	Todo conjunto no vacío contiene un elemento que no comparte miembros con él.	Prohíbe la autorreferencia: implica que $ x \notin x $ para todo conjunto, eliminando la raíz de la Paradoja de Russell.

Grupo 2 — Las herramientas de construcción (cómo fabricar conjuntos nuevos a partir de los existentes):

#	Axioma	Qué dice (intuitivamente)	Qué problema resuelve
4	Par	Dados dos conjuntos $ a $ y $ b $, existe el conjunto $ \{a, b\} $.	Permite construir pares. Sin esto, no podríamos agrupar dos objetos.
5	Unión	Dado un conjunto de conjuntos, existe un conjunto que «aplana» todo en una sola colección.	Permite fusionar colecciones: $ \bigcup \{\{1,2\}, \{3\}\} = \{1,2,3\} $.
6	Separación (Especificación)	Dado un conjunto $ A $ y una propiedad $ P $, existe $ \{x \in A \mid P(x)\} $.	Reemplaza la Comprensión Irrestricta. Solo crea subconjuntos de conjuntos ya existentes, impidiendo conjuntos «desde la nada».
7	Conjunto potencia	Para cualquier conjunto $ A $, existe $ \mathcal{P}(A) $ (el conjunto de todos sus subconjuntos).	Permite «subir de nivel» en tamaño. Garantiza la existencia de infinitos más grandes.

Grupo 3 — Las herramientas de potencia (para manejar el infinito y las elecciones):

#	Axioma	Qué dice (intuitivamente)	Qué problema resuelve
8	Infinito	Existe al menos un conjunto infinito (esencialmente, $ \mathbb{N} $).	Sin este axioma, todos los conjuntos serían finitos. Garantiza que el infinito existe como objeto.
9	Elección	Dada una familia de conjuntos no vacíos, siempre se puede «elegir» un elemento de cada uno simultáneamente.	Permite tomar decisiones infinitas. Es esencial para demostrar muchos teoremas del análisis, el álgebra y la topología.

Nota: Algunos autores cuentan también el Axioma de Reemplazo (la imagen de un conjunto bajo una función es también un conjunto) como parte de ZFC, elevando el conteo a 10. Este axioma fue añadido por Fraenkel y es el que permite construir la jerarquía completa de ordinales e infinitos transfinitos que Cantor imaginó.

La corrección clave: Comprensión Irrestricta → Separación

La diferencia esencial entre la teoría ingenua y ZFC se concentra en un solo cambio:

	Comprensión Irrestricta (Cantor)	Axioma de Separación (Zermelo)
Fórmula	$ B = \{x \mid P(x)\} $	$ B = \{x \in A \mid P(x)\} $
Requisito	Ninguno — cualquier propiedad crea un conjunto	Requiere un conjunto previo $ A $ del cual «separar»
Resultado	Puede crear conjuntos «desde la nada»	Solo crea subconjuntos de conjuntos existentes
Seguridad	✘ Inconsistente (paradojas)	✔ Consistente

¿Por qué esto arregla la Paradoja de Russell?

Con la separación, $ R = \{x \in A \mid x \notin x\} $ solo dice que ciertos elementos de $ A $ no se contienen a sí mismos. Esto no produce ninguna contradicción — simplemente prueba que $ R \notin A $, es decir, que $ R $ no pertenece al conjunto del que se extrajo. Ningún absurdo, solo un resultado sobre la relación entre $ R $ y $ A $.

Complementariamente, el Axioma de Regularidad prohíbe directamente que un conjunto se contenga a sí mismo:

\[ \forall x \neq \emptyset, \exists y \in x : y \cap x = \emptyset \]

Esto implica que $ x \notin x $ para todo conjunto $ x $, eliminando de raíz la autorreferencia que alimentaba las paradojas.

En resumen: La teoría ingenua tenía una sola regla todopoderosa (la Comprensión) que resultó ser contradictoria. ZFC la reemplaza con 9 reglas especializadas que, juntas, permiten construir toda la matemática sin caer en paradojas — cada axioma hace exactamente lo necesario, ni más ni menos.

El problema de la teoría de categorías y la solución Von Neumann-Bernays-Gödel (NBG)

Antes, ¿Qué es la Teoría de Categorías?

Antes de explicar NBG, conviene entender por qué se necesita. La teoría de categorías es una rama de la matemática que estudia las estructuras matemáticas no por lo que contienen, sino por cómo se relacionan entre sí. En lugar de mirar los elementos individuales de un grupo, un espacio o un conjunto, la teoría de categorías «hace zoom hacia afuera» y observa las transformaciones (llamadas morfismos) entre todas las estructuras de un mismo tipo.

Analogía: Si la teoría de conjuntos es un microscopio (examina los elementos dentro de cada conjunto), la teoría de categorías es un mapa satelital (ve cómo los conjuntos, los grupos, los espacios y demás se conectan entre sí a gran escala).

El problema es que, para hacer esto, la teoría de categorías necesita hablar de cosas como «la categoría de todos los conjuntos» o «la categoría de todos los grupos» — colecciones tan vastas que ZFC las prohíbe (porque serían «conjuntos de todos los conjuntos», recreando las paradojas). Aquí es donde entra NBG.

La solución: conjuntos vs. clases propias

El sistema NBG introduce una distinción elegante entre dos niveles de colecciones:

	Conjuntos	Clases propias
Tamaño	«Pequeños»	«Demasiado grandes»
¿Puede ser elemento de otra colección?	Sí	No
Ejemplos	$ \mathbb{N}, \mathbb{R}, \{1,2,3\} $	La clase de todos los conjuntos, la clase de todos los ordinales

Esta distinción resuelve las paradojas de forma elegante: la colección de todos los conjuntos existe como clase propia, pero al no poder ser elemento de nada, no puede aplicarse a sí misma — cortando la autorreferencia que alimenta las paradojas.

Conclusión

La teoría de conjuntos elemental que estudiamos en clase es como un automóvil confiable: nos lleva a todas partes en la vida cotidiana. Pero si intentamos llevarlo a una carrera de Fórmula 1 (lógica avanzada, categorías, infinitos de infinitos), necesitamos algo más robusto.

Las paradojas de Russell, Burali-Forti y Cantor no destruyeron la teoría de conjuntos — la mejoraron. El resultado fueron sistemas axiomáticos como ZFC y NBG, que:

Son robustos: Eliminan las paradojas restringiendo qué colecciones pueden ser conjuntos.
Son compactos: Reducen toda la complejidad de la matemática a un puñado de axiomas fundamentales.
Son honestos: Reconocen sus propios límites (como la indecidibilidad de la Hipótesis del Continuo).

Para el estudiante de matemática básica, la lección más importante es esta: la teoría que usamos en clase es correcta dentro de su dominio. Las paradojas aparecen solo cuando intentamos formar conjuntos «demasiado ambiciosos» — como el conjunto de todos los conjuntos o el conjunto de todos los ordinales. Mientras trabajemos dentro de un universo bien definido y evitemos la autorreferencia, el terreno es firme y como recordatorio: