Cómo la vida hackeó su propio ADN para volverse compleja y dar origen a la célula eucariota
Hace 2.600 millones de años, un cambio radical en la gestión de la información genética abrió el camino hacia la vida tal como hoy la conocemos. Un equipo de científicos nos invita a un viaje apasionante desde las bacterias hasta los seres humanos de manos de las matemáticas.
Por Enrique Coperías
Puesta de un pulpo abejorro (Octopus hummelincki). Cortesía: Thomas Barlow & Connor Gibbons / Columbia University / Department of Neurobiology and Behavior / Nikon Small World Competition 2024
Hace unos 2.600 millones de años, la vida en la Tierra dio un salto gigantesco. Surgieron las primeras células eucariotas, organismos con núcleos definidos y estructuras internas complejas, muy distintas de las bacterias y arqueas que habían dominado el planeta hasta entonces.
Este evento, conocido por los biólogos como eucariogénesis, es considerado el mayor aumento de complejidad en la historia de la vida. Pero ¿cómo fue posible semejante transformación? Un equipo internacional de científicos de las universidades de Mainz, Valencia, Madrid y Zúrich ha ofrecido una respuesta innovadora: la aparición de las células eucariotas fue el resultado de una crisis evolutiva resuelta a través de una transición de fase algorítmica, similar a los cambios abruptos que ocurren en ciertos procesos físicos y computacionales.
Este descubrimiento, publicado recientemente en la prestigiosa revista PNAS, no solo explica un misterio que había desconcertado a los biólogos durante décadas, sino que también propone un nuevo marco para entender cómo la vida puede superar límites de complejidad biológica.
Un gran salto a la complejidad
Como explica Enrique Muro, de la Universidad Johannes Gutenberg de Mainz, «el nuevo estudio combina enfoques teóricos y observacionales para entender de forma cuantitativa cómo la arquitectura genética de la vida se transformó para permitir semejante incremento de complejidad».
Los investigadores, entre ellos Fernando Ballesteros, Bartolo Luque y Jordi Bascompte, analizaron de manera masiva los datos de 9.913 proteomas, esto es, el conjunto completo de proteínas que produce un organismo, célula o tejido en un momento determinado; y de 33.627 genomas a lo largo del árbol de la vida, desde organismos unicelulares hasta vertebrados.
Una de sus observaciones más relevantes fue que la longitud de los genes y de las proteínas sigue una distribución log-normal en casi todas las especies.
Una regla matemática sencilla pero poderosa
Recordemos que una distribución log-normal es un tipo de patrón estadístico que aparece cuando los datos, en lugar de distribuirse de manera simétrica como en una campana normal, están sesgados hacia valores pequeños pero que, si se aplica un logaritmo a esos datos, se ordenan en una curva simétrica similar a una campana de Gauss.
En el caso del estudio sobre genes y proteínas, esto significa que la mayoría de los genes y proteínas tienen tamaños relativamente pequeños, mientras que existen algunos casos mucho más largos, aunque sean mucho menos frecuentes.
Esta forma de distribución es característica de procesos de crecimiento multiplicativo: pequeñas variaciones se acumulan de manera proporcional al tamaño existente, una regla matemática sencilla pero poderosa.
Desde tiempos de LUCA
Siguiendo el principio de la navaja de Ockham, que dice que, ante varias explicaciones posibles, la más simple suele ser la correcta, los científicos modelaron el crecimiento de los genes como un proceso estocástico multiplicativo. Desde el último ancestro común universal, conocido como LUCA, comprobaron, tanto teórica como empíricamente, que la longitud media de los genes ha crecido de manera exponencial a lo largo del tiempo.
Además, descubrieron una ley de escala invariante en la evolución genética: la varianza en la longitud de los genes depende directamente de su longitud media, un patrón que se mantiene estable en todo el árbol de la vida.
«Conociendo simplemente la longitud media de los genes codificadores de proteínas en una especie, podemos deducir toda la distribución de longitud de genes en esa especie — dice resaltando el alto nivel predictivo del modelo Bartolo Luque, de la Universidad Politécnica de Madrid, en un comunicado de la Universidad Johannes Gutenberg de Maguncia.
Enrique Muro muestra en la pantalla de su ordenador una de las evidencias de la transición de fase utilizando el repositorio de trabajo del equipo de investigación en la plataforma de desarrollo colaborativo GitHub. Cortesía: Juan Mac Donagh
Desfase entre genes y proteínas
Pero el hallazgo más asombroso llegó cuando observaron cómo evolucionaban las longitudes medias de los genes y las proteínas a través de distintas especies. En los organismos más antiguos, como bacterias y arqueas, genes y proteínas crecían a la par: no había apenas secuencias no codificantes en los genes; esto es, secuencias de ADN no destinadas a la síntesis de proteínas.
Sin embargo, al alcanzar un tamaño crítico de unos 1.500 nucleótidos o letras genéticas la tendencia cambió radicalmente. Mientras los genes continuaban creciendo, las proteínas dejaron de hacerlo y se estabilizaron en un tamaño medio de unos quinientos aminoácidos.
Este umbral marca el punto de no retorno en la evolución: el nacimiento de las células eucariotas. A partir de entonces, los genes siguieron aumentando de tamaño, pero gracias a la inclusión de intrones —parte del ADN dentro de un gen que no interviene en la fabricación de proteínas— y otras secuencias no codificantes que aportaban nuevas funciones de regulación sin necesidad de producir proteínas más grandes.
Desarrollo de las distribuciones de longitud de genes codificadores de proteínas a lo largo del tiempo evolutivo. Cortesía: Fernando J. Ballesteros
Ante una transición algorítmica
El equipo utilizó conceptos de la física de materiales para describir este fenómeno como una transición de fase de segundo orden. Igual que en un imán que pierde su magnetismo a cierta temperatura crítica, la evolución experimentó un cambio estructural continuo pero abrupto. «Este fenómeno se corrobora en organismos como los protistas y los hongos primitivos», indica Fernando Ballesteros, de la Universidad de Valencia.
Pero la transición no fue solo física: también fue algorítmica. «En los primeros tiempos de la vida, aumentar el tamaño de las proteínas era computacionalmente sencillo —explicó el profesor Jordi Bascompte, de la Universidad de Zúrich. Y añade—: Sin embargo, a medida que las proteínas crecían, la búsqueda de nuevas combinaciones funcionales se volvía exponencialmente más difícil.
Es decir, a medida que aumentaba el tamaño, encontrar nuevas proteínas útiles se convertía en una tarea casi imposible, como buscar una aguja en un pajar inmenso.
Calentando la reproducción sexual
La solución a esta crisis fue ingeniosa: en lugar de seguir creciendo a base de proteínas cada vez más grandes, los genes empezaron a incorporar secuencias no codificantes, permitiendo modular y diversificar las funciones sin necesidad de alargar las proteínas. Así nacieron mecanismos como el splicing alternativo, en el que un mismo gen puede generar múltiples proteínas diferentes combinando de distintas formas sus fragmentos codificantes.
Este cambio no solo alivió la dificultad computacional, sino que abrió las puertas a una explosión de nuevas posibilidades evolutivas.
El equipo fechó este momento crítico en unos 2.600 millones de años atrás, en plena era de aparición de los eucariotas, y considera que fue este cambio estructural el que permitió no solo su surgimiento, sino también otras grandes transiciones posteriores: la multicelularidad, la aparición de la reproducción sexual y el desarrollo de comportamientos sociales complejos.
Entre Darwin y los algoritmos
Además del contenido evolutivo, el trabajo publicado en PNAS destaca por su enfoque interdisciplinario, ya que combina biología computacional, biología evolutiva y física teórica. «Este estudio puede interesar a investigadores de múltiples campos y servir como base para explorar nuevas líneas de investigación en energía, teoría de la información o biocomplejidad», subraya Muro.
Hasta ahora, la mayoría de las teorías sobre el origen de la complejidad biológica se habían centrado en mecanismos como la selección natural y la deriva genética. Estas explicaciones, aunque fundamentales, no daban cuenta de los límites estructurales que la vida enfrenta cuando crece en complejidad.
Este nuevo estudio, sin embargo, ofrece una perspectiva complementaria: la evolución no es solo una competencia darwiniana, sino también una exploración algorítmica de soluciones en un paisaje de posibilidades, limitada por leyes físicas y principios de computación.
Sección transversal del raquis (tallo) del helecho Pteridium aquilinum. Cortesía: Dr. David Maitland / Nikon Small World Competition 2024
El agujero negro de la biología
La investigación también aporta una clave para entender el llamado agujero negro de la biología, esa misteriosa falta de formas intermedias entre los procariotas y los eucariotas. Según este modelo, no hubo una evolución progresiva de complejidad intermedia, sino un salto abrupto tras una fase de crisis.
Esto explica por qué en los árboles filogenéticos no encontramos restos de transiciones graduales entre bacterias y eucariotas: el cambio fue demasiado rápido en términos evolutivos, como un cambio de fase en la materia.
Además, los investigadores resaltan que el enfoque de este trabajo posee un poder predictivo poco común en biología. Basándose solo en datos actuales de genomas y proteomas, lograron predecir no solo patrones históricos de evolución, sino también el momento aproximado en el que surgieron las eucariotas y la longitud crítica de los genes asociada a este gran salto.
Una solución creativa para avanzar
En definitiva, esta investigación no solo reescribe parte de la historia de la vida, sino que también ofrece una nueva manera de pensar sobre la evolución: como un proceso algorítmico que, enfrentado a límites insuperables, encontró una solución radical que permitió que la vida siguiera avanzando hacia formas cada vez más complejas.
Así, la vida no solo evolucionó en tamaño o complejidad por selección, sino que también aprendió a cambiar su propia forma de manejar la información, desbloqueando una nueva era biológica. Y gracias a esa revolución silenciosa, hoy estamos aquí para maravillarnos ante su asombrosa creatividad. ▪️
Información facilitada por la Universidad Johannes Gutenberg de Mainz
Fuente: Enrique M. Muroa, Fernando J. Ballesteros, Bartolo Luquec and Jordi Bascompte. The emergence of eukaryotes as an evolutionary algorithmic phase transition. PNAS (2025). DOI: https://doi.org/10.1073/pnas.2422968122