AlphaGenome, la IA que descifra el lenguaje oculto del ADN
Google DeepMind presenta AlphaGenome, un nuevo modelo de inteligencia artificial que puede predecir en apenas un segundo si una mutación causará una enfermedad
La inteligencia artificial encuentra 800 objetos cósmicos nunca vistos en el archivo del Hubble
Comprender cómo funciona el genoma humano sigue siendo uno de los mayores retos de la biología moderna. Aunque el ADN contiene las instrucciones básicas de la vida, la mayoría de sus mecanismos internos -especialmente aquellos que regulan cuándo y cómo se activan los genes- permanecen en gran parte desconocidos.
Para arrojar luz sobre ese lenguaje oculto del ADN, Google DeepMind ha presentado AlphaGenome, un nuevo modelo de inteligencia artificial que puede predecir en apenas un segundo si una variante genética aumentará o disminuirá la expresión de un gen, o si alterará procesos celulares fundamentales.
Los resultados de esta investigación, publicados en Nature -que le dedica la portada de su último número-, describen una herramienta capaz de anticipar con una precisión sin precedentes cómo pequeñas variaciones en la secuencia genética pueden modificar el funcionamiento de la célula.
El avance es notable porque se centra en las regiones no codificantes del genoma, aquellas que no fabrican proteínas pero que actúan como interruptores reguladores, y donde se concentra más del 98% de la variación genética humana.
Más allá de los genes que fabrican proteínas
Durante décadas, la investigación genética se ha centrado principalmente en los genes que codifican proteínas, una pequeña fracción del ADN que apenas supera el 2% del genoma total.
Sin embargo, hoy se sabe que la mayor parte del material genético actúa como un complejo sistema de control que decide qué genes se activan, en qué células y en qué momento. Alteraciones en estas regiones reguladoras pueden contribuir al desarrollo de enfermedades, incluso cuando los genes en sí permanecen intactos.
AlphaGenome ha sido diseñado precisamente para abordar este desafío. El modelo puede analizar fragmentos muy largos de ADN -hasta un millón de pares de bases o letras genéticas- y generar predicciones detalladas, letra por letra, sobre múltiples procesos biológicos. Entre ellos se incluyen la cantidad de ARN que produce un gen, cómo se procesa ese ARN antes de convertirse en proteína, qué zonas del ADN están activas en un tipo celular concreto o cómo se organiza el genoma en el espacio tridimensional del núcleo.
Google DeepMind había presentado en los últimos años dos herramientas relacionadas: Enformer (en 2021) y AlphaMissense (en 2023). Pero AlphaGenome supone un salto cualitativo respecto a sus predecesores.
Un modelo entrenado con datos de millones de experimentos
Natasha Latysheva y Pushmeet Kohli, dos de sus desarrolladores, explicaron en qué se diferencia AlphaGenome con respecto a modelos de IA genómica anteriores.
Por una parte, el modelo se ha entrenado analizando el genoma humano y el del ratón utilizando la mayor base de datos empleada hasta ahora para una herramienta de aprendizaje automático de este tipo. Los datos proceden de grandes consorcios científicos públicos como ENCODE, GTEx, 4D Nucleome y FANTOM5, que han medido durante años cómo se comporta el genoma en distintos tejidos y tipos celulares.
La precisión lograda por la herramienta no tiene precedentes. "AlphaGenome tiene la capacidad de analizar secuencias de ADN de hasta un millón de pares de bases y de hacer predicciones con resolución de letra individual, lo que permite capturar 11 procesos biológicos con un detalle muy minucioso", señaló Kohli.
Una sola herramienta para lo que antes requerían cinco modelos
Hasta ahora, los modelos computacionales disponibles solían estar especializados en tareas concretas o tenían que sacrificar precisión para abarcar grandes regiones del genoma. AlphaGenome rompe con esa limitación al integrar en un solo sistema la capacidad de analizar largas secuencias, mantener una alta resolución y combinar información de múltiples procesos biológicos.
"Hemos sintetizado las mejores ideas existentes en inteligencia artificial genómica en un mismo modelo, de tal forma que una sola herramienta logra lo mismo que hasta ahora hacían cinco modelos existentes por separado", explicó Latysheva.
Gracias a este entrenamiento, AlphaGenome puede comparar una secuencia de ADN normal con otra que contenga una mutación y estimar en segundos qué efectos moleculares podría provocar ese cambio. Esta velocidad y capacidad de integración resultan cruciales para avanzar en campos como el diagnóstico de enfermedades raras, el desarrollo de terapias genéticas o la comprensión de algunos tipos de cáncer.
Enfermedades raras y errores en el procesamiento del ARN
Uno de los aspectos más prometedores del nuevo modelo es su capacidad para analizar mutaciones que afectan al procesamiento del ARN, un mecanismo conocido como splicing o empalme. Este proceso consiste en cortar y unir fragmentos de ARN de forma precisa antes de que se conviertan en proteínas. Fallos en este mecanismo están implicados en numerosas enfermedades raras y trastornos genéticos.
Hay enfermedades genéticas graves, como la atrofia muscular espinal y algunas formas de fibrosis quística, que pueden estar causadas por errores en el empalme del ARN. AlphaGenome logra modelar explícitamente la ubicación y el nivel de expresión de estas uniones, ofreciendo información sobre el impacto de las variantes genéticas en este proceso crítico.
AlphaGenome es el primer sistema de este tipo que puede predecir de forma directa cómo una mutación altera las uniones entre fragmentos de ARN, ofreciendo una visión más completa de sus consecuencias moleculares.
Resultados validados en casos de cáncer conocidos
En el estudio publicado en Nature, los investigadores muestran cómo el modelo reproduce mecanismos ya conocidos en ciertos tipos de cáncer, como la leucemia linfoblástica aguda de células T. En estos casos, AlphaGenome identificó correctamente cómo mutaciones situadas fuera de los genes pueden activar de forma anómala un oncogén -un gen que favorece el desarrollo tumoral-, un resultado que coincide con observaciones experimentales previas.
Los datos de rendimiento respaldan esta eficacia: para secuencias de ADN únicas, los autores informan que AlphaGenome ha superado al resto de modelos existentes en 22 de las 24 evaluaciones realizadas. Para predecir el efecto regulador de una variante genética, ha igualado o superado al resto de modelos en 24 de 26 evaluaciones.
Una herramienta para la investigación, no para diagnosticar pacientes
Los autores subrayan que AlphaGenome no está diseñado para su uso clínico directo ni para interpretar genomas individuales de pacientes. Su objetivo es servir como herramienta de investigación, capaz de ayudar a los científicos a identificar qué variantes genéticas merecen un estudio más profundo en el laboratorio.
Además, el modelo todavía tiene limitaciones. Captar con total precisión la influencia de elementos reguladores muy alejados entre sí en el genoma o predecir efectos específicos en todos los tejidos sigue siendo un reto. Y, como ocurre con otras herramientas similares, AlphaGenome describe consecuencias moleculares, pero no explica por sí solo cómo esas alteraciones desembocan en enfermedades complejas, donde influyen muchos factores adicionales de tipo ambiental, metabólico o inmunológico.
Más de 3.000 investigadores ya utilizan el modelo
Por ahora, Google DeepMind ha puesto AlphaGenome a disposición de la comunidad científica para usos no comerciales a través de una interfaz de programación. La compañía espera que el modelo evolucione con las aportaciones de otros investigadores y se convierta en una base común para explorar el funcionamiento del genoma.
En la rueda de prensa, los desarrolladores informaron de que más de 3.000 investigadores en el mundo están haciendo uso del modelo, entre ellos 500 usuarios en España, un dato que refleja el interés de la comunidad científica española por incorporar estas herramientas a sus líneas de investigación.
En un momento en el que la inteligencia artificial empieza a transformar disciplinas enteras, AlphaGenome representa un paso más hacia la comprensión profunda del ADN y de las reglas que gobiernan la vida a nivel molecular.
También te puede interesar