Potentes algoritmos pueden ‘predecir’ el lenguaje biológico del cáncer y el Alzheimer



Los poderosos algoritmos utilizados por Netflix, Amazon y Facebook pueden “predecir” el lenguaje biológico del cáncer y las enfermedades neurodegenerativas como el Alzheimer, han descubierto los científicos.

Los grandes datos producidos durante décadas de investigación se introdujeron en un modelo de lenguaje informático para ver si la inteligencia artificial puede hacer descubrimientos más avanzados que los humanos.

Académicos del St John’s College de la Universidad de Cambridge descubrieron que la tecnología de aprendizaje automático podía descifrar el “lenguaje biológico” del cáncer, el Alzheimer y otras enfermedades neurodegenerativas.

Su innovador estudio ha sido publicado en la revista científica PNAS hoy (8 de abril de 2021) y podría usarse en el futuro para “corregir los errores gramaticales dentro de las células que causan enfermedades”.

El profesor Tuomas Knowles, autor principal del artículo y miembro del St John’s College, dijo: “Llevar la tecnología de aprendizaje automático a la investigación de las enfermedades neurodegenerativas y el cáncer es un cambio de juego absoluto. En última instancia, el objetivo será utilizar la inteligencia artificial para desarrollar medicamentos dirigidos para aliviar drásticamente los síntomas o para prevenir la demencia “.

Cada vez que Netflix recomienda una serie para ver o Facebook sugiere a alguien con quien hacerse amigo, las plataformas utilizan potentes algoritmos de aprendizaje automático para hacer conjeturas bien fundamentadas sobre lo que harán las personas a continuación. Los asistentes de voz como Alexa y Siri pueden incluso reconocer a personas individuales y responderle instantáneamente.

El Dr. Kadi Liis Saar, primer autor del artículo e investigador del St John’s College, usó una tecnología similar de aprendizaje automático para entrenar un modelo de lenguaje a gran escala para observar qué sucede cuando algo sale mal con las proteínas dentro del cuerpo para causar una enfermedad. .

Ella dijo: “El cuerpo humano alberga miles y miles de proteínas y los científicos aún no conocen la función de muchas de ellas. Le pedimos a un modelo de lenguaje basado en una red neuronal para aprender el lenguaje de las proteínas.

“Le pedimos específicamente al programa que aprendiera el lenguaje de los condensados ​​biomoleculares que cambian de forma (gotitas de proteínas que se encuentran en las células) que los científicos realmente necesitan entender para descifrar el lenguaje de la función biológica y el mal funcionamiento que causan cáncer y enfermedades neurodegenerativas como el Alzheimer. Descubrimos que podría aprender, sin que se les diga explícitamente, lo que los científicos ya han descubierto sobre el lenguaje de las proteínas durante décadas de investigación “.

Las proteínas son moléculas grandes y complejas que desempeñan muchas funciones críticas en el cuerpo. Realizan la mayor parte del trabajo en las células y son necesarios para la estructura, función y regulación de los tejidos y órganos del cuerpo; los anticuerpos, por ejemplo, son una proteína que funciona para proteger el cuerpo.

Las enfermedades de Alzheimer, Parkinson y Huntington son tres de las enfermedades neurodegenerativas más comunes, pero los científicos creen que hay varios cientos.

En la enfermedad de Alzheimer, que afecta a 50 millones de personas en todo el mundo, las proteínas se vuelven rebeldes, forman grupos y destruyen las células nerviosas sanas. Un cerebro sano tiene un sistema de control de calidad que elimina eficazmente estas masas de proteínas potencialmente peligrosas, conocidas como agregados.

Los científicos ahora piensan que algunas proteínas desordenadas también forman gotitas líquidas de proteínas llamadas condensados ​​que no tienen membrana y se fusionan libremente entre sí. A diferencia de los agregados de proteínas que son irreversibles, los condensados ​​de proteínas pueden formarse y reformarse y, a menudo, se comparan con gotas de cera que cambia de forma en las lámparas de lava.

El profesor Knowles dijo: “Los condensados ​​de proteínas han atraído recientemente mucha atención en el mundo científico porque controlan eventos clave en la célula, como la expresión génica, cómo nuestro ADN se convierte en proteínas, y la síntesis de proteínas, cómo las células producen proteínas.

“Cualquier defecto relacionado con estas gotitas de proteína puede conducir a enfermedades como el cáncer. Es por eso que incorporar la tecnología de procesamiento del lenguaje natural a la investigación sobre los orígenes moleculares del mal funcionamiento de las proteínas es vital si queremos poder corregir los errores gramaticales dentro de las células que causan enfermedad.”

El Dr. Saar dijo: “Alimentamos al algoritmo con todos los datos almacenados en las proteínas conocidas para que pudiera aprender y predecir el lenguaje de las proteínas de la misma manera que estos modelos aprenden sobre el lenguaje humano y cómo WhatsApp sabe cómo sugerir palabras para que las use.

“Entonces pudimos preguntarle sobre la gramática específica que hace que solo algunas proteínas formen condensados ​​dentro de las células. Es un problema muy desafiante y desbloquearlo nos ayudará a aprender las reglas del lenguaje de la enfermedad”.

La tecnología de aprendizaje automático se está desarrollando a un ritmo rápido debido a la creciente disponibilidad de datos, el aumento de la potencia informática y los avances técnicos que han creado algoritmos más potentes.

Un mayor uso del aprendizaje automático podría transformar la investigación futura sobre el cáncer y las enfermedades neurodegenerativas. Se podrían hacer descubrimientos más allá de lo que los científicos ya saben y especulan sobre las enfermedades y potencialmente incluso más allá de lo que el cerebro humano puede entender sin la ayuda del aprendizaje automático.

El Dr. Saar explicó: “El aprendizaje automático puede estar libre de las limitaciones de lo que los investigadores creen que son los objetivos de la exploración científica y significará que se encontrarán nuevas conexiones que ni siquiera hemos concebido todavía. Es realmente muy emocionante”.

Fuente:

Referencia de la revista:

Saar, KL, et al. (2021) Aprendizaje de la gramática molecular de los condensados ​​de proteínas a partir de determinantes de secuencia e incrustaciones. PNAS. doi.org/10.1073/pnas.2019053118.

.



Source link