Un estudio guiado por haplotipos de aprendizaje profundo basado en imágenes mapea la adaptación global del SARS-CoV-2


Hasta la fecha, el síndrome respiratorio agudo severo coronavirus 2 (SARS-CoV-2), el patógeno causante de la enfermedad por coronavirus 2019 (COVID-19), ha causado más de 93,21 millones de infecciones en todo el mundo. A medida que se propaga por diferentes poblaciones, sufre adaptaciones que en ocasiones afectan su transmisibilidad y otras características biológicas.

Estudio: Uso de alineaciones de haplotipos basadas en imágenes para mapear la adaptación global del SARS-CoV-2.  Haber de imagen: Math Campbell / Shutterstock

Una preimpresión interesante en el bioRxiv* El servidor describe el uso de aprendizaje profundo con tecnología de reconocimiento de imágenes para rastrear la aparición de variantes con mayor aptitud viral. Una mayor aptitud conduce a una rápida expansión de estos linajes en las áreas donde se introducen. Este tipo de estudio podría facilitar el desarrollo de anticuerpos y vacunas más eficaces para ayudar a contener la pandemia.

Importancia de los estudios de adaptación

Un paso importante para comprender cualquier pandemia causada por un patógeno nuevo es identificar los cambios que ocurren en el genoma del organismo a lo largo del tiempo y cómo estas evoluciones reflejan cambios en su comportamiento. Esto ayuda a seleccionar los objetivos de intervención. El intenso ritmo de investigación sobre la pandemia de COVID-19 en curso ha llevado a la agregación de miles de secuencias completas de ARN viral, de múltiples poblaciones y regiones.

El presente estudio tiene como objetivo explotar esta base de datos de información genómica viral para identificar, en primer lugar, la aparición de cambios genómicos en el SARS-CoV-2 como resultado de la presión de selección global, o selección regional, con alteraciones en el tiempo. Las presiones de selección son agentes que actúan sobre el virus desde el exterior, que afectan su capacidad de supervivencia positiva o negativamente al alterar o mejorar rasgos particulares. El estudio de poblaciones virales seleccionadas durante un período de tiempo podría ayudar a descubrir cambios en la virulencia o inmunogenicidad asociados con tales procesos genéticos adaptativos.

Enfoques filogenéticos que utilizan el aprendizaje profundo

Los investigadores se basaron en métodos filogenéticos para hacer sus inferencias, sin utilizar datos de recombinación. Su enfoque es diferente de los métodos más convencionales que resumen los datos de la secuencia en forma numérica o gráfica, con el fin de identificar cómo se distribuyen las variantes de nucleótidos en situaciones sin presión de selección. En tales situaciones de evolución neutra, se supone que ocurre la recombinación libre, con la población permaneciendo constante.

En el estudio actual, los investigadores optaron por técnicas filogenéticas que requieren numerosos eventos repetitivos en un intervalo de tiempo específico para capturar eventos en exceso más allá de los límites de la evolución neutral. Esto significa que a menudo se usan solo con genomas que muestran una alta tasa de mutación o que tienen largos rastros de mutación.

Los investigadores utilizaron la capacidad de los métodos de aprendizaje profundo para capturar cambios genéticos complejos en herramientas de predicción basadas en simulaciones, de modo que no tengan que especificar parámetros claramente definidos. Ya se ha aplicado el aprendizaje profundo en genética de poblaciones para obtener predicciones de varios parámetros genéticos, como la tasa de recombinación y la selección, así como el análisis de datos de la línea germinal. Pueden utilizar parámetros de reconocimiento de imágenes para analizar la adaptación viral, utilizando así la información en alineaciones de haplotipos.

Análisis de haplotipos basado en imágenes

El estudio se basa en una red neuronal convolucional (CNN) combinada con un enfoque de red neuronal recurrente (RNN). Esta plataforma, denominada inferencia evolutiva guiada por haplotipos basada en imágenes (ImHapE), les permitió identificar la selección de forma cuantitativa en poblaciones virales en expansión, utilizando datos de secuenciación genómica. Este enfoque de cuatro pasos se modificó para aumentar su velocidad y, al mismo tiempo, conservar su capacidad para capturar las diferencias en la aptitud en diferentes poblaciones en las que la selección opera con diferentes puntos fuertes. Simularon un crecimiento exponencial en la población, con una tasa de crecimiento en poblaciones seleccionadas positivamente siendo mayor a medida que aumentaba la aptitud. La aptitud se define como “una reducción en la tasa de mortalidad de tal manera que una aptitud (1 + s) de 2 equivale a una reducción del 50% en la tasa de muerte viral en la población de virus beneficiosos”.

Una vez que su modelo CNN / RNN había sido entrenado y validado en su población simulada, lo aplicaron a dos conjuntos de datos globales reales sobre el virus. El primero fue de la base de datos de la Iniciativa Global para Compartir Todos los Datos de la Influenza (GISAID), recopilada entre marzo y julio de 2020. El segundo fueron los datos del COG del Reino Unido, recopilados entre abril y diciembre de 2020. Las mutaciones en las dos bases de datos se llamaron utilizando el genoma de referencia de Wuhan y un genoma de referencia de Inglaterra, respectivamente.

Ajustaron su tasa de mutación para que encajara con las 23 mutaciones estimadas por genoma por año que se estima que sufre el genoma del SARS-CoV-2. También agruparon muestras de virus según la región y los puntos de tiempo.

Mayor aptitud de nuevas variantes

Descubrieron que el virus estaba experimentando una selección positiva en cada población, como lo muestra un valor superior a 1, pero su aptitud era diferente en diferentes regiones. Se observó una selección positiva incluso después de compensar el crecimiento de la población.

En Europa y América del Norte, la aptitud disminuyó con el tiempo, después de la fijación de la variante D614G, pero fue mayor en julio que al principio. La aptitud en marzo y julio fue de 1,05 frente a 1,42 en Europa y de 1,27 frente a 1,40 en Norteamérica.

Utilizando los datos del COG del Reino Unido, encontraron que la selección positiva tenía un amplio rango de variación al principio del brote. Sin embargo, la aptitud aumentó de 1.05 en la semana 29 a 1.34 en la semana 49. El comienzo de una mayor aptitud se asoció con la expansión simultánea del linaje B1.177 en la semana 29, con la nueva variante B.1.1.7 expandiéndose después de la semana 46.

El linaje B. 1.177 está definido por una mutación A222V en el proteína de pico. Se ha generalizado en Europa, pero se desconoce si esto está relacionado con alguna ventaja fenotípica, como una mayor transmisibilidad. La nueva variante, B.1.1.1.7, parece estar asociada con una mayor aptitud después de la semana 46, lo que indica que está más en forma que los otros linajes que circulan en el Reino Unido en la actualidad.

Tanto el perfil de datos continental como el COG del Reino Unido es un excelente ejemplo de cómo las herramientas CNN / RNN basadas en simulación pueden rastrear diferencias selectivas entre clones virales casi en tiempo real “.

¿Cuáles son las implicaciones?

Estos hallazgos muestran cómo esta herramienta es útil para seguir a las poblaciones virales sometidas a presión de selección y, por lo tanto, hacer inferencias sobre las diferencias impulsadas por la selección en la virulencia y la infectividad. Esta herramienta versátil está lista para perfeccionarse y desarrollarse aún más para estudiar la adaptación en los genomas.

Nuestro marco general se puede adaptar y aplicar a cualquier población no recombinante en la que se disponga de información de haplotipos alineados, como tejidos somáticos o cánceres “.

*Noticia importante

bioRxiv publica informes científicos preliminares que no son revisados ​​por pares y, por lo tanto, no deben considerarse concluyentes, guiar la práctica clínica / comportamiento relacionado con la salud o tratarse como información establecida.

Referencia de la revista:

Ouelette, TW y col. (2021). Uso de alineaciones de haplotipos basadas en imágenes para mapear la adaptación global de SARS-CoV-2. bioRxiv preimpresión. doi: https://doi.org/10.1101/2021.01.13.426571. https://www.biorxiv.org/content/10.1101/2021.01.13.426571v1

.



Source link