Investigadores actualizan la herramienta de cálculo automatizada para el análisis del genoma del SARS-CoV-2


Los investigadores actualizaron una versión anterior de una herramienta automatizada para incluir el análisis del genoma del coronavirus 2 (SARS-CoV-2) del síndrome respiratorio agudo severo. El análisis del genoma utilizando el software disponible gratuitamente podría ayudar a rastrear la evolución del virus e identificar rápidamente variantes que aumentan la transmisión viral o la virulencia.

Estudio: Evolución de los conocimientos del genoma del SARS-CoV-2 de 200.000 pacientes con COVID-19.  Haber de imagen: Limbitech / Shutterstock

El patógeno SARS-CoV-2 ha estado mutando desde que se descubrió por primera vez a fines de 2019. Algunas de estas mutaciones han aumentado la aptitud del virus, lo que puede afectar los resultados de la enfermedad COVID-19, su transmisibilidad y, posteriormente, podría afectar la eficacia de vacunas actuales. Por lo tanto, la secuenciación completa y continua de tantos genomas como sea posible en todo el mundo será crucial para mantenerse al tanto de la pandemia.

Existen algunas iniciativas nacionales para la vigilancia activa del genoma del SARS-CoV-2, como el COVID-19 Genomics UK Consortium en el Reino Unido y el Indian SARS-CoV-2 Genomics Consortium, que tienen la tarea de identificar nuevas variantes. Cualquier aumento de casos debido a una nueva variante requerirá una acción inmediata para contener la propagación. Esto también requerirá métodos automatizados para analizar e identificar nuevas cepas.

En un artículo publicado en bioRxiv* Preprint Server, los investigadores informan sobre la segunda generación de una herramienta de cálculo, Detector de patógenos infecciosos (IPD), para determinar la abundancia y mutación de SARS-CoV-2, que tiene una base de datos de variantes ampliada y una evaluación de clado revisada.

Encontrar la frecuencia de mutaciones

Los autores analizaron 200,865 secuencias del genoma del SARS-CoV-2 de 155 países, que tenían 2,58 millones de mutaciones al 28 de diciembre de 2020 en comparación con la cepa de referencia de Wuhan. Encontraron alrededor del 39% de mutaciones sinónimas, mutaciones que suelen ser menores y no cambian los aminoácidos. Aproximadamente el 51% fueron mutaciones no sinónimos, que son mutaciones que cambian los aminoácidos. Aproximadamente el 9% de las mutaciones estaban en la región intergénica con las UTR codificantes 5 ‘y 3’. Entre las mutaciones no sinónimas, aproximadamente la mitad eran mutaciones sin sentido o mutaciones en un solo nucleótido.

Los investigadores observaron 13 residuos de puntos calientes que se produjeron en más de 40.000 muestras. La mutación sinónima más frecuente se produjo 186,189 veces en el gen NSP3 seguida de una mutación en el gen de la ARN polimerasa dependiente de ARN 185,945 veces. Las mutaciones no sinónimas D614G y A222V ocurren 176,436 y 47,971 veces, respectivamente, en el proteína de pico Gen S. La siguiente mutación frecuente es un cambio de 2 aminoácidos R / G203K / R. La mutación A220V en el gen N ocurre 48 426 veces, la tercera mutación más frecuente.

La mutación D614G provoca mayores cargas virales en el tracto respiratorio, pero no altera la gravedad de la enfermedad. El equipo no encontró una frecuencia significativa de las otras mutaciones de proteínas de pico N439K, S477Y, E484K y N501Y. Las 13 mutaciones más frecuentes comprenden cinco mutaciones sinónimas que probablemente afectan el corte y empalme del ARNm o la selección en el sesgo de uso de codones, la estabilidad y el plegamiento de la traducción o el plegamiento de la proteína cotraduccional.

Tras analizar más los datos, el equipo descubrió que los genes S, N, M, ORF7a y ORF10, aproximadamente el 21% del genoma, representan el 54,36% de todas las mutaciones no sinónimas del SARS-CoV-2. Los genes S y M tienen la proporción más pequeña de bases variables totales en el genoma del virus, lo que sugiere una fuerte selección positiva de mutaciones no sinónimas en estos genes.

Entre las otras variantes nuevas del virus SARS-CoV-2, el mutante B1.1.7 del Reino Unido tenía 32 mutaciones, la mutación B.1.351 de Sudáfrica tenía 25 mutaciones y la variante brasileña P.1 tenía 25 mutaciones.

Herramienta para la vigilancia del genoma

Al comparar las variantes predominantes en las tres nuevas cepas, junto con las de la India, los autores encontraron cuatro mutaciones de puntos calientes comunes que incluían D514G. N501Y fue la mutación de base en las tres variantes, y las cepas de Sudáfrica y Brasil mostraron una mutación E484K adicional en la proteína de pico.

Ninguna de estas dos mutaciones se observó en las muestras indias, y solo dos de las 3.361 muestras indias mostraron la mutación S477N. Se desconoce si la ausencia de estas mutaciones, que han aumentado la afinidad de unión al receptor de la enzima convertidora de angiotensina 2 (ACE2) humana, podría explicar la menor transmisión en India en comparación con el Reino Unido, Brasil y Sudáfrica.

El análisis de clados reveló que 20E, 20B y 20A eran los más dominantes. Todo el análisis resultante de la información de variantes y clados se incluyó en la base de datos para la segunda generación de DPI. El equipo descubrió que IPD 2.0 asignó clados con alta precisión cuando se probó utilizando un conjunto de datos de secuencia simulada generados a partir de los genomas de diferentes clados.

La base de datos con variantes actualizadas y módulo de evaluación de clados permite la cuantificación y evaluación filogenética del genoma del SARS-CoV-2. Los autores escriben: “Esto hace que IPD 2.0 sea una herramienta pertinente para el análisis de diversos conjuntos de datos de secuencias del SARS-CoV-2 y facilita la vigilancia genómica para identificar variantes involucradas en infecciones irruptivas”.

*Noticia importante

bioRxiv publica informes científicos preliminares que no son revisados ​​por pares y, por lo tanto, no deben considerarse concluyentes, guiar la práctica clínica / comportamiento relacionado con la salud o tratarse como información establecida.

.



Source link