Nueva técnica computacional diferencia con precisión entre datos de células tumorales y células normales



En un esfuerzo por abordar un desafío importante al analizar grandes conjuntos de datos de secuenciación de ARN de una sola célula, los investigadores del Centro de Cáncer MD Anderson de la Universidad de Texas han desarrollado una nueva técnica computacional para diferenciar con precisión entre los datos de las células cancerosas y la variedad de células normales encontradas. dentro de las muestras de tumores. El trabajo fue publicado hoy en Biotecnología de la naturaleza.

La nueva herramienta, denominada CopyKAT (cariotipo de número de copias de tumores aneuploides), permite a los investigadores examinar más fácilmente los datos complejos obtenidos de grandes experimentos de secuenciación de ARN de una sola célula, que entregan datos de expresión génica de muchos miles de células individuales.

CopyKAT usa esos datos de expresión genética para buscar aneuploidía, o la presencia de números cromosómicos anormales, que es común en la mayoría de los cánceres, dijo el autor principal del estudio, Nicholas Navin, Ph.D., profesor asociado de Genética y Bioinformática y Biología Computacional. La herramienta también ayuda a identificar distintas subpoblaciones, o clones, dentro de las células cancerosas.

Desarrollamos CopyKAT como una herramienta para inferir información genética a partir de los datos del transcriptoma. Al aplicar esta herramienta a varios conjuntos de datos, demostramos que podíamos identificar sin ambigüedades, con una precisión de aproximadamente el 99%, las células tumorales frente a las otras células inmunes o estromales presentes en una muestra tumoral mixta. Entonces podríamos ir un paso más allá para descubrir los subclones presentes y comprender sus diferencias genéticas “.

Nicholas Navin, Ph.D., profesor asociado de genética y bioinformática y biología computacional

Históricamente, los tumores se han estudiado como una mezcla de todas las células presentes, muchas de las cuales no son cancerosas. El advenimiento de la secuenciación de ARN unicelular en los últimos años ha permitido a los investigadores analizar tumores con una resolución mucho mayor, examinando la expresión génica de cada célula individual para desarrollar una imagen del paisaje tumoral, incluido el microambiente circundante.

Sin embargo, no es fácil distinguir entre células cancerosas y células normales sin un enfoque computacional confiable, explicó Navin. El ex becario postdoctoral Ruli Gao, Ph.D., ahora profesor asistente de Ciencias Cardiovasculares en el Instituto de Investigación Metodista de Houston, desarrolló los algoritmos CopyKAT, que mejoran las técnicas más antiguas al aumentar la precisión y ajustarse a la última generación de datos de secuenciación de ARN unicelulares .

El equipo primero evaluó su herramienta comparando los resultados con los datos de secuenciación del genoma completo, que mostraron una alta precisión en la predicción de cambios en el número de copias. En tres conjuntos de datos adicionales de cáncer de páncreas, cáncer de mama triple negativo y cáncer de tiroides anaplásico, los investigadores demostraron que CopyKAT era preciso para distinguir entre células tumorales y células normales en muestras mixtas.

Estos análisis fueron posibles gracias a la colaboración con Stephen Y. Lai, MD, Ph.D., profesor de Cirugía de Cabeza y Cuello, así como con Stacy Moulder, MD, profesora de Oncología Médica de Senos y Breast Cancer Moon Shot®, parte del Programa Moon Shots® del MD Anderson, un esfuerzo colaborativo para desarrollar rápidamente descubrimientos científicos en avances clínicos significativos que salvan la vida de los pacientes.

Al analizar estas muestras, los investigadores también demostraron que la herramienta es eficaz para identificar subpoblaciones de células cancerosas dentro del tumor en función de las diferencias en el número de copias, como lo confirman los experimentos en cánceres de mama triple negativos.

“Al usar CopyKAT, pudimos identificar subpoblaciones raras dentro de los cánceres de mama triple negativos que tienen alteraciones genéticas únicas que no se informaron ampliamente, incluidas aquellas con posibles implicaciones terapéuticas”, dijo Gao. “Esperamos que esta herramienta sea útil para la comunidad de investigadores para aprovechar al máximo sus datos de secuenciación de ARN de una sola célula y para impulsar nuevos descubrimientos en el cáncer”.

La herramienta está disponible gratuitamente para los investigadores aquí. Los autores señalan que la herramienta no es aplicable al estudio de todos los tipos de cáncer. La aneuploidía, por ejemplo, es relativamente rara en cánceres pediátricos y hematológicos.

Fuente:

Referencia de la revista:

Gao, R., et al. (2021) Delimitación del número de copias y la subestructura clonal en tumores humanos a partir de transcriptomas unicelulares. Biotecnología de la naturaleza. doi.org/10.1038/s41587-020-00795-2.

.



Source link