Noticias

La nueva herramienta computacional diferencia de forma fiable entre las células cancerosas y las normales a partir de datos de secuenciación de ARN de una sola célula

20 Jan 2021
La nueva herramienta computacional diferencia de forma fiable entre las células cancerosas y las normales a partir de datos de secuenciación de ARN de una sola célula

En un esfuerzo por abordar un importante desafío al analizar grandes conjuntos de datos de secuenciación de ARN unicelular, los investigadores del Centro de Oncología MD Anderson de la Universidad de Texas han desarrollado una nueva técnica computacional para diferenciar con precisión entre los datos de las células cancerosas y la variedad de células normales que se encuentran en las muestras de tumores.

El trabajo fue publicado hoy en Nature Biotechnology.

La nueva herramienta, denominada CopyKAT (cariotipo del número de copias de los tumores aneuploides), permite a los investigadores examinar más fácilmente los complejos datos obtenidos de los grandes experimentos de secuenciación de ARN de una sola célula, que proporcionan datos de expresión genética de muchos miles de células individuales.

CopyKAT utiliza esos datos de expresión genética para buscar la aneuploidía, o la presencia de números cromosómicos anormales, que es común en la mayoría de los cánceres, dijo el autor principal del estudio, el Dr. Nicholas Navin, profesor asociado de Genética y Bioinformática y Biología Computacional.

La herramienta también ayuda a identificar subpoblaciones distintas, o clones, dentro de las células cancerosas.

"Desarrollamos CopyKAT como una herramienta para inferir información genética de los datos del transcriptoma. Aplicando esta herramienta a varios conjuntos de datos, demostramos que podíamos identificar sin ambigüedad, con una precisión de aproximadamente el 99%, las células tumorales frente a las otras células inmunes o estromales presentes en una muestra tumoral mixta", dijo Navin. "Podríamos entonces ir un paso más allá para descubrir los subclones presentes y entender sus diferencias genéticas".

Históricamente, los tumores se han estudiado como una mezcla de todas las células presentes, muchas de las cuales no son cancerosas.

La llegada de la secuenciación de ARN unicelular en los últimos años ha permitido a los investigadores analizar los tumores con una resolución mucho mayor, examinando la expresión genética de cada célula individual para desarrollar un cuadro del paisaje tumoral, incluido el microambiente circundante.

Sin embargo, no es fácil distinguir entre las células cancerosas y las células normales sin un enfoque computacional fiable, explicó Navin.

El ex becario postdoctoral Ruli Gao, Ph.D., ahora profesor asistente de Ciencias Cardiovasculares en el Instituto de Investigación Metodista de Houston, desarrolló los algoritmos CopyKAT, que mejoran las técnicas anteriores al aumentar la precisión y ajustar la más reciente generación de datos de secuenciación de ARN de una sola célula.

El equipo primero evaluó su herramienta comparando los resultados con los datos de la secuenciación del genoma completo, que mostraron una alta precisión en la predicción de los cambios en el número de copias.

En tres conjuntos de datos adicionales de cáncer de páncreas, cáncer de mama triple negativo y cáncer de tiroides anaplásico, los investigadores mostraron que CopyKAT era preciso para distinguir entre las células tumorales y las células normales en muestras mixtas.

Estos análisis fueron posibles gracias a las colaboraciones con Stephen Y. Lai, M.D., Ph.D., profesor de Cirugía de Cabeza y Cuello, así como con Stacy Moulder, M.D., profesora de Oncología Médica de Seno, y el Cáncer de Seno de la Luna, parte del Programa de Disparos de la Luna del MD Anderson, un esfuerzo de colaboración para convertir rápidamente los descubrimientos científicos en avances clínicos significativos que salven las vidas de los pacientes.

Al analizar estas muestras, los investigadores también mostraron que la herramienta es eficaz para identificar subpoblaciones de células cancerígenas dentro del tumor, basándose en las diferencias en el número de copias, como se ha confirmado en los experimentos de cánceres de mama triple negativo.

"Mediante el uso de CopyKAT, pudimos identificar subpoblaciones raras dentro de los cánceres de mama triple negativos que tienen alteraciones genéticas únicas de las que no se ha informado ampliamente, incluyendo aquellas con posibles implicaciones terapéuticas", dijo Gao. "Esperamos que esta herramienta sea útil para la comunidad de investigadores para aprovechar al máximo sus datos de secuenciación de ARN unicelular y para impulsar nuevos descubrimientos en el cáncer".

La herramienta está disponible gratuitamente para los investigadores aquí.

Los autores señalan que la herramienta no es aplicable al estudio de todos los tipos de cáncer.

La aneuploidía, por ejemplo, es relativamente rara en cánceres pediátricos y hematológicos.

Fuente: University of Texas MD Anderson Cancer Center