El aprendizaje automático identifica mutaciones que causan cáncer en los sitios de unión de CTCF
En un estudio reciente publicado en la revista Investigación de ácidos nucleicosLos investigadores investigan si el aprendizaje automático puede identificar puntos críticos de mutación pancancerosa en los sitios de unión persistentes del factor de unión CCCTC (P-CTCF) (P-CTCFBS).
Para estudiar: El aprendizaje automático permite la identificación pan-cáncer de puntos críticos mutacionales en sitios de unión persistentes de CTCF. Haber de imagen: Nuttapong punna/Shutterstock.com
CTCF y el cáncer
Las mutaciones en el sitio de unión de CTCF afectan a CTCF, una proteína que regula la transcripción y la arquitectura nuclear en el ácido desoxirribonucleico (ADN) no codificante. Los CTCF-BS constantes muestran resistencia a la reducción de CTCF y la conservación de la unión.
Estos subtipos se distinguen por su mayor fuerza de unión, unión constitutiva específica, enriquecimiento del anclaje del bucle de cromatina y límites del dominio de asociación topológica (TAD). Las mutaciones en el sitio de unión de CTCF pueden activar genes oncogénicos; sin embargo, se han identificado pocas mutaciones de este tipo.
Sobre el estudio
En el estudio actual, los investigadores desarrollaron la investigación CTCF-In-Silico de la unión PersisTEnt (INSITE), una herramienta computacional capaz de predecir la persistencia de la unión de CTCF después de la eliminación en las células cancerosas.
CTCF-INSITE es una herramienta de aprendizaje automático que evalúa las características genéticas y epigenéticas responsables de la persistencia de la unión de CTCF. La carga mutacional en los sitios de unión de PCTCF se determinó utilizando secuencias del Consorcio Internacional del Genoma del Cáncer (ICGC) de tumores compatibles, generando métricas de persistencia para los datos de secuenciación de ChIP CTCF de la Enciclopedia de elementos de ADN (ENCODE) de diferentes tipos de tejidos. Para el análisis también se utilizaron datos del Centro Nacional de Información Biotecnológica (NCBI) y la secuenciación del genoma completo (WGS) de alta cobertura de GM12878 de la Iniciativa del Genoma del Platino.
Los investigadores rastrearon cohortes con menos mutaciones por individuo utilizando datos CTCF ChIP-seq de líneas celulares IMR-90, MCF7 y LNCaP aisladas de tejido pulmonar, cáncer de mama y adenocarcinoma de próstata, respectivamente. Después de identificar y eliminar los valores atípicos utilizando el método del rango intercuartílico (IQR), 24 cohortes, incluidos 3218 pacientes, estuvieron disponibles para el estudio.
Luego se crearon doce tipos distintos de cáncer combinando mutaciones de cohortes del mismo tipo de cáncer. Para las células IMR-90, LNCaP y MCF7, se investigaron las características genómicas, las interacciones de la cromatina, la afinidad de unión, el tiempo de replicación, la unión constitutiva y las puntuaciones de conservación.
Se utilizó el modelado de bosque aleatorio porque tiene una mayor tasa de éxito en comparación con los modelos de regresión lineal en la predicción de la unión de CTCF. en sílice. Los datos se dividieron en conjuntos de datos de entrenamiento y prueba utilizando una proporción de 9:1.
También se realizaron estudios de motivos de unión para determinar la posición de unión dentro de un pico ChIP-seq de 200 a 2000 pares de bases (pb). Luego se calculó una puntuación de motivo para cada área de un pico de ChIP-seq.
Se utilizó un análisis de enriquecimiento de conjunto de genes (GSEA) para determinar el contexto mutacional de trinucleótidos para cada paciente, y se utilizaron ensayos de unión de ADN de polarización de fluorescencia (FPDB) para comparar la carga mutacional entre P- y L-CTCF-BS. Al agregar estos resultados, se generó una tasa de mutación de fondo de CTCFBS para cada cáncer.
Resultados del estudio
En comparación con todos los sitios de unión de CTCF, los de P-CTCF tenían tasas de mutación significativamente más altas en los cánceres de próstata y mama. En los 12 tipos de cáncer examinados, los sitios de unión de P-CTCF diseñados mostraron una carga mutacional notablemente aumentada. Las mutaciones del sitio de unión de P-CTCF, que se predice que tendrán un efecto funcional sobre el bucle de CTCF y la unión de cromatina, mostraron un enriquecimiento significativamente mayor.
oh in vitro Los experimentos confirmaron que las mutaciones cancerosas en el sitio de unión de P-CTCF anticipadas disruptivamente redujeron la unión de CTCF. Se observaron mutaciones en los sitios de unión de P-CTCF con más frecuencia que L-CTCF en 12 tipos distintos de cáncer. Las mutaciones en el sitio de unión de P-CTCF se han relacionado con la alteración del bucle, lo que indica que estas mutaciones contribuyen a la desregulación tridimensional del genoma en el cáncer.
La afinidad de unión es crucial para la supervivencia de P-CTCF-BS, especialmente en los anclajes del bucle de cromatina, las regiones de tiempo de replicación tardía y los límites TAD. Además, la colocalización de los bucles cromosómicos indica durabilidad.
Los investigadores identificaron desequilibrios alélicos significativos en la unión en 91 sitios donde las mutaciones redujeron la afinidad de unión. El cáncer de mama mostró una regulación negativa de los genes inducidos por la luz ultravioleta (UV), mientras que el cáncer de próstata mostró un enriquecimiento de los genes de transición epitelial a mesenquimal. En comparación con los sitios de unión de L-CTCF, los P-CTCF-BS se asociaron con una tasa mutacional más alta y un enriquecimiento notable de mutaciones disruptivas.
Conclusiones
Los resultados del estudio identifican una nueva subclase de mutaciones del ADN CTCF-BS específicas del cáncer y proporcionan información importante sobre el papel crucial de estas mutaciones en las estructuras genómicas pancancerosas. CTCF-INSITE mostró un enriquecimiento significativo de mutaciones en varios tipos de cáncer. Debido a la posible interrupción de los bucles de cromatina y la disminución de la unión en in vitro En las pruebas de ligamiento, estas mutaciones se consideran funcionales.
El estudio de los perfiles mutacionales de otros tipos de cáncer puede estar respaldado por la señal mutacional mejorada en los sitios de unión de P-CTCF. Por lo tanto, el poder predictivo de CTCF-INSITE para CTCF-BS ofrece candidatos prometedores para la modificación experimental que los investigadores deben priorizar para comprender mejor la etiología del cáncer.