La secuenciación del genoma del cáncer es la secuenciación del genoma completo de un grupo único, homogéneo o heterogéneo de células cancerosas. Es un método de laboratorio bioquímico para la caracterización e identificación de las secuencias de ADN o ARN de las células cancerosas
A diferencia de la secuenciación del genoma completo (WGS siglas en inglés de Whole Genome Sequencing), que suele realizarse a partir de células sanguíneas, como en los proyectos de secuenciación del WGS de J. Craig Venter[1] y James D. Watson,[2] de la saliva, de las células epiteliales o de los huesos, la secuenciación del genoma del cáncer implica la secuenciación directa del tejido tumoral primario, del tejido normal adyacente o distal, del microentorno tumoral, como los fibroblastos/células estromales, o de las zonas tumorales metastásicas. Esta técnica también permite el análisis de muestras de ADN circulante tumoral presentes en el plasma de pacientes.[3]
Al igual que la secuenciación del genoma completo, la información generada por esta técnica incluye: la identificación de las bases nucleotídicas (ADN o ARN), el número de copias y las variantes de la secuencia, el estado de las mutaciones y los cambios estructurales, como las translocaciones cromosómicas y los genes de fusión.
El primer informe sobre la secuenciación del genoma del cáncer apareció en 2006. En este estudio se secuenciaron 13.023 genes en 11 tumores de mama y 11 tumores colorrectales.[4] En 2007 se publicó un seguimiento posterior en el que el mismo grupo añadió algo más de 5.000 genes más y casi 8.000 especies de transcripción para completar los exomas de 11 tumores de mama y colorrectales.[5] El primer genoma completo del cáncer que se secuenció fue el de una leucemia mieloide aguda citogenéticamente normal, realizado por Ley et al. en noviembre de 2008.[6] El primer tumor de cáncer de mama fue secuenciado por Shah et al. en octubre de 2009,[7] los primeros tumores de pulmón y piel por Pleasance et al. en enero de 2010,[8][9] y los primeros tumores de próstata por Berger et al. en febrero de 2011.[10]
Historia
Históricamente, los proyectos de secuenciación del genoma del cáncer se han dividido entre los proyectos de secuenciación basados en el transcriptoma y los centrados en el ADN.
El Proyecto de Anatomía del Genoma del Cáncer (CGAP, por sus siglas en inglés de Cancer Genome Anatomy Project) se financió por primera vez en 1997[11] con el objetivo de documentar las secuencias de las transcripciones de ARN en las células tumorales.[12] A medida que mejoró la tecnología, el CGAP amplió sus objetivos para incluir la determinación de perfiles de expresión génica de tejidos cancerosos, precancerosos y normales.[13]
El Proyecto Genoma del Cáncer del Instituto Sanger, financiado por primera vez en 2005, se centra en la secuenciación del ADN. Ha publicado un censo de genes implicados en el cáncer[15] y una serie de pruebas de resecuenciación del genoma completo en busca de genes implicados en el cáncer.[16]
El Consorcio Internacional del Genoma del Cáncer (ICGC, por sus siglas en inglés de International Cancer Genome Consortium) se fundó en 2007 con el objetivo de integrar los datos genómicos, transcriptómicos y epigenéticos disponibles de muchos grupos de investigación diferentes.[17][18] En diciembre de 2011, el ICGC incluía 45 proyectos comprometidos y disponía de datos de 2.961 genomas del cáncer.[17]
Impacto social
La complejidad y la biología del cáncer
El proceso de tumorigénesis que transforma una célula normal en una cancerosa implica una serie de complejos cambios genéticos y epigenéticos.[19][20][21] La identificación y caracterización de todos estos cambios puede llevarse a cabo mediante diversas estrategias de secuenciación del genoma del cáncer.
El poder de la secuenciación del genoma del cáncer reside en la heterogeneidad de los cánceres y los pacientes. La mayoría de los cánceres tienen varios subtipos y, junto con estas "variantes del cáncer", se encuentran las diferencias entre un subtipo de cáncer en un individuo y en otro. La secuenciación del genoma del cáncer permite a los médicos y oncólogos identificar los cambios específicos y únicos que ha sufrido un paciente para desarrollar su cáncer. A partir de estos cambios, se puede emprender una estrategia terapéutica personalizada.[22][23]
Relevancia clínica
Una gran contribución a la muerte por cáncer y al fracaso de su tratamiento es la evolución clonal a nivel citogenético, por ejemplo, como se observa en la leucemia mieloide aguda (LMA).[24][25] En un estudio de Nature publicado en 2011, Ding et al. identificaron fracciones celulares caracterizadas por cambios mutacionales comunes para ilustrar la heterogeneidad de un determinado tumor antes y después del tratamiento frente a la sangre normal de un individuo.[26]
Estas facciones celulares solo podrían haberse identificado a través de la secuenciación del genoma del cáncer, lo que muestra la información que puede proporcionar la secuenciación y la complejidad y heterogeneidad de un tumor dentro de un individuo.
Proyectos Integrales de Genómica del Cáncer
Los dos principales proyectos centrados en la caracterización completa del cáncer en individuos, que implican en gran medida la secuenciación, son el Proyecto del Genoma del Cáncer, con sede en el Instituto Wellcome Trust Sanger, y el Atlas del Genoma del Cáncer, financiado por el Instituto Nacional del Cáncer (NCI) y el Instituto Nacional de Investigación del Genoma Humano (NHGRI). Junto a estos esfuerzos, el Consorcio Internacional del Genoma del Cáncer (una organización más amplia) es una organización científica voluntaria que ofrece un foro de colaboración entre los principales investigadores mundiales del cáncer y la genómica.
Proyecto Genoma del Cáncer (CGP)
El objetivo del Proyecto Genoma del Cáncer es identificar variantes de secuencia y mutaciones críticas en el desarrollo de los cánceres humanos. El proyecto consiste en el cribado sistemático de los genes codificantes y de las uniones de empalme que flanquean a todos los genes del genoma humano para detectar mutaciones adquiridas en los cánceres humanos. Para investigar estos eventos, el conjunto de muestras de descubrimiento incluirá ADN de un tumor primario, tejido normal (de los mismos individuos) y líneas celulares de cáncer. Todos los resultados de este proyecto se amalgaman y almacenan en la base de datos de cáncer COSMIC. COSMIC también incluye datos mutacionales publicados en la literatura científica.
El Atlas del Genoma del Cáncer (TCGA)
El TCGA es un esfuerzo multiinstitucional para comprender las bases moleculares del cáncer mediante tecnologías de análisis del genoma, incluidas las técnicas de secuenciación del genoma a gran escala. Se están recogiendo, secuenciando y analizando cientos de muestras. En la actualidad, los tejidos cancerosos que se están recogiendo incluyen: sistema nervioso central, mama, gastrointestinal, ginecológico, cabeza y cuello, hematológico, torácico y urológico.
Los componentes de la red de investigación TCGA incluyen: recursos centrales de bioespecímenes, centros de caracterización del genoma, centros de secuenciación del genoma, centros de caracterización del proteoma, un centro de coordinación de datos y centros de análisis de datos del genoma. Cada tipo de cáncer se somete a una caracterización y un análisis genómicos exhaustivos. Los datos y la información generados están disponibles de forma gratuita a través del portal de datos del proyecto TCGA.
Consorcio Internacional del Genoma del Cáncer (ICGC)
El objetivo del ICGC es "obtener una descripción exhaustiva de los cambios genómicos, transcriptómicos y epigenómicos en 50 tipos y/o subtipos de tumores diferentes de importancia clínica y social en todo el mundo".[17]
Tecnologías y plataformas
La secuenciación del genoma del cáncer utiliza la misma tecnología que la secuenciación del genoma completo. La historia de la secuenciación ha recorrido un largo camino, originado en 1977 por dos grupos independientes: la técnica de secuenciación enzimática del ADN didoxilado de Fredrick Sanger[27] y la técnica de degradación química de Allen Maxam y Walter Gilbert.[28] Después de estos artículos de referencia, más de 20 años más tarde nació la "segunda generación" de secuenciación de alto rendimiento (HT-NGS), seguida de la "tercera generación de tecnología HT-NGS" en 2010.[29] Las figuras de la derecha ilustran el proceso biológico general y las empresas que participan en la secuenciación HT-NGS de segunda y tercera generación.
Como en cualquier proyecto de secuenciación del genoma, las lecturas deben ensamblarse para formar una representación de los cromosomas que se secuencian. En el caso de los genomas del cáncer, esto se suele hacer alineando las lecturas con el genoma humano de referencia.
Dado que incluso las células no cancerosas acumulan mutaciones somáticas, es necesario comparar la secuencia del tumor con un tejido normal coincidente para descubrir qué mutaciones son exclusivas del cáncer. En algunos tipos de cáncer, como la leucemia, no resulta práctico comparar la muestra de cáncer con un tejido normal, por lo que debe utilizarse un tejido no canceroso diferente.[26]
Se ha calculado que el descubrimiento de todas las mutaciones somáticas de un tumor requeriría una cobertura de secuenciación de 30 veces el genoma del tumor y un tejido normal equivalente.[30] En comparación, el borrador original del genoma humano tenía una cobertura de aproximadamente 65 veces.[31]
Uno de los principales objetivos de la secuenciación del genoma del cáncer es identificar las mutaciones impulsoras: cambios genéticos que aumentan la tasa de mutación en la célula, lo que conduce a una evolución tumoral más rápida y a la metástasis.[32] Es difícil determinar las mutaciones impulsoras sólo a partir de la secuencia del ADN, pero las mutaciones impulsoras suelen ser las más compartidas entre los tumores, se agrupan en torno a oncogenes conocidos y tienden a ser no silenciosas.[30] Las mutaciones pasajeras, que no son importantes en la progresión de la enfermedad, están distribuidas al azar por todo el genoma. Se ha estimado que el tumor medio es portador de unas 80 mutaciones somáticas, de las que se espera que menos de 15 sean impulsoras.[33]
En la actualidad, se están desarrollando diferentes softwares con el objetivo de identificar aquellas variantes de nucleótido único que guarden relación directa con la transformación celular y el desarrollo de tumores. Un estudio reciente comparó la precisión de tres de estos programas comúnmente llamados detectores de mutaciones (en inglésmutation caller's), en un estudio sobre reproducibilidad en muestras de cáncer de mama utilizando WGS y WES. Los tres programas analizados fueron MuTect2, SomaticSniper y Strelka2, y los que mostraron un mejor rendimiento fueron: MuTect2 cuando se realizó un WES, y MuTect2 y Strelka2 para WGS.[34] Además, el mismo trabajo publicó las siguientes recomendaciones con el objetivo de mejorar la reproducibilidad de los datos al trabajar con WGS en muestras de cáncer:
Cantidad de ADN de entrada y construcción de librería: el tamaño de fragmento ideal estaría entre 300-600 pares de bases (pb), el método de fragmentación sonicación para fragmentos de más de 250pb y enzimático para fragmentos mejores de 200pb. La cantidad de ADN utilizada va a depender de la librería escogida, 200-1000ng para TruSeq PCR-free, 10-200ng para TruSeq-Nano o 1-100ng para Nextera Flex.
Cobertura de lectura y seguro de calidad: si el porcentaje de células tumorales presente en la muestra es mayor al 50%, se recomienda una cobertura de lectura de 50x, pero si el contenido es menor al 50%, se recomienda una cobertura de 100x. Además, para asegurar unos resultados fiables se recomienda que las lecturas redundantes sean menores a un 30%, que las lecturas mapeables sean superiores a un 95%, que el contenido en GC esté entre 40-43% y un GIV menor a 1,5.
Programas de alineamiento: se utilizaron se utilizaron tres Bowtie2, BWA-MEM y NovoAlign pero no se encontraron diferencias significativas para WGS.
Detectores de mutaciones: de los tres utilizados (MuTect2, SomaticSniper y Strelka2), MuTect2 y Strelka2 obtuvieron mejores resultados.
Además, como observaciones finales en este trabajo se concluyó que la detección de mutaciones en cancer es un proceso inherentemente integrado del cual cada componente y cada combinación de estos es igual de importante y, finalmente, que los estudios de revisión y validación deben realizarse teniendo en cuenta todo el proceso, desde la muestra hasta el resultado.
Un análisis genómico personal requiere una mayor caracterización funcional de los genes mutantes detectados y el desarrollo de un modelo básico del origen y la progresión del tumor. Este análisis puede utilizarse para hacer recomendaciones de tratamiento farmacológico.[22][23] Hasta febrero de 2012, esto sólo se ha hecho en los ensayos clínicos con pacientes diseñados para evaluar el enfoque de genómica personal para el tratamiento del cáncer.[23][35]
Limitaciones
Un cribado a gran escala de mutaciones somáticas en tumores de mama y colorrectales demostró que muchas mutaciones de baja frecuencia contribuyen poco a la supervivencia celular.[33] Si la supervivencia de las células viene determinada por muchas mutaciones de escaso efecto, es poco probable que la secuenciación del genoma descubra un único "talón de Aquiles" para los fármacos contra el cáncer. Sin embargo, las mutaciones somáticas tienden a agruparse en un número limitado de vías de señalización,[36][33][30] que son posibles objetivos de tratamiento.
Los cánceres son poblaciones heterogéneas de células. Cuando los datos de la secuencia se obtienen de un tumor completo, se pierde la información sobre las diferencias en la secuencia y el patrón de expresión entre las células.[37] Esta dificultad puede mejorarse con el análisis de una sola célula.
Las propiedades clínicamente significativas de los tumores, incluida la resistencia a los fármacos, a veces están causadas por reordenamientos a gran escala del genoma, más que por mutaciones individuales. En este caso, la información sobre las variantes de un solo nucleótido tendrá una utilidad limitada.[37]
La secuenciación del genoma del cáncer puede utilizarse para proporcionar información clínicamente relevante en pacientes con tipos de tumores raros o novedosos. Traducir la información de la secuencia en un plan de tratamiento clínico es muy complicado, requiere expertos de muchos campos diferentes y no está garantizado que conduzca a un plan de tratamiento eficaz.[23][22]
Incidentaloma
El incidentalome es el conjunto de variantes genómicas detectadas no relacionadas con el cáncer en estudio.[38] (El término es un juego de palabras con el nombre de incidentaloma, que designa a los tumores y crecimientos detectados en las imágenes de todo el cuerpo por casualidad).[39] La detección de estas variantes puede dar lugar a medidas adicionales, como la realización de más pruebas o el control del estilo de vida.[38]
Modelo estadístico JaBbA v1
La genómica del cáncer es un hito para la ciencia que cada día trata de integrar distintas técnicas a su protocolo, de esta manera Según Zi-Ning Choo et al.(2023) Determinan que la secuenciación de lectura corta ha contribuido mucho pero creen que este modelo puede pasar por alto variantes estructurales que podrían mostrar algún tipo de información relevante, por lo mismo han realizado experimentaciones utilizando modelos estadísticos mejorados como JaBbA v1 a partir del modelo anterior (v0.1; ref 2) , realizando el análisis de 1330 genomas completos en los cuales las variantes estructurales se resolvieron a través de lecturas cortas en un 87%, así como determinaron la presencia de secuencias a las que se denominaron como neotelómeros que lo catalogan dentro de los mecanismos distintivos del cáncer como alargamiento de telómeros para alcanzar la proliferación indefinida, estos datos se confirmaron a través del análisis de 38 casos de cáncer de mama y melanoma entre datos de muestras normales y carcinogénicas, aplicados al logaritmo estadístico mejorado con mayor rendimiento de secuenciación, además adiciona la capacidad de procesar datos adicionales a mayor escala. En el presente estudio se pudo determinar que las SRS (Secuenciación de secuencias cortas) detecta la mayoría de extremos de ruptura de variantes estructurales que se suponía ni analizaban, esto se demostró implementando análisis de lecturas largas LRS que mejoran en una pequeña proporción la detección de estos extremos, pero este tipo de secuencias largas aumentan la sensibilidad de las variantes estructurales somáticas de un tamaño ≤10 kb).[40]
↑Sjoblom, T.; Jones, S.; Wood, L. D.; Parsons, D. W.; Lin, J.; Barber, T. D.; Mandelker, D.; Leary, R. J. et al. (2006). «The Consensus Coding Sequences of Human Breast and Colorectal Cancers». Science314 (5797): 268-274. Bibcode:2006Sci...314..268S. ISSN0036-8075. PMID16959974. doi:10.1126/science.1133427.Se sugiere usar |número-autores= (ayuda)
↑Wood, L. D.; Parsons, D. W.; Jones, S.; Lin, J.; Sjoblom, T.; Leary, R. J.; Shen, D.; Boca, S. M. et al. (2007). «The Genomic Landscapes of Human Breast and Colorectal Cancers». Science318 (5853): 1108-1113. Bibcode:2007Sci...318.1108W. ISSN0036-8075. PMID17932254. doi:10.1126/science.1145720.Se sugiere usar |número-autores= (ayuda)
↑B Kuska (December 1996). «Cancer genome anatomy project set for takeoff». Journal of the National Cancer Institute88 (24): 1801-3. PMID8961968. doi:10.1093/jnci/88.24.1801.
↑Angela H. Ting (December 2006). «The cancer epigenome--components and functional correlates». Genes & Development20 (23): 3215-31. PMID17158741. doi:10.1101/gad.1464906.
↑Joseph R. Testa (September 1979). «Evolution of Karyotypes in Acute Nonlymphocytic Leukemia». Cancer Research39 (9): 3619-27. PMID476688.
↑Garson OM (July 1989). «Cytogenetic studies of 103 patients with acute myelogenous leukemia in relapse». Cancer Genetics and Cytogenetics40 (2): 187-202. PMID2766243. doi:10.1016/0165-4608(89)90024-1.
↑Wong, K. M.; Hudson, T. J.; McPherson, J. D. (September 2011). «Unraveling the genetics of cancer: genome sequencing and beyond». Annual Review of Genomics and Human Genetics12: 407-30. PMID21639794. doi:10.1146/annurev-genom-082509-141532.
↑ abDuesberg, P.; Rasnick, D. (2004). «Aneuploidy approaching a perfect score in predicting and preventing cancer: highlights from a conference held in Oakland, CA in January, 2004.». Cell Cycle3 (6): 823-8. PMID15197343. doi:10.4161/cc.3.6.938.
↑ abKohane, I. S.; Masys, D. R.; Altman, R. B. (2006). «The Incidentalome: A Threat to Genomic Medicine». JAMA296 (2): 212-215. PMID16835427. doi:10.1001/jama.296.2.212.