Secuenciación del genoma del cáncer

La secuenciación del genoma del cáncer es la secuenciación del genoma completo de un grupo único, homogéneo o heterogéneo de células cancerosas. Es un método de laboratorio bioquímico para la caracterización e identificación de las secuencias de ADN o ARN de las células cancerosas

A diferencia de la secuenciación del genoma completo (WGS siglas en inglés de Whole Genome Sequencing), que suele realizarse a partir de células sanguíneas, como en los proyectos de secuenciación del WGS de J. Craig Venter[1]​ y James D. Watson,[2]​ de la saliva, de las células epiteliales o de los huesos, la secuenciación del genoma del cáncer implica la secuenciación directa del tejido tumoral primario, del tejido normal adyacente o distal, del microentorno tumoral, como los fibroblastos/células estromales, o de las zonas tumorales metastásicas. Esta técnica también permite el análisis de muestras de ADN circulante tumoral presentes en el plasma de pacientes.[3]

Al igual que la secuenciación del genoma completo, la información generada por esta técnica incluye: la identificación de las bases nucleotídicas (ADN o ARN), el número de copias y las variantes de la secuencia, el estado de las mutaciones y los cambios estructurales, como las translocaciones cromosómicas y los genes de fusión.

La secuenciación del genoma del cáncer no se limita a la secuenciación WGS y también puede incluir la secuenciación del exoma, el transcriptoma, el micrónoma y el perfilado de la secuencia final. Estos métodos se pueden utilizar para cuantificar la expresión génica, la expresión de miARN y para identificar eventos de corte y empalme alternativos además de los datos de secuencia.

El primer informe sobre la secuenciación del genoma del cáncer apareció en 2006. En este estudio se secuenciaron 13.023 genes en 11 tumores de mama y 11 tumores colorrectales.[4]​ En 2007 se publicó un seguimiento posterior en el que el mismo grupo añadió algo más de 5.000 genes más y casi 8.000 especies de transcripción para completar los exomas de 11 tumores de mama y colorrectales.[5]​ El primer genoma completo del cáncer que se secuenció fue el de una leucemia mieloide aguda citogenéticamente normal, realizado por Ley et al. en noviembre de 2008.[6]​ El primer tumor de cáncer de mama fue secuenciado por Shah et al. en octubre de 2009,[7]​ los primeros tumores de pulmón y piel por Pleasance et al. en enero de 2010,[8][9]​ y los primeros tumores de próstata por Berger et al. en febrero de 2011.[10]

Historia

Históricamente, los proyectos de secuenciación del genoma del cáncer se han dividido entre los proyectos de secuenciación basados en el transcriptoma y los centrados en el ADN.

El Proyecto de Anatomía del Genoma del Cáncer (CGAP, por sus siglas en inglés de Cancer Genome Anatomy Project) se financió por primera vez en 1997[11]​ con el objetivo de documentar las secuencias de las transcripciones de ARN en las células tumorales.[12]​ A medida que mejoró la tecnología, el CGAP amplió sus objetivos para incluir la determinación de perfiles de expresión génica de tejidos cancerosos, precancerosos y normales.[13]

El CGAP publicó en 2003 la mayor colección de marcadores de secuencias expresadas de cáncer a disposición del público.[14]

El Proyecto Genoma del Cáncer del Instituto Sanger, financiado por primera vez en 2005, se centra en la secuenciación del ADN. Ha publicado un censo de genes implicados en el cáncer[15]​ y una serie de pruebas de resecuenciación del genoma completo en busca de genes implicados en el cáncer.[16]

El Consorcio Internacional del Genoma del Cáncer (ICGC, por sus siglas en inglés de International Cancer Genome Consortium) se fundó en 2007 con el objetivo de integrar los datos genómicos, transcriptómicos y epigenéticos disponibles de muchos grupos de investigación diferentes.[17][18]​ En diciembre de 2011, el ICGC incluía 45 proyectos comprometidos y disponía de datos de 2.961 genomas del cáncer.[17]

Impacto social

La complejidad y la biología del cáncer

El proceso de tumorigénesis que transforma una célula normal en una cancerosa implica una serie de complejos cambios genéticos y epigenéticos.[19][20][21]​ La identificación y caracterización de todos estos cambios puede llevarse a cabo mediante diversas estrategias de secuenciación del genoma del cáncer.

El poder de la secuenciación del genoma del cáncer reside en la heterogeneidad de los cánceres y los pacientes. La mayoría de los cánceres tienen varios subtipos y, junto con estas "variantes del cáncer", se encuentran las diferencias entre un subtipo de cáncer en un individuo y en otro. La secuenciación del genoma del cáncer permite a los médicos y oncólogos identificar los cambios específicos y únicos que ha sufrido un paciente para desarrollar su cáncer. A partir de estos cambios, se puede emprender una estrategia terapéutica personalizada.[22][23]

Relevancia clínica

Una gran contribución a la muerte por cáncer y al fracaso de su tratamiento es la evolución clonal a nivel citogenético, por ejemplo, como se observa en la leucemia mieloide aguda (LMA).[24][25]​ En un estudio de Nature publicado en 2011, Ding et al. identificaron fracciones celulares caracterizadas por cambios mutacionales comunes para ilustrar la heterogeneidad de un determinado tumor antes y después del tratamiento frente a la sangre normal de un individuo.[26]

Estas facciones celulares solo podrían haberse identificado a través de la secuenciación del genoma del cáncer, lo que muestra la información que puede proporcionar la secuenciación y la complejidad y heterogeneidad de un tumor dentro de un individuo.

Proyectos Integrales de Genómica del Cáncer

Los dos principales proyectos centrados en la caracterización completa del cáncer en individuos, que implican en gran medida la secuenciación, son el Proyecto del Genoma del Cáncer, con sede en el Instituto Wellcome Trust Sanger, y el Atlas del Genoma del Cáncer, financiado por el Instituto Nacional del Cáncer (NCI) y el Instituto Nacional de Investigación del Genoma Humano (NHGRI). Junto a estos esfuerzos, el Consorcio Internacional del Genoma del Cáncer (una organización más amplia) es una organización científica voluntaria que ofrece un foro de colaboración entre los principales investigadores mundiales del cáncer y la genómica.

Proyecto Genoma del Cáncer (CGP)

El objetivo del Proyecto Genoma del Cáncer es identificar variantes de secuencia y mutaciones críticas en el desarrollo de los cánceres humanos. El proyecto consiste en el cribado sistemático de los genes codificantes y de las uniones de empalme que flanquean a todos los genes del genoma humano para detectar mutaciones adquiridas en los cánceres humanos. Para investigar estos eventos, el conjunto de muestras de descubrimiento incluirá ADN de un tumor primario, tejido normal (de los mismos individuos) y líneas celulares de cáncer. Todos los resultados de este proyecto se amalgaman y almacenan en la base de datos de cáncer COSMIC. COSMIC también incluye datos mutacionales publicados en la literatura científica.

El Atlas del Genoma del Cáncer (TCGA)

El TCGA es un esfuerzo multiinstitucional para comprender las bases moleculares del cáncer mediante tecnologías de análisis del genoma, incluidas las técnicas de secuenciación del genoma a gran escala. Se están recogiendo, secuenciando y analizando cientos de muestras. En la actualidad, los tejidos cancerosos que se están recogiendo incluyen: sistema nervioso central, mama, gastrointestinal, ginecológico, cabeza y cuello, hematológico, torácico y urológico.

Los componentes de la red de investigación TCGA incluyen: recursos centrales de bioespecímenes, centros de caracterización del genoma, centros de secuenciación del genoma, centros de caracterización del proteoma, un centro de coordinación de datos y centros de análisis de datos del genoma. Cada tipo de cáncer se somete a una caracterización y un análisis genómicos exhaustivos. Los datos y la información generados están disponibles de forma gratuita a través del portal de datos del proyecto TCGA.

Consorcio Internacional del Genoma del Cáncer (ICGC)

El objetivo del ICGC es "obtener una descripción exhaustiva de los cambios genómicos, transcriptómicos y epigenómicos en 50 tipos y/o subtipos de tumores diferentes de importancia clínica y social en todo el mundo".[17]

Tecnologías y plataformas

Secuenciación de segunda generación
Secuenciación de tercera generación

La secuenciación del genoma del cáncer utiliza la misma tecnología que la secuenciación del genoma completo. La historia de la secuenciación ha recorrido un largo camino, originado en 1977 por dos grupos independientes: la técnica de secuenciación enzimática del ADN didoxilado de Fredrick Sanger[27]​ y la técnica de degradación química de Allen Maxam y Walter Gilbert.[28]​ Después de estos artículos de referencia, más de 20 años más tarde nació la "segunda generación" de secuenciación de alto rendimiento (HT-NGS), seguida de la "tercera generación de tecnología HT-NGS" en 2010.[29]​ Las figuras de la derecha ilustran el proceso biológico general y las empresas que participan en la secuenciación HT-NGS de segunda y tercera generación.

Las tres principales plataformas de segunda generación son la pirosecuenciación de Roche/454, la secuenciación por ligadura de ABI/SOLiD y la tecnología de secuenciación por amplificación en puente de Illumina. Las tres principales plataformas de tercera generación incluyen la secuenciación en tiempo real de una sola molécula (SMRT) de Pacific Biosciences, la secuenciación de nanoporos de Oxford y la secuenciación por semiconductores de Ion.

Análisis de los datos

El flujo de trabajo de la secuenciación de un tumor desde la biopsia hasta la recomendación del tratamiento.

Como en cualquier proyecto de secuenciación del genoma, las lecturas deben ensamblarse para formar una representación de los cromosomas que se secuencian. En el caso de los genomas del cáncer, esto se suele hacer alineando las lecturas con el genoma humano de referencia.

Dado que incluso las células no cancerosas acumulan mutaciones somáticas, es necesario comparar la secuencia del tumor con un tejido normal coincidente para descubrir qué mutaciones son exclusivas del cáncer. En algunos tipos de cáncer, como la leucemia, no resulta práctico comparar la muestra de cáncer con un tejido normal, por lo que debe utilizarse un tejido no canceroso diferente.[26]

Se ha calculado que el descubrimiento de todas las mutaciones somáticas de un tumor requeriría una cobertura de secuenciación de 30 veces el genoma del tumor y un tejido normal equivalente.[30]​ En comparación, el borrador original del genoma humano tenía una cobertura de aproximadamente 65 veces.[31]

Uno de los principales objetivos de la secuenciación del genoma del cáncer es identificar las mutaciones impulsoras: cambios genéticos que aumentan la tasa de mutación en la célula, lo que conduce a una evolución tumoral más rápida y a la metástasis.[32]​ Es difícil determinar las mutaciones impulsoras sólo a partir de la secuencia del ADN, pero las mutaciones impulsoras suelen ser las más compartidas entre los tumores, se agrupan en torno a oncogenes conocidos y tienden a ser no silenciosas.[30]​ Las mutaciones pasajeras, que no son importantes en la progresión de la enfermedad, están distribuidas al azar por todo el genoma. Se ha estimado que el tumor medio es portador de unas 80 mutaciones somáticas, de las que se espera que menos de 15 sean impulsoras.[33]

En la actualidad, se están desarrollando diferentes softwares con el objetivo de identificar aquellas variantes de nucleótido único que guarden relación directa con la transformación celular y el desarrollo de tumores. Un estudio reciente comparó la precisión de tres de estos programas comúnmente llamados detectores de mutaciones (en inglésmutation caller's), en un estudio sobre reproducibilidad en muestras de cáncer de mama utilizando WGS y WES. Los tres programas analizados fueron MuTect2, SomaticSniper y Strelka2, y los que mostraron un mejor rendimiento fueron: MuTect2 cuando se realizó un WES, y MuTect2 y Strelka2 para WGS.[34]​ Además, el mismo trabajo publicó las siguientes recomendaciones con el objetivo de mejorar la reproducibilidad de los datos al trabajar con WGS en muestras de cáncer:

  • Cantidad de ADN de entrada y construcción de librería: el tamaño de fragmento ideal estaría entre 300-600 pares de bases (pb), el método de fragmentación sonicación para fragmentos de más de 250pb y enzimático para fragmentos mejores de 200pb. La cantidad de ADN utilizada va a depender de la librería escogida, 200-1000ng para TruSeq PCR-free, 10-200ng para TruSeq-Nano o 1-100ng para Nextera Flex.
  • Cobertura de lectura y seguro de calidad: si el porcentaje de células tumorales presente en la muestra es mayor al 50%, se recomienda una cobertura de lectura de 50x, pero si el contenido es menor al 50%, se recomienda una cobertura de 100x. Además, para asegurar unos resultados fiables se recomienda que las lecturas redundantes sean menores a un 30%, que las lecturas mapeables sean superiores a un 95%, que el contenido en GC esté entre 40-43% y un GIV menor a 1,5.
  • Programas de alineamiento: se utilizaron se utilizaron tres Bowtie2, BWA-MEM y NovoAlign pero no se encontraron diferencias significativas para WGS.
  • Detectores de mutaciones: de los tres utilizados (MuTect2, SomaticSniper y Strelka2), MuTect2 y Strelka2 obtuvieron mejores resultados.

Además, como observaciones finales en este trabajo se concluyó que la detección de mutaciones en cancer es un proceso inherentemente integrado del cual cada componente y cada combinación de estos es igual de importante y, finalmente, que los estudios de revisión y validación deben realizarse teniendo en cuenta todo el proceso, desde la muestra hasta el resultado.

Un análisis genómico personal requiere una mayor caracterización funcional de los genes mutantes detectados y el desarrollo de un modelo básico del origen y la progresión del tumor. Este análisis puede utilizarse para hacer recomendaciones de tratamiento farmacológico.[22][23]​ Hasta febrero de 2012, esto sólo se ha hecho en los ensayos clínicos con pacientes diseñados para evaluar el enfoque de genómica personal para el tratamiento del cáncer.[23][35]

Limitaciones

Un cribado a gran escala de mutaciones somáticas en tumores de mama y colorrectales demostró que muchas mutaciones de baja frecuencia contribuyen poco a la supervivencia celular.[33]​ Si la supervivencia de las células viene determinada por muchas mutaciones de escaso efecto, es poco probable que la secuenciación del genoma descubra un único "talón de Aquiles" para los fármacos contra el cáncer. Sin embargo, las mutaciones somáticas tienden a agruparse en un número limitado de vías de señalización,[36][33][30]​ que son posibles objetivos de tratamiento.

Los cánceres son poblaciones heterogéneas de células. Cuando los datos de la secuencia se obtienen de un tumor completo, se pierde la información sobre las diferencias en la secuencia y el patrón de expresión entre las células.[37]​ Esta dificultad puede mejorarse con el análisis de una sola célula.

Las propiedades clínicamente significativas de los tumores, incluida la resistencia a los fármacos, a veces están causadas por reordenamientos a gran escala del genoma, más que por mutaciones individuales. En este caso, la información sobre las variantes de un solo nucleótido tendrá una utilidad limitada.[37]

La secuenciación del genoma del cáncer puede utilizarse para proporcionar información clínicamente relevante en pacientes con tipos de tumores raros o novedosos. Traducir la información de la secuencia en un plan de tratamiento clínico es muy complicado, requiere expertos de muchos campos diferentes y no está garantizado que conduzca a un plan de tratamiento eficaz.[23][22]

Incidentaloma

El incidentalome es el conjunto de variantes genómicas detectadas no relacionadas con el cáncer en estudio.[38]​ (El término es un juego de palabras con el nombre de incidentaloma, que designa a los tumores y crecimientos detectados en las imágenes de todo el cuerpo por casualidad).[39]​ La detección de estas variantes puede dar lugar a medidas adicionales, como la realización de más pruebas o el control del estilo de vida.[38]

Modelo estadístico JaBbA v1

La genómica del cáncer es un hito para la ciencia que cada día trata de integrar distintas técnicas a su protocolo, de esta manera Según Zi-Ning Choo et al.(2023) Determinan que la secuenciación de lectura corta ha contribuido mucho pero creen que este modelo puede pasar por alto variantes estructurales que podrían  mostrar algún tipo de información relevante, por lo mismo han realizado experimentaciones utilizando modelos estadísticos mejorados como JaBbA v1 a partir del modelo anterior (v0.1; ref 2) , realizando el análisis de 1330 genomas completos en los cuales las variantes estructurales se resolvieron a través de lecturas cortas en un 87%, así como determinaron la presencia de secuencias a las que se denominaron como neotelómeros que lo catalogan dentro de los mecanismos distintivos del cáncer como alargamiento de telómeros para alcanzar la proliferación indefinida, estos datos se confirmaron a través del análisis de 38 casos de cáncer de mama y melanoma entre datos de muestras normales y carcinogénicas, aplicados al logaritmo estadístico mejorado con mayor rendimiento de secuenciación, además adiciona la capacidad de procesar datos adicionales a mayor escala. En el presente estudio se pudo determinar que las SRS (Secuenciación de secuencias cortas) detecta la mayoría de extremos de ruptura de variantes estructurales que se suponía ni analizaban, esto se demostró implementando análisis de lecturas largas LRS que mejoran en una pequeña proporción la detección de estos extremos, pero este tipo de secuencias largas aumentan la sensibilidad de las variantes estructurales somáticas de un tamaño ≤10 kb).[40]

Véase también

Referencias

  1. Samuel Levy (October 2007). «The Diploid Genome Sequence of an Individual Human». PLOS Biology 5 (10): e254. PMC 1964779. PMID 17803354. doi:10.1371/journal.pbio.0050254. 
  2. David A. Wheeler (April 2008). «The complete genome of an individual by massively parallel DNA sequencing». Nature 452 (7189): 872-6. Bibcode:2008Natur.452..872W. PMID 18421352. doi:10.1038/nature06884. 
  3. Herberts, Cameron; Annala, Matti; Sipola, Joonatan; Ng, Sarah W. S.; Chen, Xinyi E.; Nurminen, Anssi; Korhonen, Olga V.; Munzur, Aslı D. et al. (2022-08). «Deep whole-genome ctDNA chronology of treatment-resistant prostate cancer». Nature (en inglés) 608 (7921): 199-208. ISSN 1476-4687. doi:10.1038/s41586-022-04975-9. Consultado el 7 de enero de 2023. 
  4. Sjoblom, T.; Jones, S.; Wood, L. D.; Parsons, D. W.; Lin, J.; Barber, T. D.; Mandelker, D.; Leary, R. J. et al. (2006). «The Consensus Coding Sequences of Human Breast and Colorectal Cancers». Science 314 (5797): 268-274. Bibcode:2006Sci...314..268S. ISSN 0036-8075. PMID 16959974. doi:10.1126/science.1133427. 
  5. Wood, L. D.; Parsons, D. W.; Jones, S.; Lin, J.; Sjoblom, T.; Leary, R. J.; Shen, D.; Boca, S. M. et al. (2007). «The Genomic Landscapes of Human Breast and Colorectal Cancers». Science 318 (5853): 1108-1113. Bibcode:2007Sci...318.1108W. ISSN 0036-8075. PMID 17932254. doi:10.1126/science.1145720. 
  6. Timothy Ley (November 2008). «DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome». Nature 456 (7218): 66-72. Bibcode:2008Natur.456...66L. PMC 2603574. PMID 18987736. doi:10.1038/nature07485. 
  7. Sohrab P. Shah (October 2009). «Mutational evolution in a lobular breast tumour profiled at single nucleotide resolution». Nature 461 (7265): 809-13. Bibcode:2009Natur.461..809S. PMID 19812674. doi:10.1038/nature08489. 
  8. Erin D. Pleasance (December 2009). «A small-cell lung cancer genome with complex signatures of tobacco exposure». Nature 463 (7278): 184-90. PMC 2880489. PMID 20016488. doi:10.1038/nature08629. 
  9. Erin D. Pleasance (December 2009). «A comprehensive catalogue of somatic mutations from a human cancer genome». Nature 463 (7278): 191-6. PMC 3145108. PMID 20016485. doi:10.1038/nature08658. 
  10. Michael F. Berger (February 2011). «The genomic complexity of primary human prostate cancer». Nature 470 (7333): 214-20. Bibcode:2011Natur.470..214B. PMC 3075885. PMID 21307934. doi:10.1038/nature09744. 
  11. E Pinnisi (May 1997). «A catalog of cancer genes at the click of a mouse». Science 267 (5315): 1023-4. PMID 9173535. S2CID 5832728. doi:10.1126/science.276.5315.1023. 
  12. B Kuska (December 1996). «Cancer genome anatomy project set for takeoff». Journal of the National Cancer Institute 88 (24): 1801-3. PMID 8961968. doi:10.1093/jnci/88.24.1801. 
  13. «Cancer Genome Anatomy Project (CGAP) | Cancer Genome Characterization Initiative (CGCI)». Cgap.nci.nih.gov. Archivado desde el original el 14 de octubre de 2011. Consultado el 14 de septiembre de 2013. 
  14. «Copia archivada». Archivado desde el original el 3 de mayo de 2011. Consultado el 29 de enero de 2022. 
  15. «COSMIC: Cancer Gene census». Sanger.ac.uk. Archivado desde el original el 2 de julio de 2013. Consultado el 14 de septiembre de 2013. 
  16. www-core (Web team) (30 de enero de 2013). «Cancer genome project (CGP) - Wellcome Trust Sanger Institute». Sanger.ac.uk. Archivado desde el original el 2 de julio de 2013. Consultado el 14 de septiembre de 2013. 
  17. a b c «International Cancer Genome Consortium». Icgc.org. Consultado el 14 de septiembre de 2013. 
  18. International Cancer Genome Consortium (April 2010). «International network of cancer genome projects». Nature 464 (7291): 993-8. Bibcode:2010Natur.464..993T. PMC 2902243. PMID 20393554. doi:10.1038/nature08987. 
  19. Kenneth W Kinzler (October 1996). «Lessons from Hereditary Colorectal Cancer». Cell 87 (2): 159-70. PMID 8861899. doi:10.1016/S0092-8674(00)81333-1. 
  20. Peter A. Jones (February 2007). «The Epigenomics of Cancer». Cell 128 (4): 683-92. PMC 3894624. PMID 17320506. doi:10.1016/j.cell.2007.01.029. 
  21. Angela H. Ting (December 2006). «The cancer epigenome--components and functional correlates». Genes & Development 20 (23): 3215-31. PMID 17158741. doi:10.1101/gad.1464906. 
  22. a b c Jone, S.J. (2010). «Evolution of an adenocarcinoma in response to selection by targeted kinase inhibitors.». Genome Biology 11 (8): R82. PMC 2945784. PMID 20696054. doi:10.1186/gb-2010-11-8-r82. 
  23. a b c d Roychowdhury, S. (November 2011). «Personalized oncology through integrative high-throughput sequencing: a pilot study». Science Translational Medicine 3 (111): 111ra121. PMC 3476478. PMID 22133722. doi:10.1126/scitranslmed.3003161. 
  24. Joseph R. Testa (September 1979). «Evolution of Karyotypes in Acute Nonlymphocytic Leukemia». Cancer Research 39 (9): 3619-27. PMID 476688. 
  25. Garson OM (July 1989). «Cytogenetic studies of 103 patients with acute myelogenous leukemia in relapse». Cancer Genetics and Cytogenetics 40 (2): 187-202. PMID 2766243. doi:10.1016/0165-4608(89)90024-1. 
  26. a b Ding, L. (January 2012). «Clonal evolution in relapsed acute myeloid leukaemia revealed by whole-genome sequencing». Nature 481 (7382): 506-10. Bibcode:2012Natur.481..506D. PMC 3267864. PMID 22237025. doi:10.1038/nature10738. 
  27. Frederick Sanger (December 1977). «DNA sequencing with chain-terminating inhibitors». PNAS 74 (12): 104-8. Bibcode:1977PNAS...74.5463S. PMID 1422003. doi:10.1073/pnas.74.12.5463. 
  28. Allan Maxam; Walter Gilbert (February 1977). «A new method for sequencing DNA». PNAS 74 (2): 560-4. Bibcode:1977PNAS...74..560M. PMC 392330. PMID 265521. doi:10.1073/pnas.74.2.560. 
  29. Chandra Shekhar Pareek (November 2011). «Sequencing technologies and genome sequencing». Journal of Applied Genetics 52 (4): 413-35. PMC 3189340. PMID 21698376. doi:10.1007/s13353-011-0057-x. 
  30. a b c Straton, M. R.; Campbell, P. J.; Futreal, P.A. (April 2009). «The cancer genome». Nature 458 (7239): 719-724. Bibcode:2009Natur.458..719S. PMC 2821689. PMID 19360079. doi:10.1038/nature07943. 
  31. Lander, E.S. (February 2001). «Initial sequencing and analysis of the human genome». Nature 409 (6822): 860-921. PMID 11237011. doi:10.1038/35057062. 
  32. Wong, K. M.; Hudson, T. J.; McPherson, J. D. (September 2011). «Unraveling the genetics of cancer: genome sequencing and beyond». Annual Review of Genomics and Human Genetics 12: 407-30. PMID 21639794. doi:10.1146/annurev-genom-082509-141532. 
  33. a b c Wood, L.D. (November 2007). «The genomic landscapes of human breast and colorectal cancers». Science 318 (5853): 8-9. Bibcode:2007Sci...318.1108W. PMID 17932254. S2CID 7586573. doi:10.1126/science.1145720. 
  34. Zhao, Yongmei; Fang, Li Tai; Shen, Tsai-wei; Choudhari, Sulbha; Talsania, Keyur; Chen, Xiongfong; Shetty, Jyoti; Kriga, Yuliya; Tran, Bao; Zhu, Bin; Chen, Zhong; Chen, Wanqiu; Wang, Charles; Jaeger, Erich; Meerzaman, Daoud; Lu, Charles; Idler, Kenneth; Ren, Luyao; Zheng, Yuanting; Shi, Leming; Petitjean, Virginie; Sultan, Marc; Hung, Tiffany; Peters, Eric; Drabek, Jiri; Vojta, Petr; Maestro, Roberta; Gasparotto, Daniela; Kõks, Sulev; Reimann, Ene; Scherer, Andreas; Nordlund, Jessica; Liljedahl, Ulrika; Foox, Jonathan; Mason, Christopher E.; Xiao, Chunlin; Hong, Huixiao; Xiao, Wenming (9 de noviembre de 2021). «Whole genome and exome sequencing reference datasets from a multi-center and cross-platform benchmark study». Scientific Data 8 (1): 296. doi:10.1038/s41597-021-01077-5. 
  35. Jones, S. (September 2008). «Core signaling pathways in human pancreatic cancers revealed by global genomic analyses». Science 321 (5897): 1801-6. Bibcode:2008Sci...321.1801J. PMC 2848990. PMID 18772397. doi:10.1126/science.1164368. 
  36. Miklos, G. L. (May 2005). «The human cancer genome project: one more misstep in the war on cancer». Nature Biotechnology 23 (5): 535-7. PMID 15877064. S2CID 39302093. doi:10.1038/nbt0505-535. 
  37. a b Duesberg, P.; Rasnick, D. (2004). «Aneuploidy approaching a perfect score in predicting and preventing cancer: highlights from a conference held in Oakland, CA in January, 2004.». Cell Cycle 3 (6): 823-8. PMID 15197343. doi:10.4161/cc.3.6.938. 
  38. a b Kohane, I. S.; Masys, D. R.; Altman, R. B. (2006). «The Incidentalome: A Threat to Genomic Medicine». JAMA 296 (2): 212-215. PMID 16835427. doi:10.1001/jama.296.2.212. 
  39. Cancer Gene Sequencing Raises New Medical Ethics Issues by Janis C. Kelly. Sep 06, 2013
  40. Choo, Zi-Ning; Behr, Julie M.; Deshpande, Aditya; Hadi, Kevin; Yao, Xiaotong; Tian, Huasong; Takai, Kaori; Zakusilo, George et al. (2023-12). «Most large structural variants in cancer genomes can be detected without long reads». Nature Genetics (en inglés) 55 (12): 2139-2148. ISSN 1546-1718. doi:10.1038/s41588-023-01540-6. Consultado el 4 de diciembre de 2024. 


Enlaces externos