Contig

Überlappende Sequenzen aus der PET-DNA-Sequenzierung.

Ein Contig (von engl. contiguous = angrenzend, zusammenhängend) ist ein Satz überlappender DNA- oder Protein-Stücke (reads), die von derselben genetischen Quelle stammen.[1] Ein solches Contig kann dazu genutzt werden, die Original-DNA-Sequenz dieser genetischen Quelle (z. B. die Sequenz eines Chromosoms) abzuleiten.

Eine Contig-Karte zeigt die relative Reihenfolge einer zusammengehörenden Contig-Bibliothek, die z. B. ein komplettes Chromosom darstellen.

MAGs und GVMAGs

Ein damit zusammenhängender Begriff ist ein MAG (metagenome-assembled genome ‚Metagenom-assembliertes Genom‘), das ein gesamtes aus solchen Bruchstücken zusammengesetztes vermutetes (vorhergesagtes) Genom bezeichnet.[2][3]

Ein davon abgeleiteter Begriff ist GVMAG (giant virus MAG), der ein Riesenvirus-MAG bezeichnet und in der Metagenomik der Nucleocytoviricota (NCLDVs) gebräuchlich ist.

Die durch fehlerhafte Aneinanderreihung entstandenen Sequenzen nennt man (Sequenz-)Chimären. zur Erkennung solcher Fehler wurde beispielsweise von Phil Hugenholtz ab 2001 das Programm Bellerophon entwickelt.[4][5]

Sequenzierung

Bei der DNA-Sequenzierung und insbesondere beim Shotgun Sequencing muss die DNA-Sequenz bzw. bei der De-Novo-Peptidsequenzierung muss die Aminosäuresequenz durch Aneinanderreihung der verschiedenen Contigs ermittelt werden.[6] Für eine Genomsequenzierung wird zur Vorbereitung oftmals die genomische DNA fragmentiert und die Bruchstücke anschließend vervielfältigt. Die einzelnen DNA-Stränge besitzen dann unterschiedliche, teilweise überlappende Sequenzen, die durch die Aneinanderreihung die vollständige Sequenz ergeben.[7][8]

Ein Contig entsteht unter der Annahme, dass die zugehörigen Reads korrekt sind. Es gibt aber bei allen bisher genutzten Sequenziermethoden Schwächen, die oft auch bekannt sind und deren Einfluss von den Herstellern zu minimieren versucht wird. Ein Contig kann auch schon aus einem einzelnen Read bestehen, aber jeder überlappende Read (am besten aus verschiedenen Richtungen oder sogar durch eine andere Sequenziermethode) erhöht die Wahrscheinlichkeit, dass hier die Wirklichkeit zu sehen ist.

Einzelnachweise

  1. A. Guthals, K. R. Clauser, N. Bandeira: Shotgun protein sequencing with meta-contig assembly. In: Molecular & cellular proteomics : MCP. Band 11, Nummer 10, Oktober 2012, ISSN 1535-9484, S. 1084–1096, doi:10.1074/mcp.M111.015768, PMID 22798278, PMC 3494147 (freier Volltext).
  2. Ibrahim F. Farag, Rui Zhao, Jennifer F. Biddle: “Sifarchaeota,” a Novel Asgard Phylum from Costa Rican Sediment Capable of Polysaccharide Degradation and Anaerobic Methylotrophy (Memento vom 3. Mai 2021 im Internet Archive), in: ASM Appl Environ Microbiol 87:e02584-20, Epub 13. April 2021, doi:10.1128/AEM.02584-20, PMID 33608286.
    Preprint: “Sifarchaeota” a novel Asgard phylum capable of polysaccharide degradation and anaerobic methylotrophy, auf: CSH bioRxiv vom 14. Oktober 2020, doi:10.1101/2020.10.14.339440, ResearchGate.
  3. Eva F. Caceres: Genomic and evolutionary exploration of Asgard archaea, Doctoral thesis, Uppsala University, Disciplinary Domain of Science and Technology, Biology, Department of Cell and Molecular Biology, 12. November 2019. Siehe insbesondere §Genome binning.
  4. JGI Faces: Phil Hugenholtz—Bug Hunter from Down-Under (PDF; 1,3 MB). In: the PRIMER. DOE Joint Genome Institute, US Department of Energy, Office of Science, Band 2, Nr. 1, S. 2–3, Januar 2005.
  5. Phil Hugenholtz. JGI, DOE Joint Genome Institute, US Department of Energy. Research Groups: Microbial Ecology. Stand: 11. Juni 2008, Memento im Webarchiv vom 26. August 2010.
  6. Rodger Staden: A strategy of DNA sequencing employing computer programs. In: Nucleic Acids Research. 7. Jahrgang, 1979, S. 2601–2610, PMC 327874 (freier Volltext) – (englisch).
  7. S. H. Lin, Y. C. Liao: CISA: contig integrator for sequence assembly of bacterial genomes. In: PloS one. Band 8, Nummer 3, 2013, ISSN 1932-6203, S. e60843, doi:10.1371/journal.pone.0060843, PMID 23556006, PMC 3610655 (freier Volltext).
  8. Z. Frenkel, E. Paux, D. Mester, C. Feuillet, A. Korol: LTC: a novel algorithm to improve the efficiency of contig assembly for physical mapping in complex genomes. In: BMC Bioinformatics. Band 11, 2010, ISSN 1471-2105, S. 584, doi:10.1186/1471-2105-11-584, PMID 21118513, PMC 3098104 (freier Volltext).

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.