T-Coffee

T-Coffee
Información general
Tipo de programa Bioinformática
Autor Cedric Notredame
Desarrollador Centro de Regulación Genómica
Licencia GPL
Información técnica
Programado en C
Versiones
Última versión estable 13.45.0.4846264 ()
Enlaces

En bioinformática, T-Coffee (del inglés Tree-based Consistency Objective Function For alignment Evaluation; en español: función objetivo de coherencia basada en árbol para evaluación de alineamientos) es un software para el alineamiento múltiple de secuencias, utilizando un enfoque progresivo.[1]

Este software está basado en métodos de consistencia, es decir, que sea capaz de generar alineamientos múltiples que representen con la mayor fidelidad el alineamiento de las secuencias por parejas.[1]​ Genera una biblioteca de alineamientos de pares para guiar el alineamiento múltiple de secuencias. Puede combinar, también, alineamientos múltiples obtenidos previamente y, en las últimas versiones, puede usar información estructural de archivos PDB (3D-Coffee). Tiene características avanzadas para evaluar la calidad de los alineamientos, así como algunas capacidades para identificar la ocurrencia de motivos (Mocca). Por defecto, el alineamiento lo produce en el formato "aln" de Clustal, aunque también puede generar formatos PIR, MSF y FASTA. Soporta formatos FASTA y PIR para datos de partida.

Comparación con otros softwares de alineamiento

El formato que T-Coffee denomina "Clustal" es lo bastante diferente del formato de salida de ClustalW/X como para que muchos programas que soportan el formato de Clustal no puedan leerlo; afortunadamente, ClustalX puede importar salidas de T-Coffee, por lo que una sencilla solución para este punto en cuestión es importar la salida de T-Coffee en ClustalX y re-exportarla.[cita requerida]

Extensiones

  • M-Coffee: un modo especial de T-Coffee que permite combinar el resultado de múltiples paquetes de alineamiento múltiple de secuencias (Muscle, ClustalW, Mafft, ProbCons, etc.). Los alineamientos resultantes son ligeramente mejores que si se realizasen por separado; más importante, el programa indica las regiones de alineamiento donde los diferentes paquetes concuerdan. Las regiones con un alto grado de homología normalmente alinean satisfactoriamente.[2]
  • Expresso y 3D-Coffee: estas herramientas permiten combinar secuencias y estructuras en un alineamiento. Los alineamientos basados en estructuras pueden realizarse mediante los alineadores más comunes, tales como TMalign, Mustang y SAP.[3][4][5][6]
  • R-Coffee: modo especial de T-Coffee para alineamiento de secuencias de ARN, utilizando información de estructuras secundarias.[7][8]
  • PSI-Coffee: alineamiento de proteínas escasamente relacionadas mediante extensión de homología (lento y preciso).[9][10]
  • TM-Coffee: alineamiento de proteínas transmembrana mediante extensión de homología.[11]
  • Pro-Coffee: alineamiento de regiones homólogas de proteínas.[12]
  • Accurate: permite combinar automáticamente los modos más precisos para ADN, ARN y proteínas (experimental).[13]
  • Combine: combina dos o más alineamientos múltiples de secuencias en un solo alineamiento.[1][14]

Véase también

Referencias

  1. a b c Notredame, C.; Higgins, D. G.; Heringa, J. (8 de septiembre de 2000). «T-Coffee: A novel method for fast and accurate multiple sequence alignment». Journal of Molecular Biology 302 (1): 205-217. ISSN 0022-2836. PMID 10964570. doi:10.1006/jmbi.2000.4042. Consultado el 15 de julio de 2023. 
  2. Wallace, Iain M.; O'Sullivan, Orla; Higgins, Desmond G.; Notredame, Cedric (2006). «M-Coffee: combining multiple sequence alignment methods with T-Coffee». Nucleic Acids Research 34 (6): 1692-1699. ISSN 1362-4962. PMC 1410914. PMID 16556910. doi:10.1093/nar/gkl091. Consultado el 26 de diciembre de 2023. 
  3. Armougom, Fabrice; Moretti, Sébastien; Poirot, Olivier; Audic, Stéphane; Dumas, Pierre; Schaeli, Basile; Keduas, Vladimir; Notredame, Cedric (1 de julio de 2006). «Expresso: automatic incorporation of structural information in multiple sequence alignments using 3D-Coffee». Nucleic Acids Research 34 (Web Server issue): W604-608. ISSN 1362-4962. PMC 1538866. PMID 16845081. doi:10.1093/nar/gkl092. Consultado el 26 de diciembre de 2023. 
  4. Zhang, Yang; Skolnick, Jeffrey (2005). «TM-align: a protein structure alignment algorithm based on the TM-score». Nucleic Acids Research 33 (7): 2302-2309. ISSN 1362-4962. PMC 1084323. PMID 15849316. doi:10.1093/nar/gki524. Consultado el 26 de diciembre de 2023. 
  5. Konagurthu, Arun S.; Whisstock, James C.; Stuckey, Peter J.; Lesk, Arthur M. (15 de agosto de 2006). «MUSTANG: a multiple structural alignment algorithm». Proteins 64 (3): 559-574. ISSN 1097-0134. PMID 16736488. doi:10.1002/prot.20921. Consultado el 26 de diciembre de 2023. 
  6. Sun, Zheng; Tian, Weidong (2012). «SAP--a sequence mapping and analyzing program for long sequence reads alignment and accurate variants discovery». PloS One 7 (8): e42887. ISSN 1932-6203. PMC 3413671. PMID 22880129. doi:10.1371/journal.pone.0042887. Consultado el 26 de diciembre de 2023. 
  7. Wilm, Andreas; Higgins, Desmond G.; Notredame, Cédric (Mayo de 2008). «R-Coffee: a method for multiple alignment of non-coding RNA». Nucleic Acids Research 36 (9): e52. ISSN 1362-4962. PMC 2396437. PMID 18420654. doi:10.1093/nar/gkn174. Consultado el 26 de diciembre de 2023. 
  8. Moretti, Sébastien; Wilm, Andreas; Higgins, Desmond G.; Xenarios, Ioannis; Notredame, Cédric (1 de julio de 2008). «R-Coffee: a web server for accurately aligning noncoding RNA sequences». Nucleic Acids Research 36 (Web Server issue): W10-13. ISSN 1362-4962. PMC 2447777. PMID 18483080. doi:10.1093/nar/gkn278. Consultado el 26 de diciembre de 2023. 
  9. Di Tommaso, Paolo; Moretti, Sebastien; Xenarios, Ioannis; Orobitg, Miquel; Montanyola, Alberto; Chang, Jia-Ming; Taly, Jean-François; Notredame, Cedric (2011-07). «T-Coffee: a web server for the multiple sequence alignment of protein and RNA sequences using structural information and homology extension». Nucleic Acids Research 39 (Web Server issue): W13-17. ISSN 1362-4962. PMC 3125728. PMID 21558174. doi:10.1093/nar/gkr245. Consultado el 26 de diciembre de 2023. 
  10. Kemena, Carsten; Notredame, Cedric (1 de octubre de 2009). «Upcoming challenges for multiple sequence alignment methods in the high-throughput era». Bioinformatics (Oxford, England) 25 (19): 2455-2465. ISSN 1367-4811. PMC 2752613. PMID 19648142. doi:10.1093/bioinformatics/btp452. Consultado el 26 de diciembre de 2023. 
  11. Chang, Jia-Ming; Di Tommaso, Paolo; Taly, Jean-François; Notredame, Cedric (28 de marzo de 2012). «Accurate multiple sequence alignment of transmembrane proteins with PSI-Coffee». BMC bioinformatics. 13 Suppl 4 (Suppl 4): S1. ISSN 1471-2105. PMC 3303701. PMID 22536955. doi:10.1186/1471-2105-13-S4-S1. Consultado el 26 de diciembre de 2023. 
  12. Erb, Ionas; González-Vallinas, Juan R.; Bussotti, Giovanni; Blanco, Enrique; Eyras, Eduardo; Notredame, Cédric (Abril de 2012). «Use of ChIP-Seq data for the design of a multiple promoter-alignment method». Nucleic Acids Research 40 (7): e52. ISSN 1362-4962. PMC 3326335. PMID 22230796. doi:10.1093/nar/gkr1292. Consultado el 26 de diciembre de 2023. 
  13. «T-Coffee Server». tcoffee.crg.eu. Consultado el 26 de diciembre de 2023. 
  14. Di Tommaso, Paolo; Moretti, Sebastien; Xenarios, Ioannis; Orobitg, Miquel; Montanyola, Alberto; Chang, Jia-Ming; Taly, Jean-François; Notredame, Cedric (2011-07). «T-Coffee: a web server for the multiple sequence alignment of protein and RNA sequences using structural information and homology extension». Nucleic Acids Research 39 (Web Server issue): W13-17. ISSN 1362-4962. PMC 3125728. PMID 21558174. doi:10.1093/nar/gkr245. Consultado el 26 de diciembre de 2023. 

Enlaces externos