Unha superfamilia de proteínas, na clasificación das proteínas, é o grupo máis grande (clado) de proteínas do que se pode inferir que teñen un antepasado común (ver homoloxía). Xeralmente a existencia desta ascendencia común está baseada no seu aliñamento estrutural[1] e semellanza do seu mecanismo de acción aínda que non se observa semellanza de secuencia evidente.[2] As superfamilias conteñen normalmente varias familias de proteínas, constituídas por proteínas que mostran unha semellanza de secuencia. O termo clan de proteínas úsase tamén comunmente para as superfamilias de proteases baseándose no sistema de clasificación de proteases MEROPS.[2]
Os membros dunha superfamilia xeralmente non mostran homoloxía de secuencias detectable. Normalmente é imposible aliñalas debido á gran frecuencia que presentan de insercións e delecións. No clan PA das proteases, por exemplo, non hai ningún residuo simple conservado na superfamilia, nin sequera na tríade catalítica. Inversamente, as familias que constitúen unha superfamilia están definidas polo aliñamento de secuencias dos seus membros; por exemplo a familia da protease C04 pertencente ao clan PA.
A estrutura das proteínas está moito máis conservada evolutivamente que a secuencia (como tamén se pode exemplificar co clan PA das proteases). Hai moi poucos residuos que mostren conservación da secuencia de aminoácidos; porén, hai elementos estruturais secundarios que están altamente consevados como tamén os motivos estruturais terciarios que forman. Os programas de aliñamento estrutural como DALI poden utilizar a estrutura en 3D dunha proteína de interese para atopar proteínas que teñan pregamentos similares. Comparando as estruturas en 3D poden identificarse exemplos de parentescos evolutivos que non se descobren coa comparación de secuencias.
O mecanismo catalítico de encimas pertencentes a unha superfamilia está normalmente conservado, aínda que a especificidade de substrato pode ser significativamente diferente. Os residuos catalíticos tamén tenden a aparecer na mesma orde na secuencia da proteína. De novo, o clan PA das proteases pode servir de exemplo. Mesmo en familias dunha superfamilia que utilizan distintos nucleófilos, todas realizan unha catálise nucleofílica covalente sobre as proteínas, péptidos ou aminoácidos por medio dun mecanismo encimático similar.
Importancia evolutiva
As superfamilias de proteínas representan os límites actuais da nosa capacidade de identificar antepasados comúns moleculares.[3] Son o grupo evolutivo meirande baseado en probas directas que é posible establecer actualmente. Están, por tanto, entre os eventos evolutivos máis antigos que se poden estudar hoxe. Algunhas superfamilias teñen membros en todos os reinos de seres vivos, o que indica que o último antepasado común desa superfamilia era o último antepasado común universal de todos os seres vivos (LUCA).[4]
Os membros dunha superfamilia poden atoparse en diferentes especies, e a proteína ancestral é a forma da proteína que existía na especie ancestral (ortoloxía). Inversamente, ditas proteínas poden encontrarse na mesma especie, pero evolucionaron a partir dunha soa proteína cuxo xene foi duplicado no xenoma (paraloxía).
Superfamilia de barril TIM. Os seus membros comparten unha grande estrutura de barril α8β8. É un dos pregamentos proteicos máis comúns, pero a monofilia desta familia aínda se discute.[8][9]
PASS2 - Protein Alignment as Structural Superfamilies v2
SUPERFAMILY - Libraría de HMMs que representa superfamilias e bases de datos de anotacións (superfamilias e familias) para todos os organismos completamente secuenciados
SCOP e CATH - Clasificacións de estruturas de proteínas en superfamilias, familias e dominios
Igualmente, hai algoritmos que buscan no PDB proteínas con homoloxia estrutural cunha estrutura diana dada; por exemplo:
DALI - Aliñamento estrutural baseado nun método de matriz de aliñamento de distancia.
Notas
↑Holm, L; Rosenström, P (July 2010). "Dali server: conservation mapping in 3D.". Nucleic Acids Research38 (Web Server issue): W545–9. PMID20457744. doi:10.1093/nar/gkq366.
↑Carr PD, Ollis DL (2009). "Alpha/beta hydrolase fold: an update". Protein Pept. Lett.16 (10): 1137–48. PMID19508187.
↑Nardini M, Dijkstra BW (December 1999). "Alpha/beta hydrolase fold enzymes: the family keeps growing". Curr. Opin. Struct. Biol.9 (6): 732–7. PMID10607665. doi:10.1016/S0959-440X(99)00037-8.
↑Nagano, N; Orengo, CA; Thornton, JM (Aug 30, 2002). "One fold with many functions: the evolutionary relationships between TIM barrel families based on their sequences, structures and functions.". Journal of Molecular Biology321 (5): 741–65. PMID12206759. doi:10.1016/s0022-2836(02)00649-6.
↑"SCOP". Arquivado dende o orixinal o 29 de xullo de 2014. Consultado o 28 May 2014.
↑Mohamed, MF; Hollfelder, F (Jan 2013). "Efficient, crosswise catalytic promiscuity among enzymes that catalyze phosphoryl transfer.". Biochimica et Biophysica Acta1834 (1): 417–24. PMID22885024. doi:10.1016/j.bbapap.2012.07.015.
↑Bork P, Holm L, Sander C (September 1994). "The immunoglobulin fold. Structural classification, sequence patterns and common core". J. Mol. Biol.242 (4): 309–20. PMID7932691. doi:10.1006/jmbi.1994.1582.
↑Branden, Carl; Tooze, John (1999). Introduction to protein structure (2nd ed.). New York: Garland Pub. ISBN978-0815323051.
↑Bolognesi, M; Onesti, S; Gatti, G; Coda, A; Ascenzi, P; Brunori, M (1989). "Aplysia limacina myoglobin. Crystallographic analysis at 1.6 a resolution". Journal of molecular biology205 (3): 529–44. PMID2926816.
↑Vetter IR, Wittinghofer A (November 2001). "The guanine nucleotide-binding switch in three dimensions". Science294 (5545): 1299–304. PMID11701921. doi:10.1126/science.1062023.