Una superfamilia de proteínas es la agrupación más grande ( clado ) de proteínas para las cuales se puede inferir una ascendencia común (ver homología ). Por lo general, esta ascendencia común se infiere a partir de la alineación estructural [1] y la similitud mecanicista, incluso si no es evidente ninguna similitud de secuencia. [2] La homología de secuencia se puede deducir incluso si no es evidente (debido a la baja similitud de secuencia). Las superfamilias generalmente contienen varias familias de proteínas que muestran similitud de secuencia dentro de cada familia. El término clan de proteínas se usa comúnmente para las superfamilias de proteasas y glicosil hidrolasas basadas en los sistemas de clasificación MEROPS y CAZy . [2] [3]
Las superfamilias de proteínas se identifican mediante diversos métodos. Los miembros estrechamente relacionados se pueden identificar mediante métodos distintos de los necesarios para agrupar a los miembros más divergentes desde el punto de vista evolutivo.
Similitud de secuencia
Históricamente, la similitud de diferentes secuencias de aminoácidos ha sido el método más común para inferir homología . [5] La similitud de secuencias se considera un buen predictor de parentesco, ya que las secuencias similares son más probablemente el resultado de la duplicación genética y la evolución divergente , en lugar del resultado de la evolución convergente . La secuencia de aminoácidos suele estar más conservada que la secuencia de ADN (debido al código genético degenerado ), por lo que es un método de detección más sensible. Dado que algunos de los aminoácidos tienen propiedades similares (p. ej., carga, hidrofobicidad, tamaño), las mutaciones conservadoras que los intercambian suelen ser neutrales a la función. Las regiones de secuencia más conservadas de una proteína a menudo corresponden a regiones funcionalmente importantes como sitios catalíticos y sitios de unión, ya que estas regiones son menos tolerantes a los cambios de secuencia.
El uso de la similitud de secuencias para inferir homología tiene varias limitaciones. No existe un nivel mínimo de similitud de secuencias garantizado para producir estructuras idénticas. Durante largos períodos de evolución, las proteínas relacionadas pueden no mostrar una similitud de secuencia detectable entre sí. Las secuencias con muchas inserciones y deleciones también pueden ser a veces difíciles de alinear y, por lo tanto, identificar las regiones de secuencia homólogas. En el clan PA de proteasas , por ejemplo, no se conserva ni un solo residuo a lo largo de la superfamilia, ni siquiera aquellos en la tríada catalítica . Por el contrario, las familias individuales que componen una superfamilia se definen sobre la base de su alineamiento de secuencias, por ejemplo, la familia de proteasas C04 dentro del clan PA.
Sin embargo, la similitud de secuencias es la forma de evidencia más comúnmente utilizada para inferir parentesco, ya que el número de secuencias conocidas supera ampliamente el número de estructuras terciarias conocidas . [6] En ausencia de información estructural, la similitud de secuencias restringe los límites de qué proteínas pueden asignarse a una superfamilia. [6]
Similitud estructural
La estructura se conserva mucho más evolutivamente que la secuencia, de modo que las proteínas con estructuras muy similares pueden tener secuencias completamente diferentes. [7] En escalas de tiempo evolutivas muy largas, muy pocos residuos muestran una conservación detectable de la secuencia de aminoácidos, sin embargo, los elementos estructurales secundarios y los motivos estructurales terciarios están altamente conservados. Algunas dinámicas proteicas [8] y cambios conformacionales de la estructura proteica también pueden conservarse, como se ve en la superfamilia de las serpinas . [9] En consecuencia, la estructura terciaria de la proteína se puede utilizar para detectar homología entre proteínas incluso cuando no queda evidencia de parentesco en sus secuencias. Los programas de alineamiento estructural , como DALI , utilizan la estructura 3D de una proteína de interés para encontrar proteínas con pliegues similares. [10] Sin embargo, en raras ocasiones, las proteínas relacionadas pueden evolucionar para ser estructuralmente diferentes [11] y el parentesco solo se puede inferir mediante otros métodos. [12] [13] [14]
Similitud mecanicista
El mecanismo catalítico de las enzimas dentro de una superfamilia se conserva comúnmente, aunque la especificidad del sustrato puede ser significativamente diferente. [15] Los residuos catalíticos también tienden a aparecer en el mismo orden en la secuencia de proteínas. [16] Para las familias dentro del clan PA de proteasas, aunque ha habido una evolución divergente de los residuos de la tríada catalítica utilizados para realizar la catálisis, todos los miembros utilizan un mecanismo similar para realizar la catálisis nucleofílica covalente en proteínas, péptidos o aminoácidos. [17] Sin embargo, el mecanismo por sí solo no es suficiente para inferir parentesco. Algunos mecanismos catalíticos han evolucionado de manera convergente varias veces de forma independiente, y por lo tanto forman superfamilias separadas, [18] [19] [20] y en algunas superfamilias muestran una gama de mecanismos diferentes (aunque a menudo químicamente similares). [15] [21]
Importancia evolutiva
Las superfamilias de proteínas representan los límites actuales de nuestra capacidad para identificar ancestros comunes. [22] Son la agrupación evolutiva más grande basada en evidencia directa que es posible actualmente. Por lo tanto, se encuentran entre los eventos evolutivos más antiguos estudiados en la actualidad. Algunas superfamilias tienen miembros presentes en todos los reinos de la vida , lo que indica que el último ancestro común de esa superfamilia estaba en el último ancestro común universal de toda la vida (LUCA). [23]
Los miembros de una superfamilia pueden pertenecer a especies diferentes, siendo la proteína ancestral la forma de la proteína que existía en la especie ancestral ( ortología ). Por el contrario, las proteínas pueden pertenecer a la misma especie, pero evolucionar a partir de una única proteína cuyo gen se duplicó en el genoma ( paralogía ).
Diversificación
La mayoría de las proteínas contienen múltiples dominios. Entre el 66 y el 80 % de las proteínas eucariotas tienen múltiples dominios, mientras que aproximadamente el 40 y el 60 % de las proteínas procariotas tienen múltiples dominios. [5] Con el tiempo, muchas de las superfamilias de dominios se han mezclado entre sí. De hecho, es muy raro encontrar “superfamilias consistentemente aisladas”. [5] [1] Cuando los dominios se combinan, el orden de dominios N- a C-terminal (la “arquitectura de dominios”) suele estar bien conservado. Además, la cantidad de combinaciones de dominios observadas en la naturaleza es pequeña en comparación con la cantidad de posibilidades, lo que sugiere que la selección actúa sobre todas las combinaciones. [5]
Los miembros comparten una estructura tipo sándwich de dos láminas de cadenas β antiparalelas ( pliegue Ig ) y están involucrados en el reconocimiento, la unión y la adhesión . [30] [31]
Los miembros comparten un pliegue estresado de alta energía que puede sufrir un gran cambio conformacional , que normalmente se utiliza para inhibir las proteasas de serina y cisteína alterando su estructura. [9]
Los miembros comparten una gran estructura de barril α 8 β 8. Es uno de los plegamientos proteicos más comunes y la monofilicidad de esta superfamilia aún es objeto de debate. [35] [36]
Recursos sobre la superfamilia de proteínas
Varias bases de datos biológicas documentan superfamilias de proteínas y pliegues de proteínas, por ejemplo:
Pfam - Base de datos de alineaciones y HMM de familias de proteínas
PROSITE - Base de datos de dominios de proteínas, familias y sitios funcionales
PASS2 - Alineamiento de proteínas como superfamilias estructurales v2
SUPERFAMILIA - Biblioteca de HMM que representan superfamilias y base de datos de anotaciones (de superfamilias y familias) para todos los organismos completamente secuenciados
SCOP y CATH - Clasificaciones de estructuras de proteínas en superfamilias, familias y dominios
De manera similar, existen algoritmos que buscan en el PDB proteínas con homología estructural con una estructura objetivo, por ejemplo:
DALI - Alineación estructural basada en un método de matriz de alineación de distancias
^ ab Holm L, Rosenström P (julio de 2010). "Servidor Dali: mapeo de conservación en 3D". Nucleic Acids Research . 38 (número de servidor web): W545–9. doi :10.1093/nar/gkq366. PMC 2896194 . PMID 20457744.
^ abc Rawlings ND, Barrett AJ, Bateman A (enero de 2012). "MEROPS: la base de datos de enzimas proteolíticas, sus sustratos e inhibidores". Nucleic Acids Research . 40 (número de la base de datos): D343–50. doi :10.1093/nar/gkr987. PMC 3245014 . PMID 22086950.
^ Henrissat B, Bairoch A (junio de 1996). "Actualización de la clasificación basada en secuencias de las glicosilhidrolasas". The Biochemical Journal . 316 (Pt 2): 695–6. doi :10.1042/bj3160695. PMC 1217404 . PMID 8687420.
^ "Preguntas frecuentes sobre Clustal #Símbolos". Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
^ abcd Han JH, Batey S, Nickson AA, Teichmann SA, Clarke J (abril de 2007). "El plegamiento y la evolución de proteínas multidominio". Nature Reviews Molecular Cell Biology . 8 (4): 319–30. doi :10.1038/nrm2144. PMID 17356578. S2CID 13762291.
^ ab Pandit SB, Gosar D, Abhiman S, Sujatha S, Dixit SS, Mhatre NS, Sowdhamini R, Srinivasan N (enero de 2002). "SUPFAM: una base de datos de posibles relaciones de superfamilias de proteínas derivadas de la comparación de familias basadas en secuencias y estructuras: implicaciones para la genómica estructural y la anotación de funciones en genomas". Nucleic Acids Research . 30 (1): 289–93. doi :10.1093/nar/30.1.289. PMC 99061 . PMID 11752317.
^ Orengo CA, Thornton JM (2005). "Familias de proteínas y su evolución: una perspectiva estructural". Revista Anual de Bioquímica . 74 (1): 867–900. doi :10.1146/annurev.biochem.74.082803.133029. PMID 15954844.
^ Liu Y, Bahar I (septiembre de 2012). "La evolución de secuencias se correlaciona con la dinámica estructural". Biología molecular y evolución . 29 (9): 2253–63. doi :10.1093/molbev/mss097. PMC 3424413 . PMID 22427707.
^ ab Silverman GA, Bird PI, Carrell RW, Church FC, Coughlin PB, Gettins PG, Irving JA, Lomas DA, Luke CJ, Moyer RW, Pemberton PA, Remold-O'Donnell E, Salvesen GS, Travis J, Whisstock JC (septiembre de 2001). "Las serpinas son una superfamilia en expansión de proteínas estructuralmente similares pero funcionalmente diversas. Evolución, mecanismo de inhibición, funciones novedosas y una nomenclatura revisada". The Journal of Biological Chemistry . 276 (36): 33293–6. doi : 10.1074/jbc.R100016200 . PMID 11435447.
^ Holm L, Laakso LM (julio de 2016). "Actualización del servidor Dali". Nucleic Acids Research . 44 (W1): W351–5. doi :10.1093/nar/gkw357. PMC 4987910 . PMID 27131377.
^ Pascual-García A, Abia D, Ortiz ÁR, Bastolla U (2009). "Cruce entre el espacio de estructura de proteínas discreto y continuo: perspectivas sobre clasificación automática y redes de estructuras de proteínas". PLOS Computational Biology . 5 (3): e1000331. Bibcode :2009PLSCB...5E0331P. doi : 10.1371/journal.pcbi.1000331 . PMC 2654728 . PMID 19325884.
^ Li D, Zhang L, Yin H, Xu H, Satkoski Trask J, Smith DG, Li Y, Yang M, Zhu Q (junio de 2014). "Evolución de las defensinas α y θ de los primates revelada por el análisis de los genomas". Molecular Biology Reports . 41 (6): 3859–66. doi :10.1007/s11033-014-3253-z. PMID 24557891. S2CID 14936647.
^ Krishna SS, Grishin NV (abril de 2005). "Deriva estructural: un posible camino hacia el cambio de plegamiento de proteínas". Bioinformática . 21 (8): 1308–10. doi : 10.1093/bioinformatics/bti227 . PMID 15604105.
^ Bryan PN, Orban J (agosto de 2010). "Proteínas que cambian de plegamiento". Current Opinion in Structural Biology . 20 (4): 482–8. doi :10.1016/j.sbi.2010.06.002. PMC 2928869 . PMID 20591649.
^ ab Dessailly, Benoit H.; Dawson, Natalie L.; Das, Sayoni; Orengo, Christine A. (2017), "Function Diversity within Folds and Superfamilies", De la estructura de proteínas a la función con bioinformática , Springer Netherlands, págs. 295–325, doi :10.1007/978-94-024-1069-3_9, ISBN9789402410679
^ Echave J, Spielman SJ, Wilke CO (febrero de 2016). "Causas de la variación de la tasa evolutiva entre sitios proteínicos". Nature Reviews. Genética . 17 (2): 109–21. doi :10.1038/nrg.2015.18. PMC 4724262 . PMID 26781812.
^ Shafee T, Gatti-Lafranconi P, Minter R, Hollfelder F (septiembre de 2015). "La evolución de recuperación por desventaja conduce a una proteasa permisiva a nucleófilos y químicamente versátil". ChemBioChem . 16 (13): 1866–1869. doi :10.1002/cbic.201500295. PMC 4576821 . PMID 26097079.
^ Buller AR, Townsend CA (febrero de 2013). "Restricciones evolutivas intrínsecas en la estructura de la proteasa, la acilación enzimática y la identidad de la tríada catalítica". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 110 (8): E653–61. Bibcode :2013PNAS..110E.653B. doi : 10.1073/pnas.1221050110 . PMC 3581919 . PMID 23382230.
^ Coutinho PM, Deleury E, Davies GJ, Henrissat B (abril de 2003). "Una clasificación jerárquica de familias en evolución para las glicosiltransferasas". Journal of Molecular Biology . 328 (2): 307–17. doi :10.1016/S0022-2836(03)00307-3. PMID 12691742.
^ Zámocký M, Hofbauer S, Schaffner I, Gasselhuber B, Nicolussi A, Soudi M, Pirker KF, Furtmüller PG, Obinger C (mayo de 2015). "Evolución independiente de cuatro superfamilias de hemoperoxidasa". Archivos de bioquímica y biofísica . 574 : 108–19. doi :10.1016/j.abb.2014.12.025. PMC 4420034. PMID 25575902 .
^ Akiva, Eyal; Brown, Shoshana; Almonacid, Daniel E.; Barber, Alan E.; Custer, Ashley F.; Hicks, Michael A.; Huang, Conrad C.; Lauck, Florian; Mashiyama, Susan T. (23 de noviembre de 2013). "La base de datos de enlaces estructura-función". Investigación de ácidos nucleicos . 42 (D1): D521–D530. doi :10.1093/nar/gkt1130. ISSN 0305-1048. PMC 3965090 . PMID 24271399.
^ Shakhnovich BE, Deeds E, Delisi C, Shakhnovich E (marzo de 2005). "La estructura de las proteínas y la historia evolutiva determinan la topología del espacio de secuencias". Genome Research . 15 (3): 385–92. arXiv : q-bio/0404040 . doi :10.1101/gr.3133605. PMC 551565 . PMID 15741509.
^ Ranea JA, Sillero A, Thornton JM, Orengo CA (octubre de 2006). "Evolución de la superfamilia de proteínas y el último ancestro común universal (LUCA)". Journal of Molecular Evolution . 63 (4): 513–25. Bibcode :2006JMolE..63..513R. doi :10.1007/s00239-005-0289-7. hdl :10261/78338. PMID 17021929. S2CID 25258028.
^ Carr PD, Ollis DL (2009). "Pliegue de la alfa/beta hidrolasa: una actualización". Protein and Peptide Letters . 16 (10): 1137–48. doi :10.2174/092986609789071298. PMID 19508187.
^ Nardini M, Dijkstra BW (diciembre de 1999). "Enzimas plegadas de hidrolasa alfa/beta: la familia sigue creciendo". Current Opinion in Structural Biology . 9 (6): 732–7. doi :10.1016/S0959-440X(99)00037-8. PMID 10607665.
^ "SCOP". Archivado desde el original el 29 de julio de 2014 . Consultado el 28 de mayo de 2014 .
^ Mohamed MF, Hollfelder F (enero de 2013). "Promiscuidad catalítica eficiente y cruzada entre enzimas que catalizan la transferencia de fosforilo". Biochimica et Biophysica Acta (BBA) - Proteínas y proteómica . 1834 (1): 417–24. doi :10.1016/j.bbapap.2012.07.015. PMID 22885024.
^ Branden C, Tooze J (1999). Introducción a la estructura de las proteínas (2.ª ed.). Nueva York: Garland Pub. ISBN978-0815323051.
^ Bolognesi M, Onesti S, Gatti G, Coda A, Ascenzi P, Brunori M (febrero de 1989). "Mioglobina de Aplysia limacina. Análisis cristalográfico con una resolución de 1,6 A". Journal of Molecular Biology . 205 (3): 529–44. doi :10.1016/0022-2836(89)90224-6. PMID 2926816.
^ Bork P, Holm L, Sander C (septiembre de 1994). "El pliegue de inmunoglobulina. Clasificación estructural, patrones de secuencia y núcleo común". Journal of Molecular Biology . 242 (4): 309–20. doi :10.1006/jmbi.1994.1582. PMID 7932691.
^ Bazan JF, Fletterick RJ (noviembre de 1988). "Las proteasas de cisteína virales son homólogas a la familia de proteasas de serina similares a la tripsina: implicaciones estructurales y funcionales". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 85 (21): 7872–6. Bibcode :1988PNAS...85.7872B. doi : 10.1073/pnas.85.21.7872 . PMC 282299 . PMID 3186696.
^ Vetter IR, Wittinghofer A (noviembre de 2001). "El interruptor de unión al nucleótido de guanina en tres dimensiones". Science . 294 (5545): 1299–304. Bibcode :2001Sci...294.1299V. doi :10.1126/science.1062023. PMID 11701921. S2CID 6636339.
^ Atkinson, Gemma C.; Tenson, Tanel; Hauryliuk, Vasili (9 de agosto de 2011). "La superfamilia de homólogos RelA/SpoT (RSH): distribución y evolución funcional de las sintetasas e hidrolasas ppGpp a lo largo del árbol de la vida". PLOS ONE . 6 (8): e23479. Bibcode :2011PLoSO...623479A. doi : 10.1371/journal.pone.0023479 . ISSN 1932-6203. PMC 3153485 . PMID 21858139.
^ Nagano N, Orengo CA, Thornton JM (agosto de 2002). "Un pliegue con muchas funciones: las relaciones evolutivas entre las familias de barriles TIM basadas en sus secuencias, estructuras y funciones". Journal of Molecular Biology . 321 (5): 741–65. doi :10.1016/s0022-2836(02)00649-6. PMID 12206759.
^ Farber G (1993). "Un barril α/β lleno de problemas evolutivos". Current Opinion in Structural Biology . 3 (3): 409–412. doi :10.1016/S0959-440X(05)80114-9.
Enlaces externos
Medios relacionados con Superfamilias de proteínas en Wikimedia Commons