Puntuación de modelado de plantillas

Medida de similitud entre dos estructuras de proteínas

En bioinformática , la puntuación de modelado de plantilla o puntuación TM es una medida de similitud entre dos estructuras de proteínas . La puntuación TM está pensada como una medida más precisa de la similitud global de las estructuras de proteínas de longitud completa que la medida RMSD de uso frecuente . La puntuación TM indica la similitud entre dos estructuras mediante una puntuación entre , donde 1 indica una coincidencia perfecta entre dos estructuras (por lo tanto, cuanto más alta, mejor). [1] Generalmente, las puntuaciones inferiores a 0,20 corresponden a proteínas no relacionadas elegidas al azar, mientras que las estructuras con una puntuación superior a 0,5 asumen aproximadamente el mismo plegamiento. [2] Un estudio cuantitativo [3] muestra que las proteínas de puntuación TM = 0,5 tienen una probabilidad posterior del 37 % en la misma familia de topología CATH y del 13 % en la misma familia de plegamiento SCOP . Las probabilidades aumentan rápidamente cuando la puntuación TM > 0,5. La puntuación TM está diseñada para ser independiente de las longitudes de las proteínas. ( 0 , 1 ] {\estilo de visualización (0,1]}

La ecuación de puntuación TM

La puntuación TM entre dos estructuras de proteínas (por ejemplo, una estructura de plantilla y una estructura objetivo) se define mediante

Puntuación TM = máximo [ 1 yo objetivo i yo común 1 1 + ( d i d 0 ( yo objetivo ) ) 2 ] {\displaystyle {\text{puntuación TM}}=\max \left[{\frac {1}{L_{\text{objetivo}}}}\sum _{i}^{L_{\text{común}}}{\frac {1}{1+\left({\frac {d_{i}}{d_{0}(L_{\text{objetivo}})}}\right)^{2}}}\right]}

donde es la longitud de la secuencia de aminoácidos de la proteína objetivo, y es el número de residuos que aparecen tanto en la plantilla como en las estructuras objetivo. es la distancia entre el par de residuos en la plantilla y las estructuras objetivo, y es una escala de distancia que normaliza las distancias. yo objetivo {\displaystyle L_{\text{objetivo}}} yo común {\displaystyle L_{\text{común}}} d i estilo de visualización d_{i}} i {\estilo de visualización i} d 0 ( yo objetivo ) = 1.24 yo objetivo 15 3 1.8 {\displaystyle d_{0}(L_{\text{objetivo}})=1,24{\sqrt[{3}]{L_{\text{objetivo}}-15}}-1,8}

Al comparar dos estructuras de proteínas que tienen el mismo orden de residuos, se lee el número de orden C-alfa de los archivos de estructura (es decir, Columna 23-26 en Protein Data Bank (formato de archivo) ). Al comparar dos estructuras de proteínas que tienen diferentes secuencias y/o diferentes órdenes de residuos, generalmente se realiza primero una alineación estructural y luego se calcula el puntaje TM sobre los residuos alineados en común a partir de la alineación estructural. yo común {\displaystyle L_{\text{común}}}

Otras medidas

Una medida de similitud estructural que se utiliza a menudo es la desviación cuadrática media (RMSD). Debido a que la RMSD se calcula como un promedio del error de distancia ( ) con el mismo peso en todos los pares de residuos, un gran error local en unos pocos pares de residuos puede dar como resultado una RMSD bastante grande. Por otro lado, al poner en el denominador, la puntuación TM pondera naturalmente los errores de distancia más pequeños con mayor fuerza que los errores de distancia más grandes. Por lo tanto, el valor de la puntuación TM es más sensible a la similitud estructural global en lugar de a los errores estructurales locales, en comparación con la RMSD. Otra ventaja de la puntuación TM es la introducción de la escala que hace que la magnitud de la puntuación TM sea independiente de la longitud para pares de estructuras aleatorias, mientras que la RMSD y la mayoría de las otras medidas son métricas dependientes de la longitud. = i = 1 yo d i 2 / yo {\displaystyle ={\sqrt {\sum _{i=1}^{L}d_{i}^{2}/{L}}}} d i estilo de visualización d_{i}} d i estilo de visualización d_{i}} d 0 ( yo objetivo ) = 1.24 yo objetivo 15 3 1.8 {\displaystyle d_{0}(L_{\text{objetivo}})=1,24{\sqrt[{3}]{L_{\text{objetivo}}-15}}-1,8}

El algoritmo Global Distance Test (GDT), y su puntuación GDT TS para representar la "puntuación total", es otra medida de similitud entre dos estructuras proteicas con correspondencias de aminoácidos conocidas (por ejemplo, secuencias de aminoácidos idénticas ) pero diferentes estructuras terciarias . [4] La puntuación GDT tiene el mismo problema de dependencia de la longitud que RMSD, porque la puntuación GDT promedio para pares de estructuras aleatorias tiene una dependencia de ley de potencia con el tamaño de la proteína. [1]

Véase también

  • RMSD : una medida de comparación de estructuras diferente
  • GDT : una medida de comparación de estructuras diferente
  • Segmento continuo más largo (LCS): una medida de comparación de estructura diferente
  • Cálculo de distancia global (GDC_sc, GDC_all): medidas de comparación de estructuras que utilizan información del modelo completo (no solo del carbono α) para evaluar la similitud
  • Alineamiento global local (LGA): programa de alineación de la estructura de proteínas y medida de comparación de estructuras

Referencias

  1. ^ ab Zhang Y y Skolnick J (2004). "Función de puntuación para la evaluación automatizada de la calidad de la plantilla de estructura de proteínas". Proteínas . 57 (4): 702–710. doi :10.1002/prot.20264. PMID  15476259. S2CID  7954787.
  2. ^ Zhang Y y Skolnick J (2005). "TM-align: un algoritmo de alineación de la estructura de proteínas basado en el TM-score". Nucleic Acids Res . 33 (7): 2302–2309. doi :10.1093/nar/gki524. PMC 1084323 . PMID  15849316. 
  3. ^ Xu J y Zhang Y (2010). "¿Qué importancia tiene una similitud de estructura de proteína con un puntaje TM = 0,5?". Bioinformática . 26 (7): 889–895. doi :10.1093/bioinformatics/btq066. PMC 2913670 . PMID  20164152. 
  4. ^ Zemla A (2003). "LGA: Un método para encontrar similitudes 3D en estructuras proteínicas". Investigación de ácidos nucleicos . 31 (13): 3370–3374. doi :10.1093/nar/gkg571. PMC 168977. PMID  12824330. 
  • Servidor web de TM-score: del grupo de investigación de Yang Zhang. Calcula el TM-score y proporciona el código fuente.
  • Servicios de descripción de GDT y LGA y documentación sobre comparación de estructuras y medidas de similitud.
Obtenido de "https://es.wikipedia.org/w/index.php?title=Puntuación_de_modelado_de_plantillas&oldid=1150700578"