Método Chou-Fasman

El método Chou-Fasman es una técnica empírica para la predicción de estructuras secundarias en proteínas , desarrollada originalmente en la década de 1970 por Peter Y. Chou y Gerald D. Fasman. ^[1]^[2]^[3] El método se basa en análisis de las frecuencias relativas de cada aminoácido en hélices alfa , láminas beta y giros basados en estructuras proteicas conocidas resueltas con cristalografía de rayos X. A partir de estas frecuencias, se derivó un conjunto de parámetros de probabilidad para la aparición de cada aminoácido en cada tipo de estructura secundaria, y estos parámetros se utilizan para predecir la probabilidad de que una secuencia dada de aminoácidos forme una hélice, una cadena beta o un giro en una proteína. El método tiene una precisión de entre el 50 y el 60 % como máximo en la identificación de estructuras secundarias correctas, ^[4] lo que es significativamente menos preciso que las técnicas modernas basadas en aprendizaje automático . ^[5]

Propensiones de aminoácidos

Los parámetros originales de Chou-Fasman encontraron algunas tendencias fuertes entre los aminoácidos individuales a preferir un tipo de estructura secundaria sobre otros. Alanina , glutamato , leucina y metionina fueron identificados como formadores de hélice, mientras que prolina y glicina , debido a las propiedades conformacionales únicas de sus enlaces peptídicos , comúnmente terminan una hélice. Los parámetros originales de Chou-Fasman ^[6] se derivaron de una muestra muy pequeña y no representativa de estructuras de proteínas debido al pequeño número de tales estructuras que se conocían en el momento de su trabajo original. Desde entonces se ha demostrado que estos parámetros originales no son confiables ^[7] y se han actualizado a partir de un conjunto de datos actual, junto con modificaciones al algoritmo inicial. ^[8]

El método Chou-Fasman tiene en cuenta únicamente la probabilidad de que cada aminoácido individual aparezca en una hélice, cadena o giro. A diferencia del método GOR , más complejo , no refleja las probabilidades condicionales de que un aminoácido forme una estructura secundaria particular dado que sus vecinos ya poseen esa estructura. Esta falta de cooperatividad aumenta su eficiencia computacional pero disminuye su precisión, ya que las propensiones de los aminoácidos individuales a menudo no son lo suficientemente fuertes como para generar una predicción definitiva. ^[5]

Algoritmo

El método Chou-Fasman predice hélices y cadenas de una manera similar, primero buscando linealmente a través de la secuencia una región de "nucleación" de alta probabilidad de hélice o cadena y luego extendiendo la región hasta que una ventana posterior de cuatro residuos tenga una probabilidad de menos de 1. Como se describió originalmente, cuatro de cada seis aminoácidos contiguos eran suficientes para nuclear una hélice, y tres de cada cinco contiguos eran suficientes para una lámina. Los umbrales de probabilidad para las nucleaciones de hélices y cadenas son constantes pero no necesariamente iguales; originalmente se estableció 1,03 como el límite de corte de la hélice y 1,00 como el límite de corte de la cadena.

Los giros también se evalúan en ventanas de cuatro residuos, pero se calculan utilizando un procedimiento de varios pasos porque muchas regiones de giro contienen aminoácidos que también podrían aparecer en regiones de hélice o lámina. Los giros de cuatro residuos también tienen sus propios aminoácidos característicos; la prolina y la glicina son comunes en los giros. Un giro se predice solo si la probabilidad de giro es mayor que las probabilidades de hélice o lámina y un valor de probabilidad basado en las posiciones de aminoácidos particulares en el giro excede un umbral predeterminado. La probabilidad de giro p(t) se determina como:

p(t)=p_{t}(j)\times p_{t}(j+1)\times p_{t}(j+2)\times p_{t}(j+3)

donde j es la posición del aminoácido en la ventana de cuatro residuos. Si p(t) excede un valor de corte arbitrario (originalmente 7,5e–3), la media de los p(j) excede 1 y p(t) excede las probabilidades de hélice alfa y lámina beta para esa ventana, entonces se predice un giro. Si se cumplen las dos primeras condiciones pero la probabilidad de una lámina beta p(b) excede p(t), entonces se predice una lámina en su lugar.

Véase también

Lista de software de predicción de la estructura de proteínas

Referencias

^ Chou PY, Fasman GD (1974). "Predicción de la conformación de proteínas". Bioquímica . 13 (2): 222–245. doi :10.1021/bi00699a002. PMID 4358940.
^ Chou PY, Fasman GD (1978). "Predicciones empíricas de la conformación de proteínas". Annu Rev Biochem . 47 : 251–276. doi :10.1146/annurev.bi.47.070178.001343. PMID 354496.
^ Chou PY, Fasman GD (1979). "Predicción de la estructura secundaria de las proteínas a partir de su secuencia de aminoácidos". Avances en enzimología y áreas relacionadas de la biología molecular . Avances en enzimología y áreas relacionadas de la biología molecular. Vol. 47. págs. 45–148. doi :10.1002/9780470122921.ch2. ISBN 9780470122921.PMID 364941 . {{cite book}}: |journal=ignorado ( ayuda )
^ Kabsch W, Sander C (1983). "¿Qué tan buenas son las predicciones de la estructura secundaria de las proteínas?". FEBS Lett . 155 (2): 179–82. doi :10.1016/0014-5793(82)80597-8. PMID 6852232. S2CID 41477827.
^ ab Mount DM (2004). Bioinformática: análisis de secuencias y genomas (2.ª ed.). Cold Spring Harbor, Nueva York: Cold Spring Harbor Laboratory Press. ISBN 978-0-87969-712-9.
^ Chou PY, Fasman GD (1974). "Parámetros conformacionales para aminoácidos en regiones helicoidales, de lámina beta y de bobina aleatoria calculados a partir de proteínas". Bioquímica . 13 (2): 211–222. doi :10.1021/bi00699a001. PMID 4358939.
^ Kyngas J, Valjakka J (1998). "Falta de fiabilidad de los parámetros de Chou–Fasman en la predicción de la estructura secundaria de las proteínas". Protein Eng . 11 (5): 345–348. doi :10.1093/protein/11.5.345. PMID 9681866.
^ Chen H, Gu F, Huang Z (2006). "Método Chou–Fasman mejorado para la predicción de la estructura secundaria de proteínas". BMC Bioinformatics . 7 (Supl 4): S14. doi : 10.1186/1471-2105-7-S4-S14 . PMC 1780123 . PMID 17217506.

Enlaces externos

Gerald D. Fasman en Internet

[Chou_predict0-1] Chou PY, Fasman GD (1974). "Predicción de la conformación de proteínas". Bioquímica . 13 (2): 222–245. doi :10.1021/bi00699a002. PMID 4358940.

[Chou_predict1-2] Chou PY, Fasman GD (1978). "Predicciones empíricas de la conformación de proteínas". Annu Rev Biochem . 47 : 251–276. doi :10.1146/annurev.bi.47.070178.001343. PMID 354496.

[Chou_predict2-3] Chou PY, Fasman GD (1979). "Predicción de la estructura secundaria de las proteínas a partir de su secuencia de aminoácidos". Avances en enzimología y áreas relacionadas de la biología molecular . Avances en enzimología y áreas relacionadas de la biología molecular. Vol. 47. págs. 45–148. doi :10.1002/9780470122921.ch2. ISBN 9780470122921.PMID 364941 . {{cite book}}: |journal=ignorado ( ayuda )

[Kabsch-4] Kabsch W, Sander C (1983). "¿Qué tan buenas son las predicciones de la estructura secundaria de las proteínas?". FEBS Lett . 155 (2): 179–82. doi :10.1016/0014-5793(82)80597-8. PMID 6852232. S2CID 41477827.

[Mount-5] Mount DM (2004). Bioinformática: análisis de secuencias y genomas (2.ª ed.). Cold Spring Harbor, Nueva York: Cold Spring Harbor Laboratory Press. ISBN 978-0-87969-712-9.

[Chou_param-6] Chou PY, Fasman GD (1974). "Parámetros conformacionales para aminoácidos en regiones helicoidales, de lámina beta y de bobina aleatoria calculados a partir de proteínas". Bioquímica . 13 (2): 211–222. doi :10.1021/bi00699a001. PMID 4358939.

[Kyngas-7] Kyngas J, Valjakka J (1998). "Falta de fiabilidad de los parámetros de Chou–Fasman en la predicción de la estructura secundaria de las proteínas". Protein Eng . 11 (5): 345–348. doi :10.1093/protein/11.5.345. PMID 9681866.

[Chen-8] Chen H, Gu F, Huang Z (2006). "Método Chou–Fasman mejorado para la predicción de la estructura secundaria de proteínas". BMC Bioinformatics . 7 (Supl 4): S14. doi : 10.1186/1471-2105-7-S4-S14 . PMC 1780123 . PMID 17217506.