El método Chou-Fasman es una técnica empírica para la predicción de estructuras secundarias en proteínas , desarrollada originalmente en la década de 1970 por Peter Y. Chou y Gerald D. Fasman. [1] [2] [3] El método se basa en análisis de las frecuencias relativas de cada aminoácido en hélices alfa , láminas beta y giros basados en estructuras proteicas conocidas resueltas con cristalografía de rayos X. A partir de estas frecuencias, se derivó un conjunto de parámetros de probabilidad para la aparición de cada aminoácido en cada tipo de estructura secundaria, y estos parámetros se utilizan para predecir la probabilidad de que una secuencia dada de aminoácidos forme una hélice, una cadena beta o un giro en una proteína. El método tiene una precisión de entre el 50 y el 60 % como máximo en la identificación de estructuras secundarias correctas, [4] lo que es significativamente menos preciso que las técnicas modernas basadas en aprendizaje automático . [5]
Los parámetros originales de Chou-Fasman encontraron algunas tendencias fuertes entre los aminoácidos individuales a preferir un tipo de estructura secundaria sobre otros. Alanina , glutamato , leucina y metionina fueron identificados como formadores de hélice, mientras que prolina y glicina , debido a las propiedades conformacionales únicas de sus enlaces peptídicos , comúnmente terminan una hélice. Los parámetros originales de Chou-Fasman [6] se derivaron de una muestra muy pequeña y no representativa de estructuras de proteínas debido al pequeño número de tales estructuras que se conocían en el momento de su trabajo original. Desde entonces se ha demostrado que estos parámetros originales no son confiables [7] y se han actualizado a partir de un conjunto de datos actual, junto con modificaciones al algoritmo inicial. [8]
El método Chou-Fasman tiene en cuenta únicamente la probabilidad de que cada aminoácido individual aparezca en una hélice, cadena o giro. A diferencia del método GOR , más complejo , no refleja las probabilidades condicionales de que un aminoácido forme una estructura secundaria particular dado que sus vecinos ya poseen esa estructura. Esta falta de cooperatividad aumenta su eficiencia computacional pero disminuye su precisión, ya que las propensiones de los aminoácidos individuales a menudo no son lo suficientemente fuertes como para generar una predicción definitiva. [5]
El método Chou-Fasman predice hélices y cadenas de una manera similar, primero buscando linealmente a través de la secuencia una región de "nucleación" de alta probabilidad de hélice o cadena y luego extendiendo la región hasta que una ventana posterior de cuatro residuos tenga una probabilidad de menos de 1. Como se describió originalmente, cuatro de cada seis aminoácidos contiguos eran suficientes para nuclear una hélice, y tres de cada cinco contiguos eran suficientes para una lámina. Los umbrales de probabilidad para las nucleaciones de hélices y cadenas son constantes pero no necesariamente iguales; originalmente se estableció 1,03 como el límite de corte de la hélice y 1,00 como el límite de corte de la cadena.
Los giros también se evalúan en ventanas de cuatro residuos, pero se calculan utilizando un procedimiento de varios pasos porque muchas regiones de giro contienen aminoácidos que también podrían aparecer en regiones de hélice o lámina. Los giros de cuatro residuos también tienen sus propios aminoácidos característicos; la prolina y la glicina son comunes en los giros. Un giro se predice solo si la probabilidad de giro es mayor que las probabilidades de hélice o lámina y un valor de probabilidad basado en las posiciones de aminoácidos particulares en el giro excede un umbral predeterminado. La probabilidad de giro p(t) se determina como:
donde j es la posición del aminoácido en la ventana de cuatro residuos. Si p(t) excede un valor de corte arbitrario (originalmente 7,5e–3), la media de los p(j) excede 1 y p(t) excede las probabilidades de hélice alfa y lámina beta para esa ventana, entonces se predice un giro. Si se cumplen las dos primeras condiciones pero la probabilidad de una lámina beta p(b) excede p(t), entonces se predice una lámina en su lugar.
{{cite book}}
: |journal=
ignorado ( ayuda )