PSIPRED

Método utilizado para investigar la estructura de las proteínas.

PSIPRED
Autor(es) original(es)
  • David T. Jones
  • Daniel Buchan
  • Tim Nugent
  • Liam McGuffin
  • Federico Minneci
  • Kevin Bryson
Desarrollador(es)University College London , Grupo de Bioinformática
Lanzamiento inicial1999 ; hace 25 años ( 1999 )
Versión estable
4.02 / 26 de septiembre de 2018 ; hace 6 años [1] ( 26/09/2018 )
Escrito endo
Sistema operativoWindows 2000 , Unix
Plataformax86 , Java
Tamaño14 MB
Disponible enInglés
Tipo Predicción de la estructura secundaria mediante bioinformática
Licencia Código fuente de software libre propietario
Sitio webbioinf.cs.ucl.ac.uk/psipred

La predicción de la estructura secundaria basada en PSI-blast ( PSIPRED ) es un método utilizado para investigar la estructura de las proteínas . Utiliza métodos de aprendizaje automático de redes neuronales artificiales en su algoritmo. [2] [3] [4] Es un programa del lado del servidor , que cuenta con un sitio web que sirve como interfaz frontal, que puede predecir la estructura secundaria de una proteína ( láminas beta , hélices alfa y bobinas ) a partir de la secuencia primaria.

PSIPRED está disponible como servicio web y como software. El software se distribuye como código fuente , con licencia técnica de software propietario . Permite modificaciones, pero aplica las disposiciones de freeware prohibiendo la distribución con fines de lucro del software y sus resultados.

Estructura secundaria

La estructura secundaria es la forma tridimensional general de segmentos locales de biopolímeros como proteínas y ácidos nucleicos ( ADN , ARN ). Sin embargo, no describe posiciones atómicas específicas en el espacio tridimensional, que se consideran la estructura terciaria . La estructura secundaria se puede definir formalmente por los enlaces de hidrógeno del biopolímero, como se observa en una estructura de resolución atómica. En las proteínas, la estructura secundaria se define por los patrones de enlaces de hidrógeno entre los grupos amino y carboxilo de la cadena principal . Por el contrario, para los ácidos nucleicos, la estructura secundaria consiste en los enlaces de hidrógeno entre las bases nitrogenadas . Los patrones de enlaces de hidrógeno pueden estar significativamente distorsionados, lo que dificulta la determinación automática de la estructura secundaria. Los esfuerzos para utilizar computadoras para predecir las estructuras secundarias de las proteínas , basándose solo en sus secuencias de estructura primaria dadas , han estado en curso desde la década de 1970. [5]

La predicción de la estructura secundaria implica un conjunto de métodos en bioinformática que apuntan a predecir las estructuras secundarias locales de proteínas y secuencias de ARN basándose únicamente en el conocimiento de su estructura primaria : secuencia de aminoácidos o nucleótidos , respectivamente. Para las proteínas, una predicción consiste en asignar regiones de la secuencia de aminoácidos como hélices alfa , cadenas beta (a menudo señaladas como conformaciones extendidas ) o giros altamente probables. El éxito de una predicción se determina comparándola con los resultados del algoritmo DSSP aplicado a la estructura cristalina de la proteína; para los ácidos nucleicos, puede determinarse a partir del patrón de enlaces de hidrógeno. Se han desarrollado algoritmos especializados para detectar patrones específicos bien definidos, como hélices transmembrana y bobinas enrolladas en proteínas, o estructuras de micro-ARN canónicas en ARN.

Información básica

La idea de este método es utilizar la información de las proteínas relacionadas evolutivamente para predecir la estructura secundaria de una nueva secuencia de aminoácidos. PSI BLAST se utiliza para encontrar secuencias relacionadas y construir una matriz de puntuación específica de posición. Esta matriz es procesada por una red neuronal artificial [3] [ 6] que fue construida y entrenada para predecir la estructura secundaria de la secuencia de entrada; [7] en resumen, es un método de aprendizaje automático . [8]

Algoritmo de predicción (método)

El método o algoritmo de predicción se divide en tres etapas: generar un perfil de secuencia , predecir la estructura secundaria inicial y filtrar la estructura predicha . [9] PSIPRED trabaja para normalizar el perfil de secuencia generado por PSIBLAST. [3] Luego, mediante el uso de redes neuronales, se predice la estructura secundaria inicial. Para cada aminoácido en la secuencia, la red neuronal se alimenta con una ventana de 15 ácidos. Se adjunta información adicional, indicando si la ventana abarca el extremo N o C de la cadena. Esto da como resultado una capa de entrada final de 315 unidades de entrada, divididas en 15 grupos de 21 unidades. La red tiene una capa oculta de 75 unidades y 3 nodos de salida (uno para cada elemento de estructura secundaria: hélice, lámina, bobina). [6]

Se utiliza una segunda red neuronal para filtrar la estructura predicha de la primera red. Esta red también se alimenta con una ventana de 15 posiciones. También se envía el indicador de la posible posición de la ventana en un extremo de la cadena. Esto da como resultado 60 unidades de entrada, divididas en 15 grupos de cuatro. La red tiene una capa oculta de 60 unidades y da como resultado tres nodos de salida (uno para cada elemento de la estructura secundaria: hélice, lámina, bobina). [9]

Los tres nodos de salida finales entregan una puntuación para cada elemento de la estructura secundaria para la posición central de la ventana. Utilizando la estructura secundaria con la puntuación más alta, PSIPRED genera la predicción de la proteína. [9] El valor Q3 es la fracción de residuos predichos correctamente en los estados de la estructura secundaria, es decir, hélice, hebra y espiral. [9]

Véase también

Referencias

  1. ^ "Índice de /downloads/psipred". bioinfadmin.cs.ucl.ac.uk . Consultado el 26 de abril de 2021 .
  2. ^ Gajendra PS Raghava; Harpreet Kaur. "Predicción de tipos de turnos beta" . Consultado el 5 de mayo de 2014 .
  3. ^ abc Yi-Ping Phoebe Chen (18 de enero de 2005). Tecnologías bioinformáticas. Springer. pág. 107. ISBN 978-3-540-20873-0.
  4. ^ Cuff, James A.; Barton, Geoffrey A. (15 de agosto de 2000). "Aplicación de perfiles de alineamiento de secuencias múltiples para mejorar la predicción de la estructura secundaria de proteínas". Proteins . 40 (3): 502–11. doi :10.1002/1097-0134(20000815)40:3<502::aid-prot170>3.0.co;2-q. PMID  10861942.
  5. ^ Heringa, Jaap (2000). "Métodos computacionales para la predicción de la estructura secundaria de proteínas utilizando alineaciones de secuencias múltiples". Current Protein & Peptide Science . 1 (3): 273–301(29). CiteSeerX 10.1.1.470.7673 . doi :10.2174/1389203003381324. PMID  12369910. 
  6. ^ ab SC Rastogi; Namitra Mendiratta; Parag Rastogi (22 de mayo de 2013). Bioinformática: métodos y aplicaciones: (genómica, proteómica y descubrimiento de fármacos). PHI Learning Pvt. Ltd. págs. 302–. ISBN 978-81-203-4785-4.
  7. ^ "PSIPRED | Tecnología Bioinformática". 10 de abril de 2014. Consultado el 7 de mayo de 2014 .
  8. ^ "Resumen de PSIPRED" . Consultado el 7 de mayo de 2014 .
  9. ^ abcd Jones, David T. (17 de septiembre de 1999). "Protein Secondary Structure Prediction Based on Position-specific Scoring Matrices" (PDF) . Journal of Molecular Biology . 292 (2): 195–202. doi :10.1006/jmbi.1999.3091. PMID  10493868 . Consultado el 7 de mayo de 2014 .
Obtenido de "https://es.wikipedia.org/w/index.php?title=PSIPRED&oldid=1189505090"