Base de datos CATH

CATÉTERO
Contenido
DescripciónClasificación de la estructura de las proteínas
Contacto
Centro de investigaciónColegio Universitario de Londres
LaboratorioInstituto de Biología Estructural y Molecular
Cita primariaDawson y otros (2016) [1]
Fecha de lanzamiento1997
Acceso
Sitio webInformación de catdb
Descargar URLcathdb.info/descargar
Misceláneas

Frecuencia de publicación de datos
La prueba CATH-B se publica diariamente. Las publicaciones oficiales se realizan aproximadamente una vez al año.
Versión4.3
Representación esquemática de los tres niveles superiores del esquema de clasificación CATH. [2]

La base de datos de clasificación de la estructura de proteínas CATH es un recurso en línea gratuito y de acceso público que proporciona información sobre las relaciones evolutivas de los dominios proteicos . Fue creada a mediados de la década de 1990 por la profesora Christine Orengo y colegas, entre ellos Janet Thornton y David Jones , [2] y continúa siendo desarrollada por el grupo Orengo en el University College de Londres . CATH comparte muchas características generales con el recurso SCOP , sin embargo, también hay muchas áreas en las que la clasificación detallada difiere en gran medida. [3] [4] [5] [6]

Organización jerárquica

Las estructuras tridimensionales de proteínas determinadas experimentalmente se obtienen del banco de datos de proteínas y se dividen en sus cadenas polipeptídicas consecutivas , cuando corresponde. Los dominios de proteínas se identifican dentro de estas cadenas utilizando una combinación de métodos automáticos y curación manual. [7]

Los dominios se clasifican luego dentro de la jerarquía estructural CATH: en el nivel de Clase (C), los dominios se asignan de acuerdo con su contenido de estructura secundaria , es decir, todo alfa , todo beta , una mezcla de alfa y beta, o poca estructura secundaria; en el nivel de Arquitectura (A), se utiliza información sobre la disposición de la estructura secundaria en el espacio tridimensional para la asignación; en el nivel de Topología/pliegue (T), se utiliza información sobre cómo se conectan y organizan los elementos de la estructura secundaria; las asignaciones se realizan al nivel de superfamilia homóloga (H) si hay buena evidencia de que los dominios están relacionados por evolución [2], es decir, son homólogos.

Los cuatro niveles principales de la jerarquía CATH:
#NivelDescripción
1ClaseEl contenido general de la estructura secundaria del dominio. (Equivalente a la clase SCOP )
2ArquitecturaAlta similitud estructural pero sin evidencia de homología .
3Topología /pliegueuna agrupación a gran escala de topologías que comparten características estructurales particulares (equivalente al nivel de "pliegue" en SCOP)
4Superfamilia homólogaindicativo de una relación evolutiva demostrable. (Equivalente a la superfamilia SCOP )

El recurso hermano de CATH, Gene3D, proporciona datos de secuencias adicionales para dominios sin estructuras determinadas experimentalmente y se utilizan para poblar las superfamilias homólogas. Las secuencias de proteínas de UniProtKB y Ensembl se escanean en comparación con los HMM de CATH para predecir los límites de secuencia de dominios y realizar asignaciones de superfamilias homólogas.

Lanzamientos

El equipo de CATH publica nuevos datos en forma de instantáneas diarias y de publicaciones oficiales aproximadamente una vez al año. La última versión de CATH-Gene3D (v4.3) se publicó en diciembre de 2020 y consta de: [8]

  • 500.238 entradas de dominios de proteínas estructurales
  • 151 millones de entradas de dominios proteicos no estructurales
  • 5.481 entradas de superfamilias homólogas
  • 212.872 entradas de familias funcionales

Software de código abierto

CATH es un proyecto de software de código abierto , cuyos desarrolladores desarrollan y mantienen una serie de herramientas de código abierto, [9] que están disponibles públicamente en GitHub . [10]

Referencias

  1. ^ Dawson NL, Lewis TE, Das S, Lees JG, Lee D, Ashford P, et al. (enero de 2017). "CATH: un recurso ampliado para predecir la función de las proteínas a través de la estructura y la secuencia". Nucleic Acids Research . 45 (D1): D289–D295. doi :10.1093/nar/gkw1098. PMC  5210570 . PMID  27899584.
  2. ^ abc Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM (agosto de 1997). "CATH: una clasificación jerárquica de las estructuras de los dominios proteínicos". Structure . 5 (8). Londres, Inglaterra: 1093–108. doi : 10.1016/s0969-2126(97)00260-8 . PMID  9309224.
  3. ^ "CATH: base de datos de clasificación de la estructura de proteínas en la UCL". Cathdb.info . Consultado el 9 de marzo de 2017 .
  4. ^ "CATH". Cathdb.info . Consultado el 9 de marzo de 2017 .
  5. ^ "Base de datos CATH (@CATHDatabase)". Twitter . Consultado el 9 de marzo de 2017 .
  6. ^ Pearl FM, Bennett CF, Bray JE, Harrison AP, Martin N, Shepherd A, et al. (enero de 2003). "La base de datos CATH: un recurso de familia de proteínas extendida para la genómica estructural y funcional". Nucleic Acids Research . 31 (1): 452–455. doi :10.1093/nar/gkg062. PMC 165509 . PMID  12520050. 
  7. ^ "CATH". cathdb.info . Consultado el 14 de septiembre de 2024 .
  8. ^ "CATH". cathdb.info . Consultado el 14 de septiembre de 2024 .
  9. ^ "Herramientas". cathdb.info . Consultado el 18 de diciembre de 2016 .
  10. ^ UCLOrengoGroup/cath-tools, UCLOrengoGroup, 9 de septiembre de 2024 , consultado el 14 de septiembre de 2024

Obtenido de "https://es.wikipedia.org/w/index.php?title=Base_de_datos_CATH&oldid=1245731744"