Base de datos CATH

CATÉTERO
Contenido
Descripción	Clasificación de la estructura de las proteínas
Contacto
Centro de investigación	Colegio Universitario de Londres
Laboratorio	Instituto de Biología Estructural y Molecular
Cita primaria	Dawson y otros (2016)
Fecha de lanzamiento	1997
Acceso
Sitio web	Información de catdb
Descargar URL	cathdb.info/descargar
Misceláneas
; Frecuencia de publicación de datos	La prueba CATH-B se publica diariamente. Las publicaciones oficiales se realizan aproximadamente una vez al año.
Versión	4.3

La base de datos de clasificación de la estructura de proteínas CATH es un recurso en línea gratuito y de acceso público que proporciona información sobre las relaciones evolutivas de los dominios proteicos . Fue creada a mediados de la década de 1990 por la profesora Christine Orengo y colegas, entre ellos Janet Thornton y David Jones , ^[2] y continúa siendo desarrollada por el grupo Orengo en el University College de Londres . CATH comparte muchas características generales con el recurso SCOP , sin embargo, también hay muchas áreas en las que la clasificación detallada difiere en gran medida. ^[3]^[4]^[5]^[6]

Organización jerárquica

Las estructuras tridimensionales de proteínas determinadas experimentalmente se obtienen del banco de datos de proteínas y se dividen en sus cadenas polipeptídicas consecutivas , cuando corresponde. Los dominios de proteínas se identifican dentro de estas cadenas utilizando una combinación de métodos automáticos y curación manual. ^[7]

Los dominios se clasifican luego dentro de la jerarquía estructural CATH: en el nivel de Clase (C), los dominios se asignan de acuerdo con su contenido de estructura secundaria , es decir, todo alfa , todo beta , una mezcla de alfa y beta, o poca estructura secundaria; en el nivel de Arquitectura (A), se utiliza información sobre la disposición de la estructura secundaria en el espacio tridimensional para la asignación; en el nivel de Topología/pliegue (T), se utiliza información sobre cómo se conectan y organizan los elementos de la estructura secundaria; las asignaciones se realizan al nivel de superfamilia homóloga (H) si hay buena evidencia de que los dominios están relacionados por evolución ^[2], es decir, son homólogos.

Los cuatro niveles principales de la jerarquía CATH:
#	Nivel	Descripción
1	Clase	El contenido general de la estructura secundaria del dominio. (Equivalente a la clase SCOP )
2	Arquitectura	Alta similitud estructural pero sin evidencia de homología .
3	Topología /pliegue	una agrupación a gran escala de topologías que comparten características estructurales particulares (equivalente al nivel de "pliegue" en SCOP)
4	Superfamilia homóloga	indicativo de una relación evolutiva demostrable. (Equivalente a la superfamilia SCOP )

El recurso hermano de CATH, Gene3D, proporciona datos de secuencias adicionales para dominios sin estructuras determinadas experimentalmente y se utilizan para poblar las superfamilias homólogas. Las secuencias de proteínas de UniProtKB y Ensembl se escanean en comparación con los HMM de CATH para predecir los límites de secuencia de dominios y realizar asignaciones de superfamilias homólogas.

Lanzamientos

El equipo de CATH publica nuevos datos en forma de instantáneas diarias y de publicaciones oficiales aproximadamente una vez al año. La última versión de CATH-Gene3D (v4.3) se publicó en diciembre de 2020 y consta de: ^[8]

500.238 entradas de dominios de proteínas estructurales
151 millones de entradas de dominios proteicos no estructurales
5.481 entradas de superfamilias homólogas
212.872 entradas de familias funcionales

Software de código abierto

CATH es un proyecto de software de código abierto , cuyos desarrolladores desarrollan y mantienen una serie de herramientas de código abierto, ^[9] que están disponibles públicamente en GitHub . ^[10]

Referencias

^ Dawson NL, Lewis TE, Das S, Lees JG, Lee D, Ashford P, et al. (enero de 2017). "CATH: un recurso ampliado para predecir la función de las proteínas a través de la estructura y la secuencia". Nucleic Acids Research . 45 (D1): D289–D295. doi :10.1093/nar/gkw1098. PMC 5210570 . PMID 27899584.
^ abc Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM (agosto de 1997). "CATH: una clasificación jerárquica de las estructuras de los dominios proteínicos". Structure . 5 (8). Londres, Inglaterra: 1093–108. doi : 10.1016/s0969-2126(97)00260-8 . PMID 9309224.
^ "CATH: base de datos de clasificación de la estructura de proteínas en la UCL". Cathdb.info . Consultado el 9 de marzo de 2017 .
^ "CATH". Cathdb.info . Consultado el 9 de marzo de 2017 .
^ "Base de datos CATH (@CATHDatabase)". Twitter . Consultado el 9 de marzo de 2017 .
^ Pearl FM, Bennett CF, Bray JE, Harrison AP, Martin N, Shepherd A, et al. (enero de 2003). "La base de datos CATH: un recurso de familia de proteínas extendida para la genómica estructural y funcional". Nucleic Acids Research . 31 (1): 452–455. doi :10.1093/nar/gkg062. PMC 165509 . PMID 12520050.
^ "CATH". cathdb.info . Consultado el 14 de septiembre de 2024 .
^ "CATH". cathdb.info . Consultado el 14 de septiembre de 2024 .
^ "Herramientas". cathdb.info . Consultado el 18 de diciembre de 2016 .
^ UCLOrengoGroup/cath-tools, UCLOrengoGroup, 9 de septiembre de 2024 , consultado el 14 de septiembre de 2024

[Cathv4.1-1] Dawson NL, Lewis TE, Das S, Lees JG, Lee D, Ashford P, et al. (enero de 2017). "CATH: un recurso ampliado para predecir la función de las proteínas a través de la estructura y la secuencia". Nucleic Acids Research . 45 (D1): D289–D295. doi :10.1093/nar/gkw1098. PMC 5210570 . PMID 27899584.

[Orengo_1997-2] Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM (agosto de 1997). "CATH: una clasificación jerárquica de las estructuras de los dominios proteínicos". Structure . 5 (8). Londres, Inglaterra: 1093–108. doi : 10.1016/s0969-2126(97)00260-8 . PMID 9309224.

[3] "CATH: base de datos de clasificación de la estructura de proteínas en la UCL". Cathdb.info . Consultado el 9 de marzo de 2017 .

[4] "CATH". Cathdb.info . Consultado el 9 de marzo de 2017 .

[5] "Base de datos CATH (@CATHDatabase)". Twitter . Consultado el 9 de marzo de 2017 .

[Pearl2003-6] Pearl FM, Bennett CF, Bray JE, Harrison AP, Martin N, Shepherd A, et al. (enero de 2003). "La base de datos CATH: un recurso de familia de proteínas extendida para la genómica estructural y funcional". Nucleic Acids Research . 31 (1): 452–455. doi :10.1093/nar/gkg062. PMC 165509 . PMID 12520050.

[7] "CATH". cathdb.info . Consultado el 14 de septiembre de 2024 .

[8] "CATH". cathdb.info . Consultado el 14 de septiembre de 2024 .

[9] "Herramientas". cathdb.info . Consultado el 18 de diciembre de 2016 .

[10] UCLOrengoGroup/cath-tools, UCLOrengoGroup, 9 de septiembre de 2024 , consultado el 14 de septiembre de 2024