This article needs additional citations for verification. (January 2009) |
Contenido | |
---|---|
Descripción | Productos químicos y sus bioensayos |
Organismos | Los humanos y otros animales |
Contacto | |
Centro de investigación | Instituto Nacional de Biología |
Cita primaria | Número de identificación personal 15879180 |
Acceso | |
Sitio web | pubchem.ncbi.nlm.nih.gov |
Descargar URL | FTP |
URL del servicio web | Vista PUG [1] |
Misceláneas | |
Licencia | Dominio público |
PubChem es una base de datos de moléculas químicas y sus actividades frente a ensayos biológicos . El sistema es mantenido por el Centro Nacional de Información Biotecnológica (NCBI), un componente de la Biblioteca Nacional de Medicina , que forma parte de los Institutos Nacionales de Salud de los Estados Unidos (NIH). Se puede acceder a PubChem de forma gratuita a través de una interfaz de usuario web . Se pueden descargar de forma gratuita millones de estructuras de compuestos y conjuntos de datos descriptivos a través de FTP . PubChem contiene múltiples descripciones de sustancias y moléculas pequeñas con menos de 100 átomos y 1000 enlaces. Más de 80 proveedores de bases de datos contribuyen a la creciente base de datos PubChem. [2]
PubChem se lanzó en 2004 como un componente del Programa de Bibliotecas Moleculares (MLP) del NIH. A partir de noviembre de 2015, PubChem contiene más de 150 millones de descripciones de sustancias proporcionadas por depositantes, 60 millones de estructuras químicas únicas y 225 millones de resultados de pruebas de actividad biológica (de más de 1 millón de experimentos de ensayo realizados en más de 2 millones de moléculas pequeñas que cubren casi 10.000 secuencias de proteínas diana únicas que corresponden a más de 5.000 genes). También contiene ensayos de detección de interferencia de ARN (ARNi) que se dirigen a más de 15.000 genes. [3]
En agosto de 2018, PubChem contiene 247,3 millones de descripciones de sustancias y 96,5 millones de estructuras químicas únicas, aportadas por 629 fuentes de datos de 40 países. También contiene 237 millones de resultados de pruebas de bioactividad de 1,25 millones de ensayos biológicos, que abarcan más de 10 000 secuencias de proteínas objetivo. [4]
A partir de 2020, con la integración de datos de más de 100 nuevas fuentes, PubChem contiene más de 293 millones de descripciones de sustancias proporcionadas por depositantes, 111 millones de estructuras químicas únicas y 271 millones de puntos de datos de bioactividad de 1,2 millones de experimentos de ensayos biológicos. [5]
PubChem consta de tres bases de datos primarias que crecen de forma dinámica. A partir del 5 de noviembre de 2020 (la cantidad de ensayos biológicos no ha cambiado):
Es posible buscar en las bases de datos una amplia gama de propiedades, incluidas la estructura química, los fragmentos de nombres, la fórmula química , el peso molecular , XLogP y el número de donantes y aceptores de enlaces de hidrógeno .
PubChem contiene su propio editor de moléculas en línea con soporte para SMILES /SMARTS e InChI que permite la importación y exportación de todos los formatos de archivos químicos comunes para buscar estructuras y fragmentos.
Cada resultado proporciona información sobre sinónimos, propiedades químicas, estructura química (incluidas cadenas SMILES e InChI), bioactividad y enlaces a compuestos estructuralmente relacionados y otras bases de datos del NCBI como PubMed .
En el formulario de búsqueda de texto, se puede buscar en los campos de la base de datos añadiendo el nombre del campo entre corchetes al término de búsqueda. Un rango numérico se representa con dos números separados por dos puntos. Los términos de búsqueda y los nombres de los campos no distinguen entre mayúsculas y minúsculas. Se pueden utilizar paréntesis y los operadores lógicos AND, OR y NOT. Se supone que se utiliza AND si no se utiliza ningún operador.
Ejemplo ( Regla de cinco de Lipinski ):
0:500[mw] 0:5[hbdc] 0:10[hbac] -5:5[logp]
Números de identificación | ||
• | Número de identificación en la base de datos actual | [Identificador único] |
• | Número de identificación de la sustancia | [SID] |
• | Número de identificación compuesto | [CID] |
• | Número de identificación de BioAssay | [BAID], [AYUDA] |
General | ||
• | Cualquier campo de base de datos | [TODOS] |
• | Comentario | [CMT] |
• | Fecha de deposición | [DDAT], [DEPDAT] |
• | Identificación externa del depositante | [ID de origen], [ID de origen] |
• | Nombre de la fuente | [FUENTE], [NOMBREFUENTE], [NOMBREFUENTE] |
• | Fecha de publicación de la fuente | [SRD], [SRDAT], [RLSDAT] |
• | Término de encabezado de tema médico (MeSH) | [MSHT], [MALLA] |
• | Nodo de árbol MeSH | [MSHN], [MESHTN] |
• | Acciones farmacológicas MeSH | [PHMA], [FARMA] |
Propiedades de las sustancias | ||
• | Sinónimos de sustancias | [SINO] |
• | Nombre IUPAC | [UPAC], [IUPAC] |
• | Identificador químico internacional (InChI) | [PULGADAS] |
• | Peso molecular | [MW], [MWT], [MOLWT] |
• | Elementos químicos | [ELMT], [EL] |
• | Átomos que no son hidrógeno | [HAC], [HACNT] |
• | Recuento de isótopos | [IAC], [IACNT] |
• | Cargo formal total | [TFC], [CHG], [CHRG] |
• | Recuento de átomos quirales | [ACC], [ACCNT] |
• | Recuento definido de átomos quirales | [ACDC], [ACDCNT] |
• | Recuento de átomos quirales indefinido | [ACUC], [ACUCNT] |
• | Recuento de aceptores de enlaces de hidrógeno | [HBAC], [HBACNT] |
• | Recuento de donantes de enlaces de hidrógeno | [HBDC], [HBDCNT] |
• | Recuento de tautómeros | [TC], [TCNT], [TTMC] |
• | Recuento de enlaces rotativos | [RBC], [RBCNT] |
• | XLogP [11] | [XLGP], [LOGP] |
Propiedades de los compuestos | ||
• | Sinónimos compuestos | [CSYN], [CSYNO] |
• | Recuento de componentes | [CC], [CCNT] |
• | Recuento de unidades covalentes (moléculas) | [CUC], [CUCNT] |
• | Recuento total de bioactividad | [Táctica] |