Tarjetas genéticas

Base de datos de genes humanos mantenida por el Instituto de Ciencias Weizmann
Tarjetas genéticas
Contenido
Tipos de datos
capturados
Genes humanos y ortólogos modelo
OrganismosHomo sapiens
Contacto
Centro de investigaciónCentro del Genoma Humano de la Corona, WIS
Cita primariaNúmero de identificación personal  9097728
Acceso
Formato de datosHTML
Sitio webwww.genecards.org

GeneCards es una base de datos de genes humanos que proporciona información genómica , proteómica , transcriptómica , genética y funcional sobre todos los genes humanos conocidos y previstos. [1] [2] [3] [4] Está siendo desarrollado y mantenido por el Crown Human Genome Center en el Weizmann Institute of Science , en colaboración con LifeMap Sciences.

La base de datos tiene como objetivo proporcionar una visión completa de la información biomédica disponible actualmente sobre el gen buscado, incluidos sus alias e identificadores, las proteínas codificadas , las enfermedades y variaciones asociadas, su función, publicaciones relevantes y más. [1] [5] [6] La base de datos GeneCards proporciona acceso a recursos web gratuitos sobre más de 350.000 genes humanos conocidos y previstos, integrados a partir de >150 recursos de datos, como HGNC , Ensembl y NCBI . La lista principal de genes se basa en NCBI, Ensembl y símbolos genéticos aprobados publicados por el Comité de Nomenclatura Genética HUGO (HGNC). [7] [8] La información se recopila y selecciona cuidadosamente de estas bases de datos mediante su motor de integración.

Con el tiempo, la base de datos GeneCards ha desarrollado un conjunto de herramientas (VarElect, GeneALaCart, etc.) que tienen capacidades más especializadas que aprovechan la base de datos. Desde 1998, la base de datos GeneCards ha sido ampliamente utilizada por las comunidades bioinformática , genómica y médica durante más de 24 años. [7] [8]

Historia

Desde la década de 1980, la información sobre secuencias se ha vuelto cada vez más abundante; posteriormente, muchos laboratorios se dieron cuenta de ello y comenzaron a almacenar dicha información en repositorios centrales: la base de datos primaria. [9] Sin embargo, la información proporcionada por las bases de datos de secuencias primarias (bases de datos de nivel inferior) se centra en diferentes aspectos. Para reunir estos datos dispersos, el Centro del Genoma Humano Crown del Instituto Weizmann de Ciencias desarrolló una base de datos llamada "GeneCards" en 1997. Esta base de datos se ocupaba principalmente de información sobre el genoma humano, los genes humanos, las funciones de las proteínas codificadas y las enfermedades relacionadas, aunque se ha ampliado desde entonces. [1]

Crecimiento

Inicialmente, la base de datos GeneCards tenía dos características principales: la entrega de información biomédica integrada para un gen en formato de "tarjeta" y un motor de búsqueda basado en texto . Desde 1998, la base de datos ha integrado más recursos de datos y tipos de datos, como expresión de proteínas e información de la red genética. También ha mejorado la velocidad y la sofisticación del motor de búsqueda, y se ha expandido desde un dogma centrado en los genes para incluir análisis de conjuntos de genes. La versión 3 de la base de datos recopila información de más de 90 recursos de bases de datos basados ​​en una lista de genes consolidada. También ha agregado un conjunto de herramientas GeneCards que se centran en propósitos más específicos. "GeneNote y GeneAnnot para análisis de transcriptomas , GeneLoc para ubicaciones y marcadores genómicos, GeneALaCart para consultas por lotes y GeneDecks para encontrar socios funcionales y para destilaciones de conjuntos de genes". La base de datos se actualiza en un ciclo de 3 años de planificación, implementación, desarrollo, control de calidad semiautomatizado y despliegue. Las tecnologías utilizadas incluyen Eclipse , Apache , Perl , XML , PHP , Propel, Java , R y MySQL . [7] [8]

Expansiones continuas de GeneCards

Fuente: [7]

Disponibilidad

Las instituciones sin fines de lucro pueden acceder libremente a GeneCards con fines educativos y de investigación en https://www.genecards.org/ y en sitios académicos espejo . El uso comercial requiere una licencia. [ cita requerida ]

Paquete de tarjetas genéticas

GeneDecks

GeneDecks es una novedosa herramienta de análisis para identificar genes similares o asociados, que proporciona una métrica de similitud al resaltar los descriptores compartidos entre genes, basándose en la riqueza única de anotaciones combinatorias de genes humanos de GeneCards.

  1. Combinación de anotaciones : con GeneDecks, se puede obtener un conjunto de genes similares para un gen en particular con una anotación combinatoria seleccionada . La tabla resumen muestra el resultado de la clasificación de los diferentes niveles de similitud entre los genes identificados y el gen de prueba.
  2. Unificación de anotaciones : las distintas fuentes de datos suelen ofrecer anotaciones con un sistema de nombres heterogéneo . La unificación de anotaciones de GeneDecks se basa en la similitud de los algoritmos de detección del espacio de contenido genético de GeneCards .
  3. Búsqueda de socios : en Partner Hunter de GeneDecks, los usuarios ingresan un gen de consulta y el sistema busca genes similares basándose en la similitud combinatoria de atributos ponderados.
  4. Destilación de conjuntos : en Set distiller, los usuarios proporcionan un conjunto de genes y el sistema clasifica los atributos según su grado de compartición dentro de un conjunto de genes determinado. Al igual que Partner Hunter, permite una investigación sofisticada de una variedad de conjuntos de genes, de diversos orígenes, para descubrir y dilucidar patrones biológicos relevantes, mejorando así el escrutinio sistemático de la genómica y la biología de sistemas. [8] [10] [11]

Carrito GeneALa

GeneALaCart es un motor de consulta por lotes orientado a conjuntos de genes basado en la popular base de datos GeneCards. Permite recuperar información sobre múltiples genes en una consulta por lotes. [7] [12]

GeneLoc

El miembro del conjunto GeneLoc presenta un mapa cromosómico humano integrado , que es muy importante para diseñar un chip de captura personalizado , basado en datos integrados por el algoritmo GeneLoc. GeneLoc incluye enlaces adicionales a GeneCards, secuenciación del genoma humano del NCBI, UniGene y recursos de mapeo. [7] [13]

Uso

En primer lugar, introduzca un término de búsqueda en el espacio en blanco de las páginas de inicio. Los métodos de búsqueda incluyen Palabras clave, Solo símbolo, Símbolo/Alias/Identificador y Símbolo/Alias. [5] La opción de búsqueda predeterminada es buscar por palabras clave. Cuando un usuario busca por palabras clave, se muestran MicroCard y MiniCard. Sin embargo, cuando un usuario busca solo por Símbolo, será dirigido a GeneCard. [14] Las búsquedas se pueden ampliar haciendo clic en búsqueda avanzada, donde un usuario puede elegir sección, categoría, GIFtS, Fuente de símbolo y conjuntos de genes directamente. Las secciones incluyen Alias ​​y descripciones, Trastornos, Medicamentos y compuestos, Expresión en tejidos humanos, Función, Ubicación genómica, Variantes genómicas, Ortólogos, Parálogos, Vías e interacciones, Dominios/familias de proteínas, Proteínas, Publicaciones, Resúmenes y Transcripciones. La opción predeterminada es buscar en todas las secciones. [5] Las categorías incluyen Codificación de proteínas , Pseudogenes , Genes de ARN, Loci genéticos , Clústeres de genes y Sin categorizar. La opción predeterminada es buscar en todas las categorías. [5] GIFtS es el GeneCards Inferred Functionality Scores, que proporciona números objetivos para mostrar el nivel de conocimiento sobre la funcionalidad de los genes humanos. Incluye rango alto, medio, bajo y personalizado. [4] [15] Las fuentes de símbolos incluyen HGNC ( Comité de nomenclatura genética HUGO ), EntrezGene (información centrada en genes en NCBI), Ensembl, GeneCards RNA genes, CroW21, etc. [5]

Además, el usuario puede elegir buscar todas las GeneCards o dentro del subconjunto de genes, lo que sería más específico y con prioridad.

En segundo lugar, la página de resultados de búsqueda muestra todas las minitarjetas relevantes. En la página se muestran el símbolo, la descripción, la categoría, los GIFtS, el ID de GC y la puntuación. [5] El usuario puede hacer clic en el botón más de cada una de las minitarjetas para abrirlas. Además, el usuario puede hacer clic directamente en el símbolo para ver los detalles de una GeneCard en particular.

Perfil de expresión de FAM214A encontrado en tejido humano normal, como se muestra en GeneCards.

Contenido de GeneCards

Fuente: [5]

Para una GeneCard particular (ejemplo: GeneCard para TGFB1), consta de los siguientes contenidos.

  1. Encabezado : El encabezado está formado por el símbolo del gen, la categoría (es decir, el gen que codifica la proteína), GIFtS (es decir, 74) y GCID (GC19M041837). Las diferentes categorías tienen diferentes colores para expresarse: gen que codifica la proteína, pseudogen, gen de ARN, grupo de genes , locus genético y sin categorizar. El fondo indica las fuentes de los símbolos: genes aprobados por HGNC, base de datos EntrezGene, base de datos de genes Ensembl o genes generados por GeneCards.
  2. Alias : Alias, como su nombre lo indica, muestra sinónimos y alias del gen según diversas fuentes como HGNC. La columna de la derecha muestra cómo se asocian los alias a los recursos y da identificadores de GC anteriores.
  3. Resúmenes : La columna de la izquierda es la misma que la de Alias, que muestra las fuentes. La columna de la derecha ofrece un breve resumen sobre la función, la localización y el efecto de los genes en el fenotipo a partir de diversas fuentes.
  4. Vistas genómicas : además de las fuentes, esta sección ofrece información sobre secuencias de ADN de referencia, elementos reguladores, epigenética, bandas cromosómicas y ubicación genómica de diferentes fuentes. La línea roja en la imagen indica la ubicación integrada de GeneLoc. En particular, si la ubicación integrada de GeneLoc es diferente de la ubicación en Entrez Gene, se muestra en verde; aparece en azul cuando la ubicación integrada de GeneLoc es diferente de la ubicación en Ensembl. Se puede acceder a detalles adicionales a través de los enlaces en la sección.
  5. Proteínas : Esta sección presenta información anotada de los genes, incluyendo nombre recomendado, tamaño, subunidad, ubicación subcelular y accesiones secundarias. También se presentan modificaciones postraduccionales, datos de expresión de proteínas, proteínas REF SEQ, proteínas ENSEMBL, detalles de las proteínas Reactome, productos de proteínas recombinantes humanas, ontología génica , productos de anticuerpos y productos de análisis.
  6. Dominios/Familias de proteínas : esta sección muestra información anotada de dominios y familias de proteínas.
  7. Función : La sección de función describe la función del gen, incluyendo: fenotipos humanos , objetivos ligados, shRNA para humanos y/o ratones/ratas, objetivos genéticos de miRNA , productos de RNAi , microRNA para ortólogos humanos y/o ratones/ratas, edición genética , clones , líneas celulares , modelos animales, ensayos de hibridación in situ .
  8. Vías e interacciones : esta sección muestra las vías e interacciones unificadas de GeneCards que provienen de diferentes fuentes. Las vías unificadas de GeneCards se recopilan en supervías, que muestran la conexión entre las diferentes vías. La sección Interacción muestra detalles de los interactuantes y las interacciones.
  9. Medicamentos y compuestos : esta sección conecta GeneCards con medicamentos y compuestos. Los compuestos muestran el compuesto químico, la acción y el número CAS. DrugBank Compound proporciona el compuesto, los sinónimos, el número CAS (número de registro de Chemical Abstracts), el tipo (transportador/objetivo/transportador/enzima), las acciones y los identificadores de PubMed. HMDB y Novoseek muestran las relaciones de los compuestos químicos, que incluyen el compuesto, los sinónimos, el número CAS y los identificadores de PubMed (artículos relacionados con el compuesto). BitterDB muestra el compuesto, el número CAS y SMILES ( especificación simplificada de entrada de línea de entrada molecular ). PharmGKB proporciona el fármaco/compuesto y su anotación.
  10. Transcripciones : Esta sección consta de secuencias de referencia de ARNm, grupos Unigene y secuencias representativas, productos de miARN, productos de ARN inhibidor, productos de clones, productos de iniciadores y secuencias de ARNm adicionales. Además, el usuario puede obtener la estructura de exones de GeneLoc.
  11. Expresión : La columna de la izquierda muestra los recursos de los datos. En esta sección se incluyen imágenes y datos de expresión, genes similares, matrices de PCR y primers para ensayos de hibridación humana e in situ.
  12. Ortólogos : esta sección proporciona ortólogos para un gen en particular a partir de varias especies. La tabla muestra el organismo correspondiente, la clasificación taxonómica, el gen, la descripción, la similitud con los humanos, el tipo de ortología y los detalles. Está conectada con el árbol genético de ENSEMBL, el árbol genético de TreeFam y Aminode. [16]
  13. Parálogos : esta sección muestra parálogos y pseudogenes para un gen en particular.
  14. Variantes genómicas : las variantes genómicas muestran el resultado de los SNP/variantes de NCBI, el informe de desequilibrio de ligamiento de HapMap, las variaciones estructurales, la base de datos de mutaciones genéticas humanas (HGMD), los cebadores de PCR de largo alcance QIAGEN SeqTarget en humanos, ratones y ratas y las matrices de PCR de mutación de cáncer de SABiosciences. La tabla de esta sección muestra el ID de SNP, Válido, Significación clínica, Chr pos, Secuencia para datos genómicos, AAChg, Tipo y más para datos relacionados con la transcripción, Frecuencia alélica , Pop, Muestra total y más para frecuencias alélicas. Para Válido, los diferentes caracteres representan diferentes métodos de validación. 'C' significa por grupo; 'A' es por 2 hits 2 alelos; 'F' es por frecuencia; 'H' es por hapmap y 'O' es por otra población. La significación clínica puede ser una de las siguientes: no patógena, patógena, respuesta a fármacos, histocompatibilidad, probablemente no patógena, probablemente patógena, no probada, desconocida y otra. El tipo debe ser uno de estos: nonsynon, syn, cds, spl, utr, int, exc, loc, stg, ds500, spa, spd, us2k, us5k, Designaciones PupaSUITE.
  15. Trastornos/Enfermedades : Muestra trastornos/enfermedades asociados con el gen.
  16. Publicaciones : Muestra publicaciones asociadas con el gen.
  17. Búsquedas externas : busca más información en PubMed , OMIM y NCBI.
  18. Bases de datos del genoma : otras bases de datos y bases de datos especializadas.
  19. Propiedad intelectual : esta sección proporciona información sobre patentes y tecnologías licenciables.
  20. Productos

Aplicaciones

GeneCards se utiliza ampliamente en los campos biológico y biomédico. Por ejemplo, SH Shah extrajo datos de enfermedad coronaria de aparición temprana de GeneCards para identificar genes que contribuyen a la enfermedad . Se confirmó que los cromosomas 3q13, 1q25, etc. tienen efectos y este artículo analizó más a fondo la relación entre los genes mórbidos y las lipoproteínas séricas con la ayuda de GeneCard. [17]

Otro ejemplo es un estudio de investigación sobre la letalidad sintética en el cáncer . La letalidad sintética aparece cuando una mutación en un solo gen no tiene efecto sobre la función de una célula , pero una mutación en un gen adicional conduce a la muerte celular. Este estudio tuvo como objetivo encontrar nuevos métodos para tratar el cáncer mediante el bloqueo de la letalidad de los medicamentos. Se utilizó GeneCards al comparar los datos de un gen objetivo determinado con todos los genes posibles. En este proceso, la puntuación de intercambio de anotaciones se calculó utilizando GeneDecks Partner Hunter (ahora llamado Genes Like Me) para dar paralogía. Los objetivos de inactivación se extrajeron después de los experimentos de microarray de líneas celulares de neuroblastoma resistentes y no resistentes. [7]

Referencias

  1. ^ abc Rebhan M, Chalifa-Caspi V, Prilusky J, Lancet D (abril de 1997). "GeneCards: integración de información sobre genes, proteínas y enfermedades". Tendencias en genética . 13 (4): 163. doi :10.1016/S0168-9525(97)01103-7. PMID  9097728.
  2. ^ Rebhan M, Chalifa-Caspi V, Prilusky J, Lancet D (1998). "GeneCards: un nuevo compendio de genómica funcional con minería de datos automatizada y soporte de reformulación de consultas". Bioinformática . 14 (8): 656–64. doi : 10.1093/bioinformatics/14.8.656 . PMID  9789091.
  3. ^ Safran M, Solomon I, Shmueli O, Lapidot M, Shen-Orr S, Adato A, et al. (noviembre de 2002). "GeneCards 2002: hacia un compendio completo y orientado a objetos de genes humanos". Bioinformática . 18 (11): 1542–3. doi : 10.1093/bioinformatics/18.11.1542 . PMID  12424129.
  4. ^ ab Harel A, Inger A, Stelzer G, Strichman-Almashanu L, Dalah I, Safran M, Lancet D (octubre de 2009). "GIFtS: análisis del panorama de anotaciones con GeneCards". BMC Bioinformatics . 10 (1): 348. doi : 10.1186/1471-2105-10-348 . PMC 2774327 . PMID  19852797. 
  5. ^ abcdefg "GeneCards". GeneCards. Archivado desde el original el 14 de octubre de 2013. Consultado el 18 de octubre de 2013 .
  6. ^ "GeneCards" . Consultado el 19 de octubre de 2013 .
  7. ^ abcdefg Stelzer G, Dalah I, Stein TI, Satanower Y, Rosen N, Nativ N, et al. (octubre de 2011). "Genómica humana in-silico con GeneCards". Genómica humana . 5 (6): 709–17. doi : 10.1186/1479-7364-5-6-709 . PMC 3525253 . PMID  22155609. 
  8. ^ abcd Safran M, Dalah I, Alexander J, Rosen N, Iny Stein T, Shmoish M, et al. (agosto de 2010). "GeneCards versión 3: el integrador de genes humanos". Base de datos . 2010 : baq020. doi :10.1093/database/baq020. PMC 2938269 . PMID  20689021. 
  9. ^ Attwood TK, Parry-Smith DJ (1999). Introducción a la bioinformática . Harlow Longman.
  10. ^ "GeneDecks". GeneCards. Archivado desde el original el 14 de octubre de 2013. Consultado el 20 de octubre de 2013 .
  11. ^ Stelzer G, Inger A, Olender T, Iny-Stein T, Dalah I, Harel A, et al. (diciembre de 2009). "GeneDecks: búsqueda de parálogos y destilación de conjuntos de genes con anotación GeneCards" (PDF) . Omics . 13 (6): 477–87. doi :10.1089/omi.2009.0069. PMID  20001862. S2CID  33116814. Archivado desde el original (PDF) el 2020-02-10.
  12. ^ "GeneALaCart". GeneCards. Archivado desde el original el 30 de septiembre de 2013. Consultado el 20 de octubre de 2013 .
  13. ^ "GeneLoc". Tarjetas genéticas . Consultado el 20 de octubre de 2013 .
  14. ^ Sridhar GR, Divakar CH, Hanuman T, Rao AA (2006). "Enfoque bioinformático para extraer información de los genes". Revista de diabetes en países en desarrollo . 26 (4): 149–51. doi : 10.4103/0973-3930.33179 .
  15. ^ Chalifa-Caspi V, Shmueli O, Benjamin-Rodrig H, Rosen N, Shmoish M, Yanai I, et al. (diciembre de 2003). "GeneAnnot: interconexión de GeneCards con compendios de expresión génica de alto rendimiento". Briefings in Bioinformatics . 4 (4): 349–60. doi : 10.1093/bib/4.4.349 . PMID  14725348.
  16. ^ Chang KT, Guo J, di Ronza A, Sardiello M (enero de 2018). "Aminode: Identificación de restricciones evolutivas en el proteoma humano". Scientific Reports . 8 (1): 1357. Bibcode :2018NatSR...8.1357C. doi :10.1038/s41598-018-19744-w. PMC 5778061 . PMID  29358731. 
  17. ^ Shah SH, Kraus WE, Crossman DC, Granger CB, Haines JL, Jones CJ, et al. (noviembre de 2006). "Los lípidos séricos en el estudio GENECARD de la enfermedad de la arteria coronaria identifican loci de rasgos cuantitativos y subconjuntos fenotípicos en los cromosomas 3q y 5q". Anales de genética humana . 70 (parte 6): 738–48. doi :10.1111/j.1469-1809.2006.00288.x. PMID  17044848. S2CID  24239757.
  • Sitio web oficial
Obtenido de "https://es.wikipedia.org/w/index.php?title=GeneCards&oldid=1215119658"