Genómica comparativa

Campo de investigación biológica

La alineación del genoma completo es un método típico en la genómica comparativa. Esta alineación de ocho genomas de la bacteria Yersinia revela 78 bloques colineales locales conservados entre los ocho taxones . Cada cromosoma se ha dispuesto horizontalmente y los bloques homólogos en cada genoma se muestran como regiones de colores idénticos vinculadas entre genomas. Las regiones que están invertidas en relación con el KIM de Y. pestis se desplazan por debajo del eje central de un genoma. [1]

La genómica comparativa es una rama de la investigación biológica que examina las secuencias del genoma en un espectro de especies , que abarca desde los humanos y los ratones hasta una amplia gama de organismos, desde las bacterias hasta los chimpancés . [2] [3] Este enfoque holístico a gran escala compara dos o más genomas para descubrir las similitudes y diferencias entre los genomas y estudiar la biología de los genomas individuales. [4] La comparación de secuencias del genoma completo proporciona una visión muy detallada de cómo se relacionan los organismos entre sí a nivel genético . Al comparar secuencias del genoma completo, los investigadores obtienen información sobre las relaciones genéticas entre organismos y estudian los cambios evolutivos . [2] El principio principal de la genómica comparativa es que las características comunes de dos organismos a menudo estarán codificadas dentro del ADN que se conserva evolutivamente entre ellos. Por lo tanto, la genómica comparativa proporciona una herramienta poderosa para estudiar los cambios evolutivos entre organismos, ayudando a identificar genes que se conservan o son comunes entre las especies, así como genes que dan características únicas de cada organismo. Además, estos estudios pueden realizarse en diferentes niveles de los genomas para obtener múltiples perspectivas sobre los organismos. [4]

El análisis genómico comparativo comienza con una comparación sencilla de las características generales de los genomas, como el tamaño del genoma, el número de genes y el número de cromosomas. La Tabla 1 presenta datos sobre varios organismos modelo completamente secuenciados y destaca algunos hallazgos sorprendentes. Por ejemplo, mientras que la pequeña planta con flores Arabidopsis thaliana tiene un genoma más pequeño que el de la mosca de la fruta Drosophila melanogaster (157 millones de pares de bases frente a 165 millones de pares de bases, respectivamente), posee casi el doble de genes (25.000 frente a 13.000). De hecho, A. thaliana tiene aproximadamente el mismo número de genes que los humanos (25.000). Por lo tanto, una lección muy temprana aprendida en la era genómica es que el tamaño del genoma no se correlaciona con el estado evolutivo, ni el número de genes es proporcional al tamaño del genoma. [5]

Tabla 1: Tamaños comparativos del genoma de humanos y otros organismos modelo [2]
OrganismoTamaño estimado (pares de bases)Número de cromosomasNúmero estimado de genes
Humano (Homo sapiens)3.1 mil millones4625.000
Ratón (Mus musculus)2.9 mil millones4025.000
Bovino (Bos taurus)2.86 mil millones [6]60 [7]22.000 [8]
Mosca de la fruta (Drosophila melanogater)165 millones813.000
Planta ( Arabidopsis thaliana )157 millones1025.000
Lombriz intestinal ( Caenorhabditis elegans )97 millones1219.000
Levadura ( Saccharomyces cerevisiae )12 millones326.000
Bacterias ( Escherichia coli )4,6 millones13.200

En genómica comparativa, la sintenia es el orden preservado de los genes en los cromosomas de especies relacionadas que indica su descendencia de un ancestro común . La sintenia proporciona un marco en el que se identifica la conservación de genes homólogos y el orden de los genes entre genomas de diferentes especies. [9] Los bloques de sintenia se definen más formalmente como regiones de cromosomas entre genomas que comparten un orden común de genes homólogos derivados de un ancestro común. [10] [11] Se han utilizado indistintamente nombres alternativos como sintenia conservada o colinealidad . [12] Las comparaciones de la sintenia genómica entre y dentro de las especies han proporcionado una oportunidad para estudiar los procesos evolutivos que conducen a la diversidad del número y la estructura de los cromosomas en muchos linajes a lo largo del árbol de la vida; [13] [14] Los primeros descubrimientos que utilizaron dichos enfoques incluyen regiones cromosómicas conservadas en nematodos y levaduras , [15] [16] la historia evolutiva y los rasgos fenotípicos de grupos de genes Hox extremadamente conservados en animales y la familia de genes MADS-box en plantas, [17] [18] y la evolución del cariotipo en mamíferos y plantas. [19]

Además, comparar dos genomas no solo revela dominios conservados o sintenia, sino que también ayuda a detectar variaciones en el número de copias , polimorfismos de un solo nucleótido (SNP) , indeles y otras variaciones estructurales genómicas .

La genómica comparativa , que prácticamente comenzó tan pronto como se dispuso de los genomas completos de dos organismos (es decir, los genomas de las bacterias Haemophilus influenzae y Mycoplasma genitalium ) en 1995, es ahora un componente estándar del análisis de cada nueva secuencia genómica. [2] [20] Con la explosión en el número de proyectos genómicos debido a los avances en las tecnologías de secuenciación de ADN , en particular los métodos de secuenciación de próxima generación a finales de la década de 2000, este campo se ha vuelto más sofisticado, lo que hace posible abordar muchos genomas en un solo estudio. [21] La genómica comparativa ha revelado altos niveles de similitud entre organismos estrechamente relacionados, como los humanos y los chimpancés, y, lo que es más sorprendente, similitud entre organismos aparentemente distantemente relacionados, como los humanos y la levadura Saccharomyces cerevisiae . [22] También ha demostrado la extrema diversidad de la composición genética en diferentes linajes evolutivos. [20]

Historia

Véase también : Historia de la genómica

La genómica comparativa tiene sus raíces en la comparación de genomas de virus a principios de los años 1980. [20] Por ejemplo, se compararon virus de ARN pequeños que infectaban animales ( picornavirus ) y aquellos que infectaban plantas ( virus del mosaico del caupí ) y se demostró que compartían una similitud de secuencia significativa y, en parte, el orden de sus genes. [23] En 1986, se publicó el primer estudio genómico comparativo a mayor escala, comparando los genomas del virus varicela-zóster y el virus de Epstein-Barr que contenían más de 100 genes cada uno. [24]

La primera secuencia completa del genoma de un organismo celular, el de Haemophilus influenzae Rd, se publicó en 1995. [25] El segundo artículo sobre secuenciación del genoma fue el de la pequeña bacteria parásita Mycoplasma genitalium , publicado el mismo año. [26] A partir de este artículo, los informes sobre nuevos genomas se convirtieron inevitablemente en estudios genómicos comparativos. [20]

Genomas microbianos. El primer sistema de comparación de genomas completos de alta resolución de genomas microbianos de 10-15 kbp fue desarrollado en 1998 por Art Delcher, Simon Kasif y Steven Salzberg y aplicado a la comparación de organismos microbianos completos altamente relacionados con sus colaboradores en el Instituto de Investigación Genómica (TIGR). El sistema se llama MUMMER y fue descrito en una publicación en Nucleic Acids Research en 1999. El sistema ayuda a los investigadores a identificar grandes reordenamientos, mutaciones de una sola base, reversiones, expansiones de repeticiones en tándem y otros polimorfismos. En las bacterias, MUMMER permite la identificación de polimorfismos que son responsables de la virulencia, patogenicidad y resistencia a los antibióticos. El sistema también se aplicó al Proyecto de Organismo Mínimo en TIGR y posteriormente a muchos otros proyectos de genómica comparativa.

Genomas eucariotas. Saccharomyces cerevisiae , la levadura de panadería, fue el primer eucariota en tener su secuencia genómica completa publicada en 1996. [27] Después de la publicación del genoma del gusano redondo Caenorhabditis elegans en 1998 [15] y junto con el genoma de la mosca de la fruta Drosophila melanogaster en 2000, [28] Gerald M. Rubin y su equipo publicaron un artículo titulado "Genómica comparativa de los eucariotas", en el que compararon los genomas de los eucariotas D. melanogaster , C. elegans y S. cerevisiae , así como el procariota H. influenzae . [29] Al mismo tiempo, Bonnie Berger , Eric Lander y su equipo publicaron un artículo sobre la comparación del genoma completo de humanos y ratones. [30]

Con la publicación en la década de 2000 de los grandes genomas de vertebrados, incluidos el humano , el pez globo japonés Takifugu rubripes y el ratón , se han publicado resultados precalculados de comparaciones de genomas grandes para su descarga o visualización en un navegador de genomas . En lugar de realizar sus propios análisis, la mayoría de los biólogos pueden acceder a estas grandes comparaciones entre especies y evitar la impracticabilidad causada por el tamaño de los genomas. [31]

Los métodos de secuenciación de nueva generación , que se introdujeron por primera vez en 2007, han producido una enorme cantidad de datos genómicos y han permitido a los investigadores generar múltiples borradores de secuencias genómicas (procariotas) a la vez. Estos métodos también pueden descubrir rápidamente polimorfismos , inserciones y deleciones de un solo nucleótido al mapear lecturas no ensambladas contra un genoma de referencia bien anotado y, de esta manera, proporcionar una lista de posibles diferencias genéticas que pueden ser la base de cualquier variación funcional entre cepas. [21]

Principios evolutivos

Una característica de la biología es la evolución, la teoría de la evolución es también la base teórica de la genómica comparativa, y al mismo tiempo los resultados de la genómica comparativa enriquecieron y desarrollaron de manera sin precedentes la teoría de la evolución. Cuando se comparan dos o más secuencias del genoma, se pueden deducir las relaciones evolutivas de las secuencias en un árbol filogenético. Con base en una variedad de datos del genoma biológico y el estudio de los procesos de evolución vertical y horizontal, se pueden comprender partes vitales de la estructura genética y su función reguladora.

La similitud de genomas relacionados es la base de la genómica comparativa. Si dos criaturas tienen un ancestro común reciente, las diferencias entre los genomas de las dos especies se derivan del genoma de los ancestros. Cuanto más estrecha sea la relación entre dos organismos, mayores serán las similitudes entre sus genomas. Si existe una relación estrecha entre ellos, entonces su genoma mostrará un comportamiento lineal ( sintenia ), es decir, algunas o todas las secuencias genéticas se conservarán. Por lo tanto, las secuencias del genoma se pueden utilizar para identificar la función de los genes, analizando su homología (similitud de secuencia) con genes de función conocida.

El gen FOXP2 humano y la conservación evolutiva se muestran en una alineación múltiple (en la parte inferior de la figura) en esta imagen del Navegador Genómico de la UCSC . Nótese que la conservación tiende a agruparse alrededor de las regiones codificantes (exones).

Las secuencias ortólogas son secuencias relacionadas en diferentes especies: un gen existe en la especie original, la especie se divide en dos especies, por lo que los genes en la nueva especie son ortólogos a la secuencia en la especie original. Las secuencias paralógicas se separan mediante clonación de genes (duplicación de genes): si se copia un gen particular en el genoma, entonces la copia de las dos secuencias es paralógica al gen original. Un par de secuencias ortólogas se llama pares ortólogos (ortólogos), un par de secuencias paralógicas se llama pares colaterales (parálogos). Los pares ortólogos generalmente tienen la misma función o una similar, lo que no es necesariamente el caso de los pares colaterales. En los pares colaterales, las secuencias tienden a evolucionar hasta tener diferentes funciones.

La genómica comparativa explota tanto las similitudes como las diferencias en las proteínas , el ARN y las regiones reguladoras de diferentes organismos para inferir cómo ha actuado la selección sobre estos elementos. Aquellos elementos que son responsables de las similitudes entre diferentes especies deberían conservarse a través del tiempo ( selección estabilizadora ), mientras que aquellos elementos responsables de las diferencias entre especies deberían ser divergentes ( selección positiva ). Finalmente, aquellos elementos que no son importantes para el éxito evolutivo del organismo no estarán conservados (la selección es neutral).

Uno de los objetivos importantes de este campo es la identificación de los mecanismos de evolución del genoma eucariota. Sin embargo, a menudo se complica por la multiplicidad de eventos que han tenido lugar a lo largo de la historia de los linajes individuales, dejando solo rastros distorsionados y superpuestos en el genoma de cada organismo vivo. Por esta razón, los estudios de genómica comparativa de pequeños organismos modelo (por ejemplo, el modelo Caenorhabditis elegans y el estrechamente relacionado Caenorhabditis briggsae ) son de gran importancia para avanzar en nuestra comprensión de los mecanismos generales de la evolución. [32] [33]

Papel de las CNV en la evolución

La genómica comparativa desempeña un papel crucial en la identificación de variaciones en el número de copias (CNV) y la comprensión de su importancia en la evolución. Las CNV, que implican deleciones o duplicaciones de grandes segmentos de ADN, se reconocen como una fuente importante de diversidad genética , que influye en la estructura , la dosis y la regulación de los genes . Si bien los polimorfismos de un solo nucleótido (SNP) son más comunes, las CNV afectan a regiones genómicas más grandes y pueden tener efectos profundos en el fenotipo y la diversidad. [34] Estudios recientes sugieren que las CNV constituyen alrededor del 4,8 al 9,5 % del genoma humano y tienen un impacto funcional y evolutivo sustancial. En los mamíferos, las CNV contribuyen significativamente a la diversidad de la población, influyendo en la expresión genética y varios rasgos fenotípicos . [35] Los análisis genómicos comparativos de los genomas humanos y de chimpancés han revelado que las CNV pueden desempeñar un papel más importante en el cambio evolutivo en comparación con los cambios de un solo nucleótido. Las investigaciones indican que las CNV afectan a más nucleótidos que los cambios de pares de bases individuales, con aproximadamente el 2,7% del genoma afectado por las CNV en comparación con el 1,2% por los SNP. Además, aunque muchas CNV son compartidas entre humanos y chimpancés, una parte significativa es única para cada especie. Además, las CNV se han asociado con enfermedades genéticas en humanos, lo que destaca su importancia en la salud humana. A pesar de esto, muchas preguntas sobre las CNV siguen sin respuesta, incluido su origen y contribuciones a la adaptación evolutiva y la enfermedad. La investigación en curso tiene como objetivo abordar estas preguntas utilizando técnicas como la hibridación genómica comparativa , que permite un examen detallado de las CNV y su importancia. Cuando los investigadores examinaron los datos de secuencia sin procesar del humano y el chimpancé. [36]

Importancia de la genómica comparativa

La genómica comparativa tiene una profunda importancia en diversos campos, entre ellos la investigación médica, la biología básica y la conservación de la biodiversidad. Por ejemplo, en la investigación médica, predecir cómo las variantes genómicas limitan la capacidad de predecir qué variantes genómicas conducen a cambios en los fenotipos a nivel de organismo, como un mayor riesgo de enfermedades en los seres humanos, sigue siendo un desafío debido al inmenso tamaño del genoma, que comprende alrededor de tres mil millones de nucleótidos. [37] [38] [39]

Para hacer frente a este desafío, la genómica comparativa ofrece una solución al identificar las posiciones de nucleótidos que han permanecido inalteradas a lo largo de millones de años de evolución. Estas regiones conservadas indican sitios potenciales donde las alteraciones genéticas podrían tener efectos perjudiciales en la aptitud de un organismo, orientando así la búsqueda de variantes causantes de enfermedades. Además, la genómica comparativa promete desentrañar los mecanismos de la evolución genética, las adaptaciones ambientales, las diferencias específicas de género y las variaciones poblacionales en los linajes de vertebrados. [40]

Además, los estudios comparativos permiten la identificación de firmas genómicas de selección, regiones del genoma que han experimentado un aumento y fijación preferencial en las poblaciones debido a su importancia funcional en procesos específicos. [41] Por ejemplo, en genética animal, el ganado autóctono muestra una resistencia superior a las enfermedades y una adaptabilidad ambiental, pero una productividad menor en comparación con las razas exóticas. A través de análisis genómicos comparativos, se pueden identificar firmas genómicas significativas responsables de estos rasgos únicos. Usando información de esta firma, los criadores pueden tomar decisiones informadas para mejorar las estrategias de crianza y promover el desarrollo de la raza. [42]

Métodos

Los métodos computacionales son necesarios para las comparaciones genómicas, dada la gran cantidad de datos codificados en los genomas. Actualmente, hay muchas herramientas disponibles públicamente, que van desde comparaciones de genomas completos hasta análisis de expresión genética . [43] Esto incluye métodos de sistemas y control, teoría de la información, análisis de cadenas y minería de datos. [44] Los métodos computacionales seguirán siendo fundamentales para la investigación y la enseñanza, especialmente cuando la ciencia de la información y la biología genómica se enseñen en conjunto. [45]

Árbol filogenético de especies descendientes y ancestros reconstruidos. El color de las ramas representa las tasas de puntos de ruptura en los RACF (puntos de ruptura por millón de años). Las ramas negras representan tasas de puntos de ruptura no determinadas. Los colores de las puntas representan la contigüidad del ensamblaje: negro, ensamblaje del genoma a nivel de andamiaje; verde, ensamblaje del genoma a nivel de cromosoma; amarillo, ensamblaje del genoma a nivel de andamiaje a escala cromosómica. Los números junto a los nombres de las especies indican el número de cromosomas diploides (si se conoce). [46]

La genómica comparativa comienza con comparaciones básicas del tamaño del genoma y la densidad genética. Por ejemplo, el tamaño del genoma es importante para la capacidad de codificación y posiblemente por razones regulatorias. Una alta densidad genética facilita la anotación del genoma y el análisis de la selección ambiental. Por el contrario, una baja densidad genética dificulta el mapeo de enfermedades genéticas, como en el genoma humano.

Alineación de secuencias

Los alineamientos se utilizan para capturar información sobre secuencias similares, como ascendencia, descendencia evolutiva común o estructura y función comunes. Los alineamientos se pueden realizar tanto para secuencias de nucleótidos como de proteínas. [47] [48] Los alineamientos consisten en alineamientos por pares locales o globales y alineamientos de secuencias múltiples. Una forma de encontrar alineamientos globales es utilizar un algoritmo de programación dinámica conocido como algoritmo Needleman-Wunsch, mientras que el algoritmo Smith-Waterman se utiliza para encontrar alineamientos locales. Con el crecimiento exponencial de las bases de datos de secuencias y la aparición de secuencias más largas, existe un mayor interés en procedimientos de alineamiento más rápidos, aproximados o heurísticos. Entre estos, los algoritmos FASTA y BLAST son destacados para el alineamiento por pares local. En los últimos años hemos sido testigos del desarrollo de programas diseñados para alinear secuencias largas, como MUMmer (1999), BLASTZ (2003) y AVID (2003). Mientras que BLASTZ adopta un enfoque local, MUMmer y AVID están orientados al alineamiento global. Para aprovechar los beneficios de los enfoques de alineación tanto local como global, una estrategia eficaz consiste en integrarlos. Inicialmente, se emplea una variante rápida de BLAST conocida como BLAT para identificar regiones "de anclaje" homólogas. A continuación, se examinan estos anclajes para identificar conjuntos que exhiban un orden y una orientación conservados. A continuación, dichos conjuntos de anclajes se someten a alineación utilizando una estrategia global.

Además, los esfuerzos actuales se centran en optimizar los algoritmos existentes para manejar la gran cantidad de datos de secuencias genómicas mejorando su velocidad. Además, MAVID se destaca como otro programa de alineación por pares digno de mención, diseñado específicamente para alinear múltiples genomas.

Comparación por pares: la comparación por pares de datos de secuencias genómicas se utiliza ampliamente en la predicción comparativa de genes. Muchos estudios en genómica funcional comparativa se basan en comparaciones por pares, en las que los rasgos de cada gen se comparan con los rasgos de otros genes de distintas especies. Este método produce muchas más comparaciones que observaciones únicas, lo que hace que cada comparación dependa de otras. [49] [50]

Comparaciones múltiples: La comparación de múltiples genomas es una extensión natural de las comparaciones interespecíficas por pares. Estas comparaciones suelen tener como objetivo identificar regiones conservadas en dos escalas filogenéticas: 1. Las comparaciones profundas, a menudo denominadas huella filogenética [51], revelan la conservación en unidades taxonómicas superiores, como los vertebrados. [52] 2. Las comparaciones superficiales, recientemente denominadas sombra filogenética [53] , investigan la conservación en un grupo de especies estrechamente relacionadas.

Variación cromosómica por cromosoma de ganado indicino y taurino. Las diferencias estructurales genómicas en el cromosoma X entre el ganado indicino ( Bos indicusganado Nelore ) y el ganado taurino ( Bos taurusganado Hereford ) se identificaron utilizando la herramienta SyRI.

Alineación del genoma completo

El alineamiento de todo el genoma (WGA, por sus siglas en inglés) implica predecir las relaciones evolutivas a nivel de nucleótidos entre dos o más genomas. Integra elementos de alineamiento de secuencias colineales y predicción de ortología génica , lo que presenta un mayor desafío debido al gran tamaño y la naturaleza intrincada de los genomas completos. A pesar de su complejidad, han surgido numerosos métodos para abordar este problema porque los WGA desempeñan un papel crucial en varios análisis de todo el genoma, como la inferencia filogenética, la anotación del genoma y la predicción de funciones. [54] Por lo tanto, SyRI (Synteny and Rearrangement Identifier) ​​es uno de esos métodos que utiliza el alineamiento de todo el genoma y está diseñado para identificar diferencias tanto estructurales como de secuencia entre dos ensamblajes de todo el genoma . Al tomar WGA como entrada, SyRI inicialmente escanea en busca de disparidades en las estructuras del genoma. Posteriormente, identifica variaciones de secuencia locales dentro de las regiones reordenadas y no reordenadas (sinténicas). [55]

Ejemplo de un árbol filogenético creado a partir de una alineación de 250 secuencias únicas de proteínas de pico de la familia Betacoronavirus.

Reconstrucción filogenética

Otro método computacional para la genómica comparativa es la reconstrucción filogenética. Se utiliza para describir las relaciones evolutivas en términos de ancestros comunes. Las relaciones suelen representarse en un árbol llamado árbol filogenético . De manera similar, la teoría de la coalescencia es un modelo retrospectivo para rastrear los alelos de un gen en una población hasta una única copia ancestral compartida por los miembros de la población. Esto también se conoce como el ancestro común más reciente . El análisis basado en la teoría de la coalescencia intenta predecir la cantidad de tiempo entre la introducción de una mutación y la distribución de un alelo o gen en particular en una población. Este período de tiempo es igual a cuánto tiempo hace que existió el ancestro común más reciente. Las relaciones de herencia se visualizan en una forma similar a un árbol filogenético. La coalescencia (o la genealogía de los genes) se puede visualizar utilizando dendrogramas . [56]

Ejemplo de bloqueo y ruptura de sintenia. Los genes ubicados en los cromosomas de dos especies se indican con letras. Cada gen está asociado con un número que representa la especie a la que pertenece (especie 1 o 2). Los genes ortólogos están conectados por líneas discontinuas y los genes sin una relación ortóloga se tratan como espacios en los programas de sintenia. [57]

Mapas del genoma

Un método adicional en la genómica comparativa es el mapeo genético . En el mapeo genético, visualizar la sintenia es una forma de ver el orden preservado de los genes en los cromosomas. Generalmente se utiliza para cromosomas de especies relacionadas, ambas resultantes de un ancestro común. [58] Este y otros métodos pueden arrojar luz sobre la historia evolutiva. Un estudio reciente utilizó la genómica comparativa para reconstruir 16 cariotipos ancestrales a lo largo de la filogenia de los mamíferos. La reconstrucción computacional mostró cómo los cromosomas se reorganizaron durante la evolución de los mamíferos. Brindó información sobre la conservación de regiones seleccionadas a menudo asociadas con el control de los procesos de desarrollo. Además, ayudó a proporcionar una comprensión de la evolución de los cromosomas y las enfermedades genéticas asociadas con los reordenamientos del ADN. [ cita requerida ]

Los cuadrados verdes sólidos indican cromosomas de mamíferos mantenidos como un solo bloque de sintenia (ya sea como un solo cromosoma o fusionado con otro MAM), con tonos de color que indican la fracción del cromosoma afectado por reordenamientos intracromosómicos (el tono más claro es el más afectado). Los bloques divididos demarcan los cromosomas de mamíferos afectados por reordenamientos intercromosómicos. Los triángulos superiores (verdes) muestran la fracción del cromosoma afectado por reordenamientos intracromosómicos, y los triángulos inferiores (rojos) muestran la fracción afectada por reordenamientos intercromosómicos. Las relaciones sinténicas de cada MAM con el genoma humano se dan a la derecha del diagrama. MAMX aparece dividido en la cabra porque su cromosoma X está ensamblado como dos fragmentos separados. BOR, cromosoma ancestral boreoeuterio; EUA, cromosoma ancestral Euarchontoglires; EUC, cromosoma ancestral Euarchonta; EUT, cromosoma ancestral euterio; PMT; cromosoma ancestral Primatomorpha; PRT, cromosoma ancestral de los primates (Hominidae); THE, cromosoma ancestral de los terios.
Imagen del estudio Evolution of the ancestral mammalian karyotype and syntenic regiones (Evolución del cariotipo y regiones sinténicas de los mamíferos ancestrales). Se trata de una visualización de la historia evolutiva de los cromosomas de mamíferos reconstruidos a partir del linaje humano. [46]

Herramientas

Las herramientas computacionales para analizar secuencias y genomas completos se están desarrollando rápidamente debido a la disponibilidad de una gran cantidad de datos genómicos. Al mismo tiempo, las herramientas de análisis comparativo progresan y se mejoran. En los desafíos que plantean estos análisis, es muy importante visualizar los resultados comparativos. [59]

La visualización de la conservación de secuencias es una tarea difícil en el análisis comparativo de secuencias. Como sabemos, es muy ineficiente examinar la alineación de regiones genómicas largas de forma manual. Los navegadores genómicos basados ​​en Internet proporcionan muchas herramientas útiles para investigar secuencias genómicas debido a que integran toda la información biológica basada en secuencias sobre las regiones genómicas. Cuando extraemos una gran cantidad de datos biológicos relevantes, pueden ser muy fáciles de usar y requieren menos tiempo. [59]

  • Navegador UCSC : este sitio contiene la secuencia de referencia y borradores de trabajo para una gran colección de genomas. [60]
  • Ensembl : El proyecto Ensembl produce bases de datos del genoma de vertebrados y otras especies eucariotas, y pone esta información a disposición de forma gratuita en línea. [61]
  • MapView : el visor de mapas proporciona una amplia variedad de datos de secuenciación y mapeo del genoma. [62]
  • VISTA es un conjunto completo de programas y bases de datos para el análisis comparativo de secuencias genómicas. Fue creado para visualizar los resultados del análisis comparativo basado en alineaciones de ADN. La presentación de datos comparativos generados por VISTA puede adaptarse fácilmente a datos de pequeña y gran escala. [63]
  • BlueJay Genome Browser : una herramienta de visualización independiente para la visualización en múltiples escalas de genomas anotados y otros elementos genómicos. [64]
  • SyRI: SyRI significa Synteny and Rearrangement Identifier y es una herramienta versátil para la genómica comparativa, que ofrece funcionalidades para el análisis y visualización de synteny, ayudando en la predicción de diferencias genómicas entre genomas relacionados utilizando ensamblajes de genoma completo (WGA). [65]
  • Synmap2: diseñado específicamente para el mapeo de sintenia, Synmap2 compara eficientemente mapas o ensamblajes genéticos, brindando información sobre la evolución del genoma y los reordenamientos entre organismos relacionados. [66]
  • GSAlign: GSAlign facilita la alineación precisa de secuencias genómicas, lo que resulta particularmente útil para estudios de genómica comparativa a gran escala, permitiendo a los investigadores identificar similitudes y diferencias entre genomas. [67]
  • IGV (Integrative Genomics Viewer): una herramienta ampliamente utilizada para visualizar y analizar datos genómicos, IGV respalda la genómica comparativa al permitir a los usuarios explorar alineaciones, variantes y anotaciones en múltiples genomas. [68]
  • Manta: Manta es un detector rápido de variantes estructurales, crucial para la genómica comparativa ya que detecta reordenamientos genómicos como inserciones, deleciones, inversiones y duplicaciones, lo que ayuda a comprender la variación genética entre poblaciones o especies. [69]
  • CNVNatar: CNVNatar se especializa en la detección de variaciones en el número de copias (CNV), que son cruciales para comprender la evolución del genoma y la genética de poblaciones, proporcionando información sobre los cambios estructurales genómicos en diferentes organismos. [70]
  • PIPMaker: PIPMaker facilita la alineación y comparación de dos secuencias genómicas, lo que permite la identificación de regiones conservadas, duplicaciones y puntos de ruptura evolutivos, lo que ayuda en los análisis genómicos comparativos. [71]
  • GLASS (Buscador de secuencias y ubicación del genoma): GLASS es una herramienta para identificar elementos reguladores conservados en los genomas, crucial para estudios de genómica comparativa centrados en comprender la regulación y evolución de los genes. [72]
  • PatternHunter : PatternHunter es una herramienta versátil para el análisis de secuencias, que ofrece funcionalidades para identificar patrones conservados, motivos y repeticiones en secuencias genómicas, ayudando en estudios genómicos comparativos de familias de genes y elementos reguladores.
  • Mummer: Mummer es un conjunto de herramientas para la alineación y comparación de todo el genoma, ampliamente utilizado en genómica comparativa para identificar similitudes, diferencias y eventos evolutivos entre genomas en varias escalas. [73]

Una ventaja de utilizar herramientas en línea es que estos sitios web se desarrollan y actualizan constantemente. Hay muchas configuraciones y contenidos nuevos que se pueden utilizar en línea para mejorar la eficiencia. [59]

Aplicaciones seleccionadas

Agricultura

La agricultura es un campo que cosecha los beneficios de la genómica comparativa. Identificar los loci de los genes ventajosos es un paso clave en el mejoramiento de cultivos que están optimizados para un mayor rendimiento , rentabilidad, calidad y resistencia a las enfermedades . Por ejemplo, un estudio de asociación de todo el genoma realizado en 517 razas locales de arroz reveló 80 loci asociados con varias categorías de rendimiento agronómico, como el peso del grano, el contenido de amilosa y la tolerancia a la sequía . Muchos de los loci no habían sido caracterizados previamente. [74] Esta metodología no solo es poderosa, sino que también es rápida. Los métodos anteriores de identificación de loci asociados con el rendimiento agronómico requerían varias generaciones de mejoramiento cuidadosamente monitoreado de cepas parentales, un esfuerzo que consume mucho tiempo y que es innecesario para los estudios genómicos comparativos. [75]

Medicamento

Desarrollo de vacunas

El campo médico también se beneficia del estudio de la genómica comparativa. En un enfoque conocido como vaccinología inversa , los investigadores pueden descubrir antígenos candidatos para el desarrollo de vacunas analizando el genoma de un patógeno o una familia de patógenos. [76] La aplicación de un enfoque de genómica comparativa mediante el análisis de los genomas de varios patógenos relacionados puede conducir al desarrollo de vacunas que sean multiprotectoras. Un equipo de investigadores empleó dicho enfoque para crear una vacuna universal para Streptococcus del grupo B , un grupo de bacterias responsables de la infección neonatal grave . [77] La ​​genómica comparativa también se puede utilizar para generar especificidad para vacunas contra patógenos que están estrechamente relacionados con microorganismos comensales. Por ejemplo, los investigadores utilizaron el análisis genómico comparativo de cepas comensales y patógenas de E. coli para identificar genes específicos de patógenos como base para encontrar antígenos que resulten en una respuesta inmune contra cepas patógenas pero no comensales. [78] En mayo de 2019, utilizando el Global Genome Set, un equipo del Reino Unido y Australia secuenció miles de aislamientos recolectados globalmente de Streptococcus del grupo A , proporcionando objetivos potenciales para desarrollar una vacuna contra el patógeno, también conocido como S. pyogenes . [79]

Medicina personalizada

La medicina personalizada , posibilitada por la genómica comparativa, representa un enfoque revolucionario en la atención médica, que adapta el tratamiento médico y la prevención de enfermedades a la composición genética de cada paciente. [80] Al analizar las variaciones genéticas en las poblaciones y compararlas con el genoma de un individuo, los médicos pueden identificar marcadores genéticos específicos asociados con la susceptibilidad a las enfermedades, el metabolismo de los fármacos y la respuesta al tratamiento. Al identificar variantes genéticas asociadas con las vías del metabolismo de los fármacos, los objetivos de los fármacos y las reacciones adversas , la medicina personalizada puede optimizar la selección de medicamentos, la dosis y los regímenes de tratamiento para pacientes individuales. Este enfoque minimiza el riesgo de reacciones adversas a los medicamentos, mejora la eficacia del tratamiento y mejora los resultados del paciente.

Cáncer

La genómica del cáncer representa un campo de vanguardia dentro de la oncología que aprovecha la genómica comparativa para revolucionar el diagnóstico, el tratamiento y las estrategias de prevención del cáncer . La genómica comparativa desempeña un papel crucial en la investigación del cáncer al identificar mutaciones impulsoras y proporcionar análisis integrales de mutaciones , alteraciones del número de copias , variantes estructurales, expresión genética y perfiles de metilación del ADN en estudios a gran escala en diferentes tipos de cáncer. Al analizar los genomas de las células cancerosas y compararlos con células sanas, los investigadores pueden descubrir alteraciones genéticas clave que impulsan la tumorigénesis , la progresión tumoral y la metástasis . Esta profunda comprensión del panorama genómico del cáncer tiene profundas implicaciones para la oncología de precisión . Además, la genómica comparativa es fundamental para dilucidar los mecanismos de resistencia a los medicamentos , un desafío importante en el tratamiento del cáncer.

Se comparan los loci TCR de humanos (H, arriba) y ratones (M, abajo), con los elementos TCR en rojo, los genes no TCR en violeta y los segmentos V en naranja, otros elementos TCR en rojo. M6A, una supuesta metiltransferasa ; ZNF, una proteína de dedos de zinc ; OR, genes del receptor olfativo ; DAD1, defensor contra la muerte celular ; Los sitios de pseudogenes procesados ​​específicos de la especie se muestran con triángulos grises. Consulte también los números de acceso de GenBank AE000658-62. Modificado después de Glusman et al. 2001. [81]

Modelos de ratón en inmunología

Las células T (también conocidas como linfocitos T o timocitos) son células inmunes que crecen a partir de células madre en la médula ósea. Ayudan a defender el cuerpo de las infecciones y pueden ayudar en la lucha contra el cáncer. Debido a su parecido morfológico, fisiológico y genético con los humanos, los ratones y las ratas han sido durante mucho tiempo las especies preferidas para los modelos animales de investigación biomédica . La investigación en medicina comparativa se basa en la capacidad de utilizar la información de una especie para comprender los mismos procesos en otra. Podemos obtener nuevos conocimientos sobre las vías moleculares comparando las células T humanas y de ratón y sus efectos en el sistema inmunológico utilizando la genómica comparativa. Para comprender sus TCR y sus genes, Glusman realizó una investigación sobre la secuenciación de los loci del receptor de células T humanas y de ratón. Los genes TCR son bien conocidos y sirven como un recurso significativo para respaldar la genómica funcional y comprender cómo los genes y las regiones intergénicas del genoma contribuyen a los procesos biológicos. [81]

Los receptores inmunitarios de células T son importantes para ver el mundo de los patógenos en el sistema inmunitario celular. Una de las razones para secuenciar los loci TCR humanos y de ratón fue hacer coincidir las secuencias de la familia de genes ortólogos y descubrir áreas conservadas utilizando genómica comparativa. Se pensaba que estas reflejarían dos tipos de información biológica: (1) exones y (2) secuencias reguladoras . De hecho, la mayoría de los exones V, D, J y C podrían identificarse con este método. Las regiones variables están codificadas por múltiples elementos de ADN únicos que se reorganizan y conectan durante la diferenciación de las células T (TCR): elementos variables (V), de diversidad (D) y de unión (J) para los polipéptidos y ; y elementos V y J para los polipéptidos y . [Figura 1] Sin embargo, se habían mostrado varios bloques cortos no codificantes conservados del genoma. Tanto los motivos humanos como los de ratón están agrupados en gran medida en los 200 pb [Figura 2], se identificaron los potenciadores 3' conocidos en el TCR/ y posteriormente se demostró que una región conservada de 100 pb en el intrón J del ratón tenía una función reguladora.

[Figura 2] Estructura genética de los segmentos V, D, J y C de los genes humanos (arriba) y de ratón (abajo). Las flechas representan la dirección transcripcional de cada gen TCR. Los cuadrados y círculos representan la dirección directa e inversa. Modificado de Glusman et al. 2001. [81]

Las comparaciones de las secuencias genómicas dentro de cada sitio físico o ubicación de un gen específico en un cromosoma (locs) y entre especies permiten la investigación de otros mecanismos y otras señales reguladoras. Algunos sugieren nuevas hipótesis sobre la evolución de los TCR, que se pondrán a prueba (y mejorarán) mediante la comparación con el complemento de genes TCR de otras especies de vertebrados. Una investigación genómica comparativa de humanos y ratones permitirá obviamente el descubrimiento y la anotación de muchos otros genes, así como la identificación de secuencias reguladoras en otras especies. [81]

Investigación

La genómica comparativa también abre nuevas vías en otras áreas de investigación. A medida que la tecnología de secuenciación de ADN se ha vuelto más accesible, el número de genomas secuenciados ha aumentado. Con el aumento de la reserva de datos genómicos disponibles, la potencia de la inferencia genómica comparativa también ha crecido.

Un ejemplo notable de esta mayor potencia se encuentra en las recientes investigaciones sobre primates . Los métodos genómicos comparativos han permitido a los investigadores reunir información sobre la variación genética , la expresión genética diferencial y la dinámica evolutiva en primates que era imperceptible con los datos y métodos anteriores. [82]

Proyecto Genoma del Gran Simio

El Proyecto Genoma del Gran Simio utilizó métodos genómicos comparativos para investigar la variación genética con referencia a las seis especies de grandes simios , encontrando niveles saludables de variación en su acervo genético a pesar de la disminución del tamaño de la población. [83] Otro estudio mostró que los patrones de metilación del ADN, que son un mecanismo de regulación conocido para la expresión genética, difieren en la corteza prefrontal de los humanos frente a los chimpancés, e implicó esta diferencia en la divergencia evolutiva de las dos especies. [84]

Véase también

Referencias

  1. ^ Darling AE, Miklós I, Ragan MA (julio de 2008). "Dinámica del reordenamiento del genoma en poblaciones bacterianas". PLOS Genetics . 4 (7): e1000128. doi : 10.1371/journal.pgen.1000128 . PMC  2483231 . PMID  18650965.
  2. ^ abcd Touchman J (2010). "Genómica comparativa". Conocimiento de la educación en la naturaleza . 3 (10): 13.
  3. ^ Xia X (2013). Genómica comparativa . SpringerBriefs in Genetics. Heidelberg: Springer. doi :10.1007/978-3-642-37146-2. ISBN 978-3-642-37145-5. Número de identificación del sujeto  5491782.
  4. ^ ab Wei L, Liu Y, Dubchak I, Shon J, Park J (abril de 2002). "Enfoques de genómica comparativa para estudiar similitudes y diferencias entre organismos". Journal of Biomedical Informatics . 35 (2): 142–150. doi : 10.1016/s1532-0464(02)00506-3 . PMID  12474427.
  5. ^ Bennett MD, Leitch IJ, Price HJ, Johnston JS (abril de 2003). "Las comparaciones con Caenorhabditis (aproximadamente 100 Mb) y Drosophila (aproximadamente 175 Mb) mediante citometría de flujo muestran que el tamaño del genoma en Arabidopsis es de aproximadamente 157 Mb y, por lo tanto, aproximadamente un 25 % mayor que la estimación de la iniciativa del genoma de Arabidopsis de aproximadamente 125 Mb". Anales de botánica . 91 (5): 547–557. doi :10.1093/aob/mcg057. PMC 4242247 . PMID  12646499. 
  6. ^ Zimin AV, Delcher AL, Florea L, Kelley DR, Schatz MC, Puiu D, et al. (2009). "Un ensamblaje del genoma completo de la vaca doméstica, Bos taurus". Genome Biology . 10 (4): R42. doi : 10.1186/gb-2009-10-4-r42 . ISSN  1465-6906. PMC 2688933 . PMID  19393038. 
  7. ^ Holečková B, Schwarzbacherová V, Galdíková M, Koleničová S, Halušková J, Staničová J, et al. (2021-08-27). "Aberraciones cromosómicas en el ganado". Genes . 12 (9): 1330. doi : 10.3390/genes12091330 . ISSN  2073-4425. PMC 8468509 . PMID  34573313. 
  8. ^ Elsik CG, Tellam RL, Worley KC (24 de abril de 2009). "La secuencia del genoma del ganado taurino: una ventana a la biología y evolución de los rumiantes". Science . 324 (5926): 522–528. Bibcode :2009Sci...324..522A. doi :10.1126/science.1169588. ISSN  0036-8075. PMC 2943200 . PMID  19390049. 
  9. ^ Liu D, Hunt M, Tsai IJ (enero de 2018). "Inferir sintenia entre conjuntos genómicos: una evaluación sistemática". BMC Bioinformatics . 19 (1): 26. doi : 10.1186/s12859-018-2026-4 . PMC 5791376 . PMID  29382321. 
  10. ^ Vergara IA, Chen N (septiembre de 2010). "Grandes bloques de sintenia revelados entre los genomas de Caenorhabditis elegans y Caenorhabditis briggsae utilizando OrthoCluster". BMC Genomics . 11 : 516. doi : 10.1186/1471-2164-11-516 . PMC 2997010 . PMID  20868500. 
  11. ^ Tang H, Lyons E, Pedersen B, Schnable JC, Paterson AH, Freeling M (abril de 2011). "Detección de bloques de sintenia en comparaciones de genomas por pares mediante programación entera". BMC Bioinformatics . 12 : 102. doi : 10.1186/1471-2105-12-102 . PMC 3088904 . PMID  21501495. 
  12. ^ Ehrlich J, Sankoff D, Nadeau JH (septiembre de 1997). "Conservación de la sintenia y reordenamientos cromosómicos durante la evolución de los mamíferos". Genética . 147 (1): 289–296. doi :10.1093/genetics/147.1.289. PMC 1208112 . PMID  9286688. 
  13. ^ Zhang G, Li B, Li C, Gilbert MT, Jarvis ED, Wang J (11 de diciembre de 2014). "Datos genómicos comparativos del Proyecto de filogenómica aviar". GigaScience . 3 (1): 26. doi : 10.1186/2047-217X-3-26 . PMC 4322804 . PMID  25671091. 
  14. ^ Howe KL, Bolt BJ, Cain S, Chan J, Chen WJ, Davis P, et al. (enero de 2016). "WormBase 2016: expansión para permitir la investigación genómica de helmintos". Nucleic Acids Research . 44 (D1): D774–D780. doi :10.1093/nar/gkv1217. PMC 4702863 . PMID  26578572. 
  15. ^ ab The C. elegans Sequencing Consortium (diciembre de 1998). "Secuencia del genoma del nematodo C. elegans: una plataforma para investigar la biología". Science . 282 (5396): 2012–2018. doi :10.1126/science.282.5396.2012. PMID  9851916.
  16. ^ Wong S, Wolfe KH (julio de 2005). "Nacimiento de un grupo de genes metabólicos en levaduras mediante reubicación genética adaptativa". Nature Genetics . 37 (7): 777–782. doi :10.1038/ng1584. PMID  15951822.
  17. ^ Luebeck EG (octubre de 2010). "Cáncer: evolución genómica de la metástasis". Nature . 467 (7319): 1053–1055. Bibcode :2010Natur.467.1053L. doi :10.1038/4671053a. PMID  20981088.
  18. ^ Ruelens P, de Maagd RA, Proost S, Theißen G, Geuten K, Kaufmann K (2013). "LOCUS C DE FLORACIÓN en monocotiledóneas y el origen en tándem de los genes MADS-box específicos de las angiospermas". Nature Communications . 4 : 2280. Bibcode :2013NatCo...4.2280R. doi :10.1038/ncomms3280. PMID  23955420.
  19. ^ Kemkemer C, Kohn M, Cooper DN, Froenicke L, Högel J, Hameister H, et al. (abril de 2009). "Las comparaciones de sintenia génica entre diferentes vertebrados proporcionan nuevos conocimientos sobre los eventos de ruptura y fusión durante la evolución del cariotipo de los mamíferos". BMC Evolutionary Biology . 9 (1): 84. Bibcode :2009BMCEE...9...84K. doi : 10.1186/1471-2148-9-84 . PMC 2681463 . PMID  19393055. 
  20. ^ abcd Koonin EV, Galperin MY (2003). Secuencia - Evolución - Función: Enfoques computacionales en genómica comparativa . Dordrecht: Springer Science+Business Media.
  21. ^ ab Hu B, Xie G, Lo CC, Starkenburg SR, Chain PS (noviembre de 2011). "Genómica comparativa de patógenos en la era de la secuenciación de próxima generación: alineaciones genómicas, pangenómica y metagenómica". Briefings in Functional Genomics . 10 (6): 322–333. doi :10.1093/bfgp/elr042. PMID  22199376.
  22. ^ Russel PJ, Hertz PE, McMillan B (2011). Biología: la ciencia dinámica (2.ª ed.). Belmont, CA: Brooks/Cole. págs. 409–410.
  23. ^ Argos P, Kamer G, Nicklin MJ, Wimmer E (septiembre de 1984). "La similitud en la organización de genes y la homología entre las proteínas de los picornavirus animales y un comovirus vegetal sugieren una ascendencia común de estas familias de virus". Nucleic Acids Research . 12 (18): 7251–7267. doi :10.1093/nar/12.18.7251. PMC 320155 . PMID  6384934. 
  24. ^ McGeoch DJ, Davison AJ (mayo de 1986). "Secuencia de ADN del gen del virus del herpes simple tipo 1 que codifica la glicoproteína gH e identificación de homólogos en los genomas del virus varicela-zóster y el virus de Epstein-Barr". Nucleic Acids Research . 14 (10): 4281–4292. doi :10.1093/nar/14.10.4281. PMC 339861 . PMID  3012465. 
  25. ^ Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, et al. (julio de 1995). "Secuenciación aleatoria de todo el genoma y ensamblaje de Haemophilus influenzae Rd". Science . 269 (5223): 496–512. Bibcode :1995Sci...269..496F. doi :10.1126/science.7542800. PMID  7542800.
  26. ^ Fraser CM, Gocayne JD, White O, Adams MD, Clayton RA, Fleischmann RD, et al. (octubre de 1995). "El complemento genético mínimo de Mycoplasma genitalium". Science . 270 (5235): 397–403. Bibcode :1995Sci...270..397F. doi :10.1126/science.270.5235.397. PMID  7569993. S2CID  29825758.
  27. ^ Goffeau A, Barrell BG, Bussey H, Davis RW, Dujon B, Feldmann H, et al. (octubre de 1996). "La vida con 6000 genes". Science . 274 (5287): 546, 563–546, 567. Bibcode :1996Sci...274..546G. doi :10.1126/science.274.5287.546. PMID  8849441. S2CID  16763139.
  28. ^ Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, Amanatides PG, et al. (Marzo de 2000). "La secuencia del genoma de Drosophila melanogaster". Ciencia . 287 (5461): 2185–2195. Código bibliográfico : 2000Sci...287.2185.. CiteSeerX 10.1.1.549.8639 . doi : 10.1126/ciencia.287.5461.2185. PMID  10731132. 
  29. ^ Rubin GM , Yandell MD, Wortman JR, Gabor Miklos GL, Nelson CR, Hariharan IK y otros. (Marzo de 2000). "Genómica comparada de los eucariotas". Ciencia . 287 (5461): 2204–2215. Bibcode : 2000Sci...287.2204.. doi : 10.1126/science.287.5461.2204. PMC 2754258 . PMID  10731134. 
  30. ^ Batzoglou S, Pachter L, Mesirov JP, Berger B, Lander ES (julio de 2000). "Estructura genética humana y de ratón: análisis comparativo y aplicación a la predicción de exones". Genome Research . 10 (7): 950–958. doi : 10.1101/gr.10.7.950 . PMC 310911 . PMID  10899144. 
  31. ^ Ureta-Vidal A, Ettwiller L, Birney E (abril de 2003). "Genómica comparativa: análisis de todo el genoma en eucariotas metazoarios". Nature Reviews. Genetics . 4 (4): 251–262. doi :10.1038/nrg1043. PMID  12671656. S2CID  2037634.
  32. ^ Stein LD, Bao Z, Blasiar D, Blumenthal T, Brent MR, Chen N, et al. (noviembre de 2003). "La secuencia del genoma de Caenorhabditis briggsae: una plataforma para la genómica comparativa". PLOS Biology . 1 (2): E45. doi : 10.1371/journal.pbio.0000045 . PMC 261899 . PMID  14624247. 
  33. ^ "Un gusano recientemente secuenciado, una bendición para los biólogos especializados en gusanos". PLOS Biology . 1 (2): e4. 2003. doi : 10.1371/journal.pbio.0000044 . PMC 261884 . 
  34. ^ Liu GE, Hou Y, Zhu B, Cardone MF, Jiang L, Cellamare A, et al. (mayo de 2010). "Análisis de las variaciones del número de copias entre diversas razas de ganado". Genome Research . 20 (5): 693–703. doi :10.1101/gr.105403.110. PMC 2860171 . PMID  20212021. 
  35. ^ Liu Y, Mu Y, Wang W, Ahmed Z, Wei X, Lei C, et al. (2023). "Análisis de las variaciones del número de copias genómicas a través del escaneo del genoma completo en ganado Qaidam chino". Frontiers in Veterinary Science . 10 : 1148070. doi : 10.3389/fvets.2023.1148070 . PMC 10103646 . PMID  37065216. 
  36. ^ "Variación del número de copias | Aprenda ciencias en Scitable". www.nature.com . Consultado el 3 de mayo de 2024 .
  37. ^ Bornstein K, Gryan G, Chang ES, Marchler-Bauer A, Schneider VA (septiembre de 2023). "El recurso de genómica comparativa del NIH: abordar las promesas y los desafíos de la genómica comparativa en la salud humana". BMC Genomics . 24 (1): 575. doi : 10.1186/s12864-023-09643-4 . PMC 10523801 . PMID  37759191. 
  38. ^ Zoonomia C, Serres A, Armstrong J, Johnson J, Marinescu VD, Murén E, et al. (noviembre de 2020). "Una herramienta múltiple de genómica comparativa para el descubrimiento científico y la conservación". Nature . 587 (7833): 240–245. Bibcode :2020Natur.587..240Z. doi :10.1038/s41586-020-2876-6. PMC 7759459 . PMID  33177664. 
  39. ^ Lappalainen T, Scott AJ, Brandt M, Hall IM (marzo de 2019). "Análisis genómico en la era de la secuenciación del genoma humano". Cell . 177 (1): 70–84. doi :10.1016/j.cell.2019.02.032. PMC 6532068 . PMID  30901550. 
  40. ^ Kircher M, Witten DM, Jain P, O'Roak BJ, Cooper GM, Shendure J (marzo de 2014). "Un marco general para estimar la patogenicidad relativa de las variantes genéticas humanas". Nature Genetics . 46 (3): 310–315. doi :10.1038/ng.2892. PMC 3992975 . PMID  24487276. 
  41. ^ de la Fuente R, Díaz-Villanueva W, Arnau V, Moya A (febrero de 2023). "Firma genómica en biología evolutiva: una revisión". Biología . 12 (2): 322. doi : 10.3390/biology12020322 . PMC 9953303 . PMID  36829597. 
  42. ^ Verma S, Thakur A, Katoch S, Shekhar C, Wani AH, Kumar S, et al. (octubre de 2017). "Diferencias en los rasgos de respuesta inmunitaria innata y adaptativa de ganado Pahari (raza indígena india no descriptiva) y de ganado cruzado Jersey". Inmunología e inmunopatología veterinaria . 192 : 20–27. doi :10.1016/j.vetimm.2017.09.003. PMID  29042011.
  43. ^ Cristianini N, Hahn M (2006). Introducción a la genómica computacional. Cambridge University Press. ISBN 978-0-521-67191-0.
  44. ^ Pratas D, Silva RM, Pinho AJ, Ferreira PJ (mayo de 2015). "Un método sin alineamiento para encontrar y visualizar reordenamientos entre pares de secuencias de ADN". Scientific Reports . 5 : 10203. Bibcode :2015NatSR...510203P. doi :10.1038/srep10203. PMC 4434998 . PMID  25984837. 
  45. ^ Via A, De Las Rivas J, Attwood TK, Landsman D, Brazas MD, Leunissen JA, et al. (octubre de 2011). "Diez reglas simples para desarrollar un curso breve de formación en bioinformática". PLOS Computational Biology . 7 (10): e1002245. Bibcode :2011PLSCB...7E2245V. doi : 10.1371/journal.pcbi.1002245 . PMC 3203054 . PMID  22046119. 
  46. ^ ab Damas J, Corbo M, Kim J, Turner-Maier J, Farré M, Larkin DM, et al. (octubre de 2022). "Evolución del cariotipo ancestral de los mamíferos y las regiones sinténicas". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 119 (40): e2209139119. Bibcode :2022PNAS..11909139D. doi : 10.1073/pnas.2209139119 . PMC 9550189 . PMID  36161960. 
  47. ^ Altschul SF, Pop M (2017). "Alineación de secuencias". En Rosen KH, Shier DR, Goddard W (eds.). Manual de matemáticas discretas y combinatorias (2.ª ed.). Boca Raton (FL): CRC Press/Taylor & Francis. ISBN 978-1-58488-780-5. PMID  29206392 . Consultado el 18 de diciembre de 2022 .
  48. ^ Prjibelski AD, Korobeynikov AI, Lapidus AL (1 de enero de 2019). "Análisis de secuencia". En Ranganathan S, Gribskov M, Nakai K, Schönbach C (eds.). Enciclopedia de Bioinformática y Biología Computacional . Oxford: Prensa académica. págs. 292–322. doi :10.1016/b978-0-12-809633-8.20106-4. ISBN 978-0-12-811432-2. Número de identificación del sujeto  226247797.
  49. ^ Haubold B, Wiehe T (septiembre de 2004). "Genómica comparada: métodos y aplicaciones". Die Naturwissenschaften . 91 (9): 405–421. Código Bib : 2004NW..... 91.. 405H. doi :10.1007/s00114-004-0542-8. PMID  15278216.
  50. ^ Dunn CW, Zapata F, Munro C, Siebert S, Hejnol A (enero de 2018). "Las comparaciones por pares entre especies son problemáticas al analizar datos genómicos funcionales". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 115 (3): E409–E417. Bibcode :2018PNAS..115E.409D. doi : 10.1073/pnas.1707515115 . PMC 5776959 . PMID  29301966. 
  51. ^ Hardison RC, Oeltjen J, Miller W (octubre de 1997). "Alineamientos largos de secuencias humanas y de ratones revelan nuevos elementos reguladores: una razón para secuenciar el genoma del ratón". Genome Research . 7 (10): 959–966. doi : 10.1101/gr.7.10.959 . PMID  9331366.
  52. ^ Elgar G, Sandford R, Aparicio S, Macrae A, Venkatesh B, Brenner S (abril de 1996). "Lo pequeño es hermoso: genómica comparativa con el pez globo (Fugu rubripes)". Tendencias en genética . 12 (4): 145–150. doi :10.1016/0168-9525(96)10018-4. PMID  8901419.
  53. ^ Boffelli D, McAuliffe J, Ovcharenko D, Lewis KD, Ovcharenko I, Pachter L, et al. (febrero de 2003). "Sombreado filogenético de secuencias de primates para encontrar regiones funcionales del genoma humano". Ciencia . 299 (5611): 1391–1394. doi : 10.1126/ciencia.1081331. PMID  12610304.
  54. ^ Dewey CN (2012). "Alineamiento del genoma completo". En Anisimova M (ed.). Genómica evolutiva . Métodos en biología molecular. Vol. 855. Totowa, NJ: Humana Press. págs. 237–257. doi :10.1007/978-1-61779-582-4_8. ISBN 978-1-61779-581-7. Número de identificación personal  22407711.
  55. ^ Goel M, Sun H, Jiao W, Schneeberger K (2019). "SyRI: Encontrar reordenamientos genómicos y diferencias de secuencia local a partir de ensamblajes de todo el genoma". Biología del genoma . 20 (1): 277. doi : 10.1186/s13059-019-1911-0 . PMC 6913012 . PMID  31842948. 
  56. ^ Haubold B, Wiehe T (septiembre de 2004). "Genómica comparada: métodos y aplicaciones". Die Naturwissenschaften . 91 (9): 405–421. Código Bib : 2004NW..... 91.. 405H. doi :10.1007/s00114-004-0542-8. PMID  15278216. S2CID  2041895.
  57. ^ Liu D, Hunt M, Tsai IJ (enero de 2018). "Inferir sintenia entre conjuntos genómicos: una evaluación sistemática". BMC Bioinformatics . 19 (1): 26. doi : 10.1186/s12859-018-2026-4 . PMC 5791376 . PMID  29382321. 
  58. ^ Duran C, Edwards D, Batley J (2009). "Mapas genéticos y el uso de la sintenia". Plant Genomics . Métodos en biología molecular. Vol. 513. págs. 41–55. doi :10.1007/978-1-59745-427-8_3. ISBN 978-1-58829-997-0. Número de identificación personal  19347649.
  59. ^ abc Bergman NH (2007). Bergman NH (ed.). Comparative Genomics: Volúmenes 1 y 2. Totowa, Nueva Jersey: Humana Press. ISBN 978-193411-537-4. Número de identificación personal  21250292.
  60. ^ "Navegador UCSC".
  61. ^ "Navegador Genómico Ensembl". Archivado desde el original el 21 de octubre de 2013.
  62. ^ "Visor de mapas".
  63. ^ "Herramientas VISTA".
  64. ^ Soh J, Gordon PM, Sensen CW (marzo de 2012). "El explorador de genomas Bluejay". Protocolos actuales en bioinformática . 37. John Wiley & Sons, Inc. Capítulo 10, Unidad 10.9. doi :10.1002/0471250953.bi1009s37. ISBN 9780471250951. Número de identificación personal  22389011. Número de identificación personal  34553139.
  65. ^ Goel M, Sun H, Jiao WB, Schneeberger K (diciembre de 2019). "SyRI: hallazgo de reordenamientos genómicos y diferencias de secuencia local a partir de ensamblajes de todo el genoma". Genome Biology . 20 (1): 277. doi : 10.1186/s13059-019-1911-0 . PMC 6913012 . PMID  31842948. 
  66. ^ Haug-Baltzell A, Stephens SA, Davey S, Scheidegger CE, Lyons E (julio de 2017). "SynMap2 y SynMap3D: navegadores web de sintenia de todo el genoma". Bioinformática . 33 (14): 2197–2198. doi :10.1093/bioinformatics/btx144. PMID  28334338.
  67. ^ Lin HN, Hsu WL (febrero de 2020). "GSAlign: una herramienta de alineación de secuencias eficiente para genomas intraespecíficos". BMC Genomics . 21 (1): 182. doi : 10.1186/s12864-020-6569-1 . PMC 7041101 . PMID  32093618. 
  68. ^ Thorvaldsdóttir H, Robinson JT, Mesirov JP (marzo de 2013). "Integrative Genomics Viewer (IGV): visualización y exploración de datos genómicos de alto rendimiento". Briefings in Bioinformatics . 14 (2): 178–192. doi :10.1093/bib/bbs017. PMC 3603213 . PMID  22517427. 
  69. ^ Chen X, Schulz-Trieglaff O, Shaw R, Barnes B, Schlesinger F, Källberg M, et al. (abril de 2016). "Manta: detección rápida de variantes estructurales e indels para aplicaciones de secuenciación de la línea germinal y del cáncer". Bioinformática . 32 (8): 1220–1222. doi :10.1093/bioinformatics/btv710. PMID  26647377.
  70. ^ Abyzov A, Urban AE, Snyder M, Gerstein M (junio de 2011). "CNVnator: un enfoque para descubrir, genotipar y caracterizar CNV típicos y atípicos a partir de la secuenciación del genoma familiar y poblacional". Genome Research . 21 (6): 974–984. doi :10.1101/gr.114876.110. PMC 3106330 . PMID  21324876. 
  71. ^ Elnitski L, Riemer C, Schwartz S, Hardison R, Miller W (febrero de 2003). "PipMaker: un servidor World Wide Web para alineaciones de secuencias genómicas". Protocolos actuales en bioinformática . Capítulo 10. Capítulo 10, Unidad 10.2. doi :10.1002/0471250953.bi1002s00. PMID  18428692.
  72. ^ Pal K, Bystry V, Reigl T, Demko M, Krejci A, Touloumenidou T, et al. (diciembre de 2017). "GLASS: evaluación asistida y estandarizada de variaciones genéticas a partir de datos de trazas de secuencias de Sanger". Bioinformática . 33 (23): 3802–3804. doi :10.1093/bioinformatics/btx423. PMID  29036643.
  73. ^ Marçais G, Delcher AL, Phillippy AM, Coston R, Salzberg SL, Zimin A (enero de 2018). "MUMmer4: Un sistema de alineamiento genómico rápido y versátil". PLOS Computational Biology . 14 (1): e1005944. Bibcode :2018PLSCB..14E5944M. doi : 10.1371/journal.pcbi.1005944 . PMC 5802927 . PMID  29373581. 
  74. ^ Huang X, Wei X, Sang T, Zhao Q, Feng Q, Zhao Y, et al. (noviembre de 2010). "Estudios de asociación de todo el genoma de 14 características agronómicas en variedades locales de arroz". Nature Genetics . 42 (11): 961–967. doi :10.1038/ng.695. PMID  20972439. S2CID  439442.
  75. ^ Morrell PL, Buckler ES, Ross-Ibarra J (diciembre de 2011). "Genómica de cultivos: avances y aplicaciones". Nature Reviews. Genética . 13 (2): 85–96. doi :10.1038/nrg3097. PMID  22207165. S2CID  13358998.
  76. ^ Seib KL, Zhao X, Rappuoli R (octubre de 2012). "Desarrollo de vacunas en la era de la genómica: una década de vaccinología inversa". Microbiología clínica e infecciones . 18 (Supl. 5): 109–116. doi : 10.1111/j.1469-0691.2012.03939.x . hdl : 10072/50260 . PMID:  22882709.
  77. ^ Maione D, Margarit I, Rinaudo CD, Masignani V, Mora M, Scarselli M, et al. (julio de 2005). "Identificación de una vacuna universal contra el estreptococo del grupo B mediante análisis de genoma múltiple". Science . 309 (5731): 148–150. Bibcode :2005Sci...309..148M. doi :10.1126/science.1109869. PMC 1351092 . PMID  15994562. 
  78. ^ Rasko DA, Rosovitz MJ, Myers GS, Mongodin EF, Fricke WF, Gajer P, et al. (octubre de 2008). "La estructura pangenómica de Escherichia coli: análisis genómico comparativo de aislamientos comensales y patógenos de E. coli". Journal of Bacteriology . 190 (20): 6881–6893. doi : 10.1128/JB.00619-08 . PMC 2566221 . PMID  18676672. 
  79. ^ "Identificados candidatos a vacuna contra el estreptococo del grupo A a partir del conjunto de genomas globales". 28 de mayo de 2019.
  80. ^ Sadee W (agosto de 2011). "Genómica y medicina personalizada". Revista internacional de farmacia . 415 (1–2): 2–4. doi :10.1016/j.ijpharm.2011.04.048. PMID  21539903.
  81. ^ abcd Glusman G, Rowen L, Lee I, Boysen C, Roach JC, Smit AF, et al. (septiembre de 2001). "Genómica comparativa de los loci de los receptores de células T humanos y de ratón". Inmunidad . 15 (3): 337–349. doi : 10.1016/s1074-7613(01)00200-x . PMID  11567625.
  82. ^ Rogers J, Gibbs RA (mayo de 2014). "Genómica comparativa de primates: patrones emergentes de contenido y dinámica del genoma". Nature Reviews. Genética . 15 (5): 347–359. doi :10.1038/nrg3707. PMC 4113315 . PMID  24709753. 
  83. ^ Prado-Martinez J, Sudmant PH, Kidd JM, Li H, Kelley JL, Lorente-Galdos B, et al. (julio de 2013). "Diversidad genética de los grandes simios e historia de la población". Nature . 499 (7459): 471–475. Bibcode :2013Natur.499..471P. doi : 10.1038/nature12228 . PMC 3822165 . PMID  23823723. 
  84. ^ Zeng J, Konopka G, Hunt BG, Preuss TM, Geschwind D, Yi SV (septiembre de 2012). "Los mapas divergentes de metilación de todo el genoma de cerebros humanos y de chimpancés revelan la base epigenética de la evolución regulatoria humana". American Journal of Human Genetics . 91 (3): 455–465. doi : 10.1016/j.ajhg.2012.07.024 . PMC 3511995 . PMID  22922032. 

Lectura adicional

  • Kellis M, Patterson N, Endrizzi M, Birren B, Lander ES (mayo de 2003). "Secuenciación y comparación de especies de levadura para identificar genes y elementos reguladores". Nature . 423 (6937): 241–254. Bibcode :2003Natur.423..241K. doi :10.1038/nature01644. PMID  12748633. S2CID  1530261.
  • Cliften P, Sudarsanam P, Desikan A, Fulton L, Fulton B, Majors J, et al. (julio de 2003). "Encontrar características funcionales en genomas de Saccharomyces mediante huellas filogenéticas". Science . 301 (5629): 71–76. Bibcode :2003Sci...301...71C. doi : 10.1126/science.1084337 . PMID  12775844. S2CID  1305166.
  • Boffelli D, McAuliffe J, Ovcharenko D, Lewis KD, Ovcharenko I, Pachter L, et al. (febrero de 2003). "Seguimiento filogenético de secuencias de primates para encontrar regiones funcionales del genoma humano". Science . 299 (5611): 1391–1394. doi :10.1126/science.1081331. PMID  12610304. S2CID  17217612.
  • Dujon B, Sherman D, Fischer G, Durrens P, Casaregola S, Lafontaine I, et al. (julio de 2004). "Evolución del genoma en levaduras". Nature . 430 (6995): 35–44. Bibcode :2004Natur.430...35D. doi :10.1038/nature02579. PMID  15229592. S2CID  4399964.
  • Filipski A, Kumar S (2005). "Genómica comparativa en eucariotas". En Gregory TR (ed.). La evolución del genoma . San Diego: Elsevier. págs. 521–583.
  • Gregory TR, DeSalle R (2005). "Genómica comparativa en procariotas". En Gregory TR (ed.). La evolución del genoma . San Diego: Elsevier. págs. 585–675.
  • Xie X, Lu J, Kulbokas EJ, Golub TR, Mootha V, Lindblad-Toh K, et al. (marzo de 2005). "Descubrimiento sistemático de motivos reguladores en promotores humanos y 3' UTR mediante comparación de varios mamíferos". Nature . 434 (7031): 338–345. Bibcode :2005Natur.434..338X. doi :10.1038/nature03441. PMC  2923337 . PMID  15735639.
  • Champ PC, Binnewies TT, Nielsen N, Zinman G, Kiil K, Wu H, et al. (marzo de 2006). "Actualización del genoma: sesgo de la cadena de purina en 280 genomas bacterianos". Microbiología . 152 (Pt 3): 579–583. doi : 10.1099/mic.0.28637-0 . PMID  16514138.
  • Kumar L, Breakspear A, Kistler C, Ma LJ, Xie X (marzo de 2010). "Descubrimiento sistemático de motivos reguladores en Fusarium graminearum mediante la comparación de cuatro genomas de Fusarium". BMC Genomics . 11 : 208. doi : 10.1186/1471-2164-11-208 . PMC  2853525 . PMID  20346147.
  • Batzoglou S, Pachter L, Mesirov JP, Berger B, Lander ES (julio de 2000). "Estructura genética humana y de ratón: análisis comparativo y aplicación a la predicción de exones". Genome Research . 10 (7): 950–958. doi : 10.1101/gr.10.7.950 . PMC  310911 . PMID  10899144.
  • Base de datos de genomas en línea (GOLD)
  • Red de noticias sobre el genoma
  • Recurso microbiano integral del JCVI
  • Pathema: un centro de recursos bioinformáticos específico de clados
  • Base de datos del Atlas del genoma del CBS
  • El navegador del genoma de la UCSC
  • Instituto Nacional de Investigación del Genoma Humano de Estados Unidos
  • Ensembl El navegador de genomas de Ensembl
  • Genolevures, genómica comparativa de las levaduras hemiascomicetas
  • Los grupos inferidos filogenéticamente (PhIG), un método desarrollado recientemente, incorporan señales filogenéticas en la construcción de grupos de genes para su uso en genómica comparativa.
  • Metazome, un recurso para la exploración filogenómica y el análisis de las familias de genes de los metazoos.
  • IMG El sistema de Genomas Microbianos Integrados, para el análisis comparativo del genoma por parte del DOE-JGI.
  • Dcode.org Dcode.org Centro de Genómica Comparativa.
  • SUPERFAMILIA Anotaciones de proteínas para todos los organismos completamente secuenciados
  • Genómica comparativa
  • Blastología y código abierto: necesidades y realidades
  • Herramienta de genómica comparativa sin alineamiento
Obtenido de "https://es.wikipedia.org/w/index.php?title=Genómica_comparativa&oldid=1222962176"