Parte de una serie sobre |
Genética |
---|
En los campos de la biología molecular y la genética , un genoma es toda la información genética de un organismo. [1] Consiste en secuencias de nucleótidos de ADN (o ARN en los virus ARN ). El genoma nuclear incluye genes codificantes de proteínas y genes no codificantes, otras regiones funcionales del genoma como secuencias reguladoras (véase ADN no codificante ) y, a menudo, una fracción sustancial de ADN basura sin función evidente. [2] [3] Casi todos los eucariotas tienen mitocondrias y un pequeño genoma mitocondrial . [2] Las algas y las plantas también contienen cloroplastos con un genoma de cloroplasto.
El estudio del genoma se denomina genómica . Se han secuenciado los genomas de muchos organismos y se han anotado varias regiones. El Proyecto Genoma Humano se inició en octubre de 1990 y luego se informó de la secuencia del genoma humano en abril de 2003, [4] aunque a la secuencia inicial "terminada" le faltaba el 8% del genoma, que consistía principalmente en secuencias repetitivas. [5]
Gracias a los avances tecnológicos que permiten secuenciar las numerosas secuencias repetitivas que se encuentran en el ADN humano y que no fueron descubiertas por completo en el estudio original del Proyecto Genoma Humano, los científicos informaron sobre la primera secuencia completa del genoma humano en marzo de 2022. [6]
El término genoma fue creado en 1920 por Hans Winkler , [7] profesor de botánica en la Universidad de Hamburgo , Alemania. El sitio web Oxford Dictionaries y el Online Etymology Dictionary sugieren que el nombre es una mezcla de las palabras gen y cromosoma . [8] [9] [10] [11] Sin embargo, véase ómica para una discusión más completa. Ya existían algunas palabras relacionadas con -oma , como bioma y rizoma , que formaban un vocabulario en el que genoma encaja sistemáticamente. [12]
Es muy difícil llegar a una definición precisa de "genoma". Por lo general, se refiere a las moléculas de ADN (o, a veces, ARN) que contienen la información genética en un organismo, pero a veces es difícil decidir qué moléculas incluir en la definición; por ejemplo, las bacterias suelen tener una o dos moléculas grandes de ADN ( cromosomas ) que contienen todo el material genético esencial, pero también contienen moléculas plasmídicas extracromosómicas más pequeñas que transportan información genética importante. La definición de "genoma" que se utiliza habitualmente en la literatura científica suele restringirse a las grandes moléculas de ADN cromosómico en las bacterias. [13]
Los genomas eucariotas son aún más difíciles de definir porque casi todas las especies eucariotas contienen cromosomas nucleares más moléculas de ADN adicionales en las mitocondrias . Además, las algas y las plantas tienen ADN de cloroplasto . La mayoría de los libros de texto hacen una distinción entre el genoma nuclear y los genomas de los orgánulos (mitocondrias y cloroplastos), por lo que cuando hablan, por ejemplo, del genoma humano, solo se refieren al material genético del núcleo. [2] [14] Este es el uso más común de "genoma" en la literatura científica.
La mayoría de los eucariotas son diploides , lo que significa que hay dos de cada cromosoma en el núcleo, pero el "genoma" se refiere a una sola copia de cada cromosoma. Algunos eucariotas tienen cromosomas sexuales distintivos, como los cromosomas X e Y de los mamíferos, por lo que la definición técnica del genoma debe incluir ambas copias de los cromosomas sexuales. Por ejemplo, el genoma de referencia estándar de los humanos consta de una copia de cada uno de los 22 autosomas más un cromosoma X y un cromosoma Y. [15]
Una secuencia genómica es la lista completa de nucleótidos (A, C, G y T en el caso de los genomas de ADN) que componen todos los cromosomas de un individuo o una especie. Dentro de una especie, la gran mayoría de los nucleótidos son idénticos entre los individuos, pero es necesario secuenciar varios individuos para comprender la diversidad genética.
En 1976, Walter Fiers de la Universidad de Ghent (Bélgica) fue el primero en establecer la secuencia de nucleótidos completa de un genoma de ARN viral ( bacteriófago MS2 ). Al año siguiente, Fred Sanger completó la primera secuencia de genoma de ADN: fago Φ-X174 , de 5386 pares de bases. [16] El primer genoma bacteriano en ser secuenciado fue el de Haemophilus influenzae , completado por un equipo del Instituto de Investigación Genómica en 1995. Unos meses más tarde, se completó el primer genoma eucariota, con secuencias de los 16 cromosomas de la levadura en ciernes Saccharomyces cerevisiae publicadas como resultado de un esfuerzo liderado por Europa que comenzó a mediados de la década de 1980. La primera secuencia del genoma de una arqueona , Methanococcus jannaschii , fue completada en 1996, nuevamente por el Instituto de Investigación Genómica. [ cita requerida ]
El desarrollo de nuevas tecnologías ha hecho que la secuenciación genómica sea drásticamente más barata y sencilla, y el número de secuencias genómicas completas está creciendo rápidamente. Los Institutos Nacionales de Salud de Estados Unidos mantienen una de varias bases de datos integrales de información genómica. [17] Entre los miles de proyectos de secuenciación genómica completados se incluyen los del arroz , un ratón , la planta Arabidopsis thaliana , el pez globo y la bacteria E. coli . En diciembre de 2013, los científicos secuenciaron por primera vez el genoma completo de un neandertal , una especie extinta de humanos . El genoma se extrajo del hueso del dedo del pie de un neandertal de 130.000 años de antigüedad encontrado en una cueva siberiana . [18] [19]
Las nuevas tecnologías de secuenciación, como la secuenciación paralela masiva , también han abierto la posibilidad de utilizar la secuenciación del genoma personal como herramienta de diagnóstico, como lo hizo Manteia Predictive Medicine . Un paso importante hacia ese objetivo fue la finalización en 2007 del genoma completo de James D. Watson , uno de los codescubridores de la estructura del ADN. [20]
Mientras que una secuencia genómica enumera el orden de cada base de ADN en un genoma, un mapa genómico identifica los puntos de referencia. Un mapa genómico es menos detallado que una secuencia genómica y ayuda a navegar por el genoma. El Proyecto Genoma Humano se organizó para mapear y secuenciar el genoma humano . Un paso fundamental en el proyecto fue la publicación de un mapa genómico detallado por parte de Jean Weissenbach y su equipo en el Genoscope en París. [21] [22]
Las secuencias y mapas de genomas de referencia se siguen actualizando, eliminando errores y clarificando regiones de alta complejidad alélica. [23] El costo decreciente del mapeo genómico ha permitido que los sitios genealógicos lo ofrezcan como un servicio, [24] hasta el punto de que uno puede enviar su genoma a esfuerzos científicos de colaboración colectiva como DNA.LAND en el Centro del Genoma de Nueva York , [25] un ejemplo tanto de economías de escala como de ciencia ciudadana . [26]
Los genomas virales pueden estar compuestos de ARN o ADN. Los genomas de los virus ARN pueden ser de ARN monocatenario o de ARN bicatenario , y pueden contener una o más moléculas de ARN separadas (segmentos: genoma monopartito o multipartito). Los virus ADN pueden tener genomas monocatenarios o bicatenarios. La mayoría de los genomas de los virus ADN están compuestos de una única molécula lineal de ADN, pero algunos están formados por una molécula de ADN circular. [27]
Los procariotas y eucariotas tienen genomas de ADN. Las arqueas y la mayoría de las bacterias tienen un solo cromosoma circular , [28] sin embargo, algunas especies bacterianas tienen cromosomas lineales o múltiples. [29] [30] Si el ADN se replica más rápido de lo que las células bacterianas se dividen, pueden estar presentes múltiples copias del cromosoma en una sola célula, y si las células se dividen más rápido de lo que el ADN puede replicarse, se inicia la replicación múltiple del cromosoma antes de que ocurra la división, lo que permite que las células hijas hereden genomas completos y cromosomas ya parcialmente replicados. La mayoría de los procariotas tienen muy poco ADN repetitivo en sus genomas. [31] Sin embargo, algunas bacterias simbióticas (por ejemplo, Serratia symbiotica ) tienen genomas reducidos y una alta fracción de pseudogenes: solo ~40% de su ADN codifica proteínas. [32] [33]
Algunas bacterias poseen material genético auxiliar, también parte de su genoma, que se encuentra transportado en plásmidos . Por ello, la palabra genoma no debe utilizarse como sinónimo de cromosoma .
Los genomas eucariotas están compuestos por uno o más cromosomas de ADN lineal. El número de cromosomas varía ampliamente desde las hormigas saltadoras y un nemotodo asexual , [34] que tienen cada uno solo un par, hasta una especie de helecho que tiene 720 pares. [35] Es sorprendente la cantidad de ADN que contienen los genomas eucariotas en comparación con otros genomas. La cantidad es incluso mayor que la necesaria para los genes codificadores y no codificantes de proteínas de ADN debido al hecho de que los genomas eucariotas muestran una variación de hasta 64.000 veces en sus tamaños. [36] Sin embargo, esta característica especial es causada por la presencia de ADN repetitivo y elementos transponibles (TE).
Una célula humana típica tiene dos copias de cada uno de los 22 autosomas , uno heredado de cada progenitor, más dos cromosomas sexuales , lo que la convierte en diploide. Los gametos , como los óvulos, los espermatozoides, las esporas y el polen, son haploides, lo que significa que llevan solo una copia de cada cromosoma. Además de los cromosomas en el núcleo, los orgánulos como los cloroplastos y las mitocondrias tienen su propio ADN. A veces se dice que las mitocondrias tienen su propio genoma, a menudo denominado " genoma mitocondrial ". El ADN que se encuentra dentro del cloroplasto puede denominarse " plastoma ". Al igual que las bacterias de las que se originaron, las mitocondrias y los cloroplastos tienen un cromosoma circular.
A diferencia de los procariotas, en los que la organización exón-intrón de los genes codificadores de proteínas existe, pero es bastante excepcional, los eucariotas generalmente tienen estas características en sus genes y sus genomas contienen cantidades variables de ADN repetitivo. En los mamíferos y las plantas, la mayor parte del genoma está compuesto de ADN repetitivo. [37]
La tecnología de alto rendimiento hace que la secuenciación para ensamblar nuevos genomas sea accesible para todos. Los polimorfismos de secuencia se descubren generalmente comparando los aislados resecuenciados con una referencia, mientras que los análisis de profundidad de cobertura y topología de mapeo pueden brindar detalles sobre variaciones estructurales como translocaciones cromosómicas y duplicaciones segmentarias.
Las secuencias de ADN que contienen las instrucciones para fabricar proteínas se denominan secuencias codificantes. La proporción del genoma ocupada por secuencias codificantes varía ampliamente. Un genoma más grande no necesariamente contiene más genes, y la proporción de ADN no repetitivo disminuye a medida que aumenta el tamaño del genoma en eucariotas complejos. [37]
Las secuencias no codificantes incluyen intrones , secuencias de ARN no codificantes, regiones reguladoras y ADN repetitivo. Las secuencias no codificantes constituyen el 98 % del genoma humano. Existen dos categorías de ADN repetitivo en el genoma: repeticiones en tándem y repeticiones intercaladas. [38]
Las secuencias cortas, no codificantes, que se repiten de principio a fin se denominan repeticiones en tándem . Los microsatélites constan de repeticiones de 2 a 5 pares de bases, mientras que las repeticiones minisatélites tienen entre 30 y 35 pares de bases. Las repeticiones en tándem constituyen aproximadamente el 4 % del genoma humano y el 9 % del genoma de la mosca de la fruta. [39] Las repeticiones en tándem pueden ser funcionales. Por ejemplo, los telómeros están compuestos por la repetición en tándem TTAGGG en los mamíferos, y desempeñan un papel importante en la protección de los extremos del cromosoma.
En otros casos, las expansiones en el número de repeticiones en tándem en exones o intrones pueden causar enfermedades . [40] Por ejemplo, el gen humano huntingtina (Htt) contiene típicamente de 6 a 29 repeticiones en tándem de los nucleótidos CAG (que codifican un tracto de poliglutamina). Una expansión a más de 36 repeticiones resulta en la enfermedad de Huntington , una enfermedad neurodegenerativa. Se sabe que veinte trastornos humanos son resultado de expansiones de repeticiones en tándem similares en varios genes. El mecanismo por el cual las proteínas con tractos de poliglutamina expandidos causan la muerte de neuronas no se entiende completamente. Una posibilidad es que las proteínas no se plieguen correctamente y eviten la degradación, en lugar de eso acumulándose en agregados que también secuestran factores de transcripción importantes, alterando así la expresión genética. [40]
Las repeticiones en tándem suelen ser causadas por deslizamiento durante la replicación, entrecruzamiento desigual y conversión genética. [41]
Los elementos transponibles (ET) son secuencias de ADN con una estructura definida que pueden cambiar su ubicación en el genoma. [39] [31] [42] Los ET se clasifican como un mecanismo que se replica mediante copiar y pegar o como un mecanismo que se puede extirpar del genoma e insertar en una nueva ubicación. En el genoma humano, hay tres clases importantes de ET que constituyen más del 45% del ADN humano; estas clases son los elementos nucleares intercalados largos (LINE), los elementos nucleares intercalados (SINE) y los retrovirus endógenos. Estos elementos tienen un gran potencial para modificar el control genético en un organismo huésped. [36]
El movimiento de los TE es una fuerza impulsora de la evolución del genoma en eucariotas porque su inserción puede alterar las funciones genéticas, la recombinación homóloga entre TE puede producir duplicaciones y los TE pueden trasladar exones y secuencias reguladoras a nuevas ubicaciones. [43]
Los retrotransposones [44] se encuentran principalmente en eucariotas pero no en procariotas. Los retrotransposones forman una gran parte de los genomas de muchos eucariotas. Un retrotransposón es un elemento transponible que se transpone a través de un intermediario de ARN . Los retrotransposones [45] están compuestos de ADN , pero se transcriben en ARN para la transposición, luego la transcripción de ARN se copia nuevamente para la formación de ADN con la ayuda de una enzima específica llamada transcriptasa inversa. Un retrotransposón que lleva transcriptasa inversa en su secuencia puede desencadenar su propia transposición, pero los retrotransposones que carecen de una transcriptasa inversa deben usar la transcriptasa inversa sintetizada por otro retrotransposón. Los retrotransposones pueden transcribirse en ARN, que luego se duplica en otro sitio dentro del genoma. [46] Los retrotransposones pueden dividirse en repeticiones terminales largas (LTR) y repeticiones terminales no largas (Non-LTR). [43]
Las repeticiones terminales largas (LTR) se derivan de antiguas infecciones retrovirales, por lo que codifican proteínas relacionadas con las proteínas retrovirales, incluidas las proteínas gag (proteínas estructurales del virus), pol (transcriptasa inversa e integrasa), pro (proteasa) y, en algunos casos, los genes env (envoltura). [42] Estos genes están flanqueados por repeticiones largas en los extremos 5' y 3'. Se ha informado que las LTR constituyen la fracción más grande en la mayoría de los genomas de plantas y podrían explicar la enorme variación en el tamaño del genoma. [47]
Las repeticiones terminales no largas (Non-LTRs) se clasifican como elementos nucleares intercalados largos (LINEs), elementos nucleares intercalados cortos (SINEs) y elementos similares a Penelope (PLEs). En Dictyostelium discoideum , hay otros elementos similares a DIRS que pertenecen a los No-LTR. Los No-LTR están ampliamente distribuidos en los genomas eucariotas. [48]
Los elementos intercalados largos (LINE) codifican genes para la transcriptasa inversa y la endonucleasa, lo que los convierte en elementos transponibles autónomos. El genoma humano tiene alrededor de 500.000 LINE, que ocupan alrededor del 17% del genoma. [49]
Los elementos cortos intercalados (SINE) suelen tener menos de 500 pares de bases y no son autónomos, por lo que dependen de las proteínas codificadas por los LINE para su transposición. [50] El elemento Alu es el SINE más común que se encuentra en los primates. Tiene alrededor de 350 pares de bases y ocupa alrededor del 11% del genoma humano con alrededor de 1.500.000 copias. [43]
Los transposones de ADN codifican una enzima transposasa entre repeticiones terminales invertidas. Cuando se expresa, la transposasa reconoce las repeticiones terminales invertidas que flanquean el transposón y cataliza su escisión y reinserción en un nuevo sitio. [39] Este mecanismo de cortar y pegar normalmente reinserta los transposones cerca de su ubicación original (dentro de los 100 kb). [43] Los transposones de ADN se encuentran en bacterias y constituyen el 3% del genoma humano y el 12% del genoma del gusano redondo C. elegans . [43]
El tamaño del genoma es el número total de pares de bases de ADN en una copia de un genoma haploide . El tamaño del genoma varía ampliamente entre especies. Los invertebrados tienen genomas pequeños, lo que también se correlaciona con una pequeña cantidad de elementos transponibles. Los peces y los anfibios tienen genomas de tamaño intermedio, y las aves tienen genomas relativamente pequeños, pero se ha sugerido que las aves perdieron una parte sustancial de sus genomas durante la fase de transición al vuelo. Antes de esta pérdida, la metilación del ADN permite la expansión adecuada del genoma. [36]
En los seres humanos, el genoma nuclear comprende aproximadamente 3.100 millones de nucleótidos de ADN, divididos en 24 moléculas lineales, las más cortas de 45 000 000 de nucleótidos de longitud y las más largas de 248 000 000 de nucleótidos, cada una contenida en un cromosoma diferente. [51] No existe una correlación clara y consistente entre la complejidad morfológica y el tamaño del genoma ni en procariotas ni en eucariotas inferiores . [37] [52] El tamaño del genoma es en gran medida una función de la expansión y contracción de elementos repetitivos del ADN.
Como los genomas son muy complejos, una estrategia de investigación consiste en reducir al mínimo la cantidad de genes de un genoma y, aun así, lograr que el organismo en cuestión sobreviva. Se están realizando trabajos experimentales sobre genomas mínimos para organismos unicelulares, así como sobre genomas mínimos para organismos multicelulares (véase biología del desarrollo ). El trabajo se realiza tanto in vivo como in silico . [53] [54]
Existen enormes diferencias de tamaño entre los genomas, especialmente en los genomas eucariotas multicelulares, como ya se mencionó anteriormente. Gran parte de esto se debe a la diferente abundancia de elementos transponibles, que evolucionan creando nuevas copias de sí mismos en los cromosomas. [36] Los genomas eucariotas a menudo contienen muchos miles de copias de estos elementos, la mayoría de los cuales han adquirido mutaciones que los hacen defectuosos. A continuación se muestra una tabla de algunos genomas significativos o representativos. Véase también #Ver para obtener listas de genomas secuenciados.
Tipo de organismo | Organismo | Tamaño del genoma ( pares de bases ) | Número aproximado de genes | Nota | |
---|---|---|---|---|---|
Virus | Circovirus porcino tipo 1 | 1.759 | 1,8 kB | Los virus más pequeños se replican de forma autónoma en células eucariotas [55] | |
Virus | Bacteriófago MS2 | 3.569 | 3,6 kB | Primer genoma de ARN secuenciado [56] | |
Virus | SV40 | 5,224 | 5,2 kB | [57] | |
Virus | Fago Φ-X174 | 5,386 | 5,4 kB | Primer genoma de ADN secuenciado [58] | |
Virus | VIH | 9,749 | 9,7 kB | [59] | |
Virus | Fago λ | 48.502 | 48,5 kB | A menudo se utiliza como vector para la clonación de ADN recombinante. [60] [61] [62] | |
Virus | Megavirus | 1.259.197 | 1,3 MB | Hasta 2013 el genoma viral más grande conocido [63] | |
Virus | Pandoravirus salino | 2.470.000 | 2,47 MB | El genoma viral más grande conocido. [64] | |
Organelo eucariota | Mitocondria humana | 16.569 | 16,6 kB | [65] | |
Bacteria | Nasuia deltocephalinicola (cepa NAS-ALF) | 112.091 | 112 kB | 137 | El genoma no viral más pequeño conocido. Simbionte de cigarras . [66] |
Bacteria | Carsonella ruddii | 159.662 | 160 kB | Un endosimbionte de insectos psílidos | |
Bacteria | Buchnera aphidicola | 600.000 | 600 kB | Un endosimbionte de pulgones [67] | |
Bacteria | Glossinidia de Wigglesworthia | 700.000 | 700 kB | Un simbionte en el intestino de la mosca tsé-tsé | |
Bacteria – cianobacteria | Especies de Prochlorococcus (1,7 MB) | 1.700.000 | 1,7 MB | 1.884 | El genoma de cianobacteria más pequeño conocido. Uno de los principales fotosintetizadores de la Tierra. [68] [69] |
Bacteria | Haemophilus influenzae | 1.830.000 | 1,8 MB | Primer genoma de un organismo vivo secuenciado, julio de 1995 [70] | |
Bacteria | Escherichia coli | 4.600.000 | 4,6 MB | 4.288 | [71] |
Bacteria – cianobacteria | Nostoc puntiforme | 9.000.000 | 9 MB | 7,432 | 7432 marcos de lectura abiertos [72] |
Bacteria | Solibacter usitatus (cepa Ellin 6076) | 9.970.000 | 10 MB | [73] | |
Bacteria | Sorangium celulosum (Sorangio celulosum) | 13.033.779 | 13 MB | 9,367 | El genoma bacteriano más grande conocido [74] [75] |
Ameboide | Polychaos dubium ( "Amoeba" dubia ) | 670.000.000.000 | 670 GB | El genoma más grande conocido. [76] (Disputado) [77] | |
Planta | Genlisea tuberosa | 61.000.000 | 61 MB | El genoma de planta con flores más pequeño registrado , 2014 [78] | |
Planta | Arabidopsis thaliana | 135.000.000 [79] | 135 MB | 27.655 [80] | Primer genoma vegetal secuenciado, diciembre de 2000 [81] |
Planta | Populus trichocarpa | 480.000.000 | 480 MB | 73.013 | Primer genoma de árbol secuenciado, septiembre de 2006 [82] |
Planta | Pinus taeda (pino taeda) | 22.180.000.000 | 22,18 GB | 50,172 | Las gimnospermas generalmente tienen genomas mucho más grandes que las angiospermas [83] [84] |
Planta | Fritillaria assyriaca | 130.000.000.000 | 130 GB | ||
Planta | Paris japonica (originaria de Japón, orden Liliales ) | 150.000.000.000 | 150 GB | El genoma vegetal más grande conocido hasta ahora [85] | |
Planta – musgo | Physcomitrella patens | 480.000.000 | 480 MB | Primer genoma de una briofita secuenciado, enero de 2008 [86] | |
Hongo – levadura | Saccharomyces cerevisiae | 12.100.000 | 12,1 MB | 6.294 | Primer genoma eucariota secuenciado, 1996 [87] |
Hongo | Aspergillus nidulans | 30.000.000 | 30 MB | 9,541 | [88] |
Nematodo | Pratylenchus coffeae | 20.000.000 | 20 MB | [89] El genoma animal más pequeño conocido [90] | |
Nematodo | Caenorhabditis elegans | 100.300.000 | 100 MB | 19.000 | Primer genoma animal multicelular secuenciado, diciembre de 1998 [91] |
Insecto | Belgica antarctica (mosquito antártico) | 99.000.000 | 99 MB | El genoma de insecto más pequeño secuenciado hasta ahora, probablemente una adaptación a un entorno extremo [92] | |
Insecto | Drosophila melanogaster (mosca de la fruta) | 175.000.000 | 175 MB | 13.600 | Variación de tamaño según la tensión (175–180 Mb; la tensión estándar es 175 Mb) [93] |
Insecto | Apis mellifera (abeja melífera) | 236.000.000 | 236 MB | 10,157 | [94] |
Insecto | Bombyx mori (polilla de seda) | 432.000.000 | 432 MB | 14.623 | 14.623 genes predichos [95] |
Insecto | Solenopsis invicta (hormiga de fuego) | 480.000.000 | 480 MB | 16.569 | [96] |
Crustáceo | Krill antártico | 48.010.000.000 | 48 GB | 23.000 | 70-92% de ADN repetitivo [97] |
Anfibio | Perro acuático del río Neuse | 118.000.000.000 | 118 GB | El genoma de tetrápodo más grande secuenciado hasta 2022 [98] | |
Anfibio | Rana excavadora adornada | 1.060.000.000 | 1,06 GB | El genoma de rana más pequeño conocido [99] | |
Lagarto | Lagarto anillado de armadillo | 3.930.000.000 | 3,93 GB | El genoma escamoso más grande conocido [100] | |
Mamífero | Rata vizcacha de las llanuras | 8.400.000.000 | 8,4 GB | El genoma de mamífero más grande conocido [101] | |
Mamífero | Músculo musculoso | 2.700.000.000 | 2,7 GB | 20,210 | [102] |
Mamífero | Pan panisco | 3.286.640.000 | 3,3 GB | 20.000 | Bonobo: tamaño estimado del genoma: 3.290 millones de pares de bases [103] |
Mamífero | Homo sapiens | 3.117.000.000 | 3,1 GB | 20.000 | Se estima que el tamaño del genoma del Homo sapiens será de 3,12 Gbp en 2022 [51] Secuenciación inicial y análisis del genoma humano [104] |
Pájaro | Gallo gallo | 1.043.000.000 | 1,0 GB | 20.000 | [105] |
Pez | Tetraodon nigroviridis (tipo de pez globo) | 385.000.000 | 390 MB | El genoma de vertebrado más pequeño conocido, estimado en 340 Mb [106] [107] – 385 Mb [108] | |
Pez | Protopterus aethiopicus (pez pulmonado jaspeado) | 130.000.000.000 | 130 GB | El genoma vertebrado más grande conocido [109] [110] [111] | |
Planta | Tmesipteris truncata (helecho aliado) | 160.000.000.000 | 160 GB | El genoma vegetal más grande conocido [112] |
Todas las células de un organismo se originan a partir de una sola célula, por lo que se espera que tengan genomas idénticos; sin embargo, en algunos casos, surgen diferencias. Tanto el proceso de copia de ADN durante la división celular como la exposición a mutágenos ambientales pueden dar lugar a mutaciones en las células somáticas. En algunos casos, dichas mutaciones conducen al cáncer porque hacen que las células se dividan más rápidamente e invadan los tejidos circundantes. [113] En ciertos linfocitos del sistema inmunológico humano, la recombinación V(D)J genera diferentes secuencias genómicas de modo que cada célula produce un anticuerpo único o receptores de células T.
Durante la meiosis , las células diploides se dividen dos veces para producir células germinales haploides. Durante este proceso, la recombinación da como resultado una reorganización del material genético de los cromosomas homólogos, de modo que cada gameto tiene un genoma único.
La reprogramación de todo el genoma en células germinales primordiales de ratón implica el borrado de la impronta epigenética que conduce a la totipotencia . La reprogramación se ve facilitada por la desmetilación activa del ADN , un proceso que implica la vía de reparación por escisión de bases del ADN. [ 114] Esta vía se emplea en el borrado de la metilación de CpG (5mC) en células germinales primordiales. El borrado de 5mC se produce a través de su conversión a 5-hidroximetilcitosina (5hmC) impulsada por altos niveles de las enzimas dioxigenasas diez-once TET1 y TET2 . [115]
Los genomas son más que la suma de los genes de un organismo y tienen características que pueden medirse y estudiarse sin hacer referencia a los detalles de ningún gen en particular y sus productos. Los investigadores comparan características como el cariotipo (número de cromosomas), el tamaño del genoma , el orden de los genes, el sesgo en el uso de codones y el contenido de GC para determinar qué mecanismos podrían haber producido la gran variedad de genomas que existen hoy (para revisiones recientes, véase Brown 2002; Saccone y Pesole 2003; Benfey y Protopapas 2004; Gibson y Muse 2004; Reese 2004; Gregory 2005).
Las duplicaciones desempeñan un papel importante en la conformación del genoma. La duplicación puede abarcar desde la extensión de repeticiones cortas en tándem hasta la duplicación de un grupo de genes y hasta la duplicación de cromosomas enteros o incluso de genomas enteros . Estas duplicaciones son probablemente fundamentales para la creación de novedad genética.
La transferencia horizontal de genes se invoca para explicar cómo a menudo hay una similitud extrema entre pequeñas porciones de los genomas de dos organismos que de otro modo estarían muy distantemente relacionados. La transferencia horizontal de genes parece ser común entre muchos microbios . Además, las células eucariotas parecen haber experimentado una transferencia de algún material genético desde sus genomas cloroplásticos y mitocondriales a sus cromosomas nucleares. Datos empíricos recientes sugieren un papel importante de los virus y las redes de ARN subvirales para representar un papel impulsor principal para generar novedad genética y edición natural del genoma.
Las obras de ciencia ficción ilustran las preocupaciones sobre la disponibilidad de las secuencias del genoma.
La novela Jurassic Park (Parque Jurásico) de Michael Crichton, publicada en 1990, y la película que la siguió cuentan la historia de un multimillonario que crea un parque temático de dinosaurios clonados en una isla remota, con resultados desastrosos. Un genetista extrae ADN de dinosaurio de la sangre de mosquitos antiguos y rellena los huecos con ADN de especies modernas para crear varias especies de dinosaurios. A un teórico del caos se le pide que dé su opinión experta sobre la seguridad de diseñar un ecosistema con los dinosaurios, y advierte repetidamente que los resultados del proyecto serán impredecibles y, en última instancia, incontrolables. Estas advertencias sobre los peligros de utilizar información genómica son un tema principal del libro.
La película Gattaca, de 1997 , se desarrolla en una sociedad futurista en la que los genomas de los niños están diseñados para contener la combinación más ideal de los rasgos de sus padres, y se documentan parámetros como el riesgo de enfermedades cardíacas y la expectativa de vida prevista para cada persona en función de su genoma. Las personas concebidas fuera del programa eugenésico, conocidas como "inválidos", sufren discriminación y son relegadas a ocupaciones serviles. El protagonista de la película es un inválido que trabaja para desafiar las supuestas probabilidades genéticas y lograr su sueño de trabajar como navegante espacial. La película advierte contra un futuro en el que la información genómica alimenta los prejuicios y las diferencias de clase extremas entre quienes pueden y no pueden permitirse tener hijos modificados genéticamente. [116]