El valor C es la cantidad, en picogramos , de ADN contenido en un núcleo haploide (por ejemplo, un gameto ) o la mitad de la cantidad en una célula somática diploide de un organismo eucariota . En algunos casos (notablemente entre organismos diploides), los términos valor C y tamaño del genoma se usan indistintamente; sin embargo, en poliploides el valor C puede representar dos o más genomas contenidos dentro del mismo núcleo. Greilhuber et al. [1] han sugerido algunas nuevas capas de terminología y abreviaturas asociadas para aclarar esta cuestión, pero estos agregados algo complejos aún no han sido utilizados por otros autores.
Muchos autores han asumido incorrectamente que la "C" en "valor C" se refiere a "característica", "contenido" o "complemento". Incluso entre los autores que han intentado rastrear el origen del término, ha habido cierta confusión porque Hewson Swift no lo definió explícitamente cuando lo acuñó en 1950. [2] En su artículo original, Swift pareció usar la designación "valor 1C", "valor 2C", etc., en referencia a "clases" de contenido de ADN (por ejemplo, Gregory 2001, [3] 2002 [4] ); sin embargo, Swift explicó en correspondencia personal con el profesor Michael D. Bennett en 1975 que "me temo que la letra C no representaba nada más glamoroso que 'constante', es decir, la cantidad de ADN que era característica de un genotipo particular " (citado en Bennett y Leitch 2005 [5] ). Esto se refiere al informe de 1948 de Vendrely y Vendrely sobre una "notable constancia en el contenido de ADN nuclear de todas las células en todos los individuos dentro de una especie animal dada" (traducido del original en francés ). [6] El estudio de Swift sobre este tema se relacionaba específicamente con la variación (o falta de ella) entre conjuntos de cromosomas en diferentes tipos de células dentro de los individuos, pero su notación evolucionó hacia "valor C" en referencia al contenido de ADN haploide de especies individuales y conserva este uso hoy en día.
Los valores C varían enormemente entre especies. En los animales varían más de 3.300 veces, y en las plantas terrestres difieren en un factor de aproximadamente 1.000. [5] [7] Se ha informado que los genomas de los protistas varían más de 300.000 veces en tamaño, pero el extremo superior de este rango ( Amoeba ) ha sido puesto en duda. La variación en los valores C no guarda relación con la complejidad del organismo o el número de genes contenidos en su genoma; por ejemplo, algunos protistas unicelulares tienen genomas mucho más grandes que el de los humanos . Esta observación se consideró contraintuitiva antes del descubrimiento del ADN repetitivo . Como resultado, se conoció como la paradoja del valor C. Sin embargo, aunque ya no hay ningún aspecto paradójico en la discrepancia entre el valor C y el número de genes, este término sigue siendo de uso común. Por razones de clarificación conceptual, se ha sugerido que los diversos enigmas que quedan con respecto a la variación del tamaño del genoma comprenden con mayor precisión un enigma complejo pero claramente definido conocido como el enigma del valor C. Los valores C se correlacionan con una variedad de características a nivel de célula y organismo, incluido el tamaño celular , la tasa de división celular y, dependiendo del taxón , el tamaño corporal, la tasa metabólica , la tasa de desarrollo, la complejidad de los órganos , la distribución geográfica o el riesgo de extinción (para revisiones recientes, consulte Bennett y Leitch 2005; [5] Gregory 2005 [7] ).
ElEnigma del valor C oLa paradoja del valor C es el complejo rompecabezas que rodea la amplia variación enel tamaño del genomaentre laseucariotasprotistasunicelularestienen genomas mucho más grandes que el delos humanos.
Algunos prefieren el término enigma del valor C porque incluye explícitamente todas las preguntas que se necesitarán responder si se quiere lograr una comprensión completa de la evolución del tamaño del genoma (Gregory 2005). Además, el término paradoja implica una falta de comprensión de una de las características más básicas de los genomas eucariotas: a saber, que están compuestos principalmente de ADN no codificante . Algunos han afirmado que el término paradoja también tiene la desafortunada tendencia a llevar a los autores a buscar soluciones simples unidimensionales a lo que es, en realidad, un rompecabezas multifacético. [8] Por estas razones, en 2003 el término "enigma del valor C" fue respaldado en preferencia a "paradoja del valor C" en la Segunda Reunión y Taller de Discusión sobre el Tamaño del Genoma de Plantas en el Real Jardín Botánico de Kew , Reino Unido , [8] y un número cada vez mayor de autores han comenzado a adoptar este término.
En 1948, Roger y Colette Vendrely informaron de una "notable constancia en el contenido de ADN nuclear de todas las células de todos los individuos dentro de una especie animal dada", [9] lo que tomaron como evidencia de que el ADN , en lugar de las proteínas , era la sustancia de la que se componen los genes . El término valor C refleja esta constancia observada. Sin embargo, pronto se descubrió que los valores C ( tamaños del genoma ) varían enormemente entre especies y que esto no guarda relación con el número presunto de genes ( como lo refleja la complejidad del organismo ). [10] Por ejemplo, las células de algunas salamandras pueden contener 40 veces más ADN que las de los humanos. [11] Dado que se suponía que los valores C eran constantes porque la información genética está codificada por el ADN, y sin embargo no guardaban relación con el número presunto de genes, esto se consideró comprensiblemente paradójico ; el término "paradoja del valor C" fue utilizado para describir esta situación por CA Thomas Jr. en 1971.
El descubrimiento del ADN repetitivo a finales de los años 1960 resolvió la cuestión principal de la paradoja del valor C: el tamaño del genoma no refleja el número de genes en los eucariotas, ya que la mayor parte del ADN sobrante en muchas especies parece ser ADN basura . El genoma humano , por ejemplo, contiene alrededor del 10% de elementos funcionales y se cree que el 90% restante es basura. Se cree que las especies con genomas más grandes contienen una mayor proporción de ADN basura.
El término "enigma del valor C" representa una actualización del término más común pero obsoleto "paradoja del valor C" (Thomas 1971), que en última instancia se deriva del término "valor C" (Swift 1950) en referencia al contenido de ADN nuclear haploide . El término fue acuñado por el biólogo canadiense Dr. T. Ryan Gregory de la Universidad de Guelph en 2000/2001. En términos generales, el enigma del valor C se relaciona con la cuestión de la variación en la cantidad de ADN no codificante que se encuentra dentro de los genomas de diferentes eucariotas.
El enigma del valor C, a diferencia de la antigua paradoja del valor C, se define explícitamente como una serie de preguntas componentes independientes pero igualmente importantes, que incluyen:
Nucleótido | Fórmula química | Masa molecular relativa (Da) |
---|---|---|
5′-monofosfato de 2′-desoxiadenosina | C10H14N5O6P | 331.2213 |
5′-monofosfato de 2′-desoxitimidina | C10H15N2O8P | 322.2079 |
2′-desoxiguanosina 5′-monofosfato | C10H14N5O7P | 347.2207 |
5′-monofosfato de 2′-desoxicitidina | C9H14N3O7P | 307.1966 |
†Fuente del cuadro: Doležel et al. , 2003 [12]
Las fórmulas para convertir el número de pares de nucleótidos (o pares de bases) a picogramos de ADN y viceversa son: [12]
tamaño del genoma (pb) = (0,978 x 10 9 ) x contenido de ADN (pg)Contenido de ADN (pg) = tamaño del genoma (pb) / (0,978 x 10 9 )1 pg = 978 Mbp
Utilizando los datos de la Tabla 1, las masas relativas de los pares de nucleótidos se pueden calcular de la siguiente manera: A/T = 615,383 y G/C = 616,3711, teniendo en cuenta que la formación de un enlace fosfodiéster implica la pérdida de una molécula de H2O . Además, los fosfatos de los nucleótidos en la cadena de ADN son ácidos, por lo que a pH fisiológico el ion H + está disociado. Siempre que la relación de pares A/T a G/C sea 1:1 (el contenido de GC es del 50%), la masa relativa media de un par de nucleótidos es 615,8771.
La masa molecular relativa se puede convertir a un valor absoluto multiplicándola por la unidad de masa atómica (1 u) en picogramos. Así, 615,8771 se multiplica por 1,660539 × 10 −12 pg. En consecuencia, la masa media por par de nucleótidos sería 1,023 × 10 −9 pg, y 1 pg de ADN representaría 0,978 × 10 9 pares de bases (978 Mbp). [12]
Ninguna especie tiene un contenido de GC de exactamente el 50% (cantidades iguales de bases de nucleótidos A/T y G/C) como asumieron Doležel et al. Sin embargo, como un par G/C es solo más pesado que un par A/T en aproximadamente 1/6 del 1%, el efecto de las variaciones en el contenido de GC es pequeño. El contenido real de GC varía entre especies, entre cromosomas y entre isócoros (secciones de un cromosoma con contenido de GC similar). Ajustando el cálculo de Doležel para el contenido de GC, la variación teórica en pares de bases por picogramo varía de 977,0317 Mbp/pg para un contenido de GC del 100% a 978,6005 Mbp/pg para un contenido de GC del 0% (A/T es más ligero, tiene más Mbp/pg), con un punto medio de 977,8155 Mbp/pg para un contenido de GC del 50%.
El genoma humano [13] varía en tamaño; sin embargo, la estimación actual del tamaño haploide nuclear del genoma humano de referencia [14] es de 3.031.042.417 pb para el gameto X y 2.932.228.937 pb para el gameto Y. El gameto X y el gameto Y contienen 22 autosomas cuyas longitudes combinadas comprenden la mayoría del genoma en ambos gametos. El gameto X contiene un cromosoma X , mientras que el gameto Y contiene un cromosoma Y. El mayor tamaño del cromosoma X es responsable de la diferencia en el tamaño de los dos gametos. Cuando se combinan los gametos, el cigoto femenino XX tiene un tamaño de 6.062.084.834 pb mientras que el cigoto masculino XY tiene un tamaño de 5.963.271.354 pb. Sin embargo, los pares de bases del cigoto femenino XX se distribuyen entre 2 grupos homólogos de 23 cromosomas heterólogos cada uno, mientras que los pares de bases del cigoto masculino XY se distribuyen entre 2 grupos homólogos de 22 cromosomas heterólogos cada uno más 2 cromosomas heterólogos. Aunque cada cigoto tiene 46 cromosomas, 23 cromosomas del cigoto femenino XX son heterólogos mientras que 24 cromosomas del cigoto masculino XY son heterólogos. Como resultado, el valor C para el cigoto femenino XX es 3,099361 mientras que el valor C para el cigoto masculino XY es 3,157877.
El contenido de GC del genoma humano es de aproximadamente el 41%. [15] Si se tienen en cuenta los cromosomas autosómicos, X e Y, [16] el contenido de GC haploide humano es del 40,97460% para los gametos X y del 41,01724% para los gametos Y.
Resumiendo estos números:
Celúla | Descripción de los cromosomas | Tipo | Ploidía | Pares de bases (pb) | Contenido de GC (%) | Densidad (Mbp/pg) | Misa (pág.) | Valor C |
---|---|---|---|---|---|---|---|---|
Espermatozoide o óvulo | 23 cromosomas heterólogos | Gameto X | Haploide | 3.031.042.417 | 40,97460% | 977.9571 | 3.099361 | 3.099361 |
Solo esperma | 23 cromosomas heterólogos | Gameto Y | Haploide | 2.932.228.937 | 41.01724% | 977.9564 | 2.998323 | 2.998323 |
Cigoto | 46 cromosomas que constan de 2 conjuntos homólogos de 23 cromosomas heterólogos cada uno | XX Femenino | Diploide | 6.062.084.834 | 40,97460% | 977.9571 | 6.198723 | 3.099361 |
Cigoto | 46 cromosomas que constan de 2 conjuntos homólogos de 22 cromosomas heterólogos cada uno más 2 cromosomas heterólogos | XY masculino | Mayormente diploide | 5.963.271.354 | 40,99557% | 977.9567 | 6.097684 | 3.157877 |