Las reglas de Chargaff (dadas por Erwin Chargaff ) establecen que en el ADN de cualquier especie y cualquier organismo, la cantidad de guanina debe ser igual a la cantidad de citosina y la cantidad de adenina debe ser igual a la cantidad de timina . Además, debe existir una relación estequiométrica de 1:1 de bases de purina y pirimidinaA+G=T+C
(es decir, ). Este patrón se encuentra en ambas hebras del ADN. Fueron descubiertas por el químico nacido en Austria Erwin Chargaff [1] [2] a fines de la década de 1940.
La primera regla sostiene que una molécula de ADN bicatenario tiene globalmente igualdad porcentual de pares de bases: A% = T% y G% = C%. La rigurosa validación de la regla constituye la base de los pares de bases de Watson-Crick en el modelo de doble hélice del ADN.
La segunda regla sostiene que tanto Α% ≈ Τ% como G% ≈ C% son válidos para cada una de las dos cadenas de ADN. [3] Esto describe solo una característica global de la composición de bases en una sola cadena de ADN. [4]
La segunda regla de paridad fue descubierta en 1968. [3] Establece que, en el ADN monocatenario, el número de unidades de adenina es aproximadamente igual al de timina (%A ≈ %T), y el número de unidades de citosina es aproximadamente igual al de guanina (%C ≈ %G).
La primera generalización empírica de la segunda regla de paridad de Chargaff, llamada Principio de simetría, fue propuesta por Vinayakumar V. Prabhu [5] en 1993. Este principio establece que para cualquier oligonucleótido dado, su frecuencia es aproximadamente igual a la frecuencia de su oligonucleótido inverso complementario. Michel EB Yamagishi y Roberto H. Herai dedujeron matemáticamente una generalización teórica [6] en 2011. [7]
En 2006, se demostró que esta regla se aplica a cuatro [2] de los cinco tipos de genomas bicatenarios; específicamente se aplica a los cromosomas eucariotas , los cromosomas bacterianos , los genomas virales de ADN bicatenario y los cromosomas arqueológicos . [8] No se aplica a los genomas organulares ( mitocondrias y plástidos ) más pequeños que ~20-30 kbp , ni se aplica a los genomas de ADN monocatenario (virales) o cualquier tipo de genoma de ARN . La base de esta regla aún está bajo investigación, aunque el tamaño del genoma puede desempeñar un papel.
La regla en sí tiene consecuencias. En la mayoría de los genomas bacterianos (que generalmente son codificantes en un 80-90 %) los genes están dispuestos de tal manera que aproximadamente el 50 % de la secuencia codificante se encuentra en cualquiera de las dos hebras. Wacław Szybalski , en la década de 1960, demostró que en las secuencias codificantes de los bacteriófagos las purinas (A y G) superan a las pirimidinas (C y T). [9] Esta regla se ha confirmado desde entonces en otros organismos y probablemente debería denominarse ahora " regla de Szybalski ". Si bien la regla de Szybalski se cumple en general, se sabe que existen excepciones. [10] [11] [12] La base biológica de la regla de Szybalski aún no se conoce.
El efecto combinado de la segunda regla de Chargaff y la regla de Szybalski se puede observar en genomas bacterianos donde las secuencias codificantes no están distribuidas de manera uniforme. El código genético tiene 64 codones , de los cuales 3 funcionan como codones de terminación: normalmente solo hay 20 aminoácidos presentes en las proteínas. (Hay dos aminoácidos poco comunes, la selenocisteína y la pirrolisina , que se encuentran en un número limitado de proteínas y están codificados por los codones de terminación , TGA y TAG respectivamente). La falta de coincidencia entre el número de codones y aminoácidos permite que varios codones codifiquen un solo aminoácido; dichos codones normalmente difieren solo en la posición de la tercera base del codón.
El análisis estadístico multivariado del uso de codones en genomas con cantidades desiguales de secuencias codificantes en las dos hebras ha demostrado que el uso de codones en la tercera posición depende de la hebra en la que se encuentra el gen. Esto parece ser probablemente el resultado de las reglas de Szybalski y Chargaff. Debido a la asimetría en el uso de pirimidinas y purinas en secuencias codificantes, la hebra con el mayor contenido codificante tenderá a tener el mayor número de bases de purina (regla de Szybalski). Debido a que el número de bases de purina será, en una muy buena aproximación, igual al número de sus pirimidinas complementarias dentro de la misma hebra y, debido a que las secuencias codificantes ocupan el 80-90% de la hebra, parece haber (1) una presión selectiva sobre la tercera base para minimizar el número de bases de purina en la hebra con el mayor contenido codificante; y (2) que esta presión es proporcional al desajuste en la longitud de las secuencias codificantes entre las dos hebras.
Se ha sugerido que el origen de la desviación de la regla de Chargaff en los orgánulos es una consecuencia del mecanismo de replicación. [13] Durante la replicación, las cadenas de ADN se separan. En el ADN monocatenario, la citosina se desamina lentamente y de forma espontánea a adenosina (una transversión de C a A ). Cuanto más separadas estén las cadenas, mayor será la cantidad de desaminación. Por razones que aún no están claras, las cadenas tienden a existir más tiempo en forma simple en las mitocondrias que en el ADN cromosómico. Este proceso tiende a producir una cadena enriquecida en guanina (G) y timina (T) con su complemento enriquecido en citosina (C) y adenosina (A), y este proceso puede haber dado lugar a las desviaciones encontradas en las mitocondrias. [ cita requerida ] [ dudoso – discutir ]
La segunda regla de Chargaff parece ser la consecuencia de una regla de paridad más compleja: dentro de una sola cadena de ADN, cualquier oligonucleótido ( k-mero o n-grama ; longitud ≤ 10) está presente en igual número que su nucleótido complementario inverso. Debido a los requisitos computacionales, esto no se ha verificado en todos los genomas para todos los oligonucleótidos. Se ha verificado para oligonucleótidos tripletes para un gran conjunto de datos. [14] Albrecht-Buehler ha sugerido que esta regla es la consecuencia de la evolución de los genomas mediante un proceso de inversión y transposición . [14] Este proceso no parece haber actuado sobre los genomas mitocondriales. La segunda regla de paridad de Chargaff parece extenderse desde el nivel de nucleótidos a las poblaciones de tripletes de codones, en el caso del ADN monocatenario completo del genoma humano. [15] Se propone una especie de "segunda regla de paridad de Chargaff a nivel de codones" de la siguiente manera:
Primer codón | Segundo codón | Relación propuesta | Detalles |
---|---|---|---|
Twx (La posición de la 1.ª base es T) | yzA (La posición de la tercera base es A) | % %Twx yzA | Twx y yzA son codones espejo, por ejemplo TCG yCGA |
Cwx (La posición de la 1.ª base es C) | yzG (La posición de la tercera base es G) | % %Cwx yzG | Cwx y yzG son codones espejo, por ejemplo CTA yTAG |
wTx (La posición de la 2da base es T) | yAz (La posición de la 2da base es A) | % %wTx yAz | wTx y yAz son codones espejo, por ejemplo CTG yCAG |
wCx (La posición de la 2da base es C) | yGz (La posición de la 2da base es G) | % %wCx yGz | wCx y yGz son codones espejo, por ejemplo TCT yAGA |
wxT (La posición de la tercera base es T) | Ayz (La posición de la primera base es A) | % %wxT Ayz | wxT y Ayz son codones espejo, por ejemplo CTT yAAG |
wxC (La posición de la tercera base es C) | Gyz (La posición de la 1.ª base es G) | % %wxC Gyz | wxC y Gyz son codones espejo, por ejemplo GGC yGCC |
Ejemplos: el cálculo del genoma humano completo utilizando el marco de lectura del primer codón proporciona:
36530115 TTT y 36381293 AAA (ratio % = 1,00409). 2087242 TCG y 2085226 CGA (ratio % = 1,00096), etc.
En 2020, se sugiere que las propiedades físicas del dsADN (ADN de doble cadena) y la tendencia a la entropía máxima de todos los sistemas físicos son la causa de la segunda regla de paridad de Chargaff. [16] Las simetrías y patrones presentes en las secuencias de dsADN pueden surgir de las peculiaridades físicas de la molécula de dsADN y del principio de entropía máxima únicamente, en lugar de la presión evolutiva biológica o ambiental.
La siguiente tabla es una muestra representativa de los datos de Erwin Chargaff de 1952, que enumera la composición base del ADN de varios organismos y respalda ambas reglas de Chargaff. [17] Un organismo como φX174 con una variación significativa de A/T y G/C igual a uno, es indicativo de ADN monocatenario.
Organismo | Taxón | %A | %GRAMO | %DO | %T | EN | G/C | %GC | %EN |
---|---|---|---|---|---|---|---|---|---|
Maíz | Zea | 26.8 | 22.8 | 23.2 | 27.2 | 0,99 | 0,98 | 46.1 | 54.0 |
Pulpo | Pulpo | 33.2 | 17.6 | 17.6 | 31.6 | 1.05 | 1.00 | 35.2 | 64.8 |
Pollo | Gallo | 28.0 | 22.0 | 21.6 | 28.4 | 0,99 | 1.02 | 43.7 | 56.4 |
Rata | Ratón | 28.6 | 21.4 | 20.5 | 28.4 | 1.01 | 1.00 | 42.9 | 57.0 |
Humano | Homo | 29.3 | 20.7 | 20.0 | 30.0 | 0,98 | 1.04 | 40.7 | 59.3 |
Saltamontes | Ortópteros | 29.3 | 20.5 | 20.7 | 29.3 | 1.00 | 0,99 | 41.2 | 58.6 |
Erizo de mar | Equinoideos | 32.8 | 17.7 | 17.3 | 32.1 | 1.02 | 1.02 | 35.0 | 64.9 |
Trigo | Triticum | 27.3 | 22.7 | 22.8 | 27.1 | 1.01 | 1.00 | 45,5 | 54.4 |
Levadura | Saccharomyces | 31.3 | 18.7 | 17.1 | 32.9 | 0,95 | 1.09 | 35.8 | 64.4 |
E. coli | Escherichia | 24.7 | 26.0 | 25.7 | 23.6 | 1.05 | 1.01 | 51.7 | 48.3 |
φX174 | PhiX174 | 24.0 | 23.3 | 21.5 | 31.2 | 0,77 | 1.08 | 44.8 | 55.2 |
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )