Un dominio de unión al ADN ( DBD ) es un dominio proteico plegado de forma independiente que contiene al menos un motivo estructural que reconoce ADN de cadena simple o doble . Un DBD puede reconocer una secuencia de ADN específica (una secuencia de reconocimiento ) o tener una afinidad general con el ADN. [1] Algunos dominios de unión al ADN también pueden incluir ácidos nucleicos en su estructura plegada.
Uno o más dominios de unión al ADN suelen formar parte de una proteína más grande que consta de otros dominios proteicos con funciones diferentes. Los dominios adicionales suelen regular la actividad del dominio de unión al ADN. La función de la unión al ADN es estructural o implica la regulación de la transcripción , y a veces ambas funciones se superponen. [ cita requerida ]
Los dominios de unión al ADN con funciones que involucran la estructura del ADN tienen roles biológicos en la replicación , reparación , almacenamiento y modificación del ADN, como la metilación . [ cita requerida ]
Muchas proteínas implicadas en la regulación de la expresión génica contienen dominios de unión al ADN. Por ejemplo, las proteínas que regulan la transcripción mediante la unión al ADN se denominan factores de transcripción . El resultado final de la mayoría de las cascadas de señalización celular es la regulación génica. [ cita requerida ]
El DBD interactúa con los nucleótidos del ADN de una manera específica o no específica de la secuencia de ADN, pero incluso el reconocimiento no específico de la secuencia implica algún tipo de complementariedad molecular entre la proteína y el ADN. El reconocimiento del ADN por el DBD puede ocurrir en el surco mayor o menor del ADN, o en la cadena principal de azúcar-fosfato del ADN (ver la estructura del ADN ). Cada tipo específico de reconocimiento del ADN se adapta a la función de la proteína. Por ejemplo, la enzima cortadora de ADN DNAsa I corta el ADN casi al azar y, por lo tanto, debe unirse al ADN de una manera no específica de la secuencia. Pero, aun así, la DNAsa I reconoce una cierta estructura de ADN en 3-D , lo que produce un patrón de escisión del ADN algo específico que puede ser útil para estudiar el reconocimiento del ADN mediante una técnica llamada huella de ADN . [ cita requerida ]
Muchos dominios de unión al ADN deben reconocer secuencias de ADN específicas, como los DBD de factores de transcripción que activan genes específicos, o los de enzimas que modifican el ADN en sitios específicos, como las enzimas de restricción y la telomerasa . El patrón de enlaces de hidrógeno en el surco mayor del ADN es menos degenerado que el del surco menor del ADN, lo que proporciona un sitio más atractivo para el reconocimiento de ADN específico de la secuencia . [ cita requerida ]
La especificidad de las proteínas que se unen al ADN se puede estudiar utilizando muchas técnicas bioquímicas y biofísicas, como la electroforesis en gel , la ultracentrifugación analítica , la calorimetría , la mutación del ADN , la mutación o modificación de la estructura de las proteínas , la resonancia magnética nuclear , la cristalografía de rayos X , la resonancia plasmónica de superficie , la resonancia paramagnética electrónica , la reticulación y la termoforesis a microescala (MST).
Una gran parte de los genes de cada genoma codifican proteínas que se unen al ADN (véase la tabla). Sin embargo, sólo un número bastante pequeño de familias de proteínas se unen al ADN. Por ejemplo, más de 2000 de las ~20 000 proteínas humanas son "unidoras al ADN", incluidas unas 750 proteínas con dedos de zinc. [3]
Especies | Proteínas de unión al ADN [4] | Familias que se unen al ADN [4] |
---|---|---|
Arabidopsis thaliana (berro de thale) | 4471 | 300 |
Saccharomyces cerevisiae (levadura) | 720 | 243 |
Caenorhabditis elegans (gusano) | 2028 | 271 |
Drosophila melanogaster (mosca de la fruta) | 2620 | 283 |
El motivo hélice-giro-hélice, descubierto originalmente en bacterias, se encuentra comúnmente en proteínas represoras y tiene una longitud de unos 20 aminoácidos. En los eucariotas, el homeodominio consta de 2 hélices, una de las cuales reconoce el ADN (también conocida como hélice de reconocimiento). Son comunes en las proteínas que regulan los procesos de desarrollo. [5]
El dominio de dedo de zinc se encuentra principalmente en eucariotas, pero se han encontrado algunos ejemplos en bacterias. [6] El dominio de dedo de zinc generalmente tiene entre 23 y 28 aminoácidos de longitud y se estabiliza coordinando iones de zinc con residuos de coordinación de zinc regularmente espaciados (ya sea histidinas o cisteínas). La clase más común de dedo de zinc (Cys2His2) coordina un solo ion de zinc y consta de una hélice de reconocimiento y una hoja beta de 2 hebras. [7] En los factores de transcripción, estos dominios a menudo se encuentran en matrices (generalmente separados por secuencias de enlace cortas) y los dedos adyacentes están espaciados a intervalos de 3 pares de bases cuando se unen al ADN.
El dominio de cremallera de leucina básica ( bZIP ) se encuentra principalmente en eucariotas y en una medida limitada en bacterias. El dominio bZIP contiene una hélice alfa con una leucina en cada séptimo aminoácido. Si dos de estas hélices se encuentran, las leucinas pueden interactuar como los dientes de una cremallera, lo que permite la dimerización de dos proteínas. Al unirse al ADN, los residuos de aminoácidos básicos se unen a la estructura de azúcar-fosfato mientras que las hélices se asientan en los surcos principales. Regula la expresión génica.
Compuesto por aproximadamente 110 aminoácidos, el dominio de hélice alada (WH) tiene cuatro hélices y una hoja beta de dos hebras.
El dominio de hélice-giro-hélice alada (wHTH) SCOP 46785 tiene una longitud de entre 85 y 90 aminoácidos y está formado por un haz de 3 hélices y una lámina beta de 4 cadenas (ala).
El dominio básico de hélice-bucle-hélice (bHLH) se encuentra en algunos factores de transcripción y se caracteriza por dos hélices alfa (hélices α) conectadas por un bucle. Una hélice es típicamente más pequeña y, debido a la flexibilidad del bucle, permite la dimerización al plegarse y empaquetarse contra otra hélice. La hélice más grande típicamente contiene las regiones de unión del ADN.
Los dominios HMG-box se encuentran en proteínas del grupo de alta movilidad que participan en una variedad de procesos dependientes del ADN, como la replicación y la transcripción. También alteran la flexibilidad del ADN al inducir curvaturas. [8] [9] El dominio consta de tres hélices alfa separadas por bucles.
Los dominios Wor3, llamados así por el regulador blanco opaco 3 (Wor3) en Candida albicans, surgieron más recientemente en el tiempo evolutivo que la mayoría de los dominios de unión al ADN descritos anteriormente y están restringidos a una pequeña cantidad de hongos. [10]
El pliegue OB es un pequeño motivo estructural llamado así por sus propiedades de unión a oligonucleótidos y oligosacáridos . Los dominios del pliegue OB tienen una longitud de entre 70 y 150 aminoácidos. [11] Los pliegues OB se unen al ADN monocatenario y, por lo tanto, son proteínas de unión monocatenarias . [11]
Las proteínas plegadas en OB se han identificado como críticas para la replicación del ADN , la recombinación del ADN , la reparación del ADN , la transcripción , la traducción , la respuesta al choque frío y el mantenimiento de los telómeros . [12]
El dominio de inmunoglobulina ( InterPro : IPR013783 ) consiste en una estructura de lámina beta con grandes bucles de conexión, que sirven para reconocer los surcos mayores del ADN o los antígenos. Generalmente se encuentran en las proteínas de inmunoglobulina, pero también están presentes en las proteínas Stat de la vía de las citocinas. Esto probablemente se debe a que la vía de las citocinas evolucionó hace relativamente poco tiempo y ha hecho uso de sistemas que ya eran funcionales, en lugar de crear los suyos propios.
El B3 DBD ( InterPro : IPR003340 , SCOP 117343 ) se encuentra exclusivamente en factores de transcripción de plantas superiores y en endonucleasas de restricción EcoRII y BfiI y normalmente consta de 100-120 residuos. Incluye siete láminas beta y dos hélices alfa , que forman un pliegue de proteína pseudobarril que se une al ADN .
Los efectores TAL se encuentran en patógenos bacterianos de plantas del género Xanthomonas y están involucrados en la regulación de los genes de la planta huésped para facilitar la virulencia, proliferación y diseminación bacteriana. [13] Contienen una región central de repeticiones en tándem de 33-35 residuos y cada región de repetición codifica una sola base de ADN en el sitio de unión del TALE. [14] [15] Dentro de la repetición, es solo el residuo 13 el que contacta directamente con la base de ADN, determinando la especificidad de la secuencia, mientras que otras posiciones hacen contactos con la cadena principal del ADN, estabilizando la interacción de unión al ADN. [16] Cada repetición dentro de la matriz toma la forma de hélices alfa pareadas, mientras que toda la matriz de repeticiones forma una superhélice dextrógira, envolviendo la doble hélice de ADN. Se ha demostrado que las matrices de repetición del efector TAL se contraen al unirse al ADN y se ha propuesto un mecanismo de búsqueda de dos estados por el cual el TALE alargado comienza a contraerse alrededor del ADN comenzando con un reconocimiento exitoso de timina de una unidad de repetición única N-terminal del núcleo de la matriz de repetición del efector TAL. [17] Se encuentran proteínas relacionadas en el patógeno vegetal bacteriano Ralstonia solanacearum , [18] el endosimbionte fúngico Burkholderia rhizoxinica [19] y dos microorganismos marinos aún no identificados. [20] El código de unión al ADN y la estructura de la matriz de repetición se conservan entre estos grupos, denominados colectivamente como los similares a TALE .