Transcripción
La transcripción es la transferencia de información genética del ADN al ARN, utilizando el ADN como plantilla. La síntesis de proteínas se produce en los ribosomas.
¿Qué es un gen? En un nivel, un gen es una cadena ordenada de nucleótidos que codifica un polipéptido. Estos genes son «estructurales». También sabemos que los genes pueden codificar ARN, incluido el ARN mensajero (ARNm), el ARN de transferencia (ARNt), el ARN ribosómico (ARNr) y otros tipos de ARN. Pero algo tiene que encender y terminar la expresión de los genes, así como regularla. Las secuencias reguladoras, que pueden ser «promotores» o «potenciadores/silenciadores», pueden estar situadas lejos de las regiones codificantes. Así que ahora nuestra visión de un gen debe incluir la idea de regiones separadas de un cromosoma. ¿Y si la información que se transcribe en el ARNm no se refleja en la proteína final hasta que se modifica? Se trata de una «modificación postranscripcional». Ahora el concepto de gen se vuelve aún más confuso. ¿Qué pasa si hay regiones de codificación «superpuestas»? Está claro que nuestra definición de gen no va a ser sencilla.
Sin embargo, desde el punto de vista funcional, podemos describir un gen como si tuviera una región codificante distinta y una región reguladora distinta, esta última controlando la velocidad a la que el ADN se transcribe en ARNm. Veremos que las unidades reguladoras están compuestas por «motivos» de ADN y que cada motivo deberá estar ocupado por una proteína reguladora para que un gen se regule correctamente. No sólo tiene que haber una unión adecuada de la proteína, sino que todas las proteínas tienen que encajar con las proteínas que se unen a otros motivos cercanos de la forma en que encajan las piezas de un rompecabezas. Y sólo hay una forma correcta para que todo encaje. Así pues, no se trata simplemente de que el ADN dirija la síntesis de ARNm, que a su vez dirige la síntesis de proteínas; las proteínas están intrínsecamente implicadas en la regulación de la producción de proteínas a nivel de la transcripción.Esto puede llegar a ser una pesadilla si se empieza a pensar en la regulación de la producción de proteínas reguladoras.
También tenemos que tener en cuenta una diferencia importante entre los eucariotas y los procariotas con respecto a la transcripción de los genes estructurales, o codificadores de proteínas. En los eucariotas, los genes se transcriben individualmente, mientras que en los procariotas, los genes con funciones relacionadas («operones») pueden transcribirse juntos. Por ejemplo, el operón Lac incluye tres genes que codifican proteínas, así como sus secuencias de control. El operón se transcribe como una sola unidad en forma de «ARNm policistrónico». Los genes estructurales eucarióticos se transcriben como ARNm monocistrónico.
Síntesis de ARN dirigida por ADN
Hay tres pasos que caracterizan la síntesis de ARN dirigida por ADN:
(1) Iniciación mediante la unión del aparato de transcripción al molde de ADN
(2) Elongación de la cadena de ARNm
(3) Terminación de la cadena de ARNm
El trozo de ARNm que resulta de la transcripción directa del ADN que codifica un «gen» se denomina «transcrito primario» y sufre modificaciones, a veces bastante extensas, antes de poder traducir sumensaje en proteína.
La clase de enzimas que sintetizan ARN se conocen como ARN polimerasas. Son complejos de varias subunidades que están presentes en todas las células y catalizan la reacción:
(ARN)nresiduos + 1 NTP === (ARN)n+1 residuos + PPi
El pirofosfato se hidroliza irreversiblemente a 2 Pi conduciendo así la acción hacia la derecha. Los nucleótidos individuales que se leen en la cadena de ADN molde se transcriben en los nucleótidos del ARN correspondiente, por lo que el resultado final es un polímero monocatenario, es decir, el ARNm, cuyos nucleótidos se corresponden exactamente con los nucleótidos complementarios de la cadena de ADN, con la excepción de que en todos los lugares en los que aparece una «A» en la cadena de ADN molde, aparece una «U» en el ARNm. (Los posiblesNTPs, entonces, son ATP,CTP,GTP,UTP.)
Transcripción en procariotas
La ARN polimerasa más estudiada es la de E.coli, por lo que la estudiaremos como el prototipo de las ARN polimerasas. La holoenzima es una proteína de 449 kD compuesta por una «enzima núcleo» y una «subunidad s», y el complejo completo se denomina (núcleo)s. La enzima del núcleo dirige la reacción de polimerización y tiene 4 subunidades: enzima del núcleo = a2bb’w. Los iones inorgánicos Zn2+ (dos de ellos en la subunidad b’) y Mg2+ son necesarios para la actividad catalítica y la estructura tridimensional de la enzima se parece a una mano. El pulgar de la mano se puede imaginar agarrando un trozo de ADN B que se encuentra en un canal representado por los dedos curvados y la palma de la mano. Este canal es cilíndrico, con unas dimensiones del orden de 25 A por 55 A. Estas dimensiones permiten el encaje de unos 16 pares de bases de ADN B.
La estructura de «mano» aparece en otras enzimas que estudiaremos, incluyendo la ADN polimerasa y la transcriptasa inversa. Se puede estudiar más a fondo la estructura de la mano de la ARN polimerasa observando la ARN polimerasa T7 (véase el PDB más abajo).
1ARO: ARN polimerasa T7
Vamos a estudiar la transcripción desde el punto de vista del gen, que ya hemos mencionado que es una entidad bastante ambigua. Sin embargo, está claro que debe haber un punto de partida para que se produzca la transcripción correcta, y es razonable incluirlo como parte del gen, aunque no se transcriba. Así pues, el problema de la iniciación es en realidad el reconocimiento de un punto de partida. Pero ¿cuál de las dos hebras del ADN sirve como plantilla y cómo elige la polimerasa?
Cualquiera de las dos hebras puede servir como molde pero la transcripción siempre procede desde el extremo 5′ de una hebra de ADN hasta el extremo 3′. La cadena 3′-5′ que sirve de molde se denomina cadena «antisentido» o no codificante y la cadena 5′-3′ (que tiene la misma secuencia de nucleótidos, a excepción de las «U» por las «T», que el ARNm posteriormente transcrito) es la cadena «sentido» o «codificante». Para ser coherentes y claros, utilizaremos la convención de que nuestra descripción de la posición a lo largo de una secuencia de nucleótidos se hará desde el punto de vista de la cadena de sentido, ya que ésta es la misma ordenación que la del ARNm que se transcribe. La parte del gen que sirve de sitio de iniciación se denomina «promotor» y es buscada por la holoenzima ARN polimerasa. La holoenzima se une débilmente al ADN, con un Kdissoc de aproximadamente 10-7 M, lo que le permite desplazarse a lo largo de la cadena antisentido en busca del promotor. La ssubunidad es específica para su secuencia promotora y se produce una unión estrecha de la holoenzima (Kdissoc de unos 10-14 M).
El promotor es reconocido por una secuencia de nucleótidos de aproximadamente 40 pb en el lado 5′ del sitio de iniciación, y dentro de esta secuencia hay dos secuencias «conservadas». Una de ellas tiene 6 pb de longitud y está centrada a unos 10 pb aguas arriba del sitio de inicio de la transcripción. La otra secuencia, menos conservada, está centrada a unos 35 pb aguas arriba y tiene una secuencia de consenso de TTGACA. El sitio de inicio se indica con la notación +1 y casi siempre es A o G.
La holoenzima de la ARN polimerasa entra en contacto con el promotor aproximadamente en los centros de las dos regiones (-10 y -35) y la enzima central se une fuertemente al ADN dúplex.Su acción es la de fundir el ADN de doble cadena a lo largo de una secuencia de unos 11 pb, de -9 a +2. El factor s se separa al comenzar la transcripción.
Los factores s específicos de una célula son los que determinan qué genes se transcribirán. Así, los tipos de células individuales se caracterizan por sus factores s.
La elongación de la cadena procede en la dirección 5′–> 3′, y la «burbuja de transcripción» (la longitud del ADN «fundido») viaja con la ARN polimerasa. Como consecuencia, el ADN no fundido se sobreenrolla delante de la burbuja y se desenrolla detrás de ella. Las topoisomerasas actúan entonces para relajar los superenrollamientos positivos y negativos. El ARNm que se produce se hibrida durante un corto periodo de tiempo con el ADN en la posición inferior, y existe separado del ADN como una «cola», cuyo punto de unión se encuentra en el extremo inferior. La ARN polimerasa no se desprende del ADN mientras lo procesa debido a su unión relativamente estrecha, pero no específica, a ambos lados de la burbuja de transcripción, estabilizada por su «pulgar» que envuelve el ADN. Se transcriben entre 20 y 50 nucleótidos por segundo a 37 C y un nucleótido se transcribe incorrectamente cada 104. Como los genes se transcriben repetidamente, esta tasa de error no es demasiado perjudicial, especialmente cuando se combina con el hecho de que hay múltiples codones («sinónimos») para cada aminoácido traducido posteriormente y que los errores de sustitución de un solo aminoácido en una proteína no suelen obstaculizar su función.
La terminación espontánea de la transcripción de un gen se señala mediante «secuencias de terminación».En E.coli, la señal final para detener la transcripción es una serie de 4 a 10 emparejamientos de bases A-T con el As en la cadena molde. Por cada A en esta región, el transcrito de ARNm tendrá una U. Justo antes de esta secuencia hay una región rica en bases Gand C seguida de un espaciador de nucleótidos y otra región rica en G y C. Las dos regiones G,Crich son tales que una región puede superponerse a la otra mediante una operación de asimetría de 180o . Esta relación de pares de bases alrededor de un centro de simetría rotacional se denomina «secuencia palindrómica». La cadena de nucleótidos resultante en el extremo 3′ del ARNm es tal que puede formarse un bucle de horquilla, en el que la base Gs se empareja con la Cs y viceversa, y la As con la Us. La parte más terminal del extremo 3′ es una serie de Us seguida de un grupo hidroxilo. La cola terminal del oligo-U, que sólo está débilmente unida a la cadena molde de ADN, es desplazada por la cadena de ADN no molde. Sin embargo, hay muchos otros factores que influyen en el proceso general de terminación.
La terminación no espontánea de la transcripción requiere una proteína «factor rho», que también funciona para mejorar la eficiencia de la terminación espontánea.El factor rho reconoce una secuencia en la cadena de ARNm en crecimiento, aguas arriba del sitio de terminación, después de lo cual se une y se mueve a lo largo de la cadena en la dirección 5′-3′ hasta que alcanza la ARN polimerasa que está detenida en el sitio de terminación. El transcrito se libera de su cadena molde por el desenrollamiento del dúplex ARN-ADN por el factor rho.
La transcripción en los eucariotas:
Aunque es muy similar a la de los procariotas, la «maquinaria» y las secuencias de control de la transcripción en los eucariotas es mucho más compleja, y existen numerosas ARN polimerasas.
El ARNibosómico (ARNr) constituye aproximadamente el 95% de todo el ARN y alrededor del 67% del ARN de los ribosomas. El resto del ARN incluye el ARN de transferencia (ARNt), el ARN mensajero (ARNm) y otros tipos presentes en menor cantidad, como los ARN «pequeños» (ARNsn) que participan en el empalme del ARNm y los ARN «guía» que participan en la edición del ARN. Estos dos últimos procesos tienen lugar en la traducción posterior a DeepL del ciclo de vida del ARNm eucariótico. Todos los ARN están codificados por el ADN, y los diferentes tipos de ARN polimerasa en los eucariotas reflejan esto y el hecho de que, en los eucariotas, la traducción del ARNm al ADN se produce fuera del núcleo.
Los precursores de la mayoría de los ARNr se sintetizan en los nucléolos con la enzima ARNpolimerasa I. Los precursores del ARNm son sintetizados en el nucleoplasma por la ARNpolimerasa II, mientras que la ARNpolimerasa III, también en el nucleoplasma, sintetiza los precursores del ARN 5S, los ARNt y otros ARN que se encuentran tanto en el núcleo como en el citoplasma. Las mitocondrias tienen sus propias ARN polimerasas, que son análogas a los ARN de los cloroplastos de las plantas. Nos centraremos en la ARN polimerasa II, ya que es la que interviene en la transcripción en los eucariotas.
Puedes observar la estructura de la ARN polimerasa II de la levadura (ver PDB más abajo) mientras discutimos su estructura como prototipo. La forma general de la enzima es similar a la de la ARN polimerasa procariota (y a la de la ADN polimerasa), es decir, la de una mano con un motivo de «pulgar» que flanquea un canal lo suficientemente grande como para contener un trozo de ADN-B (de unos 25 A de ancho).
1ENO: Polimerasa de ARN de levadura II
Todavía no hemos considerado la química de la elongación de la cadena de ARNm, pero lo haremos aquí. Las cadenas se alargan en la dirección 5′–> 3′ por el ataque nucleofílico del grupo 3′ OH de la cadena en crecimiento por el a-fosfato del NTP entrante.
Al igual que en los procariotas, la transcripción eucariótica comienza por el reconocimiento de promotores. Hay muchas copias de los genes de ARNr que dirigen la síntesis de ARNr, todas con secuencias casi idénticas. Los promotores de estos genes casi idénticos son, por tanto, idénticos, por lo que la ARNpolimerasa I sólo debe reconocer una secuencia promotora. Sin embargo, la ARNpolimerasa I es específica de cada especie (los ARN poli II y III no son específicos de cada especie).
Para la promoción del ARNr de los mamíferos, hay un «elemento promotor central» que abarca la región de -31 a +6 (nótese que esto se solapa con una región del gen que se transcribe) y un «elemento promotor aguas arriba» que abarca de -187 a -107.
Para la transcripción de genes por la ARN polimerasa III, el promotor se sitúa a veces en un segmento dentro de la parte transcrita del gen, entre +40 y +80, pero también puede estar parcialmente aguas arriba o completamente aguas arriba del sitio de inicio.
Promotores de la ARN polimerasa II y secuencias de control
Las secuencias promotoras de la ARN polimerasa II son diversas. Podemos dividirlas en dos clases: las que se encuentran en los genes que producen proteínas más o menos al mismo ritmo en todas las células («enzimas constitutivas») y las de los genes cuyas tasas de producción varían mucho de un tipo de célula a otra y dependen de las necesidades de una célula diferenciada en un momento dado («enzimas inducibles»).
Elementos promotores de genes constitutivos:
La caja de GC: Se trata de una región que contiene una o más copias de la secuencia GGGCGG (o su complemento) en un lugar aguas arriba del sitio de inicio, y es análoga a los elementos promotores procariotas.
También se encuentran otros elementos promotores en la región de -50 a – 110 aguas arriba de la caja GC.
Elementos promotores de genes expresados selectivamente:
La caja TATA : Región situada entre -25 y -30 que es rica en los nucleótidos «A» y «T» y que se asemeja a la caja Pribnow (TATAAT). Los genes pueden seguir transcribiéndose en presencia de una caja TATA defectuosa y se cree que la caja TATA está implicada en la elección del sitio de inicio de la transcripción
La caja CCAAT : Se trata de una secuencia que a menudo se encuentra aguas arriba de la caja TATA, situada entre -70 y 90 aproximadamente. Se unen a la ARN polimerasa II así como a otras proteínas necesarias para el inicio de la transcripción.
Secuencias de control para genes estructurales:
Otras regiones del cromosoma, algunas muy alejadas del sitio de inicio, pueden afectar a la unión de la ARN polimerasa II a los elementos promotores. Estos elementos genéticos se denominan «potenciadores» y «silenciadores». Las proteínas denominadas «activadores» y «represores» pueden unirse a los potenciadores y silenciadores, afectando así a la unión de la polimerasa a los promotores. Además, la misma proteína puede funcionar como activador o represor, dependiendo de la interacción específica (factores de transcripción de «doble acción»).
Reclutamiento de la ARN polimerasa II al promotor:
Los eucariotas no tienen una proteína simple que corresponda al factor s de los procariotas. Más bien, existe un conjunto de proteínas que, en conjunto, realizan la misma función que el factor s, y son los «factores de transcripción generales» («GTF»). Ya hemos visto las estructuras de los factores de transcripción cuando hablamos de la interacción ADN-proteína en una conferencia anterior. Por lo demás, los mecanismos generales de iniciación de la transcripción son similares.
Hay 6 GTFs que se requieren para una tasa basal de transcripción baja e invariable, y esta tasa puede ser incrementada por la participación de otros factores proteicos. Estos GTF forman un «complejo de preiniciación» que comienza cuando la «proteína de unión a TATA» («TBP») se une a la caja TATA (si existe) de un promotor. La secuencia específica a la que se une identifica el sitio de inicio de la transcripción. Como resultado de esta unión, el ADN se distorsiona por medio de pliegues en ambos extremos de la caja TATA. Otros GTF se unen sucesivamente, seguidos de la unión de la ARN polimerasa. Finalmente, los restantes GTFs se unen.
1YTB: Complejo TBP/caja TATA
Después de que se una la TBP (que es un componente del TFIID), la secuencia de unión es la siguiente:
TFIIA
TFIIB
TFIIF
ARN PII
TFIIE
TFIIH
TFIIH tiene dos actividades enzimáticas importantes. La primera es una actividad quelica dependiente de ATP que ayuda a la formación de un complejo abierto y la segunda es una actividad quinasa que resulta en la fosforilación de la subunidad más grande de la ARN polimerasa II en su extremo C-terminal. Ahora puede comenzar el proceso de elongación de la transcripción, y los distintos GTF (excepto el TFIIF) se disocian del complejo a medida que se produce la elongación. El TFIID permanece unido al promotor para que pueda producirse la transcripción repetida a medida que los GTFs se reúnen para formar el complejo de preiniciación.
Esta discusión se ha centrado en la ARN polimerasa II; para las ARN polimerasas I y III se necesitan diferentes factores de transcripción. Sin embargo, las tres requieren TBP.
Las células controlan la transcripción de cada gen individualmente. Una combinación única de silenciadores y potenciadores para cada gen modula la tasa de transcripción. ¿Cómo influyen en la transcripción de los genes las proteínas activadoras y represoras que se unen lejos del promotor?
La «proteína de especificidad 1» (Sp1) fue el primer factor de transcripción humano que se encontró que podía reconocer una secuencia potenciadora reguladora GC específica. Esta proteína tiene dos módulos interesantes:
(1) Un módulo de 3 dedos de zinc en un extremo;
(2) Un módulo en el extremo opuesto con 2 segmentos discretos ricos en Gln.
Los mutantes que no tienen el extremo rico en glutamina pueden unirse al ADN pero la transcripción no se estimula. Por lo tanto, el extremo rico en glutamina debe unirse a algo más para que se produzca la transcripción, y estos son los «coactivadores».También se denominan «factores asicuados por TBP» o «TAF» y hay al menos ocho de ellos que son importantes para la activación transcripcional. No son factores basales (GTF) y no se unen a secuencias de ADN específicas. Más bien, se unen ávidamente a TBP y proporcionan múltiples «sitios de acoplamiento» a los activadores. En este sentido, son «moléculas adaptadoras». Una «caja de herramientas» de tales moléculas adaptadoras proporciona una enorme diversidad de opciones para modular la transcripción del agene. Así que, ampliando nuestra comparación anterior del complejo de preiniciación de los FGT con el factor s procariota, una mejor comparación sería entre el factor s y todo el complejo de preiniciación activador-coactivador-basal. En cuanto a cómo esta disposición modula o influye en la tasa de transcripción, es probable que esté mediada principalmente por la distorsión del ADN que facilita el movimiento de la ARN polimerasa II a lo largo de la región de codificación.
Latchman (TRENDS in Biochemical Sciences Vol. 26 No.4 April 2001) ha señalado la importancia del propio sitio de unión al ADN como elemento clave de la modulación intranscripcional. El mismo factor de transcripción puede adoptar diferentes conformaciones como resultado de su unión a diferentes sitios. Los cambios conformacionales son inducidos por la interacción ADN-proteína, aumentando así la flexibilidad del espectro de control de la transcripción, ya que una proteína puede actuar como toda una colección de proteínas, cada una con su propio efecto (activación, inhibición o sin efecto).
Para llevar esto un paso más allá, uno puede imaginar que un fenómeno similar puede ocurrir cuando los coactivadores se unen a los activadores. Tal vez se induzcan de forma similar diferentes cambios conformacionales en la proteína unida dependiendo del tipo de interacción proteína-proteína. Dichos cambios conformacionales pueden dar lugar a una capacidad diferente para modular la transcripción.
Los dominios de activación de los factores de transcripción suelen ser ricos en glutamina, pero otros son ricos en prolina o ácidos. En algunos casos, los residuos hidrofóbicos están intercalados entre los residuos ácidos o de glutamina y son importantes para la activación. Tjian (Cell, Vol. 77, 5-8, 8 de abril de 1994) sugiere que las fuerzas hidrofóbicas impulsan la cohesión de los dominios de activación con sus objetivos y que la especificidad se logra mediante la periodicidad de los elementos cohesivos.
Los genes se transcriben a tasas mensurables sólo si los activadores correctos están presentes y son capaces de superar los efectos de los represores.