Trascrizione
La trascrizione è il trasferimento di informazioni genetiche dal DNA all’RNA, usando il DNA come modello. La sintesi proteica avviene nei ribosomi.
Che cos’è un gene? Ad un livello, un gene è una stringa ordinata di nucleotidi che codifica un polipeptide. Tali geni sono geni “strutturali”. Sappiamo anche che i geni possono anche codificare RNA, compreso l’RNA messaggero (mRNA), l’RNA di trasferimento (tRNA), l’RNA ribosomiale (rRNA) e altri tipi di RNA. Ma qualcosa deve accendere e terminare l’espressione genica, così come regolarla. Le sequenze di regolazione, che possono essere “promotori” o “esaltatori/silenziatori” possono essere situate lontano dalle regioni codificanti. Così ora la nostra visione di un gene deve includere l’idea di regioni separate di un cromosoma. E se l’informazione trascritta sull’mRNA non riflettesse la proteina finale finché non viene ulteriormente modificata? Questa è la “modifica post-trascrizionale”. Ora il concetto di gene diventa ancora più nebuloso. Cosa succede se ci sono regioni codificanti “sovrapposte”? Chiaramente la nostra definizione di un gene non sarà semplice.
Funzionalmente, però, possiamo descrivere un gene come avente una regione codificante distinta e una regione regolatrice distinta, quest’ultima che controlla la velocità con cui il DNA viene trascritto in mRNA. Vedremo che le unità di regolazione sono composte da “motivi” di DNA e che ogni motivo dovrà essere occupato da una proteina di regolazione se un gene deve essere regolato correttamente. Non solo ci deve essere l’attaccamento appropriato della proteina, ma le proteine devono adattarsi tutte insieme con le proteine che si legano ad altri motivi vicini nel modo in cui i pezzi di un puzzle si adattano insieme. E c’è solo un modo corretto per tutto ciò che si incastra. Quindi, non è solo una semplice questione di DNA che dirige la sintesi dell’RNA, che poi dirige la sintesi proteica; le proteine sono intrinsecamente coinvolte nella regolazione della produzione di proteine a livello della trascrizione. Questo può diventare un incubo se si comincia a pensare alla regolazione della produzione di proteine regolatrici.
Dobbiamo anche considerare un’importante differenza tra eucarioti e procarioti per quanto riguarda la trascrizione di geni strutturali, o codificanti proteine. Negli eucarioti, i geni sono trascritti individualmente mentre nei procarioti, i geni con funzioni correlate (“operoni”) possono essere trascritti insieme. Per esempio, l’operone Lac comprende tre geni codificanti proteine e le loro sequenze di controllo. L’operone viene trascritto come una singola unità come “mRNA policistronico”. I geni strutturali eucariotici sono trascritti come mRNA monocistronico.
Sintesi dell’RNA diretta dal DNA
Ci sono tre passi che caratterizzano la sintesi dell’RNA diretta dal DNA:
(1) Inizio con il legame dell’apparato di trascrizione al modello di DNA
(2) Allungamento della catena di mRNA
(3) Terminazione della catena di mRNA
Il pezzo di mRNA che risulta dalla trascrizione diretta del DNA che codifica un “gene” è chiamato “trascrizione primaria” e subisce modifiche, a volte abbastanza estese, prima di poter tradurre il suo messaggio in proteina.
La classe di enzimi che sintetizzano gli RNA è conosciuta come RNA polimerasi. Sono tutti complessi multisubunità presenti in tutte le cellule e catalizzano la reazione:
(RNA)nresidui + 1 NTP === (RNA)n+1 residui + PPi
Il pirofosfato viene irreversibilmente idrolizzato a 2 Pi guidando così l’azione verso destra. I singoli nucleotidi che vengono letti dal filamento di DNA modello vengono trascritti nei nucleotidi dell’RNA corrispondente, per cui il risultato finale è un polimero a singolo filamento, cioè l’mRNA, i cui nucleotidi corrispondono esattamente ai nucleotidi complementari sul filamento di DNA con l’eccezione che ovunque appaia una “A” nel filamento di DNA modello, nell’mRNA appare una “U”. (I possibili NTP, quindi, sono ATP, CTP, GTP, UTP.)
Trascrizione nei procarioti
La RNA polimerasi più studiata è quella dell’E.coli, quindi la studieremo come prototipo delle RNA polimerasi. L’oloenzima è una proteina di 449 kD composta da un “core enzyme” e una “s-subunità”, e l’intero complesso è indicato come (core)s. Il core enzyme dirige la reazione di polimerizzazione e ha 4 subunità: core enzyme = a2bb’w. Gli ioni inorganici Zn2+ (due di loro nella subunità b) e Mg2+ sono richiesti per l’attività catalitica e la struttura tridimensionale dell’enzima assomiglia a una mano. Il pollice della mano può essere immaginato come se afferrasse un pezzo di DNA B che si trova in un canale rappresentato dalle dita curve e dal palmo della mano. Questo canale è cilindrico, con dimensioni dell’ordine di 25 A per 55 A. Queste dimensioni permettono un adattamento di circa 16 paia di basi di B DNA.
La struttura della “mano” appare in altri enzimi che studieremo, tra cui la DNA polimerasi e la trascrittasi inversa. Potete studiare ulteriormente la struttura a mano della RNA polimerasi guardando la T7 RNA polimerasi (vedi PDB sotto).
1ARO: T7 RNA polimerasi
Guarderemo la trascrizione dal punto di vista del gene, che abbiamo già detto essere una entità piuttosto ambigua. Tuttavia, è chiaro che ci deve essere un punto di partenza perché la trascrizione avvenga correttamente, ed è ragionevole includerlo come parte del gene, anche se non viene trascritto esso stesso. Quindi, il problema dell’iniziazione è in realtà un problema di riconoscimento di un punto di partenza. Ma quale dei due filamenti del DNA serve come modello e come sceglie la polimerasi?
Entrambi i filamenti possono servire da modello, ma la trascrizione procede sempre dall’estremità 5′ di un filamento di DNA all’estremità 3′. Il filamento 3′-5′ che serve come modello è chiamato “antisenso” o filamento non codificante e il filamento 5′-3′ (che ha la stessa sequenza nucleotidica, ad eccezione delle “U” per le “T”, come l’mRNA successivamente trascritto) è il filamento “senso” o “codificante”. Per essere coerenti e chiari, useremo la convenzione che la nostra descrizione della posizione lungo una sequenza di nucleotidi sarà dal punto di vista del filamento di senso, poiché questo è lo stesso ordine di quello dell’mRNA che viene trascritto. La parte del gene che funge da sito d’inizio si chiama “promotore” ed è ricercata dall’oloenzima RNA polimerasi. L’oloenzima si lega debolmente al DNA, con un Kdissoc di circa 10-7 M, e questo gli permette di muoversi lungo il filamento antisenso alla ricerca del promotore. La ssubunità è specifica per la sua sequenza promotrice e si verifica uno stretto legame dell’oloenzima (Kdissoc di circa 10-14 M).
Il promotore è riconosciuto da una sequenza nucleotidica di circa 40 bp sul lato 5′ del sito di iniziazione, e all’interno di questa sequenza ci sono due sequenze “conservate”. Una di queste è lunga 6 bp ed è centrata a circa 10 bps a monte del sito di inizio della trascrizione. Questa è la “Pribnow Box” e ha una sequenza di consenso TATAAT.L’altra sequenza, meno altamente conservata, è centrata a circa 35 bp a monte e ha una sequenza di consenso TTGACA.Il sito di inizio è indicato dalla notazione +1 ed è quasi sempre A o G.
L’oloenzima dell’RNA polimerasi contatta il promotore all’incirca al centro delle due regioni (-10 e -35) e l’enzima centrale si lega strettamente al DNA duplex; la sua azione è quella di fondere il DNA a doppio filamento lungo una sequenza di circa 11 bps, da -9 a +2. Il fattore s si scinde all’inizio della trascrizione.
Sono i fattori s specifici di una cellula che determinano quali geni saranno trascritti. Così i singoli tipi di cellule sono caratterizzati dai loro fattori s.
L’allungamento della catena procede nella direzione 5′–> 3′, e la “bolla di trascrizione” (la lunghezza del DNA “fuso”) viaggia con la RNA polimerasi. Di conseguenza, il DNA non fuso è sovraccaricato davanti alla bolla e sottoccaricato dietro la bolla. Le topoisomerasi agiscono quindi per rilassare le supercoil positive e negative. L’mRNA prodotto è ibridato per una breve lunghezza al DNA nella posizione a valle, ed esiste separato dal DNA come una “coda”, il punto di attacco è all’estremità a valle. L’RNA polimerasi non si stacca dal DNA mentre sta elaborando a causa del suo legame relativamente stretto, ma aspecifico, su entrambi i lati della bolla di trascrizione, stabilizzato dal suo “pollice” che avvolge il DNA. Circa 20 a 50 nucleotidi sono trascritti per secondo a 37 C e un nucleotide è trascritto in modo errato in circa ogni 104. Poiché i geni sono trascritti ripetutamente, questo tasso di errore non è troppo deleterio, specialmente se accoppiato al fatto che ci sono codoni multipli (“sinonimi”) per ogni amminoacido successivamente tradotto e che gli errori di sostituzione di un singolo amminoacido in una proteina di solito non ostacolano la sua funzione.
La terminazione spontanea della trascrizione genica è segnalata da “sequenze di terminazione”. in E.coli, il segnale finale per fermare la trascrizione è una serie di 4 – 10 accoppiamenti di basi A-T con la As sul filamento modello. Per ogni A in questa regione, la trascrizione dell’mRNA avrà una U. Appena a monte di questa sequenza c’è una regione ricca di basi Gand C seguita da uno spaziatore di nucleotidi e un’altra regione ricca di G e C. Le due regioni G,Crich sono tali che una regione può essere sovrapposta all’altra con un’operazione di asimmetria di 180o . Questo rapporto di coppie di basi intorno ad un centro di simmetria rotazionale è chiamato “sequenza palindromica”. La stringa risultante di nucleotidi all’estremità 3′ dell’mRNA è tale che si può formare un hairpinloop, la base Gs si accoppia con la Cs e viceversa, e la As con la Us. La parte più terminale dell’estremità 3′ è una serie di Us seguita da un gruppo idrossile. La coda terminale dell’oligo-U, che è solo debolmente legata al filamento di DNA modello, viene spostata dal filamento di DNA non modello.Ora il filamento di mRNA è libero dal DNA modello. Tuttavia, ci sono numerosi altri fattori che influenzano il processo generale di terminazione.
La terminazione non spontanea della trascrizione richiede una proteina “fattore rho”, che funziona anche per migliorare l’efficienza della terminazione spontanea.Il fattore rho riconosce una sequenza sulla catena di mRNA in crescita, a monte del sito di terminazione, dopo di che si attacca e si muove lungo la catena in direzione 5′-3′ fino a raggiungere la RNA polimerasi che è in pausa nel sito di terminazione. Il trascritto viene liberato dal suo filamento modello grazie al riavvolgimento del duplex RNA-DNA da parte del fattore rho.
Trascrizione negli eucarioti:
Sebbene sia molto simile a quella nei procarioti, il “macchinario” e le sequenze di controllo della trascrizione negli eucarioti è molto più complesso, e ci sono numerose RNA polimerasi.
L’RNA rabosomiale (rRNA) costituisce circa il 95% di tutto l’RNA e circa il 67% dell’RNA nei ribosomi. Il resto dell’RNA comprende l’RNA di trasferimento (tRNA), l’RNA messaggero (mRNA) e altri tipi presenti in quantità minori, come gli RNA “smallnucleari” (snRNA) coinvolti nello splicing dell’mRNA e gli RNA “guida” che sono coinvolti nell’editing dell’RNA. Questi ultimi due processi avvengono nella traduzione post-DeepL del ciclo di vita dell’mRNA eucariotico. Tutti gli RNA sono codificati dal DNA, e i diversi tipi di RNA polimerasi negli eucarioti riflettono questo e il fatto che, negli eucarioti, la traduzione dell’mRNA in DNA avviene al di fuori del nucleo.
I precursori della maggior parte degli rRNA sono sintetizzati nei nucleoli con l’enzima RNA polimerasi I. I precursori dell’mRNA sono sintetizzati nel nucleoplasma dalla RNA polimerasi II, mentre la RNA polimerasi III, anch’essa nel nucleoplasma, sintetizza i precursori dell’RNA 5S, dei tRNA e di altri RNA presenti sia nel nucleo che nel citoplasma. I mitocondri hanno le loro proprie RNA polimerasi, e queste sono analoghe agli RNA dei cloroplasti che si trovano nelle piante. Ci concentreremo sulla RNA polimerasi II perché è quella coinvolta nella trascrizione negli eucarioti.
Puoi guardare la struttura della RNA polimerasi II del lievito (vedi PDB sotto) mentre discutiamo la sua struttura come prototipo. La forma generale dell’enzima è simile a quella dell’RNA polimerasi procariotica (e della DNA polimerasi), cioè quella di una mano con un motivo a forma di “pollice” che fiancheggia un canale abbastanza grande da contenere un pezzo di B-DNA (circa 25 A di larghezza).
1ENO: Yeast RNA Polymerase II
Non abbiamo ancora considerato la chimica dell’allungamento della catena di mRNA, ma lo faremo qui. Le catene sono allungate nella direzione 5′–> 3′ per attacco nucleofilo del gruppo 3′ OH della catena in crescita da parte dell’a-fosfato dell’NTP in arrivo.
Come nei procarioti, la trascrizione eucariotica inizia dal riconoscimento dei promotori. Ci sono molte copie dei geni dell’rRNA che dirigono la sintesi dell’rRNA, tutte con sequenze quasi identiche. Questa ridondanza assicura un adeguato rifornimento di rRNA che, come abbiamo detto in precedenza, comprende circa il 95% dell’RNA cellulare. I promotori di questi geni quasi identici sono, quindi, identici, quindi la RNApolimerasi I deve riconoscere solo una sequenza promotrice. Tuttavia, la RNApolimerasi I è specie-specifica (RNA poly II e III non sono specie specifiche).
Per la promozione dell’rRNA dei mammiferi, c’è un “core promoter element” che si estende dalla regione -31 a +6 (si noti che questo si sovrappone a una regione del gene che viene trascritto) e un “upstream promoter element” che si estende da -187 a -107.
Per la trascrizione di geni da parte della RNA polimerasi III, il promotore è a volte situato in un segmento all’interno della parte trascritta del gene, tra +40 e +80, ma può anche essere parzialmente a monte o interamente a monte del sito di partenza.
Promotori dell’RNA polimerasi II e sequenze di controllo
Le sequenze del promotore per la RNA polimerasi II sono diverse. Possiamo dividerle in due classi: quelle che si trovano nei geni che producono proteine allo stesso ritmo in tutte le cellule (“enzimi costitutivi”) e quelle per i geni i cui tassi di produzione variano notevolmente da un tipo di cellula all’altro e dipendono dai bisogni di una cellula differenziata in un dato momento (“enzimi inducibili”).
Elementi promotori di geni costitutivi:
Il GC Box: Questa è una regione contenente una o più copie della sequenza GGGCGG (o il suo complemento) in una posizione a monte del sito di inizio, ed è analoga agli elementi promotori procarioti.
Altri elementi promotori si trovano anche nella regione da -50 a – 110 a monte della GC box.
Elementi promotori di geni espressi selettivamente:
La TATA Box: Aregione situata a circa -25 a -30 che è ricca di nucleotidi “A” e “T” e che assomiglia alla Pribnow Box (TATAAT). I geni possono ancora essere trascritti in presenza di una TATA box difettosa e si pensa che la TATA box sia coinvolta nella scelta del sito di inizio della trascrizione
La CCAAT Box: Questa è una sequenza che si trova spesso a monte della TATA box, situata a circa -70-90. Queste legano la RNA polimerasi II e altre proteine necessarie per l’inizio della trascrizione.
Sequenze di controllo per i geni strutturali:
Altre regioni del cromosoma, alcune molto lontane dal sito di inizio, possono influenzare il legame dell’RNA polimerasi II agli elementi promotori. Questi elementi genici sono chiamati “enhancer” e “silencers”. Le proteine chiamate “attivatori” e “repressori” possono legarsi agli enhancer e ai silenziatori, influenzando così il legame della polimerasi ai promotori. Inoltre, la stessa proteina può funzionare sia come attivatore che come repressore, a seconda dell’interazione specifica (fattori di trascrizione “dual-acting”).
Reclutamento della RNA polimerasi II al promotore:
Gli eucarioti non hanno una semplice proteina che corrisponde al fattore sf nei procarioti. Piuttosto, c’è un insieme di proteine che insieme svolgono la stessa funzione del fattore s, e questi sono i “fattori generali di trascrizione” (“GTF”). Abbiamo già visto le strutture dei fattori di trascrizione quando abbiamo discusso l’interazione DNA-proteina in una lezione precedente. Per il resto, i meccanismi generali di inizio della trascrizione sono simili.
Ci sono 6 GTFs che sono richiesti per un tasso basale basso e invariante di trascrizione, e questo tasso può essere aumentato dalla partecipazione di altri fattori proteici. Queste GTF formano un “complesso di preiniziazione” che inizia quando la “proteina legante TATA” (“TBP”) si lega alla scatola TATA (se c’è) di un promotore. La sequenza specifica alla quale si lega identifica il sito di inizio della trascrizione. Come risultato di questo legame, ilDNA è distorto da pieghe alle due estremità della scatola TATA. Altre GTF si legano successivamente, seguite dal legame della RNA polimerasi. Infine, le rimanenti GTF si legano.
1YTB: Complesso TBP/TATA Box
Dopo che TBP (che è un componente di TFIID) si lega, la sequenza di legame è la seguente:
TFIIA
TFIIB
TFIIF
RNA PII
TFIIE
TFIIH
TFIIH ha due importanti attività enzimatiche. La prima è un’attività di elicasi ATP-dipendente che assiste la formazione di un complesso aperto e la seconda è un’attività di chinasi che risulta nella fosforilazione della più grande subunità di RNA polimerasi II alla sua estremità C-terminale. Ora il processo di allungamento della trascrizione può iniziare, con le varie GTF (eccetto TFIIF) che si dissociano dal complesso mentre si verifica l’allungamento. TFIID rimane legato al promotore in modo che la trascrizione ripetuta possa avvenire mentre le GTF si riassemblano per formare il complesso di preiniziazione.
Questa discussione si è concentrata sulla RNA polimerasi II; diversi fattori di trascrizione sono necessari per le RNA polimerasi I e III. Tuttavia, tutte e tre richiedono TBP.
Le cellule controllano la trascrizione di ogni gene individualmente. Una combinazione unica di silenziatori ed esaltatori per ogni gene modula il tasso di trascrizione. In che modo le proteine attivatrici e repressorie che sono legate lontano dal promotore influenzano la trascrizione dei geni?
La “proteina di specificità 1” (Sp1) è stato il primo fattore di trascrizione umano che è stato trovato in grado di riconoscere una specifica sequenza enhancer GCregulatory. Questa proteina ha due moduli interessanti:
(1) Un modulo di 3 dita di zinco a un’estremità;
(2) Un modulo all’estremità opposta con 2 segmenti discreti ricchi di Gln.
I mutanti che non hanno l’estremità ricca di glutammina possono legarsi al DNA ma la trascrizione non viene stimolata. Pertanto, l’estremità ricca di glutammina deve legarsi a qualcos’altro perché la trascrizione avvenga, e questi sono i “coattivatori”, chiamati anche “fattori TBP-Assicurati” o “TAF” e ce ne sono almeno otto che sono importanti per l’attivazione trascrizionale. Questi non sono fattori basali (GTF) e non si legano a specifiche sequenze di DNA. Piuttosto, si legano avidamente a TBP e forniscono molteplici “siti di aggancio” agli attivatori. In questo senso, sono “molecole adattatrici”. Un “toolkit” di tali molecole adattatrici fornisce un’enorme diversità di opzioni per modulare la trascrizione dell’agene. Così, ampliando il nostro precedente confronto tra il complesso di preiniziazione dei GTF e il fattore s procariotico, un miglior confronto sarebbe tra il fattore s e l’intero complesso attivatore-coattivatore-base del complesso di preiniziazione. Per quanto riguarda il modo in cui questa disposizione modula o influenza il tasso di trascrizione, è probabilmente mediata principalmente dalla distorsione del DNA che facilita il movimento della RNA polimerasi II lungo la regione di codifica.
Latchman (TRENDS in Biochemical Sciences Vol. 26 No.4 April 2001) ha sottolineato l’importanza del sito di legame al DNA stesso che gioca un ruolo chiave nella modulazione intrascrizionale. Lo stesso fattore di trascrizione può assumere diverse conformazioni come risultato del legame a diversi siti. I cambiamenti conformazionali sono indotti dall’interazione DNA-proteina, aumentando così la flessibilità dello spettro di controllo della trascrizione, poiché una proteina può agire come un’intera collezione di proteine, ognuna delle quali ha il proprio effetto (attivazione, inibizione o nessun effetto).
Per fare un ulteriore passo avanti, si può immaginare che un fenomeno simile si verifichi quando i coattivatori si legano agli attivatori. Forse diversi cambiamenti conformazionali sono similmente indotti nella proteina legata a seconda del tipo di interazione proteina-proteina. Tali cambiamenti conformazionali possono quindi risultare in una capacità indifferente di modulare la trascrizione.
I domini di attivazione dei fattori di trascrizione sono spesso ricchi di glutamina, ma altri sono ricchi di prolina o acidi. In alcuni casi, i residui idrofobici sono intercalati tra i residui acidi o di glutammina e sono importanti per l’attivazione. Tjian (Cell, Vol. 77, 5-8, April 8, 1994) suggerisce che le forze idrofobiche guidano la coesione dei domini di attivazione con i loro obiettivi e che la specificità è raggiunta dalla periodicità degli elementi coesivi.
I geni sono trascritti a tassi misurabili solo se sono presenti gli attivatori corretti e sono in grado di superare gli effetti dei repressori.