Transcriptie
Transcriptie is de overdracht van genetische informatie van DNA naar RNA, waarbij DNA als sjabloon wordt gebruikt. De synthese van eiwitten vindt plaats in ribosomen.
Wat is een gen? Op één niveau is een gen een geordende reeks nucleotiden die een polypeptide codeert. Dergelijke genen zijn “structurele” genen. We weten ook dat genen ook RNA kunnen coderen, met inbegrip van boodschapper-RNA (mRNA), transfer-RNA (tRNA), ribosomaal RNA (rRNA) en andere RNA-types. Maar iets moet de genexpressie aanzetten en beëindigen, en ook reguleren. De regulerende sequenties, die “promotors” of “enhancers/silencers” kunnen zijn, kunnen zich ver van de coderende regio’s bevinden. Dus nu moet ons beeld van een gen het idee van afzonderlijke regio’s van een chromosoom omvatten. Wat als de informatie die op het mRNA wordt geschreven niet het uiteindelijke eiwit weerspiegelt totdat het verder wordt gewijzigd? Dit is “posttranscriptionele modificatie”. Nu wordt het concept van een gen nog onduidelijker. Wat als er “overlappende” coderende regio’s zijn? Het is duidelijk dat onze definitie van een gen niet eenvoudig zal zijn.
Functioneel echter kunnen we een gen beschrijven als hebbend een afzonderlijke coderende regio en een afzonderlijke regulerende regio, waarbij de laatste de snelheid controleert waarmee DNA wordt getranscribeerd in mRNA. We zullen zien dat de regulerende eenheden zijn samengesteld uit DNA “motieven” en dat elk motief moet worden bezet door een regulerend eiwit om een gen naar behoren te kunnen reguleren. Niet alleen moet het eiwit op de juiste manier worden bevestigd, maar de eiwitten moeten ook allemaal in elkaar passen met eiwitten die zich binden aan andere motieven in de buurt, net zoals legpuzzelstukjes in elkaar passen. En er is maar één juiste manier voor alles om in elkaar te passen. Het is dus niet alleen maar een kwestie van DNA dat de synthese van MRNA stuurt, dat vervolgens de synthese van eiwitten stuurt; eiwitten zijn intrinsiek betrokken bij de regulering van de eiwitproductie op het niveau van de transcriptie. Dit kan een nachtmerrie worden als je begint na te denken over de regulering van de productie van regulerende eiwitten.
We moeten ook rekening houden met een belangrijk verschil tussen eukaryoten en prokaryoten met betrekking tot de transcriptie van structurele, of eiwit-coderende, genen. Bij eukaryoten worden de genen afzonderlijk getranscribeerd, terwijl bij prokaryoten genen met verwante functies (“operons”) tezamen kunnen worden getranscribeerd. Het Lac-operon bijvoorbeeld omvat drie eiwitcoderende genen en hun controlereeksen. Het operon wordt als één geheel getranscribeerd als een “polycistronisch mRNA”. Eukaryotische structurele genen worden getranscribeerd als monocistronisch mRNA.
DNA-Gestuurde RNA Synthese
Er zijn drie stappen die de DNA-gestuurde RNA synthese kenmerken:
(1) Initiatie door binding van het transcriptie-apparaat aan het DNA-sjabloon
(2) Elongatie van de mRNA-keten
(3) Beëindiging van de mRNA-keten
Het stuk mRNA dat het resultaat is van de directe transcriptie van het DNA dat een “gen” codeert, wordt het “primaire transcript” genoemd en het ondergaat modificatie, soms vrij ingrijpend, voordat het zijn boodschap in eiwit kan omzetten.
De klasse van enzymen die RNA’s synthetiseren staan bekend als RNA polymerasen. Het zijn allemaal multisubunit complexen die in alle cellen aanwezig zijn en zij katalyseren de reactie:
(RNA)nresidues + 1 NTP === (RNA)n+1 residues + PPi
Pyrofosfaat wordt onomkeerbaar gehydrolyseerd tot 2 Pi waardoor de reactie naar rechts wordt gestuurd. De afzonderlijke nucleotiden die van de DNA-template-streng worden afgelezen, worden getranscribeerd in de nucleotiden van het corresponderende RNA, zodat het eindresultaat een enkelstrengs polymeer is, namelijk het mRNA, waarvan de nucleotiden precies overeenkomen met de complementaire nucleotiden op de DNA-streng, met dien verstande dat overal waar een “A” voorkomt in de DNA-template-streng, een “U” voorkomt in het mRNA. (De mogelijkeNTP’s zijn dus ATP,CTP,GTP,UTP.)
Transcriptie in Prokaryoten
Het meest bestudeerde RNA polymerase is dat van E.coli, dus we zullen het bestuderen als het prototype van de RNA polymerasen. Het holoenzym is een 449 kD eiwit dat bestaat uit een “kernenzym” en een “s-subeenheid”, en het gehele complex wordt aangeduid als (kern)s. Het kernenzym leidt de polymerisatiereactie, en het heeft 4 subeenheden: kernenzym = a2bb’w. De anorganische ionen Zn2+ (waarvan twee in de b’subeenheid) en Mg2+ zijn nodig voor de katalytische activiteit en de driedimensionale structuur van het enzym lijkt op een hand. De duim van de hand kan worden voorgesteld als vastgrijpend aan een stukje B-DNA dat in een kanaal ligt dat wordt voorgesteld door de gebogen vingers en handpalm. Dit kanaal is cilindervormig, met afmetingen in de orde van 25 A bij 55 A. In deze afmetingen passen ongeveer 16 basenparen B-DNA.
De “hand”-structuur komt ook voor in andere enzymen die we zullen bestuderen, waaronder DNA-polymerase en reverse transcriptase. U kunt de handstructuur van RNA polymerase verder bestuderen door te kijken naar T7 RNA polymerase (zie PDB hieronder).
1ARO: T7 RNA Polymerase
We zullen transcriptie bekijken vanuit het gezichtspunt van het gen, waarvan we al hebben gezegd dat het een nogal dubbelzinnige entiteit is. Niettemin is het duidelijk dat er een beginpunt moet zijn voor een correcte transcriptie, en het is redelijk om dit als deel van het gen te beschouwen, ook al wordt het zelf niet getranscribeerd. Het probleem van de initiatie is er dus eigenlijk een van herkenning van een beginpunt. Maar welke van de twee strengen van het DNA dient als het sjabloon en hoe kiest de polymerase?
Elke streng kan als sjabloon dienen, maar de transcriptie verloopt altijd van het 5′-uiteinde van een streng DNA naar het 3′-uiteinde. De 3′-5′-streng die als sjabloon dient, wordt de “antisense” of niet-coderende streng genoemd en de 5′-3′-streng (die dezelfde nucleotidesequentie heeft, met uitzondering van “U “s voor “T “s, als het vervolgens getranscribeerde mRNA) is de “sense” of “coderende” streng. Om consequent en duidelijk te zijn, zullen wij de conventie gebruiken dat onze beschrijving van de positie in een reeks van nucleotiden zal geschieden vanuit het gezichtspunt van de sense-streng, aangezien dit dezelfde ordening is als die van het getranscribeerde mRNA. Het deel van het gen dat als initiatiepunt fungeert, wordt de “promotor” genoemd en wordt opgezocht door het holoenzym RNA polymerase. Het holoenzym bindt zwak aan DNA, met een Kdissoc van ongeveer 10-7 M, en dit stelt het in staat zich langs de antisense streng te bewegen op zoek naar de promotor. De ssubeenheid is specifiek voor de promotorsequentie en er treedt een hechte binding van het holoenzym op (Kdissoc van ongeveer 10-14 M).
De promotor wordt herkend door een nucleotide-sequentie van ongeveer 40 bp aan de 5′-zijde van de initiatieplaats, en binnen deze sequentie bevinden zich twee “geconserveerde” sequenties. Een van deze sequenties is 6 bp lang en bevindt zich ongeveer 10 bps stroomopwaarts van de startplaats van de transcriptie. Dit is de “Pribnow Box” en heeft als consensussequentie TATAAT.De andere, minder sterk geconserveerde, sequentie ligt ongeveer 35 bp stroomopwaarts en heeft als consensussequentie TTGACA.De startplaats wordt aangeduid met de notatie +1 en is bijna altijd A of G.
Holo-enzym van RNA polymerase maakt contact met de promotor op ongeveer de middelpunten van de twee regio’s (-10 en -35) en het kernenzym bindt zich stevig aan het duplex-DNA. Zijn werking is dat van het smelten van het dubbelstrengs DNA langs een sequentie van ongeveer 11 bps, van -9 tot +2. De s-factor splitst zich af als de transcriptie begint.
Het zijn de specifieke s-factoren binnen een cel die bepalen welke genen zullen worden getranscribeerd. Individuele celtypen worden dus gekarakteriseerd door hun s-factoren.
De ketenverlenging verloopt in de 5′–> 3′-richting, en de “transcriptiebel” (de lengte van het “gesmolten” DNA) reist met de RNA-polymerase mee. Als gevolg daarvan wordt het ongesmolten DNA voor de bel overwikkeld en achter de bel onderwikkeld. Topoisomerases zorgen er dan voor dat de positieve en negatieve supercoils ontspannen. Het geproduceerde mRNA wordt voor een korte lengte aan het DNA gehybridiseerd op de stroomafwaartse positie, en bestaat los van het DNA als een “staart”, waarbij het aanhechtingspunt zich aan het stroomafwaartse uiteinde bevindt. Het RNA-polymerase valt tijdens de verwerking niet van het DNA af door zijn relatief nauwe, maar niet-specifieke binding aan beide zijden van de transcriptiebel, die wordt gestabiliseerd door zijn “duim” die zich om het DNA wikkelt. Ongeveer 20 tot 50 nucleotiden worden per seconde getranscribeerd bij 37 C en één nucleotide wordt verkeerd getranscribeerd in ongeveer elke 104 . Aangezien genen herhaaldelijk worden getranscribeerd, is dit foutenpercentage niet al te schadelijk, vooral wanneer men bedenkt dat er meerdere codons (“synoniemen”) zijn voor elk aminozuur dat vervolgens wordt vertaald en dat enkele aminozuur-substitutiefouten in een eiwit gewoonlijk de werking ervan niet hinderen.
De spontane beëindiging van de gentranscriptie wordt gesignaleerd door “beëindigingssequenties”. In E.coli is het eindsignaal om de transcriptie te stoppen een reeks van 4 – 10 A-T basenparen met de A op de sjabloonstreng. Voor elke A in deze sequentie heeft het mRNA-transcript een U. Net stroomopwaarts van deze sequentie bevindt zich een regio die rijk is aan Gand-C-basen, gevolgd door een spacer van nucleotiden en een andere regio die rijk is aan G en C. De twee G,C-rijke regio’s zijn zodanig dat de ene regio op de andere kan worden gesuperponeerd door een asymmetrische operatie van 180o . Deze verhouding van basenparen rond een centrum van rotatiesymmetrie wordt een “palindromische sequentie” genoemd. De resulterende reeks nucleotiden aan het 3′-uiteinde van het mRNA is zodanig dat zich een haarspeldlus kan vormen, waarbij de G’s basenparen vormen met de C’s en vice versa, en de A’s met de Us. Het meest terminale deel van het 3′-uiteinde bestaat uit een reeks Us gevolgd door een hydroxylgroep. Terwijl de lus zich vormt, pauzeert de RNA-polymerase op de terminatieplaats. De terminale oligo-U-staart, die slechts zwak aan de DNA-sjabloonstreng is gebonden, wordt verdrongen door de DNA-streng die niet als sjabloon dient.Nu is de mRNA-streng vrij van de DNA-sjabloon. Er zijn echter talrijke andere factoren die het totale proces van terminatie beïnvloeden.
Niet spontane terminatie van transcriptie vereist een “rho-factor”-eiwit, dat ook functioneert om de spontane terminatie-efficiëntie te verbeteren.De rho-factor herkent een sequentie op de groeiende mRNA-keten, stroomopwaarts van de terminatieplaats, waarna hij zich hecht en langs de keten beweegt in de 5′-3′-richting tot hij het RNA-polymerase bereikt dat op de terminatieplaats in pauze staat. Het transcript wordt vrijgemaakt van zijn sjabloonstreng door het afwikkelen van de RNA-DNA duplex door de rho-factor.
Transcriptie in Eukaryten:
Transcriptie in eukaryoten lijkt weliswaar sterk op die in prokaryoten, maar de “machinerie” en de controlesequenties van de transcriptie in eukaryoten zijn veel complexer, en er zijn talrijke RNA-polymerasen.
Ribosomaal RNA (rRNA) vormt ongeveer 95% van al het RNA en ongeveer 67% van hetRNA in ribosomen. De rest van het RNA omvat transfer-RNA (tRNA), boodschapper-RNA (mRNA) en andere soorten die in kleinere hoeveelheden aanwezig zijn, zoals “kleine-nucleaire” RNA’s (snRNA’s) die betrokken zijn bij mRNA-splicing en “gids”-RNA’s die betrokken zijn bij de bewerking van RNA. Deze laatste twee processen vinden plaats in de post-DeepL translatie van de levenscyclus van eukaryotisch mRNA. Alle RNA’s worden gecodeerd door DNA, en de verschillende typen RNA polymerase in eukaryoten weerspiegelen dit en het feit dat, in eukaryoten, de translatie van mRNA in DNA buiten de kern plaatsvindt.
Precursors van het meeste rRNA worden gesynthetiseerd in nucleoli met het enzym RNApolymerase I. Voorlopers van mRNA worden gesynthetiseerd in het nucleoplasma door RNApolymerase II, terwijl RNApolymerase III, ook in het nucleoplasma, voorlopers synthetiseert van 5S RNA, tRNA’s en andere RNA’s die zowel in de kern als in het cytoplasma worden aangetroffen. Mitochondriën hebben hun eigen RNA-polymerasen, en deze zijn analoog aan de chloroplast RNA’s die in planten worden aangetroffen. Wij zullen ons concentreren op RNA polymerase II, omdat deze betrokken is bij de transcriptie in eukaryoten.
U kunt kijken naar de structuur van gist RNA polymerase II (zie PDB hieronder) als wij de structuur bespreken als een prototype. Dit zijn grote, multisubunit-enzymen, waarbij sommige van de subeenheden homologen zijn van de a,b,en b’ subeenheden in de prokaryotische RNA polymerase.De algemene vorm van het enzym is vergelijkbaar met die van de prokaryotische RNApolymerase (en DNA polymerase), namelijk die van een hand met een “duim”-motief dat een kanaal flankeert dat groot genoeg is om een stuk B-DNA te bevatten (ongeveer 25 A breed).
1ENO: Yeast RNA Polymerase II
We hebben nog niet gekeken naar de chemie van de verlenging van de mRNA-keten, maar dat zullen we hier wel doen. De ketens worden verlengd in de richting 5′–> 3′ door nucleofiele aanval van de 3′ OH groep van de groeiende keten door het a-fosfaat van het inkomende NTP.
Zoals bij prokaryoten begint eukaryotische transcriptie door herkenning van promotoren. Er zijn vele kopieën van de rRNA-genen die de rRNA-synthese leiden, alle met bijna identieke sequenties. Deze redundantie zorgt voor een voldoende aanvoer van rRNA dat, zoals eerder gezegd, ongeveer 95% van het cellulaire RNA uitmaakt. De promotors voor deze bijna identieke genen zijn daarom identiek, zodat RNApolymerase I slechts één promotorsequentie hoeft te herkennen. RNApolymerase I is echter soortspecifiek (RNA poly II en III zijn niet soortspecifiek).
Voor de promotie van zoogdier-RRNA is er een “kernpromoterelement” dat de regio -31 tot +6 omspant (merk op dat dit een regio van het gen overlapt die wordt getranscribeerd) en een “stroomopwaarts promotorelement” dat de regio -187 tot -107 omspant.
Voor transcriptie van genen door RNA polymerase III bevindt de promotor zich soms in een segment binnen het getranscribeerde deel van het gen, tussen +40 en+80, maar kan zich ook gedeeltelijk stroomopwaarts of geheel stroomopwaarts van de startplaats bevinden.
RNA Polymerase II Promotors en controle-sequenties
Promoter-sequenties voor RNA polymerase II zijn divers. We kunnen ze in twee klassen verdelen: die voor genen die in alle cellen ongeveer even snel eiwitten produceren (“constitutieve enzymen”) en die voor genen waarvan de productie sterk varieert van celtype tot celtype en afhankelijk is van de behoeften van een gedifferentieerde cel op een bepaald moment (“induceerbare enzymen”).
Constitutieve gen-promotorelementen:
De GC-box: Dit is een gebied dat een of meer kopieën van de sequentie GGGCGG (of het complement daarvan) bevat op een plaats stroomopwaarts van de startplaats, en het is analoog aan de prokaryotische promotorelementen.
Andere promotor elementen worden ook gevonden in de -50 tot – 110 regio stroomopwaarts van de GC box.
Selectively Expressed Gene Promoter Elements:
De TATA Box : Aregion gelegen op ongeveer -25 tot -30 die rijk is aan de nucleotiden “A “en “T” en die lijkt op de Pribnow Box (TATAAT). Genen kunnen nog steeds worden getranscribeerd in aanwezigheid van een defecte TATA box en men denkt dat de TATA box betrokken is bij de keuze van de startplaats van de transcriptie
De CCAAT box : Dit is een sequentie die vaak stroomopwaarts van de TATA box wordt aangetroffen, gelegen op ongeveer -70 tot-90. Deze binden RNA polymerase II en andere eiwitten die nodig zijn voor de initiatie van de transcriptie.
Controle Sequenties voor Structurele Genen:
Andere gebieden van het chromosoom, sommige ver verwijderd van de startplaats, kunnen de binding van RNA polymerase II aan promotor elementen beïnvloeden. Deze gen-elementen worden “enhancers” en “silencers” genoemd. Eiwitten die “activatoren” en “repressoren” worden genoemd, kunnen zich aan de enhancers en “silencers” binden en zo de binding van polymerase aan de promotors beïnvloeden. Bovendien kan hetzelfde eiwit zowel als activator of als repressor fungeren, afhankelijk van de specifieke interactie (“dubbelwerkende” transcriptiefactoren).
Werving van RNA Polymerase II aan de promotor:
Eukaryoten hebben niet één enkel eiwit dat overeenkomt met de s-factor in prokaryoten. Integendeel, er is een reeks eiwitten die samen dezelfde functie vervullen als de s-factor, en dit zijn de “algemene transcriptiefactoren” (“GTF’s”). Wij hebben reeds gekeken naar de structuren van transcriptiefactoren toen wij in een vorig college de DNA-eiwitinteractie bespraken. Voor het overige zijn de algemene mechanismen van transcriptie-initiatie vergelijkbaar.
Er zijn 6 GTF’s die nodig zijn voor een lage en onveranderlijke basissnelheid van de transcriptie, en deze snelheid kan worden verhoogd door de deelname van andere eiwitfactoren. Deze GTF’s vormen een “pre-initiatie complex” dat begint wanneer het “TATA bindend eiwit” (“TBP”) zich bindt aan de TATA box (als er een is) van een promotor. De specifieke sequentie waaraan het zich bindt identificeert de startplaats van de transcriptie. Als gevolg van deze binding wordt het DNA vervormd door knikken aan beide uiteinden van de TATA-box. Andere GTF’s binden achtereenvolgens, gevolgd door de binding van RNA-polymerase. Tenslotte binden de resterende GTF’s.
1YTB: TBP/TATA Box Complex
Nadat TBP (dat een onderdeel is van TFIID) bindt, is de volgorde van binding als volgt:
TFIIA
TFIIB
TFIIF
RNA PII
TFIIE
TFIIH
TFIIH heeft twee belangrijke enzymactiviteiten. De eerste is een ATP-afhankelijke helicase-activiteit die helpt bij de vorming van een open complex en de tweede is een kinase-activiteit die resulteert in de fosforylering van de grootste subeenheid van RNA polymerase II aan het C-terminale uiteinde. Nu kan het transcriptie-elongatieproces beginnen, waarbij de verschillende GTF’s (behalve TFIIF) zich van het complex losmaken naarmate de elongatie optreedt. TFIID blijft aan de promotor gebonden, zodat herhaalde transcriptie kan plaatsvinden terwijl de GTF’s zich weer verzamelen om het pre-initiatiecomplex te vormen.
Deze discussie heeft zich geconcentreerd op RNA polymerase II; voor RNA polymerasen I en III zijn verschillende transcriptiefactoren nodig. Alle drie hebben echter TBP nodig.
Cellen controleren de transcriptie van elk gen afzonderlijk. Een unieke combinatie van “silencers” en “enhancers” voor elk gen moduleert de transcriptiesnelheid. Hoe beïnvloeden activator- en repressoreiwitten die ver van de promotor zijn gebonden de transcriptie van genen?
“Specificity protein 1” (Sp1) was de eerste menselijke transcriptiefactor die werd gevonden en die een specifieke GC-regulerende enhancersequentie kon herkennen. Dit eiwit heeft twee interessante modules:
(1) Een module van 3 zinkvingers aan één uiteinde;
(2) Een module aan het andere uiteinde met 2 discrete segmenten rijk aan Gln.
Mutanten die niet het glutamine-rijke uiteinde hebben kunnen zich wel binden aan DNA maar de transcriptie wordt niet gestimuleerd. Daarom moet het glutamine-rijke uiteinde aan iets anders binden om transcriptie te laten plaatsvinden, en dit zijn de “coactivatoren”.Zij worden ook wel “TBP-Assicuated Factors” of “TAFs” genoemd en er zijn er minstens acht die belangrijk zijn voor transcriptionele activering. Het zijn geen basale factoren (GTF’s) en zij binden zich niet aan specifieke DNA-sequenties. Integendeel, zij binden zich gretig aan TBP en zorgen voor meervoudige “docking sites” voor de activatoren. In die zin zijn het “adaptormoleculen”. Een “gereedschapskist” van dergelijke adaptormoleculen biedt een enorme verscheidenheid aan mogelijkheden om de transcriptie van een gen te moduleren. Dus, voortbouwend op onze eerdere vergelijking van het preïnitiatiecomplex vanGTF’s met de prokaryotische s-factor, zou een betere vergelijking zijn tussen de s-factor en het gehele complex van activator-coactivator-basaal preïnitiatiecomplex. Wat betreft de wijze waarop deze opstelling de snelheid van transcriptie moduleert of beïnvloedt, wordt deze waarschijnlijk hoofdzakelijk bemiddeld door een vervorming van het DNA die de beweging van RNA polymerase II langs het coderende gebied vergemakkelijkt.
Latchman (TRENDS in Biochemical Sciences Vol. 26 No.4 April 2001) heeft erop gewezen dat de DNA-bindingsplaats zelf een sleutelrol speelt bij de intranscriptionele modulatie. Dezelfde transcriptiefactor kan verschillende conformaties aannemen als gevolg van binding aan verschillende plaatsen. De conformatieveranderingen worden geïnduceerd door de DNA-eiwit interactie, waardoor de flexibiliteit van het spectrum van controle van de transcriptie toeneemt, aangezien één eiwit kan werken als een hele verzameling van eiwitten, elk met zijn eigen effect (activering, remming of geen effect).
Om nog een stap verder te gaan, men kan zich voorstellen dat een soortgelijk verschijnsel kan optreden wanneer coactivators zich binden aan activators. Misschien worden op soortgelijke wijze verschillende conformatieveranderingen in het gebonden eiwit geïnduceerd, afhankelijk van het type eiwit-eiwitinteractie. Dergelijke conformatieveranderingen kunnen dan resulteren in een verschillend vermogen om transcriptie te moduleren.
De activeringsdomeinen van transcriptiefactoren zijn vaak glutamine-rijk, maar andere zijn proline-rijk of zuur. In sommige gevallen zijn hydrofobe residuen verspreid tussen de zure of glutamine residuen en zijn belangrijk voor de activering. Tjian (Cell, Vol. 77, 5-8, April 8, 1994) suggereert dat hydrofobe krachten de cohesie van activeringsdomeinen met hun doelwitten aandrijven en dat specificiteit wordt bereikt door de periodiciteit van de cohesieve elementen.
Genenen worden alleen met meetbare snelheid getranscribeerd als de juiste activatoren aanwezig zijn en in staat zijn de effecten van repressoren te overwinnen.