Transkription
Transkription är överföringen av genetisk information från DNA till RNA, med DNA som mall. Proteinsyntesen sker i ribosomer.
Vad är en gen? På en nivå är en gen en ordnad sträng av nukleotider som kodar för en polypeptid. Sådana gener är ”strukturella” gener. Vi vet också att gener också kan koda för RNA, inklusive messenger RNA (mRNA), transfer RNA (tRNA), ribosomalt RNA (rRNA) och andra RNA-typer. Men något måste aktivera och avsluta genuttrycket samt reglera det. De reglerande sekvenserna, som kan vara ”promotorer” eller ”enhancers/silencers”, kan vara belägna långt från de kodande regionerna. Vår syn på en gen måste nu alltså omfatta idén om separata regioner på en kromosom. Vad händer om den information som transkriberas till mRNA inte återspeglar det slutliga proteinet förrän det modifieras ytterligare? Detta är ”posttranskriptionell modifiering”. Nu blir begreppet gen ännu mer oklart. Vad händer om det finns ”överlappande” kodningsregioner? Det är uppenbart att vår definition av en gen inte kommer att vara enkel.
Funktionellt kan vi dock beskriva en gen som att den har en distinkt kodande region och en distinkt reglerande region, där den sistnämnda kontrollerar den hastighet med vilken DNA transkriberas till mRNA. Vi kommer att se att de reglerande enheterna består av DNA-”motiv” och att varje motiv måste vara upptaget av ett reglerande protein om en gen ska regleras på rätt sätt. Det är inte bara proteinet som måste vara lämpligt fastsatt, utan alla proteiner måste passa ihop med proteiner som binder sig till andra motiv i närheten på samma sätt som pusselbitar passar ihop. Och det finns bara ett korrekt sätt att få allt att passa ihop. Det är alltså inte bara en enkel fråga om att DNA styrmRNA-syntesen, som sedan styr proteinsyntesen; proteiner är i grunden involverade i regleringen av proteinproduktionen på transkriptionsnivå.Detta kan bli en mardröm om man börjar tänka på regleringen av produktionen av reglerande proteiner.
Vi måste också ta hänsyn till en viktig skillnad mellan eukaryoter och prokaryoter när det gäller transkriptionen av strukturella, eller proteinkodande,gener. I eukaryoter transkriberas generna individuellt, medan gener med besläktade funktioner (”operoner”) i prokaryoter kan transkriberas tillsammans. Som exempel kan nämnas att Lac-operonet omfattar tre proteinkodande gener samt deras kontrollsekvenser. Operonet transkriberas som en enda enhet som ett ”polycistroniskt mRNA”. Eukaryotiska strukturgener transkriberas som monokistroniskt mRNA.
DNA-styrd RNA-syntes
Det finns tre steg som kännetecknar DNA-styrd RNA-syntes:
(1) Initiering genom att transkriptionsapparaten binder sig till DNA-mallen
(2) Förlängning av mRNA-kedjan
(3) Avslutning av mRNA-kedjan
Den bit mRNA som uppstår vid direkt transkription av det DNA som kodar för en ”gen” kallas för ”primärt transkript” och den genomgår en modifiering, ibland ganska omfattande, innan den kan översätta sitt budskap till protein.
Klassen av enzymer som syntetiserar RNA kallas RNA-polymeraser. De är alla multisubenhetskomplex som finns i alla celler och de katalyserar reaktionen:
(RNA)nresidues + 1 NTP === (RNA)n+1residues + PPi
Pyrofosfat hydrolyseras irreversibelt till 2 Pi och driver på så sätt reaktionen till höger. De enskilda nukleotider som avläses från DNA-mallsträngen transkriberas till nukleotiderna i motsvarande RNA, så att slutresultatet blir en enkelsträngad polymer, nämligen mRNA, vars nukleotider motsvarar exakt de komplementära nukleotiderna på DNA-strängen med det undantaget att överallt där ett ”A” förekommer i DNA-mallsträngen, förekommer ett ”U” i mRNA. (De möjligaNTPs är alltså ATP,CTP,GTP,UTP.)
Transkription i prokaryoter
Det mest studerade RNA-polymeraset är det från E.coli, så vi kommer att studera det som prototyp för RNA-polymeraserna. Holoenzymet är ett 449 kD-protein som består av ett ”kärnenzyme” och en ”s-subenhet”, och hela komplexet betecknas (core)s. Kärnenzymet styr polymeriseringsreaktionen och har 4 underenheter: kärnenzym = a2bb’w. De oorganiska jonerna Zn2+ (två av dem i b’-underenheten) och Mg2+ krävs för katalytisk aktivitet och enzymets tredimensionella struktur liknar en hand. Handens tumme kan föreställas gripa tag i en bit B-DNA som ligger i en kanal som representeras av handens böjda fingrar och handflata. Denna kanal är cylindrisk, med dimensioner i storleksordningen 25 A x 55 A. Dessa dimensioner tillåter en inpassning av cirka 16 baspar av B-DNA.
Handens struktur förekommer i andra enzymer som vi kommer att studera, inklusive DNA-polymeras och omvänt transkriptas. Du kan studera RNA-polymerasets handstruktur ytterligare genom att titta på T7 RNA-polymeras (se PDB nedan).
1ARO: T7 RNA-polymeras
Vi kommer att titta på transkriptionen ur genens synvinkel, som vi redan har nämnt är en tämligen otydlig enhet. Det står dock klart att det måste finnas en utgångspunkt för att en korrekt transkription ska kunna äga rum, och det är rimligt att inkludera denna som en del av genen, även om den inte transkriberas i sig själv. Problemet med initiering är alltså i själva verket en fråga om erkännande av en startpunkt. Men vilken av DNA:s två strängar fungerar som mall och hur väljer polymeraset?
Varje sträng kan tjäna som mall, men transkriptionen går alltid från 5′ änden av en DNA-sträng till 3′ änden. Den 3′-5′-sträng som tjänar som mall kallas ”antisense” eller icke-kodande sträng och 5′-3′-strängen (som har samma nukleotidsekvens, med undantag för ”U ”s i stället för ”T ”s, som det senare transkriberade mRNA:t) är ”sense” eller ”kodande” sträng. För att vara konsekventa och tydliga kommer vi att använda oss av konventionen att vår beskrivning av positionen längs en sekvens av nukleotider kommer att ske från synvinkelns synvinkel, eftersom detta är samma ordningsföljd som för det mRNA som transkriberas. Den del av genen som fungerar som initieringsplats kallas ”promotor” och den söks upp av RNA-polymeras-holoenzymet. Holoenzymet binder svagt till DNA, med en Kdissoc på cirka 10-7 M, och detta gör att det kan röra sig längs antisense-strängen på jakt efter promotorn. ssubenheten är specifik för sin promotorsekvens och en fast bindning av holoenzymet sker (Kdissoc på ca 10-14 M).
Promotorn känns igen av en cirka 40 bp nukleotidsekvens på 5′-sidan av initieringsstället, och inom denna sekvens finns två ”konserverade” sekvenser. En av dessa är 6 bp lång och är centrerad cirka 10 bp uppströms från transkriptionens startplats. Detta är ”Pribnow Box” och den har konsensussekvensen TATAAT.Den andra, mindre välbevarade sekvensen är centrerad cirka 35 bp uppströms och har konsensussekvensen TTGACA.Startplatsen anges med beteckningen +1 och är nästan alltid A eller G.
RNA-polymeras-holoenzym kontaktar promotorn ungefär i mitten av de två regionerna (-10 och -35) och kärnenzymet binder tätt till det dubbelsträngade DNA:t. Dess verkan är att smälta det dubbelsträngade DNA:t längs en sekvens på ungefär 11 bps, från -9 till +2. S-faktorn delas av samtidigt som transkriptionen påbörjas.
Det är de specifika s-faktorerna i en cell som avgör vilka gener som kommer att transkriberas. Individuella celltyper kännetecknas således av sina s-faktorer.
Kedjeförlängningen går i 5′–> 3′-riktningen och ”transkriptionsbubblan” (längden på det ”smälta” DNA:t) följer med RNA-polymeraset. Som en följd av detta blir det osmälta DNA:t överspolat framför bubblan och underspolat bakom bubblan. Topoisomeraserna verkar sedan för att avlasta de positiva och negativa superspiralerna. Det mRNA som produceras hybridiseras på en kort sträcka med DNA i nedströms position och existerar separat från DNA som en ”svans”, med fästpunkten i nedströms ände. RNA-polymeraset faller inte av DNA när det bearbetar det på grund av sin relativt fasta, men ospecifika, bindning på båda sidor av transkriptionsbubblan, som stabiliseras av att dess ”tumme” sveper sig runt DNA. Ungefär 20 till 50 nukleotider transkriberas per sekund vid 37 C och en nukleotid transkriberas felaktigt i ungefär var 104:e . Eftersom generna transkriberas upprepade gånger är denna felfrekvens inte alltför skadlig, särskilt när den kombineras med det faktum att det finns flera kodoner (”synonymer”) för varje aminosyra som sedan översätts och att fel i ett protein som innebär att en enda aminosyra ersätts med en annan aminosyra vanligtvis inte hindrar dess funktion.
Spontant avslutande av gentranskription signaleras av ”termineringssekvenser”.I E.coli är den slutliga signalen för att stoppa transkriptionen en serie av 4 – 10 A-T basparningar med As på mallsträngen. För varje A i denna region kommer mRNA-transkriptet att ha ett U. Strax uppströms från denna sekvens finns en region som är rik på Gand C-baser följt av en spacer av nukleotider och en annan region som är rik på G och C. I slutändan är det en sekvens som är rik på Gand C-baser. De två G,Crich-regionerna är sådana att den ena regionen kan överlagras på den andra genom en asymmetrisk operation på 180o . Detta förhållande mellan baspar runt ett rotationssymmetriskt centrum kallas en ”palindromisk sekvens”. Den nukleotidsträng som blir resultatet i 3′ änden av mRNA är sådan att en hårnålsslinga kan bildas, där Gs basparar sig med Cs och vice versa, och As med Us. Den mest terminala delen av 3′-ändan är en serie Us följt av en hydroxylgrupp. när slingan bildas pausar RNA-polymeraset vid termineringsstället. Den terminala oligo-U-halsen, som endast är svagt bunden till DNA-mallsträngen, förskjuts av den DNA-sträng som inte är mallen. mRNA-strängen är nu fri från DNA-mallen. Det finns dock många andra faktorer som påverkar den övergripande termineringsprocessen.
Nonspontan terminering av transkriptionen kräver ett ”rho factor”-protein, som också fungerar för att förbättra den spontana termineringseffektiviteten.rho factor känner igen en sekvens på den växande mRNA-kedjan, uppströms från termineringsstället, varefter den fäster och förflyttar sig längs kedjan i5′-3′-riktningen tills den når RNA-polymeraset som är pausat vid termineringsstället. Transkriptet frigörs från sin mallsträng genom att RNA-DNA-duplexen avvecklas av rho-faktorn.
Transkription i eukaryter:
Och även om transkriptionen är mycket lik den i prokaryoter är ”maskineriet” och kontrollsekvenserna för transkriptionen i eukaryoter mycket mer komplexa, och det finns många RNA-polymeraser.
Ribosomalt RNA (rRNA) utgör cirka 95 % av allt RNA och cirka 67 % av RNA:n i ribosomer. Resten av RNA omfattar transfer-RNA (tRNA), messengerRNA (mRNA) och andra typer som förekommer i mindre mängder, t.ex. ”små nukleära” RNA (snRNA) som är inblandade i mRNA-splicing och ”guide”-RNA som är inblandade i redigering av RNA. De två sistnämnda processerna sker vid översättningen efterDeepL i livscykeln för eukaryotiskt mRNA. Alla RNA kodas av DNA, och de olika typerna av RNA-polymeras hos eukaryoter återspeglar detta och det faktum att översättningen av mRNA till DNA hos eukaryoter sker utanför kärnan.
Precursorer till de flesta rRNA syntetiseras i nukleolerna med enzymet RNA-polymeras I. Prekursorer av mRNA syntetiseras i nukleoplasman av RNA-polymeras II medan RNA-polymeras III, som också finns i nukleoplasman, syntetiserar prekursorer av 5S-RNA, tRNA och andra RNA som finns både i kärnan och i cytoplasman. Mitokondrier har sina egna RNA-polymeraser, och dessa är analoga med kloroplast-RNA som finns i växter. Vi kommer att fokusera på RNA-polymeras II eftersom det är det som är inblandat i transkriptionen hos eukaryoter.
Du kan titta på strukturen av jästens RNA-polymeras II (se PDB nedan) när vi diskuterar dess struktur som en prototyp. Detta är stora enzymer med flera subenheter, där några av subenheterna är homologer till a-, b- och b’-subenheterna i det prokaryotiska RNA-polymeraset. enzymets övergripande form liknar den för det prokaryotiska RNA-polymeraset (och DNA-polymeraset), dvs. en hand med ett ”tumme”-motiv som flankerar en kanal som är tillräckligt stor för att innehålla ett stycke B-DNA (ca 25 Aw brett).
1ENO: Yeast RNA Polymerase II
Vi har ännu inte tagit hänsyn till kemin vid förlängningen av mRNA-kedjan, men det ska vi göra här. Kedjorna förlängs i riktning 5′–> 3′ genom nukleofil attack av den växande kedjans 3′-OH-grupp med a-fosfatet i det inkommande NTP.
Som hos prokaryoter börjar eukaryotisk transkription genom att erkänna promotorer. Det finns många kopior av rRNA-generna som styr rRNA-syntesen,alla med nästan identiska sekvenser. Denna redundans säkerställer en tillräcklig tillgång på rRNA som, som vi nämnde tidigare, utgör cirka 95 % av cellens RNA.Promotorerna för dessa nästan identiska gener är därför identiska, så RNA-polymeras I behöver bara känna igen en promotorsekvens. RNApolymeras I är dock artspecifikt (RNA poly II och III är inte artspecifika).
För att främja däggdjurs rRNA finns det ett ”core promoterelement” som sträcker sig från regionen -31 till +6 (observera att detta överlappar en region av genen som transkriberas) och ett ”uppströms promoterelement” som sträcker sig från -187 till -107.
För transkription av gener med RNA-polymeras III är promotorn ibland placerad i ett segment inom den transkriberade delen av genen, mellan +40 och +80, men kan också vara delvis uppströms eller helt uppströms från startplatsen.
RNA-polymeras II-promotorer och kontrollsekvenser
Promotorssekvenser för RNA-polymeras II är olika. Vi kan dela in dem i två klasser: de som finns i gener som producerar proteiner i ungefär samma takt i alla celler (”konstitutiva enzymer”) och de för gener vars produktionshastighet varierar kraftigt från en celltyp till en annan och beror på behoven hos en differentierad cell vid en viss tidpunkt (”inducerbara enzymer”).
Konstitutiva genpromoterelement:
GC-boxen: Detta är ett område som innehåller en eller flera kopior av sekvensen GGGCGG (eller dess komplement) på en plats uppströms från startplatsen, och det är analogt med de prokaryotiska promoterelementen.
Andra promotorelement finns också i regionen -50 till -110 uppströms från GC-boxen.
Promotorelement för selektivt uttryckta gener:
TATA-boxen: En region som är belägen vid cirka -25 till -30, som är rik på nukleotiderna ”A” och ”T” och som liknar Pribnow-boxen (TATAAT). Gener kan fortfarande transkriberas i närvaro av en defekt TATA-box och man tror att TATA-boxen är involverad i valet av startplats för transkription
CCAAT-boxen: Detta är en sekvens som ofta återfinns uppströms från TATA-boxen, belägen vid cirka -70-90. Dessa binder RNA-polymeras II samt andra proteiner som behövs för initiering av transkriptionen.
Kontrollsekvenser för strukturella gener:
Andra områden på kromosomen, vissa långt från startplatsen, kan påverka bindningen av RNA-polymeras II till promotorelement. Dessa genelement kallas ”enhancers” och ”silencers”. Proteiner som kallas ”aktivatorer” och ”repressorer” kan binda till enhancers och silencers och på så sätt påverka polymerasets bindning till promotorerna. Dessutom kan samma protein fungera som både aktivator och repressor, beroende på den specifika interaktionen (”dubbelverkande” transkriptionsfaktorer).
Rekrytering av RNA-polymeras II till promotorn:
Eukaryoter har inte ett enkelt protein som motsvarar s-faktorn i prokaryoter. Det finns snarare en uppsättning proteiner som tillsammans utför samma funktion som s-faktorn, och dessa är ”allmänna transkriptionsfaktorer” (”GTF”). Vi har redan tittat på strukturer för transkriptionsfaktorer när vi diskuteradeDNA-proteininteraktion i en tidigare föreläsning. I övrigt är de allmänna mekanismerna för initiering av transkriptionen likartade.
Det finns 6 GTF:er som krävs för en låg och oföränderlig basal transkriptionshastighet, och denna hastighet kan ökas genom medverkan av andraproteinfaktorer. Dessa GTF:er bildar ett ”preinitieringskomplex” som börjar när ”TATA-bindningsprotein” (”TBP”) binder till TATA-boxen (om det finns en sådan) i en promotor. Den specifika sekvens vid vilken det binder identifierar transkriptionens startplats. Som ett resultat av denna bindning förvrängs DNA:t genom knutar i båda ändarna av TATA-boxen. Andra GTF:er binder sigsuccessivt, följt av bindningen av RNA-polymeras. Slutligen binder de återstående GTF:erna.
1YTB: TBP/TATA Box-komplex
Efter att TBP (som är en komponent i TFIID) binder sig, är sekvensen för bindning som följer:
TFIIA
TFIIB
TFIIF
RNA PII
TFIIE
TFIIH
TFIIH har två viktiga enzymaktiviteter. Den första är en ATP-beroendehelikasaktivitet som hjälper till att bilda ett öppet komplex och den andra är en kinasaktivitet som resulterar i fosforylering av den största underenheten av RNA-polymeras II i dess C-terminala ände. Nu kan transkriptionens förlängningsprocess börja, och de olika GTF:erna (utom TFIIF) dissocieras från komplexet allteftersom förlängningen sker. TFIID förblir bunden till promotorn så att upprepad transkription kan ske när GTF:erna återförenas för att bilda preinitieringskomplexet.
Denna diskussion har fokuserat på RNA-polymeras II; olika transkriptionsfaktorer behövs för RNA-polymeraserna I och III. Alla tre kräver dock TBP.
Cellerna kontrollerar transkriptionen av varje gen individuellt. En unikkombination av silencers och enhancers för varje gen modulerar transkriptionstakten. Hur påverkar aktivator- och repressorproteiner som är bundna långt från promotorn transkriptionen av gener?
”Specificity protein 1” (Sp1) var den första humantranskriptionsfaktorn som hittades och som kunde känna igen en specifik GC-regulatorisk förstärkarsekvens. Detta protein har två intressanta moduler:
(1) En modul med 3 zinkfingrar i ena änden;
(2) En modul i motsatt ände med 2 diskreta segment som är rika på Gln.
Mutanter som inte har den glutaminrika änden kan binda till DNA men transkriptionen stimuleras inte. Därför måste den glutaminrika änden binda till något annat för att transkriptionen ska ske, och dessa är ”koaktivatorer”.De kallas också ”TBP-Assicuated Factors” eller ”TAFs” och det finns minst åtta av dem som är viktiga för transkriptionell aktivering. Dessa är inte basala faktorer (GTF) och de binder inte till specifika DNA-sekvenser. De binder snarare ivrigt till TBP och tillhandahåller flera ”dockningsplatser” för aktivatorerna. I denna mening är de ”anpassningsmolekyler”. En ”verktygslåda” av sådana adaptermolekyler ger en enorm mångfald av alternativ för att modulera transkriptionen av en agen. Om man utgår från vår tidigare jämförelse mellan GTF:s preinitieringskomplex och den prokaryotiska s-faktorn, skulle en bättre jämförelse vara mellan s-faktorn och hela komplexet av aktivator-koaktivator-basala preinitieringskomplex. När det gäller hur detta arrangemang modulerar eller påverkar transkriptionshastigheten, förmedlas det troligen främst genom en förvrängning av DNA som underlättar RNA-polymeras II:s förflyttning längs den kodande regionen.
Latchman (TRENDS in Biochemical Sciences Vol. 26 No.4 April 2001) har påpekat betydelsen av själva DNA-bindningsstället som spelar en nyckelroll i den intranskriptionella moduleringen. Samma transkriptionsfaktor kan anta olika former till följd av att den binder till olika platser. Konformationsförändringarna induceras av interaktionen mellan DNA och protein, vilket ökar flexibiliteten i spektrumet för kontroll av transkriptionen, eftersom ett protein kan fungera som en hel samling proteiner, var och en med sin egen effekt (aktivering, hämning eller ingen effekt).
För att föra detta ett steg längre kan man tänka sig att ett liknande fenomen kan inträffa när koaktivatorer binder till aktivatorer. Kanske olika konformationsförändringar induceras på samma sätt i det bundna proteinet beroende på typ av protein-proteininteraktion. Sådana konformationsförändringar kan då resultera i olika förmåga att modulera transkriptionen.
Aktiveringsdomänerna hos transkriptionsfaktorer är ofta glutaminrika, men andra är prolinrika eller sura. I vissa fall är hydrofoba rester insprängda bland de sura eller glutaminresterna och är viktiga för aktiveringen. Tjian (Cell, Vol. 77, 5-8, April 8, 1994) föreslår att hydrofoba krafter driver aktiveringsdomänernas kohesion med sina mål och att specificitet uppnås genom periodiciteten hos de kohesiva elementen.
Gener transkriberas med mätbara hastigheter endast om de korrekta aktivatorerna finns närvarande och kan övervinna effekterna av repressorerna.