Transskription
Transskription er overførsel af genetisk information fra DNA til RNA ved hjælp af DNA som skabelon. Proteinsyntesen sker i ribosomer.
Hvad er et gen? På et niveau er et gen en ordnet streng af nukleotider, der koder for et polypeptid. Sådanne gener er “strukturelle” gener. Vi ved også, at gener også kan kode for RNA, herunder messenger RNA (mRNA), transfer RNA (tRNA), ribosomalt RNA (rRNA) samt andre RNA-typer. Men der er noget, der skal tænde og afslutte genekspressionen og regulere den. De regulerende sekvenser, som kan være “promotorer” eller “enhancers/silencers”, kan være placeret langt væk fra de kodende regioner. Vores opfattelse af et gen må derfor nu også omfatte tanken om separate regioner på et kromosom. Hvad nu, hvis de oplysninger, der er transskriberet til mRNA, ikke afspejler det endelige protein, før det er blevet yderligere modificeret? Dette er “posttranskriptionel modifikation”. Nu bliver begrebet gen endnu mere uklart. Hvad nu, hvis der er “overlappende” kodningsområder? Det er klart, at vores definition af et gen ikke vil være enkel.
Funktionelt set kan vi dog beskrive et gen som havende en særskilt kodningsregion og en særskilt reguleringsregion, hvor sidstnævnte styrer den hastighed, hvormed DNA transskriberes til mRNA. Vi vil se, at de regulatoriske enheder består af DNA-“motiver”, og at hvert motiv skal være besat af et regulatorisk protein, hvis et gen skal reguleres korrekt. Ikke alene skal proteinet være passende fastgjort, men proteinerne skal også passe sammen med proteiner, der binder sig til andre motiver i nærheden, på samme måde som puslespilsbrikker passer sammen. Og der er kun én korrekt måde, hvorpå alting skal passe sammen. Så det er ikke bare et simpelt spørgsmål om, at DNA styrermRNA-syntesen, som så styrer proteinsyntesen; proteiner er iboende involveret i reguleringen af proteinproduktionen på transkriptionsniveau.Dette kan blive et mareridt, hvis man begynder at tænke på reguleringen af produktionen af regulerende proteiner.
Vi må også overveje en vigtig forskel mellem eukaryoter og prokaryoter med hensyn til transkriptionen af strukturelle, eller protein-kodende,gener. Hos eukaryoter transskriberes generne enkeltvis, mens gener med beslægtede funktioner (“operoner”) hos prokaryoter kan transskriberes sammen. Som eksempel kan nævnes Lac-operonet, der omfatter tre proteinkodende gener samt deres kontrolsekvenser. Operonet er transskriberet som en enkelt enhed som et “polycistronisk mRNA”. Eukaryotiske strukturelle gener transskriberes som monokistronisk mRNA.
DNA-dirigeret RNA-syntese
Der er tre trin, der karakteriserer DNA-dirigeret RNA-syntese:
(1) Initiering ved binding af transkriptionsapparatet til DNA-skabelonen
(2) Forlængelse af mRNA-kæden
(3) Afslutning af mRNA-kæden
Det stykke mRNA, der er resultatet af den direkte transskription af det DNA, der koder for et “gen”, kaldes det “primære transkript”, og det undergår modifikationer, nogle gange ret omfattende, før det kan oversætte sit budskab til protein.
Klassen af enzymer, der syntetiserer RNA’er, er kendt som RNA-polymeraser. De er alle multisubunit-komplekser, der findes i alle celler, og de katalyserer reaktionen:
(RNA)nresidues + 1 NTP === (RNA)n+1 residues + PPi
Pyrophosphat hydrolyseres irreversibelt til 2 Pi og driver dermed reaktionen til højre. De enkelte nukleotider, der aflæses fra DNA-skabelonstrengen, transskriberes til nukleotiderne i det tilsvarende RNA, så det endelige resultat er en enkeltstrenget polymer, nemlig mRNA, hvis nukleotider svarer nøjagtigt til de komplementære nukleotider på DNA-strengen med den undtagelse, at der overalt, hvor der forekommer et “A” i DNA-skabelonstrengen, forekommer et “U” i mRNA. (De muligeNTP’er er således ATP,CTP,GTP,UTP.)
Transskription i prokaryoter
Den mest undersøgte RNA-polymerase er den fra E.coli, så vi vil studere den som prototype for RNA-polymeraser. Holoenzymet er et 449 kD protein, der består af et “kerneenzym” og en “s-underenhed”, og hele komplekset betegnes (core)s. Kerneenzymet styrer polymerisationsreaktionen, og det har 4 underenheder: kerneenzym = a2bb’w. De uorganiske ioner Zn2+ (to af dem i b’underenheden) og Mg2+ er nødvendige for den katalytiske aktivitet, og enzymets tredimensionelle struktur ligner en hånd. Man kan forestille sig, at håndens tommelfinger griber fat i et stykke B-DNA, der ligger i en kanal, som repræsenteres af de buede fingre og håndfladen. Denne kanal er cylindrisk med dimensioner i størrelsesordenen 25 A x 55 A. Disse dimensioner tillader en plads til ca. 16 basepar af B-DNA.
Håndstrukturen forekommer i andre enzymer, som vi vil studere, herunder DNA-polymerase og omvendt transkriptase. Du kan studere RNA-polymerasens håndstruktur yderligere ved at se på T7 RNA-polymerase (se PDB nedenfor).
1ARO: T7 RNA-polymerase
Vi vil se på transkription ud fra genets synsvinkel, som vi allerede har nævnt er en ret tvetydig enhed. Ikke desto mindre er det klart, at der skal være et udgangspunkt, for at der kan finde en korrekt transskription sted, og det er rimeligt at medregne dette som en del af genet, selv om det ikke selv bliver transskriberet. Problemet med initiering er altså i virkeligheden et problem med anerkendelse af et startpunkt. Men hvilken af de to DNA-strenge tjener som skabelon, og hvordan vælger polymerasen den?
Enten af de to strenge kan tjene som skabelon, men transkriptionen foregår altid fra 5′-enden af en DNA-streng til 3′-enden. Den 3′-5′-streng, der tjener som skabelon, kaldes “antisense”-strengen eller den ikke-kodende streng, og 5′-3′-strengen (som har den samme nukleotidsekvens, bortset fra “U “s i stedet for “T “s, som det efterfølgende transskriberede mRNA) er “sense”-strengen eller den “kodende” streng. For at være konsekvente og klare vil vi anvende den konvention, at vores beskrivelse af positionen langs en sekvens af nukleotider vil være ud fra synspunktet for sense-strengen, da denne er den samme rækkefølge som den for det mRNA, der transskriberes. Den del af genet, der tjener som initieringssted, kaldes “promotor”, og den søges af RNA-polymerase-holoenzymet. Holoenzymet binder sig svagt til DNA med en Kdissoc på ca. 10-7 M, og det giver det mulighed for at bevæge sig langs antisense-strengen på jagt efter promotoren. ss-underenheden er specifik for sin promotorsekvens, og der sker en tæt binding af holoenzymet (Kdissoc på ca. 10-14 M).
Promotoren genkendes af en ca. 40 bp nukleotidsekvens på 5′-siden af initieringsstedet, og inden for denne sekvens findes to “konserverede” sekvenser. Den ene af disse er 6 bp lang og er centreret ca. 10 bps opstrøms fra startstedet for transkriptionen. Det er “Pribnow Boxen”, og den har konsensussekvensen TATAAT.Den anden, mindre velkonserverede sekvens er centreret ca. 35 bp opstrøms og har konsensussekvensen TTGACA.Startstedet er angivet med notationen +1 og er næsten altid A eller G.
RNA-polymerase-holoenzym kontakter promotoren omtrent i midten af de to regioner (-10 og -35), og kerneenzymet binder sig tæt til duplex-DNA’et. dets virkning består i at smelte det dobbeltstrengede DNA langs en sekvens på ca. 11 bps, fra -9 til +2. s-faktoren spaltes af i takt med, at transkriptionen begynder.
Det er de specifikke s-faktorer i en celle, der bestemmer, hvilke gener der vil blive transskriberet. De enkelte celletyper er således karakteriseret ved deres s-faktorer.
Kædeforlængelsen foregår i 5′–> 3′-retningen, og “transkriptionsboblen” (længden af “smeltet” DNA) bevæger sig sammen med RNA-polymerasen. Som følge heraf bliver det usmeltede DNA overviklet foran boblen og underviklet bag boblen. Topoisomeraser virker derefter for at afspænde de positive og negative supercoils. Det mRNA, der produceres, erhybridiseret i en kort længde til DNA’et i den nedstrømsliggende position og eksisterer adskilt fra DNA’et som en “hale”, idet fastgørelsespunktet er i den nedstrømsliggende ende. RNA-polymerasen falder ikke af DNA’et, mens den bearbejder det, fordi den bindes relativt tæt, men uspecifikt, på begge sider af transkriptionsboblen og stabiliseres af sin “tommelfinger”, der er viklet om DNA’et. Der transskriberes ca. 20 til 50 nukleotider pr. sekund ved 37 C, og der transskriberes et nukleotid forkert i ca. hver 104 . Da generne transskriberes gentagne gange, er denne fejlfrekvens ikke alt for skadelig, især når den kombineres med det faktum, at der er flere kodoner (“synonymer”) for hver aminosyre, der efterfølgende oversættes, og at fejl i et protein, der består af en enkelt aminosyresubstitution, normalt ikke hindrer dets funktion.
Spontan afslutning af gentranskriptionen signaleres af “terminationssekvenser”.I E.coli er det endelige signal til at stoppe transkriptionen en serie af 4 – 10 A-T baseparringer med As på skabelonstrengen. For hvert A i denne region vil mRNA-transkriptet have et U. Lige opstrøms fra denne sekvens er der et område med mange Gand C-baser efterfulgt af en spacer af nukleotider og et andet område med mange G- og C-baser. De to G,Crich-regioner er af en sådan art, at den ene region kan overlejres på den anden ved en asymmetrisk operation på 180o . Dette forhold mellem baseparrene omkring et rotationssymmetrisk centrum kaldes en “palindromisk sekvens”. Den deraf følgende række af nukleotider i 3′-enden af mRNA’et er af en sådan art, at der kan dannes en hårnålesløjfe, hvor Gs-baseparret danner basepar med Cs og omvendt, og As med Us. Den mest terminale del af 3′-enden er en række Us efterfulgt af en hydroxylgruppe.Mens løkken dannes, holder RNA-polymerasen pause ved termineringsstedet. Den terminale oligo-U-hale, som kun er svagt bundet til DNA-template-strengen, fortrænges af den ikke-template-DNA-streng. mRNA-strengen er nu fri af DNA-templaten. Der er imidlertid talrige andre faktorer, som påvirker den samlede termineringsproces.
Nonspontan terminering af transkription kræver et “rho-faktor”-protein, som også fungerer til at forbedre den spontane termineringseffektivitet.rho-faktoren genkender en sekvens på den voksende mRNA-kæde opstrøms for termineringsstedet, hvorefter den lægger sig fast og bevæger sig langs kæden i5′-3′-retningen, indtil den når RNA-polymerasen, der er sat på pause ved termineringsstedet. Transkriptet frigøres fra sin skabelonstreng ved at rho-faktoren afvikler RNA-DNA-duplexet.
Transskription i eukaryoter:
Mens den ligner meget den i prokaryoter, er “maskineriet” og kontrolsekvenserne for transkription i eukaryoter meget mere komplekse, og der er mange RNA-polymeraser.
Ribosomalt RNA (rRNA) udgør omkring 95% af alt RNA og omkring 67% af RNA’et i ribosomer. Resten af RNA omfatter transfer-RNA (tRNA), messengerRNA (mRNA) og andre typer, der findes i mindre mængder, som f.eks. “smånucleære” RNA’er (snRNA’er), der er involveret i mRNA-splejsning, og “guide”-RNA’er, der er involveret i redigering af RNA. De to sidstnævnte processer finder sted i den eukaryote mRNA’s livscyklus i oversættelsen efterDeepL. Alle RNA’er er kodet af DNA, og de forskellige typer RNA-polymerase hos eukaryoter afspejler dette og det faktum, at oversættelse af mRNA til DNA hos eukaryoter sker uden for kernen.
Precursorer af de fleste rRNA’er syntetiseres i kernecellerne med enzymet RNA-polymerase I. Forløbere for mRNA syntetiseres i nukleoplasmaet af RNApolymerase II, mens RNA-polymerase III, der også befinder sig i nukleoplasmaet, syntetiserer forløbere for 5S RNA, tRNA’er og andre RNA’er, der findes både i kernen og i cytoplasmaet. Mitokondrier har deres egne RNA-polymeraser, og disse er analoge til chloroplast-RNA’er, som findes i planter. Vi vil fokusere på RNA-polymerase II, da det er den, der er involveret i transkriptionen i eukaryoter.
Du kan se på strukturen af RNA-polymerase II fra gær (se PDB nedenfor), mens vi drøfter dens struktur som prototype. Der er tale om store enzymer med flere underenheder, hvor nogle af underenhederne er homologe af a-, b- og b’-underenhederne i den prokaryote RNA-polymerase. enzymets overordnede form ligner den for den prokaryote RNA-polymerase (og DNA-polymerase), nemlig en hånd med et “tommelfinger”-motiv, der flankerer en kanal, der er stor nok til at indeholde et stykke B-DNA (ca. 25 Aw bredt).
1ENO: Yeast RNA Polymerase II
Vi har endnu ikke overvejet kemien i forbindelse med forlængelsen af mRNA-kæden, men det vil vi gøre her. Kæderne forlænges i retning 5′–> 3′ ved nukleofilt angreb af den voksende kædes 3’OH-gruppe af a-fosfatet i den indkommende NTP.
Som hos prokaryoter begynder eukaryote transkription ved genkendelse af promotorer. Der findes mange kopier af de rRNA-gener, der styrer rRNA-syntesen,alle med næsten identiske sekvenser. Denne redundans sikrer en tilstrækkelig forsyning af rRNA, der som tidligere nævnt udgør ca. 95% af det cellulære RNA.Promotorerne for disse næsten identiske gener er derfor identiske, så RNApolymerase I skal kun genkende én promotorsekvens. RNApolymerase I er dog artsspecifik (RNA-poly II og III er ikke artsspecifikke).
For promotor af pattedyrs rRNA er der et “core promoterelement”, der spænder over området -31 til +6 (bemærk, at dette overlapper et område af genet, der transskriberes) og et “upstream promoterelement”, der spænder over -187 til -107.
For transkription af gener ved RNA-polymerase III er promotoren undertiden placeret i et segment inden for den transskriberede del af genet mellem +40 og +80, men kan også være delvist opstrøms eller helt opstrøms fra startstedet.
RNA-polymerase II-promotorer og kontrolsekvenser
Promotorsekvenser for RNA-polymerase II er forskelligartede. Vi kan opdele dem i to klasser: dem, der findes i gener, som producerer proteiner med nogenlunde samme hastighed i alle celler (“konstitutive enzymer”), og dem til gener, hvis produktionshastighed varierer meget fra en celletype til en anden og afhænger af en differentieret celles behov på et givet tidspunkt (“inducerbare enzymer”).
Konstitutive genpromotorelementer:
GC-boksen: Dette er et område, der indeholder en eller flere kopier af sekvensen GGGCGG (eller dens supplement) i et sted opstrøms fra startstedet, og det svarer til de prokaryote promotorelementer.
Der findes også andre promotorelementer i regionen -50 til -110 opstrøms fra GC-boksen.
Selektivt eksprimerede genpromotorelementer:
TATA-boksen: En region, der ligger omkring -25 til -30, som er rig på nukleotiderne “A” og “T”, og som ligner Pribnow-boksen (TATAAT). Gener kan stadig transskriberes i tilstedeværelsen af en defekt TATA-boks, og man mener, at TATA-boksen er involveret i valget af transkriptionens startsted
CCAAT-boksen : Dette er en sekvens, der ofte findes opstrøms for TATA-boksen, og som er placeret omkring -70 til -90. Disse binder RNA polymerase II samt andre proteiner, der er nødvendige for initiering af transkriptionen.
Kontrolsekvenser for strukturelle gener:
Andre regioner på kromosomet, hvoraf nogle ligger langt fra startstedet, kan påvirke bindingen af RNA-polymerase II til promotorelementer. Disse genelementer kaldes “enhancers” og “silencers”. Proteiner, der kaldes “aktivatorer” og “repressorer”, kan binde sig til enhancers og silencers og dermed påvirke polymerasebindingen til promotorerne. Desuden kan det samme protein fungere som både aktivator og repressor, afhængigt af den specifikke interaktion (“dobbeltvirkende” transkriptionsfaktorer).
Rekruttering af RNA-polymerase II til promotoren:
Eukaryoter har ikke et simpelt protein, der svarer til s-faktoren i prokaryoter. Der findes snarere en række proteiner, der tilsammen udfører den samme funktion som s-faktoren, og disse er de “generelle transkriptionsfaktorer” (“GTF’er”). Vi har allerede set på strukturer af transkriptionsfaktorer, da vi diskuteredeDNA-proteininteraktion i en tidligere forelæsning. Ellers er de generelle mekanismer for transkriptionsinitiering ens.
Der er 6 GTF’er, som er nødvendige for en lav og invariabel basal transkriptionshastighed, og denne hastighed kan øges ved deltagelse af andre proteinfaktorer. Disse GTF’er danner et “præinitieringskompleks”, der begynder, når “TATA-bindingsprotein” (“TBP”) binder sig til TATA-boksen (hvis der er en) i en promotor. Den specifikke sekvens, som det binder sig til, identificerer transkriptionens startsted. Som følge af denne binding forvrængesDNA’et ved at knække i begge ender af TATA-boksen. Andre GTF’er bindersuccessivt, efterfulgt af binding af RNA-polymerase. Til sidst binder de resterendeGTF’er.
1YTB: TBP/TATA Box-kompleks
Efter binding af TBP (som er en komponent af TFIID) er bindingssekvensen følgende:
TFIIA
TFIIB
TFIIF
RNA PII
TFIIE
TFIIH
TFIIH har to vigtige enzymaktiviteter. Den første er en ATP-afhængighelikaseaktivitet, der hjælper med at danne et åbent kompleks, og den anden er en kinaseaktivitet, der resulterer i fosforylering af den største underenhed af RNA-polymerase II ved dens C-terminale ende. Nu kan transkriptionselongationsprocessen begynde, idet de forskellige GTF’er (undtagen TFIIF) dissocieres fra komplekset, efterhånden som elongationen finder sted. TFIID forbliver bundet til promotoren, så gentagen transkription kan finde sted, efterhånden som GTF’erne samles igen for at danne præinitiationskomplekset.
Denne diskussion har fokuseret på RNA-polymerase II; der er behov for forskellige transkriptionsfaktorer for RNA-polymerase I og III. Alle tre kræver dog TBP.
Cellerne kontrollerer transkriptionen af hvert enkelt gen individuelt. En unik kombination af silencers og enhancers for hvert gen modulerer transkriptionshastigheden. Hvordan påvirker aktivator- og repressorproteiner, der er bundet langt fra promotoren, genernes transkription?
“Specificity protein 1” (Sp1) var den første humantranskriptionsfaktor, der blev fundet, og som kunne genkende en specifik GC-regulerende forstærkersekvens. Dette protein har to interessante moduler:
(1) Et modul med 3 zinkfingre i den ene ende;
(2) Et modul i den modsatte ende med 2 diskrete segmenter, der er rige på Gln.
Mutanter, der ikke har den glutaminrige ende, kan binde til DNA, mentranskriptionen stimuleres ikke. Derfor skal den glutaminrige ende binde sig til noget andet for at transkriptionen kan finde sted, og disse er “coactivators”.De kaldes også “TBP-Assicuated Factors” eller “TAF’er”, og der er mindst otte af dem, som er vigtige for transkriptionel aktivering. Det er ikke basale faktorer (GTF’er), og de binder ikke til specifikke DNA-sekvenser. De binder snarere ivrigt til TBP og sørger for flere “dockingsteder” for aktivatorerne. I denne forstand er de “adaptor-molekyler”. En “værktøjskasse” af sådanne adaptormolekyler giver en enorm mangfoldighed af muligheder for at modulere transkriptionen af agen. Så i forlængelse af vores tidligere sammenligning af GTF’ernes præinitieringskompleks med den prokaryote s-faktor ville en bedre sammenligning være mellem s-faktoren og hele komplekset af aktivator-coaktivator-basalt præinitieringskompleks. Med hensyn til, hvordan dette arrangement modulerer eller påvirker transkriptionshastigheden, er det sandsynligvis primært formidlet af en forvrængning af DNA, der letter RNA-polymerase II’s bevægelse langs den kodende region.
Latchman (TRENDS in Biochemical Sciences Vol. 26 No.4 April 2001) har påpeget betydningen af selve DNA-bindingsstedet, som spiller en nøglerolle i den intranskriptionelle modulering. Den samme transkriptionsfaktor kan antage forskellige konformationer, hvis den binder sig til forskellige steder. Konformationsændringerne induceres af DNA-protein-interaktionen, hvilket øger fleksibiliteten i spektret for kontrol af transkriptionen, da ét protein kan virke som en hel samling proteiner, der hver især har deres egen virkning (aktivering, hæmning eller ingen virkning).
For at føre dette et skridt videre kan man forestille sig, at et lignende fænomen kan forekomme, når coaktivatorer binder sig til aktivatorer. Måske induceres der på samme måde forskellige konformationsændringer i det bundne protein afhængigt af typen af protein-protein-interaktion. Sådanne konformationsændringer kan så resultere i forskellig evne til at modulere transkriptionen.
Transkriptionsfaktorers aktiveringsdomæner er ofte glutaminrige, men andre er prolinrige eller sure. I nogle tilfælde er hydrofobiske rester spredt ud blandt de sure eller glutaminrester og er vigtige for aktivering. Tjian (Cell, Vol. 77, 5-8, April 8, 1994) foreslår, at hydrofobe kræfter driver aktiveringsdomæners kohæsion med deres mål, og at specificitet opnås ved periodiciteten af de kohæsive elementer.
Gener transskriberes kun med målbare hastigheder, hvis de korrekte aktivatorer er til stede og er i stand til at overvinde virkningerne af repressorer.