Transkripce
Transkripce je přenos genetické informace z DNA do RNA pomocí DNAjako předlohy. Syntéza bílkovin probíhá v ribozomech.
Co je to gen? Na jedné úrovni je gen uspořádaný řetězec nukleotidů, kterýkóduje polypeptid. Takové geny jsou „strukturní“ geny. Víme také, že geny mohou kódovat také RNA, včetně messengerové RNA (mRNA), transferové RNA (tRNA),ribozomální RNA (rRNA), jakož i další typy RNA. Něco však musí genovou expresi zapínat a ukončovat a také regulovat. Regulační sekvence, které mohou být „promotory“ nebo „zesilovače/zeslabovače“, mohou být umístěny daleko od kódujících oblastí. Náš pohled na gen tedy nyní musí zahrnovat představu oddělených oblastí chromozomu. Co když informace zapsaná do mRNA neodráží výsledný protein, dokud není dále modifikován? To je „posttranskripční modifikace“. Nyní se pojem genu stává ještě nejasnějším. Co když existují „překrývající se“ kódující oblasti? Je zřejmé, že naše definice genu nebude jednoduchá.
Funkčně však můžeme gen popsat tak, že má odlišnou kódující oblast a odlišnou regulační oblast, která řídí rychlost přepisu DNA do mRNA. Uvidíme, že regulační jednotky se skládají z „motivů“ DNA a že každý motiv musí být obsazen regulačním proteinem, má-li být gen správně regulován. Nejenže musí dojít k vhodnému připojení proteinu, ale všechny proteiny do sebe musí zapadat spolu s proteiny, které se vážou na jiné blízké motivy tak, jak do sebe zapadají dílky skládačky. A existuje pouze jeden správný způsob, jak do sebe vše zapadá. Nejde tedy jen o prostou záležitost, kdy DNA řídí syntézumRNA, která pak řídí syntézu proteinů; proteiny jsou neodmyslitelně zapojeny do regulace produkce proteinů na úrovni transkripce. to se může stát noční můrou, pokud začnete přemýšlet o regulaciprodukce regulačních proteinů.
Musíme také vzít v úvahu důležitý rozdíl mezi eukaryoty aprokaryoty, pokud jde o transkripci strukturních, neboli protein kódujících,genů. U eukaryot jsou geny přepisovány jednotlivě, zatímco uprokaryot mohou být geny s příbuznými funkcemi („operony“) přepisovány společně. Jako příklad lze uvést operon Lac, který zahrnuje tři geny kódující proteiny a jejich řídicí sekvence. Operon je přepisován jako jeden celek jako „polycistronní mRNA“. Eukaryotické strukturní geny jsou přepisovány jako monocistrická mRNA.
Syntéza RNA řízená DNA
Existují tři kroky, které charakterizují syntézu RNA řízenou DNA:
(1) Iniciace vazbou transkripčního aparátu na předlohu DNA
(2) Prodloužení řetězce mRNA
(3) Ukončení řetězce mRNA
Kus mRNA, který je výsledkem přímé transkripce DNA kódující „gen“, se nazývá „primární transkript“ a prochází modifikací, někdy poměrně rozsáhlou, než může přeložit své sdělení do proteinu.
Třída enzymů, které syntetizují RNA, se nazývá RNA polymerázy. Jsou to všechno vícesložkové komplexy, které jsou přítomny ve všech buňkách a katalyzují reakci:
(RNA)nzbytků + 1 NTP === (RNA)n+1 zbytků + PPi
Pyrofosfát je nevratně hydrolyzován na 2 Pi, čímž se tato reakce řídí doprava. Jednotlivé nukleotidy, které jsou odečteny z templátového vlákna DNA, jsou přepsány do nukleotidů odpovídající RNA, takže konečným výsledkem je jednovláknový polymer, konkrétně mRNA, jejíž nukleotidy přesně odpovídají komplementárním nukleotidům na vlákně DNA s tou výjimkou, že všude, kde se v templátovém vlákně DNA objeví „A“, se v mRNA objeví „U“. (MožnéNTP jsou tedy ATP,CTP,GTP,UTP.)
Transkripce u prokaryot
Nejlépe prozkoumaná RNA polymeráza je ta z E.coli, proto ji budeme studovat jako prototyp RNA polymeráz. Holoenzym je protein o hmotnosti 449 kDsložený z „jádra enzymu“ a „podjednotky s“ a celý komplex se označuje (core)s. Jádrový enzym řídí polymerační reakci a má 4 podjednotky: jádrový enzym = a2bb’w. Anorganické ionty Zn2+ (dva z nich v b’podjednotce) a Mg2+ jsou nutné pro katalytickou aktivitu atřídimenzionální struktura enzymu připomíná ruku. Palec ruky si lze představit jako uchopení kousku B DNA, který leží v kanálu znázorněném zakřivenými prsty a dlaní ruky. Tento kanál jecylindrický, s rozměry řádově 25 A x 55 A. Tyto rozměry umožňují, aby se do něj vešlo asi 16 párů bází B DNA.
Struktura „ruky“ se objevuje i u dalších enzymů, které budeme studovat, včetně DNA polymerázy a reverzní transkriptázy. Ruční strukturu RNA polymerázy můžete dále studovat, když se podíváte na T7 RNA polymerázu (viz PDB níže).
1ARO: T7 RNA polymeráza
Na transkripci se podíváme z pohledu genu, o kterém jsme se již zmínili, že je poměrně nejednoznačnou entitou. Nicméně je jasné, že pro správnou transkripci musí existovat výchozí bod, a je rozumné jej zahrnout jako součást genu, i když se sám nepřepisuje. Problém iniciace je tedy ve skutečnosti problémem rozpoznání výchozího bodu. Které ze dvou vláken DNA však slouží jako templát a jak si polymeráza vybere?
Každé z těchto vláken může sloužit jako templát, ale transkripce vždy probíhá od 5′ konce vlákna DNA k 3′ konci. Vlákno 3′-5′, které slouží jako templát, se nazývá „antisense“ neboli nekódující vlákno a vlákno 5′-3′ (které má stejnou sekvenci nukleotidů, s výjimkou „U“ místo „T“, jako následně přepisovaná mRNA) je „sense“ neboli „kódující“ vlákno. Abychom byli důslední a jasní, budeme používat konvenci, že náš popis polohy podél sekvence nukleotidů bude z pohledu smyslového vlákna, protože toto je stejné uspořádání jako u přepisované mRNA. Část genu, která slouží jako iniciační místo, se nazývá „promotor“ a je vyhledávána holoenzymem RNA polymerázy. Holoenzym se slabě váže na DNA s Kdissoc asi 10-7 M, což mu umožňuje pohybovat se podél antisense vlákna a hledat promotor. Podjednotka je specifická pro svou promotorovou sekvenci a dochází k těsné vazbě holoenzymu (Kdissoc asi 10-14 M).
Promotor je rozpoznáván přibližně 40 bp nukleotidovou sekvencí na 5′ straně iniciačního místa a uvnitř této sekvence jsou dvě „konzervované“ sekvence. Jedna z nich má délku 6 bp a je soustředěna asi 10 bps proti proudu od počátečního místa transkripce. Jedná se o „Pribnow Box“ a má konsenzuální sekvenci TATAAT.Druhá, méně konzervovaná sekvence je soustředěna asi 35 bp před začátkem transkripce a má konsenzuální sekvenci TTGACA.Startovací místo je označeno zápisem +1 a je téměř vždy A nebo G.
Holoenzym polymerázy RNA kontaktuje promotor zhruba ve středech obou oblastí (-10 a -35) a jádro enzymu se pevně váže na duplex DNA. jeho činnost spočívá v tavení dvouvláknové DNA podél sekvence o délce zhruba 11 bps, od -9 do +2. Faktor s se odštěpí při zahájení transkripce.
Jsou to specifické s faktory v buňce, kteréurčují, které geny budou přepisovány. Jednotlivé typy buněk jsou tedy charakterizovány svými s faktory.
Elongace řetězce probíhá ve směru 5′–> 3′ a „transkripční bublina“ (délka „roztavené“ DNA) putuje s RNA polymerázou. V důsledku toho je neroztavená DNA převinuta před bublinou a podvinuta za bublinou. Topoizomerázy pak působí na uvolnění pozitivních a negativních superzávitů. Vzniklá mRNA je na krátkou dobu hybridizována s DNA v dolní části řetězce a existuje odděleně od DNA jako „ocásek“, jehož místo připojení se nachází na dolním konci řetězce. RNA polymeráza při zpracování neodpadává z DNA, protože je poměrně pevně, ale nespecificky vázána na obou stranách transkripční bubliny, stabilizované jejím „palcem“ obepínajícím DNA. Při teplotě 37 C se přepisuje asi 20 až 50 nukleotidů za sekundu a jeden nukleotid je chybně přepsán asi na každých 104 . Vzhledem k tomu, že geny jsou přepisovány opakovaně, není tato chybovost příliš škodlivá, zejména ve spojení se skutečností, že pro každou následně překládanou aminokyselinu existuje více kodonů („synonym“) a že chyby v záměně jedné aminokyseliny v proteinu obvykle nebrání jeho funkci.
Spontánní ukončení transkripce genu je signalizováno „terminačními sekvencemi“. V E.coli je konečným signálem k zastavení transkripce řada 4 – 10 párů bází A-T s Asna templátovém vlákně. Pro každé A v této oblasti bude mít mRNA transkript U.Těsně před touto sekvencí je oblast bohatá na báze Gand C, po níž následuje mezerník nukleotidů a další oblast bohatá na G aC. Obě oblasti G,Crich jsou takové, že jedna oblast může být překryta druhou operací asymetrie 180o . Tento vztah párů bází kolem centra rotační symetrie se nazývá „palindromická sekvence“. Výsledný řetězec nukleotidů na 3′ konci mRNA je takový, že může vzniknout vlásenková smyčka, kde se báze Gs páruje s Cs a naopak a As s Us. Nejkonečnější část 3′ konce tvoří řada Us následovaná hydroxylovou skupinou.Jak se smyčka tvoří, RNA polymeráza se zastaví v místě ukončení. Koncový ocas oligo-U, který je jen slabě vázán na templátové vlákno DNA, je vytlačen netemplátovým vláknem DNA. nyní je vlákno mRNA bez templátu DNA. Existuje však řada dalších faktorů, které ovlivňují celkový proces terminace.
Nespontánní terminace transkripce vyžaduje protein „rho faktor“, který rovněž funguje pro zlepšení účinnosti spontánní terminace. rho faktor rozpoznává sekvenci na rostoucím řetězci mRNA před místem terminace, po které se připojí a pohybuje se podél řetězce ve směru 5′-3′, dokud nedosáhne RNA polymerázy, která je zastavena v místě terminace. Transkript je uvolněn ze svého templátového řetězce rozvázáním duplexu RNA-DNA faktorem rho.
Transkripce u eukaryot:
Přestože je velmi podobná transkripci u prokaryot, „mašinérie“ a kontrolní sekvence transkripce u eukaryot je mnohem složitější a existuje zde mnoho RNA polymeráz.
Ribosomální RNA (rRNA) tvoří asi 95 % veškeré RNA a asi 67 % RNA v ribozomech. Zbytek RNA zahrnuje transferovou RNA (tRNA), messengerRNA (mRNA) a další typy přítomné v menším množství, jako jsou „maléjaderné“ RNA (snRNA) zapojené do sestřihu mRNA a „vodicí“ RNA, které se podílejí na úpravě RNA. Tyto dva posledně jmenované procesy probíhají poDeepL translaci v životním cyklu eukaryotické mRNA. Všechny RNA jsou kódovány DNA a různé typy RNA polymerázy u eukaryot odrážejí tuto skutečnost a fakt, že u eukaryot dochází k translaci mRNA do DNA mimo jádro.
Prekurzory většiny rRNA jsou syntetizovány v jádře pomocí enzymu RNApolymeráza I. V jádře je syntetizována většina rRNA. Prekurzory mRNA jsou syntetizovány v nukleoplasmě pomocí RNApolymerázy II, zatímco RNApolymeráza III, rovněž v nukleoplasmě, syntetizujeprekurzory 5S RNA, tRNA a dalších RNA nacházejících se jak v jádře, tak vcytoplasmě. Mitochondrie mají vlastní RNA polymerázy a ty jsou analogické chloroplastovým RNA, které se vyskytují u rostlin. Zaměříme se na RNA polymerázu II, protože právě ona se podílí na transkripci u eukaryot.
Můžete se podívat na strukturu kvasinkové RNA polymerázy II (viz PDB níže), protože její strukturu probíráme jako prototyp. Jedná se o velké, vícesubjednotkové enzymy, přičemž některé z podjednotek jsou homology podjednotek a,b,a b‘ u prokaryotické RNApolymerázy.celkový tvar enzymu je podobný tvaru prokaryotické RNApolymerázy ( a DNA polymerázy), a to tvar ruky s motivem „palce“, který lemuje kanál dostatečně velký na to, aby pojal kus B-DNA (asi 25 A široký).
1ENO: Kvasinková RNApolymeráza II
Ještě jsme se nezabývali chemií prodlužování mRNAřetězce, ale učiníme tak zde. Řetězce jsou prodlužovány ve směru 5′–> 3′ nukleofilním atakem 3′ OH skupiny rostoucího řetězce a-fosfátem vstupujícího NTP.
Stejně jako u prokaryot začíná eukaryotická transkripce rozpoznánímpromotorů. Existuje mnoho kopií genů rRNA, které řídí syntézu rRNA,všechny mají téměř identické sekvence. Tato redundance zajišťuje dostatečnou zásobu rRNA, která, jak jsme se již zmínili, tvoří asi 95 % buněčné RNA. promotory těchto téměř identických genů jsou proto identické, takže RNApolymeráza I musí rozpoznat pouze jednu promotorovou sekvenci. RNApolymeráza I je však druhově specifická (RNApolymeráza II a III nejsou druhově specifické).
Pro promotory savčí rRNA existuje „jádrový promotorový prvek“, který pokrývá oblast -31 až +6 (všimněte si, že se překrývá s oblastí genu, který je přepisován), a „horní promotorový prvek“, který pokrývá -187 až -107.
Při transkripci genů RNA polymerázou III se promotor někdy nachází v úseku uvnitř transkribované části genu, mezi +40 a+80, ale může být také částečně upsteam nebo zcela upstream od místa startu.
Promotory a kontrolní sekvence RNA polymerázy II
Sekvence promotoru pro RNA polymerázu II jsou různé. Můžeme je rozdělit do dvou tříd: ty, které se nacházejí v genech, jež produkují proteiny přibližně stejnou rychlostí ve všech buňkách („konstitutivní enzymy“), a ty pro geny, jejichž rychlost produkce se značně liší od jednoho typu buňky k druhému a závisí na potřebách diferencované buňky v daném okamžiku („indukovatelné enzymy“).
Konstitutivní promotorové prvky genů:
GC box : Jedná se o oblast obsahující jednu nebo více kopií sekvence GGGCGG (nebo jejíhokomplementu) v místě před startovacím místem a je analogická prokaryotickým promotorovým prvkům.
Další promotorové elementy se rovněž nacházejí v oblasti -50 až – 110 před GC boxem.
Selektivně exprimované genové promotorové elementy:
TATA box : Oblast nacházející se přibližně na -25 až -30, která je bohatá na nukleotidy „A“ a „T“ a která se podobá Pribnowovu boxu (TATAAT). Geny mohou být transkribovány i v případě defektního TATA boxu a předpokládá se, že TATA box se podílí na výběru místa začátku transkripce
CCAAT box : Jedná se o sekvenci, která se často nachází před TATA boxem, umístěnou přibližně na -70 až -90. Váže RNA polymerázu II i další proteiny potřebné proiniciaci transkripce.
Kontrolní sekvence pro strukturní geny:
Vazbu RNA polymerázy II na promotorové elementy mohou ovlivnit i další oblasti chromozomu, některé vzdálené od startovacího místa. Tyto genové elementy se nazývají „enhancery“ a „silencery“. Proteiny nazývané „aktivátory“ a „represory“ se mohou vázat na enhancery a silencery , a tím ovlivňovat vazbu polymerázy na promotory. Kromě toho může stejný protein fungovat jako aktivátor i represor, v závislosti na konkrétní interakci („duálně působící“ transkripční faktory).
Nábor RNA polymerázy II k promotoru:
Eukaryota nemají jednoduchý protein, který by odpovídal sfaktoru u prokaryot. Spíše existuje soubor proteinů, které společně vykonávají stejnou funkci jako s-faktor, a to jsou „obecné transkripční faktory“ („GTF“). Strukturou transkripčních faktorů jsme se již zabývali, když jsme v jedné z předchozích přednášek probírali interakci DNA s bílkovinami. Jinak jsou obecné mechanismy iniciace transkripce podobné.
Existuje 6 GTF, které jsou nutné pro nízkou a neměnnou základní rychlost transkripce, a tuto rychlost lze zvýšit účastí dalšíchproteinových faktorů. Tyto GTF tvoří „preiniciační komplex“, který začíná, když se „TATA vazebný protein“ („TBP“) naváže na TATA box (pokud existuje) promotoru. Specifická sekvence, na kterou se váže, určuje počáteční místo transkripce. V důsledku této vazby je DNA deformována zalomením na obou koncích TATA boxu. Jiné GTF se vážídále, následuje vazba RNA polymerázy. Nakonec se naváží zbývajícíGTF.
1YTB: Komplex TBP/TATA box
Po navázání TBP (který je součástí TFIID) je pořadí vazby následující:
TFIIA
TFIIB
TFIIF
RNA PII
TFIIE
TFIIH
TFIIH má dvě důležité enzymové aktivity. První je ATP-dependentníhelikázová aktivita, která napomáhá tvorbě otevřeného komplexu, a druháje kinázová aktivita, která vede k fosforylaci největší podjednotky RNA polymerázy II na jejím C-konci. Nyní může začít proces prodlužování transkripce, přičemž různé GTF (kromě TFIIF) se při prodlužování od komplexu oddělují. TFIID zůstává navázán na promotor, takže může dojít k opakované transkripci, když se GTF znovu shromáždí a vytvoří preiniciačníkomplex.
Tato diskuse byla zaměřena na RNA polymerázu II; pro RNA polymerázy I a III jsou zapotřebí jiné transkripční faktory. Všechny tři však vyžadují TBP.
Buňky řídí transkripci každého genu zvlášť. Unikátníkombinace tlumičů a zesilovačů pro každý gen moduluje rychlost transkripce. Jak ovlivňují transkripci genů proteiny aktivátorů a represorů, které jsou vázány daleko odpromotoru?
„Protein specifičnosti 1“ (Sp1) byl prvním nalezeným lidským transkripčním faktorem, který dokázal rozpoznat specifickou sekvenci GCregulačního enhanceru. Tento protein má dva zajímavé moduly:
(1) modul 3 zinkových prstů na jednom konci;
(2) modul na opačném konci se 2 diskrétními segmenty bohatými na Gln.
Mutanty, které nemají konec bohatý na glutamin, se mohou vázat na DNA; transkripce není stimulována. Proto se konec bohatý na glutamin musí navázat na něco jiného, aby došlo k transkripci, a to jsou „koaktivátory“. říká se jim také „TBP-Assicuated Factors“ nebo „TAFs“ a existuje jich nejméně osm, které jsou důležité pro transkripční aktivaci. Nejedná se o bazální faktory (GTF) a nevážou se na specifické sekvence DNA. Spíše se horlivě vážou na TBP a poskytují aktivátorům vícenásobná „dokovací místa“. V tomto smyslu jsou to „adaptorové molekuly“. Sada takových adaptorových molekul poskytuje obrovskou rozmanitost možností, jak modulovat transkripci agenu. Rozšíříme-li tedy naše předchozí srovnání preiniciačního komplexuGTF s prokaryotickým s-faktorem, lepší srovnání by bylo mezi s-faktorem a celým komplexem aktivátor-koaktivátor-základní preiniciační komplex. Pokud jde o to, jak toto uspořádánímoduluje nebo ovlivňuje rychlost transkripce, je pravděpodobně zprostředkovánopředevším deformací DNA, která usnadňuje pohyb RNA polymerázy II podél kódující oblasti.
Latchman (TRENDS in Biochemical Sciences Vol. 26 No.4 April 2001) poukázal na význam samotného vazebného místa DNA, které hraje klíčovou roli v intranskripční modulaci. Tentýž transkripční faktor může v důsledku vazby na různá místa nabývat různýchkonformací. Konformačnízměny jsou vyvolány interakcí DNA s proteinem, čímž se zvyšuje flexibilita spektra řízení transkripce, protože jeden protein může působit jako celá kolekce proteinů, z nichž každý má svůj vlastní účinek(aktivaci, inhibici nebo žádný účinek).
Pokračujeme-li o krok dále, můžeme si představit, že k podobnému jevu může dojít, když se koaktivátory vážou na aktivátory. Možná jsou podobně indukovány různé konformačnízměny ve vázaném proteinu v závislosti na typu interakce protein-protein. Takové konformační změny pak mohou vést k rozdílné schopnosti modulovat transkripci.
Aktivační domény transkripčních faktorů jsou často bohaté na glutamin, ale jiné jsou bohaté na prolin nebo kyselé. V některých případech jsou mezi kyselé nebo glutaminové zbytky vměstnány hydrofobní zbytky, které jsou důležité pro aktivaci. Tjian (Cell, Vol. 77, 5-8, April 8, 1994) předpokládá, žehydrofobní síly pohánějí kohezi aktivačních domén s jejich cíli a že specifičnosti je dosaženo periodicitou kohezních elementů.
Geny jsou transkribovány měřitelnou rychlostí pouze tehdy, pokud jsou přítomny správné aktivátory a jsou schopny překonat účinky represorů.
.