Společný původ heterodimerizujících homeoboxových transkripčních faktorů TALE u Metazoa a Archaeplastida

author
17 minutes, 11 seconds Read

TALE u Archaeplastida jsou rozděleny do dvou skupin, KNOX a non-KNOX

Pro shromáždění všech dostupných sekvencí homeoboxových proteinů jsme provedli vyhledávání BLAST a Pfam-motif proti nerostným genomům a sestavám transkriptomů napříč Archaeplastida a identifikovali 338 proteinů z 56 druhů jako kolekci homeoboxů Archaeplastida (30 genomů a 18 transkriptomů; Další soubor 1: Tabulka S1). Z nich 104 mělo definiční znak proteinů TALE, tříaminokyselinovou inzerci mezi pozicemi aa 23-24 v homeodoméně . Alespoň dva geny TALE byly zjištěny u většiny genomů s výjimkou pěti genomů třídy Trebouxiophyceae z Chlorophyta (doplňkový soubor 1: tabulka S1; další diskuse o nepřítomnosti genů TALE u Trebouxiophyceae viz doplňkový soubor 2: poznámka S1).

Sebrané sekvence TALE byly poté klasifikovány podle jejich homeodoménových vlastností pomocí fylogenetického přístupu, přičemž TALE z živočichů, rostlin a časně odvozených eukaryot (Amoebozoa a Excavata) byly zařazeny jako outgroups (Additional file 3: Figure S1). Výsledná fylogeneze homeodomén TALE rozlišila dvě skupiny u všech tří fylů Archaeplastida (obr. 2). (1) Skupina KNOX jako dobře podporovaný klad vykazovala kladogram specifický pro jednotlivé fyly: dvě sekvence Glaucophyta na bázi (jako KNOX-Glauco) byly odděleny od dalšího kladogramu, který kombinuje sekvence Rhodophyta (jako KNOX-Red1) a klad specifický pro Viridiplantae se silnou podporou (92/90/1,00). (2) Skupina non-KNOX, zahrnující homology BELL a GSP1, obsahovala klady se smíšenou taxonomickou příslušností. Tyto analýzy ukázaly, že proteiny TALE se rozdělily do dvou skupin již před evolucí Archaeplastida a že skupina KNOX je vysoce konzervovaná napříč Archaeplastida.

Obr. 2

Fylogeneze maximální pravděpodobnosti (ML) homeodomény nadtřídy TALE u Archaeplastida podporuje dávné rozdělení na skupiny TALE s KNOX a bez KNOX. ML stromy byly generovány ze zarovnání homeodomén se 70 aminokyselinovými pozicemi. Je zobrazen konsenzuální strom z 1000 bootstrapových stromů. Tři čísla u kritických uzlů ukazují % bootstrapu, %SH a Bayesovu posteriorní pravděpodobnost podpory kladů. Strom obsahuje dva outgroup clades označené černými čtverci v uzlech a dva Archaeplastida clades, jeden kombinující většinu KNOX sekvencí označený červeným čtvercem a druhý kombinující všechny non-KNOX sekvence označený modrým čtvercem. Svislé sloupce vpravo znázorňují rozložení outgroup černě, KNOX červeně a non-KNOX sekvencí modře. Červené tečky u názvů sekvencí označují přítomnost domén KN-A nebo KN-B a modré tečky označují přítomnost domény PBC-homologie. Zkrácené sekvence, které nejsou k dispozici pro analýzu homologických domén, jsou označeny otevřenými černými rámečky. Vyplněné černé rámečky označují nepřítomnost KN-A/B nebo PBC-homologické domény. Navrhovaná klasifikace je vyznačena svislými čarami. Tečkované svislé čáry označují navrhované členy třídy umístěné mimo hlavní klad pro danou třídu ve fylogenezi. Sekvence PBX-Red se nacházejí ve čtyřech samostatných kladech, které jsou označeny fialovými odstíny na modré části svislých čar. Dvě sekvence PBX-Red označené fialovým čtvercem se výjimečně nacházejí v kladu KNOX-Red1 a mají divergentní aminokyseliny na vysoce konzervovaných pozicích Trp19, His23 a Lys31 ve svém homeodoménu, což naznačuje jejich falešné spojení s KNOX-Red1. Barvy názvů sekvencí označují jejich fylogenetickou skupinu: Modrá pro Glaucophyta, fialová pro Rhodophyta, zelená pro prasinofyty, světle modrá pro chlorofyty, oranžová pro Streptophyta a černá pro outgroups. Pravítko ukazuje genetickou vzdálenost. Podrobnosti o sekvencích analyzovaných touto fylogenezí jsou uvedeny v Doplňkovém souboru 1: Tabulka S2. *Gloeochaete_wittrockiana_014496 je považována za sekvenci z améby bannelidového typu, která kontaminovala původní kulturu (SAG46.84) pro transkriptom MMETSP1089. **Asociace sekvencí třídy KNOX-Red2 se sekvencemi PBC Amorphea se přisuzuje společnému motivu WFGN určujícímu specifitu homeodomény pro vazbu na DNA prostřednictvím konvergentní evoluce

Sekvence skupiny KNOX sdílejí stejné heterodimerizační domény napříč Archaeplastida

Další otázkou bylo, zda třída KNOX rostlin vznikla před fylogenezí Viridiplantae. Rostlinné proteiny KNOX a Chlorophyta GSM1 mají KNOX-homologii, která se skládá z domén KN-A, KN-B a ELK, potřebnou pro jejich heterodimerizaci s ostatními proteiny TALE ; proto by přítomnost KNOX homologie naznačovala možnost heterodimerizace do skupiny KNOX. Abychom shromáždili homologické domény bez předchozích informací, provedli jsme ad-hoc vyhledávání homologických domén mezi sekvencemi skupiny KNOX. Pomocí identifikovaných homologických domén jako kotev jsme pečlivě sestavili zarovnání sekvencí skupiny KNOX v kombinaci se všemi ostatními sekvencemi TALE s homologií KNOX, (Additional file 3: Figure S2). Z tohoto zarovnání KNOX jsme zjistili, že všechny sekvence skupiny KNOX (s výjimkou částečných sekvencí) vykazují skóre podobnosti aminokyselin > 50 % pro alespoň dvě ze tří domén tvořících KNOX-homologickou oblast (doplňkový soubor 1: tabulka S3 pro vypočtenou homologii domén). Abychom otestovali, zda je pozorovaná podobnost specifická pro sekvence TALE, vytvořili jsme ze zarovnání KNOX motivy HMM pro domény KN-A a KN-B, vyhledali je v cílových genomech a potvrdili, že domény KN-A a KN-B se vyskytují pouze v sekvencích TALE (Doplňkový soubor 4: Data S1 a S2). Tím jsme definovali KNOX-homology jako sekvence TALE, které mají hledanou homologii KNOX (obr. 2, označené červenými tečkami za jejich ID), což naznačuje, že KNOX-homolog existoval již před evolucí eukaryotické fotosyntézy, kterou představují Archaeplastida.

Kromě KNOX-homologie odhalila stejná rešerše také dvě nové domény na C-konci homeodomény (Additional file 3: Figure S2): první (KN-C1) byla společná pro sekvence Chlorophyta a druhá (KN-C2) byla společná pro skupinu homologů KNOX v kladu mimo skupinu KNOX (KNOX-Red2).

Třídy KNOX divergovaly nezávisle mezi řasovými fylami

Ve Viridiplantae jsme našli jediný homolog KNOX u většiny druhů Chlorophyta, zatímco divergence KNOX1 a KNOX2 byla patrná v oddělení Streptophyta, včetně charofyta Klebsormidium flaccidum a suchozemských rostlin (obr. 2). Nově objevená doména KN-C1 byla specifická pro sekvence KNOX z Chlorophyta a byla nalezena u všech druhů kromě jednoho (Pyramimonas amylifera). Absence podobnosti mezi KN-C1 a C-koncovými prodlouženími sekvencí KNOX1/KNOX2 naznačuje nezávislou, liniově specifickou evoluci KNOX u Chlorophyta a Streptophyta (Additional file 3: Figure S2). Proto označujeme třídy KNOX u Chlorophyta jako KNOX-Chloro na rozdíl od tříd KNOX1 a KNOX2 u Streptophyta.

Homology KNOX u Rhodophyta jsme rozdělili do dvou tříd: parafyletická skupina blízká kladu KNOX-Chloro, nazvaná KNOX-Red1, a druhá skupina blízká PBX-Outgroup, nazvaná KNOX-Red2. KNOX-Red1 postrádala KN-A, zatímco KNOX-Red2 postrádala ELK a sdílela doménu KN-C2 (Additional file 3: Figure S2). KNOX-Red1 považujeme za ancestrální typ, protože sekvence KNOX-Red1 byly nalezeny ve všech zkoumaných taxonech Rhodophyta, zatímco sekvence KNOX-Red2 byly omezeny na dvě taxonomické třídy (Cyanidiophyceae a Florideophyceae). Zajímavé je, že klad KNOX-Red2 zahrnoval dvě sekvence zelených řas se silnou statistickou podporou (89/89/0,97; obr. 2); ty měly doménu KN-C2, což naznačuje jejich původ v rámci třídy KNOX-Red2 (doplňkový soubor 3: obr. S2; další diskuse o jejich možném původu prostřednictvím horizontálního přenosu genů viz doplňkový soubor 2: poznámka S2).

Dostupné sekvence TALE byly pro Glaucophyta omezené. U dvou druhů jsme našli jediný homolog KNOX, který měl domény KN-A a KN-B, ale postrádal doménu ELK. Označili jsme je jako KNOX-Glauco.

TALE skupiny non-KNOX mají doménu PBC-homologie živočišného typu, což naznačuje společný původ mezi Archaeplastida a Metazoa

Po identifikaci homologů KNOX byly zbývající sekvence TALE sloučeny jako skupina non-KNOX, která postrádá domény KN-A a KN-B u Archaeplastida. Další klasifikace skupiny non-KNOX byla náročná vzhledem k vysoce divergentním sekvencím homeodomén. Všimli jsme si však, že počet non-KNOX genů u jednotlivých druhů byl do značné míry neměnný: jeden ve většině genomů Rhodophyta a Glaucophyta a dva ve většině genomů Chlorophyta, což naznačuje jejich zachování v rámci jednotlivých radiací.

Naše ad-hoc hledání homologie poskytlo kritické informace pro klasifikaci non-KNOX a identifikovalo homologickou doménu společnou pro všechny non-KNOX sekvence Glaucophyta a Rhodophyta (obr. 3a, b). Protože tato doména vykazovala podobnost s druhou polovinou živočišné domény PBC-B (Pfam ID: PF03792) známé jako heterodimerizační doména , pojmenovali jsme tuto doménu PBL (PBC-B Like). V souladu s tím jsme zařadili všechny ne-KNOX TALE v Glaucophyta a Rhodophyta do jedné třídy homeoboxů příbuzných PBC, PBX-Glauco nebo PBX-Red. Sekvence PBX-Glauco rovněž disponovaly motivem MEINOX, konzervovaným v doméně PBC-B živočichů, což svědčí o společném původu domén PBC-B a PBL (obr. 3a).

Obr. 3a. 3

Archaeplastida non-KNOX group TALEs mají doménu podobnou PBC (PBL), která se skládá z N-koncové homologie MEINOX a C-koncové homologie PBC-B. Doména PBC-B je podobná doméně PBL. Písmena aminokyselin v černé barvě s šedými odstíny, v bílé barvě se světlými odstíny a v bílé barvě s černými odstíny vykazují v každém sloupci více než 60%, 80% nebo 100% podobnost. Inverzní červené trojúhelníky označují vyřazené sekvence v nezarovnaných vsuvkách. a Zarovnání domén PBL-Glauco, včetně dvou sekvencí Glaucophyta sdílejících homologii jak v homologii MEINOX, tak v C-terminální polovině domény PBC-B se sekvencemi TALE ne-Archaeplastida. Červený rámeček označuje doménu ELK. b Zarovnání domén PBL-Red. Všechny sekvence Rhodophyta, které nejsou KNOX, mají doménu PBL se slabou homologií MEINOX. c Zarovnání domény PBL-Chloro. Pro srovnání je zařazen Cyanophora_paradox_20927.63. Picocystis_salinarum_02499 je zakládajícím členem třídy GLX s doménou PBL-Chloro. d Srovnání mezi doménami PBL. Horní řádek ukazuje konsensus vytvořený ze zarovnání (a), (b) a (c) dohromady a spodní konsensuální sekvence jsou shromážděny z jednotlivých zarovnání uvedených v (a), (b), a (c)

GSP1 sdílí vzdálenou PBC-homologii spolu s dalšími sekvencemi skupiny non-KNOX u Viridiplantae

Zůstávala otázka evoluce sekvencí skupiny Chlorophyta non-KNOX, které zřejmě postrádají PBC-homologii. Abychom odhalili i vzdálenou homologii, porovnali jsme nově definované domény PBL se sekvencemi Chlorophyta pomocí BLAST (mezní hodnota E- 1E-1) a vícenásobného zarovnání sekvencí. Tento dotaz shromáždil tři sekvence TALE prasinofytů a jednu sekvenci TALE charofytů, které měly motiv MEINOX a domnělou PBL-doménu; vykazovaly však mezi sebou velmi nízkou sekvenční identitu (obr. 3c). Další dotazování s využitím těchto čtyř sekvencí identifikovalo 11 dalších sekvencí, které nejsou KNOX. Devět z nich bylo sestaveno do dvou zarovnání, z nichž jedno zahrnovalo homology GSP1 a druhé kombinovalo většinu prasinofytních sekvencí (Additional file 3: Figure S3). Dvě zbývající sekvence (Picocystis_salinarum_04995 a Klebsormidium_flaccidum_00021_0250) vykazovaly homologii se sekvencí PBX-Red z Chondrus cruentum (ID:41034) v prodloužení dlouhém ~ 200 aa za doménou PBL, což naznačuje jejich PBX-Red původ (další potenciální případ horizontálních přenosů; Additional file 3: Figure S4). Všechny sekvence Chlorophyta non-KNOX, které nesou PBL-homologické domény, byly klasifikovány jako GLX (GSP1-like homeobox) na základě uznání proteinu GSP1 z Chlamydomonas jako prvního charakterizovaného člena této třídy .

Je rostlinná třída BELL homologní s třídou GLX u Chlorophyta?

Třída BELL je jedinou třídou suchozemských rostlin, která není KNOX, sdílí doménu POX (Pre-homeobox) (PF07526) a postrádá identifikovatelnou doménu PBL. Genom K. flaccidum, jeden ze dvou dostupných genomů charofytů, z nichž vznikly suchozemské rostliny, obsahoval tři non-KNOX sekvence, přičemž všechny měly doménu PBL (obr. 3, Additional file 3: Figures S3, S4). Druhý genom charofyta Chara braunii obsahoval jeden domnělý homolog BELL, který se zdá být zkrácený o N-koncové sekvence mimo jeho C-koncovou homeodoménu pravděpodobně v důsledku neúplného genového modelu. Proto se zdá, že absence PBL-homologie v rostlinné třídě BELL je způsobena divergencí nebo ztrátou domén ze staré třídy charofytů, která PBL-homologii měla. Nalezli jsme intron na pozici homeodomény 24(2/3) homologu K. flaccidum GLX, který byl dříve identifikován jako specifický pro rostlinnou třídu BELL (Additional file 3: Figure S5) , což naznačuje, že se rostlinná třída BELL vyvinula z ancestrálního genu GLX. K potvrzení tohoto závěru je zapotřebí dalšího vzorkování taxonů charofytů.

Dva non-KNOX paralogy Chlorophyta heterodimerizují s KNOX homology

Přibližně u poloviny non-KNOX sekvencí Chlorophyta se nám ani pomocí našeho citlivého iterativního hledání homologie nepodařilo identifikovat PBC/PBL-homologii. Protože většina genomů Chlorophyta má jeden homolog GLX a jednu sekvenci non-KNOX bez domény PBL-homologie, označujeme tyto sekvence souhrnně jako třídu-B (Additional file 3: Figure S6). Výjimku tvoří jeden klad prasinofytů (třída Mamiellophyceae), jehož šest vysoce kvalitních genomů obsahuje všechny dvě non-KNOX sekvence bez PBL-homologie. Přesto tyto non-KNOX sekvence vytvořily dvě skupiny, jednu konzervativnější a druhou méně konzervativní a polyfyletickou, označované jako třídy Mam-A a Mam-B (Additional file 3: Figure S7, S8). Vzhledem k redukční evoluci genomu Mamiellophyceae , může být konzervovaná třída Mam-A odvozena od ancestrální třídy GLX.

Dvě divergentní třídy non-KNOX u Chlorophyta vedly ke kritické otázce ohledně jejich dyadických sítí. Dřívější studie ukázaly, že heterodimery TALE vyžadují interakci mezi doménami MEIS a PBC u živočichů a mezi doménami KNOX a PBL u Chlamydomonas . Proto se předpokládalo, že všechny TALE Glaucophyta a Rhodophyta tvoří heterodimery prostřednictvím svých domén KNOX a PBL. Na druhou stranu zbývalo ověřit, zda TALE z Chlorophyta, které postrádají doménu PBL, mohou tvořit heterodimery s jinými TALE.

Pro charakterizaci interakční sítě proteinů třídy TALE u Chlorophyta jsme pro testy protein-proteinových interakcí vybrali tři druhy prasinofytů: dva druhy obsahující geny Mam-A a Mam-B (Micromonas commoda a Ostreococcus tauri) a další druh (Picocystis salinarum), jehož transkriptom obsahoval jednu sekvenci GLX a jednu sekvenci třídy B. V tomto případě jsme se zaměřili na analýzu interakcí mezi proteiny třídy TALE. U všech tří druhů jsme zjistili, že homology KNOX interagují se všemi zkoumanými ne-KNOX proteiny Mam-A, Mam-B, Class-B a GLX třídy (obr. 4a-c). U žádného ze tří druhů nebyla pozorována interakce mezi dvěma non-KNOX proteiny (obr. 4a-c). Podobně jako u heterodimerizace GLX-KNOX vyžadovaly Mam-A a Mam-B pro svou heterodimerizaci s homology KNOX další domény mimo homeodoménu (Additional file 3: Figure S9). Tyto výsledky ukázaly, že všechny divergentní non-KNOX TALE si zachovaly svou původní aktivitu tvořit heterodimery s KNOX homology. Pozorovaná interakční síť mezi sekvencemi TALE je shrnuta v Doplňkovém souboru 3: Obrázek S10.

Obr. 4

TALE TF se zapojují do heterodimeračních sítí mezi skupinami KNOX a non-KNOX. Konstrukty návnady konjugované s DNA-vazebnou doménou (DBD) GAL4 a konstrukty kořisti konjugované s transkripční aktivační doménou (AD) GAL4 jsou uvedeny v tabulce. Kombinace konstruktů, označené čísly 1-8, jsou uspořádány v klínech po směru hodinových ručiček, počínaje 9. hodinou, jak je označeno v panelech -LT. Potvrzené interagující páry jsou v tabulce uvedeny tučně. Pár laminin a T-Antigen (T-Ag), o kterém je známo, že je interagujícím partnerem, byl umístěn do 8. sektoru jako pozitivní kontrola. a Testy s použitím M. commoda TALEs. b Testy s použitím O. tauri TALEs. c Testy s použitím P. salinarum TALEs. KNOX-tr označuje N-koncový zkrácený konstrukt KNOX pro zabránění samoaktivace. d Podrobné informace o konstruktu jsou uvedeny v Additional file 1: Table S5

Heterodimerizace TALE se vyvinula brzy v historii eukaryot

Náš objev PBC-homologie u Archaeplastida naznačuje společný původ heterodimerizujících TALE mezi Metazoa a Archaeplastida. Předpokládá také, že další eukaryotické linie mohou mít TALE s PBC-homologií. Mimo živočichy obsahuje databáze Pfam pouze dvě sekvence s doménou PBC-B, jednu z druhu Cryptophyta (Guillardia theta, ID:137502) a druhou z druhu Amoebozoa (Acanthamoeba castillian, ID:XP_004342337) . Dále jsme zkoumali skupinu Excavata, která se nachází v blízkosti předpokládaného kořene eukaryotické fylogeneze . Prohledáním dvou genomů (Naegleria gruberi a Bodo saltans) jsme získali 12 homeoboxových sekvencí TALE u N.gruberi a žádnou u B.saltans, z nichž jsme našli jednu s doménou PBC-homologie (ID:78561, obr. 3a) a jednu s doménou MEIS/KNOX-homologie (ID:79931, Additional file 3: Figure S2). Prohledali jsme další genomy Amorphea a našli jsme PBC-homologii a MEIS/KNOX-homologii v sekvencích TALE shromážděných u Apusozoa, Ichtyhosporea a Choanoflagellata, ale ne u Fungi (Additional file 3: Figures S11-S14). Naše data naznačují, že heterodimerizační domény – PBC-homologie a MEIS/KNOX-homologie – vznikly na počátku eukaryotické evoluce a přetrvaly během hlavních eukaryotických radiací.

Intron-retention podporuje paralelní evoluci heterodimerických tříd TALE během eukaryotických radiací

Všudypřítomnost dyadických TALE vyvolala další otázku: Jsou všechny dyadické TALE popsané v této studii potomky jediné ancestrální dyády, nebo jsou výsledkem liniově specifické evoluce z jediného prototypového TALE (proto-TALE), který se nezapojuje do heterodimerizace. Abychom prozkoumali hluboký původ, zkoumali jsme intron-retenci, která je považována za dlouho zachovávaný znak a je méně náchylná ke vzniku homoplazie (znak, který se projevuje u souboru druhů, ale není přítomen u jejich společného předka) . Pět pozic intronu sdílely alespoň dvě třídy TALE, z nichž introny 44/45 a 48(2/3) byly kvalifikovány jako nejpůvodnější, protože se vyskytovaly u všech Archaeplastida a Metazoa (Additional file 3: Figure S5).

Introny 44/45 a 48(2/3) vykazovaly zajímavou výlučnou distribuci mezi dvěma dyadickými partnery každého fyla: jeden vlastní intron 44/45 a druhý intron 48(2/3) (Additional file 3: Figure S5). Tento vzájemně se vylučující vzorec naznačuje, že na počátku eukaryotické radiace existovaly dva geny TALE s odlišnou pozicí intronu. Pozici intronu 44/45 považujeme za nejpůvodnější, vzhledem k tomu, že byla konzervována ve většině jiných homeoboxových genů než TALE . V tomto ohledu předpokládáme, že získání intronu 48(2/3) a ztráta intronu 44/45 doprovázely ranou událost, při níž byl proto-TALE s intronem 44/45 duplikován, aby vznikl druhý TALE s intronem 48(2/3). Vzhledem k tomu, že pozice 48(2/3) intronu byla nalezena v genech skupiny KNOX/MEIS u Viridiplantae a Metazoa a také v genech skupiny PBX u Rhodophyta a Cryptophyta, můžeme spekulovat, že duplikované TALE vznikly brzy a diverzifikovaly se, aby vytvořily heterodimerní konfigurace specifické pro jednotlivé linie během eukaryotické radiace. Alternativně mohla být pozice 48(2/3) intronu v homeodoméně TALE získána mnohokrát během eukaryotické radiace.

Vzhledem k tomu, že se heterodimerní TALE vyvinuly lineárně specifickým způsobem, položili jsme si otázku, jak vypadal proto-TALE v době, kdy prošel duplikací. Následující pozorování naznačují, že proto-TALE byl homodimerizující protein. Za prvé, PBC-homologické domény proteinů třídy PBX/GLX identifikované u Archaeplastida zahrnují MEINOX-motiv, který byl původně definován pro svou podobnost s MEIS/KNOX-homologickými doménami (obr. 3) . Za druhé, sekvence PBX-Glauco mají v rámci své domény PBL ELK-homologii (obr. 3), která se dobře shoduje s doménami ELK sekvencí třídy KNOX u Viridiplantae (Additional file 3: Figure S15). MEINOX-motiv a ELK-homologie napříč heterodimerizujícími skupinami KNOX a PBX tedy podpořily společný původ heterodimerizujících skupin TALE z jedné TALE duplikací a následnou subfunkcionalizací

.

Similar Posts

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.