Gemensam härstamning av heterodimeriserande TALE homeobox-transkriptionsfaktorer i Metazoa och Archaeplastida

author
15 minutes, 21 seconds Read

TALEs i Archaeplastida är indelade i två grupper, KNOX och icke-KNOX

För att samla in alla tillgängliga sekvenser av homeobox-proteiner utförde vi BLAST- och Pfam-motif-sökningar mot icke-växtgenom och transkriptomsammansättningar i hela Archaeplastida och identifierade 338 proteiner från 56 arter som Archaeplastida homeobox-samlingen (30 genomer och 18 transkriptomer; Ytterligare fil 1: Tabell S1). Av dessa hade 104 proteiner det utmärkande kännetecknet för TALE-proteiner, ett instick av tre aminosyror mellan aa positionerna 23-24 i homeodomänen . Minst två TALE-gener upptäcktes i de flesta genomer utom fem genomer i klassen Trebouxiophyceae av Chlorophyta (Additional file 1: Table S1; se Additional file 2: Note S1 för ytterligare diskussion om frånvaron av TALEs i Trebouxiophyceae).

De insamlade TALE-sekvenserna klassificerades sedan efter deras homeodomänegenskaper med hjälp av ett fylogenetiskt tillvägagångssätt, med TALEs från djur, växter och tidigt divergerande eukaryoter (Amoebozoa och Excavata) som utgrupper (Additional file 3: Figur S1). Den resulterande TALE-homeodomän-fylogeninfylogenin skiljer mellan två grupper i alla tre archaeplastida-fylerna (fig. 2). (1) KNOX-gruppen som en väl understödd klad visade ett fylumspecifikt kladogram: två Glaucophyta-sekvenser i basen (som KNOX-Glauco) var skilda från nästa klad, som kombinerar Rhodophyta-sekvenser (som KNOX-Red1) och en Viridiplantae-specifik klad med starkt stöd (92/90/1,00). (2) Gruppen som inte är KNOX, inklusive BELL- och GSP1-homologerna, innehöll klader med blandad taxonomisk tillhörighet. Dessa analyser visade att TALE-proteinerna hade divergerat i två grupper redan innan Archaeplastida utvecklades och att KNOX-gruppen är starkt bevarad i hela Archaeplastida.

Fig. 2

Maximum likelihood (ML) phylogeny of the TALE superclass homeodomain in Archaeplastida supports ancient division between KNOX- and non-KNOX TALE groups. ML-träden genererades från homeodomänen med 70 aminosyrapositioner. Konsensusträdet av 1000 bootstrapträd visas. De tre siffrorna vid kritiska noder visar %bootstrap, %SH och Bayesiansk efterföljande sannolikhet till stöd för klasser. Trädet innehåller två outgroup-klasser markerade med svarta kvadrater vid noderna och två Archaeplastida-klasser, varav den ena kombinerar de flesta KNOX-sekvenser markerade med den röda kvadraten och den andra kombinerar alla icke-KNOX-sekvenser markerade med den blå kvadraten. Vertikala staplar till höger visar fördelningen av outgroup i svart, KNOX i rött och icke-KNOX-sekvenser i blått. Röda prickar vid sekvensnamnen anger närvaron av KN-A- eller KN-B-domäner, och blå prickar anger närvaron av en PBC-homologidomän. Trunkerade sekvenser som inte är tillgängliga för analys av homologidomäner är markerade med öppna svarta rutor. Fyllda svarta rutor indikerar avsaknad av en KN-A/B- eller PBC-homologidomän. Den föreslagna klassificeringen anges av de vertikala linjerna. Streckade vertikala linjer anger föreslagna klassmedlemmar som är placerade utanför huvudkladen för klassen i fylogenin. PBX-Red-sekvenser finns i fyra separata klasser, markerade med lila nyanser på den blå delen av de vertikala staplarna. Två PBX-Red-sekvenser markerade med den lila kvadraten återfinns undantagsvis i KNOX-Red1-kladen och har avvikande aminosyror på mycket konserverade positioner vid Trp19, His23 och Lys31 i sin homeodomän, vilket tyder på att de är felaktigt associerade med KNOX-Red1. Färgerna i sekvensnamnen anger deras fylogenetiska grupp: Blått för Glaucophyta, lila för Rhodophyta, grönt för prasinofyter, ljusblått för klorofyter, orange för Streptophyta och svart för outgroups. Linjalen visar det genetiska avståndet. Detaljerade uppgifter om de sekvenser som analyserats i denna fylogeni finns i Additional file 1: Table S2. *Gloeochaete_wittrockiana_014496 betraktas som en sekvens från en amöba av bannelid-typ som förorenade den ursprungliga kulturen (SAG46.84) för MMETSP1089-transkriptomet. **Associeringen av KNOX-Red2-klassens sekvenser till Amorphea PBC-sekvenser tillskrivs ett gemensamt WFGN-motiv som bestämmer homeodomänens DNA-bindningsspecificitet via konvergent evolution

KNOX-gruppens sekvenser har samma heterodimeriseringsdomäner i hela Archaeplastida

Nästkommande fråga var om KNOX-klasserna för växter har sitt ursprung före Viridiplantae-fylum. Växternas KNOX-proteiner och Chlorophyta GSM1 har KNOX-homologin, som består av KN-A, KN-B och ELK-domäner, som krävs för deras heterodimerisering med andra TALE-proteiner ; därför skulle närvaron av KNOX-homologin antyda potentialen för heterodimerisering till KNOX-gruppen. För att samla in homologidomäner utan föregående information utförde vi ad hoc-sökningar av homologidomäner bland KNOX-gruppens sekvenser. Med hjälp av de identifierade homologidomänerna som ankare kurerade vi noggrant en anpassning av KNOX-gruppens sekvenser i kombination med alla andra TALE-sekvenser med KNOX-homologi, (Additional file 3: Figur S2). Från denna KNOX-anpassning hittade vi alla KNOX-gruppens sekvenser (exklusive partiella sekvenser) som uppvisar aminosyralikhetspoäng > 50 % för minst två av de tre domäner som utgör KNOX-homologiregionen (Additional file 1: Tabell S3 för beräknad domänhomologi). För att testa om den observerade likheten är specifik för TALE-sekvenserna genererade vi HMM-motiv för KN-A- och KN-B-domänerna från KNOX-utjämningen, sökte dem i målgenomerna och bekräftade att KN-A- och KN-B-domänerna endast finns i TALE-sekvenserna (Additional file 4: Data S1 och S2). Vi definierade därmed KNOX-homologer som TALE-sekvenser som har sökbar KNOX-homologi (fig. 2, markerade med röda prickar efter deras ID), vilket tyder på att KNOX-homologerna existerade redan före evolutionen av eukaryotisk fotosyntes som representeras av Archaeplastida.

Inom KNOX-homologin avslöjade samma sökning också två nya domäner vid homeodomänens C-terminus (Additional file 3: Figur S2): den första (KN-C1) delades med Chlorophyta-sekvenserna, och den andra (KN-C2) delades med en grupp KNOX-homologer i en klad utanför KNOX-gruppen (KNOX-Red2).

KNOX-klasser divergerade oberoende av varandra bland algfylerna

I Viridiplantae fann vi ett enda KNOX-homolog i de flesta Chlorophyta-arter, medan KNOX1- och KNOX2-diversifiering var tydlig i Streptophyta-divisionen, inklusive charofyten Klebsormidium flaccidum och landväxter (fig. 2). Den nyupptäckta KN-C1-domänen var specifik för Chlorophyta KNOX-sekvenserna och fanns i alla arter utom en (Pyramimonas amylifera). Avsaknaden av likhet mellan KN-C1 och de C-terminala förlängningarna av KNOX1/KNOX2-sekvenserna tyder på en oberoende, linjespecifik KNOX-evolution i Chlorophyta och Streptophyta (Additional file 3: Figur S2). Vi hänvisar därför till Chlorophytas KNOX-klasser som KNOX-Chloro i motsats till KNOX1- och KNOX2-klasserna i Streptophyta.

KNOX-homologerna i Rhodophyta delades in i två klasser: en parafyletisk grupp nära KNOX-Chloro-kladen, benämnd KNOX-Red1, och en andra grupp nära PBX-Out-gruppen, benämnd KNOX-Red2. KNOX-Red1 saknade en KN-A, medan KNOX-Red2 saknade en ELK och delade en KN-C2-domän (Additional file 3: Figur S2). Vi betraktar KNOX-Red1 som den ursprungliga typen, eftersom KNOX-Red1-sekvenserna hittades i alla undersökta Rhodophyta taxa, medan KNOX-Red2-sekvenserna var begränsade till två taxonomiska klasser (Cyanidiophyceae och Florideophyceae). Intressant nog innehöll KNOX-Red2-kladen två sekvenser från grönalger, med starkt statistiskt stöd (89/89/0,97; fig. 2). Dessa hade en KN-C2-domän, vilket tyder på att de härstammar från KNOX-Red2-klassen (Additional file 3: figur S2; se Additional file 2: anmärkning S2 för ytterligare diskussion om deras möjliga ursprung via horisontell genöverföring).

Det fanns endast få tillgängliga TALE-sekvenser för Glaucophyta. Vi hittade en enda KNOX-homolog i två arter, som hade KN-A- och KN-B-domäner men saknade en ELK-domän. Vi kallade dessa KNOX-Glauco.

TALEs i icke-KNOX-gruppen har en PBC-homologidomän av djurtyp, vilket tyder på en gemensam härstamning mellan Archaeplastida och Metazoa

Efter identifieringen av KNOX-homologer kombinerades de återstående TALE-sekvenserna till icke-KNOX-gruppen som saknar KN-A- och KN-B-domäner i Archaeplastida. Ytterligare klassificering av icke-KNOX-gruppen var en utmaning på grund av dess mycket divergerande sekvenser av homeodomäner. Vi noterade dock att antalet icke-KNOX-gener per art var i stort sett oföränderligt: en i de flesta Rhodophyta- och Glaucophyta-genom och två i majoriteten av Chlorophyta-genom, vilket tyder på att de är bevarade inom varje strålning.

Vår ad-hoc homologisökning gav viktig information för icke-KNOX-klassificering, genom att vi identifierade en homologidomän som delas av alla Glaucophyta- och Rhodophyta-non-KNOX-sekvenser (fig. 3a, b). Eftersom denna domän visade en likhet med den andra halvan av djurens PBC-B-domän (Pfam ID: PF03792) som är känd som heterodimeriseringsdomän , gav vi denna domän namnet PBL (PBC-B Like). Följaktligen klassificerade vi alla icke-KNOX TALEs i Glaucophyta och Rhodophyta som en enda PBC-relaterad homeoboxklass, PBX-Glauco eller PBX-Red. PBX-Glauco-sekvenserna hade också MEINOX-motivet, som är bevarat i djurens PBC-B-domän, vilket tyder på att PBC-B- och PBL-domänerna har en gemensam härstamning (fig. 3a).

Fig. 3

Archaeplastida non-KNOX group TALEs har en PBC-liknande domän (PBL) som består av N-terminal MEINOX homologi och C-terminal PBC-B homologi. Aminosyrabokstäver i svart med grå nyanser, i vitt med ljusa nyanser och i vitt med svarta nyanser visar mer än 60 %, 80 % eller 100 % likhet i varje kolumn. Inversa röda trianglar visar de bortkastade sekvenserna i icke-alignerade infogningar. a PBL-Glauco-domänanpassning, inklusive två Glaucophyta-sekvenser som delar homologi i både MEINOX-homologin och C-terminala halvan av PBC-B-domänen med TALE-sekvenser från andra arter än Archaeplastida. Den röda rutan visar ELK-domänen. b PBL-Red domain alignment. Alla Rhodophyta-sekvenser som inte är KNOX-sekvenser har en PBL-domän med dålig MEINOX-homologi. c PBL-Chloro-domänanpassning. Cyanophora_paradox_20927.63 ingår som jämförelse. Picocystis_salinarum_02499 är en grundande medlem av GLX-klassen med en PBL-Chloro-domän. d Jämförelse mellan PBL-domäner. Den översta raden visar den konsensus som gjorts från anpassningen av (a), (b) och (c) tillsammans och de lägre konsensussekvenserna är samlade från de enskilda anpassningarna som presenteras i (a), (b), och (c)

GSP1 delar avlägsen PBC-homologi tillsammans med andra sekvenser som inte tillhör KNOX-gruppen i Viridiplantae

En återstående fråga var evolutionen av de Chlorophyta icke-KNOX-sekvenser som uppenbarligen saknade PBC-homologi. För att avslöja även en avlägsen homologi jämförde vi de nyligen definierade PBL-domänerna med Chlorophyta-sekvenserna genom BLAST (cut-off E-värde på 1E-1) och multipla sekvensanpassningar. Denna sökning samlade in tre Prasinophyte- och en Charophyte-TALE-sekvenser som hade ett MEINOX-motiv och en förmodad PBL-domän; de uppvisade dock mycket låg sekvensidentitet sinsemellan (fig. 3c). Ytterligare sökning med hjälp av dessa fyra sekvenser identifierade ytterligare 11 icke-KNOX-sekvenser. Nio av dessa gjordes till två anpassningar, varav den ena inkluderade GSP1-homologer och den andra kombinerade de flesta prasinofyte-sekvenser (Additional file 3: Figur S3). De två återstående sekvenserna (Picocystis_salinarum_04995 och Klebsormidium_flaccidum_00021_0250) uppvisade en homologi med en PBX-Red-sekvens från Chondrus cruentum (ID:41034) i en ~ 200 aa lång förlängning bortom PBL-domänen, vilket tyder på att de har ett PBX-Red-anoriginalt ursprung (ännu ett potentiellt fall av horisontella överföringar; Additional file 3: Figur S4). Alla klorofytas icke-KNOX-sekvenser som bär PBL-homologidomäner klassificerades som GLX (GSP1-liknande homeobox) som ett erkännande av GSP1-proteinet från Chlamydomonas som den första karakteriserade medlemmen i denna klass .

Är växtklassen BELL homolog till klorofytans GLX-klass?

BELL-klassen är den enda icke-KNOX-klassen i landväxter, som delar en POX (Pre-homeobox)-domän (PF07526) och saknar en identifierbar PBL-domän. K. flaccidum-genomet, ett av de två genomer som finns tillgängliga hos den charofyt från vilken landväxter uppstod, innehöll tre icke-KNOX-sekvenser, som alla hade en PBL-domän (Fig. 3, Additional file 3: Figures S3, S4). Det andra charofytgenomet av Chara braunii innehöll en förmodad BELL-homolog som verkar vara trunkerad för de N-terminala sekvenserna utanför dess C-terminala homeodomän, möjligen på grund av den ofullständiga genmodellen. Avsaknaden av PBL-homologi i växternas BELL-klass verkar därför bero på divergens eller domänförlust från en gammal charofytklass som hade PBL-homologi. Vi hittade ett intron vid 24(2/3) homeodomänpositionen hos en K. flaccidum GLX-homolog, som tidigare identifierats som specifik för växternas BELL-klass (Additional file 3: Figur S5) , vilket tyder på att växternas BELL-klass har utvecklats från en ursprunglig GLX-gen. Fler taxonprovtagningar i charofyter behövs för att bekräfta denna slutsats.

Två icke-KNOX-paraloger av Chlorophyta heterodimeriserar med KNOX-homologerna

Även med vår känsliga iterativa homologisökning kunde vi inte identifiera någon PBC/PBL-homologi i ungefär hälften av de Chlorophyta icke-KNOX-sekvenser. Eftersom de flesta Chlorophyta-genom har en GLX-homolog och en icke-KNOX-sekvens utan PBL-homologidomän hänvisar vi de senare kollektivt till klass-B (Additional file 3: Figur S6). Undantag fanns i en prasinofyt-klas (klass Mamiellophyceae), vars sex högkvalitativa genomer alla innehåller två icke-KNOX-sekvenser som saknar PBL-homologin. Trots detta bildade dessa icke-KNOX-sekvenser två grupper, en mer bevarad och en mindre bevarad och polyfyletisk, som kallas Mam-A- respektive Mam-B-klasserna (Additional file 3: figurerna S7, S8). Med tanke på den reduktiva genomevolutionen hos Mamiellophyceae kan den bevarade Mam-A-klassen härstamma från en ursprunglig GLX-klass.

Två divergerande icke-KNOX-klasser i Chlorophyta ledde till en kritisk fråga om deras dyadiska nätverk. Tidigare studier hade visat att TALE-heterodimerer krävde interaktion mellan MEIS- och PBC-domäner hos djur och mellan KNOX- och PBL-domäner i Chlamydomonas . Man förutspådde därför att alla Glaucophyta och Rhodophyta TALEs bildar heterodimerer via sina KNOX- och PBL-homologidomäner. Å andra sidan återstår det att testa om de Chlorophyta TALEs som saknar PBL-domän kan bilda heterodimerer med andra TALEs.

För att karaktärisera interaktionsnätverket för TALE-klassproteiner i Chlorophyta valde vi ut tre prasinofytarter för protein-proteininteraktionsanalyser: två arter som innehåller Mam-A- och Mam-B-gener (Micromonas commoda och Ostreococcus tauri), och en annan art (Picocystis salinarum), vars transkriptom innehöll en GLX- och en Class-B-sekvens. I alla tre arterna fann vi att KNOX-homologer interagerade med alla undersökta icke-KNOX-proteiner i Mam-A-, Mam-B-, Class-B- och GLX-klassen (fig. 4a-c). Ingen interaktion observerades mellan de två icke-KNOX-proteinerna i någon av de tre arterna (fig. 4a-c). I likhet med GLX-KNOX-heterodimeriseringen krävde Mam-A och Mam-B också ytterligare domäner utanför homeodomänen för sin heterodimerisering med KNOX-homologerna (Additional file 3: Figur S9). Dessa resultat visade att alla divergerande icke-KNOX TALEs behöll sin ursprungliga aktivitet för att bilda heterodimerer med KNOX homologerna. Observerade interagerande nätverk bland TALE-sekvenserna sammanfattas i Additional file 3: Figure S10.

Fig. 4

TALE TFs engagerar sig i heterodimeriseringsnätverk mellan KNOX- och icke-KNOX-grupper. De beteskonstruktioner som är konjugerade till GAL4:s DNA-bindningsdomän (DBD) och de byteskonstruktioner som är konjugerade till GAL4:s transkriptionsaktiveringsdomän (AD) anges i tabellen. Konstruktionskombinationer, numrerade 1-8, är ordnade i kilar i klockans riktning, med början klockan 9, vilket är markerat i -LT-panelerna. Bekräftade interagerande par visas i fetstil i tabellen. Paret laminin och T-antigen (T-Ag), som man vet är interagerande partners, pläterades i den åttonde sektorn som en positiv kontroll. a Analyser med M. commoda TALEs. b Analyser med O. tauri TALEs. c Analyser med P. salinarum TALEs. KNOX-tr avser den N-terminalt trunkerade KNOX-konstruktionen för att förhindra självaktivering. d Detaljerad konstruktionsinformation finns i Additional file 1: Table S5

TALE-heterodimerisering utvecklades tidigt i eukaryotisk historia

Vår upptäckt av PBC-homologin i Archaeplastida tyder på att de heterodimeriserande TALES har en gemensam härkomst mellan Metazoa och Archaeplastida. Den förutsäger också att andra eukaryotiska släkten kan ha TALEs med PBC-homologin. Utanför djur innehåller Pfam-databasen endast två sekvenser med PBC-B-domänen, en från en Cryptophyta-art (Guillardia theta, ID:137502) och den andra från en Amoebozoa-art (Acanthamoeba castillian, ID:XP_004342337) . Vi undersökte vidare Excavata-gruppen, som ligger nära den förmodade roten till den eukaryotiska fylogenin . En sökning i två genomer (Naegleria gruberi och Bodo saltans) gav 12 TALE-homeoboxsekvenser i N.gruberi och inga i B.saltans, varav vi hittade en med en PBC-homologidomän (ID:78561, fig. 3a) och en med en MEIS/KNOX-homologi (ID:79931, Additional file 3: Figur S2). Vi sökte ytterligare genomer i Amorphea och hittade PBC-homologin och MEIS/KNOX-homologin i TALE-sekvenserna som samlats in från Apusozoa, Ichtyhosporea och Choanoflagellata men inte från svampar (Additional file 3: Figures S11-S14). Våra data tyder på att heterodimeriseringsdomänerna – PBC-homologin och MEIS/KNOX-homologin – uppstod tidigt i den eukaryotiska evolutionen och kvarstod under de stora eukaryotiska radiationerna.

Intron-retention stödjer den parallella evolutionen av de heterodimera TALE-klasserna under eukaryotiska radiationer

Den allestädes närvarande dyadiska TALE:er väckte nästa fråga: Är alla de dyadiska TALEs som rapporteras i denna studie ättlingar till en enda förfäders dyad, eller är de resultatet av linjespecifik evolution från en enda prototypisk TALE (proto-TALE) som inte ägnar sig åt heterodimerisering. För att undersöka djupt släktskap undersökte vi intronretention, eftersom detta anses vara en karaktär som bevarats länge och som är mindre benägen att uppstå genom homoplasi (en karaktär som uppvisas av en uppsättning arter men som inte finns hos deras gemensamma förfader) . Fem intronpositioner delades av minst två TALE-klasser, varav intronerna 44/45 och 48(2/3) kvalificerade sig som de mest förfäderliga eftersom de fanns överallt i Archaeplastida och Metazoa (Additional file 3: Figur S5).

Intronerna 44/45 och 48(2/3) uppvisade en fascinerande exklusiv fördelning mellan de två dyadiska partnerna i varje fylum: den ena har intronen 44/45 och den andra har intronen 48(2/3) (Additional file 3: Figur S5). Detta ömsesidigt exklusiva mönster tyder på att två TALE-gener med olika intronpositioner fanns i början av den eukaryota strålningen. Vi anser att 44/45-intronpositionen är den mest föråldrade, eftersom den var bevarad i de flesta homeoboxgener som inte är TALE-gener . I detta avseende spekulerar vi att förvärvet av 48(2/3) och förlusten av 44/45 intron åtföljdes av en tidig händelse där proto-TALE med 44/45 intron duplicerades för att generera en andra TALE med 48(2/3) intron. Eftersom intronpositionen 48(2/3) återfanns inom KNOX/MEIS-gruppens gener i Viridiplantae och Metazoa och även i PBX-gruppens gener i Rhodophyta och Cryptophyta kan vi spekulera i att de duplicerade TALE:erna uppstod tidigt och diversifierades för att etablera linjespecifika heterodimera-konfigurationer under eukaryotiska radiationer. Alternativt kan 48(2/3) intronpositionen i TALE-homeodomänen ha förvärvats många gånger under eukaryotiska radiationer.

Med tanke på att de heterodimera TALE:erna utvecklades på ett linjespecifikt sätt frågade vi oss hur proto-TALE:en såg ut vid den tidpunkt då den genomgick duplikation. Följande observationer tyder på att proto-TALE var ett homodimeriserande protein. För det första innehåller PBC-homologidomänerna för PBX/GLX-klassens proteiner som identifierats i Archaeplastida MEINOX-motivet som ursprungligen definierades på grund av dess likhet med MEIS/KNOX-homologidomänerna (fig. 3) . För det andra har PBX-Glauco-sekvenser ELK-homologin i sin PBL-domän (fig. 3), som stämmer väl överens med ELK-domänerna i KNOX-klassens sekvenser i Viridiplantae (Additional file 3: Figur S15). Därför stödde MEINOX-motivet och ELK-homologin i de heterodimeriserande KNOX- och PBX-grupperna det gemensamma ursprunget för heterodimeriserande TALE-grupper från en enda TALE genom duplicering följt av subfunktionalisering.

Similar Posts

Lämna ett svar

Din e-postadress kommer inte publiceras.