Fælles forfædre af heterodimeriserende TALE homeobox transkriptionsfaktorer på tværs af Metazoa og Archaeplastida

author
14 minutes, 44 seconds Read

TALEs i Archaeplastida er opdelt i to grupper, KNOX og ikke-KNOX

For at samle alle tilgængelige homeobox-proteinsekvenser udførte vi BLAST- og Pfam-motif-søgninger mod ikke-plantegenomer og transkriptom-sammensætninger i hele Archaeplastida og identificerede 338 proteiner fra 56 arter som Archaeplastida homeobox-samlingen (30 genomer og 18 transkriptomer; Yderligere fil 1: Tabel S1). Af disse havde 104 af dem det definerende træk ved TALE-proteiner, en indsættelse af tre aminosyrer mellem aa positionerne 23-24 i homeodomænet . Der blev påvist mindst to TALE-gener i de fleste genomer undtagen fem genomer i klassen Trebouxiophyceae i Chlorophyta (Additional file 1: Table S1; se Additional file 2: Note S1 for yderligere diskussion af fraværet af TALE’er i Trebouxiophyceae).

De indsamlede TALE-sekvenser blev derefter klassificeret efter deres homeodomænegenskaber ved hjælp af en fylogenetisk tilgang, med TALE’er fra dyr, planter og tidligt-divergerende eukaryoter (Amoebozoa og Excavata) som outgroups (Yderligere fil 3: Figur S1). Den resulterende TALE-homeodomæne-fylogeni adskilte to grupper i alle tre archaeplastida-fylaer (Fig. 2). (1) KNOX-gruppen som en velunderstøttet klade viste et phylumspecifikt kladogram: to Glaucophyta-sekvenser i bunden (som KNOX-Glauco) var adskilt fra den næste klade, som kombinerer Rhodophyta-sekvenser (som KNOX-Red1) og en Viridiplantae-specifik klade med stærk støtte (92/90/1,00). (2) Ikke-KNOX-gruppen, herunder BELL- og GSP1-homologerne, indeholdt klader af blandet taksonomisk tilhørsforhold. Disse analyser viste, at TALE-proteinerne allerede var divergeret i to grupper før udviklingen af Archaeplastida, og at KNOX-gruppen er stærkt bevaret i hele Archaeplastida.

Figur. 2

Maximum likelihood (ML) fylogeni af TALE-superklassens homeodomæne i Archaeplastida understøtter den gamle opdeling mellem KNOX- og ikke-KNOX-TALE-grupper. ML-træerne blev genereret ud fra homeodomænens alignment med 70 aminosyrepositioner. Konsensustræet ud fra 1000 bootstrap-træer er vist. De tre tal ved kritiske knuder viser %bootstrap, %SH og Bayesian posterior sandsynlighed til støtte for kladerne. Træet indeholder to outgroup-klasser markeret med sorte firkanter ved knuderne og to Archaeplastida-klasser, hvoraf den ene kombinerer de fleste KNOX-sekvenser markeret med den røde firkant og den anden kombinerer alle ikke-KNOX-sekvenser markeret med den blå firkant. De lodrette søjler til højre viser fordelingen af outgroup-sekvenser i sort, KNOX-sekvenser i rødt og ikke-KNOX-sekvenser i blåt. Røde prikker ved sekvensnavnene angiver tilstedeværelsen af KN-A- eller KN-B-domæner, og blå prikker angiver tilstedeværelsen af et PBC-homologidomæne. Trunkerede sekvenser, der ikke er tilgængelige for homologidomæneanalyse, er markeret med åbne sorte bokse. Udfyldte sorte bokse angiver fravær af et KN-A/B- eller PBC-homologidomæne. Den foreslåede klassificering er angivet med de lodrette linjer. Stiplede lodrette linjer angiver foreslåede klassemedlemmer, der er placeret uden for hovedkladen for klassen i fylogenien. PBX-Red-sekvenser findes i fire separate klader, markeret med lilla nuancer på den blå del af de lodrette søjler. To PBX-Red-sekvenser markeret med den lilla firkant findes undtagelsesvis i KNOX-Red1-kladen, idet de har divergerende aminosyrer på stærkt konserverede positioner ved Trp19, His23 og Lys31 i deres homeodomæne, hvilket tyder på deres falske tilknytning til KNOX-Red1. Farverne på sekvensnavnene angiver deres fylogenetiske gruppe: Blå for Glaucophyta, lilla for Rhodophyta, grøn for prasinophytes, lyseblå for chlorophytes, orange for Streptophyta og sort for outgroups. Linealen viser den genetiske afstand. Nærmere oplysninger om de sekvenser, der er analyseret i denne fylogeni, findes i Additional file 1: Table S2. *Gloeochaete_wittrockiana_014496 betragtes som en sekvens fra en amøbe af bannelid-typen, der forurenede den oprindelige kultur (SAG46.84) for MMETSP1089-transkriptomet. **Associeringen af KNOX-Red2-klassens sekvenser til Amorphea PBC-sekvenser tilskrives et fælles WFGN-motiv, der bestemmer homeodomænets DNA-bindingsspecificitet via konvergent evolution

KNOX-gruppens sekvenser deler de samme heterodimeriseringsdomæner i hele Archaeplastida

Det næste spørgsmål var, om KNOX-klassen for planter stammer fra før Viridiplantae-fylummet. Plante KNOX-proteinerne og Chlorophyta GSM1 besidder KNOX-homologien, der består af KN-A, KN-B og ELK-domæner, som er nødvendige for deres heterodimerisering med andre TALE-proteiner ; derfor ville tilstedeværelsen af KNOX-homologien antyde potentialet for heterodimerisering til KNOX-gruppen. For at indsamle homologidomæner uden forudgående oplysninger udførte vi ad hoc-søgninger efter homologidomæner blandt KNOX-gruppens sekvenser. Ved hjælp af de identificerede homologidomæner som ankre kuraterede vi omhyggeligt en alignment af KNOX-gruppens sekvenser kombineret med eventuelle andre TALE-sekvenser med KNOX-homologi (Additional file 3: Figur S2). Ud fra denne KNOX-udligning fandt vi alle KNOX-gruppesekvenser (undtagen partielle sekvenser), der viste aminosyre-sammenfaldsscorer > 50 % for mindst to af de tre domæner, der omfatter KNOX-homologiregionen (Yderligere fil 1: Tabel S3 for beregnet domænehomologi). For at teste, om den observerede lighed er specifik for TALE-sekvenserne, genererede vi HMM-motiver for KN-A- og KN-B-domæner fra KNOX-udligningen, søgte dem i målgenomerne og bekræftede, at KN-A- og KN-B-domæner kun findes i TALE-sekvenserne (Yderligere fil 4: Data S1 og S2). Vi definerede dermed KNOX-homologer som de TALE-sekvenser, der har søgbar KNOX-homologi (Fig. 2, markeret med røde prikker efter deres ID’er), hvilket tyder på, at KNOX-homologet allerede eksisterede før udviklingen af eukaryotisk fotosyntese, som repræsenteret af Archaeplastida.

Ud over KNOX-homologien afslørede den samme søgning også to nye domæner ved homeodomænets C-terminus (Additional file 3: Figur S2): det første (KN-C1) blev delt blandt Chlorophyta-sekvenserne, og det andet (KN-C2) blev delt blandt en gruppe af KNOX-homologer i en klade uden for KNOX-gruppen (KNOX-Red2).

KNOX-klasser divergerede uafhængigt blandt algefylaerne

I Viridiplantae fandt vi et enkelt KNOX-homolog i de fleste Chlorophyta-arter, mens KNOX1- og KNOX2-divergens var tydelig i Streptophyta-divisionen, herunder charofyten Klebsormidium flaccidum og landplanter (Fig. 2). Det nyopdagede KN-C1-domæne var specifikt for Chlorophyta KNOX-sekvenserne og fandtes i alle arter undtagen én (Pyramimonas amylifera). Fraværet af lighed mellem KN-C1 og de C-terminale forlængelser af KNOX1/KNOX2-sekvenser tyder på en uafhængig, slægtsspecifik KNOX-evolution i Chlorophyta og Streptophyta (Additional file 3: Figur S2). Vi henviser derfor til Chlorophyta KNOX-klasserne som KNOX-Chloro i modsætning til KNOX1- og KNOX2-klasserne i Streptophyta.

KNOX-homologerne i Rhodophyta blev opdelt i to klasser: en parafyletisk gruppe tæt på KNOX-Chloro-kladen, kaldet KNOX-Red1, og en anden gruppe tæt på PBX-Out-gruppen, kaldet KNOX-Red2. KNOX-Red1 manglede et KN-A-domæne, mens KNOX-Red2 manglede et ELK-domæne og delte et KN-C2-domæne (Additional file 3: Figur S2). Vi anser KNOX-Red1 for at være den forfødte type, da KNOX-Red1-sekvenserne blev fundet i alle undersøgte Rhodophyta-taxaer, mens KNOX-Red2-sekvenserne var begrænset til to taksonomiske klasser (Cyanidiophyceae og Florideophyceae). Interessant nok omfattede KNOX-Red2-kladen to grønalgesekvenser med stærk statistisk støtte (89/89/0,97; Fig. 2); disse besad et KN-C2-domæne, hvilket tyder på, at de stammer fra KNOX-Red2-klassen (Yderligere fil 3: Figur S2; se Yderligere fil 2: Note S2 for yderligere diskussion om deres mulige oprindelse via horisontal genoverførsel).

Den tilgængelige TALE-sekvenser var begrænset for Glaucophyta. Vi fandt et enkelt KNOX-homolog i to arter, som besad KN-A- og KN-B-domæner, men manglede et ELK-domæne. Vi kaldte disse KNOX-Glauco.

TALE’er fra ikke-KNOX-gruppen besidder et PBC-homologidomæne af dyrisk type, hvilket tyder på en fælles forfædre mellem Archaeplastida og Metazoa

Efter identifikationen af KNOX-homologer blev de resterende TALE-sekvenser kombineret som ikke-KNOX-gruppen, der mangler KN-A- og KN-B-domæner i Archaeplastida. Yderligere klassificering af non-KNOX-gruppen var en udfordring på grund af dens meget divergerende homøodomænesekvenser. Vi bemærkede imidlertid, at antallet af non-KNOX gener pr. art var stort set uforanderligt: et i de fleste Rhodophyta og Glaucophyta genomer og to i de fleste Chlorophyta genomer, hvilket tyder på deres bevarelse inden for hver stråling.

Vores ad-hoc homologisøgning gav kritisk information til non-KNOX klassifikation, idet vi identificerede et homologidomæne, der deles mellem alle Glaucophyta og Rhodophyta non-KNOX sekvenser (fig. 3a, b). Da dette domæne viste en lighed med den anden halvdel af det animalske PBC-B-domæne (Pfam ID: PF03792) kendt som heterodimeriseringsdomæne , navngav vi dette domæne PBL (PBC-B Like). I overensstemmelse hermed klassificerede vi alle ikke-KNOX TALEs i Glaucophyta og Rhodophyta som en enkelt PBC-relateret homeobox-klasse, PBX-Glauco eller PBX-Red. PBX-Glauco-sekvenser besad også MEINOX-motivet, der er bevaret i det animalske PBC-B-domæne, hvilket indikerer fælles forfædre for PBC-B- og PBL-domænerne (Fig. 3a).

Fig. 3

Archaeplastida non-KNOX group TALEs besidder et PBC-lignende domæne (PBL) bestående af N-terminal MEINOX-homologi og C-terminal PBC-B-homologi. Aminosyrebogstaver i sort med grå nuancer, i hvidt med lyse nuancer og i hvidt med sorte nuancer viser mere end 60 %, 80 % eller 100 % lighed i hver kolonne. Omvendte røde trekanter angiver de kasserede sekvenser i ikke-alignerede indsættelser. a PBL-Glauco-domænet alignment, herunder to Glaucophyta-sekvenser, der deler homologi i både MEINOX-homologi og den C-terminale halvdel af PBC-B-domænet med ikke-Archaeplastida TALE-sekvenser. Den røde boks angiver ELK-domænet. b PBL-Red-domænet alignment. Alle Rhodophyta-sekvenser, der ikke er KNOX-sekvenser, har et PBL-domæne med ringe MEINOX-homologi. c PBL-Chloro-domænejustering. Cyanophora_paradox_20927.63 er medtaget til sammenligning. Picocystis_salinarum_02499 er et grundlæggermedlem af GLX-klassen med et PBL-Chloro-domæne. d Sammenligning mellem PBL-domæner. Den øverste række viser den konsensus, der er lavet ud fra alignmentet af (a), (b) og (c) kombineret, og de nederste konsensussekvenser er samlet fra de individuelle alignments, der er præsenteret i (a), (b), og (c)

GSP1 deler fjern PBC-homologi sammen med andre sekvenser fra ikke-KNOX-gruppen i Viridiplantae

Et tilbageværende spørgsmål var udviklingen af de Chlorophyta-ikke-KNOX-sekvenser, der tilsyneladende manglede en PBC-homologi. For at afdække selv en fjern homologi sammenlignede vi de nyligt definerede PBL-domæner med Chlorophyta-sekvenserne ved hjælp af BLAST (cut-off E-værdi på 1E-1) og multiple sekvensaligneringer. Denne forespørgsel fandt tre Prasinophyte- og en Charophyte-TALE-sekvenser, som havde et MEINOX-motiv og et formodet PBL-domæne; de viste imidlertid meget lav sekvensidentitet indbyrdes (Fig. 3c). Yderligere forespørgsel ved hjælp af disse fire sekvenser identificerede yderligere 11 ikke-KNOX-sekvenser. Ni af disse blev lavet i to alignments, hvoraf den ene omfattede GSP1-homologer og den anden kombinerede de fleste prasinophyte-sekvenser (Additional file 3: Figur S3). De to resterende sekvenser (Picocystis_salinarum_04995 og Klebsormidium_flaccidum_00021_0250) viste en homologi med en PBX-Red-sekvens fra Chondrus cruentum (ID:41034) i en ~ 200 aa-lang forlængelse ud over PBL-domænet, hvilket tyder på deres PBX-Red-forfædre (et andet potentielt tilfælde af horisontale overførsler; Yderligere fil 3: Figur S4). Alle Chlorophyta non-KNOX-sekvenser, der bærer PBL-homologidomæner, blev klassificeret som GLX (GSP1-lignende homeobox) som anerkendelse af GSP1-proteinet fra Chlamydomonas som det første karakteriserede medlem af denne klasse .

Er planternes BELL-klasse homologe med Chlorophyta GLX-klassen?

BELL-klassen er den eneste ikke-KNOX-klasse i landplanter, der deler et POX (Pre-homeobox)-domæne (PF07526) og mangler et identificerbart PBL-domæne. K. flaccidum-genomet, et af de to genomer, der er tilgængelige i den charofyt, hvorfra landplanten opstod, indeholdt tre ikke-KNOX-sekvenser, der alle besidder et PBL-domæne (Fig. 3, Additional file 3: Figures S3, S4). Det andet charophyte-genom af Chara braunii indeholdt et formodet BELL-homolog, som synes at være afkortet for de N-terminale sekvenser uden for dets C-terminale homeodomæne, muligvis på grund af den ufuldstændige genmodel. Manglen på PBL-homologi i planternes BELL-klasse synes derfor at skyldes divergens eller domænetab fra en gammel charofyt-klasse, der havde PBL-homologi. Vi fandt et intron på 24(2/3) homeodomain-positionen i et K. flaccidum GLX-homolog, som tidligere blev identificeret som værende specifikt for plante-BELL-klassen (Additional file 3: Figur S5) , hvilket tyder på, at plante-BELL-klassen udviklede sig fra et forfædret GLX-gen. Der er behov for flere taxonprøver i charofytter for at bekræfte denne slutning.

To ikke-KNOX-paraloger af Chlorophyta heterodimeriserer med KNOX-homologerne

Selv med vores følsomme iterative homologisøgning kunne vi ikke identificere en PBC/PBL-homologi i omkring halvdelen af Chlorophyta-ikke-KNOX-sekvenserne. Da de fleste Chlorophyta-genomer besidder et GLX-homolog og en ikke-KNOX-sekvens uden PBL-homologidomæne, henviser vi sidstnævnte kollektivt til klasse B (Additional file 3: Figur S6). Undtagelser blev fundet i en prasinophyte-klade (klasse Mamiellophyceae), hvis seks genomer af høj kvalitet alle indeholder to ikke-KNOX-sekvenser uden PBL-homologi. Ikke desto mindre dannede disse ikke-KNOX-sekvenser to grupper, hvoraf den ene var mere bevaret og den anden mindre bevaret og polyfyletisk, og som blev benævnt henholdsvis Mam-A- og Mam-B-klassen (Additional file 3: Figurer S7, S8). I betragtning af den reduktive genomudvikling af Mamiellophyceae , kan den bevarede Mam-A-klasse være afledt af en forfaderlig GLX-klasse.

To divergerende ikke-KNOX-klasser i Chlorophyta førte til et kritisk spørgsmål om deres dyadiske netværk. Tidligere undersøgelser havde vist, at TALE-heterodimere krævede interaktion mellem MEIS- og PBC-domæner i dyr og mellem KNOX- og PBL-domæner i Chlamydomonas . Det blev derfor forudsagt, at alle Glaucophyta- og Rhodophyta-TALE’er danner heterodimere via deres KNOX- og PBL-homologidomæner. På den anden side er det endnu ikke blevet testet, om Chlorophyta TALEs, der mangler en PBL-domæne, kan danne heterodimere med andre TALEs.

For at karakterisere interaktionsnetværket af TALE-klasseproteiner i Chlorophyta valgte vi tre prasinophyte-arter til protein-protein-interaktionsassays: to arter, der indeholder Mam-A- og Mam-B-gener (Micromonas commoda og Ostreococcus tauri), og en anden art (Picocystis salinarum), hvis transkriptom indeholdt en GLX- og en klasse-B-sekvens. I alle tre arter fandt vi, at KNOX-homologer interagerede med alle undersøgte ikke-KNOX-proteiner i Mam-A-, Mam-B-, Class-B- og GLX-klassen (Fig. 4a-c). Der blev ikke observeret nogen interaktion mellem de to ikke-KNOX-proteiner i nogen af de tre arter (Fig. 4a-c). I lighed med GLX-KNOX-heterodimeriseringen krævede Mam-A og Mam-B også yderligere domæner uden for homeodomænet for deres heterodimerisering med KNOX-homologerne (Additional file 3: Figur S9). Disse resultater viste, at alle de divergerende ikke-KNOX TALE’er bevarede deres oprindelige aktivitet til at danne heterodimere med KNOX-homologerne. Det observerede interagerende netværk blandt TALE-sekvenserne er opsummeret i Additional file 3: Figur S10.

Fig. 4

TALE TF’er indgår i heterodimeriseringsnetværk mellem KNOX- og ikke-KNOX-grupper. Lokkemadskonstruktionerne konjugeret til GAL4’s DNA-bindingsdomæne (DBD) og byttekonstruktioner konjugeret til GAL4’s transkriptionelle aktiveringsdomæne (AD) er opført i tabellen. Konstruktionskombinationer, der er nummereret 1-8, er anbragt i kiler i urets retning, begyndende ved klokken 9 som mærket i -LT-panelerne. Bekræftede interagerende par er vist med fed skrift i tabellen. Parret laminin og T-antigen (T-Ag), som vides at være interagerende partnere, blev udplottet i den 8. sektor som en positiv kontrol. a Analyser med M. commoda TALEs. b Analyser med O. tauri TALEs. c Analyser med P. salinarum TALEs. KNOX-tr henviser til den N-terminale afkortede KNOX-konstruktion for at forhindre selvaktivering. d Detaljerede konstruktionsoplysninger findes i Additional file 1: Table S5

TALE heterodimerisering udviklede sig tidligt i eukaryotisk historie

Vores opdagelse af PBC-homologien i Archaeplastida tyder på fælles forfædre for de heterodimeriserende TALES mellem Metazoa og Archaeplastida. Det forudsagde også, at andre eukaryote slægter kunne besidde TALEs med PBC-homologien. Uden for dyrene indeholder Pfam-databasen kun to PBC-B-domænebærende sekvenser, den ene fra en Cryptophyta-art (Guillardia theta, ID:137502) og den anden fra en Amoebozoa-art (Acanthamoeba castillian, ID:XP_004342337) . Vi undersøgte yderligere Excavata-gruppen, som ligger tæt på den formodede rod i den eukaryote fylogeni . En søgning i to genomer (Naegleria gruberi og Bodo saltans) indsamlede 12 TALE-homeobox-sekvenser i N.gruberi og ingen i B.saltans, hvoraf vi fandt en med et PBC-homologidomæne (ID:78561, Fig. 3a) og en med en MEIS/KNOX-homologi (ID:79931, Additional file 3: Figur S2). Vi søgte yderligere genomer i Amorphea og fandt PBC-homologien og MEIS/KNOX-homologien i TALE-sekvenserne indsamlet fra Apusozoa, Ichtyhosporea og Choanoflagellata, men ikke fra Fungi (Additional file 3: Figures S11-S14). Vores data tyder på, at heterodimeriseringsdomænerne – PBC-homologien og MEIS/KNOX-homologien – opstod tidligt i den eukaryote evolution og varede ved gennem de store eukaryote radiationer.

Intron-retention understøtter den parallelle evolution af de heterodimere TALE-klasser under eukaryote radiationer

Den allestedsnærværende tilstedeværelse af dyadiske TALE’er rejste næste spørgsmål: Er alle de dyadiske TALEs rapporteret i denne undersøgelse efterkommere af en enkelt forfaderlig dyade, eller er de et resultat af lineage-specifik evolution fra en enkelt prototypisk TALE (proto-TALE), der ikke deltager i heterodimerisering. For at undersøge den dybe afstamning undersøgte vi intron-retention, idet dette betragtes som en længe bevaret karakter og mindre tilbøjelig til at opstå ved homoplasi (en karakter, der vises af et sæt arter, men som ikke er til stede i deres fælles forfader) . Fem intronpositioner blev delt af mindst to TALE-klasser, hvoraf 44/45- og 48(2/3)-intronerne kvalificerede sig som de mest forfædrene, da de blev fundet overalt i Archaeplastida og Metazoa (Additional file 3: Figur S5).

Intronerne 44/45 og 48(2/3) viste en spændende eksklusiv fordeling mellem de to dyadiske partnere i hver stamme: den ene besidder 44/45- og den anden besidder 48(2/3)-intronet (Yderligere fil 3: Figur S5). Dette gensidigt eksklusive mønster tyder på, at der eksisterede to TALE-gener med forskellige intronpositioner ved begyndelsen af den eukaryote stråling. Vi betragter 44/45-intronpositionen som den mest forfødte, da den var bevaret i de fleste ikke-TALE-homeoboksgener . I denne henseende spekulerer vi på, at erhvervelse af 48(2/3) og tab af 44/45-intronet ledsagede en tidlig begivenhed, hvor proto-TALE med 44/45-intronet blev duplikeret for at generere et andet TALE med 48(2/3)-intronet. Da intronpositionen 48(2/3) blev fundet inden for KNOX/MEIS-gruppens gener i Viridiplantae og Metazoa og også i PBX-gruppens gener i Rhodophyta og Cryptophyta, kan vi spekulere i, at de duplikerede TALE’er opstod tidligt og diversificerede sig for at etablere slægtsspecifikke heterodimere konfigurationer under eukaryotiske radiationer. Alternativt kan 48(2/3) intronpositionen i TALE-homeodomænet være blevet erhvervet mange gange under eukaryote radiationer.

I betragtning af, at de heterodimere TALE’er udviklede sig på en slægtsspecifik måde, spurgte vi, hvordan proto-TALE’en så ud på det tidspunkt, hvor den undergik en duplikation. Følgende observationer tyder på, at proto-TALE var et homodimeriserende protein. For det første omfatter PBC-homologidomænerne for PBX/GLX-klasseproteiner identificeret i Archaeplastida MEINOX-motivet, som oprindeligt blev defineret på grund af dets lighed med MEIS/KNOX-homologidomænerne (Fig. 3) . For det andet besidder PBX-Glauco-sekvenser ELK-homologien i deres PBL-domæne (Fig. 3), som flugter godt med ELK-domænerne i KNOX-klassesekvenser i Viridiplantae (Additional file 3: Figur S15). Derfor støttede MEINOX-motivet og ELK-homologien på tværs af de heterodimeriserende KNOX- og PBX-grupper den fælles oprindelse af heterodimeriserende TALE-grupper fra en enkelt TALE ved duplikation efterfulgt af subfunktionalisering.

Similar Posts

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.