- TALEs i Archaeplastida er opdelt i to grupper, KNOX og ikke-KNOX
- KNOX-gruppens sekvenser deler de samme heterodimeriseringsdomæner i hele Archaeplastida
- KNOX-klasser divergerede uafhængigt blandt algefylaerne
- TALE’er fra ikke-KNOX-gruppen besidder et PBC-homologidomæne af dyrisk type, hvilket tyder på en fælles forfædre mellem Archaeplastida og Metazoa
- GSP1 deler fjern PBC-homologi sammen med andre sekvenser fra ikke-KNOX-gruppen i Viridiplantae
- Er planternes BELL-klasse homologe med Chlorophyta GLX-klassen?
- To ikke-KNOX-paraloger af Chlorophyta heterodimeriserer med KNOX-homologerne
- TALE heterodimerisering udviklede sig tidligt i eukaryotisk historie
- Intron-retention understøtter den parallelle evolution af de heterodimere TALE-klasser under eukaryote radiationer
TALEs i Archaeplastida er opdelt i to grupper, KNOX og ikke-KNOX
For at samle alle tilgængelige homeobox-proteinsekvenser udførte vi BLAST- og Pfam-motif-søgninger mod ikke-plantegenomer og transkriptom-sammensætninger i hele Archaeplastida og identificerede 338 proteiner fra 56 arter som Archaeplastida homeobox-samlingen (30 genomer og 18 transkriptomer; Yderligere fil 1: Tabel S1). Af disse havde 104 af dem det definerende træk ved TALE-proteiner, en indsættelse af tre aminosyrer mellem aa positionerne 23-24 i homeodomænet . Der blev påvist mindst to TALE-gener i de fleste genomer undtagen fem genomer i klassen Trebouxiophyceae i Chlorophyta (Additional file 1: Table S1; se Additional file 2: Note S1 for yderligere diskussion af fraværet af TALE’er i Trebouxiophyceae).
De indsamlede TALE-sekvenser blev derefter klassificeret efter deres homeodomænegenskaber ved hjælp af en fylogenetisk tilgang, med TALE’er fra dyr, planter og tidligt-divergerende eukaryoter (Amoebozoa og Excavata) som outgroups (Yderligere fil 3: Figur S1). Den resulterende TALE-homeodomæne-fylogeni adskilte to grupper i alle tre archaeplastida-fylaer (Fig. 2). (1) KNOX-gruppen som en velunderstøttet klade viste et phylumspecifikt kladogram: to Glaucophyta-sekvenser i bunden (som KNOX-Glauco) var adskilt fra den næste klade, som kombinerer Rhodophyta-sekvenser (som KNOX-Red1) og en Viridiplantae-specifik klade med stærk støtte (92/90/1,00). (2) Ikke-KNOX-gruppen, herunder BELL- og GSP1-homologerne, indeholdt klader af blandet taksonomisk tilhørsforhold. Disse analyser viste, at TALE-proteinerne allerede var divergeret i to grupper før udviklingen af Archaeplastida, og at KNOX-gruppen er stærkt bevaret i hele Archaeplastida.
KNOX-gruppens sekvenser deler de samme heterodimeriseringsdomæner i hele Archaeplastida
Det næste spørgsmål var, om KNOX-klassen for planter stammer fra før Viridiplantae-fylummet. Plante KNOX-proteinerne og Chlorophyta GSM1 besidder KNOX-homologien, der består af KN-A, KN-B og ELK-domæner, som er nødvendige for deres heterodimerisering med andre TALE-proteiner ; derfor ville tilstedeværelsen af KNOX-homologien antyde potentialet for heterodimerisering til KNOX-gruppen. For at indsamle homologidomæner uden forudgående oplysninger udførte vi ad hoc-søgninger efter homologidomæner blandt KNOX-gruppens sekvenser. Ved hjælp af de identificerede homologidomæner som ankre kuraterede vi omhyggeligt en alignment af KNOX-gruppens sekvenser kombineret med eventuelle andre TALE-sekvenser med KNOX-homologi (Additional file 3: Figur S2). Ud fra denne KNOX-udligning fandt vi alle KNOX-gruppesekvenser (undtagen partielle sekvenser), der viste aminosyre-sammenfaldsscorer > 50 % for mindst to af de tre domæner, der omfatter KNOX-homologiregionen (Yderligere fil 1: Tabel S3 for beregnet domænehomologi). For at teste, om den observerede lighed er specifik for TALE-sekvenserne, genererede vi HMM-motiver for KN-A- og KN-B-domæner fra KNOX-udligningen, søgte dem i målgenomerne og bekræftede, at KN-A- og KN-B-domæner kun findes i TALE-sekvenserne (Yderligere fil 4: Data S1 og S2). Vi definerede dermed KNOX-homologer som de TALE-sekvenser, der har søgbar KNOX-homologi (Fig. 2, markeret med røde prikker efter deres ID’er), hvilket tyder på, at KNOX-homologet allerede eksisterede før udviklingen af eukaryotisk fotosyntese, som repræsenteret af Archaeplastida.
Ud over KNOX-homologien afslørede den samme søgning også to nye domæner ved homeodomænets C-terminus (Additional file 3: Figur S2): det første (KN-C1) blev delt blandt Chlorophyta-sekvenserne, og det andet (KN-C2) blev delt blandt en gruppe af KNOX-homologer i en klade uden for KNOX-gruppen (KNOX-Red2).
KNOX-klasser divergerede uafhængigt blandt algefylaerne
I Viridiplantae fandt vi et enkelt KNOX-homolog i de fleste Chlorophyta-arter, mens KNOX1- og KNOX2-divergens var tydelig i Streptophyta-divisionen, herunder charofyten Klebsormidium flaccidum og landplanter (Fig. 2). Det nyopdagede KN-C1-domæne var specifikt for Chlorophyta KNOX-sekvenserne og fandtes i alle arter undtagen én (Pyramimonas amylifera). Fraværet af lighed mellem KN-C1 og de C-terminale forlængelser af KNOX1/KNOX2-sekvenser tyder på en uafhængig, slægtsspecifik KNOX-evolution i Chlorophyta og Streptophyta (Additional file 3: Figur S2). Vi henviser derfor til Chlorophyta KNOX-klasserne som KNOX-Chloro i modsætning til KNOX1- og KNOX2-klasserne i Streptophyta.
KNOX-homologerne i Rhodophyta blev opdelt i to klasser: en parafyletisk gruppe tæt på KNOX-Chloro-kladen, kaldet KNOX-Red1, og en anden gruppe tæt på PBX-Out-gruppen, kaldet KNOX-Red2. KNOX-Red1 manglede et KN-A-domæne, mens KNOX-Red2 manglede et ELK-domæne og delte et KN-C2-domæne (Additional file 3: Figur S2). Vi anser KNOX-Red1 for at være den forfødte type, da KNOX-Red1-sekvenserne blev fundet i alle undersøgte Rhodophyta-taxaer, mens KNOX-Red2-sekvenserne var begrænset til to taksonomiske klasser (Cyanidiophyceae og Florideophyceae). Interessant nok omfattede KNOX-Red2-kladen to grønalgesekvenser med stærk statistisk støtte (89/89/0,97; Fig. 2); disse besad et KN-C2-domæne, hvilket tyder på, at de stammer fra KNOX-Red2-klassen (Yderligere fil 3: Figur S2; se Yderligere fil 2: Note S2 for yderligere diskussion om deres mulige oprindelse via horisontal genoverførsel).
Den tilgængelige TALE-sekvenser var begrænset for Glaucophyta. Vi fandt et enkelt KNOX-homolog i to arter, som besad KN-A- og KN-B-domæner, men manglede et ELK-domæne. Vi kaldte disse KNOX-Glauco.
TALE’er fra ikke-KNOX-gruppen besidder et PBC-homologidomæne af dyrisk type, hvilket tyder på en fælles forfædre mellem Archaeplastida og Metazoa
Efter identifikationen af KNOX-homologer blev de resterende TALE-sekvenser kombineret som ikke-KNOX-gruppen, der mangler KN-A- og KN-B-domæner i Archaeplastida. Yderligere klassificering af non-KNOX-gruppen var en udfordring på grund af dens meget divergerende homøodomænesekvenser. Vi bemærkede imidlertid, at antallet af non-KNOX gener pr. art var stort set uforanderligt: et i de fleste Rhodophyta og Glaucophyta genomer og to i de fleste Chlorophyta genomer, hvilket tyder på deres bevarelse inden for hver stråling.
Vores ad-hoc homologisøgning gav kritisk information til non-KNOX klassifikation, idet vi identificerede et homologidomæne, der deles mellem alle Glaucophyta og Rhodophyta non-KNOX sekvenser (fig. 3a, b). Da dette domæne viste en lighed med den anden halvdel af det animalske PBC-B-domæne (Pfam ID: PF03792) kendt som heterodimeriseringsdomæne , navngav vi dette domæne PBL (PBC-B Like). I overensstemmelse hermed klassificerede vi alle ikke-KNOX TALEs i Glaucophyta og Rhodophyta som en enkelt PBC-relateret homeobox-klasse, PBX-Glauco eller PBX-Red. PBX-Glauco-sekvenser besad også MEINOX-motivet, der er bevaret i det animalske PBC-B-domæne, hvilket indikerer fælles forfædre for PBC-B- og PBL-domænerne (Fig. 3a).
GSP1 deler fjern PBC-homologi sammen med andre sekvenser fra ikke-KNOX-gruppen i Viridiplantae
Et tilbageværende spørgsmål var udviklingen af de Chlorophyta-ikke-KNOX-sekvenser, der tilsyneladende manglede en PBC-homologi. For at afdække selv en fjern homologi sammenlignede vi de nyligt definerede PBL-domæner med Chlorophyta-sekvenserne ved hjælp af BLAST (cut-off E-værdi på 1E-1) og multiple sekvensaligneringer. Denne forespørgsel fandt tre Prasinophyte- og en Charophyte-TALE-sekvenser, som havde et MEINOX-motiv og et formodet PBL-domæne; de viste imidlertid meget lav sekvensidentitet indbyrdes (Fig. 3c). Yderligere forespørgsel ved hjælp af disse fire sekvenser identificerede yderligere 11 ikke-KNOX-sekvenser. Ni af disse blev lavet i to alignments, hvoraf den ene omfattede GSP1-homologer og den anden kombinerede de fleste prasinophyte-sekvenser (Additional file 3: Figur S3). De to resterende sekvenser (Picocystis_salinarum_04995 og Klebsormidium_flaccidum_00021_0250) viste en homologi med en PBX-Red-sekvens fra Chondrus cruentum (ID:41034) i en ~ 200 aa-lang forlængelse ud over PBL-domænet, hvilket tyder på deres PBX-Red-forfædre (et andet potentielt tilfælde af horisontale overførsler; Yderligere fil 3: Figur S4). Alle Chlorophyta non-KNOX-sekvenser, der bærer PBL-homologidomæner, blev klassificeret som GLX (GSP1-lignende homeobox) som anerkendelse af GSP1-proteinet fra Chlamydomonas som det første karakteriserede medlem af denne klasse .
Er planternes BELL-klasse homologe med Chlorophyta GLX-klassen?
BELL-klassen er den eneste ikke-KNOX-klasse i landplanter, der deler et POX (Pre-homeobox)-domæne (PF07526) og mangler et identificerbart PBL-domæne. K. flaccidum-genomet, et af de to genomer, der er tilgængelige i den charofyt, hvorfra landplanten opstod, indeholdt tre ikke-KNOX-sekvenser, der alle besidder et PBL-domæne (Fig. 3, Additional file 3: Figures S3, S4). Det andet charophyte-genom af Chara braunii indeholdt et formodet BELL-homolog, som synes at være afkortet for de N-terminale sekvenser uden for dets C-terminale homeodomæne, muligvis på grund af den ufuldstændige genmodel. Manglen på PBL-homologi i planternes BELL-klasse synes derfor at skyldes divergens eller domænetab fra en gammel charofyt-klasse, der havde PBL-homologi. Vi fandt et intron på 24(2/3) homeodomain-positionen i et K. flaccidum GLX-homolog, som tidligere blev identificeret som værende specifikt for plante-BELL-klassen (Additional file 3: Figur S5) , hvilket tyder på, at plante-BELL-klassen udviklede sig fra et forfædret GLX-gen. Der er behov for flere taxonprøver i charofytter for at bekræfte denne slutning.
To ikke-KNOX-paraloger af Chlorophyta heterodimeriserer med KNOX-homologerne
Selv med vores følsomme iterative homologisøgning kunne vi ikke identificere en PBC/PBL-homologi i omkring halvdelen af Chlorophyta-ikke-KNOX-sekvenserne. Da de fleste Chlorophyta-genomer besidder et GLX-homolog og en ikke-KNOX-sekvens uden PBL-homologidomæne, henviser vi sidstnævnte kollektivt til klasse B (Additional file 3: Figur S6). Undtagelser blev fundet i en prasinophyte-klade (klasse Mamiellophyceae), hvis seks genomer af høj kvalitet alle indeholder to ikke-KNOX-sekvenser uden PBL-homologi. Ikke desto mindre dannede disse ikke-KNOX-sekvenser to grupper, hvoraf den ene var mere bevaret og den anden mindre bevaret og polyfyletisk, og som blev benævnt henholdsvis Mam-A- og Mam-B-klassen (Additional file 3: Figurer S7, S8). I betragtning af den reduktive genomudvikling af Mamiellophyceae , kan den bevarede Mam-A-klasse være afledt af en forfaderlig GLX-klasse.
To divergerende ikke-KNOX-klasser i Chlorophyta førte til et kritisk spørgsmål om deres dyadiske netværk. Tidligere undersøgelser havde vist, at TALE-heterodimere krævede interaktion mellem MEIS- og PBC-domæner i dyr og mellem KNOX- og PBL-domæner i Chlamydomonas . Det blev derfor forudsagt, at alle Glaucophyta- og Rhodophyta-TALE’er danner heterodimere via deres KNOX- og PBL-homologidomæner. På den anden side er det endnu ikke blevet testet, om Chlorophyta TALEs, der mangler en PBL-domæne, kan danne heterodimere med andre TALEs.
For at karakterisere interaktionsnetværket af TALE-klasseproteiner i Chlorophyta valgte vi tre prasinophyte-arter til protein-protein-interaktionsassays: to arter, der indeholder Mam-A- og Mam-B-gener (Micromonas commoda og Ostreococcus tauri), og en anden art (Picocystis salinarum), hvis transkriptom indeholdt en GLX- og en klasse-B-sekvens. I alle tre arter fandt vi, at KNOX-homologer interagerede med alle undersøgte ikke-KNOX-proteiner i Mam-A-, Mam-B-, Class-B- og GLX-klassen (Fig. 4a-c). Der blev ikke observeret nogen interaktion mellem de to ikke-KNOX-proteiner i nogen af de tre arter (Fig. 4a-c). I lighed med GLX-KNOX-heterodimeriseringen krævede Mam-A og Mam-B også yderligere domæner uden for homeodomænet for deres heterodimerisering med KNOX-homologerne (Additional file 3: Figur S9). Disse resultater viste, at alle de divergerende ikke-KNOX TALE’er bevarede deres oprindelige aktivitet til at danne heterodimere med KNOX-homologerne. Det observerede interagerende netværk blandt TALE-sekvenserne er opsummeret i Additional file 3: Figur S10.
TALE heterodimerisering udviklede sig tidligt i eukaryotisk historie
Vores opdagelse af PBC-homologien i Archaeplastida tyder på fælles forfædre for de heterodimeriserende TALES mellem Metazoa og Archaeplastida. Det forudsagde også, at andre eukaryote slægter kunne besidde TALEs med PBC-homologien. Uden for dyrene indeholder Pfam-databasen kun to PBC-B-domænebærende sekvenser, den ene fra en Cryptophyta-art (Guillardia theta, ID:137502) og den anden fra en Amoebozoa-art (Acanthamoeba castillian, ID:XP_004342337) . Vi undersøgte yderligere Excavata-gruppen, som ligger tæt på den formodede rod i den eukaryote fylogeni . En søgning i to genomer (Naegleria gruberi og Bodo saltans) indsamlede 12 TALE-homeobox-sekvenser i N.gruberi og ingen i B.saltans, hvoraf vi fandt en med et PBC-homologidomæne (ID:78561, Fig. 3a) og en med en MEIS/KNOX-homologi (ID:79931, Additional file 3: Figur S2). Vi søgte yderligere genomer i Amorphea og fandt PBC-homologien og MEIS/KNOX-homologien i TALE-sekvenserne indsamlet fra Apusozoa, Ichtyhosporea og Choanoflagellata, men ikke fra Fungi (Additional file 3: Figures S11-S14). Vores data tyder på, at heterodimeriseringsdomænerne – PBC-homologien og MEIS/KNOX-homologien – opstod tidligt i den eukaryote evolution og varede ved gennem de store eukaryote radiationer.
Intron-retention understøtter den parallelle evolution af de heterodimere TALE-klasser under eukaryote radiationer
Den allestedsnærværende tilstedeværelse af dyadiske TALE’er rejste næste spørgsmål: Er alle de dyadiske TALEs rapporteret i denne undersøgelse efterkommere af en enkelt forfaderlig dyade, eller er de et resultat af lineage-specifik evolution fra en enkelt prototypisk TALE (proto-TALE), der ikke deltager i heterodimerisering. For at undersøge den dybe afstamning undersøgte vi intron-retention, idet dette betragtes som en længe bevaret karakter og mindre tilbøjelig til at opstå ved homoplasi (en karakter, der vises af et sæt arter, men som ikke er til stede i deres fælles forfader) . Fem intronpositioner blev delt af mindst to TALE-klasser, hvoraf 44/45- og 48(2/3)-intronerne kvalificerede sig som de mest forfædrene, da de blev fundet overalt i Archaeplastida og Metazoa (Additional file 3: Figur S5).
Intronerne 44/45 og 48(2/3) viste en spændende eksklusiv fordeling mellem de to dyadiske partnere i hver stamme: den ene besidder 44/45- og den anden besidder 48(2/3)-intronet (Yderligere fil 3: Figur S5). Dette gensidigt eksklusive mønster tyder på, at der eksisterede to TALE-gener med forskellige intronpositioner ved begyndelsen af den eukaryote stråling. Vi betragter 44/45-intronpositionen som den mest forfødte, da den var bevaret i de fleste ikke-TALE-homeoboksgener . I denne henseende spekulerer vi på, at erhvervelse af 48(2/3) og tab af 44/45-intronet ledsagede en tidlig begivenhed, hvor proto-TALE med 44/45-intronet blev duplikeret for at generere et andet TALE med 48(2/3)-intronet. Da intronpositionen 48(2/3) blev fundet inden for KNOX/MEIS-gruppens gener i Viridiplantae og Metazoa og også i PBX-gruppens gener i Rhodophyta og Cryptophyta, kan vi spekulere i, at de duplikerede TALE’er opstod tidligt og diversificerede sig for at etablere slægtsspecifikke heterodimere konfigurationer under eukaryotiske radiationer. Alternativt kan 48(2/3) intronpositionen i TALE-homeodomænet være blevet erhvervet mange gange under eukaryote radiationer.
I betragtning af, at de heterodimere TALE’er udviklede sig på en slægtsspecifik måde, spurgte vi, hvordan proto-TALE’en så ud på det tidspunkt, hvor den undergik en duplikation. Følgende observationer tyder på, at proto-TALE var et homodimeriserende protein. For det første omfatter PBC-homologidomænerne for PBX/GLX-klasseproteiner identificeret i Archaeplastida MEINOX-motivet, som oprindeligt blev defineret på grund af dets lighed med MEIS/KNOX-homologidomænerne (Fig. 3) . For det andet besidder PBX-Glauco-sekvenser ELK-homologien i deres PBL-domæne (Fig. 3), som flugter godt med ELK-domænerne i KNOX-klassesekvenser i Viridiplantae (Additional file 3: Figur S15). Derfor støttede MEINOX-motivet og ELK-homologien på tværs af de heterodimeriserende KNOX- og PBX-grupper den fælles oprindelse af heterodimeriserende TALE-grupper fra en enkelt TALE ved duplikation efterfulgt af subfunktionalisering.