- Factorii de transcripție TALE din Archaeplastida sunt împărțiți în două grupuri, KNOX și non-KNOX
- Secvențele grupului KNOX împărtășesc aceleași domenii de heterodimerizare în toate Archaeplastida
- Classele KNOX au avut divergențe independente între filoanele algale
- Secvențele TALE din grupul non-KNOX posedă un domeniu PBC-homologie de tip animal, sugerând o ascendență comună între Archaeplastida și Metazoa
- GSP1 împărtășește PBC-homologia îndepărtată împreună cu alte secvențe din grupul non-KNOX din Viridiplantae
- Clasa BELL din plante este omologă clasei GLX din Chlorophyta?
- Doi paralogi non-KNOX din Chlorophyta se heterodimerizează cu omologii KNOX
- Heterodimerizarea TALE a evoluat la începutul istoriei eucariote
- Reținerea intronilor susține evoluția paralelă a claselor TALE heterodimerice în timpul radiațiilor eucariote
Factorii de transcripție TALE din Archaeplastida sunt împărțiți în două grupuri, KNOX și non-KNOX
Pentru a colecta toate secvențele de proteine homeobox disponibile, am efectuat căutări BLAST și Pfam-motif împotriva genomurilor non-plante și a ansamblurilor de transcriptome din întreaga Archaeplastida, identificând 338 de proteine din 56 de specii ca fiind colecția de homeobox din Archaeplastida (30 de genomuri și 18 transcriptome; Fișierul suplimentar 1: Tabelul S1). Dintre acestea, 104 posedau caracteristica definitorie a proteinelor TALE, o inserție de trei aminoacizi între pozițiile aa 23-24 în homeodomain . Cel puțin două gene TALE au fost detectate în majoritatea genomurilor, cu excepția a cinci genomuri din clasa Trebouxiophyceae din Chlorophyta (Fișier suplimentar 1: Tabelul S1; a se vedea Fișierul suplimentar 2: Nota S1 pentru o discuție suplimentară privind absența TALE-urilor în Trebouxiophyceae).
Secvențele TALE colectate au fost apoi clasificate în funcție de caracteristicile homeodomului lor folosind o abordare filogenetică, cu TALE-uri de la animale, plante și eucariote cu divergență timpurie (Amoebozoa și Excavata) ca grupuri externe (Fișier suplimentar 3: Figura S1). Filogenia rezultată a homeodomeniilor TALE a distins două grupuri în toate cele trei filoane de Archaeplastida (Fig. 2). (1) Grupul KNOX, ca o cladă bine susținută, a afișat o cladogramă specifică filumului: două secvențe Glaucophyta de la bază (ca KNOX-Glauco) au fost separate de următoarea cladă, care combină secvențe Rhodophyta (ca KNOX-Red1) și o cladă specifică Viridiplantae cu un sprijin puternic (92/90/1.00). (2) Grupul non-KNOX, care include omologii BELL și GSP1, conținea clade de afilieri taxonomice mixte. Aceste analize au arătat că proteinele TALE au deviat deja în două grupuri înainte de evoluția Archaeplastida și că grupul KNOX este foarte bine conservat în Archaeplastida.
Secvențele grupului KNOX împărtășesc aceleași domenii de heterodimerizare în toate Archaeplastida
Întrebarea următoare a fost dacă clasa KNOX din plante își are originea înainte de phylum-ul Viridiplantae. Proteinele KNOX din plante și Chlorophyta GSM1 posedă homologia KNOX, formată din domeniile KN-A, KN-B și ELK, necesară pentru heterodimerizarea lor cu alte proteine TALE ; prin urmare, prezența homologiei KNOX ar sugera potențialul de heterodimerizare la grupul KNOX. Pentru a colecta domenii de homologie fără informații prealabile, am efectuat căutări ad-hoc de domenii de homologie printre secvențele grupului KNOX. Folosind domeniile de homologie identificate ca ancore, am curatoriat cu atenție o aliniere a secvențelor din grupul KNOX combinate cu orice alte secvențe TALE cu o homologie KNOX, (Fișier suplimentar 3: Figura S2). Din această aliniere KNOX, am găsit toate secvențele grupului KNOX (cu excepția secvențelor parțiale) care prezintă scoruri de similaritate a aminoacizilor > 50% pentru cel puțin două dintre cele trei domenii care cuprind regiunea KNOX-homologie (Fișierul suplimentar 1: Tabelul S3 pentru omologia domeniului calculată). Pentru a testa dacă similitudinea observată este specifică secvențelor TALE, am generat motive HMM pentru domeniile KN-A și KN-B din alinierea KNOX, le-am căutat în genomurile țintă și am confirmat că domeniile KN-A și KN-B se găsesc numai în secvențele TALE (Fișier suplimentar 4: Date S1 și S2). Astfel, am definit KNOX-homologii KNOX ca fiind secvențele TALE care posedă o homologie KNOX care poate fi căutată (Fig. 2, marcate cu puncte roșii după ID-urile lor), sugerând că KNOX-homologul KNOX exista deja înainte de evoluția fotosintezei eucariote, așa cum este reprezentată de Archaeplastida.
În plus față de KNOX-homologia, aceeași căutare a dezvăluit, de asemenea, două domenii noi la extremitatea C-terminală a homeodomeniului (Fișier suplimentar 3: Figura S2): primul (KN-C1) a fost împărtășit printre secvențele Chlorophyta, iar al doilea (KN-C2) a fost împărtășit printre un grup de omologi KNOX dintr-o cladă din afara grupului KNOX (KNOX-Red2).
Classele KNOX au avut divergențe independente între filoanele algale
În Viridiplantae, am găsit un singur omolog KNOX în majoritatea speciilor Chlorophyta, în timp ce divergența KNOX1 și KNOX2 a fost evidentă în diviziunea Streptophyta, inclusiv în carofitul Klebsormidium flaccidum și în plantele terestre (Fig. 2). Domeniul KN-C1 recent descoperit a fost specific secvențelor KNOX din Chlorophyta și a fost găsit la toate speciile, cu excepția uneia (Pyramimonas amylifera). Absența similitudinii dintre KN-C1 și extensiile C-terminale ale secvențelor KNOX1/KNOX2 sugerează o evoluție KNOX independentă, specifică pentru fiecare linie genetică, în Chlorophyta și Streptophyta (Fișier suplimentar 3: Figura S2). Prin urmare, ne referim la clasele KNOX din Chlorophyta ca fiind KNOX-Chloro, spre deosebire de clasele KNOX1 și KNOX2 din Streptophyta.
Omologii KNOX din Rhodophyta au fost împărțiți în două clase: un grup parafilitic apropiat de clada KNOX-Chloro, numit KNOX-Red1, și un al doilea grup apropiat de PBX-Outgroup, numit KNOX-Red2. KNOX-Red1 nu avea un KN-A, în timp ce KNOX-Red2 nu avea un ELK și împărțea un domeniu KN-C2 (Fișier suplimentar 3: Figura S2). Considerăm că KNOX-Red1 este tipul ancestral, deoarece secvențele KNOX-Red1 au fost găsite în toți taxonii Rhodophyta examinați, în timp ce secvențele KNOX-Red2 au fost limitate la două clase taxonomice (Cyanidiophyceae și Florideophyceae). În mod interesant, clada KNOX-Red2 a inclus două secvențe de alge verzi, cu un puternic suport statistic (89/89/0,97; Fig. 2); acestea posedau un domeniu KN-C2, sugerând ascendența lor în cadrul clasei KNOX-Red2 (Fișier suplimentar 3: Figura S2; a se vedea Fișierul suplimentar 2: Nota S2 pentru o discuție suplimentară despre posibila lor origine prin transfer orizontal de gene).
Secvențele TALE disponibile au fost limitate pentru Glaucophyta. Am găsit un singur omolog KNOX în două specii, care poseda domeniile KN-A și KN-B, dar nu avea un domeniu ELK. Le-am denumit KNOX-Glauco.
Secvențele TALE din grupul non-KNOX posedă un domeniu PBC-homologie de tip animal, sugerând o ascendență comună între Archaeplastida și Metazoa
În urma identificării omologilor KNOX, secvențele TALE rămase au fost combinate ca grup non-KNOX care nu are domeniile KN-A și KN-B în Archaeplastida. Clasificarea ulterioară a grupului non-KNOX a fost o provocare din cauza secvențelor sale foarte divergente de homeodomane. Cu toate acestea, am observat că numărul de gene non-KNOX per specie a fost în mare parte invariabil: una în majoritatea genomurilor Rhodophyta și Glaucophyta și două în majoritatea genomurilor Chlorophyta, sugerând conservarea lor în cadrul fiecărei radiații.
Cercetarea noastră ad-hoc de homologie a furnizat informații critice pentru clasificarea non-KNOX, identificând un domeniu de homologie împărtășit între toate secvențele non-KNOX Glaucophyta și Rhodophyta (Fig. 3a, b). Deoarece acest domeniu a prezentat o asemănare cu a doua jumătate a domeniului PBC-B animal (Pfam ID: PF03792) cunoscut ca domeniu de heterodimerizare , am numit acest domeniu PBL (PBC-B Like). În consecință, am clasificat toate TALE-urile non-KNOX din Glaucophyta și Rhodophyta ca fiind o singură clasă homeobox legată de PBC, PBX-Glauco sau PBX-Red. Secvențele PBX-Glauco posedau, de asemenea, motivul MEINOX, conservat în domeniul PBC-B al animalelor, indicând o ascendență comună a domeniilor PBC-B și PBL (Fig. 3a).
GSP1 împărtășește PBC-homologia îndepărtată împreună cu alte secvențe din grupul non-KNOX din Viridiplantae
O întrebare rămasă a fost evoluția secvențelor non-KNOX din Chlorophyta care aparent nu aveau o PBC-homologie. Pentru a descoperi chiar și o homologie îndepărtată, am comparat domeniile PBL nou definite cu secvențele Chlorophyta prin BLAST (cut-off E-value de 1E-1) și alinieri de secvențe multiple. Această interogare a colectat trei secvențe TALE de prasinofite și o secvență TALE de charophyte care posedă un motiv MEINOX și un domeniu PBL putativ; cu toate acestea, acestea au prezentat o identitate de secvență foarte scăzută între ele (Fig. 3c). O interogare suplimentară utilizând aceste patru secvențe a identificat alte 11 secvențe non-KNOX. Nouă dintre acestea au fost transformate în două alinieri, una incluzând omologii GSP1 și cealaltă combinând majoritatea secvențelor de prasinofite (Fișier suplimentar 3: Figura S3). Cele două secvențe rămase (Picocystis_salinarum_04995 și Klebsormidium_flaccidum_00021_0250) au prezentat o omologie cu o secvență PBX-Red din Chondrus cruentum (ID:41034) într-o extensie de ~ 200 aa-lungime dincolo de domeniul PBL, sugerând ascendența lor PBX-Red (un alt caz potențial de transferuri orizontale; Fișier suplimentar 3: Figura S4). Toate secvențele non-KNOX din Chlorophyta care poartă domeniile PBL-homologie au fost clasificate ca GLX (GSP1-like homeobox) în recunoașterea proteinei GSP1 din Chlamydomonas ca fiind primul membru caracterizat al acestei clase .
Clasa BELL din plante este omologă clasei GLX din Chlorophyta?
Clasa BELL este singura clasă non-KNOX din plantele terestre, împărtășind un domeniu POX (Pre-homeobox) (PF07526) și lipsită de un domeniu PBL identificabil. Genomul K. flaccidum, unul dintre cele două genomuri disponibile la carofitul din care au apărut plantele terestre, conținea trei secvențe non-KNOX, toate posedând un domeniu PBL (Fig. 3, Fișierul suplimentar 3: Figurile S3, S4). Cel de-al doilea genom de charophyte din Chara braunii conținea un omolog BELL putativ care pare să fie trunchiat pentru secvențele N-terminale în afara homeodomeniului său C-terminal, posibil din cauza modelului genetic incomplet. Prin urmare, lipsa homologiei PBL în clasa BELL a plantelor pare să se datoreze divergenței sau pierderii de domenii de la o clasă veche de carofite care avea homologie PBL. Am găsit un intron în poziția homeodomului 24(2/3) al unui omolog GLX din K. flaccidum GLX, care a fost identificat anterior ca fiind specific clasei BELL a plantelor (Fișier suplimentar 3: Figura S5) , sugerând că clasa BELL a plantelor a evoluat de la o genă GLX ancestrală. Este nevoie de mai multe eșantioane de taxoni la carofite pentru a confirma această inferență.
Doi paralogi non-KNOX din Chlorophyta se heterodimerizează cu omologii KNOX
Inclusiv cu căutarea noastră sensibilă de homologie iterativă, nu am putut identifica o homologie PBC/PBL în aproximativ jumătate din secvențele non-KNOX din Chlorophyta. Deoarece majoritatea genomurilor Chlorophyta posedă un omolog GLX și o secvență non-KNOX fără domeniul PBL-homologie, ne referim la acestea din urmă în mod colectiv la clasa B (Fișier suplimentar 3: Figura S6). Au fost găsite excepții într-o singură cladă de prasinofite (clasa Mamiellophyceae), ale cărei șase genomuri de înaltă calitate conțin toate două secvențe non-KNOX lipsite de domeniul PBL-homologie. Cu toate acestea, aceste secvențe non-KNOX au format două grupuri, unul mai conservat și celălalt mai puțin conservat și polifiletic, denumite clasele Mam-A și, respectiv, Mam-B (Fișier suplimentar 3: Figurile S7, S8). Având în vedere evoluția reductivă a genomului Mamiellophyceae , clasa Mam-A conservată poate fi derivată dintr-o clasă GLX ancestrală.
Două clase non-KNOX divergente în Chlorophyta au condus la o întrebare critică despre rețelele lor diadice. Studiile anterioare au arătat că heterodimerii TALE au necesitat interacțiunea între domeniile MEIS și PBC la animale și între domeniile KNOX și PBL la Chlamydomonas . Prin urmare, s-a prezis că toate TALE-urile din Glaucophyta și Rhodophyta formează heterodimeri prin intermediul domeniilor lor de omologie KNOX și PBL. Pe de altă parte, a rămas de testat dacă TALE-urile din Chlorophyta lipsite de un domeniu PBL pot forma heterodimeri cu alte TALE-uri.
Pentru a caracteriza rețeaua de interacțiune a proteinelor din clasa TALE în Chlorophyta, am selectat trei specii de prasinofite pentru teste de interacțiune proteină-proteină: două specii care conțin genele Mam-A și Mam-B (Micromonas commoda și Ostreococcus tauri) și o altă specie (Picocystis salinarum), al cărei transcriptom conținea o secvență GLX și una de clasă B. În toate cele trei specii, am constatat că omologii KNOX au interacționat cu toate proteinele non-KNOX examinate în clasa Mam-A, Mam-B, Clasa-B și GLX (Fig. 4a-c). Nu s-a observat nicio interacțiune între cele două proteine non-KNOX în niciuna dintre cele trei specii (Fig. 4a-c). Similar cu heterodimerizarea GLX-KNOX, Mam-A și Mam-B au necesitat, de asemenea, domenii suplimentare în afara homeodomeniului pentru heterodimerizarea lor cu omologii KNOX (Fișier suplimentar 3: Figura S9). Aceste rezultate au arătat că toate TALE-urile non-KNOX divergente și-au păstrat activitatea inițială pentru a forma heterodimeri cu omologii KNOX. Rețeaua de interacțiune observată între secvențele TALE este rezumată în Fișierul suplimentar 3: Figura S10.
Heterodimerizarea TALE a evoluat la începutul istoriei eucariote
Descoperirea noastră a homologiei PBC la Archaeplastida sugerează o ascendență comună a TALE heterodimerizante între Metazoa și Archaeplastida. De asemenea, a prezis că și alte neamuri eucariote ar putea să posede TALE-uri cu homologia PBC. În afara animalelor, baza de date Pfam conține doar două secvențe care poartă domeniul PBC-B, una de la o specie de Cryptophyta (Guillardia theta, ID:137502) și cealaltă de la o specie de Amoebozoa (Acanthamoeba castillian, ID:XP_00434342337). Am examinat în continuare grupul Excavata, aproape de rădăcina postulată a filogeniei eucariote . O căutare în două genomuri (Naegleria gruberi și Bodo saltans) a colectat 12 secvențe homeobox TALE în N.gruberi și niciuna în B.saltans, dintre care am găsit una cu un domeniu de homologie PBC (ID:78561, Fig. 3a) și una cu o homologie MEIS/KNOX (ID:79931, Fișier suplimentar 3: Figura S2). Am căutat genomuri adiționale în Amorphea și am găsit domeniul PBC-homologie și MEIS/KNOX-homologie în secvențele TALE colectate de la Apusozoa, Ichtyhosporea și Choanoflagellata, dar nu și de la Fungi (Fișier suplimentar 3: Figurile S11-S14). Datele noastre sugerează că domeniile de heterodimerizare – PBC-homologia și MEIS/KNOX-homologia – au luat naștere la începutul evoluției eucariote și au persistat de-a lungul radiațiilor eucariote majore.
Reținerea intronilor susține evoluția paralelă a claselor TALE heterodimerice în timpul radiațiilor eucariote
Prezența omniprezentă a TALE-urilor diadice a ridicat următoarea întrebare: Sunt toate TALE-urile diadice raportate în acest studiu descendenții unei singure diade ancestrale sau sunt ele rezultatul unei evoluții specifice pentru fiecare linie de descendență de la o singură TALE prototipică (proto-TALE) care nu se angajează în heterodimerizare. Pentru a sonda ancestralitatea profundă, am examinat reținerea intronilor, aceasta fiind considerată un caracter conservat de mult timp și mai puțin predispus să apară prin homoplastie (un caracter afișat de un set de specii, dar care nu este prezent în strămoșul lor comun) . Cinci poziții de introni au fost împărtășite de cel puțin două clase TALE, dintre care intronii 44/45 și 48(2/3) au fost calificați ca fiind cei mai ancestrali, deoarece au fost găsiți în toate Archaeplastida și Metazoa (Fișier suplimentar 3: Figura S5).
Intonii 44/45 și 48(2/3) au prezentat o distribuție exclusivă intrigantă între cei doi parteneri diadici ai fiecărui phylum: unul posedă intronul 44/45 și celălalt intronul 48(2/3) (Fișier suplimentar 3: Figura S5). Acest model reciproc exclusiv a sugerat că două gene TALE cu poziții distincte ale intronilor au existat la începutul radiației eucariote. Considerăm că poziția intronului 44/45 este cea mai ancestrală, având în vedere că a fost conservată în majoritatea genelor homeobox non-TALE . În acest sens, speculăm că dobândirea 48(2/3) și pierderea intronului 44/45 au însoțit un eveniment timpuriu în care proto-TALE cu intronul 44/45 a fost duplicat pentru a genera un al doilea TALE cu intronul 48(2/3). Având în vedere că poziția intronului 48(2/3) a fost găsită în genele grupului KNOX/MEIS din Viridiplantae și Metazoa și, de asemenea, în genele grupului PBX din Rhodophyta și Cryptophyta, putem specula că TALE-urile duplicate au apărut devreme și s-au diversificat pentru a stabili configurații heterodimerice specifice liniei de descendență în timpul radiațiilor eucariote. Alternativ, poziția intronului 48(2/3) în homeodomeniul TALE ar fi putut fi dobândită de mai multe ori în timpul radiațiilor eucariote.
Datorită faptului că TALE-urile heterodimerice au evoluat într-o manieră specifică fiecărui neam, ne-am întrebat cum arăta proto-TALE-ul în momentul în care a suferit o duplicare. Următoarele observații sugerează că proto-TALE a fost o proteină homodimerizantă. În primul rând, domeniile de omologie PBC ale proteinelor din clasa PBX/GLX identificate în Archaeplastida includ motivul MEINOX care a fost definit inițial pentru similitudinea sa cu domeniile de omologie MEIS/KNOX (Fig. 3) . În al doilea rând, secvențele PBX-Glauco posedă ELK-homologia în cadrul domeniului lor PBL (Fig. 3), care se aliniază bine cu domeniile ELK ale secvențelor de clasă KNOX din Viridiplantae (Fișier suplimentar 3: Figura S15). Prin urmare, MEINOX-motivul și ELK-homologia în toate grupurile KNOX și PBX heterodimerizante au susținut originea comună a grupurilor TALE heterodimerizante de la un singur TALE prin duplicare urmată de subfuncționalizare.
.