- TALE in Archaeplastida sono divisi in due gruppi, KNOX e non-KNOX
- Le sequenze del gruppo KNOX condividono gli stessi domini di eterodimerizzazione in tutte le Archaeplastida
- Le classi KNOX divergono indipendentemente tra i phyla algali
- I TALE del gruppo non-KNOX possiedono il dominio PBC-homology di tipo animale, suggerendo un’ascendenza condivisa tra Archaeplastida e Metazoa
- GSP1 condivide una lontana omologia PBC insieme ad altre sequenze del gruppo non-KNOX in Viridiplantae
- La classe BELL delle piante è omologa alla classe GLX dei Chlorophyta?
- Due paraloghi non-KNOX dei Chlorophyta si eterodimerizzano con gli omologhi KNOX
- TALE eterodimerizzazione evoluto presto nella storia eucariotica
- La ritenzione degli elettroni supporta l’evoluzione parallela delle classi TALE eterodimeriche durante le radiazioni eucariotiche
TALE in Archaeplastida sono divisi in due gruppi, KNOX e non-KNOX
Per raccogliere tutte le sequenze di proteine homeobox disponibili, abbiamo eseguito ricerche BLAST e Pfam-motif contro genomi non vegetali e assemblaggi di trascrittomi di tutti gli Archaeplastida, identificando 338 proteine da 56 specie come la collezione di homeobox Archaeplastida (30 genomi e 18 trascrittomi; File aggiuntivo 1: Tabella S1). Di questi, 104 possedevano la caratteristica che definisce le proteine TALE, un’inserzione di tre amminoacidi tra le posizioni aa 23-24 nell’omeodominio. Almeno due geni TALE sono stati rilevati nella maggior parte dei genomi tranne cinque genomi nella classe Trebouxiophyceae dei Chlorophyta (file aggiuntivo 1: tabella S1; vedi file aggiuntivo 2: nota S1 per ulteriori discussioni sull’assenza di TALE in Trebouxiophyceae).
Le sequenze TALE raccolte sono state poi classificate in base alle loro caratteristiche di omeodominio utilizzando un approccio filogenetico, con TALE da animali, piante, e primi eucarioti divergenti (Amoebozoa e Excavata) come outgroup (file aggiuntivo 3: Figura S1). La filogenesi TALE homeodomain risultante ha distinto due gruppi in tutti e tre i phyla di Archaeplastida (Fig. 2). (1) Il gruppo KNOX come clade ben supportato ha mostrato un cladogramma phylum-specifico: due sequenze Glaucophyta alla base (come KNOX-Glauco) sono stati separati dal clade successivo, che combina sequenze Rhodophyta (come KNOX-Red1) e un clade Viridiplantae-specifico con un forte sostegno (92/90/1.00). (2) Il gruppo non-KNOX, compresi gli omologhi BELL e GSP1, conteneva cladi di affiliazioni tassonomiche miste. Queste analisi hanno dimostrato che le proteine TALE si erano già differenziate in due gruppi prima dell’evoluzione degli Archaeplastida e che il gruppo KNOX è altamente conservato in tutti gli Archaeplastida.
Le sequenze del gruppo KNOX condividono gli stessi domini di eterodimerizzazione in tutte le Archaeplastida
La domanda successiva era se la classe KNOX delle piante avesse avuto origine prima del phylum Viridiplantae. Le proteine KNOX delle piante e il Chlorophyta GSM1 possiedono l’omologia KNOX, composta da domini KN-A, KN-B e ELK, necessaria per la loro eterodimerizzazione con altre proteine TALE; quindi, la presenza dell’omologia KNOX suggerirebbe il potenziale di eterodimerizzazione al gruppo KNOX. Per raccogliere i domini di omologia senza informazioni precedenti, abbiamo eseguito ricerche ad hoc di domini di omologia tra le sequenze del gruppo KNOX. Utilizzando i domini di omologia identificati come ancore, abbiamo accuratamente curato un allineamento delle sequenze del gruppo KNOX combinate con qualsiasi altra sequenza TALE con un’omologia KNOX, (file aggiuntivo 3: Figura S2). Da questo allineamento KNOX, abbiamo trovato tutte le sequenze del gruppo KNOX (escluse le sequenze parziali) che mostrano punteggi di somiglianza aminoacidica > 50% per almeno due dei tre domini che compongono la regione KNOX-omologia (file aggiuntivo 1: tabella S3 per l’omologia di dominio calcolata). Per verificare se la somiglianza osservata è specifica delle sequenze TALE, abbiamo generato motivi HMM per i domini KN-A e KN-B dall’allineamento KNOX, li abbiamo cercati nei genomi target e abbiamo confermato che i domini KN-A e KN-B si trovano solo nelle sequenze TALE (file aggiuntivo 4: dati S1 e S2). Abbiamo quindi definito KNOX-omologhi come le sequenze TALE che possiedono un’omologia KNOX ricercabile (Fig 2, contrassegnate da punti rossi dopo i loro ID), suggerendo che il KNOX-omologo esisteva già prima dell’evoluzione della fotosintesi eucariotica rappresentata dagli Archaeplastida.
Oltre all’omologia KNOX, la stessa ricerca ha rivelato anche due nuovi domini al C-terminale dell’omeodominio (Additional file 3: Figura S2): il primo (KN-C1) era condiviso tra le sequenze Chlorophyta, e il secondo (KN-C2) era condiviso tra un gruppo di omologhi KNOX in un clade esterno al gruppo KNOX (KNOX-Red2).
Le classi KNOX divergono indipendentemente tra i phyla algali
Nelle Viridiplantae, abbiamo trovato un singolo omologo KNOX nella maggior parte delle specie Chlorophyta, mentre la divergenza KNOX1 e KNOX2 era evidente nella divisione Streptophyta, incluso il cariofita Klebsormidium flaccidum e le piante terrestri (Fig. 2). Il dominio KN-C1 appena scoperto era specifico delle sequenze KNOX dei Chlorophyta e trovato in tutte le specie tranne una (Pyramimonas amylifera). L’assenza di somiglianza tra KN-C1 e le estensioni C-terminali delle sequenze KNOX1/KNOX2 suggerisce indipendente, lineage-specifica evoluzione KNOX nel Chlorophyta e Streptophyta (file aggiuntivo 3: Figura S2). Noi, quindi, ci riferiamo alle classi KNOX dei Chlorophyta come KNOX-Chloro in contrasto con le classi KNOX1 e KNOX2 negli Streptophyta.
Gli omologhi KNOX nei Rhodophyta sono stati divisi in due classi: un gruppo parafiletico vicino al clade KNOX-Chloro, chiamato KNOX-Red1, e un secondo gruppo vicino al PBX-Outgroup, chiamato KNOX-Red2. KNOX-Red1 mancava di un KN-A, mentre KNOX-Red2 mancava di un ELK e condivideva un dominio KN-C2 (Additional file 3: Figura S2). Consideriamo KNOX-Red1 come il tipo ancestrale, poiché le sequenze KNOX-Red1 sono state trovate in tutti i taxa Rhodophyta esaminati, mentre le sequenze KNOX-Red2 erano limitate a due classi tassonomiche (Cyanidiophyceae e Florideophyceae). È interessante notare che il clade KNOX-Red2 includeva due sequenze di alghe verdi, con un forte supporto statistico (89/89/0.97; Fig. 2); queste possedevano un dominio KN-C2, suggerendo la loro ascendenza all’interno della classe KNOX-Red2 (file aggiuntivo 3: Figura S2; vedi file aggiuntivo 2: Nota S2 per ulteriori discussioni sulla loro possibile origine tramite trasferimento genico orizzontale).
Le sequenze TALE disponibili erano limitate per i Glaucophyta. Abbiamo trovato un singolo omologo KNOX in due specie, che possedeva i domini KN-A e KN-B ma mancava un dominio ELK. Abbiamo chiamato questi KNOX-Glauco.
I TALE del gruppo non-KNOX possiedono il dominio PBC-homology di tipo animale, suggerendo un’ascendenza condivisa tra Archaeplastida e Metazoa
In seguito all’identificazione degli omologhi KNOX, le rimanenti sequenze TALE sono state combinate come il gruppo non-KNOX che manca dei domini KN-A e KN-B in Archaeplastida. L’ulteriore classificazione del gruppo non-KNOX è stata impegnativa a causa delle sue sequenze di omeodominio altamente divergenti. Tuttavia, abbiamo notato che il numero di geni non-KNOX per specie era in gran parte invariabile: uno nella maggior parte dei genomi Rhodophyta e Glaucophyta e due nella maggior parte dei genomi Chlorophyta, suggerendo la loro conservazione all’interno di ogni radiazione.
La nostra ricerca omologia ad-hoc ha fornito informazioni critiche per la classificazione non-KNOX, identificando un dominio omologico condiviso tra tutte le sequenze Glaucophyta e Rhodophyta non-KNOX (Fig. 3a, b). Poiché questo dominio ha mostrato una somiglianza con la seconda metà del dominio PBC-B animale (Pfam ID: PF03792) noto come dominio di eterodimerizzazione, abbiamo chiamato questo dominio PBL (PBC-B Like). Di conseguenza, abbiamo classificato tutti i non-KNOX TALEs in Glaucophyta e Rhodophyta come una singola classe di omeobox legati alla PBC, PBX-Glauco o PBX-Red. Le sequenze PBX-Glauco possedevano anche il motivo MEINOX, conservato nel dominio PBC-B animale, indicando una comune ascendenza dei domini PBC-B e PBL (Fig. 3a).
GSP1 condivide una lontana omologia PBC insieme ad altre sequenze del gruppo non-KNOX in Viridiplantae
Una questione rimanente era l’evoluzione delle sequenze non-KNOX dei Chlorophyta che apparentemente non avevano una omologia PBC. Per scoprire anche una lontana omologia, abbiamo confrontato i domini PBL appena definiti con le sequenze Chlorophyta tramite BLAST (cut-off E-value di 1E-1) e allineamenti multipli di sequenza. Questa ricerca ha raccolto tre sequenze TALE prasinofite e una cariofita che possedevano un motivo MEINOX e un dominio PBL putativo; tuttavia, hanno mostrato un’identità di sequenza molto bassa tra loro (Fig. 3c). Ulteriori ricerche utilizzando queste quattro sequenze hanno identificato 11 ulteriori sequenze non-KNOX. Nove di queste sono state fatte in due allineamenti, uno compreso GSP1 omologhi e l’altro combinando la maggior parte delle sequenze prasinophyte (Additional file 3: Figura S3). Le due sequenze rimanenti (Picocystis_salinarum_04995 e Klebsormidium_flaccidum_00021_0250) hanno mostrato un’omologia con una sequenza PBX-Red di Chondrus cruentum (ID:41034) in un’estensione di ~ 200 aa oltre il dominio PBL, suggerendo la loro ascendenza PBX-Red (un altro potenziale caso di trasferimento orizzontale; file aggiuntivo 3: Figura S4). Tutte le sequenze Chlorophyta non-KNOX che portano i domini PBL-omologia sono stati classificati come GLX (GSP1-like homeobox) in riconoscimento della proteina GSP1 di Chlamydomonas come il primo membro caratterizzato di questa classe.
La classe BELL delle piante è omologa alla classe GLX dei Chlorophyta?
La classe BELL è l’unica classe non-KNOX nelle piante terrestri, condividendo un dominio POX (Pre-homeobox) (PF07526) e manca un dominio PBL identificabile. Il genoma di K. flaccidum, uno dei due genomi disponibili nella carofita da cui è emersa la pianta terrestre, conteneva tre sequenze non-KNOX, tutte dotate di un dominio PBL (Fig. 3, Additional file 3: Figure S3, S4). Il secondo genoma charophyte di Chara braunii conteneva un omologo putativo BELL che sembra essere troncato per le sequenze N-terminali al di fuori della sua omeodominio C-terminale forse a causa del modello genico incompleto. Pertanto, la mancanza di omologia PBL nella classe BELL delle piante sembra essere dovuta alla divergenza o alla perdita di dominio da una vecchia classe di carofite che aveva l’omologia PBL. Abbiamo trovato un introne al 24 (2/3) posizione omeodominio di un omologo K. flaccidum GLX, che è stato precedentemente identificato come specifico per la classe BELL pianta (Additional file 3: Figura S5), suggerendo che la classe BELL pianta evoluto da un gene ancestrale GLX. Per confermare questa deduzione è necessario un maggiore campionamento dei taxon nelle cariofite.
Due paraloghi non-KNOX dei Chlorophyta si eterodimerizzano con gli omologhi KNOX
Anche con la nostra ricerca iterativa sensibile dell’omologia, non abbiamo potuto identificare una omologia PBC/PBL in circa la metà delle sequenze non-KNOX dei Chlorophyta. Poiché la maggior parte dei genomi dei Chlorophyta possiede un omologo GLX e una sequenza non-KNOX senza il dominio PBL-omologia, ci riferiamo a questi ultimi collettivamente alla Classe-B (file addizionale 3: Figura S6). Le eccezioni sono state trovate in un clade di prasinofite (classe Mamiellophyceae), i cui sei genomi di alta qualità contengono tutti due sequenze non-KNOX senza l’omologia PBL. Tuttavia, queste sequenze non-KNOX hanno formato due gruppi, uno più conservato e l’altro meno conservato e polifiletico, riferiti rispettivamente alle classi Mam-A e Mam-B (file aggiuntivo 3: figure S7, S8). Considerando l’evoluzione riduttiva del genoma delle Mamiellophyceae , la classe conservata Mam-A potrebbe essere derivata da una classe GLX ancestrale.
Due classi divergenti non-KNOX nei Chlorophyta hanno portato a una domanda critica sulle loro reti diadiche. Studi precedenti avevano dimostrato che gli eterodimeri TALE richiedevano l’interazione tra i domini MEIS e PBC negli animali e tra i domini KNOX e PBL in Chlamydomonas. E ‘stato, quindi, previsto che tutti i Glaucophyta e Rhodophyta TALEs formare eterodimeri attraverso i loro domini KNOX- e PBL-omologia. D’altra parte, è rimasto da testare se le TALEs Chlorophyta che mancano di una PBL-domain possono formare eterodimeri con altre TALEs.
Per caratterizzare la rete di interazione delle proteine di classe TALE nei Chlorophyta, abbiamo selezionato tre specie di prasinofite per i saggi di interazione proteina-proteina: due specie contenenti i geni Mam-A e Mam-B (Micromonas commoda e Ostreococcus tauri), e un’altra specie (Picocystis salinarum), il cui trascrittoma conteneva una sequenza GLX e una Classe-B. In tutte e tre le specie, abbiamo trovato che gli omologhi di KNOX hanno interagito con tutte le proteine non-KNOX esaminate in classe Mam-A, Mam-B, Classe-B e GLX (Fig. 4a-c). Nessuna interazione è stata osservata tra le due proteine non-KNOX in nessuna delle tre specie (Fig. 4a-c). Simile al GLX-KNOX eterodimerizzazione, Mam-A e Mam-B anche richiesto domini aggiuntivi al di fuori del homeodomain per la loro eterodimerizzazione con gli omologhi KNOX (Additional file 3: Figura S9). Questi risultati hanno mostrato che tutti i divergenti non-KNOX TALEs hanno mantenuto la loro attività originale per formare eterodimeri con gli omologhi KNOX. La rete di interazione osservata tra le sequenze TALE è riassunta nel file aggiuntivo 3: Figura S10.
TALE eterodimerizzazione evoluto presto nella storia eucariotica
La nostra scoperta del PBC-omologia in Archaeplastida suggerisce antenato comune del TALES eterodimerizzante tra Metazoa e Archaeplastida. Ha anche previsto che altri lignaggi eucarioti potrebbero possedere TALEs con l’omologia PBC. Al di fuori degli animali, il database Pfam contiene solo due sequenze che supportano il dominio PBC-B, una da una specie di Cryptophyta (Guillardia theta, ID:137502) e l’altra da una specie di Amoebozoa (Acanthamoeba castillian, ID:XP_004342337). Abbiamo ulteriormente esaminato il gruppo Excavata, vicino alla presunta radice della filogenesi eucariotica. Una ricerca di due genomi (Naegleria gruberi e Bodo saltans) ha raccolto 12 sequenze di omeobox TALE in N.gruberi, e nessuna in B.saltans, di cui abbiamo trovato una con un dominio PBC-omologia (ID:78561, Fig. 3a) e una con una MEIS/KNOX-omologia (ID:79931, Additional file 3: Figura S2). Abbiamo cercato altri genomi nell’Amorphea e abbiamo trovato l’omologia PBC e l’omologia MEIS/KNOX nelle sequenze TALE raccolte da Apusozoa, Ichtyhosporea, e Choanoflagellata ma non da Fungi (Additional file 3: Figure S11-S14). I nostri dati suggeriscono che i domini di eterodimerizzazione – l’omologia PBC e l’omologia MEIS/KNOX – sono nati all’inizio dell’evoluzione eucariotica e hanno persistito durante le principali radiazioni eucariotiche.
La ritenzione degli elettroni supporta l’evoluzione parallela delle classi TALE eterodimeriche durante le radiazioni eucariotiche
La presenza onnipresente dei TALE diadici ha sollevato la prossima domanda: Tutti i TALE diadici riportati in questo studio sono i discendenti di una singola diade ancestrale, o risultano da un’evoluzione specifica del lignaggio da un singolo TALE prototipico (proto-TALE) che non si impegna nell’eterodimerizzazione. Per sondare l’ascendenza profonda, abbiamo esaminato la ritenzione degli introni, essendo questo considerato un carattere a lungo conservato e meno incline a verificarsi per omoplasia (un carattere visualizzato da un insieme di specie ma non presente nel loro antenato comune). Cinque posizioni di introni sono state condivise da almeno due classi TALE, di cui gli introni 44/45 e 48(2/3) si sono qualificati come i più ancestrali in quanto sono stati trovati in tutto il Archaeplastida e Metazoa (Additional file 3: Figura S5).
Gli introni 44/45 e 48(2/3) hanno mostrato un’intrigante distribuzione esclusiva tra i due partner diadici di ciascun phylum: uno possiede il 44/45 e l’altro possiede l’introne 48(2/3) (Additional file 3: Figura S5). Questo modello reciprocamente esclusivo ha suggerito che all’inizio della radiazione eucariotica esistevano due geni TALE con posizioni introne distinte. Consideriamo la posizione dell’introne 44/45 come la più ancestrale, dato che era conservata nella maggior parte dei geni homeobox non TALE. A questo proposito, ipotizziamo che l’acquisizione del 48(2/3), e la perdita dell’introne 44/45, abbia accompagnato un evento precoce in cui il proto-TALE con l’introne 44/45 è stato duplicato per generare un secondo TALE con l’introne 48(2/3). Poiché la posizione dell’introne 48(2/3) è stata trovata all’interno dei geni del gruppo KNOX/MEIS nelle Viridiplantae e nei Metazoi e anche nei geni del gruppo PBX nei Rhodophyta e nei Cryptophyta, possiamo ipotizzare che i TALE duplicati siano sorti presto e si siano diversificati per stabilire configurazioni eterodimeriche specifiche del lignaggio durante la radiazione eucariotica. In alternativa, la posizione dell’introne 48(2/3) nell’omeodominio TALE potrebbe essere stata acquisita molte volte durante le radiazioni eucariotiche.
Dato che i TALE eterodimerici si sono evoluti in un modo specifico del lignaggio, abbiamo chiesto quale fosse l’aspetto del proto-TALE al momento in cui ha subito la duplicazione. Le seguenti osservazioni suggeriscono che il proto-TALE era una proteina omodimerizzante. In primo luogo, i domini di omologia PBC delle proteine di classe PBX/GLX identificate negli Archaeplastida includono il motivo MEINOX che è stato originariamente definito per la sua somiglianza con i domini di omologia MEIS/KNOX (Fig. 3). In secondo luogo, le sequenze PBX-Glauco possiedono l’omologia ELK all’interno del loro dominio PBL (Fig. 3), che si allineano bene ai domini ELK delle sequenze di classe KNOX in Viridiplantae (Additional file 3: Figura S15). Pertanto, il motivo MEINOX e l’omologia ELK attraverso i gruppi eterodimerizzanti KNOX e PBX hanno sostenuto l’origine comune dei gruppi TALE eterodimerizzanti da un singolo TALE per duplicazione seguita da subfunctionalization.