- TALEs in Archaeplastida werden in zwei Gruppen unterteilt, KNOX und non-KNOX
- Die Sequenzen der KNOX-Gruppe haben in allen Archaeplastida dieselben Heterodimerisierungsdomänen gemeinsam
- Die KNOX-Klassen divergierten unabhängig voneinander in den Algenphyla
- Die TALEs der Nicht-KNOX-Gruppe besitzen eine PBC-Homologie-Domäne vom Tiertyp, was auf eine gemeinsame Abstammung von Archaeplastida und Metazoa hindeutet
- GSP1 teilt eine entfernte PBC-Homologie mit anderen Sequenzen der Nicht-KNOX-Gruppe in Viridiplantae
- Ist die BELL-Klasse der Pflanzen homolog zur GLX-Klasse der Chlorophyta?
- Zwei Nicht-KNOX-Paraloge von Chlorophyta heterodimerisieren mit den KNOX-Homologen
- Die Heterodimerisierung von TALEs entwickelte sich früh in der Geschichte der Eukaryoten
- Die Intron-Retention unterstützt die parallele Evolution der heterodimeren TALE-Klassen während der eukaryotischen Radiationen
TALEs in Archaeplastida werden in zwei Gruppen unterteilt, KNOX und non-KNOX
Um alle verfügbaren Homeobox-Proteinsequenzen zu sammeln, führten wir BLAST- und Pfam-motif-Suchen gegen Nicht-Pflanzen-Genome und Transkriptom-Zusammenstellungen in den Archaeplastida durch und identifizierten 338 Proteine aus 56 Arten als die Archaeplastida-Homeobox-Sammlung (30 Genome und 18 Transkriptome; Zusätzliche Datei 1: Tabelle S1). Von diesen besaßen 104 das definierende Merkmal der TALE-Proteine, eine Insertion von drei Aminosäuren zwischen den aa-Positionen 23-24 in der Homeodomäne. Mindestens zwei TALE-Gene wurden in den meisten Genomen nachgewiesen, mit Ausnahme von fünf Genomen in der Klasse der Trebouxiophyceae der Chlorophyta (Zusätzliche Datei 1: Tabelle S1; siehe Zusätzliche Datei 2: Anmerkung S1 für eine weitere Diskussion über das Fehlen von TALEs in Trebouxiophyceae).
Die gesammelten TALE-Sequenzen wurden dann mit Hilfe eines phylogenetischen Ansatzes nach ihren Homöodomänen-Merkmalen klassifiziert, wobei TALEs aus Tieren, Pflanzen und frühen Eukaryoten (Amoebozoa und Excavata) als Außengruppen dienten (Zusatzdatei 3: Abbildung S1). Die daraus resultierende TALE-Homöodomänen-Phylogenie unterscheidet zwei Gruppen in allen drei Phyla der Archaeplastida (Abb. 2). (1) Die KNOX-Gruppe als gut unterstützte Klade zeigte ein phylumspezifisches Kladogramm: zwei Glaucophyta-Sequenzen an der Basis (als KNOX-Glauco) waren getrennt von der nächsten Klade, die Rhodophyta-Sequenzen (als KNOX-Red1) und eine Viridiplantae-spezifische Klade mit starker Unterstützung (92/90/1.00) vereint. (2) Die Nicht-KNOX-Gruppe, einschließlich der BELL- und GSP1-Homologe, enthielt Kladen mit gemischter taxonomischer Zugehörigkeit. Diese Analysen zeigten, dass die TALE-Proteine bereits vor der Evolution der Archaeplastida in zwei Gruppen divergierten und dass die KNOX-Gruppe in den Archaeplastida hoch konserviert ist.
Die Sequenzen der KNOX-Gruppe haben in allen Archaeplastida dieselben Heterodimerisierungsdomänen gemeinsam
Die nächste Frage war, ob die pflanzliche KNOX-Klasse vor dem Phylum der Viridiplantae entstanden ist. Die pflanzlichen KNOX-Proteine und GSM1 aus der Chlorophyta besitzen die KNOX-Homologie, bestehend aus KN-A-, KN-B- und ELK-Domänen, die für ihre Heterodimerisierung mit anderen TALE-Proteinen erforderlich ist; daher würde das Vorhandensein der KNOX-Homologie das Potenzial für eine Heterodimerisierung zur KNOX-Gruppe nahelegen. Um Homologiedomänen ohne vorherige Informationen zu sammeln, führten wir eine Ad-hoc-Homologiedomänensuche unter den Sequenzen der KNOX-Gruppe durch. Unter Verwendung der identifizierten Homologiedomänen als Anker, kuratierten wir sorgfältig ein Alignment der KNOX-Gruppensequenzen in Kombination mit anderen TALE-Sequenzen mit einer KNOX-Homologie (Additional file 3: Abbildung S2). Anhand dieses KNOX-Alignments fanden wir alle Sequenzen der KNOX-Gruppe (mit Ausnahme von Teilsequenzen), die für mindestens zwei der drei Domänen, die die KNOX-Homologieregion umfassen, Aminosäureähnlichkeitswerte > 50 % aufwiesen (Zusatzdatei 1: Tabelle S3 für die berechnete Domänenhomologie). Um zu prüfen, ob die beobachtete Ähnlichkeit spezifisch für die TALE-Sequenzen ist, generierten wir HMM-Motive für KN-A- und KN-B-Domänen aus dem KNOX-Alignment, suchten sie in den Zielgenomen und bestätigten, dass KN-A- und KN-B-Domänen nur in den TALE-Sequenzen zu finden sind (Zusatzdatei 4: Daten S1 und S2). Wir definierten somit KNOX-Homologe als TALE-Sequenzen, die eine durchsuchbare KNOX-Homologie aufweisen (Abb. 2, markiert durch rote Punkte nach ihren IDs), was darauf hindeutet, dass das KNOX-Homolog bereits vor der Evolution der eukaryotischen Photosynthese, wie sie von den Archaeplastida repräsentiert wird, existierte.
Zusätzlich zur KNOX-Homologie wurden bei derselben Suche auch zwei neue Domänen am C-Terminus der Homöodomäne gefunden (Additional file 3: Abbildung S2): die erste (KN-C1) wurde von den Chlorophyta-Sequenzen geteilt, und die zweite (KN-C2) wurde von einer Gruppe von KNOX-Homologen in einer Gruppe außerhalb der KNOX-Gruppe (KNOX-Red2) geteilt.
Die KNOX-Klassen divergierten unabhängig voneinander in den Algenphyla
In den Viridiplantae fanden wir ein einziges KNOX-Homolog in den meisten Chlorophyta-Arten, während die Divergenz von KNOX1 und KNOX2 in der Streptophyta-Abteilung, einschließlich des Charophyten Klebsormidium flaccidum und der Landpflanzen, offensichtlich war (Abb. 2). Die neu entdeckte KN-C1-Domäne war spezifisch für die KNOX-Sequenzen der Chlorophyta und wurde in allen Arten außer einer (Pyramimonas amylifera) gefunden. Die fehlende Ähnlichkeit zwischen KN-C1 und den C-terminalen Verlängerungen der KNOX1/KNOX2-Sequenzen deutet auf eine unabhängige, stammesspezifische KNOX-Evolution in den Chlorophyta und Streptophyta hin (Zusatzdatei 3: Abbildung S2). Daher bezeichnen wir die KNOX-Klassen in den Chlorophyta als KNOX-Chloro im Gegensatz zu den KNOX1- und KNOX2-Klassen in den Streptophyta.
Die KNOX-Homologe in den Rhodophyta wurden in zwei Klassen eingeteilt: eine paraphyletische Gruppe in der Nähe der KNOX-Chloro-Gruppe, genannt KNOX-Red1, und eine zweite Gruppe in der Nähe der PBX-Out-Gruppe, genannt KNOX-Red2. KNOX-Red1 fehlte ein KN-A, während KNOX-Red2 ein ELK fehlte und eine KN-C2-Domäne teilte (Zusatzdatei 3: Abbildung S2). Wir betrachten KNOX-Red1 als den Vorgängertyp, da die KNOX-Red1-Sequenzen in allen untersuchten Rhodophyta-Taxa gefunden wurden, während die KNOX-Red2-Sequenzen auf zwei taxonomische Klassen beschränkt waren (Cyanidiophyceae und Florideophyceae). Interessanterweise umfasste die KNOX-Red2-Gruppe zwei Grünalgen-Sequenzen mit starker statistischer Unterstützung (89/89/0,97; Abb. 2); diese besaßen eine KN-C2-Domäne, was darauf hindeutet, dass sie von der KNOX-Red2-Klasse abstammen (Zusatzdatei 3: Abbildung S2; siehe Zusatzdatei 2: Anmerkung S2 für eine weitere Diskussion über ihren möglichen Ursprung durch horizontalen Gentransfer).
Die verfügbaren TALE-Sequenzen waren für die Glaucophyta begrenzt. Wir fanden ein einziges KNOX-Homolog in zwei Arten, die KN-A- und KN-B-Domänen besaßen, denen aber eine ELK-Domäne fehlte. Wir bezeichneten diese als KNOX-Glauco.
Die TALEs der Nicht-KNOX-Gruppe besitzen eine PBC-Homologie-Domäne vom Tiertyp, was auf eine gemeinsame Abstammung von Archaeplastida und Metazoa hindeutet
Nach der Identifizierung der KNOX-Homologe wurden die übrigen TALE-Sequenzen als Nicht-KNOX-Gruppe zusammengefasst, der die KN-A- und KN-B-Domänen in Archaeplastida fehlen. Die weitere Klassifizierung der Nicht-KNOX-Gruppe war aufgrund der stark divergierenden Homöodomänen-Sequenzen schwierig. Wir stellten jedoch fest, dass die Anzahl der Nicht-KNOX-Gene pro Art weitgehend konstant war: ein Genom in den meisten Rhodophyta- und Glaucophyta-Genomen und zwei in den meisten Chlorophyta-Genomen, was auf ihre Erhaltung innerhalb der einzelnen Radiationen hindeutet.
Unsere Ad-hoc-Homologiesuche lieferte entscheidende Informationen für die Klassifizierung der Nicht-KNOX-Sequenzen und identifizierte eine Homologiedomäne, die alle Nicht-KNOX-Sequenzen der Glaucophyta und Rhodophyta gemeinsam haben (Abb. 3a, b). Da diese Domäne eine Ähnlichkeit mit der zweiten Hälfte der als Heterodimerisierungsdomäne bekannten tierischen PBC-B-Domäne (Pfam ID: PF03792) aufwies, nannten wir diese Domäne PBL (PBC-B Like). Dementsprechend klassifizierten wir alle Nicht-KNOX-TALEs in Glaucophyta und Rhodophyta als eine einzige PBC-verwandte Homeobox-Klasse, PBX-Glauco oder PBX-Red. PBX-Glauco-Sequenzen besaßen auch das MEINOX-Motiv, das in der tierischen PBC-B-Domäne konserviert ist, was auf eine gemeinsame Abstammung der PBC-B- und PBL-Domänen hindeutet (Abb. 3a).
GSP1 teilt eine entfernte PBC-Homologie mit anderen Sequenzen der Nicht-KNOX-Gruppe in Viridiplantae
Eine verbleibende Frage war die Evolution der Nicht-KNOX-Sequenzen der Chlorophyta, die offenbar keine PBC-Homologie aufweisen. Um auch nur eine entfernte Homologie aufzudecken, verglichen wir die neu definierten PBL-Domänen mit den Chlorophyta-Sequenzen durch BLAST (cut-off E-Wert von 1E-1) und multiple Sequenzalignments. Diese Abfrage ergab drei Prasinophyten- und eine Charophyten-TALE-Sequenz, die ein MEINOX-Motiv und eine mutmaßliche PBL-Domäne besaßen; sie wiesen jedoch nur eine sehr geringe Sequenzidentität untereinander auf (Abb. 3c). Weitere Abfragen unter Verwendung dieser vier Sequenzen ergaben 11 zusätzliche Nicht-KNOX-Sequenzen. Neun davon wurden in zwei Alignments zusammengefasst, von denen das eine GSP1-Homologe und das andere die meisten Prasinophyten-Sequenzen enthält (Additional file 3: Abbildung S3). Die beiden verbleibenden Sequenzen (Picocystis_salinarum_04995 und Klebsormidium_flaccidum_00021_0250) zeigten eine Homologie zu einer PBX-Red-Sequenz von Chondrus cruentum (ID:41034) in einer ca. 200 aa langen Verlängerung jenseits der PBL-Domäne, was auf ihre PBX-Red-Abstammung hindeutet (ein weiterer möglicher Fall von horizontalem Transfer; Zusatzdatei 3: Abbildung S4). Alle Chlorophyta-Nicht-KNOX-Sequenzen, die die PBL-Homologiedomänen tragen, wurden in Anerkennung des GSP1-Proteins von Chlamydomonas als erstes charakterisiertes Mitglied dieser Klasse als GLX (GSP1-like homeobox) klassifiziert.
Ist die BELL-Klasse der Pflanzen homolog zur GLX-Klasse der Chlorophyta?
Die BELL-Klasse ist die einzige Nicht-KNOX-Klasse der Landpflanzen, die eine POX-Domäne (PF07526) teilt und der eine identifizierbare PBL-Domäne fehlt. Das Genom von K. flaccidum, eines der beiden verfügbaren Genome des Charophyten, aus dem die Landpflanze hervorging, enthielt drei Nicht-KNOX-Sequenzen, die alle eine PBL-Domäne besitzen (Abb. 3, Additional file 3: Figures S3, S4). Das zweite Charophyten-Genom von Chara braunii enthielt ein mutmaßliches BELL-Homolog, dessen N-terminale Sequenzen außerhalb seiner C-terminalen Homöodomäne möglicherweise aufgrund des unvollständigen Genmodells abgeschnitten sind. Daher scheint das Fehlen der PBL-Homologie in der pflanzlichen BELL-Klasse auf Divergenz oder Domänenverlust von einer alten Charophyten-Klasse mit PBL-Homologie zurückzuführen zu sein. Wir fanden ein Intron an der 24(2/3)-Homöodomänen-Position eines K. flaccidum GLX-Homologs, das zuvor als spezifisch für die Pflanzen-BELL-Klasse identifiziert wurde (Zusatzdatei 3: Abbildung S5), was darauf hindeutet, dass sich die Pflanzen-BELL-Klasse aus einem GLX-Vorläufergen entwickelt hat. Um diese Schlussfolgerung zu bestätigen, sind weitere Taxonproben bei Charophyten erforderlich.
Zwei Nicht-KNOX-Paraloge von Chlorophyta heterodimerisieren mit den KNOX-Homologen
Selbst mit unserer empfindlichen iterativen Homologiesuche konnten wir in etwa der Hälfte der Nicht-KNOX-Sequenzen von Chlorophyta keine PBC/PBL-Homologie identifizieren. Da die meisten Chlorophyta-Genome ein GLX-Homolog und eine Nicht-KNOX-Sequenz ohne die PBL-Homologiedomäne besitzen, bezeichnen wir letztere gemeinsam als Klasse-B (Zusatzdatei 3: Abbildung S6). Ausnahmen wurden in einer Prasinophytengruppe (Klasse Mamiellophyceae) gefunden, deren sechs hochwertige Genome alle zwei Nicht-KNOX-Sequenzen ohne die PBL-Homologie enthalten. Dennoch bildeten diese Nicht-KNOX-Sequenzen zwei Gruppen, eine stärker konservierte und eine weniger konservierte und polyphyletische, die als Mam-A- bzw. Mam-B-Klassen bezeichnet werden (Additional file 3: Figures S7, S8). In Anbetracht der reduktiven Genomevolution der Mamiellophyceae könnte die konservierte Mam-A-Klasse von einer angestammten GLX-Klasse abstammen.
Zwei divergente Nicht-KNOX-Klassen in Chlorophyta führten zu einer kritischen Frage über ihre dyadischen Netzwerke. Frühere Studien hatten gezeigt, dass TALE-Heterodimere eine Interaktion zwischen MEIS- und PBC-Domänen in Tieren und zwischen KNOX- und PBL-Domänen in Chlamydomonas erfordern. Es wurde daher vorhergesagt, dass alle TALEs in Glaucophyta und Rhodophyta Heterodimere über ihre KNOX- und PBL-Homologie-Domänen bilden. Andererseits blieb zu prüfen, ob die Chlorophyta-TALEs, denen eine PBL-Domäne fehlt, Heterodimere mit anderen TALEs bilden können.
Um das Interaktionsnetzwerk von TALE-Proteinen in Chlorophyta zu charakterisieren, wählten wir drei Prasinophyten-Arten für Protein-Protein-Interaktionstests aus: zwei Arten mit Mam-A- und Mam-B-Genen (Micromonas commoda und Ostreococcus tauri) und eine weitere Art (Picocystis salinarum), deren Transkriptom eine GLX- und eine Klasse-B-Sequenz enthielt. Bei allen drei Arten stellten wir fest, dass KNOX-Homologe mit allen untersuchten Nicht-KNOX-Proteinen der Mam-A-, Mam-B-, Class-B- und GLX-Klasse interagierten (Abb. 4a-c). Zwischen den beiden Nicht-KNOX-Proteinen wurde bei keiner der drei Arten eine Interaktion beobachtet (Abb. 4a-c). Ähnlich wie bei der GLX-KNOX-Heterodimerisierung benötigten auch Mam-A und Mam-B zusätzliche Domänen außerhalb der Homöodomäne für ihre Heterodimerisierung mit den KNOX-Homologen (Additional file 3: Abbildung S9). Diese Ergebnisse zeigten, dass alle divergenten Nicht-KNOX-TALEs ihre ursprüngliche Aktivität zur Bildung von Heterodimeren mit den KNOX-Homologen beibehielten. Das beobachtete Interaktionsnetzwerk zwischen den TALE-Sequenzen ist in Zusatzdatei 3: Abbildung S10 zusammengefasst.
Die Heterodimerisierung von TALEs entwickelte sich früh in der Geschichte der Eukaryoten
Unsere Entdeckung der PBC-Homologie in Archaeplastida deutet auf eine gemeinsame Abstammung der heterodimerisierenden TALES zwischen Metazoa und Archaeplastida hin. Es wurde auch vorhergesagt, dass andere eukaryotische Abstammungslinien TALEs mit der PBC-Homologie besitzen könnten. Außerhalb der Tierwelt enthält die Pfam-Datenbank nur zwei PBC-B-Domänen-tragende Sequenzen, eine von einer Cryptophyta-Art (Guillardia theta, ID:137502) und die andere von einer Amoebozoa-Art (Acanthamoeba castillian, ID:XP_004342337). Außerdem untersuchten wir die Excavata-Gruppe, die nahe an der vermuteten Wurzel der eukaryotischen Phylogenie liegt. Eine Suche in zwei Genomen (Naegleria gruberi und Bodo saltans) ergab 12 TALE-Homeobox-Sequenzen in N.gruberi und keine in B.saltans, von denen wir eine mit einer PBC-Homologiedomäne (ID:78561, Abb. 3a) und eine mit einer MEIS/KNOX-Homologie (ID:79931, Additional file 3: Figure S2) fanden. Wir durchsuchten weitere Genome der Amorphea und fanden die PBC-Homologie und die MEIS/KNOX-Homologie in den TALE-Sequenzen von Apusozoa, Ichtyhosporea und Choanoflagellata, aber nicht von Fungi (Additional file 3: Figures S11-S14). Unsere Daten deuten darauf hin, dass die Heterodimerisierungsdomänen – die PBC-Homologie und die MEIS/KNOX-Homologie – schon früh in der eukaryotischen Evolution entstanden und während der großen eukaryotischen Radiationen erhalten blieben.
Die Intron-Retention unterstützt die parallele Evolution der heterodimeren TALE-Klassen während der eukaryotischen Radiationen
Das allgegenwärtige Vorhandensein von dyadischen TALEs warf die nächste Frage auf: Sind alle dyadischen TALEs, über die in dieser Studie berichtet wurde, die Nachkommen einer einzigen Vorfahren-Dyade, oder sind sie das Ergebnis einer stammbaumspezifischen Evolution aus einer einzigen prototypischen TALE (proto-TALE), die keine Heterodimerisierung betreibt. Um die tiefe Abstammung zu untersuchen, untersuchten wir die Intron-Retention, die als ein seit langem erhaltenes Merkmal gilt und weniger anfällig für Homoplasie ist (ein Merkmal, das bei einer Reihe von Arten auftritt, aber bei ihrem gemeinsamen Vorfahren nicht vorhanden war). Fünf Intron-Positionen wurden von mindestens zwei TALE-Klassen geteilt, von denen die 44/45- und 48(2/3)-Introns als die ältesten gelten, da sie in allen Archaeplastida und Metazoa gefunden wurden (Additional file 3: Abbildung S5).
Die 44/45- und 48(2/3)-Introns zeigten eine verblüffende exklusive Verteilung zwischen den beiden dyadischen Partnern jedes Stammes: einer besitzt das 44/45- und der andere das 48(2/3)-Intron (Zusätzliche Datei 3: Abbildung S5). Dieses sich gegenseitig ausschließende Muster deutet darauf hin, dass zu Beginn der eukaryotischen Radiation zwei TALE-Gene mit unterschiedlichen Intronpositionen existierten. Wir halten die 44/45-Intronposition für die älteste, da sie in den meisten Nicht-TALE-Homeobox-Genen konserviert wurde. In diesem Zusammenhang spekulieren wir, dass der Erwerb des 48(2/3)-Introns und der Verlust des 44/45-Introns mit einem frühen Ereignis einherging, bei dem die Proto-TALE mit dem 44/45-Intron dupliziert wurde, um eine zweite TALE mit dem 48(2/3)-Intron zu erzeugen. Da die 48(2/3)-Intron-Position in den Genen der KNOX/MEIS-Gruppe in Viridiplantae und Metazoa und auch in den Genen der PBX-Gruppe in Rhodophyta und Cryptophyta gefunden wurde, können wir spekulieren, dass die duplizierten TALEs früh entstanden sind und sich diversifiziert haben, um stammesspezifische heterodimere Konfigurationen während der eukaryotischen Radiation zu etablieren. Alternativ könnte die 48(2/3)-Intron-Position in der TALE-Homöodomäne während der eukaryontischen Radiationen viele Male erworben worden sein.
Angesichts der Tatsache, dass sich die heterodimeren TALEs stammesspezifisch entwickelt haben, haben wir uns gefragt, wie die Proto-TALE zu dem Zeitpunkt aussah, als sie dupliziert wurde. Die folgenden Beobachtungen legen nahe, dass das Proto-TALE ein homodimerisierendes Protein war. Erstens enthalten die in den Archaeplastida identifizierten PBC-Homologiedomänen der PBX/GLX-Klasse-Proteine das MEINOX-Motiv, das ursprünglich aufgrund seiner Ähnlichkeit mit den MEIS/KNOX-Homologiedomänen definiert wurde (Abb. 3). Zweitens besitzen PBX-Glauco-Sequenzen die ELK-Homologie innerhalb ihrer PBL-Domäne (Abb. 3), die gut mit den ELK-Domänen von KNOX-Sequenzen in Viridiplantae übereinstimmt (Additional file 3: Abbildung S15). Das MEINOX-Motiv und die ELK-Homologie in den heterodimerisierenden KNOX- und PBX-Gruppen sprechen daher für einen gemeinsamen Ursprung der heterodimerisierenden TALE-Gruppen aus einer einzigen TALE durch Duplikation und anschließende Subfunktionalisierung.