- TALE u Archaeplastida dzielą się na dwie grupy, KNOX i non-KNOX
- Sekwencje grupy KNOX dzielą te same domeny heterodimeryzacji w całej Archaeplastida
- Sekwencje TALE z grupy non-KNOX posiadają domenę PBC-homology typu zwierzęcego, co sugeruje wspólny rodowód Archaeplastida i Metazoa
- GSP1 dzieli odległą homologię PBC razem z innymi sekwencjami z grupy non-KNOX w Viridiplantae
- Czy roślinna klasa BELL jest homologiczna do klasy GLX Chlorophyta?
- Dwa nie-KNOX paralogi Chlorophyta heterodimeryzują z homologami KNOX
- Heterodimeryzacja TALE ewoluowała wcześnie w historii eukariotycznej
- Intronowa retencja wspiera równoległą ewolucję klas heterodimerycznych TALE podczas radiacji eukariotycznych
TALE u Archaeplastida dzielą się na dwie grupy, KNOX i non-KNOX
Aby zebrać wszystkie dostępne sekwencje białek homeoboksów, przeprowadziliśmy wyszukiwanie metodą BLAST i Pfam-motif w stosunku do genomów nieroślinnych i zespołów transkryptomów w całej Archaeplastida, identyfikując 338 białek z 56 gatunków jako kolekcję Archaeplastida homeobox (30 genomów i 18 transkryptomów; Plik dodatkowy 1: Tabela S1). Spośród nich, 104 posiadały cechę definiującą białka TALE, trzyaminokwasową insercję pomiędzy pozycjami aa 23-24 w homeodomenie. Co najmniej dwa geny TALE wykryto w większości genomów, z wyjątkiem pięciu genomów w klasie Trebouxiophyceae w Chlorophyta (plik dodatkowy 1: Tabela S1; patrz plik dodatkowy 2: Uwaga S1 dla dalszej dyskusji na temat braku TALE w Trebouxiophyceae).
Zebrane sekwencje TALE zostały następnie sklasyfikowane na podstawie cech homeodomen przy użyciu podejścia filogenetycznego, z TALE pochodzącymi od zwierząt, roślin i wcześnie różnicujących się eukariotów (Amoebozoa i Excavata) jako grupami zewnętrznymi (plik dodatkowy 3: Rysunek S1). Powstała w ten sposób filogeneza homeodomen TALE wyróżniła dwie grupy we wszystkich trzech filogenezach Archaeplastida (ryc. 2). (1) Grupa KNOX jako dobrze wsparty klad wykazała kladogram specyficzny dla danego azylu: dwie sekwencje Glaucophyta u podstawy (jako KNOX-Glauco) były oddzielone od następnego kladu, łączącego sekwencje Rhodophyta (jako KNOX-Red1) i klad specyficzny dla Viridiplantae z silnym wsparciem (92/90/1.00). (2) Grupa nie-KNOX, w tym homologi BELL i GSP1, zawierała klady o mieszanej przynależności taksonomicznej. Analizy te wykazały, że białka TALE uległy dywergencji na dwie grupy jeszcze przed ewolucją Archaeplastida i że grupa KNOX jest silnie konserwowana w Archaeplastida.
Sekwencje grupy KNOX dzielą te same domeny heterodimeryzacji w całej Archaeplastida
Kolejnym pytaniem było, czy roślinna klasa KNOX powstała przed azylem Viridiplantae. Roślinne białka KNOX i Chlorophyta GSM1 posiadają homologię KNOX, składającą się z domen KN-A, KN-B i ELK, wymaganą do ich heterodimeryzacji z innymi białkami TALE; dlatego obecność homologii KNOX sugerowałaby możliwość heterodimeryzacji do grupy KNOX. Aby zebrać domeny homologiczne bez wcześniejszej informacji, przeprowadziliśmy wyszukiwanie domen homologicznych ad-hoc wśród sekwencji grupy KNOX. Używając zidentyfikowanych domen homologicznych jako kotwic, starannie stworzyliśmy wyrównanie sekwencji grupy KNOX w połączeniu z innymi sekwencjami TALE z homologią KNOX (plik dodatkowy 3: Rysunek S2). Z tego wyrównania KNOX znaleźliśmy wszystkie sekwencje grupy KNOX (z wyłączeniem sekwencji częściowych) wykazujące wyniki podobieństwa aminokwasowego > 50% dla co najmniej dwóch z trzech domen składających się na region homologiczny KNOX (plik dodatkowy 1: Tabela S3 dla obliczonej homologii domen). Aby sprawdzić, czy obserwowane podobieństwo jest specyficzne dla sekwencji TALE, wygenerowaliśmy motywy HMM dla domen KN-A i KN-B z wyrównania KNOX, przeszukaliśmy je w docelowych genomach i potwierdziliśmy, że domeny KN-A i KN-B występują tylko w sekwencjach TALE (plik dodatkowy 4: Dane S1 i S2). W ten sposób zdefiniowaliśmy KNOX-homologi jako sekwencje TALE posiadające poszukiwaną homologię KNOX (Rys. 2, oznaczone czerwonymi kropkami za ich identyfikatorami), co sugeruje, że KNOX-homolog istniał już przed ewolucją eukariotycznej fotosyntezy reprezentowanej przez Archaeplastida.
Oprócz homologii KNOX, to samo wyszukiwanie ujawniło również dwie nowe domeny na C-końcu homeodomeny (plik dodatkowy 3: Rysunek S2): pierwsza (KN-C1) była wspólna dla sekwencji Chlorophyta, a druga (KN-C2) była wspólna dla grupy homologów KNOX w kladzie spoza grupy KNOX (KNOX-Red2).
Homologi KNOX w Rhodophyta podzielono na dwie klasy: parafiletyczną grupę blisko kladu KNOX-Chloro, nazwaną KNOX-Red1, i drugą grupę blisko PBX-Outgroup, nazwaną KNOX-Red2. KNOX-Red1 nie posiadał KN-A, podczas gdy KNOX-Red2 nie posiadał ELK i dzielił domenę KN-C2 (plik dodatkowy 3: Rysunek S2). Uważamy KNOX-Red1 za typ ancestralny, ponieważ sekwencje KNOX-Red1 znaleziono we wszystkich badanych taksonach Rhodophyta, podczas gdy sekwencje KNOX-Red2 były ograniczone do dwóch klas taksonomicznych (Cyanidiophyceae i Florideophyceae). Co ciekawe, klad KNOX-Red2 obejmował dwie sekwencje alg zielonych, z silnym wsparciem statystycznym (89/89/0,97; ryc. 2); posiadały one domenę KN-C2, co sugeruje ich pochodzenie z klasy KNOX-Red2 (plik dodatkowy 3: ryc. S2; patrz plik dodatkowy 2: uwaga S2 dla dalszej dyskusji o ich możliwym pochodzeniu poprzez horyzontalny transfer genów).
Dostępne sekwencje TALE były ograniczone dla Glaucophyta. Znaleźliśmy pojedynczy homolog KNOX u dwóch gatunków, który posiadał domeny KN-A i KN-B, ale nie posiadał domeny ELK. Nazwaliśmy je KNOX-Glauco.
Sekwencje TALE z grupy non-KNOX posiadają domenę PBC-homology typu zwierzęcego, co sugeruje wspólny rodowód Archaeplastida i Metazoa
Po identyfikacji homologów KNOX, pozostałe sekwencje TALE zostały połączone jako grupa non-KNOX, w której brakuje domen KN-A i KN-B w Archaeplastida. Dalsza klasyfikacja grupy non-KNOX była trudna ze względu na wysoce rozbieżne sekwencje homeodomen. Zauważyliśmy jednak, że liczba genów non-KNOX na gatunek była w dużej mierze niezmienna: jeden w większości genomów Rhodophyta i Glaucophyta oraz dwa w większości genomów Chlorophyta, co sugeruje ich konserwację w obrębie każdego promieniowania.
Nasze poszukiwania homologiczne ad-hoc dostarczyły krytycznych informacji dla klasyfikacji non-KNOX, identyfikując domenę homologiczną wspólną dla wszystkich sekwencji non-KNOX u Glaucophyta i Rhodophyta (Rys. 3a, b). Ponieważ domena ta wykazywała podobieństwo do drugiej połowy zwierzęcej domeny PBC-B (Pfam ID: PF03792), znanej jako domena heterodimeryzacji, nazwaliśmy ją PBL (PBC-B Like). W związku z tym, sklasyfikowaliśmy wszystkie nie-KNOX TALE w Glaucophyta i Rhodophyta jako pojedynczą klasę homeoboksów związanych z PBC, PBX-Glauco lub PBX-Red. Sekwencje PBX-Glauco posiadały również motyw MEINOX, konserwowany w zwierzęcej domenie PBC-B, co wskazuje na wspólne pochodzenie domen PBC-B i PBL (Ryc. 3a).
GSP1 dzieli odległą homologię PBC razem z innymi sekwencjami z grupy non-KNOX w Viridiplantae
Pozostałym pytaniem była ewolucja sekwencji Chlorophyta non-KNOX, którym najwyraźniej brakowało homologii PBC. Aby odkryć nawet odległą homologię, porównaliśmy nowo zdefiniowane domeny PBL z sekwencjami Chlorophyta za pomocą BLAST (wartość odcięcia E- 1E-1) i wielokrotnego dopasowywania sekwencji. W wyniku tej kwerendy uzyskano trzy sekwencje TALE prazinofitów i jedną sekwencję TALE charofitów, które posiadały motyw MEINOX i domenę PBL, jednakże wykazywały one bardzo niską identyczność sekwencji między sobą (Rys. 3c). Dalsza kwerenda z wykorzystaniem tych czterech sekwencji pozwoliła zidentyfikować 11 dodatkowych sekwencji nie-KNOX. Dziewięć z nich zostało połączonych w dwa układy, jeden obejmujący homologi GSP1, a drugi łączący większość sekwencji prasinofitów (plik dodatkowy 3: Rysunek S3). Dwie pozostałe sekwencje (Picocystis_salinarum_04995 i Klebsormidium_flaccidum_00021_0250) wykazały homologię do sekwencji PBX-Red z Chondrus cruentum (ID:41034) w przedłużeniu o ~ 200 aa poza domenę PBL, sugerując ich przodków PBX-Red (kolejny potencjalny przypadek horyzontalnego transferu; Dodatkowy plik 3: Rysunek S4). Wszystkie sekwencje Chlorophyta non-KNOX, które niosą domeny homologiczne PBL, zostały sklasyfikowane jako GLX (GSP1-like homeobox) w uznaniu białka GSP1 z Chlamydomonas jako pierwszego scharakteryzowanego członka tej klasy.
Czy roślinna klasa BELL jest homologiczna do klasy GLX Chlorophyta?
Klasa BELL jest jedyną nie-KNOX-ową klasą w roślinach lądowych, dzielącą domenę POX (Pre-homeobox) (PF07526) i pozbawioną możliwej do zidentyfikowania domeny PBL. Genom K. flaccidum, jeden z dwóch dostępnych genomów charofita, z którego wyłoniły się rośliny lądowe, zawierał trzy sekwencje nie-KNOX, wszystkie posiadające domenę PBL (Fig. 3, plik dodatkowy 3: Figury S3, S4). Drugi genom charofita Chara braunii zawierał jeden przypuszczalny homolog BELL, który wydaje się być obcięty dla N-końcowych sekwencji poza C-końcową homeodomeną, prawdopodobnie z powodu niekompletnego modelu genu. Dlatego brak homologii PBL w roślinnej klasie BELL wydaje się być spowodowany dywergencją lub utratą domeny ze starej klasy charofitów, która miała homologię PBL. Znaleźliśmy intron w pozycji 24(2/3) homeodomeny homologa K. flaccidum GLX, który został wcześniej zidentyfikowany jako specyficzny dla roślinnej klasy BELL (plik dodatkowy 3: Figura S5), co sugeruje, że roślinna klasa BELL wyewoluowała z ancestralnego genu GLX. Więcej próbkowania taksonów u charofitów jest potrzebne do potwierdzenia tego wnioskowania.
Dwa nie-KNOX paralogi Chlorophyta heterodimeryzują z homologami KNOX
Nawet przy naszym czułym iteracyjnym wyszukiwaniu homologii, nie mogliśmy zidentyfikować homologii PBC/PBL w około połowie sekwencji Chlorophyta nie-KNOX. Ponieważ większość genomów Chlorophyta posiada jeden homolog GLX i jedną sekwencję non-KNOX bez domeny homologii PBL, te ostatnie odnosimy zbiorczo do klasy-B (plik dodatkowy 3: Rysunek S6). Wyjątkiem był jeden klad prasinofitów (klasa Mamiellophyceae), którego sześć wysokiej jakości genomów zawiera dwie sekwencje nie-KNOX pozbawione domeny PBL-homologii. Niemniej jednak, te sekwencje nie-KNOX tworzyły dwie grupy, jedną bardziej konserwatywną, a drugą mniej konserwatywną i polifiletyczną, określane odpowiednio jako klasy Mam-A i Mam-B (plik dodatkowy 3: ryc. S7, S8). Biorąc pod uwagę redukcyjną ewolucję genomu Mamiellophyceae, konserwowana klasa Mam-A może pochodzić od ancestralnej klasy GLX.
Dwie rozbieżne klasy nie-KNOX w Chlorophyta doprowadziły do krytycznego pytania o ich sieci dyadyczne. Wcześniejsze badania wykazały, że heterodimery TALE wymagają interakcji pomiędzy domenami MEIS i PBC u zwierząt oraz pomiędzy domenami KNOX i PBL w Chlamydomonas. Przewidywano zatem, że wszystkie TALE z Glaucophyta i Rhodophyta tworzą heterodimery poprzez swoje domeny homologiczne KNOX i PBL. Z drugiej strony, pozostaje do zbadania, czy TALE Chlorophyta pozbawione domeny PBL mogą tworzyć heterodimery z innymi TALE.
Aby scharakteryzować sieć interakcji białek klasy TALE w Chlorophyta, wybraliśmy trzy gatunki prasinofitów do badań interakcji białko-białko: dwa gatunki zawierające geny Mam-A i Mam-B (Micromonas commoda i Ostreococcus tauri), oraz kolejny gatunek (Picocystis salinarum), którego transkryptom zawierał jedną sekwencję GLX i jedną klasy-B. We wszystkich trzech gatunkach stwierdzono, że homologi KNOX oddziaływały ze wszystkimi badanymi białkami nie-KNOX w klasie Mam-A, Mam-B, Class-B i GLX (Rys. 4a-c). Nie zaobserwowano interakcji pomiędzy dwoma białkami nie-KNOX w żadnym z trzech gatunków (Rys. 4a-c). Podobnie jak w przypadku heterodimeryzacji GLX-KNOX, Mam-A i Mam-B również wymagały dodatkowych domen poza homeodomeną do ich heterodimeryzacji z homologami KNOX (plik dodatkowy 3: Rysunek S9). Wyniki te wykazały, że wszystkie rozbieżne nie-KNOX TALEs zachowały swoją pierwotną aktywność do tworzenia heterodimerów z homologami KNOX. Obserwowana sieć interakcji pomiędzy sekwencjami TALE jest podsumowana w pliku dodatkowym 3: Figura S10.
Heterodimeryzacja TALE ewoluowała wcześnie w historii eukariotycznej
Nasze odkrycie homologii PBC u Archaeplastida sugeruje wspólne pochodzenie heterodimeryzujących TALES między Metazoa i Archaeplastida. Przewiduje również, że inne linie eukariotyczne mogą posiadać TALE o homologii PBC. Poza zwierzętami, baza danych Pfam zawiera tylko dwie sekwencje wiążące domenę PBC-B, jedną z gatunku Cryptophyta (Guillardia theta, ID:137502), a drugą z gatunku Amoebozoa (Acanthamoeba castillian, ID:XP_004342337). Dalej badaliśmy grupę Excavata, blisko domniemanego korzenia filogenezy eukariotycznej. W wyniku przeszukania dwóch genomów (Naegleria gruberi i Bodo saltans) zebraliśmy 12 sekwencji homeoboksów TALE w N.gruberi i żadnej w B.saltans, z których znaleźliśmy jedną z domeną homologii PBC (ID:78561, Fig. 3a) i jedną z domeną homologii MEIS/KNOX (ID:79931, Dodatkowy plik 3: Figura S2). Przeszukaliśmy dodatkowe genomy w Amorphea i znaleźliśmy domenę PBC i MEIS/KNOX w sekwencjach TALE zebranych z Apusozoa, Ichtyhosporea i Choanoflagellata, ale nie z Fungi (plik dodatkowy 3: Figury S11-S14). Nasze dane sugerują, że domeny heterodimeryzacji – homologia PBC i homologia MEIS/KNOX – powstały we wczesnym okresie ewolucji eukariotycznej i utrzymywały się przez cały czas trwania głównych radiacji eukariotycznych.
Intronowa retencja wspiera równoległą ewolucję klas heterodimerycznych TALE podczas radiacji eukariotycznych
Wszechobecność dyadycznych TALE nasuwa kolejne pytanie: Czy wszystkie dyadyczne TALE zgłoszone w tym badaniu są potomkami pojedynczej dyady przodka, czy też wynikają z ewolucji specyficznej dla danej linii od pojedynczego prototypowego TALE (proto-TALE), który nie angażuje się w heterodimeryzację. Aby zbadać głęboki rodowód, zbadaliśmy retencję intronów, która jest uważana za cechę długo zachowaną i mniej podatną na homoplazję (cecha wykazywana przez zestaw gatunków, ale nie występująca u ich wspólnego przodka). Pięć pozycji intronów było wspólnych dla co najmniej dwóch klas TALE, z których introny 44/45 i 48(2/3) kwalifikowały się jako najbardziej przodkowe, ponieważ występowały u Archaeplastida i Metazoa (plik dodatkowy 3: Rysunek S5).
Introny 44/45 i 48(2/3) wykazywały intrygującą, wyłączną dystrybucję pomiędzy dwoma partnerami dyadycznymi z każdego azylu: jeden posiadał intron 44/45, a drugi 48(2/3) (plik dodatkowy 3: Figura S5). Ten wzajemnie wykluczający się wzór sugeruje, że dwa geny TALE z różnymi pozycjami intronów istniały na początku promieniowania eukariotycznego. Uważamy pozycję intronu 44/45 za najbardziej przodującą, biorąc pod uwagę, że była ona konserwowana w większości genów homeoboksów innych niż TALE. W związku z tym spekulujemy, że nabycie intronu 48(2/3) i utrata intronu 44/45 towarzyszyły wczesnemu wydarzeniu, w którym proto-TALE z intronem 44/45 został zduplikowany w celu wygenerowania drugiego TALE z intronem 48(2/3). Ponieważ pozycja intronu 48(2/3) została znaleziona w genach grupy KNOX/MEIS u Viridiplantae i Metazoa, a także w genach grupy PBX u Rhodophyta i Cryptophyta, można spekulować, że zduplikowane TALE powstały wcześnie i różnicowały się, tworząc specyficzne dla linii heterodimeryczne konfiguracje podczas radiacji eukariotycznej. Alternatywnie, pozycja intronu 48(2/3) w homeodomenie TALE mogła być zdobywana wielokrotnie podczas radiacji eukariotycznych.
Zważywszy, że heterodimeryczne TALE ewoluowały w sposób specyficzny dla danej linii, zapytaliśmy, jak wyglądał proto-TALE w czasie, gdy uległ duplikacji. Poniższe obserwacje sugerują, że proto-TALE było białkiem homodimeryzującym. Po pierwsze, domeny homologiczne PBC białek klasy PBX/GLX zidentyfikowane u Archaeplastida zawierają motyw MEINOX, który został pierwotnie zdefiniowany ze względu na podobieństwo do domen homologicznych MEIS/KNOX (ryc. 3). Po drugie, sekwencje PBX-Glauco posiadają homologię ELK w swojej domenie PBL (Rys. 3), która dobrze pokrywa się z domenami ELK sekwencji klasy KNOX u Viridiplantae (plik dodatkowy 3: Rysunek S15). Dlatego też motyw MEINOX i homologia ELK w heterodimeryzujących grupach KNOX i PBX przemawiają za wspólnym pochodzeniem heterodimeryzujących grup TALE od pojedynczego TALE poprzez duplikację, a następnie subfunkcjonalizację.
.