- A TALE-k az Archaeplastidákban két csoportra oszlanak, KNOX és nem-KNOX
- A KNOX-csoport szekvenciái az Archaeplastida-csoporton belül azonos heterodimerizációs doménekkel rendelkeznek
- A KNOX osztályok egymástól függetlenül különböztek az algafilok között
- A nem-KNOX csoportba tartozó TALE-ok állati típusú PBC-homológiájú doménnel rendelkeznek, ami az Archaeplastida és a Metazoa közötti közös ősiségre utal
- A GSP1 távoli PBC-homológián osztozik a Viridiplantae más, nem-KNOX-csoportba tartozó szekvenciáival együtt
- A növényi BELL osztály homológ a Chlorophyta GLX osztályával?
- A Chlorophyta két nem-KNOX paralógja heterodimerizál a KNOX homológokkal
- A TALE heterodimerizáció az eukarióta történelem korai szakaszában fejlődött ki
- Az intron-megmaradás alátámasztja a heterodimer TALE-osztályok párhuzamos evolúcióját az eukarióta-sugárzások során
A TALE-k az Archaeplastidákban két csoportra oszlanak, KNOX és nem-KNOX
Az összes rendelkezésre álló homeobox fehérje szekvencia összegyűjtése érdekében BLAST és Pfam-motif kereséseket végeztünk nem növényi genomokkal és transzkriptom összeállításokkal szemben az Archaeplastida teljes körében, és 56 faj 338 fehérjét azonosítottuk az Archaeplastida homeobox gyűjteményként (30 genom és 18 transzkriptom; 1. kiegészítő fájl: táblázat). Ezek közül 104 rendelkezett a TALE-fehérjék meghatározó jellemzőjével, egy három aminosavból álló inszercióval a homeodomain 23-24 aa-pozíciói között. A legtöbb genomban legalább két TALE-gént detektáltak, kivéve a Chlorophyta osztályba tartozó Trebouxiophyceae öt genomját (Additional file 1: S1 táblázat; a Trebouxiophyceae-ben a TALE-k hiányának további tárgyalását lásd a Additional file 2: S1 megjegyzésben).
A begyűjtött TALE-szekvenciákat ezután a homeodomain jellemzőik alapján filogenetikai megközelítéssel osztályoztuk, az állatokból, növényekből és a korai divergens eukariótákból (Amoebozoa és Excavata) származó TALE-eket mint outgroupokat (Additional file 3: S1 ábra). Az így kapott TALE homeodomain filogenezis két csoportot különböztetett meg az Archaeplastida mindhárom phylájában (2. ábra). (1) A KNOX-csoport mint jól támogatott klád egy törzs-specifikus kládogramot mutatott: a két Glaucophyta-szekvencia az alapban (mint KNOX-Glauco) elkülönült a következő kládtól, amely a Rhodophyta-szekvenciákat (mint KNOX-Red1) és egy Viridiplantae-specifikus kládot egyesíti erős támogatással (92/90/1,00). (2) A nem-KNOX csoport, beleértve a BELL és a GSP1 homológokat, vegyes rendszertani hovatartozású kládokat tartalmazott. Ezek az elemzések azt mutatták, hogy a TALE-fehérjék már az Archaeplastida evolúciója előtt két csoportra váltak szét, és hogy a KNOX-csoport erősen konzervált az Archaeplastida egészében.
A KNOX-csoport szekvenciái az Archaeplastida-csoporton belül azonos heterodimerizációs doménekkel rendelkeznek
A következő kérdés az volt, hogy a növényi KNOX osztály a Viridiplantae törzs előtt keletkezett-e? A növényi KNOX fehérjék és a Chlorophyta GSM1 rendelkeznek a KN-A, KN-B és ELK doménekből álló KNOX-homológiával, amely szükséges a többi TALE fehérjével való heterodimerizációjukhoz ; ezért a KNOX homológia jelenléte a KNOX csoport heterodimerizációjának lehetőségére utal. A homológiadomének előzetes információk nélküli összegyűjtéséhez ad-hoc homológiadomén-keresést végeztünk a KNOX-csoport szekvenciái között. Az azonosított homológiadoméneket horgonyként használva gondosan kuratíroztuk a KNOX-csoport szekvenciáinak a KNOX-homológiával rendelkező bármely más TALE-szekvenciával kombinált illesztését (Additional file 3: S2 ábra). Ebből a KNOX-illesztésből megtaláltuk az összes KNOX-csoport szekvenciát (kivéve a részleges szekvenciákat), amelyek a KNOX-homológia régiót alkotó három doménből legalább kettő esetében > 50%-os aminosav-hasonlósági pontszámot mutatnak (1. kiegészítő fájl: S3. táblázat a számított domén-homológiáról). Annak tesztelésére, hogy a megfigyelt hasonlóság csak a TALE-szekvenciákra jellemző-e, a KNOX-illesztésből HMM-motívumokat generáltunk a KN-A és KN-B doménekhez, megkerestük őket a célgenomokban, és megerősítettük, hogy a KN-A és KN-B domének csak a TALE-szekvenciákban találhatók (Additional file 4: Data S1 és S2). Így a KNOX-homológokat úgy definiáltuk, mint a kereshető KNOX-homológiával rendelkező TALE-szekvenciákat (2. ábra, az azonosítójukat követő piros pontokkal jelölve), ami arra utal, hogy a KNOX-homológ már az eukarióta fotoszintézis evolúciója előtt is létezett, ahogy azt az Archaeplastida képviseli.
A KNOX-homológián kívül ugyanez a keresés két új domént is feltárt a homeodomén C-terminálisán (Additional file 3: S2 ábra): az első (KN-C1) közös volt a Chlorophyta-szekvenciák között, a második (KN-C2) pedig a KNOX-csoporton kívüli kládba tartozó KNOX-homológok egy csoportjában (KNOX-Red2).
A KNOX osztályok egymástól függetlenül különböztek az algafilok között
A Viridiplantae-ben a legtöbb Chlorophyta fajban egyetlen KNOX homológot találtunk, míg a KNOX1 és KNOX2 divergencia a Streptophyta osztályban, beleértve a charophyte Klebsormidium flaccidumot és a szárazföldi növényeket (2. ábra). Az újonnan felfedezett KN-C1 domén specifikus volt a Chlorophyta KNOX szekvenciáira, és egy faj kivételével (Pyramimonas amylifera) minden fajban megtalálható volt. A KN-C1 és a KNOX1/KNOX2 szekvenciák C-terminális nyúlványai közötti hasonlóság hiánya arra utal, hogy a KNOX evolúciója független, vonal-specifikus a Chlorophyta és a Streptophyta fajokban (Additional file 3: S2 ábra). Ezért a Chlorophyta KNOX osztályaira KNOX-Chloro néven hivatkozunk, szemben a Streptophyta KNOX1 és KNOX2 osztályaival.
A Rhodophyta KNOX homológjait két osztályra osztottuk: egy, a KNOX-Chloro kládhoz közeli parafiletikus csoportra, amelyet KNOX-Red1-nek neveztünk el, és egy második, a PBX-Out-csoporthoz közeli csoportra, amelyet KNOX-Red2-nek neveztünk el. A KNOX-Red1-nek hiányzott a KN-A, míg a KNOX-Red2-nek hiányzott az ELK és közös volt a KN-C2 doménje (Additional file 3: S2 ábra). A KNOX-Red1-et tekintjük őstípusnak, mivel a KNOX-Red1 szekvenciák az összes vizsgált Rhodophyta taxonban megtalálhatóak voltak, míg a KNOX-Red2 szekvenciák két rendszertani osztályra korlátozódtak (Cyanidiophyceae és Florideophyceae). Érdekes módon a KNOX-Red2 kládba két zöldalga szekvencia is tartozott, erős statisztikai támogatottsággal (89/89/0,97; 2. ábra); ezek KN-C2 doménnel rendelkeztek, ami arra utal, hogy a KNOX-Red2 osztályon belülről származnak (Additional file 3: S2 ábra; a horizontális géntranszfer útján történő lehetséges eredetükről lásd Additional file 2: S2 megjegyzés).
A rendelkezésre álló TALE szekvenciák korlátozottak voltak a Glaucophyta számára. Két fajban egyetlen KNOX homológot találtunk, amely rendelkezett KN-A és KN-B doménnel, de nem rendelkezett ELK doménnel. Ezeket KNOX-Glauco-nak neveztük el.
A nem-KNOX csoportba tartozó TALE-ok állati típusú PBC-homológiájú doménnel rendelkeznek, ami az Archaeplastida és a Metazoa közötti közös ősiségre utal
A KNOX-homológok azonosítását követően a fennmaradó TALE-szekvenciákat a nem-KNOX csoportba soroltuk, amelyből hiányzik a KN-A és KN-B domén az Archaeplastida-ban. A nem-KNOX csoport további osztályozása kihívást jelentett a nagymértékben eltérő homeodomén szekvenciák miatt. Megfigyeltük azonban, hogy a nem-KNOX gének száma fajonként nagyjából változatlan: egy a legtöbb Rhodophyta és Glaucophyta genomban és kettő a Chlorophyta genomok többségében, ami az egyes sugárzásokon belüli konzervációjukra utal.
A nem-KNOX osztályozáshoz kritikus információt szolgáltatott az ad-hoc homológiakeresésünk, amely egy olyan homológiadomént azonosított, amely közös az összes Glaucophyta és Rhodophyta nem-KNOX szekvencia között (3a, b ábra). Mivel ez a domén hasonlóságot mutatott az állati PBC-B domén (Pfam ID: PF03792) heterodimerizációs doménként ismert második felével, ezt a domént PBL-nek (PBC-B Like) neveztük el. Ennek megfelelően a Glaucophyta és Rhodophyta összes nem-KNOX TALE-ját egyetlen PBC-hez kapcsolódó homeobox osztályba, a PBX-Glauco vagy PBX-Red osztályba soroltuk. A PBX-Glauco szekvenciák is rendelkeztek az állati PBC-B doménben konzervált MEINOX motívummal, ami a PBC-B és a PBL domének közös ősiségére utal (3a. ábra).
A GSP1 távoli PBC-homológián osztozik a Viridiplantae más, nem-KNOX-csoportba tartozó szekvenciáival együtt
A fennmaradó kérdés a Chlorophyta nem-KNOX-szekvenciáinak evolúciója volt, amelyekből nyilvánvalóan hiányzott a PBC-homológia. Hogy akár egy távoli homológiát is feltárjunk, az újonnan definiált PBL-doméneket BLAST (1E-1-es cut-off E-értékkel) és többszörös szekvencia-illesztésekkel hasonlítottuk össze a Chlorophyta-szekvenciákkal. Ez a lekérdezés három prasinophyta és egy charophyta TALE-szekvenciát gyűjtött össze, amelyek rendelkeztek MEINOX-motívummal és feltételezett PBL-doménnel; azonban egymás között nagyon alacsony szekvenciaazonosságot mutattak (3c. ábra). E négy szekvencia további lekérdezése 11 további, nem-KNOX szekvenciát azonosított. Ezek közül kilencet két illesztésbe rendeztünk, az egyik a GSP1 homológokat, a másik pedig a legtöbb prasinofita szekvenciát egyesítette (Additional file 3: S3 ábra). A fennmaradó két szekvencia (Picocystis_salinarum_04995 és Klebsormidium_flaccidum_00021_0250) homológiát mutatott a Chondrus cruentum (ID:41034) PBX-Red szekvenciájával egy ~ 200 aa hosszúságú, a PBL doménen túli kiterjesztésben, ami a PBX-Red ősökre utal (a horizontális transzfer egy másik lehetséges esete; Additional file 3: S4 ábra). A PBL-homológiai doméneket hordozó összes Chlorophyta nem-KNOX szekvenciát a GLX (GSP1-like homeobox) kategóriába soroltuk a Chlamydomonas GSP1 fehérjéjének, mint az osztály első jellemzett tagjának elismeréseként.
A növényi BELL osztály homológ a Chlorophyta GLX osztályával?
A BELL osztály az egyetlen nem-KNOX osztály a szárazföldi növényekben, amely osztozik egy POX (Pre-homeobox) doménen (PF07526) és nem rendelkezik azonosítható PBL doménnel. A K. flaccidum genom, azon két rendelkezésre álló charofita genom egyike, amelyből a szárazföldi növény kialakult, három nem-KNOX szekvenciát tartalmazott, amelyek mindegyike rendelkezik PBL doménnel (3. ábra, Additional file 3: S3, S4 ábrák). A Chara braunii második charophyta genomja egy feltételezett BELL homológot tartalmazott, amely a jelek szerint a C-terminális homeodomainon kívüli N-terminális szekvenciák tekintetében csonka volt, valószínűleg a hiányos génmodell miatt. Ezért úgy tűnik, hogy a PBL-homológia hiánya a növényi BELL osztályban a PBL-homológiával rendelkező régi charofita osztályból való divergencia vagy doménvesztés következménye. Találtunk egy intront a K. flaccidum GLX homológjának 24(2/3) homeodomén pozíciójában, amelyet korábban a növényi BELL osztályra specifikusnak azonosítottunk (Additional file 3: Figure S5) , ami arra utal, hogy a növényi BELL osztály egy ősi GLX génből fejlődött ki. További taxonmintavételre van szükség a charophytákban ennek a következtetésnek a megerősítéséhez.
A Chlorophyta két nem-KNOX paralógja heterodimerizál a KNOX homológokkal
A Chlorophyta nem-KNOX szekvenciáinak mintegy felében még érzékeny iteratív homológiakeresésünkkel sem tudtunk PBC/PBL-homológiát azonosítani. Mivel a legtöbb Chlorophyta genom rendelkezik egy GLX-homológgal és egy PBL-homológiai domén nélküli nem-KNOX-szekvenciával, az utóbbiakat együttesen a B osztályba soroljuk (Additional file 3: Figure S6). Kivételt képez egy prasinophyta-klád (Mamiellophyceae osztály), amelynek hat jó minőségű genomja mindegyike két olyan nem-KNOX-szekvenciát tartalmaz, amelyből hiányzik a PBL-homológia. Mindazonáltal ezek a nem-KNOX-szekvenciák két csoportot alkottak, az egyik konzerváltabb, a másik kevésbé konzervált és polifiletikus, amelyeket a Mam-A és Mam-B osztályoknak neveztek el (Additional file 3: S7, S8 ábrák). Figyelembe véve a Mamiellophyceae reduktív genomevolúcióját , a konzervált Mam-A osztály egy ősi GLX osztályból származhat.
A Chlorophyta két eltérő nem-KNOX osztálya kritikus kérdést vetett fel a diadikus hálózataikkal kapcsolatban. Korábbi tanulmányok kimutatták, hogy a TALE heterodimerek megkövetelik a MEIS és a PBC domének közötti kölcsönhatást az állatokban, valamint a KNOX és a PBL domének között a Chlamydomonasban . Ezért azt jósolták, hogy minden Glaucophyta és Rhodophyta TALE heterodimert képez a KNOX- és PBL-homológiájú doménjeiken keresztül. Vizsgálat tárgyát képezte viszont, hogy a PBL-doménnel nem rendelkező Chlorophyta TALE-ok képesek-e heterodimert alkotni más TALE-okkal.
A TALE osztályú fehérjék kölcsönhatási hálózatának jellemzésére a Chlorophytákban három prasinofita fajt választottunk ki fehérje-fehérje kölcsönhatási vizsgálatokhoz: két Mam-A és Mam-B géneket tartalmazó fajt (Micromonas commoda és Ostreococcus tauri), valamint egy másik fajt (Picocystis salinarum), amelynek transzkriptomja egy GLX és egy Class-B szekvenciát tartalmazott. Mindhárom fajban azt találtuk, hogy a KNOX homológok kölcsönhatásba lépnek az összes vizsgált nem-KNOX fehérjével a Mam-A, Mam-B, Class-B és GLX osztályban (4a-c. ábra). A két nem-KNOX fehérje között a három faj egyikében sem figyeltünk meg kölcsönhatást (4a-c. ábra). A GLX-KNOX heterodimerizációhoz hasonlóan a Mam-A és a Mam-B esetében is szükség volt a homeodomainon kívüli további doménekre a KNOX homológokkal való heterodimerizációhoz (Additional file 3: Figure S9). Ezek az eredmények azt mutatták, hogy az összes eltérő, nem-KNOX TALE megőrizte eredeti aktivitását a KNOX homológokkal való heterodimerek kialakításához. A TALE-szekvenciák között megfigyelt interakciós hálózatot a 3. kiegészítő fájl: S10. ábra foglalja össze.
A TALE heterodimerizáció az eukarióta történelem korai szakaszában fejlődött ki
A PBC-homológia felfedezése az Archaeplastidákban a heterodimerizáló TALES közös ősiségére utal a Metazoa és Archaeplastida között. Azt is megjósoltuk, hogy más eukarióta vonalak is rendelkezhetnek a PBC-homológiával rendelkező TALE-okkal. Az állatokon kívül a Pfam adatbázis csak két PBC-B domént hordozó szekvenciát tartalmaz, az egyik egy Cryptophyta fajból (Guillardia theta, ID:137502), a másik pedig egy Amoebozoa fajból (Acanthamoeba castillian, ID:XP_004342337) . Megvizsgáltuk továbbá az Excavata csoportot, közel az eukarióta filogenetika feltételezett gyökeréhez . Két genomban (Naegleria gruberi és Bodo saltans) végzett keresés során 12 TALE homeobox szekvenciát gyűjtöttünk össze a N.gruberiben, és egyet sem a B.saltansban, amelyek közül egyet PBC-homológiájú doménnel (ID:78561, 3a ábra) és egyet MEIS/KNOX-homológiájú doménnel (ID:79931, Additional file 3: S2 ábra). További genomokat kerestünk az Amorpheában, és megtaláltuk a PBC-homológiát és a MEIS/KNOX-homológiát az Apusozoa, Ichtyhosporea és Choanoflagellata, de nem a Gombákból gyűjtött TALE-szekvenciákban (Additional file 3: S11-S14 ábrák). Adataink arra utalnak, hogy a heterodimerizációs domének – a PBC-homológia és a MEIS/KNOX-homológia – az eukarióta evolúció korai szakaszában keletkeztek, és fennmaradtak a nagy eukarióta-sugárzások során.
Az intron-megmaradás alátámasztja a heterodimer TALE-osztályok párhuzamos evolúcióját az eukarióta-sugárzások során
A dyadikus TALE-k mindenütt jelenléte a következő kérdést vetette fel: Vajon az ebben a tanulmányban közölt összes dyadikus TALE egyetlen ős-dyadikus leszármazottja, vagy pedig egy heterodimerizációban nem részt vevő egyetlen prototipikus TALE (proto-TALE) vonal-specifikus evolúciójának eredményeként jöttek létre. A mély ősök szondázásához megvizsgáltuk az intron-visszatartást, mivel ezt hosszú ideig megőrződött tulajdonságnak tekintjük, és kevésbé hajlamos a homoplasia (egy fajcsoport által megjelenített, de a közös ősükben nem jelenlévő tulajdonság) . Öt intronpozíciót legalább két TALE-osztály osztott meg, amelyek közül a 44/45 és a 48(2/3) intronok minősültek a legősibbnek, mivel az Archaeplastida és a Metazoa egészén megtalálhatóak voltak (Additional file 3: Figure S5).
A 44/45 és a 48(2/3) intronok érdekes módon kizárólagos eloszlást mutattak az egyes törzsek két diadikus partnere között: az egyik a 44/45, a másik a 48(2/3) intronnal rendelkezik (Additional file 3: S5 ábra). Ez az egymást kizáró mintázat azt sugallta, hogy az eukarióta sugárzás kezdetén két különböző intronpozíciójú TALE-gén létezett. A 44/45-ös intronpozíciót tekintjük a legősibbnek, mivel ez konzerválódott a legtöbb nem TALE homeobox génben . Ebben a tekintetben feltételezzük, hogy a 48(2/3) pozíció megszerzése és a 44/45 intron elvesztése egy olyan korai eseményt kísért, amelyben a 44/45 intronnal rendelkező proto-TALE megkettőződött, hogy létrehozzon egy második TALE-t a 48(2/3) intronnal. Mivel a 48(2/3) intron pozíciója megtalálható volt a KNOX/MEIS csoport génjeiben a Viridiplantae és a Metazoa, valamint a PBX csoport génjeiben a Rhodophyta és a Cryptophyta, feltételezhetjük, hogy a duplikált TALE-ok korán keletkeztek és diverzifikálódtak, hogy az eukarióta sugárzások során vonal-specifikus heterodimer konfigurációkat hozzanak létre. Alternatívaként a TALE homeodomain 48(2/3) intron pozícióját az eukarióta sugárzások során többször is megszerezhették.
Mivel a heterodimer TALE-k vonal-specifikusan fejlődtek, feltettük a kérdést, hogy hogyan nézett ki a proto-TALE a duplikáció idején. A következő megfigyelések arra utalnak, hogy a proto-TALE homodimerizáló fehérje volt. Először is, az Archaeplastidákban azonosított PBX/GLX osztályú fehérjék PBC-homológiai doménjei között megtalálható a MEINOX-motívum, amelyet eredetileg a MEIS/KNOX-homológiai doménekhez való hasonlósága miatt határoztak meg (3. ábra) . Másodszor, a PBX-Glauco szekvenciák rendelkeznek az ELK-homológiával a PBL doménjükön belül (3. ábra), amely jól illeszkedik a Viridiplantae KNOX osztályú szekvenciák ELK doménjeihez (Additional file 3: Figure S15). Ezért a MEINOX-motívum és az ELK-homológia a heterodimerizáló KNOX- és PBX-csoportokban alátámasztotta a heterodimerizáló TALE-csoportok közös eredetét egyetlen TALE-ből, duplikáció, majd szubfunkcionalizáció révén.