- TALE u Archaeplastida jsou rozděleny do dvou skupin, KNOX a non-KNOX
- Sekvence skupiny KNOX sdílejí stejné heterodimerizační domény napříč Archaeplastida
- Třídy KNOX divergovaly nezávisle mezi řasovými fylami
- TALE skupiny non-KNOX mají doménu PBC-homologie živočišného typu, což naznačuje společný původ mezi Archaeplastida a Metazoa
- GSP1 sdílí vzdálenou PBC-homologii spolu s dalšími sekvencemi skupiny non-KNOX u Viridiplantae
- Je rostlinná třída BELL homologní s třídou GLX u Chlorophyta?
- Dva non-KNOX paralogy Chlorophyta heterodimerizují s KNOX homology
- Heterodimerizace TALE se vyvinula brzy v historii eukaryot
- Intron-retention podporuje paralelní evoluci heterodimerických tříd TALE během eukaryotických radiací
TALE u Archaeplastida jsou rozděleny do dvou skupin, KNOX a non-KNOX
Pro shromáždění všech dostupných sekvencí homeoboxových proteinů jsme provedli vyhledávání BLAST a Pfam-motif proti nerostným genomům a sestavám transkriptomů napříč Archaeplastida a identifikovali 338 proteinů z 56 druhů jako kolekci homeoboxů Archaeplastida (30 genomů a 18 transkriptomů; Další soubor 1: Tabulka S1). Z nich 104 mělo definiční znak proteinů TALE, tříaminokyselinovou inzerci mezi pozicemi aa 23-24 v homeodoméně . Alespoň dva geny TALE byly zjištěny u většiny genomů s výjimkou pěti genomů třídy Trebouxiophyceae z Chlorophyta (doplňkový soubor 1: tabulka S1; další diskuse o nepřítomnosti genů TALE u Trebouxiophyceae viz doplňkový soubor 2: poznámka S1).
Sebrané sekvence TALE byly poté klasifikovány podle jejich homeodoménových vlastností pomocí fylogenetického přístupu, přičemž TALE z živočichů, rostlin a časně odvozených eukaryot (Amoebozoa a Excavata) byly zařazeny jako outgroups (Additional file 3: Figure S1). Výsledná fylogeneze homeodomén TALE rozlišila dvě skupiny u všech tří fylů Archaeplastida (obr. 2). (1) Skupina KNOX jako dobře podporovaný klad vykazovala kladogram specifický pro jednotlivé fyly: dvě sekvence Glaucophyta na bázi (jako KNOX-Glauco) byly odděleny od dalšího kladogramu, který kombinuje sekvence Rhodophyta (jako KNOX-Red1) a klad specifický pro Viridiplantae se silnou podporou (92/90/1,00). (2) Skupina non-KNOX, zahrnující homology BELL a GSP1, obsahovala klady se smíšenou taxonomickou příslušností. Tyto analýzy ukázaly, že proteiny TALE se rozdělily do dvou skupin již před evolucí Archaeplastida a že skupina KNOX je vysoce konzervovaná napříč Archaeplastida.
Sekvence skupiny KNOX sdílejí stejné heterodimerizační domény napříč Archaeplastida
Další otázkou bylo, zda třída KNOX rostlin vznikla před fylogenezí Viridiplantae. Rostlinné proteiny KNOX a Chlorophyta GSM1 mají KNOX-homologii, která se skládá z domén KN-A, KN-B a ELK, potřebnou pro jejich heterodimerizaci s ostatními proteiny TALE ; proto by přítomnost KNOX homologie naznačovala možnost heterodimerizace do skupiny KNOX. Abychom shromáždili homologické domény bez předchozích informací, provedli jsme ad-hoc vyhledávání homologických domén mezi sekvencemi skupiny KNOX. Pomocí identifikovaných homologických domén jako kotev jsme pečlivě sestavili zarovnání sekvencí skupiny KNOX v kombinaci se všemi ostatními sekvencemi TALE s homologií KNOX, (Additional file 3: Figure S2). Z tohoto zarovnání KNOX jsme zjistili, že všechny sekvence skupiny KNOX (s výjimkou částečných sekvencí) vykazují skóre podobnosti aminokyselin > 50 % pro alespoň dvě ze tří domén tvořících KNOX-homologickou oblast (doplňkový soubor 1: tabulka S3 pro vypočtenou homologii domén). Abychom otestovali, zda je pozorovaná podobnost specifická pro sekvence TALE, vytvořili jsme ze zarovnání KNOX motivy HMM pro domény KN-A a KN-B, vyhledali je v cílových genomech a potvrdili, že domény KN-A a KN-B se vyskytují pouze v sekvencích TALE (Doplňkový soubor 4: Data S1 a S2). Tím jsme definovali KNOX-homology jako sekvence TALE, které mají hledanou homologii KNOX (obr. 2, označené červenými tečkami za jejich ID), což naznačuje, že KNOX-homolog existoval již před evolucí eukaryotické fotosyntézy, kterou představují Archaeplastida.
Kromě KNOX-homologie odhalila stejná rešerše také dvě nové domény na C-konci homeodomény (Additional file 3: Figure S2): první (KN-C1) byla společná pro sekvence Chlorophyta a druhá (KN-C2) byla společná pro skupinu homologů KNOX v kladu mimo skupinu KNOX (KNOX-Red2).
Třídy KNOX divergovaly nezávisle mezi řasovými fylami
Ve Viridiplantae jsme našli jediný homolog KNOX u většiny druhů Chlorophyta, zatímco divergence KNOX1 a KNOX2 byla patrná v oddělení Streptophyta, včetně charofyta Klebsormidium flaccidum a suchozemských rostlin (obr. 2). Nově objevená doména KN-C1 byla specifická pro sekvence KNOX z Chlorophyta a byla nalezena u všech druhů kromě jednoho (Pyramimonas amylifera). Absence podobnosti mezi KN-C1 a C-koncovými prodlouženími sekvencí KNOX1/KNOX2 naznačuje nezávislou, liniově specifickou evoluci KNOX u Chlorophyta a Streptophyta (Additional file 3: Figure S2). Proto označujeme třídy KNOX u Chlorophyta jako KNOX-Chloro na rozdíl od tříd KNOX1 a KNOX2 u Streptophyta.
Homology KNOX u Rhodophyta jsme rozdělili do dvou tříd: parafyletická skupina blízká kladu KNOX-Chloro, nazvaná KNOX-Red1, a druhá skupina blízká PBX-Outgroup, nazvaná KNOX-Red2. KNOX-Red1 postrádala KN-A, zatímco KNOX-Red2 postrádala ELK a sdílela doménu KN-C2 (Additional file 3: Figure S2). KNOX-Red1 považujeme za ancestrální typ, protože sekvence KNOX-Red1 byly nalezeny ve všech zkoumaných taxonech Rhodophyta, zatímco sekvence KNOX-Red2 byly omezeny na dvě taxonomické třídy (Cyanidiophyceae a Florideophyceae). Zajímavé je, že klad KNOX-Red2 zahrnoval dvě sekvence zelených řas se silnou statistickou podporou (89/89/0,97; obr. 2); ty měly doménu KN-C2, což naznačuje jejich původ v rámci třídy KNOX-Red2 (doplňkový soubor 3: obr. S2; další diskuse o jejich možném původu prostřednictvím horizontálního přenosu genů viz doplňkový soubor 2: poznámka S2).
Dostupné sekvence TALE byly pro Glaucophyta omezené. U dvou druhů jsme našli jediný homolog KNOX, který měl domény KN-A a KN-B, ale postrádal doménu ELK. Označili jsme je jako KNOX-Glauco.
Po identifikaci homologů KNOX byly zbývající sekvence TALE sloučeny jako skupina non-KNOX, která postrádá domény KN-A a KN-B u Archaeplastida. Další klasifikace skupiny non-KNOX byla náročná vzhledem k vysoce divergentním sekvencím homeodomén. Všimli jsme si však, že počet non-KNOX genů u jednotlivých druhů byl do značné míry neměnný: jeden ve většině genomů Rhodophyta a Glaucophyta a dva ve většině genomů Chlorophyta, což naznačuje jejich zachování v rámci jednotlivých radiací.
Naše ad-hoc hledání homologie poskytlo kritické informace pro klasifikaci non-KNOX a identifikovalo homologickou doménu společnou pro všechny non-KNOX sekvence Glaucophyta a Rhodophyta (obr. 3a, b). Protože tato doména vykazovala podobnost s druhou polovinou živočišné domény PBC-B (Pfam ID: PF03792) známé jako heterodimerizační doména , pojmenovali jsme tuto doménu PBL (PBC-B Like). V souladu s tím jsme zařadili všechny ne-KNOX TALE v Glaucophyta a Rhodophyta do jedné třídy homeoboxů příbuzných PBC, PBX-Glauco nebo PBX-Red. Sekvence PBX-Glauco rovněž disponovaly motivem MEINOX, konzervovaným v doméně PBC-B živočichů, což svědčí o společném původu domén PBC-B a PBL (obr. 3a).
GSP1 sdílí vzdálenou PBC-homologii spolu s dalšími sekvencemi skupiny non-KNOX u Viridiplantae
Zůstávala otázka evoluce sekvencí skupiny Chlorophyta non-KNOX, které zřejmě postrádají PBC-homologii. Abychom odhalili i vzdálenou homologii, porovnali jsme nově definované domény PBL se sekvencemi Chlorophyta pomocí BLAST (mezní hodnota E- 1E-1) a vícenásobného zarovnání sekvencí. Tento dotaz shromáždil tři sekvence TALE prasinofytů a jednu sekvenci TALE charofytů, které měly motiv MEINOX a domnělou PBL-doménu; vykazovaly však mezi sebou velmi nízkou sekvenční identitu (obr. 3c). Další dotazování s využitím těchto čtyř sekvencí identifikovalo 11 dalších sekvencí, které nejsou KNOX. Devět z nich bylo sestaveno do dvou zarovnání, z nichž jedno zahrnovalo homology GSP1 a druhé kombinovalo většinu prasinofytních sekvencí (Additional file 3: Figure S3). Dvě zbývající sekvence (Picocystis_salinarum_04995 a Klebsormidium_flaccidum_00021_0250) vykazovaly homologii se sekvencí PBX-Red z Chondrus cruentum (ID:41034) v prodloužení dlouhém ~ 200 aa za doménou PBL, což naznačuje jejich PBX-Red původ (další potenciální případ horizontálních přenosů; Additional file 3: Figure S4). Všechny sekvence Chlorophyta non-KNOX, které nesou PBL-homologické domény, byly klasifikovány jako GLX (GSP1-like homeobox) na základě uznání proteinu GSP1 z Chlamydomonas jako prvního charakterizovaného člena této třídy .
Je rostlinná třída BELL homologní s třídou GLX u Chlorophyta?
Třída BELL je jedinou třídou suchozemských rostlin, která není KNOX, sdílí doménu POX (Pre-homeobox) (PF07526) a postrádá identifikovatelnou doménu PBL. Genom K. flaccidum, jeden ze dvou dostupných genomů charofytů, z nichž vznikly suchozemské rostliny, obsahoval tři non-KNOX sekvence, přičemž všechny měly doménu PBL (obr. 3, Additional file 3: Figures S3, S4). Druhý genom charofyta Chara braunii obsahoval jeden domnělý homolog BELL, který se zdá být zkrácený o N-koncové sekvence mimo jeho C-koncovou homeodoménu pravděpodobně v důsledku neúplného genového modelu. Proto se zdá, že absence PBL-homologie v rostlinné třídě BELL je způsobena divergencí nebo ztrátou domén ze staré třídy charofytů, která PBL-homologii měla. Nalezli jsme intron na pozici homeodomény 24(2/3) homologu K. flaccidum GLX, který byl dříve identifikován jako specifický pro rostlinnou třídu BELL (Additional file 3: Figure S5) , což naznačuje, že se rostlinná třída BELL vyvinula z ancestrálního genu GLX. K potvrzení tohoto závěru je zapotřebí dalšího vzorkování taxonů charofytů.
Dva non-KNOX paralogy Chlorophyta heterodimerizují s KNOX homology
Přibližně u poloviny non-KNOX sekvencí Chlorophyta se nám ani pomocí našeho citlivého iterativního hledání homologie nepodařilo identifikovat PBC/PBL-homologii. Protože většina genomů Chlorophyta má jeden homolog GLX a jednu sekvenci non-KNOX bez domény PBL-homologie, označujeme tyto sekvence souhrnně jako třídu-B (Additional file 3: Figure S6). Výjimku tvoří jeden klad prasinofytů (třída Mamiellophyceae), jehož šest vysoce kvalitních genomů obsahuje všechny dvě non-KNOX sekvence bez PBL-homologie. Přesto tyto non-KNOX sekvence vytvořily dvě skupiny, jednu konzervativnější a druhou méně konzervativní a polyfyletickou, označované jako třídy Mam-A a Mam-B (Additional file 3: Figure S7, S8). Vzhledem k redukční evoluci genomu Mamiellophyceae , může být konzervovaná třída Mam-A odvozena od ancestrální třídy GLX.
Dvě divergentní třídy non-KNOX u Chlorophyta vedly ke kritické otázce ohledně jejich dyadických sítí. Dřívější studie ukázaly, že heterodimery TALE vyžadují interakci mezi doménami MEIS a PBC u živočichů a mezi doménami KNOX a PBL u Chlamydomonas . Proto se předpokládalo, že všechny TALE Glaucophyta a Rhodophyta tvoří heterodimery prostřednictvím svých domén KNOX a PBL. Na druhou stranu zbývalo ověřit, zda TALE z Chlorophyta, které postrádají doménu PBL, mohou tvořit heterodimery s jinými TALE.
Pro charakterizaci interakční sítě proteinů třídy TALE u Chlorophyta jsme pro testy protein-proteinových interakcí vybrali tři druhy prasinofytů: dva druhy obsahující geny Mam-A a Mam-B (Micromonas commoda a Ostreococcus tauri) a další druh (Picocystis salinarum), jehož transkriptom obsahoval jednu sekvenci GLX a jednu sekvenci třídy B. V tomto případě jsme se zaměřili na analýzu interakcí mezi proteiny třídy TALE. U všech tří druhů jsme zjistili, že homology KNOX interagují se všemi zkoumanými ne-KNOX proteiny Mam-A, Mam-B, Class-B a GLX třídy (obr. 4a-c). U žádného ze tří druhů nebyla pozorována interakce mezi dvěma non-KNOX proteiny (obr. 4a-c). Podobně jako u heterodimerizace GLX-KNOX vyžadovaly Mam-A a Mam-B pro svou heterodimerizaci s homology KNOX další domény mimo homeodoménu (Additional file 3: Figure S9). Tyto výsledky ukázaly, že všechny divergentní non-KNOX TALE si zachovaly svou původní aktivitu tvořit heterodimery s KNOX homology. Pozorovaná interakční síť mezi sekvencemi TALE je shrnuta v Doplňkovém souboru 3: Obrázek S10.
Heterodimerizace TALE se vyvinula brzy v historii eukaryot
Náš objev PBC-homologie u Archaeplastida naznačuje společný původ heterodimerizujících TALE mezi Metazoa a Archaeplastida. Předpokládá také, že další eukaryotické linie mohou mít TALE s PBC-homologií. Mimo živočichy obsahuje databáze Pfam pouze dvě sekvence s doménou PBC-B, jednu z druhu Cryptophyta (Guillardia theta, ID:137502) a druhou z druhu Amoebozoa (Acanthamoeba castillian, ID:XP_004342337) . Dále jsme zkoumali skupinu Excavata, která se nachází v blízkosti předpokládaného kořene eukaryotické fylogeneze . Prohledáním dvou genomů (Naegleria gruberi a Bodo saltans) jsme získali 12 homeoboxových sekvencí TALE u N.gruberi a žádnou u B.saltans, z nichž jsme našli jednu s doménou PBC-homologie (ID:78561, obr. 3a) a jednu s doménou MEIS/KNOX-homologie (ID:79931, Additional file 3: Figure S2). Prohledali jsme další genomy Amorphea a našli jsme PBC-homologii a MEIS/KNOX-homologii v sekvencích TALE shromážděných u Apusozoa, Ichtyhosporea a Choanoflagellata, ale ne u Fungi (Additional file 3: Figures S11-S14). Naše data naznačují, že heterodimerizační domény – PBC-homologie a MEIS/KNOX-homologie – vznikly na počátku eukaryotické evoluce a přetrvaly během hlavních eukaryotických radiací.
Intron-retention podporuje paralelní evoluci heterodimerických tříd TALE během eukaryotických radiací
Všudypřítomnost dyadických TALE vyvolala další otázku: Jsou všechny dyadické TALE popsané v této studii potomky jediné ancestrální dyády, nebo jsou výsledkem liniově specifické evoluce z jediného prototypového TALE (proto-TALE), který se nezapojuje do heterodimerizace. Abychom prozkoumali hluboký původ, zkoumali jsme intron-retenci, která je považována za dlouho zachovávaný znak a je méně náchylná ke vzniku homoplazie (znak, který se projevuje u souboru druhů, ale není přítomen u jejich společného předka) . Pět pozic intronu sdílely alespoň dvě třídy TALE, z nichž introny 44/45 a 48(2/3) byly kvalifikovány jako nejpůvodnější, protože se vyskytovaly u všech Archaeplastida a Metazoa (Additional file 3: Figure S5).
Introny 44/45 a 48(2/3) vykazovaly zajímavou výlučnou distribuci mezi dvěma dyadickými partnery každého fyla: jeden vlastní intron 44/45 a druhý intron 48(2/3) (Additional file 3: Figure S5). Tento vzájemně se vylučující vzorec naznačuje, že na počátku eukaryotické radiace existovaly dva geny TALE s odlišnou pozicí intronu. Pozici intronu 44/45 považujeme za nejpůvodnější, vzhledem k tomu, že byla konzervována ve většině jiných homeoboxových genů než TALE . V tomto ohledu předpokládáme, že získání intronu 48(2/3) a ztráta intronu 44/45 doprovázely ranou událost, při níž byl proto-TALE s intronem 44/45 duplikován, aby vznikl druhý TALE s intronem 48(2/3). Vzhledem k tomu, že pozice 48(2/3) intronu byla nalezena v genech skupiny KNOX/MEIS u Viridiplantae a Metazoa a také v genech skupiny PBX u Rhodophyta a Cryptophyta, můžeme spekulovat, že duplikované TALE vznikly brzy a diverzifikovaly se, aby vytvořily heterodimerní konfigurace specifické pro jednotlivé linie během eukaryotické radiace. Alternativně mohla být pozice 48(2/3) intronu v homeodoméně TALE získána mnohokrát během eukaryotické radiace.
Vzhledem k tomu, že se heterodimerní TALE vyvinuly lineárně specifickým způsobem, položili jsme si otázku, jak vypadal proto-TALE v době, kdy prošel duplikací. Následující pozorování naznačují, že proto-TALE byl homodimerizující protein. Za prvé, PBC-homologické domény proteinů třídy PBX/GLX identifikované u Archaeplastida zahrnují MEINOX-motiv, který byl původně definován pro svou podobnost s MEIS/KNOX-homologickými doménami (obr. 3) . Za druhé, sekvence PBX-Glauco mají v rámci své domény PBL ELK-homologii (obr. 3), která se dobře shoduje s doménami ELK sekvencí třídy KNOX u Viridiplantae (Additional file 3: Figure S15). MEINOX-motiv a ELK-homologie napříč heterodimerizujícími skupinami KNOX a PBX tedy podpořily společný původ heterodimerizujících skupin TALE z jedné TALE duplikací a následnou subfunkcionalizací
.