- TALE:t jaetaan Archaeplastidoissa kahteen ryhmään, KNOX ja ei-KNOX
- KNOX-luokan sekvensseillä on yhteiset heterodimerisaatiodomeenit kauttaaltaan kaikissa Archaeplastida-lajissa
- KNOX-luokat erosivat toisistaan riippumatta leväfylleissä
- Ei-KNOX-ryhmän TALE-sekvensseillä on eläintyyppinen PBC-homologinen domeeni, mikä viittaa Archaeplastida- ja Metazoa-heimojen yhteiseen syntyperään
- GSP1:llä on yhteinen kaukainen PBC-homologia muiden Viridiplantae-heimon muiden kuin KNOX-ryhmän sekvenssien kanssa
- Onko kasvien BELL-luokka homologinen Chlorophyta GLX-luokan kanssa?
- Kaksi Chlorophyta-lajin ei-KNOX-paralogia heterodimeeraa KNOX-homologien kanssa
- TALE:n heterodimerisaatio kehittyi varhain eukaryoottien historiassa
- Intronien säilyminen tukee heterodimeeristen TALE-luokkien samansuuntaista evoluutiota eukaryoottisen säteilyn aikana
TALE:t jaetaan Archaeplastidoissa kahteen ryhmään, KNOX ja ei-KNOX
Kootaksemme kaikki saatavilla olevat homeobox-proteiinisekvenssit teimme BLAST- ja Pfam-motif-hakuja muiden kuin kasvien genomeihin ja transkriptomikokoelmiin koko Archaeplastida-lajistosta ja tunnistimme 338 proteiinia 56 lajista Archaeplastida-homeobox-kokoelmaksi (30 genomia ja 18 transkriptomia; Lisätiedosto 1: Taulukko S1). Näistä 104:llä oli TALE-proteiineille ominainen piirre, kolmen aminohapon insertio homeodomeenin aa-asemien 23-24 välissä. Useimmissa genomeissa havaittiin vähintään kaksi TALE-geeniä lukuun ottamatta viittä genomia Chlorophyta-luokkaan kuuluvassa Trebouxiophyceae-luokassa (lisätiedosto 1: taulukko S1; ks. lisätiedosto 2: huomautus S1, jossa käsitellään tarkemmin TALE:iden puuttumista Trebouxiophyceae-luokasta).
Kerätyt TALE-sekvenssit luokiteltiin sitten homeodomeeniominaisuuksiensa perusteella käyttäen fylogeneettistä lähestymistapaa, jossa eläimistä, kasveista ja varhain eroavista eukaryooteista (Amoebozoa ja Excavata) peräisin olevat TALE:t olivat ulkoryhminä (Lisätiedosto 3: Kuva S1). Tuloksena saatu TALE-homeodomeenifylogenia erotti kaksi ryhmää kaikissa kolmessa Archaeplastida-heimossa (Kuva 2). (1) KNOX-ryhmä hyvin tuettuna kladina näytti heimokohtaisen kladogrammin: kaksi Glaucophyta-sekvenssiä tyvessä (nimellä KNOX-Glauco) olivat erillään seuraavasta kladista, joka yhdisti Rhodophyta-sekvenssejä (nimellä KNOX-Red1) ja Viridiplantae-spesifisen kladin, jolla oli vahva tuki (92/90/1,00). (2) Muu kuin KNOX-ryhmä, johon kuuluivat BELL- ja GSP1-homologit, sisälsi kladeja, joissa oli sekalaisia taksonomisia yhteyksiä. Nämä analyysit osoittivat, että TALE-proteiinit olivat erkaantuneet kahdeksi ryhmäksi jo ennen Archaeplastida-heimon evoluutiota ja että KNOX-ryhmä on erittäin konservoitunut koko Archaeplastida-heimossa.
KNOX-luokan sekvensseillä on yhteiset heterodimerisaatiodomeenit kauttaaltaan kaikissa Archaeplastida-lajissa
Seuraavaksi kysymykseksi esitettiin kysymys siitä, ovatko kasvien KNOX-luokka saaneet alkunsa jo ennen heimoa Viridiplantae. Kasvien KNOX-proteiineilla ja Chlorophyta GSM1:llä on KNOX-homologia, joka koostuu KN-A-, KN-B- ja ELK-domeeneista, joita tarvitaan niiden heterodimerisaatioon muiden TALE-proteiinien kanssa ; siksi KNOX-homologian läsnäolo viittaisi mahdollisuuteen heterodimerisaatioon KNOX-ryhmään. Homologiadomeenien keräämiseksi ilman ennakkotietoja suoritimme ad-hoc-homologiadomeenihakuja KNOX-ryhmän sekvenssien joukosta. Käyttäen tunnistettuja homologiadomeeneja ankkureina kuratoimme huolellisesti KNOX-ryhmän sekvenssien kohdistuksen yhdistettynä kaikkiin muihin TALE-sekvensseihin, joilla oli KNOX-homologia, (lisätiedosto 3: kuva S2). Tästä KNOX-kohdistuksesta löysimme kaikki KNOX-ryhmän sekvenssit (lukuun ottamatta osittaisia sekvenssejä), joiden aminohappojen samankaltaisuuspisteet olivat > 50 % vähintään kahdelle kolmesta KNOX-homologia-alueen muodostavasta domeenista (lisätiedosto 1: taulukko S3 lasketusta domeenihomologiasta). Testataksemme, onko havaittu samankaltaisuus spesifistä TALE-sekvensseille, generoimme KNOX-kohdistuksesta HMM-motiiveja KN-A- ja KN-B-domeeneille, etsimme niitä kohdegeenomeista ja vahvistimme, että KN-A- ja KN-B-domeeneja esiintyy vain TALE-sekvensseissä (Lisätiedosto 4: Data S1 ja S2). Näin ollen määrittelimme KNOX-homologit TALE-sekvensseiksi, joilla on haettavissa oleva KNOX-homologia (kuva 2, merkitty punaisilla pisteillä niiden tunnisteiden jälkeen), mikä viittaa siihen, että KNOX-homologi oli olemassa jo ennen eukaryoottisen fotosynteesin evoluutiota, jota Archaeplastida edustaa.
KNOX-homologin lisäksi sama haku paljasti myös kaksi uutta domeenia homeodomeenin C-terminaalissa (Additional file 3: Figure S2): ensimmäinen (KN-C1) oli yhteinen Chlorophyta-sekvenssien kanssa ja toinen (KN-C2) oli yhteinen KNOX-homologien ryhmän kanssa KNOX-ryhmän ulkopuolisessa kladissa (KNOX-Red2).
KNOX-luokat erosivat toisistaan riippumatta leväfylleissä
Viridiplantae-luokassa löysimme yhden KNOX-homologin useimmilta Chlorophyta-lajeilta, kun taas KNOX1:n ja KNOX2:n eroavuus oli ilmeistä Streptophyta-luokassa, mukaan lukien charofyytti Klebsormidium flaccidum ja maakasvit (kuva 2). Äskettäin löydetty KN-C1-domeeni oli spesifinen Chlorophyta KNOX-sekvensseille, ja sitä esiintyi yhtä lajia (Pyramimonas amylifera) lukuun ottamatta kaikissa lajeissa. KN-C1:n ja KNOX1/KNOX2-sekvenssien C-terminaalisten jatkeiden välisen samankaltaisuuden puuttuminen viittaa itsenäiseen, sukulinjakohtaiseen KNOX-evoluutioon Chlorophyta- ja Streptophyta-heimoissa (lisätiedosto 3: kuva S2). Siksi viittaamme Chlorophyta KNOX-luokkiin nimellä KNOX-Chloro toisin kuin Streptophyta KNOX1- ja KNOX2-luokkiin.
Rhodophyta KNOX-homologit jaettiin kahteen luokkaan: KNOX-Chloro-klaadin lähellä olevaan parafyleettiseen ryhmään, joka on nimetty KNOX-Red1:ksi, ja toiseen ryhmään, joka on lähellä PBX-Out-ryhmää ja jonka nimi on KNOX-Red2. KNOX-Red1:stä puuttui KN-A, kun taas KNOX-Red2:sta puuttui ELK ja sillä oli yhteinen KN-C2-domeeni (lisätiedosto 3: kuva S2). Pidämme KNOX-Red1:tä esi-isätyyppinä, koska KNOX-Red1-sekvenssejä löytyi kaikista tutkituista Rhodophyta-taksoneista, kun taas KNOX-Red2-sekvenssit rajoittuivat kahteen taksonomiseen luokkaan (Cyanidiophyceae ja Florideophyceae). Mielenkiintoista oli, että KNOX-Red2-klaadiin kuului kaksi viherleväsekvenssiä, joilla oli vahva tilastollinen tuki (89/89/0,97; kuva 2); näillä oli KN-C2-domeeni, mikä viittaa siihen, että ne olivat peräisin KNOX-Red2-luokasta (lisätiedosto 3: kuva S2; ks. lisätietoja niiden mahdollisesta alkuperästä horisontaalisen geeninsiirron välityksellä lisätiedostossa 2: huomautus S2).
Saatavilla olevia TALE-sekvenssejä oli rajoitetusti saatavilla glaukofyta-heimon osalta. Löysimme kahdesta lajista yhden KNOX-homologin, jolla oli KN-A- ja KN-B-domeenit mutta josta puuttui ELK-domeeni. Kutsuimme näitä KNOX-Glauco.
Ei-KNOX-ryhmän TALE-sekvensseillä on eläintyyppinen PBC-homologinen domeeni, mikä viittaa Archaeplastida- ja Metazoa-heimojen yhteiseen syntyperään
KNOX-homologien tunnistamisen jälkeen jäljelle jääneet TALE-sekvenssit yhdistettiin ei-KNOX-ryhmäksi, jolta puuttuvat KN-A- ja KN-B-domeenit Archaeplastida-heimoissa. Ei-KNOX-ryhmän tarkempi luokittelu oli haastavaa sen erittäin erilaisten homeodomeenisekvenssien vuoksi. Huomasimme kuitenkin, että non-KNOX-geenien määrä lajeittain oli pitkälti muuttumaton: yksi useimmissa Rhodophyta- ja Glaucophyta-genomeissa ja kaksi useimmissa Chlorophyta-genomeissa, mikä viittaa niiden säilymiseen kunkin säteilyn sisällä.
Ad-hoc-homologiahakumme antoi kriittistä tietoa non-KNOX-luokittelua varten, sillä se tunnisti homologisen domeenin, joka on yhteinen kaikille Glaucophyta- ja Rhodophyta-lajin non-KNOX-jakson sekvensseille (kuvio 3a, b). Koska tämä domeeni oli samankaltainen eläinten PBC-B-domeenin (Pfam ID: PF03792) toisen puoliskon kanssa, joka tunnetaan heterodimerisaatiodomeenina, nimesimme tämän domeenin PBL:ksi (PBC-B Like). Näin ollen luokittelimme kaikki Glaucophyta- ja Rhodophyta-heimojen muut kuin KNOX TALE:t yhdeksi PBC:hen liittyväksi homeoboksiluokaksi, PBX-Glauco tai PBX-Red. PBX-Glauco-sekvensseillä oli myös MEINOX-motiivi, joka on konservoitunut eläinten PBC-B-domeenissa, mikä viittaa PBC-B- ja PBL-domeenien yhteiseen syntyperään (Kuva 3a).
GSP1:llä on yhteinen kaukainen PBC-homologia muiden Viridiplantae-heimon muiden kuin KNOX-ryhmän sekvenssien kanssa
Jäljelle jäi vielä kysymys Chlorophyta-heimon muiden kuin KNOX-heimon sekvenssien evoluutiosta, sillä niillä ei ilmeisesti ollut PBC-homologiaa. Löytääksemme edes kaukaisen homologian vertasimme vastikään määriteltyjä PBL-domeeneja Chlorophyta-sekvensseihin BLAST-menetelmällä (cut-off E -arvo 1E-1) ja monisekvenssikohdistuksilla. Tämä kysely keräsi kolme prasinofyytti- ja yhden klorofyytti-TALE-sekvenssiä, joilla oli MEINOX-motiivi ja oletettu PBL-domeeni; niiden sekvenssi-identiteetti keskenään oli kuitenkin hyvin vähäinen (kuva 3c). Näiden neljän sekvenssin avulla tehdyillä lisäkyselyillä tunnistettiin 11 muuta kuin KNOX-sekvenssiä. Yhdeksän näistä muodostettiin kahdeksi kohdistukseksi, joista toinen sisälsi GSP1-homologit ja toinen useimmat prasinofyyttisekvenssit (lisätiedosto 3: kuva S3). Kaksi jäljelle jäänyttä sekvenssiä (Picocystis_salinarum_04995 ja Klebsormidium_flaccidum_00021_0250) osoittivat homologisuutta Chondrus cruentumin PBX-Red-sekvenssin (ID:41034) kanssa noin 200 aa:n pituisen PBL-domeenin jälkeisen pidennyksen osalta, mikä viittaa niiden PBX-Red-alkuperään (toinen mahdollinen horisontaalisten siirtojen tapaus; lisätiedosto 3: kuva S4). Kaikki Chlorophyta-lajin muut kuin KNOX-sekvenssit, jotka kantavat PBL-homologisia domeeneja, luokiteltiin GLX:ksi (GSP1-like homeobox), koska Chlamydomonas-lajin GSP1-proteiini on tämän luokan ensimmäinen karakterisoitu jäsen.
Onko kasvien BELL-luokka homologinen Chlorophyta GLX-luokan kanssa?
BELL-luokka on maakasvien ainoa ei-KNOX-luokka, jolla on yhteinen POX (Pre-homeobox) -domaani (PF07526) ja josta puuttuu tunnistettava PBL-domeeni. K. flaccidum -genomi, joka on toinen kahdesta käytettävissä olevasta karofyytin genomista, josta maakasvi kehittyi, sisälsi kolme ei-KNOX-sekvenssiä, joilla kaikilla oli PBL-domeeni (Kuva 3, Additional file 3: Figures S3, S4). Toinen charofyyttien genomi Chara braunii sisälsi yhden oletetun BELL-homologin, joka näyttää olevan typistetty N-terminaalisten sekvenssien osalta C-terminaalisen homeodomeenin ulkopuolella mahdollisesti epätäydellisen geenimallin vuoksi. Näin ollen PBL-homologian puuttuminen kasvien BELL-luokasta näyttäisi johtuvan siitä, että se on eronnut vanhasta karofyyttien luokasta, jolla oli PBL-homologia, tai että se on kadonnut. Löysimme intronin K. flaccidum GLX -homologin 24(2/3) homeodomeenin kohdalta, joka on aiemmin tunnistettu spesifiseksi kasvien BELL-luokalle (lisätiedosto 3: kuva S5) , mikä viittaa siihen, että kasvien BELL-luokka on kehittynyt muinaisesta GLX-geenistä. Tämän päätelmän vahvistamiseksi tarvitaan lisää taksoninäytteenottoa karofyyteistä.
Kaksi Chlorophyta-lajin ei-KNOX-paralogia heterodimeeraa KNOX-homologien kanssa
Jopa herkällä iteratiivisella homologiahaulla emme pystyneet tunnistamaan PBC/PBL-homologiaa noin puolessa Chlorophyta-lajin ei-KNOX-sekvensseistä. Koska suurimmalla osalla Chlorophyta-genomeista on yksi GLX-homologi ja yksi ei-KNOX-sekvenssi ilman PBL-homologiadomeenia, viittaamme jälkimmäisiin kollektiivisesti luokkaan-B (Additional file 3: Figure S6). Poikkeuksia löytyi yhdestä prasinofyyttiklaadista (luokka Mamiellophyceae), jonka kuusi korkealaatuista genomia sisältävät kaikki kaksi ei-KNOX-sekvenssiä, joista puuttuu PBL-homologia. Nämä muut kuin KNOX-sekvenssit muodostivat kuitenkin kaksi ryhmää, joista toinen oli konservoituneempi ja toinen vähemmän konservoitunut ja polyfyyttinen, ja niitä kutsuttiin vastaavasti Mam-A- ja Mam-B-luokiksi (lisätiedosto 3: kuvat S7, S8). Kun otetaan huomioon Mamiellophyceae-heimon reduktiivinen genomievoluutio , konservoitunut Mam-A-luokka saattaa olla peräisin esi-isän GLX-luokasta.
Kaksi erilaista ei-KNOX-luokkaa Chlorophyta-heimossa johti kriittiseen kysymykseen niiden dyadisista verkostoista. Aikaisemmat tutkimukset olivat osoittaneet, että TALE-heterodimeerit edellyttivät vuorovaikutusta MEIS- ja PBC-domeenien välillä eläimissä ja KNOX- ja PBL-domeenien välillä Chlamydomonasissa . Siksi ennustettiin, että kaikki Glaucophyta- ja Rhodophyta- TALE:t muodostavat heterodimeerejä KNOX- ja PBL-homologiadomeeniensä kautta. Toisaalta oli vielä tutkittava, voivatko Chlorophyta TALE:t, joista puuttuu PBL-domeeni, muodostaa heterodimeerejä muiden TALE:iden kanssa.
Kuvaillaksemme TALE-luokan proteiinien vuorovaikutusverkostoa Chlorophyta-lajistossa valitsimme proteiini-proteiini-vuorovaikutustestejä varten kolme prasinofyytti-lajia: kaksi lajia, jotka sisälsivät Mam-A- ja Mam-B-geenejä (Micromonas commoda ja Ostreococcus tauri), ja toinen laji (Picocystis salinarum), jonka transkriptomista löytyi yksi GLX- ja yksi B-luokan jakso. Kaikissa kolmessa lajissa havaitsimme, että KNOX-homologit olivat vuorovaikutuksessa kaikkien tutkittujen muiden kuin KNOX-proteiinien kanssa Mam-A-, Mam-B-, Class-B- ja GLX-luokassa (Kuva 4a-c). Kahden ei-KNOX-proteiinin välistä vuorovaikutusta ei havaittu missään kolmesta lajista (Kuva 4a-c). GLX-KNOX-heterodimerisaation tapaan myös Mam-A ja Mam-B tarvitsivat homeodomeenin ulkopuolisia lisädomeeneja heterodimerisaatioon KNOX-homologien kanssa (lisätiedosto 3: kuva S9). Nämä tulokset osoittivat, että kaikki poikkeavat ei-KNOX TALE:t säilyttivät alkuperäisen aktiivisuutensa muodostaa heterodimeerejä KNOX-homologien kanssa. Havaittu vuorovaikutusverkosto TALE-sekvenssien välillä on esitetty yhteenvetona Additional file 3: Kuva S10.
TALE:n heterodimerisaatio kehittyi varhain eukaryoottien historiassa
PBC-homologian löytyminen Archaeplastida-heimosta viittaa siihen, että heterodimerisoituvilla TALE:illa on yhteinen esi-isä Metazoa- ja Archaeplastida-heimojen välillä. Se ennusti myös, että muilla eukaryoottilinjoilla saattaa olla PBC-homologian omaavia TALEja. Eläinten ulkopuolella Pfam-tietokannassa on vain kaksi PBC-B-domeenia sisältävää sekvenssiä, joista toinen on peräisin Cryptophyta-lajista (Guillardia theta, ID:137502) ja toinen Amoebozoa-lajista (Acanthamoeba castillian, ID:XP_004342337). Tarkastelimme lisäksi Excavata-ryhmää, joka on lähellä eukaryoottisen fylogenian oletettua juurta. Haku kahdesta genomista (Naegleria gruberi ja Bodo saltans) keräsi 12 TALE-homeoboksisekvenssiä N.gruberista ja yhtään B.saltansista, joista löysimme yhden, jolla on PBC-homologinen domeeni (ID:78561, kuva 3a), ja yhden, jolla on MEIS/KNOX-homologia (ID:79931, lisätiedosto 3: kuva S2). Etsimme lisää genomeja Amorpheasta ja löysimme PBC-homologian ja MEIS/KNOX-homologian Apusozoasta, Ichtyhosporeasta ja Choanoflagellatasta kerätyistä TALE-sekvensseistä, mutta emme sienistä (Additional file 3: Figures S11-S14). Tietomme viittaavat siihen, että heterodimerisaatiodomeenit – PBC-homologia ja MEIS/KNOX-homologia – saivat alkunsa eukaryoottisen evoluution alkuvaiheessa ja säilyivät koko suurten eukaryoottisäteiden ajan.
Intronien säilyminen tukee heterodimeeristen TALE-luokkien samansuuntaista evoluutiota eukaryoottisen säteilyn aikana
Dyadisten TALE-luokkien kaikkialla läsnäolo herätti seuraavaksi kysymyksen: Ovatko kaikki tässä tutkimuksessa raportoidut dyadiset TALE:t yhden esi-isä-dyadin jälkeläisiä, vai ovatko ne seurausta linjakohtaisesta evoluutiosta yhdestä prototyyppisestä TALE:sta (proto-TALE), joka ei osallistu heterodimerisaatioon. Tutkiaksemme syvää esivanhemmuutta tutkimme intronien pidättämistä, jota pidetään pitkään säilyneenä ominaisuutena ja vähemmän alttiina esiintymään homoplasian (ominaisuuden, jota esiintyy joukossa lajeja, mutta jota ei esiintynyt niiden yhteisessä esivanhemmassa) kautta. Viisi intronipaikkaa oli yhteistä vähintään kahdelle TALE-luokalle, joista 44/45- ja 48(2/3)-intronit kelpasivat esi-isimmiksi, koska niitä esiintyi kaikkialla Archaeplastida- ja Metazoa-heimossa (Additional file 3: Figure S5).
44/45- ja 48(2/3)-intronit osoittivat kiehtovaa yksinoikeusjakaumaa kunkin heimon kahden dyadisen kumppanin välillä: toisella on 44/45- ja toisella 48(2/3)-introni (Additional file 3: Figure S5). Tämä toisensa poissulkeva kuvio viittasi siihen, että eukaryoottisen säteilyn alussa oli olemassa kaksi TALE-geeniä, joilla oli erilaiset intronien sijainnit. Pidämme 44/45-intronin asemaa esi-isimpänä, koska se oli konservoitunut useimmissa muissa kuin TALE-homeoboksigeeneissä. Tältä osin spekuloimme, että 48(2/3)-asennon omaksuminen ja 44/45-intronin häviäminen liittyivät varhaiseen tapahtumaan, jossa 44/45-intronin omaava proto-TALE monistui luodakseen toisen TALE:n, jossa on 48(2/3)-introni. Koska 48(2/3)-intronin paikka löytyi KNOX/MEIS-ryhmän geeneistä Viridiplantae- ja Metazoa-heimoissa ja myös PBX-ryhmän geeneistä Rhodophyta- ja Cryptophyta-heimoissa, voimme olettaa, että duplikoidut TALE:t syntyivät varhain ja monipuolistuivat muodostaakseen sukulinjakohtaisia heterodimeerisiä konfiguraatioita eukaryoottien säteilyn aikana. Vaihtoehtoisesti 48(2/3) intronin asema TALE:n homeodomeenissa on saattanut olla hankittu useita kertoja eukaryoottisäteilyn aikana.
Koska heterodimeeriset TALE:t ovat kehittyneet linjaspesifisesti, kysyimme, miltä proto-TALE näytti silloin, kun se kävi läpi kahdentumisen. Seuraavat havainnot viittaavat siihen, että proto-TALE oli homodimerisoiva proteiini. Ensinnäkin Archaeplastidoissa tunnistettuihin PBX/GLX-luokan proteiinien PBC-homologiadomeeneihin kuuluu MEINOX-motiivi, joka alun perin määriteltiin sen samankaltaisuuden vuoksi MEIS/KNOX-homologiadomeenien kanssa (kuva 3) . Toiseksi PBX-Glauco-sekvensseillä on PBL-domeenin sisällä ELK-homologia (Kuva 3), joka on hyvin linjassa Viridiplantae-luokan KNOX-luokan sekvenssien ELK-domeenien kanssa (Additional file 3: Kuva S15). Näin ollen MEINOX-motiivi ja ELK-homologia heterodimerisoivissa KNOX- ja PBX-ryhmissä tukivat heterodimerisoivien TALE-ryhmien yhteistä alkuperää yhdestä TALE:sta duplikaation ja sitä seuranneen subfunktionaalistumisen kautta.