- Los TALE en Archaeplastida se dividen en dos grupos, KNOX y no KNOX
- Las secuencias del grupo KNOX comparten los mismos dominios de heterodimerización en todos los Archaeplastida
- Las clases de KNOX divergieron de forma independiente entre los filos de las algas
- Las TALEs del grupo no-KNOX poseen un dominio de homología PBC de tipo animal, lo que sugiere una ascendencia compartida entre Archaeplastida y Metazoa
- GSP1 comparte una homología PBC distante junto con otras secuencias del grupo no-KNOX en Viridiplantae
- ¿Es la clase BELL de las plantas homóloga a la clase GLX de Chlorophyta?
- Dos paralogos no KNOX de Chlorophyta heterodimerizan con los homólogos de KNOX
- La heterodimerización de las TALEs evolucionó a principios de la historia eucariótica
- La retención de intrones apoya la evolución paralela de las clases de TALE heterodiméricas durante las radiaciones eucariotas
Los TALE en Archaeplastida se dividen en dos grupos, KNOX y no KNOX
Para recopilar todas las secuencias de proteínas homeobox disponibles, realizamos búsquedas BLAST y Pfam-motif contra genomas no vegetales y ensamblajes de transcriptomas en toda la Archaeplastida, identificando 338 proteínas de 56 especies como la colección de homeobox de Archaeplastida (30 genomas y 18 transcriptomas; Archivo adicional 1: Tabla S1). De ellas, 104 poseían la característica que define a las proteínas TALE, una inserción de tres aminoácidos entre las posiciones 23-24 de los aa en el homeodominio. Se detectaron al menos dos genes TALE en la mayoría de los genomas, excepto en cinco genomas de la clase Trebouxiophyceae de la Chlorophyta (Archivo adicional 1: Tabla S1; véase el Archivo adicional 2: Nota S1 para una mayor discusión sobre la ausencia de TALEs en Trebouxiophyceae).
Las secuencias TALE recogidas se clasificaron entonces por sus características de homeodominio utilizando un enfoque filogenético, con TALEs de animales, plantas y eucariotas de divergencia temprana (Amoebozoa y Excavata) como grupos externos (archivo adicional 3: Figura S1). La filogenia resultante de los homeodominios TALE distingue dos grupos en los tres filos de Archaeplastida (Fig. 2). (1) El grupo KNOX, como clado bien apoyado, mostró un cladograma específico para cada filo: dos secuencias de Glaucophyta en la base (como KNOX-Glauco) estaban separadas del siguiente clado, que combina secuencias de Rhodophyta (como KNOX-Red1) y un clado específico de Viridiplantae con fuerte apoyo (92/90/1,00). (2) El grupo no KNOX, que incluye los homólogos BELL y GSP1, contenía clados de afiliaciones taxonómicas mixtas. Estos análisis mostraron que las proteínas TALE ya habían divergido en dos grupos antes de la evolución de los Archaeplastida y que el grupo KNOX está muy conservado en todos los Archaeplastida.
Las secuencias del grupo KNOX comparten los mismos dominios de heterodimerización en todos los Archaeplastida
La siguiente cuestión era si la clase KNOX vegetal se originó antes del filo Viridiplantae. Las proteínas KNOX de plantas y la GSM1 de Chlorophyta poseen la homología KNOX, que consiste en los dominios KN-A, KN-B y ELK, necesarios para su heterodimerización con otras proteínas TALE ; por lo tanto, la presencia de la homología KNOX sugeriría el potencial de heterodimerización al grupo KNOX. Para recopilar dominios de homología sin información previa, realizamos búsquedas ad-hoc de dominios de homología entre las secuencias del grupo KNOX. Utilizando los dominios de homología identificados como anclas, curamos cuidadosamente una alineación de las secuencias del grupo KNOX combinadas con cualquier otra secuencia TALE con una homología KNOX, (Archivo adicional 3: Figura S2). A partir de este alineamiento de KNOX, encontramos todas las secuencias del grupo KNOX (excluyendo las secuencias parciales) que mostraban puntuaciones de similitud de aminoácidos > 50% para al menos dos de los tres dominios que comprenden la región de homología KNOX (Archivo adicional 1: Tabla S3 para la homología de dominio calculada). Para comprobar si la similitud observada es específica de las secuencias TALE, generamos motivos HMM para los dominios KN-A y KN-B a partir del alineamiento de KNOX, los buscamos en los genomas objetivo y confirmamos que los dominios KN-A y KN-B sólo se encuentran en las secuencias TALE (archivo adicional 4: datos S1 y S2). Por lo tanto, definimos los homólogos de KNOX como las secuencias de TALE que poseen homología de KNOX que se puede buscar (Fig. 2, marcada con puntos rojos a continuación de sus identificaciones), lo que sugiere que el homólogo de KNOX ya existía antes de la evolución de la fotosíntesis eucariótica representada por los Archaeplastida.
Además del homólogo de KNOX, la misma búsqueda también reveló dos nuevos dominios en el C-terminal del homeodominio (archivo adicional 3: Figura S2): el primero (KN-C1) era compartido entre las secuencias de Chlorophyta, y el segundo (KN-C2) era compartido entre un grupo de homólogos de KNOX en un clado fuera del grupo KNOX (KNOX-Red2).
Las clases de KNOX divergieron de forma independiente entre los filos de las algas
En Viridiplantae, encontramos un único homólogo de KNOX en la mayoría de las especies de Chlorophyta, mientras que la divergencia de KNOX1 y KNOX2 fue evidente en la división Streptophyta, incluyendo el charófito Klebsormidium flaccidum y las plantas terrestres (Fig. 2). El dominio KN-C1 recién descubierto era específico de las secuencias KNOX de Chlorophyta y se encontraba en todas las especies menos en una (Pyramimonas amylifera). La ausencia de similitud entre KN-C1 y las extensiones C-terminales de las secuencias KNOX1/KNOX2 sugiere una evolución de KNOX independiente y específica de cada linaje en Chlorophyta y Streptophyta (archivo adicional 3: Figura S2). Por lo tanto, nos referimos a las clases KNOX de Chlorophyta como KNOX-Chloro en contraste con las clases KNOX1 y KNOX2 de Streptophyta.
Los homólogos de KNOX en Rhodophyta se dividieron en dos clases: un grupo parafilético cercano al clado KNOX-Chloro, denominado KNOX-Red1, y un segundo grupo cercano al grupo PBX-Out, denominado KNOX-Red2. KNOX-Red1 carecía de un KN-A, mientras que KNOX-Red2 carecía de un ELK y compartía un dominio KN-C2 (archivo adicional 3: Figura S2). Consideramos que KNOX-Red1 es el tipo ancestral, ya que las secuencias de KNOX-Red1 se encontraron en todos los taxones de Rhodophyta examinados, mientras que las secuencias de KNOX-Red2 estaban restringidas a dos clases taxonómicas (Cyanidiophyceae y Florideophyceae). Curiosamente, el clado KNOX-Red2 incluía dos secuencias de algas verdes, con un fuerte apoyo estadístico (89/89/0,97; Fig. 2); éstas poseían un dominio KN-C2, lo que sugiere su ascendencia dentro de la clase KNOX-Red2 (Archivo adicional 3: Figura S2; véase el Archivo adicional 2: Nota S2 para una mayor discusión sobre su posible origen a través de la transferencia horizontal de genes).
Las secuencias TALE disponibles eran limitadas para la Glaucophyta. Encontramos un único homólogo de KNOX en dos especies, que poseía dominios KN-A y KN-B pero carecía de un dominio ELK. Las denominamos KNOX-Glauco.
Las TALEs del grupo no-KNOX poseen un dominio de homología PBC de tipo animal, lo que sugiere una ascendencia compartida entre Archaeplastida y Metazoa
Tras la identificación de los homólogos de KNOX, las restantes secuencias de TALEs se combinaron como el grupo no-KNOX que carece de dominios KN-A y KN-B en Archaeplastida. La clasificación posterior del grupo no KNOX fue un reto debido a sus secuencias de homeodominios altamente divergentes. Sin embargo, observamos que el número de genes no-KNOX por especie era en gran medida invariable: uno en la mayoría de los genomas de Rhodophyta y Glaucophyta y dos en la mayoría de los genomas de Chlorophyta, lo que sugiere su conservación dentro de cada radiación.
Nuestra búsqueda de homología ad-hoc proporcionó información crítica para la clasificación de los no-KNOX, identificando un dominio de homología compartido entre todas las secuencias no-KNOX de Glaucophyta y Rhodophyta (Fig. 3a, b). Dado que este dominio mostró una similitud con la segunda mitad del dominio PBC-B animal (Pfam ID: PF03792) conocido como dominio de heterodimerización , denominamos a este dominio PBL (PBC-B Like). En consecuencia, clasificamos todas las TALEs no KNOX en Glaucophyta y Rhodophyta como una única clase de homeobox relacionada con PBC, PBX-Glauco o PBX-Red. Las secuencias de PBX-Glauco también poseían el motivo MEINOX, conservado en el dominio PBC-B de los animales, lo que indica una ascendencia común de los dominios PBC-B y PBL (Fig. 3a).
GSP1 comparte una homología PBC distante junto con otras secuencias del grupo no-KNOX en Viridiplantae
Una cuestión pendiente era la evolución de las secuencias no-KNOX de Chlorophyta que aparentemente carecían de una homología PBC. Para descubrir incluso una homología lejana, comparamos los dominios PBL recién definidos con las secuencias de Chlorophyta mediante BLAST (valor E de corte de 1E-1) y alineaciones de secuencias múltiples. Esta búsqueda recogió tres secuencias TALE de prasinofitas y una de charofitas que poseían un motivo MEINOX y un supuesto dominio PBL; sin embargo, mostraron una identidad de secuencia muy baja entre ellas (Fig. 3c). Una búsqueda adicional utilizando estas cuatro secuencias identificó 11 secuencias adicionales no KNOX. Nueve de ellas se alinearon en dos líneas, una de las cuales incluía los homólogos de GSP1 y la otra combinaba la mayoría de las secuencias de prasinofitas (archivo adicional 3: figura S3). Las dos secuencias restantes (Picocystis_salinarum_04995 y Klebsormidium_flaccidum_00021_0250) mostraron una homología con una secuencia PBX-Red de Chondrus cruentum (ID:41034) en una extensión de ~ 200 aa más allá del dominio PBL, lo que sugiere su ascendencia PBX-Red (otro posible caso de transferencias horizontales; archivo adicional 3: Figura S4). Todas las secuencias de Chlorophyta no KNOX que llevan los dominios de homología PBL se clasificaron como GLX (GSP1-like homeobox) en reconocimiento de la proteína GSP1 de Chlamydomonas como el primer miembro caracterizado de esta clase .
¿Es la clase BELL de las plantas homóloga a la clase GLX de Chlorophyta?
La clase BELL es la única clase no KNOX en las plantas terrestres, compartiendo un dominio POX (Pre-homeobox) (PF07526) y careciendo de un dominio PBL identificable. El genoma de K. flaccidum, uno de los dos genomas disponibles de la charófita de la que surgió la planta terrestre, contenía tres secuencias no KNOX, todas ellas con un dominio PBL (Fig. 3, archivo adicional 3: Figuras S3, S4). El segundo genoma de Chara braunii contenía un homólogo putativo de BELL que parece estar truncado por las secuencias N-terminales fuera de su homeodominio C-terminal, posiblemente debido al modelo de gen incompleto. Por lo tanto, la falta de homología PBL en la clase BELL de las plantas parece deberse a la divergencia o a la pérdida de dominios de una antigua clase charófita que tenía homología PBL. Encontramos un intrón en la posición del homeodominio 24(2/3) de un homólogo de K. flaccidum GLX, que se identificó previamente como específico de la clase BELL de plantas (archivo adicional 3: figura S5), lo que sugiere que la clase BELL de plantas evolucionó a partir de un gen GLX ancestral. Se necesita un mayor muestreo de taxones en charofitas para confirmar esta inferencia.
Dos paralogos no KNOX de Chlorophyta heterodimerizan con los homólogos de KNOX
Incluso con nuestra sensible búsqueda iterativa de homología, no pudimos identificar una homología PBC/PBL en aproximadamente la mitad de las secuencias no KNOX de Chlorophyta. Dado que la mayoría de los genomas de Chlorophyta poseen un homólogo GLX y una secuencia no KNOX sin el dominio de homología PBL, nos referimos a esta última colectivamente como Clase-B (archivo adicional 3: Figura S6). Se encontraron excepciones en un clado de prasinofitas (clase Mamiellophyceae), cuyos seis genomas de alta calidad contienen todos dos secuencias no KNOX que carecen de la homología PBL. No obstante, estas secuencias no KNOX formaron dos grupos, uno más conservado y otro menos conservado y polifilético, referidos a las clases Mam-A y Mam-B, respectivamente (archivo adicional 3: Figuras S7, S8). Considerando la evolución reductora del genoma de las Mamiellophyceae , la clase Mam-A conservada puede derivar de una clase GLX ancestral.
Dos clases divergentes no KNOX en Chlorophyta llevaron a una pregunta crítica sobre sus redes diádicas. Estudios anteriores habían demostrado que los heterodímeros TALE requerían la interacción entre los dominios MEIS y PBC en animales y entre los dominios KNOX y PBL en Chlamydomonas . Por lo tanto, se predijo que todas las TALE de Glaucophyta y Rhodophyta forman heterodímeros a través de sus dominios de homología KNOX y PBL. Por otro lado, quedaba por probar si las TALEs de Chlorophyta que carecen de un dominio PBL pueden formar heterodímeros con otras TALEs.
Para caracterizar la red de interacción de las proteínas de clase TALE en Chlorophyta, seleccionamos tres especies de prasinofitas para realizar ensayos de interacción proteína-proteína: dos especies que contenían genes Mam-A y Mam-B (Micromonas commoda y Ostreococcus tauri), y otra especie (Picocystis salinarum), cuyo transcriptoma contenía una secuencia GLX y otra de clase B. En las tres especies, encontramos que los homólogos de KNOX interactuaban con todas las proteínas no KNOX examinadas en la clase Mam-A, Mam-B, Clase-B y GLX (Fig. 4a-c). No se observó ninguna interacción entre las dos proteínas no-KNOX en ninguna de las tres especies (Fig. 4a-c). De forma similar a la heterodimerización GLX-KNOX, Mam-A y Mam-B también requerían dominios adicionales fuera del homeodominio para su heterodimerización con los homólogos de KNOX (archivo adicional 3: Figura S9). Estos resultados mostraron que todas las TALEs divergentes no KNOX mantuvieron su actividad original para formar heterodímeros con los homólogos de KNOX. La red de interacción observada entre las secuencias TALE se resume en el archivo adicional 3: Figura S10.
La heterodimerización de las TALEs evolucionó a principios de la historia eucariótica
Nuestro descubrimiento de la homología PBC en Archaeplastida sugiere una ascendencia común de las TALES heterodimerizadoras entre Metazoa y Archaeplastida. También predice que otros linajes eucariotas podrían poseer TALEs con la homología PBC. Fuera de los animales, la base de datos Pfam sólo contiene dos secuencias que albergan el dominio PBC-B, una de una especie de Cryptophyta (Guillardia theta, ID:137502) y la otra de una especie de Amoebozoa (Acanthamoeba castillian, ID:XP_004342337) . Examinamos además el grupo Excavata, cercano a la raíz de la filogenia eucariótica que se postula. Una búsqueda en dos genomas (Naegleria gruberi y Bodo saltans) recogió 12 secuencias homeobox TALE en N.gruberi, y ninguna en B.saltans, de las cuales encontramos una con un dominio de homología PBC (ID:78561, Fig. 3a) y otra con una homología MEIS/KNOX (ID:79931, Archivo adicional 3: Figura S2). Buscamos en otros genomas de Amorphea y encontramos la homología PBC y la MEIS/KNOX en las secuencias de TALE recogidas de Apusozoa, Ichtyhosporea y Choanoflagellata, pero no de Fungi (archivo adicional 3: Figuras S11-S14). Nuestros datos sugieren que los dominios de heterodimerización -la homología PBC y la homología MEIS/KNOX- se originaron a principios de la evolución eucariótica y persistieron a lo largo de las principales radiaciones eucariotas.
La retención de intrones apoya la evolución paralela de las clases de TALE heterodiméricas durante las radiaciones eucariotas
La presencia ubicua de TALEs diádicas planteó la siguiente pregunta: ¿Son todas las TALEs diádicas reportadas en este estudio las descendientes de una única díada ancestral, o son el resultado de la evolución específica de un linaje a partir de una única TALE prototípica (proto-TALE) que no participa en la heterodimerización. Para sondear la ancestralidad profunda, examinamos la retención de intrones, que se considera un carácter largamente conservado y menos propenso a producirse por homoplasia (un carácter mostrado por un conjunto de especies pero que no está presente en su ancestro común) . Cinco posiciones de intrones fueron compartidas por al menos dos clases de TALE, de los cuales los intrones 44/45 y 48(2/3) se calificaron como los más ancestrales ya que se encontraron en todos los Archaeplastida y Metazoa (archivo adicional 3: Figura S5).
Los intrones 44/45 y 48(2/3) mostraron una intrigante distribución exclusiva entre las dos parejas diádicas de cada filo: una posee el intrón 44/45 y la otra el 48(2/3) (Archivo adicional 3: Figura S5). Este patrón mutuamente excluyente sugería que existían dos genes TALE con posiciones de intrón distintas al inicio de la radiación eucariótica. Consideramos que la posición del intrón 44/45 es la más ancestral, dado que se conserva en la mayoría de los genes homeobox no TALE. En este sentido, especulamos que la adquisición del 48(2/3), y la pérdida del intrón 44/45, acompañaron un evento temprano en el que la proto-TALE con el intrón 44/45 se duplicó para generar una segunda TALE con el intrón 48(2/3). Dado que la posición del intrón 48(2/3) se encontró dentro de los genes del grupo KNOX/MEIS en Viridiplantae y Metazoa y también en los genes del grupo PBX en Rhodophyta y Cryptophyta, podemos especular que las TALEs duplicadas surgieron temprano y se diversificaron para establecer configuraciones heterodiméricas específicas de linaje durante las radiaciones eucariotas. Alternativamente, la posición del intrón 48(2/3) en el homeodominio de la TALE podría haber sido adquirida muchas veces durante las radiaciones eucariotas.
Dado que las TALEs heterodiméricas evolucionaron de una manera específica para cada linaje, nos preguntamos qué aspecto tenía la proto-TALE en el momento en que sufrió la duplicación. Las siguientes observaciones sugieren que la proto-TALE era una proteína homodimerizante. En primer lugar, los dominios de homología PBC de las proteínas de clase PBX/GLX identificadas en los Archaeplastida incluyen el motivo MEINOX que fue definido originalmente por su similitud con los dominios de homología MEIS/KNOX (Fig. 3) . En segundo lugar, las secuencias PBX-Glauco poseen la homología ELK dentro de su dominio PBL (Fig. 3), que se alinea bien con los dominios ELK de las secuencias de clase KNOX en Viridiplantae (Archivo adicional 3: Figura S15). Por lo tanto, el motivo MEINOX y la homología ELK en los grupos KNOX y PBX heterodimerizantes apoyan el origen común de los grupos TALE heterodimerizantes a partir de un único TALE por duplicación seguida de subfuncionalización.