Ancestros comunes de los factores de transcripción homeobox TALE heterodimerizados en Metazoa y Archaeplastida

author
18 minutes, 55 seconds Read

Los TALE en Archaeplastida se dividen en dos grupos, KNOX y no KNOX

Para recopilar todas las secuencias de proteínas homeobox disponibles, realizamos búsquedas BLAST y Pfam-motif contra genomas no vegetales y ensamblajes de transcriptomas en toda la Archaeplastida, identificando 338 proteínas de 56 especies como la colección de homeobox de Archaeplastida (30 genomas y 18 transcriptomas; Archivo adicional 1: Tabla S1). De ellas, 104 poseían la característica que define a las proteínas TALE, una inserción de tres aminoácidos entre las posiciones 23-24 de los aa en el homeodominio. Se detectaron al menos dos genes TALE en la mayoría de los genomas, excepto en cinco genomas de la clase Trebouxiophyceae de la Chlorophyta (Archivo adicional 1: Tabla S1; véase el Archivo adicional 2: Nota S1 para una mayor discusión sobre la ausencia de TALEs en Trebouxiophyceae).

Las secuencias TALE recogidas se clasificaron entonces por sus características de homeodominio utilizando un enfoque filogenético, con TALEs de animales, plantas y eucariotas de divergencia temprana (Amoebozoa y Excavata) como grupos externos (archivo adicional 3: Figura S1). La filogenia resultante de los homeodominios TALE distingue dos grupos en los tres filos de Archaeplastida (Fig. 2). (1) El grupo KNOX, como clado bien apoyado, mostró un cladograma específico para cada filo: dos secuencias de Glaucophyta en la base (como KNOX-Glauco) estaban separadas del siguiente clado, que combina secuencias de Rhodophyta (como KNOX-Red1) y un clado específico de Viridiplantae con fuerte apoyo (92/90/1,00). (2) El grupo no KNOX, que incluye los homólogos BELL y GSP1, contenía clados de afiliaciones taxonómicas mixtas. Estos análisis mostraron que las proteínas TALE ya habían divergido en dos grupos antes de la evolución de los Archaeplastida y que el grupo KNOX está muy conservado en todos los Archaeplastida.

Fig. 2

La filogenia de máxima verosimilitud (ML) del homeodominio de la superclase TALE en Archaeplastida apoya la antigua división entre los grupos KNOX- y no KNOX TALE. Los árboles ML se generaron a partir del alineamiento del homeodominio con 70 posiciones de aminoácidos. Se muestra el árbol de consenso de 1000 árboles bootstrap. Los tres números en los nodos críticos muestran el %bootstrap, el %SH y la probabilidad posterior bayesiana en apoyo de los clados. El árbol contiene dos clados de outgroups marcados por cuadrados negros en los nodos, y dos clados de Archaeplastida, uno que combina la mayoría de las secuencias KNOX marcado por el cuadrado rojo y el otro que combina todas las secuencias no KNOX marcado por el cuadrado azul. Las barras verticales de la derecha representan la distribución del grupo externo en negro, de KNOX en rojo y de las secuencias no KNOX en azul. Los puntos rojos junto a los nombres de las secuencias indican la presencia de dominios KN-A o KN-B, y los puntos azules indican la presencia de un dominio de homología PBC. Las secuencias truncadas no disponibles para el análisis de los dominios de homología están marcadas con recuadros negros abiertos. Los recuadros negros rellenos indican la ausencia de un dominio de homología KN-A/B o PBC. La clasificación propuesta está indicada por las líneas verticales. Las líneas verticales punteadas indican los miembros de la clase sugeridos, situados fuera del clado principal de la clase en la filogenia. Las secuencias PBX-Red se encuentran en cuatro clados separados, marcados por tonos morados en la sección azul de las barras verticales. Dos secuencias PBX-Red marcadas por el cuadrado púrpura se encuentran excepcionalmente en el clado KNOX-Red1, teniendo aminoácidos divergentes en posiciones altamente conservadas en Trp19, His23 y Lys31 en su homeodominio, lo que sugiere su falsa asociación con el KNOX-Red1. Los colores de los nombres de las secuencias indican su grupo filogenético: Azul para Glaucophyta, púrpura para Rhodophyta, verde para prasinofitas, azul claro para las clorofitas, naranja para Streptophyta, y negro para los outgroups. La regla muestra la distancia genética. Los detalles de las secuencias analizadas por esta filogenia se proporcionan en el archivo adicional 1: Tabla S2. *Gloeochaete_wittrockiana_014496 se considera una secuencia de una ameba de tipo bálano que contaminó el cultivo original (SAG46.84) para el transcriptoma MMETSP1089. **La asociación de las secuencias de la clase KNOX-Red2 con las secuencias PBC de Amorphea se atribuye a un motivo WFGN compartido que determina la especificidad de unión al ADN del homeodominio a través de la evolución convergente

Las secuencias del grupo KNOX comparten los mismos dominios de heterodimerización en todos los Archaeplastida

La siguiente cuestión era si la clase KNOX vegetal se originó antes del filo Viridiplantae. Las proteínas KNOX de plantas y la GSM1 de Chlorophyta poseen la homología KNOX, que consiste en los dominios KN-A, KN-B y ELK, necesarios para su heterodimerización con otras proteínas TALE ; por lo tanto, la presencia de la homología KNOX sugeriría el potencial de heterodimerización al grupo KNOX. Para recopilar dominios de homología sin información previa, realizamos búsquedas ad-hoc de dominios de homología entre las secuencias del grupo KNOX. Utilizando los dominios de homología identificados como anclas, curamos cuidadosamente una alineación de las secuencias del grupo KNOX combinadas con cualquier otra secuencia TALE con una homología KNOX, (Archivo adicional 3: Figura S2). A partir de este alineamiento de KNOX, encontramos todas las secuencias del grupo KNOX (excluyendo las secuencias parciales) que mostraban puntuaciones de similitud de aminoácidos > 50% para al menos dos de los tres dominios que comprenden la región de homología KNOX (Archivo adicional 1: Tabla S3 para la homología de dominio calculada). Para comprobar si la similitud observada es específica de las secuencias TALE, generamos motivos HMM para los dominios KN-A y KN-B a partir del alineamiento de KNOX, los buscamos en los genomas objetivo y confirmamos que los dominios KN-A y KN-B sólo se encuentran en las secuencias TALE (archivo adicional 4: datos S1 y S2). Por lo tanto, definimos los homólogos de KNOX como las secuencias de TALE que poseen homología de KNOX que se puede buscar (Fig. 2, marcada con puntos rojos a continuación de sus identificaciones), lo que sugiere que el homólogo de KNOX ya existía antes de la evolución de la fotosíntesis eucariótica representada por los Archaeplastida.

Además del homólogo de KNOX, la misma búsqueda también reveló dos nuevos dominios en el C-terminal del homeodominio (archivo adicional 3: Figura S2): el primero (KN-C1) era compartido entre las secuencias de Chlorophyta, y el segundo (KN-C2) era compartido entre un grupo de homólogos de KNOX en un clado fuera del grupo KNOX (KNOX-Red2).

Las clases de KNOX divergieron de forma independiente entre los filos de las algas

En Viridiplantae, encontramos un único homólogo de KNOX en la mayoría de las especies de Chlorophyta, mientras que la divergencia de KNOX1 y KNOX2 fue evidente en la división Streptophyta, incluyendo el charófito Klebsormidium flaccidum y las plantas terrestres (Fig. 2). El dominio KN-C1 recién descubierto era específico de las secuencias KNOX de Chlorophyta y se encontraba en todas las especies menos en una (Pyramimonas amylifera). La ausencia de similitud entre KN-C1 y las extensiones C-terminales de las secuencias KNOX1/KNOX2 sugiere una evolución de KNOX independiente y específica de cada linaje en Chlorophyta y Streptophyta (archivo adicional 3: Figura S2). Por lo tanto, nos referimos a las clases KNOX de Chlorophyta como KNOX-Chloro en contraste con las clases KNOX1 y KNOX2 de Streptophyta.

Los homólogos de KNOX en Rhodophyta se dividieron en dos clases: un grupo parafilético cercano al clado KNOX-Chloro, denominado KNOX-Red1, y un segundo grupo cercano al grupo PBX-Out, denominado KNOX-Red2. KNOX-Red1 carecía de un KN-A, mientras que KNOX-Red2 carecía de un ELK y compartía un dominio KN-C2 (archivo adicional 3: Figura S2). Consideramos que KNOX-Red1 es el tipo ancestral, ya que las secuencias de KNOX-Red1 se encontraron en todos los taxones de Rhodophyta examinados, mientras que las secuencias de KNOX-Red2 estaban restringidas a dos clases taxonómicas (Cyanidiophyceae y Florideophyceae). Curiosamente, el clado KNOX-Red2 incluía dos secuencias de algas verdes, con un fuerte apoyo estadístico (89/89/0,97; Fig. 2); éstas poseían un dominio KN-C2, lo que sugiere su ascendencia dentro de la clase KNOX-Red2 (Archivo adicional 3: Figura S2; véase el Archivo adicional 2: Nota S2 para una mayor discusión sobre su posible origen a través de la transferencia horizontal de genes).

Las secuencias TALE disponibles eran limitadas para la Glaucophyta. Encontramos un único homólogo de KNOX en dos especies, que poseía dominios KN-A y KN-B pero carecía de un dominio ELK. Las denominamos KNOX-Glauco.

Las TALEs del grupo no-KNOX poseen un dominio de homología PBC de tipo animal, lo que sugiere una ascendencia compartida entre Archaeplastida y Metazoa

Tras la identificación de los homólogos de KNOX, las restantes secuencias de TALEs se combinaron como el grupo no-KNOX que carece de dominios KN-A y KN-B en Archaeplastida. La clasificación posterior del grupo no KNOX fue un reto debido a sus secuencias de homeodominios altamente divergentes. Sin embargo, observamos que el número de genes no-KNOX por especie era en gran medida invariable: uno en la mayoría de los genomas de Rhodophyta y Glaucophyta y dos en la mayoría de los genomas de Chlorophyta, lo que sugiere su conservación dentro de cada radiación.

Nuestra búsqueda de homología ad-hoc proporcionó información crítica para la clasificación de los no-KNOX, identificando un dominio de homología compartido entre todas las secuencias no-KNOX de Glaucophyta y Rhodophyta (Fig. 3a, b). Dado que este dominio mostró una similitud con la segunda mitad del dominio PBC-B animal (Pfam ID: PF03792) conocido como dominio de heterodimerización , denominamos a este dominio PBL (PBC-B Like). En consecuencia, clasificamos todas las TALEs no KNOX en Glaucophyta y Rhodophyta como una única clase de homeobox relacionada con PBC, PBX-Glauco o PBX-Red. Las secuencias de PBX-Glauco también poseían el motivo MEINOX, conservado en el dominio PBC-B de los animales, lo que indica una ascendencia común de los dominios PBC-B y PBL (Fig. 3a).

Fig. 3

Las TALEs del grupo no KNOX de Archaeplastida poseen un dominio PBC-like (PBL) que consiste en homología N-terminal de MEINOX y homología C-terminal de PBC-B. Las letras de los aminoácidos en negro con tonos grises, en blanco con tonos claros y en blanco con tonos negros muestran más del 60%, 80% o 100% de similitud en cada columna. Los triángulos rojos invertidos indican las secuencias descartadas en las inserciones no alineadas. a Alineación del dominio PBL-Glauco, incluyendo dos secuencias de Glaucophyta que comparten homología tanto en la homología MEINOX como en la mitad C-terminal del dominio PBC-B con secuencias TALE no Archaeplastida. El recuadro rojo indica el dominio ELK. b Alineación del dominio PBL-Red. Todas las secuencias de Rhodophyta que no son KNOX poseen un dominio PBL con escasa homología a MEINOX. c Alineamiento del dominio PBL-Chloro. Se incluye Cyanophora_paradox_20927.63 para su comparación. Picocystis_salinarum_02499 es un miembro fundador de la clase GLX con un dominio PBL-Chloro. d Comparación entre dominios PBL. La fila superior muestra el consenso realizado a partir del alineamiento de (a), (b) y (c) combinados y las secuencias de consenso inferiores se recogen de los alineamientos individuales presentados en (a), (b) y (c)

GSP1 comparte una homología PBC distante junto con otras secuencias del grupo no-KNOX en Viridiplantae

Una cuestión pendiente era la evolución de las secuencias no-KNOX de Chlorophyta que aparentemente carecían de una homología PBC. Para descubrir incluso una homología lejana, comparamos los dominios PBL recién definidos con las secuencias de Chlorophyta mediante BLAST (valor E de corte de 1E-1) y alineaciones de secuencias múltiples. Esta búsqueda recogió tres secuencias TALE de prasinofitas y una de charofitas que poseían un motivo MEINOX y un supuesto dominio PBL; sin embargo, mostraron una identidad de secuencia muy baja entre ellas (Fig. 3c). Una búsqueda adicional utilizando estas cuatro secuencias identificó 11 secuencias adicionales no KNOX. Nueve de ellas se alinearon en dos líneas, una de las cuales incluía los homólogos de GSP1 y la otra combinaba la mayoría de las secuencias de prasinofitas (archivo adicional 3: figura S3). Las dos secuencias restantes (Picocystis_salinarum_04995 y Klebsormidium_flaccidum_00021_0250) mostraron una homología con una secuencia PBX-Red de Chondrus cruentum (ID:41034) en una extensión de ~ 200 aa más allá del dominio PBL, lo que sugiere su ascendencia PBX-Red (otro posible caso de transferencias horizontales; archivo adicional 3: Figura S4). Todas las secuencias de Chlorophyta no KNOX que llevan los dominios de homología PBL se clasificaron como GLX (GSP1-like homeobox) en reconocimiento de la proteína GSP1 de Chlamydomonas como el primer miembro caracterizado de esta clase .

¿Es la clase BELL de las plantas homóloga a la clase GLX de Chlorophyta?

La clase BELL es la única clase no KNOX en las plantas terrestres, compartiendo un dominio POX (Pre-homeobox) (PF07526) y careciendo de un dominio PBL identificable. El genoma de K. flaccidum, uno de los dos genomas disponibles de la charófita de la que surgió la planta terrestre, contenía tres secuencias no KNOX, todas ellas con un dominio PBL (Fig. 3, archivo adicional 3: Figuras S3, S4). El segundo genoma de Chara braunii contenía un homólogo putativo de BELL que parece estar truncado por las secuencias N-terminales fuera de su homeodominio C-terminal, posiblemente debido al modelo de gen incompleto. Por lo tanto, la falta de homología PBL en la clase BELL de las plantas parece deberse a la divergencia o a la pérdida de dominios de una antigua clase charófita que tenía homología PBL. Encontramos un intrón en la posición del homeodominio 24(2/3) de un homólogo de K. flaccidum GLX, que se identificó previamente como específico de la clase BELL de plantas (archivo adicional 3: figura S5), lo que sugiere que la clase BELL de plantas evolucionó a partir de un gen GLX ancestral. Se necesita un mayor muestreo de taxones en charofitas para confirmar esta inferencia.

Dos paralogos no KNOX de Chlorophyta heterodimerizan con los homólogos de KNOX

Incluso con nuestra sensible búsqueda iterativa de homología, no pudimos identificar una homología PBC/PBL en aproximadamente la mitad de las secuencias no KNOX de Chlorophyta. Dado que la mayoría de los genomas de Chlorophyta poseen un homólogo GLX y una secuencia no KNOX sin el dominio de homología PBL, nos referimos a esta última colectivamente como Clase-B (archivo adicional 3: Figura S6). Se encontraron excepciones en un clado de prasinofitas (clase Mamiellophyceae), cuyos seis genomas de alta calidad contienen todos dos secuencias no KNOX que carecen de la homología PBL. No obstante, estas secuencias no KNOX formaron dos grupos, uno más conservado y otro menos conservado y polifilético, referidos a las clases Mam-A y Mam-B, respectivamente (archivo adicional 3: Figuras S7, S8). Considerando la evolución reductora del genoma de las Mamiellophyceae , la clase Mam-A conservada puede derivar de una clase GLX ancestral.

Dos clases divergentes no KNOX en Chlorophyta llevaron a una pregunta crítica sobre sus redes diádicas. Estudios anteriores habían demostrado que los heterodímeros TALE requerían la interacción entre los dominios MEIS y PBC en animales y entre los dominios KNOX y PBL en Chlamydomonas . Por lo tanto, se predijo que todas las TALE de Glaucophyta y Rhodophyta forman heterodímeros a través de sus dominios de homología KNOX y PBL. Por otro lado, quedaba por probar si las TALEs de Chlorophyta que carecen de un dominio PBL pueden formar heterodímeros con otras TALEs.

Para caracterizar la red de interacción de las proteínas de clase TALE en Chlorophyta, seleccionamos tres especies de prasinofitas para realizar ensayos de interacción proteína-proteína: dos especies que contenían genes Mam-A y Mam-B (Micromonas commoda y Ostreococcus tauri), y otra especie (Picocystis salinarum), cuyo transcriptoma contenía una secuencia GLX y otra de clase B. En las tres especies, encontramos que los homólogos de KNOX interactuaban con todas las proteínas no KNOX examinadas en la clase Mam-A, Mam-B, Clase-B y GLX (Fig. 4a-c). No se observó ninguna interacción entre las dos proteínas no-KNOX en ninguna de las tres especies (Fig. 4a-c). De forma similar a la heterodimerización GLX-KNOX, Mam-A y Mam-B también requerían dominios adicionales fuera del homeodominio para su heterodimerización con los homólogos de KNOX (archivo adicional 3: Figura S9). Estos resultados mostraron que todas las TALEs divergentes no KNOX mantuvieron su actividad original para formar heterodímeros con los homólogos de KNOX. La red de interacción observada entre las secuencias TALE se resume en el archivo adicional 3: Figura S10.

Fig. 4

Los TFs TALE participan en redes de heterodimerización entre grupos KNOX y no KNOX. Los constructos cebo conjugados con el dominio de unión al ADN (DBD) de GAL4 y los constructos presa conjugados con el dominio de activación transcripcional (AD) de GAL4 se enumeran en la tabla. Las combinaciones de constructos, numeradas del 1 al 8, están dispuestas en cuñas en el sentido de las agujas del reloj, comenzando por las 9 en punto, como se indica en los paneles -LT. Los pares de interacción confirmados se muestran en negrita en la tabla. El par de laminina y antígeno T (T-Ag), que se sabe que interactúan, se colocó en el octavo sector como control positivo. a Ensayos con TALEs de M. commoda. b Ensayos con TALEs de O. tauri. c Ensayos con TALEs de P. salinarum. KNOX-tr se refiere al constructo KNOX truncado en su extremo N para evitar la autoactivación. d La información detallada del constructo se proporciona en el archivo adicional 1: Tabla S5

La heterodimerización de las TALEs evolucionó a principios de la historia eucariótica

Nuestro descubrimiento de la homología PBC en Archaeplastida sugiere una ascendencia común de las TALES heterodimerizadoras entre Metazoa y Archaeplastida. También predice que otros linajes eucariotas podrían poseer TALEs con la homología PBC. Fuera de los animales, la base de datos Pfam sólo contiene dos secuencias que albergan el dominio PBC-B, una de una especie de Cryptophyta (Guillardia theta, ID:137502) y la otra de una especie de Amoebozoa (Acanthamoeba castillian, ID:XP_004342337) . Examinamos además el grupo Excavata, cercano a la raíz de la filogenia eucariótica que se postula. Una búsqueda en dos genomas (Naegleria gruberi y Bodo saltans) recogió 12 secuencias homeobox TALE en N.gruberi, y ninguna en B.saltans, de las cuales encontramos una con un dominio de homología PBC (ID:78561, Fig. 3a) y otra con una homología MEIS/KNOX (ID:79931, Archivo adicional 3: Figura S2). Buscamos en otros genomas de Amorphea y encontramos la homología PBC y la MEIS/KNOX en las secuencias de TALE recogidas de Apusozoa, Ichtyhosporea y Choanoflagellata, pero no de Fungi (archivo adicional 3: Figuras S11-S14). Nuestros datos sugieren que los dominios de heterodimerización -la homología PBC y la homología MEIS/KNOX- se originaron a principios de la evolución eucariótica y persistieron a lo largo de las principales radiaciones eucariotas.

La retención de intrones apoya la evolución paralela de las clases de TALE heterodiméricas durante las radiaciones eucariotas

La presencia ubicua de TALEs diádicas planteó la siguiente pregunta: ¿Son todas las TALEs diádicas reportadas en este estudio las descendientes de una única díada ancestral, o son el resultado de la evolución específica de un linaje a partir de una única TALE prototípica (proto-TALE) que no participa en la heterodimerización. Para sondear la ancestralidad profunda, examinamos la retención de intrones, que se considera un carácter largamente conservado y menos propenso a producirse por homoplasia (un carácter mostrado por un conjunto de especies pero que no está presente en su ancestro común) . Cinco posiciones de intrones fueron compartidas por al menos dos clases de TALE, de los cuales los intrones 44/45 y 48(2/3) se calificaron como los más ancestrales ya que se encontraron en todos los Archaeplastida y Metazoa (archivo adicional 3: Figura S5).

Los intrones 44/45 y 48(2/3) mostraron una intrigante distribución exclusiva entre las dos parejas diádicas de cada filo: una posee el intrón 44/45 y la otra el 48(2/3) (Archivo adicional 3: Figura S5). Este patrón mutuamente excluyente sugería que existían dos genes TALE con posiciones de intrón distintas al inicio de la radiación eucariótica. Consideramos que la posición del intrón 44/45 es la más ancestral, dado que se conserva en la mayoría de los genes homeobox no TALE. En este sentido, especulamos que la adquisición del 48(2/3), y la pérdida del intrón 44/45, acompañaron un evento temprano en el que la proto-TALE con el intrón 44/45 se duplicó para generar una segunda TALE con el intrón 48(2/3). Dado que la posición del intrón 48(2/3) se encontró dentro de los genes del grupo KNOX/MEIS en Viridiplantae y Metazoa y también en los genes del grupo PBX en Rhodophyta y Cryptophyta, podemos especular que las TALEs duplicadas surgieron temprano y se diversificaron para establecer configuraciones heterodiméricas específicas de linaje durante las radiaciones eucariotas. Alternativamente, la posición del intrón 48(2/3) en el homeodominio de la TALE podría haber sido adquirida muchas veces durante las radiaciones eucariotas.

Dado que las TALEs heterodiméricas evolucionaron de una manera específica para cada linaje, nos preguntamos qué aspecto tenía la proto-TALE en el momento en que sufrió la duplicación. Las siguientes observaciones sugieren que la proto-TALE era una proteína homodimerizante. En primer lugar, los dominios de homología PBC de las proteínas de clase PBX/GLX identificadas en los Archaeplastida incluyen el motivo MEINOX que fue definido originalmente por su similitud con los dominios de homología MEIS/KNOX (Fig. 3) . En segundo lugar, las secuencias PBX-Glauco poseen la homología ELK dentro de su dominio PBL (Fig. 3), que se alinea bien con los dominios ELK de las secuencias de clase KNOX en Viridiplantae (Archivo adicional 3: Figura S15). Por lo tanto, el motivo MEINOX y la homología ELK en los grupos KNOX y PBX heterodimerizantes apoyan el origen común de los grupos TALE heterodimerizantes a partir de un único TALE por duplicación seguida de subfuncionalización.

Similar Posts

Deja una respuesta

Tu dirección de correo electrónico no será publicada.