Ancestralidade comum dos factores de transcrição da heterodimerização dos TALE homeoboxos em Metazoa e Archaeplastida

author
17 minutes, 54 seconds Read

TALEs em Archaeplastida estão divididos em dois grupos, KNOX e não-KNOX

Para recolher todas as sequências de proteínas homeobox disponíveis, realizamos buscas BLAST e Pfam-motif contra genomas não vegetais e conjuntos de transcriptomas em todo o Archaeplastida, identificando 338 proteínas de 56 espécies como a colecção de Archaeplastida homeobox (30 genomas e 18 transcriptomas; Arquivo adicional 1: Tabela S1). Destas, 104 possuem a característica definidora das proteínas TALE, uma inserção de três aminoácidos entre as posições aa 23-24 na homeodomaína . Pelo menos dois genes TALE foram detectados na maioria dos genomas, exceto cinco genomas da classe Trebouxiophyceae da Chlorophyta (arquivo adicional 1: Tabela S1; veja arquivo adicional 2: Nota S1 para discussão adicional da ausência de TALEs em Trebouxiophyceae).

As sequências de TALEs coletadas foram então classificadas pelas suas características homeodomáticas usando uma abordagem filogenética, com TALEs de animais, plantas, e eucariotas de divisão precoce (Amoebozoa e Excavata) como outgroups (Arquivo Adicional 3: Figura S1). A filogenia homeodomática TALE resultante distinguiu dois grupos nos três filamentos do Archaeplastida (Fig. 2). (1) O grupo KNOX como clade bem suportado exibia um cladograma específico do filo: duas sequências de Glaucophyta na base (como KNOX-Glauco) foram separadas do clade seguinte, que combina sequências de Rhodophyta (como KNOX-Red1) e um clade específico de Viridiplanta com forte suporte (92/90/1.00). (2) O grupo não KNOX, incluindo os homólogos BELL e GSP1, continha clades de filiações taxonômicas mistas. Essas análises mostraram que as proteínas TALE já haviam divergido em dois grupos antes da evolução do Archaeplastida e que o grupo KNOX é altamente conservado em todo o Archaeplastida.

Fig. 2

Fig. maximum likelihood (ML) phylogeny of the TALE superclass homeodomain in Archaeplastida supports ancient division between KNOX- and non-KNOX TALE groups. As árvores ML foram geradas a partir do alinhamento da homeodomaína com 70 posições de aminoácidos. A árvore de consenso entre 1000 árvores bootstrap é mostrada. Os três números em nós críticos mostram %bootstrap, %SH e Bayesian posterior probability em suporte de clades. A árvore contém dois clades fora do grupo marcados por quadrados pretos nos nós, e dois clades de Archaeplastida, um combinando a maioria das sequências KNOX marcadas pelo quadrado vermelho e o outro combinando todas as sequências não KNOX marcadas pelo quadrado azul. As barras verticais à direita mostram a distribuição do outgroup em preto, KNOX em vermelho, e sequências não KNOX em azul. Os pontos vermelhos pelos nomes das sequências indicam a presença de domínios KN-A ou KN-B, e os pontos azuis indicam a presença de um domínio PBC-homológico. As sequências truncadas não disponíveis para análise de domínios de homologia são marcadas com caixas pretas abertas. As caixas pretas preenchidas indicam a ausência de um domínio KN-A/B ou PBC-homologia. A classificação proposta é indicada pelas linhas verticais. As linhas verticais pontilhadas indicam os membros da classe sugeridos colocados fora do clade principal para a classe na filogenia. As sequências PBX-Red são encontradas em quatro clades separados, marcados por tons roxos na secção azul das barras verticais. Duas seqüências PBX-Red marcadas pelo quadrado roxo são excepcionalmente encontradas no clade KNOX-Red1, tendo aminoácidos divergentes em posições altamente conservadas em Trp19, His23 e Lys31 em sua homeodomínio, sugerindo sua falsa associação com o KNOX-Red1. As cores dos nomes das sequências indicam o seu grupo filogenético: Azul para Glaucophyta, roxo para Rhodophyta, verde para prasinófitas, azul claro para as clorófitas, laranja para Streptophyta e preto para os grupos. A régua mostra a distância genética. Os detalhes das sequências analisadas por esta filogenia são fornecidos no arquivo adicional 1: Tabela S2. *Gloeochaete_wittrockiana_014496 é considerada como uma sequência de uma ameba tipo bannelídeo que contaminou a cultura original (SAG46.84) para o transcriptoma MMETSP1089. **Associação das sequências da classe KNOX-Red2 às sequências de Amorphea PBC é atribuída a um motivo WFGN partilhado que determina a especificidade de ligação do ADN do homeodomínio via evolução convergente

Sequências do grupo KNOX partilham os mesmos domínios de heterodimerização através de Archaeplastida

A questão seguinte era se a classe KNOX da planta era originária antes do filo Viridiplantae. As proteínas vegetais KNOX e a Chlorophyta GSM1 possuem a homologia KNOX, constituída pelos domínios KN-A, KN-B e ELK, necessários para a sua heterodimerização com outras proteínas TALE; portanto, a presença da homologia KNOX sugere o potencial de heterodimerização para o grupo KNOX. Para recolher domínios de homologia sem informação prévia, realizamos pesquisas ad-hoc de domínios de homologia entre as sequências do grupo KNOX. Usando os domínios de homologia identificados como âncoras, nós cuidadosamente curamos um alinhamento das seqüências do grupo KNOX combinado com quaisquer outras seqüências TALE com uma homologia KNOX, (arquivo adicional 3: Figura S2). A partir deste alinhamento KNOX, encontramos todas as sequências do grupo KNOX (excluindo as sequências parciais), mostrando resultados de similaridade de aminoácidos > 50% para pelo menos dois dos três domínios que compõem a região da homologia KNOX (Arquivo adicional 1: Tabela S3 para homologia de domínio calculada). Para testar se a similaridade observada é específica para as sequências TALE, geramos motivos HMM para os domínios KN-A e KN-B a partir do alinhamento KNOX, pesquisamos nos genomas alvo e confirmamos que os domínios KN-A e KN-B são encontrados apenas nas sequências TALE (Ficheiro adicional 4: Dados S1 e S2). Assim definimos KNOX-homologs como as sequências TALE que possuem homologia KNOX pesquisável (Fig. 2, marcada por pontos vermelhos seguindo suas identificações), sugerindo que o KNOX-homolog já existia antes da evolução da fotossíntese eucariótica como representada pelo Archaeplastida.

Além da homologia KNOX, a mesma busca também revelou dois novos domínios no termo C do homeodomínio (arquivo adicional 3: Figura S2): o primeiro (KN-C1) foi compartilhado entre as seqüências de Clorofita, e o segundo (KN-C2) foi compartilhado entre um grupo de homólogos KNOX em um clade fora do grupo KNOX (KNOX-Red2).

As classes KNOX divergiram independentemente entre a fila de algas

Em Viridiplantae, encontramos um único homólogo KNOX na maioria das espécies de Chlorophyta, enquanto que a divergência de KNOX1 e KNOX2 foi evidente na divisão Streptophyta, incluindo a charophyte Klebsormidium flaccidum e plantas terrestres (Fig. 2). O domínio KN-C1 recentemente descoberto foi específico para as sequências de Chlorophyta KNOX e encontrado em todas as espécies excepto uma (Pyramimonas amylifera). A ausência de similaridade entre as extensões terminais KN-C1 e C das sequências KNOX1/KNOX2 sugere uma evolução independente, específica da linhagem KNOX nas sequências Chlorophyta e Streptophyta (ficheiro adicional 3: Figura S2). Nós, portanto, nos referimos às classes Chlorophyta KNOX como KNOX-Chloro em contraste com as classes KNOX1 e KNOX2 na Streptophyta.

Os homólogos KNOX na Rhodophyta foram divididos em duas classes: um grupo parafilético próximo ao clade KNOX-Chloro, chamado KNOX-Red1, e um segundo grupo próximo ao PBX-Outgroup, chamado KNOX-Red2. KNOX-Red1 não tinha um KN-A, enquanto que KNOX-Red2 não tinha um ELK e partilhava um domínio KN-C2 (Ficheiro adicional 3: Figura S2). Consideramos KNOX-Red1 como o tipo ancestral, já que as sequências KNOX-Red1 foram encontradas em todos os táxones examinados de Rhodophyta, enquanto as sequências KNOX-Red2 foram restritas a duas classes taxonômicas (Cyanidiophyceae e Florideophyceae). Curiosamente, o clade KNOX-Red2 incluiu duas sequências de algas verdes, com forte suporte estatístico (89/89/0.97; Fig. 2); estas possuíam um domínio KN-C2, sugerindo sua ancestralidade dentro da classe KNOX-Red2 (arquivo adicional 3: Figura S2; veja arquivo adicional 2: Nota S2 para mais discussão sobre sua possível origem via transferência horizontal de genes).

Sequências TALE disponíveis foram limitadas para a Glaucophyta. Encontramos um único homólogo KNOX em duas espécies, que possuía os domínios KN-A e KN-B, mas não possuía um domínio ELK. Chamamos estes homólogos KNOX-Glauco.

TALEs do grupo não KNOX possuem domínio PBC-homológico tipo animal, sugerindo uma ancestralidade compartilhada entre Archaeplastida e Metazoa

Seguindo a identificação dos homólogos KNOX, as sequências TALE restantes foram combinadas como o grupo não KNOX que não possui domínios KN-A e KN-B em Archaeplastida. A classificação adicional do grupo não KNOX foi desafiadora devido às suas sequências de homeodomínio altamente divergentes. Entretanto, notamos que o número de genes não-KNOX por espécie era amplamente invariável: um na maioria dos genomas Rhodophyta e Glaucophyta e dois na maioria dos genomas Chlorophyta, sugerindo sua conservação dentro de cada radiação.

Nossa pesquisa homológica ad-hoc forneceu informações críticas para a classificação não-KNOX, identificando um domínio de homologia compartilhado entre todas as seqüências de Glaucophyta e Rhodophyta não-KNOX (Fig. 3a, b). Como este domínio mostrou uma semelhança com a segunda metade do domínio PBC-B animal (Pfam ID: PF03792) conhecido como domínio de heterodimerização , nomeamos este domínio como PBL (PBC-B Like). Assim, classificamos todos os TALEs não KNOX em Glaucophyta e Rhodophyta como uma única classe homeobox relacionada à PBC, PBX-Glauco ou PBX-Red. As seqüências PBX-Glauco também possuíam o motivo MEINOX, conservado no domínio animal PBC-B, indicando ancestralidade comum dos domínios PBC-B e PBL (Fig. 3a).

Fig. 3

Archaeplastida non-KNOX group TALEs possuem um domínio tipo PBC (PBL), consistindo de homologia N-terminal MEINOX e homologia C-terminal PBC-B. As letras aminoácidas em preto com tons de cinza, em branco com tons claros e em branco com tons de preto mostram mais de 60%, 80%, ou 100% de similaridade em cada coluna. Triângulos vermelhos inversos indicam as seqüências descartadas em inserções não alinhadas. um alinhamento de domínio PBL-Glauco, incluindo duas seqüências Glaucophyta compartilhando homologia tanto na homologia MEINOX quanto na metade terminal do domínio PBC-B com seqüências TALE não-Archaeplastida. A caixa vermelha indica o domínio ELK. b Alinhamento do domínio PBL-Red. Todas as seqüências Rhodophyta não KNOX possuem um domínio PBL com má homologia MEINOX. c Alinhamento do domínio PBL-Cloro. Cyanophora_paradox_20927.63 está incluído para comparação. Picocystis_salinarum_02499 é um membro fundador da classe GLX com um domínio PBL-Cloro. d Comparação entre domínios PBL. A linha superior mostra o consenso feito a partir do alinhamento de (a), (b) e (c) combinados e as sequências de consenso inferior são coletadas a partir dos alinhamentos individuais apresentados em (a), (b), e (c)

GSP1 partilha a PBC-homologia distante juntamente com outras sequências de grupos não KNOX na Viridiplantae

Uma questão restante foi a evolução das sequências não KNOX de Chlorophyta que aparentemente não tinham uma PBC-homologia. Para descobrir até mesmo uma homologia distante, comparamos os domínios PBL recentemente definidos com as sequências de Chlorophyta por BLAST (valor E de corte de 1E-1) e alinhamentos de sequências múltiplas. Esta consulta recolheu três sequências de prasinófitos e uma de TALE de carófitos que possuíam um motivo MEINOX e um suposto domínio PBL; no entanto, mostraram uma identidade de sequência muito baixa entre si (Fig. 3c). Outras consultas utilizando estas quatro sequências identificaram 11 sequências adicionais não KNOX. Nove destas foram feitas em dois alinhamentos, um incluindo homólogos GSP1 e o outro combinando a maioria das seqüências prasinófilas (arquivo adicional 3: Figura S3). As duas sequências restantes (Picocystis_salinarum_04995 e Klebsormidium_flaccidum_00021_0250) mostraram uma homologia a uma sequência PBX-Red de Chondrus cruentum (ID:41034) em uma extensão de ~ 200 aa-longa para além do domínio PBL, sugerindo a sua ancestralidade PBX-Red (outro caso potencial de transferências horizontais; Ficheiro adicional 3: Figura S4). Todas as sequências não KNOX da Chlorophyta que transportam os domínios PBL-homologia foram classificadas como GLX (GSP1-like homeobox) em reconhecimento da proteína GSP1 de Chlamydomonas como o primeiro membro caracterizado desta classe .

A classe BELL da planta é homóloga à classe Chlorophyta GLX?

A classe BELL é a única classe não-KNOX em plantas terrestres, partilhando um domínio POX (Pre-homeobox) (PF07526) e carecendo de um domínio PBL identificável. O genoma K. flaccidum, um dos dois genomas disponíveis na charophyte de onde surgiu a planta terrestre, continha três sequências não-KNOX, todas possuindo um domínio PBL (Fig. 3, arquivo adicional 3: Figuras S3, S4). O segundo genoma carófito de Chara braunii continha um homólogo BELL putativo que parece estar truncado para as sequências N-terminais fora de seu homeodomínio C-terminal possivelmente devido ao modelo genético incompleto. Portanto, a falta de homodomínio PBL na classe BELL da planta parece ser devido à divergência ou perda de domínio de uma antiga classe de carófilos que tinha homodomínio PBL. Encontramos um intron na posição 24(2/3) do homeodomínio de um homólogo K. flaccidum GLX, que foi previamente identificado como sendo específico da classe BELL da planta (arquivo adicional 3: Figura S5) , sugerindo que a classe BELL da planta evoluiu a partir de um gene GLX ancestral. Para confirmar esta inferência é necessária mais amostragem de táxon em carófitas.

Dois parálogos não KNOX de Chlorophyta heterodimerizados com os homólogos KNOX

Com nossa pesquisa sensível de homologia iterativa, não conseguimos identificar uma PBC/PBL-homologia em cerca da metade das sequências não KNOX de Chlorophyta. Como a maioria dos genomas Chlorophyta possui um homólogo GLX e uma sequência não-KNOX sem o domínio PBL-homologia, referimos este último colectivamente à Classe B (Ficheiro adicional 3: Figura S6). As exceções foram encontradas em um clade prasinófito (classe Mamiellophyceae), cujos seis genomas de alta qualidade contêm todos duas seqüências não-KNOX sem o domínio PBL-homológico. No entanto, estas sequências não-NOX formaram dois grupos, um mais conservado e o outro menos conservado e polifilético, referentes às classes Mam-A e Mam-B, respectivamente (arquivo adicional 3: Figuras S7, S8). Considerando a evolução do genoma redutor das Mamiellophyceae , a classe Mam-A conservada pode ser derivada de uma classe GLX ancestral.

Duas classes divergentes não KNOX em Chlorophyta levaram a uma questão crítica sobre suas redes diádicas. Estudos anteriores tinham mostrado que os heterodímeros TALE exigiam interação entre domínios MEIS e PBC em animais e entre domínios KNOX e PBL em Chlamydomonas . Foi, portanto, previsto que todos os TALEs Glaucophyta e Rhodophyta formam heterodímeros através de seus domínios KNOX e PBL-homologia. Por outro lado, ficou por testar se os TALEs de Clorofita sem domínio PBL podem formar heterodímeros com outros TALEs.

Para caracterizar a rede de interação das proteínas da classe TALE em Chlorophyta, selecionamos três espécies de prasinófitas para ensaios de interação proteína-proteína: duas espécies contendo os genes Mam-A e Mam-B (Micromonas commoda e Ostreococcus tauri), e outra espécie (Picocystis salinarum), cujo transcriptoma continha uma sequência GLX e uma Classe-B. Nas três espécies, constatamos que os homólogos KNOX interagiram com todas as proteínas não KNOX examinadas em Mam-A, Mam-B, Classe-B e classe GLX (Fig. 4a-c). Não foi observada interação entre as duas proteínas não-KNOX em nenhuma das três espécies (Fig. 4a-c). Similar à heterodimerização GLX-KNOX, Mam-A e Mam-B também exigiram domínios adicionais fora do homeodomínio para sua heterodimerização com os homólogos KNOX (arquivo adicional 3: Figura S9). Estes resultados mostraram que todos os TALEs divergentes não KNOX mantiveram sua atividade original para formar heterodímeros com os homólogos KNOX. A rede de interação observada entre as sequências TALE está resumida no arquivo adicional 3: Figura S10.

Fig. 4

TALE TFs se envolvem em redes de heterodimerização entre grupos KNOX e não KNOX. As construções de iscas conjugadas com o domínio GAL4 DNA-binding (DBD) e as construções de presas conjugadas com o domínio GAL4 transcriptional activation domain (AD) estão listadas na tabela. As combinações de construção, numeradas de 1 a 8, estão dispostas em cunhas em sentido horário, a partir das 9 horas, como etiquetadas nos painéis -LT. Os pares de interação confirmados são mostrados em negrito na tabela. O par Lamininin e T-Antigen (T-Ag), conhecido por ser um parceiro interativo, foi plaqueado no 8º setor como um controle positivo. a Ensaios usando M. commoda TALEs. b Ensaios usando O. tauri TALEs. c Ensaios usando P. salinarum TALEs. KNOX-tr refere-se à construção N-terminal truncado KNOX para prevenir a auto-ativação. d Informações detalhadas de construção são fornecidas no arquivo adicional 1: Tabela S5

TALE heterodimerização evoluiu cedo na história eucariótica

Nossa descoberta da PBC-homologia em Archaeplastida sugere ancestralidade comum dos TALES heterodimerizadores entre Metazoa e Archaeplastida. Também previu que outras linhagens eucarióticas poderiam possuir TALEs com a PBC-homologia. Fora dos animais, a base de dados da Pfam contém apenas duas sequências de domínio PBC-B, uma de uma espécie Cryptophyta (Guillardia theta, ID:137502) e outra de uma espécie Amoebozoa (Acanthamoeba castillian, ID:XP_004342337) . Examinamos ainda o grupo Excavata, próximo à raiz posicionada da filogenia eucariótica. Uma pesquisa de dois genomas (Naegleria gruberi e Bodo salans) coletou 12 sequências de homeobox TALE em N.gruberi, e nenhuma em B.salans, das quais encontramos uma com domínio de PBC-homologia (ID:78561, Fig. 3a) e outra com domínio de MEIS/KNOX-homologia (ID:79931, arquivo adicional 3: Figura S2). Pesquisamos genomas adicionais na Amorphea e encontramos a PBC-homologia e a MEIS/KNOX-homologia nas sequências TALE coletadas de Apusozoa, Ichtyhosporea e Choanoflagellata mas não de Fungi (arquivo adicional 3: Figuras S11-S14). Nossos dados sugerem que os domínios de heterodimerização – PBC-homologia e MEIS/KNOX-homologia – tiveram origem precoce na evolução eucariótica e persistiram ao longo das principais radiações eucarióticas.

Intron-retenção suporta a evolução paralela das classes TALE heterodiméricos durante as radiações eucarióticas

A presença onipresença onipresente de TALES diádicos levantou a próxima questão: São todos os TALEs diádicos relatados neste estudo os descendentes de um único díade ancestral, ou resultam da evolução específica da linhagem de um único TALE prototípico (proto-TALE) que não se envolve em heterodimerização. Para sondar a ancestralidade profunda, examinamos a intron-retenção, sendo esta considerada como um caráter há muito preservado e menos propenso a ocorrer por homoplasia (um caráter exibido por um conjunto de espécies mas não presente em seu ancestral comum). Cinco posições de intron foram compartilhadas por pelo menos duas classes TALE, das quais os introns 44/45 e 48(2/3) se qualificaram como as mais ancestrais, uma vez que foram encontradas em todo o Archaeplastida e Metazoa (arquivo adicional 3: Figura S5).

Os introns 44/45 e 48(2/3) mostraram uma intrigante distribuição exclusiva entre os dois parceiros diádicos de cada filo: um possui o 44/45 e o outro possui o intron 48(2/3) (Arquivo adicional 3: Figura S5). Este padrão mutuamente exclusivo sugeriu que dois genes TALE com posições distintas de intron existiam no início da radiação eucariótica. Consideramos a posição do intron 44/45 como a mais ancestral, dado que foi conservada na maioria dos genes não-TALE homeobox . A este respeito, especulamos que a aquisição do 48(2/3), e perda do intrão 44/45, acompanhou um evento precoce no qual o proto-TALE com o intrão 44/45 foi duplicado para gerar um segundo TALE com o intrão 48(2/3). Como a posição do intron 48(2/3) foi encontrada dentro dos genes do grupo KNOX/MEIS em Viridiplantae e Metazoa e também nos genes do grupo PBX em Rhodophyta e Cryptophyta, podemos especular que os TALEs duplicados surgiram cedo e diversificados para estabelecer configurações heterodiméricas de linhagem específica durante as radiações eucarióticas. Alternativamente, a posição do intron 48(2/3) no homeodomínio TALE pode ter sido adquirida muitas vezes durante as radiações eucarióticas.

Dado que os TALEs heterodiméricos evoluíram de forma linhagem-específica, perguntamos como era o proto-TALE no momento em que foi submetido à duplicação. As observações seguintes sugerem que o proto-TALE era uma proteína homodimerizadora. Primeiro, os domínios PBC-homologia das proteínas da classe PBX/GLX identificadas no Archaeplastida incluem o MEINOX-motif que foi originalmente definido pela sua semelhança com os domínios MEIS/KNOX-homologia (Fig. 3) . Em segundo lugar, as seqüências PBX-Glauco possuem a ELK-homologia dentro de seu domínio PBL (Fig. 3), que se alinham bem com os domínios ELK das seqüências da classe KNOX em Viridiplantae (arquivo adicional 3: Figura S15). Portanto, o MEINOX-motif e ELK-homologia através da heterodimerização dos grupos KNOX e PBX suportou a origem comum dos grupos TALE heterodimerizadores a partir de um único TALE por duplicação seguida de subfuncionalização.

Similar Posts

Deixe uma resposta

O seu endereço de email não será publicado.