Transcrição
Transcrição é a transferência de informação genética do DNA para o RNA, usando o DNA como modelo. A síntese de proteínas ocorre em ribossomos.
O que é um gene? Em um nível, um gene é uma cadeia ordenada de nucleotídeos que codifica um polipéptido. Tais genes são genes “estruturais”. Nós também sabemos que genes também podem codificar RNA, incluindo RNA mensageiro (mRNA), RNA de transferência (tRNA), RNA ribossômico (rRNA), assim como outros tipos de RNA. Mas algo tem que ligar e terminar a expressão gênica, assim como regulá-la. As sequências reguladoras, que podem ser “promotores” ou “melhoradores/silenciadores”, podem estar atrasadas, longe das regiões codificadoras. Portanto, agora nossa visão de um gene deve incluir a idéia de regiões separadas de um cromossomo. E se a informação transcrita para o mRNA não reflectir a proteína final até que seja modificada posteriormente? Isto é “modificação pós-transcrítica”. Agora o conceito de um gene está se tornando ainda mais nublado. E se existirem “sobreposições” de regiões codificadoras? Claramente a nossa definição de um gene não vai ser um gene simples.
Funcionalmente, porém, podemos descrever um gene como tendo uma região codificadora distinta e uma região reguladora distinta, esta última controlando a taxa na qual o DNA é transcrito em mRNA. Veremos que as unidades reguladoras são compostas por “motivos” de DNA e que cada motivo terá de ser ocupado por uma proteína reguladora para que um gene possa ser regulado adequadamente. Não só deve haver a ligação apropriada da proteína, mas as proteínas têm de se encaixar com as proteínas que se ligam a outros motivos próximos na forma em que as peças do quebra-cabeças se encaixam. E só há uma forma correcta de encaixar para sempre. Portanto, não se trata apenas de uma simples questão de síntese de ADN directingmRNA, que depois dirige a síntese proteica; as proteínas estão intrinsecamente envolvidas na regulação da produção de proteínas ao nível da transcrição.
Temos também de considerar uma diferença importante entre eucariotas e procariotas no que diz respeito à transcrição de genes estruturais, ou codificadores de proteínas. Em eucariotas, os genes são transcritos individualmente, enquanto inprokaryotes, genes com funções relacionadas (“operons”) podem ser transcritos juntos. Como exemplo, o operon Lac inclui genes codificadores de três proteínas, bem como as suas sequências de controlo. O operão é transcrito como uma única unidade como um “mRNA policistrônico”. Os genes eucarióticos estruturais são transcritos como mRNA monocistrônico.
Síntese do RNA direcionado por DNA
Existem três passos que caracterizam a síntese do RNA direcionado por DNA:
(1) Iniciação por ligação do aparelho de transcrição ao modelo de ADN
(2) Alongamento da cadeia do mRNA
(3) Terminação da cadeia do mRNA
O pedaço de mRNA que resulta da transcrição directa do ADN que codifica um “gene” é chamado de “transcrição primária” e que não é modificado, por vezes de forma extensiva, antes de poder traduzir a sua mensagem em proteína.
A classe de enzimas que sintetizam RNAs são conhecidas como polimerases de RNA. São todos complexos multisubunidades que estão presentes em todas as células e catalisam a reacção:
(RNA)nresidues + 1 NTP === (RNA)n+1 resíduos + PPi
Pirofosfato é irreversivelmente hidrolisado a 2 Pi conduzindo assim à sua acção para a direita. Os nucleotídeos individuais que são lidos da cadeia de DNA são transcritos para os nucleotídeos do RNA correspondente, portanto o resultado final é um polímero de cadeia única, ou seja, o mRNA, cujos nucleotídeos correspondem exatamente aos nucleotídeos complementares no DNAstrand, com a exceção de que em todos os lugares em que um “A” aparece na cadeia do modelo de DNA, um “U” aparece no mRNA. (Os possíveisNTPs, então, são ATP,CTP,GTP,UTP.)
Transcrição em Prokaryotes
A polimerase de RNA mais estudada é a de E.coli, portanto estudaremos como protótipo das polimerases de RNA. A holoenzima é uma proteína de 449 kD composta por uma “enzima núcleo” e uma “s-subunidade”, e todo o complexo é denotado (núcleo)s. A enzima core dirige a reação de polimerização, e tem 4 subunidades: core enzyme = a2bb’w. Os íons inorgânicos Zn2+ (dois deles na subunidade b’s) e Mg2+ são necessários para a atividade catalítica e a estrutura tridimensional da enzima se assemelha a uma mão. O polegar da mão pode ser invejado como se estivesse segurando um pedaço de DNA B que se encontra num canal representado pelos dedos curvos e pela palma da mão. Este canal é cilíndrico, com dimensões na ordem de 25 A por 55 A. Estas dimensões permitem um ajuste de cerca de 16 pares básicos de DNA B.
A estrutura da “mão” aparece em outras enzimas que iremos estudar, incluindo DNA polimerase e transcriptase reversa. Você pode estudar a estrutura da mão da RNA polimerase olhando para T7 RNA polimerase (veja PDB abaixo).
1ARO: T7 RNA polimerase
Vemos a transcrição do ponto de vista do gene, que já mencionamos ser uma entidade bastante ambígua. No entanto, é claro que deve haver um ponto de partida para que a transcrição correta ocorra, e é razoável incluí-la como parte do gene, mesmo que ela não se esqueça de transcritas. Portanto, o problema da iniciação é realmente um problema de reconhecimento de um ponto de partida. Mas qual das duas vertentes do ADN serve como modelo e como é que a polimerase escolhe?
A qualquer uma das vertentes pode servir como modelo, mas a transcrição procede sempre da extremidade de 5′ de uma vertente de ADN para a extremidade de 3′. A cadeia de 3′-5′ que serve como modelo é chamada de cadeia “antisense” ou não-codificadora e a cadeia de 5′-3′ (que tem a mesma sequência nucleotídica, com excepção de “U “s para “T “s, como o mRNA subsequentemente transcrito) é a cadeia “sense” ou “coding”. Para ser consistente e claro, usaremos a convenção que nossa descrição de posição ao longo de uma seqüência de nucleotídeos será do ponto de vista da cadeia de sentido, pois esta é a mesma ordem do mRNA que é transcrito. A parte do gene que conserva como local de iniciação é chamada de “promotor” e é procurada pela holoenzima da polimerase do RNA. A holoenzima liga-se fracamente ao ADN, com um Kdissoc de cerca de 10-7 M, o que lhe permite mover-se ao longo da vertente antisense em busca do promotor. A ssubunidade é específica para a sua sequência promotora e ocorre uma ligação apertada da holoenzima (Kdissoc de cerca de 10-14 M).
O promotor é reconhecido por uma sequência de aproximadamente 40 bp nucleotídeos no lado de 5′ do local de iniciação, e dentro desta sequência estão duas sequências “conservadas”. Uma delas tem 6 bp de comprimento e é centrada a cerca de 10 bps a montante do local de início da transcrição. Esta é a “Caixa de Pribnow” e tem uma sequência de consenso TATAAT. A outra sequência, menos conservada, está centrada a cerca de 35 bpupstream e tem uma sequência de consenso TTGACA. O local de início é indicado pela notação +1 e é quase sempre Aou G. O local de início é indicado pela notação +1 e é quase sempre Aor G.
RNA polimerase holoenzima entra em contato com o promotor em aproximadamente os centros das duas regiões (-10 e -35) e a enzima do núcleo se liga firmemente ao DNA duplex. Sua ação é a de derreter o DNA de dupla cadeia ao longo de uma seqüência de cerca de 11 bps, de -9 a +2. O fator s divide a transcrição.
São os fatores s específicos dentro de uma célula que determinam quais genes serão transcritos. Assim os tipos de células individuais são caracterizados pelos seus factores s.
O alongamento da cadeia prossegue na direção 5′–>3′, e a “bolha de transcrição” (o comprimento do DNA “derretido”) viaja com a RNA polimerase. Como conseqüência, o DNA não derretido é sobreposto ao da bolha e é ferido por trás da bolha. As topoisomerases então atuam como torelax das super bobinas positivas e negativas. O mRNA que é produzido é hibridizado por um curto comprimento para o DNA na posição a jusante, e existe separado do DNA como uma “cauda”, sendo o ponto de fixação na extremidade a jusante. A RNA polimerase não cai do DNA, pois está sendo processada devido à sua ligação relativamente apertada, mas inespecífica, nos lados da bolha de transcrição, estabilizada pelo seu “polegar” que envolve o DNA. Cerca de 20 a 50 nucleotídeos são transcritos por segundo a 37 C e um nucleotídeo é transcrito incorretamente em cerca de 104 a cada 104 . Como os genes são transcritos repetidamente, esta taxa de erro não é muito deletéria, especialmente quando acoplada ao fato de que há múltiplos códons (“sinônimos”) para cada aminoácido subseqüentemente traduzido e que os erros de substituição de aminoácidos em uma proteína geralmente não impedem a sua função.
Transcrição em eucariotas:
Embora muito semelhante à de procariotas, a “maquinaria” e as sequências de controlo da transcrição em eucariotas é muito mais complexa, e existem numerosas polimerases de RNA.
RNAibosomal (rRNA) constitui cerca de 95% de todo o RNA e cerca de 67% do RNA em ribossomas. O restante do RNA inclui RNA de transferência (tRNA), RNA de mensageiro (mRNA) e outros tipos presentes em quantidades menores, como os RNAs “smallnuclear” (snRNAs) envolvidos na emenda do mRNA e os RNAs “guia” que estão envolvidos na edição do RNA. Estes dois últimos processos ocorrem na tradução pósDeepL do ciclo de vida do mRNA eucariótico. Todos os RNAs são codificados pelo DNA, e os diferentes tipos de RNA polimerase em eucariotas refletem isso e o fato de que, em eucariotas, a tradução do mRNA em DNA ocorre fora do núcleo.
Precursores da maioria dos rRNA são sintetizados em núcleos com a enzima RNApolimerase I. Precursores de mRNA são sintetizados no nucleoplasma pela RNApolimerase II enquanto que a RNA polimerase III, também no nucleoplasma, sintetiza precursores de RNA 5S, tRNAs e outros RNAs encontrados tanto no núcleo quanto no citoplasma. As mitocôndrias têm suas próprias polimerases de RNA, e estes são análogos aos RNAs cloroplásticos encontrados nas plantas. Vamos focar no RNA polimerase II, pois é ele que está envolvido na transcrição em eucariotas.
Você pode olhar para a estrutura da levedura RNA polimerase II (veja o PDB abaixo) como um protótipo de sua estrutura. A forma geral da enzima é semelhante à da RNA polimerase procariótica (e DNA polimerase), nomeadamente a de uma mão com um motivo “polegar” que flanqueia um canal suficientemente grande para conter um pedaço de B-DNA (cerca de 25 A de largura).
1ENO: Levedura de RNA polimerase II
Ainda não consideramos a química do alongamento da cadeia de mRNA, mas o faremos aqui. As cadeias são alongadas na direção 5′–> 3′ pelo ataque nucleófilo do grupo 3′ OH da cadeia de crescimento pelo fosfato a do NTP que chega.
Como em procariotas, a transcrição eucariótica começa pelo reconhecimento dos propulsores. Há muitas cópias dos genes do rRNA que direcionam a síntese do rRNA, todos com sequências quase idênticas. Esta redundância assegura um suprimento adequado de rRNA que, como mencionado anteriormente, compreende cerca de 95% do RNA celular. Os promotores para estes genes quase idênticos são, portanto, idênticos, portanto a RNApolimerase I deve reconhecer apenas uma seqüência promotora. Entretanto, a RNApolimerase I é específica da espécie (RNA poly II e III não são específicos da espécie).
Para promoção do rRNA mamífero, há um “núcleo promotor” que abrange a região -31 a +6 (note que isto se sobrepõe a uma região do gene que é transcrito) e um “elemento promotor a montante” que abrange -187 a -107.
Para transcrição de genes por RNA polimerase III, o promotor é às vezes localizado em um segmento dentro da parte transcrita do gene, entre +40 e +80, mas também pode ser parcialmente upsteam ou inteiramente upstream do startite.
RNA Polimerase II Promotores e Seqüências de Controle
Seqüências promotoras para RNA polimerase II são diversas. Podemos dividi-las em duas classes: aquelas que são encontradas em genes que produzem proteínas atabout da mesma taxa em todas as células (“enzimas constitutivas”) e aquelas para genes cujas taxas de produção variam muito de um tipo celular para outro e dependem das necessidades de uma célula diferenciada em um dado momento (“enzimas induzíveis”).
Elementos Promotores dos Genes Constituintes:
A Caixa GC : Esta é uma região contendo uma ou mais cópias da seqüência GGGCGG (ou itscomplement) em um local a montante do local de início, e é análoga aos elementos promotores procarióticos.
Outros elementos promotores também são encontrados na região -50 a – 110 a montante da caixa GC.
Elementos Promotores Genéticos Selectivamente Expressos:
A Caixa TATA : Aregião localizada entre -25 a -30 que é rica nos nucleótidos “A “e “T” e que se assemelha à Caixa Pribnow (TATAAT). Genes ainda podem ser transcritos na presença de uma caixa TATA defeituosa e pensa-se que a caixa TATA está envolvida na escolha do local de início da transcrição
A caixa CCAAT : Esta é uma sequência que é frequentemente encontrada a montante da caixa TATA, localizada a cerca de -70 a -90. Estas ligam RNA polimerase II assim como outras proteínas necessárias para a iniciação da transcrição.
Sequências de Controlo para Genes Estruturais:
Outras regiões do cromossoma, algumas removidas do local inicial, podem afectar a ligação da RNA polimerase II aos elementos promotores. Estes elementos genéticos são chamados de “potenciadores” e “silenciadores”. As proteínas chamadas “ativadores” e “repressores” podem se ligar aos ativadores e silenciadores, afetando assim a ligação da polimerase aos promotores. Além disso, a mesma proteína pode funcionar como ativador ou repressor, dependendo da interação específica (fatores de transcrição de “dupla ação”).
Recrutamento de RNA Polimerase II para o Promotor:
Eukaryotes não possuem uma proteína simples que corresponda ao fator em procariotas. Pelo contrário, existe um conjunto de proteínas que, em conjunto, desempenham a mesma função que o fator s, e estes são os “fatores gerais de transcrição” (“GTFs”). Já analisamos estruturas de fatores de transcrição quando discutimos a interação DNA-proteína em uma palestra anterior. Caso contrário, os mecanismos gerais de iniciação da transcrição são semelhantes.
Existem 6 GTFs que são necessários para uma taxa de transcrição basal baixa e invariável, e esta taxa pode ser aumentada pela participação de outros fatores protéicos. Estes GTFs formam um “complexo de pré-iniciação” que começa quando a “TATA binding protein” (“TBP”) se liga à caixaTATA (se houver uma) de um promotor. A sequência específica em que itbinds identifica o local de início da transcrição. Como resultado desta ligação, o ADN é distorcido por dobras em ambas as extremidades da caixa TATA. Outros GTFs são ligados de forma ligeira, seguidos pela ligação de RNA polimerase. Finalmente, as demais GTFs se ligam.
1YTB: TBP/TATA Box Complex
Após a ligação do TBP (que é um componente da TFIID), a sequência de ligação é a seguinte
TFIIA
TFIIB
TFIIF
RNA PII
TFIIE
TFIIH
TFIIH tem duas importantes actividades enzimáticas. A primeira é uma atividade ATP-dependente-helicase que auxilia a formação de um complexo aberto e a segunda é uma atividade cinase que resulta na fosforilação da maior subunidade de RNA polimerase II em sua extremidade C-terminal. Agora o processo de alongamento de transcrição pode começar, com os vários GTFs (exceto TFIIF) dissociando-se do complexo à medida que o alongamento ocorre. A TFIID permanece vinculada ao promotor para que a transcrição repetida possa ocorrer à medida que os GTFs se remontam para formar o complexo de pré-iniciação.
Esta discussão concentrou-se na RNA polimerase II; diferentes fatores de transcrição são necessários para as RNA polimerases I e III. Entretanto, todas as três requerem TBP.
Células controlam a transcrição de cada gene individualmente. Uma uniquecombinação de silenciadores e melhoradores para cada gene modula a taxa de transcrição. Como as proteínas ativadoras e repressoras que estão ligadas longe do promotor influenciam a transcrição dos genes?
“Specificity protein 1” (Sp1) foi o primeiro fator de transcrição humana que foi encontrado que poderia reconhecer uma seqüência específica de melhoradores GCregulatory enhancer. Esta proteína tem dois módulos interessantes:
(1) Um módulo de 3 dedos de zinco em uma extremidade;
(2) Um módulo na extremidade oposta com 2 segmentos discretos ricos em Gln.
Mutantes que não têm a extremidade rica em glutamina podem se ligar ao DNA mas a transcrição não é estimulada. Portanto, a extremidade rica em glutamina deve se ligar a algo mais para que a transcrição ocorra, e estes são os “coactivadores”, também chamados de “TBP-Assicuated Factors” ou “TAFs” e há pelo menos oito deles que são importantes para a transcrição. Estes não são fatores basais (GTFs) e não se ligam a seqüências específicas de DNA. Pelo contrário, ligam-se avidamente ao TBP e proporcionam múltiplos “locais de ancoragem” aos activadores. Neste sentido, eles são “moléculas adaptadoras”. Um “kit de ferramentas” de tais moléculas adaptadoras fornece uma enorme diversidade de opções para modular a transcrição do agene. Assim, ampliando a nossa comparação anterior do complexo de pré-iniciação deGTFs com o fator procariótico, uma melhor comparação seria entre o fator s e todo o complexo de pré-iniciação de ativador-co-ativador-basal. Quanto a como este arranjo modula as influências da taxa de transcrição, é provavelmente mediado prioritariamente pela distorção do DNA que facilita o movimento da RNA polimerase II ao longo da região de codificação.
Latchman (TRENDS in Biochemical Sciences Vol. 26 No.4 April 2001) tem apontado a importância do próprio local de ligação do DNA como desempenhando um papel chave na modulação intranscripcional. O mesmo fator de transcrição pode assumir diferentes conformações como resultado se a ligação a locais diferentes. As mudanças conformacionais são induzidas pela interação DNA-proteína, aumentando assim a flexibilidade do espectro de controle da transcrição, uma vez que uma proteína pode atuar como uma coleção inteira de proteínas, cada uma tendo seu próprio efeito (ativação, inibição ou nenhum efeito).
Para levar este passo adiante, pode-se imaginar que um fenômeno semelhante pode ocorrer quando os coactivadores se ligam aos ativadores. Talvez diferentes mudanças conformacionais sejam induzidas de forma similar na proteína ligada, dependendo do tipo de interação proteína-proteína. Tais mudanças conformacionais podem então resultar na capacidade indiferente de modular a transcrição.
Os domínios de ativação dos fatores de transcrição são frequentemente ricos em glutamina, os butoteres são ricos em prolina ou ácidos. Em alguns casos, os resíduos hidrofóbicos são intercalados entre os resíduos ácidos ou glutamínicos e são importantes para a ativação. Tjian (Cell, Vol. 77, 5-8, 8 de abril de 1994) sugere que forças hidrofóbicas impulsionam a coesão dos domínios de ativação com seus alvos e que a especificidade é alcançada pela periodicidade dos elementos coesivos.
Genes são transcritos a taxas mensuráveis somente se os ativadores corretos estiverem presentes e forem capazes de superar os efeitos dos repressores.