Quanta informação é armazenada no Genoma Humano?

author
4 minutes, 32 seconds Read

No outro dia eu estava tendo uma conversa com um amigo meu que tinha alguma formação em ciência da computação. A conversa se deslocou para minha pesquisa e surgiu a seguinte pergunta: Qual é a quantidade de informação digital armazenada em um genoma humano? Comecei a procurar nos cantos mais escuros do meu cérebro, mas percebi que simplesmente não sabia a resposta. Então decidi fazer as contas para estimar quanta informação é armazenada em nosso genoma.

Laying out the information storage capacity of the genome

O genoma humano contém a informação genética completa do organismo como seqüências de DNA armazenadas em 23 cromossomos (22 cromossomos autossômicos e um cromossomo sexual X ou Y), estruturas que são organizadas a partir do DNA e proteínas. Uma molécula de DNA consiste em dois fios que formam a icônica “escada torcida” de dupla hélice, cuja espinha dorsal, feita de moléculas de açúcar e fosfato, está ligada por ramificações de bases contendo nitrogênio. O ADN é composto por 4 bases diferentes: Adenina (A), Tiamina (T), Citosina (C), e Guanina (G). Estas bases são sempre emparelhadas de tal forma que a Adenina se liga à Tiamina, e a Citosina se liga à Guanina. Estes emparelhamentos produzem 4 possibilidades diferentes de pares de bases: A-T, T-A, G-C, e C-G. O genoma humano haplóide (contendo apenas 1 cópia de cada cromossoma) consiste em cerca de 3 bilhões desses pares de bases agrupados em 23 cromossomos. Um ser humano herda dois conjuntos de genomas (um de cada pai), e assim dois conjuntos de cromossomas, para um total de 46 cromossomas, representando o genoma diplóide, que contém cerca de 6×10^9 pares de bases.

Comparando o genoma com o armazenamento de dados do computador

A fim de representar uma seqüência de DNA em um computador, nós precisamos ser capazes de representar todas as 4 possibilidades de pares de bases em um formato binário (0 e 1). Estes 0 e 1 bits são normalmente agrupados para formar uma unidade maior, sendo o menor um “byte” que representa 8 bits. Podemos denotar cada par de bases usando um mínimo de 2 bits, o que produz 4 combinações diferentes de bits (00, 01, 10, e 11). Cada combinação de 2 bits representaria um par de base de ADN. Um único byte (ou 8 bits) pode representar 4 pares de bases de ADN. A fim de representar todo o genoma humano diplóide em termos de bytes, podemos realizar os seguintes cálculos:

6×10^9 pares base/ genoma diplóide x 1 byte/4 pares base = 1,5×10^9 bytes ou 1,5 Gigabytes, cerca de 2 CDs de espaço! Ou suficientemente pequeno para caber 3 genomas separados em um DVD padrão!

Armazenamento de dados em todo o organismo

Algumas questões interessantes poderiam seguir. Por exemplo, quantos megabytes de dados genéticos são armazenados no corpo humano? Para simplificar, vamos ignorar o microbioma (todas as células não humanas que vivem no nosso corpo), e focar apenas nas células que compõem o nosso corpo. As estimativas para o número de células no corpo humano variam entre 10 trilhões e 100 trilhões. Tomemos 100 trilhões de células como a estimativa geralmente aceita. Então, dado que cada célula diplóide contém 1,5 GB de dados (isto é muito aproximado, pois só estou contabilizando as células diplóides e ignorando os espermatozóides e óvulos haplóides em nosso corpo), a quantidade aproximada de dados armazenados no corpo humano é:

1,5 Gbytes x 100 trilhões de células = 150 trilhões de Gbytes ou 150×10^12 x 10^9 bytes = 150 Zettabytes (10^21)!!!

Intercâmbio de informação sexual

Durante as mesmas linhas, quantos dados genéticos são trocados durante a reprodução humana?cada espermatozóide de um macho humano é heterogéneo e haplóide, o que significa que contém apenas um de dois cromossomas sexuais (X ou Y) e apenas um conjunto dos 22 cromossomas autossómicos. Assim, cada espermatozóide contém cerca de 3 bilhões de bases de informação genética, o que representa 750 Mbytes de informação digital. A ejaculação humana média contém cerca de 180 milhões de espermatozóides. Assim, são 180 x 10^6 células haplóides x 750 Mbytes/célula haplóide = 135 x10^9 Mbytes=135000 Terabytes!!!! Seguindo ainda mais esta ideia, enquanto 13500 Tbytes são transferidos, apenas um espermatozóide se fundirá com um óvulo, usando apenas 750 Mbytes de dados, combinando-o com outros 750 Mbytes de dados do óvulo. Assim, essencialmente 99,9999…% dos dados transferidos durante a reprodução sexual são perdidos no pipeline… Se a fração restante da informação resultará em algo construtivo é até uma boa parentalidade.

Having trabalhou os números acima, todo um monte de outras perguntas curiosas podem ser feitas. Você já se perguntou sobre a capacidade de dados do nosso organismo biológico? Qual é a taxa de transmissão de dados durante a divisão celular? A taxa de transmissão de dados durante a fusão de gamete? A taxa de transmissão de dados quando os linfócitos humanos circulam através da corrente sanguínea? Qual a quantidade de dados que é destruída diariamente pela apoptose? Que quantidade de dados é criada diariamente? Como isso se compara à taxa de transferência de dados através de uma fibra óptica?

Por favor, sinta-se livre para contribuir com seus próprios cálculos duvidosos e perguntas abaixo!

Ajudou você? Então por favor partilhe com a sua rede.

Escrito por Yevgeniy Grigoryev

Similar Posts

Deixe uma resposta

O seu endereço de email não será publicado.