El otro día mantenía una conversación con un amigo mío que tenía cierta formación en informática. La conversación derivó hacia mi investigación y surgió la siguiente pregunta: ¿Cuál es la cantidad de información digital almacenada en un genoma humano? Empecé a buscar en los oscuros rincones de mi cerebro, pero me di cuenta de que simplemente no sabía la respuesta. Así que decidí hacer cuentas para estimar cuánta información se almacena en nuestro genoma.
Planificando la capacidad de almacenamiento de información del genoma
El genoma humano contiene la información genética completa del organismo como secuencias de ADN almacenadas en 23 cromosomas (22 cromosomas autosómicos y un cromosoma sexual X o Y), estructuras que se organizan a partir de ADN y proteínas. Una molécula de ADN consta de dos hebras que forman la icónica «escalera retorcida» de doble hélice, cuya columna vertebral, formada por moléculas de azúcar y fosfato, está conectada por peldaños de bases que contienen nitrógeno. El ADN está compuesto por 4 bases diferentes: Adenina (A), Timina (T), Citosina (C) y Guanina (G). Estas bases siempre están emparejadas de forma que la Adenina se conecta con la Timina y la Citosina con la Guanina. Estos emparejamientos producen 4 posibilidades de pares de bases diferentes: A-T, T-A, G-C y C-G. El genoma humano haploide (que contiene sólo una copia de cada cromosoma) consta de unos 3.000 millones de estos pares de bases agrupados en 23 cromosomas. Un ser humano hereda dos conjuntos de genomas (uno de cada progenitor) y, por tanto, dos conjuntos de cromosomas, lo que supone un total de 46 cromosomas, que representan el genoma diploide, que contiene unos 6×10^9 pares de bases.
Comparación del genoma con el almacenamiento de datos en un ordenador
Para representar una secuencia de ADN en un ordenador, tenemos que ser capaces de representar las 4 posibilidades de pares de bases en formato binario (0 y 1). Estos bits 0 y 1 suelen agruparse para formar una unidad mayor, siendo la más pequeña un «byte» que representa 8 bits. Podemos denotar cada par de bases utilizando un mínimo de 2 bits, lo que da lugar a 4 combinaciones de bits diferentes (00, 01, 10 y 11). Cada combinación de 2 bits representaría un par de bases de ADN. Un solo byte (u 8 bits) puede representar 4 pares de bases de ADN. Para representar todo el genoma humano diploide en términos de bytes, podemos realizar los siguientes cálculos:
6×10^9 pares de bases/genoma diploide x 1 byte/4 pares de bases = 1,5×10^9 bytes o 1,5 Gigabytes, ¡unos 2 CDs de espacio! O lo suficientemente pequeño como para que quepan 3 genomas separados en un DVD estándar!
Almacenamiento de datos en todo el organismo
Se podrían plantear algunas preguntas interesantes. Por ejemplo, ¿cuántos megabytes de datos genéticos se almacenan en el cuerpo humano? Para simplificar, ignoremos el microbioma (todas las células no humanas que viven en nuestro cuerpo) y centrémonos sólo en las células que componen nuestro cuerpo. Se calcula que el número de células del cuerpo humano oscila entre 10 y 100 billones. Tomemos 100 billones de células como la estimación generalmente aceptada. ¡Entonces, dado que cada célula diploide contiene 1,5 GB de datos (esto es muy aproximado, ya que sólo estoy contabilizando las células diploides e ignorando los espermatozoides y óvulos haploides de nuestro cuerpo), la cantidad aproximada de datos almacenados en el cuerpo humano es:
1,5 Gbytes x 100 billones de células = 150 billones de Gbytes o 150×10^12 x 10^9 bytes = 150 Zettabytes (10^21)!
Intercambio de información sexual
En la misma línea, ¿cuántos datos genéticos se intercambian durante la reproducción humana? Cada espermatozoide de un varón humano es heterogamético y haploide, lo que significa que contiene sólo uno de los dos cromosomas sexuales (X o Y) y sólo un conjunto de los 22 cromosomas autosómicos. Así, cada espermatozoide contiene unos 3.000 millones de bases de información genética, lo que representa 750 Mbytes de información digital. La eyaculación humana media contiene unos 180 millones de espermatozoides. ¡¡¡¡Es decir, 180 x 10^6 células haploides x 750 Mbytes/célula haploide = 135 x10^9 Mbytes=135000 Terabytes!!!! Siguiendo esta idea aún más, mientras se transfieren 13500 Tbytes, sólo un espermatozoide se fusionará con un óvulo, utilizando sólo 750 Mbytes de datos, combinándolos con otros 750 Mbytes de datos del óvulo. Por lo tanto, esencialmente el 99,9999…% de los datos transferidos durante la reproducción sexual se pierden en la tubería… Si la fracción restante de información resultará en algo constructivo depende de la buena crianza.
Habiendo calculado los números anteriores, se pueden plantear un montón de otras preguntas curiosas. ¿Te has preguntado alguna vez por la capacidad de datos de nuestro organismo biológico? ¿Cuál es la velocidad de transmisión de datos durante la división celular? ¿Cuál es la velocidad de transmisión de datos durante la fusión de gametos? ¿Cuál es la velocidad de transmisión de datos cuando los linfocitos humanos circulan por el torrente sanguíneo? ¿Qué cantidad de datos se destruyen diariamente por apoptosis? ¿Qué cantidad de datos se crea diariamente? ¿Cómo se compara esto con la tasa de transferencia de datos a través de una fibra óptica?
Por favor, siéntase libre de contribuir con sus propios cálculos dudosos y preguntas a continuación!
¿Le ha ayudado esto? Entonces, por favor, comparte con tu red.