Hoeveel informatie zit er in het menselijk genoom?

author
3 minutes, 56 seconds Read

Onlangs had ik een gesprek met een vriend van me die enige achtergrond in de informatica had. Het gesprek verplaatste zich naar mijn onderzoek en de volgende vraag kwam ter sprake: Wat is de hoeveelheid digitale informatie die is opgeslagen in een menselijk genoom? Ik begon te zoeken in de diepe donkere hoeken van mijn hersenen, maar ik realiseerde me dat ik het antwoord gewoon niet wist. Dus besloot ik te gaan rekenen om te schatten hoeveel informatie er in ons genoom is opgeslagen.

De informatieopslagcapaciteit van het genoom in kaart gebracht

Het menselijk genoom bevat de volledige genetische informatie van het organisme in de vorm van DNA-sequenties die zijn opgeslagen in 23 chromosomen (22 autosomale chromosomen en één X- of Y-geslachtschromosoom), structuren die zijn georganiseerd uit DNA en eiwitten. Een DNA-molecule bestaat uit twee strengen die de iconische dubbele helix “gedraaide ladder” vormen, waarvan de ruggengraat, die bestaat uit suiker- en fosfaatmoleculen, is verbonden door sporten van stikstofhoudende basen. DNA is samengesteld uit 4 verschillende basen: Adenine (A), Thymine (T), Cytosine (C), en Guanine (G). Deze basen zijn altijd zo gekoppeld dat Adenine zich verbindt met Thymine, en Cytosine met Guanine. Deze paringen leveren 4 verschillende basenparen op: A-T, T-A, G-C, en C-G. Het haploïde menselijk genoom (dat slechts 1 kopie van elk chromosoom bevat) bestaat uit ruwweg 3 miljard van deze basenparen, gegroepeerd in 23 chromosomen. Een mens erft twee sets genomen (één van elke ouder), en dus twee sets chromosomen, voor een totaal van 46 chromosomen, die het diploïde genoom vertegenwoordigen, dat ongeveer 6×10^9 basenparen bevat.

Vergelijking van het genoom met de opslag van computergegevens

Om een DNA-sequentie op een computer weer te geven, moeten we in staat zijn alle 4 basenpaarmogelijkheden in een binair formaat (0 en 1) weer te geven. Deze 0 en 1 bits worden gewoonlijk gegroepeerd om een grotere eenheid te vormen, waarbij de kleinste een “byte” is die 8 bits vertegenwoordigt. We kunnen elk basenpaar aanduiden met een minimum van 2 bits, wat 4 verschillende bitcombinaties oplevert (00, 01, 10, en 11). Elke combinatie van 2 bits vertegenwoordigt één DNA-basenpaar. Een enkele byte (of 8 bits) kan 4 DNA-basenparen vertegenwoordigen. Om het volledige diploïde menselijke genoom in termen van bytes weer te geven, kunnen we de volgende berekeningen uitvoeren:

6×10^9 basenparen/diploïd genoom x 1 byte/4 basenparen = 1,5×10^9 bytes of 1,5 Gigabytes, ongeveer 2 CD’s aan ruimte! Of klein genoeg om 3 afzonderlijke genomen op een standaard DVD te zetten!

Gegevensopslag over het hele organisme

Er zouden interessante vragen kunnen volgen. Bijvoorbeeld, hoeveel megabytes aan genetische gegevens zijn opgeslagen in het menselijk lichaam? Laten we gemakshalve het microbioom (alle niet-menselijke cellen die in ons lichaam leven) buiten beschouwing laten en ons alleen richten op de cellen waaruit ons lichaam is opgebouwd. Schattingen van het aantal cellen in het menselijk lichaam lopen uiteen van 10 biljoen tot 100 biljoen. Laten we uitgaan van 100 triljoen cellen als de algemeen aanvaarde schatting. Uitgaande van de veronderstelling dat elke diploïde cel 1,5 GB aan gegevens bevat (dit is zeer bij benadering, aangezien ik alleen rekening houd met de diploïde cellen en de haploïde sperma- en eicellen in ons lichaam buiten beschouwing laat), bedraagt de hoeveelheid gegevens die in het menselijk lichaam is opgeslagen bij benadering:

1,5 Gbytes x 100 triljoen cellen = 150 triljoen Gbytes of 150×10^12 x 10^9 bytes = 150 Zettabytes (10^21)!

Seksuele informatie-uitwisseling

Over hetzelfde onderwerp: hoeveel genetische gegevens worden tijdens de menselijke voortplanting uitgewisseld? Elke spermacel in een menselijke man is heterogametisch en haploïd, wat betekent dat hij slechts één van de twee geslachtschromosomen (X of Y) bevat en slechts één set van de 22 autosomale chromosomen. Elk sperma bevat dus ongeveer 3 miljard basen genetische informatie, wat neerkomt op 750 Mbytes aan digitale informatie. Een gemiddeld menselijk ejaculaat bevat ongeveer 180 miljoen zaadcellen. Dat is dus 180 x 10^6 haploïde cellen x 750 Mbytes/haploïde cel = 135 x10^9 Mbytes=135000 Terabytes!!!! Dit idee nog verder volgend, terwijl 13500 Tbytes worden overgedragen, zal slechts één zaadcel samensmelten met een eicel, waarbij slechts 750 Mbytes aan gegevens worden gebruikt, die worden gecombineerd met nog eens 750 Mbytes aan gegevens van de eicel. In wezen gaat dus 99,9999…% van de tijdens de geslachtelijke voortplanting overgedragen gegevens verloren in de pijplijn… Of de resterende fractie van informatie ook maar iets constructiefs oplevert, is een kwestie van goed opvoeden.

Nadat we bovenstaande getallen hebben uitgewerkt, kunnen we ons een heleboel andere merkwaardige vragen stellen. Heeft u zich ooit afgevraagd wat de datacapaciteit van ons biologisch organisme is? Wat is de snelheid van datatransmissie tijdens celdeling? De snelheid van datatransmissie tijdens gametenfusie? Hoe snel worden gegevens doorgegeven wanneer menselijke lymfocyten door de bloedbaan circuleren? Welke hoeveelheid gegevens wordt dagelijks vernietigd door apoptose? Hoeveel gegevens worden er dagelijks gecreëerd? Hoe verhoudt zich dit tot de snelheid van gegevensoverdracht via een optische vezel?

Voel je vrij om je eigen dubieuze berekeningen en vragen hieronder bij te dragen!

Heeft dit je geholpen? Deel het dan met uw netwerk.

Geschreven door Yevgeniy Grigoryev

Similar Posts

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.