Hvor mange oplysninger er der gemt i det menneskelige genom?

author
4 minutes, 4 seconds Read

Forleden dag havde jeg en samtale med en af mine venner, som havde en vis baggrund inden for datalogi. Samtalen kom til at dreje sig om min forskning, og følgende spørgsmål kom op: Hvad er mængden af digital information, der er lagret i et menneskeligt genom? Jeg begyndte at søge i de dybe mørke hjørner af min hjerne, men det gik op for mig, at jeg simpelthen ikke kendte svaret. Så jeg besluttede mig for at regne på, hvor meget information der er lagret i vores genom.

Opgørelse af genomets informationslagringskapacitet

Det menneskelige genom indeholder hele organismens genetiske information som DNA-sekvenser, der er lagret i 23 kromosomer (22 autosomale kromosomer og et X- eller Y-kønskromosom), strukturer, der er organiseret af DNA og protein. Et DNA-molekyle består af to strenge, der danner den ikoniske dobbelthelix “snoet stige”, hvis rygrad, som består af sukker- og fosfatmolekyler, er forbundet af trin af nitrogenholdige baser. DNA er sammensat af 4 forskellige baser: Adenin (A), thymin (T), cytosin (C) og guanin (G). Disse baser er altid parret på en sådan måde, at Adenin forbindes med Thymin, og Cytosin forbindes med Guanin. Disse pardannelser giver 4 forskellige muligheder for basepar: A-T, T-A, G-C og C-G. Det haploide menneskelige genom (der kun indeholder 1 kopi af hvert kromosom) består af ca. 3 milliarder af disse basepar, der er fordelt på 23 kromosomer. Et menneske arver to sæt genomer (et fra hver forælder) og dermed to sæt kromosomer, hvilket giver i alt 46 kromosomer, der repræsenterer det diploide genom, som indeholder ca. 6×10^9 basepar.

Sammenligning af genomet med datalagring på en computer

For at kunne repræsentere en DNA-sekvens på en computer skal vi kunne repræsentere alle 4 baseparmuligheder i et binært format (0 og 1). Disse 0- og 1-bits er normalt grupperet sammen til en større enhed, hvor den mindste er en “byte”, der repræsenterer 8 bits. Vi kan betegne hvert basepar ved hjælp af mindst 2 bits, hvilket giver 4 forskellige bitkombinationer (00, 01, 10 og 11). Hver 2-bit kombination repræsenterer ét DNA-basepar. En enkelt byte (eller 8 bit) kan repræsentere 4 DNA-basepar. For at repræsentere hele det diploide menneskelige genom i form af bytes kan vi foretage følgende beregninger:

6×10^9 basepar/diploidt genom x 1 byte/4 basepar = 1,5×10^9 bytes eller 1,5 gigabyte, dvs. ca. 2 cd’er, der er plads til! Eller lille nok til at få plads til 3 separate genomer på en standard-DVD!

Datalagring på tværs af hele organismen

Der kunne følge nogle interessante spørgsmål. Hvor mange megabyte genetiske data er der f.eks. gemt i menneskekroppen? Lad os for enkelhedens skyld se bort fra mikrobiomet (alle ikke-menneskelige celler, der lever i vores krop) og kun fokusere på de celler, der udgør vores krop. Antallet af celler i menneskekroppen anslås til at ligge mellem 10 billioner og 100 billioner. Lad os tage 100 trillioner celler som det generelt accepterede skøn. Så eftersom hver diploid celle indeholder 1,5 GB data (dette er meget omtrentligt, da jeg kun tager højde for de diploide celler og ignorerer de haploide sæd- og ægceller i vores krop), er den omtrentlige mængde data, der er lagret i menneskekroppen:

1,5 Gbyte x 100 billioner celler = 150 billioner Gbyte eller 150×10^12 x 10^9 bytes = 150 Zettabytes (10^21)!!!

Kønslig informationsudveksling

Hvor mange genetiske data udveksles der i forbindelse med den menneskelige reproduktion?Hver sædcelle i en menneskelig mand er heterogame og haploid, hvilket betyder, at den kun indeholder et af de to kønskromosomer (X eller Y) og kun et sæt af de 22 autosomale kromosomer. Hver sædcelle indeholder således ca. 3 milliarder baser af genetisk information, hvilket svarer til 750 MByte digital information. Et gennemsnitligt menneskeligt ejakulat indeholder ca. 180 millioner sædceller. Det er altså 180 x 10^6 haploide celler x 750 Mbytes/haploid celle = 135 x10^9 Mbytes=135000 terabytes!!!! Hvis vi følger denne idé endnu længere, vil kun én sædcelle fusionere med et æg, mens der overføres 13500 Tbytes, og der vil kun blive brugt 750 Mbytes data, som kombineres med yderligere 750 Mbytes data fra ægget. Således går stort set 99,9999…% af de data, der overføres under den seksuelle forplantning, tabt på vejen … Om den resterende brøkdel af information vil resultere i noget konstruktivt er op til gode forældre.

Når man har regnet ovenstående tal ud, kan man stille en hel række andre nysgerrige spørgsmål. Har du nogensinde undret dig over vores biologiske organismes datakapacitet? Hvad er dataoverførselshastigheden under celledeling? Hastigheden af datatransmission under kønscellefusionen? Hvor hurtigt data overføres, når menneskelige lymfocytter cirkulerer i blodbanen? Hvor stor en mængde data ødelægges dagligt ved apoptose? Hvor mange data skabes dagligt? Hvordan kan dette sammenlignes med dataoverførselshastigheden via en optisk fiber?

Du er velkommen til at bidrage med dine egne tvivlsomme beregninger og spørgsmål nedenfor!

Har dette hjulpet dig? Så del gerne med dit netværk.

Skrevet af Yevgeniy Grigoryev

Similar Posts

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.