Innego dnia prowadziłem rozmowę z moim przyjacielem, który miał pewne doświadczenie w informatyce. Rozmowa przesunęła się w kierunku moich badań i pojawiło się następujące pytanie: Jaka jest ilość informacji cyfrowych przechowywanych w ludzkim genomie? Zacząłem szukać w głębokich, ciemnych zakamarkach mojego mózgu, ale zdałem sobie sprawę, że po prostu nie znam odpowiedzi. Postanowiłem więc wykonać obliczenia matematyczne, aby oszacować, ile informacji jest przechowywanych w naszym genomie.
Określenie pojemności przechowywania informacji w genomie
Ludzki genom zawiera kompletną informację genetyczną organizmu jako sekwencje DNA przechowywane w 23 chromosomach (22 chromosomy autosomalne i jeden chromosom płci X lub Y), strukturach, które są zorganizowane z DNA i białka. Cząsteczka DNA składa się z dwóch nici tworzących ikoniczną podwójną helisę „skręconej drabiny”, której szkielet, zbudowany z cząsteczek cukru i fosforanu, połączony jest szczeblami zasad zawierających azot. DNA składa się z 4 różnych zasad: Adenina (A), Tymina (T), Cytozyna (C) i Guanina (G). Zasady te są zawsze sparowane w taki sposób, że adenina łączy się z tyminą, a cytozyna z guaniną. Te pary dają 4 różne możliwości parowania zasad: A-T, T-A, G-C i C-G. Haploidalny genom ludzki (zawierający tylko 1 kopię każdego chromosomu) składa się z około 3 miliardów takich par zasad zgrupowanych w 23 chromosomach. Człowiek dziedziczy dwa zestawy genomów (po jednym od każdego rodzica), a zatem dwa zestawy chromosomów, w sumie 46 chromosomów, reprezentujących genom diploidalny, który zawiera około 6×10^9 par zasad.
Porównanie genomu do przechowywania danych komputerowych
Aby reprezentować sekwencję DNA na komputerze, musimy być w stanie reprezentować wszystkie 4 możliwości par zasad w formacie binarnym (0 i 1). Te 0 i 1 bity są zwykle zgrupowane razem, aby utworzyć większą jednostkę, z najmniejszym jest „bajt”, który reprezentuje 8 bitów. Każdą parę zasad możemy oznaczyć używając minimum 2 bitów, co daje 4 różne kombinacje bitów (00, 01, 10 i 11). Każda 2-bitowa kombinacja reprezentuje jedną parę zasad DNA. Pojedynczy bajt (czyli 8 bitów) może reprezentować 4 pary zasad DNA. Aby przedstawić cały diploidalny genom ludzki w postaci bajtów, możemy wykonać następujące obliczenia:
6×10^9 par zasad/diploidalny genom x 1 bajt/4 pary zasad = 1,5×10^9 bajtów lub 1,5 gigabajta, czyli około 2 płyt CD wartych miejsca! Lub wystarczająco mało, by zmieścić 3 oddzielne genomy na standardowej płycie DVD!
Przechowywanie danych w całym organizmie
Kilka interesujących pytań może się pojawić. Na przykład, ile megabajtów danych genetycznych jest przechowywanych w ludzkim ciele? Dla uproszczenia zignorujmy mikrobiom (wszystkie nie-ludzkie komórki, które żyją w naszym ciele) i skupmy się tylko na komórkach, które tworzą nasze ciało. Szacunkowa liczba komórek w ludzkim ciele waha się od 10 do 100 bilionów. Przyjmijmy 100 trylionów komórek jako ogólnie przyjęte oszacowanie. Tak więc, biorąc pod uwagę, że każda diploidalna komórka zawiera 1,5 GB danych (jest to bardzo przybliżone, ponieważ liczę tylko komórki diploidalne i ignoruję haploidalne plemniki i komórki jajowe w naszym ciele), przybliżona ilość danych przechowywanych w ludzkim ciele to:
1,5 Gbajtów x 100 bilionów komórek = 150 bilionów Gbajtów lub 150×10^12 x 10^9 bajtów = 150 Zettabajtów (10^21)!!!!
Wymiana informacji seksualnych
Podobnie, ile danych genetycznych jest wymienianych podczas ludzkiej reprodukcji? Każda komórka plemnika u mężczyzny jest heterogametyczna i haploidalna, co oznacza, że zawiera tylko jeden z dwóch chromosomów płciowych (X lub Y) i tylko jeden zestaw 22 chromosomów autosomalnych. Tak więc każdy plemnik zawiera około 3 miliardów zasad informacji genetycznej, co stanowi 750 megabajtów informacji cyfrowej. Przeciętny ludzki ejakulat zawiera około 180 milionów plemników. Zatem 180 x 10^6 komórek haploidalnych x 750 MB/komórkę haploidalną = 135 x10^9 MB=135000 Terabajtów!!!! Podążając za tą ideą jeszcze dalej, podczas gdy 13500 Tbajtów jest przesyłanych, tylko jedna komórka plemnika połączy się z komórką jajową, wykorzystując tylko 750 Mbajtów danych, łącząc je z kolejnymi 750 Mbajtami danych z komórki jajowej. Tak więc, zasadniczo 99.9999…% danych przekazywanych podczas reprodukcji seksualnej jest tracona w rurociągu … Czy pozostały ułamek informacji zaowocuje czymś konstruktywnym, zależy od dobrego rodzicielstwa.
Po opracowaniu powyższych liczb, można zadać całą masę innych ciekawych pytań. Czy zastanawiałeś się kiedyś nad pojemnością danych naszego biologicznego organizmu? Jaka jest szybkość transmisji danych podczas podziału komórki? Szybkość transmisji danych podczas łączenia się gamet? Szybkość transmisji danych podczas krążenia limfocytów w krwiobiegu? Jaka ilość danych jest codziennie niszczona przez apoptozę? Jaka ilość danych jest codziennie tworzona? Jak to się ma do szybkości przesyłania danych przez światłowód?
Proszę się nie krępować i dodać swoje własne wątpliwe obliczenia i pytania poniżej!
Czy to Ci pomogło? Więc proszę podzielić się z siecią.
.