A minap egy informatikai háttérrel rendelkező barátommal beszélgettem. A beszélgetés a kutatásomra terelődött, és a következő kérdés merült fel: Mennyi az emberi genomban tárolt digitális információ mennyisége? Elkezdtem kutatni az agyam mély, sötét zugaiban, de rájöttem, hogy egyszerűen nem tudom a választ. Ezért elhatároztam, hogy matematikailag megbecsülöm, mennyi információt tárol a genomunk.
A genom információtárolási kapacitása
Az emberi genom a szervezet teljes genetikai információját tartalmazza, 23 kromoszómában (22 autoszomális kromoszómában és egy X vagy Y nemi kromoszómában) tárolt DNS-szekvenciák formájában, DNS-ből és fehérjéből szerveződő struktúrákban. A DNS-molekula két szálból áll, amelyek az ikonikus kettős spirál “csavart létrát” alkotják, amelynek cukor- és foszfátmolekulákból álló gerincét nitrogéntartalmú bázisok lépcsőfokai kötik össze. A DNS 4 különböző bázisból áll: Adenin (A), timin (T), citozin (C) és guanin (G). Ezek a bázisok mindig úgy vannak párosítva, hogy az adenin a timinnel, a citozin pedig a guaninnal kapcsolódik. Ezek a párosítások 4 különböző bázispárosítási lehetőséget eredményeznek: A-T, T-A, G-C és C-G. A haploid emberi genom (amely minden kromoszómából csak 1 példányt tartalmaz) nagyjából 3 milliárd ilyen bázispárból áll, 23 kromoszómába csoportosítva. Az ember két genomkészletet örököl (mindkét szülőtől egyet-egyet), és így két kromoszómakészletet, összesen 46 kromoszómát, ami a diploid genomot jelenti, amely körülbelül 6×10^9 bázispárt tartalmaz.
A genom összehasonlítása a számítógépes adattárolással
A DNS-szekvencia számítógépes ábrázolásához mind a 4 bázispár lehetőségét bináris formában (0 és 1) kell tudnunk ábrázolni. Ezeket a 0 és 1 biteket általában nagyobb egységgé csoportosítják, a legkisebb egy “bájt”, amely 8 bitet képvisel. Minden bázispárt legalább 2 bit használatával jelölhetünk, ami 4 különböző bitkombinációt eredményez (00, 01, 10 és 11). Minden 2 bites kombináció egy DNS-bázispárt jelöl. Egyetlen bájt (vagy 8 bit) 4 DNS-bázispárt jelenthet. A teljes diploid emberi genom bájtokban való ábrázolásához a következő számításokat végezhetjük el:
6×10^9 bázispár/diploid genom x 1 bájt/4 bázispár = 1,5×10^9 bájt vagy 1,5 gigabájt, körülbelül 2 CD-nyi hely! Vagy elég kicsi ahhoz, hogy 3 különálló genom elférjen egy szabványos DVD-n!
Az egész szervezetre kiterjedő adattárolás
Egy érdekes kérdés következhet. Például hány megabájtnyi genetikai adat tárolódik az emberi szervezetben? Az egyszerűség kedvéért hagyjuk figyelmen kívül a mikrobiomot (a testünkben élő összes nem emberi sejtet), és csak a testünket alkotó sejtekre koncentráljunk. Az emberi testben lévő sejtek számának becsült értéke 10 és 100 billió között mozog. Vegyük a 100 billió sejtet az általánosan elfogadott becslésnek. Tehát, tekintve, hogy minden egyes diploid sejt 1,5 GB adatot tartalmaz (ez nagyon közelítő, mivel csak a diploid sejtekkel számolok, és figyelmen kívül hagyom a testünkben lévő haploid spermiumokat és petesejteket), az emberi testben tárolt adatok hozzávetőleges mennyisége:
1,5 Gbájt x 100 billió sejt = 150 billió Gbájt vagy 150×10^12 x 10^9 byte = 150 Zettabájt (10^21)!!!
Szexuális információcsere
Az emberi szaporodás során mennyi genetikai adat cserélődik ki?Az emberi férfi minden egyes spermiuma heterogám és haploid, ami azt jelenti, hogy a két nemi kromoszóma (X vagy Y) közül csak egyet tartalmaz, és a 22 autoszomális kromoszómából csak egyet. Így minden egyes spermium körülbelül 3 milliárd bázisnyi genetikai információt tartalmaz, ami 750 Mbájtnyi digitális információt jelent. Egy átlagos emberi ejakulátum körülbelül 180 millió spermiumot tartalmaz. Ez tehát 180 x 10^6 haploid sejt x 750 Mbájt/haploid sejt = 135 x10^9 Mbájt=135000 terabájt!!!!. Ezt a gondolatot még tovább követve, miközben 13500 Tbájt kerül átvitelre, csak egy spermasejt olvad össze egy petesejttel, mindössze 750 Mbájtnyi adatot használva fel, kombinálva azt a petesejtből származó másik 750 Mbájtnyi adattal. Így lényegében a szexuális szaporodás során átvitt adatok 99,9999…%-a elvész a vezetékben … Hogy az információ fennmaradó töredéke eredményez-e valami építő jellegű dolgot, az a jó szülőktől függ.
A fenti számok kiszámítása után egy csomó más kíváncsi kérdést is fel lehet tenni. Gondolkodtál már azon, hogy vajon mekkora a biológiai szervezetünk adatkapacitása? Mekkora az adatátviteli sebesség a sejtosztódás során? Az adatátvitel sebessége az ivarsejtek fúziója során? Az adatátvitel sebessége, amikor az emberi limfociták keringenek a véráramban? Mennyi adatot semmisít meg naponta az apoptózis? Mennyi adat keletkezik naponta? Hogyan viszonyul ez az adatátvitel sebességéhez egy optikai szálon keresztül?
Kérem, bátran járuljon hozzá saját kétes számításaihoz és kérdéseihez az alábbiakban!
Segített ez önnek? Akkor kérjük, ossza meg a hálózatával.