Koliko podataka stane u jedno drvo? A koliko u čoveka? Ako računari pamte tako mnogo i to samo sa dve cifre, koliko podataka pamti ljudski DNK? Ispostavlja se da svi genetički podaci o čoveku, odnosno ceo njegov genom sadrži onoliko informacija koliko može da se zabeleži na samo jedan kompakt-disk od 750 megabajta.
Da bismo stvarno razumeli o čemu je tu reč, krenimo od baze – sa stepenovanjem dvojke. Prvi put, dva. Treći put, osam. Četvrti put, šesnaest. I peti put, trideset dva. U binarnom sistemu, gde postoje samo dve cifre, ovaj se broj piše kao 10000. I svi brojevi do njega, od 0 do 31, mogu se zapisati sa pet cifarskih mesta. A to je pet bitova informacije.
No, kad su nam bitovi strujna kola, bez obzira što su izlivena u mikrodimenzijama unutar računarskog procesora, sa običnih pet bitova se malo šta može učiniti, sabrati ili oduzeti. Sve što možemo da učinimo sa pet bitova je da napišemo 32 različita broja. Zato, kad bismo ih imali sedam, to bi bilo dovoljno da zabeležimo ceo ASCII kod (American Standard Code for Information Interchange), koji je američka vojska uvela 1963. i koji sadrži 128, što je sedmi stepen dvojke, kombinacija nula i jedinica. S njima se lako mogu prikazati sva slova abecede, pomoćni interpunkcijski znaci, cifre i još poneki znak. Dovoljno da imamo ceo sistem za beleženje.
Sa osam bitova, međutim, imamo osmi stepen dvojke i možemo da zabeležimo bilo šta od 0 do 255. A to je nešto što je Verner Buholc 1956. nazvao bajtom informacije. To je dovoljno da se izvedu svi mogući računi i da sedamdesetih počnu da se proizvode procesori sa registrima od osam bitova. I da počne informaciona revolucija. Nove računarske arhitekture rade sa ni manje ni više nego 32 bita, odnosno sa registrima koji beleže 32 cifarska mesta (od 0 do 4.294.967.295), ali to je već stvar neverovatnih mogućnosti informacionih tehnologija danas.
No, šta je jedan bit kod DNK? Ovaj molekul se sastoji od dve uvijene trake čiji su šećerni i fosfatni molekuli uzajamno „povezani“ jedinjenjima koja se nazivaju baze: adenin (A), timin (T), citozin (C) i guanin (G). Oni se sparuju tako da se adenin uvek vezuje za timin, a citozin za guanin. To daje četiri moguće kombinacije: A za T, T za A, G za C i C za G.
Za beleženje jedne kombinacije potrebna su, dakle, dva bita (drugi stepen dvojke daje 4), što znači da u jedan bajt sa osam bita stane informacija o 4 bazna para. Poznato je da ukupan ljudski genom sadrži oko 3 milijarde ovakvih baznih parova. Ako taj broj podelimo sa 4, dobićemo da je to količina informacija od oko 750.000.000, odnosno 750 megabajta. Dakle, ceo DNK sasvim lako stane na jedan CD.
Vreme nauke br. 32 u PDF-u
Vreme nauke, specijalno izdanje nedeljnika Vreme za nauku i tehnologiju, broj 32. Izlazi poslednjeg četvrtka u mesecu.
Uređuju: Slobodan Bubnjević i
Marija Vidić
e-mail: vremenauke@vreme.com
Izdavač: NP Vreme
Suorganizator projekta: Institut za fiziku u Beogradu
Objavljivanje „Vremena nauke“ pomaže Centar za promociju nauke.