Poslednje nedelje avgusta u Beogradu, u palati „Srbija“ (SIV), održana je konferencija-radionica o nauci o velikim podacima (data science). Kako je izgledalo možete pogledati na adresi nsfserbia.rs, a već iz te adrese može se naslutiti da je konferencija napravljena u saradnji sa najznačajnijom naučnom fondacijom na svetu, američkom NSF. Američka strana uložila je čak sto hiljada dolara za putne troškove naučnika koji su iz SAD došli u Beograd, njih pedesetak, listom vrhunskih stručnjaka za nauku o podacima. Pored njih konferenciji je prisustvovalo par stotina naučnika iz regiona. To znači da je posećenost bila odlična, ali da bi se s obzirom na kvalitet skupa moglo očekivati da ih bude mnogo više. Srećom, prezentacije je moguće pogledati na internetu, ali su mnoge mogućnosti za neposredni kontakt propuštene. A ovakve prilike su retke i u Americi.
Nauka o velikim podacima najmlađa je naučna disciplina, postoji tek desetak godina, a o njoj se ozbiljno priča poslednjih pet. Ko se u toj oblasti osposobi može da bira da li će da radi u banci ili nekom softverskom gigantu za koliko hoćeš para. Suština ove nauke je da iz velikog broja podataka koje svakodnevno stvaramo izvuče one od kojih možemo imati koristi. Da prepoznaje zakonitosti i navike koje do sada nismo mogli da uočimo ili zato što nismo imali dovoljno informacija ili je kapacitet računara koji ih obrađuju bio nedovoljan. To se ubrzano menja, tako da se veruje da je sledeći veliki tehnološki i naučni prodor upravo u tom pravcu, ne samo u informatičkoj industriji, već i u medicini, arheologiji, praktično u svakoj oblasti nauke. Nauka o podacima tesno je vezana za veštačku inteligenciju i mašinsko učenje, ona hrani softver koji mašine čini pametnim, da ne kažemo pametnijim od nas. A svakako preciznijim i prilično nepogrešivim.
Kada se nađete u istoj sobi sa naukom na tako visokom nivou, pretenciozno je očekivati, daleko bilo tvrditi, da razumete o čemu se zapravo radi. Sem ako ste i sami naučnik. Ali na krajnje površnom nivou može se reći da nauka o velikim podacima koristi statistiku kako bi predvidela neposrednu budućnost. Na primer, automobil bez vozača prikuplja veliki broj podataka iz svoje okoline, sa raznih senzora, i na osnovu toga donosi odluku da li da ubrza ili da zakoči. Zadatak nauke je da omogući da ta odluka bude najbolja moguća, najčešće bolja od one koju bi doneo čovek za volanom.
Jedan od trenutno najzanimljivijih projekata vezanih za velike podatke sprovodi se na Univerzitetu Templ, a vodi ga akademik Zoran Obradović, najznačajniji srpski stručnjak za velike podatke. Projekat se zove „Procenjivanje uticaja vesti na buduće događaje“, a pod vestima se podrazumevaju objave u medijima i na društvenim mrežama. Tim profesora Obradovića proučava kako određene vesti „žive“ u medijima, odnosno kako se razvijaju i šire dok ne proizvedu neku posledicu. Jedan primer je, recimo, objava ili tekst koji se protivi vakcinaciji. Prati se kako se ta vest širi kroz zajednicu, kako je ko komentariše i koliko ljudi na osnovu te objave donosi odluku da li će se vakcinisati ili ne. Ukoliko bi se razumeo mehanizam širenja vesti, bilo bi moguće pravovremeno i precizno reagovati, kako bi negativne posledice bile što manje. Ovo je neobično važno u kriznim situacijama kada je vremena malo, a šansa za paniku ogromna.
Drugi primer su događaji koji se prvo primete na društvenim medijima. Mikrosredina reaguje na neki poremećaj, recimo na požar, tako što ljudi najpre krenu da zovu porodicu i prijatelje, pre nego što pozovu policiju ili vatrogasce. To se pokazalo kao pravilo otkako svi nose telefone – najpre utvrđujete da li su svi vaši dobro. U zavisnosti od ponašanja mikrozajednice moguće je utvrditi o kakvom se događaju radi, pa nadležne službe mogu brže da reaguju i pre nego što ih neko obavesti o problemu.
Projekat bi prve rezultate trebalo da predstavi za nekih šest meseci. Odlika naučnika je i da nikada ne kažu da će se društvo ponašati na određeni način, već da je najveća verovatnoća da će biti tako. Ostavlja se margina za grešku, s tim da nauka o velikim podacima tu marginu smanjuje na minimum.