U pripremi je finalna verzija Frekvencijskog rečnika savremenog srpskog jezika, odnosno, okončanje višedecenijskog projekta koji realizuje dopisni član SANU Aleksandar Kostić sa saradnicima u Laboratoriji za eksperimentalnu psihologiju Filozofskog fakulteta u Beogradu. Postojećem frekvencijskom rečniku koji je svojevremeno napravljen na uzorku poetskih tekstova i tekstova dnevne štampe, priključiće se i uzorak literarnih tekstova. Time će se dobiti pouzdaniji uvid u učestalost reči savremenog srpskog jezika i njihovih gramatičkih oblika jer će rečnik, pored frekvencije odrednica, sadržati i frekvencije svih njihovih oblika koji su se pojavili u pomenutim uzorcima. Pored naučnog značaja u lingvističkim i psiholingvističkim istraživanjima, jezički korpusi i iz njih izvedeni frekvencijski rečnici imaju i strateški značaj – što je i povod našeg razgovora.
„VREME„: Frekvencijski rečnik savremenog srpskog jezika je u „Vremenu“ prvi put pomenut pre 17 godina, što nedvosmisleno ilustruje obim ovog posla.
ALEKSANDAR KOSTIĆ: Reč je o projektu koji je sredinom pedesetih godina prošlog veka započeo Đorđe Kostić, moj otac, koji je u Institutu za eksperimentalnu fonetiku i patologiju govora osmislio i vodio projekat automatskog prepoznavanja teksta i mašinskog prevođenja. Zahvaljujući tom projektu, nastao je korpus od 11 miliona reči u kome je definisan gramatički status svake od njih, ručno gramatički obrađen na pelirima. U pitanju je korpus koji zahvata srpski jezik od 12. veka do savremenog jezika. Ovaj projekat, na kome je radilo oko 400 saradnika, prekinut je 1962. godine, ali je materijal sačuvan. Njegova digitalizacija počela je 1996. godine u Laboratoriji za eksperimentalnu psihologiju i Institutu za eksperimentalnu fonetiku i patologiju govora, da bi već 1999. godine izašla prva verzija frekvencijskog rečnika savremenog srpskog jezika. Početkom 2000-ih pristupili smo izradi frekvencijskih rečnika srpskoslovenskih tekstova, tačnije, srpskih hagiografija među kojima se nalaze dela Sv. Save, Domentijana, Teodosija, arhiepiskopa Danila II, Stefana Prvovenčanog i drugih autora. Uz nadzor prof. Đorđa Trifunovića, koji je bio stručni savetnik i predanom radu stručnjaka za srpskoslovenski jezik ovaj deo projekta je završen. Ostalo je da se završi drugi deo uzorka srpskoslovenskih tekstova koji sadrži stare srpske povelje i pisma u izdanju Ljubomira Stojanovića.
Za ovaj projekat se svojevremeno zainteresovao Službeni glasnik, tačnije, njegov ondašnji direktor Slobodan Gavrilović, koji je objavio pomenute frekvencijske rečnike u osam tomova sa pratećim softverskim aplikacijama koje omogućuju pretragu po odrednicama i gramatičkim oblicima, kao i uvid u konkordancije i kolokcije. Ovde želim posebno da pomenem gospodina Gavrilovića, čoveka sa nesvakidašnjim osećanjem za značajne kulturne poduhvate, čoveka širokih zamaha, sa dugoročnim vizijama u kulturi koje nam danas toliko nedostaju. O tome, između ostalog, svedoči i njegova namera da Službeni glasnik digitalizuje sve srpske službene novine od 1813. do 2012. godine. O ovom kapitalnom projektu Slobodana Gavrilovića malo se zna i mislim da je ovo prilika da se šira javnost upozna s jednim njegovim izuzetno značajnim delom u kome je napravljen korpus slavenosrpskog jezika.
U realizaciji projekta digitalizacije srpskih službenih novina problem je nastao sa digitalizacijom „Novina serbskih“ u periodu između 1813. i 1868. godine kada su izlazile na slavenospskom jeziku, dakle, jeziku pre Vukove reforme, koji nije imao standardizovanu ortografiju, tako da je ista reč pisana na više različitih načina. Postavilo se pitanje kako omogućiti savremenоm korisniku da pretražuje „Novine serbske“ pisane jezikom kojim se više ne govori (ali se razume) i ortografijom koja nije standardizovana. Problem je rešen tako što su svi raspoloživi primerci „Novina serbskih“ (1813-1868), od prve do poslednje strane daktilografski uneseni u digitalnom obliku. Time je dobijen korpus slavenosrpskog jezika od oko 35 miliona reči. Svakoj imenici pripisana je odrednica na slavenosrpskom koja je prevedena na savremeni srpski jezik, čime je omogućeno da se upit postavi na savremenom srpskom jeziku i da se dobiju svi tekstovi u kojima se tražena reč pojavljuje. Do 2012. godine završeno je oko 70 posto ovog projekta. Nažalost, gospodin Gavrilović je te godine smenjen, a novi direktor, prof. Radoš Ljušić je na grub način zaustavio oba projekta – i projekat daljeg izdavanja frekvencijskih rečnika srpskoslovenskih tekstova i projekat digitalizacije „Novina serbskih“.
Nestručna javnost se zainteresovala za Frekvencijski rečnik zbog mogućnosti praćenja učestalosti upotrebe reči u jeziku, čime bi mogli da se nagoveste neki događaj ili pojava nekog političara od koga će zavisiti naša svakodnevnica.
Može da zvuči čudno, ali frekvencijski rečnik je i kvantitativni opis određenog vremenskog trenutka u datoj sredini. Ako biste u regularnim vremenskim segmentima obnavljali rečnik, dobili biste dinamiku promena verovatnoća pojedinih reči koje su ponekad dramatične, a koje zapravo odražavaju promene u sredini u kojoj se dati jezik koristi. U kontekstu vašeg pitanja, od posebnog interesa bili bi onomastički pojmovi, posebno toponimi i antroponimi. Praćenje promena učestalosti pojedinih onomastičkih pojmova može da posluži kao nagoveštaj budućih događaja. Da smo, na primer, pratili učestalost toponima „Kosovo“ od 1990. godine u nekoliko vodećih svetskih dnevnih novina, videli bismo da od 1996. godine njegova učestalost naglo raste. Ekstrapolacijom funkcije mogli bismo sa određenom verovatnoćom da zaključimo kada će pitanje Kosova postati dramatično. To važi i za antroponime, tj. lična imena.
Bilo bi dobro ako bi se osnovao centar za praćenje promena verovatnoća onomastičkih pojmova u domaćoj i svetskoj štampi. Siguran sam da bi se time dobile značajne informacije o promenama koje su u toku i mogućnost predviđanja pravca u kome se kreću.
Od kako je Ana Brnabić u svom inauguracionom govoru najavila digitalizaciju, Ministarstvo kulture i informisanja je preduzelo korake da se taj proces proširi i na kulturne ustanove, što je pozitivna promena u načinu na koji se kod nas čuva i istražuje nasleđe.
Inicijativu premijerke Ane Brnabić svakako treba pozdraviti. Treba pozdraviti i inicijativu Ministarstva kulture i informisanja da se veća pažnja posveti digitalizaciji kulturnog nasleđa. Ministarstvo je krajem 2016. godine osnovalo Komisiju za digitalizaciju kulturnog nasleđa u kojoj su bili predstavnici ustanova kulture, a u ime Srpske akademije nauka i umetnosti bili smo gospodin Radoslav Zelenović, upravnik Audiovizuelnog arhiva SANU, i ja. Iz meni nepoznatih razloga, izabran sam za predsednika ove Komisije. Već na samom početku rada Komisija je došla do zaključka da ne postoje opštevažeći standardi digitalizacije, kao ni pravni okvir koji bi regulisao digitalizaciju kulturnog nasleđa. Predložio sam formiranje dve ekspertske grupe – jedne koja bi sačinila jasan pravni okvir i druge koja bi definisala tehničke standarde digitalizacije kulturnog nasleđa. Početkom ove godine, Komisija je Ministarstvu predala elaborat sa definisanim standardima i pravnim okvirom. Elaborat je sadržao i analizu trenutnog stanja i preporuke kako bi digitalizacija kulturnog nasleđa morala da se obavlja. Nažalost, ova analiza nije mogla da bude celovita jer od Ministarstva nismo dobili pregled finansiranja digitalizacije kulturnog nasleđa u poslednjih pet godina, niti smo dobili uvid u to šta je sa dodeljenim sredstvima urađeno iako smo nekoliko puta insistirali da nam se dostave ovi podaci.
Pri kraju rada Komisije saznali smo da je za 2018. godinu predviđeno nešto više od 20 miliona dinara za digitalizaciju kulturnog nasleđa. Za ova sredstva konkurisalo je nekoliko stotina ustanova kulture. Tog trenutka sam hteo da raspustim Komisiju jer sam shvatio da je sav naš trud bio uzaludan. Sa tim sredstvima ne može ništa da se uradi. To je bačen novac.
Posle svega, nisam siguran s kojim namerama Ministarstvo kulture i informisanja pristupa ovom poslu. Ako se ne traži uvid u proizvod za koji su data sredstva, ako Ministarstvo nema kriterijume vezane za standarde digitalizacije, ako finansira parcijalne projekte u minimalnom iznosu, to znači da ne postoji dugoročna strategija digitalizacije kulturnog nasleđa. Bojim se da će elaborat Komisije završiti u nekoj fioci Ministarstva.
Nedavno je osnovan Audiovizuelni arhiv Srpske akademije nauka i umetnosti koji će digitalizovati naše kulturno nasleđe u čijem ste osnivanju učestvovali. Da li je to prilika da se uspostave standardi?
Srpska akademija nauka je od države dobila znatna sredstva za osnivanje Audiovizuelnog arhiva i centra za digitalizaciju. Dobra strana ovog poduhvata je što se počinje od početka sa namerom da se u svakom segmentu delatnosti Arhiva postave vrhunski standardi. Ovi standardi ne odnose se samo na proces digitalizacije već i na procedure koje prate digitalizaciju, njene pravne aspekte, organizaciju i pristup digitalizovanom materijalu itd.
Ukoliko Ministarstvo ne počne da primenjuje standarde koje je u svom elaboratu predložila Komisija o kojoj smo govorili, a po svemu sudeći neće, to će učiniti Audiovizuelni arhiv SANU. Cilj nam je da Audiovizuelni arhiv bude nukleus iz koga će se širiti primena postavljenih standarda jer će oni biti vidljivi, tačnije, pojaviće se uočljiv kontrast u odnosu na postojeće standarde digitalizacije.
Pomenuli ste da ne postoji pravni okvir koji bi regulisao digitalizaciju kulturnog nasleđa. Zašto?
Postoje, čini mi se, dva razloga: odsustvo jasne slike kako bi digitalizacija trebalo da izgleda i kako bi trebalo da se organizuje. Sa druge strane, bojim se da postoje interesne grupe kojima odgovara odsustvo jasnog pravnog okvira. Uzmimo za primer bibliotečki softverski sistem COBIS. Reč je o slovenačkoj firmi koja je u Srbiji prisutna od početka devedesetih godina prošlog veka i koja pokriva oko 70 odsto biblioteka u Srbiji, pri čemu država odvaja nekoliko stotina hiljada evra godišnje za korišćenje ove baze. U Novom Sadu je u isto vreme napravljen bibliotečki softverski sistem (BISIS) čiji razvoj počiva na entuzijazmu nekolicine profesora sa tamošnjeg Univerziteta i koji se koristi mahom u Vojvodini. COBIS sada pokušava da uđe u Srbiju i sa bazama za muzeje, a sutra možda i za arhive. Duboko sam uveren da strateški softver, a bibliotečke baze su bez sumnje to, mora da bude proizveden i razvijan u Srbiji. To bi moralo da bude zakonski regulisano.
Traje Godina evropskog kulturnog nasleđa. Nacrt Strategije Ministarstva kulture i nformisanja istina nije usvojen, ali je jasno istakao nacionalnu kulturu. Kako to izgleda u praksi?
Moj utisak je da država, a samim tim i Ministarstvo kulture i informisanja, nema jasnu svest o tome da su kultura i identitet glavno čvorište ovog civilizacijskog trenutka. Poslednjih 30 i više godina svedoci smo otvorenog i sistematskog ataka na našu kulturu, a samim tim i na naš identitet ali toga, izgleda, nismo svesni jer ništa ne preduzimamo da to sprečimo. Mnogo toga bismo naučili ako bismo se podsetili pregnuća srpske elite iz druge polovine 19. veka. Jedan od ciljeva Društva srpske slovesnosti, na primer, bio je sakupljanje srpske srednjovekovne pisane baštine, odlazilo se u Dubrovački arhiv iz koga su doneti prepisi srpskih tekstova, setimo se samo šta su sve uradili Jovan Cvijić, Đura Daničić i Stojan Novaković. Kada danas sagledamo šta je na polju kulture urađeno od polovine 19. veka do početka Prvog svetskog rata, videćemo da je postojala jasna strategija u stvaranju napredne evropske države. Ako imate jasnu ideju o tome šta je država i viziju kako ona treba da funkcioniše, onda kultura nužno postaje jedan od nosećih stubova takve zajednice. Nažalost, danas smo daleko od toga. Bojim se možda nepovratno. Uzmimo za primer odnos prema jeziku. Nemamo rečnik srpskoslovenskog jezika kojim smo pisali do 18. veka, nemamo rečnik slavenospskog jezika kojim smo pisali do druge polovine 19. veka, nemamo rečnik savremenog srpskog jezika u digitalnom obliku.
Ovo je poslednji trenutak da se učine radikalne promene u odnosu prema kulturi i da se ona kao bitan segment postavi u širi sistem funkcionisanja države. U protivnom, nastavićemo da lutamo, a da to nećemo ni znati.