Kako alternativni podaci mogu da bace novo svetlo na depopulaciju u Srbiji

20. January 2022.

Podaci, kao resurs koji veliki broj ljudi može da koristi istovremeno i koji se ne troši, važan su pokretač inovacija. Mnogo je primera kako otvoreni podaci stvaraju korist za čitavo društvo i ekonomiju. Jedan od najboljih primera je razvoj dijagnostičkih testova i načina lečenja COVID-19, kada je sekvencirani genom novog koronavirusa objavljen samo tri dana nakon što je Svetska zdravstvena organizacija objavila otkriće virusa. 

UNDP u Srbiji želeo je da testira kako alternativni izvori podataka, bliži realnom vremenu, mogu da se iskoriste kao dopuna zvaničnim izvorima, za prikupljanje informacija i dobijanje novih uvida u jedan od najvećih razvojnih izazova – depopulaciju.

Ovaj termin označava proces kontinuiranog smanjenja i starenja stanovništva Srbije, koji ima višestruke i kompleksne socioekonomske implikacije. Društveni izazovi povezani sa ovim procesom umnožavaju se kako vreme prolazi. Za efikasne odgovore na njih neophodni su što kvalitetniji demografski pokazatelji.

Zvanična statistika proizvodi redovne godišnje procene demografskih indikatora još uvek se oslanjajući na tradicionalni popis stanovništva koji se sprovodi tek jednom u deset godina i značajno potcenjuje obim emigracije usled metodoloških ograničenja. U savremenim uslovima dramatično povećane mobilnosti stanovništva, i globalne i lokalne, pouzdanost takvih procena značajno opada sa udaljavanjem od popisne godine.

Kako bi došla do potpunijih procena kretanja stanovništva, UNDP Laboratorija za ubrzani razvoj u Srbiji, najpre je sama testirala alternativne izvore podataka. Koristili smo podatke mreže LinkedIn za identifikaciju profesija i veština koje Srbija gubi, kao i za mapiranje zemalja odredišta, i podatke Google pretraga za mapiranje dijaspore.

Sagledavši potencijal alternativnih izvora podataka, u želji da mobiliše kolektivnu inteligenciju, program Ujedinjenih nacija za razvoj (UNDP) je u partnerstvu sa Populacionim fondom UN (UNFPA) i uz podršku Nemačke razvojne agencije (GIZ), organizovao izazov „Podacima do boljeg razumevanja procesa depopulacije”. Poziv je upućen akademskoj zajednici, kompanijama iz privatnog i javnog sektora, tehnološkoj zajednici i svima zainteresovanima za ovu temu.

Više glava je pametnije od jedne

Kolektivna inteligencija znači da ljudi rade zajedno i koriste širi spektar informacija, stvarajući nove ideje i uvide, kako bi rešavali probleme i zajedno postali pametniji. To je nešto što su ljudi radili od početka vremena. Ono što se promenilo je ubrzanje kolektivne inteligencije. Digitalne tehnologije nam omogućavaju da mobilišemo kolektivnu inteligenciju u mnogo većem obimu i na potpuno nove načine. Imamo na raspolaganju čitav niz novih izvora podataka, kao što su satelitski podaci, mobilni podaci, podaci društvenih mreža i možemo da koristimo veštačku inteligenciju (AI) za proširenje vlastite inteligencije.

Naš poziv za prikupljanje i kombinovanje tradicionalnih i alternativnih skupova podataka, i korišćenje metoda veštačke inteligencije, kako bi se stekli novi uvidi i nova znanja o depopulaciji u Srbiji, računao je upravo na tu sintezu znanja koje ljudi imaju i korišćenja digitalnih tehnologija.

Na izazov je pristiglo ukupno 50 prijava, a u finalnoj fazi, koja je podrazumevala detaljnu razradu početne ideje, našlo se 11 multidisciplinarnih timova. Četvoro pobednika izabrao je žiri u kome su bili predstavnici i predstavnice Kabineta ministra bez portfelja zaduženog za demografiju i populacionu politiku, Centra za demografska istraživanja Instituta društvenih nauka, Republičkog zavoda za statistiku, UNFPA i UNDP-a.

Koliko i gde odlaze ljudi iz Srbije

Međunarodne migracije su, kao najslabija karika zvanične demografske statistike, bile centralna tema dva pobednička rešenja. Njihov fokus je bio na makro podacima, tj. pokazateljima na nivou države. Tim Bootstrappers se fokusirao na populaciju koja se odselila iz Srbije, a tim InfostudData na potencijalne emigrante.

Tim Bootstrappers, činilo je troje istraživača sa Univerziteta Harvard (SAD) - eksperata u oblasti IT i nauke o podacima. Vođa tima bio je mladi naučnik poreklom iz Srbije. Njihovo rešenje je, uprkos metodološkim neusaglašenostima ovog tipa podataka sa zvaničnom statistikom u pogledu definicija i obuhvata migranata, kroz dve dimenzije unapredilo znanje o novijoj emigraciji iz Srbije.

Jedna je, pomoću analize relativno lako dostupnih podataka o korisnicima oglasa na Fejsbuku (Facebook Ads), pružila daleko realniju procenu broja srpskih državljana u inostranstvu nego popis stanovništva. U odnosu na oko 313 hiljada emigranata prema Popisu 2011. godine (Stanković 2014), ovaj metod je ukazao da ih je bilo čak oko 860 hiljada krajem 2020, što je mnogo bliže proceni Populacionog odseka Ujedinjenih nacija (2020) od oko jednog miliona iseljenika iz Srbije.

Spisak od čak 82 odredišne države uključuje i one za koje zvanični podaci nedostaju ili se neredovno ažuriraju, što je naročito važno u slučaju najpopularnijih destinacija. Ipak, osnovni doprinos ovog rešenja ogleda se u mogućnosti da se promene u broju i ključnim demografskim obeležjima emigranata prate uz relativno visoku frekvenciju ažuriranja.

Kvartalni preseci stanja pružaju priliku za bolju identifikaciju pokretača promena u migracionoj dinamici, kao što su ekonomski poremećaji, pandemije, ratovi, klimatski faktori i sl. Tako je ova analiza jasno detektovala uticaj pandemije COVID-19 na promene broja emigranata poreklom iz Srbije – prvo kroz smanjenje koje se zaustavilo pre sredine 2021, a potom kroz lagani porast – ukazujući da će se predpandemijski migracioni tokovi najverovatnije nastaviti nakon prvobitnog šoka izazvanog naglim zatvaranjem stanovništva krajem prvog kvartala 2020.

Druga dimenzija ovog rešenja je, na osnovu analize podataka sa Microsoft Academic – internet pretraživača za akademske publikacije, pružila procenu odliva naučnika iz Srbije u poslednje dve decenije, što je jedno od najintrigantnijih pitanja u vezi sa našom novijom emigracijom.

Tako su došli do nalaza da produktivnost naših naučnika značajno raste ukoliko se zaposle u renomiranim stranim institucijama – prosečno imaju 2,3 više objavljenih radova godišnje u odnosu na istraživače koji rade na državnim univerzitetima u Srbiji. Posebno značajan doprinos ovog rešenja je zaključak da naučnici koji su ostali da rade u Srbiji, a imaju saradnju sa renomiranim naučnim ustanovama u svetu, imaju takođe visok porast naučne produktivnosti, jer prosečno objavljuju čak 1,9 radova godišnje više od kolega koje nemaju takvu vrstu međunarodne saradnje. To je vrlo jasna sugestija naučnoj zajednici i kreatorima politika u Srbiji u pogledu prednosti koje za našu zemlju mogu imati cirkularne migracije najobrazovanijeg stanovništva.

Odlazak mladih na školovanje i usavršavanje ne mora nužno voditi famoznom ’odlivu mozgova’, već umrežavanju i saradnji koja donosi koristi i zemlji porekla – kroz transfer znanja, tehnologija i iskustava, dok bi mnogi mladi naučnici, uz jasnu podršku države razvoju nauke, bili u prilici da se vrate i profesionalno ostvare u svojoj zemlji.

Važan izvor informacija za razumevanje i predviđanje migracionih tokova jesu analize ponude i potražnje za radnom snagom u inostranstvu, kao manifestacije tzv. push-pull mehanizma, koji je u osnovi ekonomski uzrokovanih migracija.

InfostudData tim, sastavljen od devet članova zaposlenih u kompaniji Infostud iz Subotice, analizirao je oglase za poslove u inostranstvu, koji su objavljeni na internet portalima Poslovi.infostud.com i NajStudent.com od 2013. do danas.

Cilj ovog rešenja je bolje razumevanje namera demografski najvitalnije populacije Srbije da život nastavi van zemlje. Takva vrsta analize istovremeno osvetljava obe strane ’push-pull’ mehanizma, odnosno odbijajućih i privlačućih faktora.

Iako namere o iseljavanju ne vode nužno stvarnom odlasku, jedan od najvažnijih doprinosa ovog rešenja je što ukazuje na stepen u kom se poklapaju ponuda i potražnja poslova, tj. koje su razlike u pogledu vrste delatnosti i nivoa obrazovanja između poslova koje nude strani poslodavci i poslova koje žele građani Srbije.

Takođe, rezultati pokazuju razliku između poslova koji mogu voditi (dugo)trajnoj emigraciji (dominantno u Nemačku) i onih koji su čisto sezonskog karaktera (zemlje u regionu bivše Jugoslavije). Konačno, ovo istraživanje sugeriše da postoji izraženo preklapanje između ponude i potražnje kod specifičnih zanimanja koja su deficitarna i u Srbiji i u odredišnim zemljama. Time se donosiocima odluka jasno ukazuje na koje segmente radne snage u Srbiji jaz u platama u odnosu na bogate zemlje deluje kao ključni motiv za odlazak.

Pogled izbliza na stanovništvo u Srbiji

Depopulacija u svom osnovnom značenju podrazumeva smanjenje ukupnog broja stanovnika, što je centralna tema druga dva rešenja. Ona su se fokusirala na mikro podatke, razmatrajući prostornu dimenziju depopulacije. Tim Geoanalitičari bavio se ’preklapanjem’ različitih vrsta izvora kako bi dobio kompletniju sliku u odnosu na onu koja se može dobiti iz demografske statistike, a tim PopInsight krajnje inovativnim pristupom analizi telekomunikacionog saobraćaja u cilju predviđanja procesa depopulacije.

Rešenje tima Geoanalitičari, koji je činilo šest istraživača iz Geografskog instituta „Jovan Cvijić“ SANU, napravilo je iskorak u sagledavanju prostorne distribucije stanovništva Srbije u zavisnosti od veličine i geografske pozicije naselja. Umreženi su skupovi geoprostornih podataka iz različitih izvora, poput noćnog osvetljenja, gustine putne mreže, udaljenosti od saobraćajnih čvorišta, kako bi se ukazalo na prostorne, morfološke i populacione promene tokom prethodnih nekoliko decenija.

Ukrštanjem tradicionalnih i alternativnih izvora podataka, sa aspekta proučavanja demografskih procesa, korisniku je pružen uvid u mikro podatak, odnosno u distribuciju stanovnika na nivou naselja, čime je prostorna identifikacija depopulacije mnogo bliža realnoj slici na terenu nego što to mogu da pokažu klasični demografski izvori. Osnovni doprinos ovog rešenja je interaktivni kartografski prikaz čak 12 indikatora depopulacije u dužem vremenskom periodu.

Korisniku je omogućeno da jasno vidi šta smanjenje i starenje stanovništva znači za ljude koji žive u gradovima – od najmanjih do najvećih, a šta za one u ruralnim oblastima, naročito rubnim i planinskim. Internet platforma ovog rešenja sadrži slojeve georeferenciranih podataka visoke prostorne rezolucije, koji mogu biti odličan ulaz za složenije analize u različitim domenima, uključujući predviđanje populacionih promena.

Tim PopInsight sastavljen od šest istraživača iz naučno-istraživačkog Instituta Biosense u Novom Sadu, otišao je korak dalje u nastojanju da izračuna konkretne rizike depopulacije na nivou opštine ukrštajući zvanične demografske podatke sa alternativnim izvorima. Ovo rešenje zasnovano je na analizi anonimiziranih i agregiranih mikro podataka o svim tipovima telekomunikacionih aktivnosti korisnika mobilne mreže telekomunikacionog operatera Telekom Srbija tokom prve polovine 2020. godine, dobijenih zahvaljujući partnerstvu koje je UNDP za potrebe ovog izazova uspostavio sa ovom kompanijom. 

Napredni metodi statističke analize telekomunikacionog saobraćaja omogućili su prepoznavanje razlika u nivou aktivnosti između opština i utvrđivanje stepena njihove međusobne povezanosti. Izračunate korelacije između indikatora proisteklih iz analize telekomunikacionih podataka i zvanične demografske statistike, na osnovu modela mašinskog učenja, poslužile su da se formuliše glavni nalaz ovog tima – što je slabija telekomunikacija neke opštine sa ostalim opštinama, veći je rizik da doživi depopulaciju.

Internet platforma ovog rešenja pruža korisnicima izuzetno bogat skup od preko 150 detaljnih indikatora telekomunikacionog saobraćaja, koji otvaraju mogućnost za dalje analize i demografske interpretacije. Naročito je izražen potencijal za prepoznavanje obrazaca dnevnih migracija i unutrašnjih preseljavanja kroz analizu podataka mobilnosti, što je doprinos rešenja koji je tek nagovešten, a mogao bi biti od velikog značaja za razumevanje ovih procesa.

Mogućnosti za dalja unapređenja

Najčešće zamerke alternativnim izvorima podataka tiču se njihove pojmovno metodološke neusklađenosti sa zvaničnom demografskom statistikom, odnosno kredibilnosti posrednih pokazatelja koji ne mere direktno demografske pojave. Glavni nedostatak je što takvi izvori ili ne pružaju informacije o važnim demografskim strukturama (pol, starost, partnerski status, obrazovanje, zaposlenost i sl.) koje su od značaja za planiranje i donošenje odluka u vitalnim državnim sistemima, ili se odnose samo na jedan aspekt populacione dinamike (migracije). Ključna prednost prikazanih alternativnih rešenja je što nude ažurnije informacije od zvanične demografske statistike.

Takođe, rezultati sva četiri rešenja poseduju snažan prognostički kapacitet, koji nedostaje tradicionalnom izvorima, zahvaljujući mogućnostima algoritama mašinskog učenja tipičnim za obradu velikog broja podataka na kojima se temelje alternativni izvori. Tako na primer, ukoliko bi se analiza tima InfostudData o ponudi i potražnji za radnom snagom u inostranstvu sprovodila kvartalno i evaluirala rezultatima tima Bootstrappers o promenama u obimu emigracije iz Srbije, mogla bi se dobiti procena broja državljana Srbije koji su ostvarili svoju nameru da emigriraju.

Takođe, očit je potencijal geo-prostornog povezivanja različitih vrsta podataka za identifikaciju i prognoziranje demografski ugroženih zona, što su pokazali timovi Geoanalitičari i PopInsight. Ukoliko bi i drugi telekomunikacioni operateri u Srbiji omogućili timu PopInsight pristup svojim podacima, kapacitet rezultata ovog rešenja drastično bi porastao naročito u pogledu analize roming (roaming) saobraćaja, odnosno međunarodnih migracija.

U tom smislu je značajno što su sva četiri rešenja i podaci do kojih su timovi došli dostupni za slobodno preuzimanje radi daljeg istraživanja ili kreiranja novih proizvoda, svima koji su zainteresovani da ih koriste, kako bi doprineli boljem kvalitetu života ljudi u Srbiji.

I pored trenutnih ograničenja, ova četiri rešenja sugerišu da alternativni izvori podataka mogu biti validan korektiv i dopuna u analizi zvaničnih podataka o populacionoj dinamici. Državna statistika već je najavila da bi mogla da koristi rešenje tima Bootstrappers kao dopunski izvor u izradi sopstvenih procena spoljne migracije. Imajući u vidu da digitalizacija postaje neizbežna u svim sferama života, čini se da neki od alternativnih izvora imaju jasan kapacitet da u dogledno vreme prerastu čak i u regularnu demografsku statistiku. 

Pobednici izazova „Podacima do boljeg razumevanja procesa depopulacije”

Linkovi ka pobedničkim rešenjima:

Bootstrappers

InfostudData

Geoanalitičari

PopInsight

Reference:

Peach, K., Berditchevskaia, A., Mulgan, G., Lucarelli, G., & Ebelshaeuser, M. (2021). Collective Intelligence for Sustainable Development: Getting Smarter Together. UNDP Accelerator Labs, Nesta. Retrieved from 

https://smartertogether.earth/download-report

Stanković, V. (2014). Srbija u procesu spoljnih migracija. Beograd: Republički zavod za statistiku. Retrieved from 

https://pod2.stat.gov.rs/ObjavljenePublikacije/Popis2011/Inostranstvo.pdf

UNDP Serbia (2021). Predstavljena saznanja o depopulaciji u Srbiji [Press release]. Retrieved from

https://www.rs.undp.org/content/serbia/sr/home/presscenter/articles/2021/predstavljena-nova-saznanja-o-depopulaciji-u-srbiji.html

United Nations (2015). Transforming Our World: The 2030 Agenda for Sustainable Development. New York: United Nations. Retrieved from https://sdgs.un.org/2030agenda

United Nations (2020). International Migrant Stock 2020. United Nations Department of Economic and Social Affairs, Population Division. Retrieved from https://www.un.org/development/desa/pd/content/international-migrant-stock

Napomena: veći deo teksta ovog bloga je prvobitno objavljen u naučnom časopisu "Stanovništvo" Vol 59 No 2 (2021) u decembru 2021. godine.