Može li Google pretraga da pomogne u lociranju dijaspore?

18. March 2020.

Dijaspora je od neprocenjivog značaja za svoju zemlju porekla. Srpska dijaspora se, na primer, procenjuje na preko četiri miliona ljudi, a doznake koje šalje dostižu 9 posto BDP-a zemlje. Ono što dijasporu čini dragocenom nije samo doprinos koji njihovi bližnji i matična država dobijaju u novcu. Potencijal ljudi u dijaspori leži u njihovom obrazovanju, profesionalnom iskustvu i mreži kontakata, koji mogu doprineti otvaranju mogućnosti za trgovinu, investicije i inovacije.

Kako bi mogle da iskoriste ove mogućnosti matične zemlje moraju da znaju gde im se nalazi dijaspora, ali upravo je to veliki izazov. Često ne postoje mehanizmi za praćenje ljudi koji napuštaju zemlju, a zvanične statističke metode koje koriste državne institucije ne mogu da isprate dinamiku savremenih migracija.

Nešto bliže tome da daju sliku kretanja ljudi između različitih zemalja u svetu u realnom vremenu došli su istraživači koji su koristili digitalne alate dostupne zahvaljujući pretragama na internetu. Znamo da pristup internetu ima 4,5 milijardi ljudi, a Google je najpopularniji pretraživač, koji koristi 92% korisnika interneta.

Ukoliko pažljivo i kreativno izaberemo upite, podaci sa Google pretrage mogu nam dati neke uvide o tome gde se nalaze građani koji su se odselili u inostranstvo. Kako to funkcioniše? Postoji javno dostupan analitički alat Google Trends, koji u realnom vremenu standardizuje obim pretraživanja za određene pojmove po jeziku i lokaciji. Na osnovu milijardi pojmova koje korisnici svakog dana ukucavaju u polje pretrage na Google pretraživaču, Google Trends analizira učestalost najpopularnijih upita za pretragu u različitim regionima i na različitim jezicima, kao i popularnost određenih reči koje mogu da budu zadate. Takođe, pomoću grafikona servis vizualizuje obim pretraživanja različitih upita u zadatom vremenskom intervalu i u zadatom regionu.

Postoji nekoliko primera upotrebe podataka dobijenih zahvaljujući Google Trendsu, u rešavanju razvojnih izazova društva i upravljanju informacijama o krizama. Google podaci korišćeni su za predviđanje kretanja izbeglica tokom izbegličke krize 2015. godine. Analiza Pewa započela je u Turskoj i pratila put izbeglica. Koristeći Google Trends, istraživači su posmatrali koliko često govornici arapskog jezika u Turskoj kao termin za pretragu koriste reč "Grčka". Takođe su pratili i koliko često je iz Grčke kao pojam za pretragu korišćena reč "Nemačka" na arapskom jeziku. Broj tih pretraga počeo je naglo da raste u leto 2015. godine. Par meseci kasnije, desetine hiljada migranata stiglo je na obale Grčke.

Villiams i Ralph [1] (2013) otkrili su u svom istraživanju da je Google pretraga za reč 'Polski' (srp. poljski) bila usko povezana sa zvaničnim statistikama o broju i lokaciji poljskih državljana u Velikoj Britaniji. Rezultati su takođe bili relevantni za migracije iz Rumunije i Litvanije, zbog karakterističnih jezika i velikog broja emigranata iz ovih zemalja, nešto manje za ostale zemlje. Bohme et al. koristili su Google Trends za predviđanje međunarodnih migracija, u istraživanju “Searching for a better life: Predicting international migration with online search keywords”. Oni su odabrali skup od pedesetak reči koje su karakteristične za migrantsku populaciju, kao što su pasoš, azil, ambasada, socijalna pomoć, nudeći novu metodu, koja omogućava realno predviđanje trenutnih migracionih tokova pre zvanične statistike.  

Izvor: Google Trends

  1. Hesen 100
  2. Baden-Virtenberg 92
  3. Bavarska 81
  4. Hamburg 60
  5. Berlin 59
  6. Severna Rajna Vestfalija 58
  7. Rajna-Palatinat 55
  8. Donja Saksonija 38
  9. Bremen 36
  10. Sarland 34

Laboratorija za ubrzani razvoj pri kancelariji UNDP-a u Srbiji uradila je sličnu analizu pokušavajući da locira srpsku dijasporu. Ovu analizu smo započeli pretpostavkom da će emigranti verovatno pretraživati Google na svom maternjem jeziku. Ispitivali smo pretrage na srpskom jeziku iz Nemačke, Austrije i drugih zemalja sa visokom koncentracijom srpske dijaspore. Podaci o pretragama dobijeni su korišćenjem Google Trends alata.

Odabrali smo da pratimo pretrage za reči koje se mogu povezati sa obrascima pretrage karakterističnim za dijasporu, kao što je reč „srpski“. Google objavljuje podatke o pretraživanju na svaki sat, na dnevnom i nedeljnom nivou. Međutim, Google ne objavljuje precizan broj izvršenih pretraga, već daje metriku koja beleži relativnu promenu u pretragama tokom određenog vremenskog perioda. Metrika se kreće od 0 do 100 i ukazuje na pretraživačku aktivnost: 100 predstavlja najveću popularnost nekog termina pretrage u odabranom regionu i vremenskom okviru. Rezultat 0 znači da nije bilo dovoljno podataka za ovaj termin.

Izvor: Google Trends

  1. Minhen 100
  2. Frankfurt 98
  3. Nirnberg 94
  4. Štutgart 82
  5. Hamburg 72
  6. Berlin 69
  7. Keln 61

Mi smo tražili podatke za period od poslednjih 5 godina na teritoriji Nemačke. Zvanični statistički podaci u Nemačkoj, na osnovu popisa iz 2011. godine, pokazuju da je najveći deo stanovništva poreklom iz Srbije (64%) koncentrisan u četiri savezne države: Hesen, Severna Rajna-Vestfalija, Baden-Virtemberg i Bavarska. Značajan deo emigranata iz Srbije nije registrovan nemačkim popisom stanovništva, jer su u trenutku dolaska u tu zemlju bili državljani Savezne Republike Jugoslavije, odnosno Srbije i Crne Gore. Trendovi Google pretrage za „srpski“ uglavnom potvrđuju ove podatke, sa nešto nižim procentom (61%). Slično ovom primeru, mogli bismo da napravimo i mapu srpske dijaspore u Austriji, zemlje koja je druga na listi odredišta za emigrante iz Srbije.

Izvor: Google Trends

  1. Beč 100
  2. Salcburg 58
  3. Foralberg 56
  4. Gornja Austrija 48
  5. Donja Austrija 46
  6. Tirol 38
  7. Koruška 32
  8. Štajerska 28
  9. Burgenland 22

Izvor: Google Trends

  1. Beč 100
  2. Vels 76
  3. Salcburg 70
  4. Dornbirn 57
  5. Linc 51
  6. Viner Nojštat 47
  7. Grac 37
  8. Insbruk 37
  9. Klagenfurt 31

Mapiranje može da se uradi vrlo brzo na nivou regiona unutar neke zemlje ili grada i da pruži nove uvide o migracijama i populaciji.

Veliki setovi (Big Data) za internet pretragu podataka mogu da pomognu u rešavanju razvojnih izazova pružanjem dodatnog sloja informacija oko drugih statistika, upoređivanjem obrazaca i indikacijama o mogućoj promeni situacije na terenu ili novim dešavanjima, kao što su izbegličke krize, protesti, nepogode, epidemije.

Sa druge strane, često je zaista teško dati smislenu interpretaciju trendovima Google pretrage. Ograničeni smo izborom jezika, nedovoljno precizno određenom lokacijom i vremenskim okvirom. U nekim zemljama region za koji je moguće uraditi pretragu je prilično veliki. Na primer, pretraga za teritoriju Srbije je data u okvirima Vojvodine i Centralne Srbije. Što se tiče vremenskog okvira pretrage, podaci su raspoloživi počevši od 2004. godine, ali je algoritam geografski poboljšan 2011. godine, što komplikuje poređenje podataka pre i posle te promene. Za pouzdaniju interpretaciju potreban je pristup stvarnom broju Google pretraga određenog pojma, a ne samo obimu pretraživanja. U konkretnom slučaju lociranja srpske dijaspore, populacija iz Bosne i Hercegovine i Hrvatske, koja govori istim ili vrlo sličnim jezikom, može uticati na tačnost nalaza.

Kada možemo sa sigurnošću da kažemo da neki skup reči koristi samo određena populacija, trendovi pretrage Google-a mogu da budu izvor korisnih informacija. Ukrštanjem sa podacima iz drugih izvora možemo da dođemo do pouzdanijih zaključaka o tome gde se nalaze pripadnici dijaspore u tom trenutku, što može biti korisno ukoliko matična država traži način da sa njima stupi u kontakt.

[1] Susan Williams and Martin Ralphs, “Preliminary Research into Internet Data Sources”, UK Government Statistical Service, 18th GSS Methodology Symposium, 2013 

[2] Böhme, M.H., et al., “Searching for a better life: Predicting international migration with online search keywords”, Journal of Development Economics, 2019 https://doi.org/10.1016/j.jdeveco.2019.04.002

Draška Draškovića možete pratiti na Tviteru.