Što jednom objavite na internetu – ostaje na internetu. No, novo istraživanje pokazuje kako to i nije slučaj. Istraživanje o kojem je riječ, proveo je američki istraživački centar Pew (Pew Research Center), a nosi naziv “Kad online sadržaj nestane“. Prema istraživanju, 38% web stranica koje su postojale 2013. godine, više im se ne može pristupiti. Izuzetak nisu ni novije web stranice, gdje je 8% web stranica koje su postojale 2023. godine već nestalo.
Pokazalo se da 23% ispitanih web stranica s vijestima i 21% vladinih web stranica sadrži barem jedan neispravni link. U slučaju najveće online enciklopedije – Wikipedije, čak 54% Wikipedijinih stranica sadržavalo je referentni link koji više ne radi.
Gubitak informacija je primjetan i na društvenim mrežama. Pew Research Center prikupio je pet milijuna tweetova objavljenih od 8. ožujka do 27. travnja 2023. Promatrali su te tweetove do 15. lipnja 2023. i na kraju razdoblja promatranja otkrili da 18% objava na Twitteru, sada poznatom kao X, više nije javno vidljivo. U 60% ovih slučajeva, račun koji je izvorno objavio tweet postao je privatan, suspendiran ili potpuno izbrisan. U ostalih 40%, vlasnik računa je izbrisao pojedinačni tweet, ali je račun i dalje postojao. Uz to, tweetovi na određenim jezicima imaju kraći životni vijek u odnosu na ostale. Gotovo 49% tweetova na turskom i 42% tweetova na arapskom jeziku, postalo je nedostupno nakon tri mjeseca.
Međutim, tweetovi ne nestaju uvijek za stalno. Otprilike 6% tweetova koji su nestali kasnije su postali ponovno dostupni. Spominje se kako to može biti zbog toga što je račun postavljen kao privatni, a zatim kao javni ili zbog toga što je račun deaktiviran i kasnije ponovo aktiviran.
Istraživanje je završeno prikupljanjem nasumičnih uzoraka od gotovo milijun web stranica, preuzetih iz Common Crawl, otvorenog skladišta podataka za indeksiranje weba koje arhivira milijarde web stranica i čini arhive i skupove podataka dostupnima za javnu upotrebu. Istraživači su zatim tražili da vide jesu li te stranice nastavile postojati između 2013. i 2023. godine.
Utvrđeno je da 25% svih stranica prikupljenih između 2013. i 2023. više nije dostupno. Od toga, 16% stranica dolazi s web stranice koja i dalje postoji, dok se 9% nalazi na web stranici koja više uopće ne postoji.
Piše: Marijan Živković