Najveća enciklopedija svih vremena, Wikipedia, suočava se s napadom AI botova. Posljednjih mjeseci Zaklada Wikimedia bilježi porast prometa na svojim stranicama, uglavnom zahvaljujući automatiziranim AI botovima tehnoloških kompanija kao što je OpenAI. Ove bilješke masovno preuzimaju tekst, slike i druge multimedijske resurse kako bi nahranile svoje AI modele.
Problem ne utječe samo na Wikipediju, već i na Wikimedia Commons, zbirku koja sadrži preko 144 milijuna multimedijskih datoteka, što slika, videozapisa i drugih datoteka pod javnom licencom. Sveukupno, od početka 2024. Zaklada Wikimedia zabilježila je povećanje potrošnje mrežne propusnosti za multimedijalne datoteke za čak 50%.
Većinu tog prometa čine automatizirani botovi koji masovno preuzimaju slike i druge datoteke s Wikimedia Commonsa kako bi trenirali modele umjetne inteligencije, time izravno opterećuju servere zaklade. Povećani promet AI robota ne samo da opterećuje servere, već dovodi i do povećanja operativnih troškova.
Kulminacija se dogodila u prosincu 2024., kada su, nakon smrti bivšeg američkog predsjednika Jimmyja Cartera, milijuni korisnika posjetili njegovu stranicu na engleskoj Wikipediji. Samim ljudskim prometom i dalje se moglo upravljati, ali pravo opterećenje je nastalo kada je velik broj korisnika odlučio istovremeno pogledati 1,5-satni snimak rasprave Cartera i Reagana iz 1980. Došlo je do zagušenja na nekim točkama veze Wikipedije s Internetom. Tim odgovoran za infrastrukturu stranice stoga je bio prisiljen ručno preusmjeriti promet.
Zaklada Wikimedia napominje da fenomen nekontroliranog prikupljanja podataka od strane AI botova danas utječe na cijeli internet, a ne samo na njihove servere. Kao odgovor na to, organizacija radi na rješenjima koja će omogućiti bolju kontrolu pristupa sadržaju. Oni bi trebali uključivati namjenske API-je za AI tvrtke, što bi smanjilo opterećenje mreže i olakšalo prepoznavanje zlouporaba.
Istovremeno, Wikimedia poziva AI tvrtke na suradnju i da počnu razumnije i odgovornije pristupati kada je u pitanju pristup sadržaju s interneta. Kako ističe, “sadržaj mu je besplatan, infrastruktura nije”. Isto vrijedi i za ostatak internet prostora.
Tošo Maršić