Jeste li se ikada pitali koliko je zapravo velik internet? U posljednjim se godinama mogu čuti razni podaci, a posebno je važan onaj da je skriveni dio interneta mnogo veći nego li onaj javni. Ako možemo imaginirati kolika je veličina javnog internet prostora, jasno je da sveukupno sa skrivenim dijelom, takozvanim deep i dark web, izgleda zaista enormno veliko. I dok o cjelokupnom internetu možemo samo nagađati, stvari su puno jasnije u Hrvatskoj.
Srce, odnosno Sveučilišni računalski centar nedavno je radio backup hrvatskog internet prostora. Pri tome su trebali pospremiti čak 7 terabajta podataka. Da malo pojasnimo, radio se backup podataka koji stoje na .hr domeni, odnosno podaci koji su usko vezani uz teritorij hrvatske.
„Primjerice uzorak izmjeren 2002. godine obuhvatio je 4.667.920 resursa (objekata dostupnih webom). Veličina uzorka procijenjena je na preko 300 GB podataka. Najveći broj resursa, čak 67%, otpadao je na HTML dok je na slikovne formate otpadalo je 23% resursa. Netom dovršenim harvestiranjem za 2016. godinu uspješno je preuzeto 77 milijuna resursa s weba, ukupne veličine 7.0 TB. Najzastupljenije vrste sadržaja su tekst u HTML formatu (51.3%) i slike u JPEG formatu (33.8%)“, zaključio je Draženko Celjak, voditelj Službe za podatkovne usluge i kolaboracijske alate.”
Ovaj zanimljivi podatak pretočen je i neku zamislivu veličinu, pa su iz Srce-a napomenuli kako bi printanje i arhiviranje svih ovih podataka na papir zauzelo prostor od minimalno osam Nacionalnih i sveučilišnih knjižnica.
Prema dostupnim podacima, u posljednjih je 15 godina broj materijala na .hr domenama porastao čak 23 puta. Dakle, jasno je vidljiv trend porasta broj web stranica, jer one postaju ključni element u stvaranju brenda.
“Odlučili smo kako će mjerenjem biti obuhvaćeni resursi dostupni HTTP odnosno HTTPS protokolom s poslužitelja u .hr vršnoj internetskoj domeni. Time je precizno definiran mjereni informacijski prostor.”
Mjerenjem se prije svega željelo ustanoviti:
- veličinu prostora weba,
- korištene formate datoteka prema MIME standardu,
- omjer teksta, slike, audio i video zapisa,
- obim i sadržaj meta podataka.
Što se konkretno broja stranica tiče, trenutno je aktivno čak 80 tisuća sajtova, a oni sveukupno imaju čak 39.5 milijuna web stranica. Impresivne brojke, koje teško da možemo zamisliti.
Izvor: Srce
Piše: D.Ž.