Dana 17. veljače 2025., xAI je pustio u javnost Grok 3, treću iteraciju svog ambicioznog AI chatbota. Pod vodstvom Elona Muska, xAI pozicionira Grok 3 kao potencijalnog top igrača u pretrpanom svijetu umjetne inteligencije, hvaleći se vrhunskim razmišljanjem, munjevito brzim odgovorima i ozbiljnom računalnom snagom.
Izgrađen na temelju xAI-jeva superračunala u Memphisu – zvijeri pokretane s preko 100.000 Nvidia H100 GPU-ova – Grok 3 obećava nadmašiti konkurente poput OpenAI-jeva GPT-4o, Googleova Gemina i Anthropicova Claudea 3.5 Sonnet. Ali ispunjava li Grok 3 očekivanja? Saznajte u nastavku teksta.
Grok 3
Ulog je vrlo visok. S navodnim povećanjem računalnog kapaciteta od 10-15 puta u odnosu na prethodnika, Grok 2, i treningom koji se oslanja na sintetičke skupove podataka, Grok 3 ulazi u bojno polje gdje su brzina, točnost i prilagodljivost nešto o čemu nema pregovora. Dodajte integraciju s X-om u stvarnom vremenu i novi alat „Dubinsko pretraživanje“ (engl. Deep search), i dobit ćete AI koji se ne predstavlja samo kao chatbot – cilja biti vaš “misaoni suputnik”.
Performanse: Brzina susreće pamet
Prvo i najvažnije: Grok 3 je brz. Stvarno brz. Postavili sam mu mnogo pitanja i dobili koherentne, sažete odgovore za manje od dvije sekunde. To nije samo impresivno; to je gotovo jezivo. Superračunalo u Memphisu s preko 100.000 GPU-ova očito ne šali se, a rezultat je AI koji se osjeća žustro čak i pod pritiskom. Za usporedbu, ChatGPT-ov GPT-4o trebao je malo više – oko tri sekunde – na isto pitanje, dok je Gemini zaostao s četiri.
Ali brzina nije sve. Prava snaga Grok 3 leži u njegovim sposobnostima razmišljanja. xAI hvali napredne značajke poput višestrukih misaonih lanaca, samoispravljanja i evaluacije rješenja, što blista u zadacima punim logike. Na Američkom matematičkom ispitu (AIME) 2025. navodno je postigao 93,3% s maksimalnim računalnim postavkama, nadmašivši OpenAI-jev o3-mini-high. To je velika pobjeda za matematičke zaljubljenike i STEM entuzijaste.
Znanstvena pitanja također impresioniraju. Odgovori nisu dovoljno duboki da zamijene čitanje znanstvenih časopisa, ali za brze uvide su i više nego odlični. Kodiranje? Napisao je Python skriptu za igru križić-kružić bez greške, iako je malo posustao na složenijoj simulaciji Settlers of Catan, zahtijevajući mali poticaj da popravi logičku pogrešku. Ipak, za programere je to solidan alat.
Dubinsko pretraživanje: Mješoviti rezultati i dobra otkrića
Jedna od istaknutih značajki Groka 3 je “dubinsko pretraživanje”, predstavljeno kao „tražilica sljedeće generacije“. Za razliku od tradicionalnih alata za pretraživanje, ono ne samo da donosi linkove – čita, sintetizira i filtrira informacije s weba i X postova u stvarnom vremenu. Testirali smo ga s pitanjem „Što ima novog o glasinama o Appleovim proizvodima za 2025.?“ i dobio uredan sažetak: glasine o sklopivom iPhoneu, izvučena iz X postova i tehnoloških blogova, isporučen za manje od 10 sekundi. Nije tako iscrpno kao OpenAI-jevo “dubinsko istraživanje” ili Perplexityjeve ponude – oni izbacuju izvješća od 20+ stranica – ali je brzo i praktično za ležerno istraživanje.
Gdje Grok posustaje je dubina. Postavili smo upit da nam isplanira putovanje u New York. Dao je pristojan plan, ali Perplexity ga je bolje formatirao i uključio mnogo više detalja.
Multimodalna magija: Mnogo više od teksta
Grok 3 nije samo tekstualni virtuoz – multimodalan je, sposoban obrađivati slike i potencijalno više u budućnosti. Učitali smo fotografiju s diska i pitali, „Što je ovo?“ Prepoznao ju je jer se radilo o popularnom meme-u, te nam je linkao X postove sa sličnom tematikom. Generiranje slika također je opcija, te Grok može napraviti vrlo lijepe i zanimljive slike. Što se više “igrate” s time, bolje rezultate ćete dobiti. Odnosno, naučiti ćete kako bolje oblikovati upit i dati mu preciznije upute.
X faktor: Prednost u stvarnom vremenu
Zahvaljujući integraciji s X-om, Grok 3 ima prednost u informacijama u stvarnom vremenu. Upit „Što se događa s lansiranjem Starshipa?“ 23. veljače 2025. donio name je predikciju za 24. veljače – izvučenu iz X postova i Muskovih komentara tijekom livestreama lansiranja. Nije nepogrešiv, ali je to spas za vijesti u nastajanju koje statički modeli ne mogu doseći. To ga čini prirodnim izborom za X korisnike, iako je manje koristan ako niste na dotičnoj platformi.
Ograničenja
Nijedan AI nije savršen, a Grok 3 ima svoje mane. Njegov ton – prožet Muskovim karakterističnim humorom – može djelovati neobično. U redu je za ležerne razgovore, manje za ozbiljna istraživanja. Halucinacije i dalje postoje; ovisno koliko duboko idete u neku temu koju poznajete. Tu ćete vidjeti da može tvrditi da nešto nije istina iako jest. Ili obrnuto.
Kreativnost je još jedna slaba točka. Zamolili sam ga da napiše kratku znanstveno-fantastičnu priču, a isporučio je funkcionalnu, ali bezličnu priču. U usporedbi s ChatGPT-ovim šarmom ili Claudeovom dubinom, to je razočaravajuće. I dok briljira u STEM-u, mekša područja poput kulturne analize ili etičkih rasprava otkrivaju praznine.
Cijena je također problem. Uz 40 eura/mjesečno za X Premium+ ili 30 eura/mjesečno za nadolazeći SuperGrok tier, skuplji je od ChatGPT Plusa ili Gemini Advanced (20 eura/mjesečno). Za tu premiju ne dobivate dvostruku vrijednost – barem ne još.
Try @Grok voice mode and personalities https://t.co/K7gpRNWhAz
— Elon Musk (@elonmusk) February 23, 2025
Presuda: Briljantan, ali ne revolucionaran
Dakle, je li Grok 3 „najpametniji AI na Zemlji“, kako Musk tvrdi? Blizu je u sirovoj logici i brzini. Njegovi AIME i GPQA rezultati potvrđuju xAI-jeve tvrdnje, a integracija s X-om u stvarnom vremenu je ključna značajka za publiku društvenih mreža. Dubinsko pretraživanje dodaje praktičan zaokret, a multimodalni potencijal nagovještava veće stvari. Za programere, istraživače i X fanove, to je uvjerljiv alat koji isporučuje gdje je važno.
Je li revolucionaran? Ne baš. Ne svrgava OpenAI-jev o3 ili Claude 3.5 Sonnet u svestranosti ili dubini. Kreativnost zaostaje, a njegov X-centrični fokus može djelovati usko. Cijena bode oči, posebno kad besplatne alternative poput DeepSeek R1 drže korak u mnogim zadacima. Rani testeri poput Andreja Karpathyja hvale njegov „state of the art“ osjećaj razmišljanja, ali drugi, poput Ethana Mollicka, nazivaju ga „solidnim, ne izvanrednim“.
Za koga je Grok? Grok 3 najsjajnije blista za tehnološke entuzijaste, STEM profesionalce i X korisnike koji žude za brzim, logičnim odgovorima i informacijama u stvarnom vremenu. Ako ste programer koji otklanja greške u kodu, student koji se bori s matematičkim dokazima ili opsjednuti trendovima u određenom polju, vrijedi ga isprobati. Za kreativce, analitičare ili one s ograničenim budžetom, ChatGPT ili Gemini možda i dalje imaju prednost.
Zaključak
Grok 3 je skok naprijed za xAI – dokaz da ne jašu samo na Muskovim leđima. Brz je, pametan i povezan s trenutkom, s hardverom koji pokazuje ozbiljnu snagu. Ali nije AI singularnost o kojoj Muskovi obožavatelji sanjaju. To je “beta” s potencijalom za poliranje, a uz 40 eura/mjesečno, to je kockanje na budućnost. Za sada je briljantan kandidat, ali ne i AI kralj.
Piše: Boris Plavljanić