Tvrtka OpenAI koja stoji iza ChatGPT-ja ne prestaje šokirati svijet. Prošli mjesec bila je najavila kako je razvila novi AI model koji pretvara tekst u videu. Službeni naziv AI modela je Sora i gotovo da nije prošlo mjesec dana od ove objave i već su potvrđene nove vijesti.
Sora izlazi za par mjeseci te postaje službeno dostupan AI model za korisnike!
Rapidne promjene
Tvrtka OpenAI je prošli mjesec sve ostavila bez tekst prilikom objave Sore, novog AI modela koji služi za pretvaranje teksta u video.
Ovaj AI model stvara realistične i izmišljene video scene na temelju tekstualnih uputa. Sora razumije tekstualne upite i pretvara ih u video koji može imati trajanje do jedne minute.
Mogućnost Sore su zaista nevjerojatne i na sljedećoj poveznici sa službene stranice tvrtke OpenAI možete pregledati nekoliko videa koji su stvoreni samo pomoću tekstualnih upita. Konkretni tekstualni upiti na temelju kojih je provedeno stvaranje nalaze se ispod svakog videa.
U trenutnoj fazi Sora ima određene slabosti pa neće uvijek točno napraviti simulaciju kompleksnih upita i možda neće razumjeti neke uzroke ili posljedice. Kao primjer se navodi situacija u kojoj čovjek jede keks, no nakon što učini tu radnju na keksu neće biti vidljivi tragovi zagriza.
Također se može, u određenom smislu, javljati zbunjenost AI modela pa neće razumjeti neke prostorne detalje kao što su lijeva i desna strana ili neće detaljnije prikazati neke dijelove prethodnog tekstualnog opisa.
Bezobzira na to što postoje neka početna ograničenja, Sora će sigurno označiti početak novog razdoblja u primjeni AI tehnologije.
Dolazak za nekoliko mjeseci
Iz tvrtke OpenAI mogli smo čuti kako Sora još uvijek nije objavljena jer istraživači aktivno rade na njenom unaprjeđenju i prilagodbi korisnicima te na suzbijanju potencijalnih opasnosti.
Pošto developeri i istraživači već duže vrijeme rade na optimizaciji AI modela, Mira Murati, tehnička direktorica OpenAI-ja, potvrdila je da Sora izlazi ove godine. U intervjuu za The Wall Street Journal potvrdila je da će Sora postati dostupna za nekoliko mjeseci. Nisu dane konkretne informacije kako će to izgledati, no navedeno je da su podaci pomoću kojih se Sora „trenirala“ ili javno dostupni ili je njihovo korištenje omogućeno putem partnerskih tvrtki kao što je Shutterstock. Murati se nije izjasnila po pitanju videa s društvenih mreža ili potencijalnog korištenja Sore u tom kontekstu.
Troškovi Sore
Murati je također potvrdila kako je Sora iznimno skupa za održavanje, no tvrtka OpenAI želi optimizirati troškove te cjenovno uskladiti svoje usluge sukladno postojećem DALL-E modelu. Za one koji nisu upućeni, generiranje standardnih fotografija pomoću DALL-E 3 modela počinje od 0.04 dolara dok je kod HD fotografija to 0.08 dolara.
U intervjuu je Murati u svojim završnim riječima obećala da će OpenAI dodati još novih značajki u Soru pa tako možemo očekivati integraciju zvuka te ostale mogućnosti uređivanja videa.
Piše: Ervin Mičetić