ChatGPT je najpopularniji AI chatbot koji, kako vrijeme ide, dobiva sve više mogućnosti i postaje neizostavni dio radnih aktivnosti bilo da se radi o privatnim ili poslovnim korisnicima.
U ovom trenutku velika novost je da ChatGPT dobiva vrlo značajnu nadogradnju generiranja fotografija koja pomalo nestvarno izgleda i korisnici dobivaju zaista velike mogućnosti.
Ono što je, nažalost, popratna strana ovakvih nadogradnji je ugrožavanje brojnih poslova kojima je osnovna djelatnost uređivanje i dizajn fotografija.
Promjena modela za generiranje fotografija
Novost kod ChatGPT-ja je da se tvrtka OpenAI ipak nije odlučila na korištenje odvojenog modela za generiranje fotografija kao što je Dall-E, već će novi, napredni, model biti dio GPT-4o modela koji se već koristi za sve funkcije.
Na tržištu trenutno postoje modeli za generiranje fotografija koji mogu stvoriti zaista nevjerojatne fotografije, no svima je zajednička mana što se baš ne snalaze kod stvaranja fotografija koje uključuju tekst, logo i ostale objekte koji se koriste u svakodnevici.
OpenAI tvrdi da ovaj novi GPT-4o model za generiranje fotografija s navedenim nema problema pa može precizno renderirati tekst i slijediti detaljne upute na način da uspoređuje dostupne baze podataka s kontekstom razgovora s korisnikom. Drugim riječima, novi model korisnicima omogućuje modificiranje učitanih fotografija i izradu novih gdje čak i već učitana fotografija može biti vizualna inspiracija za daljnje stvaranje.
Koje su mogućnosti novog modela?
Novi ChatGPT-jev model za generiranje fotografija predstavljen je na službenoj stranici tvrtke OpenAI.
U nastavku ćemo nabrojati neke od zanimljivih novih funkcija koje će biti dostupne korisnicima.
Renderiranje teksta
Korisnici koji žele da se generira fotografija koja sadrži i tekst sada će to moći uspješnije raditi jer je novi ChatGPT-jev model mnogo uspješniji u tome.
Fotografije koje će sadržavati tekst ili simbole sada se bolje i uspješnije generiraju, a završni rezultati su, prema dostupnim primjerima na službenoj web stranici, zaista fascinantni.
Konzistentno generiranje
Pošto je generiranja fotografija sada bazični dio modela kojeg koristi ChatGPT, korisnici mogu putem prirodnog govora izvoditi preinake.
GPT-4o model osigurava da se fotografija i tekst unutar nje grade na temelju konteksta razgovora s korisnikom pa se na taj način osigurava konzistentnost rezultata generiranja fotografije.
Slijeđenje uputa
GPT-4o slijedi detaljne upute s pažnjom i naglaskom na detalje. Dok drugi slični modeli imaju probleme kod generiranje 5 do 8 objekata, GPT-4o može bez problema upravljati generiranjem 10 do 20 objekata.
Isti objekti također se usko vežu uz korisnikove upute pa je stoga i bolja kontrola završnih rezultata generiranja.
Učenje unutar konteksta
GPT-4o može analizirati i učiti od fotografija koje je korisnik prethodno učitao. Na taj način integrira njihove detalje u ukupni kontekst koji je podloga za generiranje novih fotografija.
Znanje o fotografijama
GPT-4o model omogućuje da se povezuju podaci i znanje na liniji između teksta i fotografije pa na taj način dobivaju se mnogo pametniji i efikasniji konačni rezultati koji bolje odgovaraju prethodnim uputama.
Stil i realističnost fotografija
GPT-4o toliko je svestran model da ima mogućnost generiranja različitih stilova fotografija te ih može prenijeti sa sjajnom uvjerljivosti koja podiže realističnost na nevjerojatnu razinu.
Ograničenja novog modela
Novi ChatGPT-jev model za generiranje ima i određena ograničenja na kojima se još radi.
Ona su sljedeća:
- Ponekad može doći do izrezivanja dužih fotografija, uglavnom pri dnu.
- Generiranje može izmisliti informacije, a posebno kod upita s ne tako detaljnim kontekstom.
- Kada se generiranje fotografija pouzdaje u određenu bazu znanja, problem može biti točno renderiranje 10 do 20 različitih koncepata odjednom (npr. periodni sustav elemenata).
- Ponekad dolazi do problema s renderiranjem jezika koji nisu latinskog podrijetla te određena slova i znakovi mogu biti netočno prikazani, posebno kada se radi o onima koji su kompleksniji.
- Zahtjevi za uređivanje posebnih dijelova fotografija (npr. greške kod upisa) ne provode se uvijek efektivno i mogu promijeniti ostale dijelove fotografije za čijim mijenjanjem nije postojala namjera.
- Pojavljuju se problemi kada se traži renderiranje detaljnih informacija unutar male podatkovne veličine.
Tko sve može koristiti novi model za generiranje fotografija?
S obzirom na to da novi ChatGPT-jev model za generiranje fotografija donosi značajne inovacije, izvrsna je vijest kako će biti dostupan na svim verzijama popularnog AI chatbota.
GPT-4o model s generiranjem fotografija dostupan je na Plus, Pro, Team i besplatnoj (Free) verziji ChatGPT-ja, a ubrzo dolazi i na Enterprise te Edu verzije.
Developeri će mogućnost za generiranje fotografija unutar aplikacijskog programskog sučelja dobiti za nekoliko tjedana.
Ugroza poslova i radnih mjesta?
Ovako sveobuhvatna nadogradnja kod mogućnosti generiranja fotografija mora se promatrati i u kontekstu ugroze poslova i radnih mjesta.
Novi GPT-4o model sada omogućuje korisniku da putem opisa u razgovoru, koji može ići do najsitnijih detalja, dobije generiranu fotografiju u manje od jedne minute.
Ovakva efikasnost u izradi novih fotografija prema točno utvrđenim uputama mogla bi se još intenzivnije reflektirati na brojne poslove i radna mjesta kojima je to osnovna djelatnost.
Mogućnosti ChatGPT-ja s vremenom će postati sve veće i obuhvatnije pa se zaista možemo pitati gdje mu je granica i koje će još poslove moći zamijeniti.
Službena objava tvrtke OpenAI o novim mogućnostima ChatGPT-ja nalazi se na sljedećoj poveznici.
Ervin Mičetić