Na ovogodišnjoj Google I/O 2024 konferenciji saznali smo o planovima kompanije. Elementarni dio Googleovog poslovanja bit će umjetna inteligencija, koju Google planira implementirati u svoje proizvode i usluge. Uzmimo za primjer Google tražilicu. Google će koristiti tzv. AI Overview funkciju za pružanje preciznih odgovora na pitanja korisnika.
Zahvaljujući umjetnoj inteligenciji, korisnici će moći brzo dobiti odgovore na pitanje bez potrebe za pretraživanjem mnogih web stranica. U početku će funkcija biti dostupna samo u SAD-u i na engleskom jeziku, no kasnije bi trebala doći i u ostatak svijeta i s podrškom za više jezika. Google će korisnicima interneta pomoći isplanirati doslovno sve. Bilo da je u pitanju planiranje putovanja ili kućne aktivnosti, sve što treba je poslati upit i tražilica će učiniti ostalo.
Navedena je i mogućnost pretraživanja korištenjem videa. Sve što je potrebno je kamerom svog telefona snimiti predmet i umjetna inteligencija će tada iskoristiti svoju moć i generirati informacija koje sadrže prijedloge za rješenje problema ili druge korisne materijale.
Promjene očekuju i operativni sustav Android. Gemini AI postaje dio Androida, pa će korisnici moći iskoristiti prednosti novih funkcija. Uz pomoć Geminija bit će moguće komunicirati sa svime što se događa na ekranu pametnog telefona. Kada kroz njega generiramo sliku, moći ćemo je izravno prenijeti na drugo mjesto. Također će biti moguće postaviti pitanje o videozapisu koji se reproducira na YouTubeu, a AI će moći odgovoriti na postavljeno pitanje, pa čak pripremiti sažetak PDF datoteke koju gledate ili pripremiti sadržaj tekstualne poruke.
Kao i Circle to Search funkcija, Geminijeve nove funkcije imaju za cilj pomoći korisnicima pri rješavanju stvari bez potrebe za promjenom aplikacija. Kada smo već spomenuli Circle to Search, koji bi sada trebao pomoći učenicima u izradi domaćih zadaća. Sve što učenik treba učiniti jeste zaokružiti matematički zadatak i umjetna inteligencija će mu ponuditi rješenje.
U Android će također biti ugrađen Gemini Nano, jezični model koji karakterizira visoka multimodalnost. Tijekom glasovnog poziva, Gemini Nano će upozoriti na prevaru i pomoći da korisničke informacije ostanu na sigurnom. Model će s pomoću TalkBack funkcije pomoći slijepim ili slabovidnim osobama dobiti detaljnije opise prikazanih slika. Ono što je važno, opisi će raditi lokalno na uređaju, tako da neće biti potrebe za mrežnom vezom.
Google nije zaboravio na aplikaciju Photos. Najavljena je nova funkcija pod nazivom Ask Photos, koja bi trebala stići svim korisnicima u sljedećih nekoliko mjeseci. Što točno očekivati od nje? Dizajnirana je tako da vam pomogne u pronalaženju slike koja vam u datom trenutku treba. Samo postavite pitanje, pričekajte neko vrijeme i uživajte u rezultatu bez potrebe za listanjem kroz galeriju.
Umjetna inteligencija će vas podsjetiti i na stvari koje su vam možda smetnule s uma. Restoran u kojem ste jeli omiljenu pizzu ili kakve su dekoracije bile na rođendanima proteklih godina, sve će to biti moguće saznati. Ako vam se ne sviđa rezultat koji vam je Ask Photos prikazao, možete napraviti izmjenu. Što je s privatnošću fotografija? Ne može se poreći da objavljene fotografije mogu biti vrlo osobne i sadržavati informacije koje bismo radije zadržali za sebe.
S tim u vezi, upiti se ne koriste za oglašavanje, a zaposleni neće pregledavati vaše razgovore i osobne podatke u Ask Photos, osim u slučaju kada treba reagirati na zloupotrebu ili štetu. Također nema govora o treniranju nijednog generativnog AI proizvoda izvan Google Photos na ovim osobnim podatcima, uključujući druge Gemini modele i proizvode.
Novitetima nije kraj. Projekt Astra je Googleov odgovor na nove AI asistente koji će moći razumjeti svijet oko nas i pomoći nam po mnogim pitanjima. Ne tako davno, OpenAI je predstavio GPT-4o, novi multimodalni jezični model sposoban za realistične glasovne razgovore i interakciju preko teksta i slike. No, dan kasnije, na konferenciji Google I/O 2024, prikazana je konkurentna, identična funkcionalnost, koja se zove Project Astra.
Project Astra može razumjeti i reagirati na okolinu kao što to čine ljudi i može prihvatiti i zapamtiti ono što vidi i čuje kako bi razumio kontekst i poduzeo nešto. Google obavještava da će s vremenom neke od prikazanih funkcionalnosti biti dostupne u okviru proizvoda ove tvrtke.
Google je na svojoj I/O konferenciji predstavio svojevrsni odgovor na OpenAI-jev AI alat pod nazivom Sora. Google je službeno predstavio svoj novi AI generator videa pod nazivom Veo, koji će postati izravna konkurencija modelu Sora iz OpenAI-ja.
Google Veo može stvarati Full HD videozapise koji traju duže od 60 sekundi, a u stanju razumjeti razne pojmove koji se koriste u filmskoj industriji, poput “timelapsea”, te će kreirati video od fotorealizma, nadrealizma i animacije. Generirani video također možemo na neki način urediti tako da odredimo što u njemu treba promijeniti. Googleov Veo još nije dostupan javnosti. Međutim, tvrtka želi prikupiti povratne informacije od kreatora, a planira se i dolazak Veo na YouTube Shorts.
Piše: Marijan Živković