PočetnaSoftverKorisniMeta Llama: novi i drugačiji generativni model umjetne inteligencije

Meta Llama: novi i drugačiji generativni model umjetne inteligencije


Kao i svaka druga velika tvrtka koja je orijentirana prema tehnologiji i tehnološkim postignućima ovih dana, Meta je osmislila svoj vodeći generativni AI model, nazvan Llama. Llama je donekle jedinstven između glavnim modelima po tome što je “otvoren”, što znači da je programeri mogu preuzeti i koristiti kako god žele, uz određena ograničenja. To je u suprotnosti s modelima kao što su Anthropicov Claude, OpenAI-jev GPT-4o, koji pokreće ChatGPT i Googleov Gemini, kojima se može pristupiti samo putem API-ja.

Meta je sklopila i partnerstvo s tvrtkama kao što su AWS, Google Cloud i Microsoft Azure kako bi bile dostupne i verzije Llame iz oblaka. Osim toga, tvrtka je izdala alate koji su osmišljeni baš za detaljno namještanje i prilagodbu modela prema željama korisnika.

Koje su točno posebnosti Llame kao generativnog modela umjetne inteligencije? Koje su prednosti ovog modela, a koji su njegovi nedostaci u odnosu na ostale alate umjetne inteligencije? Na ova i na još neka pitanja odgovore možete saznati u članku koji slijedi.

Llama je obitelj generativnih modela umjetne inteligencije

Postoje čak tri modela: Llama 8B, Llama 70B i Llama 405B. Najnovije verzije su Llama 3.1 8B, Llama 3.1 70B i Llama 3.1 405B, koja je objavljena u srpnju. Svaki od tih modela obučavani su na internetskim stranicama, na različitim jezicima, javnom kodu i datotekama te na sintetičkim podacima, odnosno na podacima koje generiraju drugi generativni model umjetne inteligencije.

Llama 3.1 8B i Llama 3.1 70B mali su, kompaktni modeli namijenjeni za rad na uređajima u rasponu od prijenosnih računala do poslužitelja. Llama 3.1 405B, s druge strane, model je velikih razmjera koji zahtijeva hardver podatkovnog centra. Llama 3.1 8B i Llama 3.1 70B manje su sposobni od Llame 3.1 405B, ali su brži. S

vi Llama modeli imaju kontekstne prozore od 128 000 tokena. Kontekst modela ili kontekstni prozor odnosi se na ulazne podatke, npr. Tekst, koje model uzima u obzir prije generiranja izlaza, npr. dodatnog teksta. Duži kontekst dovest će do toga da modeli neće ”zaboraviti” sadržaj nedavnih dokumenata i uostalom, spriječit će mogućnost ”skretanja” s teme i pogrešnog definiranja stvari, kao i pružanja pogrešnih rezultata.

 

Što sve Llama kao generativni model umjetne inteligencije može učiniti?

Kao i drugi generativni AI modeli, Llama može obavljati niz različitih pomoćnih zadataka, poput kodiranja i odgovaranja na osnovna matematička pitanja, kao i sažimanja dokumenata na osam jezika: engleski, njemački, francuski, talijanski, portugalski, hindu, španjolski i tajlandski. Llama se uglavnom koristi za obavljanje zadataka koji koriste tekst, kao što je analiza i izračunavanje podataka unutar proračunskih tablica i slično. No nažalost, nijedan od Llama modela ne može obraditi niti generirati slike, iako bi se to moglo promijeniti u bliskoj budućnosti.

Svi najnoviji Llama modeli mogu se konfigurirati za korištenje aplikacija, alata i API-ja trećih strana za izvršavanje zadataka. Nadalje, obučeni su za korištenje Brave Search-a za odgovaranje na pitanja o nedavnim događajima, Wolfram Alpha API-ja za upite vezane uz matematiku i znanost te Python tumača za provjeru koda.

Gdje korisnici mogu koristiti Llama generativni model?

Ako želite samo komunicirati s Llamom, imajte na umu da ovaj model pokreće Meta-in AI chatbot na Facebook Messengeru, WhatsAppu, Instagramu, Oculusu i Meta.ai. Programeri koji koriste Llamu mogu preuzeti, koristiti ili namjestiti model na većini popularnih platformi u oblaku.

Meta tvrdi da ima više od 25 partnera koji ”hostiraju” Llamu, uključujući Nvidia-u, Databricks, Groq, Dell i Snowflake. Neki od tih partnera osmislili su dodatne alate i usluge, uključujući alate koji omogućuju modelima referencu vlasničkih podataka i koji omogućuju rad s nižim latencijama.

Meta predlaže korištenje svojih manjih modela, Llama 8B i Llama 70B, za aplikacije opće namjene poput pokretanja chatbota i generiranja koda. Llama 405B, kako tvrde u Meti, treba se koristiti za aktivnosti kao što je proces prijenosa znanja s velikog modela na manji, učinkovitiji model i generiranje sintetičkih podataka za obučavanje ili fino namještanje alternativnih modela.

 

Koje sve alate Meta nudi za Llamu?

Uz Llamu, Meta nudi i sljedeće alate:

  • Llama Guard,
  • Prompt Guard,
  • CyberSecEval

Llama Guard pokušava otkriti potencijalno problematičan sadržaj koji je ubačen ili generiran modelom Llama, uključujući sadržaj koji se odnosi na kriminalne aktivnosti, iskorištavanje djece, kršenja autorskih prava, promoviranje različitih vrsta uznemirujućeg sadržaja i seksualno zlostavljanje. Programeri mogu prilagoditi kategorije blokiranog sadržaja i primijeniti blokade na sve jezike koje Llama podržava.

Prompt Guard može blokirati tekst koji je namijenjen Llami, ali samo onaj tekst koji treba “napasti” model i natjerati ga na ponašanje koje ili nije predviđeno ili koje je štetno. Meta tvrdi da se Llama Guard može obraniti od eksplicitno zlonamjernih upita.

CyberSecEval nije toliko alat koliko je zbirka mjerila koja služi za mjerenje sigurnosti modela. CyberSecEval može procijeniti rizik koji model Llama predstavlja za programere aplikacija i krajnje korisnike, u područjima kao što su “automatizirani društveni inženjering” i “skaliranje ofenzivnih kibernetskih aktivnosti i operacija”.

 

Koja su ograničenja s kojima se suočava Llama?

Kako i svaki drugi generativni model umjetne inteligencije i Llama se suočava s određenim ograničenjima.

Na primjer, nije jasno je li Meta ”obučila” Llamu o sadržaju koji je zaštićen autorskim pravima. Ako jest, korisnici bi mogli biti odgovorni za kršenje, ako nesvjesno koriste isječak koji je zaštićen autorskim pravima, a kojeg je model povratio i koristio.

Programiranje je još jedno područje u vezi kojeg treba pripaziti. Razlog za ovo je jasan: Llama bi, kao i svaki drugi generativni model umjetne inteligencije koji posjeduje mogućnosti ”programiranja” mogla dati pogrešan ili jednostavno loš kod.

Kao što je slučaj sa svakim drugim generativnim modelom umjetne inteligencije, najbolje je da čovjek, stručnjak ovisno o području o kojem se govori, sam pregleda završni rezultat. Llama, bez obzira na svoje mogućnosti i potencijal i dalje je samo program, zbir kodova koji operira na temelju točno određenih zakonitosti, što znači da Llama, kao niti jedan drugi AI model, ne može kreativno ništa sam osmisliti.

 

 

Alan Milić


RELATED ARTICLES

Komentiraj

Please enter your comment!
Please enter your name here

- Advertisment -

Most Popular