PočetnaOstaloTechDeepSeek - AI revolucija ili “kineska prevara”?

DeepSeek – AI revolucija ili “kineska prevara”?


U dinamičnom svijetu umjetne inteligencije, novi igrač iz Kine uzdrmao je temelje AI industrije svojim inovativnim pristupom i isplativim rješenjima.

DeepSeek, relativno nova startup tvrtka koju je 2023. godine osnovao Liang Wenfeng, brzo je postala tema interesa među tehnološkim entuzijastima, investitorima i industrijskim gigantima. U nastavku teksta donosimo pregled što je DeepSeek, koje modele koristi, kako se uspoređuje s konkurencijom i kakav je njegov nedavni utjecaj na tehnološko tržište.

Advertisement

 

Što je DeepSeek?

DeepSeek, na prvi pogled, nije samo još jedna AI tvrtka; to je predvodnik u open-source AI zajednici, s ciljem demokratizacije naprednih AI tehnologija. Sa sjedištem u Hangzhouu (Kina), DeepSeek je usmjeren na postizanje onoga što naziva “superinteligentnim AI-jem”, koristeći vlastite modele kako bi izazvao etablirane igrače u industriji.

Filozofija tvrtke temelji se na povećanju dostupnosti AI-ja kroz open-source modele, čime se smanjuju prepreke za manje tvrtke i individualne istraživače i AI eksperte.

DeepSeekovi modeli

DeepSeek je privukao pažnju svojim AI modelima, od kojih svaki ima jedinstvene mogućnosti:

  • DeepSeek-V3: Najviše se govori o ovom modelu, koji ima nevjerojatnih 671 milijardu parametara, što ga čini jednim od najvećih open-source modela. DeepSeek-V3 je bio izuzetno učinkovit u treniranju, zahtijevajući samo 5.5 milijuna dolara računalne snage, što je tek djelić troškova konkurencije. Jake snage su mu programiranje i rješavanje programskih problema, prevođenje tekstova i generiranju teksta, u često nadmašuje modele koje koje ima, odnosno koristi OpenAI, Google i Meta. Potvrđeno na različitim testovima.
  • DeepSeek-R1: Poznat po svojim sposobnostima zaključivanja, R1 je izravni konkurent modelu ChatGPT O1, ali s ključnim prednostima u računalnoj učinkovitosti i troškovima. Sa 670 milijardi parametara, R1 se ističe u složenim zadacima koji zahtijevaju duboko razumijevanje i kreativno razmišljanje.
  • DeepSeek-Coder-V2: Ovaj model je optimiziran za kodiranje i matematičke zadatke, a pokazao se boljim čak i od najnaprednijih modela poput GPT-4 Turbo i Claude 3 Opus. Podržava širok spektar programskih jezika, što ga čini neprocjenjivim alatom za programere. Bilo IT profesionalce ili one tek koji uče programirati.

Ovi modeli koriste inovativne tehnike poput Multi-Token Predictiona i FP8 Mixed Precision Traininga, što doprinosi njihovim visokim performansama i niskim troškovima obuke.

 

DeepSeek

Usporedba s drugim AI alatima

Pojava DeepSeekovih modela potaknula je preispitivanje AI ekosustava:

  • Performanse: DeepSeekovi modeli uspoređeni su s vodećim modelima poput GPT-4o, Llama 3.1 i Claude 3.5 Sonnet, često postižući jednake ili bolje rezultate u pogledu točnosti, brzine i učinkovitosti. Posebno se ističe njegova sposobnost rješavanja složenih zadataka uz manje računalnih resursa.
  • Cijena i dostupnost: Za razliku od zatvorenih modela koji zahtijevaju API pristup i dolaze s visokim troškovima, DeepSeekov open-source pristup omogućuje developerima da pristupe, modificiraju i implementiraju modele bez skrivenih i velikih troškova. Ova strategija otvorila je rasprave o budućnosti razvoja AI-ja i potencijalu open-source modela za poticanje inovacija.
  • Etička i sigurnosna razmatranja: Budući da je open-source, DeepSeek promovira transparentnost, ali također otvara pitanja privatnosti, sigurnosti i etičke upotrebe AI-ja. Ponašanje modela, koje ponekad identificira sebe kao ChatGPT, izazvalo je rasprave o podacima korištenima u treniranju i mogućim pristranostima.

Utjecaj na tehnološko tržište

DeepSeekov ulazak na AI tržište imao je snažan učinak:

  • Reakcije tržišta: Najava DeepSeekovih učinkovitih i moćnih modela odmah je utjecala na burzu. Nvidia, ključni dobavljač GPU-ova za AI obuku, izgubila je gotovo 600 milijardi dolara tržišne vrijednosti u jednom danu, jer su investitori preispitali buduću potražnju za visokokvalitetnim hardverom ako modeli poput DeepSeeka mogu postići jednake rezultate s manjim resursima. Drugi dan se Nvidia opopravila ali se nije vratila na “originalnu” razinu.
  • Inovacija i konkurencija: DeepSeek je natjerao konkurente da preispitaju svoje strategije, posebno kada je riječ o cijenama i potrebi za ogromnim računalnim ulaganjima. To je pokrenulo val inovacija, pri čemu tvrtke traže načine da dostignu DeepSeekovu učinkovitost ili prilagode svoj pristup razvoju AI-ja.
  • Šire implikacije: Osim trenutačnog tržišnog utjecaja, priča o uspjehu DeepSeeka pokazuje potencijal open-source modela u svijetu umjetne inteligencije, moguće mijenjajući ravnotežu moći u tehnološkom razvoju s velikih korporacija prema decentraliziranom, zajedničkom modelu inovacija.

Zaključak

Uspon DeepSeeka jasan je pokazatelj koliko se brzo može promijeniti svijet umjetne inteligencije. Fokusirajući se na visokoučinkovite, isplative AI modele, DeepSeek ne samo da izaziva etablirane tehnološke gigante, već postavlja i nove standarde u razvoju umjetne inteligencije.

Tehnološka zajednica pomno će pratiti kako će ovaj kineski startup nastaviti utjecati na globalne AI trendove, tržišnu dinamiku i demokratizaciju tehnologije. Hoće li to dovesti do inkluzivnijeg tehnološkog ekosustava ili donijeti nove izazove vezane uz sigurnost i etiku, tek ostaje za vidjeti, ali jedno je sigurno: DeepSeek je već ostavio neizbrisiv trag u industriji.

Napomena: Dio u koji nismo detaljno ulazili je sigurnost podataka koje dajete DeepSeeku. Iako u uvjetima korištenja na web stranici DeepSeeka piše da prikupljaju različite vrste podataka, nije poznato u kojim količinama. Stoga, ako planirate koristiti DeepSeek, imajte na umu da iza ove kompanije stoji Kina i da će se o sigurnosti i pouzdanosti DeepSeeka definitivno još mnogo raspravljati u nadolazećim tjednima i mjesecima.

 

Piše: Boris Plavljanić


RELATED ARTICLES

Komentiraj

Please enter your comment!
Please enter your name here

- Advertisment -
Advertisement

Most Popular