DeepSeek, start-up-ul chinez de inteligență artificială, a zguduit lumea tehnologiei odată cu lansarea noului său model, R1, poziționându-se ca un concurent redutabil pentru giganții americani ai tehnologiei, precum OpenAI, Google și Meta. Dar ce anume stârnește acest val de entuziasm – și de anxietate?

Ce este modelul DeepSeek R1?

DeepSeek dezvoltă modele lingvistice mari (LLM), similare cu sistemele AI utilizate de ChatGPT (OpenAI), LLaMA (Meta) sau Gemini (Google). Aceste modele sunt antrenate pe cantități masive de date textuale – cărți, articole de știri și pagini web – din care învață să genereze propoziții coerente. LLM-urile sunt folosite într-o gamă variată de aplicații, de la scrierea de cod și rezolvarea problemelor până la generarea de conținut și redactarea articolelor de știri (cu rezultate variabile).

La 20 ianuarie 2025, DeepSeek a lansat cel mai recent model al său, denumit R1. În câteva cuvinte: este extrem de inteligent, foarte eficient și surprinzător de accesibil.

Din punct de vedere tehnic, DeepSeek susține că R1 rivalizează sau chiar depășește modelele concurente, inclusiv OpenAI o1, pe baza mai multor parametri. Această afirmație a fost susținută de investitori și experți în tehnologie.[sursa]

DeepSeek
DeepSeek R1 a dat pestecap marile companii de tehnologie

Un aspect esențial este eficiența sa: R1 poate îndeplini sarcini complexe folosind mai puțină putere de calcul și cipuri mai puțin performante, obținând rezultate similare sau chiar mai bune decât modelele rivale.

Un alt punct de atracție major: DeepSeek-R1 este open-access, ceea ce înseamnă că este disponibil gratuit pentru utilizare publică. Codul său poate fi accesat de utilizatori, permițând integrarea în aplicații proprii sau utilizarea sa în cercetare și dezvoltare.

„DeepSeek a demonstrat că modelele lingvistice mari pot rezolva sarcini complexe cu mai puține resurse de calcul și mai puține date pentru antrenare. Acest lucru deschide calea către chatbots mai rapide, mai eficiente, care consumă mai puțină energie și sunt mai puțin costisitoare de dezvoltat.”, a declarat Wolfgang Meyer, profesor asociat în STEM la Universitatea din Australia de Sud.

• CITEŞTE ŞI:  Galaxiile UFO, ciudatele obiecte cosmice pe care astronomii le pot vedea acum cu Telescopul James Webb

„Deși procesul de antrenare și capacitățile DeepSeek nu sunt pe deplin înțelese, rezultatele sale ar putea influența viitoarele direcții în dezvoltarea chatbots-urilor.”, a adăugat Meyer.

Cu toate acestea, DeepSeek nu este lipsit de controverse. Criticii au evidențiat conformitatea sa cu cenzura impusă de guvernul chinez. De exemplu, modelul refuză să răspundă la întrebări despre protestele din Piața Tiananmen din 1989, un subiect pe care Partidul Comunist Chinez încearcă constant să-l minimalizeze.

De asemenea, există îngrijorări legate de confidențialitatea datelor. Unii comentatori susțin că DeepSeek ar trimite volume mari de date ale utilizatorilor din SUA în China, ceea ce ridică semne de întrebare privind securitatea și protecția datelor personale.

Cine se află în spatele DeepSeek?

DeepSeek este o companie de inteligență artificială cu sediul în Hangzhou, un oraș recunoscut ca un hub al tehnologiei în China, care găzduiește și giganți precum Alibaba – considerat echivalentul chinez al Amazonului.

Publicitate

Compania a fost fondată în 2023 de Liang Wenfeng, un antreprenor de 40 de ani, cunoscut pentru succesul său în cadrul fondului de hedging High-Flyer. Potrivit Financial Times, Wenfeng a achiziționat mii de cipuri Nvidia înainte ca administrația Biden să impună restricții privind exporturile de cipuri către China, folosindu-le pentru a dezvolta un proiect secundar de inteligență artificială.

„Când l-am întâlnit prima dată, părea un tip tocilar, cu o coafură teribilă, care vorbea despre construirea unui cluster de 10.000 de cipuri pentru a-și antrena propriile modele. Nu l-am luat în serios.”, a declarat un partener de afaceri al lui Liang pentru Financial Times.[sursa]

„Nu a putut să își articuleze viziunea decât spunând: ‘Vreau să construiesc asta și va fi o schimbare de joc.’ Am crezut că un astfel de proiect era posibil doar pentru giganți precum ByteDance și Alibaba.”, a adăugat acesta.

• CITEŞTE ŞI:  Urme de mâini vechi de 12.600 de ani arată că oamenii au trăit în Himalaya mult mai devreme decât se credea

DeepSeek a raportat că a cheltuit doar 5,6 milioane de dolari pentru puterea de calcul necesară dezvoltării modelului său de bază. Deși această sumă nu acoperă costul total al proiectului, ea este semnificativ mai mică decât investițiile de sute de milioane sau chiar miliarde de dolari alocate de companiile americane pentru dezvoltarea inteligenței artificiale.

Această abordare rentabilă și simplificată este considerată un factor-cheie în succesul modelului DeepSeek, care a stârnit un val de interes în industria tehnologiei.

„Modelul open-source al DeepSeek a fost dezvoltat la un cost mult mai mic și necesită un hardware mai puțin performant pentru a funcționa, comparativ cu liderii de piață actuali, precum ChatGPT.”, a explicat Dr. William Darler de la University of Leicester School of Business.

„Consensul inițial al experților este că modelele DeepSeek par robuste, dar le lipsește în prezent volumul de date de formare necesar pentru a concura cu cele mai bune modele cu sursă închisă. Acest lucru ar putea forța organizațiile de IA generativă să își regândească modelele de afaceri, ceea ce ar putea reprezenta o veste bună pentru organizațiile și consumatorii care consideră costurile actuale prohibitive.”, a adăugat Darler.

Care este problema cu DeepSeek?

Luni, 27 ianuarie, la închiderea piețelor, valoarea de piață a producătorului american de microcipuri Nvidia a suferit o pierdere de aproape 600 de miliarde de dolari – cea mai mare scădere într-o singură zi înregistrată vreodată de o companie. Această prăbușire a generat panică printre investitorii din SUA și Europa.

În aceeași zi, DeepSeek a depășit OpenAI, devenind cea mai descărcată aplicație gratuită din App Store-ul Apple din SUA.

Ascensiunea rapidă a DeepSeek semnalează că societățile americane de inteligență artificială se confruntă acum cu o concurență globală semnificativă. SUA nu mai dețin monopolul în acest domeniu. Unii experți consideră că această competiție cu companiile chineze de IA ar putea stimula progresul și inovația printr-o concurență sănătoasă.

• CITEŞTE ŞI:  Oamenii de știință au descoperit un "întrerupător de frică" în creier și modul în care se poate opri această senzaţie

Marc Andreessen, capitalist de risc din Silicon Valley, a scris pe X: „DeepSeek-R1 este momentul Sputnik al inteligenței artificiale.”, făcând referire la satelitul sovietic care a declanșat cursa spațială în timpul Războiului Rece și a deschis calea pentru misiunile Apollo.

Pe de altă parte, creșterea influenței companiilor chineze de inteligență artificială amenință supremația tehnologică a SUA, provocând deja perturbări în industria americană de profil. Această situație este de așteptat să intensifice tensiunile geopolitice dintre cele două superputeri.

„Acesta este cel mai clar semnal al direcției în care se îndreaptă viitorul. IA va fi tehnologia definitorie a timpului nostru, iar cursa pentru a o domina va modela piețele globale pentru următoarele decenii.”, a declarat Nigel Green, CEO al gigantului global de consultanță financiară deVere Group.

„Progresele tehnologice ale Chinei, în special în domeniul inteligenței artificiale, erodează capacitatea SUA de a folosi tarifele ca instrument de menținere a supremației globale. Echilibrul de putere se schimbă, iar Washingtonul trebuie să accepte că nu mai poate dicta întotdeauna condițiile Beijingului, așa cum a făcut-o în trecut. Această nouă realitate va avea consecințe de amploare pentru investitori și factorii de decizie politică.”, a adăugat el.

Abonaţi-vă la newsletter folosind butonul de mai jos, pentru a primi - periodic şi gratuit - o notificare pe adresa de email atunci când publicăm articole interesante: