Orice generator de imagini AI devine pe zi ce trece tot mai puternic, dar există un mic inconvenient: se bazează, de obicei, pe modele lingvistice de mari dimensiuni (LLM) extrem de gurmande, care rulează în cloud. Acum, cercetătorii tocmai au schimbat regulile jocului. Au construit un nou sistem capabil să genereze imagini de înaltă calitate folosind de 10 ori mai puțini pași de procesare.

noul generator de imagini AI pe smartphone
Noul generator de imagini AI pe smartphone generează imagini de 10 ori mai repede

Rezultatul? Un AI suficient de rapid și eficient pentru a rula direct și local pe telefoanele și laptopurile noastre. Mai mult, este o alternativă considerabil mai sigură și mai ecologică în comparație cu sistemele AI care depind de centrele de date uriașe, cunoscute pentru consumul lor masiv de energie.

Tehnologia a fost botezată Stable Diffusion 3.5 Flash (SD3.5-Flash) și a luat naștere dintr-o colaborare fascinantă între cercetătorii de la Institutul pentru AI Centrată pe Oameni din cadrul Universității din Surrey și compania Stability AI. Mecanismele interne ale noului model au fost detaliate într-un studiu încărcat pe 25 septembrie 2025 în baza de date de preprint arXiv. Vestea cu adevărat mare a venit pe 4 martie, printr-o declarație oficială în care se anunța că gigantul Lenovo a licențiat deja modelul pentru a-l integra în viitoarea sa platformă de AI pe dispozitiv. Concluzia este simplă: acest sistem va apărea în curând pe viitoarele smartphone-uri, tablete și laptopuri de pe piață.

Obiectivul principal al cercetătorilor a fost unul simplu, dar incredibil de ambițios: să scoată AI-ul generativ puternic din centrele de date îndepărtate și să îl aducă exact acolo unde este nevoie de el – pe dispozitivele pe care oamenii le folosesc în viața de zi cu zi. Această mutare nu are doar implicații majore asupra protejării mediului și a confidențialității, dar ar putea transforma orice generator de imagini AI într-o unealtă mai rapidă ca niciodată.

De ce este atât de lent un generator de imagini AI obișnuit?

Pentru a înțelege inovația, trebuie să ne uităm sub capotă. Majoritatea sistemelor moderne de transformare a textului în imagine folosesc o tehnică numită „difuzie”. Aceste modele AI pornesc de la un zgomot vizual aleatoriu – imaginați-vă, în esență, o grilă de pixeli umplută cu valori complet aleatorii – și îl rafinează treptat, până când devine o imagine clară, printr-o secvență lungă de pași.

În mod obișnuit, acest proces necesită între 30 și 50 de iterații obositoare pentru a produce o imagine finală, iar fiecare etapă devorează o putere de calcul semnificativă. Acesta este motivul pentru care un generator de imagini AI popular nu rulează de obicei pe telefonul tău, ci pe clustere uriașe de unități de procesare grafică (GPU) aflate pe servere la distanță, prin cloud. Arhitectura este excelentă pentru calitatea imaginilor, dar vine cu limitări practice severe: modelele sunt mult mai lente, consumă enorm de multă energie și te obligă să trimiți constant solicitări sau imagini către servere, așteptând apoi un răspuns.

• CITEŞTE ŞI:  Cercetătorii au descoperit o nouă celulă, prezisă pentru prima oară în urmă cu 100 de ani

Prin noul lor studiu, oamenii de știință și-au propus exact să elimine acest blocaj. SD3.5-Flash scurtează dramatic întregul flux de lucru. În loc de zeci de iterații, modelul poate produce o imagine în doar patru pași de procesare.

Cum reușește această performanță? Sistemul comprimă procesul de difuzie într-o formă hiper-eficientă, fără a sacrifica însă calitatea imaginii. Simplificând, AI-ul a învățat cum să „sară” prin procesul de reglaj fin făcând salturi mult mai mari, în loc să avanseze lent, pas cu pas. Totuși, autorii studiului recunosc că principala provocare tehnică a fost exact aceasta: menținerea calității vizuale superioare în timp ce se taie drastic din numărul de pași.

„Modelul nostru SD3.5-Flash permite utilizatorilor să creeze imagini din descrieri textuale în întregime pe dispozitivul lor, fără ca datele să părăsească hardware-ul lor. Atingerea acestui nivel de eficiență este o provocare tehnică, deoarece necesită comprimarea unui model de difuzie pentru a rula în doar câțiva pași, menținând în același timp calitatea., a explicat Hmrishav Bandyopadhyay, cercetător doctorand la Universitatea din Surrey, care a dezvoltat modelul în timpul unui stagiu la Stability AI.

Practic, reducerea pașilor de inferență înseamnă că modelul necesită mult mai puține resurse de calcul, deschizând calea pentru a rula fără probleme pe hardware-ul pe care îl avem deja acasă.

Triumful celor trei: Confidențialitate, Viteză și Sustenabilitate

Scoaterea AI-ului generativ din cloud și rularea sa la nivel local vine cu un pachet imens de avantaje. Primul și cel mai evident este confidențialitatea. Dacă modelul AI funcționează exclusiv pe dispozitivul tău, solicitările pe care le scrii și imaginile generate nu mai pleacă niciodată spre servere externe. Asta reduce la zero riscul expunerii, interceptării sau utilizării abuzive a datelor tale.

Al doilea mare câștig este viteza. Eliminând etapele lungi de procesare și latența rețelei de internet, utilizarea unui generator de imagini AI ar putea oferi un rezultat vizual aproape instantaneu.

Nu în ultimul rând, trebuie să vorbim despre mediu. Modelele AI masive din cloud „beau” și „mănâncă” cantități substanțiale de apă și energie prin simpla operare a centrelor de date. Un model local, mult mai ușor, poate reduce aceste cerințe în mod dramatic.

• CITEŞTE ŞI:  Creierele mai mari ale oamenilor vin cu un preț tragic, potrivit unui studiu

Yi-Zhe Song, directorul SketchX Lab din cadrul Universității din Surrey, subliniază că obiectivul final este de a aduce tehnologia mai aproape de realitatea practică a utilizatorului de rând: „SD3.5-Flash pune un instrument creativ puternic direct în mâinile utilizatorilor, păstrând în același timp confidențialitatea datelor lor și reducând cerințele energetice asociate procesării în cloud.”

Pentru a fi siguri că scurtătura nu strică rezultatul, cercetătorii au testat riguros SD3.5-Flash împotriva fluxurilor tradiționale de difuzie. Au folosit standarde de referință stricte, evaluând fidelitatea imaginii și capacitatea sistemului de a respecta prompturile textuale – metrici utilizate pe scară largă în machine learning pentru a evalua generatoarele vizuale. Testele au demonstrat clar: în ciuda reducerii etapelor de la 30-50 la doar patru, noul model oferă rezultate vizuale similare cu cele ale sistemelor tradiționale greoaie.

Din laborator, direct în buzunarul tău

Partea cu adevărat entuziasmantă este că această tehnologie nu a rămas doar o curiozitate academică, ci se îndreaptă rapid către rafturile magazinelor. Lenovo a licențiat deja Stable Diffusion 3.5 Flash pentru viitoarea sa platformă Personal Ambient Intelligence, denumită Qira, o inițiativă al cărei scop asumat este aducerea AI-ului direct pe dispozitivele de consum.

În curând, vei putea folosi un generator de imagini AI pentru a crea grafici complexe direct pe laptopul, tableta sau smartphone-ul tău, chiar și atunci când nu ești conectat la internet. Primele indicii reale au apărut deja în luna martie, când Lenovo a prezentat primul set de dispozitive compatibile cu Qira, inclusiv câteva concepte noi, ceea ce sugerează că lansarea pe scară largă bate la ușă.

Dacă această mișcare va avea succesul anticipat, am putea asista la o schimbare de paradigmă în modul în care folosim AI-ul generativ. Vom face trecerea de la o infrastructură masivă, centralizată, la instrumente care rulează local, „la margine” (edge computing), încorporate nativ în dispozitivele noastre de zi cu zi. Pentru cercetători, acesta este doar începutul unui efort mai amplu de a face inteligența artificială nu doar spectaculoasă, ci și eficientă și practică.

Deși comprimarea modelelor masive fără a sacrifica calitatea rămâne un domeniu efervescent de cercetare, Stable Diffusion 3.5 Flash ne arată un lucru clar: prăpastia uriașă dintre sistemele AI puternice și hardware-ul de consum se micșorează în ritm accelerat. Dacă integrarea plănuită de companii precum Lenovo decurge conform planului, următorul tău generator de imagini AI nu va mai pluti undeva într-un cloud îndepărtat, ci va sta liniștit chiar la tine în buzunar.

Fii mereu la curent cu noutățile!

Abonează-te acum la newsletter-ul nostru și primești, direct pe email, cele mai interesante articole și recomandări — gratuit și fără mesaje nedorite.

Abonează-te acum