Elon Musk și compania sa xAI au lansat oficial Grok 3, cea mai nouă versiune a modelului lor de inteligență artificială. Anunțul, făcut în cadrul unui livestream pe platforma X, a inclus și lansarea versiunilor Grok 3 Reasoning (în beta) și Grok 3 mini Reasoning. Spre deosebire de modelele generative standard, precum GPT-4, aceste modele sunt capabile de raționament avansat, ceea ce le face mai puțin predispuse la halucinații.
xAI susține că Grok 3 depășește modelele rivale de la OpenAI, Google, Anthropic și DeepSeek pe mai multe benchmark-uri cheie. Performanțele sale în competițiile de testare a chatbot-urilor, precum Chatbot Arena, au demonstrat că noul model s-a apropiat considerabil de nivelul liderilor din industrie. Însă, cât de competitiv este cu adevărat Grok 3?
Grok 3 concurează cu modele de top, dar nu suficient pentru a renunța la ChatGPT
Andrej Karpathy, unul dintre membrii fondatori ai OpenAI și fost director AI la Tesla, a testat Grok 3 și a împărtășit primele impresii despre model.
Potrivit acestuia, Grok 3, cu noua funcție Deep Search, „pare să fie în aceeași ligă cu modelele de vârf de la OpenAI, precum o1-pro (care costă 200 de dolari pe lună) și ușor mai bun decât DeepSeek-R1 și Google Gemini 2.0 Flash Thinking”.
Aceasta este o realizare remarcabilă pentru xAI, însă mulți utilizatori nu sunt convinși că Grok 3 oferă suficiente motive pentru a renunța la ChatGPT sau alte modele consacrate. Profesorul de AI Ethan Mollick de la Wharton School a comentat pe X că lansarea acestui model nu schimbă fundamental dinamica industriei, dar demonstrează că dezvoltarea AI continuă într-un ritm accelerat.

xAI a omis un detaliu important în comparația cu OpenAI
xAI a prezentat Grok 3 ca fiind superior modelelor OpenAI, dar OpenAI a contestat rapid această afirmație. Rex Asabor, inginer la OpenAI, a publicat o diagramă actualizată care arată că modelul o3, încă nelansat public, depășește Grok 3 Reasoning la testele de matematică și știință.
Deși xAI probabil nu a avut acces la aceste scoruri înainte de lansare, comparația ridică semne de întrebare cu privire la adevărata poziție a Grok 3 în peisajul AI.
Evoluția rapidă a Grok 3 este un semnal de alarmă pentru competiție
Unul dintre aspectele cele mai impresionante este viteza cu care xAI a reușit să dezvolte Grok 3. În timp ce OpenAI și Google lucrează la modelele lor de ani de zile (din 2013 și respectiv 2016), xAI a fost fondată abia în 2023.
Musk a menționat că Grok 3 a fost antrenat cu de 10 ori mai multă putere de calcul decât Grok 2, utilizând 200.000 de GPU-uri. Aceasta întărește ideea că mai multă putere de calcul duce la modele mai bune, deși unii cercetători, precum profesorul Gary Marcus de la NYU, sunt sceptici că scalarea va duce la o inteligență semnificativ mai avansată.

Limitările lui Grok 3: umor slab și sensibilitate excesivă la dileme etice
La fel ca multe alte modele AI, Grok 3 încă nu excelează în generarea de umor. Karpathy a remarcat că răspunsurile sale la glume sunt banale și repetitive, ceea ce este o problemă comună pentru modelele de limbaj mari.
Un alt test a implicat generarea unui SVG cu un pelican pe bicicletă – o provocare dificilă pentru modelele AI, deoarece acestea nu „văd” imagini așa cum o fac oamenii. Grok 3 a avut rezultate mai bune decât alte modele, dar încă nu perfecte.
În plus, Grok 3 a evitat să răspundă la o întrebare despre dileme etice – în special, dacă ar fi moral justificabil să greșești intenționat un pronume pentru a salva un milion de vieți. Karpathy a considerat că răspunsul evaziv al modelului reflectă o sensibilitate excesivă, lucru care ar putea nemulțumi utilizatorii care își doresc un chatbot mai puțin „corect politic”.
Aceasta este o problemă pentru Musk, care promovează Grok ca fiind alternativa „anti-woke” la modelele OpenAI și Google. Cu toate acestea, Musk susține că modelul este influențat de datele pe care este antrenat și promite să-l facă mai „neutru politic”.
Concluzie: Grok 3 este impresionant, dar nu revoluționar
Faptul că xAI a reușit să ajungă atât de repede la nivelul liderilor AI este un semnal important pentru competiție. Cu toate acestea, Grok 3 nu oferă un salt tehnologic major care să-l facă preferat în locul ChatGPT sau Gemini.
Pentru utilizatorii obișnuiți, Grok 3 este disponibil doar pentru abonații X Premium+, care trebuie să plătească 50 de dolari pe lună – un cost ridicat în comparație cu alternativele gratuite sau mai accesibile.
În concluzie, Grok 3 este un model puternic, dar dacă ești deja utilizator ChatGPT sau Gemini, nu există un motiv suficient de puternic pentru a face schimbarea – cel puțin, deocamdată.