În timp ce ChatGPT de la OpenAI a devenit un fenomen la nivel mondial și unul dintre produsele de consum cu cea mai rapidă creștere vreodată, Bard de la Google a fost ceva după acest succes. Chatbot-ul a câștigat în mod constant noi funcții, inclusiv accesul la datele dvs. prin alte produse Google, dar răspunsurile și informațiile sale au părut rareori să rivalizeze cu ceea ce obțineți de la ChatGPT și alți roboți care folosesc GPT-3 și GPT-4.
Cazul pentru Bard poate că tocmai a devenit mai convingător: de astăzi, pentru utilizatorii vorbitori de limba engleză din 170 de țări, Bard este acum alimentat de noul model Gemini de la Google, despre care spune că se potrivește și chiar depășește tehnologia OpenAI în mai multe moduri. (Google spune că Gemeni va fi disponibil în mai multe limbi și țări „în viitorul apropiat”).
Bard rulează acum Gemini Pro, nivelul de mijloc al seriei Gemini. Ultra este cel mai mare și cel mai lent, dar cel mai capabil, Nano este mic și rapid și destinat sarcinilor de pe dispozitiv, iar Pro se află chiar la mijloc. Este menită să fie versiunea Goldilocks a modelului, într-adevăr: rapidă și eficientă, în același timp cât mai capabilă posibil.
Sissie Hsiao, care conduce Bard și Asistent la Google, a declarat într-o conferință de presă că Gemeni reprezintă „cel mai mare și cel mai bun upgrade de până acum” pentru Bard. Ar trebui să fie o îmbunătățire semnificativă pentru aproape tot ceea ce face deja Bard: rezumat, brainstorming, scris și altele asemenea.
Sundar Pichai, CEO-ul Google, a spus că, în timpul testării sale, a descoperit că nu există atât de mult o funcție nouă, ci doar o îmbunătățire generală. „Cred că oamenii vor descoperi că produsul a devenit mult mai bun”, spune el. „Înțelege mai bine intenția lor, răspunde mai bine. Este mai real, de calitate superioară. Dacă încercați să codificați, este mai bine!”
În acest moment, Bard este încă doar un chatbot: tastezi, tastează înapoi. Dar urmează o nouă versiune a lui Bard, care ar putea fi mult mai mult. Anul viitor, Google intenționează să lanseze o previzualizare a „Bard Advanced”, cu Gemini Ultra, care este cea mai puternică și capabilă versiune a noului model de limbă mare al Google. Gemini Ultra este, de asemenea, versiunea multimodală a modelului, ceea ce înseamnă că poate accepta și crea imagini, audio și video pe lângă doar text.
Interacțiunile non-text este, se pare, partea la care Gemeni se descurcă cel mai bine, spune Demis Hassabis, șeful Google DeepMind. „L-am construit pentru a fi multimodal de la zero”, spune el. „Aceasta este una dintre noile capabilități pe care le are… tipurile de integrare și raționament perfectă pe care le poate face în diferite modalități.”
Demonstrațiile Google au inclus YouTuberul Mark Rober care folosește Bard pentru a realiza avionul de hârtie perfect – inclusiv făcând fotografii ale design-urilor sale pentru a obține feedback furnizat de AI – și părinții care încărcau imagini cu temele copiilor lor pentru a obține ajutor pentru a afla unde a mers prost matematica.
Deocamdată, toate acestea sunt doar demonstrații și videoclipuri promoționale. Pichai spune că se gândește la această lansare atât ca la un mare moment pentru Bard, cât și la începutul erei Gemeni. Dar dacă benchmarking-ul Google este corect, noul model ar putea face deja din Bard un chatbot la fel de bun ca ChatGPT. Și aceasta este deja o performanță destul de impresionantă.