Google a început implementarea accesului privat la modelele sale generative AI Veo și Imagen 3, disponibile pentru utilizatorii pachetului Vertex AI Google Cloud. De astăzi, clienții pot utiliza Veo pentru a genera videoclipuri pornind de la texte sau imagini, iar începând de săptămâna viitoare, Imagen 3, modelul de ultimă generație pentru transformarea textului în imagini, va fi disponibil pentru aceiași utilizatori.
Veo: Primul model de tip imagine-în-video oferit de un furnizor major de cloud
Google se laudă că este primul furnizor cloud la scară largă care oferă un model AI capabil să transforme imagini în videoclipuri. Spre comparație, modelul Sora al OpenAI este accesibil momentan doar pentru artiști, cercetători și academicieni selectați, dar compania promite noi demonstrații de produse începând cu 5 decembrie.
Veo produce clipuri video 1080p, cu o durată de peste un minut, care sunt „consistente și coerente”, conform Google. Instrumentul funcționează atât pe baza comenzilor text, cât și a imaginilor, acestea putând fi generate fie de AI, fie de creatori umani.
Totuși, demonstrațiile furnizate de Google evidențiază unele limitări ale modelului. Într-un exemplu cu prăjituri marshmallows la foc de tabără, procesul de prăjire nu este redat realist – dulciurile nu capătă nuanțe aurii sau nu se ard. De asemenea, artefactele vizuale, cum ar fi detalii greșite ale mâinilor în alte clipuri, rămân o provocare.
Imagen 3: Imagini mai realiste și de calitate superioară
Modelul Imagen 3, potrivit Google, este capabil să genereze cele mai realiste și detaliate imagini bazate pe descrieri textuale, depășind versiunile anterioare în ceea ce privește detaliile, iluminarea și reducerea artefactelor.
Cu toate acestea, și Imagen 3 are nevoie de îmbunătățiri. De exemplu, într-o imagine generată pe baza unei comenzi despre „fotografie cu bliț”, subiecții apar clar retroiluminați, ceea ce contrazice ideea de fotografie realizată cu un bliț clasic. Dacă intenția era să reflecte un stil specific din anii ’60, rezultatul nu se potrivește exact.
Adoptarea generative AI în mediul de afaceri
Google încearcă să atragă tot mai multe companii să utilizeze AI generativ în operațiunile lor. Potrivit unui studiu realizat de gigantul tehnologic, 86% dintre companiile care folosesc AI generativ raportează o creștere a veniturilor. Cu toate acestea, un sondaj recent realizat de Appen indică o scădere a randamentului investițiilor în proiecte AI, de la an la an, cu 4,6 puncte procentuale între 2023 și 2024.
Concluzie
Modelele Veo și Imagen 3 reprezintă pași importanți pentru Google în direcția democratizării tehnologiei generative AI pentru clienții săi corporativi. Totuși, rămâne de văzut cât de rapid vor putea fi rezolvate limitările actuale pentru a asigura o experiență completă și fără compromisuri pentru utilizatori.