Modelul de generare de imagini DALL-E 2 AI al Open AI nu mai este de ultimă generație. Compania a anunțat DALL-E 3, cel mai recent generator de text-to-image și și-a arătat câteva dintre noile sale caracteristici impresionante, inclusiv capacitatea de a genera text care poate fi citit direct în imagini – ceva ce nu a fost ușor cu DALL-E 2 și pe care alte modele AI concurente de generator de imagini, cum ar fi Midjourney, încă se luptă să le atingă.
„DALL·E 3 oferă îmbunătățiri semnificative față de DALL·E 2 atunci când se generează text într-o imagine și în detalii umane, cum ar fi mâinile”, a scris OpenAI pe pagina sa web explicând noul model.
Această caracteristică pune OpenAI în concurență directă cu Ideogram, un startup de la foștii angajași Google lansat luna trecută, care oferă, de asemenea, generarea de imagini cu text/tipografie, folosind propriul model AI proprietar.
Mai mult, OpenAI a scris că DALL-E 3 face o treabă mult mai bună de a înțelege relațiile spațiale pe care utilizatorii le includ în textul lor prompt, generând imagini care plasează figuri și obiecte pe care utilizatorul le-a descris unul în raport cu celălalt. Aceasta înseamnă că solicitările descriptive pot fi acum redate mult mai precis, așa cum se vede într-un exemplu de captură de ecran de mai jos.

OpenAI a mai spus că DALL-E 3 va fi disponibil pe ChatGPT Plus, nivelul de abonament plătit de 20 USD pe lună al modelului său de limbaj major (LLM) și noile sale planuri ChatGPT pentru întreprinderi anunțate luna trecută, ceea ce înseamnă că clienții corporativi vor acum au capacitatea de a genera imagini cu text pentru marketing sau colateral intern.
În plus, OpenAI spune că ChatGPT poate ajuta utilizatorii să-și perfecționeze automat solicitările pentru a genera imaginile care se potrivesc mai bine cu intenția lor.
Un videoclip postat de co-fondatorul și CEO-ul OpenAI, Sam Altman, pe X, rețeaua de socializare cunoscută anterior sub numele de Twitter, demonstrează stilul impresionant de susținere a conversației, care este acum posibil în DALL-E 3 datorită integrării ChatGPT.
În același timp, OpenAI a scris: „ca și versiunile anterioare, am luat măsuri pentru a limita capacitatea DALL-E 3 de a genera conținut violent, pentru adulți sau plin de ură”.
Anunțul a fost încurajat de avocatul pentru relațiile cu dezvoltatorii OpenAI Logan Kilpatrick pe X (fostul Twitter), care a spus că este „absolut incredibil”.