ChatGPT de la OpenAI primește o actualizare majoră care va permite chatbot-ului viral să aibă conversații vocale cu utilizatorii și să interacționeze folosind imagini, apropiindu-l de asistenții populari de inteligență artificială (AI) precum Siri de la Apple.
Funcția vocală „deschide ușile către multe aplicații creative și axate pe accesibilitate”, a spus OpenAI într-o postare pe blog luni.
Servicii similare AI precum Siri, asistentul vocal Google și Amazon Alexa sunt integrate cu dispozitivele pe care rulează și sunt adesea folosite pentru a seta alarme și memento-uri și pentru a furniza informații de pe internet.
De la debutul său de anul trecut, ChatGPT a fost adoptat de companii pentru o gamă largă de sarcini, de la rezumarea documentelor până la scrierea codurilor de programare, declanșând o cursă între companiile Big Tech pentru a-și lansa propriile oferte bazate pe IA generativă.
Noua funcție vocală a ChatGPT poate, de asemenea, să povestească povestiri de culcare, să stabilească dezbateri la masă și să rostească textul cu voce tare de la utilizatori.
Tehnologia din spatele acesteia este folosită de Spotify pentru podcasterii platformei pentru a traduce conținutul în diferite limbi, a spus OpenAI.

Pentru a începe conversațiile vocale, accesați Setări → Funcții noi din aplicația mobilă și înscrieți-vă în conversațiile vocale. Apoi, atingeți butonul căștilor situat în colțul din dreapta sus al ecranului de start și alegeți vocea preferată din cinci voci diferite.
Noua capacitate de voce este alimentată de un nou model text-to-speech, capabil să genereze sunet asemănător unui om din doar text și câteva secunde de exemplu de vorbire. OpenAI spune că a colaborat cu actori vocali profesioniști pentru a crea fiecare dintre voci. De asemenea, a folosit Whisper, sistemul propriu open-source de recunoaștere a vorbirii, pentru a transcrie cuvintele tale rostite în text.
Cu ajutorul imaginilor, utilizatorii pot face fotografii cu lucrurile din jurul lor și pot cere chatbot-ului să „spună de ce grătarul nu pornește, să exploreze conținutul frigiderului pentru a planifica o masă sau să analizeze un grafic complex pentru date legate de muncă”. Sau poți obține ajutor ca să aranjezi șaua unei biciclete.

Google Lens de la Alphabet este în prezent alegerea populară pentru a obține informații despre imagini.
Noile funcții ChatGPT vor fi lansate pentru abonații planurilor sale Plus și Enterprise în următoarele două săptămâni.