Mentre ChatGPT continua a cambiare il panorama del lavoro creativo, nel bene e nel male, un nuovo aggiornamento della tecnologia potrebbe far sì che il bot faccia molto di più che semplicemente tirare fuori parole.
Open AI, la società che possiede e gestisce ChatGPT, ha annunciato lunedì che il suo bot sarà presto in grado di analizzare foto e avere conversazioni audio.
ChatGPT: Le nuove funzionalità
Gli utenti possono caricare foto di una scena o di un oggetto e poi chiedere a ChatGPT di parlare di ciò che vedono e porre domande su cosa comportano le foto attraverso il riconoscimento delle immagini.
Con funzionalità vocali, ChatGPT imiterà le voci e creerà discorsi dopo aver ascoltato “solo pochi secondi” di qualcuno che parla.
“Stiamo iniziando a implementare nuove funzionalità vocali e di immagini in ChatGPT. Offrono un nuovo tipo di interfaccia più intuitiva consentendoti di avere una conversazione vocale o mostrare a ChatGPT di cosa stai parlando”, ha affermato Open AI in un comunicato.
Spotify utilizza l’intelligenza artificiale per le traduzioni dei podcast
Spotify sta già utilizzando la nuova tecnologia, ha detto la società questa settimana, per la sua funzione di traduzione vocale, che consentirà ai podcast di lunga durata di essere tradotti in altre lingue pur utilizzando la voce e le inflessioni vocali del podcaster originale.
“Questo strumento sviluppato da Spotify sfrutta le ultime innovazioni, una delle quali è la nuova tecnologia di generazione vocale di OpenAI, per adattarsi allo stile di chi parla originale, creando un’esperienza di ascolto più autentica che suona più personale e naturale rispetto al doppiaggio tradizionale”, ha spiegato l’azienda. in un rilascio.
Open AI ha affermato che le funzionalità vocali e di immagine inizieranno a essere distribuite agli utenti ChatGPT Plus nelle prossime due settimane.