La tecnologia di generazione vocale di ElevenLab basata sull’IA si sta espandendo a 30 lingue

ElevenLab's AI-based voice generation technology expanding to 30 languages.

ElevenLabs è una startup che ha fatto notizia per la sua piattaforma di generazione vocale basata su intelligenza artificiale, che è stata utilizzata per la narrazione di audiolibri e per aumentare l’accessibilità dei contenuti, ma è stata anche utilizzata in modo improprio per far sembrare che personaggi pubblici dicano cose terribili. La piattaforma sta ora uscendo dalla fase beta ed espandendosi significativamente in più lingue.

Il lunedì, ElevenLabs ha annunciato che la piattaforma sta uscendo da una fase beta iniziata a gennaio e la startup ha anche rivelato un nuovo modello di deep-learning multilingue fondamentale, l’Eleven Multilingual v2.

Inoltre: 4 cose che Claude AI può fare che ChatGPT non può

Eleven Multilingual v2 supporta 30 lingue e consente alle persone di tutto il mondo di utilizzare le capacità di text-to-speech e di clonazione vocale di ElevenLabs.

Quando gli utenti inseriscono del testo, il modello identifica automaticamente la lingua scritta e genera una voce con “un livello di autenticità senza precedenti”, secondo il comunicato.

Le caratteristiche vocali uniche dello speaker, indipendentemente che si tratti di una voce sintetica o clonata, rimangono le stesse in tutte le 30 lingue, garantendo lo stesso stile di pronuncia, compreso l’accento.

“ElevenLabs è stata fondata con il sogno di rendere tutti i contenuti universalmente accessibili in qualsiasi lingua e con qualsiasi voce”, ha dichiarato Mati Staniszewski, CEO e cofondatore di ElevenLabs.

“Con il rilascio di Eleven Multilingual v2, siamo un passo più vicini a realizzare questo sogno e a rendere disponibili voci AI di qualità umana in ogni dialetto”.

Inoltre: Il 40% dei lavoratori dovrà acquisire nuove competenze nei prossimi tre anni a causa dell’IA, secondo uno studio IBM

ElevenLabs ha identificato alcuni possibili casi d’uso per questa applicazione, come ad esempio consentire agli autori indipendenti di creare audiolibri, tradurre esperienze di videogiochi e contenuti audio per il pubblico internazionale e aumentare l’accessibilità dei contenuti per le persone con disabilità visive e ulteriori esigenze di apprendimento.

Come elencato nel comunicato, le lingue supportate includono coreano, olandese, turco, svedese, indonesiano, vietnamita, filippino, ucraino, greco, ceco, finlandese, rumeno, danese, bulgaro, malese, ungherese, norvegese, slovacco, croato, arabo classico, tamil, inglese, polacco, tedesco, spagnolo, francese, italiano, hindi e portoghese.