E-Mail: redazione@bullet-network.com
- Openai presenta i modelli gpt-4o per trascrizione e generazione vocale.
- Gpt-4o-mini-tts genera voci più realistiche e modulabili.
- Gli sviluppatori controllano stile ed emozione, creando agenti virtuali.
Rivoluzione nel campo dell’audio AI: OpenAI presenta i nuovi modelli gpt-4o
OpenAI ha annunciato il rilascio di una nuova generazione di modelli di intelligenza artificiale dedicati alla trascrizione e alla generazione vocale, segnando un passo significativo verso sistemi automatizzati più sofisticati e personalizzabili. Questi modelli, denominati gpt-4o-transcribe, gpt-4o-mini-transcribe e gpt-4o-mini-tts, promettono di superare le prestazioni dei loro predecessori, offrendo una maggiore accuratezza, espressività e controllo. L’obiettivo dichiarato è quello di fornire strumenti che consentano agli sviluppatori di creare “agenti” virtuali capaci di interagire in modo più naturale ed efficace con gli utenti.
Caratteristiche e funzionalità dei nuovi modelli
Il modello gpt-4o-mini-tts si distingue per la sua capacità di generare voci più realistiche e modulabili. Gli sviluppatori possono istruire il modello su come pronunciare le parole, specificando lo stile e l’emozione desiderata. Ad esempio, è possibile richiedere una voce da “scienziato paz