E-Mail: [email protected]
- Il modello 'Italia' è stato addestrato su oltre mille miliardi di parole, con il 90% dei dati provenienti da fonti italiane.
- È disponibile per il download open source, permettendo una vasta personalizzazione da parte delle aziende.
- 'Italia' offre un'efficienza del 60% superiore nella generazione di token in italiano rispetto ad altri modelli.
Il 6 giugno 2024 segna una data storica per l’Italia nel campo dell’intelligenza artificiale. La startup milanese iGenius, in collaborazione con Cineca, ha lanciato “Italia”, il primo large language model (LLM) interamente addestrato in italiano. Questo modello, che conta ben 9 miliardi di parametri, è disponibile per il download open source, segnando un passo significativo verso l’autonomia tecnologica del Paese.
Il progetto, inizialmente previsto per l’estate, è stato accelerato per rispondere alla crescente domanda di soluzioni di intelligenza artificiale generativa. “Italia” è stato addestrato utilizzando il supercomputer Leonardo, una delle infrastrutture di calcolo più potenti al mondo, gestita da Cineca. Il modello è stato allenato su oltre mille miliardi di parole, con il 90% dei dati provenienti da fonti italiane, tra cui Wikipedia e dati sintetici creati ad hoc.
Un Modello Open Source per l’Innovazione Italiana
Una delle caratteristiche distintive di “Italia” è la sua natura open source. Questo permette a qualsiasi azienda o ente pubblico di scaricare e personalizzare il modello per le proprie esigenze. La scelta di rendere il modello open source è stata motivata dalla volontà di contribuire all’ecosistema italiano ed europeo dell’intelligenza artificiale, come spiegato da Uljan Sharka, fondatore e CEO di iGenius.
Il modello è stato sviluppato in conformità con le normative europee, rendendolo particolarmente adatto per settori altamente regolamentati come i servizi finanziari, l’industria e la pubblica amministrazione. La collaborazione con Fincantieri, ad esempio, mira a creare una piattaforma di intelligenza artificiale per il settore navale.
Efficienza e Prestazioni Superiori
“Italia” si distingue per la sua capacità di generare token in italiano con un’efficienza del 60% superiore rispetto ai modelli basati su altre lingue. Questo si traduce in una riduzione significativa dei costi e delle risorse necessarie per servire il modello, rendendolo una soluzione ideale per il mondo aziendale.
Il modello è stato progettato per essere altamente personalizzabile, permettendo alle imprese di adattarlo alle proprie esigenze specifiche. La finestra di contesto di 4.096 token e un vocabolario di 50.000 token garantiscono una comprensione approfondita della lingua italiana, delle sue sfumature e del contesto storico-culturale.
Prospettive Future e Sviluppi
Il lancio di “Italia” rappresenta solo l’inizio di un percorso di innovazione continua. Sono già previsti aggiornamenti mensili e l’evoluzione verso una versione multilingua del modello. Inoltre, iGenius sta lavorando per rilasciare una versione di “Italia” con 10 miliardi di parametri, aumentando ulteriormente le capacità del modello.
La collaborazione con Cineca e altre istituzioni accademiche e commerciali continuerà a giocare un ruolo cruciale nello sviluppo delle prossime versioni del modello. L’obiettivo è quello di rendere l’Italia un attore di primo piano nella rivoluzione dell’intelligenza artificiale, non solo come consumatore di prodotti stranieri, ma come creatore di soluzioni innovative.
Bullet Executive Summary
In conclusione, il lancio di “Italia” rappresenta un passo significativo verso l’autonomia tecnologica dell’Italia nel campo dell’intelligenza artificiale. Questo modello, interamente addestrato in italiano e disponibile open source, offre un’efficienza e una personalizzazione senza precedenti, rendendolo una soluzione ideale per settori altamente regolamentati. La collaborazione con Cineca e altre istituzioni garantisce un continuo sviluppo e miglioramento del modello, posizionando l’Italia come leader nell’innovazione tecnologica.
Nozione base di intelligenza artificiale: Un large language model (LLM) è un tipo di intelligenza artificiale progettato per comprendere e generare testo naturale. Questi modelli sono addestrati su enormi quantità di dati testuali e utilizzano tecniche di deep learning per prevedere la parola successiva in una sequenza, rendendoli capaci di generare testo coerente e contestualmente rilevante.
Nozione avanzata di intelligenza artificiale: L’addestramento di un LLM richiede una quantità significativa di risorse computazionali e dati. Utilizzare un supercomputer come Leonardo permette di accelerare questo processo, migliorando l’efficienza e la precisione del modello. Inoltre, l’uso di tecniche di fine-tuning e l’integrazione di dati sintetici possono ulteriormente migliorare le prestazioni del modello in contesti specifici, rendendolo più versatile e applicabile a una vasta gamma di settori.