ChipsBuilder

Da Sapienza a Cineca, da Domyn ad Almawave e Fastweb, c’è un crescente impegno da parte di enti pubblici e privati in Italia per lo sviluppo di Large Language Model (LLM). Questo articolo fa il punto sullo stato dell’arte, spiegando dove si trova il Paese e verso quali obiettivi sta lavorando, pur riconoscendo che rimane molto distante rispetto a Silicon Valley.

La situazione europea e italiana

Siamo agli ultimi posti in Europa in termini di ricerca e sviluppo di Large Language Models. Secondo Giovanni Miragliotta, direttore dell’Osservatorio sull’intelligenza artificiale del Politecnico di Milano, “Il primo modello fondazionale europeo è Mistral, ma è solo centesimo al mondo per capacità. L’Italia è molto più indietro del resto dell’UE”. Questo spinge il Paese a cercare una propria strada per sviluppare modelli adatti al contesto nazionale.

Un piano strategico, la strategia italiana per l’Intelligenza Artificiale 2024-2026, indica l’obiettivo di costruire modelli fondazionali nazionali, specializzati per il contesto italiano e multimodali, adatti ai particolari bisogni industriali, finanziari e pubblici.

ChatMinerva: una realtà accademica

Una delle iniziative più notate nel 2026 è ChatMinerva, evoluzione dell’impegno del gruppo NLP di Sapienza Roma, coordinato da Roberto Navigli, in collaborazione con Babelscape. Il modello sfrutta una parte della potenza di calcolo del supercomputer Leonardo di Cineca.

ChatMinerva si distingue per la sua capacità di accesso web tramite WebRag, contesto di 32.000 token, gestione di documenti complessi, comprensione multimodale e un sistema di sicurezza che filtra input indesiderati. È inoltre open source e adatto a un ampio spettro di applicazioni.

Minerva: base solida per ChatMinerva

Minerva è il modello su cui si basa ChatMinerva. Questa famiglia di modello ha un totale di 2,5 trilioni di token, con particolare attenzione all’italiano e all’inglese, e include circa 200 miliardi di codici. Il modello si distingue per essere centrato sull’italiano fin dalla fase iniziale.

La prossima versione, un modello da 20 miliardi di parametri, è prevista verso la fine del 2026. Sebbene non raggiunga le dimensioni dei modelli di grandi multinazionali come ChatGPT o Claude, rappresenta un significativo sforzo accademico.

Domyn e la sua offerta

Domyn, ex iGenius, contribuisce al panorama italiano con una serie di modelli come Italia-9B, Domyn Small e Colosseum-355B. Ogni modello si rivolge a diversi contesti industriali, finanziari e della pubblica amministrazione.

Il Domyn Small supporta ambienti dove sono rilevanti latenza e costo, con contesto estendibile a 131 mila token e licenza Mit. Questo modello supporta oltre 50 lingue, tra cui italiano, francese, tedesco, spagnolo e portoghese.

I modelli Domyn Large, progettati per applicazioni complesse come estrazione di dati e sicurezza, mirano a rispondere alle esigenze aziendali più specifiche, mentre Colosseum-355B offre opzioni per sistemi con alta regolamentazione e controllo completo sui dati.

Almawave e Fastweb

Almawave ha pubblicato la famiglia Velvet, composta da modello da 2B, Speech 2B, 14B e fino a 25B di parametri. Questi modelli rappresentano i primi sviluppi di un’architettura proprietaria italiana.

Fastweb, invece, ha lanciato un modello LLM nazionale per settori industriali e pubblici. Il modello è addestrato su un corpus localizzato in Italia con infrastrutture localizzate e gestite. È adatto a essere distribuito in private cloud o on-premise, con licenze differenziate.

Progetti accademici e aperti

Vitruvian è una famiglia di modelli di ragionamento e spiegazione sviluppata da gruppi accademici. Include modelli specifici per domini specialistici e benchmark tecnici. Al contrario, i progetti aperti come Nesso e Zagreus mirano a modelli trasparenti e adatti a deployment edge.

Zagreus, realizzato nel contesto MII-LLM, ha quattro modelli bilingui addestrati da zero su token open source. I modelli si concentrano su italiano, inglese, spagnolo, portoghese e francese. L’apertura del progetto supporta la distribuzione in ambienti ridotti e l’uso in settori locali.

Modelli indipendenti

Altro interessante contributo nel panorama italiano è rappresentato da Dante-2B, realizzato da uno sviluppatore autonomo. Un modello bilingue italiano-inglese da 2,1 miliardi di parametri che nasce da sperimentazione personale su infrastruttura NVIDIA. È rilasciato con licenza Apache 2.0 e supporta 4.096 token.

Modelli come Dante rappresentano un’altra strada, spesso trascurata, per l’Italia: iniziative private e personali che, pur non avendo risorse gigantesche, cercano di contribuire all’ecosistema aperto.

Conclusione

L’Italia sta lavorando per costruire una propria identità nel panorama globale degli LLM. Anche se non può sperare di contendere la leadership a Silicon Valley, la strada tracciata da iniziative accademiche, aziende private e progetti aperti indica una volontà di crescere e di trovare spazi di nicchia dove la specializzazione può fare la differenza.