Nel corso di una svelazione avvenuta mercoledì, OpenAI ha presentato il primo chip personalizzato pensato appositamente per gli utili di inferenza, progettato e costruito in collaborazione con Broadcom. Ribattezzato Jalapeño, il microchip era nato per controllare le uniche esigenze di OpenAI. Lazienda ha dichiarato che modelli di AI interni hanno fornito un importante contributo durante lo sviluppo del dispositivo.

Sebbene sia ancora in fase test, Openai afferma che i risultati iniziali mostrano una migliore prestazione per watt rispetto agli strumenti più avanzati attualmente sul mercato. La collaborazione è ufficialmente iniziata ad ottobre, anche se in precedenza si parlava di Openai's desiderio di diminuire l dipendenza dai GPU di Nvidia.

Google e Amazon hanno creato ciascun propria versione di componenti custom, chiamati spesso acceleratori di AI, che accelerano il carico delle attività machine learning. Il presidente di OpenAI, Greg Brockman, ha spiegato lapproccio dellazienda per lo sviluppo dei chips in-house sul podcast interno non molto tempo dopo lannuncio della collaborazione con Broadcom.

Gli sforzi del chip di Jalapeño sono concentrati sullinference, il procedimento di operazione di modelli di AI costruiti con i comandi dellutente. Durante la dichiarazione, Openai ha sottolineato il basso costo operativo del chip quando si eseguono i modelli di codifica in tempo reale. È probabile che compiti più impegnativi come la pre-training continueranno a dipendere Hardware di Nvidia, ma piccole riduzioni dei costi durante gli sforzi di inferenza potrebbero significativamente influenzare il bilancio dellazienda.

La sottoscrizione e il controllo del processo dinferenza potrebbe rappresentare un fattore fondamentale per leconomia dellAI nel futuro. Si suppone che il lavoro si svolgerà a ogni stadio della pila: OpenAI sta costruendo prodotti agil, come Codex e i modelli su cui si basano, così come centri di dati per eseguirli. Il coinvolgimento in chips creati appositamente permette allazienda di avanzare ulteriormente, come spiegato nellannuncio.

OpenAI non sviluppa modelli di avanguardia o costruisce prodotti sopra di essi, ma progetta anche le infrastrutture che li sostengono: architettura del chip, nuclei, sistemi di memoria, rete, programmazione, sistemi di distribuzione e esperienza dellutente. OpenAI ha dichiarato nel comunicato che essendo in grado di operare attraverso lintero stack, ognuno dei livelli può essere migliorato con lo stesso obiettivo: rendere i modelli più veloci, affidabili e accessibili per gli utenti.