Finora, l'infrastruttura cloud è stata progettata per servire gli utenti umani, che navigano, cliccano e scorrono in modo prevedibile. I nuovi agenti intelligenti, invece, agiscono in modo diverso: possono generare improvvisamente grandi attività, creando dozzine di sottogent agenti che eseguono query su database, analizzano documenti e chiamano API in pochi secondi, prima di scomparire altrettanto velocemente.

Una Nuova Piattaforma per gli Agenti

Al fine di rispondere a questa evoluzione, Amazon sta ridefinendo una parte fondamentale del proprio ecosistema cloud. Il 18 ottobre 2024, AWS ha lanciato la prossima generazione di OpenSearch Serverless, un database vettoriale e di ricerca su larga scala, progettato appositamente per i carichi di lavoro generati dagli agenti. La nuova piattaforma, completamente gestita, può scalare istantaneamente quando gli agenti iniziano a eseguire compiti e ridurre completamente la capacità quando non sono in uso.

La Crescita del Traffico Non Umano

Questo passo segna una crescente consapevolezza nel settore tecnologico: l'infrastruttura precedentemente concepita per il web umano non è adatta a un ambiente sempre più dominato da agenti automatici. Anche se gli agenti AI rappresentano ancora una percentuale moderata di traffico, il traffico generato da macchine è già significativo e destinato a crescere.

Nelle ultime sei mesi, Cloudflare ha osservato che i bot hanno rappresentato il 31% del traffico HTTP totale. Tra questi, gli agenti AI, i motori di ricerca e gli assistenti hanno rappresentato circa un quarto del traffico. Secondo Li Yi Ohlsen, senior product manager di Cloudflare, "il traffico non umano supererà il traffico umano entro la prima metà del 2027."

I Piani di Google e le Aziende di Tech

Al recente evento I/O di Google, il colosso ha annunciato che gli utenti potranno iniziare a delegare compiti agli agenti AI, come ricerche su acquisti, prenotazioni di viaggi, navigazione web e interazione con le applicazioni. Oltre ai prodotti AI orientati al consumatore, sempre più aziende stanno adottando agenti in ambienti interni e verso i propri clienti, generando nuovi tipi di traffico macchina.

In risposta, i principali fornitori di infrastruttura cloud stanno valutando come adattare i loro sistemi, progettati per gli esseri umani, a un mondo dove i macchine interagiscono in modo autonomo, recuperando informazioni e generando traffico tra loro.

La Soluzione di AWS

Una soluzione chiave arriva da AWS con OpenSearch Serverless. “Il momento è semplice: gli agenti stanno passando dagli esperimenti alla produzione e stanno creando modelli di traffico che infrastruttura precedente non era in grado di gestire”, ha spiegato Tia White, general manager per Amazon OpenSearch Service.

Il punto chiave della tecnologia è il decuplamento tra calcolo e storage, consentendo al primo di scalare in pochi secondi per gestire i picchi improvvisi di traffico e ridursi a zero quando non necessario. “Prima, anche nella versione precedente di Serverless, dovevi sempre tenere almeno un’istanza in funzione perché calcolo e storage erano legati,” ha aggiunto White. “Non potevi semplicemente farlo scalare esattamente quando ti serviva e quindi pagavi per risorse inutilizzate.”

La metafora proposta da White è simile a pagare sempre lo spazio di sosta, anche quando non è necessario. Con la nuova versione di AWS Serverless, invece, si paga solo quanto si utilizza, come un parcheggio a pagamento.

Integrazioni e Sviluppi Future

Non appena lanciato, OpenSearch Serverless sarà integrato con piattaforme di sviluppo AI come Vercel e Kiro, permettendo agli sviluppatori di distribuire backend di ricerca e vettori pronti per gli agenti senza la gestione dell’infrastruttura sottostante.

La rotazione tecnologica è evidente in tutto l’ecosistema cloud. Databricks e Snowflake si stanno posizionando come sistemi di memoria e recupero dati per le aziende. Microsoft ha rilasciato aggiornamenti a Azure per gestire i picchi degli agenti AI e condividere memoria tra di loro. Anche Cloudflare, come AWS, ha annunciato nuovi strumenti per fornire ambienti persistenti e scalabili agli agenti.

Un Futuro Conforme ai Macchi

Man mano che sempre più aziende adotteranno agenti AI, crescerà la pressione per riconsiderare l'infrastruttura, adattandola al traffico generato da macchine. Questo rinnovamento tecnologico renderà non solo più semplice, ma anche più economico e scalabile il deployment degli agenti AI in contesti sempre più ampi.

L’evoluzione del cloud e dei suoi servizi mostra una chiara tendenza verso un web che non è solo per gli esseri umani, ma ormai in equilibrio con un mondo guidato sempre più da intelligenze generate algoritmicamente.