
NVIDIA Blackwell Ultra: GPU per agenti autonomi
NVIDIA ha presentato Blackwell Ultra, la nuova GPU pensata esplicitamente per workload agentici. Non è solo un boost di FLOPS: l'architettura introduce primitive hardware per gestire in modo efficiente il pattern 'reason → tool call → observe → reason' tipico degli agenti AI moderni.
Tra le novità più interessanti c'è un'unità dedicata di 'speculative tool execution' che permette al modello di iniziare a generare il prossimo step di reasoning mentre la tool call precedente è ancora in flight, riducendo la latenza end-to-end fino al 40%.
Il chip integra anche 288 GB di HBM4 con bandwidth di 12 TB/s, sufficiente a tenere in memoria modelli da 1T parametri senza sharding aggressivo. Per il training di agenti specializzati, questo significa cicli di iterazione molto più rapidi.
Sul fronte cloud, AWS, GCP e Azure hanno già annunciato la disponibilità di istanze Blackwell Ultra entro Q3 2026. I primi prezzi indicativi parlano di circa 12 $/h per GPU on-demand, con sconti significativi su reserved instances.
Per chi non vuole gestire infrastruttura, gli inference provider come Together, Fireworks e Groq hanno già confermato che ospiteranno modelli ottimizzati per Blackwell Ultra entro fine anno.
Articoli correlati

Il loop di feedback definitivo: l'era in cui l'Intelligenza Artificiale scrive l'Intelligenza Artificiale

Da YouTuber a core dev: perché l'AI open-source di PewDiePie è una lezione per la Silicon Valley
