
Anthropic × SpaceX: nuovi record per Claude
Anthropic ha annunciato la scorsa settimana una collaborazione strategica con SpaceX che, sulla carta, sembra fantascienza ma sta già producendo effetti concreti per chiunque lavori con Claude in produzione: i limiti di rate, il context window e la latenza globale dell'inferenza sono migliorati in modo significativo.
Il cuore dell'accordo è l'utilizzo della rete Starlink come backbone a bassa latenza tra cluster di GPU distribuiti geograficamente, combinato con i primi esperimenti di compute orbitale a bassa potenza per workload batch. Per gli sviluppatori, questo si traduce in un context window esteso a 1M token su Claude Sonnet e 2M token su Claude Opus, con rate limit raddoppiati su tutti i tier API.
L'effetto immediato è che pattern che fino a ieri richiedevano RAG aggressivo ora possono essere risolti caricando l'intero corpus documentale nel prompt. Per agenti long-running, il vantaggio è ancora maggiore: la memoria di sessione può tenere settimane di interazioni senza dover ricorrere a riassunti distruttivi.
Lato costi, Anthropic ha mantenuto il pricing invariato sui tier esistenti e ha introdotto un nuovo tier 'Orbital Batch' con sconto del 40% per workload non urgenti — perfetto per indicizzazioni, valutazioni e job di fine-tuning.
Per chi sta progettando agenti AI oggi, il consiglio è semplice: rivedete le architetture pensate per aggirare i vecchi limiti. Molti workaround (chunking aggressivo, cache di summary, compressione semantica) ora sono overhead inutile.
Articoli correlati

Il loop di feedback definitivo: l'era in cui l'Intelligenza Artificiale scrive l'Intelligenza Artificiale

Da YouTuber a core dev: perché l'AI open-source di PewDiePie è una lezione per la Silicon Valley
