IA

Microsoft tratta con Anthropic per il primo impiego esterno di Maia 200

Susan Hill

Microsoft tratta con Anthropic per fornirle il proprio chip di intelligenza artificiale Maia 200, in quella che sarebbe la prima volta che il silicio lascia i data center proprietari del gruppo. Le discussioni, rivelate da The Information e confermate dalla CNBC, sono la conseguenza operativa di un rapporto finanziario rimasto finora sul foglio di calcolo.

L’accordo in discussione è ristretto ma pesante. Anthropic affitterebbe server Azure con chip Maia 200 per l’inferenza, la fase costosa in cui Claude risponde agli utenti, distinta dal lavoro più visibile dell’addestramento di nuovi modelli. L’inferenza è il punto in cui ogni laboratorio di frontiera sta bruciando cassa. Il costo unitario di una singola richiesta, moltiplicato per centinaia di milioni di utenti, è oggi la cifra che decide il business dell’IA.

Per Microsoft, portare Anthropic su Maia 200 sarebbe la migliore validazione commerciale possibile di un programma vissuto finora come progetto interno. Trainium e Inferentia di Amazon sono in mano a clienti esterni da anni. I TPU di Google sono la colonna vertebrale silenziosa di buona parte della rivoluzione dei grandi modelli linguistici. Maia, al contrario, è stato dispiegato solo dentro gli impianti di Microsoft in Arizona e Iowa, eseguendo carichi interni di IA non dettagliati. Conquistare il secondo laboratorio di frontiera più osservato al mondo trasformerebbe il chip in un prodotto commerciale da un giorno all’altro.

La logica finanziaria è già in posizione. Microsoft detiene una partecipazione azionaria di cinque miliardi di dollari in Anthropic; Anthropic, a sua volta, si è impegnata per circa trenta miliardi di dollari di spesa Azure a lungo termine. Quel denaro sarebbe comunque passato per qualche forma di silicio. La domanda aperta, e quella che l’accordo risponderebbe, era se Anthropic lo avrebbe consumato in GPU Nvidia affittate da Microsoft o se Microsoft sarebbe riuscita a deviarne una fetta significativa verso chip disegnati in casa.

Maia 200 è l’acceleratore di inferenza di seconda generazione di Microsoft. La componente è prodotta da TSMC sul processo a 3 nanometri e utilizza quattro acceleratori collegati per package, posizionata dal gruppo come silicio inference-first, ottimizzato per il lavoro di rispondere e non per quello di imparare. L’amministratore delegato Satya Nadella ha detto agli investitori che il chip offre “oltre il 30 per cento in più di token per dollaro” rispetto al silicio GPU più recente già nella flotta Azure. È un’affermazione di costo, non di capacità, e nell’inferenza il costo è la metrica che decide se un chip vive abbastanza da contare.

Per Anthropic, le trattative su Maia 200 si inseriscono in uno schema. Il laboratorio ha passato l’ultimo anno a costruire uno stack di calcolo deliberatamente eterodosso: GPU Nvidia attraverso più cloud, chip AWS Trainium grazie a un impegno pluriennale con Amazon valutato oltre cento miliardi di dollari, e TPU di Google per parti dell’addestramento. Aggiungere il silicio di Microsoft completa l’insieme. Anthropic avrebbe, in pratica, l’architettura di calcolo più diversificata per fornitore tra i laboratori di frontiera. È l’espressione operativa di una strategia che Dario Amodei comunica da mesi: il calcolo, non il talento, è il vincolo che lega il laboratorio.

Niente è chiuso. Entrambe le parti definiscono i colloqui in fase iniziale, e Maia 200 non è stato reso disponibile ai clienti esterni di Azure in nessuna forma commerciale. La cifra del 30 per cento citata da Microsoft è una metrica del fornitore su un carico che il fornitore controlla da capo a fondo. I benchmark indipendenti contro le generazioni Hopper o Blackwell di Nvidia non esistono nel dominio pubblico. L’ottica strategica è inoltre scomoda in almeno una direzione: Microsoft è il principale singolo investitore di OpenAI, il rivale più diretto di Anthropic. Vendere capacità Maia ai due laboratori contemporaneamente è una configurazione che Microsoft non ha mai testato, e la partizione contrattuale necessaria perché regga non è banale.

Quello che segue è procedurale. Nessun termine commerciale è trapelato, nessuna data di disponibilità generale per Maia 200 fuori dagli impianti di Microsoft è stata pubblicata, e nessuna delle due aziende ha confermato un calendario. Il prossimo segnale concreto arriverà con la prossima trimestrale di Microsoft, dove qualsiasi cliente esterno impegnato di peso dovrebbe essere riconosciuto. Fino ad allora, la coreografia finanziaria tra Redmond e San Francisco corre davanti al silicio stesso.

Discussione

Ci sono 0 commenti.