IA

DeepSeek ha reso l’IA economica, e la bolla americana scommetteva sul contrario

Susan Hill

DeepSeek, un laboratorio cinese nato da un fondo speculativo quantitativo, insiste a fare ciò che l’industria americana dell’IA dava per impossibile. Costruisce modelli che rendono vicino alla frontiera, li addestra per una frazione di quanto spendono i rivali statunitensi e poi pubblica i pesi perché chiunque li scarichi e li esegua. Ogni rilascio riapre lo stesso dibattito: la valutazione dell’intero settore americano dell’IA poggia su un presupposto che DeepSeek smonta a poco a poco, quello secondo cui l’intelligenza deve restare cara.

Quel presupposto non è astratto. Regge centinaia di miliardi di dollari di data center in costruzione, le quotazioni dei produttori di chip e dei fornitori di cloud presenti in quasi ogni fondo indicizzato e l’abbonamento mensile che molti lettori pagano già per un chatbot. Se un rivale offre risultati paragonabili a molto meno e regala il software, il sovrapprezzo legato a una potenza di calcolo scarsa e costosa somiglia meno a un fossato difensivo e più a una scommessa.

L’argomento di DeepSeek riguarda l’efficienza, non la magia. I suoi ingegneri hanno puntato su un’architettura a mistura di esperti che attiva solo una parte del modello per ogni richiesta, sull’uso intensivo di calcoli a precisione ridotta e su pipeline di addestramento tarate per girare con meno chip, in parte soggetti alle restrizioni all’export. La cifra più ripetuta per uno dei suoi addestramenti principali restava sotto i sei milioni di dollari. Gli addestramenti americani equivalenti costano molte volte tanto, una volta sommato il conto completo.

Conta tanto come si pubblica il modello quanto quanto è costato. DeepSeek rilascia pesi aperti, così chi sviluppa a São Paulo, un laboratorio universitario a Varsavia o una start-up a Seul possono scaricare il modello ed eseguirlo sulle proprie macchine, senza pagare un fornitore statunitense a ogni richiesta e senza spedire i dati all’estero. L’ironia sta qui: i controlli all’export pensati per frenare l’IA cinese togliendole i chip più potenti sembrano aver spinto DeepSeek a spremere di più da meno, e quei metodi parsimoniosi ora viaggiano ovunque arrivino i pesi aperti.

Per chi questi strumenti si limita a usarli, l’effetto immediato è la scelta. Modelli più economici spingono al ribasso i prezzi degli abbonamenti, portano assistenti più capaci su computer e telefoni comuni e indeboliscono la ragione per legarsi a un unico fornitore. Ciò che sembrava un servizio in affitto inizia a sembrare un software che si può possedere.

Il discorso sulla bolla richiede riserve enormi. Quella cifra sotto i sei milioni di dollari copre un solo addestramento finale, non la ricerca, i vicoli ciechi, gli stipendi o l’hardware che lo hanno reso possibile: confrontarla con la spesa totale di un laboratorio americano significa confrontare due cose diverse. I pesi aperti, inoltre, non sono codice aperto; i dati di addestramento e il metodo completo restano privati. E l’argomento dell’efficienza taglia da entrambi i lati. Interpellata su DeepSeek, la dirigenza di Microsoft ha tirato in ballo il paradosso di Jevons, la vecchia osservazione per cui, quando una risorsa diventa più economica da usare, il consumo totale tende a salire anziché a scendere. Un’intelligenza più economica potrebbe semplicemente significare che il mondo ne compra molta di più, una buona notizia per chi vende calcolo, non una cattiva.

Non è nemmeno la prima volta che la bolla viene dichiarata morta. Lo stesso laboratorio ha già provocato la più grande perdita di valore di borsa in una sola giornata nella storia statunitense, cancellando quasi seicento miliardi di dollari da un produttore di chip in un pomeriggio, per poi vedere il titolo recuperarne quasi tutto nel giro di settimane. Le grandi aziende americane dell’IA non hanno risposto spendendo meno. Hanno raccolto di più e costruito più in grande. Ogni affermazione che la bolla sia finalmente scoppiata deve reggere il fatto che proprio chi ha più denaro in gioco continua a rilanciare.

Ciò che DeepSeek ha fatto davvero è più difficile da drammatizzare di una bolla che scoppia. Ha tolto la comodità di presumere che i laboratori americani di testa siano protetti da un muro di capitale insormontabile. Se una capacità di frontiera si può approssimare a basso costo e distribuire gratis, il valore smette di stare nel possedere il modello. Si sposta sulla distribuzione, sui prodotti costruiti attorno al modello e su chi controlla il cliente. La prossima prova è già in calendario, anche senza una data: ogni nuovo rilascio di DeepSeek riapre la stessa domanda e cade in un mercato che si è impegnato a spendere di più, non di meno, convinto che la scala vinca ancora. Si deciderà nelle trimestrali e nelle previsioni di investimento dei prossimi mesi, non in un thread di forum che dà la partita per chiusa.

Discussione

Ci sono 0 commenti.