Affari e finanza

Liang Wenfeng, il fondatore di DeepSeek che ha ridefinito l’IA e poi è sparito

Penelope H. Fritz
Liang Wenfeng
Liang Wenfeng
Nascita1 gennaio 1985
Zhanjiang
ProfessioneImprenditore tecnologico e ricercatore in IA
PremiTime 100 u00b7 Nature's 10

Samuel Altman di OpenAI era stato in Italia poche settimane prima. Jensen Huang di Nvidia aveva appena tenuto un discorso davanti a migliaia di persone. Liang Wenfeng non era da nessuna parte. Eppure il modello che aveva costruito — DeepSeek-R1, addestrato per cinque virgola sei milioni di dollari — aveva appena scalzato ChatGPT dalla cima dell’App Store negli Stati Uniti e cancellato centinaia di miliardi di capitalizzazione dalle aziende tecnologiche più grandi del mondo. Il contrasto era quasi difficile da credere: la persona responsabile dell’evento più dirompente nel settore dell’intelligenza artificiale da anni non stava facendo nulla per raccontarlo.

Wuchuan, la città costiera della provincia del Guangdong dove è cresciuto, non compare nelle narrazioni abituali sulle origini dell’intelligenza artificiale. I suoi genitori erano insegnanti di scuola primaria. Si studiò il calcolo avanzato da solo durante le scuole medie, ottenne il punteggio più alto nella regione di Zhanjiang all’esame di ammissione all’università e iniziò gli studi alla Università dello Zhejiang a diciassette anni. Studiò ingegneria dell’informazione elettronica, poi completò un master in ingegneria dell’informazione e delle comunicazioni con una tesi sugli algoritmi di tracciamento di oggetti tramite telecamere. I temi di ricerca erano modesti, ma la sensibilità — matematica applicata per risolvere problemi reali con vincoli — avrebbe definito tutto ciò che sarebbe venuto dopo.

Quando la crisi finanziaria del 2008 mandò i mercati in caduta libera, cominciò a sperimentare l’apprendimento automatico applicato al trading. Dopo Chengdu e diversi progetti iniziali, nel 2016 cofondò High-Flyer Capital Management (幻方量化) a Hangzhou con due compagni dell’Università dello Zhejiang. La società divenne uno dei fondi quantitativi più riusciti della Cina, con oltre settanta miliardi di renminbi in gestione e rendimenti medi superiori al cinquanta percento nel 2025. Il vantaggio era algoritmico: modelli di deep learning su infrastruttura GPU che Liang aveva cominciato ad accumulare su larga scala. Nel 2021 acquistava già chip Nvidia A100 in quantità che suggerivano piani considerevolmente più ambiziosi di un’operazione di trading.

Quella infrastruttura divenne la base di DeepSeek, che Liang costituì come spin-off nel luglio 2023. L’obiettivo dichiarato dell’azienda non era costruire un chatbot o un prodotto commerciale, ma perseguire quella che descrisse come ricerca fondamentale nell’intelligenza artificiale — il tipo di lavoro che non ha una roadmap di prodotto né un obiettivo trimestrale. DeepSeek impiegava circa centosessanta persone, reclutate da un ventaglio deliberatamente ampio di discipline, e operava con un budget che avrebbe a malapena figurato nei conti di OpenAI o Google DeepMind. Quando DeepSeek-V3 fu rilasciato alla fine del 2024, il costo di addestramento fu stimato intorno ai sei milioni di dollari. Quando DeepSeek-R1 seguì nel gennaio 2025, la cifra che circolò fu di cinque virgola sei milioni di dollari.

Il racconto della disruption che si attaccò a DeepSeek quasi immediatamente non era del tutto sbagliato, ma era incompleto in modi che contavano. La storia che i mercati finanziari raccontarono — che DeepSeek avesse dimostrato che la spesa americana nell’IA era uno spreco — assumeva che ciò che il team di Liang aveva fatto fosse riproducibile ovunque, da chiunque, con un budget ridotto. Quell’assunzione merita esame. L’infrastruttura GPU di High-Flyer era stata costruita prima che entrassero in vigore le restrizioni all’esportazione più severe. Le scelte ingegneristiche che produssero modelli efficienti a basso costo di addestramento richiedevano una competenza di profondità insolita. Ciò che DeepSeek dimostrò non fu che i grandi modelli di IA sono economici da costruire; fu che l’innovazione architettonica può comprimere il costo marginale di addestrare un certo livello di capacità.

Nel febbraio 2025, Liang partecipò a un simposio con il presidente Xi Jinping, accanto ad alcuni dei più importanti dirigenti tecnologici della Cina. Fu il suo momento pubblico più visibile. Da allora non è più apparso in pubblico. DeepSeek ha rilasciato un’anteprima di V4 nell’aprile 2026 e si dice stia cercando trecento milioni di dollari di nuovi investimenti a una valutazione di dieci miliardi. La sua quota — circa l’ottantaquattro percento tramite partecipazioni dirette e indirette — gli conferisce sia il controllo sia, evidentemente, la libertà di essere ovunque tranne che davanti a un microfono.

Mantiene quasi nulla nel registro pubblico della sua vita privata. Non ci sono informazioni verificate su un coniuge o figli. Non aveva presenza sui social media prima che DeepSeek diventasse notizia mondiale, e non ne ha acquisita dopo.

DeepSeek rilascerà altri modelli. La traiettoria dell’azienda dal momento R1 non mostra segni di rallentamento. Ciò che rimane genuinamente incerto è se Liang Wenfeng emergerà per dire qualcosa al riguardo, o se il lavoro continuerà a parlare là dove lui ha scelto di tacere.

Tag: , , , , ,

Discussione

Ci sono 0 commenti.