IA

LongCat 2.0 batte GPT-5.5 nel coding con chip cinesi senza Nvidia

Susan Hill

LongCat 2.0 ha 1.600 miliardi di parametri, elabora una finestra di contesto di un milione di token e ha appena superato GPT-5.5 di OpenAI sul principale benchmark per l’ingegneria del software reale. È stato sviluppato da Meituan, un’azienda che fuori dalla Cina la maggior parte delle persone conosce, se la conosce, come app di consegna cibo.

Il modello ha ottenuto 59,5 su SWE-bench Pro contro i 58,6 di GPT-5.5. Il margine sembra ridotto, ma il contesto è ciò che rende il risultato notevole: Meituan ha addestrato LongCat 2.0 su più di 50.000 acceleratori AI domestici — non hardware Nvidia, che la Cina non può importare in quantità dal 2022. Il produttore non è stato confermato ufficialmente, ma la comunità tecnica indica l’Ascend 910B di Huawei. Se fosse confermato, sarebbe la prima volta che un modello addestrato su chip Huawei raggiunge prestazioni di frontiera in benchmark pubblici trasparenti.

LongCat 2.0 usa un’architettura Mixture-of-Experts: per ogni richiesta si attivano solo tra 33 e 56 miliardi di parametri, mantenendo l’inferenza veloce senza richiedere hardware enterprise. La finestra da un milione di token consente di leggere un’intera base di codice in una sola sessione. Su SWE-bench Multilingual ha ottenuto 77,3; su Terminal-Bench, che testa la navigazione in un vero ambiente Unix, ha raggiunto 70,8.

Prima dell’annuncio ufficiale, il modello era attivo su OpenRouter con il nome in codice “Owl Alpha” per circa due mesi. Chi lo aveva usato ne aveva notato le capacità di coding insolite senza saperne l’origine. Meituan ha confermato dopo il lancio che Owl Alpha era LongCat 2.0 in una fase di valutazione anticipata.

La licenza MIT racconta solo una parte della storia. Nonostante sia tra le più aperte e permissive disponibili, i pesi del modello non sono ancora stati rilasciati. Il repository GitHub e la scheda su Hugging Face indicano entrambi “prossimamente”. Per ora LongCat 2.0 è accessibile solo tramite API ospitata: scaricare, fare fine-tuning o eseguirlo localmente non è ancora possibile.

Meituan elabora ogni giorno oltre 50 milioni di ordini alimentari e aveva già sviluppato internamente un modello linguistico chiamato Zhichi prima di avventurarsi nello sviluppo esterno. LongCat 2.0 è il suo primo modello pubblico e, per prestazioni sui benchmark, uno dei sistemi di coding più capaci disponibili con licenza aperta.

Quando i pesi arriveranno, LongCat 2.0 entrerà in confronto diretto con Llama 4.1 di Meta e DeepSeek-V4 Pro. La domanda su quali chip domestici abbiano reso possibili questi risultati avrà implicazioni ben oltre il mondo dell’AI.

Tag: , , , , ,

Discussione

Ci sono 0 commenti.